Электронные библиотеки
Электронная библиотека как информационный ресурс. Общая схема электронной библиотеки и организация доступа. Особенности представления и поиска информации. Роль электронных библиотек в передаче технологий. Концепции развития библиотечной автоматизации.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 01.02.2011 |
Размер файла | 56,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
электронная библиотека информация автоматизация
Введение
1. Электронные библиотеки
1.1 Электронная библиотека как информационный ресурс
1.2 Обобщенная схема электронной библиотеки и организация доступа
1.3 Особенности представления и поиска информации
1.4 Роль электронных библиотек в передаче технологий
2. Концепции развития библиотечной автоматизации
2.1 Развитие электронных библиотек
2.2 Национальная электронная библиотека
Заключение
Литература
Введение
Одной из важнейших задач, практически всегда стоявших перед человечеством, является сохранение информации во времени и/или пространстве. После возникновения книгопечатания основной формой фиксации распространения информации являются печатные издания, а главными средствами хранения и доступа к информации стали библиотеки. Сохранение и использование рукописных и печатных документов достаточно хорошо освоено, здесь имеются богатый опыт и результаты исследовательской и практической работы многих поколений специалистов. Но очевидно, что объёмы информации, хранящейся в традиционной форме, делают всё более затруднительной работу с ней: хранение, распространение, поиски, учет и т.п. Развитие вычислительной техники позволило сохранять и распространять информацию в электронной форме, что играет революционную роль в истории человечества, аналогичную изобретению книгопечатания. Электронная форма позволяет на сегодня хранить наиболее надежно и компактно, распространять ее намного оперативнее и шире и, кроме того, предоставляет возможности манипулирования с ней, которых не могло быть при иных формах. В связи с этим за последние годы во всем мире интенсивно увеличивается количество электронных публикаций. Значительное количество различных документов уже сейчас существует в электронной форме.
По ряду оценок, на середину 1998 г. в Интернете их было около 300 млн., и это число постоянно растет. В больших масштабах ведется преобразование в электронную форму печатных документов. Так, в США осуществляется проект Пентагона по преобразованию в электронную форму 20 млн. документов. В Японии в рамках проекта по созданию Национальной электронной библиотеки переведено в электронную форму около 10 млн. страниц текстовой информации. Подготовка традиционных печатных изданий всё чаще осуществляется в электронной форме. Аналогичные тенденции, правда, в меньших масштабах, имеют место и в России.
Так, в информационных системах ряда организаций формируются электронные массивы, например по полным текстам российских газет (АДН, Интегрум-Техно), по справочно - энциклопедической информации (R-Style), по музейным энциклопедиям (ЗАО Интернет) и др. В российской государственной библиотеке в рамках программы “Память России” осуществляется преобразование в электронную форму первопечатных русских книг. С 1997г. Институтом мировой литературы А. М. Горького РАН и НТЦ «Информрегистр» при участии ряда других организаций ведется создание электронного фонда «А. С. Пушкин и классическая русская литература». В настоящее время этот фонд уже включает в себя в электронной форме значительные объёмы информации, посвященной жизни творчеству Пушкина, Есенина, Лермонтова, Грибоедова. В России существует целый ряд электронных журналов, доступных через Интернет: «Русский журнал», «Вечерний Интернет», «Zhurnal», «Исследовано в России» и др. Всё большее число отечественных традиционных издательств выполняет подготовку оригинал - макетов в электронной форме.
Стремительное развитие электронной издательской деятельности и рост количества электронных публикаций приводит к весьма серьёзным проблемам. Перечислим четыре наиболее важные:
1. При подготовке электронной информации, прежде всего полнотекстовой, очень часто игнорируются или учитываются не в полной мере опыт, правила и нормы, существующие в сфере производства и распространения печатной информации, что приводит не только к нарушению сложившихся традиций, но и усложняет коммуникативные процессы, в которых участвует и будет участвовать как электронная, так и печатная информация. Это относится к шрифтовому оформлению, к организации и структурированию информации, к атрибутированию произведений и т.п.
2. Современные информационные технологии предоставляют эффективные средства надёжного сохранения электронной информации. Однако на практике процесс накопления и сохранения электронной информации носит случайный характер. Например, создаваемые в рамках традиционной издательской деятельности электронные оригинал - макеты часто уничтожаются. Известны случаи, когда выполнялись дорогостоящие операции преобразования в электронную форму книг, электронные оригинал-макеты которых были уничтожены. Другой пример дают некоторые телеконференции: их материалы выставляются для доступа в Интернет, а по истечении некоторого времени уничтожаются. Число таких примеров можно значительно увеличить. Решение проблемы сохранения электронной информации нуждается в организационных, методических и технологических проработках.
3. Особую проблему представляет инвентаризация электронной информации, включающая в себя определение самостоятельных единиц электронной информации, их адекватное и унифицированное описание. Сюда же входят вопросы учёта и каталогизации.
4. Сохраняемая электронная информация должна эффективно использоваться. Здесь сразу же встают вопросы совместимости программного обеспечения и форматов, вопросы реализации разнообразных функциональных возможностей, предусматриваемых создателями электронных документов. На решение указанных и ряда других проблем направлена деятельность по созданию электронных библиотек. Область деятельности связанная с электронными библиотеками, является достаточно новой и поэтому ещё не имеет устойчивой терминологии. Кажется, впервые этот вопрос подробно рассматривал Ф. Ланкастер в начале 80-х годов. Однако его работы имели в определённой степени футурологический характер.
Существенное развитие работы по электронным библиотекам получили на рубеже 90-х годов, когда появились адекватные средства вычислительной техники и информационные технологии, обеспечивающие надёжное сохранение, оперативную обработку и эффективное использование больших массивов разнородной информации, прежде всего текстовой. Именно в это время в ряде стран стали подготавливаться проекты электронных библиотек. Некоторые из них легли в основы соответствующих национальных и международных программ. В процессе этих работ стало конкретизироваться понятие «электронная библиотека», стали определяться и уточняться её цели, задачи и функции, что, однако, не привело ещё к однозначной трактовке проблемы. Так, в качестве синонимов для понятия «электронная библиотека» можновстретить такие словосочетания, как «цифровая библиотека» (digital library) и «виртуальная библиотека» (virtual library). Сложность определений в этой области и разнообразие мнений показал и Российско-американский семинар «Электронные библиотеки», прошедший 16-17 апреля 1998г. в Москве. Остановимся на следующем определении, основанном на анализе отечественного и зарубежного опыта работы в данной области.
Электронная библиотека - это информационная система, позволяющая надёжно сохранять и эффективно использовать разнообразные коллекции электронных документов (текстовых, изобразительных, звуковых видео и др.), локализованных в самой системе, а также доступных ей через телекоммуникационные сети. Основные задачи ЭБ - интеграция информационных ресурсов и эффективная навигация в них. Под интеграцией информационных ресурсов понимается их объединение с целью использования (с помощью удобных и унифицированных пользовательских интерфейсов, желательно одного) различной информации с сохранением её свойств, особенностей представления и пользовательских возможностей манипулирования с ней. При этом объединение ресурсов не обязательно должно осуществляться физически, оно может быть виртуальным, главное - оно должно обеспечивать пользователю восприятие доступной информации как единого информационного пространства. В частности предполагается, что ЭБ должны обеспечивать работу с гетерогенными БД, обеспечивая пользователю эффективность информационных поисков, независимо от особенностей конкретных информационных систем, к которым осуществляется доступ. Эффективная навигация в ЭБ понимается как возможность пользователя находить интересующую его информацию с наибольшей полнотой и точностью при наименьших затратах усилий во всём доступном информационном пространстве. При таком подходе хорошо известные информационные поиски, используемые в информационных системах и базах данных, являются частными случаями навигационных средств.
Практически вся накопленная человечеством информация зафиксирована сегодня в печатной форме. Поэтому сейчас в ближайшем будущем печатная информация будет являться основным источником формирования электронных библиотек.
1. Электронные библиотеки
1.1 Электронная библиотека как информационный ресурс
Основные задачи электронной библиотеки - интеграция информационных ресурсов и обеспечение эффективной навигации в них. Причем под интеграцией понимается объединение электронных документов и справочников различного вида с целью их широкого использования для предоставления пользователю возможностей манипулирования данными предпочтительно в функционально однородной среде. Само же объединение ресурсов не обязательно должно быть физическим - оно может быть виртуальным, но восприниматься пользователем как единое информационное пространство. Если рассматривать ныне создаваемые электронные библиотеки с точки зрения состава и характера информационных ресурсов, то можно заметить, что в качестве компонентов здесь выступают электронные каталоги, библиографические и реферативные базы данных, полнотекстовые массивы (электронные журналы, фактографические базы данных, хранилища электронных копий статей и других публикаций ), справочно-нормативные файлы (рубрикаторы, тезаурусы, авторские, предметные, географические и другие метаинформационные продукты ). Записи этих массивов могут быть взаимосвязаны между собой ссылками, указателями хранения или условиями отыскания.
И даже если такие ссылки в явном виде не существуют, то уже по всей сути эти компоненты всегда были и будут связаны, по крайней мере, на концептуальном уровне. Например, записи электронных каталогов содержат указания местоположения книг, а справочно-нормативные файлы традиционно используются в качестве “точек входа” в библиографические и реферативные базы данных. С появлением полнотекстовых баз данных справочно - поисковый аппарат и массив собственно информации технологически становятся единым целым, и на первый план выходит задача организации таких взаимосвязей, чтобы переход по ссылке внутри электронной библиотеки воспринимался пользователем как простейший одномоментный процесс, подобно перевороту страницы книг.
Таким образом, в общем случае информационные компоненты электронной библиотеки образуют трёхуровневую структуру, включающую:
1. компоненты метаинформационного уровня, обеспечивающие “узнаваемость” коллекции в целом, идентификацию как её наполнения, так и формы представления. Сюда относится, например, нормативная информация о коллекциях объектов (рубрикаторы, тезаурусы, авторские, предметные и другие указатели), а также каталоги и описания структуры и наполнения доступных ассоциированных ресурсов;
2. компоненты справочно-поискового описания объектов, обеспечивающих семантическую идентификацию - “ узнаваемость” отдельного документа за счёт унификации и нормализации представления как элементов данных, так и содержания. Обычно это библиографическая запись или какая-либо другая вторичная информация, являющаяся поисковым образом документа;
3. компоненты уровня объектов первичной информации: текст, графическое изображение, аудио, видео и т.д., т.е. собственно информативные документы.
Ссылки вполне “ узнаваемы ” и представляют собой традиционные правила и приемы отыскания информации в условиях “бумажной” библиотеки, где поиск начинается с классификационной схемы, указателя или каталога, и далее через библиографические описания приводит к первоисточнику, по которому, используя теперь уже пристатейные ссылки и указатели, поиск может быть снова продолжен с метаинформационного уровня. С точки зрения характера размещения информационных ресурсов (т.е. их локализации в вычислительной среде, что в итоге и определяет технологию и условия использования) можно выделить два класса электронных библиотек:
1. локализованные, когда метаинформационная, поисковая и информационная компоненты объединены в одной программной и общей вычислительной среде;
2. распределённые, когда компоненты находятся, возможно, в различном сочетании, на взаимно удалённых вычислительных системах, взаимодействующих на уровне сетевого протокола и функционирующих под управлением разных программных систем.
Здесь, в свою очередь, можно выделить два типичных варианта. Первый - ЭБ, использующие ассоциированные ресурсы, когда локализована метаинформационная, а также, возможно поисковая компоненты, а информационная компонента является распределённой (удалённой и независимо изменяющейся). Второй - ЭБ с произвольно распределёнными компонентами, когда о ресурсе известны только его Интернет-адрес и, возможно, параметры для генерации поискового запроса. Существующая практика, основанная на принципах гипертекста, предполагает, что сами компоненты и связи между ними, как правило, статичны или, по крайней мере, мало подвержены изменениям и поэтому могут быть жёстко и надолго определены. На деле это не совсем так. Вернее, это совсем не так. Ничего более динамичного, чем компоненты постоянно развивающейся электронной коллекции, не существует. Поэтому, даже когда речь идёт о взаимосвязи на уровне локальных информационных ресурсов, нельзя раз и навсегда установить такие связи. С широким внедрением телекоммуникационных сетей и некоторой стандартизации представления данных в Интернет задача взаимосвязи становится ещё более сложной. Её решение путём создания статичных связей практически невозможно, даже если бы все компоненты имели свои уникальные идентификаторы и незыблемое место в информационном пространстве (чего зачастую невозможно добиться даже для локальных массивов). Таким образом, любое изменение местоположения информационного объекта влечёт за собой возникновение “ ложных” связей в распределённых электронных библиотеках. Поэтому на смену статичным связям приходят так называемые “активные” динамические связи. Основной их особенностью является то, что они генерируются программно, по предопределённым алгритмам во время обращения к объекту, позволяющим связать информационные объекты при условии достаточной определённости (специфицированности) элементов.
Связи внутри ЭБ могут быть построены на таких идентификаторах, как давно применяемые ISBN и ISSN или недавно возникшие DOI. В тех случаях, когда такие идентификаторы отсутствуют (а таких случаёв большинство), одним из решений может быть генерация динамических связей. В качестве основы для построения идентификаторов здесь могут выступать либо уникальные элементы записи, либо их свёртки. Такого рода связывание можно показать на примере электронной библиотеки Института научной информации по общественным наукам РАН, создаваемой при финансовой поддержке Российского фонда фундаментальных исследований. Электронная библиотека ИНИОН включает сейчас массив (свыше 1.8 млн. записей) и хранилище оцифрованных копий источников (около 3 тысяч документов). Массив библиографии раз делен по тематическому признаку на несколько проблемно-ориентированных баз данных. Электронные копии хранятся в специальных разделах сервера. При этом библиографические описания отдельных книг и статей из журналов могут быть включены сразу в несколько баз. Связь библиографического описания и электронной копии здесь определена на уровне структуры идентификатора копии, который генерируется из элементов библиографического описания источника - шифра хранения, года издания и некоторых других элементов библиографического описания. Когда пользователь обращается к той или иной библиографической записи, система поиска генерирует идентификатор предполагаемой копии и, в случае её наличия в хранилище, делает её доступной пользователю, визуализируя сгенерированную гиперссылку. Если копия по каким-либо причинам удаляется из электронного хранилища, то, соответственно, ссылка во всех библиографических базах данных генерироваться не будет. Кроме того, в качестве идентификаторов, используемых для установки активных связей, могут служить части компонентов ЭБ организованные, например, в виде поисковых индексов. Таким образом можно связывать, скажем элементы записей справочно-нормативных файлов и библиографических массивов. А для установления ссылок от пристатейной библиографии в полнотекстовых базах данных к записям библиографических баз данных, и далее - к оцифрованным копиям, равно как и для связывания элементов самих полнотекстовых баз данных, могут использоваться свёртки библиографических описаний источников. Конечно, это возможно лишь при достаточно строгой структуризации данных и применении алгоритмов свёртки, допускающих минимальный процент дублирования. Установленные подобным образом связи ошибочного определения объекта, однако, это решение кажется приемлемым, так как позволяет не отслеживать частые изменения компонентов ЭБ.
Еще к одному типу активных связей относятся так называемые внешние связи, направленные к компонентам удаленных электронных коллекций, поддерживаемых разными производителями. Рассмотрим несколько возможных реализаций связей электронных библиотек с внешними информационными ресурсами. Если такой ресурс представляет собой полнотекстовую базу данных с поисковым аппаратом, то связеобразующий механизм может функционировать на уровне обмена запросами при этом запрос от электронной библиотеки к внешнему ассоциированному ресурсу должен формироваться программно, базируясь на данных исходной записи. Для примера рассмотрим реализованный в ЭБ ИНИОН механизм связывания записей библиографических баз данных с электронными журналами издательства Elsevier из научной электронной библиотеки РФФИ. При формировании результата поиска в базах ИНИОН для записей, которые соответствуют статьям из журнала издательства Elsevier (это определяется по справочнику соответствующего ассоциированного ресурса), система строит URL - запрос к Научной электронной библиотеке, размещаемый в соответствующей библиографической записи. При инициировании ссылки полный текст статьи, в случае его обнаружения на сервере НЭБ и после проверки прав доступа выдаётся пользователю. Таким образом, создаются активные гипертекстовые ссылки, которые распространяются в данном случае только на определенный набор ресурсов. Однако когда речь идет о распределенных ресурсах, каковыми являются Интернет - страницы содержащие полные тексты отдельных источников, ситуация становится более сложной. Во-первых, выявления описываемых в библиографических базах данных и опубликованных в Интернет документов - электронных аналогов печатной продукции, весьма трудоёмкий и до сих пор мало автоматизированный процесс. А во-вторых, связи между компонентами электронных библиотек и Интернет - страницами в этом случае также должны быть динамическими, поскольку такой тип ресурсов ещё в большей степени подвержен изменениям, чем организованные полнотекстовые хранилища. Поэтому необходимо создание программ, которые будут собирать и периодически обновлять информацию о таких ресурсах, создавая для этого справочные элементы локальной электронной библиотеки. В задачи этих программ также должно входить выявление областей на Интернет - страницах относящихся непосредственно к электронным публикациям, и их индексирование. Если говорить, например, о нахождении и индексировании электронных журналов в Интернет, то в качестве поисковых предписаний могут служить библиографические описания журналов и их издателей. Программы поиска и просмотра в этом случае будут обращаться к созданным индексам и формировать активные связи с внешними ресурсами. Спецификации связей рассматриваемой нами ЭБ, когда ресурсы - источники связей - реализованных в виде баз данных, обеспечиваются средствами определения схемы БД. Возможность генерировать динамические связи основана на механизме спецификации типов и значений параметров каждой связи на логическом уровне как функции значений элементов данных текущей записи. Элемент записи (например, отдельный термин самого документа, пиктограмма или комментарий), визуализирующий связь определяется в схеме как генерируемое поле, с которым связывается гипертекстовая ссылка-запрос. При активации такой ссылки происходит поиск или прямое обращение к указанному в запросе ресурсу, а найденные документы будут визуализированы как результат перехода по ссылке. Поскольку для базы данных можно определить неограниченное количество схем, такой способ обеспечивает достаточную гибкость, как с точки зрения типологии, так и точки зрения степени насыщения ссылками объектов ресурса, причем выбор схемы предоставлен пользователю при работе с ресурсом.
Вывод: Электронные библиотеки объединяют электронные документы исправочники различного вида с целью их широкого использования для предоставления пользователю возможностей манипулирования данными предпочтительно в функционально однородной среде, а такжеобеспечивают эффективную навигацию в них.
1.2 Обобщенная схема электронной библиотеки и организация доступа
Информационный сервер - это хранилище данных, представляющих коллекции разнородных логически или физически взаимосвязанных документов (образующих компоненты трехуровневой модели ЭБ), доступ к которым обеспечивается средствами информационно - поисковой системы. При этом поисковые (реферативные и библиографические) и метаинформационные компоненты, традиционно реализованы в виде структурированных баз данных, в то время как компоненты уровня первичной информации могут быть представлены полнотекстовыми БД, так и коллекциями файлов, каждый из которых хранит чаще всего образ в том или ином графическом или печатном ориентированном формате. Сервер управления доступом к информационным ресурсам, реализующий ограничения доступа к компонентам электронной библиотеки, является специализированной системой, обеспечивающей поддержку сессионного уровня поискового процесса, а также возможности административного учета и управления доступом на уровне отдельного пользователя к отдельному информационному и функциональному ресурсу. Реализуется в виде специализированных баз данных, в том числе: - каталога информационных ресурсов, хранящего сведения о локализованных и ассоциированных ресурсах;
- каталога пользователей, хранящего учетные данные о каждом пользователе и список доступных ему информационных ресурсов;
- технологические базы данных сеансов, содержащей информацию о текущем сотоянии каждой поисковой сессии;
- базы данных учетно - статистической информации об использовании ресурсов.
Такие средства позволяют создавать каталоги доступных ресурсов для каждого отдельного пользователя, защищая определенные базы и массивы библиотеки от несанкционированного обращения. Кроме того, можно запретить доступ в случае, если физический адрес отправителя запроса отличается от адреса, зафиксированного в каталоге. Таким образом сервер поддерживает уровень поисковой сессии как последовательность сеансов - операций, осуществляемых пользователем в среде информационно - поисковой системы электронной библиотеки. Такими операциями могут быть: выбор БД для поиска; выбор формата представления (схемы); установление параметров поиска, предпочтительных для данного пользователя; составление запроса; осуществление поиска; просмотр результатов;навигация в протоколе; завершение работы и т.д. (необязательно именно в такой последовательности - например, просмотрев результаты поиска, можно провести новый поиск). При этом будем считать, что поисковый сеанс - это одна операция выполняемая в рамках одной транзакции - физического сетевого соединения, т.е поисковая сессия - это последовательность функционально связанных поисковых сеансов, направленная на получение логически целостного результата. Сессионный уровень в рамках сеансового НТТР- протокола реализуется с помощью специализированной БД сеанса, в которую заносятся параметры всех операций поиска: какие установлены базы, схемы просмотра и параметры поиска (тип поиска, объём выдачи, способ сортировки результата, способ отображения найденных документов, четкий/нечеткий поиск, с маскированием или нет), каков механизм поиска (обычный поиск, эвристический), сколько документов найдено. Каждому сеансу присваивается уникальный идентификатор, с которым все функциональные запросы и их параметры заносятся в БД сеанса. Идентификатор сеанса также заносится в регистрационную базу, и при следующем посещении пользователем электронной библиотеки, после осуществления аутентификации, по этому идентификатору можно восстановить и продолжить поисковую сессию. К тому же, пользователь имеет возможность сохранить свой запрос с тем, чтобы воспользоваться им в дальнейшем, т.е. поисковая сессия реализуется как последовательность поисковых сеансов, где каждый последующий сеанс использует параметры предыдущего.
Вывод: В электронной библиотеке можно выделить три блока, обеспечивающих доступ, поиск и управление информационными ресурсами.
1.3 Особенности представления и поиска информации
Особенности представления информации определяются их назначением - обеспечением эффективного (быстрого и исчерпывающего прежде всего по полноте) поиска нужных данных или, если таковые не обнаружены, - сведений о документах, предположительно их содержащих. Именно поэтому для достижения общности представления, по возможности не зависящей от точек зрения и особенностей изложения, создаются каталоги и базы данных вторичной информации, когда содержание документа редуцируется до формы перечисления основных понятий, в той или иной степени однозначно характеризующих его в контексте той предметной области, для которой создаётся база данных.
В свою очередь, для обозначения таких характеризующих понятий используется ограниченная (нормализованная) лексика, снижающая влияние свойств синонимии и полисемии. Представление информационного содержимого конкретных документов в виде поисковых образов обеспечивает, с одной стороны, очень эффективную вычислительную процедуру (когда отбор производится по условию простого сопоставления термина запроса с термином документа), а с другой стороны - даёт пользователю возможность получать достаточно полные и точные ответы на запросы, выражаемые упрощенным, “телеграфным” стилем. Кроме этого, в ряде случаев, когда предметом проблемного поиска является что - то неизвестное (по крайней мере пользователю), удовлетворительным результатом поиска скорее всего будет не отдельный документ, содержащий ответы на все вопросы, а некоторое множество документов, образующее для пользователя информационное пространство (фактов, идей и т.д.), достаточное для построения неизвестного до того решения, и таким образом, генерации новой информации. Т.е. в случае такого рода проблемных поисков, запрос - это не столько вопрос предопределяющий ответ, сколько определение (через уже известное) предметной, документальной и лексической области для поиска неизвестного. С другой сторон (внутримашинного представления информации), семантическая тривиальность структур данных, реализующих документальные системы в архитектуре фон - Неймановских машин, предопределяет, что развитие запроса и смысловая оценка результата поиска - исключительно прерогатива пользователя, а система - ассистент. И даже принимая во внимание определённые успехи в области разработок искусственного интеллекта, по крайней мере два фактора не позволяют надеяться на скорое равноправие сторон:
1) выражение запроса (даже хорошо формализованное и обязательно представленное на естественном языке) слишком лаконично для того, чтобы можно было бы выделить глубинную сущность и аспектные взаимосвязи проблемы, для решения которой должна быть найдена информация;
2) в ряде случаев пользователь не может однозначно специфицировать информационную потребность, особенно если она связана с этапом постановки задачи.
Таким образом, роль системы - не более чем информационно-технологическая поддержка на различных этапах многостадийного процесса информационного поиска, который в общем случае включает:
1. Определение (локализация и формализация) темы запроса и идентификация (тематический выбор) ресурса, где система обеспечивает метаинформирование о тематике, наполнении, структуре и методах доступа к выбранному ресурсу.
2. Формирование (форма, способ ввода), а также адаптирование (структурное и лексическое ) выраение запроса, где система предостовляет вспомогательные информационные объекты (словари, тезаурусы, шаблоны и т.д.).
3. Отбор документов по критерию, адекватному степени неопределённости информационной потребности, где система предоставляет выбор механизма поиска или, например, автоматически расширяет лексику запроса.
4. Формирование и управление выдачей найденных документов, где система обеспечивает масштабирование (форматирование) пространства представления выданных документов, а также сортировку и, возможно, ранжирование по некоторому формальному критерию соответствия.
5. Оценку результатов поиска с точки зрения полного удовлетворения информационной потребности (т.е. завершение поискового процесса) или их соответствия цели поиска и степени освоения информационного ресурса в части, соответствующей теме запроса (для обоснования решения о завершении процесса из-за отсутствия информации), где система позволяет количественно оценивать динамику выдач и обеспечивает возможность выборочного обращения к результатам отдельных этапов процесса поиска.
6. Развитие запроса по технологии “реформулирования по обратной связи по релевантности” или использование других ресурсов, где система обеспечивает регистрацию оценки пользователя и генерацию нового выражения запроса (включающего, например, статистически значимые термины из документов, которые пользователь отметил как действительно релевантные), а также связывание ресурсов, например, ассоциированных баз данных вторичной или справочной информации.
Следует также отметить и некоторые особенности взаимоотношений человека и автоматизированной поисковой системы, обусловленные “заторможенным развитием” последних, сохранивших пакетную, вопросно-ответную идеологию, свойственную уже ушедшим системам информационного обслуживания, когда гарантом качества поиска был информационный работник. Задачей такого информационного посредника были понимание и интерпретация потребностей пользователя и, далее, используя знание особенностей конкретной базы и поисковых средств, проведение эффективного (по крайней мере - профессионального) поиска. В современных условиях ”информационного самообслуживания” пользователь, привыкший к интуитивному освоению программных сред (в основном стандартных средств операционной системы, большинство из которых имеет существенно более простой и дружественный интерфейс), часто неадекватно оценивает состояние и результаты поиска. Крайними примерами ошибок может быть принятие безапелляционного решения о “плохой” базе данных или поисковой системе после получения неудовлетворительного или нулевого результата по первому же запросу, иногда даже не являющемуся правильным с точки зрения поискового языка; прекращение пользователем развития запроса, если он получает известные или собственные публикации, т.е. когда происходит подмена критерия остановки процесса поиска по условию нахождения нужной новой информации или остановки по условию отсутствия новой информации каждой следующей выдаче условием подтверждаемости “результативности” выражения запроса.
Кроме того, пользователь рискует обрести некоторую убеждённость в том, что ИПС (особенно, когда речь идёт о поисковых средствах Интернет) всемогущи и вездесущи, а их способности извлекать информацию (знания) из текстов и массивов документов бесконечно выше человеческих. Такой подход в самом безобидном случае приводит к некритичному отношению к результату поиска, т.е. пользователь удовлетворяется уже фактом получения выдачи (а современные поисковые системы часто устроены так, чтобы практически всегда пользователю выдавались какие - нибудь документы, пусть даже и в минимальной степени соответствующие запросу). Поскольку система является всего лишь инструментом, используемым человеком при поиске, а не интеллектуальным автоматом для поиска информации, эффективность её использования зависит от того, насколько хорошо человек знает природу объектов и свойства инструмента, посредством которого он с этими объектами работает.
В этом смысле, говоря об организации поиска информации, представленной в документальной форме (и отдавая должное истории развития АИПС), можно говорить о системах, основанных на одном из двух типов “стратегических” решений. Первые представлены “классическими” АИПС, берущими начало от библиотечных систем, информационный вход в которых реализуется через дополнительные (вторичные по отношению к текстам документов) справочные структуры. Вторые - гипертекстовые системы, в которых переход к потенциально полезному документу реализуется через контекстно определённую ссылку, статически размещённую непосредственно в тексте документа, обычно при его подготовке.
Относительная независимость (а иногда даже некоторая альтернативность) развития этих двух направлений в значительной степени обусловливалась функциональным различием информационного продукта и техническими ограничениями среды хранения. Имея в виду тождественность конечной задачи - обеспечение доступа к реально полезной и полной информации (а не только выдача документов по формальным признакам), гипертекстовые системы использовались для реализации локальных справочных систем, базирующихся на предметно-ориентированных, ограниченных коллекциях полнотекстовых документов, а эффективность поиска документов или их фрагментов достигалась через более или менее полную систему контекстно - определённых ссылок. ИПС же предназначались для обработки большого количества однородных (регулярных), чаще всего вторичных документов, а контекст запроса заранее не может быть предопределён. Можно сказать, что у этих двух типов систем принципиально различаются сценарии и средства выборки пользователем реально нужной информации. Координатное индексирование документов и использование в запросе терминов вне контекста предопределяет для классических АИПС необходимость последующей пользовательской оценки документов после их отбора системой по формальным признакам. Гипертекстовые же системы позволяют более целенаправленно (хотя лишь в рамках отдельного, текущего документа) управлять переходом к следующему документу за счёт контекстной определённости ссылки. Соответственно (субъективно), легче выработка решения о завершении поиска по критерию удовлетворения потребности или исчерпания релевантных документов в просматриваемом потоке. Однако, по крайней мере для класса задач поиска новой информации, не укладывающейся в предопределённость типологии и графов ссылок, более гибким представляется метод координатного индексирования с его свойством комбинативности. С появлением технических возможностей реализации полнотекстовых ИС альтернативность выбора какой - либо одной из двух “стратегических” технологий практически перешла в плоскость экономических решений о степени насыщения отдельных документов ссылками и приемлемых объёмах словарей, индексирующих все или отдельные поля документов. Наиболее показательным примером является WWW-технология Интернет, где массивы документов изначально создаются по гипертекстовой технологии, а в дальнейшем строятся индексы, реализующие “классические” поисковые технологии. Таким образом, в общем случае процесс поиска может быть представлен как навигация - целенаправленное и управляемое перемещение в документальном и лексическом пространстве базы данных, обеспечивающее оцениваемый уровень удовлетворения информационной потребности или объективно подтверждающее отсутствие информации.
Целенаправленность здесь предполагает наличие некоторой цели, обычно в сфере основной деятельности, которая в свою очередь может быть представлена как комплекс локальных (информационных) целей тематического (многоаспектный поиск) и технологического типа. Это означает, что для того, чтобы обеспечить целенаправленность избирательного обращения к поисковым объектам, интерфейсные средства системы должны позволять фиксировать и идентифицировать цель (точнее, технологические объекты, использованные в процессе её достижения). Управляемость же предполагает, с одной стороны, возможность выбора средств и параметров работы, а с другой - выборочное, в том числе повторное обращение к результатам и их обработку. Кроме того, так как выделенная последовательность результатов (физически соответствующая отдельным шагам поиска, а логически-отдельной цели) образует ряд, это позволяет использовать статистически вычисляемые показатели (разностного типа), характеризующие сходимость процесса поиска и, в частности, обеспечивающие некоторую обоснованность принятия решения об окончании процесса совершенствования запроса.
Вывод: Особенности представления информации определяются их назначением - обеспечением эффективного поиска нужных данных, а поскольку система является всего лишь инструментом, используемым человеком при поиске, а не интеллектуальным автоматом для поиска информации, эффективность её использования зависит от того, насколько хорошо человек знает природу объектов и свойства инструмента, посредством которого он с этими объектами работает.
1.4 Роль электронных библиотек в передаче технологий
В 1960-х годах в тогда ещё СССР, США и Европе начало формулироваться понятие информационной революции нашего времени. Сегодня мы опять говорим о создании нового общества, располагающего глобальным доступом к имеющимся информационным ресурсам самого различного уровня и значения. Электронные библиотеки явно оказываются интегрирующим центром происходящих событий, охватывающих, в частности, и вопросы как частного, так и глобального тезнологического развития. Промышленные технологии составляют основу конкурентоспособности отдельных предпринимателей, фирм, отраслей, целых стран и их союзов. На макроэкономическом в развитых странах осуществляется целый ряд законодательных, финансово-экономических и других мер, способных помочь государствам создать условия для активизации технологических инноваций. На микроэкономическом уровне бизнес-процесса отдельного предприятия рассматриваются вопросы обеспечения всего жизненного цикла каждого технического и технологического новщества (исследования, разработки по созданию продукта, освоение производства и продаж, разворачивание выпуска и сбыта продукта, модернизация и обновление, прекращение выпуска и обслуживания продукта). Решается задача менеджмента инноваций (исследования рынка нового продукта и выбор его целевого сегмента, прогнозирование жизненных стадий продукта, определение видов продаж и посредников, исследования конъюнктуры на рынках материалов и комплектующих, нахождение субподрядчиков, анализа патентной чистоты, поиск стратегических партнёров и пр.).
Фоном решения заведомо рискованной задачи технологических изменений служит отсутствие опыта, связанного с технической новизной каждого из проектов, постоянные изменения тенденций отрасли и поведения конкурентов. Эффективность деятельности определяется факторами: способности анализа текущего и перспективного положения дел ; готовности принятия обоснованных и профессионально состоятельных технологических решений; состоятельности управления; наличия информации об обстоятельствах, окружающих конкретных проект или процесс. При этом особое внимание уделяется информационному фактору.
Сегодня правительства и компании выделяют все большие средства на информационное обеспечение и численное моделирование вопросов развития своих стран и различного бизнеса, возникающих на глобальном, национальном и региональном уровнях. Выполняются специализированные проекты национальных информационных магистралей и инфраструктур. Работы, с одной стороны, фокусируются на сетевых средствах доступа, высокоскоростном вводе и выводе данных, высокопродуктивном корпоративном инструментарии, научном управлении данными, визуализации распределённой информации, безопасности данных и осуществлении распределённых, высокопроизводительных вычислений, с другой стороны, на использовании накопленных данных для решения текущих задач выбора и принятия решений. Промышленность оценивает экономическую целесообразность предлагаемых информационных услуг и технологий, снижая объёмы и риски собственных исследований.
Созданные технологии и накопленная информация передаются во все сегменты промышленности, а это десятки тысяч независимых компаний.
Для этого создаются глобальные, национальные, отраслевые и другие всеобъемлющие цифровые библиотеки. Регионы формируют локальные, но нередко более насыщенные базы данных. При этом общей тенденцией оказывается возможность сочетания использования как региональных, так и глобальных информационных систем. При таком подходе отрасли и регионы часто формируют данные, используемые для создания более глобальных информационных систем или моделей. Последние, в свою очередь, разрабатывают методологии, адаптируемые для специальных условий.
В частности, в рамках Еврокомиссий создан ряд информационных служб, обеспечивающих поддержку исследованиям, инновациям. ARCADE - комплексное информационное средство - предназначено для организации доступа к некоторым исследовательским программам. CORDIS (Community R&D Information services) - обеспечивает общую информацию по программам поддержки, проектам, результатам, включая оборудование для совместных исследований и поиск пратнёров. BC-NET (Business Cooperation Network) - сеть поиска партнёров в своём регионе, стране и в рамках сообщества. BiC (Business innovation Centres) - система, предлагающая рекламу местной промышленности, новых предприятий и инноваций. BRE (Bureau de Rapp - rochment des Entreprises) включает партнёров, находящихся в странах EC и в странах третьего мира, и ориентирована на повышение конкурентоспособности. EICs (Euro Info Centres) - система центров, информирующая различные фирмы о деятельности и программах EC в области развития исследований и технологий, программах передачи полученных результатов. IRC (Inovation Relay Center) - сеть из 53 европейских и 10 восточноевропейских центров передачи инноваций - оказывает консультативную помощь в области технологий и инноваций, что помогает определить технологические потребности и подобрать соответсвующие технологии. Каждый из центров сети является самостоятельным звеном, субсидируемым из фонда европейской инновационной программы, и фактически служит региональным окном в европейские инновации ,помогающим компаниям и исследовательским организациям в обмен технологиями; способствующим развитию исследовательских программ вне узости национальных рамок.
В то же время Россия не имеет собственного инновационного центра как, например, представительства вIRC, а соответственно не принимает участия в работе всей этой сети. В результате, несмотря на помощь ряда международных организаций, в частности Британского совета, осуществляющего некоммерческую поддержку малых предприятий научно - технической сферы в Северо-Западном регионе России, имеются явные проблемы. Российские разработчики и другие участники инновационных процессов часто не располагают информацией об аналогах своих разработок, состоянии рынков, о стратегии и тактике осуществления инноваций, потенциальных партнерах и конкурентах. По данным Госкомстата за 1998г., из разработанных передовых производственных технологий, основанных на микроэлектронике или управляемых с помощью компьютеров, более 80% являлись новыми лишь для России и всего 10% - принципиально новыми. Подавляющая часть образцов новых типов техники (90,7%) не соответствовала требованиям патентной чистоты. Внутренние расходы России на исследования и разработки составляют около 1,2 млрд. евро. За прошлый год создано несколько тысяч новых технологий и 993 образца новых машин и приборов, 44% из которых являются принципиально новыми. Однако потенциальные потребители в России и Европе могут иметь только случайную информацию об их наличии. Как следствие, доля образцов, по которым были заключены лицензионные соглашения на использование продукции, составила только 16,1% образцов для внутренних и лишь 1,2% - по международным соглашениям. Внутренние расходы России на осуществление инноваций составили 431,7 млн. евро, но российские предприниматели все еще не имеют представительного информационного ресурса, который позволил бы им осуществлять квалифицированный выбор требуемой английской или российской технологии. Россия является не только потребителем, но и крупным донором интеллектуальных ресурсов. Есть основания полагать, что появление российско-британского или российско-европейского канала, а с российской стороны соответствующей ему электронной библиотеки обеспечит вектор для:
1. формирования, например, российско - британской сети учреждений и организаций, вовлечённых в исследования и инновации;
2. значимого дополнения информационных портфелей инновационных центров достоверными, стандартизованными данными об инновационных потребностям и предлагаемых технологических разработках;
3. усиления контактов российских научных организаций с британской промышленностью с целью взаимного повышения конкурентоспособности;
4. расширения технологического обмена - фактора экономической конкурентоспособности за счет партнерства в совместных программах, исследованиях и разработках;
5. повышения эффективности исследований и разработок, ведущихся в рамках национальных и международных проектов за счет отработки новых форм организации удалённого труда.
Одно из определений термина «электронная библиотека», утверждённое в 1995г. Ассоциацией исследовательских библиотек США, гласит, что под электронными библиотеками понимается технология создания распределённых информационных систем, характеризующихся высокой степенью интероперабельности составляющих компонент, предоставляющих универсальный доступ к хранящейся информации и содержащих мультимедийную информацию, а также сами информационные ресурсы, созданные с помощью такой технологии. Данные, необходимые для технологического обмена, хорошо соответствуют такому определению за счет того, что они распределены среди многих сетей, центров , университетов и фирм; поддерживающие их информационные системы хоть сколь-либо интероперабельны , а доступ хотя бы за счет сети Интернет уже обеспечивает универсальность доступа и мультимедийность. В то же время, когда мы говорим об обмене технологиями, мы сталкиваемся с серьёзными вопросами, типичными для современных информационных систем. Несмотря на прогресс в этой области, наметились и постоянно прослеживающиеся факторы сдерживания информационного обеспечения инноваций. К числу таких факторов следует отнести, в первую очередь, лавинообразный рост научной и технологической информации и её разобщённый характер в силу хранения в огромном количестве баз данных, научных журналов, появляющихся и исчезающих адресов сети Интернет. Другим фактором является исключительное старение технологической информации, определяемое, с одной стороны, большим временным разрывом между значимыми исследованиями или «сенсациями» из мира науки и реально работающим «ноу-хау», а с другой стороны, постоянным появлением конкурирующих замещающих технологий. Очевидно и то, что исследовательская, конструкторская и технологическая документация всегда будет представлять собой набор «тяжёлых» дaнных постоянно меняющихся форм хранения и методов представления. Сами электронные библиотеки - новая, развивающаяся технология, эффективность которой требует создания: перспективных методов хранения больших объёмов данных в разнообразных форматах; сверхбыстрых методов доступа к этим данным; разработки эффективных методов сжатия информации; создания эффективных пользовательских интерфейсов; разработки эффективных методов классификации и индексирования, а также поиска информации, включающего поиск метаданных, поиск по всему документу, поиск изображений, аудио- и видеоинформации по содержанию, а также разнообразных методов фильтрации, основанных на создании, программируемых агентов; передачи данных; новых способов представления накопленной информации. Наконец, верно и то, что конкретные технологические данные, позволяющие оценить технологию, чаще всего носят исключительно закрытый характер. Современные электронные библиотеки используют средства защиты, предоставляемые операционными системами, что является, безусловно, недостаточным и резко ограничивает возможности не только их повсеместного внедрения, но даже и наполнения для внутри фирменного пользования. Разработка новых, эффективных методов технического и политического администрирования должна обеспечить разные права доступа к документам для разных пользователей, персонифицированное предоставление и фильтрацию информации и прочее. Пока же это ещё не случилось, при электронных коммуникациях нам, чаще всего приходится рассматривать только титульную информацию о технологиях, что, конечно, не позволяет получать серьёзную сравнительную информацию.
Вывод: Появление электронных библиотек для целей обмена технологиями является весьма актуальной задачей развития информационно - технологического общества, во многом определяющей развития всего мирового сообщества.
2. Концепции развития библиотечной автоматизации
2.1 Развитие электронных библиотек
Создание Электронной (Цифровой) библиотеки (она же - “библиотека без границ” или “библиотека без стен”, “виртуальная библиотека”) опирается на формирование электронного (машиночитаемого) ресурса в масштабах одной организации или в масштабах отраслевой или даже национальной программы и предоставление широкого доступа к этим ресурсам, что требует наличия справочного аппарата (в данном случае средств навигации) и сетей передачи данных. Исторически сложилось так, что мощные национальные и международные телекоммуникационные сети были созданы в Западном мире несколько раньше, чем наработан электронный ресурс. Поэтому акцент в создании Электронных библиотек сейчас делается на формирование массивов машиночитаемых данных и обеспечении удобного доступа к ним. В ряде стран существуют национальные программы создания Электронных библиотек. Это, например, заканчивающийся в 2000 году 5-ти летний проект “Digital Library” по оцифровке исторических документов из фондов Библиотеки Конгресса США и предоставление доступа к ним практически всем американским школам; последующее развитие эти идеи нашли в проекте общедоступной для каждого американца Национальной Цифровой Библиотеки для Образования как составной части созданного Института Музеев и Библиотек (во-первых, хотелось бы отметить как весьма типичное для современной мировой практики объединение музеев и библиотек в их электронных версиях и во-вторых весьма значительное финансирование Института на 2000 год - 188,5 млн. долларов). Проекты Калифорнийских Университетов в Беркли и Лос-Анджелесе, Санта- Барбаре - библиотека “Александрия” с гигантскими массивами геоинформации нацелены на удовлетворение нужд ученых истудентов. Как набор отдельных 30 проектов во главе с ведущими университетами организованы работы по 3-му этапу Electronic Libraries Program в Великобритании: это электронная доставка документов, использование электронных текстов в образовании, электронные издания, гибридная библиотека, формирование аналога Сводного Каталога путем введения гиперсвязей между каталогами отдельных библиотек и т.д. Английский подход во многом определяет и позицию Европейского Сообщества в этом вопросе, ибо Великобритания участвует более чем в 70 % исследований Сообщества в библиотечно - информационной области.
Подобные документы
Необходимость существования, критерии анализа и выбора электронных библиотек. Виды электронных библиотек - универсальные, электронные библиотеки периодических изданий и книг. Особенности распространения информационно-коммуникационных технологий.
курсовая работа [5,6 M], добавлен 04.05.2013Характеристика общих вопросов организации электронных ресурсов. Принципы взаимодействия Интернет-ресурсов и процесса формирования каталогов электронных изданий. Анализ концепции построения электронных библиотек и организации информационных ресурсов в них.
дипломная работа [111,4 K], добавлен 24.11.2012Библиотека, обладающая крупной распределенной коллекцией документов в электронной форме, доступной через сети передачи данных. Основные задачи электронных библиотек. Цели создания и концепция электронных библиотек. Профильность хранимой информации.
контрольная работа [26,0 K], добавлен 27.11.2012Применение современных информационных и коммуникационных технологий в библиотеках. Электронные библиотеки и их роль в профессиональной деятельности. Особенности работы с электронными библиотеками. Доступность материалов в различных электронных форматах.
реферат [32,5 K], добавлен 01.09.2011Эволюция электронных библиотек (ЭБ) в Российской Федерации. Понятие, структура и основные направления деятельности ЭБ. Современные тенденции развития электронных библиотек РФ. Характеристика деятельности Президентской библиотеки им. Б.Н. Ельцина.
дипломная работа [2,4 M], добавлен 29.10.2017Организация и эволюция развития поискового аппарата электронного каталога библиотеки. Функции и структурные особенности справочно-библиографического аппарата. Электронные каталоги библиотек г. Омска. Общий функционал программного обеспечения OPAC.
курсовая работа [106,8 K], добавлен 16.09.2017Становление системы электронных библиотек и соответствующих информационных инфраструктур в современной России. Проблемы создания электронных каталогов. Организация массива данных и разработка программного кода поисковой машины на языке JavaScript.
курсовая работа [43,7 K], добавлен 03.09.2012Проблемы, обзор и анализ публикаций процесса функционирования библиотеки и обоснование его автоматизации. Анализ альтернативного программного обеспечения по автоматизации работы библиотек. Моделирование процесса функционирования библиотеки "Стэлс".
дипломная работа [1,2 M], добавлен 09.01.2014Преимущества электронных библиотек и список наиболее известных из них. Процедура поиска книги на сайте и отображение результатов, возможности просмотра оглавления, откладывания необходимой книги в корзину и оформления заказа, перечень способов оплаты.
презентация [534,5 K], добавлен 08.12.2011Разработка виртуальной библиотеки, которая в электронной форме и с лаконичным, удобным интерфейсом позволяет хранить информацию в надёжном и компактном виде, при этом значительно увеличивая скорость поиска нужной информации и проста в распространении.
курсовая работа [1,1 M], добавлен 05.07.2012