Лингвистическое обеспечение ЭК. К проблемам коммуникабельности информационных ресурсов электронного каталога

Внедрение информационных технологий в практику работы библиотек. Разработка форматов библиографических записей. Создание методики предметизации с учетом проведения поиска в автоматизированном режиме. Определение принципов поиска в электронном каталоге.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 01.02.2019
Размер файла 28,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Лингвистическое обеспечение ЭК. К проблемам коммуникабельности информационных ресурсов электронного каталога

Подковырина Е.Н.,

зав. отделом НБ УИПА

Библиотеки - гардеробы, из которых умелые люди могут извлекать кое-что для украшения, многое - для любопытства и еще больше для употребления.

Дж. Дайер

бибилиотека электронный каталог поиск автоматизированный

Лингвистические средства по праву относятся к числу важнейших, системообразующих элементов любой информационно-библиотечной системы. Их качество определяет конечный результат работы системы в целом. Лингвистическое обеспечение (ЛО) предназначено

· для индексирования документов и запросов;

· проведения эффективного поиска в ЭК по тематическим запросам;

· осуществления лингвистической совместимости ЭК различных библиотек с целью обмена данными.

Вопросы ЛО являются, пожалуй, наиболее проблемными и трудоемкими аспектами работы с ЭК.

Стремительное внедрение новых информационных технологий в практику работы библиотек в последние десятилетия не могло не повлиять на развитие ЛО, породив целый комплекс проблем, требующих своего решения. При этом наблюдается явное отставание теории лингвистического обеспечения от реальной практики развития информационно-библиотечных систем. Например, повсеместное распространение электронных каталогов не сопровождается научно-обоснованными рекомендациями по выбору соответствующих средств лингвистического обеспечения; развитие международных и отечественных корпоративных сетей требует ведения каталогизации литературы в едином формате с использованием общих словарных средств и правил описания документов, т. е. решения проблемы соотношения общесистемных и локальных лингвистических средств, а также проблемы их совместимости. Рост уровня информационного сервиса, повышение степени интеллектуальности и аналитичности предоставляемых библиотеками информационных продуктов и услуг невозможны без повышения качества индексирования и роста уровня раскрытия содержания документов.

В литературе по информатике накопилось много различных подходов к понятию ЛО и, соответственно, различных определений этого понятия (или близких понятий “информационно-поисковые языки”, “языковые средства АИС” и др.).

Наиболее известным является классический подход, при котором лингвистическим обеспечением называют комплекс информационно-поисковых языков (ИПЯ), прежде всего, классификационных и вербальных (дескрипторных). В числе последних и языки библиографических данных, включающие правила библиографического описания и форматы библиографической записи.

Так как электронный каталог -- это интеллектуальный продукт работы каталогизатора и объект многочисленных раздумий о совершенствовании качества создаваемых информационных ресурсов, то в рамках ЛО в настоящее время проводится работа по следующим направлениям:

1. Разработка форматов библиографических записей (БЗ).

Полнота и эффективность поиска находятся в прямой зависимости от правильности выбора формы, содержания и структуры представления библиографической информации и, прежде всего, библиографической записи. В практике работы отдела принята тенденция к полноте научного описания всех видов изданий и максимальному отражению всех элементов библиографического описания (БО). При этом приходится учитывать особенности издательского оформления в нашей стране. Сейчас у нас существует большое количество издательств, в том числе частных, часто не соблюдающих стандарт по оформлению издательской продукции.

Традиционно формированию заголовка уделяется большое внимание, эта работа всегда в центре внимания каталогизатора. С одной стороны, мы стремимся к расширению поисковых возможностей, с другой - считаем, что оно не может быть безграничным. В частности, необходимо решить вопрос о количестве авторов, фамилии которых отражаются в блоке Интеллектуальной ответственности. По правилам БО отражаются три автора. Мы допускаем расширение количества указываемых авторов, однако склоняемся к разумному ограничению. Исключение составляют авторы-сотрудники академии (указываются все). Кроме этого, ввод фамилий авторов-сотрудников академии осуществляется через АФ Индивидуальный автор, который является словарем информационно-поискового языка, с помощью которого осуществляется авторитетный контроль при ведении БЗ.

Отказались в работе от практики применения сокращений слов и словосочетаний при формировании таких полей/подполей элементов БЗ, которые являются поисковыми в ЭК, например, таких, как заглавие и серия/подсерия отражаемого документа, чтобы не сужать поисковые возможности ЭК.

Новые возможности поиска заставили обратить серьезное внимание на использование дополнительных, ранее не востребованных данных при составлении библиографического описания документов. Любая, даже самая современная библиотечная система способна выдать ту информацию, которая в нее заложена, и чем полнее и грамотнее введена эта информация, тем более плодотворным будет поиск пользователя. В связи с этим и было принято решение - раскрывать содержание документов.

Одной из актуальных задач в настоящее время для нас является определение целей использования классификационных индексов и создание формата для их представления. Универсальная десятичная классификация (УДК) и Библиотечно-библиографическая классификация (ББК) являются гибкими системами, обладающими богатым набором средств отражения и синтеза информации, что позволяет наиболее полно отображать содержание документа и легко создавать индексы для новых и измененных понятий. Правила построения индексов УДК и ББК строго не регламентированы, что приводит к большой свободе интерпретации. Индексы в классификационных таблицах ББК или УДК представляют собой сложные лексические единицы, построенные по правилам образования индексов соответствующей классификации. Например:

в таблицах ББК для областных библиотек:

2 - Естественные науки,

22 - Физико-математические науки,

22.1 - Математика,

22.14 - Алгебра и т. д.

Кроме этого, правила соединения в классификационных индексах ББК и УДК основного индекса и типового деления или определителя при описании конкретной книги можно считать средством формирования «фразы» на данном ИПЯ.

В настоящее время в работе отдела широко используются отраслевые рабочие таблицы классификации по УДК «Образование. Воспитание. Обучение. Досуг», разработанные отделом научной обработки и каталогизации документов Государственной научно-педагогической библиотеки Украины им. В. А. Сухомлинского. Практика показала, что трудности в работе возникли из-за отсутствия поискового аппарата к Таблицам. Поэтому мы вынуждены были начать работу по созданию АПУ, которую планируем закончить в этом году.

2. Создание методики предметизации с учетом проведения поиска в автоматизированном режиме

При создании предметных рубрик (ПР) чрезвычайно важно, чтобы соблюдалось единство подходов к формулировкам, а язык ПР был предельно формализован и типизирован. Для достижения единообразия и исключения субъективизма при формулировке ПР мы взяли за эталон терминологию алфавитно-предметных указателей к таблицам УДК и ББК, что, в свою очередь, позволяет сохранить единство с АПУ к систематическому каталогу. Опыт работы по предметизации, позволил уяснить несколько основных правил формулировки ПР.

Главное из них - ПР представляет собой выражение самого предмета. Она создается настолько конкретной, насколько конкретен предмет (тема), который она раскрывает. Иными словами, она не должна быть ни уже, ни шире содержания документа.

При необходимости детализации предмета через запятую вносим сведения, уточняющие аспект его рассмотрения. Например:

o башенные краны, монтаж;

o автомобили, эксплуатация;

o детская одежда, моделирование.

Подрубрики уточняют тип документа, например: справочники, учебные пособия, альбомы, авторефераты диссертаций и т. д. В обязательном порядке эти сведения указываются во множественном числе. По возможности такой порядок формулировки следует соблюдать и при создании самих рубрик.

Если есть возможность, в формулировке предметной рубрики не нужно повторять заглавие документа. Например: книге с заглавием «Промышленная психология» присвоена рубрика «инженерная психология»; книге с названием «Риторика» - рубрика «ораторское искусство».

Предметные рубрики и подрубрики представлены, как правило, на двух языках: украинском и русском. Исключения составляют

· термины в области информационных технологий (языки программирования, компьютерные программы) представлены на языке оригинала, а уточнения - на украинском и русском языках. Например:

- Delfi, мова программування;

- Windows XP, настройка.

3. Определение принципов поиска в ЭК.

Библиотечная практика показывает, что пользователь чаще заинтересован в использовании информационных языков вербального типа, чем информационных языков классификационного типа. Классификационные языки обеспечивают в основном поиск по запросам отраслевого характера и обладают большей универсальностью и формализованностью, а вербальные языки - по запросам предметного характера, и именно предметные запросы чаще всего делаются пользователями. В качестве языков индексирования вербального типа могут выступать языки предметных рубрик и ключевых слов.

При этом язык предметных рубрик является менее эффективным средством тематического поиска ввиду отсутствия единой системы предметизации и универсального словаря предметных рубрик.

Среди вербальных языков наблюдается тенденция к предпочтительному использованию в качестве языка индексирования языка ключевых терминов, в наибольшей степени отвечающего потребностям пользователя в актуальной терминологии при узкотематических запросах. В системе ИРБИС словарь автоматически формируется из фамилий авторов, коллективных авторов, из основного заглавия, заглавий части/выпуска, серии, содержания документов.

Практика показывает, что при поиске с помощью ключевых терминов удается найти большее число релевантных документов, чем при поиске с помощью предметных рубрик.

Возможно применение контролируемого (на основе словаря) или свободного (неконтролируемого словарем) индексирования. В любом случае предпочтительно иметь тезаурус и использовать его для обогащения поисковых предписаний. Преимущества тезауруса по сравнению со списком ключевых слов/терминов очевидны. В списках ключевых слов/терминов не отражены смысловые связи между терминами, при этом алфавитный порядок расположения терминов усугубляет эту разобщенность: родственные понятия удалены друг от друга. Использование тезауруса в информационно-поисковых системах повышает качество анализа текста и полноту поиска информации, позволяя расширить запрос синонимическими, более общими или более частными понятиями.

Подводя итоги вышесказанному, хотелось бы еще раз обратить внимание на то, что качество системы автоматизации библиотек во многом определяются тем, какие лингвистические средства в ней используются. Качественной системой можно считать такую систему, которая использует все разнообразие лингвистических средств: словарное обеспечение, встроенные тезаурусы, авторитетные файлы, алфавитно-предметные указатели к системам классификации, классификационные системы в виде специализированных баз данных и другие. Каждый ИПЯ имеет свои достоинства и недостатки, поэтому проблему повышения эффективности поиска целесообразно решать путем использования достоинств каждого из языков индексирования. А значит, мы вновь возвращаемся к принципу интегральности информационной среды и необходимости применения при поиске нескольких ИПЯ. Очевидно, что возможности различных типов ИПЯ дополняют друг друга и будут необходимы в разных поисковых ситуациях.

Литература:

1. Антопольский А. Б. Лингвистическое обеспечение электронных библиотек [Текст] / А. Б. Антопольский. - М.: ФГУП Научно-технический центр «Информрегистр», 2003. - 302 с.

2. Генералова Е. А. Критерии качества лингвистического обеспечения электронного каталога вузовской библиотеки [Электронный ресурс] / Е. А. Генералова. - Режим доступа: http://lib.omgtu.ru/Data/Pages/349/generalova.doc

3. Зайцева Е. М. Лингвистическое обеспечение автоматизированных библиотечно-информационных систем: современные требования и направления развития [Текст] / Е. М. Зайцева // Науч. и техн. б-ки. - 2000. - № 3. - С. 54 -57

4. Скарук Г. А. Языки тематического поиска в электронном каталоге и индиивидуальное поисковое взаимодействие [Текст] / Г. А. Скарук // Библиосфера. - 2005. - № 2. - С. 45-49

5. Сукиасян Э. Р. Требования к информационно-поисковым языкам [Текст] / Э. Р. Сукиасян // Библиотека . - 2004. - № 4 . - С.73-75.

Размещено на Allbest.ru


Подобные документы

  • Становление системы электронных библиотек и соответствующих информационных инфраструктур в современной России. Проблемы создания электронных каталогов. Организация массива данных и разработка программного кода поисковой машины на языке JavaScript.

    курсовая работа [43,7 K], добавлен 03.09.2012

  • Подготовка планово-картографического материала в программном продукте "Adobe Photoshop", сшивка сканированного изображения. Разработка проекта организации территории ассоциации фермерского хозяйства в автоматизированном режиме (в среде ГИС "MapInfo").

    курсовая работа [5,4 M], добавлен 22.04.2012

  • Удовлетворение информационной потребности как цель поиска информации. Виды информационных ресурсов. Понятие документа в информационном поиске. Схема информационного поиска, этапы его представления. Характеристика качества поиска, его базовые положения.

    презентация [1,2 M], добавлен 06.01.2014

  • Сущность проектирования информационных систем как поиска способа, который удовлетворяет требованиям функциональности системы средствами имеющихся технологий с учетом заданных ограничений. Характеристика даталогического и физического проектирования.

    контрольная работа [30,7 K], добавлен 30.09.2011

  • Особенность применения лучевой диагностики в современной среде. Главный анализ внедрения в повседневную практику работы врачей и среднего медицинского персонала информационных технологий. Характеристика построения электронного журнала учета пациентов.

    статья [56,8 K], добавлен 11.09.2017

  • Функциональное назначение информационных ресурсов. Использование push-технологий для распространении различного рода сведений среди пользователей Internet. Создание электронных библиотек даных и организация общих телеконференций во всемирной сети.

    презентация [301,7 K], добавлен 06.05.2011

  • Перспективные направления развития информационных технологий. Методы поиска информации. Канал связи, кодирующее и декодирующее устройство, криптология. Примеры обработки информации. Сущность прагматического, семантического и синтаксического аспекта.

    лекция [253,1 K], добавлен 19.02.2014

  • Основные черты современных информационных технологий. Цель применения информационных технологий - снижение трудоемкости использования информационных ресурсов. Использованные программные средства для разработки информационной системы для продажи книг.

    курсовая работа [1,2 M], добавлен 27.06.2014

  • Определение IT технологий и искусственного интеллекта. Особенности информационных процессов по законодательству РФ. Информационная технология как аналог переработки материальных ресурсов. Роль и значение информационных технологий. IT в военном деле.

    презентация [7,7 M], добавлен 22.08.2017

  • Средства компьютерной, коммуникационной и организационной техники как техническая основа обеспечения информационных технологий. Основные системы классификации компьютеров. Программное обеспечение информационных технологий в маркетинге и экономике.

    лекция [924,6 K], добавлен 01.04.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.