Информационно-поисковые тезаурусы

Двуязычный тезаурус Библиотеки Российской академии наук. Дескрипторные и аскрипторные статьи, индексирование документов, обработка запросов по сохранности. Лексические единицы, входящие в дескриптор. Тезаурус терминов по морскому делу и парусному туризму.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 01.06.2009
Размер файла 10,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

ТЕМА:

Информационно-поисковые тезаурусы

1. Информационно-поисковый тезаурус по сохранности документов

1). Первый отечественный двуязычный тезаурус по сохранности документов, подготовленный в Библиотеке Российской академии наук. тезаурус насчитывает 5 166 терминов.

Издание представляет собой образец смешанного двуязычного (русско-английского) тезауруса. Основным языком выбран английский. Это значит, что в качестве дескрипторов выбраны английские термины, а русские термины приводятся как синонимы.

Настоящий информационно-поисковый тезаурус предназначен для индексирования документов и обработки запросов по обеспечению сохранности (хранению) документов в традиционных и нетрадиционных информационных системах. Тезаурус может использоваться как специальный двуязычный словарь при выполнении переводов с русского на английский и с английского на русский язык, а также как терминологический словарь справочник.

В состав тезауруса входят:

- лексико-семантический указатель;

- иерархический указатель;

- хронологический идентификатор.

2). Дескрипторы часто определяют как классы условной эквивалентности терминов, поскольку имеется поисковая и обычная (общеязыковая) эквивалентность языковых единиц, и эти два вида лексической равнозначности терминов в дескрипторных словарях могут не полностью совпадать. Так, например, у лексических единиц, входящих в дескриптор «DERATISATION c. Дератизация, н. MICE, RATS», содержание понятий «мыши» и «крысы» относятся к семантическим категориям «живые организмы», «биологический фактор», а понятие «дератизация» - к лексической категории «операции». Но поскольку при проведении поиска информации различия в категориальном значении указанных слов являются не очень существенными и более важным является их информационно-поисковая эквивалентность, в тезаурусе по сохранности документов понятия «мыши» и «крысы» являются нижестоящими по отношению к термину «deratisation».

В лексико-семантическом указателе тезауруса расположены дескрипторные и аскрипторные статьи.

В рамках дескрипторной статьи термины располагаются в следующем порядке:

- заглавные дескрипторы выделены заглавными буквами;

- дополнительные данные;

- аскрипторы или дескрипторы синонимы, которые следуют за индексом «с»;

- вышестоящие дискрипторы следующие за индексом «в»;

- нижестоящие дескрипторы следующие за индексом «н».

Пример:

ACCTSS CONTROL

c Visitors control

Контроль и управление доступом

в ORGANIZATION OF SECURITY SISTEMS

н ACCESS CONTROL

3). В дескрипторных статьях тезауруса отсутствуют:

- лексическое примечание;

- дескрипторы связанные другими видами отношений.

2. Тезаурус терминов по морскому делу и парусному туризму. (информационно поисковый тезаурус). Составитель В.Н. Белозеров. Москва 2001

1). Тезаурус содержит около 2200 терминов с определениями и тезаурусными связями.

Настоящий словарь-справочник по морскому делу и парусному туризму является терминологическим словарем, в котором для каждого термина дано его определение, при необходимости -- примечания о характере использования, а также семантические связи с другим понятиями.

Наличие явного указания на семантические связи понятий в совокупности с раскрытием их содержания в определениях и комментариях позволяет использовать словарь как "программированный учебник", который ведет читателя от слова к слову, сообщая сведения о понятиях всей сферы интереса.

В состав словаря входит вся специальная терминология, необходимая для изложения материала по организации и проведению туристских плаваний на транспортабельных разборных судах по внутренним водоемам и прибрежным районам морей. Терминология этого вида деятельности дополнена лексикой классического парусного дела, парусного спорта, навигации, гидрографии, организации морских перевозок, что позволяет использовать словарь как справочник по морскому делу в целом.

Словарь состоит из настоящего введения и алфавитного лексико-семантического указателя терминологии. Элементом алфавитного указателя является словарная статья, состоящая из заглавной лексической единицы, определения, примечания и ссылок.

Тематику словаря можно отнести к следующим рубрикам Государственного рубрикатора научно-технической информации:

· 71.37.01 Общие вопросы туристско-экскурсионного обслуживания

· 73.34.01 Общие вопросы водного транспорта

· 77.01.33 Терминология. Справочники, словари, учебная литература по физической культуре и спорту

· 77.29.32 Парусный спорт. Виндсерфинг

· 77.29.33 Спортивный туризм

2). Заглавная лексическая единица возглавляет словарную статью и в дескрипторных статьях выделена заглавными (прописными) буквами. В некоторых случаях в состав заглавной лексической единицы включены факультативные пояснительные слова в круглых скобках. Например: "УЗЕЛ (скорость)" в отличие от "УЗЕЛ (на тросе)".

Определение следует непосредственно после заглавной лексической единицы, отделено от нее тире и набрано шрифтом с уменьшенной высотой букв (в настоящем варианте петит не реализован). В некоторых случаях, когда определение термина очевидно из его внутренней формы, оно не приводится. В тех же случаях, когда термин можно определить с разных сторон и лишь в совокупности соответствующие определения описывают понятие, приводятся два или даже три определения, разделенные точкой с запятой.

Например:

обычное определение:

КЛИВЕР -- треугольный косой парус, передняя шкаторина которого крепится к кливер-лееру, соединяющему стеньгу с ноком бушприта или утлегарем.

определение опущено:

ДАЛЬНОСТЬ ВИДИМОСТИ --

два определения (со стороны значения и со стороны формы):

АЗ -- флаг ВМСС, обозначающий русскую букву А; красный с косицами и белым квадратом у древка.

Важной частью статьи являются ссылки на другие термины или другие формы того же термина. Они позволяют знакомиться с содержанием тезауруса методом "навигации" по ссылкам и уточняют значение терминов, дополнительно раскрывая его через связи термина (набранного обычным светлым шрифтом). Если в статье приводится два или более ссылочных термина, имеющих одинаковый характер связи с заглавной лексической единицей, обозначение ссылки приводится только один раз в первой из строк.

Все термины, указанные в ссылках, являются заглавными лексическими единицами соответствующих статей, в которых можно получить дополнительную информацию о данном термине. Исключение составляют ссылки на обозначения и аббревиатуры.

В настоящем тезаурусе используются следующие виды ссылок, которые располагаются в указанном ниже порядке:

с -- в дескрипторной статье указывает на синонимичный аскриптор;

см -- в аскрипторной статье указывает на синонимичный дескриптор;

исп -- в аскрипторной статье указывает на несколько дескрипторов, среди которых нужно выбрать один, наиболее точно выражающий интересующее читателя понятие;

об -- условное обозначение данного понятия;

вр -- вышестоящее родовое понятие;

вц -- вышестоящий термин, обозначающий объект, включающий в себя данное понятие в качестве своей составной части;

вм -- множество, один из элементов которого обозначается заглавной лексической единицей;

нв -- нижестоящее видовое понятие;

нч -- нижестоящий термин, обозначающий часть объекта, выраженного заглавной лексической единицей;

нэ -- нижестоящий термин, обозначающий один из элементов множества, выраженного заглавной лексической единицей;

асх -- ассоциация по сходству объектов или понятий; асм -- ассоциация по смежности объектов, процессов или явлений; ант -- антоним, т.е. "противоположное" понятие;

ср -- ссылка на аскриптор, предлагающий данную заглавную лексическую единицу в качестве одной из альтернатив для выбора точного термина.

Пример:

АЗИМУТ - направление в пространстве, выраженное относительно стран света

вр: направление

нв: азимут светила; истинный азимут; компасный азимут; магнитный азимут;

асх: пеленг; румб

асм: круговая система азимутов; румбовая система азимутов; четвертная система азимутов

3). Настоящий словарь, рассматриваемый как тезаурус, подготовлен в соответствии с ГОСТ 7.25 -- 80.

Список литературы

1. ГОСТ 7.24-90. тезаурус информационно-поисковый многоязычный.

2. ГОСТ 7.25-2001. тезаурус информационно-поисковый одноязычный.


Подобные документы

  • Тезаурусы как инструмент для облегчения поиска языковых средств выражающих данное понятие. Виды, состав и структура тезауруса. Сущность информационно-поискового тезауруса по сохранности документов. Тезаурус терминов по морскому делу и парусному туризму.

    контрольная работа [22,1 K], добавлен 01.07.2009

  • Тезаурус для автоматического концептуального индексирования как особый вид тезауруса. Подходы к описанию отношений при разработке онтологий. Родовидовое отношение выше-ниже. Семантическое смещение. Формальная онтология. Сравнение поисковых механизмов.

    презентация [721,9 K], добавлен 19.10.2013

  • Компоненты документальной информационно-поисковой системы. Результаты индексирования документов и запросов. Иерархическая, фасетная и эмпирическая классификационные схемы. Дескрипторные информационно-поисковые языки. Примеры дескрипторной статьи.

    презентация [59,2 K], добавлен 14.10.2013

  • Информационно-поисковый тезаурус, его определение и цель разработки. Организация быстрого и эффективного поиска документальной информации. Использование, структура, построение, сфера применения и перспективы развития информационно-поисковых тезаурусов.

    контрольная работа [17,6 K], добавлен 01.08.2009

  • Отличительные особенности тезауруса для автоматического концептуального индексирования. Методы, используемые при формировании состава Общественно-политического тезауруса. Описание идеи алгоритма, основанного на учете структуры связного текста.

    презентация [38,0 K], добавлен 01.09.2013

  • Основные принципы построения информационно-поисковых систем. Архитектура современных информационно-поисковых систем WWW. Принцип работы поисковых систем. Процесс поиска, информационный язык, перевод, дескриптор, критерий соответствия, индексирование.

    курсовая работа [70,2 K], добавлен 10.06.2014

  • Оценка качества поисковых систем. Индексирование по ключевым словам. Внутренние представления запросов и документов на информационно-поисковом языке. Способы улучшения поиска при помощи тезаурусов и онтологий. Ранжированный поиск (vector-space model).

    лекция [31,5 K], добавлен 19.10.2013

  • Информационно-поисковые системы. Создание основных и вспомогательных таблиц, запросов для отбора данных по критериям поиска, отчётов для формирования выходных документов и вывода их на печать в программе Access. Построение функции в Microsoft Excel.

    курсовая работа [650,8 K], добавлен 04.05.2015

  • Повышение эффективности (снижение времени, увеличение релевантности документов) поиска данных в больших массивах неструктурированной текстовой информации с помощью поисково-информационных и поисково-справочных машин. Классификация сайтов. Языки запроса.

    дипломная работа [523,2 K], добавлен 07.07.2015

  • Исследование особенностей организации мультимедийной информации. Абстрактные представления. Языки запросов для мультимедийных данных. Индексирование в структурированных мультимедийных базах данных. Анализ мультимедиа-интерфейса для описания содержимого.

    презентация [174,6 K], добавлен 11.10.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.