Информационно-поисковые языки

Классификационный информационно-поисковый язык предназначен для индексирования (частей) документов и информационных запросов посредством понятий и кодов некоторой выбранной классификации документов. ИПЯ по способу учета парадигматических отношений.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 26.04.2015
Размер файла 112,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Оглавление

1. Классификация ИПЯ, используемых в АБИС. Информационно-поисковые тезаурусы

2. Общие сведения о персональном компьютере

3. Назначение баз данных авторитетных записей

Список литературы

1. Классификация ИПЯ, используемых в АБИС. Информационно-поисковые тезаурусы

Классификационный информационно-поисковый язык - информационно-поисковый язык, предназначенный для индексирования (частей) документов и информационных запросов посредством понятий и кодов некоторой выбранной классификации документов (классификационной системы).

Первоначальные подходы к классификации тематики (предмета) документов основывались на формировании списка предметных заголовков, располагаемых в алфавитном порядке. Каждая предметная рубрика получала определенный цифровой или буквенно-цифровой код. Содержание (предметы) документа индексировалось перечислением кодов тех рубрик, которые отражали предметы документа. Такие подходы получили название перечислительной классификации.

При систематизированной классификации список предметных рубрик строится, как иерархическая структура, в виде перевернутого дерева. Вся предметная область ИПС разбивается на ряд взаимоисключающих (непересекающихся) рубрик. Каждая рубрика, в свою очередь, может включать несколько подрубрик по принципу "Род-Вид". Таким образом, при систематизированной классификации используются уже некоторые семантические основы предметной области, выражаемые в родо-видовых отношениях основных категорий, понятий и классов.

Так же, как и при перечислительной классификации, содержание документа индексируется кодами соответствующих рубрик, однако при этом отпадает необходимость в явном указании более общих рубрик, к которым относятся отмеченные подрубрики. В результате индексирование и поиск документов на основе иерархической классификации позволяют более адекватно отражать содержание документов и обеспечивают большую точность поиска.

Перечислительный и иерархический подходы к классификации впоследствии воплотились в широко используемых в библиотечной практике алфавитно-предметных каталогах, наиболее распространенным из которых в настоящее время является УДК, ББК, ГРНТИ.

Недостатком как перечислительной, так и иерархической классификации является принципиальная невозможность заранее перечислить все темы, по которым существуют или могут существовать документы.

Принцип организации классификационного индексирования документов, преодолевающего в определенной степени такие ограничения перечислительной и иерархической классификации, был предложен в 30-х годах выдающимся индийским библиотековедом и математиком Ш.Р. Ранганатаном. Впоследствии развит в работах английской группы по исследованию классификаций (Classification Research Group) и получил название аналитико-синтетической или иначе фасетной классификации (Классификатор грузов, упаковке и упаковочных материалов). Идея фасетной классификации состоит в том, что вся предметная область сведений разбивается на ряд исходных групп рубрик (фасет) по организационно-технологическому или семантическому принципу, отражающему специфику предметной области.

Фасеты выступают в роли "кирпичиков", из которых можно сложить (сконструировать) любую, даже самую сложную и узкую предметную рубрику. Внутри фасет предметные рубрики строятся и упорядочиваются по алфавитно-иерархическому принципу.

Основное достоинство фасетной классификации заключается в возможности ограниченным небольшим перечнем фасетных рубрик отразить (сконструировать) огромное количество узких специализированных рубрик и, тем самым, наиболее точно и полно проиндексировать содержание документов.

ИПЯ по способу координации лексических единиц.

ИПЯ - разновидность ИЯ, предназначенная для индексирования ПОД, и ПОЗ, а также описания фактов с целью последующего поиска и хранения.

1) Типология по способу задания лексики:

- контролируемые ИПЯ (дескрипторные, иерархические)

- неконтролируемые - строятся на основе выбора многих терминов естественного языка (язык вспомогательных указателей, язык КС, БО).

2) Типология по способу координации ЛЕ:

- некоординируемые - жесткие классификационные схемы, в которых для одного объекта только одно место (перечислительные классификации).

- координируемые - ЛЕ координируются и в процессе индексирования и в процессе поиска. Различают:

- предкоординатные - сочетание ЛЕ устанавливается в процессе индексирования по заранее определенным правилам, и предусматривающие их жесткую последовательность (иерархические классификации, фасетные, язык ПР). парадигматический информационный индексирование

- посткоординатные - сочетаются в процессе ПОЗ (дискрипторные ИПЯ, объектно-признаковые)

3) ИПЯ по способу ПарО:

- с учетом ПарО: иерархические, фасетные, неиерархические (алфавитно-предметные)

- процедурные языки (языки запросов и манипулирования данными)

4) По области или по сфере применения информационно-поисковых языков можно выделить:

- Коммуникативные (общесистемные) ИПЯ - предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными) системами (в т.ч. распределенными по государственной, ведомственной или территориальной принадлежности) - (международная система ведомств АРБИКОН);

- Локальные (внутренние) ИПЯ - предназначенные для использования в рамках отдельной системы;

- Внешние ИПЯ - используемые в других системах и предназначенные для взаимодействия только с ними.

ИПЯ по способу учета парадигматических отношений.

ИПЯ - разновидность ИЯ, предназначенная для индексирования ПОД, и ПОЗ, а также описания фактов с целью последующего поиска и хранения.

1) Типология по способу задания лексики:

- контролируемые ИПЯ (дескрипторные, иерархические)

- неконтролируемые - строятся на основе выбора многих терминов естественного языка (язык вспомогательных указателей, язык КС, БО).

2) Типология по способу координации ЛЕ:

- некоординируемые - жесткие классификационные схемы, в которых для одного объекта только одно место (перечислительные классификации).

- координируемые - ЛЕ координируются и в процессе индексирования и в процессе поиска. Различают:

- предкоординатные - сочетание ЛЕ устанавливается в процессе индексирования по заранее определенным правилам, и предусматривающие их жесткую последовательность (иерархические классификации, фасетные, язык ПР). парадигматический информационный индексирование

- посткоординатные - сочетаются в процессе ПОЗ (дискрипторные ИПЯ, объектно-признаковые)

3) ИПЯ по способу ПарО:

- с учетом ПарО: иерархические, фасетные, неиерархические (алфавитно-предметные)

- процедурные языки (языки запросов и манипулирования данными)

4) По области или по сфере применения информационно-поисковых языков можно выделить:

- Коммуникативные (общесистемные) ИПЯ - предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными) системами (в т.ч. распределенными по государственной, ведомственной или территориальной принадлежности) - (международная система ведомств АРБИКОН);

- Локальные (внутренние) ИПЯ - предназначенные для использования в рамках отдельной системы;

- Внешние ИПЯ - используемые в других системах и предназначенные для взаимодействия только с ними.

Можно выделить два определения информационно-поискового тезауруса:

1. Информационно-поисковый тезаурус представляет собой словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно-поискового языка (дескрипторами) и предназначенный для поиска слов по их смысловому содержанию.

2. Информационно-поисковый тезаурус (ИПТ) - контролируемый словарь терминов предметной области, создаваемый для улучшения качества информационного поиска в данной предметной области.

И в том, и в другом случае речь идет о словаре, который призван облегчить поиск необходимой информации.

Возможно два способа расположения слов в словарях: по близости их буквенного состава и по смысловой близости.

По первому способу создаются алфавитные словари. По второму способу - тезаурусы. Алфавитные словари служат для раскрытия значения данного слова. Тезаурусы служат для поиска слов для выражения данного понятия. Т.е., если в обычном словаре по слову ищется его смысл, то в тезаурусе по заданному смыслу ищутся слова, которые этот смысл выражают.

Цели разработки ИПТ:

- перевод языка авторов на контролируемый язык, используемый для индексации и поиска;

- обеспечение последовательности в присваивании индексных терминов;

- обозначение отношений между терминами;

- облегчение информационного поиска

Использование информационно-поисковых тезаурусов.

Тезаурусы используют в своей работе специалисты, в той или иной степени связанные с подготовкой и обработкой текстовой информации: переводчики, редакторы, научные работники, референты и др.

Информационно-поисковые тезаурусы используются при индексировании документов и запросов.

Различают безтезаурусное индексирование и индексирование с тезаурусным контролем лексики.

При безтезаурусном индексировании поисковый образ документа представляется в виде списка ключевых слов, выбранных непосредственно из текста документа. Такое индексирование требует меньше времени и менее трудоемко. Однако такой режим индексирования обладает рядом недостатков: возможна синонимия; нельзя отразить парадигматические отношения.

При индексировании с тезаурусным контролем лексики для выражения содержания документа и запроса используют только дескрипторы, входящие в информационно-поисковый тезаурус, что позволяет исключить синонимию и учесть парадигматические связи, и, в конечном счете, повышает эффективность поиска.

Таким образом, информационно-поисковые тезаурусы используются для:

- перевода текста с ЕЯ на дескрипторный ИПЯ путем замены ключевых слов соответствующими дескрипторами, при этом исключается многозначность;

- отображения парадигматических связей между дескрипторами.

Структура информационно-поискового тезауруса

Тезаурус имеет вид словаря, в котором в определенном порядке расположены термины и зафиксированы связи между ними.

Как правило, тезаурус состоит из введения, алфавитного указателя (словарная часть) и систематического указателя.

Введение содержит общие характеристики тезауруса - область применения, правила использования, число дескрипторов, ключевых слов и другую справочную информацию.

Алфавитный указатель включает алфавитный перечень дескрипторных статей.

Дескрипторная статья может иметь следующую структуру:

- заглавный дескриптор;

- ключевые слова из класса эквивалентности;

- дескрипторы, подчиняющие заглавный;

- дескрипторы, подчиненные заглавному;

- дескрипторы, ассоциированные с заглавным.

Ассоциации могут быть следующих видов: причина - следствие; сырье - продукт; процесс - объект; процесс - субъект; свойство - носитель свойства; функциональное сходство и др.

Систематический указатель служит для раскрытия, учета и контроля парадигматических отношений между дескрипторами. Для каждого дескриптора ИПЯ должны быть найдены соответствующие родовые и видовые дескрипторы. Причем предварительно необходимо сформулировать критерии, определяющие число уровней иерархии. Определение степени отображения парадигматических отношений зависит от требований, предъявляемых к системе. Чем шире эти отношения отображены, тем выше полнота выдачи, но одновременно происходит увеличение словарного запаса, усложняется система ссылок и может произойти уменьшение точности поиска.

2. Общие сведения о персональном компьютере

Персональные компьютеры (ПК) появились в результате эволюции миникомпьютеров при переходе элементной базы машин с малой и средней степенью интеграции на большие и сверхбольшие интегральные схемы. ПК, благодаря своей низкой стоимости, очень быстро завоевали хорошие позиции на компьютерном рынке и создали предпосылки для разработки новых программных средств, ориентированных на конечного пользователя. Это прежде всего - "дружественные пользовательские интерфейсы", а также объектно-ориентированные среды и инструментальные средства для автоматизации разработки прикладных программ.

Быстрый рост производительности ПК на базе новейших микропроцессоров Intel в сочетании с резким снижением цен на эти изделия, делают современные персональные компьютеры все более популярными.

Основные компоненты персонального компьютера.

Современный персональный компьютер состоит из следующих основных компонентов:

1. Системный блок;

2. Монитор служит для отображения текстовой и графической информации;

3. Клавиатура - устройство ввода информации;

4. Мышь - манипулятор - альтернативное устройство ввода информации.

На рисунке 2.1 показаны основные блоки персонального компьютера

Рисунок 2.1 Основные компоненты компьютера

Основной частью любого компьютера является системный блок, в котором находятся практически все основные устройства. К системному блоку подключаются основные устройства ввода-вывода информации - монитор, клавиатура, мышь.

Существует два вида компоновки системного блока - desktop и tower.

Компоновка desktop определяет горизонтальное расположение системного блока на рабочем столе (рисунок 2.2).

Рисунок 2.2 ПК с корпусом desktop.

Модели desktop бывают нескольких размеров и подразделяются на: full-size, baby-AT(АТХ) или slim-sized, однако все они имеют общий дизайн.

Модели tower (рисунок 2.3) располагаются в вертикальном положении и также подразделяются на несколько разновидностей: mini-tower, midsize-tower, full-tower и т.д.

Рисунок 2.3 ПК с корпусом tower.

Модели tower имеют ряд преимуществ по сравнению с desktop - они занимают меньше места на столе, а модели tower больших размеров предоставляют дополнительное место для внутренних дисководов.

Независимо от того какой вид компоновки имеет ПК (tower или desktop) все они имеют общие для всех компьютеров элементы.

Основные компоненты системного блока.

На лицевой панели системного блока расположены следующие компоненты:

Кнопки - обычно две или три (рисунок 2.4).

Кнопка Power предназначена для включения и выключения компьютера.

Кнопка Turbo использовалась в компьютерах старых поколений (286, 386 и 486) и была предназначена для ускорения или наоборот для замедления работы компьютера. С выходом новых процессоров семейства Pentium необходимость в данной кнопке отпала.

Кнопка Sleep стала применяться в компьютерах семейства Pentium II и при необходимости позволяет перевести компьютер в режим ожидания. В современных компьютерных системах эта кнопка заменила на лицевой панели кнопку Turbo.

Кнопка Reset предназначена для перезагрузки компьютера. Без выключения питания - почти так же, как если выключить и включить компьютер с помощью кнопки Power. Перезагрузка - процесс перезапуска ПК в случае если компьютер в результате какой-либо ошибки в его работе отказывается выполнять любые ваши команды. Данное состояние называется "зависанием". Существует два способа перезагрузки - горячая и холодная. Холодная перезагрузка - это кардинальный процесс и выполняется при выключенном питании. При этом удаляются все данные, которые располагаются в памяти компьютера. При холодной перезагрузке выполняется также POST (самотестирование при загрузке). Горячая перезагрузка предполагает постоянное присутствие питания, и данный процесс несет в себе меньше нагрузки для электронных компонентов компьютера.

Индикаторы - две (или три) светящиеся лампочки, отражающие определенные параметры при работе компьютера (рисунок 2.4).

Индикатор питания показывает текущее состояние компьютера: включен он в сеть или нет. Этот индикатор горит на протяжении всей работы компьютера и обозначается символом горящей лампочки.

Индикатор работы жестких дисков зажигается когда компьютер производит запись или чтение данных с жесткого диска. Обычно индикатор работы жестких дисков обозначается символом цилиндра.

Дисководы. На передней панели обязательно располагается устройство для работы со сменными носителями информации, - дисковод. Маленький дисковод предназначен для работы с магнитными дисками размера 3,5 дюйма.

На задней панели ПК (рисунок 2.5) располагаются разъемы для подключения питания, а так же различные разъемы (порты), предназначенные для подключения различных дополнительных устройств. Подключить какое-либо устройство не правильно практически невозможно т.к. каждый разъем уникален и имеет свое строго определенное место расположения.

Внутри системного блока располагаются все основные узлы компьютера (рисунок 2.6):

· Системная плата

· Процессор

· Оперативная память

· Корпус

· Блок питания

· Дисковод для гибких дисков

Жесткий диск (винчестер) Накопитель CD-ROM, CD-R или DVD-ROM

· Видеоадаптер

Рисунок 2.6 Устройство системного блока

3. Назначение баз данных авторитетных записей

Большие объёмы информации удобнее организовывать в базы данных. Пример: база данных предприятия хранит информацию о кадрах, заказах, заказчиках, поставщиках, выпускаемой продукции и т. д. Назначение базы данных - организация информации так, чтобы можно было легко и быстро находить её, чтобы одну и ту же совокупность данных можно было использовать для максимального числа приложений. Вся информация в базе данных должна отражать действительное состояние объекта, т. е. постоянно дополняется, корректируется.

Авторитетные данные - это нормируемые, контролируемые элементы поисковых полей библиографических записей, обозначаемые не кодами, а лексическими средствами языков. В теории и практике информационного, в том числе библиографического, поиска давно освоены два типа контролируемых вербальных информационно-поисковых языков: язык предметных рубрик и дескрипторный язык. В терминологии авторитетного контроля это и есть один из видов авторитетных /нормативных данных

Реализация двуязычия заголовков авторитетных записей:

Формируются две авторитетные записи на обоих языках каталогизации

Авторитетная запись создается на одном из языков каталогизации, заголовок на другом языке представлен в качестве варианта

Заголовок на одном из языков каталогизации не приводится

Структура авторитетной базы данных

· * авторитетные/нормативные записи с принятой формой заголовка

· ** с предварительной формой заголовка

· ** автоматически сформированы с принятой формой заголовка

· ** прототипы

· * ссылочные записи

· * справочные записи

Какие проблемы электронного каталога можно решить при надлежащей работе с авторитетными записями?

Повышение эффективности и скорости работы. Использование в качестве источника данных при выборе всей рубрики или её элементов.

Исключение многовариантности наименований в словаре. Снижение возможности орфографической ошибки.

Есть и сложности.

Необходимость создание серьезной методической базы

Необходимость преодоления длительного временного "плато" от начала создания базы данных до её полноценного использования. Выполнение работы "по остаточному принципу"

Список литературы

1. Жигарев, А.Н. Основы компьютноной грамоты [Текст] / А.Н. Жигарев -Л. Машиностроение. Ленинг. отд-ие, 1987 г. - 255 с.

2. Зайцев, Е.М. Что нужно современной библиотеке: гипертекстовое лингвистическое пространство или автоматизированные лингвистические системы [Текст] / Е.М. Зайцев // Научные и технические библиотеки. - 2005. - № 4.- С. 5-13.

3. Кузнецов, Е. Ю., Осман, В.М. Персональные компьютеры и программируемые микрокалькуляторы [Текст]: учеб. пособие для ВТУЗов - М.: Высш. шк. -1991.- 160 с.

4. Растригин, Л.А. С компьютером наедине [Текст] / Л.А. Растригин. - М.: Радио и связь, - 1990. - 224 с.

5. Сизых, И. Лингвистическое обеспечение электронного каталога [Текст] / И. Сизых // Библиотека. - 2009. - № 6. - С. 35-38.

6. Храмцов, П.И. Информационно-поисковые языки [Текст]/ П.И. Храмцов.- М.: Гелиос.- 2008.- 244 с.

Размещено на Allbest.ru


Подобные документы

  • Компоненты документальной информационно-поисковой системы. Результаты индексирования документов и запросов. Иерархическая, фасетная и эмпирическая классификационные схемы. Дескрипторные информационно-поисковые языки. Примеры дескрипторной статьи.

    презентация [59,2 K], добавлен 14.10.2013

  • Информационно-поисковый язык и словарь. Последовательность процедуры поиска. Фактографические, документальные и геоинформационные системы. Справочно-правовая система "Консультант Плюс", "Гарант". Структура и состав информационных продуктов "Кодекс".

    контрольная работа [250,6 K], добавлен 07.10.2013

  • Повышение эффективности (снижение времени, увеличение релевантности документов) поиска данных в больших массивах неструктурированной текстовой информации с помощью поисково-информационных и поисково-справочных машин. Классификация сайтов. Языки запроса.

    дипломная работа [523,2 K], добавлен 07.07.2015

  • Основные принципы построения информационно-поисковых систем. Архитектура современных информационно-поисковых систем WWW. Принцип работы поисковых систем. Процесс поиска, информационный язык, перевод, дескриптор, критерий соответствия, индексирование.

    курсовая работа [70,2 K], добавлен 10.06.2014

  • Тезаурус для автоматического концептуального индексирования как особый вид тезауруса. Подходы к описанию отношений при разработке онтологий. Родовидовое отношение выше-ниже. Семантическое смещение. Формальная онтология. Сравнение поисковых механизмов.

    презентация [721,9 K], добавлен 19.10.2013

  • Информационно-поисковый тезаурус, его определение и цель разработки. Организация быстрого и эффективного поиска документальной информации. Использование, структура, построение, сфера применения и перспективы развития информационно-поисковых тезаурусов.

    контрольная работа [17,6 K], добавлен 01.08.2009

  • Анализ существующих поисковых систем и используемых ими алгоритмов поиска документов. Разработка информационно-поисковой системы словарного типа, способной осуществлять релевантный поиск документов, особенности ее структуры и информационно-поисковой базы.

    дипломная работа [942,1 K], добавлен 19.05.2011

  • Тезаурусы как инструмент для облегчения поиска языковых средств выражающих данное понятие. Виды, состав и структура тезауруса. Сущность информационно-поискового тезауруса по сохранности документов. Тезаурус терминов по морскому делу и парусному туризму.

    контрольная работа [22,1 K], добавлен 01.07.2009

  • Проектирование алгоритмов и программных кодов для различных элементов пользовательских форм информационно-аналитической системы. Исследование структуры базы данных. Связь между таблицами. Разработка графического интерфейса программы и справочной системы.

    курсовая работа [2,4 M], добавлен 10.01.2015

  • Изучение классификации поисковых средств по В.В. Дудихину. Поиск информации с помощью поисковых ресурсов. Формирование запросов. Использование ключевых слов. Индексация документов, размещенных на различных серверах. Зарубежные лидеры поисковых систем.

    презентация [775,3 K], добавлен 10.03.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.