Управление информацией о предметной области на основе онтологий

Создание онтологий как методология кодирования и представления декларативных знаний, причины и предпосылки данного процесса. Принципы организации на основе онтологий электронных ресурсов для интеллектуализации работы поисковых систем сети Интернет.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 27.05.2018
Размер файла 111,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Управление информацией о предметной области на основе онтологий

В настоящее время предпринимаются попытки преобразования информации самого различного вида и содержания в электронную форму для ее последующего централизованного хранения и обработки. Для этого постоянно разрабатываются и совершенствуются компьютерные технологии, позволяющие организовать управление такой информацией в виде, наиболее приближенном к ее естественному восприятию человеком. В таких условиях особую актуальность получает идея компьютеризации знаний о целых предметных областях, что позволит повысить качество работы с программами вследствие наделения их интеллектуальными свойствами, а также создать условия для взаимодействия автономных электронных агентов, выполняющих поиск информации в компьютерных сетях.

Центральным компонентом таких систем стали онтологии, создание которых представляет собой методологию кодирования и представления декларативных знаний [1].

С точки зрения информатики онтологию можно определить как набор определений (на формальном языке) фрагмента декларативных знаний, ориентированный на совместное многократное использование различными пользователями в своих приложениях. Из этого определения следует, что онтология включает комплекс понятий _ от самых общих до наиболее конкретных, _ охватывающий полный спектр объектов и отношений, включая события и процессы, а также значения (атрибутов и отношений), определяемые, если необходимо, во времени и пространстве. Эта система объектов связывается как универсальными зависимостями типа «общее-частное», «часть-целое», «причина-следствие» и т.п., так и специфическими для соответствующей предметной области. Другими словами, онтология - модель предметной области, использующая все допустимые средства представления знаний, релевантные для этой предметной области.

Можно выделить следующие причины, когда возникает потребность в создании онтологий:

- для совместного использования людьми или программными агентами общего понимания структуры информации;

- для возможности повторного использования знаний в предметной области;

- для того, чтобы сделать допущения в предметной области явными;

- для анализа знаний в предметной области.

Онтологии можно применять в качестве строительных блоков компонентов баз знаний, схемы объектов в объектно-ориентированных системах, концептуальной схемы баз данных, структурированного глоссария взаимодействующих сообществ, словаря для связи между агентами, определения классов для программных систем.

Важно отметить, что, как правило, создание онтологии предметной области само по себе не является главной целью. Разработка онтологии напоминает процесс определения набора данных и их структуры для использования другими программами.

Онтологии включают описание как очень общих, так и специфических для конкретной предметной области терминов и могут быть формализованно записаны как O = <X, R, F>, где X - конечное непустое множество понятий (терминов) предметной области; R - конечное множество отношений между понятиями X; F - конечное множество функций интерпретации, заданных на понятиях X и (или) отношениях R.

Для такой формализации онтологии возможны следующие частные случаи.

1. R = Ш, F = Ш. При этом онтология представляет собой простой словарь, и ее практическое использование целесообразно в том случае, если термины принадлежат очень узкой предметной области и их смыслы уже заранее согласованы в пределах некоторого сообщества. Примером такой ситуации могут служить индексы поисковых машин сети Интернет.

2. R = Ш, F ? Ш. Здесь каждому элементу множества X может соответствовать функция интерпретации. При этом часть таких интерпретирующих терминов задаются процедурно, а не декларативно, т. е. смысл терминов предметной области может динамически меняться в зависимости от перехода между прикладными областями.

В общем случае (X ? Ш, R ? Ш, F ? Ш) основной акцент в онтологии делается на задание семантических отношений, имеющихся в предметной области, вместе с созданием единой иерархии понятий, унификацию терминов и правил их интерпретации.

Заметим, что в настоящее время не существует единственного «правильного» способа разработки онтологии. Чаще всего используется итерационный подход, когда, начиная с некоторого чернового варианта, онтология постепенно уточняется с добавлением к ней новых деталей [2].

Как методология инженерии знаний информация в онтологии, как правило, представляется в виде семантической, фреймовой сети. При таком описании узлами сети являются понятия предметной области, а дуги определяют их отношения. Для конкретизации таких понятий они организовываются в иерархию классов, правила проектирования которой близки к технологии объектно-ориентированного программирования. Отличие состоит в том, что объектно-ориентированное программирование сосредоточивается главным образом на операторных свойствах класса, тогда как разработчик онтологии принимает решения, основываясь на структурных свойствах класса [4].

Для описания классов онтологии используются фреймы, представляющие собой именованную структуру данных, состоящую из слотов, с помощью которых описываются свойства понятий для их конкретизации.

Одним из наиболее перспективных направлений в применении онтологий является организация на их основе электронных ресурсов для интеллектуализации работы поисковых систем сети Интернет. В этом случае онтологии предлагается использовать для аннотирования содержимого Интернет-документов, а также для повышения уровня «компетентности» электронных агентов при анализе распределенной информации в хранилищах данных [3]. В частности, для этих целей был разработан проект онтологии для прикладной области «Искусственный интеллект». Областью применения такой онтологии могут быть образовательные или информационно - поисковые системы.

Согласно принципам разработки онтологий для заданной предметной области были определены следующие классы для наиболее общих понятий: «Технологии искусственного интеллекта», «Интеллектуальные системы», «Программное обеспечение», «Области применения», «Источники информации». Далее каждый из классов был уточнен множеством подклассов, например «Интеллектуальные системы»: «Экспертные системы», «Системы анализа естественного языка», «Системы обработки естественного языка», «Системы анализа изображений» и др. На рис.1 приведены верхние уровни таксономии основных понятий предметной области.

Дальнейший шаг связан с выделением понятий каждой категории и организацией связей между ними, он осуществляется непосредственно экспертом в данной предметной области, поскольку автоматическая генерация онтологий в настоящее время затруднительна. Каждый из представленных на рис. 1 классов включает в зависимости от уровня сложности их описания либо группу связанных с ней понятий, либо вложенные подклассы для более подробной детализации. Так, категория «Интеллектуальные системы» включает группу уточняющих и расширяющих это понятие подклассов, представленных на рис. 2.

Рис. 1. Таксономия классов понятий предметной области

онтология интернет сеть электронный

Для дальнейшего уточнения понятий должна быть описана внутренняя структура классов через заполнение соответствующих слотов. С этой целью был определен список терминов, связанных с каждым из понятий и образующих тезаурус, или словарь предметной области.

Описанная таким образом онтология может быть эффективно использована в качестве посредника между пользователем и поисковой системой. При этом взаимодействие с онтологией предполагается на следующих этапах:

- формирование поискового образа релевантного документа;

- построение запроса к поисковой системе;

- формирование списка релевантных документов.

Практическая реализация этого подхода должна позволить пользователю на основе заданного ключевого слова получать информацию не просто в виде отдельных фрагментов (более или менее соответствующих условиям поиска), а как взаимосвязанные, логически выверенные данные этой предметной области, представленные в форме, удобной для статистической обработки и автоматизации процессов принятия решений.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Рис. 2. Таксономия класса «Интеллектуальные системы»

Таким образом, создание онтологий является перспективной технологией управления информацией о предметной области. Ее использование представляет собой подход к структуризации и систематизации знаний, в частности для повышения интеллектуальности информационно-поисковых систем. В то же время отсутствие унифицированных правил формирования онтологий приводит к тому, что их проектирование становится исключительно творческой процедурой, зависящей от множества субъективных факторов. Следствиями этого являются проблема логической верности построенных онтологий, а также ограниченные возможности применения онтологий в качестве универсального средства описания декларативных знаний предметной области. Тем не менее, онтологии остаются важной технологией структуризации и систематизации информационного пространства сети Интернет, совершенствование которой может привести к новому уровню представления информации.

Список литературы

онтология интернет сеть электронный

1. Noy, N. Ontology Development 101: A Guide to Creating Your First Ontology / N. Noy, D. McGuinness // Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI.-2001.

2. Аверченков, В.И. Применение онтологий при создании предметно-ориентированных электронных ресурсов / В.И. Аверченков, П.В. Казаков // Информационные технологии в науке, образовании и производстве: материалы междунар. науч. -техн. конф. - Орел: ОрелГТУ, 2006. _ С. 6-11.

3. Аверченков, В.И. Мониторинг и системный анализ информации в сети Интернет: монография / В.И. Аверченков, С.М. Рощин. - Брянск: БГТУ, 2006. - 160 с.

4. Гаврилова, Т.А. Базы знаний интеллектуальных систем: учеб. пособие для вузов / Т.А. Гаврилова, В. Ф. Хорошевский. - СПб.: Питер, 2000. - 382с.

Размещено на Allbest.ru


Подобные документы

  • Анализ существующих программных средств для автоматического отображения онтологий, их практического применения в зависимости от поставленной задачи и сложности входных онтологий. Отображение сложных онтологий с помощью алгоритма повышенной точности.

    дипломная работа [1,5 M], добавлен 14.06.2012

  • Оценка качества поисковых систем. Индексирование по ключевым словам. Внутренние представления запросов и документов на информационно-поисковом языке. Способы улучшения поиска при помощи тезаурусов и онтологий. Ранжированный поиск (vector-space model).

    лекция [31,5 K], добавлен 19.10.2013

  • Проблема выбора товара в Интернете. Типы и свойства онтологий как части концепции Semantic Web. Разработка web-приложения для выбора музыкального инструмента: создание иерархии онтологий для предметной области "Гитара", формирование SPARQL-запроса.

    дипломная работа [2,2 M], добавлен 20.04.2012

  • Система классов и свойств языка RDFS. Реификация или материализация утверждений. Возможности RDF, RDF Schema в представлении онтологий. Способы представления RDF-описаний. Структура и базовые элементы OWL-онтологии. Языки запросов к RDF-хранилищам.

    презентация [312,1 K], добавлен 01.09.2013

  • Построение баз знаний для семантической сети. Цели создания и язык представления онтологий. Структура исследований в области многоагентных интеллектуальных информационных систем, архитектура агента. Экономическое обоснование разработки базы знаний.

    дипломная работа [1,6 M], добавлен 29.09.2013

  • Построение онтологии предметной области для анализа глобальных процессов на основе информации, получаемой из новостных лент. Средства разработки онтологий, используемых для поиска событий, фактов, извлечённых из СМИ; моделирование экономических рисков.

    курсовая работа [3,4 M], добавлен 27.08.2017

  • Формализации в онтологии областей знаний с помощью концептуальной схемы. Определение атрибутов класса и свойств экземпляров. Создание экземпляров класса и DL-Query запросов. Методика использования для разработки онтологии среды разработки Protege.

    курсовая работа [2,0 M], добавлен 18.06.2014

  • Тезаурус для автоматического концептуального индексирования как особый вид тезауруса. Подходы к описанию отношений при разработке онтологий. Родовидовое отношение выше-ниже. Семантическое смещение. Формальная онтология. Сравнение поисковых механизмов.

    презентация [721,9 K], добавлен 19.10.2013

  • Язык запросов SPARQL. Система классов и свойств языка RDFS. Интенсионал и экстенсионал. Парадокс Рассела. Списки, коллекции и контейнеры ресурсов, текстовые комментарии для создания удобных для чтения примечаний. Утверждение об авторстве утверждения.

    презентация [355,8 K], добавлен 19.10.2013

  • Структура и принципы построения сети Интернет, поиск и сохранение информации в ней. История появления и классификация информационно-поисковых систем. Принцип работы и характеристики поисковых систем Google, Yandex, Rambler, Yahoo. Поиск по адресам URL.

    курсовая работа [3,6 M], добавлен 29.03.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.