Онтологический инжиниринг знаний в системе Protege

Процесс построения онтологий, которые описывают концепции предметной области, определяют отношения между ними. Начало создания онтологии, разработка простейшей системы. Формальный анализ терминов. Отделение знаний предметной области от оперативных знаний.

Рубрика Программирование, компьютеры и кибернетика
Вид доклад
Язык русский
Дата добавления 20.12.2020
Размер файла 23,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Национальный ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«МЭИ»

ИНЖЕНЕРНО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

Кафедра безопасности и информационных технологий

Направление подготовки бакалавриата

10.03.05-«Бизнес-информатика»

Доклад

Тема: «Онтологический инжиниринг знаний в системе Protege»

Москва 2020 г.

Введение

В связи с развитием научных областей деятельности человека значение компьютерных технологий в наше время непрерывно растет. Количество информации увеличивается и появляется потребность в разработке новейших способов ее представления, хранения, обработке, а так же систематизации. Исходя из этого, интерес к базам знаний возрастает. Такие базы знаний применяют в практических целях.

Целью работы является изучение общих сведений об Онтологическом инжиниринге знаний в системе Protege

Что такое онтология?

Онтология описывает основные концепции (положения) предметной области и определяет отношения между ними. Процесс построения онтологий состоит из создания следующих блоков:

* Классов и их свойств (classes, properties).

* Свойств каждой концепции, описывающих различные функциональные возможности и атрибуты концепции (cлоты (slots), иногда называемые роли).

* Ограничения по слотам (также известных как аспекты/грани (slot facets), иногда называемые ограничения ролей).

Онтология вместе с множеством индивидуальных экземпляров классов составляют базу знаний. В литературе по искусственному интеллекту содержится много определений понятия онтологии, многие из которых противоречат друг другу. В этой статье онтология - формальное явное описание понятий в рассматриваемой предметной области (классов, иногда их называют понятиями), свойств каждого понятия, описывающих различные свойства и атрибуты понятия (слотов (иногда их называют ролями или свойствами)), и ограничений, наложенных на слоты (фацетов, иногда их называют ограничениями ролей). Онтология вместе с набором индивидуальных экземпляров классов образует базу знаний. В действительности, трудно определить, где кончается онтология и где начинается база знаний.

Для чего создаются онтологии?

В последние годы разработка онтологий - явное формальное описание терминов предметной области и отношений между ними - переходит из мира лабораторий по искусственному интеллекту на рабочие столы экспертов по предметным областям. Во всемирной паутине онтологии стали обычным явлением. Онтологии в сети варьируются от больших таксономий, категоризирующих веб-сайты (как на сайте Yahoo!), до категоризаций продаваемых товаров и их характеристик (как на сайте Amazon.com). Во многих дисциплинах сейчас разрабатываются стандартные онтологии, которые могут использоваться экспертами по предметным областям для совместного использования и аннотирования информации в своей области. Например, в области медицины созданы большие стандартные, структурированные словари, такие как SNOMED и семантическая сеть Системы Унифицированного Медицинского Языка (the Unified Medical Language System). Также появляются обширные общецелевые онтологии. Например, Программа ООН по развитию (the United Nations Development Program) и компания Dun & Bradstreet объединили усилия для разработки онтологии UNSPSC, которая предоставляет терминологию товаров и услуг (http://www.unspsc.org/). Онтология определяет общий словарь для ученых, которым нужно совместно использовать информацию в предметной области. Она включает машинно-интерпретируемые формулировки основных понятий предметной области и отношения между ними. Почему возникает потребность в разработке онтологии? Вот некоторые причины: * Для совместного использования людьми или программными агентами общего понимания структуры информации. * Для возможности повторного использования знаний в предметной области. * Для того чтобы сделать допущения в предметной области явными. * Для отделения знаний в предметной области от оперативных знаний. * Для анализа знаний в предметной области. Совместное использование людьми или программными агентами общего понимания структуры информации является одной из наиболее общих целей разработки онтологий. К примеру, пусть несколько различных веб-сайтов содержат информацию по медицине или предоставляют информацию о платных медицинских услугах, оплачиваемых через Интернет. Если эти веб-сайты совместно используют и публикуют одну и ту же базовую онтологию терминов, которыми они все пользуются, то компьютерные агенты могут извлекать информацию из этих различных сайтов и накапливать ее. Агенты могут использовать накопленную 7 информацию для ответов на запросы пользователей или как входные данные для других приложений. Обеспечение возможности использования знаний предметной области стало одной из движущих сил недавнего всплеска в изучении онтологий. Например, для моделей многих различных предметных областей необходимо сформулировать понятие времени. Это представление включает понятие временных интервалов, моментов времени, относительных мер времени и т.д. Если одна группа ученых детально разработает такую онтологию, то другие могут просто повторно использовать ее в своих предметных областях. Кроме того, если нам нужно создать большую онтологию, мы можем интегрировать несколько существующих онтологий, описывающих части большой предметной области. Мы также можем повторно использовать основную онтологию, такую как UNSPSC, и расширить ее для описания интересующей нас предметной области. Создание явных допущений в предметной области, лежащих в основе реализации, дает возможность легко изменить эти допущения при изменении наших знаний о предметной области. Жесткое кодирование предположений о мире на языке программирования приводит к тому, что эти предположения не только сложно найти и понять, но и также сложно изменить, особенно непрограммисту. Кроме того, явные спецификации знаний в предметной области полезны для новых пользователей, которые должны узнать значения терминов предметной области. Отделение знаний предметной области от оперативных знаний - это еще один вариант общего применения онтологий. Мы можем описать задачу конфигурирования продукта из его компонентов в соответствии с требуемой спецификацией и внедрить программу, которая делает эту конфигурацию независимой от продукта и самих компонентов. После этого мы можем разработать онтологию компонентов и характеристик ЭВМ и применить этот алгоритм для конфигурирования нестандартных ЭВМ. Мы также можем использовать тот же алгоритм для конфигурирования лифтов, если мы предоставим ему онтологию компонентов лифта. Анализ знаний в предметной области возможен, когда имеется декларативная спецификация терминов. Формальный анализ терминов чрезвычайно ценен как при попытке повторного использования существующих онтологий, так и при их расширении. Часто онтология предметной области сама по себе не является целью. Разработка онтологии сродни определению набора данных и их структуры для использования другими программами. Методы решения задач, доменнонезависимые приложения и программные агенты используют в качестве данных онтологии и базы знаний, построенные на основе этих онтологий.

онтология инжиниринг знание

Создание онтологии

Строго говоря, единого универсального подхода к созданию онтологий, который бы привел к однозначно успешному результату не существует. Процесс создания онтологий обычно является итеративным, т.е. сначала создается черновой набросок, а затем по мере необходимости происходит возврат для определения деталей, и так продолжается до тех пор, пока онтология не будет отражать концепцию предметной области с определенной степенью. Практически, создание онтологий включает:

1. Определение классов в онтологии

2. Организация классов в некоторую иерархию (базовый класс -> подкласс)

3. Определение слотов и их допустимых значений

4. Заполнение значений слотов для экземпляров классов.

Как определить, правильно ли создана онтология?

Для любой предметной области может существовать бесчисленное количество онтологий; ведь каждая новая онтология - это всего лишь еще один из способов структурирования концепций и отношений между ними. Однако существуют несколько простых принципов, которые могут помочь при принятии решений о том, как создавать те или иные онтологии: * Не может быть только одного способа описания модели предметной области - всегда есть жизнеспособная альтернатива. Лучшее решение почти всегда будет зависеть от того, какая система разрабатывается и от возможных будущих изменений в системе. * Процесс разработки обязательно должен быть итеративным. * Концепции в онтологии должны быть максимально близки к объектам (логическим или физическим) и отношениям между ними в интересуемой области знаний. При правильном моделировании, онтология может быть представлена предложениями, где вероятней всего в качестве существительных будут объекты, а отношений - глаголы.

Начало создания онтологии

Для начала необходимо понять, для чего должна быть использована онтология и как примерно выглядел бы ее детальный и общий вариант. Затем среди многих альтернатив вы должны будете выбрать ту, которая будет лучше всего работать для намеченной задачи, а также будет наиболее 9 интуитивна, расширяема, поддерживаема. При этом необходимо помнить, что онтология представляет предметную область в реальном окружающем мире, и потому понятия в онтологии также должны отражать эту реальность. После того как вы сделаете черновой вариант онтологии, вы можете проверить ее и откорректировать, используя Protйgй, или путем обсуждения с экспертами в исследуемой области (как результат, почти наверняка придется пересмотреть черновой вариант). Такой процесс итеративной коррекции, вероятней всего, будет продолжаться на протяжении всего жизненного цикла онтологии

Разработка простейшей системы

Предположим, что мы хотим разработать систему, которая помогает управлять стоимостью и организацией печатного издания (для простоты можно взять некую газету). Система должна отвечать на следующие вопросы:

* Кто ответственный за каждый раздел в газете?

* Каково содержимое каждой статьи в разделе и кто автор?

* Перед кем отчитывается каждый автор?

* Каково расположение и расходы на каждую статью?

После того как мы определились с идеей, мы можем расписать некоторые из важных положений системы. Сюда могут войти: основные концепции и их свойства, а также отношения между ними. Для начала мы можем просто определить термины, независимо от роли, которую они могут играть в онтологии. Итак, в любой газете есть разделы. Каждый раздел имеет содержимое, например, статьи, реклама и т.д. и ответственного редактора. У каждой статьи есть автор, который может быть как работником газеты, так и быть приглашенным со стороны. Для каждого автора, работающего в газете, мы хотим знать его имя и зарплату, а также перед кем он отчитывается. По мере определения понятий, мы неявно определяем рамки нашей онтологии, а именно, что мы должны будем включить в нашу модель, а что нет. К примеру, при начальном рассмотрении термина «работник», мы, возможно, хотели бы включить в это понятие вахтера или водителя грузовика из службы доставки. Однако, подумав, мы могли осознать, что хотим чтобы наша онтология была сфокусирована на производственных затратах, связанных напрямую с тем что, как и где написано в газете. Таким образом, мы решаем не включать вахтера и т.п. в область рассмотрения. Получив достаточно полный список терминов, мы можем разделить эти понятия по категориям в зависимости от их функции в онтологии. Понятия (концепции/термины предметной области), являющиеся объектами, такие как статья или автор, будут представлены в виде классов. Свойства классов, такие как содержимое раздела или зарплата, могут быть представлены как слоты, а ограничения на свойства или отношения между классами как грани/аспекты (slot facets).

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.