Интегрированные распределенные интеллектуальные системы оценки и прогнозирования состояния природных ресурсов

Рассмотрение интегрированных распределенных интеллектуальных систем прогнозирования состояния морских рыбных ресурсов, созданных с использованием инструментальных средств SIMER+MIR. Обобщенная модель системы. Интеграция основных компонентов системы.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 17.01.2018
Размер файла 23,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ИНТЕГРИРОВАННЫЕ РАСПРЕДЕЛЕННЫЕ ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ ОЦЕНКИ И ПРОГНОЗИРОВАНИЯ СОСТОЯНИЯ ПРИРОДНЫХ РЕСУРСОВ

Л.И. Сазонова11 152 140 , г.Переславль-Залесский, ИЦИИ ИПС РАН, sazonova@luda.botik.ru, Г.С. Осипов22 152 140 , г.Переславль-Залесский, ИЦИИ ИПС РАН, osipov@airec.botik.ru

В работе рассматриваются структура знаний, состав и интеграция основных компонентов интеллектуальных систем прогнозирования состояния морских биологических объектов. Предложенная обобщенная модель системы может стать основой для создания систем поддержки принятия решений по управлению ресурсами в разных предметных областях.

Введение

интегрированный интеллектуальный система прогнозирование

В работе рассматриваются интегрированные распределенные интеллектуальные системы прогнозирования состояния морских рыбных ресурсов, созданные с использованием инструментальных средств SIMER+MIR [Осипов, 1990а]. Задачи, решаемые такими системами, состоят в текущей оценке и прогнозировании состояния популяции, в том числе численности и биомассы всех поколений, на ближайший год, а также в прогнозировании возможных допустимых квот вылова без нанесения ущерба для дальнейшего существования вида. Особенностью систем является необходимость использования большого массива информации, характеризующей состояние экосистемы и популяций, как количественной, так и качественной. Знания в системах представлены в виде неоднородной семантической сети (НС) [Осипов, 1990б]. В состав таких систем [Sazonova, 1999] входят базы знаний (БЗ), система моделирования рассуждений, набор внешних программ и средства хранения данных об экосистеме.

1. Структура знаний

Решение сложных задач требует комплексного использования знаний из разных предметных областей (ПО). Объединение знаний из разных ПО в рамках одной базы знаний, во-первых, резко усложняет создание базы знаний, во-вторых, делает практически невозможным совместную работу нескольких коллективов разработчиков, так как параллельное создание фрагментов базы знаний, даже при наличии возможности «склеивать» фрагменты, привело бы к целому ряду затруднений, в частности, к необходимости отслеживать взаимодействия разных фрагментов базы знаний и устранять возникшие противоречия. Работа разных коллективов последовательно над созданием одной базы знаний увеличила бы сроки создания в несколько раз и не освободила бы от указанных выше трудностей. Выходом стали распределение знаний, необходимых для решения сложной задачи, в несколько баз знаний и разработка средств, обеспечивающих совместное участие нескольких баз знаний в выработке решения сложных задач. Механизм взаимодействия баз знаний описан в [Sazonova, 1999].

Таким образом, существенной чертой рассматриваемых систем является распределенность знаний в нескольких базах знаний в рамках одной системы. Преимущества такого подхода заключаются в следующем: во-первых, сокращаются сроки разработки системы, так как такой подход позволяет вести работы по созданию системы параллельно несколькими группами разработчиков. Во-вторых, созданные базы знаний могут использоваться для разных целей: как для совместного решения одной крупной задачи, так и для решения более простых задач в рамках одной базы знаний. В-третьих, распределенность знаний позволяет осуществить многократное их использование в разных системах.

Распределенность знаний позволяет преодолеть отмеченный в [Георгиев, 1991] недостаток применяемого формализма семантической сети (СС), заключающийся в том, что СС в своем традиционном виде ориентирована на узкоспециализированные задачи, а семантическая сеть сложной предметной области оказывается чрезмерно громоздкой.

Рассмотрим структуру знаний в моделях, отражающих этапы развития некоторых процессов.

База знаний представляет собой совокупность фрагментов, содержащих знания об отдельных этапах процесса развития популяции. Каждый фрагмент сети, представляющий модель этапа процесса, является, с одной стороны, законченным и достаточным для получения заключения о состоянии рассматриваемой экологической системы на данном этапе процесса. Гипотезы, выведенные на этом этапе, входят в заключительное решение системы. В некотором смысле фрагмент базы знаний можно рассматривать как модель для решения задачи диагностики, где характерны большое количество признаков и короткий путь в графе, по которому идет вывод.

С другой стороны, каждый фрагмент связан с фрагментами, представляющими предыдущий и последующий этапы процесса. Гипотеза, выведенная в рассматриваемом фрагменте, должна участвовать в качестве одного из признаков во фрагменте, моделирующем следующий этап, наряду с многими другими признаками, отражающими влияние различных факторов на состояние рассматриваемого вида (предмета). В работе [Sazonova, 1999] был предложен способ представления средствами НС выведенной гипотезы в качестве признака, описывающего следующий этап процесса. В результате, путь в графе, по которому идет вывод и который проходит через ряд фрагментов, занимает несколько десятков шагов.

В базах знаний объединены декларативные и процедурные знания. Создание модели этапа процесса может включать в себя необходимость проведения вычислительных операций, то есть запуска внешних программ. В этом случае, наряду с активацией внешних программ, происходит передача из базы знаний значений некоторых параметров, необходимых для работы этих программ. Дополнительные данные для работы внешних программ берутся из баз данных. Рассчитанные внешними программами значения параметров участвуют в выводе на сети в базе знаний.

В системах могут использоваться альтернативные математические методы расчета некоторых признаков. Входные и выходные параметры запускаемых внешних программ могут не совпадать, но преобразования выходных параметров дают результаты, которые можно сравнивать. Схематично это можно представить следующим образом:

Здесь П1 и П2 -- внешние программы, встроенные между фрагментами НС. Включение альтернативных методик расчета позволяет отражать точки зрения разных научных школ.

2. Обобщенная модель системы

Исходя из вышесказанного, модель интегрированной распределенной интеллектуальной системы в самом общем виде можно представить как:

M= <KB, I, П, DB>,

где KB -- совокупность баз знаний; I -- множество копий системы моделирования рассуждений типа аргументации и вычислений над базой знаний; П -- множество внешних программ; DB -- множество таблиц баз данных. Заметим, что средства приобретения знаний не используются в ходе промышленной эксплуатации системы, но они входят в комплект поставки.

Рассмотрим каждый элемент модели M подробнее.

2.1 База знаний

База знаний задается некоторой совокупностью событий и отношений на них. Имеется фиксированный набор возможных бинарных отношений R1, R2, R3,... на множестве событий БЗ. Типы и семантика этих отношений являются общими для всех возможных баз знаний независимо от предметной области. Таким образом, модель базы знаний можно представить следующим образом:

KB= < E, R, P, H>,

где E -- множество произвольных пар E = <N,C>, состоящих из имени события N = N(E) и его характеристики C = {A1:v1, A2:v2, ..., An:vn, E1, E2, ..., Ek}, возможно даже пустой (cлучай n=0 и k=0). Элементами множества C служат ранее построенные события Ej, 1 j k, и пары Ai:vi, 1 i n, где Ai -- атрибут, а vi -- значение этого атрибута. Предполагается также, что каждому атрибуту Ai сопоставлен его домен D(Ai) -- непустая область возможных его значений, откуда и берется vi. Все события разбиваются на две группы: исходные события, от которых зависит ход рассуждения (они называются признаками), и события, которые формируют решения, -- гипотезы; статус признаков бывает разным, они могут объединяться в комплексы и т.д.

R -- некоторый фиксированный набор возможных бинарных отношений R1, R2, R3,... на множестве событий БЗ, формальные свойства этих отношений описаны в [Osipov, 1995];

P -- множество процедур, которые, в общем случае, записываются следующим образом:

P(sin , sout ) = Body,

здесь sin и sout -- множества входных и выходных параметров процедуры P.

Для внешней процедуры Body = П<parametrs>, где П -- внешняя программа, parametrs -- строка параметров внешней программы, которая должна содержать в том числе и имя файла для передачи значений sin, sout между базой знаний и внешним источником информации -- другой базой знаний или произвольным файлом.

H -- множество комментариев или иллюстраций: текстовых, табличных, графических, аудио- и видеокомментариев, которые используются в системе как для всех объектов базы знаний, так и для любых этапов работы системы.

2.2 Решатель Mirage

Модель решателя можно представить в следующем виде:

I=<V, D, E, S, K>,

где V -- блок вывода,

D -- блок формирования решений,

E -- блок объяснений,

S -- блок комментирования,

K -- коммуникационная компонента, которая работает в разных режимах, в том числе и в режиме широковещательной рассылки (broadcasting).

Кроме того, имеется еще ряд модулей: модуль MGlue для программной связи с Mirage, управления им и получения информации из него; модуль, обеспечивающий взаимодействие базы знаний с базой данных Linkbase; модуль графического вывода информации; модуль графического ввода информации в Mirage с электронных карт.

Общий цикл работы решателя можно представить следующим образом:

формирование выборки;

обработка введенных значений признаков, которая может включать в себя: вывод в сети, формирование списков рассматриваемых и отвергнутых гипотез, активизацию процедур и комментариев;

возврат к 1.

В системе работает столько копий решателя, сколько баз знаний необходимо для решения задачи. Возможны следующие режимы работы решателя:

стандартный -- режим работы нескольких баз знаний, находящихся на разных компьютерах, этот режим является одновременным с точки зрения работы решателей;

индивидуальный -- режим работы нескольких баз знаний на одном компьютере, он является последовательным с точки зрения работы решателей, чаще всего он используется при отладке и концептуальном тестировании системы;

распределенный -- режим работы с использованием сервера, асинхронный с точки зрения работы копий решателя.

2.3 Внешние программы

Внешние программы используют аргументы из баз знаний системы и баз данных (возможно, из всех). Возвращаемые результаты помещаются в одну из баз знаний.

В качестве внешней программы может выступать система имитационного моделирования. В этом случае из базы знаний происходит запуск системы моделирования и передача управляющих параметров (шаг, период моделирования и т.д.), а из базы данных поступают первоначальные данные для моделирования. Срез моделирования может быть передан в базу знаний для участия в выводе на сети.

2.4 База данных

В рассматриваемых системах используются базы знаний двух типов. Первый тип -- это базы данных произвольного формата, содержащие любые поля. В них, в частности, могут храниться данные мониторинга, определяемые исследуемой областью и используемые не только рассматриваемыми системами. Причем, для работы интеллектуальных систем могут использоваться только выборочные данные, из имеющихся в разных таблицах этих баз данных, и часто только после проведения некоторой обработки этих данных.

Второй тип баз данных, используемых в системах, содержит таблицы, поля которых соответствуют основным объектам базы знаний. Это так называемые базы данных, «связанные» с базами знаний. Использование баз данных второго типа позволяет осуществлять загрузку данных из БД в БЗ и выгрузку данных из базы знаний в базу данных. Выгрузка данных из БЗ в БД позволяет сохранять информацию о сеансе работы пользователя с базой знаний в соответствующей связанной базе данных. Режимы загрузки и выгрузки реализуются в рамках работы программы Mirage.

3. Интеграция основных компонентов системы

Интеграционным компонентом в рассматриваемых системах является решатель Mirage. Каждая копия решателя выступает как агент и взаимодействует с другими копиями.

Знания о том, какой компонент системы, когда и с каким компонентом вступает во взаимодействие, каков предмет взаимодействия, то есть значения каких параметров запрашиваются или передаются, хранятся в базах знаний.

Механизм взаимодействия компонентов системы определяется следующим образом: в базах знаний зафиксирована процедура осуществления взаимодействия, само взаимодействие выполняют копии программы Mirage, операции по вычислению -- внешние программы. Однако, это только общая схема, работу по вычислению могут выполнять и внутренние процедуры, написанные на встроенном в систему языке.

Рассмотрим особенности взаимодействия основных компонентов системы.

Во-первых, как указывалось выше, копии решателя с открытыми базами знаний взаимодействуют между собой по следующим правилам: каждая копия программы Mirage может являться одновременно и клиентом, и сервером. Вместе с запросом может происходить передача данных, необходимых для вывода во второй базе знаний. На протяжении одного сеанса работы может быть несколько взаимодействий между двумя базами знаний. База знаний, находящаяся в режиме выработки ответа на запрос из второй БЗ, может отправить свой запрос в третью БЗ.

Во-вторых, возможно взаимодействие базы знаний и внешней программы, которое осуществляется по следующим правилам: база знаний может взаимодействовать в течение одного сеанса с разными программами из П; одновременно с запуском внешней программы из БЗ происходит передача значений фиксированного количества параметров; вычисленные значения параметров возвращаются в ту базу знаний, которая произвела запуск внешней программы. Вместо внешней программы может выступать система имитационного моделирования.

В-третьих, возможно взаимодействие баз данных с базами знаний: загрузка данных из БД в БЗ может происходить несколько раз в течение одного сеанса; загрузка данных в БЗ может производиться из разных таблиц БД; выгрузка данных из БЗ в БД происходит только в «связанную» БД.

И, наконец, в рассматриваемых системах базы данных являются «поставщиком» данных для внешних программ.

Следует особо подчеркнуть, что в ходе сеанса работы с системой пользователь имеет дело только с программой Mirage, то есть все действия происходят в рамках одного интерфейса.

Заключение

Таким образом, интеграция в распределенных интеллектуальных системах прогнозирования состояния природных ресурсов осуществляется на различных уровнях:

декларативных и процедурных знаний,

знаний разных предметных областей,

текстовых, табличных и графических представлений знаний и данных,

баз знаний, баз данных и внешних программ,

интеллектуальных систем и систем имитационного моделирования.

Литература

[Осипов, 1990a] Осипов Г.С., Куршев Е.П., Голубев С.А., Комаров С.И., Беляев А.Б., Годовников М.Н. SIMER + MIR -- инструментальные программные средства для экспертных систем. II Всесоюзная конференция «Искусственный интеллект-90». Сб. тезисов. Минск, 1990, с. 58-64.

[Осипов, 1990б] Осипов Г.С. Построение моделей предметных областей. Ч. 1. Неоднородные семантические сети. Изв. АН СССР. Техническая кибернетика. 1990. № 5, с. 32-45.

[Sazonova, 1999] Sazonova, L, Osipov, G. and Godovnikov, M. Intelligent system for fish stock prediction and allowable catch evaluation, Environmental modelling & software, vol. 14 (1999), pp. 391-399.

[Георгиев, 1991] Георгиев В.О. Модели представления знаний предметных областей диалоговых систем. Изв. АН СССР. Техническая кибернетика. 1991. № 5, с. 3-23.

[Osipov, 1995] Osipov, G. S. Semantic Types of Natural Language Statements, in Proc. 10-th IEEE Intern. Symposium on Intelligent Control, Monterey, California, (1995).

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.