Интеллектуальные информационные системы

Понятие интеллектуальной информационной системы, классификация и особенности ИИС. Методика когнитивного анализа сложных ситуаций. Моделирование процессов обработки информации для принятия решений. Формальные логические модели. Модели нейронных сетей.

Рубрика Программирование, компьютеры и кибернетика
Вид лекция
Язык русский
Дата добавления 02.04.2012
Размер файла 557,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

26. Самоорганизованные сети Кохонена

Идея сетей с самоорганизацией на основании конкуренции между нейронами базируется на применении специальных алгоритмов самообучения(ИНС).

Сети Кохонена обычно содержат один выходной слой обработки элементов с пороговой передаточной функцией. Число нейронов в выходном слое соответствует комплексному распознаванию классов.

Настройка параметров межнейронных соединений проводится автоматически на основе меры близости векторов - весовых коэффициентов настраиваемых связей к вектору входного сигнала в евклидовом пространстве. В конкурентной борьбе побеждает нейрон со значениями весов наиболее близком к нормализованным векторов входных сигналов. Кроме того в самоорганизованных сетях возможна классификация входных образцов.

27. Построение нейронной сети

При построении модели ИНС сначала необходимо точно определить задачи, которые будут решаться с ее помощью. В настоящем времени ИНС используется при прогнозировании, распознавании и обобщении.

Первым этапом построения нейросетевых моделей является отбор входных данных, влияющий на ожидаемый результат. Из исходной информации необходимо исключить все сведения не относящиеся к исследуемой проблеме, в то же время стоит располагать достаточным количеством примеров для обучения ИНС.

Существуют эмпирические правила, которые устанавливают рекомендуемое соотношение Х между получаемыми обучающими примерами, содержащими входные данные и правила ответов и число соединений нейронной сети (Х<10). Для факторов, которые включаются в обучение необходимо предварительно оценить их значения, для этого используют корреляционный и регрессионный анализ и анализируют диапазон возможных значений.

На втором этапе осуществляется преобразование исходных данных с учетом характера и типа проблемы, отображаемой нейросетевой моделью и выбирается способ представления информации.

Эффективность нейросетевой модели повышается, если диапазон изменения входных и выходных величин приведет к некоторому стандартному:

[0;1]

[-1;1]

Третий этап заключается в построении ИНС. Проект его архитектуры - число слоев нейронов. Структура ИНС формируется до начала обучения, поэтому условия решения проблемы определяются конкретным опытом и использованием специалиста - аналитика, который проводит исследования.

Четвертый этап связан с обучением сети, которое может проводиться на основе конструктивного или деструктивного подхода. В соответствии с первым подходом обучение ИНС начинается на сети небольшого размера, т.е. с каждым шагом постоянно увеличивается размер до требуемой точности. По результатам тестирования. Это называется конструктивным подходом.

Деструктивный подход основан на проектировании деревьев. Выбирается сеть с заведомо избыточным объемом и с каждым шагом постепенно удаляются нижние нейроны и прекращаются связи. Этот подход позволяет исследовать возможность влияния удаленных элементов на связи в сети.

Процесс обучения нейронной сети представляет собой уточнение значений весов коэффициентов для отдельных узлов по средством постепенного увеличения объема входной и выходной информации.

Началу обучения должна предшествовать процедура выбора функции активации нейронов, которые учитывают характер решаемой задачи.

В частности в трехслойных персептронах на нейроны спр слоя применяется логистическая функция, а тип передаточных слоев…….

…..индикатор обучения - …., значения межсетевых связей.

На пятом этапе проводится тестирование полученной модели на независимой выборке примеров.

27. Обучение нейронных сетей

Важнейшим свойством нейронных сетей является их способность к обучению. Это делает нейросетевые модели незаменимыми при решении тех задач, для которых алгоритмизация является невозможной, проблематичной или слишком сложной.

Обучение нейронных сетей заключается в изменении внутренних параметров модели таким образом, чтобы на выходе искусственной нейронной сети генерировался вектор значений, совпадающий с результатами примеров обучающей выборки. Изменение параметров нейросетевой модели может выполняться различными способами в соответствии с разными алгоритмами обучения.

Парадигма (от гр. пример, образец) - это исходная концептуальная схема модели, то есть модель постановки проблем и их решений, методов исследования, господствующих в течении определенного исторического периода в научном сообществе.

Парадигма обучения определяется доступностью необходимой информации. Выделяют три парадигмы:

1) обучение с учителем (контролируемое обучение);

2) обучение без учителя (неконтролируемое обучение);

3) смешанное обучение.

При обучении с учителем задаются примеры обучающей выборки, которая содержит правильные ответы, соответствующие исходным данным (входам). В процессе контролируемого обучения синаптические веса настраиваются так, чтобы сеть порождала ответы, наиболее близкие правильным.

Обучение без учителя используют тогда, когда не для всех примеров обучающей выборки известны правильные ответы. В таком случае предпринимаются попытки определения внутренней структуры поступающих в сеть данных с целью распределить образцы по категориям.

Обучение по примерам характеризуется тремя свойствами:

1) емкость;

2) сложность образцов;

3) вычислительная сложность.

Емкость соответствует количеству образцов, которые может запомнить нейронная сеть. Сложность образцов определяет способность нейронной сети к обучению. При обучении нейронной сети могут возникнуть состояния перетренировки, в которых сеть хорошо функционирует на примерах обучающей выборки, но не справляется с другими новыми примерами.

28. Правила обучения

1) Правило коррекции по ошибке.

Процесс обучения ИНС состоит в коррекции исходных значений весовых коэффициентов межнейронных связей. При вводе входящих данных запоминаемого примера (стимула) появляется реакция, которая передается от одного слоя нейронов к другому, достигая последнего слоя, где вычисляется результат. Разность между известным значением результата и реакцией сети соответствует величине ошибки, которая может использоваться для корректировки весов межнейронных связей. Корректировка заключается в небольшом увеличении синаптического веса (порядка < 1%) тех связей, которые усиливают правильные реакции, и уменьшении тех, которые способствуют ошибочным. Это простейшее правило контролируемого обучения используется в однослойных сетях с одним уровнем настраиваемых связей между множеством входов и множеством выходов. При этом на каждом k-том шаге для j-того нейрона вес i-той связи определяется как:

wjik = wji(k-1) + Дwjik

Оптимальные значения весов межнейронных соединений можно определить путем минимизации среднеквадратической ошибки с использованием детерминированных или псевдослучайных алгоритмов поиска экстремума в пространстве весовых коэффициентов.

При этом возникает традиционная проблема оптимизации, которая связана с попаданием в локальный минимум.

29. Правило Хэбба

Правило Хэбба базируется на следующем нейрофизическом наблюдении: если нейроны по обе стороны синапса активизируются одновременно и регулярно, то сила их синаптической связи возрастает. При этом изменение веса каждой межнейронной связи зависит только от активности нейронов, образующих этот синапс. Это существенно упрощает реализацию алгоритмов обучения.

30. Обучение методом соревнования

В отличие от правила Хэбба, где множество выходных нейронов может возбуждаться одновременно, в данном случае выходные нейроны соревнуются (конкурируют) между собой за активизацию. В процессе этого соревновательного обучения осуществляется модификация весов связей выигравшего нейрона и нейронов, расположенных в его окрестности.

31. Метод обратного распространения ошибки

Метод был разработан и опубликован в 1986 году. Его разработал Дэвид Румельхарт. Метод также известен как метод обобщения дельта-правил.

Общий принцип работы многослойной нейронной сети с обучением методом обратного распространения ошибки заключается в следующем.

Сначала с помощью заранее известных исходных данных и результатов по ним обучают сеть. На ее вход подают входные значения, а на выходе сравнивают значения сети с реальным результатом, и в зависимости от степени их разногласия корректируют внутренние веса нейронов. Добившись удовлетворительной работы сети с заданной погрешностью, прекращают обучение. Теперь сеть готова рассчитывать реальные данные. Для расчета сеть переводится из режима обучения в режим работы. На вход поступают данные, они обрабатываются, и на выходе получается ответ с определенной долей вероятности. Так работает примитивная нейронная сеть обратного распространения ошибки.

В действительности существует множество разнообразных способов увеличения точности ответов и ускорения обучения сети.

Обучение сети начинается с предъявления образа и вычисления соответствующей реакции. Сравнение с желаемой реакцией дает возможность изменять веса связей таким образом, чтобы сеть на следующем шаге могла выдавать более точный результат.

Обучающие правила обеспечивают настройку весов связей. Информация о выходах сети является исходной для нейронов предыдущих слоев. Эти нейроны могут настраивать веса своих связей для уменьшения погрешности на следующем шаге. Когда мы предъявим нейронной сети входной образ, она будет выдавать случайный образ. Функция ошибки представляет собой разность между текущим выходом сети и идеальным выходом. Для успешного обучения требуется приблизить выход сети к желаемому выходу, то есть последовательно уменьшать функцию ошибки. Это достигается настройкой межнейронных связей. Обобщенное дельта-правило обучает сеть путем вычисления функции ошибки для заданного слоя с обратным распространением от данного слоя к предыдущему. Каждый нейрон имеет свои веса, которые настраиваются, чтобы уменьшить функцию ошибки.

Для нейронов выходного слоя известны фактические и желаемые значения выходов.

Поэтому настройка весов для таких нейронов является относительно простой. Для нейронов предыдущих слоев настройка не столь очевидна.

Интуитивно ясно, что нейроны внутренних слоев, которые связаны с выпадами, имеющими большую погрешность, должны изменять свои значения весов сильнее, чем нейроны, созданные с почти корректными выпадами.

Т.е. веса данного нейрона должны изменяться прямо пропорционально ошибкам тех нейронов, с которыми нейрон связан.

Вот поэтому обратное распределение этих ошибок через сеть позволяет корректно настроить веса связей между всеми слоями.

В этом случае величина функции ошибки уменьшается и сеть обучается.

32. Способы реализации нейронных сетей

Нейронные сети обычно реализуются 2 способами:

1. Программный;

2. Аппаратный.

Вариантами аппаратной реализации являются нейрокомпьютеры,

нейроплаты и нейронные БИС специального значения.

Одна из самых простых и дешевых - MD1220 (фирма Micro Devices).

Эта БИС реализует сеть с 8 нейронами и 120 синапсами.

Устройства Adaptive Solution (USA) и Hitachi (Japan).

Скорость обработки у Adaptive Solution - 1,2 млрд. мнс/с

(межнейронных соединений с секунду).

NETSIM - нейрокомпьютер на базе процессоров 80188,

производительность 450 млн. мнс/с.

Программная реализация нейронных сетей является более дешевой.

Программные продукты:

- Brain Maker, фирма CSS;

- Loral Space Systems - по заказу NASA.

33. Практическое применение нейросетевых технологий

- целесообразно при решении задач, у которых имеются следующие признаки:

1) Отсутствие алгоритма решения задач, но есть масса примеров;

2) Наличие большого числа входной информации, характеризующих исследуемую проблему;

3) Зашумленность, частичная противоречивость, неполнота или избыточность исходных данных.

Применение:

С помощью нейросистем решают широкий круг неформализованных задач: контроль воздушного пространства, вскрытие шифра, целенаведение ракет, моделирование развития военных действий.

Преимущества нейросетей:

1) Способность обучаться на множестве примеров, в тех случаях, когда неизвестны закономерности, отсутствуют зависимости между входными и выходными данными;

2) Нейронные сети способны успешно решать задачи, опираясь на неполную, искаженную, зашумленную и внутренне противоречивую входную информацию;

3) Для использования методов корреляционного анализа необходим профессионал-математик. А при использовании обученной сети, высокий уровень не требуется;

4) Нейросетевые пакеты позволяют легко подключаться к базе данных, электронной почте и автоматизировать процесс ввода и обработки первичной информации.

5) Внутренний параллелизм, который присущ нейросетям, позволяет практически безгранично наращивать мощность нейросистемы, т.е. можно начать с простого дешевого пакета, потом перейти на профессиональный пакет, потом добавить плату-ускоритель, потом перейти на специальный нейрокомпьютер и все это с гарантией полной преемственности созданного ранее ПО.

34. Построение экспертной системы

Прежде чем приступить к разработке экспертной системы, инженер по знаниям должен рассмотреть вопрос - следует ли разрабатывать ЭС для данного приложения.

ЭС следует использовать тогда, когда разработка возможна, оправдана и методы инженерии знаний соответствуют решаемой задаче.

Чтобы разработка ЭС была возможна для данного приложения, необходимо выполнить следующие требования:

1) Существует эксперты в данной области, которые решают данную задачу значительно лучше начинающих специалистов;

2) Эксперты должны сходится в оценке предполагаемого решения, иначе нельзя будет оценить качество системы;

3) Эксперты должны уметь выразить на естественном языке (вербализовать) и объяснить используемые ими методы, иначе трудно будет рассчитывать на то, что их знания будут извлечены и вложены в экспертную систему;

4) Задача, возложенная на ЭС, требует только рассуждений, а не действий;

5) Решение данной задачи должно занимать у эксперта несколько часов, а не дней или недель;

6) Решение задачи не должно в значительной степени использовать здравый смысл, т.е. широкий спектр знаний о мире;

7) Задача должна относиться к достаточно понятной и структурированной области, т.е. должны быть выделены основные понятия, отношения и способы принятия решений.

Использование ЭС может быть оправдано в случае выполнения хотя бы

одного из условий:

1) Решение задачи принесет пользу в поиске полезных ископаемых;

2) Использование человека-эксперта не допустимо, либо из-за отсутствия достаточного количества экспертов, либо из-за необходимости выполнять экспертизу в различных местах;

3) При передаче эксперту происходят недопустимые потери времени или информации;

4) При необходимости решать задачу во враждебной для человека обстановке.

Приложение соответствует методам экспертных систем, если решаемая

задача обладает совокупностью характеристик:

1) Может быть естественным образом решена посредством символьных рассуждений, а не числами;

2) Должна иметь эвристическую, а не алгоритмическую природу, т.е. должна решаться с выполнением эвристических правил;

3) Должна быть достаточно сложной, чтобы оправдать затраты;

4) Должна быть достаточно узкой, чтобы решаться методами инженерии знаний.

При разработке ЭС используется так называемая концепция быстрого

прототипа:

- разработчики не пытаются сразу создать конечный продукт.

На начальном этапе они создают прототипную ЭС.

Прототип должен удовлетворять 2 требованиям:

1) С одной стороны решать задачи конкретного приложения;

2) С другой стороны время его разработки должно быть незначительно, чтобы можно было запараллелить процесс отладки знаний с процессом выбора программных средств.

Прототип должен продемонстрировать пригодность методов

инженерии знаний. В случае успеха эксперт с помощью инженера по знаниям расширяет знания прототипа.

В случае неудачи можно разработать новый прототип.

Не…чность вывода - это свойство характерное для вывода в открытой системе и базе знаний, состоящее в том, что ранее выводные значения могут перестать быть выводными при появлении новых фактов.

35. Системы, основанные на прецедентах

CBR - системы

В этих системах база знаний содержит не описания обобщенных ситуаций, а собственно сами ситуации (прецеденты).

Поиск решаемой проблемы сводится к поиску по аналогии - абдуктивный вывод от частного к частному.

1) Получение подробной информации от текущей проблеме;

2) Сопоставление полученной информации со значениями признаков прецедентов из базы знаний;

3) Выбор прецедента из базы знаний, который наиболее близок к рассматриваемой проблеме;

4) В случае необходимости выполняется адаптация выбранного прецедента к текущей проблеме;

5) Проверка корректности каждого полученного решения;

6) Занесение информации о полученном решении в базу знаний.

Также как и для индуктивных систем, прецеденты описываются

множеством признаков, по которым строятся индексы поиска. Но в отличии от индуктивных систем, допускается нечеткий поиск с получением множества альтернатив.

Наиболее подходящее решение адаптируется к данной ситуации.

36. Этапы разработки экспертных систем

Рисунок 20 - Этапы разработки экспертных систем

Идентификация заключается в составлении словесного описания задачи. Нужно указывать общие характеристики задачи, подзадачи, характеристики отношений, входные, выходные данные, знания, соответствующие решаемой задаче, примеры решения.

Цель идентификации - обеспечить начальный импульс для развития системы. В ходе идентификации надо ответить на следующие вопросы:

1) Какие задачи нужно решать ?

2) Как они определены ?

3) На какие подзадачи надо разбить задачу ?

4) Какие основные понятия и взаимоотношения используются при формулировании задачи ?

5) Какие ситуации препятствуют решаемой задаче ?

37. Идентификация цели

Заключается в формировании в явном виде целей построения ЭС. При этом важно отличие целей, ради которых создается система, от задач, которые она должна решать. Примерами возможных целей являются:

1. Формализованные неформальные знания экспертов.

2. Улучшение качества решений, принятых экспертом.

3. Автоматизация рутинных аспектов работы экспертов - пользователей.

4. Тиражирование знаний эксперта.

Обычно в основном цикле разработки системы участвует не менее трех-четырех человек: один - эксперт, один или два - инженеры по знаниям и один программист, привлекаемый для создания конкретных инструментальных систем. Могут привлекаться дополнительные эксперты, руководители.

Эксперт - информирующий, учитель.

Инженер - ученик.

Типичными ресурсами при разработке знаний являются технические и программные средства, знания, объемы финансирования.

38. Концептуализация

Концептуализация - определенное понятие, относящееся к механизму управления, которое необходимо для описания процесса решения задачи в избранной предметной области.

Концептуальная модель - определенное множество понятий и связей между ними, которые в совокупности являются смыслом структуры рассматриваемой предметной области. Это модель предметной области, которая состоит из перечня связанных понятий.

39. Содержательная модель

Содержательная модель - абстрактная модель, определяющая структуру системы, свойства ее элементов, причинно-следственные связи, присущие системе и существующие для достижения цели моделирования.

Эксперт и инженер по знаниям объясняют и выделяют ключевые понятия отношения и характера, необходимых для описания решаемой задачи.

На этом этапе выявляются следующие особенности задач:

- типы доступных данных;

- исходные и выводимые данные;

- подзадачи, общие задачи;

- используемые стратегии и гипотезы;

- виды взаимосвязи между объектами;

- типы используемых отношений(часть- целое);

- процессы, используемые в ходе решения задачи, типы организации, накладываемые на процессы, используемые в ходе решения;

- состав знаний, используемый для решения задач;

- состав знаний, используемый для объяснения решения.

40. Этап формализации

Все ключевые понятия и отношения, включаемые на предыдущем этапе выражения на некотором формальном языке, которые являются задачами инженера по знаниям.

Выходы являются описанием того, как задача может быть представлена в конкретной формализации.

Процесс зависит от трех факторов:

- структура, пространство, понятия;

- модель, лежащая в основе процесса решаемой задачи;

- свойства данных решаемой задачи.

При формализации необходимо ответить на следующие вопросы:

1) Являются ли понятия примитивными или имеют внутреннюю структуру;

2) Необходимо ли представление причинно- пространственного отношения между понятиями и должны ли они быть представлены явно;

3) Необходима ли иерархия гипотез;

4) Относится ли коэффициент уверенности или другие средства для выражения мнения только к окончательным гипотезам или он необходим для промежуточных гипотез;

5) Необходимо ли рассматривать понятия и процессы на различных уровнях абстракции.

Для формализации знаний важно изучить природу данной проблемной области. Необходимо определить свойства данных, которые влияют на решения проблемы:

1. Данные объяснены или нет в теории гипотез;

2. Типы отношений между данными. Знания типов отношений помогают объяснять как взаимосвязаны данные, гипотезы и цели в процессе решения.

3. Данные могут быть редкими, обильными, недостаточными и избыточными.

4. Данные могут быть определены или нет и требуют ли уточнения фактора уверенности или нет.

5. Интегрированные данные зависят или не зависят от порядка их появления во времени;

6. Стоимость приобретаемых данных;

7. Как необходимые параметры объекта могут быть извлечены из входного сообщения: сигнала, изображения, текста.

8. Данные надежны, ненадежны;

9. Данные согласованы - несогласованны, полные - неполные.

41. Этап выполнения

Цель этого этапа: создание одного или нескольких прототипов, которые решают данную задачу.

Разработка прототипа состоит в программировании его компонентов. Главное чтобы прототип обеспечил идеи, методы и способы представления знаний, выбранных при создании данной системы.

После разработки первого прототипа рассматриваемого круга задач собирают комиссию. Далее происходит развитие системы.

Она развивается путем добавления:

- дружественного интерфейса;

- средств для исследования баз знаний, цепочек вывода;

- средств для сбора замечаний пользователей;

- средств библиотек задач, решаемых системой.

Обычно большие правила необходимо разбивать на несколько мелких правил. В некоторых случаях в проблемной области существуют понятия, которые не указаны экспертом и у которых нет имени. Эти понятия необходимо ввести в явном виде и сформулировать некоторое правило.

42. Этап тестирования

Необходимо подобрать примеры, обеспечивающие проверку системы. Часто неудачная работа системы объясняется недостаточным показателем тестовых примеров. На данном этапе проверяется пригодность системы.

Этап тестирования.

Здесь осуществляется оценка выбранного способа представления знаний и ЭС в целом. Как только ЭС оказывается в состоянии обработать от начала до конца два или три примера, необходимо начинать проверку на более широком круге примеров, чтобы определить недостатки БЗ и управляющего механизма (процедур вывода). Инженер по знаниям должен подобрать примеры, обеспечивающие всестороннюю проверку ЭС.

Обычно выделяют следующие источники неудач в работе системы:

тестовые примеры;

ввод-вывод; правила вывода;

управляющие стратегии.

Наиболее очевидной причиной неудачной работы ЭС являются недостаточно показательные тестовые примеры. В худшем случае тестовые примеры могут оказаться вообще вне проблемной области, на которую рассчитана ЭС, однако чаще множество тестовых примеров находится в рассматриваемой проблемной области, но является однородным и не позволяет охватить всю проблемную область.

Ввод-вывод можно характеризовать данными, приобретенными в ходе диалога с экспертом, и заключениями, предъявленными ЭС в ходе объяснений. Методы приобретения данных могут не давать нужных результатов, так как задавались неправильные вопросы или собрана не вся необходимая информация. Ошибки при вводе могут возникнуть из-за неудобного для пользователя входного языка. В ряде приложений для пользователей удобен ввод не только в печатной, но и в звуковой форме, может понадобиться ввод и в графическом виде.

Выходные сообщения (заключения) системы могут оказаться непонятными пользователю (эксперту) по содержанию, либо потому, что их слишком мало. Типичным источником ошибок в рассуждениях являются правила вывода. Важная причина здесь -- неучет зависимостей между правилами (точнее, между их означиваниями). Дело в том, что правила редко независимы друг от друга, хотя на первом этапе отладки удобно считать их таковыми. Среди других причин ошибок можно отметить ошибочность, противоречивость и неполноту правил. Необходимо принять меры против порождения гипотез (промежуточных заключений), которые правдоподобны каждая в отдельности, но комбинируются в бессмысленные последовательности (комбинации). Требуется разработать специальные правила, препятствующие образованию ошибочных комбинаций.

Весьма часто к ошибкам в работе ЭС приводят управляющие стратегии. Возможно, изменение стратегии необходимо, если ЭС рассматривает сущности в порядке, отличном от «естественного» для эксперта. Последовательность, в которой данные рассматриваются ЭС, не только влияет на эффективность работы системы, но и может приводить к изменению конечного результата. Например, рассмотрение правила X до правила Y может иногда привести к тому, что правило Y всегда будет игнорироваться системой. Изменение стратегии необходимо и в случае неэффективной работы ЭС. Кроме того, недостатки в управляющих стратегиях могут привести к чрезмерно сложным заключениям и объяснениям ЭС.

Этап опытной эксплуатации.

На данном этапе проверяется пригодность ЭС для конечного пользователя. Здесь ЭС занимается решением всех задач, возможных при работе с различными пользователями. Пригодность ЭС для пользователя определяется в основном удобством работы с ней и ее полезностью. Под полезностью ЭС понимается способность ее в ходе диалога определять потребности пользователя, выявлять и устранять причины неудач в работе, а также удовлетворять потребности пользователя (т.е. решать поставленные задачи). Другими словами пользователю важно донести «до сознания» ЭС свою информационную потребность, несмотря на возможные ошибки, допускаемые им из-за недостаточного знания ЭС.

Под удобством работы ЭС понимается естественность взаимодействия с ней (общение в привычном, не утомляющем пользователя виде), ее гибкость (способность системы настраиваться на различных пользователей, а также учитывать изменения в квалификации одного и того же пользователя) и устойчивость системы к ошибкам (способность не выходить из строя при ошибочных действиях неопытного пользователя).

По результатам эксплуатации может потребоваться не только модификация программ и данных (совершенствование или изменение языка общения, диалоговых систем, средства обнаружения и исправления ошибок, настройка на пользователя и т.д.), но и изменения устройств ввода-вывода из-за их неприемлемости для пользователя. По результатам этого же этапа принимается решение о переносе системы на другие ЭВМ (например, для расширения сферы использования ЭС и (или) снижения ее стоимости).

Взаимодействия инженера по знаниям с экспертом.

Мощность ЭС как систем, основанных на знании, зависит, в первую очередь, от качества и количества знаний, хранимых в них. Поэтому ясно, что процесс приобретения знаний для ЭС наиболее важный. Так как в настоящее время не существует методов автоматического приобретения знаний, процесс наполнения ЭС знаниями является весьма трудоемким. Знания для ЭС могут быть получены из различных источников (книг, отчетов, баз данных, эмпирических данных, персонального опыта эксперта, инженера и т.п.). Однако наиболее значимые знания приобретаются от людей-экспертов.

Извлечение знаний из эксперта (экспертов) осуществляется в процессе интенсивного систематического (в течение нескольких месяцев) взаимодействия инженера по знаниям с экспертом. Сложность извлечения знаний состоит в том, что, как правило, эксперт либо не осознает, какими знаниями он пользуется для получения решения, либо не может сразу эти знания вербализовать. Поэтому инженер по знаниям должен работать с экспертом в контексте решения конкретных задач (подзадач). Для построения ЭС важны следующие выводы:

Не будьте сами себе экспертом! (Другими словами, если Вы эксперт, то не пытайтесь описать свои знания без инженера по знаниям, который должен убедиться в достоверности выделенных знаний.)

Инженер по знаниям должен верить не тем знаниям, за которые эксперт ручается, а тем знаниям, которые он действительно использует для решения задач. Исследование работы экспертов базируется на методах психологии: наблюдении и интуитивности.

Метод наблюдений реализуется следующим образом. Эксперта при решении задач просят «думать вслух». Раздумья эксперта оформляются в виде протокола, который затем исследуется инженером по знаниям (с возможным привлечением эксперта).

Интуитивный метод применяется в одной из двух модификаций. В первом случае инженер по знаниям изучает литературу и взаимодействует с экспертом для того, чтобы овладеть данной проблемной областью, т.е. он становится псевдоэкспертом. Во втором случае сам эксперт действует как «строитель» теории своего собственного поведения, используя интроспекцию. Некоторые приемы по извлечению знаний из экспертов приведены в табл. 7.1.

Характеристики инструментальных средств.

Большинство ИтС предназначено для создания прототипов ЭС, решающих статические задачи (обычно задачи расширения) в статических проблемных областях.

Таблица 7.1. Приемы извлечения знаний из экспертов

ПРИЕМЫ

ОПИСАНИЕ

Наблюдение

Инженер наблюдает (не вмешиваясь) за тем, как эксперт решает реальную задачу

Обсуждение задачи

Инженер на представленном множестве задач неформально обсуждает с экспертом данные, знания и процедуры решения

Описание задачи

Эксперт описывает типичные задачи для основных типов ответов

Анализ задачи

Эксперт решает «вслух» реальные задачи, детализируя ход рассуждений

Проверка системы (прототипа)

Эксперт предлагает инженеру перечень задач для решения (от простых до сложных), которые (с использованием приобретенных знаний) перед решением системы инженер решает вручную

Исследование системы

Эксперт исследует и критикует правила и механизм вывода системы

Оценка системы

Инженер предлагает другим экспертам оценить решения разработанной системы (прототипа) и решения эксперта, наполнявшего систему

По степени отработанности ИтС выделяют следующие стадии существования: исследовательская, промышленная, коммерческая. Разделяют следующие типы ИтС:

языки программирования;

языки инженерии знаний;

средства автоматизации разработки (проектирования) ЭС;

оболочки ЭС.

С точки зрения потребителя, на выбор ИтС влияют моменты:

затраты труда на построение ЭС или ее прототипа с помощьюИтС;

эффективность функционирования ЭС, построенной на основе выбранного ИтС;

квалификация разработчика, необходимая для применения ИтС.

Оболочки ЭС ориентированы на работу с пользователем-непрофессионалом в области программирования. Основным свойством оболочек является то, что они содержат все компоненты ЭС в готовом виде и их использование не предполагает программирования, а сводится лишь к вводу в оболочку знаний о проблемной области. Каждая оболочка характеризуется фиксированным способом представления знаний и организации вывода и фиксирования компонентов, которые будут использоваться во всех положениях, где будет применяться оболочка. Наиболее популярные оболочки обладают следующими свойствами:

решают задачи класса расширения в статических предметных областях в условиях ненадежности знаний;

представляют процедурные знания в виде правил;

описывают предметную область в виде значений неструктурированных переменных и утверждений, снабженных мерой их истинности (определенности).

Желание представить разработчику ЭС разнообразные средства для учета особенностей приложения привело к объединению в рамках одной системы различных методов решения задач, представления и интерпретации знаний. В их состав могут входить средства модификации функционирования оболочки, набор компонентов, позволяющих конструировать собственные оболочки, средства комплексирования компонентов в виде языка высокого уровня, развитые интерактивные графические средства общения с пользователем. Подобные средства называют средствами автоматизации проектирования (разработки) ЭС.

Характеристика «Универсальность» определяет возможности ИтС в использовании различных способов представления знаний в рабочей памяти и базе знаний и различных парадигм функционирования системы. Наличие универсальности позволяет адекватно отображать в системе различные типы знаний о проблемной области. К настоящему времени в большинстве ИтС при представлении знаний используют фреймы и сети, а в качестве механизма функционирования, как правило, программирование, ориентированное на правила.

Характеристика «Основные свойства» определяет особенности, которые присущи ИтС в реализации основных программных компонентов системы. Для решателя наиболее важны способы сопоставления и основной способ планирования вычисления (построение цепочек вывода от данных или от целей). Задача сопоставления состоит в том, чтобы определить, какое из правил, хранящихся в БЗ, может быть применено к текущему состоянию предметной области, хранимой в РП. Способы сопоставления в значительной мере зависят от: типа ссылки на объекты РП, используемого в правиле; вида данных РП, сопоставляемых со ссылками; вида проверок, выполняемых в ходе сопоставления.

Выделяют следующие типы ссылок:

конкретная, когда ссылка (идентификатор) в условии правила является адресом конкретного элемента РП;

абстрактная, когда ссылка (идентификатор и его описание) в условии правила именует не конкретный, а любой элемент в РП, свойства которого сопоставляются с описанием ссылки, указаннымв правиле (т.е. описание определяет класс элементов РП).

Существующие ИтС допускают следующие виды данных РП: константы; переменные, имеющие значения; сложные структуры (типы фрейм), логически объединяющие множество переменных. В них используются либо тривиальные виды проверок, сводящиеся к проверке наличия (отсутствия) указанных элементов в РП, либо сложные, требующие вычисления некоторых соотношений между значениями ссылок, указанных в условиях правил. Таким образом, в первом приближении способ сопоставления определяется используемым типом ссылок и видом данных РП.

Средства приобретения знаний в существующих ИтС можно оценивать с точки зрения допустимых способов формирования БЗ. Выделяют следующие способы формирования БЗ:

редакторы;

средства отладки;

средства индуктивного вывода новых знаний.

Редакторы позволяют отображать и модифицировать БЗ, возможно, в графическом виде, поддерживая ее целостность. Средства отладки обеспечивают анализ содержимого БЗ, переформирование и отображение его результатов пользователю. Средства индуктивного вывода осуществляют формирование новых знаний (правил) на основе вводимых пользователем примеров ситуаций с их решениями.

В существующих ИтС диалог организуется в двух видах: в фиксированной структуре и структуре, формируемой при генерации ЭС. Среда функционирования ИтС определяет тип ЭВМ, используемую операционную систему (ОС) и язык программирования. По типу используемых ЭВМ ИтС можно разделить на три класса: для персональных ЭВМ (ПЭВМ); для символьных ЭВМ и интеллектуальных рабочих станций.

Характеристики экспертных систем.

С точки зрения назначения большинство ЭС создается для тиражирования знаний экспертов и ориентировано либо на специалистов, стремящихся повысить свои знания, либо на неспециалистов, чтобы оказать им помощь в решении сложных задач.

По характеристике «проблемная область» ЭС обобщенно можно определить так: предметная область является статической (как правило, с неточными знаниями); решаемые задачи являются статическими (как правило, задачи расширения и реже задачи доопределения). Приложения, реализуемые с помощью ЭС, различаются по количеству возможных решений, по сложности (структурированности) проблемной области, по методам решения задач, по типу используемых знаний.

С точки зрения глубины анализа проблемной области большинство существующих ЭС являются поверхностными, что обеспечивает их высокую эффективность. Однако для многих приложений необходимо создание глубинных ЭС, реализация которых требует существенных вычислительных ресурсов, что препятствует их широкому распространению. По типу используемых методов и знаний ЭС делятся на традиционные и гибридные. Большинство существующих ЭС традиционные. Тенденцией является создание гибридных ЭС путем выделения в неформализованной задаче формализуемых подзадач и реализации их методами традиционного программирования (т.е. в виде БД и ППП). Гибридизация ЭС значительно усложняет процесс управления системой, увеличивает количество неявно представленных знаний, что ухудшает ее объяснительные возможности и сужает номенклатуру используемых методов инженерии знаний. С точки зрения класса ЭС большинство существующих ЭС являются простыми (в США из общего числа продаваемых ЭС 90% простые).

На рис. 7.2 представлена более удобная для восприятия (по сравнению с рис. 7.1 ) схема стандартной технологии разработки ЭС.

Характерной особенностью подобной технологии являются многочисленные возвраты к любому этапу и пересмотр принятых там проектных решений, что достаточно удобно для быстрого создания небольших автономно функционирующих ЭС (концепция «быстрого прототипирования» [1--3]), однако модель жизненного цикла (ЖЦ), соответствующая такой технологии, затруднена для промышленного использования из-за низкой эффективности разработки конкретной системы, она важнее для исследовательских целей и как ЭС-1.

Технология создания ЭС, предложенная в работах включает три фазы: проектирование, реализацию и внедрение, а ЖЦ разработки состоит из шести этапов:

исследование выполнимости проекта;

разработка общей концепции ЭС;

разработка и тестирование серии прототипов;

разработка и испытание головного образца;

разработка и проверка расширенных версий системы;

привязка системы к реальной рабочей среде.

Сравнивая данные технологии между собой, можно заметить, что первые два этапа промышленной технологии соответствуют этапу идентификации, а следующие три этапа -- этапам концептуализации, формализации и тестирования. Единственное отличие -- наличие этапа привязки ЭС к реальной рабочей среде.

Определяется:

1. Удобство работы. Под удобством работы понимают естественность взаимодействия с ней, которая заключается в приведении информации в требуемом пользователем виде;

2. Ее полезность. Под полезностью понимается способность в ходе диалога определять параметры пользователя, выявлять и устранять неудачи в работе и удовлетворять потребностям пользователя;

3. Гибкость. - способность системы настраиваться на конкретного пользователя;

4. Устойчивость системы к ошибкам. Это способность системы не выходить из строя при ошибочных действиях неопытного пользователя.

43. Взаимодействие инженера по знаниям с экспертом

Знания берут из книг, отчетов, опыта, эксперта, от людей-экспертов.

Извлечение знаний осуществляется в процессе интенсивного систематического взаимодействия инженера по знаниям с экспертом.

Сложность - эксперт не осознает, какими знаниями пользуется, либо не может вербализовать их.

Для построения системы необходимы следующие выводы:

1) если Вы эксперт, то не нужно пытаться определить свои знания без инженера по знаниям. Этот инженер должен убедиться в достоверности знаний;

2) инженер по знаниям должен верить не тем знаниям за которые ручается эксперт, а те которые действительно достоверны.

44. Метод наблюдений

При данном методе эксперта при решении задачи просят думать вслух. Все это протоколируется.

45. Генетические алгоритмы и моделирование биологической эволюции

Основные понятия, принципы и предпосылки генетических алгоритмов.

Генетический алгоритм (ГА)- это простая модель эволюции в природе, реализованная в виде компьютерной программы. В нем используются как аналог механизма генетического наследования, так и аналог естественного отбора. Задача курсовой работы состоит в изучении генетических алгоритмов и рассмотрении основных принципов решения задач с их помощью. Так же реализовать решение задачи с использованием генетического алгоритма.

Рисунок 21 - Модель эволюции в природе

Эволюционная теория утверждает, что каждый биологический вид целенаправленно развивается и изменяется для того, чтобы наилучшим образом приспособиться к окружающей среде.

Можно сказать, что эволюция - это процесс оптимизации всех живых организмов. Основной механизм эволюции - это естественный отбор. Его суть состоит в том, что более приспособленные особи имеют больше возможностей для выживания и размножения и, следовательно, приносят больше потомства, чем плохо приспособленные особи. При этом благодаря передаче генетической информации генетическому наследованию) потомки наследуют от родителей основные их качества. Таким образом, потомки сильных индивидуумов также будут относительно хорошо приспособленными, а их доля в общей массе особей будет возрастать. После смены нескольких десятков или сотен поколений средняя приспособленность особей данного вида заметно возрастает. Схема генетического алгоритма приведена на рисунке справа. Вначале генерируется начальная популяция особей (индивидуумов), т.е. некоторый набор решений задачи. Как правило, это делается случайным образом. Затем необходимо смоделировать размножение внутри этой популяции. Для этого случайно отбираются несколько пар индивидуумов, производится скрещивание между хромосомами в каждой паре, а полученные новые хромосомы помещаются в популяцию нового поколения. В генетическом алгоритме сохраняется основной принцип естественного отбора -- чем приспособленнее индивидуум (чем больше соответствующее ему значение целевой функции), тем с большей вероятностью он будет участвовать в скрещивании. Теперь моделируются мутации -- в нескольких случайно выбранных особях нового поколения изменяются некоторые гены. Затем старая популяция частично или полностью уничтожается и мы переходим к рассмотрению следующего поколения. Популяция следующего поколения в большинстве реализаций генетических алгоритмов содержит столько же особей, сколько начальная, но в силу отбора приспособленность в ней в среднем выше.

Теперь описанные процессы отбора, скрещивания и мутации повторяются уже для этой популяции и т. д.

В каждом следующем поколении мы будем наблюдать возникновение совершенно новых решений нашей задачи. Среди них будут как плохие, так и хорошие, но благодаря отбору число хороших решений будет возрастать.

Мутация -- это преобразование хромосомы, случайно изменяющее одну или несколько ее позиций (генов). Наиболее распространенный вид мутаций -- случайное изменение только одного из генов хромосомы.

Кроссинговер (кроссовер или скрещивание) -- это операция,при которой из двух хромосом порождается одна или несколько новых хромосом.

Фенотип - совокупность всех внутренних и внешних признаков и свойств особи, организма.

Генотип - совокупность всех генов, локализованных в хромосомах данного организма. В более широком смысле генотип -- совокупность всех наследственных факторов организма -- как ядерных (геном), так и неядерных, внехромосомных (т. е. цитоплазматических и пластидных наследственных факторов). Термин предложен датским биологом В. Иогансеном (1909).

Генетические алгоритмы (ГА) являются адаптивными методами функциональной оптимизации, основанные на компьютерном имитационном моделировании биологической эволюции. Основные принципы ГА были сформулированы Голландом (1975), и хорошо описаны во многих работах и на ряде сайтов в Интернете.

В настоящее время существует ряд теорий биологической эволюции (Ж.-Б.Ламарка, П. Тейяра де Шардена, К.Э. Бэра, Л.С. Берга, А.А. Любищева, С.В. Мейена и др.), однако, ни одна из них не считается общепризнанной. Наиболее известной и популярной, конечно, является теория Чарльза Дарвина, которую он представил в работе "Происхождение Видов" в 1859 году.

Эта теория, как и другие, содержит довольно много нерешенных проблем, глубокое рассмотрение которых далеко выходит за рамки данной работы. Здесь мы можем отметить лишь некоторые наиболее известные из них. Как это ни парадоксально, но несмотря на то, что сам Чарльз Дарвин назвал свою работу "Происхождение Видов" но как раз именно происхождения видов она и не объясняет. Дело в том, что возникновение нового вида "по алгоритму Дарвина" является крайне маловероятным событием, т.к. для этого требуется случайное возникновение в одной точке пространства и времени сразу не менее 100 особей нового вида, т.е. особей, которые могли бы иметь плодовитое потомство. При меньшем количестве особей вид обречен на вымирание. Поэтому процесс видообразования на основе случайных мутаций должен был бы занять несуразно много времени (по некоторым оценкам даже в намного раз больше, чем время существования Вселенной). Кроме того, "алгоритм Дарвина" не объясняет явной системности в многообразии возникающих форм, типа закона гомологичных рядов Н.И. Вавилова. Поэтому Л.С. Берг предложил очень интересную концепцию номогенеза - закономерной или направленной эволюции живого. В этой концепции предполагается, что филогенез имеет определенное направление и смена форма является не случайной, а задается некоторым вектором, природа которого не ясна. Идеи номогенеза глубоко разработал и развил А.А. Любищев, высказавший гипотезу о математических закономерностях, которые определяют многообразие живых форм. Кроме того, Дарвин не смог показать механизм наследования, при котором поддерживается и закрепляется изменчивость. Это было на пятьдесят лет до того, как генетическая теория наследственности начала распространяться по миру, и за тридцать лет до того, как "эволюционный синтез" укрепил связь между теорией эволюции и молодой генетикой.

Тем ни менее и не смотря на свои недостатки, именно теория Дарвина традиционно и моделируется в ГА, хотя, конечно, это не исключает возможности моделирования и других теорий эволюции в ГА. Более того, возможно именно такое компьютерное моделирование и сравнение его результатов с картиной реальной эволюции жизни на Земле может быть и сыграет положительную роль в дальнейшей разработке наиболее адекватной теории биологической эволюции.

Теория Дарвина применима не к отдельным особям, а к популяциям - большому количеству особей одного вида, т.е. способных давать плодовитое потомство, находящейся в определенной статичной или динамичной внешней среде.

В основе модели эволюции Дарвина лежат случайные изменения отдельных материальных элементов живого организма при переходе от поколения к поколению. Целесообразные изменения, которые облегчают выживание и производство потомков в данной конкретной внешней среде, сохраняются и передаются потомству, т.е. наследуются. Особи, не имеющие соответствующих приспособлений, погибают, не оставив потомства или оставив его меньше, чем приспособленные (считается, что количество потомства пропорционально степени приспособленности). Поэтому в результате естественного отбора возникает популяция из наиболее приспособленных особей, которая может стать основой нового вида.

Естественный отбор происходит в условиях конкуренции особей популяции, а иногда и различных видов, друг с другом за различные ресурсы, такие, например, как пища или вода. Кроме того, члены популяции одного вида часто конкурируют за привлечение брачного партнера. Те особи, которые наиболее приспособлены к окружающим условиям, будут иметь относительно больше шансов воспроизвести потомков. Слабо приспособленные особи либо совсем не произведут потомства, либо их потомство будет очень немногочисленным. Это означает, что гены от высоко адаптированных или приспособленных особей будут распространятся в увеличивающемся количестве потомков на каждом последующем поколении.

Таким образом, по сути дела каждый конкретный генетический алгоритм представляют имитационную модель некоторой определенной теории биологической эволюции или ее варианта. Вместе с тем необходимо отметить, что сами исследователи биологической эволюции пока еще не до конца определились с критериями и методами определения степени существенности для поддерживаемой ими теории эволюции тех или иных биологических процессов, которые собственно и моделируются в генетических алгоритмах. На рисунке приведен пример простого генетического алгоритма.

Работа ГА представляет собой итерационный процесс, который продолжается до тех пор, пока поколения не перестанут существенно отличаться друг от друга, или не пройдет заданное количество поколений или заданное время. Для каждого поколения реализуются отбор, кроссовер (скрещивание) и мутация.

Таким образом, можно сделать фундаментальный вывод, имеющий даже мировоззренческое звучание, о том, что естественный отбор представляет собой процесс генерации и накопления информации о выживании и продолжении рода в ряде поколений популяции, как системы.

Это накопление информации происходит на различных уровнях иерархии популяции, как системы, включающей:

- элементы системы: отдельные особи;

- взаимосвязи между элементами: отношения между особями в популяции, обеспечивающие передачу последующим поколениям максимального количества информации об их выживании и продолжении рода (путем скрещивания наиболее приспособленных особей и наследования рациональных приобретений);

- цель системы: сохранение и развитие популяции, реализуется через цели особей: индивидуальное выживание и продолжение рода.

Фенотип соответствует генотипу и представляет собой его внешнее проявление в признаках особи. Особь взаимодействует с окружающей средой и другими особями в соответствии со своим фенотипом. В случае, если это взаимодействие удачно, то особь передает генетическую информацию, определяющую фенотип, последующим поколениям.

Если кроссовер происходит, то потомки получают по половине случайным образом определенных признаков от каждого из родителей. Численность потомства пропорциональна суммарной приспособленности родителей. В некоторых вариантах ГА потомки после своего появления заменяют собой родителей и переходят к мутации.

Если кроссовер не происходит, то исходные особи - несостоявшиеся родители, переходят на стадию мутации.

Если ГА сошелся, то это означает, что решение найдено, т.е. получено поколение, идеально приспособленное к условиям данной фиксированной среды обитания. Иначе - переход на шаг 4 - начало формирования нового поколения.

В реальной биологической эволюции этим дело не ограничивается, т.к. любая популяция кроме освоения некоторой экологической ниши пытается также выйти за ее пределы освоить и другие ниши, как правило "смежные". Именно за счет этих процессов жизнь вышла из моря на сушу, проникла в воздушное пространство и поверхностный слой почвы, а сейчас осваивает космическое пространство.


Подобные документы

  • Задача анализа деловой активности, факторы, влияющие на принятие решений. Современные информационные технологии и нейронные сети: принципы их работы. Исследование применения нейронных сетей в задачах прогнозирования финансовых ситуаций и принятия решений.

    дипломная работа [955,3 K], добавлен 06.11.2011

  • Анализ применения нейронных сетей для прогнозирования ситуации и принятия решений на фондовом рынке с помощью программного пакета моделирования нейронных сетей Trajan 3.0. Преобразование первичных данных, таблиц. Эргономическая оценка программы.

    дипломная работа [3,8 M], добавлен 27.06.2011

  • Системы поддержки принятия решений. Информационные аспекты процессов химической очистки теплоэнергетического оборудования. Математическое моделирование на основе корреляционно-регрессионного анализа. Построение модели. Подсистема "Дисперсионный анализ".

    дипломная работа [4,2 M], добавлен 12.08.2017

  • Анализ существующих решений системы поддержки принятия решений для корпоративной сети. Многоагентная система. Разработка концептуальной модели. Структура базы знаний. Разработка модели многоагентной системы на базе сетей Петри. Методика тестирования.

    дипломная работа [5,1 M], добавлен 19.01.2017

  • Понятие информационной системы как системы сбора, хранения, накопления, поиска и передачи информации, применяемая в процессе управления или принятия решений. Классификация и структура информационных систем. Разнообразие задач, решаемых с помощью ИС.

    контрольная работа [160,6 K], добавлен 18.01.2010

  • Структура модели системы обработки информации. Особенности временной диаграммы и машинной программы решения задачи. Сравнение результатов имитационного моделирования и аналитического расчета характеристик. Описание возможных улучшений в работе системы.

    курсовая работа [1,1 M], добавлен 26.06.2011

  • Структурное обеспечение информационной системы как инструмента формирования управленческих решений. Структурные модели. Классификация компьютерных сетей. Основные понятия локальной сети. Глобальные сети. История возникновения, специфика электронных денег.

    учебное пособие [881,9 K], добавлен 14.09.2015

  • Системы и задачи их анализа. Методы системного анализа: аналитические; математические. Сущность автоматизации управления в сложных системах. Структура системы с управлением, пути совершенствования. Цель автоматизации управления. Этапы приятия решений.

    реферат [324,3 K], добавлен 25.07.2010

  • Основные понятия: модель, моделирование, виды моделей. Пути и способы изучения темы "Моделирование и формализация" в курсе информатики в 8 классе. Создание табличной информационной модели. Понятие информационной модели, системы и структуры системы.

    методичка [1,8 M], добавлен 30.05.2013

  • Построение концептуальной модели системы и ее формализация. Алгоритмизация модели системы и ее машинная реализация. Построение логической схемы модели. Проверка достоверности модели системы. Получение и интерпретация результатов моделирования системы.

    курсовая работа [67,9 K], добавлен 07.12.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.