Метод формирования обобщенных понятий с использованием темпоральных деревьев решений
Обнаружение знаний в базах данных как актуальная проблема современных интеллектуальных систем. Темпоральные деревья решений, позволяющие учитывать фактор времени, их использование для диагностики сложного технического объекта и задач бортовой диагностики.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 18.01.2018 |
Размер файла | 410,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
9
Размещено на http://www.allbest.ru/
Московский энергетический институт (технический университет)
Метод формирования обобщенных понятий с использованием темпоральных деревьев решений
С.Г. Антипов, М.В. Фомина
Аннотация
В работе рассматриваются подходы к построению темпоральных деревьев решений для задачи диагностики технического объекта, предлагаются алгоритмы построения темпоральных деревьев решений. Моделируется процесс диагностики на основе известных данных о возможных неисправностях. Для диагностики в динамике используется многоагентный подход.
Введение
Обнаружение знаний в базах данных является актуальной проблемой современных интеллектуальных систем. Это связано с большим объемом современных баз данных, которые так велики, что практически невозможно вручную проанализировать их для извлечения ценной информации, помогающей принимать важные решения. Отсюда следует, что люди нуждаются в помощи интеллектуальных систем для повышения своих аналитических возможностей. Системы автоматического обнаружения знаний могут анализировать "сырые" данные и предоставлять извлеченную информацию скорее и успешнее, чем аналитик мог бы найти её самостоятельно.
Во многих случаях описание поведения сложных систем содержит сотни независимых атрибутов, которые необходимо анализировать, чтобы наиболее точно смоделировать поведение системы. Важным параметром, отражающим динамику поведения сложной системы, является время. Обобщение информации, отражающей изменение ситуаций во времени требует использования специальных методов.
Постановка задачи
Рассматривается задача диагностики на основе модели [Brusoni et al., 1998]. Модель может быть использована для имитации поведения объекта и выявления неисправностей. Если имеются результаты наблюдений за поведением системы, диагностирование может быть произведено путем сравнения поведения, предсказанного моделью, и наблюдаемым поведением объекта. Чтобы такая модель была полезной и для бортовой диагностики, она должна включать в себя действия, которые должны производиться в случае обнаружения отказа. В общем случае действия (восстановительные действия) характеризуются некоторой стоимостью, которая чаще всего выражается в уменьшении функциональности системы. Таким образом, основная цель процедуры бортовой диагностики заключается в выборе оптимального действия в аварийном режиме.
Для имитации поведения объекта и выявления неисправностей может быть использована модель специального вида, которая описывает структуру и поведение сложного технического объекта. Такая модель представляет собой тройку <S, M, R>, где:
S - множество переменных, описывающих состояние системы (в технической диагностике это чаще всего измерения, получаемые от датчиков, установленных в системе, или результаты вычислений, выполненных над полученными измерениями);
M - набор режимов работы, включающих в себя состояния "норма" (корректное поведение) и "неисправность" (некорректное поведение);
R - набор отношений, связывающих множество переменных S, описывающих состояние системы, и набор режимов работы M.
В рассматриваемой задаче информация о функционировании объекта управления представлена множеством результатов измерений, поступающих с датчиков; таким образом, состояние сложного объекта и его компонентов описывается набором признаков (количественных и качественных), при этом одним из признаков является время. Целью работы является получение обобщенных описаний классов ситуаций, возникающих на объекте, причем с каждым классом ситуаций связываются определенные действия по управлению объектом, называемые далее восстановительными действиями. Постановка задачи обобщения по признакам приведена в [Вагин и др., 2008].
Темпоральные деревья решений - это расширение классического понятия деревьев решений [Quinlan, 1986], позволяющее учитывать фактор времени. Каждый узел такого дерева имеет метку времени, благодаря чему можно учитывать порядок производимых наблюдений и задержку между ними, что в результате приводит к увеличению различающей способности дерева и самым непосредственным образом влияет на процесс принятия решений. Решение задачи обобщения на основе анализа набора признаков, постановка которой дана в [Вагин и др. 2008], предполагает первоначально построение дерева решений, а затем использования его для классификации ситуаций на объекте.
Темпоральные деревья предлагается использовать для решения задач диагностики сложного технического объекта и задач бортовой диагностики (например, автомобиля). Данные, поступающие с различных датчиков, описывают состояние всей системы в конкретный момент времени, а использование темпоральных деревьев решений позволяет проследить изменение состояния системы за некоторый интервал времени и выявить неисправности или неблагоприятные тенденции, которые могут по истечении некоторого интервала времени привести к неисправности.
Необходимо на основе анализа обучающей выборки построить понятие, разделяющее положительные и отрицательные примеры. Понятие Q считается сформированным, если удалось построить решающее правило, которое для любого примера из обучающей выборки указывает, принадлежит ли этот пример понятию, или нет. Сформированное понятие может быть представлено в виде логической функции, дерева решений, набора продукционных правил вида “ЕСЛИ условие ТО искомое понятие”.
Исходными данными как для первоначального обобщения, так и для диагностики, является таблица наблюдений. Также может использоваться некоторая модель для восстановительных действий: например, может быть введен частичный порядок над действиями - тогда при наличии неразличимых ситуаций и сравнимых действий достаточно будет выполнить наиболее сильное из действий. Далее приведен пример таблицы с наблюдениями (табл. 1).
Табл. 1.
Датчик1 |
Датчик2 |
Датчик3 |
Д |
К |
|||||||||||||||||||||||
t |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|||
сит1 |
n |
n |
n |
n |
h |
h |
l |
v |
v |
v |
v |
v |
n |
n |
n |
l |
l |
l |
a |
5 |
|||||||
сит2 |
h |
h |
h |
h |
n |
n |
n |
n |
n |
b |
2 |
||||||||||||||||
сит3 |
n |
n |
n |
n |
h |
h |
h |
h |
l |
l |
l |
l |
v |
v |
v |
v |
n |
n |
n |
l |
l |
l |
v |
v |
b |
7 |
|
сит4 |
n |
n |
n |
h |
h |
h |
h |
l |
l |
l |
l |
l |
v |
n |
n |
h |
h |
h |
h |
h |
c |
6 |
|||||
сит5 |
h |
h |
h |
h |
h |
n |
n |
n |
n |
n |
n |
l |
c |
3 |
|||||||||||||
сит6 |
n |
n |
n |
h |
h |
h |
l |
v |
v |
z |
z |
z |
n |
n |
n |
l |
l |
v |
d |
5 |
|||||||
сит7 |
h |
h |
h |
h |
h |
h |
l |
l |
n |
n |
l |
v |
n |
n |
n |
l |
l |
v |
b |
5 |
|||||||
сит8 |
h |
h |
h |
h |
h |
h |
h |
h |
n |
n |
l |
l |
n |
n |
n |
l |
v |
z |
c |
5 |
Каждой строке в таблице соответствует некоторая ситуация ситi, которая определяется:
показаниями датчиков Датчикj в моменты времени k=0, 1,.7 (здесь z, n, l, v, h соответствуют качественным показаниям датчиков: n - норма, l и h соответственно низкое и высокое, v - очень низкое, z - нуль);
восстановительным действием Дi для каждой ситуации;
крайним сроком Кi выполнения соответствующего действия.
Такое представление позволяет не вводить каких-либо ограничений на способ представления времени в системе.
На основании этих данных необходимо построить дерево, осуществляющее диагностику технического объекта управления. Такое дерево решений будем называть темпоральным деревом решений Ќ. Внутренним узлам дерева сопоставлены проверки значений датчиков в определенные моменты времени, дуги помечены показаниями датчиков, листья дерева соответствуют выбранным управляющим действиям.
Алгоритмы построения темпоральных деревьев решений
Общая схема алгоритма построения темпорального дерева решений приведена на рис.1. На вход алгоритма подаются:
1) таблица с ситуациями;
2) наблюдения (множество пар <датчик, временная метка>);
3) модель восстановительных действий. На выходе получаем темпоральное дерево решений. Функция Лист (S, M) на основе ситуаций и модели восстановительных действий строит лист дерева, помечая его множеством восстановительных действий, полученным согласно модели.
В работе был исследован алгоритм для построения темпоральных деревьев решений, изложенный в [Console et al., 2003] (назовем его CPD как сокращение от фамилий авторов - Console-Picardi-Dupre). Этот алгоритм строит темпоральное дерево решений на основе показаний датчиков с учетом крайнего срока выполнения действий и их стоимости. Временные метки в узлах дерева при движении от корня к листьям не убывают, следовательно, нет необходимости хранить показания датчиков при диагностировании.
В работе предлагается алгоритм (назовем его Temporal ID3), который является расширением алгоритма ID3 [Quinlan, 1986], учитывающим фактор времени. По сравнению с алгоритмом CPD, на темпоральное дерево решений не накладывается никаких ограничений по временным меткам в узлах. Однако не учитывается стоимость восстановительных действий при выборе наблюдения на каждом шаге. Кроме того, снимается ограничение на неуменьшение временных меток при движении от корня дерева к листьям, что приводит к необходимости сохранять некоторые значения датчиков для дальнейшего использования при проведении диагностики.
Основное различие между алгоритмами CPD и temporal ID3 - выбор наблюдения, на основе которого будет производиться разбиение множества ситуаций. В алгоритме CPD выбирается наблюдение, минимизирующее стоимость результирующего дерева. В temporal ID3 мы используем критерий "прирост информативности" Куинлана [Quinlan, 1986].
Алгоритм Построение_темпорального_дерева (S: Таблица с ситуациями, O: Наблюдения, M: Модель восстановительных действий) Результат: Темпоральное дерево решений Ќ начало Если для всех ситуаций из S восстановительные действия совпадают, то вернуть Лист (S, M) Пусть D - минимальный крайний срок для ситуаций из S. Если ситуации из S неразличимы на основе показаний датчиков с меткой времени t?D, то вернуть Лист (S, M). Выбрать наблюдение <s*,t*>, которое будет проверяться в данном узле дерева. Пусть s*1, s*2,., s*n - различающиеся показания датчика s* в момент времени t*, а S*j, j=1,2,.,n - подмножества ситуаций из S, состоящие из ситуаций с показанием s*j датчика s* в момент времени t*. Вернуть дерево с корнем, помеченным выбранным наблюдением <s*,t*>, и дугами, помеченными s*1, s*2,., s*n, соединяющими корень соответственно с деревьями Построение_темпорального_дерева (S*1, O\{<s*,t*>}, M) Построение_темпорального_дерева (S*2, O\{<s*,t*>}, M) … Построение_темпорального_дерева (S*n, O\{<s*,t*>}, M) Конец |
Рис.1. Общая схема алгоритмов построения темпорального дерева решений
Темпоральные деревья решений, построенные с использованием данных из табл.1 и алгоритмов CPD и temporal ID3, приведены соответственно на рис.2 и рис.3.
темпоральное дерево решение база интеллектуальная
Моделирование
Было проведено программное моделирование работы алгоритмов. Моделирование включает в себя несколько этапов. На первом этапе производится построение темпорального дерева решений. Второй этап - генерация ситуаций, которые могут происходить на объекте. Далее производится классификация сгенерированных ситуаций, причем возможны два варианта: классификация ситуации целиком - в случае, если показания датчиков сняты на временном интервале, не превышающем временной интервал, указанный в исходной таблице. При этом для классификации требуется единственное дерево.
Рис 2. Темпоральное дерево решений (алгоритм CPD)
Рис.3. Темпоральное дерево решений (алгоритм temporal ID3)
Другой вариант - классификация на большом временном интервале: на вход последовательно поступают показания датчиков. В этом случае для классификации потребуется несколько деревьев решений (точнее, столько, какова величина временного интервала, использованного при построении деревьев). Помимо этого потребуются агенты, работающие с каждым из этих деревьев (выполняют функции "получение данных", "контроль времени") и агент-координатор, который получает данные и рассылает их рабочим агентам. Такая многоагентная система позволяет проводить бортовую диагностику в псевдореальном времени.
Заключение
При проведении эксперимента было выявлено, что темпоральные деревья решений, построенные с использованием алгоритмов CPD и Temporal ID3, правильно определяют значительное количество некорректных ситуаций и выбирают нужные восстановительные действия. При этом следует отметить, что одним из недостатков алгоритма CPD является большое число ложных срабатываний - так называемых ошибок первого рода. Поэтому минимизация размера дерева решений не должна быть единственным критерием при его построении.
С этой точки зрения алгоритм Temporal ID3 является более предпочтительным. Большее по размерам дерево решений, полученное с помощью данного алгоритма, может обладать большей различающей способностью, однако при этом вырастают требования к вычислительным ресурсам. В связи с этим необходимо попытаться найти некий разумный компромисс.
Благодарности. Работа выполнена при финансовой поддержке РФФИ (проект № 09-01-0076).
Список литературы
1. [Вагин и др., 2008] Вагин В.Н., Головина Е.Ю., Загорянская А.А., Фомина М.В. Достоверный и правдоподобный вывод в интеллектуальных системах. Второе издание. - М.: Физматлит, 2008.
2. [Brusoni et al., 1998] Brusoni V., Console L., Terenziani P., Duprй D. A spectrum of definitions for temporal model-based dignosis // Artificial Intelligence. 1998. №102.
3. [Console et al., 2003] Console L., Picardi C., Duprй D. Temporal decision trees: model-based diagnosis of dynamic systems on-board // Journal of artificial intelligence research. 2003. №19.
4. [Quinlan, 1986] Quinlan J. R. Induction of decision trees // Machine learning. 1986. №1.
Размещено на Allbest.ru
Подобные документы
Пример дерева решений. Анализ древовидной структуры данных. Предикторные (зависимые) переменные как признаки, описывающие свойства анализируемых объектов. Решение задач классификации и численного прогнозирования с помощью деревьев классификации.
презентация [391,1 K], добавлен 09.10.2013Инструментальные средства проектирования интеллектуальных систем. Анализ традиционных языков программирования и представления знаний. Использование интегрированной инструментальной среды G2 для создания интеллектуальных систем реального времени.
контрольная работа [548,3 K], добавлен 18.05.2019Разработка экспертной системы диагностики и выбора оптимальных решений. Формирование медицинской базы. Структура программного средства. Работа с базами данных. Функционирование программного средства, добавление и редактирование заболеваний, симптомов.
дипломная работа [5,5 M], добавлен 23.03.2012Изображения древовидной структуры. Десятичная система обозначений Дьюи. Стандартные формы представления деревьев. Представление деревьев с использованием списков, с использованием списков сыновей. Полное бинарное дерево. Основные операции над кучей.
презентация [495,0 K], добавлен 19.01.2014Признаки и отличительные черты интеллектуальных информационных систем, их классификация и использование при разработке экономических и управленческих решений. Определение, назначение и области применения экспертных систем. Использование нейронных сетей.
курс лекций [1,7 M], добавлен 27.04.2009Фрагментарная обработка больших объектов в мультимедийных базах данных (прямой доступ к отдельным фрагментам хранимого объекта). Двухуровневое разбиение полей большого размера. Древовидное представление данных. Части объекта, определяемые поддеревом.
презентация [93,4 K], добавлен 11.10.2013Индексирование в базах данных. Создание индекса, его типы, виды и структура. Индексы для последовательных файлов. Неупорядоченные и упорядоченные файлы. Типы хеширования, древовидные структуры для многомерных данных. Деревья квадрантов и их вершины.
реферат [2,6 M], добавлен 19.06.2015Классификация систем поддержки принятия решений. Сравнительный анализ методик для оценки рисков розничного кредитования. Структура системы поддержки принятия решений, формирование начальной базы знаний. Проектирование базы данных информационной системы.
дипломная работа [1,9 M], добавлен 10.07.2017Использование конечного двойственного метода для корректировки решений близких задач линейно-квадратичного программирования. Разработка программы на языке С для решения и корректировки решений. Двойственная задача. Основные понятия и утверждения.
курсовая работа [165,9 K], добавлен 01.06.2014Универсальная модель данных. Использование функций пакета. Нечёткая логика в таблицах принятия решений. Динамические SQL-запросы и их использование. Прямой и обратный логический выводы. Контроль корректности данных. Адаптивный интерфейс пользователя.
дипломная работа [5,2 M], добавлен 23.07.2015