Анализ методов и средств извлечения знаний и оценивание качества моделей в СППР для индустриально-технологический и строительных производств
Рассмотрение методов и средств извлечения знаний с учетом оценки качества моделей в системах поддержки принятия решений. Возможности совместного эффективного использования экспертных систем, интеллектуального анализа данных, машинного логического вывода.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 17.05.2020 |
Размер файла | 171,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Кубанский государственный аграрный университет
АНАЛИЗ МЕТОДОВ И СРЕДСТВ ИЗВЛЕЧЕНИЯ ЗНАНИЙ И ОЦЕНИВАНИЕ КАЧЕСТВА МОДЕЛЕЙ В СППР ДЛЯ ИНДУСТРИАЛЬНО-ТЕХНОЛОГИЧЕСКИХ И СТРОИТЕЛЬНЫХ ПРОИЗВОДСТВ
Лаптев Владимир Николаевич к.т.н, доцент
Липин Константин Михайлович аспирант
Степанов Владимир Васильевич д.т.н., профессор
Степанова Марина Валерьевна старший преподаватель
Аннотация
модель решение экспертный интеллектуальный
В работе рассмотрены наиболее используемые методы и средства извлечения знаний с учетом оценки качества моделей в системах поддержки принятия решений. В научном и практическом плане исследованы возможности совместного эффективного использования экспертных систем, интеллектуального анализа данных (ИАД) и машинного логического вывода (МЛВ), что обеспечивает более глубокую обработку данных, учитывая существенные отличия баз данных (БД) и баз знаний (БЗ). БД является единицей информации несвязанной друг с другом сведениями, в то время как БЗ - не только связаны между собой, но и с понятиями окружающего мира, что дает возможность решать сложные многокритериальные задачи в различных предметных областях. В настоящее время все возрастающее внимание уделяется неройсетевым технологиям, обладающие способностью моделирования нелинейных процессов, работе с зашумленными данными, а также способностью к обучению и самообучению, извлекая из поступающей информации существенные особенности. В тоже время интеграция нейросетевых технологий и моделей искусственного интеллекта в единую гибридную систему вместе с методами логического вывода в виде иерархической последовательности структуры правил «Если-то» значительно улучшает понимание изучаемого процесса и качества представления получаемого результата. Тем не менее эти методы и средства извлечения знаний являются недостаточными если не использовать механизм нечеткого лингвистического вывода. Базовой характеристикой нечетких множеств является функция принадлежности, которая представляет собой обобщенную характеристику обычного множества. Для задания этой функции используются три типа форм - треугольная, трапецеидальная и гауссового типа и две основных процедуры - фазификация и дефазификация, что и рассмотрено на примере метода Мамдани. Наряду с изложенным наиболее перспективным направлением в этой области является алгоритм адаптивного усиления AdaBoost, где ограничение усиления за счет фильтрации состоит в применении подвыборки, контур которой есть обычный контур пакетного обучения, допускающий повторное использование данных обучения. Это и обеспечивает возможность работы со слабыми моделями, а в условиях гибридизации обуславливает повышение эффективности, усиливает классификаторы, объединенные в «комитет». Каждая следующая совокупность классификаторов строится по объектам неверно классифицированных предыдущими совокупностями. AdaBoost чувствителен к шуму в данных и выбросам и менее подвержен переобучению, что позволяет значительно уменьшить количество примеров и получать более качественный вывод в СППР
Ключевые слова: ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ, ОБРАБОТКА ДАННЫХ, МНОГОКРИТЕРИАЛЬНЫЕ ЗАДАЧИ, НЕЙРОСЕТЕВЫЕ ТЕХНОЛОГИИ, ФАЗИФИКАЦИЯ, ДЕФАЗИФИКАЦИЯ, АЛГОРИТМ АДАПТИВНОГО УСИЛЕНИЯ
Annotation
ANALYSIS OF METHODS AND MEANS OF EXTRACTING KNOWLEDGE AND ASSESSING THE QUALITY OF MODELS IN THE DSS FOR INDUSTRIAL-TECHNOLOGICAL AND CONSTRUCTION INDUSTRIES
The article considers the most used methods and means of knowledge extraction taking into account the quality assessment of models in decision support systems. In scientific and practical terms, the possibilities of joint effective use of expert systems, data mining (IAD) and machine logical inference (MLV), which provides deeper data processing, taking into account the significant differences between databases (DB) and knowledge bases (BZ). DB is a unit of information unrelated to each other information, while BZ - not only related to each other, but also with the concepts of the world, which makes it possible to solve complex multi-criteria problems in various subject areas. Currently, increasing attention is paid to non-network technologies that have the ability to simulate nonlinear processes, work with noisy data, as well as the ability to learn and self-study, extracting essential features from the incoming information. At the same time, the integration of neural network technologies and artificial intelligence models into a single hybrid system together with the methods of logical inference in the form of a hierarchical sequence of the "If-then" rules structure significantly improves the understanding of the studied process and the quality of presentation of the result. Nevertheless, these methods and means of knowledge extraction are insufficient if the fuzzy linguistic inference mechanism is not used. The basic characteristic of fuzzy sets is the membership function, which is a generalized characteristic of a normal set. To set this feature, we use three types of shapes - triangular, trapezoidal and Gaussian type and two main procedures - phasefication and de-phaseification which is considered by the example of the method of Mamdani. Along with the stated most promising direction in this area is the adaptive gain algorithm called AdaBoost, where the limitation of the gain due to the filtering is to apply the subsampling circuit which has the normal contour of batch training, reusable training data. This provides an opportunity to work with weak models, and in the conditions of hybridization causes efficiency increase, strengthens the classifiers united in the "Committee". Each next set of classifiers is built on objects incorrectly classified by previous sets. AdaBoost is sensitive to data noise and emissions and is less susceptible to retraining, which can significantly reduce the number of examples and obtain better output in the DSS
Keyword. DATA MINING, DATA PROCESSING, MULTICRITERIA PROBLEM, NEURAL NETWORK TECHNOLOGY, PHASEFICATION, DE-PHASEFICATION, ADAPTIVE ALGORITHM GAIN
Основная часть
Информация и разнородные данные - это основной строительный материал не только для построения обычных вычислительных, но и нейронных сетей, а также деревьев решений в интеллектуальных системах поддержки принятия решений, обеспечивающих осуществление высококачественного анализа, выявления скрытых закономерностей и выработки стратегии принятия решений. Интеллектуальный анализ данных (ИАД) - процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей, шаблонов, сведений - автоматически обобщенных до информации, которая может быть отождествлена как знания. Особенности алгоритмов, методов и средств, применяемых в ИАД - отсутствие ограничительных рамок в процессе выявления закономерностей и предположений в структуре выбора анализируемых показателей с необработанными (сырыми) данными, сокращения объема которых не производится за счет некоторых значений величинами или производными от них, например, средних значений.
ИАД основан на методологии «обнаружения знаний» в базе данных (БД), как мультидисциплинарная область, возникшая из теории БД (DW, OLAP), теории искусственного интеллекта распознавания образов, экспертных систем, нейросетевых технологий, математической статистики, деревьев решений, нечетких множеств, иерархических моделей данных и т.д.
Методы ИАД позволяют выделить основные типы закономерностей:
- ассоциация - выявление связи (совместимость) нескольких событий с учетом их временной составляющей (последовательность);
- классификация - выделение признаков классов (сгруппированных данных);
- кластеризация - формирование классов.
Как следствие, имеет место прогнозирование, чему наилучшим образом соответствуют нейронные технологии, обладающие способностью к моделированию нелинейных процессов, работе зашумленными данными, способностью обучаться и самообучаться, извлекать из поступающей информации существенные особенности [1].
Интеграция нейронных сетей и моделей искусственного интеллекта (ИИ) в единую гибридную систему позволяет значительно повысить эффективность работы в области поддержки принятия решений. Рассмотрим несколько примеров интеграции в единую систему указанных выше технологий, обеспечивающих ожидаемый эффект.
Экспертные системы (ЭС) моделируют рассуждение эксперта в некоторой предметной области, и использует базу знаний, содержащей факты и правила об этой области, а также специальную процедуру логического вывода и является составной частью исследований по ИИ, цель которых использовать алгоритмы обработки примеров. Ориентация на обработку данных с помощью некоторых правил вывода, которые могут извлекать знания из баз знаний (БЗ) или же непосредственно получать их от эксперта, последнее свойственно именно экспертным системам, когда возникает необходимость разработки моделей и выбора метода для решения определенной задачи предметной области (ПрО) [1].
Существенно важным в ЭС является их взаимодействие с пользователем, структурно-технологической частью системы, что обусловило появление нового технологического приема основанного на знаниях, как составной части ИИ, и имеет целью создание компьютерных методов решения задач (проблем) требующих привлечение экспертов. Основой экспертных систем является БЗ, отличающаяся от базы данных (БД) единицами информации несвязанных друг с другом сведений, в то время как в БЗ все элементы не только связаны между собой, но и с понятиями окружающего мира, что необходимо для понимания, формулирования и решения задач различных предметных областей. Основным элементом ЭС является машина логического вывода (МЛВ), которая манипулирует информацией из БЗ, и указывает, в каком порядке следует выявлять взаимосвязи и делать выводы. Кроме того, она используется для обработки вопросов, моделирования рассуждений и подготовки ответов [3]. В тоже время в рамках интеграции с другими системами этот подход имеет ряд недостатков. Например, в случае использования нейросетевых технологий и построения деревьев решений на основе экспертных оценок с помощью некоторых правил вывода, он реализует цепочку рассуждений эксперта при выборе метода решения задачи в конкретных условиях предметной области и не предназначен для решения универсальных задач.
Поскольку ЭС - компьютерная программа, и как конечный продукт зависит от качества создаваемой базы знаний и решает большой круг задач исключительно в узкоспециализированной хорошо изученной предметной области, располагает четкими стратегиями принятия решений, то передача ЭС более глубоких знаний о ПрО весьма сложной проблемой. Это связано со сложностью формализации эвристических знаний экспертов, не способностью к самообучению, отсутствием возможностей осмысленно объяснить собственные рассуждения.
Способность нейронных сетей к моделированию нелинейных процессов, а также к работе с зашумленными данными в процессе решения задач ИАД априорных предположений о структуре выборки и виде распределенных знаний анализируемых показателей, вызывает необходимость применения нейросетевых технологий.
Интеграция нейросетевых технологий с методами логического вывода в виде иерархической последовательности структуры правил «Если-то» значительно улучшает понимание изучаемого явления за счет более качественного представления результата полученного в ходе обучения нейронной сети [2].
Основой для использования механизма нечеткого логического вывод, как известно, является база правил, основанная на нечетких высказываниях в форме «Если-то» для соответствующих лингвистических термов и функций принадлежности удовлетворяющая двум условиям:
· входная переменная для любого терма должна иметь хотя бы одно правило, в котором этот терм используется в качестве предпосылки (левая часть правила);
· существует хотя бы одно правило для каждого лингвистического терма выходной переменной.
Базовой характеристикой нечеткого множества является функция принадлежности, которую чаще всего обозначают через - обобщенное понятие характеристической функции обычного множества.
означает отсутствие принадлежности множеству, а - полная принадлежность [2], где с - нечеткое множество, при этом является множеством упорядоченных пар, то есть Для задания функции принадлежности существует достаточно много типовых форм, из которых приемлемыми явились - треугольная, трапецеидальная и гауссова.
Треугольная функция, принадлежность которой строится на основе тройки чисел (a, b, c) и ее значение в точке x вычисляется исходя из соотношения (рис.1)
(1)
Рисунок 1 Кусочно-линейная типовая функция треугольной функции принадлежности
Как видно из соотношения [1] в случае имеет место случай симметричной треугольной функции принадлежности, которая может быть однозначно задана двумя параметрами из тройки чисел (a, b, c).
Для более сложного случая имеет место трапецеидальная функция принадлежности, ее можно записать с помощью четверки чисел (a, b, c, d) (рис.2).
(2)
Размещено на http://www.allbest.ru/
Рисунок 2 Кусочно-линейная трапецеидальная функция принадлежности
Функция принадлежности гауссового типа может быть представлена следующей формулой:
] (3),
где с - центр нечеткого множества;
- параметр, отвечающий за крутизну функции (рис.3).
Размещено на http://www.allbest.ru/
Рисунок 3 Гауссова функция принадлежности
Обычно функции принадлежности для каждого терма из базового множества Т изображают на одном графике лингвистической переменной, учитывая, что в ней количество термов редко превышает 7.
Для углубленного понимания рассмотрим механизм нечеткого вывода на примере алгоритма Мамдани, в основу которого положены виды используемых правил, логических операций и методы дефазификации, а также минимаксная композиция нечетких множеств. Полученный таким образом алгоритм включает следующую последовательность действий [2]:
1. процедура дефазификации: определяется истинности, то есть значение функции принадлежности для левых частей соответствующего правила (предпосылки). Степень истинности обозначается как Aik(xk), где i=1,…,m; k=1,…,n.
2. Нечеткий вывод - вначале определяются уровни «отсечения» для левой части каждого из правила: alfai=mini(Aik(xk)). Затем находят «усеченную» функцию принадлежности: Bi*(y)=mini(alfai,Bi(y)).
3. Композиция или объединение полученных усеченных функций, в основе чего используется максимальная композиция нечетких множеств:), где - функция принадлежности итогового нечеткого множества.
4. Дефазификация или приведение к четкости - методом среднего центра (центроидный метод). Геометрический смысл которого заключается в том, что центр тяжести для кривой: определяется на примере двух выходных переменных, что является распространенным способом логического вывода в нечетких системах. Последнее может найти широкое применение, особенно в инженерии.
Рассматриваемый алгоритм работает следующим образом. На итерации n алгоритм усиления реализует слабую модель обучения с распределением Dn множества примеров обучения Т, затем для нее вычисляется гипотеза Fn:X>Y, которая осуществляет классификацию примеров обучения F1, F2, …, FТ в единую гипотезу Ffin, для вычисления распределения Dn на итерации n, Ffin.
После окончания обучения третьего эксперта, на отфильтрованном множестве примеров процесс обучения завершается. Таким образом, алгоритм концентрирует основной объем веса на трех примерах, классифицировать которые наиболее сложно [1] и где ограничение усиления за счет фильтрации состоит в использовании предвыборки, контур которой является обычным контуром пакетного обучения, допускающей повторное использование данных обучения, что позволяет работать со слабыми моделями обучения.
Отличие Ada Boost от других алгоритмов состоит в следующем:
· адаптивно настраивается на ошибки слабых гипотез, возвращаемых слабыми моделями;
· ограничение производительности алгоритма зависит от производительности слабой модели обучения, только на трех распределениях, которые фактически формируются в процессе обучения.
Алгоритм Ada Boost в сочетании с другими алгоритмами классификации обеспечивает повышение эффективности, усиливает классификаторы, объединяя их в «комитет». Он является адаптивным и строится по следующему правилу - каждая следующая совокупность классификаторов строится по объектам, неверно классифицированным предыдущими совокупностями. Кроме того, Ada Boost чувствителен к шуму в данных и выбросам, менее подвержен переобучению по сравнению с другими алгоритмами.
Рассмотрим на достаточно простом примере решения задачи построения бинарного классификатора [4].
Дано , где ? X, Инициируем для каждого t=1,…,T.
Находим классификатор , который минимизирует взвешенную ошибку классификации
где .
При этом,
- если величина , то останавливаемся.
- выбираем бt . Обычно бt=, где - взвешенная ошибка классификатора.
Обновляем:
где - нормализующий параметр, выбираемый так, чтобыпредставлял собой распределение вероятностей
Строим результирующий классификатор:
.
Соотношения для последующего обновления должны удовлетворять условиям:
.
После выполнения этих условий и выбора оптимального классификатора для распределения объекты распределения (i=1,…,m), характеризующие идентифицируют корректно и имеют веса меньше, чем те, которые идентифицируют некорректно. При этом на каждой последующей итерации веса каждого неверно классифицируемого объекта увеличиваются, вызывая у нового комитета необходимость, концентрировать внимание именно на этих объектах.
Таким образом, когда алгоритм Ada Boost тестирует классификаторы на рассматриваемом распределении , он ориентируется на классификатор, который лучше идентифицирует объекты неверно распознаваемые предыдущим классификатором.
Обобщая изложенное в данной работе, следует отметить, что проведенный анализ методов и средств извлечения знаний и оценки качества моделей в СППР показал, что широко известные методы автоматического анализа данных, в основе которого лежит обучение на примерах, позволяют решать более сложные задачи различных сложных предметных областей.
Чаще всего в сложных ПрО может возникнуть ситуация когда точно классифицировать исследуемый объект весьма трудоемко, а использование даже экспертных систем, ориентированных на обработку данных с помощью некоторых правил вывода, которые могут извлекать знания из БЗ, ограничены хорошо изученными предметными областями. Возникает необходимость использования нейронных сетей, поскольку они хорошо адаптивны к классификации образов, формированию классов, моделирование нелинейных процессов, работа с зашумленными данными, обладают способностью к обучению и самообучению.
Интеграция нейронных сетей и методов искусственного интеллекта (ИИ), а также машины логического вывода (МЛВ) в единую гибридную систему значительно повышают эффективность работы в области поддержки принятия решений. Наиболее эффективным в этой ситуации является то, что когда в единую гибридную систему к МЛВ добавляется метод логического вывода в виде иерархической последовательности структуры правил «Если-то», значительно улучшает качество разрабатываемых моделей, а использование механизма нечеткого логического вывода для этого же случая, на основе соответствующей базы правил и лингвистических термов, функций принадлежности ограниченной двумя известными условиями.
На основе использования нечеткого вывода и алгоритма, имеющего четыре последовательных действия, последним из которых является дефазификация или приведение к четкости (центроидный метод) получаем наиболее обоснованный четкий вывод.
Достаточно перспективным направлением в этой области является алгоритм адаптивного усиления Ada Boost, который адаптивно настраивается на ошибки слабых моделей, при этом производительность его зависит от производительности слабой модели только на трех распределениях, которые фактически формализуются в процессе обучения. То есть, когда алгоритм Ada Boost тестирует классификаторы на рассматриваемом распределении , он ориентируется на классификатор, который лучше идентифицирует объекты неверно распознаваемые предыдущим. Учитывая, что в процессе обработки БЗ имеет место огромное количество примеров, последнее обеспечивает значительные уменьшения и более качественный вывод в области СППР.
Литература
1. Саймон Хаки. Нейронные сети. Полный курс Второе издание. [Текст] / Саймон Хаки. М.: Издательский дом Вильямс, 2006. 1104 с.
2. Солодовников И.В., Солодовников В.И. Подход к созданию подсистем автоматизации проектирования нейросетевых структур данных с использованием деревьев решений. [Текст]/ Солодовников И.В., Солодовников В.И.// / Информационные технологии в проектировании и производстве. 2006. № 2. С. 62-66.
3. Рассел С., Норвиг П. Искусственный интеллект: современный подход [Текст]/ Рассел С., Норвиг П. М.: Издательский дом «Вильямс», 2006.
4. Алгоритм AdaBoost/ [Электронный ресурс] Режим доступа: http://www.machinelearning.ru, свободный.
Размещено на Allbest.ru
Подобные документы
Рассмотрение понятия и истории возникновения систем поддержки принятия решения. Приспособленность информационных систем к задачам повседневной управленческой деятельности. Понятие термина "интеллектуальный анализ данных". Методика извлечения знаний.
реферат [79,8 K], добавлен 14.04.2015Понятие информационных систем и принципы их проектирования. Изучение различных методов извлечения знаний, построение оптимальной информационной системы Data Mining, позволяющей разбивать набор данных, представленных реляционными базами данных на кластеры.
аттестационная работа [4,7 M], добавлен 14.06.2010Разработка методов дихотомической оценки нечетких моделей знаний операторов информационной системы о государственных и муниципальных платежах. Механизмы и принципы управления базами нечетких моделей знаний операторов, методика и этапы их идентификации.
диссертация [2,0 M], добавлен 30.01.2014Методы решения проблем, возникающих на стадиях и этапах процесса принятия решений, их реализация в информационных системах поддержки принятия решений (СППР). Назначение СППР, история их эволюции и характеристика. Основные типы СППР, области их применения.
реферат [389,3 K], добавлен 22.11.2016Гибкая технологии извлечения знаний из нейронных сетей, настраиваемой с учетом предпочтений пользователя. Тестирование, пробная эксплуатация и разработка новой версии программных средств, реализующих данную технологию. Индивидуальные пространства смыслов.
дипломная работа [336,3 K], добавлен 07.06.2008Data Mining как процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). Его закономерности и этапы реализации, история разработки данной технологии, оценка преимуществ и недостатков, возможности.
эссе [36,8 K], добавлен 17.12.2014Основные модели представления знаний. Системы поддержки принятия решений. Диаграмма UseCase. Разработка базы данных на основе трех моделей: продукционные правила, семантическая сеть, фреймовая модель. Программная реализация системы принятия решений.
курсовая работа [715,1 K], добавлен 14.05.2014Преимущества и недостатки моделей представления знаний. Модель, основанная на правилах, фреймовая модель. Семантическая сеть. Структура экспертных систем и этапы их разработки. Механизмы логического вывода. Стратегия "вверх-снизу", "от цели к ситуации").
презентация [195,3 K], добавлен 29.10.2013Классификация систем поддержки принятия решений. Сравнительный анализ методик для оценки рисков розничного кредитования. Структура системы поддержки принятия решений, формирование начальной базы знаний. Проектирование базы данных информационной системы.
дипломная работа [1,9 M], добавлен 10.07.2017Понятия, классификация и структура экспертных систем. Базы знаний и модели представления знаний. Механизмы логического вывода. Инструментальные средства проектирования и разработки экспертных систем. Предметная область ЭС "Выбор мобильного телефона".
курсовая работа [2,2 M], добавлен 05.11.2014