Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности

Методика интеллектуального анализа и преобразования эксплицированных данных при построении модели знаний обучающей системы. Формирование свойств инструментальных сталей для швейных игл, подбор рецептур крашения, оценка качества синтетических нитей.

Рубрика Экономико-математическое моделирование
Вид автореферат
Язык русский
Дата добавления 08.02.2018
Размер файла 1,7 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http: //www. allbest. ru/

АВТОРЕФЕРАТ

на соискание ученой степени

доктора технических наук

05.13.01 - Системный анализ, управление и обработка информации (промышленность)

Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности

Пименов Виктор Игоревич

Санкт-Петербург 2009

Работа выполнена в государственном образовательном учреждении высшего профессионального образования “Санкт-Петербургский государственный университет технологии и дизайна” (СПГУТД)

Научный консультант: доктор технических наук, профессор Ипатов Олег Сергеевич

Официальные оппоненты: доктор технических наук, профессор Федоров Василий Николаевич

доктор физ.-мат. наук, профессор Братчиков Игорь Леонидович

доктор физ.-мат. наук, профессор Шапорев Сергей Дмитриевич

Ведущая организация: Санкт-Петербургский институт информатики и автоматизации РАН

Защита диссертации состоится “___” ноября 2009 года в ____ часов на заседании совета по защите докторских и кандидатских диссертаций Д 212.230.03 при государственном образовательном учреждении высшего профессионального образования “Санкт-Петербургский государственный технологический институт (технический университет)” по адресу: 190013, Санкт-Петербург, Московский пр., д. 26, ауд. _____.

С диссертацией можно ознакомиться в библиотеке института.

Отзывы на автореферат в одном экземпляре, заверенные печатью, просим направлять по адресу: 190013, Санкт-Петербург, Московский пр., д. 26, СПбГТИ(ТУ), Ученый Совет.

Автореферат разослан “___” _________ 2009 года.

Ученый секретарь диссертационного совета, доктор технических наук В.И. Халимон

1. Общая характеристика работы

Актуальность проблемы целенаправленного создания обучающей системы, адекватно соответствующей спектру потребностей пользователя, обоснована современным уровнем информатизации общества, объективной потребностью развития дистанционных форм и распространением электронных средств обучения, созданием учебных ресурсов, образовательных Интернет-порталов и внедрением инновационных педагогических технологий.

Не затрагивая этапы, которые прошли в своем развитии обучающие ситемы, их классификацию и набор целевых показателей, рассмотрим вопросы, которые требуется решать на стадии концептуального проектирования для повышения качества создаваемой системы.

Определяющее значение имеет разработка информационной модели, обеспечивающей логическое упорядочивание информации, ее систематизацию и структурирование. Эти задачи обладают творческим характером и являются трудноформализуемыми. Недостаточное развитие научно обоснованных принципов информационно-образовательного обеспечения учебного процесса, подходы к построению моделей, инвариантных к предметной области, жесткое структурирование материала дисциплины, используемое во многих разработках, неоправданное дублирование учебных элементов и сведение методов создания обучающих систем к воспроизведению бумажных оригиналов не позволяют решать данный вопрос в полном объеме.

Задача расширения функциональных возможностей обучающей системы, обеспечивающих достижение целей обучения оптимальным образом, решается в настоящее время за счет ее интеллектуализации, на основе моделей предметной области, обучаемого и процесса обучения.

Очертим класс разрабатываемых обучающих систем областью технологии и дизайна. Технологические процессы, в которых осуществляется преобразование одних объектов в другие с целью создания материального или информационного продукта, - один из самых сложных для формализации разделов человеческих знаний. В условиях расширения ассортимента исходного сырья, создания новых материалов и объектов дизайна непростая и актуальная задача выявления и представления знаний о технологиях должна быть решена с помощью алгоритмов автоматического построения обобщающих правил.

Помимо перечисленных задач при создании обучающей системы решаются следующие вопросы: выбор инструментария и среды для хранения и наполнения данных и знаний, проектирование онтологии предметной области, разработка схемы пользовательского интерфейса и модели навигации по структурным единицам, сопряжение гипертекстовых и интеллектуальных составляющих в единую систему. Для интеллектуального наполнения обучающих систем существует не так много доступных оболочек с развитым программным интерфейсом, а представление знаний на специализированном языке доступно в основном профессиональным инженерам по знаниям.

Таким образом, представляет существенный интерес разработка такой методики использования обобщающих правил, которая позволяет повысить эффективность разработки логических схем обучающих систем и обеспечивает интеграцию знаний для различных моделей обучения - от обычных линейных и гипертекстовых структур до интеллектуальных разветвленных сценариев.

В большинстве работ рассматриваются научно-методические основы создания систем учебного назначения. Однако методика интеллектуального анализа и преобразования эксплицированных данных при построении модели знаний обучающей системы изложена пока недостаточно.

В отраслях текстильной и легкой промышленности весьма много трудноформализуемых задач (формирование свойств инструментальных сталей для машинных швейных игл, подбор рецептур крашения, оценка качества синтетических нитей и др.), отличающихся многомерностью, функционированием в нескольких устойчивых режимах, большим числом неявных нелинейных внутренних взаимосвязей между переменными. Слабоформализованные отношения - представление конструкторских приемов при создании объекта дизайна, гармонизация художником-дизайнером композиционных и цветовых решений характерны для задач, связанных с формированием проектно-художественной концепции изделия.

Формализующий базой для широкой совокупности промышленных технологий может служить теория распознавания образов. Описание технологического процесса массивом “объект-атрибуты-значения” позволяет представить задачу построения модели знаний как обучение распознаванию образов, когда из баз данных извлекается система решающих правил, описывающих порядок изготовления продукции заданных классов. В настоящее время известно несколько сотен алгоритмов распознавания. Тем не менее, остаются теоретические и прикладные вопросы, связанные с задачей обучения распознаванию образов (ОРО), которые еще полностью не решены: алгоритм ОРО, формирующий на основе обучающих выборок решающие правила, обычно задается заранее из эвристических соображений и целиком зависит от опыта и интуиции разработчика либо выбирается из узкого класса “согласованных” с исходными данными алгоритмов. Недостаточность обучающих выборок при создании ряда трудноформализуемых технологических систем в условиях часто меняющегося ассортимента предъявляет особые требования к их прогностическим свойствам, что заставляет подходить более строго к решению задачи выбора типа решающих правил при построении модели знаний. интеллектуальный швейный нить игла

Таким образом, системный анализ задач проектирования для класса обучающих систем технологической направленности - формализованное описание конкретного технологического процесса и построение информационной модели обучающей системы - показал их взаимозависимость. Оба круга задач в совокупности образуют одну крупную научную проблему. Следовательно, разработка методологических основ построения модели знаний интеллектуальных обучающих систем в области технологии и дизайна, включающей разнотипные знания, является актуальной крупной научной проблемой.

Объектом исследования является процесс синтеза модели знаний компьютерных обучающих систем в области технологии и дизайна.

Цель диссертационной работы - решение научной проблемы разработки методологических основ создания обучающих систем, основанных на знаниях технологического профиля, описывающих слабоформализованные отношения и различные модели обучения, за счет автоматического построения решающих правил, что позволит повысить эффективность разработки логических схем систем рассматриваемого класса.

Для достижения поставленной цели в работе решены следующие задачи:

проведен анализ современного состояния проблемы структурирования учебных элементов и построения интеллектуальных обучающих систем, выявлены их основные компоненты и тенденции развития;

разработана методология формализации знаний о технологических процессах, базирующаяся на автоматическом построении решающих правил методами обучения распознаванию образов;

в рамках методологии разработан подход к синтезу модели знаний на основе комплексного применения дискриминантных алгоритмов;

исследованы экстраполирующие свойства решающих правил, отличающихся легкой семантической интерпретацией при представлении технологических знаний в виде набора продукций, предложены и реализованы новые методы обучения и распознавания для различных видов априорной неопределенности;

исследованы способы повышения точности описания классов объектов, разработаны новые методы и алгоритмы оптимизации систем описания, позволяющие повысить степень сжатия информации при построении правил вывода на знаниях;

разработана методика структуризации обучающих систем технологической направленности на основе применения результатов интеллектуального анализа данных;

выполнена проверка эффективности предложенных методов и алгоритмов при разработке ряда обучающих систем в области технологии и дизайна.

Основные методы исследований. Методической и теоретической основой диссертационного исследования явились научные труды по теории распознавания образов, имитационному моделированию, структурному анализу. Широко использовались современные методы искусственного интеллекта, теории вероятностей и математической статистики, теории нечеткой логики, математического программирования, последовательного анализа. Компьютерная реализация разработанных алгоритмов производилась на основе объектно-ориентированного подхода с применением средств мультимедиа, компьютерной графики, и трудов по текстильным технологиям. Исследования предложенных методов комплексного применения множества дискриминантных алгоритмов для построения поля знаний технологического процесса проводились с использованием пакета прикладных программ, разработанного автором. Достоверность полученных результатов обеспечивалась корректностью исходных предпосылок, математической строгостью доказанных утверждений и преобразований при получении аналитических зависимостей, а также результатами практической реализации.

Научная новизна работы заключается в том, что в ней предложена, развита и реализована концепция построения модели знаний обучающих систем технологической направленности, основанная на использовании ранее не применявшихся к данной предметной области методов обучения распознаванию образов, в частности, разработаны:

- новая методология рационального выбора и построения системы решающих правил, учитывающая виды априорной неопределенности, объем выборки, сложность систем описания объектов, емкость формируемого правила и количество классов;

- модель знаний обучающей системы, эксплицированных специалистами и извлеченных из массива данных, в виде набора решающих правил, основанная на предложенной классификации методов обучения распознаванию образов;

- совокупность теоретических оценок прогностических свойств решающих правил различной емкости, служащих для повышения эффективности базы знаний интеллектуальных обучающих систем;

- новый комплексный подход к применению дискриминантных алгоритмов для синтеза модели знаний при ограниченном объеме исходных данных, позволяющий добиться более глубокого минимума гарантированной оценки риска по сравнению с известными методами обучения;

- методика применения результатов интеллектуального анализа данных для описания трудноформализуемых технологических процессов, автоматизации построения модели знаний интеллектуальных обучающих систем и создания информационной модели обучающих систем, которая позволяет структурировать базовые понятия, декларативные фрагменты, процедурные блоки, выявлять дублирующие данные, повторяющиеся для различных технологических процессов, а также устанавливать связи-гиперссылки;

- разработанные в рамках предложенной методологии новые методы обучения и распознавания, позволяющие легко реализовать семантическую интерпретацию решающих правил, предназначенные для различных видов априорной неопределенности, - в форме бинарной решающей матрицы, многоградационной матрицы степеней принадлежности и на основе упрощенного последовательного критерия отношения вероятностей;

- разработанные в рамках комплексного подхода новые критерии и методы обработки информации, предназначенные для сжатия описаний классов объектов и позволяющие увеличить экстраполирующую силу известных решающих правил, а именно: методы уточнения многогранных логических классификаторов, аддитивный метод выбора рабочего словаря признаков, метод кодирования по методу минимального числа порогов, интервальный критерий информативности;

- модель многофункциональной обучающей системы, основанная на системе решающих правил, управляющих процессом обучения, в которую заложены разные уровни усвоения учебного материала.

На защиту выносится совокупность научных результатов в области создания моделей знаний о технологических процессах.

1. Принципы рационального выбора и построения решающих правил при формировании модели знаний о технологических процессах.

2. Сравнительный анализ экстраполирующих свойств решающих правил различной сложности и методология комплексного применения дискриминантных алгоритмов в условиях ограниченных ОВ.

3. Алгоритмы обучения, формирующие логическую и нечеткую решающие матрицы; упрощенный последовательный алгоритм выделения класса с новыми потребительскими свойствами.

4. Алгоритмы кодирования, выбора информативных признаков и уточнения описаний классов при построении правил вывода на знаниях.

5. Методика структуризации и синтеза продуктивной составляющей гипертекстовых и интеллектуальных обучающих систем.

6. Результаты практического применения методов и алгоритмов обработки информации в ряде гипертекстовых и интеллектуальных обучающих систем в области технологии и дизайна.

Практическая значимость. Разработанная в диссертационной работе методология синтеза на основе комплексного применения дискриминантных алгоритмов может повысить качество модели знаний интеллектуальных систем при ограниченном обучающем материале за счет повышения экстраполирующей силы решающих правил при принятии решения по новым данным.

Методика структуризации гипертекстовых обучающих систем технологической направленности позволяет формировать гибкую, индивидуальную цепочку учебных элементов, выявляя дублирующие информационные блоки, повторяющихся для различных технологических процессов, устанавливать логические связи-гиперссылки и формировать систему правил, которые могут использоваться в обучающих системах на различных уровнях освоения учебного материала, например, в режимах тестирования или тренажера.

Формализация технологических процессов с помощью автоматического построения решающих правил позволяет решать практическую задачу эффективной семантической коммуникации между непрограммирующими авторами-педагогами и разработчиками информационной системы, являющимися специалистами в разных предметных областях, при работе над общим проектом - сценарием и наполнением обучающей системы по специальной дисциплине.

Предложенный в работе спектр методов и алгоритмов позволяет осуществлять интеллектуализацию обучающих систем по технологии и дизайну при реализации различных моделей процесса обучения. Разработанная система дизайн-программирования ассортимента производственной одежды, в которую заложены знания профессионального дизайнера, позволяет пользователю самостоятельно осуществлять проектирование одежды в соответствии с его потребностями.

Разработанная методология применения методов и алгоритмов интеллектуального анализа данных на основе выделения классов и этапности выполнения процедур может использоваться при создании обучающих систем в различных предметных областях, например, посвященных изучению технических систем, в которых последовательность действий реализуется для изменения состояния системы.

Основные результаты, полученные в работе, доведены до уровня расчетных формул, вычислительных алгоритмов или методик, что облегчает их применение при создании обучающих систем.

Реализация результатов работы. Результаты диссертационной работы реализованы, внедрены и используются в виде методологии построения модели знаний обучающих систем, методов и алгоритмов интеллектуального анализа больших массивов даных, мультимедийных программ в Санкт-Петербургском государственном университете технологии и дизайна, Балтийском государственном техническом университете “ВОЕНМЕХ”, Санкт-Петербургской Государственной Лесотехнической академии им. С.М. Кирова, что подтверждено соответствующими актами.

Разработанные обучающие системы широко используются в учебном процессе СПГУТД в курсах “Методы и средства исследований”, “Компьютерное проектирование одежды”, “Механико-технологические процессы текстильной промышленности”, “Информационное обеспечение дизайн-проектирования”, “Информационные системы в дизайне изделий легкой промышленности”, “Математическое моделирование”, “Интеллектуальные информационные системы” для студентов различных специальностей.

Связь исследований с научными программами. Работа поддерживалась следующими грантами: “Разработка аудиовизуальных компьютерных систем обучения иностранным языкам на основе новых информационных технологий” по программе "Перспективные информационные технологии" (1995-1996 г.г.); “Речевой адаптер для ЭВМ: верификация оператора и оценка его эмоционального состояния” (1995-1997 г.г.); персональным грантом “Разработка аудиовизуальной компьютерной системы обучения специалистов в области текстильной и легкой промышленности” по межвузовской комплексной программе "Наукоемкие технологии образования" (МКП НТО, 1998-1999 г.г.); “Разработка экспертных систем для оценки конкурентов” по программе Европейского Союза Tacis ERDUS 9706 “Развитие образовательных связей и инициатив в области высшего и профессионального образования”, проект Delphi - IV “Развитие ресурсов открытого и дистанционного образования” (1999-2001г.г.); грантом “Лентек № 1.5.01. Разработка теоретических основ построения интеллектуализированных компьютерных энциклопедий технологий текстильных материалов” (2001-2003 г.г.), грантом “Разработка информационно-методического и конструкторско-технологического обеспечения дизайн-программирования и изготовления ассортимента производственной одежды для служб городского хозяйства Санкт-Петербурга” по конкурсу инновационных проектов “Знания-инновации” к 300-летию Санкт-Петербурга (2003-2005 г.г.,); разработкой “Виртуальное представительство Санкт-Петербургского университета технологии и дизайна” в рамках комплексного мультимедиа и Internet проекта “Высшая школа Санкт-Петербурга в киберпространстве”, при построении комплекса инновационных разработок для образовательных учреждений высшего профессионального образования “Образовательные виртуальные миры Петербурга”, за создание которого ректору СПГУТД Романову В.Е. присуждена премия президента РФ в области образования за 2003 год (Указ № 79 от 25 января 2005 года).

Апробация работы. Основные результаты работы докладывались, одобрены и опубликованы в материалах 16 международных, 9 всероссийских и всесоюзных научных конференциях, отраженных в списке публикаций.

Личный вклад автора. Постановка основных задач и направлений исследования, отраженных в монографии [1], выполнена совместно с научным консультантом Ипатовым О.С. Выбор методов исследования, анализ и обобщение полученных результатов, теоретические положения и выводы диссертации осуществлены и получены автором единолично (без соавторов). Разработка обучающих систем выполнялась под его руководством или при его участии.

Публикации. По теме диссертации опубликовано 55 работ, в том числе 9 статей в рецензируемых центральных журналах, входящих в перечень ВАК, 1 монография, 4 учебных пособия с грифом УМО, 6 свидетельств о регистрации программ.

Структура и объем работы. Диссертация состоит из введения, пяти разделов, заключения, списка использованных источников из 241 наименований. Общий объем работы - 319 страниц, в том числе основной текст - 278 страниц, 9 таблиц, 64 рисунка.

2. Содержание работы

Во введении изложены основные положения диссертационной работы, обоснована актуальность темы, определена цель исследований и решаемые задачи, дана характеристика научной новизны и практической значимости работы. Представлены данные об апробации работы и публикациях.

В первой главе проведен анализ современного состояния проблемы создания обучающих систем и синтеза образовательных ресурсов. Выявлены тенденции перехода к новым моделям организации учебного материала и технических средств обучения.

Рассмотрены этапы развития и технологии реализации компьютерных обучающих систем, методы выделения учебных элементов, принципы сборки конечных модулей и курсов. Совершенствованию методов создания систем учебного назначения в значительной степени способствовали труды российских ученых: А. И. Башмакова (МГЭИ (ТУ)), В. П. Беспалько (МГОУ), И. Л. Братчикова (СПбГУ), А. Ю. Деревниной (ТюмГУ), Дозорцева В.М. (РГУ нефти и газа им. И. М. Губкина), З. О. Джалиашвили (СПбГИТМО (ТУ)), В. И. Солдаткина (РГИОО), А. В. Соловова (Самарский ГАУ), Д. В. Сошникова (МАИ (ГТУ)), В. П. Тихомирова (МЭСИ), Т. Б. Чистяковой (СПбГТИ (ТУ)), работы, выполняемые в рамках ряда федеральных программ: “Электронная Россия на 2002-2010 годы”, “Развитие единой образовательной информационной среды на 2001-2005 годы”, “Создание системы открытого образования”, при разработке федерального портала “Российское образование” www.edu.ru, Федерального центра информационно-образовательных ресурсов eor.edu.ru, информационной системы “Единое окно доступа к образовательным ресурсам” window.edu.ru, распределенного Российского портала открытого образования www.openet.ru и др. Из зарубежных работ в этой области исследований отмечены работы Б. Скиннера, Н. Краудера, У. К. Ричмонда, А. Пателя, Кинчука, К. Лемона, В. Люка.

Расширение функциональных возможностей средств электронного обучения, интеллектуализация обучающей системы возможны после построения ряда информационных моделей, основными из которых являются модели обучаемого, процесса обучения и предметной области (рис. 1). Одной из основных характеристик обучаемого является показатель уровня усвоения учебного материала , который может меняться от осмысленного понимание новой информации до уровня творческой деятельности и создания новых знаний. На основе оценки уровня усвоения студентами учебных элементов выполняется коррекция учебного материала в процессе обучения. Модели процесса обучения и предметной области определяют набор логических связей и декомпозицию учебного материала. Его структуризация обычно выполняется на основе дидактических рекомендаций, зависит от педагогического мастерства и слабо поддерживается рабочими методиками. Повышение эффективности гипертекстовой обучающей системы в области технологии и дизайна, способной формировать гибкую, индивидуальную цепочку учебных элементов, опирается на объектное хранение учебных модулей и устранение дублирующих мультимедийных и текстовых данных, описывающих, например, повторяющиеся для различных технологических процессов операции.

Компонентами, которые необходимо формализовать при построении модели предметной области, описывающей технологические процессы и конструкторские решения, являются вербальная модель (снабженная иллюстрациями, формулами, таблицами и т. п.), а также большое количество экспериментальных данных. Целый ряд конструкторско-технологических задач в текстильной и легкой промышленности являются слабоформализованными. Для принятия конкретных решений в сфере дизайна, конструирования одежды и обуви необходим значительный предшествующий опыт специалиста, снижающий неопределенность проектной задачи. В таких условиях обучающая система должна быть основана на знаниях.

Развитию методологических основ системного подхода к исследованиям в области текстильной и легкой промышленности способствовали труды российских и зарубежных ученых: В. Е. Романова, К. Е. Перепелкина, А. Г. Севостьянова, А. М. Сталевич, Н. Н. Труевцева, Б. Н. Гусева, Е. Я. Сурженко, Е. Б. Кобляковой, А. С. Далидович и др. Знания о ТП позволяют воссоздать в пространстве и времени последовательность технологических переходов, указав все причинно-следственные связи (отношения), возможные альтернативные последовательности, диапазоны значений технологических параметров, обеспечивающие получение готового продукта требуемого качества. Выделены особенности задач, возникающих при концептуализации текстильных объектов и объектов легкой промышленности. Показано, что с точки зрения описания понятий и их свойств вопросы описания и формализации исходных ингредиентов и готового продукта могут решаться одинаково.

Современный рыночный принцип создания новых текстильных, швейных и других изделий базируется на следующей “цепочке заказа”: изделие определенного функционального назначения > текстильный материал заданной структуры > волокна заданного состава. Многоуровневое представление технологических процессов и оборудования, структуры и свойств продуктов и полупродуктов текстильных производств осуществляется по принципу “от волокна до изделия”. Отмечено, что этапность выполнения технологических операций, выделение классов готовой продукции, разработка для каждой конкретной области применения текстильных материалов их специальных видов с оптимизированными свойствами свидетельствуют в пользу построения дискретных моделей знаний о технологических процессах.

Рассматривается проблема выявления знаний при разработке интеллектуальных обучающих систем. Выделение категорий технологических объектов выполняется специалистом в предметной области по сочетаниям свойств всех или отобранных выходных признаков, например, потребительских свойств изделия либо методами автоматической классификации. Число атрибутов, идентифицирующих технологические и текстильные объекты в базе знаний (БЗ) технологических процессов, исчисляется сотнями. В подобных условиях представление поля знаний вручную чрезвычайно затруднено: консеквенты большинства правил указывают на абстрактные категории, а увеличенное число условий в антецеденте трудно сформировать умозрительно. Для представления знаний, эксплицированных специалистами, и извлечения знаний из массива данных, образованных триадами “объект-атрибуты-значение”, предложено использовать методологию обучения распознаванию образов для автоматического построения обобщающих правил, описывающих принадлежность ситуаций к классам. В случаях, когда объем обучающих данных ограничен, в особенности при наличии большого числа классов, определена необходимость рассмотрения прогностических свойств построенной системы решающих правил.

Решающие правила, построенные в процессе обучения распознаванию образов, используются для представления динамических знаний о ТП в виде набора продукций. Причинно-следственные связи между классами объектов и их признаками, отражающие закономерности в обучающих последовательностях, чаще всего устанавливаются с помощью логических РП. Эти правила при малой мере сложности являются универсальными для эффективного решения прикладных задач. Они легко поддаются семантической интерпретации и позволять автоматически формировать сообщения типа “на заданном оборудовании, в заданной последовательности, с заданными режимами подвергнуть исходные элементы определенному воздействию”.

Дополнительные требования к представлению знаний, которые нельзя формализовать символьным представлением - использование обычной и анимированной графики, видео, 3D-моделей, демонстрирующих особенно важные технологические операции и труднодоступные для фотосъемки узлы.

На основании проведенного анализа современного состояния проблемы создания обучающих систем делается вывод о том, что знания, эксплицированные специалистом и извлеченные методами ОРО в результате научных исследований, при эксплуатации технологического оборудования, могут переноситься в сферу учебного процесса в виде многофункциональной обучающей системы, охватывающей различные уровни усвоения учебного материала и предоставляющей возможность гибкого использования учебных элементов в процессе обучения, благодаря достоинствам моделей данных, основанных на гипертексте, объектном подходе и методе экспертных систем. В завершении главы выявлены основные направления научного исследования, выбраны соответствующие методы и поставлены задачи диссертационной работы.

Вторая глава посвящена развитию теоретических основ формализации знаний о технологических процессах на основе дискриминантных методов распознавания образов.

Формально технологический оператор можно описать математической моделью

Y(t) = W(t, U) X(t),

где X(t) - свойства сырья или материалов, участвующих в преобразовании в выходной продукт; t - время; U - конструкционные и режимные параметры оборудования, а также параметры входных и выходных технологических потоков; W(t, U) - оператор преобразования, отображающий пространства X и U в пространство значений выходных переменных Y; Y(t) - потребительские свойства готового продукта. Часто перечисление заданных свойств Y является вербально формулируемой целью ТП.

На практике любой ТП представляет последовательность ряда частных технологических подпроцессов (этапов).

Пример - последовательное изготовление пряжи, нитей, тканей, одежды. Такая технологическая цепочка может реализовываться последовательно или параллельно. Параметрами, характеризующими все этапы технологической цепочки, являются:

X = XС XМ XД - характеристики исходных компонентов, где

XС = XС1 XС2… - характеристики используемого сырья,

XМ = XМ1 XМ2… - характеристики материалов,

XД = XД1 XД2… - параметры деталей;

U = { UC1, UС2, … , UМ1, …, UДК }

- параметры оборудования и технологических потоков на этапах обработки сырья, материалов, деталей;

Y = YП YЭ -

потребительские свойства продукции, где

YП = YП1 YП2… -

показатели качества произведенной продукции, YЭ - показатели работоспособности изделия после его эксплуатации.

Сложные многоконтурные технологические системы могут быть представлены эквивалентной разомкнутой схемой путем выделения отдельных подсистем.

Возможные наименования продукции, сортность, уровни потребительских и эксплуатационных показателей качества при одной и той же структуре технологической цепочки представляет собой множество классов , содержащее M элементов. Классификация выполняется специалистом-экспертом или автоматически по сочетанию потребительских свойств продукции Y. В трудноформализуемых ситуациях - с использованием весовых коэффициентов и функций принадлежности нечетких переменных размытым множествам-классам.

Составление алгоритма управления, описывающего, при необходимости, применение оборудования в режимах пуска, останова и нормальной эксплуатации, выполняется отдельно для каждого класса продукции.

Выделен ряд базовых задач, в которых конкретная технология определяется по сочетанию диапазонов изменения параметров X, U и Y. Большинство из них могут решаться на основе построения схем формализации ТП в рамках выявления логических и статистических закономерностей по эмпирическим данным, а при нехватке последних - с привлечением знаний экспертов и аппарата нечеткой логики. Исходные данные представляются матрицей

,

содержащей векторы значений входных X и выходных Y показателей звеньев технологической цепочки, условий U протекания ТП для n прецедентов i , i = , с известными решениями (заключениями эксперта).

Модель ТП в форме “объект-атрибуты-значения” при наличии реальных связей содержит их в неявной форме. Весь набор входных параметров для дальнейших исследований можно объединить в единое глобальное пространство

XA = X U -

априорный словарь признаков с описаниями свойств ТП:

.

Каждый объект описывается вектором (x1 , …, xNА ) в NА -мерном пространстве признаков априорного словаря

XА = {Xj j = }.

Для описания классов объектов используется обучающая выборка 1, …, i , …, n , где i - объект-прецедент, известный принадлежностью одному из распознаваемых (описываемых) классов,

i = , n - длина (объем) ОВ.

Для формирования поля знаний в виде системы продукционных правил требуется построить соответствующие решающие правила (дискриминантный алгоритм распознавания). Это можно сделать, решив четыре взаимосвязанные задачи:

1) пороговое кодирование признаков;

2) выбор оптимального рабочего словаря признаков

XР = {Xj j = }, XР XА (структурная идентификация РП);

3) выбор класса решающих правил: логического, линейно-логического, линейного, кусочно-линейного, квадратичного или более сложного и соответствующего типа алгоритма распознавания;

4) определение параметров выбранного алгоритма (параметрическая идентификация РП).

Выбрать тот или иной метод конструирования набора решающих правил на начальном этапе формирования поля знаний позволяет анализ причин и видов априорной неопределенности. В случае недостаточности глобального множества признаков, характеризующих ТП, при отсутствии возможности его пополнения для повышения точности РП целесообразно использовать дополнительные источники информации: последовательное (неоднократное) измерение признака(ов) в процессе наблюдения за изготовлением готового продукта или учет опыта эксперта при построении решающего правила. Последовательный алгоритм выделения класса с новыми потребительскими свойствами применяется при статистической неопределенности задачи ОРО, по запросу на дополнительные измерения, до достижения заданной точности распознавания. В ситуации нестатистической неопределенности используется нечеткое РП, позволяющее учесть субъективную информацию эксперта.

Ситуация описанная В. А Дюком, когда объекты различных классов перемешаны в признаковом пространстве, приводит к тому, что дискриминантные правила отказываются от распознавания или в лучшем случае “цепляют” только кусочки настоящих логических закономерностей в данных. Чтобы избежать нарушения гипотезы компактности, следует перед обучением соответствующие “трудные” классы разбить на подклассы или, если выполняется поиск неочевидных, скрытых регулярностей, предварительно выделить подгруппы объектов ОВ методами таксономического анализа.

Среди подходов к формированию систем РП выделяются два направления. Первое связано с оптимизацией критерия качества сформированного РП при заданной системе описания объектов. Решение последней задачи (обучение в узком смысле) обычно представляется с помощью алгоритма ОРО, причем существенное значение для эффективности сформированного РП имеет объем n ОВ. В этой группе подходов различные методы отличаются друг от друга сложностью аппроксимирующих решающих функций, формируемых алгоритмом ОРО, видом показателя качества и способом оптимизации этого показателя. Обычно минимизируется риск в известном классе РП. Второе направление сводится к формированию систем описания объектов, в пространстве которых оптимизируется критерий качества РП заданного класса либо разделение классов становится чрезвычайно простым.

Существующие подходы обеспечивают выбор системы описания объектов и построение алгоритма распознавания лишь в узком классе РП. Влияние решения каждой из взаимосвязанных задач на эффективность создаваемой базы знаний приводит к необходимости совместного решения задач обучения при ограниченных ОВ. Предлагается использовать комплексное применение множества дискриминантных алгоритмов. В рамках данного подхода РП классифицируются по типу разделяющих поверхностей. Обучение осуществляется в широком смысле (вводится дополнительный этап - выбор класса РП), что позволяет добиться более глубокого минимума эмпирического риска по сравнению с известными методами обучения.

Методология совместного выбора класса РП, соответствующего алгоритма обучения и системы описания объектов предназначена для формирования динамической модели знаний в условиях ограниченной ОВ. Процесс обучения распознающей БЗ представляется как двухпараметрическая дискретная экстремальная задача, решение которой дает возможность учесть структуру взаимосвязи основных этапов обучения.

Поиск РП при достаточном словаре XА и ограниченной ОВ осуществляется после определения экстраполирующих свойств решающих правил различной сложности. С этой целью множество классов РП {K} = K упорядочивается по критерию минимума гарантированной оценки риска (вероятности ошибки распознавания) Pош, определяемой с заданной мерой надежности 1-. Оценки Pош для различных классов РП вычисляются через меры сложности на основе неравенств Вапника-Червоненкиса, как

Pош = min(K, Xр ) + (n, , M, h),

где min - величина минимума эмпирического риска в классе K, - гарантированное уклонение среднего риска от эмпирического,

h = h(K, Xр) -

емкость класса РП K, равная в общем случае числу настраиваемых при обучении параметров. Тогда искомый класс РП K* определяется как

K* = arg[Pош(n , , M , K , Xр )].

Для определения величины минимума эмпирического риска в классе K min(K, Xр ), входящей в выражение для Pош , используется один из таких алгоритмов обучения при заданном рабочем словаре Xр , которые строят РП в данном классе K. При этом предполагается, что в классе K различные алгоритмы обучения дают на одной и той же ОВ близкие значения минимума эмпирического риска min . Допустимость этого предположения обусловлена тем обстоятельством, что при ограниченной ОВ и рабочем словаре, информативность которого I(Xр) 1, выполняется соотношение min << , причем диапазон изменений минимума эмпирического риска для различных алгоритмов обучения распознающей БЗ в каждом фиксированном классе РП min(K, Xр) значительно меньше изменения величины min при переходе от одного класса к другому.

Выбор Xр в классе K осуществляется путем сокращения размерности признакового пространства, при котором min сохраняется на нулевом уровне. При этом, если ОВ ограничена,

Pош(K) Pош(K , Xр ).

Формирование системы описания для логических РП осуществляется за счет сокращения объема пространства признаков V при min 0, где

V = tj , j = ,

tj - число градаций j-го признака. Кодирование признаков для логических РП и поиск рабочего словаря осуществляются без непосредственного определения величин минимума эмпирического риска min и гарантированной вероятности ошибки распознавания Pош, а с использованием критерия информативности группы признаков - их разделяющей силы I. Способ определения информативности зависит от класса используемых РП. При равномерном распределении числа объектов ОВ по множеству минимум эмпирического риска оценивается соотношением min 1 - I, причем при min 0 всегда I 1.

Уменьшение избыточности кода и объема признакового пространства может осуществляться устранением “дублирующих” порогов для отдельных признаков при сохранении разделяющей силы их группы. В общем случае требуется разработка специальных методов кодирования.

Отбор входных и выходных отличительных признаков при обучении в глобальном пространстве описания технологического процесса упрощает семантическую интерпретацию системы построенных РП.

В диссертационной работе процесс обучения трактуется как совместный поиск такого класса РП, а также необходимого и достаточного пространства признаков, при которых объекты ОВ становятся легкоразделимыми на классы с помощью несложных поверхностей. Стремление к простоте, положенное в основу закона предсказания, позволяет успешно решать задачу ОРО. Определены экстраполирующие свойства простейших классов решающих правил, обладающих минимальной емкостью: логических, линейно-логических, линейных и кусочно-линейных.

Утверждение 1. Если в Nр-мерном пространстве многоградационных признаков логическое РП безошибочно разделяет обучающую последовательность длины n на M классов, то с вероятностью 1- можно утверждать, что вероятность ошибочного распознавания Pош с помощью этого РП будет меньше:

= , (1)

где V = -

объем пространства признаков, tj - количество интервалов кодирования признака

Xj , j = .

Утверждение 2. В случае 0 с вероятностью 1- можно утверждать, что вероятность ошибочного распознавания с помощью логического РП будет меньше + , где

= . (2)

Таким образом, минимизация объема V пространства признаков за счет оптимального кодирования и сокращения числа признаков позволяет повысить точность и надежность распознающей БЗ, основанной на логических правилах.

Если при сохранении разделяющей силы рабочего словаря устраняются “дублирующие” пороги, а логическое РП осуществляет покрытие каждого из классов одним гиперпараллелепипедом (Sm = 1) с гранями, параллельными осям координат-признаков, то V M и

при = 0,

где tmax =, и

при 0.

Также получены оценки качества для линейных и кусочно-линейных РП. Их описание сведено в табл. 1, где МЛК - многогранные логические классификаторы;

k = k - Nр, k

- число гиперплоскостей, составляющих РП.

Таблица 1 Экстраполирующие свойства простейших решающих правил

Эмпирический риск

Гарантированное уклонение среднего риска от эмпирического,

Логическое РП (Sm = 1)

Линейные РП

МЛК

= 0

MNр

M 2Nр

M 2(Nр + k )(Nр +1)

0

M

M

На основе анализа теоретических и экспериментальных результатов выработаны практические рекомендации по использованию основных алгоритмов ОРО в условиях ограниченных ОВ. В задачах обучения, априорный алфавит которых представлен значительным числом классов (M 5), с точки зрения обеспечения надежности распознающей БЗ наиболее целесообразно применение простейших РП типа прямоугольных логических классификаторов, решающих деревьев, при Nр 5 - линейных РП. При построении системы искусственного интеллекта, реализующей стратегию прямого вывода, более сложные РП (включая вероятностные методы, учитывающие распределение объектов по классам) предпочтительно использовать на начальных шагах, когда осуществляется разбиение на небольшое число промежуточных образов. На последних шагах, характеризующихся сильным ветвлением, возникает необходимость применения простейших логических РП, усложнение РП необходимо использовать лишь локально для разделения “трудных” классов или для уточнения описания класса в случае достаточного числа его прецедентов.

Найденные при формировании свойств материалов и при проектировании объектов легкой промышленности адекватные нелинейные модели регрессии или детерминированные зависимости для выходных переменных отдельных звеньев ТП, используются для уточнения описаний классов объектов за счет добавления к системе РП соответствующих нелинейных неравенств. Поскольку при обучении распознающей БЗ описания классов формируются в терминах выходных признаков, например показателей качества готовой продукции, то в первую очередь рассматриваются зависимости для конечных этапов технологического процесса.

Первоначально формируются описания классов с помощью построения кусочно-линейных РП. Знание статистической структуры описаний классов, особенно важное при M > 2, добавляется заменой соответствующих гиперпараллелепипедов и многогранников на гипертрубы, описываемые системой неравенств - доверительных границ для прогнозов значений зависимых признаков.

В пределе, при наличии строгих функциональных детерминированных зависимостей для всех звеньев технологической цепочки, описания классов сжимаются до минимальных размеров, гарантированное уклонение среднего риска от эмпирического стремится к нулю, а экстраполирующая сила системы РП - к единице.

При выявлении материалов с новыми свойствами, заданными через интервалы значений соответствующих выходных переменных, с помощью адекватных статистических моделей определяется область в пространстве признаков рабочего словаря, которая проверяется на технологическую реализуемость.

Исследованы вопросы повышения точности описания классов при формировании распознающей БЗ в условиях мультиколлинеарности системы признаков. На этапе выбора рабочего словаря при комплексном применении множества дискриминантных алгоритмов влияние мультиколлинеарности устраняется за счет ликвидации дублирующих признаков. Сужение, уточнение многогранных Nр-мерных областей класса может осуществляться не только аналитически по уравнениям регрессии через заданные в каждом классе интервалы выходных признаков, но и последовательным расширением центроидов классов в процессе применения методов автоматической классификации (таксономии).

Третья глава посвящена решению задачи оптимизации систем описания правил вывода на знаниях.

Описания технологических объектов, выбираемых из БД, по виду шкалы принимаемых значений содержат признаки различного типа - количественные, порядковые и классификационные.

При оценке в рамках комплексного подхода качества логических решающих правил требуется минимизировать пространство признаков, снижая тем самым величину Pош .

Задача оптимизации объема пространства признаков может быть представлена как бинарная задача минимизации нелинейной целевой функции

= , (3.1)

где cj = tj, при условии сохранения достаточности рабочего словаря, имеющем вид линейных ограничений

, (3.2)

где aij = 01, xj = 01, i = , j = , m = M(M - 1)/2.

Если xj = 0, то j-й признак входит в состав рабочего словаря, в противном случае - нет. Единичное значение коэффициента aij матрицы ограничений указывает на способность j-го признака априорного словаря разделить i-ю пару классов.

Дискретизация признакового пространства сводится к определению числа градаций признаков, мест расположения порогов и должна осуществляться совместно с выбором рабочего словаря признаков. Перебор колоссального числа вариантов при значительном числе классов продукции (M > 10) и размерности априорного словаря признаков (NA > 50) делает затруднительным решение данной задачи на компьютере за приемлемое время. Поиск близких к оптимальным систем описания звеньев технологической цепочки производится путем последовательного кодирования отдельных признаков, выбора рабочего словаря, минимизирующего объем пространства признаков, и устранения “дублирующих порогов” (повторного кодирования) для признаков, разделяющих одинаковые пары классов.

При формировании РП, осуществляющих покрытие каждого класса объектов ОВ гиперпараллелепипедами с гранями, ортогональными координатным осям, предложен алгоритм кодирования независимых признаков, который обеспечивает разделение всех непересекающихся по данному признаку классов, используя минимальное число порогов. Если априорный словарь признаков достаточен для распознавания M типов продукции в классе логических РП, то кодирование по методу МЧП является оптимальным в смысле минимизации объема пространства признаков без учета зависимости их реальных разделяющих сил от подсистемы совместно используемых признаков.

Реальная разделяющая сила признака Xj

= ,

где mj - мощность множества Rj пар классов, полностью разделимых признаком Xj; mj,q - коэффициент ослабления разделяющей силы признака Xj;

mj,q = RjRq; Rq -

множество пар классов, полностью разделимых подсистемой Xq совместно используемых признаков,

Xq = Xр\Xj, m = M(M-1)/2.

зависимость Ij от совместно используемой подсистемы ухудшает экстраполирующие свойства распознающей БЗ.

С целью уменьшения гарантированной оценки риска в процессе логического вывода на новых данных исследованы возможности поиска оптимального объема пространства признаков после их кодирования методом МЧП.

Показано, что уменьшение суммарного числа градаций, то есть минимизация числа взвешенных признаков

= , (3.3)

с весовыми коэффициентами

=

при ограничениях (3.2) позволяет эффективно решать задачу оптимизации объема пространства признаков в общем случае зависимых разделяющих сил. Если число градаций имеет незначительный разброс, либо один из признаков имеет число градаций, близкое числу классов M, то поставленная задача эффективно решается путем сокращения количества признаков без учета числа их градаций (при cj = 1).

Поскольку “сильная” зависимость реальных разделяющих сил, когда каждый признак делит только одну-две пары классов по сравнению с подсистемой используемых совместно с ним признаков, встречается редко, то в практических приложениях повышение экстраполирующей силы РБЗ достигается за счет минимизации числа признаков рабочего словаря.

Для решения задачи минимизации числа взвешенных признаков с большим объемом входных данных (M 10, NA 50) предложено использовать -оптимизацию и точный алгоритм ветвей и границ. Метод ветвей и границ для решения бинарных линейных задач имеет ряд особенностей, позволяющих учитывать специфику задачи и требования к программной реализации алгоритмов. В вычислительном отношении чрезвычайно просты стратегия одностороннего обхода (используются логические операции) и операция сложения, определение целевой функции при нулевых значениях незафиксированных переменных и организация информации о дереве вариантов с помощью целочисленного вектора.

Разработан и реализован аддитивный алгоритм ветвей и границ для выбора рабочего словаря многоградационных признаков. Время решения задач размерностью до 20 переменных (признаков) и 45 ограничений (10 классов) на современных компьютерах не превосходит 1 мин и в среднем занимает около 15 с. Алгоритм работает лучше на матрицах высокой плотности, равной 0,6-0,9, то есть при наличии информативных признаков, число градаций которых стремится к M (при кодировании методом МЧП). В особо трудных случаях используется -оптимальное решение z(x) z*(x)[1+] ( 0,01) или последнее допустимое решение по достижении предельного времени.

Оставшееся подмножество признаков XA\ Xр используется только при формировании концептуальной составляющей поля знаний. После принятия решения о классе производимой продукции эти признаки позволяют дать полное заключение о характеристиках исходных ингредиентов и диапазонах параметров ТП.

Если приходится оценивать наличие свойства в рассматриваемом изделии, когда исследуемый объект в той или иной степени может принадлежать двум или нескольким нечетким классам и требуется сравнить степень принадлежности или вероятность истинности при сопоставлении различных вариантов решений, то используется подход на основе нечеткой логики с привлечением знаний и опыта экспертов. Оценки специалистов позволяют существенно сократить затрачиваемые время и средства на моделирование сложных объектов, а трудноформируемые связи для выходных показателей - представить интеллектуальной системой в виде словесных описаний, например, сообщить о зависимостях потребительских свойств наборов различных нитей от параметров формования в терминах надмолекулярных структур волокнообразующих полимеров.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.