Адаптивный поиск границ классов в задачах порядковой классификации

Шаги алгоритма классификации Кланш и Клара, их предназначение для решения задачи многокритериальной порядковой классификации. Построение баз экспертных знаний для интеллектуальных обучающих систем. Оптимальная расшифровка монотонных булевых функций.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 18.01.2018
Размер файла 56,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

АДАПТИВНЫЙ ПОИСК ГРАНИЦ КЛАССОВ В ЗАДАЧАХ ПОРЯДКОВОЙ КЛАССИФИКАЦИИ

Д.Ю. Кочин

Институт Системного Анализа РАН, Москва

Многие методы порядковой классификации для поиска границ классов используют принцип дихотомии. Статья представляет новый принцип адаптивной дихотомии, когда деление цепей при поиске происходит не пополам, а в отношении, позволяющем быстрее достичь результата. Оптимальное отношение рассчитывается в процессе классификации, адаптируясь к фактическому расположению границ классов. Статистическое моделирование подтверждает преимущество такого подхода.

Во многих практических случаях задача извлечения экспертных знаний может быть представлена как задача классификации, так как экспертное знание часто состоит в отнесении объектов (альтернатив, состояний) к классам решений. Так, например, инженер анализирует сбой в сложной технической системе и определяет возможный тип неисправности. Врач изучает состояние пациента и ставит диагноз, выбирая из нескольких возможных типов заболеваний. Элементы, составляющие некоторую совокупность, подлежащую классификации, могут иметь разнообразную природу. В частности, это могут быть различные физические объекты, варианты выбора, состояния некоторого объекта. Далее в контексте задачи классификации мы будем употреблять термины объект, альтернатива, состояние, случай, вектор как синонимы.

Способ отнесения рассматриваемого объекта к тому или иному классу решений очень часто не может быть явно описан экспертом, в силу невербализуемости стратегии поведения эксперта. Тем не менее, эти невербализуемые навыки эффективно и быстро применяются, когда эксперт решает классификационные задачи в своей предметной области.

Задача экспертной классификации в постановке [Ларичев и др., 1989], [Larichev et al., 1991] предполагает определение множества критериев (признаков), которыми описывается каждый объект. Для каждого критерия задаётся конечное множество допустимых оценок - шкала критерия. Если в некоторой задаче множество оценок по одному или более критериям бесконечно, то соответствующая шкала преобразуется к конечной посредством разбиения исходного бесконечного множества оценок на конечный набор интервалов. Декартово произведение шкал всех критериев представляет собой пространство всех гипотетически возможных объектов (состояний), описываемых в рамках данной задачи. Требуется на основе экспертных знаний построить классификацию в указанном пространстве состояний, т.е. сформировать правила отнесения каждого объекта к одному из заранее определенных классов.

1. Постановка задачи порядковой классификации

Приведем формальную постановку задачи многокритериальной порядковой экспертной классификации. Дано:

1. G - свойство, отвечающее целевому критерию задачи (наличие и степень тяжести заболевания, критичность неисправности в технической системе, ценность кредитного проекта и т.д.).

2. K = {K1, K2, …, KN} - множество критериев (признаков), по которым оценивается каждый объект исследования.

3. , q = 1, …, N - множество оценок по критерию Kq; q - число градаций на шкале критерия Kq; оценки упорядочены по убыванию характерности для свойства G. То есть, на каждом множестве Sq определено рефлексивное антисимметричное транзитивное отношение Qq (необязательно связное) такое, что .

4. Y = S1 S2 SN - декартово произведение шкал критериев, которое определяет пространство состояний объектов, подлежащих классификации. Каждый объект описывается набором оценок по критериям K1, …, KN и представляется в виде векторной оценки y Y, где y = (y1, y2,,yN), yq - одна из оценок из множества Sq.

5. - мощность множества Y.

6. Y* Y - множество объектов, которые требуется классифицировать. Назовём это множество допустимым, а составляющие его объекты допустимыми.

7. C = {C1, C2, …, CM} - множество классов решений, упорядоченных по убыванию выраженности свойства G. То есть, на множестве C определено рефлексивное антисимметричное транзитивное отношение QC такое, что . Все эти классы четко определены, каждый допустимый объект может быть отнесен экспертом к одному и только к одному классу. Случаи, когда эксперт затрудняется отнести объект к одному классу, считаются недопустимыми и исключаются из классификации.

Введем бинарное отношение строгого доминирования векторных оценок:

(1.1)

Удобно также ввести отношение нестрогого доминирования:

алгоритм интеллектуальный задача многокритериальный

Отношение доминирования для краткости можно записывать эквивалентными записями (x, y)P x P y x y, отношение нестрогого доминирования: (x, y)Q x Q y x y.

Требуется: На основе знаний эксперта построить разбиение множества допустимых альтернатив Y* на M классов решений Сi (CiCj= i?j, iCiY*) так, чтобы выполнялось свойство непротиворечивости:

x,y Y: x Сi, y Сj, (x, y) P i j. (1.2)

2. Метод ЦИКЛ

Лучшие показатели эффективности, с точки зрения числа вопросов, задаваемых эксперту для построения полной порядковой классификации, продемонстрировал метод ЦИКЛ (Цепная Интерактивная Классификация) [Асанов, 2002]. В методе была использована и обобщена идея динамического построения цепей, покрывающих пространство Y, для выбора каждого следующего векторов для предъявления эксперту, впервые предложенная в ДИФКЛАСС [Ларичев и др., 1996]. К сожалению, метод ЦИКЛ обладает довольно узкой областью применимости - он позволяет эффективно строить только полные базы экспертных знаний для предметных областей с полным порядком на шкалах критериев.

3. Метод КЛАНШ

Метод КЛАНШ (КЛАссификация при Непорядковых Шкалах) [Нарыжный, 1998] предназначен для решения задачи порядковой классификации в тех случаях, когда не выполняется требование строгой линейной упорядоченности оценок на шкалах критериев. Вводится ряд дополнительных понятий.

Говорят, что вектор x непосредственно доминирует вектор y, если (x, y)P, x?y, и не существует z, такой, что xPzPy, x?z, y?z.

Определяется также понятие орграфа непосредственного доминирования альтернатив G(Y, E), являющегося ориентированным ациклическим графом, в котором множество вершин есть множество альтернатив Y, а множество дуг EYЧY состоит из элементов (x, y) таких, что x непосредственно доминирует y.

Цепью называется последовательность векторов w = <x1, x2, …, xd>, в которой xi непосредственно доминирует xi+1 (1?i?d-1). Число d называется длиной цепи. Отдельный вектор считается цепью длины 1.

Основные шаги алгоритма классификации КЛАНШ:

1 Поскольку классы C1, …, CM упорядочены по качеству, границы между ними строятся последовательно, отделяя класс большего качества Ci от класса меньшего качества Ci+1.

2 Орграф доминирования векторов G(Y, E) может иметь несколько компонент связности, поэтому последовательно исследуются все еще не классифицированные векторы. Очередная выбранная альтернатива ysY называется исходной.

3 В текущей компоненте связности орграфа G(Y, E) строится цепь wmax максимальной длины, проходящая через исходную альтернативу ys.

4 Определяется средний элемент ym цепи wmax.

5 Эксперту предъявляется альтернатива ym цепи wmax, и проводится распространение его решения по доминированию.

6 Из цепи wmax исключаются классифицированные альтернативы. Если цепь wmax еще не пуста, то продолжается дихотомия wmax, которая завершается, когда все входящие в цепь wmax альтернативы оказываются прямо или косвенно классифицированы относительно классов Ci и Ci+1.

7 Цикл выполняется до тех пор, пока все альтернативы не окажутся классифицированными относительно этой пары классов.

Метод КЛАНШ позволяет строить полные базы экспертных знаний, когда предположение о наличии линейного порядка на множестве оценок по каждому из критериев заменяется предположением о наличии несвязного транзитивного бинарного отношения. Вычислительная сложность шагов 3-5 алгоритма не превышает, как показано в [Нарыжный, 1998], величину O(|Y|Чlog2|Y|).

4. Метод КЛАРА

Несмотря на то, что ЦИКЛ является более «быстрым» методом классификации, он не всегда может быть применен на практике, поскольку предназначен только для полной классификации с полным порядком на шкалах критериев. Метод КЛАНШ имеет более широкую область применения. На его основе был разработан метод КЛАРА (КЛАссификация Реальных Альтернатив). Он использует идею дихотомии цепей альтернатив, начиная с цепи максимальной длины, впервые использованной в алгоритме ДИФКЛАСС [Ларичев и др., 1996], затем в алгоритме КЛАНШ [Нарыжный, 1998], и адаптирует эту идею на случай разреженных пространств Y. Кроме того, в алгоритме КЛАРА используется новая идея адаптивной дихотомии, позволяющая быстрее находить границы классов решений и ускоряющая классификацию.

Введём несколько формальных определений.

Определение 1. Альтернативы x, yY называются сравнимыми: x~y, если x y или y x, иначе они называются несравнимыми: xy.

Любые две альтернативы, принадлежащие одному классу, либо находятся в отношении доминирования, либо несравнимы, следовательно, в каждом классе можно выделить подмножества недоминируемых и недоминирующих альтернатив.

Определение 2. Подмножество альтернатив ВU(Cn) класса Cn называется верхней границей этого класса, если xCnU(Cn) такой, что y x и x, yВU(Cn), xy xy.

Определение 3. Подмножество альтернатив ВL(Cn) класса Cn называется нижней границей этого класса, если xCnL(Cn) такой, что x y и x, yВL(Cn), xy xy.

Задача порядковой классификации может быть решена путем предъявления эксперту всех допустимых альтернатив Y* для получения искомого разбиения на классы. Однако использование отношения доминирования (1.1) и условия непротиворечивости (1.2) позволяет существенно сократить число непосредственно предъявляемых альтернатив и тем самым ускорить процедуру построения классификации. Сокращение числа предъявляемых альтернатив становится возможным благодаря использованию информации об уже классифицированных альтернативах для классификации оставшихся.

Нам понадобятся числовые функции CU(x) и CL(x), определенные на множестве Y соответственно, как максимальный и минимальный номер класса, допустимый для x, т.е. класса, при отнесении x к которому, не нарушается условие непротиворечивости классификации (1.2). Будем считать вектор x классифицированным и отнесенным к классу Ck, если для этого x выполняется условие: CU(x)=CL(x)=k. Первоначально для xY* полагается CL(x)=1, CU(x)=M.

Имеется множество альтернатив Y, на котором задано отношение доминирования P, а также M классов решений, упорядоченных по качеству. С каждой альтернативой xY* связаны максимальный и минимальный номера допустимых классов решений CU(x) и CL(x). Перед началом классификации xY: CL(x)=1, CU(x)=M. Классификация считается построенной, когда xY*: CL(x)=CU(x).

Определение 4. Альтернатива xY непосредственно доминирует альтернативу yY, если x y и zY: x z y.

Определение 5. Альтернатива xY непосредственно доминируется альтернативой yY, если x y и zY: x z y.

Множество альтернатив, непосредственно доминирующих альтернативу x, обозначается как ZU(x), а множество непосредственно доминируемых - как ZL(x).

Определение 6. Орграфом непосредственного доминирования альтернатив G(Y, E) называется ориентированный ациклический граф, в котором множество вершин есть множество альтернатив Y, а в множество дуг EYY состоит из элементов (x, y), в которых альтернатива xY непосредственно доминирует альтернативу yY.

Определение 7. Последовательность альтернатив w = <y1, y2, …, yl>, в котором yi+1 ZL(yi), 1 i (l - 1), называется цепью. Число L(w)=l альтернатив цепи w называется длиной цепи. Отдельная альтернатива является цепью длины 1.

Основные шаги алгоритма классификации КЛАРА:

1 В начале классификации коэффициент дихотомии di для поиска границы классов Ci и Ci+1 полагается равным Ѕ.

2 Орграф доминирования альтернатив G(Y, E) может иметь несколько компонент связности, поэтому последовательно исследуются все допустимые, но еще не классифицированные альтернативы из множества Y*. Последовательность выбора альтернатив имеет значение, она выбирается специальным образом, который описан ниже. Очередная выбранная альтернатива xS называется исходной.

3 В текущей компоненте связности (которой принадлежит xS) орграфа G(Y, E) строится цепь wmax альтернатив максимальной длины, проходящая через исходную альтернативу xS и содержащая максимальное число ещё неклассифицированных альтернатив из Y*.

4 Поскольку классы {Cn} упорядочены по качеству, границы между классами на цепи строятся последовательно, отделяя класс большего качества Cn от класса меньшего качества Cn+1.

5 Для предъявления эксперту выделяется элемент xd цепи wmax, где d = dn·L(wmax), причем если альтернатива xd оказалась недопустимой или уже классифицированной, то в качестве нового xd берется неклассифицированный допустимый элемент цепи с ближайшим индексом.

6 Эксперту предъявляется допустимая альтернатива xd цепи wmax и проводится распространение его решения на максимально возможное число элементов, принадлежность которых к классам Cn и Cn+1 остается неопределенной.

7 Если цепь wmax еще содержит допустимые неклассифицированные элементы, то продолжается дихотомия цепи wmax, которая завершается, когда все входящие в нее допустимые альтернативы оказываются прямо или косвенно классифицированы относительно классов Cn и Cn+1. В противном случае, на цепи ищется следующая граница между классами (производится возврат на шаг 4). Если же цепь классифицирована относительно всех классов, то для каждого класса находится индекс k в цепи wmax, где происходит смена класса с Cn на Cn+1. Полагается dnw=k/L(wmax). На каждом последующем шаге dn есть среднее арифметическое всех посчитанных до этого dnw.

8 Цикл выполняется до тех пор, пока все допустимые альтернативы из допустимого множества Y* не окажутся классифицированными относительно этой пары классов.

Остановимся более подробно на шаге 7. Когда цепь wmax оказывается полностью классифицированной относительно всех классов, выполняется процедура UPDATE_DN, аккумулирующая статистику относительно деления цепей на классы.

Эта процедура подсчитывает коэффициенты деления цепи w на классы и представляет их как вектор d, который используется потом алгоритмом COMPUTE_DN (на шаге 5 КЛАРА). В компоненте 0 вектора d содержится число рассмотренных цепей (для того, чтобы COMPUTE_DN могла посчитать средний коэффициент дихотомии для нужного класса), в компоненте i - сумма всех полученных ранее коэффициентов di.

На шагах 1-3 UPDATE_DN инициализируются переменные счетчиков, в том числе внешний вектор d, если статистика подсчитывается впервые. Далее в цикле по всем элементам цепи w подсчитывается, сколько раз встречается каждый класс. Несмотря на то, что цепь w полностью классифицирована, может оказаться, что элемент цепи yw относится к нескольким допустимым классам (CL(y)CU(y)). Это может произойти в случае, если y не является допустимым. Однако, свою лепту в статистику деления классов этот элемент всё равно внесёт.

Разделив суммарный счетчик для каждого класса Ci на общий счетчик n, и просуммировав полученные коэффициенты для всех ji, получим искомые коэффициенты дихотомии для рассматриваемой цепи w (шаги 12-13 UPDATE_DN).

Накопленная UPDATE_DN статистика используется на шаге 5 КЛАРА. На этом шаге определяется элемент цепи, наиболее вероятно лежащий на границе между рассматриваемыми классами. Для этого вычисляется коэффициент дихотомии с помощью вспомогательной процедуры COMPUTE_DN.

Если уже накоплена статистика по расположению границ классов на цепи, то возвращается соответствующий коэффициент дихотомии, являющийся средним арифметическим соответствующих коэффициентов для всех рассмотренных ранее цепей. В противном случае возвращается коэффициент дихотомии, равный Ѕ, и осуществляется классическая дихотомия делением пополам.

Алгоритм КЛАРА завершает свою работу, когда все альтернативы из множества Y* будут классифицированы, то есть yY* CL(y)=CU(y).

5. Оценка эффективности алгоритма КЛАРА

В работах [Нарыжный, 1998] и [Асанов, 2002] предлагается общая схема сравнения алгоритмов классификации, которую удобно использовать для оценки алгоритма КЛАРА. Схема основана на статистическом моделировании процедуры опроса эксперта и каждому алгоритму ставит в соответствие его эффективность, то есть отношение минимально возможного числа вопросов к эксперту к числу реально заданных. Было проведено сравнение различных алгоритмов порядковой классификации на задачах с бинарными шкалами критериев. Сравнивались алгоритмы ЦИКЛ, ОРКЛАСС [Ларичев и др., 1989], ДИФКЛАСС [Ларичев и др., 1996], КЛАНШ, КЛАРА [Кочин, 2006] и серия алгоритмов расшифровки монотонных функций алгебры логики [Алексеев, 1976], [Соколов, 1987].

Данные по известным алгоритмам (при N=11 (число двоичных критериев), Q=2) сведены в таблицу (Табл. 1).

Как видно, алгоритм КЛАРА немного уступает только алгоритмам ЦИКЛ и ДИФКЛАСС. Однако КЛАРА имеет гораздо более широкую область применения, включающую возможность работы со шкалами критериев произвольной длины (ДИФКЛАСС работает только на бинарных шкалах), с частичным порядком на шкалах, а также в сильно разреженных пространствах. Алгоритм КЛАРА эффективнее алгоритма КЛАНШ, имеющего такую же область применения.

Табл. 1.

Алгоритм

Число обращений к эксперту

Средняя эффективность

ЦИКЛ

146,63

0,68

ДИФКЛАСС

148,54

0,67

КЛАРА

159,88

0,65

КЛАНШ

176,54

0,53

ОРКЛАСС

265,08

0,33

А*

672,88

0,18

Благодарности. Работа поддержана программами фундаментальных исследований президиума РАН «Интеллектуальные информационные технологии, математическое моделирование, системный анализ и автоматизация» и ОНИТ РАН «Информационные технологии и методы анализа сложных систем», Российским фондом фундаментальных исследований (проекты 07-01-00515, 08-01-00247, 08-07-13532, 09-07-00009).

Список литературы

1. Алексеев В. Б. О расшифровке некоторых классов монотонных многозначных функций. // Журнал вычислительной математики и математической физики, 1976. т.16. № 1.

2. Асанов А. А. Методы извлечения и анализа экспертных знаний. Диссертация на соискание ученой степени кандидата технических наук. - М.: ИСА РАН. 2002.

3. Кочин Д. Ю. Построение баз экспертных знаний для интеллектуальных обучающих систем. Диссертация на соискание ученой степени кандидата технических наук, - М.: ИСА РАН, 2006.

4. Ларичев О. И., Мечитов А. И., Мошкович Е. М., Фуремс Е. М. Выявление экспертных знаний. - М.: Наука, 1989.

5. Ларичев О. И., Болотов А. А. Система ДИФКЛАСС: построение полных и непротиворечивых баз экспертных знаний в задачах дифференциальной диагностики. // НТИ, Сер. 2, Информ. процессы и системы, № 9, - М.: ВИНИТИ, 1996.

6. Нарыжный Е. В. Построение интеллектуальных обучающих систем, основанных на экспертных знаниях. Диссертация на соискание ученой степени кандидата технических наук, - М.: ИСА РАН, 1998.

7. Соколов Н. А. Оптимальная расшифровка монотонных булевых функций. // Журн. вычисл. матем. и матем. физ., т. 27, № 12, 1987.

8. Larichev O. I., Moshkovich H. M., Furems E. M., Mechitov A. I., Morgoev V. K. // Knowledge Acquisition for the construction of the full and contradiction free knowledge bases, Iec ProGAMMA, Croningen, The Netherlands, 1991.

Размещено на Allbest.ru


Подобные документы

  • Роль классификации документов в решении задач информационного поиска. Методы автоматической классификации документов и этапы построения классифицирующей системы: индексация документа, построение классификаторов на базе обучающих данных, оценка их работы.

    курсовая работа [354,2 K], добавлен 13.01.2013

  • Изучение характеристик, классификации, функций и основных элементов экспертных систем. Исследование их структуры и отличительных особенностей от другого программного обеспечения. Описания методов проектирования и области применения экспертных систем.

    реферат [38,1 K], добавлен 18.09.2013

  • Использование библиотеки готовых компонентов как основы процесса построения моделей организационных систем. Характеристика качественных методов принятия решений. Применение порядковой классификации в процессе UFO-моделирования систем телемеханики.

    магистерская работа [732,7 K], добавлен 26.04.2011

  • Программное обеспечение для получения исходных данных для обучения нейронных сетей и классификации товаров с их помощью. Алгоритм метода обратного распространения ошибки. Методика классификации товаров: составление алгоритма, программная реализация.

    дипломная работа [2,2 M], добавлен 07.06.2012

  • Роль интеллектуальных информационных систем в развитии общества. Проблемы концептуального классификационного моделирования для систем, основанных на знаниях. Иерархическая структура универсума. Интенсиональность и параметричность классификации, структура.

    реферат [15,4 K], добавлен 19.02.2011

  • Пример дерева решений. Анализ древовидной структуры данных. Предикторные (зависимые) переменные как признаки, описывающие свойства анализируемых объектов. Решение задач классификации и численного прогнозирования с помощью деревьев классификации.

    презентация [391,1 K], добавлен 09.10.2013

  • Создание и реализация алгоритма решения транспортной задачи методом наименьших стоимостей. Схема алгоритма основной программы. Основные шаги алгоритма решения транспортной задачи. Инструкция по эксплуатации программы и обзор результатов ее выполнения.

    курсовая работа [2,0 M], добавлен 12.02.2013

  • Анализ классификаций туристских предложений и построение обобщенной классификации. Разработка методики подбора актуального туристического предложения на основе созданной классификации и проекта информационной системы (ИС). Частичное прототипирование ИС.

    дипломная работа [3,3 M], добавлен 01.07.2017

  • Понятие и особенности экспертных систем, способных накапливать, обрабатывать знания из некоторой предметной области, на их основе выводить новые знания и решать на основе этих знаний практические задачи. История и устройство юридических экспертных систем.

    реферат [58,4 K], добавлен 17.03.2015

  • Виды машинного обучения, его основные задачи и методы. Подходы к классификации: логистическая регрессия, наивный байесовский классификатор, стохастический градиентный спуск, K-ближайший сосед, дерево решений, случайный лес, метод опорных векторов.

    курсовая работа [436,9 K], добавлен 14.12.2022

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.