Упорядочение и классификация объектов с противоречивыми признаками
Множество с повторяющимися элементами как удобная математическая модель для представления объектов, которые характеризуются многими разнородными признаками. Методы упорядочения объектов, основанных на теории метрических пространств мультимножеств.
Рубрика | Экономико-математическое моделирование |
Вид | статья |
Язык | русский |
Дата добавления | 17.01.2018 |
Размер файла | 78,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1
Упорядочение и классификация объектов с противоречивыми признаками
А.Б. Петровский
Аннотация
Мультимножество или множество с повторяющимися элементами служит удобной математической моделью для представления объектов, которые характеризуются многими разнородными (количественными и качественными) признаками и могут существовать в нескольких экземплярах с отличающимися, в частности, противоречивыми значениями признаков. В работе рассматриваются новые методы упорядочения и классификации таких многопризнаковых объектов, основанные на теории метрических пространств мультимножеств. Методы применены для решения практических задач: построения рейтинга компаний и конкурсного отбора проектов, оцененных несколькими экспертами по многим критериям.
В проблемах многокритериального принятия решений, распознавания образов, классификации, обработки разнородной информации, теории кодирования других предметных областях часто возникает необходимость сгруппировать или упорядочить анализируемые объекты, основываясь на их свойствах, выраженных признаками (атрибутами) объектов. Вместе с тем имеется достаточно широкий круг задач, где изучаемые объекты характеризуются многими разнородными признаками, которые могут быть и количественными, и качественными, и, кроме того, одни и те же объекты могут существовать в нескольких экземплярах с отличающимися значениями признаков, свертка которых или невозможна, или математически некорректна. В качестве примеров таких задач укажем классификацию и ранжирование объектов, оцененных несколькими экспертами по многим качественным критериям, распознавание графических символов, обработку текстовых документов. Множественность и повторяемость факторов, описывающих объекты, усложняет и затрудняет решение таких задач. Главные трудности обусловлены необходимостью одновременно учитывать большое количество вербальных и числовых данных и обрабатывать эти данные, не прибегая к дополнительным преобразованиям типа усреднения, смешивания, взвешивания, которые могут привести к необоснованным и необратимым искажениям исходных данных.
Удобной математической моделью для представления многопризнаковых объектов является мультимножество или множество с повторяющимися элементами. Кратность элементов - существенная особенность мультимножества, позволяющая отличать его от множества и рассматривать мультимножество как качественно новое математическое понятие. В работе предложены методы упорядочения и классификации совокупности многопризнаковых объектов, которые базируются на теории метрических пространств мультимножеств. Метод упорядочения объектов основан на оценке их близости по отношению к некоторому «идеальному» объекту в многопризнаковом пространстве. Метод классификации объектов позволяет строить обобщенное решающее правило для их отбора, которое аппроксимирует различные, в том числе и противоречивые, правила экспертной сортировки объектов.
Способы представления многопризнаковых объектов. Выбор той или иной модели для представления рассматриваемых объектов и исследования структуры их связей определяется свойствами этих объектов, которые выражаются признаками (атрибутами) объектов. Признаки, характеризующие свойства объектов, могут быть непрерывными и дискретными, количественными и качественными, или смешанными.
Обычно совокупность объектов представляется множеством точек в некотором многомерном (как правило, метрическом) пространстве, оси которого соотносятся с соответствующими признаками. В прикладных задачах в качестве такого пространства достаточно часто (но, заметим, не всегда обоснованно) выбирается пространство типа евклидового. Задание расстояния между объектами позволяет оценивать близость или удаленность этих объектов относительно друг друга вне зависимости от их природы, исследовать структурные особенности совокупности объектов и всего пространства в целом.
В различных предметных областях рассматриваются совокупности A ={A1,...,Ak} объектов, которые описываются m дискретными признаками Q1,…,Qm, имеющими конечное число , es=1,…,hs, s=1,…,m количественных (числовых) или качественных (номинальных, либо порядковых) значений. Каждый объект Ai, i=1,…,k из совокупности A можно представить как точку qi в m-мерном векторном пространстве Q=Q1Q2…Qm, являющемся прямым произведением шкал значений признаков Qs, и поставить объекту Ai в соответствие m-мерный вектор Ai =(,,…,) [1], [2], [3], [4].
Ситуация существенным образом усложняется, если одному и тому же объекту Ai может соответствовать не один, а несколько m-мерных векторов с различающимися значениями признаков. Подобная ситуация возникает, например, когда необходимо одновременно учесть m параметров объекта Ai, измеренных n различными способами, либо когда объект Ai оценивается n независимыми экспертами по m критериям. В таком случае объект Ai представляется в m-мерном пространстве Q уже не одной точкой qi, а группой (“облаком”), состоящей из n точек {qi(1),…,qi(n)} вида
Ai={(,,…,),…,(,,…,)}
которая должна рассматриваться и анализироваться как единое целое. При этом, очевидно, измеренные разными способами значения параметров, как и индивидуальные оценки экспертов, могут быть похожими, различающимися и даже противоречивыми, что в свою очередь может приводить к несравнимости m-мерных векторов
qi(j)=(,,…,)
характеризующих один и тот же объект Ai.
Совокупность таких многомерных объектов может иметь в пространстве Q сложную структуру, достаточно трудную для анализа. Непросто ввести в этом пространстве и метрику для измерения расстояний между объектами. Указанные трудности можно преодолеть, воспользовавшись иным способом представления многопризнаковых объектов, основанным на формализме мультимножеств [5], [6], который позволяет одновременно учесть все комбинации значений количественных и качественных признаков, а также число значений каждого из этих признаков. Вместо прямого произведения m шкал значений признаков Q=Q1Q2…Qm введем обобщенную шкалу признаков - множество G=Q1,Q2,…,Qm, состоящее из m групп признаков, и представим объект AiA в таком символическом виде:
Ai = {kAi(q11)*q11,…,kAi()*,…,kAi(qm1)*qm1,…, kAi()*} (1)
где число kAi() указывает, сколько раз признак Qs встречается в описании объекта Ai, знак * обозначает кратность вхождения признака . Например, при многокритериальной оценке объекта Ai несколькими экспертами число kAi() равно числу экспертов, давших объекту Ai оценку по критерию Qs. Объект Ai можно записать и более единообразно как Ai={kAi(x1)*x1,…,kAi(xh)*xh}, определив элементы множества G={x1,...,xh} следующим образом:
x1=q11,x2=q12,…,=
=q21,…,=,…,
=qm1,…,=
где h=h1+...+hm. Множество G определяет свойства совокупности объектов A ={A1,...,Ak}. Такие объекты Ai суть множества с повторяющимися элементами xjG или мультимножества, и их можно представлять точками в метрических пространствах мультимножеств.
Мультимножества и операции над ними. Дадим краткий обзор теории мультимножеств и метрических пространств мультимножеств [5], [6]. Мультимножеством A, порожденным обычным множеством U={x1,x2,…}, все элементы которого различны, называется совокупность групп элементов вида
А={kA(х)*x|xU, kA(х)Z+}
Здесь kA:UZ+={0,1,2,…} называется функцией числа экземпляров мультимножества, определяющей кратность вхождения элемента xiU в мультимножество А, что обозначено символом *.
Если
kA(x)=A(x)
где A(х)=1 при xА и A(х)=0 при xА, то мультимножество А становится обычным множеством. Если все мультимножества семейства A ={A1,A2,…} образуются из элементов множества G, то G называется доменом для семейства A , а множество SuppA={x|xG, SuppA(х)=А(х)} - опорным множеством или носителем мультимножества А. Мощность мультимножества |А|=xkA(х) определяется как общее число экземпляров всех его элементов; размерность мультимножества /А/=xA(х)=|SuppA| - как общее число различных элементов. Максимальное значение функции кратности hgtA= называется высотой, а элемент xA*=arg - пиком мультимножества А. Мультимножество называется пустым , если k(x)=0, и максимальным Z, если
kZ(х)=kA(х), xU
Рассмотрим возможные способы сопоставления мультимножеств, обусловленные особенностями их различных характеристик. Мультимножества А и В называются равными (А=В), если kA(х)=kB(х) для всех элементов xG, и неравными (АВ), если kA(х)kB(х) хотя бы для одного хG. Для равных мультимножеств имеем |А|=|В|, /A/=/B/, hgtA=hgtВ, xA*=xB*, SuppA=SuppB. Мультимножества А и В будем называть равномощными, если |А|=|В|; равноразмерными, если /A/=/B/; равновеликими, если они равномощны и равноразмерны. Равные мультимножества равновелики, обратное утверждение, вообще говоря, неверно.
Будем говорить, что мультимножество В содержится или включено в мультимножество А (ВА), если kВ(х)kА(х), для каждого элемента xG. Мультимножество В называется тогда подмультимножеством мультимножества А, а мультимножество А - надмультимножеством мультимножества В. В этом случае |В||А|, /В//А/, hgtВhgtА, SuppBSuppA, а xA*=xB*, либо xA*?xB*. Как и в случае обычных множеств, одновременное выполнение условий ВА и АВ влечет равенство мультимножеств А=В. Включение мультимножества обладает свойствами рефлексивности (AА) и транзитивности (АВ, ВC АC), а значит, является отношением предпорядка.
Мультимножества А и В будем называть одноименно или S-эквивалентными (АВ), если их носители совпадают (SuppA=SuppB) и существует взаимно однозначное соответствие f между одноименными компонентами: kВ(х)=f(kА(х)), x G; разноименно или D-эквива-лентными (АВ), если их носители эквивалентны (SuppA~SuppB) и существует взаимно однозначное соответствие f между разноименными компонентами:
kВ(хi)=f(kА(хj)), xi,xjG
где f - целочисленная функция с областью значений Z+. S- и D-эквивалентные мультимножества равноразмерны /В/=/А/, их мощности и высоты связаны равенствами |В|=f(|А|), hgtВ=f(hgtА). Одно из S-эквивалентных мультимножеств всегда является подмультимножеством другого, а для D-эквивалентных мультимножеств это утверждение не выполняется. D-эквивалентные мультимножества становятся S-эквивалентными, если в одном из мультимножеств переобозначить элементы xixj. Частными случаями S-эквивалентности будут равные мультимножества; сдвинутые мультимножества, для которых kВ(х)=kА(х)+p, p0 - целое; растянутые или пропорциональные мультимножества, для которых kВ(х)=qkА(х), q1 - целое. Важным частным случаем D-эквивалентности являются равносоставленные мультимножества, чьи разноименные компоненты равны kA(хi)=kB(хj), xi,xjG. Равные мультимножества равносоставлены, обратное утверждение неверно.
Введем следующие основные операции над мультимножествами:
объединение AB = {kAB (x)*x | kAB (x)=max(kA(x), kB(x))};
пересечение AB = {kAB (x)*x | kAB (x)=min(kA(x), kB(x))};
арифметическое сложение A+B = {kA+B(x)*x kA+B(x)=kA(x)+kB(x)};
арифметическое вычитание AB = {kAB(x)*x kAB(x)=kA(x)kA?B (x)};
симметрическая разность AB = {kAB(x)*x kAB(x)=|kA(x)kB(x)|};
дополнение = ZA = *x =kZ(x)kA(x);
умножение на число (репродукция) h*A = {kh*A(x)*x kh*A(x)=hkA(x), hZ+};
арифметическое умножение А*В = {kА*В(x)*x kА*В(x) = kA(x)kB(x)};
арифметическая п-ая степень Ап = {*x = (kA(x))п};
прямое произведение AB = {kAB*xi, xj kAB=kA(xi)kB(xj), xiA, xjB};
прямая п-ая степень (A)n = {*x1,…,xп | =, xiA}.
Носители операций над мультимножествами определяются следующими выражениями:
Supp(AB) = Supp(A+B) = (SuppA)(SuppB);
Supp(AB) = Supp (А*В) = (SuppA)(SuppB);
Supp(AB) = (Supp(AB))(Supp(BА));
(SuppA)(SuppВ) = (SuppA\SuppВ)(SuppВ\SuppА);
Supp(h*A) = SuppA = Supp(Ап);Supp(AB) = (SuppA)(SuppB).
В теории множеств операции арифметического сложения, умножения на число, арифметического умножения и возведения в степень множеств в общем случае не определяются. Аналогами этих операций могут служить соответственно покомпонентное сложение и умножение на скаляр векторов
a+b=(a1+b1,…,an+bn), ha=(ha1,…,han)
и матриц
А+В=||aij+bij||mn, hА=||h aij||mn
поэлементное умножение матриц АВ=||aijbij||mn. Последняя операция, введенная в алгебраической теории распознавания образов [7], отличается от традиционной операции умножения матриц. При переходе к множествам арифметическое умножение и возведение в степень мультимножеств вырождаются в пересечение множеств, а арифметическое сложение множеств и умножение множества на число будут неосуществимы.
Семейство мультимножеств, замкнутое относительно операций объединения, пересечения, сложения и дополнения, называется алгеброй мультимножеств L (Z), где максимальное мультимножество Z является единицей алгебры, а пустое мультимножество - нулем. Действительная неотрицательная функция m(A), определенная на алгебре L (Z) и удовлетворяющая условию коаддитивности: m(A)+m(B)=m(A+B), называется мерой мультимножества. Мера мультимножества m(A) обладает следующим свойствами: m()=0; монотонность m(A)m(B)AB; непрерывность m(Ai)=m(Ai); симметричность m(A)+m()=m(Z); эластичность m(h*A)=hm(A). Меру мультимножества можно определить различными способами, например, как линейную комбинацию функций кратности: m(A)=jwjkA(xj), wj>0. Заметим, что мощность мультимножества A также будет мерой мультимножества
Метрические пространства мультимножеств (A ,d) введены в [5], где определены следующие виды расстояний между мультимножествами:
d1(A,B) = m(AДB); d2(A,B) = m(AДB)m(Z); d3(A,B) = m(AДB)m(AB). (2)
Функции d2(A,B) и d3(A,B) удовлетворяют условию нормировки 0d(A,B)1. По определению принимается d3(,)=0. Основное расстояние d1(A,B) является метрикой типа Хемминга, традиционно используемым во многих приложениях. Полностью усредненное расстояние d2(A,B) характеризует различие между двумя мультимножествами A и B, отнесенное к расстоянию, максимально возможному в исходном пространстве. Локально усредненное расстояние d3(A,B) задает различие, отнесенное к максимально возможной «общей части» только этих двух мультимножеств в исходном пространстве.
Построение рейтинга компаний. Одним из весьма распространенных подходов к структуризации совокупности объектов A ={A1,...,Ak} является их строгое или нестрогое упорядочение, которое представляет собой введение между объектами бинарных отношений строгого или нестрогого порядка, эквивалентности или несравнимости, заданных на множестве свойств объектов. Сравнение объектов по их свойствам производится на основе признаков, характеризующих объекты.
Рассмотрим достаточно часто встречающуюся практическую задачу нахождения рейтинга компаний, занимающихся бизнесом в некоторой области. Решить такую задачу, можно, например, голосованием - рейтинг компаний определяется тогда по количеству поданных за нее голосов. Но в этом случае получается оценка компании «в целом» без каких-либо деталей.
Более сложной является задача построения рейтинга компаний, основываясь на фактических показателях их деятельности и/или экспертных оценках по многим критериям. Перечень таких критериев формируется заранее, он зависит от целей анализа. Например, компании, действующие в некотором секторе рынка, можно оценивать по следующим критериям: Q1. Уровень деловой активности; Q2. Объем прибыли от реализации продукции; Q3. Объем продаж; Q4. Число выполненных проектов; Q5. Квалификация персонала; Q6. Численность сотрудников компании; и тому подобное. Шкалы критериев оценки могут быть как количественными, так и качественными. Для удобства оценки и сравнения компаний количественные критерии можно трансформировать в качественные с небольшим числом упорядоченных градаций шкал. Шкалы критериев Q4. «Число выполненных проектов» и Q6. «Численность сотрудников компании» могут иметь, например, такой вид:
q41 - очень высокое (больше ста);
q42 - высокое (от пятидесяти до ста);
q43 - среднее (от десяти до пятидесяти);
q44 - низкое (меньше десяти).
Пусть каждая компания из некоторой совокупности оценивается несколькими экспертами по всем критериям. В частности, возможна ситуация, когда представитель каждой компании является экспертом, ставящим свои оценки всем рассматриваемым компаниям, в том числе и своей собственной. При этом оценки разных экспертов могут отличаться друг от друга и даже быть противоречивыми. В таком случае каждую компанию можно рассматривать как многопризнаковый объект, а определение рейтинга компаний представляет собой тогда задачу упорядочивания многопризнаковых объектов. Основной трудностью при решении таких задач является необходимость учета всех описаний объекта - различающихся оценок, сделанных разными экспертами.
К числу наиболее популярных методов упорядочения объектов относятся непосредственная порядковая классификация, ранжирование, парные сравнения.
Наименее трудоемким для эксперта методом упорядочения объектов является метод непосредственной классификации с именованными и упорядоченными классами - метод сортировки [8]. В этом методе эксперт непосредственно относит объект Ai к одному из выделенных классов, назначая объекту одну из оценок по порядковой или номинальной шкале критериев. При коллективной экспертизе сортировка объектов проводится обычно на основе распределений экспертных оценок. Если согласованность оценок оказывается приемлемой, то в качестве коллективной средней оценки используется медиана Кемени-Снелла [9], [10], которая практически достаточно часто совпадает с модой распределения. Итоговое упорядочение объектов строится на основе средних оценок.
При упорядочении объектов с помощью метода ранжирования для каждого объекта Ai тем или иным образом, например, на основе предпочтений лица, принимающего решение (ЛПР), или оценок эксперта вычисляется натуральное число ri, называемое рангом. Упорядочению объектов соответствует упорядочение рангов r1r2…ri…rc. Возможны различные способы ранжирования объектов. Например, объекты могут предъявляться эксперту все сразу или поочередно. При небольшом числе объектов и одном признаке (критерии) оценке объектов ранжирование не представляет больших трудностей для экспертов. При увеличении числа объектов, критериев и экспертов, оценивающих объекты, количество связей между оценками резко возрастает. Поэтому эксперты могут допускать в таких случаях существенные ошибки при определении рангов объектов. В силу ограниченных возможностей человека при обработке информации методы ранжирования объектов являются для экспертов более трудоемкими по сравнению с методами непосредственной классификации.
В методах парных сравнений итоговое упорядочение объектов строится на основе сравнения всех пар объектов. ЛПР или эксперту предъявляется пара объектов и предлагается указать, какой из объектов более предпочтителен. В случае сравнения всех пар объектов и транзитивности предпочтений эксперта, получается полное упорядочение объектов. Если эксперт считает некоторые из объектов несравнимыми, то упорядочение будет частичным. Для каждого эксперта и признака (критерия) составляется своя матрица парных сравнений «объект-объект». Таким образом, появляется набор матриц, обработка которых для получения итогового упорядочения требует создания специальных вычислительных алгоритмов.
ЛПР и эксперты могут быть не всегда последовательными в своих ответах, могут допускать неточности, особенно в трудных случаях, предпочтения ЛПР могут быть противоречивыми. Для преодоления таких трудностей при построении итоговых упорядочений разрабатываются специальные процедуры. Так, например, в группе методов ЗАПРОС (Замкнутые Процедуры у Опорных Ситуаций) [1] для упорядочения многокритериальных объектов используется процедура выявления цепочек сравнений, образующих нетранзитивные триады. Выявленные нарушения предъявляются ЛПР для изменения его оценок с тем, чтобы устранить противоречия и построить единую порядковую шкалу оценок. В группе методов ELECTRE (Elimination et Choix Traduisant la Realite) [11] упорядочение многокритериальных объектов осуществляется путем их попарного сравнения с использованием специальных индексов согласия и несогласия, рассчитываемых на основе предпочтений ЛПР.
Когда объекты имеют многопараметрическое описание, а сами объекты должны рассматриваться и анализироваться как единое целое, например, когда объекты оцениваются несколькими экспертами по многим качественным критериям Q1,…,Qm, построение итогового упорядочения k объектов на основании m отдельных ранжировок, полученных по каждому из параметров вызывает значительные трудности. Исторически сложились два подхода к их преодолению, которые можно условно назвать статистическим и алгебраическим [8]. При статистическом подходе каждое из индивидуальных упорядочений, к примеру, заданное экспертом, рассматривается как одна из возможных реализаций одного и того же наиболее вероятного упорядочения объектов. Известны различные модели для построения такого вероятностного упорядочения, например, модели Льюса, Терстоуна и другие.
В алгебраическом подходе итоговое упорядочение ищется как наиболее близкое ко всем индивидуальным упорядочениям. Близость ранжировок оценивается по некоторому расстоянию, обычно вводимому аксиоматически. Одним из широко используемых видов таких компромиссных решений является медиана Кемени-Снелла. Другим часто употребляемым методом построения итогового упорядочения служит упорядочение объектов по средним рангам, то есть по среднему арифметическому значению рангов, присвоенных каждому объекту разными экспертами. Как отмечается в работе [10], со статистической точки зрения и медиана Кемени-Снелла, и упорядочение по средним рангам представляют собой упорядочения, наиболее коррелированные в среднем с индивидуальными экспертными предпочтениями. В первом случае корреляции ищутся с использованием в качестве коэффициента ранговой корреляции коэффициента Кендалла, а во втором - коэффициента Спирмена. При упорядочении несравнимых объектов необходимо учитывать дополнительную информацию, например, предпочтения ЛПР [1] или относительную важность критериев [4].
В перечисленных выше подходах построение итогового упорядочения объектов производится либо на основе информации, полученной от одного источника, либо путем согласования или усреднения различных оценок. Однако, если имеются различные источники информации, например, объекты оцениваются несколькими экспертами, которые работают независимо и не знают оценок друг от друга, то получить согласованное мнение экспертов крайне сложно или вообще невозможно. Поэтому необходимы методы упорядочения многопризнаковых объектов, которые позволяли бы одновременно учитывать оценки, в том числе и противоречивые, всех экспертов без поиска компромисса между мнениями отдельных экспертов.
Упорядочение многопризнаковых объектов. Дадим формальную постановку задачи упорядочения многопризнаковых объектов. Пусть A ={A1,...,Ak} - совокупность объектов, которые оцениваются n экспертами по m критериям Q1,…,Qm. Каждый критерий Qs имеет порядковую шкалу количественных или качественных оценок {}, es=1,…,hs, s=1,…,m, которые упорядочены от лучшего значения к худшему qs1qs2…. Предполагается, что разные критерии могут иметь различную относительную важность, но значения оценок, относящихся к одному и тому же критерию, равноценны. Будем также считать, что каждый объект оценивается всеми n экспертами по всем m критериям, не существует «главного» эксперта и мнения всех экспертов одинаково важны, экспертные оценки независимы. Можно выделить два объекта (возможно, гипотетических) - абсолютно лучший и абсолютно худший, которым все эксперты дали соответственно наивысшие и наинизшие оценки по всем критериям. Требуется, исходя из многокритериальных оценок объектов, упорядочить объекты от лучшего к худшему.
Представим объект Ai как мультимножество вида (1) над доменом G={Q1,…,Qm}, являющимся множеством критериальных оценок, где функция кратности kAi() мультимножества характеризует количество экспертов, давших объекту Ai оценку . Наилучшему и наихудшему объектам соответствуют мультимножества
мультимножество математический объект метрический
Amax = {n*q11,0,…,0, n*q21,0,…,0,…, n*qm1,0,…,0} (3)
Amin = {0,…,0,n*, 0,…,0,n*,…, 0,…,0,n*} (4)
и их принято называть идеальным и антиидеальным решениями. В дальнейшем мы не будем делать различия между объектом Ai и представляющим его мультимножеством Ai. Задача упорядочения многопризнаковых объектов сводится, таким образом, к упорядочению мультимножеств. Рассмотрим возможные подходы к ее решению.
Простейший способ сравнения и упорядочения объектов состоит в упорядочении мультимножеств по включению. В этом случае i-ый объект Ai будет лучше j-ого объекта Aj (AiAj), если для мультимножеств выполняется включение Ai Aj, что равносильно условию kAi()kAj() для всех G. Однако такая возможность на практике встречается достаточно редко.
Мультимножество A в определенном смысле эквивалентно целочисленному вектору cA=(kA1,…,kAh1,…, kAm1,…,kAhm), различные компоненты kAs которого являются значениями функции кратности kA() мультимножества A. Используя представление объекта A с помощью вектора cA, мы возвращаемся к методам группового сравнения и упорядочения многопризнаковых объектов, рассмотренным выше. Важнейшим недостатком этих методов является их малая пригодность для противоречиво описанных объектов, а также трудоемкость процедур сбора и обработки информации об объектах.
Будем теперь считать многопризнаковые объекты точками метрического пространства мультимножеств (A , d), например, с основной метрикой (типа Хемминга), которая задается формулой (2), принимающей вид
d1(A,B) = m(AДB) = (5)
где ws 0 - коэффициенты относительной важности критериев Qs. Будем сравнивать объекты по их близости к идеальному решению Amax и говорить, что объект Ai лучше объекта Aj (AiAj), если он находится ближе к идеальному решению Amax, то есть выполняется условие
d1(Amax, Ai) d1(Amax, Aj) (6)
Упорядочим все объекты по величине их расстояния от идеального решения. Если для некоторых объектов d1(Amax,Ai)=d1(Amax,Aj), то объекты Ai и Aj будут или эквивалентными, или несравнимыми. Тем самым полученное ранжирование объектов окажется нестрогим.
Так как каждый объект Ai оценивается n экспертами по всем m критериям, то нетрудно убедиться, что выполняются равенства
= n, = mn
Отсюда, в частности, для любого критерия Qs следует соотношение
= n kAi(qs1) (7)
Воспользовавшись формулами (3), (5), условием равноценности оценок по каждому критерию и учитывая равенство (7), запишем выражение для расстояния от идеального решения Amax до объекта Ai в виде:
d1(Amax, Ai) = = 2[n kAi(qs1)]
Условие (6) сравнения многопризнаковых объектов приобретает тогда следующую форму: объект Ai лучше объекта Aj (Ai Aj), если
kAi(qs1) kAj(qs1) (8)
Таким образом, правило упорядочения многопризнаковых объектов сводится к сравнению взвешенных сумм SAi1 =s ws kAi(qs1) первых (наилучших) оценок объектов по всем критериям Qs. Лучшим будет тот объект Ai, у которого эта сумма SAi1 будет больше.
Для некоторых объектов Air вместо неравенств (6) или (8) выполняются равенства d1(Amax, Ai1)=…=d1(Amax, Ait), r=1,…t. В таком случае получим частичное упорядочение объектов, в котором объекты Ai1,…,Ait «делят» одно и то же место. Чтобы упорядочить эти объекты внутри группы воспользуемся следующим приемом. Подсчитаем для объектов взвешенные суммы SAir2 =s ws kAir(qs2) вторых оценок по всем критериям, и будем считать, что объект Aiu лучше объекта Aiv, если выполняется условие
kAiu(qs2) kAiv(qs2) (9)
Если для каких-то объектов Airp и эти суммы окажутся одинаковыми, то упорядочим объекты из этой подгруппы по суммам SAirp3 =s ws kAirp(qs3) третьих оценок по всем критериям. И так далее, пока не расставим по своим местам все объекты Ai1,…,Ait данной группы и всей совокупности A ={A1,...,Ak} в целом.
Представим рассмотренную процедуру упорядочения совокупности многопризнаковых объектов в виде следующего алгоритма [12].
Шаг 1. Вычислить для каждого объекта Ai из совокупности A ={A1,...,Ak} взвешенную сумму SAi1 =s ws kAi(qs1) всех первых (наилучших) оценок по всем критериям Qs и упорядочить объекты от лучшего к худшему по величинам SAi1 сумм первых оценок. Если найдутся группы эквивалентных или несравнимых объектов Ai1,…,Ait, имеющих одинаковые суммы SAi1, перейти к шагу 2.
Шаг 2. Вычислить для каждого объекта Air, r=1,…t в соответствующей группе взвешенную сумму SAir2 =s ws kAir(qs2) всех вторых оценок по всем критериям Qs и упорядочить объекты внутри каждой группы от лучшего к худшему по величинам SAir2 сумм вторых оценок. Если останутся подгруппы эквивалентных или несравнимых объектов Airu,…,Airv, имеющих одинаковые суммы SAir2, перейти к шагу 3.
Шаг 3. Вычислить для каждого объекта Airp в соответствующей подгруппе взвешенную сумму SAirp3 =s ws kAirp(qs3) всех третьих оценок по всем критериям Qs и упорядочить объекты внутри каждой подгруппы от лучшего к худшему по величинам сумм SAirp3 третьих оценок. Продолжить процедуру до полного упорядочения всех объектов из совокупности A={A1,...,Ak}. Если число hs значений оценок у некоторых критериев Qs окажется меньше требуемого на данном b-ом шаге алгоритма, то следует считать kAir…p(qsb)=0. _
В приведенном выше алгоритме предполагалась различная относительная важность критериев Qs, выражаемая коэффициентами ws 0, на которые могут накладываться некоторые условия, например, s ws =1. Проблема определения важности критериев имеет самостоятельное значение и в контексте данной работы не рассматривается. В случае, когда все критерии одинаково важны, все коэффициенты ws считаются равными 1.
Аналогичным образом можно построить процедуру упорядочения многопризнаковых объектов Ai по отношению к антиидеальному решению Amin, заданному выражением (4), считая, что объект Ai лучше объекта Aj (Ai Aj), если он находится дальше от антиидеального решения Amin, то есть d1(Amin, Ai)d1(Amin, Aj). Как и выше, объекты Ai и Aj будут эквивалентными или несравнимыми, если d1(Amin,Ai)=d1(Amin,Aj). Подчеркнем, что упорядочение совокупности многопризнаковых объектов A ={A1,...,Ak} по отношению к антиидеальному решению может не совпадать с упорядочением по отношению к идеальному решению.
Данный метод упорядочения многопризнаковых объектов был применен для построения рейтинга российских компаний, работающих в секторе информационно-коммуникацион-ных технологий [13]. Экспертная оценка деятельности компаний давалась по специально разработанным критериям с качественными оценками, аналогичным указанным выше, а результаты обрабатывались по описанной процедуре. Всего было оценено около 50 компаний, из которых были выделены 30 ведущих высокотехнологичных компаний, а также составлены рейтинги 10 ведущих разработчиков программного обеспечения и 10 наиболее динамично развивающихся компаний.
Классификация многопризнаковых объектов. Рассмотрим еще одну практическую задачу, в которой, исходя из некоторой предварительной сортировки совокупности многопризнаковых объектов, требуется распределить эти объекты по нескольким классам. Допустим, что для решения какой-либо важной проблемы (научно-технической, экономической, производственной, экологической) необходимо сформировать программу, которая будет состоять из отдельных работ, проектов, заданий и тому подобное, отобранных на конкурсной основе. Каждая представленная на конкурс заявка оценивается несколькими экспертами по специально разработанным качественным критериям. Основываясь на заключениях экспертов, орган, ответственный за формирование программы, принимает решение о включении того или иного проекта в программу.
Например, при формировании государственной научно-технической программы по высокотемпературной сверхпроводимости [14] экспертная оценка и конкурсный отбор проектов проводился по следующим качественным критериям: Q1. Важность проекта для программы; Q2. Перспективность проекта; Q3. Новизна подхода к решению поставленных задач; Q4. Квалификация исполнителей проекта; Q5. Ресурсное обеспечение работ; Q6. Возможность быстрого выхода результатов в практику.
Каждый критерий имел порядковую или номинальную шкалу оценок с развернутыми словесными формулировками градаций качества. Так, шкала критерия Q4. «Квалификация исполнителей проекта» имела вид:
q41 - по опыту и квалификации исполнители проекта являются одним из лучших научных коллективов;
q42 - опыт и квалификация исполнители находятся на уровне, достаточном для проведения работ;
q43 - исполнители не обладают необходимыми опытом и квалификацией;
q44 - опыт и квалификация исполнителей неизвестны.
Шкала оценок по критерию Q6. «Возможность быстрого выхода результатов в практику» выглядела следующим образом:
q61 - результаты будут обладать достаточной степенью технологичности, обеспечивающей их быстрое использования в практике;
q62 - для использования запланированных результатов на практике потребуются дополнительные исследования и разработки;
q63 - результаты будут носить в основном теоретический характер.
Экспертиза заявок осуществлялась экспертами независимо друг от друга без согласования их мнений. Каждый эксперт, наряду с оценкой заявки по всем критериям, давал одну из следующих рекомендаций:
r1 - включить проект в программу;
r2 - отклонить проект;
r3 - отложить рассмотрение заявки и отправить проект на доработку.
Указанные рекомендации экспертов являются, по существу, правилами предварительной классификации (сортировки) рассматриваемых заявок. В других задачах критерии оценки объектов и правила их сортировки могут быть и иными.
Если бы заявка оценивалась только одним экспертом, то найти на множестве многокритериальных оценок обобщенное решающее правило для отбора предложений не составило бы особого труда. Известно большое число разных подходов к решению подобного рода задач классификации, например, [1], [2], [10], [15]. Однако когда заявка рассматривается несколькими экспертами, то появляется несколько различных вариантов («экземпляров») одной и той же заявки, поскольку и многокритериальные экспертные оценки, и заключения экспертов могут быть как схожими, так и противоречивыми. В силу качественного характера экспертных данных их агрегирование тем или иным способом представляет самостоятельную, достаточно сложную проблему. Помимо этого, вырабатывая решение о включении заявки в программу, необходимо учесть все, даже и не совпадающие заключения экспертов по принятию или отклонению заявки. Желательно поэтому иметь некое единое решающее правило для отнесения заявки к какому-либо классу, которое, во-первых, базировалось бы на характеристиках заявок, выраженных их многокритериальными оценками, а во-вторых, в наибольшей степени соответствовало бы индивидуальным экспертным правилам сортировки. Прежде, чем переходить к изложению путей решения этой задачи, напомним некоторые общие положения.
Подобные документы
Понятие и цели метода фокальных объектов - поиска новых идей путем присоединения к исходному объекту свойств или признаков случайных объектов. Активизация ассоциативного мышления как один из способов эвристического исследования в теории принятия решений.
контрольная работа [19,5 K], добавлен 24.12.2012Основы математического моделирования детерминированных и стохастических объектов. Идентификация объектов управления по переходной характеристике. Получение модели методом множественной линейной регрессии и проверка ее адекватности по критерию Фишера.
курсовая работа [1,1 M], добавлен 14.10.2014Раскрытие содержания математического моделирования как метода исследования и прогнозирования развития объектов народного хозяйства. Алгоритмы, модели и функции процедуры Эйткена. Оценивание ковариационной матрицы вектора при оценке объектов недвижимости.
статья [56,4 K], добавлен 14.10.2012Понятие корреляционной связи. Связь между качественными признаками на основе таблиц сопряженности. Показатели тесноты связи между двумя количественными признаками. Определение коэффициентов уравнения линейной регрессии методом наименьших квадратов.
контрольная работа [418,7 K], добавлен 22.09.2010Методы построения имитационных моделей экономических объектов. Проведение анализа по результатам численных экспериментов на имитационной модели оптового магазина. Выявление закономерностей, которые помогут в проведении кадровой политики предприятия.
курсовая работа [389,0 K], добавлен 28.11.2010Понятие простой экспертизы. Экспертное оценивание важности объектов. Усреднение экспертных оценок. Попарное сравнение объектов. Сложные экспертизы, метод дерева целей. Общие требования при структурировании проблемы. Применение метода анализа иерархий.
контрольная работа [241,5 K], добавлен 14.02.2011Интервальная оценка показателей безотказности. Формулировка закона надёжности по полностью определённым и цензурированным выборкам. Планы наблюдения за эксплуатацией энергетических объектов. Планирование сроков и объемов технического обслуживания объекта.
презентация [1,2 M], добавлен 23.04.2014Потенциальная возможность математического моделирования любых экономических объектов и процессов. Методы минимизации, связанные с вычислением градиента. Суть метода градиентного спуска. Анализ симплекс-таблицы. Построение экономико-математической модели.
курсовая работа [998,7 K], добавлен 01.10.2011Разработка программной системы, моделирующей продажу автобусных билетов, ее структура, объектно-ориентированный анализ; построение UML-диаграммы: прецедентов, деятельности объектов. Создание классов: свойства, методы, состояние; интерфейс пользователя.
реферат [186,9 K], добавлен 04.02.2011Классификация систем по степени сложности и обусловленности действия, по происхождению и характеру поведения. Составление анкеты для получения экспертных оценок. Построение дерева целей и аттестация сотрудников. Метод экспортных оценок и задачи программ.
контрольная работа [85,4 K], добавлен 18.11.2011