Синтез адаптивных интеллектуальных измерительных систем с применением автоматизированного системно-когнитивного анализа и системы "Эйдос", системная идентификация в эконометрике, биометрии, экологии, педагогике, психологии и медицине
Характеристика интеллектуальных измерительных систем. Описание сути и особенностей применения метода автоматизированного системно-когнитивного анализа. Решение задач многопараметрической типизации и системной идентификации состояний сложных объектов.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 22.05.2017 |
Размер файла | 2,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
3. Произвести расчет матриц абсолютных частот, условных и безусловных процентных распределений и матрицы информативностей, отражающей причинно-следственные связи между значениями факторов и принадлежностью объектов к классам.
Таким образом, информация по задаче - это исходные данные плюс классификационные и описательные шкалы и градации, обучающая выборка, а также матрицы частот, процентных распределений и информативностей.
Процедура преобразования информации в знания - это оценка полезности информации для достижения цели.
Значит знания по задаче - это информация плюс цель и оценка степени полезности информации для достижения этой цели.
Знания получаются из информации, когда мы классифицируем будущие состояния объекта управления как желательные (целевые) и нежелательные.
Банк данных - это базы данных плюс система управления базами данных (СУБД) (стандартные термины). СУБД - это, по сути, система управления данными.
Информационный банк - это информационные базы плюс информационные системы (предлагается стандартизировать эти термины). Информационная система - это, по сути, система управления информацией.
Банк знаний - это базы знаний плюс интеллектуальные системы (стандартные термины). Интеллектуальная система - это, по сути, система управления знаниями.
Итак, измерение рассматривается как процесс получения информации об объекте измерения, в частности о степени выраженности тех или иных его свойств или принадлежности состояния объекта измерения к определенным категориям. Предлагается применить системно-когнитивный анализ как для синтеза, так и для применения адаптивной интеллектуальной измерительной системы с целью измерения не значений параметров объектов, а для идентификации состояний измеряемых систем, т.е. для так называемой системной идентификации. Измерительная система должна быть не проще, чем измеряемая система (вариант принципа Эшби), иначе она не может быть адекватной. Значит, для измерения сложных нелинейных систем должны применяться интеллектуальные технологии, обеспечивающие достаточно высокий уровень сложности баз знаний. Когда мы проводим диагностику (квалиметрию) материалов, то стараемся оценить качество каких-либо параметров в определенных шкалах. Это параметрический подход, который корректен только для линейных объектов (материалов), в которых отдельные параметры практически не влияют друг на друга. Для нелинейных материалов качество надо оценивать не по одному параметру, а по всем сразу и в этом суть системного подхода к квалиметрии, когда качество рассматривается как системное (эмерджентное) свойство.
Математические модели АСК-анализа, применяемые при синтезе и применении адаптивных интеллектуальных измерительных систем, а также численные примеры системной идентификации, более подробно рассматриваются в последующих разделах.
2. Математический метод АСК-анализа - системная теория информации
Первый раздел данной работы посвящен концептуальным основам построения интеллектуальных измерительных систем в АСК-анализе, данный раздел (второй) - математическому методу АСК-анализа, в третьем будет рассмотрен численный пример синтеза интеллектуальной измерительной системы в системе «Эйдос-Х++» и ее применения для системной идентификации состояний сложных систем.
На основе 1-го раздела предлагаются следующие три принципа построения интеллектуальных измерительных систем в АСК-анализе.
1-й принцип состоит на ясном осознании того обстоятельства, что когда мы получаем результаты измерения, то по сути мы получаем некоторое количество информации о том, в каком состоянии находится измеряемый объект. Однако традиционно результаты измерения выражаются в определенных единицах измерения (в частности, единицах измерения физических величин), а не в единицах измерения информации и этим в определенной степени маскируется или скрывается смысл самого измерения, выраженный в 1-м принципе.
2-й принцип, связан с первым и состоит в понимании того, что когда мы получаем результаты измерения то нас интересует не собственно сам этот результат, а количество информации, которое содержится в результате измерения о состоянии объекта измерения, т.е. о том, что нас собственно интересует. Например, когда врач измеряет температуру пациенту то его интересует не эта температура сама по себе как некоторые почему-то думают, а возможность на ее основе сделать выводы о состояния пациента, т.е. о том болен он или нет, и, если болен, то на сколько серьезно и какой у него диагноз и какой выбрать план лечения при этом диагнозе.
3-й принцип состоит в том, что при построении измерительной системы на эмпирических примерах производится градуировка или метризация измерительных шкал, т.е. нанесение на них делений, соответствующих различным степеням выраженности измеряемых свойств у объектов измерения. Затем, когда измерительная система применяется, т.е. при измерении по ранее полученным шкалам получаются некоторые значения, то на основании этих значений делается вывод о том, что состояние измеряемого объекта близко к состоянию тех примеров, которые давали аналогичный результат измерений при построении шкал. По сути 3-й принцип, отражающий этап построения или синтеза измерительной системы, функционально сходен с этапом обучения системы распознавания образов, а этап ее применения сходен с применением системы распознавания для идентификации состояния объекта измерения.
Для того, чтобы реализовать сформулированные принципы в реальной интеллектуальной измерительной системе необходим математический метод, обеспечивающий преобразование данных, полученных в результате измерений, в информацию о состоянии измеряемого объекта. Такой метод существует - это математический метод АСК-анализа, основанный на системной нечеткой интервальной математике (СНИМ) [3, 15] и представляющий собой реализацию идей СНИМ в теории информации.
В этой связи необходимо определить соотношение содержания терминов: «данные», «информация» и «знание» (рисунок 4):
Рисунок 4. Цикл преобразования эмпирических данных в информацию и знания и их применения для прогнозирования и принятия управленческих решений в АСК-анализе
интеллектуальный измерительный когнитивный автоматизированный
Данные рассматриваются как информация, записанная на носителях или находящаяся в каналах связи и представленная в определенной системе кодирования или на определенном языке и рассматриваемая безотносительно к ее смысловому содержанию.
Смысл данных согласно концепции смысла Шенка-Абельсона [21] известен и понятен тогда, когда известны причины и следствия меду событиями, которые описываются этими данными.
Информация представляет собой осмысленные данные, т.е. данные, описывающие события, между которыми выявлены причинно-следственные связи.
Знания - это информация, полезная для достижения целей, т.е. для управления [22].
В этой связи возникает вопрос о математической количественной мере причинно-следственных связей, которая бы адекватно отражала их силу и направление. Из вышесказанного следует, что естественной мерой причинно-следственных связей являются количественные меры информации и в качестве единицы измерения силы и направления причинно-следственных связей могут быть использованы единицы измерения информации. В связи с этой идеей необходимо отметить работу [24], суть которой в применении теории информации для проверки статистических гипотез. Еще в лемме Неймана-Пирсона доказывается, что более вероятна та статистическая гипотеза в пользу которой больше информации. В предисловии к работе [24] А.Н. Колмогоров высоко оценивал это научное направление, но соответствующий поток работ в СССР не возник [25]. По-видимому, АСК-анализ мере можно рассматривать как развитие этого направления прикладной математической статистики, может быть не столько в чисто-математическом теоретическом плане, сколько в прагматически-прикладном [25, 26].
Однако известно довольно много различных количественных мер информации. Поэтому возникает вопрос о том, какая мера информации является наиболее подходящей в нашем случае. По мнению автора это семантическая мера целесообразности информации А.Харкевича [3]. Основным свойством этой меры, предопределяющим ее выбор, является то обстоятельство, что в ее определение органично входит понятие цели. В соответствии с изложенными выше и в работе [22] представлениями автора о соотношении понятий: «Данные», «Информация» и «Знания» это означает, что по сути А.Харкевич предложил количественную меру знаний. Кроме того для вычисления меры А.Харкевича достаточно знать изменение вероятности достижения цели в условиях действия некоторого значения фактора и при его отсутствии, т.е. она вполне может быть рассчитана непосредственно на основе эмпирических данных, что очень важно для практических применений (поэтому и говорят, что эта мера прагматическая).
Операция преобразования данных в информацию называется «анализ данных», представляет собой процедуру выявления смысла в данных, т.е. согласно концепции смысла Шенка-Абельсона, выявление причинно-следственных связей между событиями Причинно-следственные связи, их сила и направление - это вообще не математический термин, а термин, описывающий взаимосвязь событий реальной предметной области. Поэтому выявление причинно-следственных связей непосредственно в данных вообще невозможно, а для этого необходимо предварительно найти в этих данных описания событий., отражаемыми этими данными, и предполагает выполнение следующих этапов:
1. Разработка справочников, содержащих формальное кодированное описание с одной стороны будущих состояний объекта управления, а с другой стороны - факторов их значений, влияющих на этот объект (классификационных и описательных шкал и градаций в терминологии АСК-анализа).
2. Поиск в исходных данных событий, связанных с переходами объекта из одного состояния в другое, и значений факторов, под действием которых эти переходы происходят. При этом в качестве значений факторов могут выступать и переходы объекта из одного состояния в другое в прошлом.
3. Преобразование базы исходных данных в базу событий, т.е. кодирование исходных данных с использованием справочников классов и факторов.
4. Поиск причинно-следственных связей между прошлыми и будущими событиями в базе событий и формальное представление этих причинно-следственных связей в виде базы информативностей.
Таким образом, если исходные базы данных представляют собой временные ряды, то информационная база включает в себя еще дополнительно:
- базы классификационных и описательных шкал и градаций;
- базу событий (т.е. обучающую выборку), представляющую собой закодированную с помощью классификационных и описательных шкал и градаций базу исходных данных;
- базу информативностей, содержащую информацию о силе и направлении влияния значений факторов на переход объекта управления в состояния, соответствующие классам.
Основываясь на работах [3, 16, 18] рассмотрим, математический метод АСК-анализа, обеспечивающей решение поставленных задач. Очень краткое и несколько упрощенное описание автоматизированного системно-когнитивного анализа (АСК-анализ) приведено в работе [27].
В работе [15] (и ряде других) развита идея системного обобщения математики и обоснована актуальность этой идеи. Эта идея актуальна по ряду причин разного рода.
Во-первых, потому, что в мире нет ничего кроме систем, а понятие множества является абстракцией от понятия системы: множество - это система без внутренней структуры. Поэтому математика, основанная на понятии системы, имеет некоторые шансы быть более адекватной, чем классическая математика, в очень большой степени основанная на понятии множества.
Во-вторых, идея системного обобщения математики частично реализована в теории информации, в результате получена некоторые результаты в области системной теории информации (СТИ), в частности получен вариант выражения для семантической меры целесообразности информации А.Харкевича, удовлетворяющий принципу соответствия с формулой Р.Хартли для равновероятного детерминистского случая. Этим преодолена искусственная пропасть между «Теорией передачи данных по каналам связи», как совершенно справедливо называл свою теорию К.Шеннон, интуитивно понимавший различие между данными и информацией, и семантической теорией информации А.Харкевича На наличие этой пропасти, как недостаток прагматической теории информации А.Харкевича, еще в 2003 году указывал д.т.н., проф. В.И.Ключко. Но именно тогда автором и был предложен и обоснован вариант ее преодоления [3]..
В-третьих, в созданной системной теории информации получены разнообразные формы различных коэффициентов эмерджентности: Хартли, Харкевича, Шеннона, для классических систем, подчиняющихся статистике Л.Больцмана [15] и квантовых систем подчиняющихся статистикам Ферми-Дирака и Бозе-Эйнштейна [15]. Смысл этих коэффициентов раскрыт в работе [15] и других. Если резюмировать, то можно сказать, что эти подходы, по-видимому, открывают новые подходы математического моделирования процессов эволюции систем различного рода и масштаба от микро до макро и мега уровней [8, 15, 16] и другие См., например: http://lc.kubagro.ru/, http://elibrary.ru/author_items.asp?authorid=123162 .
Математический метод АСК-анализа основан на системной теории информации (СТИ), которая создана в рамках реализации программной идеи обобщения всех понятий математики, в частности теории информации, базирующихся на теории множеств, путем тотальной замены понятия множества на более общее понятие системы и тщательного отслеживания всех последствий этой замены [15]. Благодаря математическому методу, положенному в основу АСК-анализа, этот метод является непараметрическим и позволяет в реализующей его системе «Эйдос-Х++» сопоставимо обрабатывать десятки и сотни тысяч градаций факторов и будущих состояний нелинейных [28] многопараметрических объектов управления (классов) при неполных (фрагментированных), зашумленных данных числовой и нечисловой природы измеряемых в различных единицах измерения [3, 15].
Итак, будем считать, что информация содержится не только в самих базовых элементах системы, но и в ее подсистемах различной сложности, т.е. состоящих из 2, 3,… m,… M базовых элементов.
Классическая формула Хартли имеет вид [32]:
( 1 )
Будем искать ее системное обобщение в виде [3]:
( 2 )
где: W - количество элементов в множестве.
I - количество информации, которое содержится в факте извлечения одного элемента из множества.
- коэффициент эмерджентности, названный автором в честь Р.Хартли, коэффициентом эмерджентности Хартли См.: В.Вяткин. Групповой плагиат: от студента до министра. - [Электронный ресурс]. Адрес доступа: http://trv-science.ru/2011/11/08/gruppovojj-plagiat-ot-studenta-do-ministra/ .
Суммарное количество таких подсистем для систем, подчиняющихся статистике Ферми-Дирака [15, 29], можно принять равным числу сочетаний. Поэтому примем, что системное обобщение формулы Хартли имеет вид:
( 3 )
где:
- количество подсистем из m элементов;
m - сложность подсистем;
M - максимальная сложность подсистем (максимальное число элементов подсистемы).
Так как , то при M=1 система переходит в множество и выражение (3) приобретает вид (1), т.е. для него выполняется принцип соответствия, являющийся обязательным для более общей теории.
Учитывая, что при M=W:
( 4 )
в этом случае получаем:
( 5 )
Выражение (5) дает оценку максимального количества информации в элементе системы. Из выражения (5) видно, что при увеличении числа элементов W количество информации I быстро стремится к W (6) и уже при W>4 погрешность выражения (5) не превышает 1%:
( 6 )
Приравняв правые части выражений (2) и (3):
( 7 )
получим выражение для коэффициента эмерджентности Хартли:
( 8 )
Смысл этого коэффициента весьма интересен и раскрыт в работах [3, 15] и ряде других См., например: http://lc.kubagro.ru/aidos/_Aidos-X.htm, искать: «эмерджентн». Здесь отметим лишь, что при M1, когда система асимптотически переходит в множество, имеем 1 и (2) (1), как и должно быть согласно принципу соответствия, предложенному Нильсом Бором в 1913 году.
С учетом (8) выражение (2) примет вид:
( 9 )
или при M=W и больших W, учитывая (4) и (5):
( 10 )
Выражение (9) и представляет собой искомое системное обобщение классической формулы Хартли, а выражение (10) - его достаточно хорошее приближение при большом количестве элементов в системе W.
Классическая формула А. Харкевича имеет вид:
( 11)
где: - Pij - условная вероятность перехода объекта в j-е состояние при условии действия на него i-го значения фактора;
- - безусловная вероятность перехода объекта в j-е состояние (вероятность самопроизвольного перехода или вероятность перехода, посчитанная по всей выборке, т.е. при действии любого значения фактора).
Придадим выражению (11) следующий эквивалентный вид (12), который и будем использовать ниже. Вопрос об эквивалентности выражений (11) и (12) рассмотрим позднее.
( 12 )
где: - индекс i обозначает признак (значение фактора): 1 i M;
- индекс j обозначает состояние объекта или класс: 1 j W;
- Pij - условная вероятность наблюдения i-го значения фактора у объектов в j-го класса;
- - безусловная вероятность наблюдения i-го значения фактора по всей выборке.
Из (12) видно, что формула Харкевича для семантической меры информации по сути является логарифмом от формулы Байеса для апостериорной вероятности (отношение условной вероятности к безусловной).
Известно, что классическая формула Шеннона для количества информации для неравновероятных событий преобразуется в формулу Хартли при условии, что события равновероятны, т.е. удовлетворяет фундаментальному принципу соответствия. Поэтому теория информации Шеннона справедливо считается обобщением теории Хартли для неравновероятных событий. Однако, выражения (11) и (12) при подстановке в них реальных численных значений вероятностей Pij, и не дает количества информации в битах, т.е. для этого выражения не выполняется принцип соответствия, обязательный для более общих теорий. Возможно, в этом состоит причина довольно сдержанного, а иногда и скептического отношения специалистов по теории информации Шеннона к семантической теории информации Харкевича.
Причину этого мы видим в том, что в выражениях (11) и (12) отсутствуют глобальные параметры конкретной модели W и M, т.е. в том, что А. Харкевич в своем выражении для количества информации не ввел зависимости от мощности пространства будущих состояний объекта W и количества значений факторов M, обуславливающих переход объекта в эти состояния.
Поставим задачу получить такое обобщение формулы Харкевича, которое бы удовлетворяло тому же самому принципу соответствия, что и формула Шеннона, т.е. преобразовывалось в формулу Хартли в предельном детерминистском равновероятном случае, когда каждому классу (состоянию объекта) соответствует один признак (значение фактора), и каждому признаку - один класс, и эти классы (а, значит и признаки), равновероятны, и при этом каждый фактор однозначно, т.е. детерминистским образом определяет переход объекта в определенное состояние, соответствующее классу.
В детерминистском случае вероятность Pij наблюдения объекта j-го класса при обнаружении у него i-го признака:
.
Будем искать это обобщение (12) в виде:
( 13 )
Найдем такое выражение для коэффициента , названного автором в честь А. Харкевича "коэффициентом эмерджентности Харкевича" См.: В.Вяткин. Групповой плагиат: от студента до министра. - [Электронный ресурс]. Адрес доступа: http://trv-science.ru/2011/11/08/gruppovojj-plagiat-ot-studenta-do-ministra/ , которое обеспечивает выполнение для выражения (13) принципа соответствия с классической формулой Хартли (1) и ее системным обобщением (2) и (3) в равновероятном детерминистском случае.
Для этого нам потребуется выразить вероятности Pij, Pj и Pi через частоты наблюдения признаков по классам (см. табл. 6). В табл. 1 рамкой обведена область значений, переменные определены ранее.
Таблица 6 - МАТРИЦА АБСОЛЮТНЫХ ЧАСТОТ
Классы |
Сумма |
|||||||
1 |
... |
j |
... |
W |
||||
Значения факторов |
1 |
|||||||
... |
||||||||
i |
||||||||
... |
||||||||
M |
||||||||
Суммарное количество признаков |
Алгоритм формирования матрицы абсолютных частот.
Объекты обучающей выборки описываются векторами (массивами) имеющихся у них признаков:
Первоначально в матрице абсолютных частот все значения равны нулю. Затем организуется цикл по объектам обучающей выборки. Если предъявленного объекта, относящегося к j-му классу, есть i-й признак, то:
Здесь можно провести очень интересную и важную аналогию между способом формирования матрицы абсолютных частот и работой многоканальной системы выделения полезного сигнала из шума. Представим себе, что все объекты, предъявляемые для формирования обобщенного образа некоторого класса, в действительности являются различными реализациями одного объекта - "Эйдоса" в смысле Платона [30], по-разному зашумленного различными случайными обстоятельствами. И наша задача состоит в том, чтобы подавить этот шум и выделить из него то общее и существенное, что отличает объекты данного класса от объектов других классов. Учитывая, что шум чаще всего является "белым" и имеет свойство при суммировании с самим собой стремиться к нулю, а сигнал при этом, наоборот, возрастает пропорционально количеству слагаемых, то увеличение объема обучающей выборки приводит ко все лучшему отношению сигнал/шум в матрице абсолютных частот, т.е. к выделению полезной информации из шума. Примерно так мы начинаем постепенно понимать смысл фразы, которую мы сразу не расслышали по телефону и несколько раз переспрашивали. При этом в повторах шум не позволяет понять то одну, то другую часть фразы, но в конце концов за счет использования памяти и интеллектуальной обработки информации мы понимаем ее всю. Так и объекты, описанные признаками, можно рассматривать как зашумленные фразы, несущие нам информацию об обобщенных образах классов - "Эйдосах" [30], к которым они относятся. И эту информацию мы выделяем из шума при синтезе модели.
Для выражения (11):
( 14 )
Для выражений (12) и (13):
( 15 )
Для выражений (11), (12) и (13):
( 16 )
В (16) использованы обозначения:
Nij - суммарное количество наблюдений в исследуемой выборке факта: "действовало i-е значение фактора и объект перешел в j-е состояние";
- суммарное по всей выборке количество встреч различных факторов у объектов, перешедших в j-е состояние;
- суммарное количество встреч i-го фактора у всех объектов исследуемой выборки;
- суммарное количество встреч различных значений факторов у всех объектов исследуемой выборки.
Формирование матрицы условных и безусловных процентных распределений.
На основе анализа матрицы частот (табл. 1) классы можно сравнивать по наблюдаемым частотам признаков только в том случае, если количество объектов по всем классам одинаково, как и суммарное количество признаков по классам. Если же они отличаются, то корректно сравнивать классы можно только по условным и безусловным относительным частотам (оценкам вероятностей) наблюдений признаков, посчитанных на основе матрицы частот (табл. 1) в соответствии с выражениями (14) и (15), в результате чего получается матрица условных и безусловных процентных распределений (табл. 7).
При расчете матрицы оценок условных и безусловных вероятностей Nj из табл. 1 могут браться либо из предпоследней, либо из последней строки. В 1-м случае Nj представляет собой "Суммарное количество признаков у всех объектов, использованных для формирования обобщенного образа j-го класса", а во 2-м случае - это "Суммарное количество объектов обучающей выборки, использованных для формирования обобщенного образа j-го класса", соответственно получаем различные, хотя и очень сходные семантические информационные модели, которые мы называем СИМ-1 и СИМ-2. Оба этих вида моделей поддерживаются системой "Эйдос".
Таблица 7 - МАТРИЦА УСЛОВНЫХ И БЕЗУСЛОВНЫХ ПРОЦЕНТНЫХ РАСПРЕДЕЛЕНИЙ
Классы |
Безусловная вероятность признака |
|||||||
1 |
... |
j |
... |
W |
||||
Значения факторов |
1 |
|||||||
... |
||||||||
i |
||||||||
... |
||||||||
M |
||||||||
Безусловная вероятность класса |
Эквивалентность выражений (11) и (12) устанавливается, если подставить в них выражения относительных частот как оценок вероятностей Pij, и через абсолютные частоты наблюдения признаков по классам из (14), (15) и (16). В обоих случаях из выражений (11) и (12) получается одно и то же выражение (17):
( 17 )
А из (13) - выражение (18), с которым мы и будем далее работать.
( 18 )
При взаимно-однозначном соответствии классов и признаков в равновероятном детерминистском случае имеем (таблица 8):
Таблица 8 - МАТРИЦА ЧАСТОТ В РАВНОВЕРОЯТНОМ ДЕТЕРМИНИСТСКОМ СЛУЧАЕ
Классы |
Сумма |
|||||||
1 |
... |
j |
... |
W |
||||
Значения факторов |
1 |
1 |
1 |
|||||
... |
1 |
1 |
||||||
i |
1 |
1 |
||||||
... |
1 |
1 |
||||||
M |
1 |
1 |
||||||
Сумма |
1 |
1 |
1 |
1 |
1 |
В этом случае к каждому классу относится один объект, имеющий единственный признак. Откуда получаем для всех i и j равенства (19):
( 19 )
Таким образом, обобщенная формула А. Харкевича (18) с учетом (19) в этом случае приобретает вид:
( 20 )
откуда:
( 21 )
или, учитывая выражение для коэффициента эмерджентности Хартли (8):
( 22 )
Выражения (21) и (22) получены автором в 2002 году [3] и названы коэффициентом эмерджентности А.Харкевича, т.к. имеют очевидную связь с его формулой для количества информации. Эти коэффициенты имеют весьма глубокий смысл, который автор попытался раскрыть в работах [3, 15] и ряде других.
Подставив коэффициент эмерджентности А.Харкевича (21) в выражение (18), получим:
или окончательно:
( 23 )
Отметим, что 1-я задача получения системного обобщения формул Хартли и Харкевича и 2-я задача получения такого обобщения формулы Харкевича, которая удовлетворяет принципу соответствия с формулой Хартли - это две разные задачи. 1-я задача является более общей и при ее решении, которое приведено выше, автоматически решается и 2-я задача, которая является, таким образом, частным случаем 1-й.
Однако представляет самостоятельный интерес и частный случай, в результате которого получается формула Харкевича, удовлетворяющая в равновероятном детерминистском случае принципу соответствия с классической формулой Хартли (1), а не с ее системным обобщением (2) и (3). Ясно, что эта формула получается из (23) при =1.
( 24 )
Из выражений (21) и (22) видно, что в этом частном случае, т.е. когда система эквивалентна множеству (M=1), коэффициент эмерджентности А.Харкевича приобретает вид:
( 25 )
На практике для численных расчетов удобнее пользоваться не выражениями (23) или (24), а формулой (26), которая получается непосредственно из (18) после подстановки в него выражения (25):
( 26 )
Используя выражение (26) и данные таблицы 1 непосредственно прямым счетом получаем матрицу знаний (таблица 9):
Таблица 9 - МАТРИЦА ЗНАНИЙ (ИНФОРМАТИВНОСТЕЙ)
Классы |
Значимость фактора |
|||||||
1 |
... |
j |
... |
W |
||||
Значения факторов |
1 |
|||||||
... |
||||||||
i |
||||||||
... |
||||||||
M |
||||||||
Степень редукции класса |
Здесь - это среднее количество знаний в i-м значении фактора:
Когда количество информации Iij > 0 - i-й фактор способствует переходу объекта управления в j-е состояние, когда Iij < 0 - препятствует этому переходу, когда же Iij = 0 - никак не влияет на это. В векторе i-го фактора (строка матрицы информативностей) отображается, какое количество информации о переходе объекта управления в каждое из будущих состояний содержится в том факте, что данный фактор действует. В векторе j-го состояния класса (столбец матрицы информативностей) отображается, какое количество информации о переходе объекта управления в соответствующее состояние содержится в каждом из факторов.
Таким образом, матрица знаний (информативностей), приведенная в таблице 6, является обобщенной таблицей решений, в которой входы (факторы) и выходы (будущие состояния объекта управления) связаны друг с другом не с помощью классических (Аристотелевых) импликаций, принимающих только значения: "истина" и "ложь", а различными значениями истинности, выраженными в битах, и принимающими значения от положительного теоретически-максимально-возможного ("максимальная степень истинности"), до теоретически неограниченного отрицательного ("степень ложности"). Это позволяет автоматически формулировать прямые и опосредованные правдоподобные высказывания с расчетной степенью истинности.
Фактически предложенная модель позволяет осуществить синтез обобщенных таблиц решений для различных предметных областей непосредственно на основе эмпирических исходных данных и продуцировать прямые и обратные правдоподобные (нечеткие) логические рассуждения по неклассическим схемам с различными расчетными значениями истинности, являющимися обобщением классических импликаций.
Таким образом, данная модель позволяет рассчитать, какое количество информации содержится в любом факте о наступлении любого события в любой предметной области, причем для этого не требуется повторности этих фактов и событий. Если данные повторности осуществляются и при этом наблюдается некоторая вариабельность значений факторов, обуславливающих наступление тех или иных событий, то модель обеспечивает многопараметрическую типизацию, т.е. синтез обобщенных образов классов или категорий наступающих событий с количественной оценкой степени и знака влияния на их наступление различных значений факторов. Причем эти значения факторов могут быть как количественными, так и качественными и измеряться в любых единицах измерения, в любом случае в модели оценивается количество информации, которое в них содержится о наступлении событий, переходе объекта управления в определенные состояния или, просто, о его принадлежности к тем или иным классам. Другие способы метризации приведены в работе [9]. Все они реализованы в системно-когнитивном анализе и интеллектуальной системе «Эйдос» и обеспечивают сопоставление градациям всех видов шкал числовых значений, имеющих смысл количества информации в градации о принадлежности объекта к классу. Поэтому является корректным применение интегральных критериев, включающих операции умножения и суммирования, для обработки числовых значений, соответствующих градациям шкал. Это позволяет единообразно и сопоставимо обрабатывать эмпирические данные, полученные с помощью любых типов шкал, применяя при этом все математические операции.
Информационный портрет класса - это список значений факторов, ранжированных в порядке убывания силы их влияния на переход объекта управления в состояние, соответствующее данному классу. Информационный портрет класса отражает систему его детерминации. Генерация информационного портрета класса представляет собой решение обратной задачи прогнозирования, т.к. при прогнозировании по системе факторов определяется спектр наиболее вероятных будущих состояний объекта управления, в которые он может перейти под влиянием данной системы факторов, а в информационном портрете мы, наоборот, по заданному будущему состоянию объекта управления определяем систему факторов, детерминирующих это состояние, т.е. вызывающих переход объекта управления в это состояние. В начале информационного портрета класса идут факторы, оказывающие положительное влияние на переход объекта управления в заданное состояние, затем факторы, не оказывающие на это существенного влияния, и далее - факторы, препятствующие переходу объекта управления в это состояние (в порядке возрастания силы препятствования). Информационные портреты классов могут быть от отфильтрованы по диапазону факторов, т.е. мы можем отобразить влияние на переход объекта управления в данное состояние не всех отраженных в модели факторов, а только тех, коды которых попадают в определенный диапазон, например, относящиеся к определенным описательным шкалам.
Информационный (семантический) портрет фактора - это список классов, ранжированный в порядке убывания силы влияния данного фактора на переход объекта управления в состояния, соответствующие данным классам. Информационный портрет фактора называется также его семантическим портретом, т.к. в соответствии с концепцией смысла системно-когнитивного анализа, являющейся обобщением концепции смысла Шенка-Абельсона [21], смысл фактора состоит в том, какие будущие состояния объекта управления он детерминирует или обуславливает. Сначала в этом списке идут состояния объекта управления, на переход в которые данный фактор оказывает наибольшее влияние, затем состояния, на которые данный фактор не оказывает существенного влияния, и далее состояния - переходу в которые данный фактор препятствует. Информационные портреты факторов могут быть от отфильтрованы по диапазону классов, т.е. мы можем отобразить влияние данного фактора на переход объекта управления не во все возможные будущие состояния, а только в состояния, коды которых попадают в определенный диапазон, например, относящиеся к определенным классификационным шкалам.
Прямые и обратные, непосредственные и опосредованные правдоподобные логические рассуждения с расчетной степенью истинности в системной теории информации.
Одним из первых ученых, поднявших и широко обсуждавшим в своих работах проблематику правдоподобных рассуждений, был известный венгерский, швейцарский и американский математик Дьердь Пойа [31], книги которого подарил автору его школьный учитель математики Михаил Ильич Перевалов, за что автор ему очень благодарен (см. также раздел «Формализация логики правдоподобных рассуждений Д. Пойа», глава третья, параграф 7, с.158-163, исходящий из (репрезентативной) теории измерений). Разве мог он тогда предположить, что через много лет в работе [3] Примерно через 33 года. Все же, наверное, мог предположить. Иначе зачем было бы дарить эти книги. им будет предложена логическая форма представления правдоподобных логических рассуждений с расчетной степенью истинности, которая определяется в соответствии с системной теорией информацией непосредственно на основе эмпирических данных
Перевалов Михаил Ильич, учитель математики СШ№31 г.Краснодара, примерно 1970 год Фото автора
В качестве количественной меры влияния факторов, предложено использовать обобщенную формулу А.Харкевича, полученную на основе предложенной эмерджентной теории информации. При этом непосредственно из матрицы абсолютных частот рассчитывается база знаний (табл.4), которая и представляет собой основу содержательной информационной модели предметной области.
Весовые коэффициенты табл.4 непосредственно определяют, какое количество информации Iij система управления получает о наступлении события: "активный объект управления перейдет в j-е состояние", из сообщения: "на активный объект управления действует i-й фактор".
Принципиально важно, что эти весовые коэффициенты не определяются экспертами неформализуемым способом на основе интуиции и профессиональной компетенции (т.е. фактически «на глазок»), а рассчитываются непосредственно на основе эмпирических данных и удовлетворяют всем ранее обоснованным в работе [3] требованиям, т.е. являются сопоставимыми, содержательно интерпретируемыми, отражают понятия "достижение цели управления" и "мощность множества будущих состояний объекта управления" и т.д.
В работе [3] обосновано, что предложенная информационная мера обеспечивает сопоставимость индивидуальных количеств информации, содержащейся в факторах о классах, а также сопоставимость интегральных критериев, рассчитанных для одного объекта и разных классов, для разных объектов и разных классов.
Когда количество информации Iij>0 - i-й фактор способствует переходу объекта управления в j-е состояние, когда Iij<0 - препятствует этому переходу, когда же Iij=0 - никак не влияет на это. В векторе i-го фактора (строка матрицы информативностей) отображается, какое количество информации о переходе объекта управления в каждое из будущих состояний содержится в том факте, что данный фактор действует. В векторе j-го состояния класса (столбец матрицы информативностей) отображается, какое количество информации о переходе объекта управления в соответствующее состояние содержится в каждом из факторов.
Таким образом, матрица информативностей (табл.4) является обобщенной таблицей решений, в которой входы (факторы) и выходы (будущие состояния активного объекта управления (АОУ) связаны друг с другом не с помощью классических (Аристотелевских) импликаций, принимающих только значения: "Итина" и "Ложь", а различными значениями истинности, выраженными в битах и принимающими значения от положительного теоретически-максимально-возможного ("Максимальная степень истинности"), до теоретически неограниченного отрицательного ("Степень ложности").
Фактически предложенная модель позволяет осуществить синтез обобщенных таблиц решений для различных предметных областей непосредственно на основе эмпирических исходных данных и продуцировать на их основе прямые и обратные правдоподобные (нечеткие) логические рассуждения по неклассическим схемам с различными расчетными значениями истинности, являющимся обобщением классических импликаций (табл. 10).
Таблица 10 - Прямые и обратные правдоподобные логические высказывания с расчетной в соответствии с системной теорией информации (СТИ) степенью истинности импликаций
Приведем пример более сложного высказывания, которое может быть рассчитано непосредственно на основе матрицы информативностей - обобщенной таблицы решений (табл. 4): «Если A, со степенью истинности (A,B), детерминирует B, и если С, со степенью истинности (C,D), детерминирует D, и A совпадает по смыслу с C со степенью истинности (A,C), то это вносит вклад в совпадение B с D, равный степени истинности (B,D)».
При этом в прямых рассуждениях как предпосылки рассматриваются факторы, а как заключение - будущие состояния АОУ, а в обратных - наоборот: как предпосылки - будущие состояния АОУ, а как заключение - факторы. Степень истинности i-й предпосылки - это просто количество информации Iij, содержащейся в ней о наступлении j-го будущего состояния АОУ. Если предпосылок несколько, то степень истинности наступления j-го состояния АОУ равна суммарному количеству информации, содержащемуся в них об этом. Количество информации в i-м факторе о наступлении j-го состояния АОУ, рассчитывается в соответствии с выражениями системной теории информации (СТИ).
Прямые правдоподобные логические рассуждения позволяют прогнозировать степень достоверности наступления события по действующим факторам, а обратные - по заданному состоянию восстановить степень необходимости и степень нежелательности каждого фактора для наступления этого состояния, т.е. принимать решение по выбору управляющих воздействий на АОУ, оптимальных для перевода его в заданное целевое состояние.
Приведем простой пример, когда безупречная классическая бинарная логика Аристотеля дает сбой. Рассмотрим высказывания:
А) если студент хорошо сдал экзамен по информационным системам, значит, он умеет хорошо программировать;
Б) если студент умеет хорошо программировать, то он может стать хорошим специалистом в области прикладной информатики.
Откуда средствами логики предикатов получаем вывод:
В) если студент хорошо сдал экзамен по информационным системам, то он может стать хорошим специалистом в области прикладной информатики.
Если при рассмотрении каждого высказывания «А» и «Б» по отдельности у нас не возникает особых возражений, хотя мы сразу чувствуем здесь какой-то подвох, что это не совсем так или не всегда так и легко можем привести вполне реальные примеры, когда эти высказывания могут быть и ложными, то высказывание «В» уже само по себе выглядит очень сомнительным, т.е. проще говоря ложным, тогда как в логике предикатов оно является истинным. Интуитивно мы хорошо понимаем, почему так получается. Дело в том, что в этих высказываниях не отражен контекст, т.е. та огромная слабо формализованная и вообще неформализованная информация об объекте моделирования, которой располагает человек, но не располагает логическая система. Например, в этих двух логических высказываниях не отражена информация, которой располагает каждый преподаватель и студент, о том, каким образом иногда сдаются экзамены, когда оценка вообще никак не зависит от знаний. Иначе говоря, чтобы эти высказывания были истинны необходимо, чтобы оценка определялась только знаниями. Но и этого мало. Предполагается, что факт получения хорошей оценки по дисциплине означает полное ее освоение, хотя все понимают, что для этого достаточно освоения только тех вопросов, которые были в билете и были заданы преподавателем (кроме того существуют и весьма распространены и другие варианты).
При решении этой же задачи средами АСК-анализа мы формулируем эти высказывания в форме правдоподобных рассуждений:
А) если студент хорошо сдал экзамен по информационным системам, то в этом факте содержится I(A) информации о том, что он умеет хорошо программировать;
Б) если студент умеет хорошо программировать, то в этом факте содержится I(Б) информации о том он может стать хорошим специалистом в области прикладной информатики.
Откуда средствами АСК-анализа получаем результирующее высказывание:
В) если студент хорошо сдал экзамен по информационным системам, то в этом факте содержится I(В) информации о том он может стать хорошим специалистом в области прикладной информатики.
Это высказывание не выглядит как истинное или ложное и может быть и истинным, и ложным, причем в различной степени, в зависимости от знака и модуля его расчетной степени истинности I(В)=F(I(A), I(В)). Для расчета этой величины нужны конкретные эмпирические данные, являющиеся репрезентативными для отражения определенной предметной области (генеральной совокупности), в которой этот вывод и будет иметь эти значения знака и величины степени истинности.
Итак, описанная в данном разделе математическая модель реализована в программном инструментарии АСК-анализа - универсальной когнитивной аналитической системе «Эйдос-Х++». Как следует из самого названия системы это сделано в универсальной постановке не зависящей от предметной области. Поэтому система «Эйдос-Х++» может быть применена, и фактически и была применена, в самых различных предметных областях для построения интеллектуальных измерительных систем и интеллектуальных систем управления, а также для решения задач идентификации, прогнозирования и приятия решений [8, 16, 33-60, 62].
Более подробной численный пример применения данного математического метода и реализующей его системы «Эйдос-Х++» для построения интеллектуальной измерительной системы для системной идентификации состояний сложных систем приводится в следующем третьем разделе данной статьи.
3. Применение АСК-анализа и системы «Эйдос» для интеллектуальных измерений и идентификации состояний сложных нелинейных систем
В первом разделе данной статьи предлагается применить автоматизированный системно-когнитивный анализ (АСК-анализ) как для синтеза, так и для применения адаптивной интеллектуальной измерительной системы с целью измерения не значений параметров объектов, а для идентификации состояний сложных систем, т.е. для так называемой системной идентификации. Применение данного подхода является корректным для измерения состояний сложных многофакторных нелинейных динамических систем.
Во втором разделе статьи кратко рассматривается математический метод АСК-анализа, реализованный в его программном инструментарии - универсальной когнитивной аналитической системе «Эйдос-Х++». Математический метод АСК-анализа основан на системной теории информации (СТИ), которая создана в рамках реализации программной идеи обобщения всех понятий математики, в частности теории информации, базирующихся на теории множеств, путем тотальной замены понятия множества на более общее понятие системы и тщательного отслеживания всех последствий этой замены [3, 15]. Благодаря математическому методу, положенному в основу АСК-анализа, этот метод является непараметрическим и позволяет сопоставимо обрабатывать десятки и сотни тысяч градаций факторов и будущих состояний нелинейного объекта управления (классов) при неполных (фрагментированных), зашумленных данных числовой и нечисловой природы измеряемых в различных единицах измерения.
В данном разделе статьи приводится численный пример применения АСК-анализа и системы «Эйдос-Х++» как для синтеза системно-когнитивной модели, обеспечивающей многопараметрическую типизацию состояний сложных систем, так и для системной идентификации их состояний, а также для принятии решений об управляющем воздействии, так изменяющем состав объекта управления, чтобы его качество (уровень системности) максимально повышалось при минимальных затратах на это Что соответствует принципам Функционально-Стоимостного Анализа и метода Директ-Костинг. . В данном разделе для численного примера в качестве сложной системы выбран коллектив фирмы, а его компонент - сотрудники и кандидаты (персонал). Однако необходимо отметить, что этот пример следует рассматривать шире, т.к. АСК-анализ и система «Эйдос» разрабатывались и реализовались в очень обобщенной постановке, постановке, не зависящей от предметной области, и с успехом могут быть применены и в других областях [4, 33-60, 62].
3.1 Решение 1-й задачи - многопараметрической типизации состояний сложных объектов
Решение 1-й задачи является стандартным для системы «Эйдос», т.е. она предназначена для решения подобных задач и соответствующие применения описаны в работах автора [33, 60] Для удобства читателей ссылки на эти и другие работы даны с сайта автора: http://lc.kubagro.ru/ а также в РИНЦ: http://elibrary.ru/author_items.asp?authorid=123162 . В соответствии с этапами АСК-анализа и порядком преобразования данных в информацию, а ее в знания [22], рассмотрим Excel-таблицу исходных данных (таблица 11).
Таблица 11 - Исходные данные для синтеза системно-когнитивной модели управления качеством системы путем управления ее составом Для численной иллюстрации излагаемых подходов в статье используется чрезвычайно упрощенный условный пример малой размерности, связанный с управлением персоналом фирмы. Таблица исходных данных представлена в графической форме с высоким разрешением, что обеспечивает хорошую читабельность при увеличении масштаба просмотра
В этой таблице колонки со 2-й по 4-ю являются классификационными измерительными шкалами, а с 5-й по последнюю - описательными измерительными шкалами. Каждая классификационная шкала представляет собой должность, а ее градации (классы) отражают различную степень успешности работы на этой должности. Описательные шкалы представляют собой личностные и профессиональные свойства сотрудников, а градации (признаки) - степень их выраженности. Отметим, что в приведенном упрощенном численном примере классы не являются профессиональными категориями с указанием степени успешности (например: МЕНЕДЖЕР ТОРГОВОГО ЗАЛА - хорошо подходит), а признаки респондентов не являются их личностными свойствами (например: ФАКТОР А: «ЗАМКНУТОСТЬ - ОБЩИТЕЛЬНОСТЬ» - 8 баллов). Поэтому от читателя требуется некоторая фантазия, чтобы представить себе, что это так. Но суть примера от этого не меняется, и он позволяет нам проиллюстрировать излагаемые в данной статье идеи. Каждому респонденту соответствует строка, в которой он описан и своими свойствами, и принадлежностью к классам. Таким образом, исходные данные в содержательной форме, представленные в таблице 1, эквивалентны такому количеству обучающих выборок, сколько возможно различных способов группировки данных, описанными описательными шкалами и градациями по классам. На основе этих данных и решается 1-я задача многопараметрической типизации, результаты которой отражены в системно-когнитивной модели. В системе «Эйдос» осуществляется нормализация базы исходных данных путем автоматической разработки классификационных и описательных шкал и градаций и кодирования с их использованием исходных данных и представления их в форме эвентологической базы данных (рисунок 5):
Подобные документы
Предмет и этапы когнитивного анализа задач, его основные методы и их реализация на псевдокодовом языке. Виды факторов, использующихся при когнитивном моделировании систем. Предъявляемые к библиотеке требования, оценка ее экономической эффективности.
дипломная работа [1,3 M], добавлен 29.01.2013Понятия в области метрологии. Представление знаний в интеллектуальных системах. Методы описания нечетких знаний в интеллектуальных системах. Классификация интеллектуальных систем, их структурная организация. Нечеткие системы автоматического управления.
курсовая работа [768,2 K], добавлен 16.02.2015Применение и развитие измерительной техники. Сущность, значение и классификация информационных измерительных систем, их функции и признаки. Характеристика общих принципов их построения и использования. Основные этапы создания измерительных систем.
реферат [25,9 K], добавлен 19.02.2011Разработка системы автоматизированного анализа сложных объектов образовательной системы. Построение диаграмм последовательности, кооперации, классов, состояний, компонентов, а также развертывания. Представление сгенерированных кодов клиента и сервера.
курсовая работа [501,1 K], добавлен 23.06.2014Изучение современных принципов, подходов и методов моделирования сложно формализуемых объектов. Решение задач структурной и параметрической идентификации. Характеристики вычислительных систем как сложных систем массового обслуживания. Теория потоков.
курс лекций [2,3 M], добавлен 18.02.2012Определение структуры информационно-измерительных систем и устройств сопряжения с ЭВМ. Расчет метрологических характеристик измерительных каналов. Протокол измерений значений функции преобразования ИК ИИС. Продолжительность межповерочных интервалов.
курсовая работа [171,4 K], добавлен 22.03.2015AutoCAD как одна из самых популярных графических систем автоматизированного проектирования, круг выполняемых ею задач и функций. Технология автоматизированного проектирования и методика создания чертежей в системе AutoCAD. Создание и работа с шаблонами.
лекция [58,9 K], добавлен 21.07.2009Инструментальные средства проектирования интеллектуальных систем. Анализ традиционных языков программирования и представления знаний. Использование интегрированной инструментальной среды G2 для создания интеллектуальных систем реального времени.
контрольная работа [548,3 K], добавлен 18.05.2019Понятие искусственного интеллекта и интеллектуальной системы. Этапы развития интеллектуальных систем. Модели представления знаний, процедурный (алгоритмический) и декларативный способы их формализации. Построение концептуальной модели предметной области.
презентация [80,5 K], добавлен 29.10.2013Формулировка поставленной задачи при конструировании систем управления для идентификации нестационарных объектов. Изучение основ алгоритмического конструирования системы с неполной информацией. Рассмотрение использования метода адаптивной идентификации.
курсовая работа [110,8 K], добавлен 10.08.2014