Системная теория информации и семантическая информационная модель

Исследование теоретических основ системной теории информации. Семантическая информационная модель СК – анализа и свойства математической модели: сходимость, адекватность, устойчивость. Взаимосвязь математической модели СК - анализа с другими моделями.

Рубрика Программирование, компьютеры и кибернетика
Вид книга
Язык русский
Дата добавления 26.08.2010
Размер файла 3,5 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

2. Измерение валидности модели на оставшемся подмножестве обучающей выборки, не использованном для синтеза модели.

Поскольку оба случайных подмножества имеют переменный состав по объектам обучающей выборки, то подобная процедура должна повторяться много раз, после чего могут быть рассчитаны статистические характеристики адекватности модели, например, такие как:

- средняя внешняя валидность;

- среднеквадратичное отклонение текущей внешней валидности от средней и другие.

Достоинство бутстрепного подхода к оценке адекватности модели состоит в том, что он позволяет измерить внешнюю валидность на уже имеющейся выборке и изучить статистические характеристики, характеризующие адекватность модели при изменении объема и состава выборки.

Непараметричность модели. Робастные процедуры и фильтры для исключения артефактов

Предложенная семантическая информационная модель является непараметрической, т.к. базируется на системной теории информации [64], которая никоим образом не основана на предположениях о нормальности распределений исследуемой выборки.

Под робастными понимаются процедуры, обеспечивающие устойчивую работу модели на исходных данных, зашумленных артефактами, т.е. данными, выпадающими из общих статистических закономерностей, которым подчиняется исследуемая выборка.

Критерий выявления артефактов, реализованный в СК-анализе, основан на том, что при увеличении объема статистики частоты значимых атрибутов растут, как правило, пропорционально объему выборки, а частоты артефактов так и остаются чрезвычайно малыми, близкими к единице. Таким образом, выявление артефактов возможно только при достаточно большой статистике, т.к. в противном случае недостаточно информации о поведении частот атрибутов с увеличением объема выборки.

В модели реализована такая процедура удаления наиболее вероятных артефактов, и она, как показывает опыт, существенно повышает качество (адекватность) модели.

Методика численных расчетов СК-анализа

Детальный список БКОСА и их алгоритмов

В таблице 25 приведен детальный список базовых когнитивных операций системного анализа, которым соответствует 24 алгоритма, которые здесь привести нет возможности из-за их объемности. Но они все приведены в полном виде в работе [64].

Иерархическая структура данных семантической информационной модели СК-анализа

На рисунке 43 приведена в обобщенном виде иерархическая структура баз данных семантической информационной модели системно-когнитивного анализа. На этой схеме базы данных обозначены прямоугольниками, а базовые когнитивные операции системного анализа, преобразующие одну базу в другую - стрелками с надписями. Имеются также базовые когнитивные операции, формирующие выходные графические формы. Из этой схемы видно, что одни базовые когнитивные операции готовят данные для других операций, относящихся к более высоким уровням иерархии системы процессов познания. Этим определяется возможная последовательность выполнения базовых когнитивных операций.

Иерархическая структура баз данных семантической информационной модели системно-когнитивного анализа

Специальный программный инструментарий СК-анализа - система "Эйдос"

На таблице 26 показана обобщенная схема когнитивной аналитической системы "Эйдос", которая реализует математическую модель и численный метод системно-когнитивного анализа и, таким образом, является его инструментарием. В состав данной системы входит 7 подсистем.

Первые 3 подсистемы являются инструментальными, т.е. позволяют осуществлять синтез и адаптацию модели. Остальные 4 подсистемы обеспечивают идентификацию, прогнозирование и кластерно-конструктивный анализ модели, в т.ч. верификацию модели и выработку управляющих воздействий.

Система "Эйдос" является довольно большой системой: распечатка ее исходных текстов 6-м шрифтом составляет около 800 листов, она генерирует 54 графических формы (двумерные и трехмерные) и 50 текстовых форм. На данную систему и системы окружения получено 8 свидетельств РосПатента РФ.

Таблица- ОБОБЩЕННАЯ СТРУКТУРА УНИВЕРСАЛЬНОЙ КОГНИТИВНОЙ АНАЛИТИЧЕСКОЙ СИСТЕМЫ "ЭЙДОС"

Подсистема

Режим

Функция

Операция

1.

Словари

1. Классификационные шкалы и градации

2. Описательные шкалы (и градации)

3. Градации описательных шкал (признаки)

4. Иерархические уровни систем

1. Уровни классов

2. Уровни признаков

5. Программные интерфейсы для импорта данных

1. Импорт данных из TXT-фалов стандарта DOS-текст

2. Импорт данных из DBF-файлов стандарта проф. А.Н.Лебедева

3. Импорт из транспонированных DBF-файлов проф. А.Н.Лебедева

4. Генерация шкал и обучающей выборки RND-модели

5. Генерация шкал и обучающей выборки для исследования чисел

6. Транспонирование DBF-матриц исходных данных

6. Почтовая служба по НСИ

1. Обмен по классам

2. Обмен по обобщенным признакам

3. Обмен по первичным признакам

7. Печать анкеты

2.

Обучение

1. Ввод-корректировка обучающей выборки

2. Управление обучающей выборкой

1. Параметрическое задание объектов для обработки

2. Статистическая характеристика, ручной ремонт

3. Автоматический ремонт обучающей выборки

3. Пакетное обучение системы распознавания

1. Накопление абсолютных частот

2. Исключение артефактов (робастная процедура)

3. Расчет информативностей признаков

4. Расчет условных процентных распределений

5. Автоматическое выполнение режимов 1-2-3-4

6. Измерение сходимости и устойчивости модели

1. Сходимость и устойчивость СИМ

2. Зависимость валидности модели от объема обучающей выборки

4. Почтовая служба по обучающей информации

3.

Оптимизация

1. Формирование ортонормированного базиса классов

2. Исключение признаков с низкой селективной силой

3. Удаление классов и признаков, по которым недостаточно данных

4.

Распознавание

1. Ввод-корректировка распознаваемой выборки

2. Пакетное распознавание

3. Вывод результатов распознавания

1. Разрез: один объект - много классов

2. Разрез: один класс - много объектов

4. Почтовая служба по распознаваемой выборке

5.

Типология

1. Типологический анализ классов распознавания

1. Информационные (ранговые) портреты (классов)

2. Кластерный и конструктивный анализ классов

1 Расчет матрицы сходства образов классов

2. Генерация кластеров и конструктов классов

3. Просмотр и печать кластеров и конструктов

4. Автоматическое выполнение режимов: 1,2,3

5. Вывод 2d семантических сетей классов

3. Когнитивные диаграммы классов

2. Типологический анализ первичных признаков

1. Информационные (ранговые) портреты признаков

2. Кластерный и конструктивный анализ признаков

1. Расчет матрицы сходства образов признаков

2. Генерация кластеров и конструктов признаков

3. Просмотр и печать кластеров и конструктов

4. Автоматическое выполнение режимов: 1,2,3

5. Вывод 2d семантических сетей признаков

3. Когнитивные диаграммы признаков

6. Анализ

1. Оценка достоверности заполнения объектов

2. Измерение адекватности семантической информационной модели

3. Измерение независимости классов и признаков

4. Просмотр профилей классов и признаков

5. Графическое отображение нелокальных нейронов

6. Отображение Паретто-подмножеств нейронной сети

7. Классические и интегральные когнитивные карты

Подсистема

Режим

Функция

Операция

7.

Сервис

1. Генерация (сброс) БД

1. Все базы данных

2. НСИ

1. Всех баз данных

2. БД классов

3. БД первичных признаков

4. БД обобщенных признаков

3. Обучающая выборка

4. Распознаваемая выборка

5. Базы данных статистики

2. Переиндексация всех баз данных

3. Печать БД абсолютных частот

4. Печать БД условных процентных распределений

5. Печать БД информативностей

6. Интеллектуальная дескрипторная информационно-поисковая система

Выводы

Интервальные оценки сводят анализ чисел к анализу фактов и позволяют обрабатывать количественные величины как нечисловые данные. Это ограничивает возможности обработки количественных величин методами обработки нечисловых данных. В математической модели СК-анализа, основанной на системной теории информации, наоборот, качественным, нечисловым данным, сопоставляются количественные величины. Это позволяет использовать все возможности количественных методов для исследования нечисловых данных.

Таким образом, в СК-анализе числовые и нечисловые данные обрабатываются единообразно на основе единой математической модели как числовые данные.

Рассматривается связь метода измерения адекватности модели в СК-анализе с бутстрепными методами.

Описывается робастная процедура выявления и устранения артефактов в СК-анализе.

Резюме

1. Сформулированы требования к математической модели и к численной мере. Затем на их основе обоснован выбор базовой численной меры. Для этого рассмотрены три вида информации: абсолютная, относительная и аналитическая информация. Предпочтение отдано аналитической форме информации, к которой принадлежат относительные вероятности, относительные проценты и количество информации. Вместо традиционных мер, основанных на понятии "стоимости" и "полезности" предложено использовать информационную меру. Рассмотрены различные аспекты применения теории информации для анализа процесса труда и средств труда как информационных систем. Показано, что принятие решения об управляющем воздействии есть обратный процесс по отношению к идентификации и прогнозированию, т.е. познанию. Установлена связь количества (синтаксиса) и качества (содержания, семантики) информации, записываемой в структуре предмета труда, с меновой и потребительной стоимостью. Сформулирована информационная теория стоимости, в которой информация рассматривается как сущность стоимости и как "первичный" и по сути единственный товар. Рассмотрены вопросы определения стоимости и амортизация интеллектуальных систем и баз знаний. Показано, что их стоимость как генераторов информации возрастает в процессе эксплуатации. С позиций теории информации раскрыт фундаментальный источник экономической эффективности АСУ и систем интеллектуальной обработки данных: понижение энтропии объекта управления как приемника сообщений в результате получения управляющей информации. Сделан вывод о целесообразности выбора в качестве базовой численной меры количества информации. Поставлена задача выбора или конструирования конкретной численной меры, основанной на понятии информации.

2. В классической теории информации Шеннона, созданной на основе обобщения результатов Больцмана, Найквиста и Хартли, само понятие информации определяется на основе теоретико-множественных и комбинаторных представлений путем анализа поведения классического макрообъекта, который может переходить только в четко фиксированные альтернативные редуцированные состояния. Однако, квантовые объекты и сложные активные рефлексивные системы могут оказываться одновременно в двух и более альтернативных для классических объектов состояниях. Такие состояния названы смешанными. Таким образом в реальности наблюдается картина последствий, не сводящаяся к простой сумме последствий альтернативных вариантов. Она больше напоминает квантовое физическое явление, которое называется интерференцией плотности вероятности. Это явление, безусловно имеющее системный характер, предлагается называть "интерференция последствий выбора".

3. Предлагается обобщение классической теория информации Хартли-Шеннона путем рассмотрения активных объектов в качестве объектов, на основе анализа которых формируется само основополагающее понятие информации. Обобщенную таким образом теорию информации предлагается называть системной или эмерджентной теорией информации (СТИ). Основным отличием эмерджентной теории информации от классической является учет свойства системности, как фундаментального и универсального свойства всех объектов, на уровне самого понятия информации, а не только в последующем изложении, как в классической теории.

4. Предложена системная модификация формулы Хартли для количества информации:

где:

W - количество чистых (классических) состояний системы;

- сочетания "по m" классических состояний.

Так как , то при M=1 выполняется принцип соответствия, являющийся обязательным для более общей теории. Данная формула дает верхнюю оценку возможного количества информации состоянии системы, т.к. возможны различные правила запрета и реальное количество возможных состояний системы будет меньшим, чем .

Предложено приближенное выражение для системной модификации формулы Хартли (при M=W):

При W>4 погрешность данного выражения не превышает 1%.

Дополнительная информация, которую мы получаем из поведения объекта в СТИ, по сути дела является информацией о множестве всех его возможных состояний, как системы, элементом которой является объект в некотором данном состоянии.

5. Численные расчеты и аналитические выкладки согласно СТИ показывают, что при возрастании количества элементов в системе доля системной информации в поведении ее элементов возрастает, причем возрастает ускоренно. Это установленное нами свойство систем названо "Законом возрастания эмерджентности".

6. Предложена системная модификация классической формулы А.Харкевича, являющееся нелинейной суперпозицией классических выражением для плотности информации Шеннона и количества информации Хартли.

где: - коэффициент эмерджентности Хартли (уровень системной организации объекта, имеющего W чистых состояний):

Установлено, что полученное выражение учитывает как взаимосвязь между признаками (факторами) и будущими, в т.ч. целевыми состояниями объекта управления, так и мощность множества будущих состояний. Эта мера отражает уровень системности и степень детерминированности объекта, объединяет возможности их интегрального и дискретного описания, что является основой формализации смысла, а также удовлетворяет принципу соответствия, т.е. преобразуется в формулу Хартли в предельном случае, когда каждому классу (состоянию объекта) соответствует один признак (фактор), и каждому признаку - один класс, и эти классы, а значит и признаки, равновероятны.

7. Все это делает семантическую меру целесообразности информации оптимальной по сформулированным критериям для целей построения семантической информационной модели активных объектов управления и для применения при синтезе рефлексивных АСУ активными системами.

8. В разработанной семантической информационной модели генерируется обобщенная таблица решений, в которой входы (факторы) и выходы будущие состояния активного объекта управления (АОУ) связаны друг с другом не с помощью классических (Аристотелевских) импликаций, принимающих только значения: "Истина" и "Ложь", а различными значениями истинности, выраженными в битах и принимающими значения от положительного теоретически-максимально-возможного ("Максимальная степень истинности"), до теоретически неограниченного отрицательного ("Степень ложности"). Синтез обобщенных таблиц решений для различных предметных областей осуществляется непосредственно на основе эмпирических исходных данных. На основе этих таблиц продуцируются прямые и обратные правдоподобные (нечеткие) логические рассуждения по неклассическим схемам с различными расчетными значениями истинности, являющимся обобщением классических импликаций. При этом в прямых рассуждениях как предпосылки рассматриваются факторы, а как заключения - будущие состояния АОУ, а в обратных - наоборот. Степень истинности i-й предпосылки - это количество информации Iij, содержащейся в предпосылке о наступлении j-го будущего состояния активного объекта управления.

9. В качестве меры сходства объекта с классом, класса с классом и атрибута с атрибутом предложено использовать неметрический интегральный критерий, основанный на лемме Неймана-Пирсона, - суммарное количество информации. Если предпосылок несколько, то степень истинности наступления j-го состояния АОУ равна суммарному количеству информации, содержащемуся в них об этом:

Или в координатной форме:

где: - вектор j-го состояния объекта управления, координаты которого в информационном семантическом пространстве рассчитываются согласно системного обобщения формулы Харкевича, приведенной в п.6; - булев вектор состояния предметной области, включающий все виды факторов, характеризующих объект управления, возможные управляющие воздействия и окружающую среду (массив-локатор). Обоснована замена значений координат этих векторов их стандартизированными значениями.

10. Предложенная семантическая информационная модель позволяет решать задачи идентификации и прогнозирования развития активных систем (разложение вектора объекта по векторам классов - "Объектный анализ"), а также вырабатывать эффективные управляющие воздействия путем решения обратной задачи прогнозирования и применения элементов нетрадиционной логики и правдоподобных (нечетких) рассуждений. В ней объединены преимущества содержательных и статистических моделей, созданы предпосылки для реализации СК-анализа.

11. Исследована взаимосвязь примененной в модели семантической меры Харкевича со статистикой 2, и, на этой основе, предложена новая статистическая мера наличия причинно-следственных связей в предметной области H, основанная на модифицированной формуле Харкевича:

где:

Обоснована устойчивость модели при малых и больших выборках, дано обоснование сопоставимости частных критериев, разработана интерпретация распознавания как объектного анализа (разложение вектора объекта в ряд по векторам классов), предложены робастные процедуры, а также процедуры обеспечения структурной репрезентативности выборки.

12. Предлагается модель нелокального нейрона, являющаяся обобщением классической модели Дж. Маккалоки и У. Питта. Суть нелокальности данной модели состоит в том, что весовые коэффициенты каждого нейрона зависят не только от нейронов, прямо или косвенно соединенных с ним синаптически, но и от всех остальных нейронов сети, не затрагиваемых при обратном распространении ошибки от данного нейрона. Предлагается новый класс нейронных сетей: "Нелокальные интерпретируемые нейронные сети прямого счета" (нелокальные нейронные сети - ННС). Организация ННС обеспечивает один из вариантов решения традиционных для нейронных сетей проблем: содержательной интерпретации смысла интенсивности входных сигналов и весовых коэффициентов ("проблема интерпретируемости весовых коэффициентов"); содержательной интерпретации и обоснования аддитивности аргумента и вида активационной (передаточной) функции нейрона ("проблема интерпретируемости передаточной функции"); "Комбинаторного взрыва" при определении структуры связей нейронов, подборе весовых коэффициентов и передаточных функций ("проблема размерности"). Математическая модель ННС основана на предложенной автором системной теории информации и семантической информационной модели автоматизированного системно-когнитивного анализа (АСК-анализ), и в отличие от известных нейронных сетей, обеспечивают автоматизацию всех 10 базовых когнитивных операций, образующих "когнитивный конфигуратор". Предложены не только математическая модель, но также и соответствующий численный метод (включая алгоритмы и структуры данных), а также программный инструментарий нелокальных нейронных сетей (универсальная когнитивная аналитическая система "Эйдос" версии 12.5), успешно апробированные в ряде предметных областей. Данная система обеспечивает практически неограниченное количество слоев ННС, рецепторов, выходных нейронов и связывающих их весовых коэффициентов (десятки миллионов), а также автоматическую визуализацию и запись в виде графических файлов сформированных моделей нелокальных нейронов и Паретто-подмножеств нелокальной нейронной сети.

13. Введено в научный оборот новое понятие: коэффициент эмерджентности Хартли , который представляет собой относительное превышение количества информации о системе при учете системных эффектов (смешанных состояний, иерархической структуры ее подсистем и т.п.) над количеством информации без учета системности, т.е. этот коэффициент отражает уровень системности объекта. Этот уровень системности объекта изменяется от 1 (системность минимальна, т.е. отсутствует) до W/Log2W (системность максимальна). Для каждого количества элементов системы существует свой максимальный уровень системности, который никогда реально не достигается из-за действия правил запрета на реализацию в системе ряда подсистем различных уровней иерархии.

Введено в научный оборот новое понятие: коэффициент эмерджентности Харкевича , который изменяется от 0 до 1 и определяет степень детерминированности системы: =1 соответствует полностью детерминированной системе, поведение которой однозначно определяется действием минимальным количеством факторов, которых столько же, сколько состояний системы; =0 соответствует полностью случайной системе, поведение которой никак не зависит действия факторов независимо от их количества; 0<<1 соответствуют большинству реальных систем, поведение которых зависит от многих факторов, число которых превосходит количество состояний системы, причем ни одно из состояний не определяется однозначно никакими сочетаниями действующих факторов. Увеличение уровня системности влияет на семантическую информационную модель аналогично повышению уровня детерминированности. Понижение уровня системности, также как и степени детерминированности системы приводит к ослаблению влияния факторов на поведение системы, т.е. к своего рода "инфляции факторов".

Основной вывод:

В предложенном системном обобщении формулы Харкевича впервые непосредственно в аналитическом выражении для самого понятия "Информация" отражены такие фундаментальные свойства систем, как "Уровень системности" и "Степень детерминированности" системы, кроме того это выражение (как и формула Шеннона) удовлетворяет принципу соответствия с выражением Хартли в детерминистском случае, учитывает понятие цели и мощность множества будущих состояний объекта управления, объединяет возможности интегрального и дискретного описания объектов. По этим причинам полученное выражение является оптимальным и его целесообразно использовать в качестве основы для построения математической модели рефлексивных АСУ активными объектами.

Литература

1. Орлов А.И. "Высокие статистические технологии": http://antorlov.chat.ru.

2. Луценко Е.В. Автоматизированная система распознавания образов: математическая модель и опыт применения. //В сб.: "В.И. Вернадский и современность (к 130-летию со дня рождения)". - Краснодар: КНА, 1993. - С.37-42.

3. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.

4. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). -Краснодар: КубГАУ. 2002. -605 с.

5. Пат. № 940217. РФ. Универсальная автоматизированная система распознавания образов "ЭЙДОС". /Е.В.Луценко (Россия); Заяв. № 940103. Опубл. 11.05.94. - 50с.

6. Пат. № 2003610986 РФ. Универсальная когнитивная аналитическая система "ЭЙДОС" / Е.В.Луценко (Россия); Заяв. № 2003610510 РФ. Опубл. от 22.04.2003. - 50с.

7. Луценко Е.В. Типовая методика и инструментарий когнитивной структуризации и формализации задач в СК-анализе. // Научный журнал КубГАУ. - 2004.- № 1 (3). -18 с. http://ej.kubagro.ru

8. Эфрон Б. Нетрадиционные методы многомерного статистического анализа. - М.: Финансы и статистика, 1988. - 263 с.

Размещено на Allbest.ru


Подобные документы

  • Анализ существующих алгоритмов обработки информации человеком и современных моделей памяти. Разработка алгоритмов и математической модели ассоциативного мышления. Имитационная модель обработки информации. Компьютерный эксперимент по тестированию модели.

    курсовая работа [2,3 M], добавлен 19.11.2014

  • Понятие математической модели, свойства и классификация. Характеристика элементов системы Mathcad. Алгоритмический анализ задачи: описание математической модели, графическая схема алгоритма. Реализация базовой модели и описание исследований MathCAD.

    реферат [1,0 M], добавлен 20.03.2014

  • Разработка программы в среде Microsoft Visual C++ для вывода системной информации о компьютере, его оперативной памяти, процессоре, ip-адресе, принтерах, текущем видеорежиме и дисках. Использование программы Sysinfo для анализа работы компьютера.

    курсовая работа [667,3 K], добавлен 24.04.2011

  • Общая характеристика и свойства системы Matlab - пакета прикладных программ для решения задач технических вычислений. Разработка математической модели в данной среде, программирование функций для задающего воздействия. Проектирование GUI-интерфейса.

    курсовая работа [1023,2 K], добавлен 23.05.2013

  • Метод решения математической модели на примере решения задач аналитической геометрии. Описание согласно заданному варианту методов решения задачи. Разработка математической модели на основе описанных методов. Параметры окружности минимального радиуса.

    лабораторная работа [310,6 K], добавлен 13.02.2009

  • Формы представления моделей: модели материальные и модели информационные. Формализация текстовой информации, представление данных в табличной форме. Граф как совокупность точек, соединённых между собой линиями. Упорядочение информации в форме графа.

    реферат [2,5 M], добавлен 10.04.2010

  • Создание математической модели системы массового обслуживания на примере банка. Разработка имитационной модели на языке программирования С++. Блок-схема программы, перевод модели на язык программирования. Верификация и валидация имитационной модели.

    курсовая работа [630,5 K], добавлен 01.06.2015

  • Классификация угроз конфиденциальной информации. Концепция математической модели оценки ущерба конфиденциальной информации от внешних угроз. Реализация и исследование модели. Безопасность и экологичность работы. Расчет технико-экономической эффективности.

    дипломная работа [1,5 M], добавлен 30.06.2011

  • Структурное и функциональное моделирование. Информационная модель базы данных для проектирования. Разработка технического задания и проекта (Visio, MathCad, BPWin). Задача синтеза (оптимизация в проектировании). Построение математической модели объектов.

    курсовая работа [1,5 M], добавлен 05.04.2014

  • Построение концептуальной модели и метод имитационного моделирования. Определение переменных уравнений математической модели и построение моделирующего алгоритма. Описание возможных улучшений системы и окончательный вариант модели с результатами.

    курсовая работа [79,2 K], добавлен 25.06.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.