Система "Эйдос" как геокогнитивная система для восстановления неизвестных значений пространственно-распределенных функций на основе описательной информации картографических баз данных
Геокогнитичная подсистема "Эйдос". Визуализация 2d-функций и восстановление значений функций по признакам аргумента. Картографическая визуализация обучающей выборки. Восстановление неизвестных значений функции по описательной информации на основе модели.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 22.05.2017 |
Размер файла | 4,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
СИСТЕМА "ЭЙДОС" КАК ГЕОКОГНИТИВНАЯ СИСТЕМА (ГКС) ДЛЯ ВОССТАНОВЛЕНИЯ НЕИЗВЕСТНЫХ ЗНАЧЕНИЙ ПРОСТРАНСТВЕННО-РАСПРЕДЕЛЕННЫХ ФУНКЦИЙ НА ОСНОВЕ ОПИСАТЕЛЬНОЙ ИНФОРМАЦИИ КАРТОГРАФИЧЕСКИХ БАЗ ДАННЫХ
Луценко Евгений Вениаминович
д.э.н., к.т.н., профессор
Бандык Дмитрий Константинович
Разработчик интеллектуальных систем
Аннотация
В статье предлагается применить автоматизированный системно-когнитивный анализ (АСК-анализ) и его программный инструментарий систему «Эйдос» для решения задач многопараметрической типизации, системной идентификации и картографической визуализации пространственно-распределенных природных, экологических и социально-экономических систем. Пусть есть исходное облако точек с координатами (X,Y,Z), для каждой из которых известны значения градаций описательных шкал номинального, порядкового или числового типа S(s1,s2,…,sn). Тогда система «Эйдос» обеспечивает: 1) построение модели, содержащей обобщенные знания о силе и направлении влиянии градаций описательных шкал на значения Z=M(S); 2) оценку значения Z для точек (X,Y), описанных в тех же описательных шкалах S(s1,s2,…,sn), но не входящих в исходное облако точек; 3) картографическую визуализацию пространственного распределения значений функции Z=M(S) для точек, не входящих в исходное облако, с использованием триангуляции Делоне. По сути это означает, что система «Эйдос» обеспечивает восстановление неизвестных значений функции по признакам аргумента и реализует это в универсальной постановке, не зависящей от предметной области. Предлагается новое научное понятие: «Геокогнитивная система», под которым понимается программная система, обеспечивающая преобразование исходных данных в информацию, а ее в знания и картографическую визуализацию этих знаний, в результате чего карта становится когнитивной графикой. Эта возможность может быть использовано для количественной оценки степени пригодности микрозон для выращивания тех или иных культур, оценки экологической обстановки на тех или иных территориях по структуре и интенсивности антропогенной нагрузки, визуализации результатов прогнозирования землетрясений и рисков других нежелательных или чрезвычайных ситуаций, а также для решения многих других подобных по математической сути задач в самых различных предметных областях. Приводится простой численный пример
Ключевые слова: АСК-АНАЛИЗ, АВТОМАТИЗИРОВАННЫЙ СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ, ИНТЕЛЛЕКТУАЛЬНАЯ ГЕОИНФОРМАЦИОННАЯ СИСТЕМА «ЭЙДОС», МНОГОПАРАМЕТРИЧЕСКАЯ ТИПИЗАЦИЯ, СИСТЕМНАЯ ИДЕНТИФИКАЦИЯ КАРТОГРАФИЧЕСКИЕ БАЗЫ ДАННЫХ КОГНИТИВНАЯ ГРАФИКА
Содержание
геокогнитивный эйдос визуализация информация
Постановка проблемы
Традиционные подходы к решению проблемы и их недостатки
Решение проблемы в системе «Эйдос»
Формальная (математическая) постановка задачи
Технологическая постановка задачи
Описание геокогнитивной подсистемы «Эйдос»
Триангуляция Делоне случайного облака точек
Триангуляция Делоне спирали Архимеда
Визуализация 2d-функций и восстановление значений функций по признакам аргумента
Картографическая визуализация обучающей выборки
Картографическая визуализация распознаваемой выборки
Синтез геокогнитивной модели
Восстановление неизвестных значений функции по описательной информации на основе модели
Исследование погрешностей распознавания
Возможные области применения предлагаемой технологии
Выводы
Перспективы
Литература
Постановка проблемы
С одной стороны, картографические базы данных (КБД) геоинформационных систем (ГИС) содержат не только графическую информацию, но и описательную, атрибутивную часть, представляющую собой более или менее развернутую и подробную количественную и качественную характеристику различных пространственно-соотнесенных объектов, изображенных на карте.
С другой стороны, для некоторых из этих объектов, но не для всех, известно значение каких-либо интегральных характеристик, обобщающих, агрегирующих описательную информацию о них различными способами. Таким образом, картографическая визуализация пространственного распределения этих интегральных характеристик фрагментирована и из-за этого на карте получаются «белые пятна».
Проблема состоит в том, чтобы сначала по описательной информации восстановить значение этих интегральных характеристик для тех пространственно-соотнесенных объектов, для которых они неизвестны, а затем получить полную картографическую визуализацию пространственного распределения интегральной характеристики: заполнить «белые пятна».
Пример. Для всех микрозон известны такие характеристики, как вид почвы, уровень и тип грунтовых вод, предшественники, освещенность (инсоляция), средние, максимальные и минимальные температуры в различные периоды года, мощность и длительность сохранения снегового покрова, количество осадков, сила и направление господствующих ветров и т.п. Имеется картографическая база данных, содержащая соответствующую описательную информацию. Для некоторых микрозон известно, в какой степени данная микрозона пригодна (или непригодна) для выращивания определенных конкретных сельскохозяйственных культур, т.е. какие количественные и качественные результаты выращивания этих культур как правило получается в этих микрозонах. Имеется фрагментарная картографическая визуализация степени пригодности микрозон для выращивания различных культур, построенная по тем микрозонам, для которых имеется многолетний опыт выращивания этих культур. Требуется оценить степень пригодности для выращивания каждой культуры всех микрозон, для которых есть описательная информация.
Традиционные подходы к решению проблемы и их недостатки
Традиционно подобные проблемы решаются путем совместного применения систем искусственного интеллекта (СИИ) и геоинформационных систем (ГИС). При этом приходиться искать конкретные СИИ и ГИС, пригодные для решения этих задач, а также чаще всего разрабатывать соответствующие программные интерфейсы, обеспечивающие как передачу исходных данных для формирования моделей знаний из ГИС в СИИ, так и наоборот: передачу результатов распознавания из СИИ в ГИС для их наглядной картографической визуализации в нужной форме. Необходимо отметить, что эти программные интерфейсы обычно являются специфическим для каждой задачи и различных видов систем СИИ и ГИС. Все это связано со значительными затратами квалифицированного труда и времени, и вообще на практике далеко не всегда возможно, что является недостатком традиционного подхода, существенно уменьшающим и сводящим на нет синергетический эффект от совместного применения ГИС и ИИС.
Решение проблемы в системе «Эйдос»
В системе «Эйдос» органично сочетаются:
- возможности обучающейся с учителем системы распознавания образов, имеющей разнообразные встроенные программные интерфейсы с внешними источниками текстовых, табличных, графических и звуковых данных;
- возможности синтеза системно-когнитивных моделей и их применения для решения различных задач, в т.ч. распознавания и анализа;
- возможности наглядной графической визуализации в форме когнитивной графики, в т.ч. картографической, как исходных данных, так и результатов решения задач.
Система «Эйдос» по описательной информации о пространственно-соотнесенных объектах и их интегральных характеристиках позволяет построить системно-когнитивную модель, отражающую причинно-следственные взаимосвязи между атрибутами объектов, приведенными описательной информации баз данных ГИС с одной стороны, и их интегральными оценками, с другой стороны. На основе данной модели система «Эйдос» обеспечивает восстановление интегральных характеристик для всех объектов по их атрибутам и картографическую визуализацию пространственного распределения данной интегральной характеристики с применением триангуляции Делоне.
Таким образом система «Эйдос» на единой программной платформе в универсальной постановке, не зависящей от предметной области, позволяет решить сформулированную проблему и преодолевает сформулированные недостатки традиционного подхода.
Система «Эйдос» является инструментом для синтеза и применения интеллектуальных измерительных систем. С этой точки зрения она является инструментом для построения измерительных шкал на основе примеров эталонных объектов в различных состояниях и применения этих шкал для измерения других объектов путем сравнения их состояний с отраженными в шкалах.
Например, шкала Цельсия построена путем указания температуры воды при ее замерзании или плавлении льда, которая принимается за 0С°, и температуры ее кипения (при нормальном давлении), которая принимается за 100С°. Атрибуты воды описываются как твердое состояние, переходящее в жидкое (точка плавления-замерзания), и жидкое, переходящее в газообразное (точка кипения). Точке плавления-замерзания на классификационной шкале присваивается числовое значение 0, а точке кипения - 100. Затем эта шкала продолжается и в сторону более низких, и более высоких температур и используется для измерения температуры различных объектов по сути путем сравнения их температуры с температурой воды. Аналогично, в системе «Эйдос» описательные шкалы используются для описания атрибутов эталонных объектов в известных состояниях, а сами состояния описаны в классификационных шкалах. После построения модели, отражающей взаимосвязи между атрибутами объектов и их принадлежностью к определенным градациям классификационных шкал, система может восстановить значения на классификационных шкалах и для других объектов, для которых известны только атрибуты.
Предлагается новое научное понятие: «Геокогнитивная система» (ГКС), под которым понимается программная система, обеспечивающая преобразование исходных данных в информацию, а ее в знания и картографическую визуализацию этих знаний, в результате чего карта становится когнитивной графикой. Поэтому система «Эйдос» является геокогнитивной системой, возможно на данный момент единственной, находящейся в полном открытом бесплатном доступе (причем с подробно комментированными открытыми исходными текстами). В Internet искать систему «Эйдос» не сложно: она на сайте автора по адресу: http://lc.kubagro.ru/aidos/_Aidos-X.htm.
Формальная (математическая) постановка задачи
Пусть в ряде конкретных точек многомерного пространства таблично задана скалярная функция (многих аргументов):
(1)
В классическом регрессионном анализе этого достаточно, чтобы попытаться восстановить аналитическое представление этой функции в том или ином виде по этим значениям, точнее подобрать такие числовые значения коэффициентов в некоторых заранее выбранных видах функций, которые по определенным критериям дают наилучшее приближение к известным табличным значениям.
Ранее автором высказывались и обосновывались идеи о системном обобщении математики суть которых в том, чтобы заменить понятие «множество» понятием «система» и проследить все следствия этого. При этом все математические понятия, прямо или косвенно основанные на понятии множества, а понятие функции относится к их числу (т.к. функция является отображением множества аргументов на множество значений функции), будут обобщены, и при этом будет выполнятся принцип соответствия, обязательный для более общих теорий, т.к. при уровне системности стремящемся к нулю система переходит в множество.
Одна из основных идей, связанных с системным обобщением математики, состоит в том, что понятие математической точки необходимо обогатить новыми свойствами, которыми это понятие не обладает в современной геометрии. В общем виде это можно сделать, приписав или поставив во взаимно-однозначное соответствие каждой точке многомерно пространства аргументов функции (которое в общем случае неортонормировано, с осями, которые являются шкалами номинального, порядкового и числового типа, измеряемыми в различных единицах измерения) обобщенный вектор свойств, элементы которого по своей природе может быть или количественными, или качественными (лингвистическими) переменными:
(2)
В этом случае значения аргумента можно рассматривать как координаты точки, а свойства аргумента можно интерпретировать как значения факторов, обусловливающих значения функции (каждый элемент вектора соответствует фактору, а значение этого элемента - значению этого фактора: числовому, интервальному или лингвистическому. Факторы вообще говоря действуют не в чистом виде, а всегда являются более или менее зашумленными, т.е. любое значение фактора реалистичнее всего рассматривать как сумму некоторого неизвестного истинного значения фактора и шума. АСК-анализ позволяет оценивать долю шума в модели.
Идея применения автоматизированного системно-когнитивного анализа (АСК-анализ) для восстановления значений функции Y состоит в том, чтобы на основе априорной информации об известных значениях функции в тех точках, в которых они заданы, выявить взаимосвязь между свойствами точек аргумента и значениями функции Y, а затем зная эту взаимосвязь восстановить значения функции Y для всех точек, для которых известны их свойства, но неизвестно значение функции, т.е. найти вид функции :
(3)
Символически эту идею можно выразить в форме:
(4)
Казалось бы в этом нет ничего сложного и достаточно сначала найти функцию, обратную Ш, а затем подставить ее в F:
(5)
После чего, получаем:
, (6)
т.е.:
(7)
следовательно:
.
Однако на самом деле все не так просто по крайней мере по следующим трем причинам:
- во-первых, потому, что аналитический вид функции Ш неизвестен и регрессионный анализ не позволяет найти ее, а всего лишь обеспечивает ее аппроксимацию другими функциями, заданными специалистом, которая практически всегда выполняется с определенной погрешностью;
- во-вторых, сама эта операция: выражение признаков аргумента через координаты точек, предполагает, что сами координаты содержат информацию о признаках, что далеко не всегда так (т.е. многие признаки аргумента не обусловливаются координатами, а просто по независимым от координат причинам наблюдаются по определенным координатам);
- в-третьих, для разных значений аргумента известны значения различных атрибутов, т.е. пространственно-соотнесенные объекты описаны в различных системах шкал и градаций, причем сами шкалы могут быть различного типа (номинального, порядкового и числового), а градации могут измеряться в различных единицах измерения;
- в-четвертых, нахождение аналитическим путем функции обратной заданной не всегда является тривиальной задачей.
По этим причинам в АСК-анализе принято решение найти функцию непосредственной связи признаков аргумента и значений функции, а не через координаты, как в Щ:
(8)
Основной проблемой при этом было найти способ сопоставимого представления силы влияния всех признаков аргумента на значения функции, не зависящий от того, количественными, интервальными или лингвистическими переменными являются те или иные значения признаков и в каких единицах измерения они измеряются. Тем ни менее, немного упрощая можно сказать, что в определенном смысле функция I это и есть Щ: т.е. она вполне может ее заменить для наших целей.
В АСК-анализе эти задачи и проблемы достаточно давно успешно решены [1 - 42] и могут быть представлены в виде, приведенном ниже. Предварительно отметим лишь, что сам вид функции Щ в АСК-анализе восстанавливается не в полной мере аналитически, а представляет собой базу знаний, т.е. таблицу, элементы которой имеют аналитическое и численное выражение, а для всей базы знаний в целом аналитической формы пока не найдено. Поэтому точнее будет сказать, что данная задача в АСК-анализе решается не полностью аналитически, а алгоритмически с элементами аналитики. Рассмотрим это решение условного (абстрактного) примера с двумерной функцией, не привязанных к конкретной предметной области, а затем кратко приведем возможные области применения предложенных подходов, технологий и методик.
Технологическая постановка задачи
Дано:
1. БД прецедентов, состоящая из строк, каждая из которых содержит значение функции (класс) и локальные признаки в точке, а также координаты этой точки.
2. Распознаваемая БД, состоящая из строк, каждая из которых содержит координаты точек и их локальные признаки.
Необходимо:
1. Выявить зависимости между локальными признаками точек и значениями функции в точках.
2. Используя знание выявленных зависимостей между локальными признаками точек и значениями функции в точках восстановить значения функции для всех точек, как для тех, для которых значения функции известны (опорные точки), так и для тех, для которых известны только локальные признаки аргумента и координаты.
3. Визуализировать опорные и восстановленные точки в картографической форме с использованием координат и триангуляции Делоне.
Рассмотрим пример с двумерной (2d) функцией, а затем кратко приведем возможные области применения предложенных технологий, в частности для решения задач интерполяции и экстраполяции с применением технологий искусственного интеллекта, а также интеллектуального анализа картографических баз данных и восстановления картографической визуализации значений функций для точек, для которых она неизвестна, на основе модели, созданной на основе априорной информации по опорным точкам.
Описание геокогнитивной подсистемы «Эйдос»
Данная подсистема (4.8.) входит в состав универсальной когнитивной аналитической системы «Эйдос» (система «Эйдос») и обеспечивает пространственную, в т.ч. картографическую визуализацию значений двумерных (2d) функций, восстановленных по признакам аргумента в процессе распознавания. Подсистема 4.8 названа «Геокогнитивная системой» (ГКС), т.к. позволяет выявить знания о белых пятнах на карте на основе знаний (описательной информации) по отображенным на ней объектам.
На рисунке 1 приведены меню запуска данной подсистемы и ее Help:
Рисунок 1 Меню запуска геокогнитивной подсистемы «Эйдос» и ее Help
Перед картографической визуализацией необходимо сформировать облако точек. Это можно сделать различными способами. На рисунке 2 приведена экранная форма, в которой пользователь может выбрать используемый способ генерации облака точек и задать его параметры:
Рисунок 2 Выбор способа генерации облака точек и задание параметров
Триангуляция Делоне случайного облака точек
При выборе генерации облака точек случайным образом появляется возможность задать количество точек и они отображаются на экране (рисунок 3):
Рисунок 3 Результат генерации случайного облака точек
При выборе режима: «Триангуляция (сетка)» осуществляется триангуляция Делоне ранее созданного облака точек. Результаты этого процесса показаны на рисунках 4 и 5:
Рисунок 4 Триангуляция Делоне случайного облака точек
Рисунок 5 Градиентная заливка цветом триангуляции Делоне случайного облака точек
Цвет на рисунке соответствует значению функции в точке. Шкала соответствия цветов значениям приведена на изображении.
Триангуляция Делоне спирали Архимеда
При выборе генерации облака точек для обобщенной списали Архимеда (рисунок 2*) появляется возможность задать количество точек, количество витков спирали и показатель степени p при r, после чего точки спирали отображаются на экране (рисунок 3*):
Рисунок 2 Выбор способа генерации облака точек и задание параметров
Рисунок 3 Результат генерации случайного облака точек
При выборе режима: «Триангуляция (сетка)» осуществляется триангуляция Делоне ранее созданного облака точек. Результаты этого процесса показаны на рисунках 4* и 5*:
Рисунок 4 Триангуляция Делоне случайного облака точек
Рисунок 5 Градиентная заливка цветом триангуляции Делоне случайного облака точек (на экранной форме, приведенной на рисунке 2*задан параметр: «Рисовать ребра в цветовой заливке»)
Визуализация 2d-функций и восстановление значений функций по признакам аргумента
Получим расчетным путем значения функции Z, зависящей от координат X,Y. Получим картографическую визуализацию полной исходной функцию со всеми значениями. Уберем из исходного файла некоторое количество точек. Это можно делать различными способами и в большем или меньшем количестве. Например, оставим в некоторой таблице только верхнюю левую четверть и получим таблицу 1. Опишем каждое значение функции признаками, зависящими от этих значений Z, и, косвенно, от аргумента X,Y. Построим геокогнитивную модель, отражающую зависимость значений функции от признаков. На основе геокогнитивной модели восстановим значения функции в точках, отсутствующих в исходных данных. Получим картографическую визуализацию полной исходной функцию с исходными и восстановленными значениями. Сравним расчетные значения функции и их значения, восстановленные на основе геокогнитивной модели.
Картографическая визуализация обучающей выборки
Рассмотрим файл исходных данных, приведенный в таблице 1:
Таблица 1
2d Excel-файл исходных данных
N1 |
N2 |
N3 |
N4 |
N5 |
N6 |
N7 |
N8 |
N9 |
N10 |
N11 |
N12 |
|
0,00 |
-1,00 |
-0,90 |
-0,80 |
-0,70 |
-0,60 |
-0,50 |
-0,40 |
-0,30 |
-0,20 |
-0,10 |
0,00 |
|
-1,00 |
0,82 |
0,89 |
0,92 |
0,93 |
0,91 |
0,89 |
0,87 |
0,84 |
0,82 |
0,81 |
0,80 |
|
-0,90 |
0,89 |
0,92 |
0,92 |
0,90 |
0,87 |
0,83 |
0,79 |
0,75 |
0,72 |
0,70 |
0,70 |
|
-0,80 |
0,92 |
0,92 |
0,90 |
0,85 |
0,80 |
0,74 |
0,69 |
0,64 |
0,61 |
0,59 |
0,58 |
|
-0,70 |
0,93 |
0,90 |
0,85 |
0,79 |
0,72 |
0,65 |
0,59 |
0,53 |
0,49 |
0,47 |
0,46 |
|
-0,60 |
0,91 |
0,87 |
0,80 |
0,72 |
0,64 |
0,56 |
0,48 |
0,43 |
0,38 |
0,35 |
0,35 |
|
-0,50 |
0,89 |
0,83 |
0,74 |
0,65 |
0,56 |
0,47 |
0,39 |
0,33 |
0,28 |
0,25 |
0,24 |
|
-0,40 |
0,87 |
0,79 |
0,69 |
0,59 |
0,48 |
0,39 |
0,31 |
0,24 |
0,20 |
0,17 |
0,16 |
|
-0,30 |
0,84 |
0,75 |
0,64 |
0,53 |
0,43 |
0,33 |
0,24 |
0,18 |
0,13 |
0,10 |
0,09 |
|
-0,20 |
0,82 |
0,72 |
0,61 |
0,49 |
0,38 |
0,28 |
0,20 |
0,13 |
0,08 |
0,05 |
0,04 |
|
-0,10 |
0,81 |
0,70 |
0,59 |
0,47 |
0,35 |
0,25 |
0,17 |
0,10 |
0,05 |
0,02 |
0,01 |
|
0,00 |
0,80 |
0,70 |
0,58 |
0,46 |
0,35 |
0,24 |
0,16 |
0,09 |
0,04 |
0,01 |
0,00 |
Значения координат X и Y приведены в ячейках на желтом фоне.
Значения функции Z рассчитываются для каждой точки с координатами X,Y по формуле:
=EXP(-0,05*(H$2^2+$A12^2))*SIN(H$2^2+$A12^2).
Данная таблица в виде Excel-файла с именем Inp_map2.xls записывается в папку: c:\Aidos-X\AID_DATA\Inp_data\.
Затем в геокогнитивной подсистеме 4.8 выбирается способ формирования облака точек: «Из 2d Excel-таблицы: Inp_map2.xls» с опцией «Без формирования модели». В результате формируется база данных Points_XYZ.DBF, с координатами X,Y и значениями функции Z, фрагмент которой приведен на рисунке 6. Данные о координатах точек, извлеченные из Excel-файла, отображается в окне (рисунок 7).
Рисунок 6 Фрагмент базы данных Points_XYZ.DBF с координатами точек X,Y и значениями функции Z в этих точках
Рисунок 7 Визуализация облака точек, сформированных на основе 2d Excel-таблицы: Inp_map2.xls
На основе 2d Excel-таблицы: Inp_map2.xls формируется облако точек, расположенных в узлах регулярной решетки, т.е. решетки с равным шагом по каждой из осей координат (алгоритм триангуляции Делоне работает с любыми решетками, а не только регулярными).
Для получения картографической визуализации данной функции в стиле «Сетка» кликаем по кнопке: «Триангуляция (сетка)». Процесс рисования треугольников отображается в реальном времени путем рисования ребер (рисунки 8 и 9):
Рисунок 8 Отображение процесса триангуляции в реальном времени
Рисунок 9 Результат триангуляции облака точек из базы данных Points_XYZ.DBF в стиле «Сетка»
На рисунке 10 приведена картографическая визуализация исходной функции в стиле «Градиентная заливка цветом»:
Рисунок 10 Результат триангуляции облака точек из базы данных Points_XYZ.DBF в стиле «Градиентная заливка цветом»
Картографическая визуализация распознаваемой выборки
В экранной форме, появляющейся по нажатию кнопки: «Формирование облака точек», выберем режим: «Из распознаваемой 2d Excel-таблицы Rsp_map2.xls» с опцией «без распознавания» (рисунок 11):
Рисунок 11 Экранная форма выбора режима: «Формирование облака точек», сначала выберем режим: «Из распознаваемой 2d Excel-таблицы Rsp_map2.xls» с опцией «Без распознавания»
Это позволяет отобразить распознаваемую выборку в исходном виде из 2d Excel-таблицы Rsp_map2.xls. В таблице 2 приведена распознавемая выборка. По своей структуре она сходна с таблицей 1, но отражает примерно в два раза большую область значений аргумента по каждой оси:
Таблица 2
2d Excel-файл данных для распознаваемой выборки
N1 |
N2 |
N3 |
N4 |
N5 |
N6 |
N7 |
N8 |
N9 |
N10 |
N11 |
N12 |
N13 |
N14 |
N15 |
N16 |
N17 |
N18 |
N19 |
N20 |
N21 |
N22 |
|
0,00 |
-1,00 |
-0,90 |
-0,80 |
-0,70 |
-0,60 |
-0,50 |
-0,40 |
-0,30 |
-0,20 |
-0,10 |
0,00 |
0,10 |
0,20 |
0,30 |
0,40 |
0,50 |
0,60 |
0,70 |
0,80 |
0,90 |
1,00 |
|
-1,00 |
0,82 |
0,89 |
0,92 |
0,93 |
0,91 |
0,89 |
0,87 |
0,84 |
0,82 |
0,81 |
0,80 |
0,81 |
0,82 |
0,84 |
0,87 |
0,89 |
0,91 |
0,93 |
0,92 |
0,89 |
0,82 |
|
-0,90 |
0,89 |
0,92 |
0,92 |
0,90 |
0,87 |
0,83 |
0,79 |
0,75 |
0,72 |
0,70 |
0,70 |
0,70 |
0,72 |
0,75 |
0,79 |
0,83 |
0,87 |
0,90 |
0,92 |
0,92 |
0,89 |
|
-0,80 |
0,92 |
0,92 |
0,90 |
0,85 |
0,80 |
0,74 |
0,69 |
0,64 |
0,61 |
0,59 |
0,58 |
0,59 |
0,61 |
0,64 |
0,69 |
0,74 |
0,80 |
0,85 |
0,90 |
0,92 |
0,92 |
|
-0,70 |
0,93 |
0,90 |
0,85 |
0,79 |
0,72 |
0,65 |
0,59 |
0,53 |
0,49 |
0,47 |
0,46 |
0,47 |
0,49 |
0,53 |
0,59 |
0,65 |
0,72 |
0,79 |
0,85 |
0,90 |
0,93 |
|
-0,60 |
0,91 |
0,87 |
0,80 |
0,72 |
0,64 |
0,56 |
0,48 |
0,43 |
0,38 |
0,35 |
0,35 |
0,35 |
0,38 |
0,43 |
0,48 |
0,56 |
0,64 |
0,72 |
0,80 |
0,87 |
0,91 |
|
-0,50 |
0,89 |
0,83 |
0,74 |
0,65 |
0,56 |
0,47 |
0,39 |
0,33 |
0,28 |
0,25 |
0,24 |
0,25 |
0,28 |
0,33 |
0,39 |
0,47 |
0,56 |
0,65 |
0,74 |
0,83 |
0,89 |
|
-0,40 |
0,87 |
0,79 |
0,69 |
0,59 |
0,48 |
0,39 |
0,31 |
0,24 |
0,20 |
0,17 |
0,16 |
0,17 |
0,20 |
0,24 |
0,31 |
0,39 |
0,48 |
0,59 |
0,69 |
0,79 |
0,87 |
|
-0,30 |
0,84 |
0,75 |
0,64 |
0,53 |
0,43 |
0,33 |
0,24 |
0,18 |
0,13 |
0,10 |
0,09 |
0,10 |
0,13 |
0,18 |
0,24 |
0,33 |
0,43 |
0,53 |
0,64 |
0,75 |
0,84 |
|
-0,20 |
0,82 |
0,72 |
0,61 |
0,49 |
0,38 |
0,28 |
0,20 |
0,13 |
0,08 |
0,05 |
0,04 |
0,05 |
0,08 |
0,13 |
0,20 |
0,28 |
0,38 |
0,49 |
0,61 |
0,72 |
0,82 |
|
-0,10 |
0,81 |
0,70 |
0,59 |
0,47 |
0,35 |
0,25 |
0,17 |
0,10 |
0,05 |
0,02 |
0,01 |
0,02 |
0,05 |
0,10 |
0,17 |
0,25 |
0,35 |
0,47 |
0,59 |
0,70 |
0,81 |
|
0,00 |
0,80 |
0,70 |
0,58 |
0,46 |
0,35 |
0,24 |
0,16 |
0,09 |
0,04 |
0,01 |
0,00 |
0,01 |
0,04 |
0,09 |
0,16 |
0,24 |
0,35 |
0,46 |
0,58 |
0,70 |
0,80 |
|
0,10 |
0,81 |
0,70 |
0,59 |
0,47 |
0,35 |
0,25 |
0,17 |
0,10 |
0,05 |
0,02 |
0,01 |
0,02 |
0,05 |
0,10 |
0,17 |
0,25 |
0,35 |
0,47 |
0,59 |
0,70 |
0,81 |
|
0,20 |
0,82 |
0,72 |
0,61 |
0,49 |
0,38 |
0,28 |
0,20 |
0,13 |
0,08 |
0,05 |
0,04 |
0,05 |
0,08 |
0,13 |
0,20 |
0,28 |
0,38 |
0,49 |
0,61 |
0,72 |
0,82 |
|
0,30 |
0,84 |
0,75 |
0,64 |
0,53 |
0,43 |
0,33 |
0,24 |
0,18 |
0,13 |
0,10 |
0,09 |
0,10 |
0,13 |
0,18 |
0,24 |
0,33 |
0,43 |
0,53 |
0,64 |
0,75 |
0,84 |
|
0,40 |
0,87 |
0,79 |
0,69 |
0,59 |
0,48 |
0,39 |
0,31 |
0,24 |
0,20 |
0,17 |
0,16 |
0,17 |
0,20 |
0,24 |
0,31 |
0,39 |
0,48 |
0,59 |
0,69 |
0,79 |
0,87 |
|
0,50 |
0,89 |
0,83 |
0,74 |
0,65 |
0,56 |
0,47 |
0,39 |
0,33 |
0,28 |
0,25 |
0,24 |
0,25 |
0,28 |
0,33 |
0,39 |
0,47 |
0,56 |
0,65 |
0,74 |
0,83 |
0,89 |
|
0,60 |
0,91 |
0,87 |
0,80 |
0,72 |
0,64 |
0,56 |
0,48 |
0,43 |
0,38 |
0,35 |
0,35 |
0,35 |
0,38 |
0,43 |
0,48 |
0,56 |
0,64 |
0,72 |
0,80 |
0,87 |
0,91 |
|
0,70 |
0,93 |
0,90 |
0,85 |
0,79 |
0,72 |
0,65 |
0,59 |
0,53 |
0,49 |
0,47 |
0,46 |
0,47 |
0,49 |
0,53 |
0,59 |
0,65 |
0,72 |
0,79 |
0,85 |
0,90 |
0,93 |
|
0,80 |
0,92 |
0,92 |
0,90 |
0,85 |
0,80 |
0,74 |
0,69 |
0,64 |
0,61 |
0,59 |
0,58 |
0,59 |
0,61 |
0,64 |
0,69 |
0,74 |
0,80 |
0,85 |
0,90 |
0,92 |
0,92 |
|
0,90 |
0,89 |
0,92 |
0,92 |
0,90 |
0,87 |
0,83 |
0,79 |
0,75 |
0,72 |
0,70 |
0,70 |
0,70 |
0,72 |
0,75 |
0,79 |
0,83 |
0,87 |
0,90 |
0,92 |
0,92 |
0,89 |
|
1,00 |
0,82 |
0,89 |
0,92 |
0,93 |
0,91 |
0,89 |
0,87 |
0,84 |
0,82 |
0,81 |
0,80 |
0,81 |
0,82 |
0,84 |
0,87 |
0,89 |
0,91 |
0,93 |
0,92 |
0,89 |
0,82 |
Область значений аргумента исходных данных (т.е. по сути таблица 1) в таблице 2 выделена светло-зеленым фоном.
Триангуляция распознаваемой выборки в стилях «Сетка» и «Градиентная заливка цветом» приведена на рисунке 12:
Рисунок 12 Триангуляция исходной распознаваемой выборки в стилях «Сетка» и «Градиентная заливка цветом»
Из рисунков 10 и 12 видно, что распознаваемая выборка по чсилу точек примерно в 4 раза больше обучающей и перед нами стоит задача восстановить неизвестные значения функции на основе модели, отражающей зависимости между этими значениями и атрибутами, содержащимися в описательной информации к каждому значению функции как обучающей, так и распознаваемой выборки. В таблице 3 приведена обучающая выборка, как с геометрической, так и описательной частью (файл: Inp_data.dbf):
Таблица 3
Обучающая выборка, включая и геометрическую, и описательную информацию (фрагмент)
COORD_XY |
PZ |
ATTR1 |
ATTR2 |
ATTR3 |
ATTR4 |
ATTR5 |
ATTR6 |
ATTR7 |
|
X= -1.0000000 Y= -1.0000000 |
0,8227663 |
0,6769444 |
0,5569670 |
0,4582537 |
0,3770357 |
0,3102123 |
0,2552322 |
0,2099965 |
|
X= -0.9000000 Y= -1.0000000 |
0,8874649 |
0,7875939 |
0,6989620 |
0,6203042 |
0,5504982 |
0,4885479 |
0,4335691 |
0,3847773 |
|
X= -0.8000000 Y= -1.0000000 |
0,9190668 |
0,8446838 |
0,7763208 |
0,7134907 |
0,6557456 |
0,6026740 |
0,5538977 |
0,5090690 |
|
X= -0.7000000 Y= -1.0000000 |
0,9251794 |
0,8559569 |
0,7919137 |
0,7326623 |
0,6778440 |
0,6271273 |
0,5802053 |
0,5367940 |
|
X= -0.6000000 Y= -1.0000000 |
0,9135802 |
0,8346288 |
0,7625003 |
0,6966052 |
0,6364047 |
0,5814068 |
0,5311617 |
0,4852588 |
|
X= -0.5000000 Y= -1.0000000 |
0,8914885 |
0,7947517 |
0,7085120 |
0,6316303 |
0,5630912 |
0,5019893 |
0,4475177 |
0,3989569 |
|
X= -0.4000000 Y= -1.0000000 |
0,8651412 |
0,7484693 |
0,6475316 |
0,5602063 |
0,4846575 |
0,4192972 |
0,3627513 |
0,3138311 |
|
X= -0.3000000 Y= -1.0000000 |
0,8395989 |
0,7049263 |
0,5918554 |
0,4969211 |
0,4172144 |
0,3502928 |
0,2941054 |
0,2469306 |
|
X= -0.2000000 Y= -1.0000000 |
0,8187052 |
0,6702782 |
0,5487603 |
0,4492729 |
0,3678220 |
0,3011378 |
0,2465431 |
0,2018461 |
|
X= -0.1000000 Y= -1.0000000 |
0,8051287 |
0,6482322 |
0,5219104 |
0,4202050 |
0,3383191 |
0,2723904 |
0,2193094 |
0,1765723 |
|
X= 0.0000000 Y= -1.0000000 |
0,8004320 |
0,6406914 |
0,5128299 |
0,4104855 |
0,3285657 |
0,2629945 |
0,2105092 |
0,1684983 |
|
X= -1.0000000 Y= -0.9000000 |
0,8874649 |
0,7875939 |
0,6989620 |
0,6203042 |
0,5504982 |
0,4885479 |
0,4335691 |
0,3847773 |
|
X= -0.9000000 Y= -0.9000000 |
0,9210776 |
0,8483839 |
0,7814274 |
0,7197553 |
0,6629505 |
0,6106289 |
0,5624366 |
0,5180477 |
|
X= -0.8000000 Y= -0.9000000 |
0,9232883 |
0,8524613 |
0,7870675 |
0,7266902 |
0,6709446 |
0,6194753 |
0,5719543 |
0,5280787 |
|
X= -0.7000000 Y= -0.9000000 |
0,9029190 |
0,8152627 |
0,7361162 |
0,6646533 |
0,6001281 |
0,5418671 |
0,4892621 |
0,4417640 |
|
X= -0.6000000 Y= -0.9000000 |
0,8684319 |
0,7541740 |
0,6549487 |
0,5687784 |
0,4939453 |
0,4289578 |
0,3725207 |
0,3235088 |
|
X= -0.5000000 Y= -0.9000000 |
0,8273245 |
0,6844658 |
0,5662753 |
0,4684935 |
0,3875961 |
0,3206678 |
0,2652963 |
0,2194861 |
|
X= -0.4000000 Y= -0.9000000 |
0,7858334 |
0,6175341 |
0,4852789 |
0,3813484 |
0,2996763 |
0,2354957 |
0,1850604 |
0,1454266 |
|
X= -0.3000000 Y= -0.9000000 |
0,7488586 |
0,5607892 |
0,4199518 |
0,3144845 |
0,2355044 |
0,1763595 |
0,1320683 |
0,0989005 |
|
X= -0.2000000 Y= -0.9000000 |
0,7200200 |
0,5184288 |
0,3732791 |
0,2687684 |
0,1935186 |
0,1393373 |
0,1003256 |
0,0722365 |
|
X= -0.1000000 Y= -0.9000000 |
0,7017751 |
0,4924883 |
0,3456160 |
0,2425447 |
0,1702118 |
0,1194504 |
0,0838273 |
0,0588279 |
|
X= 0.0000000 Y= -0.9000000 |
0,6955396 |
0,4837753 |
0,3364849 |
0,2340386 |
0,1627831 |
0,1132221 |
0,0787504 |
0,0547741 |
|
X= -1.0000000 Y= -0.8000000 |
0,9190668 |
0,8446838 |
0,7763208 |
0,7134907 |
0,6557456 |
0,6026740 |
0,5538977 |
0,5090690 |
|
X= -0.9000000 Y= -0.8000000 |
0,9232883 |
0,8524613 |
0,7870675 |
0,7266902 |
0,6709446 |
0,6194753 |
0,5719543 |
0,5280787 |
|
X= -0.8000000 Y= -0.8000000 |
0,8986237 |
0,8075246 |
0,7256607 |
0,6520959 |
0,5859888 |
0,5265835 |
0,4732004 |
0,4252291 |
|
X= -0.7000000 Y= -0.8000000 |
0,8547296 |
0,7305627 |
0,6244336 |
0,5337218 |
0,4561879 |
0,3899173 |
0,3332738 |
0,2848590 |
|
X= -0.6000000 Y= -0.8000000 |
0,8004320 |
0,6406914 |
0,5128299 |
0,4104855 |
0,3285657 |
0,2629945 |
0,2105092 |
0,1684983 |
|
X= -0.5000000 Y= -0.8000000 |
0,7432502 |
0,5524209 |
0,4105869 |
0,3051688 |
0,2268168 |
0,1685816 |
0,1252983 |
0,0931280 |
|
X= -0.4000000 Y= -0.8000000 |
0,6892282 |
0,4750355 |
0,3274079 |
0,2256587 |
0,1555304 |
0,1071959 |
0,0738824 |
0,0509219 |
|
X= -0.3000000 Y= -0.8000000 |
0,6429678 |
0,4134076 |
0,2658078 |
0,1709058 |
0,1098870 |
0,0706538 |
0,0454281 |
0,0292088 |
|
X= -0.2000000 Y= -0.8000000 |
0,6077734 |
0,3693885 |
0,2245045 |
0,1364479 |
0,0829294 |
0,0504023 |
0,0306332 |
0,0186180 |
|
X= -0.1000000 Y= -0.8000000 |
0,5858340 |
0,3432015 |
0,2010591 |
0,1177873 |
0,0690038 |
0,0404248 |
0,0236822 |
0,0138738 |
|
X= 0.0000000 Y= -0.8000000 |
0,5783877 |
0,3345323 |
0,1934894 |
0,1119119 |
0,0647285 |
0,0374381 |
0,0216538 |
0,0125243 |
|
X= -1.0000000 Y= -0.7000000 |
0,9251794 |
0,8559569 |
0,7919137 |
0,7326623 |
0,6778440 |
0,6271273 |
0,5802053 |
0,5367940 |
|
X= -0.9000000 Y= -0.7000000 |
0,9029190 |
0,8152627 |
0,7361162 |
0,6646533 |
0,6001281 |
0,5418671 |
0,4892621 |
0,4417640 |
|
X= -0.8000000 Y= -0.7000000 |
0,8547296 |
0,7305627 |
0,6244336 |
0,5337218 |
0,4561879 |
0,3899173 |
0,3332738 |
0,2848590 |
|
X= -0.7000000 Y= -0.7000000 |
0,7907839 |
0,6253392 |
0,4945082 |
0,3910491 |
0,3092353 |
0,2445383 |
0,1933770 |
0,1529194 |
|
X= -0.6000000 Y= -0.7000000 |
0,7200200 |
0,5184288 |
0,3732791 |
0,2687684 |
0,1935186 |
0,1393373 |
0,1003256 |
0,0722365 |
|
X= -0.5000000 Y= -0.7000000 |
0,6497952 |
0,4222338 |
0,2743655 |
0,1782814 |
0,1158464 |
0,0752764 |
0,0489143 |
0,0317843 |
|
X= -0.4000000 Y= -0.7000000 |
0,5858340 |
0,3432015 |
0,2010591 |
0,1177873 |
0,0690038 |
0,0404248 |
0,0236822 |
0,0138738 |
|
X= -0.3000000 Y= -0.7000000 |
0,5323595 |
0,2834066 |
0,1508742 |
0,0803193 |
0,0427588 |
0,0227630 |
0,0121181 |
0,0064512 |
|
X= -0.2000000 Y= -0.7000000 |
0,4923127 |
0,2423718 |
0,1193227 |
0,0587441 |
0,0289205 |
0,0142379 |
0,0070095 |
0,0034509 |
|
X= -0.1000000 Y= -0.7000000 |
0,4675885 |
0,2186390 |
0,1022331 |
0,0478030 |
0,0223521 |
0,0104516 |
0,0048870 |
0,0022851 |
|
X= 0.0000000 Y= -0.7000000 |
0,4592357 |
0,2108974 |
0,0968516 |
0,0444777 |
0,0204258 |
0,0093802 |
0,0043077 |
0,0019783 |
|
X= -1.0000000 Y= -0.6000000 |
0,9135802 |
0,8346288 |
0,7625003 |
0,6966052 |
0,6364047 |
0,5814068 |
0,5311617 |
0,4852588 |
|
X= -0.9000000 Y= -0.6000000 |
0,8684319 |
0,7541740 |
0,6549487 |
0,5687784 |
0,4939453 |
0,4289578 |
0,3725207 |
0,3235088 |
|
X= -0.8000000 Y= -0.6000000 |
0,8004320 |
0,6406914 |
0,5128299 |
0,4104855 |
0,3285657 |
0,2629945 |
0,2105092 |
0,1684983 |
|
X= -0.7000000 Y= -0.6000000 |
0,7200200 |
0,5184288 |
0,3732791 |
0,2687684 |
0,1935186 |
0,1393373 |
0,1003256 |
0,0722365 |
|
X= -0.6000000 Y= -0.6000000 |
0,6360690 |
0,4045838 |
0,2573432 |
0,1636880 |
0,1041169 |
0,0662255 |
0,0421240 |
0,0267938 |
|
X= -0.5000000 Y= -0.6000000 |
0,5556588 |
0,3087567 |
0,1715634 |
0,0953307 |
0,0529713 |
0,0294340 |
0,0163553 |
0,0090879 |
|
X= -0.4000000 Y= -0.6000000 |
0,4841278 |
0,2343797 |
0,1134697 |
0,0549339 |
0,0265950 |
0,0128754 |
0,0062333 |
0,0030177 |
|
X= -0.3000000 Y= -0.6000000 |
0,4252881 |
0,1808700 |
0,0769218 |
0,0327139 |
0,0139129 |
0,0059170 |
0,0025164 |
0,0010702 |
|
X= -0.2000000 Y= -0.6000000 |
0,3817073 |
0,1457005 |
0,0556149 |
0,0212286 |
0,0081031 |
0,0030930 |
0,0011806 |
0,0004507 |
|
X= -0.1000000 Y= -0.6000000 |
0,3549870 |
0,1260158 |
0,0447340 |
0,0158800 |
0,0056372 |
0,0020011 |
0,0007104 |
0,0002522 |
|
X= 0.0000000 Y= -0.6000000 |
0,3459900 |
0,1197091 |
0,0414181 |
0,0143303 |
0,0049581 |
0,0017155 |
0,0005935 |
0,0002054 |
Синтез геокогнитивной модели
Для синтеза модели в окне «Формирование облака точек» выберем режим: «Из распознаваемой 2d Excel-таблицы Inp_map2.xls» с опцией «С формированием модели» (рисунок 13):
Рисунок 13 Экранная форма «Формирование облака точек» путем импорта данных из «Из 2d Excel-таблицы: Inp_map2.xls» с опцией: «С формированием модели»
Появится экранная форма (рисунок 14). На этой экранной форме указано, какие работы по формированию модели уже выполнены, а какие еще предстоит выполнить. Стандартные режимы системы «Эйдос», необходимые для выполнения работ, будут последовательно автоматически запущены с нужными параметрами по умолчанию после нажатия клавиши «ОК» (рисунки 15):
Рисунок 14 Экранная форма отображения 1-го этапа формирования облака точек путем импорта данных из «Из 2d Excel-таблицы: Inp_map2.xls» с опцией: «С формированием модели»
Рисунок 15 Экранные формы режимов системы «Эйдос», автоматически запускаемых в геокогнитивной подсистеме при синтезе модели
Восстановление неизвестных значений функции по описательной информации на основе модели
До этого мы рассматривали триангуляцию и отображение исходной функции. Рассмотрим теперь способность геокогнитивной подсистемы «Эйдос» восстанавливать неизвестные значения функции по атрибутам, связанным с ее значением и аргументами. Попробуем на основе исходной функции создать модель и в ней распознать значения функции для областей, для которых она не описана в исходных данных, но имеет значения, встречающиеся в исходных данных.
Для восстановления неизвестных значений функции на основе ранее созданной модели в окне «Формирование облака точек» выберем режим: «Из распознаваемой 2d Excel-таблицы Rsp_map2.xls» с опцией «Проводить распознавание» (рисунок 16):
Рисунок 16 Экранная форма окна: «Формирование облака точек», выбор режима: «Из итоговых результатов распознавания Rsp_IT.dbf» с интегральным критерием «Резонанс знаний»
Выполним предлагаемые системой и автоматически запускаемые режимы (рисунок 17):
Рисунок 17 Информация о пройденных и будущих этапах процесса восстановления значений функции по признакам аргумента
Экранные формы режимов, автоматически запускаемых системой «Эйдос» при восстановления значений функции по признакам аргумента, приведены ниже на рисунках 18:
Рисунок 18 Экранные формы режимов, автоматически запускаемых системой «Эйдос» при восстановления значений функции по признакам аргумента
Для картографической визуализации результатов восстановления пространственного распределения значений функции по признакам аргумента необходимо на экранной форме «Формирование облака точек» выбрать режим: «Из итоговых результатов распознавания Rsp_IT.dbf» с интегральным критерием «Резонанс знаний» (рисунок 19):
Рисунок 19 Экранная форма окна: «Формирование облака точек», выбор режима: «Из итоговых результатов распознавания rsp_IT.dbf» с интегральным критерием «Резонанс знаний»
На основе созданной модели получены результаты триангуляции, Делоне, приведенные на рисунках 20 и 21.
Рисунок 20 Визуализация сетки триангуляции результатов восстановления значений функции по признакам аргумента
Рисунок 21 Визуализация градиентной заливкой цветом результатов восстановления значений функции по признакам аргумента
Необходимо отметить, что если распознаваемая выборка не совпадает с обучающей, особенно если имеет больший объем, чем обучающая, то может возникнуть ситуация, при которой как интегративные характеристики объектов распознаваемой выборки (классы), так и их атрибуты, могут оказаться выходящими за пределы диапазонов классификационных и описательных шкал, сформированных при формировании модели на основе обучающей выборки. В этом случае система «Эйдос», естественно, может их не закодировать и не идентифицировать. Эта проблема легко решается путем включения в обучающую выборку новых объектов с такими характеристиками, которые встречаются в распознаваемой выборке, но аналогичных которым не было в обучающей выборке.
Из сравнения рисунков 12 и 21 прежде всего видно, что значения функции для точек, для которых они не были указаны в обучающей выборке, восстановлены по свойствам этих точек, связь которых со значениями функции выявлена на основе опорных точек, входящих в обучающую выборку, для которых известны и значения функции, и атрибутивная информация.
Так что представляют интерес дальнейшие исследования и численные эксперименты, которые могли бы позволить оценить устойчивость метода к шуму как в обучающей, так и в распознаваемой выборках, а также к дефициту априорной и атрибутивной информации, т.е. к как к числу опорных точек, так и к степени подробности их описания. Ранее проведенные многочисленные исследования показали, что в этом метод АСК-анализа обеспечивает высокое качество подавления шума, как при синтезе модели (обучении системы), так и при идентификации объектов в интегральном критерии.
Исследование погрешностей распознавания
Из визуального сравнения рисунков 12 и 21 прежде видно, что в принципе поставленная в статье задача решена. Но понятно, что визуальное сравнение не дает количественного анализа погрешностей распознавания.
С этой целью при подготовке результатов распознавания для картографической визуализации геокогнитивная подсистема создает базу данных «Out_map2.dbf» (таблица 4), аналогичную по структуре исходной базе «Rsp_map2.dbf», представленной в таблице 2, но содержащую не исходные данные, а результаты распознавания. Погрешности распознавания легко устанавливаются путем сравнения этих баз данных.
Таблица 4
2d Excel-файл результатов распознавания (округлено до сотых)
0,00 |
-1,00 |
-0,90 |
-0,80 |
-0,70 |
-0,60 |
-0,50 |
-0,40 |
-0,30 |
-0,20 |
-0,10 |
0,00 |
0,10 |
0,20 |
0,30 |
0,40 |
0,50 |
0,60 |
0,70 |
0,80 |
0,90 |
1,00 |
|
-1,00 |
0,51 |
0,51 |
0,70 |
0,70 |
0,79 |
0,70 |
0,70 |
0,60 |
0,60 |
0,51 |
0,51 |
0,00 |
0,51 |
0,51 |
0,60 |
0,60 |
0,70 |
0,70 |
0,79 |
0,70 |
0,70 |
|
-0,90 |
0,42 |
0,70 |
0,79 |
0,79 |
0,70 |
0,70 |
0,51 |
0,42 |
0,42 |
0,42 |
0,42 |
0,00 |
0,42 |
0,42 |
0,42 |
0,42 |
0,51 |
0,70 |
0,70 |
0,79 |
0,79 |
|
-0,80 |
0,06 |
0,70 |
0,79 |
0,70 |
0,51 |
0,51 |
0,33 |
0,42 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,42 |
0,33 |
0,51 |
0,51 |
0,70 |
0,79 |
|
-0,70 |
0,06 |
0,79 |
0,70 |
0,51 |
0,42 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
0,42 |
0,51 |
0,70 |
|
-0,60 |
0,06 |
0,70 |
0,70 |
0,51 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
0,51 |
0,70 |
|
-0,50 |
0,06 |
0,70 |
0,51 |
0,33 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,33 |
0,51 |
|
-0,40 |
0,06 |
0,60 |
0,42 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
0,42 |
|
-0,30 |
0,06 |
0,60 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
|
-0,20 |
0,06 |
0,51 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
|
-0,10 |
0,06 |
0,51 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
|
0,00 |
0,00 |
0,51 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
|
0,10 |
0,06 |
0,51 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
|
0,20 |
0,06 |
0,51 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
|
0,30 |
0,06 |
0,60 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
|
0,40 |
0,06 |
0,60 |
0,42 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
0,42 |
|
0,50 |
0,06 |
0,70 |
0,51 |
0,33 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,33 |
0,51 |
|
0,60 |
0,06 |
0,70 |
0,70 |
0,51 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
0,51 |
0,70 |
|
0,70 |
0,06 |
0,79 |
0,70 |
0,51 |
0,42 |
0,42 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,06 |
0,06 |
0,42 |
0,42 |
0,51 |
0,70 |
|
0,80 |
0,06 |
0,70 |
0,79 |
0,70 |
0,51 |
0,51 |
0,33 |
0,42 |
0,06 |
0,06 |
0,06 |
0,00 |
0,06 |
0,06 |
0,06 |
0,42 |
0,33 |
0,51 |
0,51 |
0,70 |
0,79 |
|
0,90 |
0,42 |
0,70 |
0,79 |
0,79 |
0,70 |
0,70 |
0,51 |
0,42 |
0,42 |
0,42 |
0,42 |
0,00 |
0,42 |
0,42 |
0,42 |
0,42 |
0,51 |
0,70 |
0,70 |
0,79 |
0,79 |
|
1,00 |
0,51 |
0,51 |
0,70 |
0,70 |
0,79 |
0,70 |
0,70 |
0,60 |
0,60 |
0,51 |
0,51 |
0,00 |
0,51 |
0,51 |
0,60 |
0,60 |
0,70 |
0,70 |
0,79 |
0,70 |
0,70 |
На рисунке 22 показано распределение абсолютных погрешностей (разностей) между истинными значениями функции распознаваемой выборки и значений функции, восстановленных путем распознавания по признакам аргумента на основе модели:
Рисунок 22 Погрешности (разности) между истинными и восстановленным значениями функции
Из рисунка 22 видно, что абсолютные погрешности распознавания зависят от значений восстанавливаемой функции. По-видимому, эти погрешности во многом обусловлены тем, что при создании модели было принято решение разбить диапазоны изменения классификационных и описательных шкал всего на 10 интервальных значений, а, например, не на 100. Кроме того, довольно сильное отличие исходной распознаваемой функции от результатов распознавания может быть обусловлено не вполне удачным выбором атрибутов, связанных со значениями функции и ее аргументов. С другой стороны, если погрешности были меньше, то визуально бы рисунки 21 и 12 не отличались бы, что тоже было не вполне убедительно.
Результаты распознавания исходных данных, использованных для создания модели, весьма сходны с самими исходными данными, но иногда встречаются и ошибки неидентификации и ложной идентификации (рисунки 23):
Рисунок 23 Различные варианты результатов распознавания значений исходной функции
Следует заметить, что даже при ошибках распознанное значение функции обычно весьма близко к истинному, что вполне разумно и соответствует интуитивным ожиданиям.
Достоверность модели зависит от многих обстоятельств, среди которых количество и конкретный набор атрибутов объектов и другие параметры модели, такие как количество интервальных значений классов и атрибутов и многие-многие другие. Проводя численные эксперименты, варьируя эти параметры моделей, можно добиваться повышения их достоверности. В системе «Эйдос» есть и много способов повышения качества моделей, собранных в специальную подсистему 3.7 (рисунок 24):
Рисунок 24 Выход на подсистему повышения качества моделей
Однако в задачу данной статьи не входит исследование возможностей повышения качества описанных в ней моделей.
Для иллюстрации высказанных мыслей и гипотез, связанных с повышением достоверности моделей, приведем на рисунках 25 исходную распознаваемую выборку с рисунка 5*, а также результаты распознавания в моделях с 10 и 100 градациями (интервальными значениями) числовых описательных шкал. Из рисунка 25 хорошо видно, что увеличение числа градаций описательных шкал с 10 до 100 дало значительное повышение качества модели, в результате чего нижний рисунок, полученный на модели со 100 градациями, стал значительно более похож на исходный, чем средний, полученный на модели с 10 градациями.
Подобные документы
Особенности и параметры процесса защиты информации. Оценка полноты и достоверности информации. Методы восстановления пропусков в массивах данных с использованием регрессионного моделирования. Методы структурирования данных в условиях неопределенности.
курсовая работа [89,1 K], добавлен 13.07.2011Виды неопределенностей в исходных данных систем и процессов защиты информации. Методы восстановления пропущенных значений в исходных данных. Моделирование методом экспертного построения функций, принадлежности оценки уровня риска информационной системы.
дипломная работа [735,3 K], добавлен 13.07.2011Расчет и построение таблицы значений функции (протабулирование функции) при различных значениях аргумента. Нахождение наибольшего и наименьшего значений функции на отрезке и построение графика. Рабочий лист Excel в режимах отображения значений и формул.
контрольная работа [30,0 K], добавлен 27.05.2010Ограничения нормализации, требование атомарности значений атрибута, запрет внутренней структуры. Достоинства и недостатки постреляционной объектной модели. Технологии интеграции распределенных данных на основе XML. Универсальный язык моделирования.
презентация [156,0 K], добавлен 19.08.2013Разработка различных программ для вычисления X и Y по формуле, для вычисления интеграла, для вычисления таблицы значений функции и для вычисления элементов вектора. Составление блок-схемы программы. Ввод значений, описание переменных и условия расчета.
контрольная работа [148,1 K], добавлен 08.11.2013Составление методического пособия пользователя для восстановления утраченной информации своими силами. Способы простого автоматического восстановления с помощью специализированных утилит и ручное восстановление памяти при помощи использования редакторов.
дипломная работа [7,0 M], добавлен 27.04.2010Причины "исчезновения" информации с жестких дисков и карт памяти. Принцип работы и обзор программ восстановления данных, восстановление данных с поцарапанных CD и DVD. Архивирование важных данных как лучший метод предупреждения потери информации.
курсовая работа [2,2 M], добавлен 27.12.2010Программный способ восстановления данных без физического вмешательства в устройство накопителя, а также в функционирование микропрограммы и структуру модулей служебной информации. Восстановление структуры файловой системы или ее удаленных данных.
презентация [67,5 K], добавлен 20.11.2016Главные преимущества использования информационно-аналитической системы "Невод". Характеристика объектов с использованием значений атрибута. Форма ввода данных, их интеграция. Формирование сложного поискового задания. Визуализация семантической сети.
презентация [382,8 K], добавлен 14.10.2013Пакет Microsoft Office. Электронная таблица MS Excel. Создание экранной формы и ввод данных. Формулы и функции. Пояснение пользовательских функций MS Excel. Физическая постановка задач. Задание граничных условий для допустимых значений переменных.
курсовая работа [3,4 M], добавлен 07.06.2015