Интеллектуальная информационная система

Функциональная структура автоматизированной интеллектуальной информационной системы сортировки грибов. Вербальная и формальная постановки задач, описание методов решения, примеры решения задач. Рассмотрение технологического процесса обработки данных.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 12.12.2018
Размер файла 1,9 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

СОДЕРЖАНИЕ

  • ВВЕДЕНИЕ
  • 1. ФУНКЦИИ ИИС
    • 1.1. Внешние объекты и диаграммы окружения
    • 1.2. Данные, результаты, хранилища и логическая модель
    • 1.3. Задачи, функции и модель поведения
  • 2. ПОСТАНОВКИ ЗАДАЧ И МЕТОДЫ РЕШЕНИЯ
    • 2.1. Получение правил выделения границы грибов на изображении
    • 2.2. Использование системы для определения границ изображения
    • 2.3. Формирование сигналов для автомата сортировки грибов
    • 2.4. Формирование накладных и актов
  • 3. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ ИИС
    • 3.1. Концептуальное проектирование базы данных
    • 3.2. Логическое проектирование базы знаний
    • 3.3. Создание базы знаний
      • 3.3.1. Определение показателя
      • 3.3.2. Определение факторов
      • 3.3.3. Проведение экспериментов и построение выборки значений
      • 3.3.4. Удаление признаков с неизвестными значениями
  • 3.3.5. Удаление факторов с постоянными значениями
  • 3.3.6. Устранение одинаковых элементов выборки
  • 3.3.7. Контроль значений признаков и восстановление ошибочных данных
  • 3.3.8. Нормирование значений признаков
  • 3.3.9. Выбор информационных признаков
  • 3.3.10. Формирование обучающей и контролирующей выборок
  • 3.4. Формирование правил принятия решений
  • 4. ТЕХНОЛОГИЧЕСКИЙ ПРОЦЕСС ОБРАБОТКИ ДАННЫХ
  • 4.1. Технология приобретения знаний
  • 4.2. Технология принятия решения
  • 5. ПРОГРАММНЫЕ СРЕДСТВА
  • 5.1. Программные средства приобретения знаний
  • 5.2. Программные средства принятия решений
  • ЗАКЛЮЧЕНИЕ
  • CONCLUSION
  • ПРИЛОЖЕНИЕ

ВВЕДЕНИЕ

На современном этапе развития в грибном хозяйстве на новый уровень выходят автоматизированные системные решения, которые способны заменить трудовые ресурсы при проведении сбора урожая. Участие роботизированных машин в сельском хозяйстве позволяет повысить эффективность и производительность сбора урожая. Данная проблема актуальна, так как необходимо разработать такую систему, которая идентифицирует и классифицирует цели для роботизированных машин.

Разрабатываемая интеллектуальная информационная система предназначена для управления процессом сбора грибов в грибном хозяйстве для работников сборки грибов.

Рассматриваемая организация осуществляет деятельность по сборке грибов в лесах, примыкающих к пункту заготовки грибов артели заготовителей, вручную. Заготовители осуществляют сбор белых грибов и маслят в лесу без предварительной сортировки и доставляют грибы в корзинах на пункт заготовки грибов артели заготовителей. В одной корзине могут находиться грибы нескольких видов. Заготовители укладывают грибы на транспортер, который доставляет их в пункт сортировки. Далее определяются вес грибов каждого вида и сумма, которая будет выплачена заготовителю за сбор грибов.

Проблема деятельности организации заключается в необходимости большого количества заготовителей для сбора грибов, так как сезон появления грибов непродолжителен. Недостаток трудовых ресурсов приводит к тому, что часть грибов портится или остается не собранной. В связи с этим организация теряет часть своей прибыли, которую она могла бы получить, если бы вовремя успела собрать урожай. Чтобы решить данную проблему, необходимо усовершенствовать процесс организации сбора грибов путем процесса обработки информации изображения каждого собранного гриба и оценки его параметров по изображению для дальнейшей транспортировки до пункта сортировки грибного хозяйства.

Для многих культур уже есть решения по автоматизированной уборке урожая. Например, одним из самых крупных заготовителей овощей в России является компания ООО «СИТИ-сад», Краснодарский край. Для автоматизированной сортировки используется линия AWETA с мощностью до 4,5 т/ч.

Интеллектуальная информационная система управления сбором грибов приведет к существенной экономии времени и трудозатрат, а также повысит прибыль организации от уменьшения значительной части заготовителей (персонала). В данной работе используется именно интеллектуальная информационная система, потому что не существует формального четкого алгоритма определения границ объекта, в связи с этим необходимо производить обучение и применять методы искусственного интеллекта.

Таким образом, целью курсовой работы является разработка ИИС управления сбором грибов для увеличения прибыли заготовительного предприятия за счет повышения качества сортировки грибов. Для реализации данного решения необходимо решить следующие задачи:

1. Построение классификатора граничных точек изображения гриба;

2. Управление сбором грибов.

В первом разделе курсовой работы представлена функциональная структура автоматизированной интеллектуальной информационной системы сортировки грибов.

Во втором разделе представлены вербальная и формальная постановки задач, описание методов решения, примеры решения задач.

В третьем разделе описаны проектирование информационного обеспечения, концептуальное и логическое проектирование базы данных, кардинальность и избирательность связей, кодирование информации, классификаторы и кодификаторы информации, определение задач ведения базы данных, состав задач, операторы, документы, источники, расчет трудоемкости ведения базы данных.

В четвертом разделе представлен технологический процесс обработки данных, задачи принятия решения и ведения базы данных.

В пятом разделе представлена разработка программных средств, выбор системного программного обеспечения, инструментальные средства разработки прикладных программ, прикладное программное обеспечение, алгоритмы прикладных программ: алгоритмы пользовательского интерфейса, алгоритмы принятия решений.

автоматизированный интеллектуальный информационный

1. ФУНКЦИИ ИИС

В данной главе представлены DFD диаграммы для модели окружения, логической модели и модели поведения.

1.1 Внешние объекты и диаграммы окружения

На рисунке 1.1 представлена DFD диаграмма «Управление сбором грибов». На ней представлена модель окружения информационной системы. Она включает внешние объекты, воздействующие на процесс.

Источники информации:

· Специалист по обработке изображений;

· Сортировочный автомат;

· Видеокамера.

Получатели информации:

· Сортировщик - работник, отвечающий за работу конвейера;

· Сортировочный автомат;

· Специалист по обработке изображений;

· Видеокамера.

Рис. 1.1. Модель окружения

1.2 Данные, результаты, хранилища и логическая модель

На рисунке1.2 представлена логическая модель в виде DFD диаграммы. Она отображает систему, как набор действий и описывает, что должна делать система.

Логическая модель включает в себя 2 процесса: «Формирование правил по определению границ гриба на изображении», «Определение вида гриба, его количество и вес, а также формирование накладных и актов».

Исходными данными являются: «Получение изображения гриба с данными о граничных точках», «Получение изображения каждого собранного гриба».

Результатами логической модели являются: «Сортировка грибов» и «Анализ и исправление накладных и актов».

Рис. 1.2. Логическая модель

1.3 Задачи, функции и модель поведения

На рисунке 1.3 представлена DFD диаграмма «Контроль, профилактика аварийных ситуаций, ремонт грузоподъемной техники». На ней представлена модель поведения информационной системы. Она включает внешние объекты, хранилища, основные процессы и информационные связи.

Основные задачи ИИС:

- формирование правил по определению границ гриба на изображении;

- определение вида гриба, его количество и вес, а также формирование накладных и актов.

Источники информации

- Видеокамера;

- Специалист по обработке изображений;

- Сортировочный автомат.

Получатели информации

- Специалист по обработке изображений;

- Сортировщик.

Рис. 1.3. Модель поведения

2 ПОСТАНОВКИ ЗАДАЧ И МЕТОДЫ РЕШЕНИЯ

Для сортировки грибов на основе изображений решить следующие задачи:

1. сформировать правила для определения границ изображения;

2. использовать систему для определения границ изображения;

3. сформировать сигналы для автомата сортировки грибов;

4. сформировать и напечатать накладные и акты.

2.1 Получение правил выделения границы грибов на изображении

2.1.1. Постановка задачи

На вход системе поступают изображения с выделенными границами грибов. По полученным изображениям необходимо сформировать правила, по которым система будет определять принадлежность пикселя изображения к границе гриба. Правила строятся на основе информационных признаков. Определение множества информационных признаков включает в себя подготовку обучающей и контролирующей выборки для последующего корреляционного анализа. На выходе получим значение, которое будет указывать на принадлежность точки на изображении гриба к границе. Обозначения приведены в таблице 1.

Таблица 1. Обозначения

Обозначение

Название

Диапазон значений переменной

j

Номер признака

1, n

j признак

Обучающая выборка

a

Параметры функции u

i

Номер опыта

i = 1,m

ri

Значение коэффициента корреляции

xij

Значение j-го признака в i-ом элементе выборки

О

Множество объектов выборки

С01

Классы объектов

е

Целевая функция

Xj

вариация j-го признака

Пусть имеются экспериментально найденные значения случайных величин координат граничных точек и точек, лежащих вне границы X = (x1, x2,…xn)и Y=( y1,y2,…yn).

По следующей формуле находим значения парного коэффициента корреляции.

Таким образом, выявляем зависимость между случайными величинами для выявления наиболее информационных признаков для классификации.

Если коэффициент корреляции принимает значения близкие к 1, то значит, между значениями имеется зависимость (-1 обратная зависимость). Если коэффициент корреляции равен 0, то значит, что значения являются независимыми, но это не является признаком отсутствия или присутствия зависимости.

Классификация представляет собой отнесение объекта к одному из заранее известных классов.

Пусть дано множество объектов О = {o} и n мерное пространство признаков X: X = X1X2Xn, где Xj - множество значений j-ого признака, j=1,n.

Каждый объект oО задан точкой x в n мерном пространстве признаков X: X, x = (o), o = -1(X), гдеx = (x1, x2,…xn) - вектор значений признаков объекта o, xijXj , j = 1,n.

Рассмотрим два класса объектов С0 и С1: O = С0С1,С0 С1 = .

Необходимо каждый объект отнести к одному из двух классов С0 или С1, т. е. должна быть задана функция

Если известна функция y = u(x):

то k(0) = u((o)), o О.

Необходимо оценить функцию u(x) определить ее вид и параметры (а).

Задача определения функции u(x) состоит в поиске параметров a функции u*: y* = u*(x, a), y* [0,1], при которой минимизируется значение погрешности для каждого элемента заданной обучающей выборки V = {(xi, yi)} , где

yi = u(xi) - значение функции, полученное в результате проведения i-го опыта(i=1,s; j=1,n),

xi = (xi1, xi2,…xin) - элемент выборки, xij- значение j-го признака в i-ом элементе выборки (результата i-го опыта), причем

xijXj, где Xj - вариация j-го признака ( i = 1,m, j = 1,n):

В качестве оценочной функции используется полином второго порядка y*= u*(x, a):

, где a = (a00, a01, a02, …,a0n, a11, a12, …, a1n, a22, a23, …, ann)

Значение полинома на i-ом элементе обучающей выборки (i=1,m):

Таким образом, мы получаем функцию для оценки значений обучающей выборки.

Окончательная формулировка задачи: необходимо определить множество информационных признаков объекта и значения полинома, найти параметры a функции u*, при которой минимизируется значение погрешности для каждого элемента заданной обучающей выборки V.

2.2 Использование системы для определения границ изображения

2.2.1. Постановка задачи

На основе полинома второго порядка, определенного ранее, необходимо построить характеристическую функцию g1(xi, a), определяющую принятие решение об отнесении пикселя изображения к фону или грибу. Таблица 2 содержит список обозначений.

Таблица 2. Обозначения

Обозначение

Название

Диапазон значений переменной

Характеристическая функция

[0;1]

Полином

i признак

i

Номер признака

1, n

Параметр

Порог принятия решений

0-1

Функция

[0;1]

На основе полученного полинома

формируем принятие решения об отнесении объекта к классу.

Для этого строим характеристическую функцию g0(xi,a), определяющую принятие решения об отнесении объектаoi(oi = -1(xi)) к классу C0:

Аналогично строится характеристическая функция g1(xi,a), определяющая принятие решения об отнесении объектаoi(oi = -1(xi)) к классу C1:

hможет быть равен 0,5, но на практике его значения подбираются для того, чтобы количество ошибочных решений было минимальным.

Ошибки первого и второго рода:

1. ;

2. .

Окончательная формулировка задачи: необходимо подобрать такой h, при котором минимизируются ошибки I и II рода.

2.3 Формирование сигналов для автомата сортировки грибов

2.3.1. Постановка задачи

На изображениях c вычисленной границей необходимо определить вид гриба - белый или маслята. Таблица 3 включает в себя обозначения данной задачи.

Таблица 3. Обозначения

Обозначение

Название

Диапазон значений переменной

Дисперсия яркости изображения

i яркость

Средняя яркость в области

Количество пикселей в области

Порог принятия решений

0-1

Функция

[0;1]

Для определения вида гриба сначала вычисляется дисперсия яркости изображения:

Где n - количество пикселей в области, Ij - яркость текущего пикселя, Iср - средняя яркость пикселей в области.На основе значения дисперсии строится функция q, которая определяет на основании порогового значения tвида гриба:

Порог t подбирается таким образом, чтобы ошибки распознавания были минимальны.

Ошибки первого и второго рода:

1.

2.

Окончательная формулировка задачи: необходимо подобрать такой t, при котором минимизируются ошибки I и II рода.

2.4 Формирование накладных и актов

2.4.1. Постановка задачи

Автомат сортировки ведет подсчет видов грибов: белые и маслята. На основе среднего веса каждого гриба вычисляется общий вес гриба. Зная максимальный вес, который может выдержать контейнер, система упаковывает грибы в контейнеры для консервирования. Для грибов формируются накладные, а для заготовителей грибов - акты на оплату. Таблица 4 содержит обозначения данной задачи.

Таблица 4. Обозначения

Обозначение

Название

Диапазон значений переменной

Объем

Число Пи, отношение длины окружности к диаметру

D

Диаметр

Масса

Плотность

V

Объем

Максимальный переносимый вес

m

Масса одного гриба

p

Цена за один контейнер

с

Цена одного гриба

Для вычисления массы требуется найти V.Гриб имеет полусферическую функцию, для определения объема будет использоваться следующая формула:

,

где D - диаметр шарового сегмента, который находиться на основе двух наиболее удаленных точек из набора известных параметров изображения, а h - высота шарового сегмента, т.е. длина перпендикуляра, восстановленного из центра основания до пересечения с поверхностью шара.

Масса гриба вычисляется по формуле m = V * с, где с - среднее значение плотности объекта. Средняя плотность грибас ? 640.

Примеры накладной и акта изображены на рисунках 2.1 и 2.2 соответственно.

Рис. 2.1. Пример накладной.

Накладная должная содержать: наименование гриба, вид гриба, количество грибов в контейнере, цену за контейнер и итоговую сумму. При заполнении контейнера учитывается максимальный вес, который может выдержать контейнер и не сломаться. Максимальный переносимый вес равен 15 кг.

Для вычисления количества грибов в контейнере используется формула:

Цена за контейнер вычисляется по следующей формуле:

,

где k -количество грибов, с - стоимость одного гриба.

Акт должен содержать: даты поступления и списания товара, номер накладной, причину списания.

Рис. 2.2. Пример акта.

Окончательная формулировка задачи: необходимо на изображении вычислить диаметр гриба, используя его, вычислить объем и массу гриба. На основе данных о сортировке составить накладные и акты.

3. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ ИИС

Задача проектирования информационного обеспечения ИС формулируется следующим образом: определить потоки, содержание, носители, форму и структуру представления информации, необходимой и достаточной для управления объектом в рассматриваемой предметной области.

3.1 Концептуальное проектирование базы данных

При концептуальном проектировании базы данных используется методика, ориентированная на модель представление данных «Сущность-связь». Базовыми элементами в этой модели являются сущности и связи.

1. Устанавливаются сущности. Под сущностью понимают основное содержание, совокупность важнейших свойств объектов рассматриваемой предметной области. Сущность состоит из множества экземпляров, каждый из которых содержит характеристики или свойства конкретного объекта предметной области.

Для каждой сущности указывается наименование, дается краткое описание. Оценивается количество экземпляров сущности. Описание сущностей приведены в таблице 5.

Таблица 5. Описание сущностей

Наименование сущности

Описание сущности

Количество экземпляров

Признаки изображения

Признаки изображений грибов

9

Выборка входных данных

Выборка входных данных

100

Накладная для передачи контейнеров

Накладная для передачи контейнеров с грибами

1

Акт для передачи корзин

Акт передачи корзин для оплаты работ заготовителя

1

2. Для каждой сущности определяется совокупность атрибутов. Атрибуты ? поименованные свойства объектов, являющиеся содержанием сущности. Для каждого атрибута устанавливается имя и дается определение, которое вносится в глоссарий. Сущность не может содержать двух атрибутов с одним и тем же именем. Каждый экземпляр сущности должен быть уникален и отличаться от других экземпляров.

Атрибут может использоваться в качестве первичного ключа, вторичного ключа или определять не ключевое свойство сущности. Описание атрибутов сущностей приведены в таблице 6.

Таблица 6. Описание атрибутов сущностей

Наименование сущности

(количество экземпляров)

Наименование атрибута

Наименование домена

Признаки изображения (9)

*Идентификатор изображения

Идентификатор

*Координаты точки х

Координаты

*Координаты точки у

Координаты

*Идентификатор признака

Идентификатор

Значение признака

Значение признака

Выборка входных данных (100)

*Идентификатор изображения

Идентификатор

*Координаты точки х

Координаты

*Координаты точки у

Координаты

Принадлежность границе

Принадлежность

Принадлежность обучающей выборке

Принадлежность

Правила принятия решений (1)

*Идентификатор признака 1

Идентификатор

*Идентификатор признака 2

Идентификатор

Значение коэффициента

Значение коэффициента

Значение измененного полинома

Значение полинома

Накладная для передачи контейнеров (1)

*Идентификатор накладной

Идентификатор

*Идентификатор контейнера

Идентификатор

*Идентификатор товара

Идентификатор

Наименование товара

Наименование

Количество товаров в накладной

Количество

Единица измерения

Единица измерения

Количество грибов в контейнере

Количество

Вес нетто контейнера

Вес

Акт для передачи корзин (1)

*Идентификатор акта

Идентификатор

*Идентификатор корзины

Идентификатор

*Идентификатор товара

Идентификатор

Наименование товара

Наименование

Единица измерения

Единица измерения

Количество грибов в корзине

Количество

Количество грибов в акте

Количество

Вес нетто

Вес

Цена

Цена

3. Для доменов определяются типы значений. Домен можно определить как совокупность значений, из которых берутся значения атрибутов. Каждый атрибут может быть определен только на одном домене, но на каждом домене может быть определено множество атрибутов. В понятие домена входит не только тип данных, но и область значений данных. Описание доменов приведены в таблице 7.

Таблица 7. Описание доменов

Наименование домена

Название и описание типа данных (максимальное количество знаков)

Примеры значений

1

Идентификатор

Идентификатор, числовой (4)

0025

2

Координаты

Координата точек на изображении, числовой (4)

10

3

Значение признака

Значение признака изображения (4)

256

4

Принадлежность

Бинарный (1)

1

5

Наименование

Наименование товара в накладной, текстовый (100)

Грибы

6

Единица измерения

Единица измерения корзин/контейнеров, текстовый (2)

кг

7

Количество

Количество корзин/контейнеров, числовой (3)

25

8

Цена

Цена товара, числовой (5)

10000

3.2 Логическое проектирование базы знаний

Примем за начальную логическую модель базы данных исходную концептуальную модель, приведенную в разделе 3.1.

Построим систему полных функциональных зависимостей. Результат оформим в виде таблицы 8.

Таблица 8. Функциональные зависимости

Наименование сущности

Наименование атрибута

Функциональные зависимости F1

Признаки изображения

*Идентификатор изображения

*

*Координаты точки х

*

*Координаты точки у

*

*Идентификатор признака

*

Значение признака

<

Выборкавходныхданных

*Идентификатор изображения

*

*Координаты точки х

*

*Координаты точки у

*

Принадлежность границе

<

Принадлежность обучающей выборке

<

Правилапринятиярешений

*Идентификатор признака 1

*

*Идентификатор признака 2

*

Значение коэффициента

<

Значение измененного полинома

<

Накладнаядляпередачиконтейнеров

*Идентификатор накладной

*

*

*Идентификатор контейнера

<

*

*

*Идентификатор товара

<

*

<

Наименование товара

<

Количество товара в накладной

<

Единица измерения

<

Количество товаров в контейнере

<

Вес нетто корзины

<

Цена

<

Акт для передачи корзин

*Идентификатор акта

*

*

*Идентификатор корзины

<

*

*

*Идентификатор товара

<

*

<

Наименование товара

<

Количество товара в акте

<

Единица измерения

<

Количество товаров в корзине

<

Вес нетто корзин

<

Цена

<

Таблица 9. Измененная таблица функциональных зависимостей

Наименование сущности

Наименование атрибута

Функциональные зависимости F1

Признаки изображения

*Идентификатор изображения

*

*Координаты точки х

*

*Координаты точки у

*

*Идентификатор признака

*

Значение признака

<

Выборкавходныхданных

*Идентификатор изображения

*

*Координаты точки х

*

*Координаты точки у

*

Принадлежность границе

<

Принадлежность обучающей выборке

<

Правилапринятиярешений

*Идентификатор признака 1

*

*Идентификатор признака 2

*

Значение коэффициента

<

Значение измененного полинома

<

Товар

*Идентификатор товара

*

Наименование товара

<

Цена

<

Единица Измерения

<

Корзина

*Идентификатор корзины

*

Идентификатор товара

<

Количество товаров

<

Вес нетто

<

Накладнаядляпередачиконтейнеров

*Идентификатор накладной

*

Идентификатор товара

<

Количество товаров в накладной

<

Акт для передачи корзин

*Идентификатор акта

*

Идентификатор товара

<

Количество товаров в акте

<

Корзины накладной

Идентификатор накладной

*

Идентификатор корзины

<

Корзины актов

Идентификатор акта

*

Идентификатор корзины

<

Поскольку все не ключевые атрибуты отношений функционально зависят от первичных ключей этих отношений, все отношения находятся во второй нормальной форме.

Поскольку отсутствуют транзитивные зависимости, отношения также находятся в третьей нормальной форме.

Результатом логического проектирования является логическая модель базы данных.

Логическая модель базы данных представлена на рисунке 3.1.

Рис. 3.1. Логическая модель базы данных

3.3 Создание базы знаний

Выборка значений необходима для проведения аппроксимации неизвестной функции:

y=f(x).

Значение функции y определяет показатель, а аргументы, представленные вектором x - факторы.

Формирование обучающей и контролирующей выборки включает выполнение следующих этапов:

1. Определение показателя и его характеристик: единица измерения, точность, тип значений показателя и определить вариацию значений.

2. Установление факторов (связанных зависимостью с показателем) и их характеристики (единица измерения, точность, тип значений факторов); определить вариацию значений факторов.

3. Проведение экспериментов и построение выборки значений факторов и показателя.

4. Удаление признаков с неизвестными значениями.

5. Удаление признаков с постоянными значениями.

6. Устранение одинаковых элементов выборки и подсчетом их частоты.

7. Контроль значений признаков.

8. Нормирование факторов.

9. Определение множества наиболее информационных признаков.

10. Разбиение выборки на обучающую и тестирующую выборку.

3.3.1 Определение показателя

Показатель задается в задании курсовой работы или выбирается самостоятельно по согласованию с руководителем. Пример оформления выполнения этапа приведен в таблице 10.

Таблица 10. Характеристики целевого показателя

Целевой показатель

Обозначение

Единица

измерения

Вариации и пояснение значений

Точность измерений

Тип

Граница гриба

Y

-

{0, 1},

0 - фон изображения,

1 - гриб.

-

Бинарный

3.3.2 Определение факторов

Факторы, влияющие на значение показателя,задаются в задании курсовой работы или выбираются самостоятельно по согласованию с руководителем. Пример оформления выполнения этапа приведен в таблице 11.

Таблица 11. Характеристики факторов

Обозначение

Фактор

Единица измерения

Вариации

Точность измерений

Тип

Х1

Оценка мат. ожидания в окрестностях точки 5х5 без преобразования

-

[77; 255]

1

Целое

Х2

Несмещенная оценка дисперсии в окрестностях точки 5х5 без преобразования

-

[0;7001]

1

Целое

Х3

Мода в окрестностях точки 5х5 без преобразования

-

[82; 255]

1

Целое

Таблица.11. Окончание

Х4

Оценка мат. ожидания в окрестностях точки 5х5 (преобразование Собеля)

-

[0,134]

1

Целое

Х5

Несмещенная оценка дисперсии в окрестностях точки 5х5 (преобразование Собеля)

-

[0;15963]

1

Целое

Х6

Мода в окрестностях точки 5х5 (преобразование Собеля)

-

[0; 255]

1

Целое

Х7

Оценка мат. ожидания в окрестностях точки 5х5 (LBP (ЛБШ))

-

[0; 99]

1

Целое

Х8

Несмещенная оценка дисперсии в окрестностях точки 5х5 (LBP (ЛБШ))

-

[0,14739]

1

Целое

Х9

Мода в окрестностях точки 5х5 (LBP (ЛБШ))

-

[0,]

1

Целое

3.3.3 Проведение экспериментов и построение выборки значений

При проведении экспериментов активных экспериментов необходимо построить его план (план полного или дробного факторного эксперимента). Количество опытов эксперимента должно достаточно для получения не менее 100 элементов выборки.

Пример данных выборки, отображающей соответствие значений факторов ипоказателя, представлен в таблице 12.

Таблица 12. Начало

X1

X2

X3

X4

X5

X6

X7

X8

X9

Y

1

0223

0617

0240

0117

8750

0000

0012

0074

0006

1

2

0211

0590

0241

0084

7274

0253

0020

0307

0004

1

3

0206

0594

0237

0045

2180

0254

0029

0683

0011

1

4

0229

0572

0244

0075

6375

0254

0024

0505

0007

1

5

0220

0823

0196

0104

9072

0254

0027

0452

0008

1

6

0197

1045

0229

0119

12249

0255

0022

0291

0004

1

7

0149

1063

0134

0131

11668

0255

0020

0343

0001

1

8

0189

0763

0186

0131

15596

0255

0013

0141

0001

1

9

0206

0658

0244

0148

12709

0255

0007

0081

0001

1

10

0215

0699

0244

0120

13956

0000

0012

0152

0003

1

11

0220

0938

0251

0119

7418

0255

0015

0077

0007

1

12

0217

0940

0195

0141

12071

0255

0019

0309

0004

1

13

0192

1950

0146

0136

11295

0255

0031

0683

0011

1

14

0169

1691

0187

0088

4306

0052

0022

0503

0007

1

15

0227

0685

0252

0160

10798

0255

0028

0455

0008

1

16

0242

0577

0255

0157

11346

0255

0022

0292

0007

1

17

0245

0385

0254

0174

10600

0255

0022

0343

0003

1

18

0237

0837

0254

0148

14182

0255

0014

0143

0003

1

19

0219

1036

0254

0144

13469

0255

0008

0081

0001

1

20

0207

1358

0165

0113

15051

0000

0012

0152

0003

1

21

0211

0397

0204

0088

5112

0031

0008

0062

0002

1

22

0228

0561

0244

0065

2385

0026

0013

0155

0006

1

23

0212

0845

0246

0039

0460

0050

0019

0347

0002

1

24

0209

0205

0203

0112

11941

0255

0019

0158

0004

1

25

0190

0286

0169

0136

12571

0255

0007

0066

0004

1

26

0233

0646

0249

0123

12986

0255

0009

0115

0001

1

27

0220

0560

0204

0089

6203

0255

0015

0095

0025

1

28

0241

0543

0247

0029

1939

0056

0004

0019

0002

1

29

0220

0910

0246

0030

4263

0245

0013

0085

0006

1

30

0216

0995

0244

0058

2028

0000

0002

0006

0002

1

31

0233

0342

0253

0093

2151

0049

0021

0117

0029

1

32

0239

0308

0233

0072

2746

0061

0019

0153

0007

1

33

0240

0526

0254

0036

1921

0000

0005

0086

0001

1

34

0222

0725

0202

0036

2239

0000

0020

0097

0018

1

Таблица 12. Продолжение.

X1

X2

X3

X4

X5

X6

X7

X8

X9

Y

35

0235

0583

0254

0033

1326

0000

0014

0048

0013

1

36

0247

0515

0254

0115

13847

0000

0018

0100

0017

1

37

0248

0164

0255

0127

13417

0000

0018

0153

0023

1

38

0241

0407

0236

0133

11271

0255

0022

0105

0025

1

39

0231

0624

0219

0106

8579

0254

0021

0114

0033

1

40

0214

0613

0209

0082

4568

0254

0009

0040

0008

1

41

0104

3359

0084

0124

13484

0255

0065

6425

0011

1

42

0103

3053

0085

0078

13456

0000

0062

5998

0004

1

43

0080

0151

0080

0110

15185

0254

0010

0825

0004

1

44

0216

2036

0253

0130

15089

0255

0051

5091

0005

1

45

0213

1844

0252

0036

4419

0000

0065

5866

0002

1

46

0154

1282

0139

0121

13735

0255

0060

5108

0007

1

47

0197

1827

0249

0073

9953

0255

0023

1041

0001

1

48

0177

0804

0163

0117

15355

0254

0022

0712

0007

1

49

0166

0311

0165

0132

14657

0254

0028

0986

0002

1

50

0179

0675

0173

0099

14992

0254

0022

0922

0002

1

51

0243

0101

0243

0000

0000

0000

0006

0002

0006

0

52

0245

0081

0245

0000

0004

0000

0002

0003

0004

0

53

0245

0164

0246

0000

0000

0000

0001

0001

0001

0

54

0242

0303

0243

0000

0000

0000

0001

0001

0002

0

55

0242

0343

0243

0000

0000

0000

0001

0000

0000

0

56

0243

0466

0244

0000

0000

0000

0002

0004

0002

0

57

0244

0000

0244

0002

0020

0000

0001

0003

0002

0

58

0245

0000

0245

0000

0002

0000

0000

0001

0000

0

59

0245

0000

0245

0000

0008

0000

0000

0001

0000

0

60

0247

0000

0247

0000

0000

0000

0000

0001

0000

0

61

0251

0105

0251

0000

0001

0000

0006

0002

0006

0

62

0232

0110

0234

0002

0018

0000

0002

0003

0004

0

63

0254

0360

0255

0002

0025

0000

0001

0001

0001

0

64

0255

0000

0255

0002

0010

0000

0001

0001

0002

0

65

0255

0000

0255

0000

0000

0000

0001

0000

0000

0

66

0255

0000

0255

0000

0000

0000

0002

0004

0002

0

67

0255

0000

0255

0000

0000

0000

0001

0003

0002

0

68

0255

0000

0255

0000

0000

0000

0000

0001

0000

0

69

0238

0383

0239

0000

0000

0000

0000

0001

0000

0

70

0250

0501

0251

0004

0049

0000

0000

0001

0000

0

71

0255

0000

0255

0002

0013

0000

0000

0000

0000

0

72

0255

0000

0255

0002

0023

0000

0000

0000

0000

0

73

0255

0000

0255

0002

0025

0000

0000

0000

0000

0

74

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

75

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

76

0254

0487

0255

0000

0000

0000

0000

0000

0000

0

77

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

78

0253

0169

0254

0000

0000

0000

0000

0000

0000

0

79

0253

0317

0254

0000

0000

0000

0000

0000

0000

0

80

0255

0000

0255

0003

0039

0000

0000

0000

0000

0

81

0250

0441

0248

0000

0000

0000

0000

0000

0000

0

Таблица 12. Окончание.

X1

X2

X3

X4

X5

X6

X7

X8

X9

Y

82

0254

0487

0255

0000

0000

0000

0000

0000

0000

0

83

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

84

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

85

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

86

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

87

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

88

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

89

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

90

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

91

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

92

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

93

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

94

0254

0487

0255

0000

0000

0000

0000

0000

0000

0

95

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

96

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

97

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

98

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

99

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

100

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

3.3.4 Удаление признаков с неизвестными значениями

Если в каждом элементе выборки значения фактора неизвестно, то такой фактор удаляется. В рассматриваемом примере в результате анализа выборки факторы с неизвестными значениями не обнаружены.

3.3.5 Удаление факторов с постоянными значениями

В рассматриваемом примере в результате анализа факторы с постоянными значениями не обнаружены.

3.3.6 Устранение одинаковых элементов выборки

Выборка должна быть множеством различных между собой элементов. Поэтому в ней не должно встречаться хотя бы двух одинаковых элементов, для которых совпадают вектора значений факторов и значения целевых показателей. В некоторых случаях бывает целесообразно сохранять информацию о частоте, с которой каждый элемент встречается в исходной выборке:

,

где. x* - вектор значений факторов,

y - целевой показатель,

- пространство значений признаков,

p - частота с которой (x*,y) присутствовала в исходной выборке.

В результате анализа выборки, были обнаружены одинаковые элементы (строки таблицы 12 с номерами: 51-56, 58-61, 65-69, 74-79, 81-100). Данные строки выделены в таблице 12 красным цветом. Удалимиз выборки повторяющиеся значения. Итоговая выборка представлена в таблице 13.

Таким образом, было произведено устранение одинаковых элементов выборки.

Таблица 13. Начало

X1

X2

X3

X4

X5

X6

X7

X8

X9

Y

1

0223

0617

0240

0117

8750

0000

0012

0074

0006

1

2

0211

0590

0241

0084

7274

0253

0020

0307

0004

1

3

0206

0594

0237

0045

2180

0254

0029

0683

0011

1

4

0229

0572

0244

0075

6375

0254

0024

0505

0007

1

5

0220

0823

0196

0104

9072

0254

0027

0452

0008

1

6

0197

1045

0229

0119

12249

0255

0022

0291

0004

1

7

0149

1063

0134

0131

11668

0255

0020

0343

0001

1

8

0189

0763

0186

0131

15596

0255

0013

0141

0001

1

9

0206

0658

0244

0148

12709

0255

0007

0081

0001

1

10

0215

0699

0244

0120

13956

0000

0012

0152

0003

1

11

0220

0938

0251

0119

7418

0255

0015

0077

0007

1

12

0217

0940

0195

0141

12071

0255

0019

0309

0004

1

13

0192

1950

0146

0136

11295

0255

0031

0683

0011

1

14

0169

1691

0187

0088

4306

0052

0022

0503

0007

1

15

0227

0685

0252

0160

10798

0255

0028

0455

0008

1

16

0242

0577

0255

0157

11346

0255

0022

0292

0007

1

17

0245

0385

0254

0174

10600

0255

0022

0343

0003

1

18

0237

0837

0254

0148

14182

0255

0014

0143

0003

1

19

0219

1036

0254

0144

13469

0255

0008

0081

0001

1

20

0207

1358

0165

0113

15051

0000

0012

0152

0003

1

21

0211

0397

0204

0088

5112

0031

0008

0062

0002

1

22

0228

0561

0244

0065

2385

0026

0013

0155

0006

1

23

0212

0845

0246

0039

0460

0050

0019

0347

0002

1

24

0209

0205

0203

0112

11941

0255

0019

0158

0004

1

25

0190

0286

0169

0136

12571

0255

0007

0066

0004

1

26

0233

0646

0249

0123

12986

0255

0009

0115

0001

1

27

0220

0560

0204

0089

6203

0255

0015

0095

0025

1

28

0241

0543

0247

0029

1939

0056

0004

0019

0002

1

29

0220

0910

0246

0030

4263

0245

0013

0085

0006

1

30

0216

0995

0244

0058

2028

0000

0002

0006

0002

1

31

0233

0342

0253

0093

2151

0049

0021

0117

0029

1

32

0239

0308

0233

0072

2746

0061

0019

0153

0007

1

33

0240

0526

0254

0036

1921

0000

0005

0086

0001

1

34

0222

0725

0202

0036

2239

0000

0020

0097

0018

1

35

0235

0583

0254

0033

1326

0000

0014

0048

0013

1

36

0247

0515

0254

0115

13847

0000

0018

0100

0017

1

37

0248

0164

0255

0127

13417

0000

0018

0153

0023

1

38

0241

0407

0236

0133

11271

0255

0022

0105

0025

1

39

0231

0624

0219

0106

8579

0254

0021

0114

0033

1

40

0214

0613

0209

0082

4568

0254

0009

0040

0008

1

41

0104

3359

0084

0124

13484

0255

0065

6425

0011

1

42

0103

3053

0085

0078

13456

0000

0062

5998

0004

1

43

0080

0151

0080

0110

15185

0254

0010

0825

0004

1

44

0216

2036

0253

0130

15089

0255

0051

5091

0005

1

45

0213

1844

0252

0036

4419

0000

0065

5866

0002

1

46

0154

1282

0139

0121

13735

0255

0060

5108

0007

1

47

0197

1827

0249

0073

9953

0255

0023

1041

0001

1

Таблица 13. Окончание

X1

X2

X3

X4

X5

X6

X7

X8

X9

Y

48

0177

0804

0163

0117

15355

0254

0022

0712

0007

1

49

0166

0311

0165

0132

14657

0254

0028

0986

0002

1

50

0179

0675

0173

0099

14992

0254

0022

0922

0002

1

51

0243

0101

0243

0000

0000

0000

0006

0002

0006

0

52

0244

0000

0244

0002

0020

0000

0001

0003

0002

0

53

0245

0000

0245

0000

0002

0000

0000

0001

0000

0

54

0232

0110

0234

0002

0018

0000

0002

0003

0004

0

55

0254

0360

0255

0002

0025

0000

0001

0001

0001

0

56

0255

0000

0255

0002

0010

0000

0001

0001

0002

0

57

0255

0000

0255

0000

0000

0000

0001

0000

0000

0

58

0250

0501

0251

0004

0049

0000

0000

0001

0000

0

59

0255

0000

0255

0002

0013

0000

0000

0000

0000

0

60

0255

0000

0255

0002

0023

0000

0000

0000

0000

0

61

0255

0000

0255

0002

0025

0000

0000

0000

0000

0

62

0255

0000

0255

0000

0000

0000

0000

0000

0000

0

63

0255

0000

0255

0003

0039

0000

0000

0000

0000

0

64

0250

0441

0248

0000

0000

0000

0000

0000

0000

0

3.3.7 Контроль значений признаков и восстановление ошибочных данных

Для контроля данных найдем:

1. Минимальные и максимальные значения каждого признака в выборке.

2. Оценки математического ожидания значений признаков.

3. Оценку среднего квадратичного отклонения.

4. Стандартные ошибка среднего.

5. Отношение стандартной ошибки среднего к среднему значению.

Результаты представлены в таблице14.

Таблица 14. Значения признаков

X1

X2

X3

X4

X5

X6

X7

X8

X9

Мин

0080

0000

0080

0000

0000

0000

0000

0000

0000

Макс

0255

3359

0255

0174

15596

0255

0065

6425

0033

Сред

0216

0710

0222

0080

7232

0132

0017

0643

0006

Откл

37,35

669,48

45,551

53,775

5765,7

123,8879

15,716

1512,7

7,36114

СОШ

4,669

83,685

5,6939

6,72188

720,71

15,48599

1,96461

189,08

0,92014

ОСО

0,021

0,1178

0,0257

0,0844

0,099

0,117

0,116

0,293

0,1517

Для решения вопроса о «выскакивающих» (ошибочных) значениях необходимо найти диапазон значений фактора [aj, bj] (j=1,M+K), в котором должно находиться 95% значений фактора выборки:

Далее необходимо найти процент значений рассматриваемого фактора непопадающих в этот диапазон. Если таких значений меньше 5%, то считается, что «выскакивающих» значений нет. В противном случае необходимо удалить одно из «выскакивающих» значений (значение наиболее удаленное от оценки среднего) и вновь воспользоваться этой же методикой.

В таблице 15 приведен процент попадающих в диапазон значений фактора [aj, bj].

Таблица 15. Диапазон значений

Х1

Х2

Х3

X4

X6

X6

X7

X8

X9

95,3125

95,3125

95,3125

100

100

100

95,3125

95,3125

95,3125

3.3.8 Нормирование значений признаков

Нормирование значений- процесс преобразования значений, при котором не изменяется размерность выборки. Нормировать значения факторов необходимо для приведения значений факторов к одному сегменту вариаций значений. Нормализованная выборка приведена в таблице 16.

Таблица 16. Нормализованная выборка

X1

X2

X3

X4

X5

X6

X7

X8

X9

Y

1

0,817

0,184

0,914

0,672

0,561

0,000

0,185

0,012

0,182

1

2

0,749

0,176

0,920

0,483

0,466

0,992

0,308

0,048

0,121

1

3

0,720

0,177

0,897

0,259

0,140

0,996

0,446

0,106

0,333

1

4

0,851

0,170

0,937

0,431

0,409

0,996

0,369

0,079

0,212

1

5

0,800

0,245

0,663

0,598

0,582

0,996

0,415

0,070

0,242

1

6

0,669

0,311

0,851

0,684

0,785

1,000

0,338

0,045

0,121

1

7

0,394

0,316

0,309

0,753

0,748

1,000

0,308

0,053

0,030

1

8

0,623

0,227

0,606

0,753

1,000

1,000

0,200

0,022

0,030

1

9

0,720

0,196

0,937

0,851

0,815

1,000

0,108

0,013

0,030

1

10

0,771

0,208

0,937

0,690

0,895

0,000

0,185

0,024

0,091

1

11

0,800

0,279

0,977

0,684

0,476

1,000

0,231

0,012

0,212

1

12

0,783

0,280

0,657

0,810

0,774

1,000

0,292

0,048

0,121

1

13

0,640

0,581

0,377

0,782

0,724

1,000

0,477

0,106

0,333

1

14

0,509

0,503

0,611

0,506

0,276

0,204

0,338

0,078

0,212

1

15

0,840

0,204

0,983

0,920

0,692

1,000

0,431

0,071

0,242

1

16

0,926

0,172

1,000

0,902

0,727

1,000

0,338

0,045

0,212

1

17

0,943

0,115

0,994

1,000

0,680

1,000

0,338

0,053

0,091

1

18

0,897

0,249

0,994

0,851

0,909

1,000

0,215

0,022

0,091

1

19

0,794

0,308

0,994

0,828

0,864

1,000

0,123

0,013

0,030

1

20

0,726

0,404

0,486

0,649

0,965

0,000

0,185

0,024

0,091

1

21

0,749

0,118

0,709

0,506

0,328

0,122

0,123

0,010

0,061

1

22

0,846

0,167

0,937

0,374

0,153

0,102

0,200

0,024

0,182

1

23

0,754

0,252

0,949

0,224

0,029

0,196

0,292

0,054

0,061

1

24

0,737

0,061

0,703

0,644

0,766

1,000

0,292

0,025

0,121

1

25

0,629

0,085

0,509

0,782

0,806

1,000

0,108

0,010

0,121

1

26

0,874

0,192

0,966

0,707

0,833

1,000

0,138

0,018

0,030

1

27

0,800

0,167

0,709

0,511

0,398

1,000

0,231

0,015

0,758

1

28

0,920

0,162

0,954

0,167

0,124

0,220

0,062

0,003

0,061

1

29

0,800

0,271

0,949

0,172

0,273

0,961

0,200

0,013

0,182

1

30

0,777

0,296

0,937

0,333

0,130

0,000

0,031

0,001

0,061

1

31

0,874

0,102

0,989

0,534

0,138

0,192

0,323

0,018

0,879

1

32

0,909

0,092

0,874

0,414

0,176

0,239

0,292

0,024

0,212

1

33

0,914

0,157

0,994

0,207

0,123

0,000

0,077

0,013

0,030

1

34

0,811

0,216

0,697

0,207

0,144

0,000

0,308

0,015

0,545

1

35

0,886

0,174

0,994

0,190

0,085

0,000

0,215

0,007

0,394

1

36

0,954

0,153

0,994

0,661

0,888

0,000

0,277

0,016

0,515

1

37

0,960

0,049

1,000

0,730

0,860

0,000

0,277

0,024

0,697

1

38

0,920

0,121

0,891

0,764

0,723

1,000

0,338

0,016

0,758

1

39

0,863

0,186

0,794

0,609

0,550

0,996

0,323

0,018

1,000

1

40

0,766

0,182

0,737

0,471

0,293

0,996

0,138

0,006

0,242

1

41

0,137

1,000

0,023

0,713

0,865

1,000

1,000

1,000

0,333

1

42

0,131

0,909

0,029

0,448

0,863

0,000

0,954

0,934

0,121

1

43

0,000

0,045

0,000

0,632

0,974

0,996

0,154

0,128

0,121

1

44

0,777

0,606

0,989

0,747

0,967

1,000

0,785

0,792

0,152

1

45

0,760

0,549

0,983

0,207

0,283

0,000

1,000

0,913

0,061

1

46

0,423

0,382

0,337

0,695

0,881

1,000

0,923

0,795

0,212

1

47

0,669

0,544

0,966

0,420

0,638

1,000

0,354

0,162

0,030

1

Таблица 16. Нормализованная выборка.Окончание

X1

X2

X3

X4

X5

X6

X7

X8

X9

Y

48

0,554

0,239

0,474

0,672

0,985

0,996

0,338

0,111

0,212

1

49

0,491

0,093

0,486

0,759

0,940

0,996

0,431

0,153

0,061

1

50

0,566

0,201

0,531

0,569

0,961

0,996

0,338

0,144

0,061

1

51

0,931

0,030

0,931

0,000

0,000

0,000

0,092

0,000

0,182

0

52

0,937

0,000

0,937

0,011

0,001

0,000

0,015

0,000

0,061

0

53

0,943

0,000

0,943

0,000

0,000

0,000

0,000

0,000

0,000

0

54

0,869

0,033

0,880

0,011

0,001

0,000

0,031

0,000

0,121

0

55

0,994

0,107

1,000

0,011

0,002

0,000

0,015

0,000

0,030

0

56

1,000

0,000

1,000

0,011

0,001

0,000

0,015

0,000

0,061

0

57

1,000

0,000

1,000

0,000

0,000

0,000

0,015

0,000

0,000

0

58

0,971

0,149

0,977

0,023

0,003

0,000

0,000

0,000

0,000

0

59

1,000

0,000

1,000

0,011

0,001

0,000

0,000

0,000

0,000

0

60

1,000

0,000

1,000

0,011

0,001

0,000

0,000

0,000

0,000

0

61

1,000

0,000

1,000

0,011

0,002

0,000

0,000

0,000

0,000

0

62

1,000

0,000

1,000

0,000

0,000

0,000

0,000

0,000

0,000

0

63

1,000

0,000

1,000

0,017

0,003

0,000

0,000

0,000

0,000

0

64

0,971

0,131

0,960

0,000

0,000

0,000

0,000

0,000

0,000

0

3.3.9 Выбор информационных признаков

Один из методов выделения информационных признаков - подсчет коэффициентов корреляции между факторами и показателем.

Информативность фактора определяется путем сравнения абсолютной величины коэффициента корреляции с пороговым значением:

,

где I- задаваемое пороговое значение.

Коэффициент корреляции определяется по формуле:

,

где- оценка первичных моментов.

При нахождении коэффициентов корреляции необходимо использовать нормированные значения факторов. Пороговым значением Iявляется значение 0,56.

Таблица 17. Коэффициенты корреляций признаков

X1

X2

X3

X4

X5

X6

X7

X8

X9

Y

X1

1

X2

-0,625

1

X3

0,902

-0,514

1

X4

-0,426

0,359

-0,350

1

X5

-0,572

0,438

-0,510

0,889

1

X6

-0,418

0,263

-0,330

0,710

0,656

1

X7

-0,586

0,780

-0,488

0,441

0,492

0,370

1

X8

-0,565

0,765

-0,470

0,159

0,315

0,128

0,877

1

X9

0,020

0,046

-0,052

0,266

0,124

0,153

0,257

-0,007

1

Y

-0,484

0,479

-0,336

0,774

0,667

0,569

0,540

0,226

0,361

1

По результатам корреляционного анализа выбраны три наиболее информативных признака X4, X5, X6. Данные признаки выделены в таблице 17 цветом.

3.3.10 Формирование обучающей и контролирующей выборок

На этом этапе выборка, полученная после удаления не информационных факторов, разбивается на две выборки: одна из них обучающая будет использоваться для определения функции аппроксимации, а другая контролирующая - для оценки качества аппроксимации.

Количество элементов в выборках примерно должно быть одинаковым и в разных выборках должны присутствовать близкие и разнообразные значения показателя из его вариации.

Обучающая и контролирующая выборка представлены в таблице18 и таблице19соответственно.

Таблица 18. Обучающая выборка.

X4

X5

X6

Y

1

0,672

0,561

0

1

2

0,258

0,139

0,996

1

3

0,597

0,581

0,996

1

4

0,752

0,748

1

1

5

0,850

0,814

1

1

6

0,683

0,475

1

1

7

0,781

0,724

1

1

8

0,919

0,692

1

1

9

1

0,679

1

1

10

0,827

0,863

1

1

11

0,505

0,327

0,123

1

12

0,224

0,029

0,196

1

13

0,781

0,806

1

1

14

0,511

0,397

1

1

15

0,172

0,273

0,960

1

16

0,534

0,137

0,192

1

17

0,206

0,123

0

1

18

0,189

0,085

0

1

19

0,729

0,860

0

1

20

0,609

0,550

0,996

1

21

0,712

0,865

1

1

22

0,632

0,973

0,996

1

23

0,206

0,283

0

1

24

0,419

0,638

1

1

25

0,758

0,939

0,996

1

26

0

0

0

0

27

0

0,00013

0

0

28

0,011

0,0016

0

0

29

0

0

0

0

30

0,011

0,00083

0

0

31

0,011

0,0016

0

0

32

0,017

0,0025

0

0

Таблица 19. Контролирующая выборка.

X4

X5

X6

Y

1

0,482

0,466

0,992

1

2

0,431

0,408

0,996

1

3

0,683

0,785

1

1

4

0,752

1

1

1

5

0,689

0,894

0

1

6

0,810

0,773

1

1

7

0,505

0,276

0,203

1

8

0,902

0,727

1

1

9

0,850

0,909

1

1

10

0,649

0,965

0

1

11

0,373

0,152

0,101

1

12

0,643

0,765

1

1

13

0,706

0,832

1

1

14

0,166

0,124

0,219

1

15

0,333

0,130

0

1

16

0,413

0,176

0,239

1

17

0,206

0,143

0

1

18

0,660

0,887

0

1

19

0,764

0,722

1

1

20

0,471

0,292

0,996

1

21

0,448

0,862

0

1

22

0,747

0,967

1

1

23

0,695

0,880

1

1

24

0,672

0,984

0,996

1

25

0,568

0,961

0,996

1

26

0,011

0,0012

0

0

27

0,011

0,0011

0

0

28

0,011

0,0006

0

0

29

0,022

0,003

0

0

30

0,011

0,0014

0

0

31

0

0

0

0

32

0

0

0

0

3.4 Формирование правил принятия решений

1. Определим целевую функцию линейной модели:

2. Определим систему линейных уравнений

Рассмотрим линейную функцию: u(a,x). Найдем значения a00,....a04 обеспечивающие минимум суммы среднеквадратических ошибок на всех элементах обучающей выборки:

1) Продифференцируем E по переменной a00

Используя (1), получим первое уравнение системы:

2) Продифференцируем E по переменной a01

Введем обозначения:

Получим второе уравнение системы:

3) Продифференцируем E по переменной a02

Введем обозначения:

Получим третье уравнение системы:

4) Продифференцируем E по переменной a03

Введем обозначения:

Получим четвертое уравнение системы:

2. Составим систему из 4-х линейных уравнений:

Тогдаполучаемприn=3:

Преобразуемсистемуприm=32:

Используя выборку, снова преобразуем систему:

Воспользовавшись методом Гаусса для решения СЛУ, вычислим значения a00,a01,a02,a03:

Значенияa00,a01,a02,a03вставляем в полином первой степени:

Посчитаем полином и найдем ошибку аппроксимации.Результаты представлены в таблице 20.Значение столбца Y**это значение полинома после сравнения с порогом 0,5.

Таблица 20. Значение у* (контролирующая выборка)

X4

X5

X6

Y

Y*

Y**

1

0,482

0,466

0,992

1

0,918

1

2

0,431

0,408

0,996

1

0,849

1

3

0,683

0,785

1

1

1,167

1

4

0,752

1

1

1

1,219

1

5

0,689

0,894

0

1

0,893

1

6

0,810

0,773

1

1

1,385

1

7

0,505

0,276

0,203

1

0,817

1

8

0,902

0,727

1

1

1,555

1

9

0,850

0,909

1

1

1,413

1

10

0,649

0,965

0

1

0,804

1

11

0,373

0,152

0,101

1

0,604

1

12

0,643

0,765

1

1

1,104

1

13

0,706

0,832

1

1

1,191

1

14

0,166

0,124

0,219

1

0,290

0

15

0,333

0,130

0

1

0,517

1

16

0,413

0,176

0,239

1

0,700

1

17

0,206

0,143

0

1

0,298

0

18

0,660

0,887

0

1

0,847

1

19

0,764

0,722

1

1

1,322

1

20

0,471

0,292

0,996

1

0,952

1

21

0,448

0,862

0

1

0,493

0

22

0,747

0,967

1

1

1,219

1

23

0,695

0,880

1

1

1,157

1

24

0,672

0,984

0,996

1

1,086

1

25

0,568

0,961

0,996

1

0,917

1

26

0,011

0,001

0

0

0,009

0

27

0,011

0,001

0

0

0,009

0

28

0,011

0,0006

0

0

0,009

0

29

0,0229

0,003

0

0

0,028

0

30

0,0114

0,001

0

0

0,009

0

31

0

0

0

0

-0,01

0

32

0

0

0

0

-0,01

0

В ходе анализа выявлены три ошибки I-рода и не выявлены ошибки II-рода. Ошибка аппроксимацииE вычисляется по формуле:

= 9,335

Воспользовавшись программой для решения СЛУ, вычислим значения a00,a01,a02,a03, a04,a05,a06,a07a08,a09:

Значенияa00,a01,a02,a03, a04,a05,a06,a07a08,a09 подставляем в полином второй степени:

Посчитаем полином и найдем ошибку аппроксимации.Результаты представлены в таблице 21.Значение столбца Y**это значение полинома после сравнения с порогом 0,5.

Таблица 21. Значение у** (контролирующая выборка)

X4

X5

X6

Y

Y*

Y**

1

0,482

0,466

0,992

1

1,431

1

2

0,431

0,408

0,996

1

1,373

1

3

0,683

0,785

1

1

1,472

1

4

0,752

1

1

1

1,380

1

5

0,689

0,894

0

1

1,064

1

6

0,810

0,773

1

1

1,417

1

7

0,505

0,276

0,203

1

1,252

1

8

0,902

0,727

1

1

1,372

1

9

0,850

0,909

1

1

1,331

1

10

0,649

0,965

0

1

1,084

1

11

0,373

0,152

0,101

1

0,996

1

12

0,643

0,765

1

1

1,483

1

13

0,706

0,832

1

1

1,454

1

14

0,166

0,124

0,219

1

0,751

1

15

0,333

0,130

0

1

0,832

1

Таблица 21. Значение у** (контролирующая выборка). Окончание

X4

X5

X6

Y

Y*

Y**

16

0,413

0,176

0,239

1

1,165

1

17

0,206

0,143

0

1

0,649

1

18

0,660

0,887

0

1

1,086

1

19

0,764

0,722

1

1

1,458

1

20

0,471

0,292

0,996

1

1,384

1

21

0,448

0,862

0

1

1,162

1

22

0,747

0,967

1

1

1,395

1

23

0,695

0,880

1

1

1,448

1

24

0,672

0,984

0,996

1

1,440

1

25

0,568

0,961

0,996

1

1,484

1

26

0,011

0,001

0

0

0,129

0

27

0,011

0,001

0

0

0,129

0

28

0,011

0,0006

0

0

0,129

0

29

0,022

0,003

0

0

0,159

0

30

0,011

0,001

0

0

0,129

0

31

0

0

0

0

0,100

0

32

0

0

0

0

0,100

0

Ошибка аппроксимацииE при обучающей выборке:

=0

В ходе анализа ошибки Iи IIрода не выявлены.

Таблица 22. Ошибка аппроксимации

Ошибка аппроксимации на контролирующей выборке

Полином 1степени

9,335

Полином 2степени

0

Полином второй степени допускает меньшее количество ошибок на тестирующей выборке. Полином второй степени в дальнейшем будет использоваться для поиска границы объекта на изображении.

4. ТЕХНОЛОГИЧЕСКИЙ ПРОЦЕСС ОБРАБОТКИ ДАННЫХ

4.1 Технология приобретения знаний

Технологический процесс приобретения знаний представлен на рисунке 4.1.

Рис. 4.1. Технология приобретения знаний

4.2 Технология принятия решения

Технологический процесс принятия решений представлен на рисунке 4.2.

Рис. 4.2. Технология принятия решения

5. ПРОГРАММНЫЕ СРЕДСТВА

5.1 Программные средства приобретения знаний

В данной курсовой работе использовались следующие программные средства приобретений знаний:

- программа на C# для преобразования изображения;

- программа на C# для выбора граничных и неграничных точек;

- программа на C# для вычисления признаков изображения;

- MSExcel для корреляционного анализа, выделения информационных признаков, вычисления коэффициентов полинома первой степени, вычисления значения полинома и ошибок;

- программа на C# для вычисления коэффициентов полинома второй степени.

В программу для преобразования изображения загружались необходимые изображения, проводились преобразования и на выходе получались преобразованные изображения.

Полученные изображения загружались в программу для выбора граничных и неграничных точек. На каждом изображении отмечались граничные точки и точки фона. На выходе были получен набор координат граничных и неграничных точек.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.