Интеллектуальная информационная система
Функциональная структура автоматизированной интеллектуальной информационной системы сортировки грибов. Вербальная и формальная постановки задач, описание методов решения, примеры решения задач. Рассмотрение технологического процесса обработки данных.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 12.12.2018 |
Размер файла | 1,9 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
СОДЕРЖАНИЕ
- ВВЕДЕНИЕ
- 1. ФУНКЦИИ ИИС
- 1.1. Внешние объекты и диаграммы окружения
- 1.2. Данные, результаты, хранилища и логическая модель
- 1.3. Задачи, функции и модель поведения
- 2. ПОСТАНОВКИ ЗАДАЧ И МЕТОДЫ РЕШЕНИЯ
- 2.1. Получение правил выделения границы грибов на изображении
- 2.2. Использование системы для определения границ изображения
- 2.3. Формирование сигналов для автомата сортировки грибов
- 2.4. Формирование накладных и актов
- 3. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ ИИС
- 3.1. Концептуальное проектирование базы данных
- 3.2. Логическое проектирование базы знаний
- 3.3. Создание базы знаний
- 3.3.1. Определение показателя
- 3.3.2. Определение факторов
- 3.3.3. Проведение экспериментов и построение выборки значений
- 3.3.4. Удаление признаков с неизвестными значениями
- 3.3.5. Удаление факторов с постоянными значениями
- 3.3.6. Устранение одинаковых элементов выборки
- 3.3.7. Контроль значений признаков и восстановление ошибочных данных
- 3.3.8. Нормирование значений признаков
- 3.3.9. Выбор информационных признаков
- 3.3.10. Формирование обучающей и контролирующей выборок
- 3.4. Формирование правил принятия решений
- 4. ТЕХНОЛОГИЧЕСКИЙ ПРОЦЕСС ОБРАБОТКИ ДАННЫХ
- 4.1. Технология приобретения знаний
- 4.2. Технология принятия решения
- 5. ПРОГРАММНЫЕ СРЕДСТВА
- 5.1. Программные средства приобретения знаний
- 5.2. Программные средства принятия решений
- ЗАКЛЮЧЕНИЕ
- CONCLUSION
- ПРИЛОЖЕНИЕ
ВВЕДЕНИЕ
На современном этапе развития в грибном хозяйстве на новый уровень выходят автоматизированные системные решения, которые способны заменить трудовые ресурсы при проведении сбора урожая. Участие роботизированных машин в сельском хозяйстве позволяет повысить эффективность и производительность сбора урожая. Данная проблема актуальна, так как необходимо разработать такую систему, которая идентифицирует и классифицирует цели для роботизированных машин.
Разрабатываемая интеллектуальная информационная система предназначена для управления процессом сбора грибов в грибном хозяйстве для работников сборки грибов.
Рассматриваемая организация осуществляет деятельность по сборке грибов в лесах, примыкающих к пункту заготовки грибов артели заготовителей, вручную. Заготовители осуществляют сбор белых грибов и маслят в лесу без предварительной сортировки и доставляют грибы в корзинах на пункт заготовки грибов артели заготовителей. В одной корзине могут находиться грибы нескольких видов. Заготовители укладывают грибы на транспортер, который доставляет их в пункт сортировки. Далее определяются вес грибов каждого вида и сумма, которая будет выплачена заготовителю за сбор грибов.
Проблема деятельности организации заключается в необходимости большого количества заготовителей для сбора грибов, так как сезон появления грибов непродолжителен. Недостаток трудовых ресурсов приводит к тому, что часть грибов портится или остается не собранной. В связи с этим организация теряет часть своей прибыли, которую она могла бы получить, если бы вовремя успела собрать урожай. Чтобы решить данную проблему, необходимо усовершенствовать процесс организации сбора грибов путем процесса обработки информации изображения каждого собранного гриба и оценки его параметров по изображению для дальнейшей транспортировки до пункта сортировки грибного хозяйства.
Для многих культур уже есть решения по автоматизированной уборке урожая. Например, одним из самых крупных заготовителей овощей в России является компания ООО «СИТИ-сад», Краснодарский край. Для автоматизированной сортировки используется линия AWETA с мощностью до 4,5 т/ч.
Интеллектуальная информационная система управления сбором грибов приведет к существенной экономии времени и трудозатрат, а также повысит прибыль организации от уменьшения значительной части заготовителей (персонала). В данной работе используется именно интеллектуальная информационная система, потому что не существует формального четкого алгоритма определения границ объекта, в связи с этим необходимо производить обучение и применять методы искусственного интеллекта.
Таким образом, целью курсовой работы является разработка ИИС управления сбором грибов для увеличения прибыли заготовительного предприятия за счет повышения качества сортировки грибов. Для реализации данного решения необходимо решить следующие задачи:
1. Построение классификатора граничных точек изображения гриба;
2. Управление сбором грибов.
В первом разделе курсовой работы представлена функциональная структура автоматизированной интеллектуальной информационной системы сортировки грибов.
Во втором разделе представлены вербальная и формальная постановки задач, описание методов решения, примеры решения задач.
В третьем разделе описаны проектирование информационного обеспечения, концептуальное и логическое проектирование базы данных, кардинальность и избирательность связей, кодирование информации, классификаторы и кодификаторы информации, определение задач ведения базы данных, состав задач, операторы, документы, источники, расчет трудоемкости ведения базы данных.
В четвертом разделе представлен технологический процесс обработки данных, задачи принятия решения и ведения базы данных.
В пятом разделе представлена разработка программных средств, выбор системного программного обеспечения, инструментальные средства разработки прикладных программ, прикладное программное обеспечение, алгоритмы прикладных программ: алгоритмы пользовательского интерфейса, алгоритмы принятия решений.
автоматизированный интеллектуальный информационный
1. ФУНКЦИИ ИИС
В данной главе представлены DFD диаграммы для модели окружения, логической модели и модели поведения.
1.1 Внешние объекты и диаграммы окружения
На рисунке 1.1 представлена DFD диаграмма «Управление сбором грибов». На ней представлена модель окружения информационной системы. Она включает внешние объекты, воздействующие на процесс.
Источники информации:
· Специалист по обработке изображений;
· Сортировочный автомат;
· Видеокамера.
Получатели информации:
· Сортировщик - работник, отвечающий за работу конвейера;
· Сортировочный автомат;
· Специалист по обработке изображений;
· Видеокамера.
Рис. 1.1. Модель окружения
1.2 Данные, результаты, хранилища и логическая модель
На рисунке1.2 представлена логическая модель в виде DFD диаграммы. Она отображает систему, как набор действий и описывает, что должна делать система.
Логическая модель включает в себя 2 процесса: «Формирование правил по определению границ гриба на изображении», «Определение вида гриба, его количество и вес, а также формирование накладных и актов».
Исходными данными являются: «Получение изображения гриба с данными о граничных точках», «Получение изображения каждого собранного гриба».
Результатами логической модели являются: «Сортировка грибов» и «Анализ и исправление накладных и актов».
Рис. 1.2. Логическая модель
1.3 Задачи, функции и модель поведения
На рисунке 1.3 представлена DFD диаграмма «Контроль, профилактика аварийных ситуаций, ремонт грузоподъемной техники». На ней представлена модель поведения информационной системы. Она включает внешние объекты, хранилища, основные процессы и информационные связи.
Основные задачи ИИС:
- формирование правил по определению границ гриба на изображении;
- определение вида гриба, его количество и вес, а также формирование накладных и актов.
Источники информации
- Видеокамера;
- Специалист по обработке изображений;
- Сортировочный автомат.
Получатели информации
- Специалист по обработке изображений;
- Сортировщик.
Рис. 1.3. Модель поведения
2 ПОСТАНОВКИ ЗАДАЧ И МЕТОДЫ РЕШЕНИЯ
Для сортировки грибов на основе изображений решить следующие задачи:
1. сформировать правила для определения границ изображения;
2. использовать систему для определения границ изображения;
3. сформировать сигналы для автомата сортировки грибов;
4. сформировать и напечатать накладные и акты.
2.1 Получение правил выделения границы грибов на изображении
2.1.1. Постановка задачи
На вход системе поступают изображения с выделенными границами грибов. По полученным изображениям необходимо сформировать правила, по которым система будет определять принадлежность пикселя изображения к границе гриба. Правила строятся на основе информационных признаков. Определение множества информационных признаков включает в себя подготовку обучающей и контролирующей выборки для последующего корреляционного анализа. На выходе получим значение, которое будет указывать на принадлежность точки на изображении гриба к границе. Обозначения приведены в таблице 1.
Таблица 1. Обозначения
Обозначение |
Название |
Диапазон значений переменной |
|
j |
Номер признака |
1, n |
|
j признак |
|||
Обучающая выборка |
|||
a |
Параметры функции u |
||
i |
Номер опыта |
i = 1,m |
|
ri |
Значение коэффициента корреляции |
||
xij |
Значение j-го признака в i-ом элементе выборки |
||
О |
Множество объектов выборки |
||
С0 ,С1 |
Классы объектов |
||
е |
Целевая функция |
||
Xj |
вариация j-го признака |
Пусть имеются экспериментально найденные значения случайных величин координат граничных точек и точек, лежащих вне границы X = (x1, x2,…xn)и Y=( y1,y2,…yn).
По следующей формуле находим значения парного коэффициента корреляции.
Таким образом, выявляем зависимость между случайными величинами для выявления наиболее информационных признаков для классификации.
Если коэффициент корреляции принимает значения близкие к 1, то значит, между значениями имеется зависимость (-1 обратная зависимость). Если коэффициент корреляции равен 0, то значит, что значения являются независимыми, но это не является признаком отсутствия или присутствия зависимости.
Классификация представляет собой отнесение объекта к одному из заранее известных классов.
Пусть дано множество объектов О = {o} и n мерное пространство признаков X: X = X1X2 … Xn, где Xj - множество значений j-ого признака, j=1,n.
Каждый объект oО задан точкой x в n мерном пространстве признаков X: :О X, x = (o), o = -1(X), гдеx = (x1, x2,…xn) - вектор значений признаков объекта o, xijXj , j = 1,n.
Рассмотрим два класса объектов С0 и С1: O = С0С1,С0 С1 = .
Необходимо каждый объект отнести к одному из двух классов С0 или С1, т. е. должна быть задана функция
Если известна функция y = u(x):
то k(0) = u((o)), o О.
Необходимо оценить функцию u(x) определить ее вид и параметры (а).
Задача определения функции u(x) состоит в поиске параметров a функции u*: y* = u*(x, a), y* [0,1], при которой минимизируется значение погрешности для каждого элемента заданной обучающей выборки V = {(xi, yi)} , где
yi = u(xi) - значение функции, полученное в результате проведения i-го опыта(i=1,s; j=1,n),
xi = (xi1, xi2,…xin) - элемент выборки, xij- значение j-го признака в i-ом элементе выборки (результата i-го опыта), причем
xijXj, где Xj - вариация j-го признака ( i = 1,m, j = 1,n):
В качестве оценочной функции используется полином второго порядка y*= u*(x, a):
, где a = (a00, a01, a02, …,a0n, a11, a12, …, a1n, a22, a23, …, ann)
Значение полинома на i-ом элементе обучающей выборки (i=1,m):
Таким образом, мы получаем функцию для оценки значений обучающей выборки.
Окончательная формулировка задачи: необходимо определить множество информационных признаков объекта и значения полинома, найти параметры a функции u*, при которой минимизируется значение погрешности для каждого элемента заданной обучающей выборки V.
2.2 Использование системы для определения границ изображения
2.2.1. Постановка задачи
На основе полинома второго порядка, определенного ранее, необходимо построить характеристическую функцию g1(xi, a), определяющую принятие решение об отнесении пикселя изображения к фону или грибу. Таблица 2 содержит список обозначений.
Таблица 2. Обозначения
Обозначение |
Название |
Диапазон значений переменной |
|
Характеристическая функция |
[0;1] |
||
Полином |
|||
i признак |
|||
i |
Номер признака |
1, n |
|
Параметр |
|||
Порог принятия решений |
0-1 |
||
Функция |
[0;1] |
На основе полученного полинома
формируем принятие решения об отнесении объекта к классу.
Для этого строим характеристическую функцию g0(xi,a), определяющую принятие решения об отнесении объектаoi(oi = -1(xi)) к классу C0:
Аналогично строится характеристическая функция g1(xi,a), определяющая принятие решения об отнесении объектаoi(oi = -1(xi)) к классу C1:
hможет быть равен 0,5, но на практике его значения подбираются для того, чтобы количество ошибочных решений было минимальным.
Ошибки первого и второго рода:
1. ;
2. .
Окончательная формулировка задачи: необходимо подобрать такой h, при котором минимизируются ошибки I и II рода.
2.3 Формирование сигналов для автомата сортировки грибов
2.3.1. Постановка задачи
На изображениях c вычисленной границей необходимо определить вид гриба - белый или маслята. Таблица 3 включает в себя обозначения данной задачи.
Таблица 3. Обозначения
Обозначение |
Название |
Диапазон значений переменной |
|
Дисперсия яркости изображения |
|||
i яркость |
|||
Средняя яркость в области |
|||
Количество пикселей в области |
|||
Порог принятия решений |
0-1 |
||
Функция |
[0;1] |
Для определения вида гриба сначала вычисляется дисперсия яркости изображения:
Где n - количество пикселей в области, Ij - яркость текущего пикселя, Iср - средняя яркость пикселей в области.На основе значения дисперсии строится функция q, которая определяет на основании порогового значения tвида гриба:
Порог t подбирается таким образом, чтобы ошибки распознавания были минимальны.
Ошибки первого и второго рода:
1.
2.
Окончательная формулировка задачи: необходимо подобрать такой t, при котором минимизируются ошибки I и II рода.
2.4 Формирование накладных и актов
2.4.1. Постановка задачи
Автомат сортировки ведет подсчет видов грибов: белые и маслята. На основе среднего веса каждого гриба вычисляется общий вес гриба. Зная максимальный вес, который может выдержать контейнер, система упаковывает грибы в контейнеры для консервирования. Для грибов формируются накладные, а для заготовителей грибов - акты на оплату. Таблица 4 содержит обозначения данной задачи.
Таблица 4. Обозначения
Обозначение |
Название |
Диапазон значений переменной |
|
Объем |
|||
Число Пи, отношение длины окружности к диаметру |
|||
D |
Диаметр |
||
Масса |
|||
Плотность |
|||
V |
Объем |
||
Максимальный переносимый вес |
|||
m |
Масса одного гриба |
||
p |
Цена за один контейнер |
||
с |
Цена одного гриба |
Для вычисления массы требуется найти V.Гриб имеет полусферическую функцию, для определения объема будет использоваться следующая формула:
,
где D - диаметр шарового сегмента, который находиться на основе двух наиболее удаленных точек из набора известных параметров изображения, а h - высота шарового сегмента, т.е. длина перпендикуляра, восстановленного из центра основания до пересечения с поверхностью шара.
Масса гриба вычисляется по формуле m = V * с, где с - среднее значение плотности объекта. Средняя плотность грибас ? 640.
Примеры накладной и акта изображены на рисунках 2.1 и 2.2 соответственно.
Рис. 2.1. Пример накладной.
Накладная должная содержать: наименование гриба, вид гриба, количество грибов в контейнере, цену за контейнер и итоговую сумму. При заполнении контейнера учитывается максимальный вес, который может выдержать контейнер и не сломаться. Максимальный переносимый вес равен 15 кг.
Для вычисления количества грибов в контейнере используется формула:
Цена за контейнер вычисляется по следующей формуле:
,
где k -количество грибов, с - стоимость одного гриба.
Акт должен содержать: даты поступления и списания товара, номер накладной, причину списания.
Рис. 2.2. Пример акта.
Окончательная формулировка задачи: необходимо на изображении вычислить диаметр гриба, используя его, вычислить объем и массу гриба. На основе данных о сортировке составить накладные и акты.
3. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ ИИС
Задача проектирования информационного обеспечения ИС формулируется следующим образом: определить потоки, содержание, носители, форму и структуру представления информации, необходимой и достаточной для управления объектом в рассматриваемой предметной области.
3.1 Концептуальное проектирование базы данных
При концептуальном проектировании базы данных используется методика, ориентированная на модель представление данных «Сущность-связь». Базовыми элементами в этой модели являются сущности и связи.
1. Устанавливаются сущности. Под сущностью понимают основное содержание, совокупность важнейших свойств объектов рассматриваемой предметной области. Сущность состоит из множества экземпляров, каждый из которых содержит характеристики или свойства конкретного объекта предметной области.
Для каждой сущности указывается наименование, дается краткое описание. Оценивается количество экземпляров сущности. Описание сущностей приведены в таблице 5.
Таблица 5. Описание сущностей
Наименование сущности |
Описание сущности |
Количество экземпляров |
|
Признаки изображения |
Признаки изображений грибов |
9 |
|
Выборка входных данных |
Выборка входных данных |
100 |
|
Накладная для передачи контейнеров |
Накладная для передачи контейнеров с грибами |
1 |
|
Акт для передачи корзин |
Акт передачи корзин для оплаты работ заготовителя |
1 |
2. Для каждой сущности определяется совокупность атрибутов. Атрибуты ? поименованные свойства объектов, являющиеся содержанием сущности. Для каждого атрибута устанавливается имя и дается определение, которое вносится в глоссарий. Сущность не может содержать двух атрибутов с одним и тем же именем. Каждый экземпляр сущности должен быть уникален и отличаться от других экземпляров.
Атрибут может использоваться в качестве первичного ключа, вторичного ключа или определять не ключевое свойство сущности. Описание атрибутов сущностей приведены в таблице 6.
Таблица 6. Описание атрибутов сущностей
Наименование сущности (количество экземпляров) |
Наименование атрибута |
Наименование домена |
|
Признаки изображения (9) |
*Идентификатор изображения |
Идентификатор |
|
*Координаты точки х |
Координаты |
||
*Координаты точки у |
Координаты |
||
*Идентификатор признака |
Идентификатор |
||
Значение признака |
Значение признака |
||
Выборка входных данных (100) |
*Идентификатор изображения |
Идентификатор |
|
*Координаты точки х |
Координаты |
||
*Координаты точки у |
Координаты |
||
Принадлежность границе |
Принадлежность |
||
Принадлежность обучающей выборке |
Принадлежность |
||
Правила принятия решений (1) |
*Идентификатор признака 1 |
Идентификатор |
|
*Идентификатор признака 2 |
Идентификатор |
||
Значение коэффициента |
Значение коэффициента |
||
Значение измененного полинома |
Значение полинома |
||
Накладная для передачи контейнеров (1) |
*Идентификатор накладной |
Идентификатор |
|
*Идентификатор контейнера |
Идентификатор |
||
*Идентификатор товара |
Идентификатор |
||
Наименование товара |
Наименование |
||
Количество товаров в накладной |
Количество |
||
Единица измерения |
Единица измерения |
||
Количество грибов в контейнере |
Количество |
||
Вес нетто контейнера |
Вес |
||
Акт для передачи корзин (1) |
*Идентификатор акта |
Идентификатор |
|
*Идентификатор корзины |
Идентификатор |
||
*Идентификатор товара |
Идентификатор |
||
Наименование товара |
Наименование |
||
Единица измерения |
Единица измерения |
||
Количество грибов в корзине |
Количество |
||
Количество грибов в акте |
Количество |
||
Вес нетто |
Вес |
||
Цена |
Цена |
3. Для доменов определяются типы значений. Домен можно определить как совокупность значений, из которых берутся значения атрибутов. Каждый атрибут может быть определен только на одном домене, но на каждом домене может быть определено множество атрибутов. В понятие домена входит не только тип данных, но и область значений данных. Описание доменов приведены в таблице 7.
Таблица 7. Описание доменов
№ |
Наименование домена |
Название и описание типа данных (максимальное количество знаков) |
Примеры значений |
|
1 |
Идентификатор |
Идентификатор, числовой (4) |
0025 |
|
2 |
Координаты |
Координата точек на изображении, числовой (4) |
10 |
|
3 |
Значение признака |
Значение признака изображения (4) |
256 |
|
4 |
Принадлежность |
Бинарный (1) |
1 |
|
5 |
Наименование |
Наименование товара в накладной, текстовый (100) |
Грибы |
|
6 |
Единица измерения |
Единица измерения корзин/контейнеров, текстовый (2) |
кг |
|
7 |
Количество |
Количество корзин/контейнеров, числовой (3) |
25 |
|
8 |
Цена |
Цена товара, числовой (5) |
10000 |
3.2 Логическое проектирование базы знаний
Примем за начальную логическую модель базы данных исходную концептуальную модель, приведенную в разделе 3.1.
Построим систему полных функциональных зависимостей. Результат оформим в виде таблицы 8.
Таблица 8. Функциональные зависимости
Наименование сущности |
Наименование атрибута |
Функциональные зависимости F1 |
||||
Признаки изображения |
*Идентификатор изображения |
* |
||||
*Координаты точки х |
* |
|||||
*Координаты точки у |
* |
|||||
*Идентификатор признака |
* |
|||||
Значение признака |
< |
|||||
Выборкавходныхданных |
*Идентификатор изображения |
* |
||||
*Координаты точки х |
* |
|||||
*Координаты точки у |
* |
|||||
Принадлежность границе |
< |
|||||
Принадлежность обучающей выборке |
< |
|||||
Правилапринятиярешений |
*Идентификатор признака 1 |
* |
||||
*Идентификатор признака 2 |
* |
|||||
Значение коэффициента |
< |
|||||
Значение измененного полинома |
< |
|||||
Накладнаядляпередачиконтейнеров |
*Идентификатор накладной |
* |
* |
|||
*Идентификатор контейнера |
< |
* |
* |
|||
*Идентификатор товара |
< |
* |
< |
|||
Наименование товара |
< |
|||||
Количество товара в накладной |
< |
|||||
Единица измерения |
< |
|||||
Количество товаров в контейнере |
< |
|||||
Вес нетто корзины |
< |
|||||
Цена |
< |
|||||
Акт для передачи корзин |
*Идентификатор акта |
* |
* |
|||
*Идентификатор корзины |
< |
* |
* |
|||
*Идентификатор товара |
< |
* |
< |
|||
Наименование товара |
< |
|||||
Количество товара в акте |
< |
|||||
Единица измерения |
< |
|||||
Количество товаров в корзине |
< |
|||||
Вес нетто корзин |
< |
|||||
Цена |
< |
Таблица 9. Измененная таблица функциональных зависимостей
Наименование сущности |
Наименование атрибута |
Функциональные зависимости F1 |
|
Признаки изображения |
*Идентификатор изображения |
* |
|
*Координаты точки х |
* |
||
*Координаты точки у |
* |
||
*Идентификатор признака |
* |
||
Значение признака |
< |
||
Выборкавходныхданных |
*Идентификатор изображения |
* |
|
*Координаты точки х |
* |
||
*Координаты точки у |
* |
||
Принадлежность границе |
< |
||
Принадлежность обучающей выборке |
< |
||
Правилапринятиярешений |
*Идентификатор признака 1 |
* |
|
*Идентификатор признака 2 |
* |
||
Значение коэффициента |
< |
||
Значение измененного полинома |
< |
||
Товар |
*Идентификатор товара |
* |
|
Наименование товара |
< |
||
Цена |
< |
||
Единица Измерения |
< |
||
Корзина |
*Идентификатор корзины |
* |
|
Идентификатор товара |
< |
||
Количество товаров |
< |
||
Вес нетто |
< |
||
Накладнаядляпередачиконтейнеров |
*Идентификатор накладной |
* |
|
Идентификатор товара |
< |
||
Количество товаров в накладной |
< |
||
Акт для передачи корзин |
*Идентификатор акта |
* |
|
Идентификатор товара |
< |
||
Количество товаров в акте |
< |
||
Корзины накладной |
Идентификатор накладной |
* |
|
Идентификатор корзины |
< |
||
Корзины актов |
Идентификатор акта |
* |
|
Идентификатор корзины |
< |
Поскольку все не ключевые атрибуты отношений функционально зависят от первичных ключей этих отношений, все отношения находятся во второй нормальной форме.
Поскольку отсутствуют транзитивные зависимости, отношения также находятся в третьей нормальной форме.
Результатом логического проектирования является логическая модель базы данных.
Логическая модель базы данных представлена на рисунке 3.1.
Рис. 3.1. Логическая модель базы данных
3.3 Создание базы знаний
Выборка значений необходима для проведения аппроксимации неизвестной функции:
y=f(x).
Значение функции y определяет показатель, а аргументы, представленные вектором x - факторы.
Формирование обучающей и контролирующей выборки включает выполнение следующих этапов:
1. Определение показателя и его характеристик: единица измерения, точность, тип значений показателя и определить вариацию значений.
2. Установление факторов (связанных зависимостью с показателем) и их характеристики (единица измерения, точность, тип значений факторов); определить вариацию значений факторов.
3. Проведение экспериментов и построение выборки значений факторов и показателя.
4. Удаление признаков с неизвестными значениями.
5. Удаление признаков с постоянными значениями.
6. Устранение одинаковых элементов выборки и подсчетом их частоты.
7. Контроль значений признаков.
8. Нормирование факторов.
9. Определение множества наиболее информационных признаков.
10. Разбиение выборки на обучающую и тестирующую выборку.
3.3.1 Определение показателя
Показатель задается в задании курсовой работы или выбирается самостоятельно по согласованию с руководителем. Пример оформления выполнения этапа приведен в таблице 10.
Таблица 10. Характеристики целевого показателя
Целевой показатель |
Обозначение |
Единица измерения |
Вариации и пояснение значений |
Точность измерений |
Тип |
|
Граница гриба |
Y |
- |
{0, 1}, 0 - фон изображения, 1 - гриб. |
- |
Бинарный |
3.3.2 Определение факторов
Факторы, влияющие на значение показателя,задаются в задании курсовой работы или выбираются самостоятельно по согласованию с руководителем. Пример оформления выполнения этапа приведен в таблице 11.
Таблица 11. Характеристики факторов
Обозначение |
Фактор |
Единица измерения |
Вариации |
Точность измерений |
Тип |
|
Х1 |
Оценка мат. ожидания в окрестностях точки 5х5 без преобразования |
- |
[77; 255] |
1 |
Целое |
|
Х2 |
Несмещенная оценка дисперсии в окрестностях точки 5х5 без преобразования |
- |
[0;7001] |
1 |
Целое |
|
Х3 |
Мода в окрестностях точки 5х5 без преобразования |
- |
[82; 255] |
1 |
Целое |
Таблица.11. Окончание
Х4 |
Оценка мат. ожидания в окрестностях точки 5х5 (преобразование Собеля) |
- |
[0,134] |
1 |
Целое |
|
Х5 |
Несмещенная оценка дисперсии в окрестностях точки 5х5 (преобразование Собеля) |
- |
[0;15963] |
1 |
Целое |
|
Х6 |
Мода в окрестностях точки 5х5 (преобразование Собеля) |
- |
[0; 255] |
1 |
Целое |
|
Х7 |
Оценка мат. ожидания в окрестностях точки 5х5 (LBP (ЛБШ)) |
- |
[0; 99] |
1 |
Целое |
|
Х8 |
Несмещенная оценка дисперсии в окрестностях точки 5х5 (LBP (ЛБШ)) |
- |
[0,14739] |
1 |
Целое |
|
Х9 |
Мода в окрестностях точки 5х5 (LBP (ЛБШ)) |
- |
[0,] |
1 |
Целое |
3.3.3 Проведение экспериментов и построение выборки значений
При проведении экспериментов активных экспериментов необходимо построить его план (план полного или дробного факторного эксперимента). Количество опытов эксперимента должно достаточно для получения не менее 100 элементов выборки.
Пример данных выборки, отображающей соответствие значений факторов ипоказателя, представлен в таблице 12.
Таблица 12. Начало
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
Y |
||
1 |
0223 |
0617 |
0240 |
0117 |
8750 |
0000 |
0012 |
0074 |
0006 |
1 |
|
2 |
0211 |
0590 |
0241 |
0084 |
7274 |
0253 |
0020 |
0307 |
0004 |
1 |
|
3 |
0206 |
0594 |
0237 |
0045 |
2180 |
0254 |
0029 |
0683 |
0011 |
1 |
|
4 |
0229 |
0572 |
0244 |
0075 |
6375 |
0254 |
0024 |
0505 |
0007 |
1 |
|
5 |
0220 |
0823 |
0196 |
0104 |
9072 |
0254 |
0027 |
0452 |
0008 |
1 |
|
6 |
0197 |
1045 |
0229 |
0119 |
12249 |
0255 |
0022 |
0291 |
0004 |
1 |
|
7 |
0149 |
1063 |
0134 |
0131 |
11668 |
0255 |
0020 |
0343 |
0001 |
1 |
|
8 |
0189 |
0763 |
0186 |
0131 |
15596 |
0255 |
0013 |
0141 |
0001 |
1 |
|
9 |
0206 |
0658 |
0244 |
0148 |
12709 |
0255 |
0007 |
0081 |
0001 |
1 |
|
10 |
0215 |
0699 |
0244 |
0120 |
13956 |
0000 |
0012 |
0152 |
0003 |
1 |
|
11 |
0220 |
0938 |
0251 |
0119 |
7418 |
0255 |
0015 |
0077 |
0007 |
1 |
|
12 |
0217 |
0940 |
0195 |
0141 |
12071 |
0255 |
0019 |
0309 |
0004 |
1 |
|
13 |
0192 |
1950 |
0146 |
0136 |
11295 |
0255 |
0031 |
0683 |
0011 |
1 |
|
14 |
0169 |
1691 |
0187 |
0088 |
4306 |
0052 |
0022 |
0503 |
0007 |
1 |
|
15 |
0227 |
0685 |
0252 |
0160 |
10798 |
0255 |
0028 |
0455 |
0008 |
1 |
|
16 |
0242 |
0577 |
0255 |
0157 |
11346 |
0255 |
0022 |
0292 |
0007 |
1 |
|
17 |
0245 |
0385 |
0254 |
0174 |
10600 |
0255 |
0022 |
0343 |
0003 |
1 |
|
18 |
0237 |
0837 |
0254 |
0148 |
14182 |
0255 |
0014 |
0143 |
0003 |
1 |
|
19 |
0219 |
1036 |
0254 |
0144 |
13469 |
0255 |
0008 |
0081 |
0001 |
1 |
|
20 |
0207 |
1358 |
0165 |
0113 |
15051 |
0000 |
0012 |
0152 |
0003 |
1 |
|
21 |
0211 |
0397 |
0204 |
0088 |
5112 |
0031 |
0008 |
0062 |
0002 |
1 |
|
22 |
0228 |
0561 |
0244 |
0065 |
2385 |
0026 |
0013 |
0155 |
0006 |
1 |
|
23 |
0212 |
0845 |
0246 |
0039 |
0460 |
0050 |
0019 |
0347 |
0002 |
1 |
|
24 |
0209 |
0205 |
0203 |
0112 |
11941 |
0255 |
0019 |
0158 |
0004 |
1 |
|
25 |
0190 |
0286 |
0169 |
0136 |
12571 |
0255 |
0007 |
0066 |
0004 |
1 |
|
26 |
0233 |
0646 |
0249 |
0123 |
12986 |
0255 |
0009 |
0115 |
0001 |
1 |
|
27 |
0220 |
0560 |
0204 |
0089 |
6203 |
0255 |
0015 |
0095 |
0025 |
1 |
|
28 |
0241 |
0543 |
0247 |
0029 |
1939 |
0056 |
0004 |
0019 |
0002 |
1 |
|
29 |
0220 |
0910 |
0246 |
0030 |
4263 |
0245 |
0013 |
0085 |
0006 |
1 |
|
30 |
0216 |
0995 |
0244 |
0058 |
2028 |
0000 |
0002 |
0006 |
0002 |
1 |
|
31 |
0233 |
0342 |
0253 |
0093 |
2151 |
0049 |
0021 |
0117 |
0029 |
1 |
|
32 |
0239 |
0308 |
0233 |
0072 |
2746 |
0061 |
0019 |
0153 |
0007 |
1 |
|
33 |
0240 |
0526 |
0254 |
0036 |
1921 |
0000 |
0005 |
0086 |
0001 |
1 |
|
34 |
0222 |
0725 |
0202 |
0036 |
2239 |
0000 |
0020 |
0097 |
0018 |
1 |
Таблица 12. Продолжение.
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
Y |
||
35 |
0235 |
0583 |
0254 |
0033 |
1326 |
0000 |
0014 |
0048 |
0013 |
1 |
|
36 |
0247 |
0515 |
0254 |
0115 |
13847 |
0000 |
0018 |
0100 |
0017 |
1 |
|
37 |
0248 |
0164 |
0255 |
0127 |
13417 |
0000 |
0018 |
0153 |
0023 |
1 |
|
38 |
0241 |
0407 |
0236 |
0133 |
11271 |
0255 |
0022 |
0105 |
0025 |
1 |
|
39 |
0231 |
0624 |
0219 |
0106 |
8579 |
0254 |
0021 |
0114 |
0033 |
1 |
|
40 |
0214 |
0613 |
0209 |
0082 |
4568 |
0254 |
0009 |
0040 |
0008 |
1 |
|
41 |
0104 |
3359 |
0084 |
0124 |
13484 |
0255 |
0065 |
6425 |
0011 |
1 |
|
42 |
0103 |
3053 |
0085 |
0078 |
13456 |
0000 |
0062 |
5998 |
0004 |
1 |
|
43 |
0080 |
0151 |
0080 |
0110 |
15185 |
0254 |
0010 |
0825 |
0004 |
1 |
|
44 |
0216 |
2036 |
0253 |
0130 |
15089 |
0255 |
0051 |
5091 |
0005 |
1 |
|
45 |
0213 |
1844 |
0252 |
0036 |
4419 |
0000 |
0065 |
5866 |
0002 |
1 |
|
46 |
0154 |
1282 |
0139 |
0121 |
13735 |
0255 |
0060 |
5108 |
0007 |
1 |
|
47 |
0197 |
1827 |
0249 |
0073 |
9953 |
0255 |
0023 |
1041 |
0001 |
1 |
|
48 |
0177 |
0804 |
0163 |
0117 |
15355 |
0254 |
0022 |
0712 |
0007 |
1 |
|
49 |
0166 |
0311 |
0165 |
0132 |
14657 |
0254 |
0028 |
0986 |
0002 |
1 |
|
50 |
0179 |
0675 |
0173 |
0099 |
14992 |
0254 |
0022 |
0922 |
0002 |
1 |
|
51 |
0243 |
0101 |
0243 |
0000 |
0000 |
0000 |
0006 |
0002 |
0006 |
0 |
|
52 |
0245 |
0081 |
0245 |
0000 |
0004 |
0000 |
0002 |
0003 |
0004 |
0 |
|
53 |
0245 |
0164 |
0246 |
0000 |
0000 |
0000 |
0001 |
0001 |
0001 |
0 |
|
54 |
0242 |
0303 |
0243 |
0000 |
0000 |
0000 |
0001 |
0001 |
0002 |
0 |
|
55 |
0242 |
0343 |
0243 |
0000 |
0000 |
0000 |
0001 |
0000 |
0000 |
0 |
|
56 |
0243 |
0466 |
0244 |
0000 |
0000 |
0000 |
0002 |
0004 |
0002 |
0 |
|
57 |
0244 |
0000 |
0244 |
0002 |
0020 |
0000 |
0001 |
0003 |
0002 |
0 |
|
58 |
0245 |
0000 |
0245 |
0000 |
0002 |
0000 |
0000 |
0001 |
0000 |
0 |
|
59 |
0245 |
0000 |
0245 |
0000 |
0008 |
0000 |
0000 |
0001 |
0000 |
0 |
|
60 |
0247 |
0000 |
0247 |
0000 |
0000 |
0000 |
0000 |
0001 |
0000 |
0 |
|
61 |
0251 |
0105 |
0251 |
0000 |
0001 |
0000 |
0006 |
0002 |
0006 |
0 |
|
62 |
0232 |
0110 |
0234 |
0002 |
0018 |
0000 |
0002 |
0003 |
0004 |
0 |
|
63 |
0254 |
0360 |
0255 |
0002 |
0025 |
0000 |
0001 |
0001 |
0001 |
0 |
|
64 |
0255 |
0000 |
0255 |
0002 |
0010 |
0000 |
0001 |
0001 |
0002 |
0 |
|
65 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0001 |
0000 |
0000 |
0 |
|
66 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0002 |
0004 |
0002 |
0 |
|
67 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0001 |
0003 |
0002 |
0 |
|
68 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0001 |
0000 |
0 |
|
69 |
0238 |
0383 |
0239 |
0000 |
0000 |
0000 |
0000 |
0001 |
0000 |
0 |
|
70 |
0250 |
0501 |
0251 |
0004 |
0049 |
0000 |
0000 |
0001 |
0000 |
0 |
|
71 |
0255 |
0000 |
0255 |
0002 |
0013 |
0000 |
0000 |
0000 |
0000 |
0 |
|
72 |
0255 |
0000 |
0255 |
0002 |
0023 |
0000 |
0000 |
0000 |
0000 |
0 |
|
73 |
0255 |
0000 |
0255 |
0002 |
0025 |
0000 |
0000 |
0000 |
0000 |
0 |
|
74 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
75 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
76 |
0254 |
0487 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
77 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
78 |
0253 |
0169 |
0254 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
79 |
0253 |
0317 |
0254 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
80 |
0255 |
0000 |
0255 |
0003 |
0039 |
0000 |
0000 |
0000 |
0000 |
0 |
|
81 |
0250 |
0441 |
0248 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
Таблица 12. Окончание.
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
Y |
||
82 |
0254 |
0487 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
83 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
84 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
85 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
86 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
87 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
88 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
89 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
90 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
91 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
92 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
93 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
94 |
0254 |
0487 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
95 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
96 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
97 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
98 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
99 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
100 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
3.3.4 Удаление признаков с неизвестными значениями
Если в каждом элементе выборки значения фактора неизвестно, то такой фактор удаляется. В рассматриваемом примере в результате анализа выборки факторы с неизвестными значениями не обнаружены.
3.3.5 Удаление факторов с постоянными значениями
В рассматриваемом примере в результате анализа факторы с постоянными значениями не обнаружены.
3.3.6 Устранение одинаковых элементов выборки
Выборка должна быть множеством различных между собой элементов. Поэтому в ней не должно встречаться хотя бы двух одинаковых элементов, для которых совпадают вектора значений факторов и значения целевых показателей. В некоторых случаях бывает целесообразно сохранять информацию о частоте, с которой каждый элемент встречается в исходной выборке:
,
где. x* - вектор значений факторов,
y - целевой показатель,
- пространство значений признаков,
p - частота с которой (x*,y) присутствовала в исходной выборке.
В результате анализа выборки, были обнаружены одинаковые элементы (строки таблицы 12 с номерами: 51-56, 58-61, 65-69, 74-79, 81-100). Данные строки выделены в таблице 12 красным цветом. Удалимиз выборки повторяющиеся значения. Итоговая выборка представлена в таблице 13.
Таким образом, было произведено устранение одинаковых элементов выборки.
Таблица 13. Начало
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
Y |
||
1 |
0223 |
0617 |
0240 |
0117 |
8750 |
0000 |
0012 |
0074 |
0006 |
1 |
|
2 |
0211 |
0590 |
0241 |
0084 |
7274 |
0253 |
0020 |
0307 |
0004 |
1 |
|
3 |
0206 |
0594 |
0237 |
0045 |
2180 |
0254 |
0029 |
0683 |
0011 |
1 |
|
4 |
0229 |
0572 |
0244 |
0075 |
6375 |
0254 |
0024 |
0505 |
0007 |
1 |
|
5 |
0220 |
0823 |
0196 |
0104 |
9072 |
0254 |
0027 |
0452 |
0008 |
1 |
|
6 |
0197 |
1045 |
0229 |
0119 |
12249 |
0255 |
0022 |
0291 |
0004 |
1 |
|
7 |
0149 |
1063 |
0134 |
0131 |
11668 |
0255 |
0020 |
0343 |
0001 |
1 |
|
8 |
0189 |
0763 |
0186 |
0131 |
15596 |
0255 |
0013 |
0141 |
0001 |
1 |
|
9 |
0206 |
0658 |
0244 |
0148 |
12709 |
0255 |
0007 |
0081 |
0001 |
1 |
|
10 |
0215 |
0699 |
0244 |
0120 |
13956 |
0000 |
0012 |
0152 |
0003 |
1 |
|
11 |
0220 |
0938 |
0251 |
0119 |
7418 |
0255 |
0015 |
0077 |
0007 |
1 |
|
12 |
0217 |
0940 |
0195 |
0141 |
12071 |
0255 |
0019 |
0309 |
0004 |
1 |
|
13 |
0192 |
1950 |
0146 |
0136 |
11295 |
0255 |
0031 |
0683 |
0011 |
1 |
|
14 |
0169 |
1691 |
0187 |
0088 |
4306 |
0052 |
0022 |
0503 |
0007 |
1 |
|
15 |
0227 |
0685 |
0252 |
0160 |
10798 |
0255 |
0028 |
0455 |
0008 |
1 |
|
16 |
0242 |
0577 |
0255 |
0157 |
11346 |
0255 |
0022 |
0292 |
0007 |
1 |
|
17 |
0245 |
0385 |
0254 |
0174 |
10600 |
0255 |
0022 |
0343 |
0003 |
1 |
|
18 |
0237 |
0837 |
0254 |
0148 |
14182 |
0255 |
0014 |
0143 |
0003 |
1 |
|
19 |
0219 |
1036 |
0254 |
0144 |
13469 |
0255 |
0008 |
0081 |
0001 |
1 |
|
20 |
0207 |
1358 |
0165 |
0113 |
15051 |
0000 |
0012 |
0152 |
0003 |
1 |
|
21 |
0211 |
0397 |
0204 |
0088 |
5112 |
0031 |
0008 |
0062 |
0002 |
1 |
|
22 |
0228 |
0561 |
0244 |
0065 |
2385 |
0026 |
0013 |
0155 |
0006 |
1 |
|
23 |
0212 |
0845 |
0246 |
0039 |
0460 |
0050 |
0019 |
0347 |
0002 |
1 |
|
24 |
0209 |
0205 |
0203 |
0112 |
11941 |
0255 |
0019 |
0158 |
0004 |
1 |
|
25 |
0190 |
0286 |
0169 |
0136 |
12571 |
0255 |
0007 |
0066 |
0004 |
1 |
|
26 |
0233 |
0646 |
0249 |
0123 |
12986 |
0255 |
0009 |
0115 |
0001 |
1 |
|
27 |
0220 |
0560 |
0204 |
0089 |
6203 |
0255 |
0015 |
0095 |
0025 |
1 |
|
28 |
0241 |
0543 |
0247 |
0029 |
1939 |
0056 |
0004 |
0019 |
0002 |
1 |
|
29 |
0220 |
0910 |
0246 |
0030 |
4263 |
0245 |
0013 |
0085 |
0006 |
1 |
|
30 |
0216 |
0995 |
0244 |
0058 |
2028 |
0000 |
0002 |
0006 |
0002 |
1 |
|
31 |
0233 |
0342 |
0253 |
0093 |
2151 |
0049 |
0021 |
0117 |
0029 |
1 |
|
32 |
0239 |
0308 |
0233 |
0072 |
2746 |
0061 |
0019 |
0153 |
0007 |
1 |
|
33 |
0240 |
0526 |
0254 |
0036 |
1921 |
0000 |
0005 |
0086 |
0001 |
1 |
|
34 |
0222 |
0725 |
0202 |
0036 |
2239 |
0000 |
0020 |
0097 |
0018 |
1 |
|
35 |
0235 |
0583 |
0254 |
0033 |
1326 |
0000 |
0014 |
0048 |
0013 |
1 |
|
36 |
0247 |
0515 |
0254 |
0115 |
13847 |
0000 |
0018 |
0100 |
0017 |
1 |
|
37 |
0248 |
0164 |
0255 |
0127 |
13417 |
0000 |
0018 |
0153 |
0023 |
1 |
|
38 |
0241 |
0407 |
0236 |
0133 |
11271 |
0255 |
0022 |
0105 |
0025 |
1 |
|
39 |
0231 |
0624 |
0219 |
0106 |
8579 |
0254 |
0021 |
0114 |
0033 |
1 |
|
40 |
0214 |
0613 |
0209 |
0082 |
4568 |
0254 |
0009 |
0040 |
0008 |
1 |
|
41 |
0104 |
3359 |
0084 |
0124 |
13484 |
0255 |
0065 |
6425 |
0011 |
1 |
|
42 |
0103 |
3053 |
0085 |
0078 |
13456 |
0000 |
0062 |
5998 |
0004 |
1 |
|
43 |
0080 |
0151 |
0080 |
0110 |
15185 |
0254 |
0010 |
0825 |
0004 |
1 |
|
44 |
0216 |
2036 |
0253 |
0130 |
15089 |
0255 |
0051 |
5091 |
0005 |
1 |
|
45 |
0213 |
1844 |
0252 |
0036 |
4419 |
0000 |
0065 |
5866 |
0002 |
1 |
|
46 |
0154 |
1282 |
0139 |
0121 |
13735 |
0255 |
0060 |
5108 |
0007 |
1 |
|
47 |
0197 |
1827 |
0249 |
0073 |
9953 |
0255 |
0023 |
1041 |
0001 |
1 |
Таблица 13. Окончание
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
Y |
||
48 |
0177 |
0804 |
0163 |
0117 |
15355 |
0254 |
0022 |
0712 |
0007 |
1 |
|
49 |
0166 |
0311 |
0165 |
0132 |
14657 |
0254 |
0028 |
0986 |
0002 |
1 |
|
50 |
0179 |
0675 |
0173 |
0099 |
14992 |
0254 |
0022 |
0922 |
0002 |
1 |
|
51 |
0243 |
0101 |
0243 |
0000 |
0000 |
0000 |
0006 |
0002 |
0006 |
0 |
|
52 |
0244 |
0000 |
0244 |
0002 |
0020 |
0000 |
0001 |
0003 |
0002 |
0 |
|
53 |
0245 |
0000 |
0245 |
0000 |
0002 |
0000 |
0000 |
0001 |
0000 |
0 |
|
54 |
0232 |
0110 |
0234 |
0002 |
0018 |
0000 |
0002 |
0003 |
0004 |
0 |
|
55 |
0254 |
0360 |
0255 |
0002 |
0025 |
0000 |
0001 |
0001 |
0001 |
0 |
|
56 |
0255 |
0000 |
0255 |
0002 |
0010 |
0000 |
0001 |
0001 |
0002 |
0 |
|
57 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0001 |
0000 |
0000 |
0 |
|
58 |
0250 |
0501 |
0251 |
0004 |
0049 |
0000 |
0000 |
0001 |
0000 |
0 |
|
59 |
0255 |
0000 |
0255 |
0002 |
0013 |
0000 |
0000 |
0000 |
0000 |
0 |
|
60 |
0255 |
0000 |
0255 |
0002 |
0023 |
0000 |
0000 |
0000 |
0000 |
0 |
|
61 |
0255 |
0000 |
0255 |
0002 |
0025 |
0000 |
0000 |
0000 |
0000 |
0 |
|
62 |
0255 |
0000 |
0255 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
|
63 |
0255 |
0000 |
0255 |
0003 |
0039 |
0000 |
0000 |
0000 |
0000 |
0 |
|
64 |
0250 |
0441 |
0248 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
0 |
3.3.7 Контроль значений признаков и восстановление ошибочных данных
Для контроля данных найдем:
1. Минимальные и максимальные значения каждого признака в выборке.
2. Оценки математического ожидания значений признаков.
3. Оценку среднего квадратичного отклонения.
4. Стандартные ошибка среднего.
5. Отношение стандартной ошибки среднего к среднему значению.
Результаты представлены в таблице14.
Таблица 14. Значения признаков
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
||
Мин |
0080 |
0000 |
0080 |
0000 |
0000 |
0000 |
0000 |
0000 |
0000 |
|
Макс |
0255 |
3359 |
0255 |
0174 |
15596 |
0255 |
0065 |
6425 |
0033 |
|
Сред |
0216 |
0710 |
0222 |
0080 |
7232 |
0132 |
0017 |
0643 |
0006 |
|
Откл |
37,35 |
669,48 |
45,551 |
53,775 |
5765,7 |
123,8879 |
15,716 |
1512,7 |
7,36114 |
|
СОШ |
4,669 |
83,685 |
5,6939 |
6,72188 |
720,71 |
15,48599 |
1,96461 |
189,08 |
0,92014 |
|
ОСО |
0,021 |
0,1178 |
0,0257 |
0,0844 |
0,099 |
0,117 |
0,116 |
0,293 |
0,1517 |
Для решения вопроса о «выскакивающих» (ошибочных) значениях необходимо найти диапазон значений фактора [aj, bj] (j=1,M+K), в котором должно находиться 95% значений фактора выборки:
Далее необходимо найти процент значений рассматриваемого фактора непопадающих в этот диапазон. Если таких значений меньше 5%, то считается, что «выскакивающих» значений нет. В противном случае необходимо удалить одно из «выскакивающих» значений (значение наиболее удаленное от оценки среднего) и вновь воспользоваться этой же методикой.
В таблице 15 приведен процент попадающих в диапазон значений фактора [aj, bj].
Таблица 15. Диапазон значений
Х1 |
Х2 |
Х3 |
X4 |
X6 |
X6 |
X7 |
X8 |
X9 |
|
95,3125 |
95,3125 |
95,3125 |
100 |
100 |
100 |
95,3125 |
95,3125 |
95,3125 |
3.3.8 Нормирование значений признаков
Нормирование значений- процесс преобразования значений, при котором не изменяется размерность выборки. Нормировать значения факторов необходимо для приведения значений факторов к одному сегменту вариаций значений. Нормализованная выборка приведена в таблице 16.
Таблица 16. Нормализованная выборка
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
Y |
||
1 |
0,817 |
0,184 |
0,914 |
0,672 |
0,561 |
0,000 |
0,185 |
0,012 |
0,182 |
1 |
|
2 |
0,749 |
0,176 |
0,920 |
0,483 |
0,466 |
0,992 |
0,308 |
0,048 |
0,121 |
1 |
|
3 |
0,720 |
0,177 |
0,897 |
0,259 |
0,140 |
0,996 |
0,446 |
0,106 |
0,333 |
1 |
|
4 |
0,851 |
0,170 |
0,937 |
0,431 |
0,409 |
0,996 |
0,369 |
0,079 |
0,212 |
1 |
|
5 |
0,800 |
0,245 |
0,663 |
0,598 |
0,582 |
0,996 |
0,415 |
0,070 |
0,242 |
1 |
|
6 |
0,669 |
0,311 |
0,851 |
0,684 |
0,785 |
1,000 |
0,338 |
0,045 |
0,121 |
1 |
|
7 |
0,394 |
0,316 |
0,309 |
0,753 |
0,748 |
1,000 |
0,308 |
0,053 |
0,030 |
1 |
|
8 |
0,623 |
0,227 |
0,606 |
0,753 |
1,000 |
1,000 |
0,200 |
0,022 |
0,030 |
1 |
|
9 |
0,720 |
0,196 |
0,937 |
0,851 |
0,815 |
1,000 |
0,108 |
0,013 |
0,030 |
1 |
|
10 |
0,771 |
0,208 |
0,937 |
0,690 |
0,895 |
0,000 |
0,185 |
0,024 |
0,091 |
1 |
|
11 |
0,800 |
0,279 |
0,977 |
0,684 |
0,476 |
1,000 |
0,231 |
0,012 |
0,212 |
1 |
|
12 |
0,783 |
0,280 |
0,657 |
0,810 |
0,774 |
1,000 |
0,292 |
0,048 |
0,121 |
1 |
|
13 |
0,640 |
0,581 |
0,377 |
0,782 |
0,724 |
1,000 |
0,477 |
0,106 |
0,333 |
1 |
|
14 |
0,509 |
0,503 |
0,611 |
0,506 |
0,276 |
0,204 |
0,338 |
0,078 |
0,212 |
1 |
|
15 |
0,840 |
0,204 |
0,983 |
0,920 |
0,692 |
1,000 |
0,431 |
0,071 |
0,242 |
1 |
|
16 |
0,926 |
0,172 |
1,000 |
0,902 |
0,727 |
1,000 |
0,338 |
0,045 |
0,212 |
1 |
|
17 |
0,943 |
0,115 |
0,994 |
1,000 |
0,680 |
1,000 |
0,338 |
0,053 |
0,091 |
1 |
|
18 |
0,897 |
0,249 |
0,994 |
0,851 |
0,909 |
1,000 |
0,215 |
0,022 |
0,091 |
1 |
|
19 |
0,794 |
0,308 |
0,994 |
0,828 |
0,864 |
1,000 |
0,123 |
0,013 |
0,030 |
1 |
|
20 |
0,726 |
0,404 |
0,486 |
0,649 |
0,965 |
0,000 |
0,185 |
0,024 |
0,091 |
1 |
|
21 |
0,749 |
0,118 |
0,709 |
0,506 |
0,328 |
0,122 |
0,123 |
0,010 |
0,061 |
1 |
|
22 |
0,846 |
0,167 |
0,937 |
0,374 |
0,153 |
0,102 |
0,200 |
0,024 |
0,182 |
1 |
|
23 |
0,754 |
0,252 |
0,949 |
0,224 |
0,029 |
0,196 |
0,292 |
0,054 |
0,061 |
1 |
|
24 |
0,737 |
0,061 |
0,703 |
0,644 |
0,766 |
1,000 |
0,292 |
0,025 |
0,121 |
1 |
|
25 |
0,629 |
0,085 |
0,509 |
0,782 |
0,806 |
1,000 |
0,108 |
0,010 |
0,121 |
1 |
|
26 |
0,874 |
0,192 |
0,966 |
0,707 |
0,833 |
1,000 |
0,138 |
0,018 |
0,030 |
1 |
|
27 |
0,800 |
0,167 |
0,709 |
0,511 |
0,398 |
1,000 |
0,231 |
0,015 |
0,758 |
1 |
|
28 |
0,920 |
0,162 |
0,954 |
0,167 |
0,124 |
0,220 |
0,062 |
0,003 |
0,061 |
1 |
|
29 |
0,800 |
0,271 |
0,949 |
0,172 |
0,273 |
0,961 |
0,200 |
0,013 |
0,182 |
1 |
|
30 |
0,777 |
0,296 |
0,937 |
0,333 |
0,130 |
0,000 |
0,031 |
0,001 |
0,061 |
1 |
|
31 |
0,874 |
0,102 |
0,989 |
0,534 |
0,138 |
0,192 |
0,323 |
0,018 |
0,879 |
1 |
|
32 |
0,909 |
0,092 |
0,874 |
0,414 |
0,176 |
0,239 |
0,292 |
0,024 |
0,212 |
1 |
|
33 |
0,914 |
0,157 |
0,994 |
0,207 |
0,123 |
0,000 |
0,077 |
0,013 |
0,030 |
1 |
|
34 |
0,811 |
0,216 |
0,697 |
0,207 |
0,144 |
0,000 |
0,308 |
0,015 |
0,545 |
1 |
|
35 |
0,886 |
0,174 |
0,994 |
0,190 |
0,085 |
0,000 |
0,215 |
0,007 |
0,394 |
1 |
|
36 |
0,954 |
0,153 |
0,994 |
0,661 |
0,888 |
0,000 |
0,277 |
0,016 |
0,515 |
1 |
|
37 |
0,960 |
0,049 |
1,000 |
0,730 |
0,860 |
0,000 |
0,277 |
0,024 |
0,697 |
1 |
|
38 |
0,920 |
0,121 |
0,891 |
0,764 |
0,723 |
1,000 |
0,338 |
0,016 |
0,758 |
1 |
|
39 |
0,863 |
0,186 |
0,794 |
0,609 |
0,550 |
0,996 |
0,323 |
0,018 |
1,000 |
1 |
|
40 |
0,766 |
0,182 |
0,737 |
0,471 |
0,293 |
0,996 |
0,138 |
0,006 |
0,242 |
1 |
|
41 |
0,137 |
1,000 |
0,023 |
0,713 |
0,865 |
1,000 |
1,000 |
1,000 |
0,333 |
1 |
|
42 |
0,131 |
0,909 |
0,029 |
0,448 |
0,863 |
0,000 |
0,954 |
0,934 |
0,121 |
1 |
|
43 |
0,000 |
0,045 |
0,000 |
0,632 |
0,974 |
0,996 |
0,154 |
0,128 |
0,121 |
1 |
|
44 |
0,777 |
0,606 |
0,989 |
0,747 |
0,967 |
1,000 |
0,785 |
0,792 |
0,152 |
1 |
|
45 |
0,760 |
0,549 |
0,983 |
0,207 |
0,283 |
0,000 |
1,000 |
0,913 |
0,061 |
1 |
|
46 |
0,423 |
0,382 |
0,337 |
0,695 |
0,881 |
1,000 |
0,923 |
0,795 |
0,212 |
1 |
|
47 |
0,669 |
0,544 |
0,966 |
0,420 |
0,638 |
1,000 |
0,354 |
0,162 |
0,030 |
1 |
Таблица 16. Нормализованная выборка.Окончание
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
Y |
||
48 |
0,554 |
0,239 |
0,474 |
0,672 |
0,985 |
0,996 |
0,338 |
0,111 |
0,212 |
1 |
|
49 |
0,491 |
0,093 |
0,486 |
0,759 |
0,940 |
0,996 |
0,431 |
0,153 |
0,061 |
1 |
|
50 |
0,566 |
0,201 |
0,531 |
0,569 |
0,961 |
0,996 |
0,338 |
0,144 |
0,061 |
1 |
|
51 |
0,931 |
0,030 |
0,931 |
0,000 |
0,000 |
0,000 |
0,092 |
0,000 |
0,182 |
0 |
|
52 |
0,937 |
0,000 |
0,937 |
0,011 |
0,001 |
0,000 |
0,015 |
0,000 |
0,061 |
0 |
|
53 |
0,943 |
0,000 |
0,943 |
0,000 |
0,000 |
0,000 |
0,000 |
0,000 |
0,000 |
0 |
|
54 |
0,869 |
0,033 |
0,880 |
0,011 |
0,001 |
0,000 |
0,031 |
0,000 |
0,121 |
0 |
|
55 |
0,994 |
0,107 |
1,000 |
0,011 |
0,002 |
0,000 |
0,015 |
0,000 |
0,030 |
0 |
|
56 |
1,000 |
0,000 |
1,000 |
0,011 |
0,001 |
0,000 |
0,015 |
0,000 |
0,061 |
0 |
|
57 |
1,000 |
0,000 |
1,000 |
0,000 |
0,000 |
0,000 |
0,015 |
0,000 |
0,000 |
0 |
|
58 |
0,971 |
0,149 |
0,977 |
0,023 |
0,003 |
0,000 |
0,000 |
0,000 |
0,000 |
0 |
|
59 |
1,000 |
0,000 |
1,000 |
0,011 |
0,001 |
0,000 |
0,000 |
0,000 |
0,000 |
0 |
|
60 |
1,000 |
0,000 |
1,000 |
0,011 |
0,001 |
0,000 |
0,000 |
0,000 |
0,000 |
0 |
|
61 |
1,000 |
0,000 |
1,000 |
0,011 |
0,002 |
0,000 |
0,000 |
0,000 |
0,000 |
0 |
|
62 |
1,000 |
0,000 |
1,000 |
0,000 |
0,000 |
0,000 |
0,000 |
0,000 |
0,000 |
0 |
|
63 |
1,000 |
0,000 |
1,000 |
0,017 |
0,003 |
0,000 |
0,000 |
0,000 |
0,000 |
0 |
|
64 |
0,971 |
0,131 |
0,960 |
0,000 |
0,000 |
0,000 |
0,000 |
0,000 |
0,000 |
0 |
3.3.9 Выбор информационных признаков
Один из методов выделения информационных признаков - подсчет коэффициентов корреляции между факторами и показателем.
Информативность фактора определяется путем сравнения абсолютной величины коэффициента корреляции с пороговым значением:
,
где I- задаваемое пороговое значение.
Коэффициент корреляции определяется по формуле:
,
где- оценка первичных моментов.
При нахождении коэффициентов корреляции необходимо использовать нормированные значения факторов. Пороговым значением Iявляется значение 0,56.
Таблица 17. Коэффициенты корреляций признаков
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
Y |
||
X1 |
1 |
||||||||||
X2 |
-0,625 |
1 |
|||||||||
X3 |
0,902 |
-0,514 |
1 |
||||||||
X4 |
-0,426 |
0,359 |
-0,350 |
1 |
|||||||
X5 |
-0,572 |
0,438 |
-0,510 |
0,889 |
1 |
||||||
X6 |
-0,418 |
0,263 |
-0,330 |
0,710 |
0,656 |
1 |
|||||
X7 |
-0,586 |
0,780 |
-0,488 |
0,441 |
0,492 |
0,370 |
1 |
||||
X8 |
-0,565 |
0,765 |
-0,470 |
0,159 |
0,315 |
0,128 |
0,877 |
1 |
|||
X9 |
0,020 |
0,046 |
-0,052 |
0,266 |
0,124 |
0,153 |
0,257 |
-0,007 |
1 |
||
Y |
-0,484 |
0,479 |
-0,336 |
0,774 |
0,667 |
0,569 |
0,540 |
0,226 |
0,361 |
1 |
По результатам корреляционного анализа выбраны три наиболее информативных признака X4, X5, X6. Данные признаки выделены в таблице 17 цветом.
3.3.10 Формирование обучающей и контролирующей выборок
На этом этапе выборка, полученная после удаления не информационных факторов, разбивается на две выборки: одна из них обучающая будет использоваться для определения функции аппроксимации, а другая контролирующая - для оценки качества аппроксимации.
Количество элементов в выборках примерно должно быть одинаковым и в разных выборках должны присутствовать близкие и разнообразные значения показателя из его вариации.
Обучающая и контролирующая выборка представлены в таблице18 и таблице19соответственно.
Таблица 18. Обучающая выборка.
X4 |
X5 |
X6 |
Y |
||
1 |
0,672 |
0,561 |
0 |
1 |
|
2 |
0,258 |
0,139 |
0,996 |
1 |
|
3 |
0,597 |
0,581 |
0,996 |
1 |
|
4 |
0,752 |
0,748 |
1 |
1 |
|
5 |
0,850 |
0,814 |
1 |
1 |
|
6 |
0,683 |
0,475 |
1 |
1 |
|
7 |
0,781 |
0,724 |
1 |
1 |
|
8 |
0,919 |
0,692 |
1 |
1 |
|
9 |
1 |
0,679 |
1 |
1 |
|
10 |
0,827 |
0,863 |
1 |
1 |
|
11 |
0,505 |
0,327 |
0,123 |
1 |
|
12 |
0,224 |
0,029 |
0,196 |
1 |
|
13 |
0,781 |
0,806 |
1 |
1 |
|
14 |
0,511 |
0,397 |
1 |
1 |
|
15 |
0,172 |
0,273 |
0,960 |
1 |
|
16 |
0,534 |
0,137 |
0,192 |
1 |
|
17 |
0,206 |
0,123 |
0 |
1 |
|
18 |
0,189 |
0,085 |
0 |
1 |
|
19 |
0,729 |
0,860 |
0 |
1 |
|
20 |
0,609 |
0,550 |
0,996 |
1 |
|
21 |
0,712 |
0,865 |
1 |
1 |
|
22 |
0,632 |
0,973 |
0,996 |
1 |
|
23 |
0,206 |
0,283 |
0 |
1 |
|
24 |
0,419 |
0,638 |
1 |
1 |
|
25 |
0,758 |
0,939 |
0,996 |
1 |
|
26 |
0 |
0 |
0 |
0 |
|
27 |
0 |
0,00013 |
0 |
0 |
|
28 |
0,011 |
0,0016 |
0 |
0 |
|
29 |
0 |
0 |
0 |
0 |
|
30 |
0,011 |
0,00083 |
0 |
0 |
|
31 |
0,011 |
0,0016 |
0 |
0 |
|
32 |
0,017 |
0,0025 |
0 |
0 |
Таблица 19. Контролирующая выборка.
X4 |
X5 |
X6 |
Y |
||
1 |
0,482 |
0,466 |
0,992 |
1 |
|
2 |
0,431 |
0,408 |
0,996 |
1 |
|
3 |
0,683 |
0,785 |
1 |
1 |
|
4 |
0,752 |
1 |
1 |
1 |
|
5 |
0,689 |
0,894 |
0 |
1 |
|
6 |
0,810 |
0,773 |
1 |
1 |
|
7 |
0,505 |
0,276 |
0,203 |
1 |
|
8 |
0,902 |
0,727 |
1 |
1 |
|
9 |
0,850 |
0,909 |
1 |
1 |
|
10 |
0,649 |
0,965 |
0 |
1 |
|
11 |
0,373 |
0,152 |
0,101 |
1 |
|
12 |
0,643 |
0,765 |
1 |
1 |
|
13 |
0,706 |
0,832 |
1 |
1 |
|
14 |
0,166 |
0,124 |
0,219 |
1 |
|
15 |
0,333 |
0,130 |
0 |
1 |
|
16 |
0,413 |
0,176 |
0,239 |
1 |
|
17 |
0,206 |
0,143 |
0 |
1 |
|
18 |
0,660 |
0,887 |
0 |
1 |
|
19 |
0,764 |
0,722 |
1 |
1 |
|
20 |
0,471 |
0,292 |
0,996 |
1 |
|
21 |
0,448 |
0,862 |
0 |
1 |
|
22 |
0,747 |
0,967 |
1 |
1 |
|
23 |
0,695 |
0,880 |
1 |
1 |
|
24 |
0,672 |
0,984 |
0,996 |
1 |
|
25 |
0,568 |
0,961 |
0,996 |
1 |
|
26 |
0,011 |
0,0012 |
0 |
0 |
|
27 |
0,011 |
0,0011 |
0 |
0 |
|
28 |
0,011 |
0,0006 |
0 |
0 |
|
29 |
0,022 |
0,003 |
0 |
0 |
|
30 |
0,011 |
0,0014 |
0 |
0 |
|
31 |
0 |
0 |
0 |
0 |
|
32 |
0 |
0 |
0 |
0 |
3.4 Формирование правил принятия решений
1. Определим целевую функцию линейной модели:
2. Определим систему линейных уравнений
Рассмотрим линейную функцию: u(a,x). Найдем значения a00,....a04 обеспечивающие минимум суммы среднеквадратических ошибок на всех элементах обучающей выборки:
1) Продифференцируем E по переменной a00
Используя (1), получим первое уравнение системы:
2) Продифференцируем E по переменной a01
Введем обозначения:
Получим второе уравнение системы:
3) Продифференцируем E по переменной a02
Введем обозначения:
Получим третье уравнение системы:
4) Продифференцируем E по переменной a03
Введем обозначения:
Получим четвертое уравнение системы:
2. Составим систему из 4-х линейных уравнений:
Тогдаполучаемприn=3:
Преобразуемсистемуприm=32:
Используя выборку, снова преобразуем систему:
Воспользовавшись методом Гаусса для решения СЛУ, вычислим значения a00,a01,a02,a03:
Значенияa00,a01,a02,a03вставляем в полином первой степени:
Посчитаем полином и найдем ошибку аппроксимации.Результаты представлены в таблице 20.Значение столбца Y**это значение полинома после сравнения с порогом 0,5.
Таблица 20. Значение у* (контролирующая выборка)
X4 |
X5 |
X6 |
Y |
Y* |
Y** |
||
1 |
0,482 |
0,466 |
0,992 |
1 |
0,918 |
1 |
|
2 |
0,431 |
0,408 |
0,996 |
1 |
0,849 |
1 |
|
3 |
0,683 |
0,785 |
1 |
1 |
1,167 |
1 |
|
4 |
0,752 |
1 |
1 |
1 |
1,219 |
1 |
|
5 |
0,689 |
0,894 |
0 |
1 |
0,893 |
1 |
|
6 |
0,810 |
0,773 |
1 |
1 |
1,385 |
1 |
|
7 |
0,505 |
0,276 |
0,203 |
1 |
0,817 |
1 |
|
8 |
0,902 |
0,727 |
1 |
1 |
1,555 |
1 |
|
9 |
0,850 |
0,909 |
1 |
1 |
1,413 |
1 |
|
10 |
0,649 |
0,965 |
0 |
1 |
0,804 |
1 |
|
11 |
0,373 |
0,152 |
0,101 |
1 |
0,604 |
1 |
|
12 |
0,643 |
0,765 |
1 |
1 |
1,104 |
1 |
|
13 |
0,706 |
0,832 |
1 |
1 |
1,191 |
1 |
|
14 |
0,166 |
0,124 |
0,219 |
1 |
0,290 |
0 |
|
15 |
0,333 |
0,130 |
0 |
1 |
0,517 |
1 |
|
16 |
0,413 |
0,176 |
0,239 |
1 |
0,700 |
1 |
|
17 |
0,206 |
0,143 |
0 |
1 |
0,298 |
0 |
|
18 |
0,660 |
0,887 |
0 |
1 |
0,847 |
1 |
|
19 |
0,764 |
0,722 |
1 |
1 |
1,322 |
1 |
|
20 |
0,471 |
0,292 |
0,996 |
1 |
0,952 |
1 |
|
21 |
0,448 |
0,862 |
0 |
1 |
0,493 |
0 |
|
22 |
0,747 |
0,967 |
1 |
1 |
1,219 |
1 |
|
23 |
0,695 |
0,880 |
1 |
1 |
1,157 |
1 |
|
24 |
0,672 |
0,984 |
0,996 |
1 |
1,086 |
1 |
|
25 |
0,568 |
0,961 |
0,996 |
1 |
0,917 |
1 |
|
26 |
0,011 |
0,001 |
0 |
0 |
0,009 |
0 |
|
27 |
0,011 |
0,001 |
0 |
0 |
0,009 |
0 |
|
28 |
0,011 |
0,0006 |
0 |
0 |
0,009 |
0 |
|
29 |
0,0229 |
0,003 |
0 |
0 |
0,028 |
0 |
|
30 |
0,0114 |
0,001 |
0 |
0 |
0,009 |
0 |
|
31 |
0 |
0 |
0 |
0 |
-0,01 |
0 |
|
32 |
0 |
0 |
0 |
0 |
-0,01 |
0 |
В ходе анализа выявлены три ошибки I-рода и не выявлены ошибки II-рода. Ошибка аппроксимацииE вычисляется по формуле:
= 9,335
Воспользовавшись программой для решения СЛУ, вычислим значения a00,a01,a02,a03, a04,a05,a06,a07a08,a09:
Значенияa00,a01,a02,a03, a04,a05,a06,a07a08,a09 подставляем в полином второй степени:
Посчитаем полином и найдем ошибку аппроксимации.Результаты представлены в таблице 21.Значение столбца Y**это значение полинома после сравнения с порогом 0,5.
Таблица 21. Значение у** (контролирующая выборка)
X4 |
X5 |
X6 |
Y |
Y* |
Y** |
||
1 |
0,482 |
0,466 |
0,992 |
1 |
1,431 |
1 |
|
2 |
0,431 |
0,408 |
0,996 |
1 |
1,373 |
1 |
|
3 |
0,683 |
0,785 |
1 |
1 |
1,472 |
1 |
|
4 |
0,752 |
1 |
1 |
1 |
1,380 |
1 |
|
5 |
0,689 |
0,894 |
0 |
1 |
1,064 |
1 |
|
6 |
0,810 |
0,773 |
1 |
1 |
1,417 |
1 |
|
7 |
0,505 |
0,276 |
0,203 |
1 |
1,252 |
1 |
|
8 |
0,902 |
0,727 |
1 |
1 |
1,372 |
1 |
|
9 |
0,850 |
0,909 |
1 |
1 |
1,331 |
1 |
|
10 |
0,649 |
0,965 |
0 |
1 |
1,084 |
1 |
|
11 |
0,373 |
0,152 |
0,101 |
1 |
0,996 |
1 |
|
12 |
0,643 |
0,765 |
1 |
1 |
1,483 |
1 |
|
13 |
0,706 |
0,832 |
1 |
1 |
1,454 |
1 |
|
14 |
0,166 |
0,124 |
0,219 |
1 |
0,751 |
1 |
|
15 |
0,333 |
0,130 |
0 |
1 |
0,832 |
1 |
Таблица 21. Значение у** (контролирующая выборка). Окончание
X4 |
X5 |
X6 |
Y |
Y* |
Y** |
||
16 |
0,413 |
0,176 |
0,239 |
1 |
1,165 |
1 |
|
17 |
0,206 |
0,143 |
0 |
1 |
0,649 |
1 |
|
18 |
0,660 |
0,887 |
0 |
1 |
1,086 |
1 |
|
19 |
0,764 |
0,722 |
1 |
1 |
1,458 |
1 |
|
20 |
0,471 |
0,292 |
0,996 |
1 |
1,384 |
1 |
|
21 |
0,448 |
0,862 |
0 |
1 |
1,162 |
1 |
|
22 |
0,747 |
0,967 |
1 |
1 |
1,395 |
1 |
|
23 |
0,695 |
0,880 |
1 |
1 |
1,448 |
1 |
|
24 |
0,672 |
0,984 |
0,996 |
1 |
1,440 |
1 |
|
25 |
0,568 |
0,961 |
0,996 |
1 |
1,484 |
1 |
|
26 |
0,011 |
0,001 |
0 |
0 |
0,129 |
0 |
|
27 |
0,011 |
0,001 |
0 |
0 |
0,129 |
0 |
|
28 |
0,011 |
0,0006 |
0 |
0 |
0,129 |
0 |
|
29 |
0,022 |
0,003 |
0 |
0 |
0,159 |
0 |
|
30 |
0,011 |
0,001 |
0 |
0 |
0,129 |
0 |
|
31 |
0 |
0 |
0 |
0 |
0,100 |
0 |
|
32 |
0 |
0 |
0 |
0 |
0,100 |
0 |
Ошибка аппроксимацииE при обучающей выборке:
=0
В ходе анализа ошибки Iи IIрода не выявлены.
Таблица 22. Ошибка аппроксимации
Ошибка аппроксимации на контролирующей выборке |
||
Полином 1степени |
9,335 |
|
Полином 2степени |
0 |
Полином второй степени допускает меньшее количество ошибок на тестирующей выборке. Полином второй степени в дальнейшем будет использоваться для поиска границы объекта на изображении.
4. ТЕХНОЛОГИЧЕСКИЙ ПРОЦЕСС ОБРАБОТКИ ДАННЫХ
4.1 Технология приобретения знаний
Технологический процесс приобретения знаний представлен на рисунке 4.1.
Рис. 4.1. Технология приобретения знаний
4.2 Технология принятия решения
Технологический процесс принятия решений представлен на рисунке 4.2.
Рис. 4.2. Технология принятия решения
5. ПРОГРАММНЫЕ СРЕДСТВА
5.1 Программные средства приобретения знаний
В данной курсовой работе использовались следующие программные средства приобретений знаний:
- программа на C# для преобразования изображения;
- программа на C# для выбора граничных и неграничных точек;
- программа на C# для вычисления признаков изображения;
- MSExcel для корреляционного анализа, выделения информационных признаков, вычисления коэффициентов полинома первой степени, вычисления значения полинома и ошибок;
- программа на C# для вычисления коэффициентов полинома второй степени.
В программу для преобразования изображения загружались необходимые изображения, проводились преобразования и на выходе получались преобразованные изображения.
Полученные изображения загружались в программу для выбора граничных и неграничных точек. На каждом изображении отмечались граничные точки и точки фона. На выходе были получен набор координат граничных и неграничных точек.
Подобные документы
Разработка программы на языке Си++ и осуществление постановки и выбора алгоритмов решения задач обработки экономической информации, создание и редактирование базы данных, сортировка записей по определенному запросу, анализ эффективности обработки данных.
контрольная работа [316,8 K], добавлен 28.08.2012Системный анализ предметной области проектируемой базы данных. Экономическая сущность комплекса экономических информационных задач. Проектные решения по программному обеспечению комплекса задач. Структура базы данных и технологическое обеспечение.
курсовая работа [303,7 K], добавлен 27.02.2009Осуществление постановки и выбор алгоритмов решения задач обработки экономической информации; разработка программы для работы с базой данных о маршруте: начало, конец, номер, суммарное количество мест. Поиск маршрутов по названиям конечного пункта.
курсовая работа [2,5 M], добавлен 17.01.2013Создание автоматизированной информационной системы учета оборудования (компьютерной и оргтехники) на АКБ НМБ ОАО с использованием современных компьютерных средств. Проектирование базы данных. Алгоритмы решения задач. Расчёт затрат на проектирование.
дипломная работа [2,1 M], добавлен 16.12.2013Модернизации информационной системы "Техническая подготовка производства". Анализ процессов обработки данных при процессе заказа и размещения технологического оборудования, разработка модели автоматизированной обработки данных при помощи методологии RAD.
дипломная работа [2,5 M], добавлен 23.06.2012Функциональная модель предметной области на примере базы данных автоматизированной информационной системы "Общежития". Ведение информационной базы об общежитиях, комнатах и сотрудниках, хранение информации о студентах, специальностях и факультетах.
курсовая работа [2,7 M], добавлен 10.04.2014Разработка автоматизированной информационной системы "Супермаркет DNS" с опорой на платформу NET, в среде MS Visual Studio, на языке программирования C. Объектная модель программной системы согласно методологии ОМТ. Описание алгоритмов обработки данных.
курсовая работа [394,0 K], добавлен 21.10.2012Проектирование и разработка автоматизированной информационной системы (АИС) публикации и обработки данных для работников детского сада № 176. Недостатки существующей АИС, снижающие эффективность работы организации. Прототип пользовательского интерфейса.
дипломная работа [7,7 M], добавлен 19.07.2012Основные технические решения проекта создания информационной системы целью оповещение населения актуальной информации (новости, указы, законы). Описание алгоритма обработки запросов, добавления и удаления информации в базу данных, ее обновление.
дипломная работа [3,9 M], добавлен 06.04.2013Характеристика организации автоматизированной обработки. Схема данных и ее описание. Характеристика входной и выходной информации. Организация технологического процесса сбора, передачи, обработки и выдачи информации. Формализация автоматизируемых задач.
курсовая работа [941,7 K], добавлен 22.11.2013