Інтелектуальна система селекторного розпізнавання електронограм

Метод функціонально-статистичних випробувань, а також методи селекції ознак розпізнавання. Розробка математичної моделі і алгоритму оцінки інформативності груп ознак розпізнавання в рамках інформаційно-екстремальної інтелектуальної технології (ІЕІТ).

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид дипломная работа
Язык украинский
Дата добавления 14.06.2010
Размер файла 298,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

ДИПЛОМНА РОБОТА

на тему:

«Інтелектуальна система селекторного розпізнавання електронограм»

РЕФЕРАТ

Записка: 64 стр., 14 рис., 3 табл., 1 додаток, 38 бібліографічних джерел.

Об'єкт дослідження - слабоформалізований керований процес.

Мета роботи -- розробка математичної моделі і алгоритму оцінки інформативності груп ознак розпізнавання в рамках інформаційно екстремальної інтелектуальної технології (ІЕІТ).

Методи дослідження -- метод функціонально-статистичних випробувань, методи селекції ознак розпізнавання.

Результати -- алгоритм та програмне забезпечення комп'ютерної інтелектуальної системи розпізнавання електронограм, що функціонує в рамках інформаційно-екстремальної технології. При цьому розглянуті питання відтворення класифікаторів з використанням певної частини електронограми та обчислення інформаційного критерію функціональної ефективності (КФЕ). Розроблений алгоритм реалізовано у програмному забезпеченні створеному за допомогою інструментального програмного середовища php.

ВСТУП

Підвищення ефективності та оперативності управління виробничими процесами органічно пов'язано із розробкою та впровадженням інтелектуальних інформаційних технологій, що базуються на ідеях і методах машинного навчання. Застосування здатних навчатися (самонавчатися) систем керування (СК) у виробництві дозволяє здійснити перехід від застарілих суб'єктивних методів ручного управління до інтелектуальних інформаційних технологій управління слабо формалізованими процесами та об'єктами, які функціонують в умовах невизначеності. Основні перешкоди на шляху інтенсивного впровадження АСУТП, що навчаються, все ще обумовлені відставанням теорії машинного навчання від потреб практики. Так, основними недоліками багатьох відомих методів навчання систем розпізнавання, які роблять неефективним їх застосування на практиці, є ігнорування перетину класів розпізнавання у просторі ознак розпізнавання, що має місце у практичних задачах контролю та управління, і необхідність використовування навчальних вибірок великих обсягів.

Використання невеликої кількості інформативних ознак розпізнавання дозволяє частково вирішити вищезазначені проблеми. Але окремо взяті ознаки не несуть достатньої кількості інформації про класи. Таким чином ознаки необхідно об'єднувати у групи. Але навіть група ознак в деяких випадках може бути менш інформативною в порівнянні з іншими групами. Отже, перед тим як використовувати ту чи іншу ознаку, необхідно оцінити її інформативність.

1 АНАЛІЗ ПРОБЛЕМИ. ПОСТАНОВКА ЗАДАЧІ ДОСЛІДЖЕННЯ

1.1 Аналітичній огляд методів оцінки інформативності ознак розпізнавання

Оцінка інформативності визначає ефективність використання певної ознаки розпізнавання або групи таких ознак - словника ОР. Методи оцінки інформативності поділяють на фільтри (методи попередньої обробки) та вкладені методи. Фільтри використовують елементи теорії інформації, що робить їх найбільш універсальними методами оцінки. Недоліком фільтрів можна вважати те, що вони безпосередньо не використовують інформацію про класифікаційні особливості ОР. Вкладені методи навпаки базуються на оцінці того, наскільки ефективно проводиться класифікація з використанням даної ознаки або словника ОР, що вказує на наявність певних симбіотичних відносин між ними та системою класифікації. Завдяки цьому вкладені методи характеризуються більш якісними, ніж фільтри, результатами, але втрачають в оперативності та універсальності. Крім того застосування вкладених методів може бути проблематичним для деяких особливо специфічних класифікаторів.

Окрема класифікація функцій оцінки вводиться по мірам інформативності, що використовуються в них:

1) Точносні, що використовуються у вкладених методах, для яких функція оцінки залежить від точностних характеристик ІС, і характеризуються високою точністю але значними обчислювальними витратами. Дані міри - єдині, для яких можна безпосередньо вказати точність вже на етапі оптимізації.

2) Сумістностні, що визначають сумісність навчальних даних, використовуючи поняття мінімального розміру репрезентативної навчальної вибірки, який визначається для поточного варіанту словника ОР. Характеризуються універсальністю та помірними обчислювальними витратами.

3) Кореляційні, що визначають малоінформативні ОР, розраховуючи кореляцію між ними та іншими ОР. Дані міри основані на відповідних інформаційних мірах, але подають дещо іншу точку зору на питання оцінки якості словника ОР і тому виділяються в окрему групу. Характеризуються універсальністю та незначними обчислювальними витратами.

4) Інформаційні, що визначають приріст кількості інформації (різницю між апріорною та очікуваною апостеріорною невизначеністю) при використанні кожної ОР, наприклад, ентропійні міри Шенона або Кульбака. Характеризуються універсальністю та незначними обчислювальними витратами.

5) Дистанційні, що розраховують та максимізують ступінь рознесеності образів, наприклад, Евклідову кодову відстань. Характеризуються універсальністю та незначними обчислювальними витратами.

Слід зазначити, що міри якості з груп 2-5 найчастіше використовуються у фільтрах, а групи 1 - у вкладених методах селекції, що пояснює універсальність перших і високу точність останніх. Таким чином для оцінки інформативності бажано використовувати вкладені методи, які основну увагу приділяють класифікаційним особливостям ОР і характеризуються високою точністю.

1.3 Постановка задачі та формування завдань дослідження

Із приведеного вище огляду методів оцінки інформативності ознак розпізнавання та особливостей структури та функцій СППР можна розбити висновок про перспективність поєднання ефективних алгоритмів оцінки інформативності ОР та методу синтезу системи керування, що навчається, та створенні на їх базі відповідних методів оптимізації словника ознак розпізнавання.

У роботі необхідно розробити модифікацію методу синтезу СК, що навчається на базі методу функціонально-статистичних випробувань, з використанням вкладених методів оцінки ОР, що дозволить підвищити ефективність навчання системи.

Таким чином, метою роботи є

1) формування вхідного математичного опису для інтелектуальної системи розпізнавання електронограм;

2) формування класифікаторів у вигляді контейнерів гіперсферичної форми та оптимізація в інформаційному сенсі їх параметрів;

3) оптимізація в інформаційному сенсі системи контрольних допусків на ознаки розпізнавання,

4) оцінка ефективності селекторної системи розпізнавання, що використовує для формування навчальної матриці частину рецепторного поля.

2 ІНФОРМАЦІЙНО-ЕКСТРЕМАЛЬНА ІНТЕЛЕКТУАЛЬНА ТЕХНОЛОГІЯ

2.1 Основні принципи, концепція та визначення

Метод функціонально-статистичних випробувань (МФСВ) - непараметричний інформаційно-екстремальний метод аналізу та синтезу здатної навчатися СК, який ґрунтується на прямій оцінці інформаційної здатності системи за умов нечіткої компактності реалізацій образу, та обмеження навчальної вибірки, яка є прийнятною для задач контролю і управління. Метод призначено для розв'язання практичних задач контролю та управління слабо формалізованими системами і процесами шляхом автоматичної класифікації їх функціональних станів за умови невизначеності.

МФСВ окрім системних та специфічних принципів ґрунтується також на 2-х дистанційних принципах:

а) максимально-дистанційному, який вимагає максимальної міжцентрової відстані між класами;

б) мінімально-дистанційному, вимагає мінімальної середньої відстані реалізацій від центру свого класу.

Класом розпізнавання (образом) називається відбиття властивостей m-го функціонального стану і відношень між елементами системи. Клас розпізнавання топологічна категорія, яка задається в просторі ОР областю

Б.

Детерміновано-статистичний підхід до моделювання систем вимагає завдання систем нормованих (експлуатаційних) і контрольних допусків на ОР. Нехай базовий клас, який характеризує максимальну функціональну ефективність, тобто є найбільш бажаним для розробника інформаційного забезпечення системи. Нормованим називається поле допусків , в якому значення і-ї ОР знаходиться з імовірністю або , за умови, що функціональний стан відноситься до класу . Контрольним називається поле допусків , в якому значення і-ї ОР знаходиться з імовірністю за умови, що функціональний стан відноситься до класу.

В МФСВ система контрольних допусків (СКД) вводиться з метою рандомізації процесу прийняття рішень, оскільки для повного дослідження ОКУ необхідно використовувати як детерміновані, так і статистичні характеристики. Зрозуміло, що і базова (відносно класу ) СКД є сталою для всієї абетки класів розпізнавання.

Реалізацією образу називається випадковий структурований бінарний вектор

де і-та координата вектора, яка приймає одиничне значення, якщо значення і-ї ОР знаходиться в полі допусків , і нульове значення, якщо не знаходиться; мінімальна кількість випробувань, яка забезпечує репрезентативність реалізацій образу.

При обґрунтуванні гіпотези компактності (чіткої, або нечіткої) реалізацій образу за геометричний центр класу приймається вершина бінарного еталонного вектору хm.

Еталонний вектор (ЕВ) xm це математичне сподівання реалізацій класу .

Він подається у вигляді детермінованого структурованого бінарного вектора

де хm,і і-та координата вектора, яка приймає одиничне значення, якщо значення і-ї ОР знаходиться в нормованому полі допусків , і нульове значення, якщо не знаходиться.

Основною задачею етапу навчання за МФСВ є розбиття простору ОР за поданою навчальною матрицею на області класів розпізнавання деяким оптимальним в інформаційному сенсі способом, який забезпечує на етапі екзамену прийняття рішень з достовірністю, наближеною до максимальної асимптотичної достовірності.

Параметром функціонування називається характеристика інформаційного забезпечення, яка прямо або непрямо впливає на функціональну ефективність системи. Такими параметрами можуть бути параметри навчання, перетворення образу, впливу середовища та інші, які безпосередньо впливають на асимптотичну достовірність.

Як критерій оптимізації процесу навчання системи прийняттю рішень в рамках МФСВ застосовується статистичний інформаційний КФЕ, який є природною мірою різноманітності (або схожості) класів розпізнавання і одночасно функціоналом асимптотичних точнісних характеристик СПР. При цьому важливо, щоб параметри навчання були оптимальними в інформаційному розумінні, тобто забезпечували максимальну функціональну ефективність СПР, яка визначається достовірністю прийняття рішень на екзамені.

Достовірність класифікатора залежить від геометричних параметрів роздільних гіперповерхонь класів розпізнавання.

У загальному випадку, коли класи розпізнавання перетинаються, розглянемо відносний коефіцієнт нечіткої компактності реалізації образу для класу

(2.1)

Процес навчання полягає в мінімізації цього виразу.

В МФСВ, який ґрунтується на допущенні гіпотези компактності (чіткої або нечіткої) реалізацій образу, як наближення точної роздільної гіперповерхні для класу розглядається гіперсфера, центром якої є еталонний вектор хm, а радіусом кодова відстань, яка у просторі Хеммінга визначається як

(2.2)

де і-та координата вектора ; i-тa координата деякого вектора m, вершина якого знаходиться на роздільні гіперповерхні класу ; операція складання за модулем два.

Оптимальною кодовою відстанню (радіусом) між вектором xm і контейнером називається екстремальне значення , яке визначає максимум інформаційного КФЕ

де {d} - послідовність збільшень радіуса контейнера .

Побудова оптимальної в інформаційному сенсі РГП у вигляді гіперсфери за МФСВ зводиться до оптимізації радіуса роздільної гіперсфери dm, яка відбувається за ітераційним алгоритмом

(2.3)

де k змінна числа збільшень радіуса РГП; h крок збільшення.

Процедура закінчується при знаходженні екстремального значення критерію

де множина радіусів концентрованих гіперсфер, центр яких визначається вершиною еталонного вектора , еталонний вектор найближчого (до ) класу .

2.2 Математична модель процесу навчання

Розглянемо математичну модель СК, яка реалізує класичну задачу розпізнавання образів за МФСВ. Математична модель повинна включати як обов'язкову складову частину вхідний математичний опис, який подамо на рівні системного аналізу у вигляді теоретико-множинної структури

де G простір вхідних сигналів (факторів); T множина моментів часу зняття інформації; ? простір ознак розпізнавання; Z - простір можливих станів; Y множина сигналів після первинної обробки інформації; П:GT?Z оператор переходів, що відбиває механізм зміни станів під дією внутрішніх і зовнішніх збурень; Ф:GT?ZY оператор оброблення зображення (формування вибіркової множини Y на вході СПР), який є реакцією на внутрішні і зовнішні збурення. Як універсум випробувань W розглядається декартовий добуток: W=GT?Z.

Для чіткого детермінованого розбиття потужності M, оператор побудови розбиття ? задає відображення ?:Y. Апріорно оператором будується покриття , яке визначає абетку класів розпізнавання і на якому на відміну від розбиття відношення еквівалентності відсутнє. Оператор ? переводить апостерірно розбиття в покриття і замикає комутативне кільце. Перевірка гіпотези про належність реалізацій образу здійснюється оператором класифікації

де множина допустимих гіпотез (рішень). При цьому гіпотеза означає відмову від класифікації. У загальному випадку математичну модель будь-якої ІСК, яка розв'язує задачу класифікаційного аналізу , подамо у вигляді діаграми відображень відповідних множин:

Рисунок 2.1 - Математична модель СК

Оператор зворотного зв'язку корегує геометричні параметри розбиття з метою поліпшення точнісних характеристик СПР. Саме спосіб реалізації оператора породжує різні методи та підходи до розв'язання проблеми адаптивного навчання ІСК.

При обґрунтуванні гіпотези нечіткої компактності має місце нечітке розбиття ?.

Тоді замість оператора застосуємо оператор ? нечіткої факторизації простору ознак: ?:Y. Нехай оператор класифікації :I|l| визначає перевірку основної статистичної гіпотези про належність реалізацій {| j=} класу , де l кількість статистичних гіпотез. Принциповою відмінністю МФСВ від відомих методів автоматичної класифікації є ітераційна оптимізація процесу навчання за інформаційним КФЕ.

Для обчислення КФЕ оператор ?: I|l||q| шляхом оцінки прийнятих гіпотез l формує множину ТХ |q|, де q=l2 - кількість ТХ, а оператор |q| E обчислює множину значень інформаційного КФЕ, який є функціоналом від ТХ. Ітераційний процес оптимізації геометричних параметрів розбиття реалізується оператором r: E шляхом пошуку максимуму КФЕ

де множина кроків навчання розпізнаванню реалізацій класу . Структурна діаграма процесу навчання за МФСВ для випадку нечіткого розбиття має вигляд:

Рисунок 2.2 - Процес навчання за МФСВ у випадку нечіткого розбиття

Таким чином, контур операторів

безпосередньо оптимізує геометричні параметри розбиття . Оператор U: EGT?Z регламентує процес навчання. Оскільки в цьому контурі також застосовано процедуру обчислення інформаційного критерію, то він дозволяє розв'язувати задачу оптимізації параметрів плану навчання, які визначають, наприклад, обсяг і тривалість випробовувань, потужність словника ОР, черговість подання для навчання класів розпізнавання та інше.

2.3 Оцінка функціональної ефективності

Задача вибору та обчислення КФЕ є центральною проблемою оцінки функціональної ефективності АСК, що навчається, для вирішення якої застосовуються два основні підходи: один з них базується на економічних показниках, а інший - на інформаційних. Подолання існуючої суперечності між цими підходами полягає у реалізації принципу підпорядкованості економічних показників функціонування системи інформаційним. Інформаційний підхід природно базується на використанні для оцінки функціональної ефективності інформаційного критерію. У рамках ІЕІ-технології знайшли широке застосування інформаційна міра Кульбака, яка дозволяє оцінювати диференційну інформативність ознак:

(2.4)

де - точнісні характеристики процесу навчання: перша та друга достовірності, помилки першого та другого роду відповідно, отримані на k-му кроці навчання. Тривимірну поверхню модифікованого критерію , побудовану за формулою (2.4), показано на рис. 2.3.

Рис. 2.3 Графік залежності критерію (2.4) від точнісних характеристик: першої та другої достовірностей

Як видно з рис. 2.3, функція (2.4) є взаємно-неоднозначною. На практиці цей недолік усувається шляхом введення робочої (допустимої) області визначення функції, в якій значеннями точнісних характеристик- першої та другої достовірностей, повинні бути більшими відповідних помилок першого та другого роду, тобто D1 ?0,5 та D2 ? 0,5. Робоча область на рис. 2.3 показано на відповідних графіках сірим кольором. Аналіз цих графіків показує, що при збільшенні у робочій області як першої, так і другої достовірностей кількість інформації теж збільшується, що знаходиться у відповідності з другим принципом адитивності інформації.

2.4 Базовий алгоритм навчання СПР за методом-функціонально-статистичних випробувань (МФСВ)

Призначенням базового алгоритму навчання LEARNING [8] є оптимізація геометричних параметрів контейнерів класів розпізнавання, які відновлюються на кожному кроці навчання в радіальному базисі. Вхідною інформацією для навчання за базовим алгоритмом у загальному випадку є дійсний масив реалізацій образу

система полів контрольних допусків і рівні селекції координат двійкових еталонних векторів-реалізацій образу, які за замовчанням дорівнюють 0,5 для всіх класів розпізнавання.

Розглянемо етапи реалізації алгоритму LEARNING:

1 Формування бінарної навчальної матриці , елементи якої дорівнюють

(4.1.1)

2 Формування масиву еталонних двійкових векторів

, елементи якого визначаються за правилом

(4.1.2)

де m рівень селекції координат вектора .

3 Розбиття множини еталонних векторів на пари найближчих «сусідів»:

=<xm , xl >

де xl еталонний вектор сусіднього класу , здійснюється за таким алгоритмом:

а) структурується множина еталонних векторів, починаючи з вектора x1 базового класу , який характеризує найбільшу функціональну ефективність СПР;

б) будується матриця кодових відстаней між еталонними векторами розмірності M M;

в) для кожного рядка матриці кодових відстаней знаходиться мінімальний елемент, який належить стовпчику вектора, найближчого до вектора, що визначає строку. За наявності декількох однакових мінімальних елементів вибирається з них будь-який, оскільки вони є рівноправними;

г) формується структурована множина елементів попарного розбиття

, яка задає план навчання.

4 Оптимізація кодової відстані dm відбувається за рекурентною процедурою (2.3.4). При цьому береться

5 Процедура закінчується при знаходженні максимуму КФЕ в робочій області його визначення:

де множина радіусів концентрованих гіперсфер, центр яких визначається вершиною

.

Таким чином, базовий алгоритм навчання є ітераційною процедурою пошуку глобального максимуму інформаційного КФЕ в робочій області визначення його функції

.

На рис. 1 наведено структурну схему базового алгоритму навчання LEARNING. Тут показано такі вхідні дані: {Y[J,I,K]} масив навчальних вибірок, змінна кількості випробувань, де NM мінімальний обсяг репрезентативної навчальної вибірки, I= змінна кількості ознак розпізнавання, K= змінна кількості класів розпізнавання; {NDK[I]}, {VDK[I]}масиви нижніх і верхніх контрольних допусків на ознаки відповідно. Результатом реалізації алгоритму є: {DOPT[K]}цілий масив оптимальних значень радіусів контейнерів класів розпізнавання у кодовій відстані Хеммінга; {EV[K]}масив еталонних двійкових векторів класів розпізнавання; {EM[K]}дійсний масив максимальних значень інформаційного КФЕ процесу навчання;

Рисунок 1 Структурна схема базового алгоритму навчання

{D1[K]}, {A[K]}, {B[K]}, {D2[K]} дійсні масиви оцінок екстремальних значень точнісних характеристик процесу навчання для відповідних класів розпізнавання: перша достовірність, помилки першого та другого роду і друга достовірність відповідно. Змінна D є робочою змінною кроків навчання, на яких послідовно збільшується значення радіуса контейнера.

У структурній схемі алгоритму (рис. 1) блок 3 формує масив навчальних двійкових вибірок {X[J,I,K]} шляхом порівняння значень елементів масиву {Y[J,I,K]} з відповідними контрольними допусками за правилом (2.4.1.1) і формує масив еталонних двійкових векторів {EV[K]} шляхом статистичного усереднення стовпців масиву {X[J,I,K]} за правилом (2.4.1.2) при відповідному рівні селекції, який за замовчуванням дорівнює

.

Блок 4 здійснює розбиття множини еталонних векторів на пари «найближчих сусідів». Блок 11 обчислює на кожному кроці навчання значення інформаційного КФЕ. При невиконанні умови блока порівняння 12 блок 13 оцінює належність поточного значення критерію робочій області визначення його функції і при позитивному рішенні блока 13 це значення запам'ятовуєься блоком 14. При негативному рішенні блока порівняння 15, в якому величина дорівнює кодовій відстані між парою сусідніх еталонних векторів, блок 16 здійснює у робочій області пошук глобального максимуму КФЕ - EM[K] і визначає для нього екстремальне значення радіуса гіперсфери - DOPT[K]. Аналогічно будуються оптимальні контейнери для інших класів. Якщо параметри навчання {DOPT[K]} і {EV[K]} є вхідними даними для екзамену, то значення КФЕ та екстремальних оцінок точнісних характеристик використовуються для аналізу ефективності процесу навчання.

Таким чином, основною процедурою базового алгоритму навчання за МФСВ є обчислення на кожному кроці навчання інформаційного КФЕ і організація пошуку його глобального максимуму в робочій області визначення функції критерію.

4.2 Критерії функціональної ефективності навчання СПР

4.2.1 Ентропійний КФЕ

Для оцінки функціональної ефективності СПР широко використовуються ентропійні нформаційні критерії. Наприклад, за Шенноном такий нормований критерій має вигляд

, (4.2.1.1)

де апріорна (безумовна) ентропія:

; (4.2.1.2)

апостеріорна умовна ентропія, яка характеризує залишкову невизначеність після прийняття рішень:

, (4.2.1.3)

де - апріорна ймовірність прийняття гіпотези l; p(m/l) - апостеріорна ймовірність появи події m за умови прийняття гіпотези ; М- число альтернативних гіпотез.

На практиці при оцінюванні функціональної ефективності СК, що навчається, можуть мати місце такі допущення:

· рішення є двоальтернативним (М=2);

· оскільки здатна навчатися СК слабо формалізованим процесом функціонує за умови невизначеності, то за принципом Бернуллі-Лапласа виправдано прийняття рівноймовірних гіпотез

.

Тоді критерій (4.2.1.1) з урахуванням виразів (4.2.1.2) і (4.2.1.3) набирає такий частинний вигляд:

. (4.2.1.4)

При двоальтернативному рішенні (M=2) за основну беремо гіпотезу 1 про знаходження значення ознаки розпізнавання, що контролюється, в полі допусків і як альтернативну їй гіпотезу 2. При цьому мають місце чотири можливих результати оцінки виміру ознаки (рис. 2), які характеризуються наступними ймовірностями - точнісними характеристиками: помилка першого роду - (рис. 2а); помилка другого роду - (рис. 2б); перша достовірність- (рис. 2в) і друга достовірність- (рис. 2г), де x, z виміряне та дійсне значення ознаки розпізнавання відповідно.

Розіб'ємо множину значень ознак на області та . Область включає значення, що знаходяться в допуску , а - не в допуску. Тоді можна записати

Рисунок 2 Можливі результати оцінки виміру ознак розпізнавання при М=2

Виразимо апостеріорні ймовірності через апріорні за формулою Байєса:

та, прийнявши p(1)=p(2)=0,5, отримаємо:

(4.2.1.5)

Після підстановки (4.2.1.5) в (4.2.1.4) отримаємо формулу для обчислення КФЕ за Шенноном:

(4.2.1.6)

Розглянемо обчислення модифікації ентропійного інформаційного КФЕ за Шенноном для двоальтернативного рішення при рівноймовірних гіпотезах згідно з формулою . Оскільки інформаційний критерій є функціоналом від точнісних характеристик, то при обмеженому обсязі навчальних вибірок слід користуватися їх оцінками

; ; , (4.2.3.1)

де , кількість подій, які означають відповідно належність та неналежність реалізацій образу контейнеру , якщо дійсно ; , кількість подій, які означають відповідно належність і неналежність реалізацій контейнеру , якщо вони насправді належать класу ; nmin мінімальний обсяг репрезентативної навчальної вибірки.

Після підстановки відповідних позначень (4.2.3.1) в (4.2.1.6), отримаємо робочу формулу для обчислення ентропійного КФЕ навчання СПР розпізнаванню реалізацій класу для двоальтернативного рішення і при рівноймовірних гіпотезах:

. (4.2.3.2)

Структурну схему алгоритму обчислення критерію (4.2.3.2) за паралельним способом оброблення навчальної матриці в процесі побудови у радіальному базисі оптимального контейнера класу подано на рис. 3. Тут наведено такі вхідні дані: Х1, Х2 еталонні двійкові вектори класів і відповідно; - навчальна матриця, яка складається з реалізацій цих класів; N=, де NM обсяг репрезентативної навчальної вибірки; D - радіус контейнера класу . Вихідні дані: Е - значення КФЕ; А, В, D1, D2 значення точнісних характеристик процессу навчання СПР: помилки першого і другого родів, перша і друга достовірності відповідно. За схемою, що розглядається, блок 5 обчислює при кожному випробуванні кодову відстань D(N) шляхом складання за модулем два вектора Х1 з поточним вектором-реалізацією X(N) і підрахунку кількості одиниць в одержаній сумі.

Рисунок 3 - Структурна схема обчислення інформаційного КФЕ

При кожному непарному випробуванні визначається відстань D(N) між вектором Х1 і реалізацією свого класу, а на кожному парному між вектором Х1 і реалізацією іншого класу. Обчислення коефіцієнтів К1, К2, К3 і К4 здійснюється за таким алгоритмом (блоки 6 - 12):

а) порівняння (блок 6): якщо D(N) D (реалізація належить області класу ), то при непарному випробуванні обчислюється К1:=К1+1 (своя реалізація), а при парному К3:=К3+1 (чужа реалізація). Визначення парності або непарності реалізацій здійснюють блоки 7 і 8, які перевіряють виконання умови N/2=F, де F - ціле число. Якщо умова виконується, то випробування парне, інакше непарне. Якщо D(N)>D (реалізація не належить області класу ), то при непарному випробуванні обчислюється коефіцієнт К2:=К2+1 (своя реалізація), а при парному - К4:=К4+1 (чужа реалізація);

б) порівняння (блок 13): якщо N=NM , то обчислюються оцінки точнісних характеристик за (4.2.3.1), інакше обробляється наступна реалізація;

в) при виконанні умови блока 15: (D1>0,5 і D2>0,5) обчислюється інформаційний критерій, наприклад, за формулою (4.2.1.6), інакше видається повідомлення «КФЕ не визначено».

Знання точнісних характеристик процесу навчання дозволяє визначати робочу область значень КФЕ. Виходячи із вимоги практичної цінності рішень, які приймаються СПР, на робочу область визначення функції інформаційного КФЕ необхідно вводити обмеження знизу. Так, для двоальтернативного рішення такими обмеженнями є: D1>0,5 і D2>0,5, тобто значення першої та другої достовірностей у робочій області не можуть бути менше значень відповідних помилок.

Після відповідної підстановки (4.2.3.1) у (4.2.2.1) отримаємо робочу формулу для обчислення міри Кульбака:

, (4.2.3.3)

де r число цифр у мантисі значення критерію .

Зрозуміло, що залежно від величини числа r будуть змінюватися значення критерію (4.2.3.3), але це не впливає на положення глобального максимуму в робочій області визначення їх функцій.

Алгоритм послідовної оптимізації системи контрольних допусків. Оскільки контрольні допуски на значення ознак розпізнавання прямо впливають на геометричні параметри контейнерів класів розпізнавання, а отже і на асимптотичні точні сні характеристики СПР, то питання вибору СКД набуває важливого значення при розробці інформаційного забезпечення ІСУ. Якщо задача визначення системи нормованих (експлуатаційних) допусків на значення ознак знайшла свій розв'язок в рамках параметричного підходу математичної статистики то аналітичне розв'язання проблеми вибору СКД, дослідження її впливу на функціональну ефективність ІСУ і достовірність результатів контролю все ще не отримано.

Задача оптимізації СКД на ознаки розпізнавання є частковою задачею інформаційного синтезу, в якій необхідно визначити екстремальні значення

де - область допустимих значень контрольних допусків. Згідно з діаграмою відображень множин, в процесі навчання оптимізація СКД здійснюється за ітераційною процедурою, в якій задіяно оператори контура .

Розглянемо такі алгоритми оптимізації СКД:

· послідовний алгоритм, при якому контрольні допуски оптімізуються послідовно для кожної ознаки розпізнавання при фіксованих значеннях інших ознак;

· паралельний алгоритм, при якому контрольні допуски оптимізуються для всіх ознак одночасно;

· алгоритм оптимізації за зведеним полем допусків.

Розглянемо схему алгоритму LEARNING-1, призначеного для послідовної оптимізації контрольних допусків на ознаки розпізнавання за процедурою . Вхідні дані: масив реалізацій образу ; стартова СКД і система нормованих допусків (СНД) , яка визначає область значень відповідних контрольних допусків. Стартовий параметр поля контрольних допусків може дорівнювати половині відповідного симетричного поля нормованих допусків для і-ї ознаки за умови випадковості її значень. Попередньо для кожної ознаки визначається ціна градації , на яку змінюється і-та ознака.

Схема алгоритму послідовної оптимізації контрольних допусків така:

1. Обнуління лічильника прогонів процедури оптимізації параметрів навчання: l:=0.

2. Для стартової системи допусків обчислюється за базовим алгоритмом навчання LEARNING значення функції .

3. Формування лічильника прогонів: l: l+1.

4. Обнуління лічильника ознак розпізнавання: і:=0.

5. Формування лічильника ознак розпізнавання: і: і+1.

6. Визначення екстремального значення параметра за процедурою , в якій внутрішній цикл оптимізації реалізує алгоритм LEARNING.

7. .

8. Якщо , то виконується пункт 5, інакше пункт 9.

9. Якщо , де - будь-яке мале позитивне число, то виконується пункт 10, інакше пункт 3.

10. і «Зупин».

Приклад реалізації алгоритму послідовної оптимізації ознак розпізнавання буде наведено в шостому розділі.

Паралельний алгоритм LEARNING-2 оптимізує параметри контейнерів класів розпізнавання за умови ітераційної процедури визначення для базового класу оптимальних контрольних допусків на всі ознаки одночасно. Вхідні дані такі самі як і для алгоритму LEARNING-1, але за область визначення параметра приймається інтервал , де ширина нормованого поля допусків. Розглянемо кроки реалізації цього алгоритму:

1. Обнулюється лічильник кроків зміни параметра : l:=0.

2. Запускається лічильник: l:=l+1 і обчислюються нижні та верхні контрольні допуски для всіх ознак: і , відповідно.

3. Реалізується базовий алгоритм навчання.

4. Якщо , то виконується пункт 5, інакше пункт 6.

5. Якщо , то виконується пункт 2, інакше пункт 6.

6. і «ЗУПИН».

4.3 Алгоритм екзамену за МФСВ

На рис. 4 показано структурну схему алгоритму екзамену для нечіткого розбиття простору ознак розпізнавання, яке має місце у загальному випадку. Алгоритм має такі вхідні дані: масив еталонних двійкових векторів: змінна числа класів розпізнавання; цілий масив оптимальних радіусів контейнерів класів розпізнавання у кодовій відстані Хеммінга; двійкова реалізація образу, що розпізнається.

Рисунок 4- Структурна схема алгоритму екзамену:

Виходом алгоритму є повідомлення про належність реалізації, що розпізнається, деякому класу із сформованого на етапі навчання алфавіту класів . На рис.4 блок 5 обчислює, починаючи з базового класу, кодову відстань між поточним еталонним вектором і реалізацією ХР. Блок 6 для кожного класу обчислює значення функції належності , яка для гіперсферичного класифікатора має вигляд

(4.3.1)

Після виходу із циклу блок 8 визначає клас, до якого належить реалізація ХР за максимальним значенням функції належності (4.3.1).

СПИСОК ЛІТЕРАТУРИ

1. Рідкокаша А.А., Голдер К.К. Основи систем штучного інтелекту: Навчальний посібник - Черкаси: Відлуння Плюс, 2002 240 с.

2. А.С. Краснопоясовський Інформаційний синтез інтелектуальних систем керування, що навчаються // Видавництво СумДУ Суми - 2003.

3. Краснопоясовський А. С. Інформаційний синтез інтелектуальних систем контролю та управління, що навчаються //Матеріали Міжнародної конференції з управління “Автоматика 2002”. 1620 вересня 2002 р., м.Донецьк, Україна: У 2-х т. Донецьк, 2002. Т. 2.С. 124 126.

4. Краснопоясовский А. С., Успаленко В. И., Козуб В.Н., Михаленко С. Н. Разработка информационного и программного обеспечения обучающихся бортовых автоматизированных систем контроля самолетов серии АН // Авиационно-космическая техника и технология: Труды Харьковского авиационного института им. Н. Е. Жуковского. Харьков, 1994, - С. 210 - 215.

5. Краснопоясовський А. С., Черниш А. В. Алгоритм навчання системи розпізнавання за методом функціонально - статистичних випробувань // Вісник Сумського державного університету, 1998. - № 1. - С. 89 - 94

6. Краснопоясовський А. С. Інформаційний синтез системи підтримки прийняття рішень, що навчається // Труды Одес. политехн. ун-та, 2001.Вып.4 (16).С. 8286

7. Краснопоясовський А. С., Скаковська А. М. Оптимізація параметрів нормалізації образу при класифікаційному настроюванні електронного мікроскопа // Автоматизированные системы управления и приборы автоматики. 2003. Вып. 123. С. 62 - 66

8. Краснопоясовський А. С., Марченко В. В. Оцінка фокусності зображення для растрового електронного мікроскопа // Вісник Сумського державного університету.1999.№2.С. 112-114

9. Краснопоясовський А. С. Оптимізація контейнерів класів розпізнавання за методом функціонально-статистичних випробувань //Автоматизированные системы управления и приборы автоматики, 2002. Вып. 119. С. 6976

10. ГОСТ 12.2.032 - 78 ССБТ

11. СНиП 2.09.02 - 85

12. СНиП 2.09.04 - 87 Административные и бытовые здания и сооружения.

13. СНиП 2.01.02 - 85 Противопожарные нормы.

14. СНиП 2.05.02 - 89

15. СН 912 - 78

16. ГОСТ 12.1.005 - 88 ССБТ. Общие и санитарно - гигиенические требования к воздуху рабочей зоны.

17. СНиП 2.04.05 - 91 Отопление, вентиляция и кондиционирование.

18. ГОСТ 12.1.003 - 83 ССБТ. Шум. Общие требования безопасности.

19. СН 3223 - 85

20. ГР 2411 - 81

21. ГОСТ 12.1.029 - 80 ССБТ. Средства и методы защиты от шума. Классификация.

22. ГОСТ 12.2.007 - 75 ССБТ.

23. ГОСТ 25.851 - 85 ССБТ.

24. ГНАТО 0.00. - 1.21.98

25. СНиП II-4-79. Естественное и искусственное освещение.

26. Правила побудови електроустановок, затверджені в 1984 р.

27. Правила безпечної експлуатації електроустановок споживачів.

28. ДсанПин 3.3.2 - 007 - 98

29. СН 40.88 - 86

30. Русак О.Н. Справочная книга по охране труда в машиностроении - Л.: Машиностроение, 1984.

31. Денисенко Г.Ф. Охрана труда - М.: Высшая школа, 1985.

32. Долин П. А. Справочник по технике безопасности. - М.: Энергоиздат, 1984.

33. Белов С.В. Средства защиты в машиностроении. - М.: Машиностроение.


Подобные документы

  • Розробка схем розпізнавання бінарних та напівтонових зображень, електро-функціонального блоку керування, аналізатора симетричності та алгоритму блока первинного центрування з метою оптимізації пристрою керування для системи ідентифікації зображень.

    курсовая работа [1,0 M], добавлен 19.01.2010

  • Принцип роботи радіомаяка VOR-4000. Схема розміщення апаратури радіомаяка. Основні технічні характеристики радіомаяка VOR-4000: точність вимірювання азимута; частота модуляції та сигналу розпізнавання. Функціональна схема одного комплекту радіомаяка.

    реферат [188,1 K], добавлен 26.02.2011

  • Характеристика устаткування підприємств м’ясної промисловості. Функціональна схема електроприводу куттера. Розробка структурної, математичної схеми мікропроцесорної САУ, її алгоритму функціонування. Дослідження якості перехідних процесів й точності МПСАУ.

    курсовая работа [1,2 M], добавлен 12.05.2014

  • Математичний опис лінійних неперервних систем автоматичного керування (САК). Інерційні й не інерційні САК, їх часові та частотні характеристики. Елементарні ланки та їх характеристики. Перетворення схеми математичної моделі САК до стандартного вигляду.

    курсовая работа [444,8 K], добавлен 10.04.2013

  • Методи машинного навчання систем керування. Інформаційне забезпечення інтелектуальної системи автофокусування електронного мікроскопа. Реалізація алгоритму самонастроювання з оптимізацією контрольних допусків. Перевірка даних на електронограмі алюмінію.

    дипломная работа [2,4 M], добавлен 17.11.2011

  • Дослідження потенційних можливостей м’якого декодування завадостійких кодів. Аналіз алгоритму ітеративного декодування турбокодів. Розробка програмної моделі системи передавання з турбокодуванням та оцінка достовірності результатів моделювання.

    дипломная работа [553,5 K], добавлен 19.05.2011

  • Варіанти організації доступу абонентів до послуг інтелектуальної мережі IN каналами базової телефонної мережі через вузли комутації послуг – SSP. Оптимальний вибір рівня розміщення та кількості SSP. Основні критерії вибору точки та способу доступу.

    контрольная работа [217,6 K], добавлен 16.01.2011

  • Система реєстрації даних як високопродуктивний обчислювач з процесором або контролером, накопичувачем інформації й інтерфейсом зв'язку. Розробка функціональної схеми й вибір елементної бази. Аналіз принципової електричної схеми. Економічні розрахунки.

    дипломная работа [694,4 K], добавлен 20.02.2011

  • Методика розрахунку кільцевої форми осердя з прямокутною петлею гістерезису при імпульсному діянні. Розроблення програми на базі математичної моделі розрахунку для розрахунку геометричних параметрів осердя та побудови графічної моделі петлі гістерезису.

    курсовая работа [1,6 M], добавлен 07.02.2010

  • Технічне обґрунтування варіанту реалізації системи. Розробка структурної та електричної принципової схеми інформаційно-вимірювальної системи тиску газу в газопроводі. Головні вимоги до тензоперетворювачів. Форми вихідного сигналу для TMP03/TMP04.

    курсовая работа [717,2 K], добавлен 05.12.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.