Моделі та алгоритми визначення ефективних робастних методів при синтезі функціональних задач АСУ
Розробка системи імітаційного моделювання для статистичних іспитів робастних методів. Алгоритм визначення кількісних характеристик "забруднення" вибірки даних. Визначення найбільш ефективного методу побудови статистичних моделей процесів чи об'єктів.
Рубрика | Коммуникации, связь, цифровые приборы и радиоэлектроника |
Вид | автореферат |
Язык | украинский |
Дата добавления | 07.01.2014 |
Размер файла | 80,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Харківський державний технічний університет радіоелектроніки
Автореферат дисертації
на здобуття наукового ступеня кандидата технічних наук
Моделі та алгоритми визначення ефективних робастних методів при синтезі функціональних задач АСУ
Антонов Владислав Олександрович
УДК 681.518:681.5
05.13.06 - автоматизовані системи управління та
прогресивні інформаційні технології
Харків 2000
Дисертацією є рукопис
Робота виконана у Харківському державному технічному університеті радіоелектроніки, Міністерства освіти і науки України.
Науковий керівник - кандидат технічних наук, доцент
Шамша Борис Володимирович, Харківський державний технічний університет
радіоелектроніки, професор кафедри
інформаційних управляючих систем
Офіційні опоненти:
- доктор технічних наук, професор Годлевський Михайло Дмитрович, Харківський державний політехнічний університет, завідувач кафедри автоматизованих систем управління;
- кандидат технічних наук, професор Євсєєв Віктор Володимирович, Харківський державний технічний університет радіоелектроніки, професор кафедри системотехніки
Провідна установа:
- Національний авіаційний університет, кафедра комп'ютерно- інтегрованих комплексів, Міністерство освіти і науки України, м. Київ.
Захист відбудеться “14 ” грудня 2000 р. о 13.00 годині на засіданні спеціалізованої вченої ради Д 64.052.01 у Харківському державному технічному університеті радіоелектроніки за адресою: 61166, м. Харків, пр. Леніна, 14, тел: (0572) 40-94-51.
З дисертацією можна ознайомитись у бібліотеці Харківського державного технічного університету радіоелектроніки за адресою: 61166, м. Харків, пр. Леніна, 14.
Автореферат розісланий “ 2 ” листопада 2000 р.
Вчений секретар спеціалізованої вченої ради В.І. Саєнко
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. Сучасне виробництво характеризується наявністю великої кількості інформації, що спричиняє збільшення кількості службовців, зайнятих її обробкою. У цих умовах застосування сучасних автоматизованих систем управління (АСУ) стає важливим чинником у підвищенні ефективності суспільного виробництва усіх видів продукції та послуг для поліпшення соціально-економічних умов життя населення.
Ефективність функціонування АСУ значною мірою залежить від досконалості розробки математичного забезпечення (МЗ), а саме від досконалості безпосередньо методів розв'язання функціональних задач та досконалості засобів вибору тих із них, що забезпечать одержання максимально ефективного результату.
Теорія та практика розробки математичного і програмного забезпечення АСУ показує, що найбільш перспективний шлях розвитку - це автоматизація проектування прикладного МЗ. Питанням розробки елементів МЗ приділяється увага у роботах таких відомих вчених як В.М.Глушков, Б.Я.Совєтов, А.А.Павлов, В.М.Левикін, Е.Г.Петров, В.Л.Волкович, В.С.Михалевич.
В організаційно-економічних АСУ під час розв'язання задач техніко-економічного і календарного планування, оперативного керування, прогнозування тощо досить широко застосовуються моделі оптимізаційних задач. В умовах нестабільної ринкової економіки процес функціонування підприємств має стохастичний характер, обумовлений впливом різних - як постійних, так і одиничних, як правило, взаємозалежних випадкових зовнішніх чинників. Тому виникає необхідність у побудові статистичних моделей оптимізаційних задач, що являють собою сукупність регресійних рівнянь і ряду обмежень. Регресійні моделі будуються на підставі реалізацій випадкових процесів, накопичених за попередні періоди функціонування підприємств, із використанням методів математичної статистики, зокрема, регресійного аналізу (РА). Як відомо, результати, отримані методами РА, вважають достовірними, якщо дотримуються усі припущення його використання, одне з яких - залишки моделі регресії повинні мати нормальний закон розподілу. При його порушенні оцінки параметрів моделі регресії залишаються становищними і незміщеними, але втрачають в ефективності. Основною причиною порушення вимоги нормальності є наявність "забруднення" у вихідних даних і обмеженість вибірки.
Як правило, реалізації випадкових процесів, на підставі яких будуються регресійні моделі, є багатомірними, мають обмежену довжину та містять різні за розміром викиди (10-35% від середнього значення), обумовлені впливом одиничних малоймовірних чинників. При аналізі та обробці таких вибірок вихідних даних методом РА одержувана модель може втратити до 20% ефективності, що спричинить зниження ефективності всієї АСУ. Тому для побудови статистичних математичних моделей при порушенні припущень про нормальність залишків використовують робастні методи. Завдяки цьому розробка методів оцінювання в регресійних задачах, що призводять до підвищення ефективності оцінок в умовах порушення припущень про нормальність залишків, є досить актуальною задачею.
У зв'язку з великим розмаїттям робастних методів та їх модифікацій, що мають специфічні властивості, вибір того чи іншого методу в залежності від статистичних властивостей вихідної інформації являє собою досить складну та мало вивчену науково-дослідну задачу. Так, вибір неефективного методу може звести на нівець всю перевагу, обумовлену переходом від РА до класу робастних методів. Тому необхідно оцінити ефективність і припустимі області використання відомих робастних методів.
У зв'язку з цим формалізація підходу до автоматизованого визначення на інженерному рівні ефективного робастного методу безумовно є дуже актуальною задачею, що розв'язується в рамках МЗ АСУ, як задача вибору оптимального методу або алгоритму розв'язання функціональних задач АСУ.
Зв'язок роботи з науковими програмами, планами, темами. Робота виконувалась згідно з планом науково-дослідних робіт Харківського державного технічного університету радіоелектроніки в рамках держбюджетних тем: № 010 “Розробка методології, методів і засобів проектування розподілених систем керування з необхідними параметрами” (№ДР 0197U012133) і №108 “Розробка методології, методів і засобів проектування основних компонент інформаційних технологій типової розподіленої логістичної інформаційно-керуючої системи” (діє з 2000р.), на яких автор працював як виконавець.
Мета і задачі дослідження. Метою дисертаційної роботи є розробка елементів математичного забезпечення АСУ, що реалізують вибір на інженерному рівні ефективного робастного методу для синтезу найбільш адекватних математичних моделей процесів та об'єктів, на які впливають різноманітні випадкові зовнішні чинники, та базуються на математичних моделях залежностей ефективності робастних методів від статистичних властивостей вихідної інформації.
Для досягнення поставленої мети необхідно вирішити такі задачі дослідження:
- обгрунтувати необхідність застосування робастних методів у МЗ АСУ при побудові статистичних моделей оптимізаційних задач в умовах “забрудненості” вихідних даних, як методів, що дозволяють одержувати більш адекватні моделі процесу керування і, отже, підвищити ефективність АСУ;
- розробити систему імітаційного моделювання для cтатистичних іспитів робастних методів і провести з її допомогою серію експериментів;
- розробити алгоритм визначення кількісних характеристик "забруднення" вибірки вихідних даних;
- розробити математичні моделі визначення характеристик ефективності робастних методів у залежності від статистичних властивостей вихідних даних;
- удосконалити однокроковий робастний метод, що дозволить будувати адекватні моделі процесів, реалізації яких містять велику кількість викидів різної структури і розмірів;
- розробити алгоритм визначення на інженерному рівні найбільш ефективного методу побудови статистичних математичних моделей процесів чи об'єктів, на які впливають різноманітні за величиною випадкові зовнішні чинники.
Об'єктом дослідження є стохастичні процеси, які описуються лінійними за параметрами математичними моделями та на які впливають різноманітні за величиною випадкові зовнішні чинники.
Предметом дослідження є математичні моделі залежностей показників ефективності робастних методів від властивостей вихідної інформації з об'єкта чи процесу, на який впливають різноманітні за величиною випадкові зовнішні чинники.
Методи дослідження. Для оцінки якісних показників робастних методів застосовувалися методи імітаційного моделювання. Для апроксимації нелінійних залежностей якісних показників робастних методів від статистичних властивостей вихідних даних використовувався апарат штучних нейронних мереж прямого розповсюдження.
Наукова новизна одержаних результатів. У ході вирішення поставлених задач були отримані наступні результати:
- вперше формалізовано підхід до автоматизованого визначення найбільш ефективного робастного методу в залежності від статистичних характеристик вихідних даних, який дозволяє з використанням обраного методу побудувати найбільш адекватну модель процесу керування, що, в свою чергу, дозволяє підвищити ефективність АСУ;
- вперше отримані математичні моделі залежностей ефективності робастних методів від статистичних характеристик вихідних даних, що дозволяють кількісно порівняти адекватність моделей процесу керування, які можна отримати з використанням досліджуваних робастних методів для конкретної реалізації вихідних даних, і, тим самим, дозволяють вибрати найбільш ефективний робастний метод, що в підсумку підвищить ефективність АСУ;
- удосконалено однокроковий робастний метод максимальної правдоподібності, заснований на залишках Пірсона, у частині схеми зважування, що дозволяє будувати адекватні моделі процесів, реалізації яких містять велику кількість викидів різної структури і розмірів.
Практичне значення одержаних результатів. Запропоновані в дисертаційній роботі моделі та алгоритми визначення на інженерному рівні ефективних робастних методів, реалізовані у вигляді програмного комплексу, знайшли досить широке застосування в МЗ АСУ при побудові найбільш адекватних статистичних математичних моделей для розв'язання функціональних задач короткострокового техніко-економічного планування підприємством. Удосконалений однокроковий робастний метод забезпечив побудову адекватних математичних моделей в умовах високої "забрудненості" вихідних даних за рахунок зменшення дисперсії оцінок параметрів моделей. Розроблена система імітаційного моделювання дозволяє генерувати вибірки даних, ступінь і структуру “забруднення” яких можна змінювати у досить широких межах, що дозволяє моделювати та прогнозувати поведінку широкого класу стохастичних процесів.
Наукові результати, отримані в ході виконання даної дисертаційної роботи, знайшли своє практичне застосування в науково-дослідному інституті НДПІАСУ ТРАНСГАЗ при розробці та впровадженні автоматизованих систем керування транспортуванням газу на території України, а також на ДП “Завод імені Малишева” при розвитку та впровадженні автоматизованих комплексів розв'язання функціональних задач техніко-економічного планування АСУП, що засвідчено відповідними актами про впровадження №12 від 15.04.2000 та №48 від 5.05.2000.
Особистий внесок кандидата. У роботі [1] автором запропоновано концепцію інтелектуальної системи обробки даних, що входить складовою частиною в МЗ АСУ і дозволяє на інженерному рівні вибрати найефективніший метод побудови математичних моделей. У роботі [2] наводяться результати оцінки ефективності ряду робастних методів, на підставі чого пропонується формальна процедура вибору найбільш ефективного методу. У роботах [3, 6] запропоновано використовувати апарат штучних нейронних мереж для апроксимації нелінійних залежностей. У роботі [4] запропонована методика розробки модифікованих робастних методів і запропонована модифікація методу, що забезпечила повну його ефективність і стійкість до викидів у незалежних змінних. У роботі [5] автором запропоновано модификацію онлайнового алгоритму побудови моделей для випадку слабкої "забрудненості" даних. Усі результати, що виносяться на захист, отримані автором особисто.
Апробація результатів дисертації. Основні результати дисертації доповідалися та обговорювалися на 6-й міжнародній науково-технічній конференції ”Інформаційні технології: наука, техніка, технологія, утворення, здоров'я” (Харків, 1998); 3-му та 4-му Міжнародних молодіжних форумах “Радіоелектроніка та молодь у XXI столітті” (Харків, 1999 та 2000); 5-й міжнародній конференції “Теорія і техніка передачі, прийому й обробки інформації” (Туапсе, 1999); 6-й Українській конференції автоматичного керування “Автоматика - 99” (Харків, 1999).
Публікації. Матеріали дисертації опубліковано в 8 наукових працях (6 статтях, 4 із них надруковано у виданнях, перелік яких затверджено ВАК України, і 2 тезах доповідей на наукових конференціях).
Структура дисертації. Дисертація складається зі вступу, п'ятьох розділів, висновків і додатків. Повний обсяг дисертації становить 205 сторінок, у тому числі 8 додатків на 55 сторінках, 2 рисунки, 5 таблиць, список використаних літературних джерел з 123 найменувань на 9 сторінках.
ОСНОВНИЙ ЗМІСТ РОБОТИ
імітаційний моделювання робастний
У першому розділі дисертаційної роботи проведено аналіз функціональних задач, що розв'язуються у підсистемах АСУ, який виявив необхідність застосування статистичних методів обробки інформації, зокрема методу регресійного аналізу (РА). Було виявлено причини, що призводять до порушення вимог нормальності залишків регресії, і показано, що на практиці, в умовах нестабільної економіки, це явище зустрічається доволі часто. В результаті було обгрунтувано умови переходу до робастних методів оцінювання та проведено їх аналіз. Аналіз показав розмаїття їх специфічних особливостей, які спричиняють труднощі, пов'язані з вибором найбільш ефективного методу для побудови статистичних математичних моделей в АСУ, і дозволив виділити перелік методів, що досліджувались. Показано, що застосування неефективного робастного методу може звести нанівець усю потенційну перевагу, що виникає при переході від РА до цього класу методів. Завдяки нелінійному характеру робастних методів досить важко дослідити їх аналітично. Тому було запропоновано використати для цього метод імітаційного моделювання. Додаткові труднощі при дослідженні робастних методів викликає відсутність формальної процедури визначення ступеня і структури "забрудненості" вибірки вихідних даних.
У роботі розглядається клас квазістаціонарних об'єктів і процесів, що підлягають впливу різноманітних випадкових зовнішніх чинників та описуються лінійними за параметрами математичними моделями із симетричним законом розподілу помилок. Виділено перелік досліджуваних робастних методів: метод найменших модулів (LAD); метод найменших квадратів медіан (LMS); метод найменших усічених квадратів (LTS); метод зважених найменших квадратів (RLS); метод функціональних найменших квадратів (FLS); S-оцінка; ММ-оцінка; однокрокова GM-оцінка (S1S).
На підставі проведеного аналізу, виявлених труднощів і відповідно до мети даної дисертаційної роботи були поставлені вищезазначені задачі дослідження.
У другому розділі дисертаційної роботи була розроблена система імітаційного моделювання для проведення статистичних іспитів методів робастного оцінювіння, що дозволяє досліджувати їх якісні показники в залежності від статистичних властивостей вибірки вихідних даних. Метою імітаційного моделювання є побудова статистичних залежностей сукупності показників якості від множини параметрів вихідних даних для кожного з досліджуваних робастних методів. Для одержання вказаних залежностей необхідно провести серію машинних експериментів, у яких незалежними змінними є , а залежними - кожний із .
Як критерії оцінки якісних показників робастних методів було запропоновано відносні критерії у вигляді
, (1)
, (2)
де - оцінки параметрів моделі регресії, отримані з використанням МНК;
- оцінки параметрів моделі регресії, отримані за допомогою робастного методу;
- дійсні значення параметрів регресійної моделі;
p - кількість незалежних змінних у вибірці вихідних даних.
Було показано, що критерій (2) краще використовувати у випадку великої "забрудненості" вибірок вихідних даних, а критерій (1) - у випадку малої їх "забрудненості".
Було визначено основні параметри вибірки вихідних даних kj, що впливають на ефективність робастних методів,: k1=n - довжина вибірки вихідних даних; k2=p- кількість незалежних змінних у вихідних даних; k3= - ступінь "забруднення" незалежних змінних точками негативного високого впливу; k4= - ступінь "забрудненості" змішаного закону розподілу помилок моделі регресії; k5= - співвідношення масштабів "забруднюючого" та основного розподілів змішаного розподілу помилок моделі. Ці параметри визначають розмірність вибірки вихідних даних (k1, k2) та характеристики її "забрудненості", а саме - "вагу" і довжину "хвостів" симетричного розподілу помилок регресійної моделі (k4, k5) та кількість викидів у незалежних змінних (k3).
Відповідно до наведених параметрів, як модель розподілу помилок регресії з "важкими" хвостами було обрано модель змішаного нормального розподілу у наступному вигляді:
, (3)
де N(0,1) - стандартний нормальний закон розподілу;
=(з/о)1 - відношення масштабів “забруднюючого” та основного розподілів;
- ступінь "забруднення" розподілу.
Також запропоновано модель для генерації викидів у незалежних змінних.
Для дослідження якісних показників робастних методів було використано методи оптимального планування активного експерименту, а саме - повний факторний експеримент.
На підставі викладеного раніше було розроблено систему імітаційного моделювання, що дозволяє моделювати вибірки вихідних даних із заданими ступенем і структурою "забрудненості", законами розподілу та структурою об'єкту, що модулюється. Крім цього, було визначено кількість і значення рівнів домінуючих чинників імітаційного експерименту, що дозволило одержати найбільш інформативні залежності Lm(kj) для досліджуваних методів.
Для можливості практичного використання результатів модельного експерименту необхідно мати можливість обчислювати значення параметрів, що впливають, множини для конкретної вибірки даних. Як було відзначено раніше, на даний момент не існує формальних процедур оцінки ступеня та структури "забрудненості" вибірок даних.
У третьому розділі дисертаційної роботи було розроблено алгоритм кількісної оцінки "забрудненості" вихідних даних, що дозволяє визначати параметри kj для реальної вибірки вихідних даних.
Значення параметрів k1, k2 визначаються безпосередньо з вихідних даних.
Для виявлення викидів у незалежних змінних, якщо вони мають випадковий характер, було запропоновано використовувати міру у вигляді
(4)
де T(X) - робастна оцінка положення;
C(X) - матриця розкиду, що є робастною оцінкою коваріаційної матриці;
RDГ - граничне значення міри;
p - кількість незалежних змінних, що відповідає ступеням свободи -розподілу.
Ця міра - робастна відстань - є робастним аналогом відстані Махалонобіса, квадрат якої має -розподіл, що визначає її граничне значення. Тому викидом будемо вважати точку, для якої значення RDi буде більше граничного RDГ.
Для обчислення робастних оцінок положення і коваріаційної матриці найчастіше використовують метод мінімального об'єму еліпсоїда (MVE) або метод мінімального визначника коваріаційної матриці (MCD), що мають 50% порогову точку. Якщо виконується умова n*p<600, то доцільно використовувати перший, а якщо ні - другий. Для підвищення ефективності цих методів було запропоновано використовувати зважені оцінки положення і коваріаційної матриці у такому вигляді:
(5)
(6)
де .
Вирази (5), (6) використовуються при обчисленні робастної відстані (4).
Для визначення параметра необхідно мати вибірку стандартизованих залишків регресійної моделі, що дозволить виявити викиди у вибірці залежної змінної вихідних даних. Для цього необхідно обчислити початкове наближення параметрів регресії і масштабу її залишків робастними методами з максимальною пороговою точкою, наприклад LTS і Qn, відповідно. З властивостей нормального закону розподілу як граничне значення стандартизованих залишків регресії , що визначає викид, приймемо 2.5. Далі визначаємо значення параметра , що являє собою відсоток точок негативного високого впливу у вихідній вибірці, з виразу
(7)
За умови адекватності моделі, вибірка залишків регресії, обчислених без точок негативного високого впливу, відображає властивості вибірки помилок регресії e. Обчислювати її доцільно за допомогою М-оцінок. У випадку детермінованого характеру незалежних змінних для визначення властивостей вибірки помилок регресії e можна використати стандартизованi значення вихідної змінної.
Для оцінки належності вибірки вихідних даних до класу об'єктів, що розглядяється, було запропоновано статистичний критерій перевірки симетричності розподілу вибірки залишків регресії, що не залежить від виду її закону розподілу.
Маючи вибірку залишків регресії, що відображає властивості вибірки її помилок, можна визначити параметри та . Використовуючи розроблену імітаційну модель, було проведено імітаційний експеримент, у якому моделювалися вибірки з законом розподілу (3) та обчислювався ряд їх статистичних характеристик. Використовуючи значення відповідних коефіцієнтів кореляції, було визначено найбільш інформативні з них
J1=P(|ei|>2.5), J2=P(|ei|>2.5), , J4=max(|ei- ej |;ij)/, (8)
де , - оцінка середньоквадратичного відхилення вибірки {ei} та її робастного масштабу, відповідно.
За допомогою апарата штучних нейронних мереж прямого розповсюдження (ШНМПР), що використовувався в режимі навчання, було побудовано математичні моделі залежностей параметрів і від вищевказаних статистичних характеристик вибірки в наступному вигляді
, (9)
, (10)
де wji , vi - числові коефіцієнти, що відповідають синапсичним вагам ШНМПР;
=(Jj-min(Jj))/( max(Jj)-min(Jj)) - нормовані значення характеристик закону розподілу.
Для коректного використання одержаних моделей необхідно, щоб обчислені значення характеристик (8) закону розподілу належали відповідним діапазонам J1[0.01;0.063], J2[0.07;0.313], J3[0.8936;9.5951], J4[5.2534;91.6667].
Таким чином, відповідно до вище вказаного, було запропоновано алгоритм визначення у кількісному вигляді ступеня і структури "забрудненості" вибірки вихідних даних.
У четвертому розділі за допомогою розробленої системи імітаційного моделювання було проведено експеримент, що дозволив визначити приблизні області використання досліджуваних робастних методів. Експеримент виявив недостатню ефективність досліджуваних методів у присутності точок негативного високого впливу. Тому було запропоновано удосконалити метод робастного оцінювання, заснований на залишках Пірсона - (x)=f*(x)/m*(x)-1 де , - відповідно, оцінка щільності та згладжена щільність моделі з ядром k(x;t;h) та параметром, що згладжує, h.
Оцінки параметрів регресії визначаються як розв'язання рівняння
, (11)
де - похідна по логарифму моделі щільності помилок регресії;
- початкова оцінка параметрів регресії;
- вагова функція, заснована на залишках Пірсона.
Ітераційна залежність для обчислення оцінок параметрів має вигляд
, (12)
де - похідна в точці ;
- залишки регресії при початкових оцінках параметрів та масштабу .
Для обчислення початкових оцінок параметрів і масштабу залишків застосовується LTS і Qn-алгоритм, відповідно. Метод було вдосконалено у частині схеми зважування, що прийняла вигляд
(13)
де r(ri) - залишки Пірсона для розподілу залишків регресії;
x(xi) - залишки Пірсона для розподілу незалежних змінних регресії;
((ri))=1-2(ri)/((ri)+2)2 - функція ваги, що визначає вплив залишків;
- функція ваги, що визначає вплив викидів у незалежних змінних, де (r(ri)) - безупинна функція, така що якщо (r) -1, то r -0 та якщо (r) -0, то r -; q - коефіцієнт, що визначає ступінь впливу викидів у незалежних змінних, q[0;1]. Дана функція дозволяє враховувати та регулювати ступінь впливу викидів у незалежних змінних. Так, вага точок позитивного високого впливу максимально збільшується, а вага точок негативного високого впливу - максимально знижується.
На практиці закон розподілу залишків регресії, як правило, близький до нормального. У цьому випадку u(xi,yi;)=xiri. Ефективність методу залежить від вибору параметра , що згладжує, h, що у випадку нормального розподілу визначається як . Для обчислення k необхідно розв'язати систему рівнянь
((c))= c, (14)
де - ступінь "забруднення" змішаного нормального закону розподілу помилок регресії;
c - значення, що показує, на скільки стандартних відхилень відстоїть розглянуте спостереження від середнього вибірки;
p- порядок багатомірної щільності розподілу вибірки, для якої формуються залишки Пірсона;
c - досить мала вага, що призначається спостереженню c.
Використовуючи результати роботи розглянутого раніше алгоритму, можна запропонувати формальні правила вибору значень параметрів з рівнянь (14) та, як наслідок, параметрів , що згладжують, для залишків регресії та незалежних змінних, відповідно, у наступному виді:
P=1, c=2.5, =P(|ri|>2.5), c=min{0.2; P(|ri|>2.5)}; (15)
c=RDn, =P(RDi>RDn), c=min{0.2; P(RDi>RDn)}. (16)
Ці правила дозволяють забезпечити максимальну ефективність даного методу. Якість функціонування удосконаленого методу було перевірено експериментально, що підтвердило його максимальну порогову точку, високу ефективність і стійкість до точок високого негативного впливу. Метод дозволяє будувати найбільш адекватні математичні моделі процесів та об'єктів, на які одночасно впливають різноманітні за величиною та структурою випадкові чинники, що забезпечить ефективне розв'язання функціональних задач АСУ.
За результатами імітаційного експерименту з використанням апарата ШНМПР було побудовано комплекс математичних моделей залежностей критеріїв оцінки якісних показників робастних методів від параметрів закону розподілу помилок моделі регресії для різних довжин вибірки та наявності в ній точок негативного високого впливу в наступному виді:
, (17)
де wkj , vj - числові коефіцієнти, що відповідають синапсичним вагам ШНМПР;
, - параметри змішаного закону розподілу помилок регресії.
Для коректного використання моделей (17) необхідно, щоб кількість незалежних змінних і відсоток точок негативного високого впливу у вибірці вихідних даних належали відповідним діапазонам p[1;10], [0;0.1], а також моделі (9), (10) були адекватними, що обумовлює корректність визначення параметрів “забруднення” , .
Далі для реалізації алгоритму вибору найбільш ефективного методу робастного оцінювання було запропоновано узагальнений критерій оцінки їх якісних показників у вигляді
, (18)
де - вагові коефіцієнти;
a7[0;0.5] - ваговий коефіцієнт;
L3[0.1;4] - критерій якості робастного методу, що відображає його обчислювальну складність;
=+0.1 - узагальнений параметр, що відображає ступінь "забрудненості" вихідної вибірки даних;
Sigm(x)=1/(1+e-x) - сигмоїдальна функція.
Його необхідність викликана тим, що при великому рівні "забрудненості" вибірки вихідних даних доцільніше використовувати критерій (2), а при малому - (1). Узагальнений же критерій об'єднує значення цих критеріїв із відповідними вагами, обумовленими ступенем забруднення даних. Також із використанням апарата ШНМПР були отримані залежності для вагових коефіцієнтів, що визначають співвідношення критеріїв L1 та L2 при різній довжині вибірки вихідних даних і різній кількості точок негативного високого впливу. Також виважено було введено критерій, що відображає обчислювальну складність відповідних методів.
Слід зазначити, що при побудові за допомогою ШНМПР усіх моделей, що згадувались раніше, помилка апроксимації не перевищувала п'яти відсотків.
На підставі узагальненого критерію (18) та моделей (7), (9), (10), (17) було розроблено алгоритм визначення найбільш ефективного робастного методу. Він дозволяє на інженерному рівні визначити оптимальний метод обробки даних в умовах порушення вимоги нормальності помилок моделі регресії, що і було визначено в меті та задачах дослідження.
Таким чином, моделі та алгоритми, запропоновані в роботі, дозволили формалізувати підхід до автоматизованого визначення ефективних робастних методів у залежності від статистичних характеристик вихідних даних.
У п'ятому розділі дисертаційної роботи розглядалися особливості практичного застосування розробленого комплексу моделей та алгоритмів, що знайшли відображення у програмному комплексі, при реалізації елементів МЗ АСУ виробничим підприємством та АСУ компресорною станцією. Зокрема, було побудовано адекватну статистичну математичну модель функціональної задачі побудови виробничої програми підприємства, що функціонує в умовах нестабільної ринкової економіки. При цьому розроблений програмний комплекс було використано для побудови критерію оптимізації. Також було побудовано адекватну статичну модель, яка дозволяє розв'язати задачу непрямих вимірів об'єму газу, що транспортується, у рамках функціональної задачі визначення основних техніко-економічних показників компресорної станції (КС).
З використанням розробленого комплексу кращим робастним методом у першому випадку було визначено FLS, а у другому - RLS. В обох випадках не вдалося побудувати адекватні моделi за допомогою МНК. Для оцінки адекватності при цьому використовувались робастні модифікації F-критерію, t-критерію та множинного коефіцієнту детермінації. Цей результат свідчить про ефективність використання запропонованого комплексу моделей та алгоритмів, що забезпечує визначення методу побудови найбільш адекватних статистичних моделей у випадку порушення вимог нормальностi залишків моделі регресії.
У додатках наведено результати імітаційних експериментів, що проводились під час досліджень; значення числових параметрів розроблених математичних моделей; приклади впровадження результатів дисертаційної роботи з відповідними актами.
ВИСНОВКИ
У дисертації наведене теоретичне узагальнення і нове вирішення наукової задачі, що виявляється у формалізації підходу до автоматизованого визначення ефективних робастних методів побудови лінійних статистичних моделей, необхідних при синтезі функціональних задач АСУ, в залежності від властивостей вихідних даних, що дозволить будувати найбільш адекватні моделі і, як результат, забезпечить підвищення ефективності АСУ. Для її вирішення були побудовані математичні моделі оцінки ефективності робастних методів, алгоритми вибору кращого з них для конкретного випадку та було удосконалено робастний метод, який дозволяє будувати адекватні моделі в умовах великого рівня “забрудненості” вихідних даних. Ці результати мають важливе наукове та практичне значення для автоматизації вибору в рамках МЗ АСУ методів та алгоритмів розв'язання функціональних задач організаційних систем, що забезпечить підвищення їх ефективності.
1. У дисертаційній роботі обгрунтовано причину використання статистичних моделей оптимізаційних задач під час розв'язання функціональних задач АСУ. Виявлено особливості функціонування підприємств, що обумовлюють наявність викидів різної структури та розмірів у реалізаціях процесів їх функціонування, що визначає некоректність використання найбільш поширеного методу обробки статистичних даних і побудови моделей у МЗ АСУ - регресійного аналізу, пов'язану з порушенням вимоги нормальності залишків моделі. У результаті обгрунтовано перехід до робастних методів, що мінімізують дисперсію оцінок у цьому випадку. Показано неспроможність асимптотичних властивостей робастних методів у випадку кінцевих вибірок і відсутність систематизованих результатів дослідження їх якісних характеристик у залежності від статистичних властивостей реальних вибірок даних. Це дозволило визначити напрямок досліджень, сформулювати мету та задачі дисертаційної роботи.
2. Запропоновано відносні критерії (1), (2) оцінки якісних показників робастних методів і обгрунтовано їх застосування для розв'язання задачі визначення найбільш ефективного робастного методу для вибірок вихідних даних, статистичні властивості яких змінюються в досить широких межах.
3. Розроблено систему імітаційного моделювання, що дозволяє оцінити якісні показники робастних методів у залежності від статистичних властивостей вихідних даних. У рамках цієї системи було запропоновано модель імітації симетричної вибірки з різною "вагою" і "довжиною хвостів" її закону розподілу, модель імітації викидів у вигляді "довгого хвоста" з довільною довжиною і "вагою", а також у вигляді залишкових викидів.
4. Розроблено алгоритм, що дозволяє визначати в кількісному виді ступінь і структуру "забруднення" вибірки вихідних даних. При цьому як модель закону розподілу з "довгими хвостами" була обрана модель змішаного нормального розподілу (3) та були визначені в аналітичному вигляді (9), (10) залежності параметрів цієї моделі від статистичних характеристик вибірки.
5. Удосконалено однокроковий робастний метод максимальної правдоподібності, заснований на залишках Пірсона, у частині схеми зважування (13) та запропоновано правила (15), (16), які забезпечують максимальну ефективність методу, що було доведено експериментально. Це дозволяє з його допомогою будувати адекватні моделі процесів, реалізації яких містять велику кількість викидів різної структури та розмірів.
6. Розроблено математичні моделі (17) якісних показників досліджуваних робастних методів в залежності від параметрів моделі змішаного нормального закону розподілу помилок регресійної моделі для різної довжини вибірки вихідних даних і наявності викидів у незалежних змінних. Вони дозволяють у кількісному виді порівняти адекватність моделей, що можуть бути отримані з використанням досліджуваних робастних методів для конкретної реалізації вихідних даних, і, тим самим, дозволяють вибрати найбільш ефективний робастний метод, що в підсумку підвищить ефективність АСУ.
7. Розроблено алгоритм визначення найбільш ефективного методу або групи методів робастного оцінювання в залежності від конкретних статистичних властивостей вибірки вихідних даних, який базується на узагальненому критерії оцінки якісних показників ефективності методів (18) та алгоритмі кількісного визначення структури та ступеня "забрудненості" даних. Даний алгоритм дозволяє на інженерному рівні вибрати групу кращих робастних методів, визначивши припустимий рівень втрати ефективності побудованої з їх допомогою моделі та їх обчислювальної складності, що дозволяє забезпечити необхідний рівень ефективності АСУ. Вказаний алгоритм дозволив формалізувати підхід до автоматизованого визначення найбільш ефективного робастного методу в залежності від статистичних характеристик вихідних даних.
8. Розроблено програмний комплекс, що дозволяє визначити найбільш ефективний метод або групу методів робастного оцінювання для побудови адекватних лінійних статистичних математичних моделей процесів, реалізації яких містять різні за розміром і структурою викиди. Даний програмний комплекс доцільно використовувати в підсистемі МЗ АСУ для розв'язання задачі вибору алгоритмів і методів, що забезпечують ефективне вирішення функціональних задач АСУ. Ефективність програмного комплексу була доведена експериментально в процесі побудови статистичної моделі задачі розрахунку оптимальної виробничої програми підприємства та задачі непрямих вимірів об'єму газу, що транспортується, розв'язуваної в рамках МЗ АСУ КС.
СПИСОК ОПУБЛІКОВАНИХ АВТОРОМ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ
1. Антонов В.А., Шамша Т.Б., Репка В.Б. Концептуальная модель системы идентификации в современных системах управления технологическими объектами. // АСУ и приборы автоматики. - Харьков: ХТУРЭ.-1998.-№108.- С.214-223.
2. Шамша Б.В., Антонов В.А., Васин И.С. Сравнение эффективности методов робастного оценивания на основе исходной статистической информации. // Інформаційно керуючі системи на залізничному транспорті.-1999.-№5.-С.68-72.
3. Антонов В.А. Об одном подходе к идентификации квазистационарных объектов. // Вестник ХГПУ.-Харьков: ХГПУ. - 1999.- №72.- С.105-110с.
4. Шамша Б.В., Антонов В.А. Об одном подходе к разработке модифицированных алгоритмов робастного оценивания.//Вестник ХГПУ.-Харьков: ХГПУ. - 2000.- № 80.- С. 24- 26.
5. Антонов В.А., Шамша Б.В. Оценка качественных показателей алгоритмов идентификации в условиях зашумленности объектов управления и разработка модифицированного алгоритма онлайновой идентификации. // Информационные технологии: наука, техника, технология, образование, здоровье. - Харьков: ХГПУ.- 1998.- №6.- С.178-182с.
6. Антонов В.А., Шамша Б.В., Хмара С.И. Оптимизация искусственных нейронных сетей с помощью генетического алгоритма. // Труды Междунар.конф. “Теория и техника передачи информации”.- Харьков: ХТУРЭ.- 1999.- С.416-418.
7. Антонов В.А. Применение искусственных нейронных сетей для идентификации квазистационарных объектов. // Тез. докл. конф. ”Радиоэлектроника и молодежь в 21 веке”. - Харьков:ХТУРЭ. - 1999.- С.290-294.
АНОТАЦІЯ
Антонов В.О. Моделі та алгоритми визначення ефективних робастних методів при синтезі функціональних задач АСУ. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 - автоматизовані системи управління та прогресивні інформаційні технології. - Харківський державний технічний університет радіоелектроніки, Харків, 2000.
Дисертація присвячена питанням автоматизації визначення ефективних робастних методів для побудови найбільш адекватних статистичних моделей об'єктів, що функціонують під впливом різноманітних за величиною випадкових чинників. У роботі пропонується комплекс алгоритмів визначення ефективних робастних методів, що базується на моделях залежностей якісних показників досліджуваних методів від статистичних характеристик вихідних даних. Побудова вказаних моделей стала можлива завдяки розробці системи імітаційного моделювання, що дозволила накопичити статистичні дані залежностей критеріїв оцінки якісних показників досліджуваних методів від статистичних характеристик вихідних даних. У роботі також удосконалено однокроковий робастний метод максимальної правдоподібності, що дозволяє будувати адекватні моделі в умовах великої “забрудненості” вихідних даних. Запропонований комплекс алгоритмів реалізовано програмно у вигляді елементів математичного забезпечення АСУ по визначенню методів та алгоритмів, що забезпечать найбільш ефективне розв'язання функціональних задач АСУ. Основні результати роботи знайшли практичне застосування при вирішенні планово-економічних задач підприємств.
Ключові слова: функціональні задачі АСУ, статистичні моделі, робастний метод, регресійна модель, імітаційне моделювання.
АННОТАЦИЯ
Антонов В.А Модели и алгоритмы выбора эффективных робастных методов при синтезе функциональных задач АСУ. - Рукопись.
Диссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06 - автоматизированные системы управления и прогрессивные информационные технологии. - Харьковский государственный технический университет радиоэлектроники, Харьков, 2000.
Диссертационная работа посвящена вопросам автоматизации определения эффективных методов для синтеза наиболее адекватных статистических моделей процессов и объектов, подверженных влиянию различных по величине случайных факторов, что, в конечном счете, повысит эффективность решения функциональных задач АСУ. Анализ проблемы показал, что в условиях нестабильной рыночной экономики реализации процессов функционирования предприятий содержат различные выбросы. Это, в свою очередь, исключает применение метода регрессионного анализа для построения статистических моделей и обусловливает переход к классу робастных методов, отличающихся большим разнообразием свойств. Это определяет актуальность разработки средств выбора на инженерном уровне эффективных робастных методов в зависимости от статистических свойств исходной информации.
В работе был формализован подход к определению эффективных робастных методов в зависимости от статистических свойств исходных данных. Указанный подход был реализован в виде комплекса алгоритмов, основанных на моделях зависимости качественных показателей эффективности исследуемых робастных методов от статистических свойств исходной информации.
Для исследования свойств робастных методов использовался метод статистических испытаний. Была разработана система имитационного моделирования, позволяющая генерировать выборки данных с различными статистическими свойствами. В качестве критериев оценки качественных показателей исследуемых методов использовались относительные критерии, основанные на среднеквадратической ошибке и медиане абсолютных отклонений.
В работе был предложен алгоритм определения в количественном виде структуры и степени “загрязненности” выборки исходных данных, основанный на математических моделях зависимостей параметров смешанного нормального закона распределения остатков регрессионной модели от ряда количественных характеристик выборки и робастном критерии выявления точек высокого влияния факторного пространства.
С использованием системы имитационного моделирования были получены статистические данные зависимостей качественных показателей исследуемых робастных методов от количественных характеристик “загрязненности” исходных данных, определяемых с использованием вышеуказанного алгоритма. На основании этих статистических зависимостей были построены математические модели зависимости показателей эффективности исследуемых робастных методов от статистических свойств исходных данных.
В работе был усовершенствован одношаговый робастный метод максимального правдоподобия в части схемы взвешивания. Предложенная схема взвешивания обеспечивает практически полную эффективность метода при сильной “загрязненности” исходных данных, что позволяет строить адекватные статистические модели в указанных условиях и, тем самым, повысить эффективность решения функциональных задач АСУ.
В работе был предложен обобщенный критерий оценки качественных показателей робастных методов, основанный на взвешенной сумме указанных ранее относительных критериев и критерия, отражающего вычислительную сложность исследуемых методов. На базе обобщенного критерия, использующего полученные модели зависимостей качественных показателей исследуемых методов, был разработан алгоритм определения на инженерном уровне эффективных робастных методов в зависимости от статистических свойств исходной информации.
Предложенный в работе комплекс алгоритмов был реализован программно в виде элементов математического обеспечения АСУ по выбору методов и алгоритмов, которые обеспечат наиболее эффективное решение функциональных задач АСУ. Основные результаты диссертационной работы нашли практическое применение при решении функциональных задач технико-экономического планирования и управления предприятиями. Это обеспечило повышение эффективности получаемых решений соответствующих задач.
Ключевые слова: функциональные задачи АСУ, статистические модели, робастный метод, регрессионная модель, имитационное моделирование.
ABSTRACT
Antonov V.A. Models and algorithms of choice of effectiveness robust estimator in building of functional problems ASC. - Manuscript.
Thesis for a candidate's degree by speciality 05.13.06 - automated control systems and progressive information technologies. - Kharkov state technical university of radioelectronics, Kharkov, 2000.
The thesis is devoted to problems of automation of definition of effective robust estimators for build-up of the most adequate statistical models of processes, which one operate under effect manifold on magnitude of random factors. In thesis the complex of algorithms of definition of effective robust estimators is offered, which one are founded on models of associations of the qualitative indexes of researched methods from statistical properties of input data. The build-up of the indicated models became possible due to development system of a simulation modeling, which one has allowed to accumulate the statistical data of associations of criteria of estimate of the qualitative indexes of researched methods from statistical properties of input data. In thesis a one-step robust estimator of maximum likelihood is updated, which one allows creating adequate models in conditions big contaminated of input data. The offered complex of algorithms is implemented by the way of program complex, as parts of mathematics ware of ACS at the choice of methods and algorithms, which one will provide the most effective solution of functional tasks of ACS. The main outcomes of thesis were used at solution of the economical tasks of firms.
Keywords: functional tasks of ACS, statistical models, robust estimator, regression model, simulation modeling.
Размещено на Allbest.ru
Подобные документы
Характеристика параметричних моделей випадкових процесів. Особливості методів спектрального оцінювання, апроксимація даних з використанням детермінованої експоненціальної моделі по методу Проні. Автокореляційна функція як часова характеристика сигналу.
реферат [243,3 K], добавлен 04.12.2010Огляд методів і прийомів визначення місцезнаходження. Вивчення особливостей системи супутникового зв’язку, супутникової навігації (позиціювання), автоматизованого визначення місцеположення транспортних засобів. Мікростільникова структура зв’язку.
реферат [257,7 K], добавлен 02.06.2015Методи аналітичного, імітаційного і натурного моделювання. Характеристика моделей теорії масового обслуговування. Спеціалізовані системи імітаційного моделювання обчислювальних мереж. Топологічний структурний аналіз властивостей мережі - нові пропозиції.
реферат [1003,5 K], добавлен 20.11.2010Визначення класичним, оперативним і спектральним методами реакції лінійного електричного кола на підключення джерела живлення. Використання цих методів при проектуванні нових телекомунікаційних пристроїв. Моделювання перехідного процесу за допомогою ЕОМ.
контрольная работа [419,6 K], добавлен 23.02.2012Розробка загальної структури перетворювача ємність - тривалість імпульсу. Визначення залишкової напруги на колекторі. Визначення метрологічних характеристик. Моделювання одного з вузлів. Розрахунок підсилювача напруги. Розробка детальної структури схеми.
курсовая работа [588,8 K], добавлен 29.11.2009Виявлення та відсіювання результатів рівноточних вимірювань, які містять грубі похибки та промахи. Знаходження середнє квадратичного відхилення. Визначення верхньої та нижньої межі. Побудова гістограми та визначення ймовірностей попадання в інтервал.
научная работа [552,6 K], добавлен 09.04.2010Методи моделювання динамічних систем. Огляд методів синтезу. Математичне забезпечення вирішення задачі системи управління. Моделювання процесів за допомогою пакету VisSim. Дослідження стійкості системи управління. Реалізація програмного забезпечення.
дипломная работа [3,8 M], добавлен 07.11.2011Аналіз сучасного стану питання та обґрунтування методу розрахунку і оптимізації. Комп’ютерне моделювання та вибір математичної моделі. Основні характеристики моделей дисперсійного аналізу, методика їх розрахунку. Моделі систем масового обслуговування.
курсовая работа [518,0 K], добавлен 25.08.2013Аналіз статистичних даних щодо проявів можливих відмов апарату ШВЛ Savina. Структурна схема апарату, блок живлення та плата управління. Визначення рівня контролепридатності, функціонально-логічна модель апарату. Оптимальна програма діагностування.
курсовая работа [1,7 M], добавлен 21.04.2015Розробка інформаційно-вимірювальної системи визначення температури. Методи вимірювання температури, вибір оптимальної структурної схеми. Електрична принципова схема, розрахунок вузлів системи. Визначення основної похибки перетворювача–датчика KTY81-121.
курсовая работа [991,6 K], добавлен 24.01.2011