Інформаційна технологія та методи аналізу сумішей сигналів на основі лінійних за параметрами моделей

Аналіз сумішей сигналів, що містять шум, методами апроксимації та виділення прихованих джерел. Удосконалення методів стійкого оцінювання параметрів лінійних моделей за наявності невизначеностей та реалізація інформаційної технології аналізу даних.

Рубрика Программирование, компьютеры и кибернетика
Вид автореферат
Язык украинский
Дата добавления 26.07.2014
Размер файла 46,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

НАЦІОНАЛЬНА АКАДЕМІЯ НАУК УКРАЇНИ

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

МІЖНАРОДНИЙ НАУКОВО-НАВЧАЛЬНИЙ ЦЕНТР ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ ТА СИСТЕМ

Автореферат дисертації на здобуття наукового ступеня кандидата технічних наук

ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ТА МЕТОДИ АНАЛІЗУ СУМІШЕЙ СИГНАЛІВ НА ОСНОВІ ЛІНІЙНИХ ЗА ПАРАМЕТРАМИ МОДЕЛЕЙ

05.13.06 - інформаційні технології

РЕВУНОВА Олена Георгіївна

Київ - 2008

Дисертацією є рукопис.

Робота виконана у Міжнародному науково-навчальному центрі інформаційних технологій та систем НАН і МОН України.

Науковий керівник: кандидат технічних наук

Рачковський Дмитро Андрійович,

Міжнародний науково-навчальний центр

інформаційних технологій та систем

НАН і МОН України,

старший науковий співробітник.

Офіційні опоненти: доктор технічних наук, професор

Васильєв Володимир Іванович,

Міжнародний науково-навчальний центр інформаційних технологій та систем

НАН і МОН України,

завідувач відділу;

кандидат фізико-математичних наук,

старший науковий співробітник

Кук Юрій Васильович,

Інститут кібернетики ім. В.М. Глушкова

НАН України,

старший науковий співробітник.

Захист відбудеться «10» червня 2008 року о 13 годині на засіданні спеціалізованої вченої ради Д 26.171.01 в Міжнародному науково-навчальному центрі інформаційних технологій та систем НАН і МОН України за адресою: 03680, Київ, проспект акад. Глушкова, 40.

З дисертацією можна ознайомитися в бібліотеці Міжнародного науково-навчального центру інформаційних технологій та систем НАН і МОН України: 03680, Київ, проспект акад. Глушкова, 40.

Автореферат розісланий «6» травня 2008 року.

Вчений секретар

спеціалізованої вченої ради Верещагін І.І.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Проблема ефективного аналізу сумішей сигналів, що містять шум, виникає при розв'язанні класу задач, пов'язаних із обробкою інформації, що отримується від різного роду датчиків (задачі захисту від завад, ідентифікації, діагностики, інтерпретації та ін.). Важливими для практики прикладами таких задач є визначення вмісту радіонуклідів в об'єктах навколишнього середовища (задача ідентифікації) та пригнічення активних радіозавад (задача захисту від завад).

Найбільш продуктивні підходи та методи аналізу сумішей сигналів, що містять шум, засновані на використанні лінійних за параметрами моделей. В даний час інтенсивно розвиваються два підходи до аналізу сумішей, які забезпечують стійку оцінку параметрів лінійних моделей - апроксимація та виділення прихованих джерел. У рамках підходу апроксимації розвинений ряд напрямів стійкої оцінки параметрів моделі за наявності різного роду невизначеностей, проте конкретним методам властиві недоліки, що ускладнюють їх практичне застосування.

Методи стійкого розв'язання задачі найменших квадратів при виродженій та близькій до виродженої матриці входів, досліджувані T. Greville (1960), Р. Лі (1966), А. Албертом (1977), J. Zhou (2002), Е.В. Бодянським (2004), вимагають адаптації для роботи з нестаціонарними даними в реальному часі через високу обчислювальну складність.

Методи стійкої оцінки параметрів при спотвореному шумом векторі виходу та числі входів, що не перевищує числа зразків вибірки, в рамках напряму вибору моделі (model selection) досліджувалися А.Г. Івахненко (1968, 1985); В.С. Степашко (1977, 1985, 2003); H. Akaike (1974); C.L. Mallows (1973); B.Yu (2001); S. van de Geer (2004); М. Sugiyama (2002). Проте, питання порівняння критеріїв вибору моделі та вибору найкращого критерію в прикладних задачах в рамках цього напряму досліджені недостатньо.

Методи розрідженої апроксимації (sparse approximation), досліджувані S. Mallat, Z. Zhang (1989); T. Sejnowski (1996); K. Kreutz-Delgado (2003); M. Elad, D. Donoho (2004); R. Gribonval (2005), забезпечують стійку оцінку параметрів при числі входів, що набагато перевищує число зразків вибірки, та малому числі ненульових параметрів. Проте, врахування впливу шуму у векторі виходу на стійкість оцінки параметрів недостатньо опрацьовано, що ускладнює застосування цих методів для розв'язання практичних задач.

При підході до аналізу даних шляхом виділення прихованих джерел потрібно знайти входи за їх сумішами, спотвореними адитивним шумом. Цей напрям досліджувався в роботах P. Comon (1994, 2002); E. Oja, A. Cichocki (2001); A. Hyvarinen (1998, 2003); M. Davies (2004), М.Цибулевський (2005) та ін. Методи, що розвинуто в рамках даного напряму, критичні до наявності адитивного шуму, вимагають великого обсягу вибірок, що заважає їх використанню у реальних задачах з нестаціонарними даними.

Отож, існуючі підходи та методи, в цілому, забезпечують в задачах аналізу сумішей сигналів, що містять шум, стійку оцінку параметрів моделі за наявності невизначеностей різного роду. Проте, у зв'язку із вищезазначеними недоліками, - висока обчислювальна складність, нестійкість за наявності шуму у виходах, необхідність великого обсягу вибірки - існує потреба у доопрацюванні методів для їх застосування при розв'язанні практичних задач. Вибір методу аналізу суміші сигналів, що містять шум, залежно від типу невизначеностей може бути автоматизований шляхом систематизації підходів та методів - як традиційних, так і нейромережевих, та створення єдиної технології, що забезпечує у кожному конкретному випадку вибір найкращого підходу та методу розв'язання задачі.

Тому актуальною є науково-прикладна задача удосконалення методів та розробки базової інформаційної технології аналізу сумішей сигналів, що містять шум, на основі стійкого оцінювання параметрів лінійних моделей при різних типах невизначеностей.

Зв'язок роботи з науковими програмами, планами, темами. Робота виконувалася відповідно до планів наукових досліджень відділу Міжнародного науково-навчального центру інформаційних технологій та систем в таких науково-дослідних роботах: «Дослідження та розроблення нових інтелектуальних інформаційних технологій на основі використання високоефективних нейромережевих методів та алгоритмів» (№ ДР 0102U002070, 2002-2006); «Розроблення та дослідження нейромережевих інформаційних технологій роботи з базами знань» (№ ДР 0104U003191, 2004-2006); «Створити дослідні зразки нейрокомп'ютерів нових поколінь» (№ ДР 0101U006718); «Розробити інтелектуальні інформаційні технології розпізнавання та ідентифікації аудіо-відеоінформації на основі нейромережевих технологій» (№ ДР 0104U008324, 2004).

Мета роботи. Метою дисертаційної роботи є підвищення ефективності аналізу сумішей сигналів, що містять шум, методами апроксимації та виділення прихованих джерел шляхом удосконалення методів стійкого оцінювання параметрів лінійних моделей за наявності невизначеностей, та реалізація інформаційної технології аналізу даних.

Для досягнення поставленої мети в дисертаційній роботі необхідно вирішити такі задачі:

- проаналізувати існуючі підходи до аналізу сумішей сигналів, що містять шум, та розробити базову інформаційну технологію аналізу даних на основі лінійних моделей за наявності невизначеностей різного типу;

- удосконалити та дослідити рекурсивні методи розв'язання задачі найменших квадратів;

- удосконалити та дослідити методи стійкої оцінки параметрів лінійної моделі в умовах шуму у векторі виходу та при числі входів, що перевищує число зразків в навчальній вибірці;

- розробити та дослідити цільову функцію, що забезпечує стійке виділення прихованих джерел в умовах малої довжини навчальної вибірки та адитивного шуму;

- розробити та дослідити методи стійкого пригнічення активних завад при матриці входів, близькій до виродженості, та за наявності корисного сигналу у всіх антенних каналах;

- розробити та дослідити методи визначення вмісту радіонуклідів в спектрах довільного радіонуклідного складу, виміряних у фіксованій та нефіксованій геометрії;

- розробити, реалізувати та експериментально дослідити ефективність інформаційної технології на штучних та реальних даних.

Об'єкт дослідження - аналіз даних за допомогою лінійних моделей за наявності невизначеностей. сигнал лінійний інформаційний

Предметом дослідження є лінійні моделі даних за наявності невизначеностей в задачах апроксимації та виділення прихованих джерел, пригнічення завад, визначення вмісту радіонуклідів в об'єктах навколишнього середовища; методи та алгоритми стійкого розв'язання задачі найменших квадратів, розрідженої апроксимації, виділення прихованих джерел; інформаційна технологія аналізу даних.

Методи дослідження. При розробці та дослідженні методів аналізу даних використовувалися методи математичного моделювання, теорії вірогідності та математичної статистики, теорії інформації, лінійної алгебри, матричного числення. При розв'язанні прикладних задач застосовувалися методи масових експериментальних досліджень з використанням штучних та реальних даних, статистичної обробки результатів, теорії машинного навчання.

Наукова новизна роботи. Основні результати роботи, які визначають наукову новизну та виносяться на захист, такі:

- вперше розроблена інформаційна технологія аналізу сумішей сигналів, що містять шум. Технологія відрізняється стійким оцінюванням параметрів моделі в умовах невизначеності, викликаної: адитивним шумом у виходах та входах, малою розмірністю вибірки даних, неповнотою рангу матриць плану та змішування, властивостями вектора сингулярних чисел матриці входів;

- отримав подальший розвиток рекурсивний метод розв'язання лінійної задачі найменших квадратів шляхом модифікації методу Гревіля, що забезпечило обчислювально ефективну обробку даних у ковзному робочому вікні для виродженої та близької до виродженої матриці входів;

- вдосконалений метод розв'язання задачі розрідженої апроксимації пошуком відповідностей шляхом використання тесту Грібонваля для побудови лінійної моделі при малих рівнях шуму та базисах, що задовольняють умові Грібонваля, а інакше - шляхом використання критеріїв вибору моделі;

- вперше запропонована цільова функція для методу виділення прихованих джерел з лінійної суміші, що стійко функціонує в умовах адитивного шуму у виходах та малої довжини навчальної вибірки, відрізняється використанням мінімальної довжини опису та модифікованого методу пошуку відповідності;

- вдосконалений метод пригнічення активних завад в неоднорідній антенній системі з малим числом елементів за рахунок використання модифікованого методу Гревіля. Вдосконалений метод пригнічення активних завад для однорідної антенної системи за рахунок використання цільової функції на основі мінімальної довжини опису при виділенні прихованих джерел;

- отримав подальший розвиток метод визначення вмісту радіонуклідів в об'єктах навколишнього середовища для спектрів довільного радіонуклідного складу, виміряних у фіксованій геометрії, за рахунок використання критеріїв вибору лінійної моделі оптимальної складності для зниження відносної погрішності визначення активності;

- вперше запропонований метод визначення вмісту радіонуклідів в об'єктах навколишнього середовища, спектри яких виміряні в нефіксованій геометрії, що відрізняється використанням вдосконаленого методу пошуку відповідностей для більш точного виявлення радіонуклідного складу.

Практичне значення отриманих результатів. На основі розвинених методів розроблено програмні засоби, що забезпечують стійке оцінювання параметрів лінійних моделей в умовах різного типу невизначеностей, для базової інформаційної технології аналізу сумішей сигналів, що містять шум:

- реалізація вдосконалених методів Гревіля, формул Кириченко, усіченого розкладання по сингулярних значеннях, обробки ковзним вікном (програмний модуль StableLSPSolution);

- реалізація обчислення критеріїв вибору моделі та функції "жадібного" перебору моделей (програмний модуль ModelSelection);

- реалізація перевірки умови і тесту Грібонваля, та модифікованого методу пошуку відповідностей (програмний модуль SparseRegression);

- реалізація виділення прихованих джерел на основі мінімальної довжини опису (програмний модуль AIT-BSS).

Розроблені також модулі програмного нейрокомп'ютера SNC, що реалізовують методи виділення прихованих джерел FastICA та PCA.

Створені програмні засоби для пригнічення активних завад в неоднорідних антенних системах з підвищеною швидкодією та коефіцієнтом пригнічення, а також для пригнічення активних завад в однорідних антенних системах за наявності корисного сигналу та шуму у всіх антенних каналах.

Створені програмні засоби для визначення вмісту радіонуклідів в об'єктах навколишнього середовища, орієнтовані на роботу із спектрами довільного радіонуклідного складу при вимірюванні як у фіксованій, так і в нефіксованій геометрії, такі, що перевершують традиційні методи за точністю.

Створені програмні засоби використовуються в наукових і практичних цілях, що підтверджується відповідними актами: Міністерства промислової політики України (від 26.10.2005 р.); Інституту геохімії (від 16.11.2005 р.); НВО ОРТ (від 5.07.2007 р.).

Особистий внесок здобувача. У роботах, написаних у співавторстві та опублікованих у профільних виданнях, внесок здобувача полягає в наступному: [1] - експериментальне дослідження методу побудови моделі на основі критерію інформаційних підпросторів Сугиями; тестування на реальних даних. У [2], [8] - розробка частин архітектури SNC та блоків обробки. У [5] - метод обчислювально ефективного стійкого розв'язання задачі найменших квадратів; розробка та тестування стійкого методу компенсації активних завад. У [7] - математична формалізація задачі; вибір методу розрідженої апроксимації з найменшою обчислювальною складністю, порівняння критеріїв останову, тестування на реальних даних.

Апробація результатів дисертації. Результати дисертаційного дослідження були представлені на: XIV міжнародному симпозіумі "Математичні методи і комп'ютерні технології при розв'язанні задач захисту навколишнього середовища в надзвичайних ситуаціях" (Київ, 1998); XIII, XIV Міжнародних конференціях з нейрокібернетики (Ростов-на-Дону, 2002, 2005); XI-th Intern. Conf. "Knowledge-Dialogue-Solution" KDS-2005 (Bulgaria, 2005); Міжнародному семінарі з індуктивного моделювання МСІМ (Київ, 2005; Prague 2007); школах-семінарах "Про проблеми образного мислення" (Жукін, 2005) і "Індуктивне моделювання: теорія і застосування" (Жукін, 2006), наукових семінарах "Проблеми нейрокомп'ютерів та нейромереж" (Київ, ІПММС і МНУЦ ІТС) і "Образний комп'ютер" (Київ, МНУЦ ІТС).

Публікації. Основні результати дисертації опубліковано в 16 наукових роботах, із них 9 праць опубліковано в профільних виданнях.

Структура дисертації. Дисертація складається із вступу, п'яти розділів, висновків, списку використаних джерел із 159 найменувань, трьох додатків. Основна частина займає 144 сторінки, ілюстрована 61 рисунком та 3 таблицями. Загальний обсяг дисертаційної роботи - 184 сторінки.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовано актуальність теми дисертаційної роботи, сформульовано мету і задачі дослідження, визначено наукову новизну і практичне значення отриманих результатів, зазначено особистий внесок здобувача.

Перший розділ присвячений огляду сучасного стану проблеми аналізу даних методами апроксимації та виділення прихованих джерел за допомогою лінійних за параметрами моделей (ЛМ) вигляду:

y = j=1,N j(z)иj.

(1)

де (и1,и2,...,иN) = N - вектор параметрів (1(z), 2(z),..., N(z))=xN - вектор значень базисних функцій j від z. Базисні функції (БФ) можуть бути нелінійними, а z - скаляром або вектором.

Розглянутий ряд актуальних практичних задач, де з фізичних міркувань відомо, що входи і вихід зв'язані ЛМ. Це задача визначення вмісту радіонуклідів в об'єктах навколишнього середовища та задача пригнічення активних радіо завад, які в даний час для ряду важливих випадків вирішуються незадовільно.

Для ефективного розв'язання цих та аналогічних задач потрібне удосконалення і адаптація методів аналізу даних лінійними моделями в рамках підходу апроксимації та виділення прихованих джерел.

Задача апроксимації (ЗА) розглядається як відновлення функції (1) шляхом оцінки за L парами спостережень входу хiN і виходу yi DL={(хi, yi)}i=1,L. Значення yi спотворені адитивним шумом i (yi = y0 + i); у загальному випадку це також справедливо для хi.

Задача найменших квадратів (ЗНК) полягає у відшуканні вектора параметрів *, що мінімізує нев'язку RSS = ||Х-y||2 (де yL, ХLN - матриця входів):

*=argmin RSS.

(2)

Якщо відомо, що всі параметри j в (1) значущі - всі входи хj значуще впливають на у, розв'язок ЗНК дається виразом *=Х+y, де Х+ - псевдообернена Х.

Отримання стійкого розв'язку ЗНК (при det(Х)=0 та Х, що не містить шуму) можливо, коли ряд власних чисел має виражений перепад. Якщо ж ряд власних чисел спадає монотонно, то для розв'язання задачі (2) використовують методи регуляризації.

Якщо не відомо, які саме БФ сформували спостережуваний вихід, розв'язок ЗА отримують методами вибору моделі та розрідженої апроксимації.

Вибір моделі складності sN (s - число ненульових параметрів в (1)), при якій помилка відновлення функції мінімальна, здійснюється на основі перебору моделей (тобто складу БФ) і мінімізації критеріїв вибору моделі. Найбільш відомими критеріями є: AIC (Akaike, 1974), CP (Mallows, 1973), SIC (Sugiyama, 2002), LY (Yu, 2001).

Методи вибору моделі зазвичай дають субоптимальний розв'язок ЗА через обчислювальну неможливість повного перебору моделей складності s N.

Оптимальний розв'язок ЗА для у, який не містить шуму, при L<N (зазвичай, L<<N и s<<N) у разі повного базису {j} (що дозволяє точне представлення у) може бути отримано на основі розрідженої апроксимації (Mallat, Zhang, 1989).

При цьому здійснюється пошук представлення виходу у з найбільшою можливою розрідженістю *, вимірюваною за нормою l0 (за числом ненульових елементів , ||||0=s):

*=min ||||0 за умови y=X.

(3)

Розв'язок розрідженої ЗА (3) отримують методом пошуку відповідності (МПС) (matching pursuit). Достоїнства МПС: оптимальність для деяких типів базисів {} (Mallat, Zhang, 1993); низька обчислювальна складність у порівнянні з методами l1-апроксимації (Chen, 1995) та m-членним розкладанням (DeVore, 1998), (Temlyakov, 2002). Іншим способом розв'язання розрідженої ЗА є застосування методу прямої покрокової регресії (Hocking, 1976). При розв'язанні за допомогою МПС розрідженої ЗА із у, що містить шум, виникає проблема останову. Перспективним є застосування тесту Грібонваля (Gribonval, 2005) для перевірки розв'язку розрідженої ЗА на оптимальність.

У задачах виділення прихованих джерел (ВПД) дані представлені вибіркою L векторів виходів DL={yi}i=1,L. Зазвичай, yiN. Відомо, що вектор виходів у пов'язаний з вектором входів (джерел) xN лінійною моделлю: у=, де ANN, rank(A)=N, матриця змішування - невідома. Задача полягає у відновленні L спостережених векторів х (матриці X) за L спостереженнями у (за матрицею YLN) шляхом відшукання розділяючої матриці W=(w1,…,wN)TNN та виконання X=WY.

Для розв'язання задачі ВПД відомі методи використовують апріорні припущення про джерела: їх статистичну незалежність (аналіз незалежних компонент ICA), розрідженість (аналіз розріджених компонент SCA), некорельованість (аналіз головних компонент РСА). Недоліком цих методів є відсутність урахування шумів. В результаті проведеного аналізу виявлено, що запропоновані за останні десятиріччя підходи до стійкої оцінки параметрів лінійних моделей ураховують ряд класів невизначеностей та властивостей матриць входів та змішування. Проте систематизація нових методів недостатня, багато задач вимагають розробки та удосконалення методів для роботи в реальному часі, з різними типами невизначеностей. Тому актуальна розробка інформаційної технології аналізу даних для різних типів невизначеностей як на основі аналізу існуючих методів, так і шляхом їх розвитку задля підвищення обчислювальної ефективності, більш обґрунтованого врахування шуму, здатності працювати з вибірками малого обсягу.

Другий розділ присвячений удосконаленню методів стійкого оцінювання параметрів лінійних моделей для розв'язання задач апроксимації та виділення прихованих джерел. Розроблені: обчислювально ефективний та стійкий до неповноти рангу X метод PRGM розв'язання ЗНК для ковзного часового вікна; метод ВПД на базі запропонованої цільової функції BSSMDL, модифікація МПС (ММПС) для стійкої роботи за наявності шуму в у.

Метод PRGM розроблений для обчислювально ефективного розв'язання ЗНК при rank(X)N та нестаціонарних даних, де для визначення параметрів ЛМ необхідно використовувати тільки зразки даних, що знаходяться в ковзному робочому вікні розміром M. Для усунення впливу вектора входів х, що вийшов за межі вікна, на основі формул збурення псевдооберненої матриці (Кириченко, 1997) отримані вирази для модифікації Pk+1 та Qk+1 при k>M:

При xT1q1 (1±Neff): Pk=(I-q1qТ1/||q1||2)(Pk+1-q1qТ1)(I-q1qТ1/||q1||2),

Qk=(I-q1qТ1/||q1||2) (Qk+1-qТ1q1),

(4)

інакше: Pk = Pk+1+q1qТ1/(1-xТ1q1), Qk=Qk+1,

(5)

де q1 = (I-bkхTk+1)q1 стовпчик матриці X+k=(q1|Dk), відповідний х, що вийшов за межі вікна; вертикальна риска позначає конкатенацію стовпчика.

Для врахування хТk+1, що поступає на вхід, у роботі запропоновано використовувати вдосконалений метод Гревіля (Zhou, 2002):

якщо ||хTk+1Qk||2 Neff, то bk+1 = Pkхk+1/(1+хТk+1Pkхk+1),

Pk+1=(I-bk+1хТk+1)Pk, Qk+1=Qk,

(6)

якщо ||хTk+1Qk||2 Neff, то bk+1= Qkхk+1/(хТk+1Qkхk+1),

Pk+1 = (I-bk+1хТk+1)Pk(I-bk+1хТk+1)Т+bk+1bТk+1, Qk+1 = (I-bk+1хТk+1)Qk, Pk=Х+(Хk+)Т,

(7)

де Neff - константа на рівні машинної точності. Знайдене bk+1 використовується для обчислення иk+1 = иk + bk+1(yk+1-хTk+1иk).

PRGM знижує обчислювальну складність визначення и для кожного вікна з O(NM2), що відповідає традиційному Гревілю, до O(N3) (розмір вікна M>N). Реалізація та експериментальне дослідження PRGM розглянуті в розділах 3 та 5.

Для подолання недоліку методу пошуку відповідностей за наявності шуму - необхідності завдання порогу на значення залишку e=y-Ф, Ф={j}, ФХ для останову - запропонований модифікований метод пошуку відповідностей ММПС.

Модифікація полягає у використанні для останову тесту Грібонваля (11), а при його непридатності - останову за критерієм вибору моделі.

Тест Грібонваля (11) може застосовуватись при виконанні умови Грібонваля:

(2s-1)1,

(8)

(s)=supcard(J)s supj2J j1J | j2, j1|, j1ФХ, ||j1||2=1.

(9)

Тут j1J, j1 індексує елементи підпростору для всіх можливих card(J)-членних розкладань y (card(J)=1,...,s, j1=1,...,card(J)).

Якщо умова (8) виконується, починаючи з f0=0 (fkL), ММПС на (k+1)-му проході:

§ обчислює fk+1 = fk+k+1k+1, вибираючи k+1LХ та k+1, що мінімізують ||ek-||2:

(k+1,k+1) = argmin, ||ek-||2, ek+1 = y - fk+1;

(10)

§ перевіряє тест Грібонваля:

|e|1+|e|2(k+1) < 0.5(1- (2k+1)) minj|j|.

(11)

Тут |e|1 = (|e,j|2)1/2, де - e,j найбільший скалярний добуток e та j; |e|2(k+1) = (j2(k+1)|e,j|2)1/2 - сума 2(k+1) найбільших скалярних добутків.

Якщо (11) задовольняється, то *=(1,2,...,k+1) є розв'язок з максимально можливою розрідженістю та найменшою помилкою апроксимації, і ММПС зупиняється. При невиконанні умови Грібонваля ітераційний процес (10) в ММПС зупиняється при CR(k+1)CR(k), де CR(k) - значення критерію вибору моделі на проході k.

Для боротьби з нестійкістю методів ВПД при малому обсязі вибірки та наявності адитивного шуму у виходах розроблена цільова функція BSSMDL, заснована на алгоритмічній взаємній інформації. Вважаємо, що взаємна інформація між джерелами менша, ніж у їх сумішей. У роботі запропоновано для обчислення алгоритмічної взаємної інформації використовувати мінімальну довжину опису даних універсальною моделлю nMDL, або змішаною моделлю gMDL (Bin Yu, 1998):

nMDL = (L/2) log(RSS/(L - k)) + 0.5 k log(F) + log(L-k) - 3/2 log(k),

(12)

gMDL = (L/2) log(RSS/(L - k)) + 0.5 k log(F) + log(L),

(13)

F = (xТx - RSS)/(k RSS/(L - k)), RSS = || x - Ф ||2.

(14)

Запропонована цільова функція BSSMDL для розділення двокомпонентної суміші має такий вигляд:

I(x*1:x*2) = MDL(Yw1) - MDL(Yw1|Н2),

(15)

де YL2 - матриця виходів, Yw1=x*1 - вектор оцінки сигналу джерела x*1L, MDL() - функція, значенням якої є довжина опису даних (наприклад (12) або (13)), x*1L - вектор оцінки сигналу першого джерела, x*2L - вектор оцінки сигналу другого джерела, w1 - рядок розділяючої матриці, відповідний першому джерелу, Н2 - лінійна модель для апроксимації x*2.

Оптимізаційна задача відшукання w1* для виділення першого джерела:

w1* = arg minW I(x*1:x*2) = arg minW (MDL(Yw1) - MDL(Yw1|Н2)).

(16)

На кожній ітерації оптимізаційної процедури здійснюється побудова лінійної моделі Н1 для апроксимації поточної оцінки x1*=Yw1*, та лінійної моделі Н2 для апроксимації x2*=Yw2*, де w1* і w2* - оцінки w1 і w2, отримані на поточній ітерації оптимізації. Для побудови моделей Н1 та Н2, стійких до шуму, пропонується використовувати ММПС з остановом за тестом оптимальної розрідженості Грібонваля.

Третій розділ присвячений розробці базової інформаційної технології аналізу даних з використанням лінійних моделей (ІТЛМ) для задач апроксимації та виділення прихованих джерел.

ІТЛМ (рис. 1) включає як відомі методи (розділ 1), так і розроблені в дисертації (розділ 2), і дає засоби вибору адекватного методу для розв'язання задач шляхом врахування їх особливостей - даних, що аналізуються, та типів невизначеностей (спотворення шумами Х, спотворення шумами виходу у та ін.). На рис.1 ND - число датчиків, МДО - мінімальна довжина опису, i - сингулярні числа матриці XTX.

Ряд блоків ІТЛМ реалізований здобувачем у вигляді програмних модулів. Реалізація блоку методів побудови моделі ModelSelection і блоку розрідженої апроксимації SparseRegression містить функції: формування вибірки даних; обчислення критеріїв вибору моделі; перебору моделей. Реалізація блоку стійкого розв'язання ЗНК StableLSPSolution містить функції: методу Гревіля, вдосконаленого методу Гревіля, PRGM, усіченого SVD. Реалізація блоку виділення прихованих джерел AIT-BSS містить функції: обчислення значень цільової функції BSSMDL, формування моделі за даними сумішей, обчислення довжини опису.

Блоки ІТЛМ PCA та ICA реалізовані як оброблювальні модулі програмного нейрокомп'ютера SNC. Метод визначення вмісту радіонуклідів при нефіксованій геометрії вимірювань, заснований на ММПС (з остановом за критерієм вибору моделі), реалізований у ПО спектрометра "Вектор" на мові С процесора С196.

Четвертий розділ присвячений застосуванню розробленої ІТЛМ у задачі визначення вмісту радіонуклідів в об'єктах навколишнього середовища та експериментальному дослідженню модифікованого методу пошуку відповідностей ММПС.

Проведено експериментальне дослідження ефективності розробленої ІТЛМ в задачі визначення вмісту радіонуклідів в об'єктах навколишнього середовища при фіксованій геометрії вимірювань (ФГ), для якої функції відгуку детектора (ФВД) відомі. Одній спектральній лінії зіставлялася одна ФОД . Для L-канального спектрометра набір функцій цj j=1,…,N формує Х розмірністю LN, де N=L. Оскільки спектр гамма випромінювання (вихід у) формується як лінійна модель з БФ цj і потрібно знайти параметри моделі, ІТЛМ відносить задачу до апроксимаційних та пропонує методи вибору моделі. Знайдені параметри лінійної моделі спектра, які відповідають відібраним методами вибору моделі БФ, пропорційні активностям гамма-випромінюючих елементів.

Для дослідження розробленого методу визначення вмісту радіонуклідів у ФГ були сформовані спектри, до складу яких входили гамма-випромінюючі елементи 60Со, 137Cs, 134Cs, 58Mn, для яких піки повного поглинання окремих спектральних ліній перекриваються. Для таких спектрів традиційні методи вікон (МВ) та послідовних вирахувань (МПВ) виявляють елементи, що реально не входять у спектр, що знижує точність оцінки активностей радіонуклідів.

Лінійна за параметрами модель, що включає зазначені п'ять складових (60Со містить дві спектральні лінії) була дійсною моделлю (TRUE). Повна (FULL) модель включала N=10 БФ, де окрім БФ TRUE включені ще п'ять додаткових ФВД. Показником точності відновлення вектора параметрів була середня помилка відновлення дійсного вектора параметрів и0 (ПВП): E||и0 - и*||2, де и* - оцінка вектора параметрів ||||2 - квадрат норми Евкліда, E - математичне очікування по реалізаціях шуму.

Практично у всьому діапазоні рівнів власного шуму (РВШ) метод найменших квадратів з моделлю TRUE дає мінімальні значення ПВП, з моделлю FULL - максимальні (рис.3). ММПС з дослідженими критеріями вибору моделі (Маллоуза CP, Акаїке AIC, Бін Ю gMDL, LY) при наростанні РВШ дають ПВП гірше, ніж ПВП TRUE, але краще від ПВП FULL. У великому діапазоні параметрів шуму ПВП за критерієм Маллоуза CP є близьким до ПВП дійсної моделі TRUE і є кращим за решту критеріїв.

В умовах обробки спектрів довільного радіонуклідного складу відносна погрішність визначення цезію 137Cs склала: для розробленого методу 3 %, для МВ та МПВ 19 %, 12 % відповідно.

Проведено експериментальне дослідження розробленої ІТЛМ в задачі визначення вмісту радіонуклідів в об'єктах навколишнього середовища при нефіксованій геометрії вимірювань (НФГ), яка відрізняється тим, що невідоме співвідношення кількості гамма-квантів, що припадає на кожну з трьох характерних областей спектру, та його зв'язок з активністю радіонукліда. Для врахування цих особливостей в роботі запропоновано зіставляти кожній області окрему функцію . Тому для L-канального спектрометра набір функцій цj j=1,…,N формує Х розмірністю LN, де N=3L. Застосування ІТЛМ дозволило віднести цю задачу до розрідженої ЗА, для розв'язання якої використовується метод ММПС.

Для дослідження розробленого методу визначення вмісту радіонуклідів при НФГ були сформовані спектри, до складу яких входять гамма-випромінюючі елементи 60Со, 137Cs, 134Cs, 58Mn. На відміну від ФГ, різні частини ФВД масштабувалися по-різному. Із спектрів окремих елементів формувався сумарний спектр, до якого був доданий адитивний шум з нормальним розподілом та у2 = 0.0, 5.5, 11.0,..., 104.5.

Аналіз залежності ПВП від РВШ при N=20, 30, 40 показав, що ПВП для ММПС з остановом за критеріями вибору моделі у всьому діапазоні шумів менше ПВП FULL, але більше ПВП TRUE. При N=30, 40 ПВП LY для МПС з остановом за критерієм мінімальної довжини опису LY у всьому діапазоні шумів менше ПВП CP та ПВП AIC.

Досліджувалось також виявлення точкового джерела гамма-випромінювання (цезій 137Cs) на фоні розподіленого джерела з вищою енергією (калій 40K з 51 % активності 137Cs), що є актуальною задачею при вимірюваннях в НФГ. Відносна погрішність визначення параметра, пропорційного активності 137Cs, склала для МВ - 92 %, для МПВ - 85 %. Для розробленого ММПС з остановом за критерієм LY відносна погрішність склала 12 %.

Проведено експериментальне порівняння точності відновлення вектора параметрів ММПС при останові за критеріями вибору моделі та тестом Грібонваля (11). Сигнал, сформований лінійною за параметрами моделлю з базисом Гауса, що задовольняє (8), спотворювався шумом з нормальним розподілом, РВШ=2={0.0, 0.07,...,0.63}. Виявлено, що поки складність моделі, отриманої за критеріями вибору моделі, збігається з істинною: РВШ0.07 для CP та РВШ0.14 для MDL, ПВП критеріїв вибору моделі мала і близька до ПВП за тестом Грібонваля (рис.5). Коли складність моделі стає менше істинної, ПВП критеріїв вибору моделі значно більше ніж ПВП за тестом Грібонваля. Проте, при РВШ1.2 тест Грібонваля не задовольняється і тому не застосовується в ММПС, тоді як критерії вибору моделі дозволяють оцінити параметри ЛМ.

П'ятий розділ присвячений застосуванню розробленої ІТЛМ в задачі пригнічення активних завад в неоднорідній та однорідній антенних системах.

У неоднорідній антенній системі в сигналах N антенних елементів додаткових каналів переважають активні завади, а складова корисного сигналу мала. Тільки один з каналів - основний - містить корисний сигнал. Той факт, що всі входи значуще впливають на вихід та можлива близькість матриці входів до виродженості, а також нестаціонарність вибірки обумовлюють вибір ІТЛМ методу PRGM для розв'язання задачі пригнічення активних завад.

Якість пригнічення завад оцінювалася за допомогою коефіцієнта пригнічення КП = КАЗвх/КАЗвих, де КАЗвх - коефіцієнт активної завади на вході основного каналу, КАЗвих - на виході методу пригнічення. Досліджувалася залежність КП від рівня власних шумів в додаткових каналах (РВШД) при фіксованому рівні шумів основного (РВШО) каналу (центровані випадкові величини з гаусовим розподілом). Число обумовленості, що визначає ступінь виродженості матриці Х, без шуму - 103. При РВШД={1.610-9,…,2.510-8} та КАЗвх = 5 для PRGM отримано КП = 9.6.

Для обернення матриці за методом Гауса (на рис. 7 позначене LMS) та розкладанням за сингулярними числами (SVD) спостерігаються значення КП<1, що відповідає підсиленню завади (рис. 7). При зростанні КАЗвх з 9.0103 до 1.2107 та РВШД = РВШО = 0.1 для методу PRGM КП = 9.19 і є постійним, тоді як для LMS та SVD КП падає з 8.7 до нуля.

В однорідній антенній системі сигнальна інформація у всіх антенних каналах є суміш трьох складових - корисного сигналу, активних завад, та власного шуму каналу, що робить використання PRGM не ефективним. Проте, розділення суміші та виділення складової корисного сигналу відповідає пригніченню завади, тому ІТЛМ відносить задачу пригнічення завад в такій постановці до задач ВПД.

З міркувань швидкодії та врахування нестаціонарності сигналів у задачах такого типу використовують мінімально можливий розмір вибірки (L<102), тому ІТЛМ вибирає метод, заснований на BSSMDL. Якість пригнічення завад оцінювалася за допомогою відношення сигнал-шум (ВСШ) на виході методу: SNR=10log10(||x||2/||xx*||2), де xL - вектор дійсного сигналу, x*L - вектор оцінки сигналу, отриманий в результаті роботи алгоритму розділення суміші.

Експериментально досліджена залежність ВСШ від рівня власного шуму каналів (РВШК) для методів PCA, FastICA та BSSMDL. При розділенні за допомогою BSSMDL для обчислення K() за (12), кожній компоненті суміші (y1 та y2) зіставлялася лінійна модель (Н1 та Н2) з радіальними БФ. Для PRGM y1 зіставлялася лінійна модель, де як БФ використовувалася y2 (імітувалася неоднорідна антенна система).

Суміш складалася з імпульсного сигналу з одиничною амплітудою тривалістю 5 відліків та сигналу завади - реалізації випадкового процесу тривалістю L=100 відліків з рівномірним розподілом. Аналіз залежностей ВСШ від РВШК={0, 0.01,…,2.56} показує, що ВСШ BSSMDL перевищує ВСШ FastICA при малих РВШК, а також ВСШ РСА та PRGM - у всьому діапазоні власних шумів (рис.9). Наприклад, при зростанні РВШК від 0.005 до 2.56, ВСШ падає: для BSSMDL з 70.84дБ (при 0.005) до 16.8 дБ (при 2.56), для FastICA - з 59.27 до 16.8 дБ, для РСА - з 12.6 до 11.09 дБ, для PRGM - з 15.2 до 12.87 дБ.

Досліджувалася залежність ВСШ від L, де сигнали джерел - пилкоподібний сигнал одиничної амплітуди та реалізація випадкового процесу з нормальним розподілом, нульовим середнім та одиничною дисперсією. Аналіз результатів показав, що ВСШ для BSSMDL перевищує ВСШ для ICA при числі зразків, меншому ніж 103. ВСШ для BSSMDL та ICA перевищує ВСШ для PCA у всьому досліджуваному діапазоні числа зразків. Таким чином, BSSMDL є ефективним методом розділення сумішей при малому числі зразків даних.

Досліджувалась залежність ВСШ від рівня активної завади (РАЗ). При = 5 метод BSSMDL забезпечує постійне ВСШ при різному РАЗ, що перевищує ВСШ для FastICA, РСА та PRGM. Так, при рівні власних шумів 10-2 при зміні рівня активної завади від 0.25 до 2048 BSSMDL забезпечує постійне ВСШ 70 дБ, тоді як ВСШ FastICA не перевищує 54 дБ, а в більшій частині діапазону рівня шумового сигналу дорівнює 40 дБ. Показники ВСШ методів РСА та PRGM нерівномірні та менші ніж для FastICA. Для PCA при =15 (рис. 10) і РАЗ від 10 до 103 ВСШ росте, а при зростанні РАЗ з 103 до 105 ВСШ є постійним. Для алгоритмів ICA та BSSMDL ВСШ не залежить від РАЗ.

ВИСНОВКИ

Сукупність отриманих у дисертації результатів забезпечує розв'язання актуальної науково-прикладної задачі удосконалення методів та розробки інформаційної технології аналізу сумішей сигналів, що містять шум, на основі стійкого оцінювання параметрів лінійних моделей при різних типах невизначеностей. Систематизовані та включені в технологію відомі та вдосконалені методи апроксимації та виділення прихованих джерел. Методи реалізовані в програмних засобах. Ефективність інформаційної технології досліджена в задачах пригнічення завад та визначення вмісту радіонуклідів.

За наслідками проведеного дослідження зроблені такі виводи:

1. Розроблена інформаційна технологія за рахунок стійкого оцінювання параметрів лінійної моделі забезпечує підвищення якості аналізу даних, що підтверджене на прикладі розв'язання задач пригнічення завад в антенних системах та визначення вмісту радіонуклідів в об'єктах навколишнього середовища.

2. Удосконалення методу Гревіля забезпечило отримання стійкої оцінки параметрів лінійної моделі для ковзного вікна. Обчислювальна складність розроблених методів O(N3) для числа входів N<M (розмір ковзного вікна) та O(N2М) нижча, ніж O(2) для традиційного методу Гревіля.

3. Удосконалення методу розв'язання задачі розрідженої апроксимації методом пошуку відповідностей при малих рівнях шуму та базисі, що задовольняє умові Грібонваля, забезпечує при останові за тестом Грібонваля більшу точність визначення параметрів, чим при останові за критерієм вибору моделі.

4. Вперше запропонована цільова функція BSSMDL в задачі виділення прихованих джерел забезпечує вище відношення сигнал-шум, ніж аналіз незалежних компонент.

5. Використання вдосконаленого методу Гревіля в задачі пригнічення активних завад забезпечує для неоднорідної антенної системи за умов матриці входів, виродженої та близької до виродженості, високий і не залежний від рівня активної завади коефіцієнт пригнічення (при зростанні активної перешкоди в 104 отримано коефіцієнт пригнічення 9.2, тоді як для методів, що використовують обернену матрицю або розкладання за сингулярними значеннями, коефіцієнт пригнічення падає з 8.7 до нуля).

Використання запропонованої цільової функції BSSMDL для виділення прихованих джерел дозволило удосконалити метод пригнічення активних завад в однорідній антенній системі за умов вибірок малої довжини і аддитивного шуму. За рівних умов BSSMDL забезпечує постійне відношення сигнал-шум 70 дБ, FastICA, РСА і PRGM - до 54 дБ при значній нерівномірності.

6. Вдосконалений метод визначення вмісту радіонуклідів при фіксованій геометрії вимірювань на основі вибору моделі шляхом покрокової регресії з остановом за критерієм Маллоуза Сp за рахунок урахування власного шуму спектрометра та використання функцій відгуку детектора забезпечує меншу погрішність, ніж метод послідовних вирахувань і метод вікон (при визначенні вмісту в пробі 137Cs відносна погрішність склала 3 %, 12 %, 19 % для розробленого методу, методу послідовних вирахувань, і методу вікон відповідно).

7. Вперше розроблений метод визначення вмісту радіонуклідів в об'єктах навколишнього середовища при нефіксованій геометрії вимірювань за рахунок використання модифікованого методу пошуку відповідностей дозволив забезпечити підвищення точності виявлення точкового джерела гамма-випромінювання на фоні розподіленого джерела в порівнянні з методами вікон і послідовних вирахувань (більш ніж в п'ять разів підвищена точність виявлення 137Cs на фоні калія 40K).

8. Розроблені програмні засоби за рахунок реалізації створених у рамках дисертаційної роботи методів забезпечують ефективність практичного застосування інформаційної технології аналізу даних та виділення прихованих джерел у задачах визначення вмісту радіонуклідів в об'єктах навколишнього середовища та пригнічення активних завад.

ОСНОВНІ ПОЛОЖЕННЯ ДИСЕРТАЦІЇ ОПУБЛІКОВАНІ В ТАКИХ ПРАЦЯХ

1. Забулонов Ю.Л., Лисиченко Г.В., Ревунова Е.Г. Экспресс-анализ радионуклидного состава с использованием аппроксимационного подхода к восстановлению спектра // Геохимия и экология: Сб. научн. тр. - Киев: ИГОС НАН и МЧС Украины, 2004. - № 10. - С. 32-38.

2. Гриценко В.И., Мисуно И.С., Рачковский Д.А., Ревунова Е.Г., Слипченко С.В., Соколов А.М. Концепция и архитектура программного нейрокомпьютера SNC // Управляющие системы и машины. - 2004. - № 3. - С. 3-14.

3. Ревунова Е.Г. Разделение сигнальных смесей на основе принципа минимальной длины описания // Комп'ютерні засоби, мережі та системи. - 2005. - № 4.- С. 86-93.

4. Ревунова Е.Г. Два подхода к разделению сигнальных смесей на основе линейных моделей // Системные технологии. - 2005. - № 6(41). - С. 142-148.

5. Revunova E.G., Rachkovskij D.A. Training a linear neural network with a stable LSP solution for jamming cancellation // Intern. Journal Information Theories and Applications. - 2005. - V. 12, № 3. - P. 224-230.

6. Ревунова Е.Г. Сравнение критериев выбора модели в задачах аппроксимации с естественным базисом // Математические машины и системы. - 2005. - № 3.- С. 116-126.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.