Методи та засоби прогнозування екологічних та економічних процесів на основі комп’ютерного моделювання часових рядів

Сутність побудови ARIMA-моделі, яка адекватно описує часовий ряд; визначення структури моделі, оцінювання параметрів, побудова прогнозів на основі отриманої ARIMA-моделі. Доцільність використання методу Недлера і Міда для оцінки параметрів ARIMA-моделі.

Рубрика Программирование, компьютеры и кибернетика
Вид автореферат
Язык украинский
Дата добавления 04.03.2014
Размер файла 51,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

НАЦІОНАЛЬНА АКАДЕМІЯ НАУК УКРАЇНИ

ІНСТИТУТ ПРОБЛЕМ МОДЕЛЮВАННЯ В ЕНЕРГЕТИЦІ

ім. Г. Є. ПУХОВА

УДК 681. 51

Автореферат

дисертації на здобуття наукового ступеня

кандидата технічних наук

Методи та засоби прогнозування екологічних та економічних процесів на основі комп'ютерного моделювання часових рядів

05. 13. 06 - Автоматизовані системи управління та прогресивні інформаційні технології

ДЕМКІВСЬКА ТЕТЯНА ІВАНІВНА

КИЇВ-2001

ЗАГАЛЬНА ХАРАКТЕРИСТИКА

Актуальність проблеми. В зв'язку з розвитком ринкової економіки та перебудовою суспільних відносин в Україні виникають значні труднощі при прогнозуванні поведінки учасників ринку. Зміни в економіці та обмеженість природних ресурсів в свою чергу призводять до зростання екологічних проблем, особливо з урахуванням наслідків аварії на Чорнобильській АЕС. Тому все більш актуальними стають проблеми моделювання та прогнозування екологічних та економічних процесів для створюваних автоматизованих систем. Моделюванню цих процесів велика увага приділялась в роботах Дженкінса і Бокса, Рао і Каш'яп, Ю. П. Лукашина, А. Капустинскаса і А. Немури. На жаль розроблені ними методи не завжди задовольняють конкретним практичним вимогам. Нові підходи до моделювання еколого-економічних проблем пропонуються в роботах П. І. Бідюка, І. Н. Ляшенка, В. С. Дейнеки, в наукових школах Інституту кібернетики НАН України та Київського університету імені Тараса Шевченка. В той же час прикладні проблеми сьогодення вимагають удосконалення методів ідентифікації та побудови прогнозних моделей.

Оскільки показники, що характеризують економічні та екологічні процеси, можна розглядати як часові ряди, в дисертаційній роботі основну увагу приділено проблемам моделювання і прогнозування часових рядів за допомогою ARIMA (Auto Regression Integrated Moving Average) - моделей авторегресії проінтегрованого ковзного середнього. Найвідомішими з застосувань цих моделей є використання для прогнозування різноманітних економічних рядів, сонячної активності, стоку рік, чисельності популяцій. ARIMA-моделі також можуть бути застосовані у різноманітних автоматизованих системах для прогнозування вартості акцій і інших біржових активів, курсів валют, змін щоденних залишків запасів на складах, в магазинах. За допомогою цих же моделей можна описати еволюцію зміни техніко-економічних характеристик виробів і змінних параметрів хімічних процесів, моделювати поведінку показників частоти відмов обладнання в залежності від його віку. Нарешті, вони можуть бути використані при аналізі сезонності змін статистичних характеристик, в ряді випадків вони застосовуються також для прогнозування макропоказників. В майбутньому попит на використання цих моделей зростатиме, оскільки розвиток фондового ринку, як свідчить досвід країн з розвиненою економікою, потребуватиме більш і більш детального прогнозування економічних процесів. Узагальнюючи, можна сказати, що моделі ARIMA ефективно застосовуються там, де основною інформацією для прогнозу є окремий часовий ряд.

Проведений при виконанні дисертаційної роботи аналіз показав, що поки що недостатньо досліджено питання звуження множини ARIMA-моделей, а також визначення структури і складу її параметрів для практичних потреб розробки автоматизованих систем управління в економіці, екології, банківській справі, тощо.

Саме тому основним напрямком дисертаційної роботи є побудова ARIMA-моделей для опису процесів, що задані часовими рядами, знаходження оцінок параметрів побудованої моделі та побудова прогнозу поведінки часового ряду.

Мета і задачі дослідження. Об'єктом дослідження дисертаційної роботи є процеси, що можуть бути описані часовими рядами. Предметом дослідження є побудова ARIMA-моделей. В роботі використовувались математичні методи аналізу моделей, експериментальні дослідження з застосуванням сучасної електронно-обчислювальної техніки та програмного забезпечення.

Для досягнення поставлених цілей розв'язувались такі задачі:

побудова ARIMA-моделі, яка адекватно описує часовий ряд;

визначення структури моделі, оцінювання параметрів та побудова прогнозів на основі отриманої ARIMA-моделі.

Наукова новизна одержаних результатів дисертаційної роботи визначається наступними отриманими автором теоретичними і експериментальними результатами:

досліджено моделі та побудовано алгоритм пошуку класу моделей та оцінок параметрів для цих моделей без попереднього знання фізичних процесів та оцінки фахівців;

вперше для вибору множини запізнювань використано частковий коефіцієнт кореляції, що дає змогу без участі оцінок фахівців та емпіричних висновків визначити структуру моделі.

вперше доведена доцільність використання методу Недлера і Міда для оцінки параметрів ARIMA-моделі і експериментально підтверджена його ефективність в порівнянні з використовуваними на сьогоднішній день методами;

запропоновані алгоритми та розроблено підсистему управління та інтерфейсу з користувачем для автоматизованих систем схеми обігу цінних паперів в акціонерному товаристві закритого типу “Обрій Капітал” та системі “ЕкоЕксперт”.

Зв'язок з науковими програмами, планами, темами. Дисертаційна робота виконувалась у відповідності з науково-дослідними темами: “Наукові основи комплексних комп'ютерних систем проектування та виготовлення продукції в легкій промисловості”, затвердженою рішенням науково-експертної ради Міносвіти України, пр. 2 від 04. 11. 1998 р. (регістраційний номер 0199U003013) і “Охорона навколишнього середовища та створення систем захисту людини від шкідливих впливів на виробництві”, затвердженою Наказом Київського національного університету технологій та дизайну від 22. 02. 2000 року № 25.

Практичне значення одержаних результатів. На основі розроблених методів і запропонованих алгоритмів розв'язана задача побудови прогнозу економічних та екологічних процесів на основі часових рядів.

Сформульовані умови використання часткового коефіцієнту кореляції при визначенні структури моделей та доцільність застосування методу Недлера і Міда для оцінювання параметрів ARIMA-моделей.

Створено програмну підсистему дослідження навколишньго середовища і ресурсів для моніторингу стану техногенно-екологічної безпеки на об'єктах найбільш вразливих з точки зору ймовірності виникнення надзвичайних ситуацій, моніторингу екологічної ситуації в зоні ЧАЕС (у тому числі весняного паводку, лісових і торфових пожеж і т. ін.). Ця підсистема використовується в Українському інституті досліджень навколишнього середовища і ресурсів, який є однією з провідних установ з питань моніторингу техногенно-небезпечних об'єктів та екологічної безпеки.

Розроблені в дисертації програмні засоби використовуються в автоматизованій системі моніторингу і прогнозування економічних показників Українського фондового ринку, зокрема в Акціонерному товаристві закритого типу “Обрій Капітал”, яке займається операціями на Фондовому ринку, а також підтримує автоматизовану систему моніторингу і прогнозування деяких економічних показників Українського фондового ринку, що виконується в рамках автоматизованої системи електронного обігу цінних паперів в Україні.

Автором було розроблено і впроваджено програмне забезпечення для розв'язання задачі знаходження оцінок параметрів визначених ARIMA-моделей та побудови прогнозу поведінки ряду.

Апробація результатів роботи. Основні положення роботи доповідались і обговорювались на конференції “Комп'ютерне моделювання та інформаційні технології в науці, економіці та освіті”, м. Кривий Ріг, 2001 р. ; на наукових семінарах кафедри інформатики Київського національного університету технологій та дизайну; на засіданні наукового семінару “Прикладні методи системного аналізу” Інституту прикладного системного аналізу НТУУ КПІ.

Публікації. За матеріалами дисертаційної роботи опубліковано 5 друкованих робіт, з них 4 - у фахових виданнях, список яких затверджений ВАК України.

Особистий внесок здобувача. Всі наукові результати, включені в дисертаційну роботу, одержані автором особисто. У роботах [1], [2], [4], написаних у співавторстві, авторові належить розробка та реалізація алгоритмів, написання програм та проведення експериментальних досліджень за темою дисертації.

Структура та обсяг роботи. Дисертаційна робота обсягом 134 сторінки складається з вступу, п'яти розділів, висновків, списку використаних джерел (87 найменувань) та 3-х додатків.

ОСНОВНИЙ ЗМІСТ

часовий ряд побудова модель

У вступі обгрунтовано актуальність теми та доцільність роботи. Вказано мету роботи, наукову новизну та практичне значення одержаних результатів.

У розділі 1 “Обгрунтування необхідності застосування моделювання часових рядів при створенні автоматизованих систем моніторингу фондового ринку України та контролю за станом природного середовища” обгрунтовується необхідність застосування ARIMA-моделей як єдино доцільного засобу моделювання часових рядів та побудови прогнозу поведінки системи на фондовому ринку України та в інформаційно-експертних системах контролю за станом природного середовища.

Розвиток економіки постійно вимагає мобілізації, розподілу і перерозподілу фінансових ресурсів. У будь-якій країні, де економіка працює ефективно, цей процес здійснюється на ринку фінансових ресурсів. Ринок фінансових ресурсів об'єднує три головні складові: кредитний ринок, валютний ринок та ринок цінних паперів. Ринок цінних паперів є багатоаспектною соціально-економічною системою, на основі якої функціонує ринкова економіка в цілому. Він сприяє акумулюванню капіталу для інвестицій у виробничу і соціальну сфери, структурній перебудові економіки, позитивній динаміці соціальної культури суспільства, підвищенню достатку кожної людини шляхом володіння і вільного розпорядження цінними паперами, психологічній готовності населення до ринкових відносин.

В Україні ринок цінних паперів перебуває на стадії свого становлення. З січня 1992 року працює Українська фондова біржа (УФБ) з Центральним депозитарієм цінних паперів, мережею філій та брокерських контор по всій території України. З грудня 1993 року на біржі введена в дію система електронного обігу цінних паперів, яка не виключає можливості котирування матеріалізованих цінних паперів. Зростає кількість позабіржових фінансових посередників, торговців цінними паперами, інвестиційних фондів і компаній. Збільшується число емітентів (організацій, що випускають цінні папери), які зареєстрували випуск своїх цінних паперів у Міністерстві фінансів України, невпинно зростає загальний обсяг їх емісії.

В квітні 1994 року Кабінет Міністрів України затвердив “Концепцію функціонування і розвитку фондового ринку в Україні”. Указом президента від 25 травня 1994 року “Про електронний обіг цінних паперів і Національний депозитарій” законодавчо закріплене переміщення фінансових активів у дематеріалізованій формі та створення Всеукраїнського Національного депозитарію на базі Центрального депозитарію цінних паперів УФБ.

Одним з головних принципів функціонування фондового ринку є введення системи електронного обігу цінних паперів - їх дематеріалізованого обігу у формі комп'ютерних записів на рахунках через систему “національна фондова біржа - центральний депозитарій - кліринговий банк”. Система електронного обігу цінних паперів дозволяє без додаткових матеріальних затрат здійснювати будь-які операції з цінними паперами: випуски нових емісій, збільшення номіналу акцій, об'єднання цінних паперів при злитті акціонерних товариств, дроблення акцій, їх асиміляцію тощо. Їх головні характеристики - надійність, дешевизна, швидкість у випуску й обігу цінних паперів. Електронна система обігу цінних паперів дає змогу по кожній угоді відслідкувати всі етапи руху цінних паперів і грошових коштів - від банківських розпоряджень і угод між брокерами ринку до стандартизованих розрахунків.

На рис. 1. 1 зображено структуру функціональної схеми взаємодії інструментів та суб'єктів централізованого фондового ринку в Україні.

Рис. 1. 1. Система електронного обігу цінних паперів в Україні

В традиційній взаємодії складових елементів Української фондової біржі, провідними з яких є емітенти, інвестори та їх посередницькі структури, важливо органічно включити блок “Підсистема управління та інтерфейсу з користувачем” для визначення ефективності ділових угод для всіх учасників фондового ринку.

Для забезпечення функціонування блоку “Підсистема управління та інтерфейсу з користувачем” слід створити підсистему моделювання фінансових потоків та зустрічних потоків цінних паперів. Вказані потоки можуть бути представлені часовими рядами.

Дана система ефективно вписується і в мікроекономічні схеми взаємодії членів акціонерного товариства. “Підсистема управління та інтерфейсу з користувачем” рекомендується для використання при визначенні взаємодії акціонерів відкритих та закритих акціонерних товариств. Нехай, закрите акціонерне товариство здійснило емісію акцій з метою впровадження науково-технічних досягнень і новітніх технологій для подальшого нарощення і розвитку своєї виробничої бази. В наступних операціях акціонерне товариство здійснило розміщення своїх акцій членам і засновникам акціонерного товариства, які в даному випадку виступають інвесторами.

Для акціонерів робочим інструментом оцінки ефективності інвестицій у даній акції стає “Підсистема управління та інтерфейсу з користувачем”. Вона дозволяє здійснити прогнозну оцінку ефективності інвестованого проекту і вирішити питання його фінансування. Результат розрахунку прогнозу дозволяє акціонерам ефективно визначити величину прибутку і надати належну інформацію інвесторам та емітенту для наступного ефективного розподілу дивідентів.

Розглянемо загальну схему ринкової економіки фондової взаємодії (рис. 1. 2), яка дає уявлення та пояснює обіг акцій (облігацій), інших цінних паперів в акціонерному товаристві закритого типу, в якій використовується вищеописаний підхід для блоку “Підсистема управління та інтерфейсу з користувачем”.

Фонди ринку

Рис. 1. 2. Схема обігу цінних паперів в акціонерному товаристві закритого типу

Для успішного функціонування цієї структури необхідно запроваджувати новітні технології, а саме, прогнози, які зокрема можуть бути отримані завдяки запропонованій методиці.

В дисертаційній роботі розроблена система побудови експертно-оціночних модулів, яка пропонується також для використання в системі “ЕкоЕксперт”.

Оптимальним способом організації роботи блоку “Підсистема управління та інтерфейсу з користувачем”, є використання ARIMA-моделювання, тобто вхідні дані слід розглядати як часовий ряд. Модель управління розпадається на дві частини: задачу ідентифікації і задачу вибору оптимального керування.

До задачі вибору оптимального управління входять: задача ідентифікації вхідного ряду, тобто побудова адекватної моделі, що описує даний ряд, та задача вибору функціоналу якості оцінок. Побудову ARIMA-моделі, яка адекватно описує даний ряд, можна розглядати як етап ідентифікації. В свою чергу задача ARIMA-моделювання розпадається на п'ять складових частин: пошук класу моделей, визначення структури моделей відібраного класу, знаходження параметрів і оцінок складових моделі ковзного середнього, вибір моделі. Запропонований підхід можна зобразити за допомогою структурної схеми, наведеної на рис. 1. 3.

У розділі 2 “Огляд стану проблеми моделювання часових рядів за допомогою моделей авторегресії та проінтегрованого ковзного середнього” зроблено огляд літератури з проблеми моделювання часових рядів. Наведена історична довідка застосування методів регресійного аналізу часових рядів. Розглянуто основні підходи до проблеми оцінювання параметрів авторегресійних моделей: метод найменших квадратів та метод Юла-Уоккера. Розглянуто можливість використання гармонійного регресійного аналізу при вивченні періодичних часових рядів. Порівнюються різні підходи до визначення класу моделей, що адекватно описують вхідний часовий ряд спостережень досліджуваних процесів, методів визначення порядку процесів AR, MA, ARMA. Розглянуто можливості аналізу часових рядів за допомогою загальної лінійної моделі. Наведено приклади побудови моделей ковзного середнього та авторегресійної моделі першого та другого порядку та розглянуто можливість отримання ефективних оцінок для авторегресійних моделей та моделей ковзного середньго. Вивчено можливість використання авторегресії ковзного середнього для аналізу лінійних процесів. На основі аналізу літератури зроблено висновки про те, що недостатньо уваги приділяється питанню про визначення структури ARIMA-моделі, тобто кількості і складу запізнювань, кількості різниць і порядку ковзного середнього.

Рис. 1. 3. Структурна схема “Модель управління”

У розділі 3 “Розробка алгоритму вибору структури моделі авторегресії та проінтегрованого ковзного середнього” розглянуто можливість використання простого та часткового коефіцієнтів кореляції для визначення структури ARIMA-моделі.

Розглядається наступна ARIMA-модель

rxt-1 = 1rxt - l1 + … + prxt - lp + еt - 1еt-1 - 2еt-2 - … - qеt-q, (1)

де l1, …, lp - різні цілі невід'ємні числа (для визначеності будемо вважати, що l1 < … < lp), r- різницевий оператор зрушення порядку r такий, що r = xt - xt-1. Тобто ARIMA-модель з параметрами (p, r, q). Не порушуючи загальності, далі будемо вважати, що r = 0, тобто будемо розглядати модель ARIMA (p, 0, q), що має наступний вигляд:

xt+1 = 1xt - l1 + … +p xt - lp + еt - 1еt-1 - 2еt-2 - … - qеt-q. (2)

На першому етапі вважатимемо і = 0, i = 1, …, lp. Необхідно визначити p - кількість запізнювань, li - склад запізнювань та оцінити значення i. Для визначення p та li будуємо кореляційний ряд si. Порівнювалося два підходи.

Перший підхід.

Будуємо кореляційний ряд si, i =1, …, n - 1,

,

де , та .

Вибираємо номери p найбільших за модулем si і вважаємо, що це і є ті запізнювання, комбінації яких дадуть нам множину моделей, серед яких знаходиться адекватна. Відсортувавши їх за зростанням, матимемо номери l1, l2, …, lp запізнювань. Для зручності та прискорення подальших обчислень, пропонується побудувати коваріаційну матрицю наступним чином:

Записуємо ряд з n спостережень у вигляді таблиці 1.

Табл. 1.

Матриця спостережень

Y

Z1

Z2

Zp

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

Будуємо матрицю R розміром (p+1) (p+1), елементи якої

.

Подальша частина спільна для обох підходів, тому її буде розглянуто нижче.

Другий підхід.

Розглянемо можливість використання часткового коефіцієнта кореляції для побудови кореляційного ряду.

Частковий коефіцієнт кореляції дозволяє оцінити ступінь тісноти лінійного зв'язку між двома змінними, не залежної від непрямого впливу інших факторів. Для його розрахунку необхідна вихідна інформація як за парою змінних, так і за всіма тими змінними, безпосередній (“той, що заважає”), вплив яких ми хочемо елімінувати.

Без обмеження загальності будемо вважати, що l1 = 1, l2 = 2, …, lm = m, тоді

,

де vij - елементи матриці V = R-1.

Виходячи з властивостей матриці R, отримання матриці V є відносно нескладним завданням. В даній роботі V знаходилась за методом квадратного кореня. Як і в попередньому випадку, вибираємо номери pнайбільших за модулем si. Для уточнення (звуження) множини моделей, які розглядаємо, так як вона є вже достатньо вузькою, застосовано метод повного перебору, оскільки основна інформація для роботи методу міститься в матриці R.

Процедура обведення дає змогу здійснити перебір моделей з визначеної множини за прийнятний час, використовуючи інформацію один раз обчисленої коваріаційної матриці.

Знайдено МНК-оцінки запізнень для моделей визначеного класу.

На основі проведених чисельних експериментів над рядами відомої структури, отримано наступні результати:

- перший підхід: в 62% випадків (в межах проведеного експерименту) отримана множина запізнювань, що складалась із 6 найкращих, не містила жодного з істинних запізнювань досліджуваної моделі, хоча і дві-три моделі достатньо точно імітують вихідний ряд;

- другий підхід завжди давав змогу точно (в межах проведеного експерименту) отримати параметри вихідної моделі. Множина моделей для повного перебору не перевищує 6 запізнювань, якщо кількість реальних запізнювань не перевищує 5.

У розділі 4 “Оцінювання коефіцієнтів моделі авторегресії та проінтегрованого ковзного середнього” запропоновано алгоритм уточнення параметрів моделей отриманих в попередньому розділі, а також вибору найкращої моделі, що адекватно описує досліджуємий процес.

Розглядається питання вибору функціоналу якості оцінок. Він очевидно залежить від припущень щодо процесу, який моделюється, а також від мети, для якої ця модель створюється. З того факту, що процес описується рівнянням (1), не витікає, які оцінки для його параметрів 1, …, p, 1, …, q є найкращими. Перше запитання, на яке слід відповісти, є питання про те, що ми спостерігаємо. Найпростішим і найрозповсюдженішим є припущення, що ми спостерігаємо саме незбурені значення xk. В подальшому також дотримуватимемося цього припущення. Воно приводить до наступної побудови функціоналу якості оцінки параметрів моделі (1) (МНК-оцінки).

Нехай маємо спостереження x1, …, xn. Безпосередньо з (1) випливає, що

(3) .

Якщо припущення про функцію розподілу випадкових величин ?k,, k = 1, …, n - 1 прийнято, для них можна було б записати функцію правдоподібності. Функція розподілу не постулюється, але фактично використовується функціонал, до якого зводиться логарифмічна функція правдоподібності, взята зі знаком мінус, у припущенні нормальності шуму:

(4)

який власне і слід мінімізувати.

Головна проблема оцінювання полягає в тому, що, по-перше, значення k, k = 1, …, q + lp, не спостерігаються, а отже їх треба оцінювати, виходячи з мінімізації функціоналу, а по-друге, що зрештою і є головним - значення k, k = 1 - q + lp, …, n - 1, також не спостерігаються і їх слід оцінювати, виходячи з мінімізації того ж функціоналу, але, крім того, обчислювати їх за допомогою рекурентної формули (3). Формула (3) є лінійним різницевим рівнянням щодо змінної k і його розв'язок можна записати у загальному вигляді як лінійну комбінацію k-х степенів коренів характеристичного многочлена різницевого рівняння (3). Проте останнє ніяким чином не допомагає у мінімізації принаймні з двох причин. Перша з них очевидна - корені характеристичного рівняння в разі, якщо його порядок перевищує 4, згідно з теоремою Абеля, у загальному випадку не виражаються через коефіцієнти характеристичного рівняння. Друга причина полягає в тому, що навіть у разі, коли корені виражено через коефіцієнти, функціонал (4) після підстановки у нього аналітичних виразів для k, k = 1 - q + lp, …, n - 1, перетворюється на достатньо складну для мінімізації функцію. Наведеними причинами пояснюється те, що при оцінюванні параметрів загальний розв'язок різницевого рівняння (3) не використовується.

Існують різні чисельні алгоритми оцінювання параметрів. Але їхньою головною особливістю є те, що оцінки для k, k = 1, …, q + lp, не отримуються, а вважаються рівними нулю. Таке припущення не створює значних збурень, а оцінки для k, k = 1 + q + lp, …, n - 1, отримують за допомогою рекурентної формули (3).

Запропоновано використовувати як алгоритм оцінювання параметрів ARIMA-моделі метод Недлера і Міда прямого пошуку по симплексу, що деформується або S2-метод. Для порівняння їх ефективності розглядається ця ж модель:

xk = k+1 k-1+2 k-2+ 3 k-3.

Причиною такого вибору є те, що функція, яку слід мінімізувати, надто відрізняється від квадратичної, отже алгоритми типу Ньютона-Рафсона не можуть бути ефективними.

В методі Недлера і Міда мінімізується функція n незалежних змінних з використанням n + 1 вершин многогранника, що деформується, в Еn. Кожна вершина може бути ідентифікована вектором с. Вершина (точка в Еn), в якій значення f (с) максимальне, проектується через центр ваги (центроїд) вершин, які залишились. Покращені (менші) значення цільової функції знаходяться послідовною заміною точки з максимальним значенням f (с) на “кращі” точки, поки на буде знайдений мінімум f (с).

Запропонований нижче алгоритм призначено для розв'язання задачі оцінювання як структури, так і коефіцієнтів ARIMA-моделі. Його може бути умовно розділено на 4 частини:

1- знаходження оцінок коефіцієнтів 1, …, p;

2- знаходження оцінок коефіцієнтів 1, …, q;

3- визначення початкових значень t-1, …, t-q для t = t0;

4- оцінка адекватності отриманих моделей.

Якщо в процесі побудови моделей було отримано модель, в якій i = 0 (i = 1, …, p), вважається, що отримано модель типу MA, якщо в моделі i = 0 (i = 1, …, q), вважається, що отримано модель типу AR, якщо в побудованій моделі є ненульові i і i то отримана модель належить до класу ARMA (або ARIMA залежно від того яку модель вибрано: (1) чи (2)).

Алгоритм побудови адекватної моделі, що описує часовий ряд

Крок 1. Побудова коваріаційної матриці R.

Для уникнення ситуації переповнення при обчислювальному процесі (тобто в випадках, коли n - велике число, а ряд спостережень xi може приймати достатньо великі значення) пропонується нормувати ряд xi так, щоб xi [0, 1]. Для цього кожний елемент ряду xi ділиться на max{| x1|, …, | xn |}.

Представимо ряд спостережень xi у вигляді коваріаційної матриці, наведеної вище.

Значення p вибирається з припущення, що максимальний номер запізнення lp m, також треба мати на увазі, що n > 2m + 1. Будується коваріаційна матриця Rm+1, m+1, де

rij = , i = 0, …, m; j = 0, …, m.

Крок 2. Визначаємо множини структур запізнень.

Виходячи з властивостей матриці R, обчислимо V = R-1 за методом квадратного кореня.

Для визначення структури = ( i) обчислюються часткові коефіцієнти кореляції cori = -v1, i / і сортуються отримані cori за спаданям. Для підвищення достовірності отриманих результатів пропонується ряд xi розглядати з деяким початковим шумом, тобто = xi + i, де i [-h, h] рівномірно розподілена випадкова величина.

На основі проведених експериментів з даними заздалегідь відомої структури та шумом що не перевищує 10% середнього значення ряду спостережень та кількості складових моделі ковзного середнього не більше 5, можна зробити висновок, що отриманий таким чином ряд з 6 перших значень cori включає в себе номери запізнень вхідного ряду. А отже подальший вибір параметрів шуканої моделі зводиться до розгляду різних комбінацій з множини 6 номерів запізнень (позначимо їх як l1, …, l6). Тобто, якщо визначення структури моделі в загальному випадку є задачею експоненційної складності, то запропонований алгоритм дає змогу звести її фактично до задачі поліноміальної складності.

Крок 3. Визначаємо номери коефіцієнтів запізнень адекватної моделі.

На даному етапі розглядаються всі можливі варіанти моделей, які можна отримати з відібраних на попередньому кроці, та обчислюється значення коефіцієнтів запізнювань і критерій адекватності для кожної моделі. Перебір моделей здійснюється за методом окаймлення.

Для кожної моделі обчислюється критерій crit = i2 / (n - p), або crit= i2 / (n - p) ln (n) (обговорення вибору конкретного критерію виходить за рамки дисертаційної роботи) та вибирається певна фіксована кількість моделей, наприклад, 6 з найменшими значеннями crit.

Крок 4. Знаходимо оцінки 1, …, n.

Виходячи з практичних міркувань далі розглядались випадки, коли r = 0, r = 1, r = 2, тобто не порушуючи загальності вважаєьтся, що на практиці більше 3х складових моделі ковзного середнього в задачах не зустрічається. Отже, для кожної відібраної на попередньому кроці моделі досліджуються моделі з різним порядком ковзного середнього:

xt = 1xt-l1 + 2xt-l2 + … + pxt-lp + t;

xt = 1xt-l1 + 2xt-l2 + … + pxt-lp + t + 1t-1;

xt = 1xt-l1 + 2xt-l2 + … + pxt-lp + t + 1t-1 + 2t-2;

Для двох останніх рядів за допомогою методу S2 (описанного вище) знаходяться оцінки i.

Крок 5. Обчислюємо оцінки ;

На попередніх кроках заходились оцінки i та i, виходячи з того, що = 0 та = 0. На даному етапі вважаючи, що i та i відомі, знайдемо оцінки та , виходячи з того, що min і i для i = lp, …, n є функціями i (). Розв'язок задачі знаходиться також за допомогою методу S2.

Кроки 4-5 повторюються доти, поки оцінки отримані на двох сусідніх ітераціях змінюватимуться істотно.

Крок 6. Здійснюємо вибір адекватної моделі.

Використовуючи значення ряду x1, …, xlp, а також значень оцінок i, i та t-1, t-2, будуємо ряд , i = lp+1, n. За критерій адекватності отриманих моделей вхідним даним приймається min.

Крок 7. Закінчуємо роботу за алгоритмом.

При застосуванні описаного вище алгоритму для рядів невідомої структури з'ясувалося, що не для всякого ряду представленого як (1), можна точно знайти оцінки параметрів моделі, тобто якщо вхідний ряд спостережень не є стаціонарним, то потрібно розглядати модель (2).

В результаті роботи алгоритму з отриманої множини вибирається модель, що адекватно описує часовий ряд та оцінються невідомі початкові значення шумів.

У розділі 5 “Підсистема управління та інтерфейсу з користувачем” дається порівняльний аналіз методів прогнозування часових рядів та запропоновано оригінальний метод практичного застосування результатів, отриманих в попередніх розділах.

Знаходячись в стані прогнозування, неможливо отримати оцінку для шуму (це різниця між прогнозним і спостережним значенням), а оцінка шуму входить як складова до прогнозної ARIMA-моделі.

Прогнозоване значення може змінюватись в достатньо широкому діапазоні. Виникає питання: що тоді є прогноз? Прогноз тут не конкретне значення вихідної величини, а функція розподілу прогнозованої величини в кожний момент часу.

Теоретичне обчислення функції розподілу є самостійною задачею і в дисертації не розглядається. Використовується альтернативний підхід, який базується на побудові емпіричної функції розподілу.

Статистичний підхід реалізується в формі методу Монте-Карло. Здійснюється це наступним чином: генерується послідовність випадкових чисел, розподілених за цим же законом, що і шуми на навчальній множині спостережень, і з оціненими на цій же множині параметрами функції розподілу. Далі для кожної реалізації згенерованого таким чином шуму, обчислюється прогноз для кожної точки t = n + 1, n + 2, …. Таких прогнозів будується стільки, скільки згенеровано реалізацій шуму. Нехай s - кількість реалізацій шуму. За таких умов кожному моменту часу t відповідає s значень прогнозу. За цією множиною s значень прогнозу можна збудувати емпіричну функцію розподілу, яку і вважатимемо прогнозом, отриманим за допомогою ARIMA-моделі. У цієї функції розподілу є середнє значення, медіана і інші статистичні характеристики, які в разі потреби можна вважати за точковий прогноз, а таку характеристику як стандартне відхилення вважати характеристикою його точності.

У більшості практичних задач нульова гіпотеза про те, що емпірична функція розподілу оцінок шумів на навчальній множині має нормальний закон, на реалістичних рівнях значимості критерієм ч2 не відкидається.

Якщо цей факт має місце, то можна оцінити параметри нормального розподілу - середнє значення і дисперсію. І надалі при побудові прогнозу ми маємо вправо генерувати реалізації шуму у відповідності з нормальним законом з оціненими значеннями параметрів.

Цей підхід реалізовано на прикладі щотижневої вартості акцій однієї з компаній, що входить до числа провідних на Нью-Йоркській біржі, за 1996 рік. Дані отримано через мережу INTERNET, http//www. bog. frb. fed. us. /release/zl/data.

Для експериментальної перевірки цього підходу було згенеровано дані за відомою ARIMA-моделлю і перевірено ефективність прогнозу за цими даними. Випадкову величину, розподілену за нормальним законом, отримано за допомогою вбудованих функцій Excel: СЛЧИС () та НОРМОБР () таким чином - НОРМОБР (СЛЧИС (), , ).

В запропонованому алгоритмі прогноз будується по крокам наступним чином:

Крок 1. Обчислюємо значення zn (в нашому випадку n = 52) як zn =, де - істинне значення ряду в точці n, - оцінка значення ряду, отримана в результаті моделювання ряду за обчисленими раніше параметрами;

Крок 2. Генеруємо 100 реалізацій zi, i = n + 1, …, m (де m - кількість точок, що прогнозуються) у відповідності з нормальним законом з параметрами (, ) ;

Крок 3. Обчислюємо значення i = n + 1, …, m за визначеними параметрами адекватної моделі для кожної зі 100 реалізацій; середнє значення по ансамблю реалізацій оголошено прогнозом.

Крок 4. Закінчення роботи алгоритму

Вважаємо, що отримані таким чином і є шуканим прогнозом поведінки ряду. Для визначення достовірності отриманого прогнозу, знаючи (в нашому випадку) істинні значення ряду будуємо стандартне відхилення прогнозу наступним чином: si =.

В результаті проведеного експерименту отримано наступний результати:

- якщо часовий ряд не стаціонарний, то для для його опису не вдається побудувати адекватну модель. Це доводить необхідність використання різниць, тобто переходу від моделі (2) до моделі записаної у вигляді (1) ;

- реальний процес починає відхилятися від прогнозу звичайно вже після 4, 5 кроку завбачення, що збігається з теоретичними розрахунками та доводить правильність побудованої моделі.

У висновках сформульовано основні результати і вказані шляхи їх можливого застосування.

ВИСНОВКИ

Основні результати дисертаційної роботи полягають у наступному:

Досліджено методи вибору кількості і складу запізнювань, що входять до прогнозної моделі. При цьому з'ясовано, що використання звичайного коефіцієнту кореляції не дає змоги побудувати достатньо вузький клас моделей, який містить адекватну модель. Використання часткового коефіцієнту кореляції дає змогу виділити номери запізнювань, що входять в адекватну модель. Причому, як показали дослідження, з достатньо високою ймовірністю, запізнювання адекватної моделі знаходяться серед відібраних з його допомогою запізнювань. Тим самим подолано проблему NP повноти задачі перебору всіх можливих запізнювань.

Розроблено чисельний алгоритм і програму виділення класу моделей, який містить модель, що адекватно описує часовий ряд. Знайдено метод оптимізації для оцінювання параметрів ARIMA-моделей. Серед розглянутих алгоритмів найвищу ефективність показав метод симплексів Недлера і Міда (S2-метод), що не належить до класу градієнтних методів.

Розроблено програму, що реалізує алгоритм Недлера і Міда. Програма застосована для пошуку оптимального плану дискримінуючого експерименту.

Збудовано підсистему управління та інтерфейсу з користувачем, яка послідовно здійснює: вибір кількості і складу запізнювань; оцінку значення запізнювань; розглядає кожну із моделей побудованого класу послідовно із одним та двома шумами, оцінивши при цьому значення коефіцієнтів при шумах; оптимізує значення початкових шумів; вибирає модель, що адекватно описує вхідний ряд; будує прогноз поведінки ряду в середньому.

Універсальність розробленої системи прогнозування часових рядів дозволила використати її як у системі електронного обігу цінних паперів, так і в автоматизованій системі контролю навколишнього середовища.

ОСНОВНІ РОБОТИ, ОПУБЛІКОВАНІ ЗА ТЕМОЮ ДИСЕРТАЦІЇ

Ю. П. Юрачківський, Т. І. Демківська. Чисельний алгоритм типу S2 побудови оптимального за критерієм розрізнення дискримінуючого експеримента // Моделювання та інформаційні технології: Зб. наук. пр. ІПМЕ НАНУ- К. : вип. 4. - 1999. -С. 33-40.

Ю. П. Юрачківський, Т. І. Демківська. Один метод пошуку оптимальної за структурою ARIMA-моделі. // Зб. наук. пр. Інститут проблем моделювання в енергетиці НАНУ -К. : вип. 9. -2000. - С. 66-71.

Т. І. Демківська. Стан проблеми вибору класу і структури ARIMA-моделі. // Вісник ДАЛПУ. 2000 р. - № 2. - С. 175-178.

Т. І. Демківська, А. Б. Демківський. Побудова прогнозу ціни акцій однієї з компаній за допомогою ARIMA-моделі. // Вісник КДУТД. - 2001 р. - № 2. -С. 90-94.

АНОТАЦІЇ

Демківська Т. І. Методи та засоби прогнозування екологічних та економічних процесів на основі комп'ютерного моделювання часових рядів. Рукопис дисертації на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05. 13. 06 - автоматизовані системи управління та прогресивні інформаційні технології - Київський інститут проблем моделювання в енергетиці ім. Г. Є. Пухова Національної академії наук України, Київ, 2001 р.

Дисертацію присвячено проблемі прогнозування економічних та екологічних процесів за допомогою ARIMA-моделей, які здобули загальне визнання як адекватний математичний апарат для опису багатьох природних і економічних процесів, що описуються скалярними і векторними часовими рядами. Досліджено різноманітні підходи до автоматизації вибору класу і структури ARIMA-моделей. Експериментально підтверджено доцільність використання часткового коефіцієнта кореляції для знаходження структури моделі, що дає змогу без участі оцінок фахівців і емпіричних висновків побудувати достатньо вузький клас моделей. Розроблено чисельний алгоритм і програму виділення класу, який містить модель, що адекватно описує часовий ряд. Здійснено цілеспрямований пошук методів оптимізації, призначених для оцінювання параметрів ARIMA-моделей. Показано, що серед розглянутих алгоритмів найвищу ефективність має метод S2, який не належить до класу градієнтних методів. Розроблено алгоритм побудови прогнозу і здійснено його чисельну реалізацію.

Ключові слова: комп'ютерне моделювання, методи прогнозування, авторегресійні моделі, моделі ковзного середнього, частковий коефіцієнт кореляції, оцінювання параметрів.

Demkivska T. I. Methods and means of prediction of ecological and economical proceses on the based on time series computer simulation. Thesis for the candidates by the speciality 05. 13. 06 - automated control systems and progressive information technologies - Institute of Simulation Problems in Power Еngineering, National Academy of Science of Ukraine, Kyiv 2001.

The dissertation is devoted to the problem of economical and ecological processes forecasting with the help of ARIMA-models. These models have received a common recognition as the adequate mathematical approach for the description of many natural and economic processes, which are described by scalar and vector time series. The various approaches to automation of ARIMA-models choice class and structure are investigated. The expediency of particular correlation coefficient use for search of model structure is experimentally confirmed. This gives an opportunity to construct a rather narrow class of models without participation of experts estimation and empirical conclusions. The numerical algorithm and computer program are developed for choice of the model, which adequately describes a time series. The purposeful search of optimization methods, for estimation of parameters of ARIMA-models is carried out. Among the considered algorithms the S2 method, which does not belong to a class of gradient methods has the highest efficiency. The algorithm of construction of the forecast is created and its numerical computer realization is carried out.

Key words: computer simulation, the methods of prediction, auto regression model, moving average of model, particual coefficient of correlation, a estimating of parameters.

Демковская Т. И. Методы и средства прогнозирования экологических и экономических процессов на основании компьютерного моделирования временных рядов. Рукопись диссертации на соискание ученой степени кандидата технических наук по специальности 05. 13. 06 - автоматизированные системы управления и прогрессивные информационные технологии - Киевский институт проблем моделирования в энергетике им. Г. Е. Пухова Национальной академии наук Украины, Киев 2001 г.

Диссертация посвящена проблеме прогнозирования экономических и экологических процессов при помощи ARIMA-моделей, которые получили общее признание как адекватный математический аппарат для описания многих природных и экономических процессов, которые описываются скалярными и векторными временными рядами.

Проблема прогнозирования временных рядов принадлежит к классическим задачам прикладного статистического анализа. Количество научных публикаций и прикладных работ в этом направлении не только не уменьшается в последнее время, но и увеличивается как в нашей стране, так и за рубежом. Наблюдается также в последнее время увеличение интереса к широко известной технике построения моделей, которую принято называть ARIMA-моделированием. Достаточно сказать, что эта аббревиатура на сегодняшний день не требует расшифровки не только для специалистов в области прикладной статистики, но и во многих других предметных областях.

В данной диссертационной работе исследованы разнообразные подходы к автоматизации класса и структуры ARIMA-моделей, методы выбора количества и состава запаздываний. При этом выяснено, что использование обычного коэффициента корреляции не предоставляет возможности построить достаточно узкий класс моделей, который содержит адекватную модель. Использование частного коэффициента корреляции позволяет построить двухэтапную процедуру. На первом этапе выбирается возможный состав запаздываний, на втором этапе в этом достаточно узком классе определяется структура модели, которая адекватно описывает временной ряд.

Разработан численный алгоритм и программа выделения класса моделей, которая содержит модель, адекватно описывающую временной ряд.

Для выбора наилучшей структуры из определенного класса моделей использована процедура окаймления, которая предоставляет возможность осуществить перебор моделей из определенного класса за приемлемое время, используя информацию один раз вычисленной ковариационной матрицы.

Осуществлен целенаправленный поиск методов оптимизации, которые предназначены для оценивания параметров ARIMA-моделей. Среди рассмотренных алгоритмов наиболее высокую эффективность показал метод Недлера и Мида поиска по симплексу (или S2 метод), который не принадлежит к классу градиентных методов.

Разработана программа, которая реализует алгоритм Недлера и Мида. Программа применена для поиска оптимального плана дискриминирующего эксперимента. Экспериментальные исследования показали, что эффективность этого алгоритма выше, чем эффективность встроенного в Excel алгоритма поиска решений.

Созданы единый целостный алгоритм и программа, которая решает следующие задачи:

осуществляет выбор количества и состава запаздываний;

оценивает значения запаздываний;

рассматривает каждую из моделей построенного класса последовательно с одним или двумя шумами, оценив при этом значения коэффициентов при шумах;

оптимизирует значения начальных шумов;

выбирает модель, которая адекватно описывает входной ряд;

строит прогноз поведения ряда в целом.

С помощью алгоритма построения прогноза осуществлено прогнозирование 2-х реальных временных рядов: стоимости акций на Нью-Йоркской фондовой бирже, а также искусственно созданного ряда, параметры которого совпадают с параметрами первого из упоминаемых рядов. Осуществлено сравнение прогнозов и сделан вывод о равной прогнозирующей силе с точки зрения упреждения созданного прогноза обеих прогнозирующих моделей.

Ключевые слова: компьютерное моделирование, методы прогнозирования, авторегресссионные модели, модели скользящего среднего, частный коэффициент корреляции, оценивание параметров.

Размещено на Allbest.ru


Подобные документы

  • Використання комп'ютерного моделювання. Особливості проектування моделі автоматичної системи управління технологічним процесом. Визначення кількості пропущених через відмову даних та часу знаходження системи в загальмованому стані. Опис алгоритму моделі.

    контрольная работа [501,7 K], добавлен 13.01.2014

  • Політичне прогнозування як процес розробки науково обгрунтованого судження про ймовірносний розвиток політичних подій, шляхи і терміни його здійснення. Можливості комп'ютерного моделювання - системний підхід. Моделі та методи моделювання, їх використання.

    контрольная работа [26,0 K], добавлен 13.03.2013

  • Побудова моделі процесів системи. Відображення користувачів і їхніх функцій, підметів автоматизації в прив'язці до структури системи. Відображення структури інформаційних та фізичних об'єктів системи та їх взаємозв’язків. Побудова моделі станів системи.

    курсовая работа [125,2 K], добавлен 03.10.2008

  • Визначення найкращого режиму роботи системи обробки повідомлень. Представлення моделі у вигляді системи масового обслуговування. Визначення структури моделі. Обмеження на зміну величин. Програмна реалізація імітаційної моделі. Оцінка адекватності.

    курсовая работа [153,9 K], добавлен 29.01.2013

  • Модель – це прообраз, опис або зображення якогось об'єкту. Класифікація моделей за способом зображення. Математична модель. Інформаційна модель. Комп'ютерна модель. Етапи створення комп'ютерної моделі.

    доклад [11,7 K], добавлен 25.09.2007

  • Аналіз параметрів та характеристик аудіо та відео кодеків. Аналіз параметрів протоколів сигналізації медіатрафіку та мережного рівня медіа систем. Вербальні моделі взаємодії відкритих систем. Математичні моделі процесів інкапсуляції та передачі даних.

    курсовая работа [573,9 K], добавлен 22.03.2015

  • Конкурентоспроможність страхового продукту та ринку. Фазифікація та дефазифікація. Етапи моделювання комплексної оцінки конкурентоспроможності компанії. Комп’ютерна реалізація моделі. Графіки функцій належності гаусівського типу вхідних змінних системи.

    курсовая работа [1,7 M], добавлен 14.06.2014

  • Формалізація моделі виробничої діяльності підприємства. Рішення за допомогою Excel. Алгоритм розрахунку моделі. Побудова моделі рішення за допомогою "С++". Знаходження оптимальної програми функціонування підприємства. Розробка коду програми.

    контрольная работа [720,1 K], добавлен 12.06.2015

  • Створення інформаційної системи для магазинів, які займаються реалізацією музичної продукції. Проектування моделі "сутність-зв'язок" (ER-модель) та на її основі розробка реляційної моделі бази даних. Інструкція для користувача програмним продуктом.

    курсовая работа [2,4 M], добавлен 08.09.2012

  • Розгляд принципів моделювання для дослідження роботи гідроакумулятора в системах водопостачання. Опис математичної моделі для підбору гідроакумулятора. Створення графічної моделі процесу вмикання та вимикання насосу, комп’ютерної в середовищі Delphi.

    курсовая работа [392,4 K], добавлен 08.12.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.