Динамічні ряди та їх застосування
Компоненти мультиплікативної моделі динамічних рядів. Згладжування динамічних рядів. Обчислення тренду за допомогою авторегресії, методу найменших квадратів та прогнозування, сезонних даних. Обчислення лінійного, квадратичного та експоненціального тренда.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | украинский |
Дата добавления | 07.05.2011 |
Размер файла | 2,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Міністерство освіти і науки України
Рівненський державний гуманітарний університет
Кафедра інформатики та прикладної математики
КУРСОВА РОБОТА
на тему:
«Динамічні ряди та їх застосування»
Виконала: студентка 4 курсу
спеціальності «Інформатика», гр. І-42
Паш Руслана Михайлівна
Науковий керівник: к.ф.-м.н., доцент
Соколовська Ольга Петрівна
Рівне - 2011
ЗМІСТ
Вступ
1. Динамічні ряди. Основні поняття
1.1 Прогнозування в бізнесі
1.2 Компоненти класичної мультиплікативної моделі динамічних рядів
1.3 Згладжування динамічних рядів
1.4 Обчислення трендів за допомогою методу найменших квадратів і прогнозування
1.5 Обчислення тренду за допомогою авторегресії та прогнозування
1.6 Вибір адекватної моделі прогнозування
1.7 Прогнозування динамічних рядів на підставі сезонних даних
2. Застосування таблиць Еxcel у реалізації теорії динамічних рядів
2.1 Обчислення плинних середніх
2.2 Обчислення експоненціально згладжених величин
2.3 Обчислення лінійного тренда
2.4 Обчислення квадратичного тренда
2.5 Обчислення експоненціального тренда
2.6 Вибір моделі на основі різниць першого і другого порядку, а також відносних різниць
2.7 Обчислення тренда за допомогою авторегресії та прогнозування
2.8 Вибір адекватної моделі прогнозування
2.9 Прогнозування динамічних рядів на підставі сезонних даних
Висновки
Література
ВСТУП
Сучасне суспільство постійно відчуває потребу необхідності прогнозування. Наприклад, для проведення правильної політики, члени уряду повинні прогнозувати рівні безробіття, інфляції, промислового виробництва, податків окремих осіб та корпорацій. Для визначення потреб в устаткуванні та персоналі, директора авіакомпаній повинні правильно передбачити об'єм авіаперевезень. Для створення достатньої кількості місць в гуртожитку, адміністрація університету повинна знати, скільки студентів вступлять до їх навчального закладу в наступному році.
Існують два загальноприйняті підходи до прогнозування: якісний і кількісний. Методи якісного прогнозування (qualitative forecasting methods) особливо важливі, якщо дослідник не має доступу до кількісних даних. Як правило, ці методи носять вельми суб'єктивний характер.
Якщо досліднику доступні дані про історію об'єкту дослідження, використовують методи кількісного прогнозування (quantitative forecasting methods). Ці методи позволяють передбачити стан об'єкту в майбутньому на підставі даних про його минуле. Методи кількісного прогнозування розділяють на дві категорії: аналіз динамічних рядів і методи аналізу причинно-наслідкових залежностей [4].
Метою курсової роботи «Динамічні ряди та їх застосування» є систематизація та поглиблення знань з теорії ймовірностей та математичної статистики; засвоєнню нової теми, яка не вивчається в програмному курсі теорії імовірностей і математичної статистики; використання комп'ютерних технологій у реалізації теорії динамічних рядів.
Курсова робота містить: вступ, розділ 1 «Динамічні ряди. Основні поняття», розділ 2 «Застосування таблиць Excel у реалізації теорії динамічних рядів», висновки та список використаної літератури.
В розділі 1 «Динамічні ряди. Основні поняття» дано основні поняття та означення з теорії динамічних рядів, описано загальноприйняті підходи до прогнозування динамічних рядів - метод плинних середніх, метод експоненціального згладжування, лінійна, квадратична та експоненціальна моделі, а також авторегресійна модель. Показано використання методу найменших квадратів для прогнозування місячних та квартальних динамічних рядів.
В розділі 2 «Застосування таблиць Excel у реалізації теорії динамічних рядів» здійснено постановку задачі та побудовано графік спостережень, тренд динамічного ряду, реалізовано: метод плинних середніх, метод експоненціального згладжування, лінійна, квадратична та експоненціальна моделі, а також авторегресійні моделі першого, другого та третього порядків, регресійна модель, що має фіктивні змінні, відповідні сезонному компоненту засобами Microsoft Excel та описано покрокова побудова відповідних моделей прогнозування.
Список використаних джерел містить 6 найменувань.
1. ДИНАМІЧНІ РЯДИ. ОСНОВНІ ПОНЯТТЯ
1.1 ПРОГНОЗУВАННЯ В БІЗНЕСІ
Оскільки економічні умови з часом змінюються, менеджери повинні прогнозувати вплив цих змін на певну компанію. Одним із методів, що дозволяє забезпечити точне планування, є прогнозування (forecasting). Не дивлячись на велику кількість розроблених методів, всі вони переслідують одну мету - передбачити події, які відбудуться в майбутньому, що дозволить врахувати їх при розробці планів і стратегій розвитку компанії.
Динамічний ряд (time series) - це набір числових даних, отриманих протягом послідовних періодів часу [1].
Метод аналізу динамічних рядів (time-series forecasting methods) дозволяє передбачити значення числової змінної на підставі її минулих та дійсних значень.
Наприклад, щоденні котирування акцій на Нью-Йоркській фондовій біржі утворюють динамічний ряд. Іншим прикладом динамічного ряду є щомісячні значення індексу споживчих цін, щоквартальні величини валового внутрішнього продукту і щорічні доходи від продажів якої-небудь компанії.
Методи аналізу причинно-наслідкових залежностей (causal forecasting methods) дозволяють визначити, які чинники впливають на значення прогнозованої змінної. До них відносяться методи множинного регресійного аналізу із змінними, що запізнюються, економетричне моделювання, аналіз лідируючих індикаторів, методи аналізу дифузійних індексів і інших економічних показників. Розгляд цих методів виходить не входить в завдання даної роботи, тому основну увагу приділено методам прогнозування на підставі аналізу динамічних рядів.
1.2 КОМПОНЕНТИ КЛАСИЧНОЇ МУЛЬТИПЛІКАТИВНОЇ МОДЕЛІ ДИНАМІЧНИХ РЯДІВ
Основне припущення, що лежить в основі аналізу динамічних рядів, полягає в наступному: фактори, що впливають на досліджуваний об'єкт в сьогоденні і минулому, впливатимуть на нього і в майбутньому. Таким чином, основна мета аналізу динамічних рядів полягає в ідентифікації та визначенні факторів, які мають значення для прогнозування.
Аби досягти цієї мети, було розроблено багато математичних моделей, призначених для дослідження коливань компонентів, що входять в модель динамічного ряду. Ймовірно, найбільш поширеною є класична мультиплікативна модель (classical multiplicative model) для щорічних, щоквартальних і щомісячних даних. Для демонстрації класичної мультиплікативної моделі динамічних рядів розглянемо дані про фактичні валові доходи компанії А за період з 1989 по 2008 роки (табл. 1.1).
Рік |
Дохід |
Рік |
Дохід |
Рік |
Дохід |
|
1989 |
1587,7 |
1996 |
1936,9 |
2003 |
1865,2 |
|
1990 |
1558,0 |
1997 |
1684,7 |
2004 |
1636,7 |
|
1991 |
1752,0 |
1998 |
1488,0- |
2005 |
1652,8 |
|
1992 |
1407,5 |
1999 |
1562,2 |
2006 |
1699,0 |
|
1993 |
1309,9 |
2000 |
1618,5 |
2007 |
1698,0 |
|
1994 |
1434,0 |
2001 |
1686,6 |
2008 |
1523,0 |
|
1995 |
1676,6 |
2002 |
1840,9 |
Табл 1.1. Доходи компанії А в 1989-2008 роках (млн. грн.).
Рис. 1.1. Графік фактичного валового доходу компанії А (млн. грн. в поточних цінах) за період з 1989 по 2008 роки.
Як бачимо, впродовж 20 років фактичний валовий прибуток компанії мав зростаючу тенденцію. Ця довготривала тенденція називається трендом (trend) [1].
Тренд - не єдиний компонент динамічного ряду. Окрім нього, дані мають циклічний і нерегулярний компоненти. Циклічний компонент (cyclical component) описує коливання даних вгору і вниз, часто корелюючи з циклами ділової активності. Його довжина змінюється в інтервалі від 2 до 10 років. Інтенсивність, або амплітуда, циклічного компонента також не постійна. У деякі роки дані можуть бути вище за значення, передбачене трендом (тобто знаходитися в околі піку циклу), а в інші роки - нижче (тобто бути на дні циклу). Будь-які спостережувані дані, що не лежать на кривій тренду і не підкоряються циклічній залежності, називаються іррегулярними або випадковими компонентами (irregular, or random, component). Якщо дані записуються щодня або щокварталу, виникає додатковий компонент, який називають сезонним (seasonal component) [3].
Всі компоненти, що впливають на динамічні ряди наведені в таблиці 1.2:
Компонент |
Вид |
Означення |
Причини |
Термін |
|
Тренд |
Систематичний |
Описує довготривале зростання або спадання даних |
Зміни технології, населення, благополуччя, ринкових цін. |
Декілька років |
|
Сезонний |
Систематичний |
Описує чітко визначені періодичні коливання, що трапляються щорічно |
Погодні умови, соціальна поведінка, релігійні звички. |
Протягом року (можливо також, квартал або місяць). |
|
Циклічний |
Систематичний |
Коливання, які повторюються и мають чотири фазі: пік (розквіт), спадання (рецесія), дно (депресія) та зростання (відновлення або зріст) |
Взаємодія багатьох факторів, які мають вплив на економічну активність. |
Як правило, із змінною інтенсивністю протягом 2-10 років. |
|
Нерегулярний |
Несистематичний |
Випадкові коливання динамічного ряду, які виникають після врахування систематичних ефектів. |
Випадкові коливання даних або непередбачені події, наприклад, урагани, повені, страйки. |
Короткочасні та одноразові. |
Табл. 1.2. Фактори, що впливають на динамічний ряд.
Класична мультиплікативна модель динамічного ряду (classical multiplicative time-series model) стверджує, що будь-яке спостережуване значення є добутком перерахованих компонентів. Якщо дані є щорічними, спостереження , відповідне i-му році, визначається рівнянням (1.1).
, (1.1)
де - значення тренду, - значення циклічного компонента в і-му році, - значення випадкового компонента в i-му році.
Якщо дані вимірюються щомісячно або щоквартально, спостереження, яке відповідає і-му періоду, визначається рівнянням (1.2):
, (1.2)
де - значення тренду, - значення сезонного компонента в і-му періоді, - значення циклічного компонента в і-му році, - значення випадкового компонента в i-му році.
На першому етапі аналізу динамічних рядів будується графік даних і виявляється їх залежність від часу. Спочатку необхідно з'ясувати, чи існує довготривале зростання або спадання даних (тобто тренд), або динамічний ряд коливається довкола горизонтальної лінії. Якщо тренд відсутній, то для згладжування даних можна застосувати метод плинних середніх або експоненціального згладжування, який дозволяє створити штучний довготривалий тренд. Якщо ж реальний тренд існує, відкривається можливість застосовувати різні методи прогнозування на основі щорічних даних [4].
1.3 ЗГЛАДЖУВАННЯ ДИНАМІЧНИХ РЯДІВ
Плинні середні.
Метод плинних середніх досить суб'єктивний і залежить від довжини періоду L, обраного для обчислення середніх значень. Для того, щоб виключити циклічні коливання, довжина періоду має бути цілим числом, кратним середній довжині циклу.
Плинні середні (moving averages) для вибраного періоду, що має довжину L, утворюють послідовність середніх значень, обчислених для послідовностей довжини L. Плинні середні позначаються символами МА(L).
Уявимо, що ми хочемо обчислити п'ятирічні плинні середні значення за даними, виміряними протягом n = 11 років. Оскільки L = 5, п'ятирічні плинні середні утворюють послідовність середніх значень, обчислених по п'яти послідовних значеннях динамічного ряду. Перше з п'ятирічних плинних середніх значень обчислюється шляхом підсумовування даних про перші п'ять років з подальшим діленням на п'ять:
.
Друге п'ятирічне плинне середнє обчислюється шляхом підсумовування даних про роки з 2-го по 6-ий з подальшим діленням на п'ять:
.
Цей процес продовжується, поки не буде обчислено плинне середнє для останніх п'яти років.
.
Працюючи з річними даними, слід вважати число L (довжину періоду, обраного для обчислення плинних середніх) непарним. В цьому випадку неможливо обчислити плинні середні для перших (L-1)/2 і останніх (L-1)/2 років. Отже, при роботі з п'ятирічними плинних середніми неможливо виконати обчислення для перших двох і останніх двох років.
Рік, для якого обчислюється плинне середнє, повинен знаходитися в середині періоду, що має довжину L. Якщо п = 11, а L = 5, перше плинне середнє повинне відповідати третьому року, друге - четвертому, а останнє - дев'ятому [3].
Експоненціальне згладжування.
Для виявлення довготривалих тенденцій, які характеризують зміни даних, крім плинних середніх, використовується метод експоненціального згладжування (exponential smoothing). Цей метод дозволяє також робити короткочасні прогнози (в межах одного періоду), коли наявність довготривалих тенденцій залишається під питанням. Завдяки цьому метод експоненціального згладжування відрізняється значною перевагою над методом плинних середніх.
Метод експоненціального згладжування отримав свою назву від послідовності експоненціально зважених плинних середніх. Кожне значення в цій послідовності залежить від всіх попередніх спостережуваних значень. Ще одна перевага методу експоненціального згладжування над методом плинного середнього полягає в тому, що при використанні останнього деякі значення відкидаються. При експоненціальному згладжуванні вага, що привласнена спостережуваним значенням, спадає з часом, тому після виконання обчислень значень, що часто зустрічаються, отримають найбільшу вагу, а величини, що зустрічаються зрідка - найменшу.
Рівняння, що дозволяє згладити динамічний ряд в межах довільного періоду часу і, містить три члени: поточне спостережуване значення , що належить динамічному ряду, попереднє експоненціально згладжене значення та привласнену вагу W.
, (1.3)
де - значення експоненціально згладженого ряду, обчислене для i-гo періоду, - значення експоненціально згладженого ряду, обчислене для (і-1)-го періоду, - спостережуване значення динамічного ряду в i-му періоді, W -- суб'єктивна вага, або згладжуючий коефіцієнт (0 < W < 1).
Вибір згладжуючого коефіцієнта, або ваги, привласненої членам ряду, є принципово важливим, оскільки він безпосередньо впливає на результат. На жаль, цей вибір до деякої міри є суб'єктивним. Якщо дослідник хоче просто виключити з динамічного ряду небажані циклічні або випадкові коливання, слід обирати невеликі величини W (близькі до нуля). З іншого боку, якщо динамічний ряд використовується для прогнозування, необхідно обрати велику вагу W (близьку до одиниці). У першому випадку чітко виявляються довготривалі тенденції динамічного ряду. У другому випадку підвищується точність короткострокового прогнозування.
Екпоненціально згладжене значення, яке отримано для і-го динамічного інтервалу, можна використовувати в якості оцінки передбачуваного значення в (і+1)-му інтервалі.
Прогнозування значень для (і+1)-го інтервалу:
Інакше кажучи, формула для прогнозування має наступний вигляд:
Поточне згладжене значення =
= W * (поточне спостережуване значення) + (1-W) * (попереднє згладжене значення);
Новий прогноз = W * (поточне спостережуване значення) + (1- W) * (поточний прогноз) [5].
1.4 ОБЧИСЛЕННЯ ТРЕНДІВ ЗА ДОПОМОГОЮ МЕТОДУ НАЙМЕНШИХ КВАДРАТІВ І ПРОГНОЗУВАННЯ
Серед компонентів динамічного ряду частіше за інші досліджується тренд. Саме тренд дозволяє робити короткострокові і довгострокові прогнози. Для виявлення довготривалої тенденції зміни динамічного ряду зазвичай будують графік, на якому спостережувані дані (значення залежної змінної) відкладаються на вертикальній осі, а часові інтервали (значення незалежної змінної) - на горизонтальній. Опишемо процедуру виявлення лінійного, квадратичного і експоненціального тренда за допомогою методу найменших квадратів [4].
Модель лінійного тренду.
Модель лінійного тренду (linear trend model)
,
є найпростішою моделлю, яка використовується для прогнозування.
Рівняння лінійного тренду:
. (1.4)
У рівнянні (1.4) - коефіцієнт зсуву:
(1.5)
- коефіцієнт нахилу:
Якщо при апроксимації динамічного ряду за допомогою методу найменших квадратів перше спостереження розташувати на початку координат, поставивши його у відповідність значенню X=0, інтерпретація коефіцієнтів спрощується. Все подальші спостереження отримують цілочисельні номери: 1, 2, 3, ..., отже n-е (останнє) спостереження матиме номер n-1. Наприклад, якщо динамічний ряд записується впродовж 20 років, перший рік позначається цифрою 0, другий - цифрою 1, третій-- цифрою 2 і так далі, а останній (20-й) рік - числом 19.
Модель квадратичного тренду.
Модель квадратичного тренду (quadratic trend model), або поліноміальна модель другого порядку
,
є найпростішою нелінійною моделлю, що використовується для прогнозування.
Рівняння квадратичного тренду:
, (1.6)
де - оцінка зсуву відгуку , - оцінка лінійного ефекту, - оцінка квадратичного ефекту.
Модель експоненціального тренду.
Якщо динамічний ряд є зростаючим, а відносна зміна даних - постійною, можна застосовувати модель експоненціального тренду (exponential trend model).
Модель експоненціального тренду:
, (1.7)
де - зсув, - щорічний рівень зростання (%).
Модель експоненціального тренду абсолютно не схожа на модель лінійної регресії. Для того, щоб звести її до лінійної, слід застосувати логарифмічне перетворення за основою . Тоді перетворена модель експоненціального тренду виглядатиме таким чином:
(1.8)
Оскільки рівняння (1.8) є лінійним, до нього можна застосувати метод найменших квадратів. Застосування логарифмічного перетворення до залежної і незалежної змінних призводить до рівняння (1.9).
Рівняння експоненціального тренда:
, (1.9)
де - оцінка величини , тобто , - оцінка величини , тобто .
Таким чином
, (1.10)
де - щорічний рівень зростання (%).
Вибір моделі за допомогою різниць першого і другого порядку, а також відносних різниць.
Для апроксимації даних було застосовано три моделі: лінійну, квадратичну і експоненціальну. Яка з цих моделей краща? Окрім візуального враження і порівняння скоректованих коефіцієнтів, як інструмент для оцінки якості моделі застосовуються різниці першого, другого і третього порядку. Властивості моделей:
· Якщо вихідні дані добре апроксимуються лінійною моделлю, різниця першого порядку повинна бути стійкою. Інакше кажучи, різниці між двома послідовними значеннями однакові:
.
· Якщо вихідні дані добре апроксимуються квадратичною моделлю, різниця другого порядку повинна бути стійкою. Інакше кажучи, різниці між двома послідовними різницями першого порядку однакові:
.
· Якщо вихідні дані добре апроксимуються експоненціальною моделлю, відносна різниця повинна бути стійкою. Інакше кажучи, відносні різниці, обчислені за двома послідовними спостереженнями, однакові:
.
Не слід чекати, що модель ідеально апроксимуватиме конкретний набір даних. Не дивлячись на це, при виборі відповідної моделі необхідно аналізувати різниці першого і другого порядку, а також відносні різниці. Розглянемо ці питання на прикладах лінійної, квадратичної і експоненціальної моделей.
1.5 ОБЧИСЛЕННЯ ТРЕНДУ ЗА ДОПОМОГОЮ АВТОРЕГРЕСІЇ ТА ПРОГНОЗУВАННЯ
Інший підхід до прогнозування заснований на авторегресійній моделі (auto-regressive modeling). Часто значення динамічного ряду в якийсь момент часу сильно корелюють як з попередніми, так і з наступними значеннями. Автокореляція першого порядку (first-order autocorrelation) оцінює міру залежності між послідовними значеннями динамічного ряду. Автокореляція другого порядку оцінює силу зв'язку між значеннями, розділеними двома динамічними інтервалами. Автокореляція р-го порядку (pth-order autocorrelation) є величиною кореляції між значеннями, розділеними р динамічними інтервалами. Авторегресійна модель дозволяє краще оцінити передісторію і отримати точніший прогноз.
Авторегресійна модель першого порядку:
, (1.11)
Авторегресійна модель другого порядку:
, (1.12)
Авторегресійна модель р-го порядку:
, (1.13)
Тут - спостережуване значення динамічного ряду в i-й момент, - спостережуване значення динамічного ряду в (і-1)-й момент, - спостережуване значення динамічного ряду в (і-2)-й момент, - спостережуване значення динамічного ряду в (і-p)-й момент, - фіксований параметр, що оцінюється за допомогою методу найменших квадратів, - параметри авторегресії, що обчислюються за допомогою методу найменших квадратів, - випадковий компонент з нульовим математичним очікуванням і постійною дисперсією.
У авторегресійній моделі першого порядку (1.11) розглядаються лише сусідні значення динамічного ряду. У авторегресійній моделі другого порядку (1.12) оцінюється залежність і кореляція як між сусідніми, так і між послідовними значеннями динамічного ряду, розділеними двома динамічними інтервалами. У авторегресійній модели р-го порядку (1.13) оцінюється залежність і кореляція між сусідніми значеннями, послідовними значеннями динамічного ряду, розділеними двома динамічними інтервалами, і так далі аж до послідовних значень динамічного ряду, розділених р динамічними інтервалами.
Вибір відповідної авторегресійної моделі є нелегким завданням. В процесі її вирішення необхідно оцінити нескладність моделі і можливі втрати унаслідок ігнорування автокореляції між даними. З іншого боку, моделі високих порядків зв'язані з оцінками багаточисельних параметрів, які можуть виявитися непотрібними, особливо якщо довжина п динамічного ряду не дуже велика. Це відбувається тому, що при обчисленні параметра кожне значення динамічного ряду порівнюється з його найближчими сусідами, розташованими не далі чим за р динамічних інтервалів (тобто величина порівнюється із значеннями).
Обравши модель та використавши метод найменших квадратів для обчислення оцінок регресійних параметрів, необхідно оцінити її адекватність. Для цього можна використати або авторегресійну модель визначеного порядку, яку вже використовували для подібних даних, або відразу ж побудувати модель з декількома параметрами, а потім послідовно виключати з неї параметри, які не мають статистичного значення. В останньому випадку використовується t-критерій вагомості параметра , який має найвищий порядок в даній авторегресійній моделі. Нульова і альтернативна гіпотези формулюються наступним чином:
Використання t-критерію вагомості параметра , який має найвищий порядок:
, (1.14)
де - гіпотетичне значення параметра, що має найвищий порядок в регресійній моделі, - оцінка параметра авторегресії, що має найвищий порядок, - стандартна похибка оцінки.
Тестова t-статистика має t-розподіл з п-2р-1 ступенями свободи.
При заданому рівні значущості нульова гіпотеза відхиляється, якщо тестова t-cтатистика більша за верхній або менша за нижній критичний рівень t-розподілу. Інакше кажучи, вирішальне правило формулюється таким чином:
Якщо або , нульова гіпотеза відхиляється,
інакше нульова гіпотеза не відхиляється.
Якщо нульова гіпотеза не відхиляється, значить, обрана модель містить надто багато параметрів. Критерій дозволяє відкинути старший член моделі і оцінити авторегресійну модель порядку р-1. Цю процедуру слід продовжувати до тих пір, поки нульова гіпотеза не буде відхилена.
Рівняння, отримане шляхом регресійного аналізу авторегресійної моделі називається емпіричним (fitted).
Емпіричне рівняння авторегресії р-го порядку:
, (1.15)
де - передбачене значення динамічного ряду в i-й момент, - спостережуване значення динамічного ряду в і-й момент, - оцінки параметрів авторегресії.
Для передбачення значень динамічного ряду на j років вперед на підставі даних про попередні п динамічних інтервалах використовується рівняння (1.16).
Рівняння для прогнозу авторегресії р-го порядку:
, (1.16)
де - оцінки параметрів авторегресії , j - номер року в майбутньому, - передбачене значення для .
Таким чином, для того, щоб передбачити значення динамічного ряду за допомогою авторегресійної моделі третього порядку, необхідно використовувати лише останні три спостережувані значення , а також оцінки параметрів, отримані під час багаторегресійного аналізу.
Для значення динамічного ряду на один рік вперед рівняння (1.16) набирає вигляду:
.
Для значення динамічного ряду на два роки вперед рівняння (1.16) набирає вигляду:
.
Для значення динамічного ряду на три роки вперед рівняння (1.16) набирає вигляду:
.
Авторегресійна модель є досить корисним інструментом для апроксимації і передбачення значень динамічного ряду.
Етапи авторегресійного моделювання річних динамічних рядів:
· Виберіть порядок р авторегресійної моделі, яка оцінюється, з урахуванням того, що t-критерій значущості має ступінь свободи.
· Сформуйте послідовність змінних р «із запізненням» так, щоб перша змінна запізнювалася на один часовий інтервал, друга - на два і так далі. Останнє значення повинне запізнюватися на р динамічних інтервалів.
· Обчисліть регресійну модель, що містить всі р значення динамічного ряду із запізненням.
· Оцініть значущість параметра, який має найвищий порядок.
- Якщо нульова гіпотеза відхиляється, в авторегресійну модель можна включати всі р параметрів і застосовувати її для апроксимації динамічного ряду і передбачення.
- Якщо нульова гіпотеза не відхиляється, відкиньте р-ю змінну і повторіть п. 3 і 4 для нової моделі, що включає р-1 параметр. Перевірка значущості нової моделі заснована на t-критерії, кількість ступенів свободи визначається новою кількістю параметрів.
· Повторюйте п. 3 і 4, поки старший член авторегресійної моделі не стане статистично значимим [4].
1.6 ВИБІР АДЕКВАТНОЇ МОДЕЛІ ПРОГНОЗУВАННЯ
Яку з описаних моделей слід застосовувати для прогнозування значення динамічного ряду?
Тут перераховано чотири принципи, якими необхідно керуватися при виборі адекватної моделі прогнозування. Ці принципи засновані на оцінках точності моделей. При цьому передбачається, що значення динамічного ряду можна передбачити, вивчаючи його попередні значення. Необхідно:
· Провести аналіз залишків.
· Оцінити величину залишкової похибки за допомогою квадратів різниць.
· Оцінити величину залишкової похибки за допомогою абсолютних різниць.
· Враховувати принцип економії.
Залишком (residual) називається різниця між передбаченим і спостережуваним значенням. Побудувавши модель для динамічного ряду, слід обчислити залишки для кожного з п інтервалів. Якщо модель є адекватною, залишки є випадковим компонентом динамічного ряду і розподілені нерегулярно. З іншого боку, якщо модель не адекватна, залишки можуть мати систематичну залежність, що не враховує або тренд, або циклічний, або сезонний компонент [6].
Вимір абсолютної і середньоквадратичної залишкових погрішностей.
Якщо аналіз залишків не дозволяє визначити єдину адекватну модель, можна скористатися іншими методами, заснованими на оцінці величини залишкової погрішності. На жаль, статистики не прийшли до консенсусу відносно найкращої оцінки залишкових погрішностей моделей, вживаних для прогнозування.
Виходячи з принципу найменших квадратів, можна спочатку провести регресійний аналіз і обчислити стандартну похибку оцінки . При аналізі конкретної моделі ця величина є сумою квадратів різниць між фактичним і передбаченим значеннями динамічного ряду. Якщо модель ідеально апроксимує значення динамічного ряду в попередні моменти часу, стандартна похибка оцінки дорівнює нулю. З іншого боку, якщо модель погано апроксимує значення динамічного ряду в попередні моменти часу, стандартна похибка оцінки велика. Таким чином, аналізуючи адекватність декількох моделей, можна вибрати модель, що має мінімальну стандартну похибку оцінки .
Основним недоліком такого підходу є перебільшення значущості похибок при прогнозуванні окремих значень. Інакше кажучи, будь-яка велика різниця між величинами і при обчисленні суми квадратів похибок SSE зводиться до квадрату, тобто збільшується. З цієї причини багато статистиків вважають за краще застосовувати для оцінки адекватності моделі прогнозування середнє абсолютне відхилення (mean absolute deviation MAD).
Середнє абсолютне відхилення:
, (1.17)
При аналізі конкретних моделей величина MAD є середнім значенням модулів різниць між фактичним і передбаченими значеннями динамічного ряду. Якщо модель ідеально апроксимує значення динамічного ряду в попередні моменти часу, середнє абсолютне відхилення дорівнює нулю. З іншого боку, якщо модель погано апроксимує такі значення динамічного ряду, середнє абсолютне відхилення велике. Таким чином, аналізуючи адекватність декількох моделей, можна вибрати модель, що має мінімальне середнє абсолютне відхилення [4].
Принцип економії.
Якщо аналіз стандартних похибок оцінок і середніх абсолютних відхилень не дозволяє визначити оптимальну модель, можна скористатися четвертим методом, заснованим на принципі економії (parsimony). Цей принцип стверджує, що з декількох рівноправних моделей слід обирати найпростішу.
Серед розглянутих нами моделей прогнозування найбільш простими є лінійна і квадратична регресійні моделі, а також авторегресійна модель першого порядку. Інші моделі набагато складніші.
Порівняння чотирьох методів прогнозування.
Порівняємо чотири моделі: лінійну, квадратичну, експоненціальну і авторегресійну модель першого порядку. (Авторегресійні моделі другого і третього порядку лише трохи покращують точність прогнозування значень даного динамічного ряду, тому їх можна не розглядати.)
Жодна модель, окрім авторегресійної моделі першого порядку, не враховує циклічний компонент. Саме ця модель краще за інші апроксимує спостереження і характеризується найменш систематичною структурою.
Аналіз залишків всіх чотирьох методів показав, що найкращою є авторегресійна модель першого порядку, а лінійна, квадратична і експоненціальна моделі мають меншу точність.
Для всіх чотирьох моделей порівняння величин і MAD призводить приблизно до однакових результатів. Це порівняння показує, що експоненціальна модель є гіршою, а лінійна і квадратична модель перевершує її по точності. Як і очікувалося, найменші величини і MAD має авторегресійна модель першого порядку.
Обираючи конкретну модель прогнозування, необхідно уважно слідкувати за подальшими змінами динамічного ряду. Крім того, така модель створюється для того, щоб вірно передбачити значення динамічного ряду в майбутньому. На жаль, такі моделі прогнозування погано враховують зміни в структурі динамічного ряду. Необхідно порівнювати не тільки залишкову погрішність, але й точність прогнозування майбутніх значень динамічного ряду, яка отримана за допомогою інших моделей. Обчислюючи нове значення в спостережуваному інтервалі часу, її необхідно відразу ж порівнювати із передбаченим значенням. Якщо різниця дуже велика, модель прогнозування слід переобрати. Такі методи називають методами адаптивного керування [4].
1.7 ПРОГНОЗУВАННЯ ДИНАМІЧНИХ РЯДІВ НА ПІДСТАВІ СЕЗОННИХ ДАНИХ
Досі розглядалися динамічні ряди, що складалися із річних даних. Однак велика кількість динамічних рядів складається із величин, які виміряють щоквартально, щомісячно, щотижнево, щоденно і навіть щогодини. Розглянемо методи, що дозволяють прогнозувати значення таких динамічних рядів.
Для таких квартальних рядів, як цей, класична мультиплікативна модель, окрім тренду, циклічного і випадкового компонента, містить сезонний компонент.
.
Прогнозування місячних і динамічних рядів за допомогою методу найменших квадратів.
Регресійна модель, що включає сезонний компонент, заснована на комбінованому підході. Для обчислення тренду застосовується метод найменших квадратів, а для обліку сезонного компонента - категорійна змінна.
Для апроксимації квартальних динамічних рядів з врахуванням сезонних компонентів використовується рівняння (1.18).
Експоненціальна модель для квартальних даних.
, (1.18)
де , - закодоване квартальне значення, і=0,1,..., для першого кварталу і 0 для інших, для другого кварталу і 0 для інших, для третього кварталу і 0 для інших, - зсув змінної , - темп щоквартального зростання доходів (%), - множник першого кварталу по відношенню до четвертого кварталу, - множник другого кварталу по відношенню до четвертого кварталу, - множник третього кварталу по відношенню до четвертого кварталу, - величина випадкового компонента в і-му динамічному інтервалі.
Модель (1.18) значно відрізняється від моделі лінійної регресії. Для того, щоб привести її до лінійного вигляду, необхідно виконати логарифмування за основою 10.
Перетворена експоненціальна модель для апроксимації квартальних даних.
. (1.19)
Модель (1.19) є лінійною, тому до неї можна застосувати метод найменших квадратів, враховуючи, що - відгук, а величини , , і - незалежні змінні.
Модель експоненціального зростання для квартальних даних.
, (1.20)
де - оцінка (тобто ), - оцінка (тобто ), - оцінка (тобто ), - оцінка (тобто ), - оцінка (тобто ).
Для обліку сезонного компонента при апроксимації місячних даних можна використовувати наступну модель.
Експоненціальна модель для місячних даних.
, (1.21)
де - закодоване місячне значення і = 0, 1, ..., для січня і 0 для решти місяців, для лютого і 0 для решти місяців, для березня і 0 для решти місяців,..., для листопада і 0 для решти місяців, - зсув змінної , - темп щомісячного зростання доходів (%), - множник січня по відношенню до грудня, - множник лютого по відношенню до грудня, - множник березня по відношенню до грудня ,..., - множник листопада по відношенню до грудня, - величина випадкового компонента в i-м тимчасовому інтервалі.
Модель (1.21) відрізняється від моделі лінійної регресії. Для того, щоб привести її до лінійного вигляду, необхідно виконати логарифмування за основою 10.
Перетворена експоненціальна модель для апроксимації місячних даних.
. (1.22)
Модель (1.22) є лінійною. Отже, до неї можна застосувати метод найменших квадратів, обчислюючи відгуком, а величини , , ,..., - незалежними змінними.
Модель експоненціального зростання для місячних даних.
, (1.23)
де - оцінка (тобто ), - оцінка (тобто ), - оцінка (тобто ), - оцінка (тобто ),..., - оцінка (тобто ).
Зверніть увагу на те, що в моделі, що апроксимує квартальний динамічний ряд, для обліку чотирьох кварталів нам знадобилися три фіктивні змінні , і , а в моделі для місячного динамічного ряду 12 місяців представляються за допомогою 11 фіктивних змінних , ,..., . Оскільки в цих моделях як відзив використовується змінна , а не , для обчислення справжніх регресійних коефіцієнтів необхідно виконати зворотне перетворення (тобто потенціювання).
На перший погляд, ці регресійні моделі виглядають громіздкими. Проте при прогнозуванні динамічного ряду для конкретного періоду значення решти всіх фіктивних змінних вважаються рівними нулю, і рівняння значно спрощуються. Наприклад, рівняння (1.20) набуває наступного вигляду.
Для першого кварталу: .
Для другого кварталу: .
Для третього кварталу: .
Для четвертого кварталу: .
При визначенні фіктивних змінних четвертий квартал є базовим і кодується нулем.
Аналогічно модель (1.23) для місячних динамічних рядів набуває наступного вигляду.
Для січня: .
Для грудня: .
При визначенні фіктивних змінних базовим періодом вважається грудень, який кодується нулем [4].
2. ЗАСТОСУВАННЯ ТАБЛИЦЬ EXCEL У РЕАЛІЗАЦІЇ ТЕОРІЇ ДИНАМІЧНИХ РЯДІВ
В наступній таблиці 2.1 наведені фактичні доходи компанії Х за період з 2000 до 2008 роки (млрд. грн. в поточних цінах):
Рік |
Дохід (млрд. грн.) |
|
2000 |
1 |
|
2001 |
1,4 |
|
2002 |
1,9 |
|
2003 |
2,5 |
|
2004 |
3,1 |
|
2005 |
3,8 |
|
2006 |
5,6 |
|
2007 |
6,8 |
|
2008 |
7,1 |
Табл. 2.1. Фактичні доходи компанії Х (2000-2008 рр.).
Класична мультиплікативна модель динамічного ряду
Рис. 2.1. Графік зкоректованого динамічного ряду фактичних доходів компанії Х.
Рис. 2.2. Лінійний тренд фактичних доходів компанії Х.
Рис. 2.2 показує, що існує довготривале зростання даних (тобто тренд), а значить відкривається можливість використання різноманітних методів прогнозування на підставі щорічних даних. Інструкції, що дозволяють побудувати графік лінійного тренду (рис. 2.2) засобами Майстра діаграм Microsoft Excel:
1. Побудувати графік фактичних доходів компанії Х: виділити стовпець В рядки 2-10 в табл. 2.2. Майстер діаграм - тип Графік - Ряд - вказати Назву графіку - Підписи на осі Х - виділити стовпчик А рядки 2-10 в табл. 2.2 - Заголовки - вказати Назву діаграми - Готово.
2. Виділити графік, обрати Діаграма - Додати лінію тренду - Лінійний - Параметри - поставити галочку Показувати рівняння на діаграмі - поставити галочку Помістити на діаграму величину апроксимації .
Для згладжування динамічного ряду необхідно усереднити початкові дані, а потім побудувати графік згладженого динамічного ряду, використовуючи Майстер діаграм Microsoft Excel.
2.1 ОБЧИСЛЕННЯ ПЛИННИХ СЕРЕДНІХ
Для обчислення плинних середніх використовується проста формула =СРЗНАЧ(діапазон комірок, що містять дані по роках).
Табл. 2.2. Обчислення 3- і 7-річних плинних середніх доходів компанії Х.
3- і 7-річні плинні середні значення знаходяться в стовпцях C і D відповідно. Рядки, що відповідають рокам, для яких плинне середнє не обчислюється (наприклад, рядок 1), залишаються порожніми. Для реалізації обчислень таблиці 2.2 необхідно виконати наступні дії:
1. Ввести в комірку С1 заголовок 3-річні МА, а в комірку D1 - заголовок 7-річні МА.
2. Ввести в комірку С3 формулу =СРЗНАЧ(В2:В4) та скопіювати її в комірки, що розташовані нижче до рядка 9.
3. Ввести в комірку D5 формулу =СРЗНАЧ(В2:В8) та скопіювати її в комірки, що розташовані нижче до рядка 9.
Інструкції для побудови плинного середнього (див. рис. 2.3) аналогічні побудові рис. 2.2 (п.1).
2.2 ОБЧИСЛЕННЯ ЕКСПОНЕНЦІАЛЬНО ЗГЛАДЖЕНИХ ВЕЛИЧИН
Для обчислення експоненціально згладжених значень при конкретному значенні коефіцієнта W використовується процедура Сервіс - Аналіз даних… - Експоненціальне згладжування. (Якщо процедури Аналіз даних немає, потрібно загрузити Настройка - Пакет даних).
Ця процедура генерує експоненціально згладжені значення, використовуючи фактор затухання (1- W). Наприклад, щоб згладити дані про доходи компанії Х, наведені в таблиці 2.1, використаємо коефіцієнти згладжування W = 0,50 та W = 0,25 (див. рис. 2.4). Необхідно виконати наступні дії:
Рис. 2.3. Плинне середнє для доходів компанії Х.
1. Ввести в комірку С1 заголовок ЕС(W=0,50).
2. Обрати команду Сервіс - Аналіз даних… - Експоненціальне згладжування.
3. В діалоговому вікні ввести Вхідний інтервал діапазон В2:В21
4. У вікні редагування Фактор затухання число 0,5
5. У вікні редагування Вихідний інтервал діапазон С2:С21.
Процедура Аналіз даних вставляє в комірку С2 спеціальне значення #Н/Д. Кожна з формул експоненціального згладжування відноситься до року, що вказаний в наступному рядку. Для того щоб налагодити цей стовпчик так, щоб формули згладжування і відповідні дані знаходились в одному рядку, необхідно виконати наступне:
1. Виділити комірку С2, обрати команду Правка - Видалити
2. У вікні Видалення комірок встановити перемикач Видалити в положення Комірки, із зміщенням доверху
3. Копіювати формулу із комірки С2 у комірку С21.
Рис. 2.4. Графіки експоненціально згладженого динамічного ряду (W=0,50 та W=0,25) для даних про доходи компанії Х, побудовані за допомогою програми Microsoft Excel.
Для створення стовпчика ЕС(W=0,25) (див. рис. 2.4) необхідно повторити описані дії.
Для побудови графіка екпоненціально згладжених величин (рис. 2.4) в якості початкових даних використовується таблиця експоненціально згладжених величин (рис. 2.4). Інструкції, які дозволяють будувати графік, аналогічні побудові рис. 2.2 (п.1).
2.3 ОБЧИСЛЕННЯ ЛІНІЙНОГО ТРЕНДА
Для обчислення лінійного тренда і побудови діаграми розсіювання необхідно виконати процедуру Сервіс - Аналіз даних… - Регресія та слідувати інструкціям:
1. Сервіс - Аналіз даних…
2. В списку Аналіз даних обрати пункт Регресія
3. Ввести у діалоговому вікні Вхідний інтервал Y діапазон комірок С2:С10.
4. Ввести в діалоговому вікні Вхідний інтервал Х діапазон комірок В2:В10.
5. Встановити прапорець Мітки
6. Ввести у вікні редагування Рівень надійності число 95.
7. Встановити перемикач Параметри виводу в положення Новий робочий лист і ввести назву діаграми.
8. Встановити прапорці Остачі та Графік Остачі.
Для будови діаграми розсіювання і графіку тренда (див. рис. 2.6) слід скористатись інструкцією рис 2.2 (п.1), частково її змінивши:
· У вікні редагування Діапазон даних ввести діапазони А2:А10, С2:С10
· Відкрити робочий лист де міститься діаграма розсіювання, і виконати команду Діаграма - Додати лінію тренда…
· У вікні Лінія тренда відкрити вкладку Тип і обрати варіант Лінійна в групі Побудова лінії тренда (апроксимація та згладжування)
· У вкладці Параметри встановити перемикач Назва апроксимуючої (згладженої) кривої в положення Автоматично.
Регресійні коефіцієнти інтерпретуються так:
· Зсув є передбачене середнє значення доходів компанії Х 2000 році.
· Нахил є передбачене зменшення доходів компанії в середньому на 0,886 млрд. грн. в рік
Рис. 2.5. Модель лінійної регресії для передбачення доходів компанії Х (побудована за допомогою програми Microsoft Excel).
дінамичний ряд прогнозування лінійний тренд
Щоб виконати проекцію доходів компанії Х на 2009 рік слід підставити величину (номер 2009 року) в рівняння прогнозу.
млрд. грн.
Аналіз рис. 2.6 показує, що протягом ряду років доходи компанії Х лінійно зростали. Зкоректований коефіцієнт . Це значить, що всі зміни доходів добре описуються лінійним трендом.
Рис. 2.6. Графік лінійного тренда доходів компанії Х, яка побудована за допомогою методу найменших квадратів і програми Microsoft Excel.
2.4 ОБЧИСЛЕННЯ КВАДРАТИЧНОГО ТРЕНДА
Для обчислення квадратичного тренда і побудови діаграми розсіювання слід виконати інструкції аналогічні інструкціям будови лінійного тренда, лише в діалоговому вікні Лінія тренда на вкладці Тип обрати варіант Поліноміальна в групі Побудова лінії тренда (апроксимація і згладжування) (див. рис. 2.7, рис. 2.8).
Рівняння лінійної регресії має наступний вигляд:
,
де початком координат є 2000 рік, а крок змінної Х дорівнює одному року.
Для використання квадратичної моделі прогнозування необхідно підставити величину (номер 2009 року) в рівняння регресії. В результаті отримаємо такий прогноз:
млрд. грн.
Графік, що апроксимує динамічний ряд (див. рис. 2.8), майже такий як і лінійний тренд. Зкоректований коефіцієнт.
2.5 ОБЧИСЛЕННЯ ЕКСПОНЕНЦІАЛЬНОГО ТРЕНДА
Інструкції по побудові моделі експоненціальної регресії для передбачення доходів компанії Х (див. рис. 2.9) та графіку експоненціального тренду доходів компанії Х (див. рис. 2.10) аналогічні інструкціям побудови лінійного та квадратичного трендів.
Використовуючи формулу (1.9) та результати наведені на рис. 2.9, отримаємо вираз:
, (2.1)
де початок координат відповідає 2000 року, а крок зміни змінної Х дорівнює одному року.
Величини , . Таким чином використовуючи формулу (1.10) отримаємо рівняння експоненціального тренда:
. (2.2)
Рис. 2.7. Модель квадратичної регресії для передбачення доходів компанії Х (побудована за допомогою програми Microsoft Excel).
Величина % є оцінкою темпу щорічного зростання доходів компанії Х.
Для використання експоненціальної моделі для прогнозування необхідно підставити величину (номер 2009 року) в рівняння (2.1) або (2.2). В результаті отримаємо прогноз:
;
млрд. грн.
Рис. 2.8. Графік квадратичного тренда доходів компанії Х, обчислений за допомогою методу найменших квадратів і програми Microsoft Excel.
Рис. 2.9. Модель експоненціальної регресії для передбачення доходів компанії Х (побудована за допомогою програми Microsoft Excel).
Рис. 2.10. Графік експоненціального тренду доходів компанії Х, обчислений за допомогою методу найменших квадратів і програми Microsoft Excel.
Графік, що апроксимує динамічний ряд, майже такий як лінійний і квадратичний тренди. Зкоректований коефіцієнт.
2.6 ВИБІР МОДЕЛІ НА ОСНОВІ РІЗНИЦЬ ПЕРШОГО І ДРУГОГО ПОРЯДКУ, А ТАКОЖ ВІДНОСНИХ РІЗНИЦЬ
Щоб з'ясувати, яка з моделей (лінійна, квадратична, експоненціальна) є кращою використовують різниці першого, другого і третього порядку.
Табл. 2.3. Різниці першого та другого порядків, а також відносні різниці, обчислені за даними про доходи компанії Х.
Вихідні дані добре апроксимуються квадратичною моделлю, різниця другого порядку майже постійне число, тобто
2.7 ОБЧИСЛЕННЯ ТРЕНДА ЗА ДОПОМОГОЮ АВТОРЕГРЕСІЇ ТА ПРОГНОЗУВАННЯ
В таблиці 2.4 представлені дані, необхідні для побудови авторегресійних моделей першого, другого і третього порядків. Для будови авторегресійної моделі третього порядку необхідні всі стовпці даної таблиці. Для будови авторегресійної моделі другого порядку останній стовпчик ігнорується, відповідно ігноруються два останніх стовпця для будови авторегресійної моделі першого порядку.
Табл. 2.4. Побудова авторегресійних моделей першого, другого та третього порядків для доходів компанії Х.
Комірки С2, D2, D3, E2, E3, E4 залишаються пустими. Для створення авторегресійних моделей використовуюсь процедуру регресійного аналізу Аналіз даних (див. процедуру побудови лінійного тренда та діаграми розсіяння рис. 5.2). Вибір найбільш точної моделі починається з моделі третього порядку, представленої на рис. 2.11.
Як слідує з рис. 2.11, рівняння авторегресії третього порядку має наступний вигляд:
.
Тут початок координат відповідає 2003 року, а крок по осі дорівнює одному року.
Перевіримо значимість параметру , що має найвищий порядок. Його оцінка дорівнює 3,2527, а стандартна похибка дорівнює 0,8033. Для перевірки гіпотез та . Обчислимо -статистику:
.
При рівні значимості, рівному 0,05, критичні величини двобічного t-критерію з 2 вільними степенями дорівнюють . Оскільки та , нульову гіпотезу відхиляти не можна. Таким чином, параметр третього порядку не має статистичної значимості в авторегресійній моделі і повинен бути видалений.
Рівняння авторегресії другого порядку (див. рис. 2.12) має наступний вигляд:
.
Тут початок координат відповідає 2002 року, а крок по осі дорівнює одному року.
Оцінка параметра, що має найвищий порядок, дорівнює , а її стандартна похибка дорівнює 0,9174. Для перевірки гіпотез та . Обчислимо -статистику:
.
При рівні значимості, рівному 0,05, критичні величини двобічного t-критерію з 4 вільними степенями дорівнюють . Оскільки та , нульову гіпотезу відхиляти не можна. Таким чином, параметр другого порядку не є статистично значимим і може бути видалений із моделі.
Рис. 2.11. Параметри авторегресійної моделі третього порядку, обчислені за допомогою програми Microsoft Excel.
Побудуємо авторегресійну модель першого порядку:
Рівняння авторегресії першого порядку має наступний вигляд:
.
Тут початок координат відповідає 2001 року, а крок по осі дорівнює одному року.
Оцінка параметра, що має найвищий порядок, дорівнює , а її стандартна похибка дорівнює 0,0968. Для перевірки гіпотез та . Обчислимо -статистику: .
При рівні значимості, рівному 0,05, критичні величини двобічного t-критерію з 6 вільними степенями дорівнюють . Оскільки нульову гіпотезу потрібно відхилити. Таким чином, параметр першого порядку має статистичне значення і його не можна видаляти.
Модель авторегресії першого порядку краще за інші апроксимує початкові дані. Використаємо оцінки , та значення динамічного ряду за останній рік - за допомогою формули (1.16) можна передбачити величини доходів компанії Х в 2009 та 2010 роках.
.
2008: на один рік вперед млрд. грн.
2008: на два роки вперед млрд. грн.
Передбачувані значення змінної Y, отримані за допомогою авторегресійної моделі першого порядку (рис. 2.14):
2.8 ВИБІР АДЕКВАТНОЇ МОДЕЛІ ПРОГНОЗУВАННЯ
Для визначення, яка з побудованих моделей є оптимальною, необхідно проаналізувати остачі, оцінити величину остаточної похибки за допомогою квадратів різниць (), оцінити величину остаточної похибки за допомогою абсолютних різниць (MAD) (див. табл. 2.5).
Аналізуючи адекватність моделей, обирають ту, що має мінімальне середнє абсолютне відхилення (MAD), та мінімальну стандартну похибку оцінки (). Як і очікувалось, найкраща апроксимація в нашому випадку досягнута за допомогою лінійної моделі прогнозування.
Обчислення в таблиці 2.5 реалізувалось в ручну за формулами (1.17) для обчислення MAD та для обчислення .
2.9 ПРОГНОЗУВАННЯ ДИНАМІЧНИХ РЯДІВ НА ПІДСТАВІ СЕЗОННИХ ДАНИХ
Багато динамічних рядів складаються з даних, що вимірюються щоквартально, щомісячно, щотижнево і навіть щогодини. Проілюструємо процес створення моделі, яка апроксимує квартальний динамічний ряд, на прикладі доходів компанії Х. В таблиці на рис. 2.15 представлені дані про квартальні доходи компанії Х за період з 2000 до 2008 років.
Щоб побудувати експоненціальну модель прогнозування необхідно ввести фіктивні змінні (для моделі апроксимації квартальних даних) та (для моделі апроксимації місячних даних). Для створення фіктивних змінних, що входять в регресійну модель для прогнозування значень квартальних динамічних рядів, використовують послідовність формул, що містять функцію Якщо. Для таблиці доходів компанії Х додаються додаткові стовпці, в яких мають бути записані значення фіктивних значень . Формули для обчислення змінної перевіряють значення, що записані в стовпці В. Якщо вони рівні 1, змінна теж дорівнює 1, інакше - вона дорівнює 0. Аналогічно виконується перевірка при обчисленні значень змінних - якщо в стовпці В записані числа 2 та 3, змінні рівні 1, інакше - 0. (Для прогнозування місячних динамічних рядів в якості кодів місяців в стовпці можна використовувати їх назви. Тоді при обчисленні змінної формули в рядку 3 мають наступний вигляд: =ЕСЛИ(В2=''січень''; 1; 0), відповідно для обчислення змінної : =ЕСЛИ(B2=''листопад''; 1; 0). (Оскільки назви місяців є текстовими величинами, їх слід брати в подвійні лапки). Параметри експоненціальної моделі, отримані за допомогою програми Microsoft Excel, наведені в таблиці 2.6:
Експоненціальна модель добре апроксимує початкові дані. Коефіцієнт змішаної кореляції =96,7%, зкоректований коефіцієнт змішаної кореляції - 92%, текстова F-статистика 21,23, а p-значення - 7,225Е-11. Кожен регресійний коефіцієнт в класичній мультиплікативній моделі динамічного ряду є статистично значимим. Використаємо до них операцію потенціювання і отримаємо наступні параметри:
Коефіцієнти інтерпретуються наступним чином:
· Параметр , зсув залежної змінної Y, є значенням некоректованого тренда квартальних доходів в першому кварталі 2000 року, тобто в першому динамічному періоді.
· Величина оцінює темп зростання квартальних доходів.
· Величина є сезонним множником для першого кварталу по відношенню до четвертого кварталу.
· Величина є сезонним множником для другого кварталу по відношенню до четвертого кварталу.
· Величина є сезонним множником для третього кварталу по відношенню до четвертого кварталу.
Використовуючи регресійні коефіцієнти , а також формулу (1.20), можна передбачити дохід, що отримає компанія в конкретному кварталі. Наприклад, зпрогнозуємо дохід компанії для четвертого кварталу 2008 року ().
.
.
Для того, щоб розповсюдити прогноз на період часу, який знаходиться за межами динамічного ряду, наприклад, на перший квартал 2009 року (), необхідно виконати наступні обчислення.
.
.
Прогнозований дохід компанії Х в першому кварталі 2009 року дорівнює млрд. грн.
ВИСНОВКИ
В курсовій роботі «Динамічні ряди та їх застосування» продемонстровано, як за допомогою статистичних методів проаналізувати дані, які зібрані протягом послідовних часових інтервалів. Розглянуто три альтернативні підходи до аналізу динамічних рядів. Демонструються два методи згладжування таких даних: плинне середнє та експоненціальне згладжування; процедура обчислення тренда за допомогою методу найменших квадратів та більш складні методи прогнозування. Отримані моделі розповсюджуються на динамічні ряди, які побудовані на основі щоквартальних даних.
Подобные документы
Оцінка якості моделі лінійної регресії. Використання методу найменших квадратів при розрахунках параметрів. Згладжування рядів динаміки за методом простої середньої і експоненціального згладжування. Перевірка адекватності моделі за критерієм Фішера.
контрольная работа [272,3 K], добавлен 10.05.2015Застосування методу найменших квадратів для оцінки невідомих параметрів рівняння пропозиції грошей. Побудування діаграми розсіювання, обчислення числових характеристик показника і фактора дисперсії. Визначення функції попиту та коефіцієнта детермінації.
контрольная работа [276,4 K], добавлен 22.07.2010Основні поняття і попередній аналіз рядів динаміки. Систематичні та випадкові компоненти часового ряду. Перевірка гіпотези про існування тренда. Методи соціально-економічного прогнозування. Прогнозування тенденцій часового ряду за механічними методами.
презентация [1,3 M], добавлен 10.10.2013Ознайомлення з сутністю ідеї методу експоненціального згладжування. Розрахунок експоненціально зваженої середньої абсолютних похибок прогнозу. Розгляд призначення спеціальних формул, розроблених Брауном. Аналіз вибору оптимальних параметрів згладжування.
доклад [28,5 K], добавлен 15.09.2019Ознайомлення зі змістом методу прогнозування тренду за середнім рівнем, на основі абсолютного приросту та темпу росту за останній рік. Визначення загального вигляду згладжуючого рівняння для одержання середніх та розрахункових значень випадкових величин.
контрольная работа [164,7 K], добавлен 04.08.2010Параметри проведення економетричного аналізу. Метод найменших квадратів. Оцінка параметрів лінійної регресії за методом найменших квадратів. Властивості простої лінійної регресії. Коефіцієнти кореляції і детермінації. Ступені вільності, аналіз дисперсій.
контрольная работа [994,5 K], добавлен 29.03.2009Головна мета методів найменших квадратів. Розрахунок системи рівнянь для динамічного ряду облікової ставки ФРН. Розрахунок лінійної залежності рентабельності фірми від наявних сумарних активів і середньорічної вартості нормованих оборотних засобів.
контрольная работа [71,7 K], добавлен 11.02.2010Теоретичні основи методів аналізу фінансових даних. Формалізований опис емпіричних закономірностей фінансових часових рядів. Розробка алгоритмів оцінювання параметрів волатильності і комплексу стохастичних моделей прогнозування фінансових індексів.
курсовая работа [1,4 M], добавлен 05.05.2015Побудування математичної моделі задачі. Розв'язання задачі за допомогою лінійного програмування та симплексним методом. Наявність негативних коефіцієнтів в індексному рядку. Основний алгоритм симплексного методу. Оптимальний план двоїстої задачі.
контрольная работа [274,8 K], добавлен 28.03.2011Кредитний ринок як складова національної економіки. Показники стану кредитного ринку. Підходи до визначення процентної ставки та аналізу її складових. Побудова моделі взаємозв’язку відсотків та обсягу кредитних ресурсів. Методи дослідження часових рядів.
дипломная работа [1,7 M], добавлен 09.11.2013