Анализ современных статистических методов прогнозирования
Сущность статистических прогнозов и задачи экономико-статистического прогнозирования. Основные методы прогнозирования в статистике: наименьших квадратов, наименьших квадратов с весами, экспоненциального сглаживания, авторегрессии. Построение прогноза.
Рубрика | Математика |
Вид | реферат |
Язык | русский |
Дата добавления | 08.05.2011 |
Размер файла | 240,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Анализ современных статистических методов прогнозирования
Псков 2011
Введение
Главным приемом в статистическом исследовании является формирование и изучение обобщающих статистических показателей. Такие показатели, с одной стороны, выступают предметом исследования, а с другой - служат специальным приемом исследования. Взаимосвязь явлений требует совместного применения различных статистических методов и показателей. Абсолютные, относительные, средние показатели, показатели структуры и динамики, дополняющие их взаимосвязанные системы показателей в исследовании должны применяться комплексно. Статистические методы прогнозирования основаны на использовании количественной информации о состоянии и поведении исследуемого объекта.
Наиболее часто в статистике используется метод наименьших квадратов. Метод наименьших модулей и другие методы экстраполяции применяются реже, хотя их статистические свойства зачастую лучше. Большую роль играет традиция и общий невысокий уровень знаний об эконометрических методах прогнозирования.
Оценивание точности прогноза - необходимая часть процедуры квалифицированного прогнозирования. При этом обычно используют вероятностно-статистические модели восстановления зависимости, например, строят наилучший прогноз по методу максимального правдоподобия.
В статистике применяются также эвристические приемы, не основанные на какой-либо теории: метод скользящих средних, метод экспоненциального сглаживания.
К современным статистическим методам прогнозирования относятся также модели авторегрессии, модель Бокса-Дженкинса, системы эконометрических уравнений, основанные как на параметрических, так и на непараметрических подходах.
1. Сущность статистических прогнозов
Под прогнозом понимается научно обоснованное описание возможных состояний объектов в будущем, а также альтернативных путей и сроков достижения этого состояния. Процесс разработки прогнозов называется прогнозированием [6, с. 68]. Прогнозирование - вид познавательной деятельности человека, направленной на формирование прогнозов развития объекта, на основе анализа тенденций его развития. Прогнозирование должно отвечать на два вопроса: что вероятнее всего можно ожидать в будущем? Каким образом нужно изменить условия, чтобы достичь заданное состояние? Прогнозирование является важным связующим звеном между теорией и практикой во всех областях жизни общества. В зависимости от степени конкретности и характера воздействия на ход исследуемых процессов и явлений различают три формы предвидения: гипотезу (общенаучное предвидение), прогноз и план. Эти формы предвидения тесно связаны в своих проявлениях друг с другом и с исследуемым объектом в системе управления и планирования, представляют собой последовательные ступени познания поведения объекта в будущем.
Прогнозы можно подразделять в зависимости от целей, задач, объектов, времени упреждения, методов организации прогнозирования, источников информации и т.д. Большое количество таких признаков и отсутствие их строго определенных характеристик затрудняют создание единой классификации.
Задачи экономико-статистического прогнозирования следующие:
- выявление перспектив ближайшего или более отдаленного будущего в исследуемой области на основе реальных процессов действительности;
- выработка оптимальных тенденций и перспективных планов с учетом составленного прогноза и оценки принятого решения с позиций его последствий в прогнозируемом периоде [2, с. 117].
Статистические методы прогнозирования - научная и учебная дисциплина, к основным задачам которой относятся разработка, изучение и применение современных математико-статистических методов прогнозирования на основе объективных данных (в том числе непараметрических методов наименьших квадратов с оцениванием точности прогноза, адаптивных методов, методов авторегрессии и др.); развитие теории и практики вероятностно-статистического моделирования экспертных методов прогнозирования, в том числе методов анализа субъективных экспертных оценок на основе статистики нечисловых данных; методов прогнозирования в условиях риска и комбинированных методов прогнозирования с использованием совместно экономико-математических и эконометрических моделей. Научной базой статистических методов прогнозирования является прикладная статистика и теория принятия решений. Простейшие методы восстановления используемых для прогнозирования зависимостей исходят из заданного временного ряда, т.е. функции, определенной в конечном числе точек на оси времени. Временной ряд при этом часто рассматривается в рамках той или иной вероятностной модели, вводятся другие факторы, помимо времени, например, объем денежной массы. Временной ряд может быть многомерным. Основные решаемые задачи - интерполяция и экстраполяция. Метод наименьших квадратов в простейшем случае был разработан К. Гауссом в 1794-1795 гг. Могут оказаться полезными предварительные преобразования переменных, например, логарифмирование.
2. Основные методы прогнозирования в статистике
Метод наименьших квадратов
Сущность метода наименьших квадратов (МНК) заключается в минимизации суммы квадратов случайных отклонений, фактических значений временного ряда от тренда f(t) [4, с. 60]:
(1) |
Минимизируется сумма квадратов отклонений, а не самих отклонений по той причине, что эти отклонения могут иметь как положительное, так и отрицательное значения и при суммировании взаимно погашаются. Отсюда название метода.
МНК дает наиболее точные результаты в случае, когда f(t) имеет линейный вид.
Однако на практике этим методом пользуются и при определении параметров функций, описываемых параболической и гиперболической зависимостями; погрешность МНК в этом случае для практических целей не существенна. Рассмотрим МНК для определения параметров следующих зависимостей:
f(t) = а0 + а1t - линейная зависимость;
f(t) = а0 + а1t +а1t2 - парабола;
f(t) = а0 + а1 / t - гипербола [4, с. 60].
Для линейной зависимости условие (1) запишется в виде:
(2) |
Для краткости обозначим сумму через Q.
Тогда задача определения тренда формулируется так: найти такие значения коэффициентов а0 и а1, чтобы Q = minQ.
Необходимым условием осуществления минимума функции является равенство нулю частных производных этой функции по параметрам а0 и ах:
После преобразования получим систему так называемых нормальных уравнений:
(3) |
Решив эту систему относительно а0 и а1, получим параметры функции f(t) = a0 +a1t.
В случае когда принимается гипотеза о квадратичном виде функции f(t), т.е. , система нормальных уравнений имеет вид [4, с. 62]:
((4) |
, , , , , и подставив их в систему (4), нужно решить эту систему относительно а0, a1, и а2 и получить искомые параметры.
В случае гиперболической зависимости f(t) = а0+а1 / t - система нормальных уравнений имеет вид:
После вычисления коэффициентов аппроксимирующих зависимостей производится процедура прогнозной экстраполяции, заключающаяся в расчете значений функции f(t) на будущие моменты времени t = n+1, n+2, n+3 и т.д. путем подстановки значения аргумента t в выражение тренда.
Метод наименьших квадратов с весами
Экстраполяция выполненной с помощью МНК тенденции изменений показателя на прогнозный период предполагает, что все наблюдения (уровни временного ряда) равнозначны для прогноза [3, с. 120].
Однако информация об изменении показателя в период времени, непосредственно примыкающий к моменту прогноза, «ценнее» для прогнозирования, чем в более удаленный.
Но и более удаленные от момента прогноза наблюдения временного ряда также несут значительную информацию о процессе, поэтому пренебрегать этими наблюдениями при расчете прогноза не следует.
Для учета различной «ценности», или, как это принято в терминологии прогнозирования и информатики, «веса» информации в различные моменты времени применяют метод наименьших квадратов с весами (МНКВ) и метод экспоненциального сглаживания.
Рассмотрим метод наименьших квадратов с весами.
Суть метода заключается в том, что каждому отклонению придается вес <1, причем веса возрастают для точек, находящихся ближе к моменту прогнозирования.
Следовательно, чем дальше наблюдение (уровень) стоит от момента прогноза, тем меньший вес оно имеет, тем меньшее влияние оказывает на формирование уровня прогнозного значения показателя.
Для определения веса удобно использовать выражение [4, с. 66]:
(5) |
где - некоторое число, меньшее единицы;
n - число наблюдений.
Чем меньше величина , тем меньше ранние наблюдения влияют на прогноз.
Условие (5) для МНКВ запишется в виде:
(6) |
Система нормальных уравнений для МНКВ имеет вид:
Пример:
5x - 8y - 16 = 0
8x - y - 32 = 0
16x + 8y - 55 = 0
9x + 7y - 32 = 0
9x + 20y - 29 = 0
Составив значения [aa], [ab]., получаем следующие нормальные уравнения:
507x + 323у - 1765 = 0
323x + 578у - 1084 = 0,
откуда х = +3,55; у = -0,109.
Метод экспоненциального сглаживания
Идея метода заключается в том, что временной ряд сглаживается с помощью взвешенной скользящей средней, веса которой подчиняются экспоненциальному закону, причем чем дальше от момента прогноза отстоит точка ряда, тем меньшее участие принимает она в формировании прогнозного значения.
В общем виде скользящая средняя Sk временного ряда по m наблюдениям при длине ряда n определяется по формуле [4, с. 68-69]:
, k+(m-1)<n |
(7) |
Прогноз временных рядов методом экспоненциального сглаживания основывается на вычислении экспоненциальной средней k-го порядка для ряда xt:
(8) |
где - экспоненциальная средняя k-го порядка для t-го наблюдения временного ряда;
- экспоненциальная средняя [k-1] - го порядка для [t-1] - го наблюдения временного ряда;
k - порядок средней, характеризующий уровень ряда в зависимости от степени прогнозирующего полинома;
t - точка ряда, для которой вычисляется средняя;
і - номера точек, для которых вычисляется средняя;
- параметр сглаживания.
ПримерРазмещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
сгладить приведенный ниже исходный ряд по методу экспоненциальной средней для различных значений параметра сглаживания б: 0,1; 0,5; 0,9. Построить графики и сделать выводы.
На Таблице 1.2 урожайность пшеницы Псковской области за 12 лет (ц/га):
t |
1996 |
1997 |
1998 |
1999 |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
2006 |
2007 |
|
yt |
10,3 |
14,3 |
7,7 |
15,8 |
14,4 |
16,7 |
15,3 |
20,2 |
17,1 |
7,7 |
15,3 |
16,3 |
Решение: Покажем расчет при б = 0,1:
1. За начальное значение сглаженного ряда в момент времени t=1 принимаем первое значение наблюдаемого уровня = y1 = 10,3;
2. Значение экспоненциальной средней в момент времени t=2 в соответствии с выражением составляет = 0,1*14,3+0,9*10,3 = 10,7 и т.д.
3. Для последней точки ряда t=12 значение экспоненциальной средней для параметра сглаживания б = 0,1 равно = 0,1*16,3+0,9*13,07= 13,39.
При б = 0,5 и б = 0,9 расчеты аналогичны. Исходные и сглаженные значения ряда yt по экспоненциальной средней приведены в табл. 1.3, а графики - на рис. 1.1.
Исходный и сглаженные уровни ряда
t, мес |
yt, |
(б =0,1) |
(б =0,5) |
(б =0,9) |
|
1996 |
10,3 |
10,3 |
10,3 |
10,3 |
|
1997 |
14,3 |
10,7 |
12,3 |
13,9 |
|
1998 |
7,7 |
10,4 |
10 |
8,32 |
|
1999 |
15,8 |
10,94 |
12,9 |
15,05 |
|
2000 |
14,4 |
11,29 |
13,65 |
14,46 |
|
2001 |
16,7 |
11,83 |
15,17 |
16,48 |
|
2002 |
15,3 |
12,17 |
15,24 |
15,42 |
|
2003 |
20,2 |
12,98 |
17,72 |
19,72 |
|
2004 |
17,1 |
13,39 |
17,41 |
17,36 |
|
2005 |
7,7 |
12,82 |
12,55 |
8,67 |
|
2006 |
15,3 |
13,07 |
13,93 |
14,64 |
|
2007 |
16,3 |
13,39 |
15,11 |
16,13 |
Наблюдаемые и сглаженные уровни ряда по методу экспоненциальной средней
Самый сглаженный ряд (с наименьшей дисперсией) получен при малом значении б=0,1, а самый колеблемый - при б=0,9 (он почти повторяет значения исходного ряда).
Метод авторегрессии
В основе метода лежит гипотеза стационарности изучаемого явления, т.е. сохранения статистических характеристик явления без изменения на ретроспективном промежутке времени, в настоящем и будущем. В качестве информации, привлекаемой для прогноза, используется ряд динамики случайной прогнозируемой величины (компоненты). Относительно случайной компоненты , выдвигается гипотеза о том, что она представляет собой стационарный процесс.
Авторегрессионные модели можно применять при прогнозировании изучаемых экономических показателей динамического ряда только при выполнении следующих предпосылок:
1) отклонения от тренда представляют собой стационарный в широком смысле случайный процесс;
2) отклонения от тренда являются случайной величиной, не зависящей от времени;
3) отклонения от расчетных значений, полученных по авторегрессионной модели, имеют нормальный закон распределения с математическим ожиданием, равным 0;
4) в ряду отклонений от расчетных значений, полученных по авторегрессионной модели, отсутствует автокорреляция [1, с. 80].
Авторегрессионная модель имеет следующий вид [4, с. 70]:
(11) |
Важным является оценка погрешности полученного прогноза.
Доверительный интервал прогноза будет:
(12) |
где - фактическое значение уровня временного ряда;
- прогнозное значение уровня ряда.
3. Построение прогноза
статистический прогнозирование авторегрессия сглаживание
В самом общем виде модель прогноза по имеющимся данным имеет следующий вид [1, с. 90-91]:
y(t) = tr(t) + S(t) + C(t) + I(t) + е |
(13) |
где tr(t) - тренд, который представляет собой плавно изменяющуюся составляющую, обычно отражающую влияние факторов, оказывающих долговременное воздействие. Например, изменение заболеваемости может иметь длительную тенденцию к уменьшению или увеличению, являющуюся следствием общего изменения состояния экономики государства.
S(t) - сезонная составляющая, которая отражает регулярную повторяемость процессов во времени (в течение года, недели, суток и др.). Например, изменение количества простудных заболеваний или цен на сельскохозяйственную продукцию в течение года, загрузка линий связи в течение суток и т.п.
C(t) - циклическая составляющая, описывающая длительные периоды относительного спада или подъема. Например, изменение уровня заболеваемости по некоторым нозологическим единицам в зависимости от многолетних циклов солнечной активности.
I(t) - интервенции, т.е. резкие изменения под влиянием непредвиденных обстоятельств, например, политических, природных катастроф и т.п., которые неизбежно время от времени случаются, но их практически невозможно определить и локализовать во времени с точки зрения возможности предвидения.
Реально же данная модель сводится к двум составляющим:
y(t) = tr(t) + S(t) |
(14) |
Это связано обычно с ограниченной длиной временного ряда, имеющегося в распоряжении маркетолога. Что касается интервенций, то для их введения необходим анализ политической и экономической информации, даже за пределами страны, что делает практически невозможным их использование для рядового работника.
То есть необходимо сделать прогноз общей тенденции изменений, а затем этот прогноз уточнить введением членов, описывающих сезонные изменения.
Общий прогноз необходимо обязательно представлять в отчетных документах, так как он дает представления об имеющихся тенденциях, которые в помесячном прогнозе на первый взгляд не слишком заметны и не вызывают необходимости делать выводы для всех участников процесса.
Данный алгоритм предназначен для краткосрочного (до года) прогноза по данным и оперативного контроля за изменением тенденций.
Прогноз выполняется в три этапа. На первом этапе производится выделение участка временного ряда, который отражает последние по времени тенденции. Для этого используется полигональная регрессия. Затем строятся три варианта прогноза по выделенному последнему участку. После этого выполняется учет сезонных тенденций.
Исходными данными служат данные о продажах за прошлые периоды времени. Для построения прогноза выполняется следующая последовательность действий:
1. С помощью полигональной регрессии находят точку изменения тенденции. Для этого исходными данными служит отрезок, содержащий не более одного перелома. В обычных условиях - это 2-3 года.
2. Используя фрагмент данных после точки перелома (изменения тенденции), строятся три варианта модели прогноза: линейная функция, показательная, степенная. Эти три функции будут давать три разных варианта прогноза. В литературе их часто называют наиболее вероятный, оптимистический, пессимистический, хотя это не совсем так. Коэффициенты уравнений регрессии находят решением системы методом линейных уравнений. Варианты прогноза являются построением будущих тенденций, исходя из различных предположений о природе процесса. При линейном предполагается, что процесс продолжается как и прежде, при показательном - темпы изменения скорости процесса остаются постоянными, при степенном - темпы изменения скорости увеличиваются.
3. Выявляются сезонные изменения. Для описания сезонных изменений используется представление в виде таблицы долей продаж. После описания всех имеющихся полных периодов выполняется их сравнение. Если все периоды подобны (коэффициенты парной корреляции каждого с каждым не менее 0,9), то модель сезонных изменений представляет собой усреднение всех временных периодов. Если этого нет, то для усреднения выбираются подобные периоды. Если подобных периодов нет, то в качестве модели сезонных изменений выбирается последний период.
Выполняется расчет прогноза на заданный период времени по всем функциям. Прогноз выводится в двух вариантах: как общая тенденция, которая дает возможность представить ход изменений, и с корректировкой, учитывая сезонные изменения [1. с. 98].
4. Анализ методов прогнозирования
Экстраполятивные методы прогнозирования одни из самых точных методов прогнозирования, если применяются правильно. Данная группа методов прогнозирования применяется в ситуациях, когда имеется определенный тренд, который, ожидается, будет продолжаться и в будущем Для успешного применения методов экстраполяции необходимо наличие довольно длинных временных рядов данных.
Метод экспоненциального сглаживания, по сравнению с другими методами прогноза, имеет достоинства и недостатки. В числе достоинств метода необходимо отметить его точность, которая увеличивается с увеличением числа уровней динамического ряда. Недостатком метода является то, что отсутствует точный метод для выбора оптимальной величины параметра сглаживания. Точность прогноза по этому методу падает с увеличением прогнозного интервала. Он эффективен для краткосрочных прогнозов, в прочих условиях его можно использовать для получения приближенных оценок [5, с. 77].
С помощью скользящей средней успешно прогнозируются временные ряды, однако на практике этот метод используется редко из-за грубых результатов.
При использовании метода наименьших квадратов, метода скользящих средних, гармонических весов прогнозируется только детерминированная компонента ряда динамики и не учитывается случайная компонента. Чтобы сделать прогноз более точным, надо отыскать закономерность изменения во времени этой случайной величины и сделать ее прогноз. Затем результаты прогноза детерминированной и случайной компонент объединяются. Сумма двух полученных таким образом прогнозов дает общий суммарный прогноз экономического показателя по одному ряду динамики.
Заключение
Статистические методы прогнозирования - научная и учебная дисциплина, к основным задачам которой относятся разработка, изучение и применение современных математико-статистических методов прогнозирования на основе объективных данных; развитие теории и практики вероятностно-статистического моделирования экспертных методов прогнозирования, в том числе методов анализа субъективных экспертных оценок на основе статистики нечисловых данных; методов прогнозирования в условиях риска и комбинированных методов прогнозирования с использованием совместно экономико-математических и эконометрических (как математико-статистических, так и экспертных) моделей.
Статистические методы прогнозирования основаны на использовании количественной информации о состоянии и поведении исследуемого объекта. Эта информация является ретроспективной, т.е. она описывает состояние и поведение объекта в прошлые моменты времени. Исследователь, анализируя эту информацию, выявляет качественную картину поведения объекта в прошлом, определяет тенденцию его развития.
Экстраполятивные методы прогнозирования одни из самых точных методов прогнозирования, если применяются правильно. Данная группа методов прогнозирования применяется в ситуациях, когда имеется определенный тренд, который, ожидается, будет продолжаться и в будущем Для успешного применения методов экстраполяции необходимо наличие довольно длинных временных рядов данных. С помощью скользящей средней успешно прогнозируются временные ряды, однако на практике этот метод используется редко из-за грубых результатов. При использовании метода наименьших квадратов, метода скользящих средних, гармонических весов прогнозируется только детерминированная компонента ряда динамики и не учитывается случайная компонента.
Список литературы
1. Адамов В.Е., Вергилес Э.В. Статистика промышленности: Учебник. - М.: Финансы и статистика, 2005. - 326 с.
2. Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов. - М.: Высшая школа, 2003. - 479 с.
3. Мизина Е.В. Статистика. Курс лекций. - Д.: ДонГТУ, 2001. - 256 с.
4. Орлов А.И. Прикладная статистика. - М.: Экзамен, 2006. - 671 с.
5. Орлов А.И. Эконометрика. - М.: Экзамен, 2004. - 576 с.
6. Статистика: термины и определения: Учеб. пособие для вузов / Баженова С.Г., Попович Н.К., Велесевич В.И. и др. / Ред. совет: Л.А. Пучков и др. - М.: Высшая школа, 2005. - 338 с.
7. Статистическое моделирование и прогнозирование: Учеб. пособие / Г.М. Гамбаров, Н.М. Журавель, Ю.Г. Королев и др. / Под ред. А.Г. Гранберга. - М.: Финансы и статистика, 2000. - 340 с.
Размещено на Allbest.ru
Подобные документы
Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.
презентация [100,3 K], добавлен 16.12.2014Исследование точности прогнозирования случайного процесса с использованием метода наименьших квадратов. Анализ расхождения между трендом и прогнозом, последующая оценка близости распределения расхождений наблюдений и распределения сгенерированного шума.
курсовая работа [1,0 M], добавлен 29.01.2010Вероятностное обоснование метода наименьших квадратов как наилучшей оценки. Прямая и обратная регрессии. Общая линейная модель. Многофакторные модели. Доверительные интервалы для оценок метода наименьших квадратов. Определение минимума невязки.
реферат [383,7 K], добавлен 19.08.2015Обзор адаптивных методов прогнозирования. Построение модели Брауна. Применение методов прогнозирования на примере СПК колхоза "Новоалексеевский" в рамках модели авторегрессии и проинтегрированного скользящего среднего, предложенной Боксом и Дженкинсом.
дипломная работа [9,0 M], добавлен 28.06.2011Оценка неизвестных величин по результатам измерений, содержащим случайные ошибки, при помощи метода наименьших квадратов. Аппроксимация многочленами, обзор существующих методов аппроксимации. Математическая постановка задачи аппроксимации функции.
курсовая работа [1,9 M], добавлен 12.02.2013Исследование вопросов построения эмпирических формул методом наименьших квадратов средствами пакета Microsoft Excel и решение данной задачи в MathCAD. Сравнительная характеристика используемых средств, оценка их эффективности и перспективы применения.
курсовая работа [471,3 K], добавлен 07.03.2015Постановка задачи аппроксимации методом наименьших квадратов, выбор аппроксимирующей функции. Общая методика решения данной задачи. Рекомендации по выбору формы записи систем линейных алгебраических уравнений. Решение систем методом обратной матрицы.
курсовая работа [77,1 K], добавлен 02.06.2011Изучение аппроксимации таблично заданной функции методом наименьших квадратов при помощи вычислительной системы Mathcad. Исходные данные и функция, вычисляющая матрицу коэффициентов систему уравнений. Выполнение вычислений для разных порядков полинома.
лабораторная работа [166,4 K], добавлен 13.04.2016Определение среднего квадратичного отклонения. Расчет значения критерия Стьюдента, значения доверительных границ с его учетом. Обоснование выбора математической модели прогнозирования. Параметры по методу наименьших квадратов, наработка до отказа.
контрольная работа [394,1 K], добавлен 18.06.2014Аппроксимация и теория приближений, применение метода наименьших квадратов для оценки характера приближения. Квадратичное приближение таблично заданной функции по дискретной норме Гаусса. Интегральное приближение функции, которая задана аналитически.
реферат [82,0 K], добавлен 05.09.2010