Анализ и прогнозирование динамики средней продолжительности жизни в 30 странах мира

Понятие временных рядов и их составляющих, задачи и этапы анализа временных рядов. Выявление аномальных наблюдений, гипотеза существования тенденции и методы сглаживания временных рядов. Построение прогнозов динамики средней продолжительности жизни.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 28.06.2014
Размер файла 1,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Министерство образования и науки Российской Федерации

Бердский филиал ФГБОУ ВПО «Новосибирский Государственный Технический Университет»

Курсовая работа

по дисциплине: «Эконометрика»

на тему: «Анализ и прогнозирование динамики средней продолжительности жизни в 30 странах мира»

г. Новосибирск 2013 г.

Содержание

Введение

1. Теоретическая часть

1.1 Временные ряды и задачи их анализа

1.2 Выявление аномальных наблюдений

1.3 Определение наличия тренда

1.4 Сглаживание (выравнивание) временных рядов

1.5 Трендовые модели

1.6 Проблема выбора вида кривой роста для конкретного временного ряда

1.7 Проверка адекватности моделей

1.8 Оценка качества, значимости и точности модели

1.9 Построение прогнозов

2 Практическая часть

Заключение

Список использованной литературы

Введение

В данной работе я использовала методы эконометрического анализа с целью моделирования и прогнозирования, данных средней продолжительности жизни в странах мира. Значения представляют собой временной ряд данных 30 стран мира. Актуальность данной работы заключается в необходимости точного анализа и прогнозирования, данных временного ряда с целью определения дальнейшего изменения продолжительности жизни. Исследования проводились на основе статистических данных средней продолжительности жизни 30 стран мира.

Целью данной курсовой работы является описание, моделирование и выявление тенденций временного ряда средней продолжительности жизни стран мира. Но главная задача данной работы - это построение наиболее точных прогнозов относительно средней продолжительности жизни.

Первая часть курсовой работы состоит из теоретических аспектов. Даётся полное описание временных рядов, методов моделирования, анализа и прогнозирования временных рядов. Вторая часть представляет собой исследования и расчеты данных о средней продолжительности жизни стран мира. Строится трендовая модель, производится её анализ, и в конце работы производится прогнозирование на основе полученных данных.

1. Теоретическая часть

1.1 Временные ряды и задачи их анализа

Последовательность наблюдений некоторых показателей упорядоченных в зависимости от последовательно возрастающих или убывающих значений другого показателя называется динамическим рядом или рядом динамики. временной ряд сглаживание прогноз

Если в качестве показателя в зависимости от которого идет упорядочение, берется время, то такой ряд называется временным рядом. Отдельные наблюдения называются уровнями ряда, которые будем обозначать yt (t= 1,2,..., n), где n -- число уровней.

В общем виде при исследовании экономического временного ряда yt выделяются несколько составляющих:

yt=ut+vt+ct+Еt (t = 1,2,..., п)- временной ряд

где ut -- тренд, плавно меняющаяся компонента, описывающая чистое влияние долговременных факторов, т. е. длительную («вековую») тенденцию изменения признака (например, рост населения, экономическое развитие, изменение структуры потребления и т. п.). Если во временном ряду меняется длительная тенденция к изменению показателя, то говорят, что в этом ряду есть тренд;

vt -- сезонная компонента, отражающая повторяемость экономических процессов в течение не очень длительного периода (года, иногда месяца, недели и т. д., например, объем продаж товаров или перевозок пассажиров в различные времена года);

ct -- циклическая компонента, отражающая повторяемость экономических процессов в течение длительных периодов (например, влияние волн экономической активности Кондратьева, демографических «ям», циклов солнечной активности и т. п.);

Еt -- случайная компонента, отражающая влияние не поддающихся учету и регистрации случайных факторов.

Следует обратить внимание на то, что в отличие от Еt первые три составляющие (компоненты) ut,, vt, ct являются закономерными, неслучайными.

Отметим основные этапы анализа временных рядов:

1) графическое представление и описание поведения временного рада;

2) выделение и удаление закономерных (неслучайных) составляющих временного рада (тренда, сезонных и циклических составляющих);

3) сглаживание и фильтрация (удаление низко- или высокочастотных составляющих временного рада);

4) исследование случайной составляющей временного рада, построение и проверка адекватности математической модели для ее описания;

5) прогнозирование развития изучаемого процесса на основе имеющегося временного рада;

6) исследование взаимосвязи между различными временными радами.

1.2 Выявление аномальных наблюдений

Аномальный уровень - отдельное значение уровня временного ряда, которое не отвечает потенциальным возможностям исследуемого показателя и оказывает существенное влияние на значения основных характеристик временного ряда.

Выявление аномальных наблюдений является обязательной процедурой во время предварительного анализа временного ряда. Для диагностики аномальных наблюдений разработаны различные критерии, например, метод Ирвина.

Для всех или только для подозреваемых в аномальности наблюдений вычисляется величина лt :

t=2, 3…n

Если рассчитанная величина лt превышает табличное значение, т.е. , то уровень yt считается аномальным. После выявления аномальных уровней определяются причины их возникновения, если точно установлено, что они вызваны ошибками первого рода, то они устраняются, либо заменяются простой средней арифметической двух соседних значений, либо заменой аномальных уровней соответствующими заменами по кривой, аппроксимирующей данный временной ряд.

1.3 Определение наличия тренда

Проверка гипотезы существования тенденции во временном ряду

Прогнозирование временных рядов целесообразно начинать с построения графика исследуемого показателя. Однако в нём не всегда прослеживается присутствие тренда. Поэтому в этих случаях необходимо выяснить - существует ли тенденция во временном ряду или она отсутствует.

Отметим, что о наличии тренда говорит не только изменение среднего значения показателя (уменьшение, увеличение), но и изменение дисперсии, автокорреляции, корреляции с другими показателями и т.д. Тенденцию среднего, дисперсии можно определить визуально из графика исходных данных. Проверка наличия или отсутствия неслучайной (зависящей от времени t) составляющей сводится к проверке гипотезы о неизменности среднего значения временного ряда. Процедура проверки может быть осуществлена с помощью различных методов, например:

· метод проверки разностей средних уровней;

· метод проверки Фостера - Стьюарта.

Метод проверки разностей средних уровней.

Реализация этого метода состоит из четырех этапов. На первом этапе исходный временной ряд y1, y2, y3, …, yn разбивается на две примерно равные по числу уровней части: в первой части n1 первых уровней исходного ряда, во второй -- n2 остальных уровней (n1 + n2 = n).

На втором этапе для каждой из этих частей вычисляются средние значения и дисперсии:

; ;

; .

Третий этап заключается в проверке равенства (однородности) дисперсий обеих частей ряда с помощью критерия Фишера, которая основана на сравнении расчетного значения этого критерия:

С табличным (критическим) значением критерия Фишера Fтабл с заданным уровнем значимости (уровнем ошибки) . Чаще всего =0,05. Величина (1-) называется доверительной вероятностью.

Если расчетное значение Fрасч меньше критического Fтабл, то гипотеза о равенстве дисперсий принимается, и переходят к четвертому этапу. Если Fрасч больше или равно Fтабл, гипотеза о равенстве дисперсий отклоняется и делается вывод, что данный метод для определения наличия тренда ответа не дает.

На четвертом этапе проверяется гипотеза об отсутствии тренда с использованием t-критерия Стьюдента. Для этого определяется расчетное значение критерия Стьюдента по формуле:

где -- среднеквадратическое отклонение разности средних:

.

Если расчетное значение t меньше критического значения статистики Стьюдента tтабл с заданным уровнем значимости , гипотеза принимается, т.е. тренда нет, в противном случае тренд есть.

Метод Фостера-Стьюарта выявления тенденции во временном ряду.

Основными показателями Фостера-Стьюарта являются:

Где wt=Ct+Vt, dt=Ct-Vt, t=1,..n

Параметры Ct , Vt определяются следующим способом:

Из соотношений следует, что 0 ?W ? n ?1, а ?(n ?1) ? D ? n ?1.

Если все уровни ряда одинаковы, то есть y1 = y2 = ... = yn , то W = 0, а если y1 < y2 < ...< yn , то W = n ?1.

Показатели D и W используются для определения тенденции изменения во времени соответственного среднего значения и дисперсии St2 .

После определения для ряда значений D и W по критерию Стьюдента проверяется гипотеза об отсутствии тенденции в среднем значении D и W:

,

где у1 , у2 - среднеквадратические отклонения для D и W , W - среднее значение параметра W .

Теоретическое значение tтабл - критерий, определяют по таблицам Стьюдента при а=0,05. Если tpасч (1) > tтабл и tpасч(2) > tтабл , то гипотеза об отсутствии тренда с вероятностью 0,95 отклоняется. Если tpасч (1) < tтабл и tpасч(2) < tтабл, то с вероятностью 0,95 гипотеза об отсутствии тренда принимается.

1.4 Сглаживание (выравнивание) временных рядов

С целью более четкого выявления тенденции развития, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание временных рядов.

Сглаживание временного ряда - это замена фактических уровней расчётными значениями, имеющими меньшую колеблемость, чем исходные данные. Соответствующие преобразования называются фильтрованием. Сглаживание временных рядов проводится в следующих случаях: если при графическом изображении временного ряда тренд прослеживается недостаточно хорошо; применяемые методы для анализа и прогнозирования требуют сглаживания временного ряда; при устранении аномальных наблюдений; при непосредственном прогнозировании экономических показателей и прогнозировании изменения тренда - точек поворота.

Существующие методы сглаживания делятся на две группы:

1. Аналитические методы: Сглаживание с использованием кривой, проведенной между конкретными уровнями ряда так, чтобы она отображала тенденцию, присущую ряду и одновременно освобождала его от незначительных колебаний.

2. Методы механического сглаживания: Сглаживается каждый отдельный уровень ряда с использованием фактических значений соседних с ним уровней. Для сглаживания временных рядов часто используются такие методы: простой скользящей средней; взвешенной скользящей средней; экспоненциального сглаживания.

Метод простой скользящей средней состоит в следующем. Определяется количество наблюдений, входящих в интервал сглаживания. При этом, если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим. Если нужно сохранить более мелкие волны, но освободиться от периодических, повторяющихся колебаний, то интервал сглаживания уменьшают. Вычисляется среднее значение наблюдений, образующих интервал сглаживания, которое одновременно является сглаженным значением уровня, находящегося в центре интервала сглаживания. Длину интервала сглаживания удобно брать в виде нечётного числа. В этом случае расчётное значение скользящей средней будет приходиться на средний интервал ряда.

Если m нечётное число, то:

где m - количество наблюдений, входящих в интервал сглаживания, p - количество наблюдений, стоящих по разные стороны от сглаживаемого.

Если количество наблюдений в интервале сглаживания нечетно, то:

Первым сглаженным наблюдением будет .

В частности, если m = 3, то = (yt-1+yt+yt+1)/3, t=2,3…, (n-1).

Если m = 5, то = (yt-2+yt-1+ yt+yt+1+yt+2)/5, t=3,4…, (n-2).

Для того, чтобы не потерять первый и последний уровни ряда, их можно вычислить по формулам параболического интерполирования:

= (5y1+2y2-y3)/6

= (5yn+2yn-1-yn-2)/6

Метод простой скользящей средней даёт хорошие результаты во временных рядах с линейной тенденцией развития. Интервал сглаживания несколько раз сдвигается вправо, пока в интервал сглаживания не войдёт последнее наблюдение временного ряда.

Если развитие процесса носит нелинейный характер, то применение метода простой скользящей средней может привести к значительным искажениям исследуемого процесса. В таких случаях более надёжным является использование других методов сглаживания, например метода взвешенной скользящей средней.

Метод взвешенной скользящей средней. Сглаживание ведётся не по прямой, а по кривой более высокого порядка. Если сглаживание производится с помощью полинома второго или третьего порядка, то веса берутся, например, следующие:

1/35(-3; 12; 17; 12; -3) для m=5,

1/21(-2; 3; 6; 7; 6; 3; -2) для m =7.

Веса определяются экспериментальным путем, но с учетом следующих особенностей: веса симметричны относительно центрального члена; сумма весов с учётом общего множителя равна единице. Недостаток метода: первые и последние p наблюдений ряда остаются несглаженными.

1.5 Трендовые модели

Существует большое количество типов трендовых моделей. Наиболее часто используются:

1. Полиномиальные

2. Экспоненциальные

3. S-образные

Полиномиальные кривые используются для приближения и прогнозирования временных рядов, в которых последующее развитие не зависит от достигнутого уровня.

=ao+a1*t - полином первой степени

=ao+a1*t+a2*t2 - полином второй степени

В отличие от полиномиальных кривых, использование экспоненциальных кривых предполагает, что дальнейшее развитие зависит от достигнутого уровня.

Используются две кривые: простая экспонента и модифицированная экспонента.

В экономике распространяются процессы, которые сначала растут медленно, затем ускоряются, а затем снова замедляют свой рост и т.д., например, спрос на товар. Для моделирования таких процессов используются S-образные кривые:

1. Кривая Гомперца:

2.

=k*, где

a, b - положительные параметры;

b<1;

K-асимптота.

3. Логистическая кривая Перла-Рида:

4.

, где

K-асимптота.

1.6 Проблема выбора вида кривой роста для конкретного временного ряда

Комплекс аналитических методов выравнивания временного ряда сводится к выбору конкретных кривых роста и определению их параметров. Плавную кривую (гладкую функцию), аппроксимирующую временной ряд, принято называть кривой роста.

Наиболее часто на практике используются кривые роста, которые позволяют описывать процессы трёх основных типов с монотонным характером развития без предела роста; пределом роста без точки перегиба, такие кривые называются кривыми с насыщением; пределом роста и с точкой перегиба, их называют S ? образными кривыми.

Для описания процессов без предела роста служат функции-полиномы:

· прямая yt = a0 + a1t ,

· парабола yt = a0 + a1t + a2t2 ,

· полином третьей степени yt = a0 + a1t + a2t + a3t3 ,

· экспонента yt =ea0 + a1t,

· гипербола yt = a0 + a1/t.

Процессы такого типа характерны, в основном, для абсолютных объёмных показателей.

Формирование набора моделей, одна из которых будет использована для получения прогноза, происходит на основе интуитивных приемов (таких, например, как анализ графика ряда динамики), формализованных статистических процедур (исследование приростов уровней), а также содержательного анализа процесса. Предпочтение, как правило, отдается простым моделям, допускающим содержательную интерпретацию. К числу наиболее простых относятся линейные модели роста:

где a0 и a1 параметры модели, а t = 1, 2, …, n.

Рассмотрим оценку параметров модели по методу, сводящемуся к поиску таких значений a0 и a1, при которых сумма квадратов отклонений эмпирических (опытных) данных от рассчитанных по модели является наименьшей - метод наименьших квадратов (МНК). Математически критерий такой оценки параметров записывается в виде:

Для нахождения минимума функции двух переменных следует взять частные производные по a0 и a1, а затем приравнять их к нулю.

В результате получаем систему нормальных уравнений:

Решая эту систему двух линейных уравнений с двумя неизвестными, получим:

Для выбора вида кривой часто используют последовательные разности. Вычисляют первые, вторые и высшие порядки разностей уровней временного ряда:

Вычисления осуществляют до тех пор, пока разности не будут почти одинаковыми. Если одинаковыми будут первые разности, то тренд описывается прямой; если приблизительно одинаковые значения имеют вторые разности, то за тренд берут параболу второго порядка и т.д.

1.7 Проверка адекватности моделей

Важным этапом прогнозирования социально-экономических процессов является проверка адекватности (соответствия) модели реальному явлению. Для ее осуществления исследуют ряд остатков , то есть отклонений расчетных значений от фактических. Если модель выбрана правильно, то для остатков характерны:

1) случайный характер значений. Проверяется с помощью критерия поворотных точек;

2) отсутствие автокорреляции (самозависимости). Остатки должны быть независимыми друг от друга. Проверяется с помощью критерия Дарбина - Уотсона;

3) нормальный закон распределения. Проверяется с помощью R/S - критерия;

4) математическое ожидание остатков должно быть равно нулю и дисперсия остатков должна быть неизменна во времени. Проверяется с помощью t- критерия Стьюдента.

Для проверки условия случайности возникновения отдельных отклонений от модели часто используется критерий, основанный на поворотных точках. Уровень последовательности Ei считается максимумом, если он больше двух рядом стоящих уровней, т.е. Ei -1 < Ei > Ei +1 и минимумом, если он меньше обоих соседних уровней, т.е. Ei -1 > Ei < Ei +1. В обоих случаях Ei считается поворотной точкой; общее число поворотных точек для остаточной последовательности Ei обозначим через p.

В случайной выборке математическое ожидание числа точек поворота p и дисперсия 2p выражаются формулами:

Критерием случайности с 5%-ным уровнем значимости, т.е. с доверительной вероятностью 95%, является выполнение неравенства , где квадратные скобки означают целую часть числа. Если неравенство выполняется, то с вероятностью 95% делаем вывод о случайном характере ряда остатков. Если это неравенство не выполняется, модель считается неадекватной.

Проверка независимости значений уровней случайной компоненты, т.е. проверка отсутствия существенной автокорреляции в остаточной последовательности может осуществляться по ряду критериев, наиболее распространенным из которых является d-критерий Дарбина--Уотсона. Необходимо вычислить расчетное значение , где Еi - i- тый уровень остаточной последовательности (i=1..9). Теоретическое обоснование применения этого критерия обусловлено тем, что в динамических рядах как сами наблюдения, так и отклонения от них расположены в хронологическом порядке.

Значение d может располагаться в пределах от 0 до 4. При отсутствии автокорреляции значение d примерно равно 2. При полной автокорреляции - 0 или 4. Следовательно, оценки, получаемые по этому критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (d1) критические значения, позволяющие принять или опровергнуть гипотезу об отсутствия автокорреляции, зависят от количества уровней динамического ряда и числа независимых переменных модели. Значения для этих границ при 5% уровне значимости приведены в Приложении 2. При сравнении расчетного значения d с табличным могут возникнуть следующие ситуации:

· d2<d<2 - ряд остатков не коррелирован;

· d<d1 - остатки содержат автокорреляцию;

· d1<d<d2 - область неопределенности, когда нет оснований ни принять, ни отвергнуть гипотезу о существовании автокорреляции. Необходимо применять другой критерий;

· d>2, то это свидетельствует об отрицательной связи, и его надо преобразовать по формуле d' = 4-d и посмотреть, в какой из трех первых интервалов попадает значение d'.

Установив наличие автокорреляции остатков, надо улучшать модель.

Если же ситуация оказалась неопределенной (d1<d<d2), применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции: . Для суждения о наличии или отсутствии автокорреляции в исследуемом ряду расчетное значение коэффициента r1 сравнивают с критическим для 5%-го уровня значимости (в нашем случае можно взять в качестве rкрит = 0,36). Если ¦r1¦ меньше критического значения, то делается вывод об отсутствии автокорреляции в ряду остатков. Если ¦r1¦ больше

Проверка гипотезы о нормальном распределении остаточной последовательности по R/SE - критерию. В нашем случае R = Emax _ Emin, где Emax и Emin соответственно максимальный и минимальный уровни ряда остатков; . Вычисленное значение R/SE-критерия сравнивается с критическими нижней и верхней границами данного отношения. Критические границы приведены в Приложении 3. Если значение R/SE попадает в интервал между критическими границами, то с заданным уровнем значимости гипотеза о том, что остаточная последовательность распределена по нормальному закону, принимается; в противном случае эта гипотеза отвергается.

Проверка гипотезы о равенстве математического ожидания случайной компоненты нулю на основе t _ критерия Стьюдента. Расчетное значение этого критерия задается формулой где -- среднее арифметическое значение уровней остаточной последовательности Et; SE -- стандартное (среднеквадратическое) отклонение для этой последовательности. Если расчетное значение t меньше критического значения t,v статистики Стьюдента с заданным уровнем значимости и числом степеней свободы v=n-1, то гипотеза о равенстве нулю математического ожидания случайной последовательности принимается; в противном случае эта гипотеза отвергается и модель считается неадекватной.

Если все четыре вышеперечисленные критерии дают положительный ответ, делается вывод о том, что выбранная модель является адекватной реальному ряду экономической динамики. Только в этом случае ее можно использовать для построения прогнозных оценок. В противном случае модель надо улучшать.

1.8 Оценка качества, значимости и точности модели

Если модель оказалась статистически адекватной эмпирическим данным, то предстоит оценить ее качество, значимость и точность.

Проверка качества модели проводится с помощью коэффициента детерминации . Он показывает, какую долю вариации исследуемого признака Y описывает наша модель под воздействием изучаемого фактора. Чем ближе к единице R2, тем лучше качество модели.

Проверка значимости модели проводится с помощью F - теста. Если расчетное значение Fрасч больше критического F,1,2 при заданном уровне значимости и со степенями свободы v1=m и v2=n-m (где m - число факторов, включенных в модель), то модель считается значимой.

Для оценки точности модели используйте стандартную ошибку оценки прогнозируемого показателя (или среднеквадратическое отклонение от линии тренда)

,

где n- число опытов, m - число факторов, включенных в модель, и среднюю относительную ошибку аппроксимации . Если ошибка Еотн не превышает 15%, то точность модели считается приемлемой. В общем случае допустимый уровень точности, а, значит, и надежности прогноза, устанавливает пользователь модели, который в результате содержательного анализа проблемы выясняет, насколько она чувствительна к точности решения и насколько велики потери из-за неточного решения.

1.9 Построение прогнозов

Если в ходе проверки разрабатываемая модель признана значимой, достаточно точной, и ее качество нас устраивает, то на ее основе разрабатывается точечный прогноз. Он получается путем подстановки в модель значений времени t, соответствующих периоду упреждения k (количество шагов прогноза): t=n+k. Так в случае трендовой модели в виде полинома первой степени - линейной модели роста - экстраполяция на k шагов вперед имеет вид:

Для учета случайных колебаний при прогнозировании рассчитываются доверительные интервалы, зависящие от стандартной ошибки, периода упреждения k, длины временного интервала n и уровня значимости прогноза б. В частности, для прогноза будущие значения с вероятностью (1-б) попадут в интервал:

где .

2. Практическая часть

Для практической части я использовал данные о смертности от болезней в г. Бердске с июля 2010, по февраль 2012.

Исходные данные:

t

Yt,

1

96

2

90

3

85

4

84

5

86

6

93

7

74

8

83

9

86

10

75

11

73

12

92

13

105

14

61

15

90

16

74

17

82

18

66

19

76

20

69

21

91

22

88

23

86

24

62

25

82

26

95

27

84

28

103

29

99

30

101

31

83

32

77

Предварительный анализ - это выявление и устранение аномальных значений уровней временного ряда, а так же определение наличия тренда.

Определение аномальных уровней.

Найдём средний показатель смертности;

Yt =84, 09

Для выявления аномальных уровней используют методы математической статистики, например метод Ирвина. Используя данный метод, рассчитаем среднеквадратическое отклонение:

t=2, 3…n

уy= 11,30

t

yt

yt -?yср

(yt -?yср)2

л

1

96

11,91

141,84

 

2

90

5,91

34,92

0,530

3

85

0,91

0,82

0,442

4

84

0,09

0,01

0,088

5

86

1,91

3,64

0,176

6

93

8,91

79,38

0,619

7

74

-10,09

101,80

1,681

8

83

-1,09

1,18

0,796

9

86

1,91

3,64

0,265

10

75

-9,09

82,62

0,973

11

73

-11,09

122,98

0,176

12

92

7,91

62,56

1,681

13

105

20,91

437,22

1,150

14

61

-23,09

533,14

3,893

15

90

5,91

34,92

2,566

16

74

-10,09

101,80

1,415

17

82

-2,09

4,36

0,707

18

66

-18,09

327,24

1,415

19

76

-8,09

65,44

0,884

20

69

-15,09

227,70

0,619

21

91

6,91

47,74

1,946

22

88

3,91

15,28

0,265

23

86

1,91

3,64

0,176

24

62

-22,09

487,96

2,123

25

82

-2,09

4,36

1,769

26

95

10,91

119,02

1,150

27

84

-0,09

0,01

0,973

28

103

18,91

357,58

1,681

29

99

14,91

222,30

0,353

30

101

16,91

285,94

0,176

31

83

-1,09

1,18

1,592

32

77

-7,09

50,26

0,530

Если лtрасч > лtтабл то соответствующие значение уровня является аномальным. Для n=30, лtтабл=1,2, a=0.05.

Сравнив полученные значения, мною было выявлено 11 аномальных значений уровня.

Следующим этапом мы определяем наличие тренда.

Наличие тренда проверяем с помощью метода проверки разностей средних уровней. Для этого разбиваем наш исходный временной ряд на две примерно равные по числу уровней части, в данном случае каждая часть будет состоять из 15 значений. Затем для каждой из этих частей находим средние величины и дисперсии.

и

Проверяем гипотезу о равенстве дисперсии обеих частей с помощью критерия Фишера. Далее при делении большего значения на меньшее мы находим расчетное значение по Фишеру.

Fрасч=162,12/117,55=1,379

Fтабл=2,50

Fрасч < Fтабл

Так как, Fрасч < Fтабл переходим в 4-му этапу. Проверяем гипотезу об отсутствии тренда с помощью критерия Стьюдента.

,

где


Если tрасч меньше табличного значения tтабл, то гипотеза принимается, т.е. тренда нет, в противном случае тренд есть. При заданном а=0,05 и к=n1+n2-2, tтабл =2,05

у=0,31

tрасч =3,06

tрасч > tтабл, значит гипотеза не принимается, т.е .тренд есть.

Сглаживание (выравнивание) временного ряда:

С целью более четкого выявления тенденции развития, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание временных рядов. Существует 2 метода сглаживания: аналитическое сглаживание и механическое. Мы будем использовать механический метод. Определяем интервал сглаживания при m=3 и вычисляем среднее арифметическое.

Например:

Для первого и последнего значения рекомендуется использовать следующие функции:

yt

75,8

75,82

75,95

75,92

76

76,17

76,55

76,40

76,65

76,70

76,9

76,87

77,05

77,12

77,4

77,40

77,75

77,72

78

77,93

78,05

78,05

78,1

78,15

78,3

78,33

78,6

78,55

78,75

78,78

79

78,93

79,05

79,05

79,1

79,10

79,15

79,17

79,25

79,23

79,3

79,35

79,5

79,53

79,8

79,73

79,9

79,88

79,95

79,97

80,05

80,15

80,45

80,40

80,7

80,72

81

81,23

82

81,88

Далее выбираем трендовую модель с помощью метода конкретных разностей.

Представим расчёты в виде таблицы

yt

logut

logut/yt

logut/yt2

75,8

75,82

 

 

 

 

 

 

75,95

75,92

0,175

0,002305

-1,743

-6,07261

-10,402242

76

76,17

0,241667

0,0458

0,003173

-1,420

-5,75312

-10,086044

76,55

76,40

0,266667

-0,0042

0,00349

-1,322

-5,65774

-9,9937212

76,65

76,70

0,233333

-0,0292

0,003042

-1,455

-5,79519

-10,135091

76,9

76,87

0,208333

0,0167

0,00271

-1,569

-5,91069

-10,252761

77,05

77,12

0,266667

0,0458

0,003458

-1,322

-5,66708

-10,012395

77,4

77,40

0,3

0,0000

0,003876

-1,204

-5,55296

-9,9019464

77,75

77,72

0,266667

-0,0667

0,003431

-1,322

-5,67483

-10,027895

78

77,93

0,166667

-0,0792

0,002139

-1,792

-6,14761

-10,503467

78,05

78,05

0,108333

-0,0125

0,001388

-2,223

-6,57989

-10,937242

78,1

78,15

0,141667

0,0458

0,001813

-1,954

-6,31291

-10,671539

78,3

78,33

0,2

0,0417

0,002553

-1,609

-5,97041

-10,331384

78,6

78,55

0,225

-0,0042

0,002864

-1,492

-5,85539

-10,219126

78,75

78,78

0,191667

-0,0458

0,002433

-1,652

-6,0187

-10,3854

79

78,93

0,133333

-0,0542

0,001689

-2,015

-6,38351

-10,75211

79,05

79,05

0,083333

-0,0375

0,001054

-2,485

-6,85499

-11,225068

79,1

79,10

0,058333

-0,0083

0,000737

-2,842

-7,21229

-11,583007

79,15

79,17

0,066667

0,0167

0,000842

-2,708

-7,07961

-11,451161

79,25

79,23

0,091667

0,0417

0,001157

-2,390

-6,76199

-11,134391

79,3

79,35

0,15

0,0500

0,00189

-1,897

-6,27099

-10,644857

79,5

79,53

0,191667

0,0125

0,00241

-1,652

-6,02817

-10,40435

79,8

79,73

0,175

-0,0375

0,002195

-1,743

-6,12166

-10,500345

79,9

79,88

0,116667

-0,0208

0,00146

-2,148

-6,529

-10,909569

79,95

79,97

0,133333

0,0500

0,001667

-2,015

-6,39651

-10,778123

80,05

80,15

0,216667

0,0750

0,002703

-1,529

-5,9133

-10,297195

80,45

80,40

0,283333

0,1000

0,003524

-1,261

-5,64815

-10,03516

80,7

80,72

0,416667

0,1500

0,005162

-0,875

-5,26641

-9,6573589

81

81,23

0,583333

0,007181

-0,539

-4,93632

-9,3336478

82

81,88

 

 

 

 

 

 

На основе полученных данных выбираем вид трендовой модели, в нашем случае он линейный. Если в качестве Yt использовать полином вида Yt=a+b*t, то для определения параметров a и b получим систему линейных уравнений:

Подставляем наши данные в уравнение и находим a и b.

a=75,85

b=0,18

После того как мы выявили модель проверяем ее на адекватность. Трендовая модель считается адекватной, если правильно отражает систематические компоненты временного ряда. Это требование эквивалентно следующему требованию: остаточная компонента (Et) должна удовлетворять следующим 4 свойствам:

Проверка 1 свойства означает проверку гипотезы о правильности выбора вида модели, тренда:

1.Критерий серий.

Kmax - серия максимальной длины, а v - общее число серий. Если Еt>Еm, то ставим «+», если наоборот то ставим «-».

Критерий серий

V - число серий

K max

6

13

10,22

14,52

1 условие не выполняется

Так как гипотеза по критерию серий не верна, я рассмотрела адекватность модели с помощью критерия поворотных точек (пиков).

Et-1<Et>Et+1 - то будет считаться мах;

Et-1>Et<Et+1 - то min.

И в том и в другом случае, точка будет называться поворотной точкой.

Р - количество поворотных точек. Математическое ожидание поворотных точек (Р) определяется по формуле:

= 2/3*(n-2)

Дисперсия определяется:

=

При а=0,05, проверяем выполнение следующего условия:

если Р> [], то 1свойство выполняется.

Критерий поворотных точек

Р=13

=

18,66667

=

5,011111

P>

2,847093

13>

2,847093

1 условие выполняется

Проверка 2 свойства:

Проверяем с помощью показателей ассиметрии и экцесса.

A - коэффициент ассиметрии

Э - коэффициент экцесса

A = -1,14

-3

Э = -2,36

Одновременно должно выполняться два условия:

Так как , значит, свойство не выполняется. И мы будем проверяем модель на адекватность с помощью критерия согласия .

Для этого разобьем данные на группы.

k

6

R

1,23

h

0,205

k=[1+3,32*,

где k - количество групп (6 групп),

R=max Еt - min Еt,

где R - размах вариации,

h = ,

где h - длина интервала.

?1=[min Et; min Et + h)

?2=[ min Et + h; min Et + 2h) и т.д. получает шесть интервалов.

Полученные интервалы

№ интервала

Нижняя граница

Верхняя граница

Кол-во попавших значений в интервал

?1

-0,48

-0,275

5

?2

-0,275

-0,070

10

?3

-0,070

0,135

7

?4

0,135

0,340

6

?5

0,340

0,545

1

?6

0,545

0,750

1

Далее вычисляем Pi=F(b)-F(a) - вероятность попадания в тот или иной интервал.

Вероятность попадания в тот или иной интервал

№ п/п

Pi

n*Pi

Pi`

Число значений, попавших в интервал

Р1

0,139834289

4,195029

8,211323

7

Р2

0,261764668

7,85294

7,85294

10

Р3

0,284664451

8,539934

8,539934

7

Р4

0,179860126

5,395804

5,395804

6

Р5

0,0659815

1,979445

Р6

0,067894965

2,036849

Так как n*Pi?5, то, я объединила первый, пятый и шестой интервалы. Далее рассчитаем ч2 расч, которое должно быть меньше ч2 табл. (в нашем случае 5,99).

ч2 расч =) -n

Получается 1,11<5,99, следовательно, гипотеза верна, можем переходить к следующему этапу.

Проверка 3 свойства: проверяется гипотеза о том, что EEt=0. Для этого используем критерий Стьюдента, выдвигаем гипотезу, что математическое ожидание равно нулю.

, где

=

tрасч = -1,034

tтабл = 2,05 при а=0,05

Если tрасч < tтабл значения с уровнем значимости б и числом степеней свободы n-1, то гипотеза, о равенстве нулю математического ожидания, принимается. В нашем случае -1,034<2,05 - гипотеза принимается.

Проверка 4 свойства: проверка независимости значений уровней случайной компоненты (отсутствие автокорреляции). Выполняется с помощью критерия Дарбина-Уотсона, расчетное значение которого определяется по формуле:

Расчетное значение критерия необходимо сравнить с критическими значениями из таблицы Дарбина-Уотсона при n=30 и а=0,05: d1=1,28 и d2=1,57. Если d > d2, то гипотеза о независимости уровней остаточной последовательности принимается, т.е. трендовая модель адекватна. Если d < d1, то эта гипотеза отвергается и модель неадекватна. При значениях d1 < d > d2 нельзя сделать тот или иной вывод.

Так как 1,69 >1,57, то свойство выполняется, трендовая модель адекватна.

Так как все четыре свойства выполняются одновременно, то трендовая модель, выбранная нами, считается адекватной.

Далее проверяем модель на «точность»:

Среднеквадратичное отклонение:

к - число параметров модели, к=2

Средняя относительная ошибка аппроксимации:

Средняя относительная ошибка должна быть не больше 10-15%.

Коэффициент сходимости:

Коэффициент детерминации:

R2=1-

R2=1-0,002=0,998

Чем ближе коэффициент детерминации к 1, тем выше точность модели.

Прогнозирование экономических показателей

Точечный прогноз - прогноз, которым называется единственное, прогнозируемого показателя. Определяется подстановкой в выбранную модель величины t.

Проведем прогнозирование для t=31 и t=32, т.е вычислим данные для 31 и 32 страны.

t=+*t

y31=75,85+0,18*31=81,43

y32=75,85+0,18*32=81,61

Проведем интервальный прогноз путем расчета доверительного интервала для линейной модели.

, где

n=30, L=1(период), tl =2,05.

Для 31 значения:

81,43±2,05*0,2030*1,068

(80,99; 81,87)

Для 32 значения:

81,61±2,05*0,2030*1,068

(81,17; 82,05)

Заключение

В ходе данной работы мною было проведено моделирование и прогнозирование одного временного ряда, а именно средней продолжительности жизни в разных странах. Исследование было проведено с помощью следующих действий:

1) предварительный анализ, который заключался в выявлении аномальных уровней ряда с помощью метода Ирвина;

2) определение и наличие тренда с помощью метода проверки разностей средних уровней;

3) сглаживание временного ряда при помощи метода простой скользящей средней и определение трендовой модели;

4) проверка трендовой модели на адекватность с помощью критерия поворотных точек (пиков), критерия согласия , критерия Стьюдента, критерия Дарбина-Уотсона;

5) проверка трендовой модели на точность;

6) прогнозирование экономических показателей на основе точечного и интервального прогнозирование.

В результате прогнозирования, я определила среднюю продолжительность жизни 31 и 32 страны. Затем я вычислила доверительные интервалы, в которых может изменяться значение прогноза.

На основе полученных данных, можно сделать вывод, что средняя продолжительность жизни стран мира будет расти, и это приведет к демографическому росту населения стран мира.

Список использованной литературы

1. Елисеева И.И., Практикум по эконометрике: Учебное пособие. - М.: Финансы и статистика, 2005 - 192 с.

2. Кремер Н.Ш., Путко Б.А., Эконометрика: Учебник для вузов - М.: ЮНИТИ-ДАНА, 2002.

3. Луговская Л.В., Эконометрика в вопросах и ответах: учебное пособие. - М.: ТК Велби, Изд-во Проспект, 2006. - 208 с.

4. Тихомиров Н.П., Дорохина Е.Ю., Эконометрика: учебник. - М.: Экзамен, 2003 - 512 с.

5. Чураков Е.П., Прогнозирование эконометрических временных рядов: учеб. пособие / Е.П. Чураков. - М.: Финансы и статистика, 2008. - 208 с.

Размещено на Allbest.ru


Подобные документы

  • Структурные компоненты детерминированной составляющей. Основная цель статистического анализа временных рядов. Экстраполяционное прогнозирование экономических процессов. Выявление аномальных наблюдений, а также построение моделей временных рядов.

    курсовая работа [126,0 K], добавлен 11.03.2014

  • Статистические методы анализа одномерных временных рядов, решение задач по анализу и прогнозированию, построение графика исследуемого показателя. Критерии выявления компонент рядов, проверка гипотезы о случайности ряда и значения стандартных ошибок.

    контрольная работа [325,2 K], добавлен 13.08.2010

  • Временные ряды и их характеристики. Факторы, влияющие на значения временного ряда. Тренд и сезонные составляющие. Декомпозиция временных рядов. Метод экспоненциального сглаживания. Построение регрессионной модели. Числовые характеристики переменных.

    контрольная работа [1,6 M], добавлен 18.06.2012

  • Основные элементы эконометрического анализа временных рядов. Задачи анализа и их первоначальная обработка. Решение задач кратко- и среднесрочного прогноза значений временного ряда. Методы нахождения параметров уравнения тренда. Метод наименьших квадратов.

    контрольная работа [37,6 K], добавлен 03.06.2009

  • Теоретические выкладки в области теории хаоса. Методы, которые используются в математике, для прогнозирования стохастических рядов. Анализ финансовых рядов и рядов Twitter, связь между сентиметными графиками и поведением временного финансового ряда.

    курсовая работа [388,9 K], добавлен 01.07.2017

  • Классические подходы к анализу финансовых рынков, алгоритмы машинного обучения. Модель ансамблей классификационных деревьев для прогнозирования динамики финансовых временных рядов. Выбор алгоритма для анализа данных. Практическая реализация модели.

    дипломная работа [1,5 M], добавлен 21.09.2016

  • Анализ временных рядов с помощью статистического пакета "Minitab". Механизм изменения уровней ряда. Trend Analysis – анализ линии тренда с аппроксимирующими кривыми (линейная, квадратическая, экспоненциальная, логистическая). Декомпозиция временного ряда.

    методичка [1,2 M], добавлен 21.01.2011

  • Расчет суммы издержек для плана выпуска продукции. Коэффициенты линейного уравнения парной регрессии. Характеристика графической интерпретации результатов. Развитие экономических процессов. Особенности эконометрического моделирования временных рядов.

    контрольная работа [723,3 K], добавлен 22.02.2011

  • Изучение особенностей стационарных временных рядов и их применения. Параметрические тесты стационарности. Тестирование математического ожидания, дисперсии и коэффициентов автокорреляции. Проведение тестов Манна-Уитни, Сиджела-Тьюки, Вальда-Вольфовитца.

    курсовая работа [451,7 K], добавлен 06.12.2014

  • Влияние девальвации национальной валюты на цены активов и процентных ставок на фондовый рынок. Анализ отраслевых взаимосвязей и закономерностей в динамике биржевых индикаторов и множества других временных рядов. Оценка моделей методом "rolling window".

    дипломная работа [1,7 M], добавлен 06.11.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.