Многофакторный анализ. Временные ряды

Матрица парных линейных коэффициентов корреляции. Расчетные критерии Стьюдента. Расчет параметров уравнения линейной регрессии. Множественный коэффициент детерминации. Определение аномальных значений временного ряда. Сглаживание временных рядов.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 22.02.2013
Размер файла 756,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

ПРИЛОЖЕНИЕ А. МНОГОФАКТОРНЫЙ АНАЛИЗ

Целью данной работы является проведение многофакторного анализа и построение уравнения зависимости состояния углерода (С) от параметров температуры (TEPLOTAFE), содержания кремния(SI), серы(S) и марганца(MN).

Используя табличный процессор Microsoft Office Excel и последовательность расчетов, постоим и выберем аналитическую форму уравнения регрессии по данным, приведенным в таблице 1.

Таблица 1 - Исходные данные

TEPLOTAFE(0C)

SI(%)

MN(%)

S(%)

C(%)

1

1423

0,38

0,40

0,024

4,91

2

1410

0,44

0,52

0,029

4,84

3

1449

0,94

0,49

0,021

4,87

4

1416

0,73

0,40

0,023

4,87

5

1401

0,68

0,39

0,021

4,80

6

1425

0,65

0,41

0,020

4,99

7

1431

0,89

0,52

0,013

4,85

8

1422

0,38

0,42

0,013

4,94

9

1425

0,61

0,51

0,009

4,96

10

1453

0,70

0,51

0,012

4,94

11

1451

0,91

0,56

0,005

4,90

12

1467

0,83

0,58

0,007

4,96

13

1460

0,66

0,52

0,010

4,97

14

1432

0,53

0,48

0,016

5,01

15

1438

0,84

0,55

0,011

4,96

16

1449

0,68

0,50

0,015

4,97

17

1435

0,79

0,49

0,014

4,92

18

1398

0,34

0,35

0,035

4,78

19

1411

0,73

0,43

0,021

4,76

20

1417

0,52

0,36

0,028

4,75

21

1411

0,88

0,43

0,020

4,72

22

1407

0,70

0,37

0,033

4,72

23

1411

0,80

0,40

0,028

4,71

24

1420

0,61

0,39

0,025

4,87

25

1416

0,51

0,40

0,023

4,88

26

1421

0,53

0,40

0,024

4,96

27

1428

0,65

0,36

0,024

4,87

28

1420

0,47

0,34

0,030

4,91

29

1424

0,45

0,31

0,035

4,76

30

1407

0,40

0,33

0,035

4,74

31

1425

0,53

0,38

0,022

4,88

32

1444

0,74

0,44

0,017

4,94

33

1425

0,56

0,45

0,022

4,89

34

1421

0,62

0,56

0,015

4,95

35

1441

0,60

0,47

0,011

5,01

36

1438

0,55

0,48

0,009

5,02

37

1444

0,67

0,52

0,012

5,02

38

1459

1,09

0,57

0,008

4,99

39

1416

0,86

0,55

0,006

4,81

40

1406

0,66

0,62

0,009

4,88

41

1428

0,81

0,47

0,011

4,94

42

1439

0,61

0,44

0,015

4,96

43

1447

0,98

0,50

0,009

4,95

44

1445

0,84

0,51

0,010

4,94

45

1431

0,65

0,40

0,018

4,97

46

1421

0,59

0,40

0,022

4,94

47

1425

0,64

0,40

0,017

4,96

48

1432

0,71

0,52

0,014

4,96

49

1430

0,60

0,49

0,018

4,98

50

1436

0,79

0,45

0,015

4,96

1. Корреляционный анализ

Для количественной оценки связи зависимости исследуемого параметра от нескольких критериев строим и проанализируем матрицу парных линейных коэффициентов корреляции.

Проведение корреляционного анализа воспользуемся помощью Microsoft Office Excel , пакета анализа, Корреляция. (Таблица 2).

Таблица 2 - Матрица парных линейных коэффициентов корреляции.

TEPLOTAFE

SI

MN

S

TEPLOTAFE

1

SI

0,49

1

MN

0,54

0,56

1

S

-0,65

-0,58

-0,83

1

C

0,66

0,09

0,46

-0,64

Анализируя матрицу парных линейных коэффициентов корреляции rху принимается во внимание:

1. Знак коэффициента парной корреляции, который указывает на характер взаимосвязи величин. «+» - означает, что зависимость прямая между зависимым параметром C и всеми факторными признаками, кроме серы у нее знак «-» означает обратную связь.

2. Величина коэффициента парной корреляции.

Для оценки тесноты связи сравнивали значение парного коэффициента между углеродом и всеми независимыми признаками и определили заметную связь углерода с серой и температурой, умеренную связь с марганцем и слабую с кремнием.

3. Значимость (существенность) линейного коэффициента корреляции. Интерпретируя значение коэффициента корреляции, следует иметь в виду, что он рассчитан для ограниченного числа наблюдений и подвержен случайным колебаниям, т.е. как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями. Поэтому на основе t-критерия Стьюдента оценивают существенность (значимость) самого rху и, соответственно реальность измеряемой связи между C и TEPLOTAFE, SI, MN, S.

Для этих целей строят и анализируют матрицу расчетных значений t-критерия Стьюдента. (Таблица 3).

Таблица 3 - Расчетные критерии Стьюдента

TEPLOTAFE

SI

MN

S

C

TEPLOTAFE

1

SI

1,95

1

MN

2,21

2,33

1

S

2,99

2,45

5,10

1

C

3,04

0,30

1,81

2,91

1

Если tрасч > tтабл, то нулевая гипотеза отвергается и линейный коэффициент считается значимым, а связь между х и у - существенной.

Расчетные значения критерия Стьюдента углерода с температурой кремнием марганцем серой равны соответственно 3,04; 0,30; 1,81, 2,91, а табличное значение равно 2,01.

По критерию Стьюдента коэффициенты корреляции TEPLOTAFE, S являются значимыми, а коэффициент корреляции между SI, MN и C является не значимым.

Наличие мультиколлинеарности между факторными признаками является превышение величины парного коэффициента корреляции 0,8 в данном случае мультиколлинеарные факторы отсутствуют.

После проверки на существенность и значимость из выборки исключили SI и по критерию силы связи и существенности связи между C обозначим за Y и коэффициентами оставляем x1 - TEPLOTAFE, x4 - S .

Поэтому выше перечисленные признаки могут быть включены в модель.

2. Расчет параметров уравнения линейной регрессии

Построение регрессионной модели осуществлялось с помощью Microsoft Office Excel , пакета анализа, Регрессия, результаты приведены в таблицах. (см. таблицы. 4 - 8)

Таблица 4 - Регрессионная статистика

Регрессионная статистика

Множественный R

0,73

R-квадрат

0,53

Нормированный R-квадрат

0,50

Стандартная ошибка

0,06

Наблюдения

50

Эти результаты соответствуют следующим статистическим показателям:

Множественный R -- множественный коэффициент корреляции R;

R-квадрат - множественный коэффициент детерминации R2;

Стандартная ошибка -- остаточное стандартное отклонение

Наблюдения -- число наблюдений n.

Таблица 5 - Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

3,00

0,19

0,06

17,19

0,0000001

Остаток

46,00

0,17

0,00

Итого

49,00

0,37

Столбцы таблицы 5 имеют следующую интерпретацию:

1. Столбец df -- число степеней свободы.

Для строки Регрессия число степеней свободы определяется количеством факторных признаков m в уравнении регрессии kФ= m.

Для строки Остаток число степеней свободы определяется числом наблюдений n и количеством переменных в уравнении регрессии m + 1: kО = n - (m+1).

Для строки Итого число степеней свободы определяется суммой kY = kФ + kО.

2. Столбец SS -- сумма квадратов отклонений.

Для строки Регрессия -- это сумма квадратов отклонений теоретических данных от среднего.

Для строки Остаток -- это сумма квадратов отклонений эмпирических данных от теоретически.

3. Столбец МS -- дисперсии.

4. Столбец F -- расчетное значение F - критерия Фишера Fp.

5. Столбец Значимость F -- значение уровня значимости, соответствующее вычисленному значению Fр.

Таблица 6 - Значение коэффициентов регрессии

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

1,90

1,06

1,79

0,08

-0,23

4,03

-0,23

4,03

TEPLOTAFE

0,00

0,00

3,11

0,00

0,00

0,00

0,00

0,00

MN

-0,25

0,21

-1,18

0,24

-0,68

0,18

-0,68

0,18

S

-5,88

2,16

-2,73

0,01

-10,22

-1,55

-10,22

-1,55

Столбцы таблицы 6 имеют следующую интерпретацию:

Коэффициенты -- значения коэффициентов аi.

Стандартная ошибка -- стандартные ошибки коэффициентов аi.

t-статистика -- расчетные значения t-критерия

Перейдем к анализу сгенерированных таблиц.

Рассчитанные в таблице 6 коэффициенты регрессии аi позволяют построить уравнение, выражающее зависимость

Y= 1,9 + 0,002*X1 - 0,25* X3 -5,88*Х4 Для измерения степени совокупного влияния отобранных факторов на результативный признак рассмотрим совокупный коэффициент детерминации R2 и совокупный коэффициент множественной корреляции R - общие показатели тесноты связи многих признаков.

Значение множественного коэффициента детерминации R2 = 0,53 (Таблица 4) показывает, что 53 % общей вариации результативного признака объясняется вариацией факторных признаков X1 Х3 , Х4 . Значит, выбранные факторы существенно влияют на Y, что подтверждает правильность их включения в построенную модель.

Рассчитанный уровень значимости р = 0,0000001 < 0,05 (показатель Значимость F в таблице 5) подтверждает значимость R2, и следовательно свидетельствует о существенности связи между рассматриваемыми признаками.

Другой подход к проверке значимости R2 основан на сравнении расчетного и критического значения F - критерия. В генерируемых таблицах режима не приводится значение F кр, но его можно легко вычислить с помощью функции FРАСПОБР. Для рассматриваемого примера Fкр =2,8,

Так как Fрасч =17,19 (показатель F в таблице 5) больше Fкр =2,8, то гипотеза H0: R2 = 0 отвергается, т. е. коэффициент детерминации R2 является значимым.

Следующим этапом является проверка значимости коэффициентов регрессии: а0, а1 , a4 и а3. Сравнивая попарно эти элементы со стандартными ошибками, видим, что абсолютное значение коэффициента а1 является больше своей стандартной ошибки. Так же он является значимым, это можно проверить по значениям показателя Р- значение (см. Таблица 6), которые меньше заданного уровня значимости = 0,05, остальные же коэффициенты не значимы.

Другой способ проверки значимости коэффициентов осуществляется с помощью сравнения расчетного и критического значений t-критерия Стьюдента. Значение tкр=2,01,

Так как таких коэффициентов, как TEPLOTAFE и свободный член (см. таблица 6) превышает tкрл (теоретическое) значение t-критерия Стьюдента, то коэффициенты регрессии в уравнении являются значимыми, а значение коэффициентов критериев SI и MN меньше tкрл (теоретическое) значение t-критерия Стьюдента, то коэффициенты регрессии в уравнении являются не значимыми.

По аналогии, проанализировав таблицы и проверив коэффициенты на значимость путем сравнения значений коэффициентов Стьюдента расчетного с теоретическим, получили, что свободный коэффициент не значимым.

В случае статистической не значимости свободного члена а0 для пересчета уравнения регрессии в диалоговом окне Регрессия задаются те же самые параметры, за исключением лишь того, что следует активизировать флажок Константа-ноль. На данном этапе был выполнен шаг 2.

Полученные данные показаны в таблицах 7-9.

Таблица 7 - Регрессионная статистика

Регрессионная статистика

Множественный R

1,00

R-квадрат

1,00

Нормированный R-квадрат

0,98

Стандартная ошибка

0,06

Наблюдения

50

Таблица 8 - Дисперсионный анализ

df

SS

MS

F

Регрессия

1,00

1201,05

1201,05

284428,04

0,00

Остаток

49,00

0,21

0,00

Итого

50,00

1201,26

Fтабл =

4,03

Таблица 9 - Значение коэффициентов регрессии

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

0

#Н/Д

#Н/Д

#Н/Д

#Н/Д

#Н/Д

#Н/Д

#Н/Д

TEPLOTAFE

0,003

0,00001

533,318

0,000

0,003

0,003

0,003

0,003

Полученное уравнение удовлетворяет всем критериям значимости и существенности, следовательно, модель признана адекватной.

Для принятия решения о выборе уравнения сведем полученные характеристики в таблицу 10.

Таблица 10 - Пошаговая регрессия

Шаг

Модель

Параметры модели

t-критерий Стьюдента

F-критерий Фишера

Стандартная ошибкаапроксимации

Коэффициент детерминации

расчетное

критическое

результаты сравнения

расчетное

критическое

результаты сравнения

1

Y= 1,9 + 0,002*X1 - 0,25* X3 -5,88*Х4

a0

1,79

2,01

незначим

17,19

2,81

значим

0,73

0,53

a1

3,11

значим

a3

-1,18

незначим

a4

-2,73

незначим

3

Y=0,003*X1

a1

461,8

2,01

значим

284428

4,04

значим

1

1

Вывод: Проделав многофакторный анализ данных, мы видим из таблицы 10, что искомое значимое уравнение регрессии Y=0,003*X1, содержащее значимые параметры было получено на втором шаге.

Этот выбор подтверждается увеличением множественного коэффициента детерминации.

ПРИЛОЖЕНИЕ Б. ВРЕМЕННЫЕ РЯДЫ

Целью данной работы является описание особенностей ряда и подбор статистической модели, которая описывает временной ряд.

В таблице 1 представлен исходный временной ряд.

Таблица 1 - Исходный временной ряд

t(с)

SI(%)

t(с)

SI(%)

t(с)

SI(%)

t(с)

SI(%)

t(с)

SI(%)

1

0,38

11

0,91

21

0,88

31

0,53

41

0,81

2

0,44

12

0,83

22

0,70

32

0,74

42

0,61

3

0,94

13

0,66

23

0,80

33

0,56

43

0,98

4

0,73

14

0,53

24

0,61

34

0,62

44

0,84

5

0,68

15

0,84

25

0,51

35

0,60

45

0,65

6

0,65

16

0,68

26

0,53

36

0,55

46

0,59

7

0,89

17

0,79

27

0,65

37

0,67

47

0,64

8

0,38

18

0,34

28

0,47

38

1,09

48

0,71

9

0,61

19

0,73

29

0,45

39

0,86

49

0,60

10

0,70

20

0,52

30

0,40

40

0,66

50

0,79

График 1 - Модель временного ряда

1. Определение аномального значения

Суть анализа временных рядов заключается в выявлении и устранении аномальных значений уровней ряда.

Значение SI обозначим за y, и далее будем использовать.

Таблица 2 - Определение аномальных значений ряда

t

SI

(y-?)2

л

Результат

1

0,38

0,082

2

0,44

0,051

0,4

3

0,94

0,075

3,0

аномальное

4

0,73

0,004

1,3

аномальное

5

0,68

0,000

0,3

6

0,65

0,000

0,2

7

0,89

0,050

1,4

8

0,38

0,082

3,1

аномальное

9

0,61

0,003

1,4

аномальное

10

0,70

0,001

0,5

11

0,91

0,059

1,3

аномальное

12

0,83

0,027

0,5

13

0,66

0,000

1,0

14

0,53

0,019

0,8

15

0,84

0,030

1,9

аномальное

16

0,68

0,000

1,0

17

0,79

0,015

0,7

18

0,34

0,107

2,7

аномальное

19

0,73

0,004

2,3

аномальное

20

0,52

0,021

1,3

аномальное

21

0,88

0,046

2,2

аномальное

22

0,70

0,001

1,1

23

0,80

0,018

0,6

24

0,61

0,003

1,1

аномальное

25

0,51

0,025

0,6

26

0,53

0,019

0,1

27

0,65

0,000

0,7

28

0,47

0,039

1,1

29

0,45

0,047

0,1

30

0,40

0,071

0,3

31

0,53

0,019

0,8

32

0,74

0,005

1,3

аномальное

33

0,56

0,011

1,1

34

0,62

0,002

0,4

35

0,60

0,004

0,1

36

0,55

0,014

0,3

37

0,67

0,000

0,7

38

1,09

0,179

2,5

аномальное

39

0,86

0,037

1,4

аномальное

40

0,66

0,000

1,2

аномальное

41

0,81

0,021

0,9

42

0,61

0,003

1,2

аномальное

43

0,98

0,098

2,2

аномальное

44

0,84

0,030

0,8

45

0,65

0,000

1,1

аномальное

46

0,59

0,006

0,4

47

0,64

0,001

0,3

48

0,71

0,002

0,4

49

0,60

0,004

0,7

50

0,79

0,015

1,1

аномальное

Таблица 3 - Данные расчетов

Среднее значение

0,67

Среднеквадратическое отклонение (СКО)

0,166

Проверка правилом 3у

Интервал допустимых значений

0,168

< y i <

1,164

0,50

MAX

1,09

MIN

0,34

Для выявления аномальных значений временных рядов используются методы, рассчитанные для статистических совокупностей, такие как: метод Ирвина, метод 3у.

По результатам анализа методом Ирвина воспользуемся следующей формулой:

,

гдe среднеквадратическое отклонение рассчитывается с использованием формул:

Расчетные значения сравниваются с табличными значениями критерия Ирвина л табл = 1,1 , и если расчетное значение больше табличного, то значение yt уровня ряда - это аномальное значение. Вследствие этого условия были определены аномальные значения ряда данных. В таблице 2 представлен результат определения аномальных значений ряда.

А так же проверка осуществлялась по методу трех сигм (3у), суть которого состоит в определении закона распределения случайной величины с доверительной вероятностью. С вероятностью 0,95 значение временного ряда должно попадать в интервал [y-3у; y+3у]. Если значение попадает в данный интервал, то речь идет о нормальном распределении случайной величины и не аномальном значении ряда, если же значение выходит за границы доверительного интервала, то значение - аномальное.

2. Проверка наличия тренда

Чтобы определить наличие тренда в данном временном ряду применяется несколько методов: Критерий серий, Критерий «восходящих» и «нисходящих» серий.

Рассмотрим «Критерий серий». С целью проверки гипотезы о неизменности среднего значения временного ряда рассмотрим критерий серий, основанный на медиане.

Значение временного ряда сопоставляется с выборочной медианой, и если x(t) > , то для соответствующего наблюдения член последовательности, образующего серии, принимает знак«+», если x(t) < , то - знак «-».

Таблица 4 - Проверка наличия тренда методом «Критерий серий»

SI

Серии

Число серий

Нисходящие серии

Серии

0,38

-

-

0,44

-

2

-

2

0,94

+

+

0,73

+

+

0,68

+

3

+

3

0,65

-

-

0,89

+

+

0,38

-

-

0,61

-

2

-

2

0,70

+

+

0,91

+

+

0,83

+

+

0,66

+

4

+

4

0,53

-

-

0,84

+

+

0,68

+

+

0,79

+

3

+

3

0,34

-

-

0,73

+

+

0,52

-

-

0,88

+

+

0,70

+

+

0,80

+

3

+

3

0,61

-

-

0,51

-

-

0,53

-

-

0,65

-

-

0,47

-

-

0,45

-

-

0,40

-

-

0,53

-

8

-

8

0,74

+

+

0,56

-

-

0,62

-

-

0,60

-

-

0,55

-

4

-

4

0,67

+

+

1,09

+

+

0,86

+

+

0,66

+

+

0,81

+

5

+

5

0,61

-

-

0,98

+

+

0,84

+

2

+

2

0,65

-

-

0,59

-

-

0,64

-

3

-

3

0,71

+

+

0,60

-

-

0,79

+

+

Таблица 5 - Данные расчетов

Медиана

0,655

Число серии(n)

11

max серия(t)

8

ЛОЖЬ

ЛОЖЬ

Проверка по нисходящему критерию серий

Число серии(n)

11

max серия(t)

8

ИСТИНА

ЛОЖЬ

В методе «Критерий серий», основанном на медиане выборки, для того чтобы не была отвергнута гипотеза о случайности исходного ряда, должны выполняться следующие неравенства:

(1)

где n - длина временного ряда;

н(n) - число серий;

фmax(n) - число подряд идущих плюсов или минусов в самой длинной серии;

квадратные скобки, как обычно, обозначают целую часть числа.

Если хотя бы одно из неравенств (1) нарушается, то гипотеза об отсутствии тренда отвергается, в данном случае нарушены оба неравенства. Из этого следует вывод о наличии тренда

Проверка гипотезы «Критерий «восходящих» и «нисходящих» серий» основывается на том, что при условии случайности ряда протяженность самой длинной серии не должна быть слишком большой, а общее число серий - слишком малым.

«Критерий «восходящих» и «нисходящих» серий» устанавливается исходя из системы неравенств (2)

(2)

где n - длина временного ряда;

н(n) - число серий;

фmax(n) - число подряд идущих плюсов или минусов в самой длинной серии.

Если хотя бы одно из неравенств (2) окажется нарушенным, то гипотезу об отсутствии тренда следует отвергнуть, т.е. в ряде данных присутствует неслучайная компонента, зависящая от времени t. Наличие тренда.

3. Сглаживание временных рядов

3.1 Метод простой скользящей средней

Метод простой скользящей средней, согласно которому фактические уровни заменяются средними уровнями, рассчитанными для последовательно подвижных (скользящих) укрупненных интервалов, охватывающих т уровней ряда.

По заданию, проведены расчеты для трех и пяти точек: m=3, m=5.

матрица корреляция временной ряд

Таблица 6 - Сглаживание простой скользящей средней

Метод простой скользящей средней

t

SI

Сглаживание по 3 точкам

Сглаживание по 5 точкам

1

0,38

2

0,44

3

0,94

0,587

4

0,73

0,703

5

0,68

0,783

0,634

6

0,65

0,687

0,688

7

0,89

0,740

0,778

8

0,38

0,640

0,666

9

0,61

0,627

0,642

10

0,70

0,563

0,646

11

0,91

0,740

0,698

12

0,83

0,813

0,686

13

0,66

0,800

0,742

14

0,53

0,673

0,726

15

0,84

0,677

0,754

16

0,68

0,683

0,708

17

0,79

0,770

0,700

18

0,34

0,603

0,636

19

0,73

0,620

0,676

20

0,52

0,530

0,612

21

0,88

0,710

0,652

22

0,70

0,700

0,634

23

0,80

0,793

0,726

24

0,61

0,703

0,702

25

0,51

0,640

0,700

26

0,53

0,550

0,630

27

0,65

0,563

0,620

28

0,47

0,550

0,554

29

0,45

0,523

0,522

30

0,40

0,440

0,500

31

0,53

0,460

0,500

32

0,74

0,557

0,518

33

0,56

0,610

0,536

34

0,62

0,640

0,570

35

0,60

0,593

0,610

36

0,55

0,590

0,614

37

0,67

0,607

0,600

38

1,09

0,770

0,706

39

0,86

0,873

0,754

40

0,66

0,870

0,766

41

0,81

0,777

0,818

42

0,61

0,693

0,806

43

0,98

0,800

0,784

44

0,84

0,810

0,780

45

0,65

0,823

0,778

46

0,59

0,693

0,734

47

0,64

0,627

0,740

48

0,71

0,647

0,686

49

0,60

0,650

0,638

50

0,79

0,700

0,666

График 2 - Сглаживание по 3 точкам

График 3 - Сглаживание по 5 точкам

Вывод: Визуально проанализировав графики, заметно, что сглаживание по 5 точкам более плавно выявляет тенденцию развития временного ряда и приближает его к среднему значению, а сглаживание по 3 точкам более точно отражает исходный ряд данных.

3.2 Метод медианного сглаживания

Суть метода: вместо скользящей средней можно использовать медиану значений, попавших в окно.

Таблица 7 - Метод медианного сглаживания

Метод медианного сглаживания

t

SI

Сглаживание по 3 точкам

Сглаживание по 5 точкам

1

0,38

0,44

0,68

2

0,44

0,73

0,68

3

0,94

0,73

0,73

4

0,73

0,68

0,68

5

0,68

0,68

0,65

6

0,65

0,65

0,65

7

0,89

0,61

0,70

8

0,38

0,61

0,70

9

0,61

0,70

0,70

10

0,70

0,83

0,70

11

0,91

0,83

0,83

12

0,83

0,66

0,68

13

0,66

0,66

0,68

14

0,53

0,68

0,68

15

0,84

0,79

0,73

16

0,68

0,68

0,68

17

0,79

0,73

0,73

18

0,34

0,52

0,70

19

0,73

0,73

0,73

20

0,52

0,70

0,70

21

0,88

0,80

0,70

22

0,70

0,70

0,61

23

0,80

0,61

0,61

24

0,61

0,53

0,53

25

0,51

0,53

0,51

26

0,53

0,53

0,47

27

0,65

0,47

0,47

28

0,47

0,45

0,47

29

0,45

0,45

0,53

30

0,40

0,53

0,56

31

0,53

0,56

0,60

32

0,74

0,62

0,60

33

0,56

0,60

0,60

34

0,62

0,60

0,62

35

0,60

0,60

0,67

36

0,55

0,67

0,67

37

0,67

0,86

0,81

38

1,09

0,86

0,81

39

0,86

0,81

0,81

40

0,66

0,66

0,81

41

0,81

0,81

0,81

42

0,61

0,84

0,65

43

0,98

0,84

0,65

44

0,84

0,65

0,65

45

0,65

0,64

0,64

46

0,59

0,64

0,64

47

0,64

0,64

0,67

48

0,71

0,71

0,71

49

0,60

0,69

0,69

50

0,79

0,79

0,79

График 4 - Сглаживание по 3 точкам

График 5- Сглаживание по 5 точкам

Вывод: Медианное сглаживание более точно отражает тенденцию изменения ряда.

3.3 Метод экспоненциального сглаживания

Его особенность заключается в том, что в процедуре нахождения сглаженного уровня используются значения только предшествующих уровней ряда, взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня ряда.

Экспоненциальное сглаживание определяется по формуле 3:

, (3)

где -- параметр сглаживания (0 < < 1); величина (1 - ) называется коэффициентом дисконтирования.

Таблица 8 - Метод экспоненциального сглаживания.

Метод экспоненциального сглаживания

t

SI

=0,1

=0,3

1

0,38

0,38

0,63

2

0,44

0,39

0,58

3

0,94

0,44

0,69

4

0,73

0,47

0,70

5

0,68

0,49

0,69

6

0,65

0,51

0,68

7

0,89

0,55

0,74

8

0,38

0,53

0,63

9

0,61

0,54

0,63

10

0,70

0,55

0,65

11

0,91

0,59

0,73

12

0,83

0,61

0,76

13

0,66

0,62

0,73

14

0,53

0,61

0,67

15

0,84

0,63

0,72

16

0,68

0,64

0,71

17

0,79

0,65

0,73

18

0,34

0,62

0,61

19

0,73

0,63

0,65

20

0,52

0,62

0,61

21

0,88

0,65

0,69

22

0,70

0,65

0,69

23

0,80

0,67

0,73

24

0,61

0,66

0,69

25

0,51

0,65

0,64

26

0,53

0,63

0,60

27

0,65

0,64

0,62

28

0,47

0,62

0,57

29

0,45

0,60

0,54

30

0,40

0,58

0,50

31

0,53

0,58

0,51

32

0,74

0,59

0,58

33

0,56

0,59

0,57

34

0,62

0,59

0,59

35

0,60

0,59

0,59

36

0,55

0,59

0,58

37

0,67

0,60

0,61

38

1,09

0,65

0,75

39

0,86

0,67

0,78

40

0,66

0,67

0,75

41

0,81

0,68

0,77

42

0,61

0,67

0,72

43

0,98

0,70

0,80

44

0,84

0,72

0,81

45

0,65

0,71

0,76

46

0,59

0,70

0,71

47

0,64

0,69

0,69

48

0,71

0,70

0,70

49

0,60

0,69

0,67

50

0,79

0,70

0,70

График 6 - Сглаживание с параметром =0,1

График 7 - Сглаживание с параметром =0,3

Вывод: От параметра зависит сглаживание временного ряда. Чем больше , тем сильнее сказываются фактически (наблюдаемые) значения ряда, чем меньше , тем сильнее сказываются теоретические сглаженные значения.

4. Нахождение трендовой модели

Смысл этого метода состоит в том, что основная тенденция развития процесса (тренд) рассчитывается как функция времени (Формула 4).

(4)

Набор моделей формируется на основе интуитивных приемов.

На практике статистического изучения временных рядов различают следующие основные типы развития явлений во времени:

Ш ;

Ш ;

Ш ;

Ш ;

Ш

Построение трендовых моделей осуществлялось с помощью пакета Microsoft Office Excel, результаты представлены на графиках (8 - 10).

График 8 - Линейная модель

График 9 - Экспоненциальная модель

График 10 - Полиномиальная модель

Вывод: Проанализировав графики построенных трендовых моделей, адекватных моделей не найдено, но для приведения примеров проверки точности и адекватности была выбрана линейная модель.

5. Оценка адекватности и точности линейной трендовой модели

Проверка случайности колебаний уровней остаточной последовательности означает проверку гипотезы о правильности выбора вида тренда. Для исследования случайности отклонений от тренда необходимо располагать набором разностей (Формула 5)

(t =1 , 2, . . ., n) (5)

Характер этих отклонений изучается с помощью ряда непараметрических критериев. Одним из таких критериев является критерий пиков (поворотных точек). Уровень последовательности t считается максимумом, если он больше двух рядом стоящих уровней, т.е. t -1 < t >t+1, и минимумом, если он меньше обоих соседних уровней, т.е. t -1 > t <t+1. В обоих случаях t считается поворотной точкой; общее число поворотных точек для остаточной последовательности t обозначим через р.

Критерием случайности с уровнем значимости =0,05 является выполнение неравенства (6).

(6)

где квадратные скобки означают целую часть числа, это неравенство выполняется, 32 > 26 условие выполняется, трендовая модель считается неадекватной.

Проверка соответствия распределения случайной компоненты нормальному закону распределения может быть произведена по RS-критерию.

Этот критерий численно равен отношению размаха вариации случайной величины R= max-min к стандартному отклонению, вычисляемому по формуле 7.

(7)

у=0,18

Вычисленное значение RS -критерия сравнивается с табличными значениями, которые равны 3,47 и 4,89, верхнее и нижнее соответственно. В данном случае рассчитанное значение не попадает в данный интервал, модель считается распределенной не по нормальному закону, т. е. не адекватной.

Проверка равенства математического ожидания случайной компоненты нулю, если она распределена по нормальному закону, осуществляется на основе t-критерия Стьюдента. Расчетное значение этого критерия задается формулой 8.

(8)

где -- среднее арифметическое значение уровней остаточной последовательности t;

-- стандартное (среднеквадратическое) отклонение для этой последовательности.

Расчетное значение t = 2,41 больше табличного значения t=2,00 статистики Стьюдента с уровнем значимости 0,95 , гипотеза о равенстве нулю математического ожидания случайной последовательности принимается, модель не адекватна.

Проверка независимости значений уровней случайной компоненты, т.е. проверка отсутствия существенной автокорреляции в остаточной последовательности осуществляется через d-критерий Дарбина -- Уотсона. Расчетное значение этого критерия определяется по формуле 9:

(9)

Расчетное значение критерия d =1,43 больше верхнего табличного значения d2 =1,49 то гипотеза о независимости уровней остаточной последовательности, т.е. об отсутствии в ней автокорреляции, принимается.

Вывод: модель является неадекватной по причине не выполнения всех критериев одновременно.

В качестве статистических показателей точности применяются следующие:

Ш Среднеквадратичное отклонение (СКО). (Формула 10)

(10)

у=0,18

Средняя относительная ошибка аппроксимации (ошибка менее 5% свидетельствует об удовлетворительном уровне точности; ошибка в 10% и более считается большой). (Формула 11)

(11)

= 21,45

Ш коэффициент сходимости (Формула 12).

(12)

?2 =1,17

Коэффициент детерминации (трендовая модель адекватна изучаемому процессу и отражает тенденцию его развития во времени при значениях R2, близких к 1). (Формула 13)

(13)

R2 = 0,17

В приведенных формулах (7- 13): n -- количество уровней ряда, k -- число определяемых параметров модели, - оценка уровней ряда по модели, - среднее арифметическое значение уровней ряда.

Вывод: После проверки на точность и адекватность данной линейной модели временного ряда, определили, что она не адекватна и не точна.

Размещено на Allbest.ru


Подобные документы

  • Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.

    контрольная работа [298,2 K], добавлен 19.01.2011

  • Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.

    контрольная работа [110,4 K], добавлен 28.07.2012

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.

    лабораторная работа [890,1 K], добавлен 06.12.2014

  • Выборка и генеральная совокупность. Модель множественной регрессии. Нестационарные временные ряды. Параметры линейного уравнения парной регрессии. Нахождение медианы, ранжирование временного ряда. Гипотеза о неизменности среднего значения временного ряда.

    задача [62,0 K], добавлен 08.08.2010

  • Временные ряды и их характеристики. Факторы, влияющие на значения временного ряда. Тренд и сезонные составляющие. Декомпозиция временных рядов. Метод экспоненциального сглаживания. Построение регрессионной модели. Числовые характеристики переменных.

    контрольная работа [1,6 M], добавлен 18.06.2012

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Методика определения параметров линейной регрессии, составления экономической интерпретации коэффициентов регрессии. Проверка выполнения предпосылок МНК. Графическое представление физических и модельных значений. Нахождение коэффициентов детерминации.

    контрольная работа [218,0 K], добавлен 25.05.2009

  • Проверка графика на анормальности и наличие тренда. Определение параметров линейной регрессии. Сглаживание уровней ряда методом простой скользящей средней. Расчет среднеквадратического отклонения. Адекватность и точность параметров нелинейных регрессий.

    контрольная работа [912,4 K], добавлен 26.05.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.