Расчет параметров парной линейной регрессии

Построение модели парной линейной регрессии, описывающей зависимость среднедушевых денежных расходов за месяц от среднемесячной начисленной заработной платы на человека. Расчет коэффициентов корреляции и детерминации. Анализ средней ошибки аппроксимации.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 19.05.2012
Размер файла 832,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ФГОУ ВПО «БАШКИРСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ»

Факультет экономический

Специальность финансы и кредит

Контрольная работа

по дисциплине «Эконометрика»

Колесникова Ольга Михайловна

Форма обучения заочная

Курс, группа 203ф

Руководитель

доц. каф. СиИСЭ. Салимова Г.А.

Уфа 2011

ЗАДАЧА 1

1 Рассчитайте параметры парной линейной регрессии

2 Оцените тесноту связи с помощью показателей корреляции и детерминации

3 Оцените с помощью средней ошибки аппроксимации качество уравнений

4 Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента

5 Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня (). Определите доверительный интервал прогноза для уровня значимости = 0,05

6 Оцените полученные результаты, выводы оформите в аналитической записке

Таблица 1.1 Исходные данные

Регионы

Среднедушевые денежные расходы за месяц, руб., y

Среднемесячная начисленная заработная плата работающих в экономике, руб., x

Республика Башкортостан

14253

14084,1

Республика Марий Эл

7843

10534,6

Республика Мордовия

8384

10530,5

Республика Татарстан

14181

14904,0

Удмуртская Республика

9581

12153,8

Чувашская Республика

8594

11146,6

Пермский край

16119

14774,1

Кировская область

10112

10971,0

Нижегородская область

13090

13467,7

Оренбургская область

10184

12087,2

Пензенская область

10173

11723,1

Самарская область

15805

14674,9

Саратовская область

9062

12008,3

Ульяновская область

9756

10895,0

Свердловская область

17171

17526,7

Построим поле корреляции (рис.1.1)

Рис. 1.1 Поле корреляции. Зависимость среднемесячного начисленная заработной платы работающих в экономике от среднедушевого денежного расхода за месяц

Таблица 1.2 Расчетные данные для построения модели парной линейной регрессии

1

14253

14084,1

200740677,3

198361872,8

203148009

2

7843

10534,6

82622867,8

110977797,2

61512649

3

8384

10530,5

88287712

110891430,3

70291456

4

14181

14904

211353624

222129216

201100761

5

9581

12153,8

116445557,8

147714854,4

91795561

6

8594

11146,6

95793880,4

124246691,6

73856836

7

16119

14774,1

238143717,9

218274030,8

259822161

8

10112

10971

110938752

120362841

102252544

9

13090

13467,7

176292193

181378943,3

171348100

10

10184

12087,2

123096044,8

146100403,8

103713856

11

10173

11723,1

119259096,3

137431073,6

103489929

12

15805

14674,9

231936794,5

215352690

249798025

13

9062

12008,3

108819214,6

144199268,9

82119844

14

9756

10895

106291620

118701025

95179536

15

17171

17526,7

300950965,7

307185212,9

294843241

Итого

174308

191481,6

2310972718

2503307351,56

2164272508

Среднее

11620,53

12765,44

154064847,9

166887156,8

144284833,9

Для уравнения зависимости среднедушевых денежных расходов за месяц от среднемесячной начисленной заработной платы на человека система нормальных уравнений составит:

Решаем ее:

Итак, уравнение парной линейной регрессии, описывающее зависимость среднедушевых денежных расходов за месяц от среднемесячной начисленной заработной платы на человека, рассчитанное на основе выборочного обследования 15 регионов РФ, имеет вид:

.

В среднем по изучаемой нами совокупности отклонение уровня заработной платы от средней величины на 1 тыс. руб. приводило к отклонению средних денежных расходов на 1,456 тыс. руб. в среднем.

По полученному уравнению определим теоретические (расчетные) значения и запишем их в таблице 1.3. Правильность расчета параметров уравнения регрессии может быть проверена с помощью сравнения сумм Изобразим полученное уравнение на графике - построим линию регрессии (рис. 1.2.).

Рис. 1.2 Линия регрессии зависимости среднемесячных начислений заработной платы работающих в экономике от среднедушевых денежных расходов за месяц

Коэффициент эластичности составит

,

т.е. при повышении среднемесячной заработной платы 1 человека в среднем на 1% средние денежные расходы за месяц на 1 человека увеличиваются на 1,6%.

Таблица 1.3

1

13540,68

4,99

1738864,196

6929880,75

507399,64

712,32

0,05

2

8372,13

6,74

4976647,106

14269758,08

279978,02

529,13

0,06

3

8366,16

0,21

4994956,804

10475148,02

318,29

17,84

0,002

4

14734,56

3,9

4573438,874

6555989,55

306434,26

553,56

0,039

5

10729,9

11,99

374103,4896

4159696,22

1319978,15

1148,9

0,119

6

9263,28

7,78

2620642,946

9159904,02

447941,09

669,28

0,077

7

14545,41

9,76

4034714,996

20236202,35

2476175,62

1573,58

0,097

8

9007,58

10,92

3220014,914

2275672,82

1219728,65

1104,41

0,109

9

12643,12

3,41

493169,1076

2159332,28

199703

446,88

0,034

10

10632,92

4,41

460009,4976

2063628,02

201533,15

448,92

0,044

11

10102,74

0,69

1086472,676

2095352,75

4935,66

70,25

0,006

12

14400,96

8,88

3646037,492

17509761,28

1971315,52

1404,03

0,088

13

10518,03

16,07

573260,9796

6546092,82

2120039,09

1456,03

0,16

14

8896,92

8,8

3498545,794

3476484,55

738017,6

859,08

0,088

15

18553,57

8,05

22669596,79

30807680,22

1911499,49

1382,57

0,08

Итого

174308

106,64

58960475,66

138720583,7

13704997,27

12376,82

1,066

Среднее

11620,53

7,11

3930698,377

9248038,916

913666,4846

825,12

0,071

Средняя ошибка аппроксимации составит (относительные ошибки аппроксимации для каждого наблюдения рассчитаны в таблице 1.3.):

- уравнение прямой линии достаточно хорошо отражает зависимость между изучаемыми явлениями.

Оценим тесноту линейной связи среднемесячной заработной платы на душу населения и среднедушевых денежных расходов с помощью коэффициента корреляции:

- связь между среднемесячной заработной платой на душу населения и среднедушевыми денежными расходами высокая, прямая.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции - коэффициент детерминации

или 90,1%.

Это означает, что 90,1% расходов обусловлены различиями в уровне среднемесячных заработных плат регионов РФ, остальные 9,9% вызваны прочими факторами, которые в данном случае не рассматриваются (допустим, в нашем случае ими могут быть количество безработных, детей и т.д.).

Оценим значимость уравнения регрессии в целом:

Фактическое значение критерия Фишера, равное 118,585, больше табличного, равного 4,67, следовательно, гипотеза о случайности различий факторной и остаточной дисперсии отклоняется. Эти различия существенны, статистически значимы, уравнение надежно, значимо, показатель тесноты связи надежен и отражает устойчивую зависимость средних денежных расходов на душу населения от уровня среднемесячных заработных плат на человека в 15 регионах РФ в 2008 г.

Рассчитаем стандартные ошибки параметров и коэффициента корреляции:

t-критерий для числа степеней свободы составит 1,770933.

следовательно, являются статистически значимыми.

Рассчитаем доверительные интервалы для параметров уравнения регрессии:

предельная ошибка параметра ;

предельная ошибка коэффициента регрессии ;

предельная ошибка коэффициента корреляции .

; или

;

Рассчитаем точечные ожидаемые средние денежные расходы на душу населения для среднемесячной заработной платы, превышающей среднюю на 10%, имея построенную модель зависимости:

руб. на душу населения.

Стандартная ошибка прогнозирования:

Доверительный интервал для прогнозируемого значения:

, где

- предельная ошибка прогноза, которая в 95% случаев не будет превышена.

Доверительный интервал прогноза:

,

т.е. прогнозное значение денежных расходов человека, имеющего заработную плату 14041,984 руб. в месяц, будет находиться в интервале руб. Это то интервальное значение средних денежных расходов при заданном прогнозном значении уровня среднемесячной заработной платы, который в 95 случаях из 100 подтвердится.

ЗАДАЧА 2

линейный регрессия корреляция аппроксимация

Таблица 2.1 Исходные данные. Показатели российских банков на 1 марта 2008 г.

Банк

Работающие активы, млн. руб., y

Собственный капитал, %, х1

Средства частных лиц, %, х2

Сбербанк

1917403

10

60

Внешторгбанк

426484

16

13

Газпромбанк

362532

8

9

Альфа-банк

186700

13

15

Банк Москвы

157286

11

30

Росбанк

151849

8

19

Ханты-Мансийский банк

127440

3

5

МДМ-банк

111285

12

9

ММБ

104372

8

10

Райффайзенбанк

96809

8

22

Промстройбанк

85365

10

24

Ситибанк

81296

11

12

Уралсиб

76617

16

22

Межпромбанк

67649

36

1

Промсвязьбанк

54848

9

11

Петрокоммерц

53701

15

26

Номос-банк

52473

11

6

Зенит

50666

14

10

Русский стандарт

46086

19

7

Транскредитбанк

41332

9

8

Ак Барс

40521

23

19

Глобэкс

40057

26

16

Еврофинанс-Моснарбанк

38245

15

5

Никойл

36946

23

11

Автобанк-Никойл

34762

19

34

Импэксбанк

34032

13

37

Союз

33062

13

8

БИН-банк

32948

12

20

Возрождение

30713

9

49

Гута-банк

30596

10

13

Таблица 2.2 Вспомогательная таблица для расчета параметров уравнения множественной регрессии

i

1

1917403

10

60

3676434264409,00

100

3600

600

19174030

115044180

2

426484

16

13

181888602256,00

256

169

208

6823744

5544292

3

362532

8

9

131429451024,00

64

81

72

2900256

3262788

4

186700

13

15

34856890000,00

169

225

195

2427100

2800500

5

157286

11

30

24738885796,00

121

900

330

1730146

4718580

6

151849

8

19

23058118801,00

64

361

152

1214792

2885131

7

127440

3

5

16240953600,00

9

25

15

382320

637200

8

111285

12

9

12384351225,00

144

81

108

1335420

1001565

9

104372

8

10

10893514384,00

64

100

80

834976

1043720

10

96809

8

22

9371982481,00

64

484

176

774472

2129798

11

85365

10

24

7287183225,00

100

576

240

853650

2048760

12

81296

11

12

6609039616,00

121

144

132

894256

975552

13

76617

16

22

5870164689,00

256

484

352

1225872

1685574

14

67649

36

1

4576387201,00

1296

1

36

2435364

67649

15

54848

9

11

3008303104,00

81

121

99

493632

603328

16

53701

15

26

2883797401,00

225

676

390

805515

1396226

17

52473

11

6

2753415729,00

121

36

66

577203

314838

18

50666

14

10

2567043556,00

196

100

140

709324

506660

19

46086

19

7

2123919396,00

361

49

133

875634

322602

20

41332

9

8

1708334224,00

81

64

72

371988

330656

21

40521

23

19

1641951441,00

529

361

437

931983

769899

22

40057

26

16

1604563249,00

676

256

416

1041482

640912

23

38245

15

5

1462680025,00

225

25

75

573675

191225

24

36946

23

11

1365006916,00

529

121

253

849758

406406

25

34762

19

34

1208396644,00

361

1156

646

660478

1181908

26

34032

13

37

1158177024,00

169

1369

481

442416

1259184

27

33062

13

8

1093095844,00

169

64

104

429806

264496

28

32948

12

20

1085570704,00

144

400

240

395376

658960

29

30713

9

49

943288369,00

81

2401

441

276417

1504937

30

30596

10

13

936115216,00

100

169

130

305960

397748

Итого

4604075

410

531

4173183447549,00

6876

14599

6819

52747045

154595274

Среднее

153469,1667

13,67

17,7

139106114918,30

229,2

486,6333

227,3

1758234,833

5153175,8

Матрица парных коэффициентов корреляции

Матрица парных коэффициентов корреляции имеет вид

где ryxi - парные коэффициенты корреляции результата с каждым фактором.

Парные коэффициенты корреляции найдем по формулам:

Где

Получаем:

В данной модели мультиколлинеарные факторы отсутствуют, так как все парные коэффициенты корреляции < 0,7.

Оценка параметров с помощью метода определителей

Параметры уравнения множественной регрессии оцениваются, как и в парной регрессии, методом наименьших квадратов (МНК). При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров регрессии. Так, для уравнения система нормальных уравнений составит:

На основе расчетов, представленных в таблице 2.2, получили следующую систему:

Решаем систему с помощью метода определителей.

При этом

где - определитель системы; - частные определители.

Определитель системы имеет вид:

Частные определители получаем путем замены соответствующего столбца матрицы определителя системы данными левой части системы.

,

Уравнение множественной регрессии имеет вид:

.

В линейной множественной регрессии параметры при х называются коэффициентами условно чистой регрессии. Они характеризуют среднее изменение результатов, с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне.

Так, в нашем случае, с увеличением собственного капитала на 1%, работающие активы уменьшатся в среднем на 3251,508 млн. руб. при тех же средствах частных лиц. Повышение средств частных лиц на 1% при том же уровне собственного капитала приведет к увеличению работающих активов на 13783,625 млн. руб.

Построение уравнения регрессии в стандартизованном масштабе

Параметры множественной регрессии можно определить другим способом, когда на основе матрицы парных коэффициентов корреляции строится уравнение регрессии в стандартизованном масштабе:

,

где t- стандартизованные переменные, для которых среднее значение равно 0, а среднее квадратическое отклонение равно 1;

в - стандартизованные коэффициенты регрессии.

Применяя МНК к уравнению множественной регрессии в стандартизованном масштабе, после соответствующих преобразований получим систему нормальных уравнений вида:

где rух1, rух2 - парные коэффициенты корреляции.

Система уравнений имеет вид:

Решив систему методом определителей, получили формулы:

Уравнение в стандартизованном масштабе имеет вид:

Уравнение в стандартизованном масштабе показывает, что с ростом собственного капитала на 1 сигму при неизменном уровне средств частных лиц, работающие активы в среднем уменьшатся на 0,062 сигмы; а с ростом средств частных лиц на 1 сигму при неизменном уровне собственного капитала, работающие активы увеличатся в среднем на 0,534 сигмы.

Во множественной регрессии коэффициенты «чистой» регрессии bi связаны со стандартизованными коэффициентами регрессии вi следующим образом:

Проверяем:

Частные коэффициенты корреляции

Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в модель. Формула коэффициента частной корреляции, выраженная через показатель детерминации, для х1 принимает вид:

Таким образом, при закреплении фактора на постоянном уровне (элиминировании) корреляция и равна 0,073, то есть связь слабая, обратная. При закреплении фактора на постоянном уровне корреляция и равна 0,532, то есть связь слабая, прямая.

Построение частных уравнений регрессии

Частные уравнения регрессии связывают результативный признак с соответствующими факторами х при закреплении других, учитываемых во множественной регрессии, факторов на среднем уровне. Частные уравнения имеют вид:

В отличие от парной регрессии частные уравнения регрессии характеризуют изолированное влияние фактора на результат, т.к. другие факторы закреплены на неизменном среднем уровне.

В данной задаче частные уравнения имеют вид:

Определение средних коэффициентов эластичности

Средние по совокупности показатели эластичности находим по формуле:

Для данной задачи они окажутся равными:

Таким образом, с повышением собственного капитала на 1%, работающие активы в среднем по совокупности понизятся на 0,29% при неизменных средствах частных лиц. При увеличении средств частных лиц на 1%, работающие активы в среднем по изучаемой совокупности увеличатся на 1,59% при неизменном уровне собственного капитала.

Коэффициент множественной корреляции

Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата - коэффициента детерминации. Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, т.е. оценивает тесноту связи совместного влияния факторов на результат. Величина индекса множественной корреляции должна быть больше или равна максимальному парному индексу корреляции. При линейной зависимости признаков формула индекса корреляции может быть представлена следующим выражением:

где вxi - стандартизованные коэффициенты регрессии;

ryxi - парные коэффициенты корреляции результата с каждым фактором.

Ryx1x2 =

Таким образом, связь величины работающих активов с уровнем собственного капитала и средствами частных лиц слабая.

Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции или совокупного коэффициента корреляции.

Определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции

При линейной зависимости совокупный коэффициент корреляции можно также определить через матрицу парных коэффициентов корреляции:

,

где ?r - определитель матрицы парных коэффициентов корреляции;

?r11 - определитель матрицы межфакторной корреляции.

Для уравнения определитель матрицы коэффициентов парной корреляции принимает вид:

Определитель более низкого порядка ?r11 остается, когда вычеркиваются из матрицы коэффициентов парной корреляции первый столбец и первая строка, что соответствует матрице коэффициентов парной корреляции между факторами:

В данной задаче

Тогда

Определение коэффициента детерминации

Качество построенной модели в целом оценивает коэффициент детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции:

.

Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:

где n - число наблюдений;

m - число параметров при переменных х (число факторов, включенных в модель).

Чем больше величина m, тем сильнее различия и чем больше объем совокупности, по которой исчислена регрессия, тем менее различаются и .

Таким образом, вариация величины работающих активов на 0,3% (0,25% - при скорректированном индексе детерминации) зависит от уровня собственного капитала и средств частных лиц, а на остальные 99,7% (99,75%) от других факторов, не включенных в модель.

Оценка значимости уравнения с помощью F-критерия Фишера

Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера по формуле:

где R2 - коэффициент множественной детерминации;

n - число наблюдений;

m - число параметров при переменных (в линейной регрессии совпадет с числом включенных в модель факторов).

При этом выдвигается гипотеза о статистической незначимости уравнения регрессии и показателя тесноты связи.

Fтабл. = 3,34 (при ; и ).

Так как Fфакт.> Fтабл, то гипотезу (Н0) отклоняем. С вероятностью 0,95 делаем вывод о статистической значимости уравнения в целом и показателя тесноты связи, которые сформировались под неслучайным воздействием факторов и .

Частные F-критерии оценивают статистическую значимость присутствия факторов и в уравнении множественной регрессии, оценивают целесообразность включения в уравнение одного фактора после другого фактора, т.е. Fх1 оценивает целесообразность включения в уравнение фактора х1 после того, как в него был включен фактор х2. Соответственно, Fx2 указывает на целесообразность включения в модель фактора х2 после фактора х1. Определим частные F-критерии для факторов х1 и х2 по формулам:

Fтабл. = 4,20 (при ; и ).

Таким образом, значение Fх1факт. < Fтабл, что свидетельствует о нецелесообразности включения в модель фактора х1 (собственного капитала). Включение фактора х2 (средств частных лиц) в модель статистически целесообразно, так как Fх2факт. > Fтабл.

Оценка значимости коэффициентов чистой регрессии по t-критерию Стьюдента

Частный F-критерий оценивает значимость коэффициентов чистой регрессии:

Так как tb1 <tтабл.=2,0484, то фактор х1 статистически незначим, так как tb2 > табл., то фактор х2 статистически значим.

Реализация задачи построения модели регрессии и корреляции в ППП Excel

Рис. 2.1 Диалоговое окно ввода параметров инструмента Регрессия

Рис. 2.2 Результаты применения инструмента Регрессия

Пояснения к рисунку 2.2.

· Множественный R - коэффициент корреляции (множественный в случае множественной корреляции, в нашем случае это парный коэффициент корреляции между х и у).

· R - квадрат - коэффициент детерминации.

· Нормированный R - квадрат - коэффициент детерминации с поправкой на число степеней свободы.

· Стандартная ошибка - ошибка модели.

· Наблюдений - число наблюдений, по которым строится модель (в нашем случае это число групп населения).

· df - число степеней свободы (строка Регрессия - для факторной (объясненной сумы квадратов отклонений), строка Остаток - для остаточной (необъясненной суммы квадратов отклонений), строка Итого - для общей суммы квадратов отклонений).

· SS - значение вариации или сумма квадратов отклонений;

· MS - дисперсия, деленная на соответствующее число степеней свободы.

· F - критерий Фишера.

· Значимость F - вероятность совершить ошибку при отклонении нулевой гипотезы: модель является незначимой. Если значимость модели проверяется на уровне значимости, равном 0,05 (как обычно мы принимаем в расчетах), то для нашего примера значимость F равна 0,001, что меньше 0,05, следовательно, модель является значимой.

· «Y - пересечение» - означает свободный член уравнения регрессии «а».

· «Располагаемые ресурсы, тыс.руб. на человека в месяц (в общем случае пишется Переменная х» - значение коэффициента регрессии.

· Стандартная ошибка - ошибка коэффициента (свободного члена или коэффициент регрессии по соответствующим строкам).

· t - статистика - критерий Стьюдента для коэффициента;

· «Р - значение» - уровень значимости критерия Стьюдента.

· «Нижние 95%», «Верхние 95%» - нижние и верхние 95% доверительные интервалы нахождения математических ожиданий коэффициентов модели.

Рис. 2.3 Диалоговое окно ввода параметров инструмента Корреляция

Рис. 2.4 Результаты применения инструмента Корреляция

Делаем вывод, что результаты расчетов вручную с применением формул совпадают с расчетами, выполненными в ППП Excel.

ЗАДАЧА 3

Таблица 3.1 Исходные данные

Годы

Численность городского населения РБ, тыс. чел., на начало года

1990

2545,2

1991

2569,3

1992

2587,0

1993

2603,7

1994

2614,0

1995

2607,6

1996

2646,4

1997

2648,4

1998

2661,1

1999

2672,3

2000

2640,1

2001

2636,5

2002

2631,9

2003

2628,1

2004

2626,3

2005

2434,8

2006

2422,7

2007

2415,0

2008

2421,6

Построение аддитивной и мультипликативной моделей временного ряда предполагает нахождение трендовой (Т), сезонной (S) и случайной (Е) компонент. Аддитивная модель: Y=T+S+E, мультипликативная модель: Y=TSE. По исходным табличным данным построим график ряда, чтобы определить наличие компонент T, S, E.

Рис. 3.1 Временной ряд динамики численности городского населения РБ за 1990-2008 гг.

Рис. 3.2 Выравнивание ряда динамики аналитическим методом по линейному тренду

Уравнение имеет вид:

y = -7,816x + 2657,7

Величина достоверности: RІ = 0,2485.

Рис. 3.3 Выравнивание ряда динамики аналитическим методом по логарифмическому тренду

Уравнение имеет вид:

y = -26,036ln(x) + 2633,5

Величина достоверности: RІ = 0,0568.

Рис. 3.4 Выравнивание ряда динамики аналитическим методом по полиноминальному тренду

Уравнение имеет вид:

y = -2,4671x2 + 41,526x + 2485.

Величина достоверности: RІ = 0,8377.

Рис. 3.5 Выравнивание ряда динамики аналитическим методом по степенному тренду

Уравнение имеет вид:

y = 2635,6x-0,0106.

Величина достоверности: RІ = 0,0609.

Рис. 3.6 Выравнивание ряда динамики аналитическим методом по экспоненциальному тренду

Уравнение имеет вид:

y = 2660,1e-0,0031x.

Величина достоверности: RІ = 0,2556.

Произведём отбор функции в качестве тренда используя F - критерий Фишера при =0,05.

1) Линейная функция:

=

>, таким образом линейная функция считается статистически значимой и существенной.

2) Логарифмическая функция:

=

<, таким образом логарифмическая функция считается статистически не значимой.

3) Полиномиальная функция:

=

;

>, таким образом полиномиальная функция считается статистически значимой и существенной.

4) Степенная функция:

=

<, таким образом, степенная функция считается статистически не значимой.

5) Экспоненциальная функция:

=

>, таким образом, экспоненциальная функция считается статистически значимой и существенной.

Так как по F-критерию Фишера три функции подходят для отображения тенденции, то отберем наиболее адекватную функцию по наименьшему среднему квадратическому отклонению остаточному.

Отбор наиболее адекватной функции проведем с помощью среднеквадратического отклонения:

1. Линейная функция:

2. Полиномиальная функция:

3. Экспоненциальная функция:

Наиболее адекватной функцией будет - полиномиальная функция, так как у нее среднеквадратическое отклонение наименьшее.

= -2,4671t2 +41,526t + 2485

Выполним интервальный прогноз на 2 года:

,

где =

- интервальный прогноз,

- табличное значение Стьюдента,

при ,

Интервальный прогноз на 2009 год:

Интервальный прогноз на 2010 год:

Таким образом, если выявленная тенденция по полиномиальной функции сохранится, то в следующие два года можно ожидать увеличение численности городского населения РБ, причем в 2009 году потребление будет составлять от 2239,96 тыс. чел. до 2417,396 тыс. чел., а в 2010 году - от 2169,445 тыс. чел. до 2368,66 тыс. чел.

Задача 4

Используя данные своего варианта и разобранный пример, построить аддитивную и мультипликативную модели временного ряда (вариант определяет преподаватель), сделать прогноз на первый квартал следующего года (после таблицы для вариантов 1 - 10 дается фактический уровень для первого квартала следующего года - для которого Вы делаете прогноз - для проверки правильности Ваших расчетов и выбора наиболее точной модели).

Таблица 4.1 Исходные данные для построения моделей временного ряда

Годы

2001

2002

2003

Квартал,

1

2

3

4

1

2

3

4

1

2

3

4

Производство яиц в РФ, млрд. шт.

7,72

9,68

9,69

8,08

8,30

10,10

9,63

8,24

8,34

10,14

9,73

8,23

Фактический уровень ряда за 1-ый квартал 2004 г. = 8,18 млрд. шт.

Решение:

Необходимо построить аддитивную и мультипликативную модели временного ряда. Для этого найдем трендовый (Т), сезонный (S) и случайный (Е) компоненты.

Аддитивная модель:

Y=T+S+E

Мультипликативная модель:

Y=TSE.

По исходным табличным данным построим график ряда, чтобы определить наличие компонент T, S, E.

Рисунок 4.1 Временной ряд

График фактических значений временного ряда показывает, что ряд содержит сезонные колебания периодичностью 4. То есть уровни ряда во 2-й квартал каждого года больше, чем в остальные.

Построим аддитивную модель ряда:

Шаг 1.

Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого составим вспомогательную таблицу 4.2.

Таблица 4.2 Расчет оценок сезонной компоненты в аддитивной модели

Номер квартала,

Уровни ряда,

Итого за 4 квартала

Скользящая средняя за 4 квартала

Центрированная скользящая средняя

Оценка сезонной компоненты

1

2

3

4

5

6

1

7,72

-

-

-

-

2

9,68

35,17

8,7925

-

-

3

9,69

35,75

8,9375

8,865

0,825

4

8,08

36,17

9,0425

8,99

-0,91

5

8,3

36,11

9,0275

9,035

-0,735

6

10,1

36,27

9,0675

9,0475

1,0525

7

9,63

36,31

9,0775

9,0725

0,5575

8

8,24

36,35

9,0875

9,0825

-0,8425

9

8,34

36,45

9,1125

9,1

-0,76

10

10,14

36,44

9,11

9,11125

1,029

11

9,73

-

-

-

-

12

8,23

-

-

-

-

1. просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени (графа 3);

2. разделим полученные суммы на 4 и найдем скользящие средние (графа 4). Полученные таким образом выровненные значения уже не содержат сезонной компоненты (их количество будет меньше количества уровней исходного временного ряда на 3 единицы);

3. приведем эти значения в соответствие с фактическими моментами времени, для этого найдем средние значения их двух последовательных скользящих средних - центрированные скользящие средние (графа 5) (их количество будет меньше количества уровней исходного временного ряда на 4 единицы).

Шаг 2.

Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими средними (графа 6 таблицы 2). Используем эти оценки для расчета значений сезонной компоненты S (таблица 4.3).

Таблица 4.3 Расчет значений сезонной компоненты в аддитивной модели

Показатель

Год

Номер квартала

1

2

3

4

1

2

3

-

-0,735

-0,76

-

1,052

1,029

-0,825

0,557

-

-0,91

-0,842

-

Итого за i-й квартал (за все годы)

х

-1,495

2,081

1,382

-1,752

Средняя оценка сезонной компоненты для i-ого квартала,

х

-0,748

1,041

0,691

-0,876

Скорректированная сезонная компонента,

х

-0,775

1,014

0,664

-0,903

Найдем средние за каждый квартал (по все годам) оценки сезонной компоненты . В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по все кварталам должна быть равна нулю.

Имеем для данной модели: -0,748 + 1,041 + 0,691 - 0,876 = 0,108.

Определим корректирующий коэффициент:

.

Рассчитаем скорректированные значения сезонной компоненты как разность между ее средней оценкой и корректирующим коэффициентом :

,

где

1 квартал: S1=-0,748-0,027= -0,775

2 квартал: S2=1,041-0,027= 1,014

3 квартал: S3=0,691-0,027= 0,664

4 квартал: S4=-0,876-0,027= -0,903

Проверим условие равенства нулю суммы значений сезонной компоненты:

-0,775+1,014+0,664-0,903 = 0.

Занесем полученные значения в таблицу 4 для соответствующих кварталов каждого года (графа 3).

Шаг 3.

Вычтем значение сезонной компоненты из каждого уровня исходного временного ряда, чтобы устранить ее влияние. Получим:

T + E = Y - S (графа 4 таблицы 4.4).

Эти значения рассчитываются для каждого момента времени и содержат только тенденцию и случайную компоненту.

Таблица 4.4 Расчет выровненных значений Т и ошибок Е в аддитивной модели

Т + Е =

Т

Т + S

Е = yt - (T + S)

1

2

3

4

5

6

7

8

9

1

7,72

-0,775

8,495

8,758

7,983

-0,263

0,069

1,613

2

9,68

1,014

8,666

8,8

9,814

-0,134

0,0179

0,476

3

9,69

0,664

9,026

8,842

9,506

0,184

0,034

0,49

4

8,08

-0,903

8,983

8,884

7,981

0,0987

0,0097

0,828

5

8,3

-0,775

9,075

8,926

8,152

0,1478

0,022

0,476

6

10,1

1,014

9,086

8,968

9,982

0,118

0,014

1,232

7

9,63

0,664

8,966

9,01

9,674

-0,044

0,002

0,41

8

8,24

-0,903

9,143

9,052

8,149

0,091

0,008

0,563

9

8,34

-0,775

9,115

9,094

8,319

0,021

0,0004

0,423

10

10,14

1,014

9,126

9,136

10,15

-0,01

0,0001

1,323

11

9,73

0,664

9,066

9,178

9,842

-0,112

0,013

0,548

12

8,23

-0,903

9,133

9,22

8,317

-0,087

0,008

0,578

сумма

107,88

0,1981

8,96

Шаг 4.

Определим компоненту Т данной модели. Для этого проведем выравнивание ряда (Т + Е) с помощью линейного тренда.

Таблица 4.5 Расчет линейного тренда уровней временного ряда

№ п/п

1

2

3

4

5

6

1

1

8,495

8,495

1

8,758

2

2

8,666

17,332

4

8,8

3

3

9,026

27,078

9

8,842

4

4

8,983

35,932

16

8,884

5

5

9,075

45,375

25

8,926

6

6

9,086

54,516

36

8,968

7

7

8,966

62,762

49

9,01

8

8

9,143

73,144

64

9,053

9

9

9,115

82,035

81

9,095

10

10

9,126

91,26

100

9,137

11

11

9,066

99,726

121

9,179

12

12

9,133

109,596

144

9,22

Итого

78

107,88

707,251

650

107,88

Для оценки параметров и необходимо составить систему нормальных уравнений:

Система нормальных уравнений составит:

Решаем ее:

Итак, линейный тренд имеет вид:

.

Найдем уровни Т для каждого момента времени (графа 5 таблицы 4.4).

Шаг 5.

Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням Т значения сезонной компоненты для соответствующих кварталов (графа 6 таблицы 4).

Шаг 6. Рассчитаем ошибку (случайную компоненту Е) модели. Численные значения абсолютных ошибок приведены в таблице 4 (графа 7).

Таким образом, рассчитаны количественные значения трендовой, сезонной и случайной компонент уровней временного ряда за каждый квартал за три года по аддитивной модели. Так, например, расчеты за второй квартал 2003 г. (10-й уровень ряда) показывают, что если бы ряд содержал только трендовую составляющую (тенденцию уровней - сезонное увеличение производства яиц на 0,042 млрд. шт.), то производства яиц составил бы 9,136 млрд. шт. Прибавляя сезонную компоненту (из реальной жизни мы наблюдаем, что за 2 - 3 квартал производится больше яиц), равную за второй квартал 1,014 млрд. шт., мы получаем уровень ряда 9,136 + 1,014 = 10,15 млрд. шт. Однако из-за воздействия случайной составляющей, равной -0,01, фактическое производство яиц во втором квартале 2003 г. составил 10,15 - 0,01 = 10,14 млрд. шт.

Для оценки качества построения модели можно использовать сумму квадратов абсолютных ошибок. Для данной построенной аддитивной модели сумма квадратов абсолютных ошибок равна = 0,89. По отношению к общей сумме квадратов отклонений уровней ряда от его среднего уровня, равной , эта величина составляет:

или 97,79% -

аддитивная модель объясняет 97,79% общей вариации уровней временного ряда производства яиц в Российской Федерации за 2001 - 2003 гг.

На основе построенной модели сделаем точечный прогноз ожидаемого ввода в действие жилых домов в Российской Федерации в течение первого квартала 2004 года. Прогнозное значение уровня временного ряда в аддитивной модели есть сумма трендового значения и соответствующего значения сезонной компоненты

Для расчета трендовых значений воспользуемся уравнением тренда, рассчитанным нами на шаге 4:

:

рассчитываем (первый квартал четвертого в ряду года будет стоять под номером 13 - продолжение ряда)

.

Значение сезонной компоненты за первый квартал равно

Прогнозное значение составит:

Производство яиц в Российской Федерации в первом квартале 2004 года составит 8,487 млрд. шт. Фактическое производство яиц в первом квартале 2004 г. 8,18 млрд. шт. - рассчитанный показатель незначительно отличается от фактического.

Построим мультипликативную модель ряда:

Шаг 1.

Проведем выравнивание исходных уровней ряда методом скользящей средней (таблица 6 - та же методика расчета, что и для аддитивной модели табл. 2).

Таблица 4.6 Расчет оценок сезонной компоненты в мультипликативной модели

Номер квартала,

Уровни ряда,

Итого за 4 квартала

Скользящая средняя за 4 квартала

Центрированная скользящая средняя

Оценка сезонной компоненты

1

2

3

4

5

6

1

7,72

-

-

-

-

2

9,68

35,17

8,7925

-

-

3

9,69

35,75

8,9375

8,865

1,093

4

8,08

36,17

9,0425

8,99

0,899

5

8,3

36,11

9,0275

9,035

0,919

6

10,1

36,27

9,0675

9,0475

1,116

7

9,63

36,31

9,0775

9,0725

1,061

8

8,24

36,35

9,0875

9,0825

0,907

9

8,34

36,45

9,1125

9,1

0,916

10

10,14

36,44

9,11

9,11125

1,113

11

9,73

-

-

-

-

12

8,23

-

-

-

-

Шаг 2.

Найдем оценки сезонной компоненты как частное от деления фактических уровней ряда (графа 6 таблица 6). Используем эти оценки для расчета значений сезонной компоненты S (таблица 6). Для этого найдем средние за каждый квартал оценки сезонной компоненты . Взаимопогашаемость сезонных воздействий в мультипликативной модели выражается в том, что сумма значений сезонной компоненты по все кварталам должна быть равна числе периодов в цикле, т.е. 4 (4 квартала в цикле - в году).

Таблица 4.7 Расчет сезонной компоненты в мультипликативной модели

Показатель

Год

Номер квартала

1

2

3

4

1

2

3

-

0,919

0,916

-

1,116

1,113

1,093

1,061

-

0,899

0,907

-

Итого за i-й квартал (за все годы)

х

1,835

2,229

2,154

1,806

Средняя оценка сезонной компоненты для i-ого квартала,

х

0,917

1,1146

1,077

0,903

Скорректированная сезонная компонента,

х

0,915

1,111

1,0739

0,9002

Имеем: 0,917 + 1,1146 + 1,077 + 0,903 = 4,0124.

Рассчитаем корректирующий коэффициент:

Определим скорректированные значения сезонной компоненты, умножив ее средние оценки на корректирующий коэффициент k: , где

Получим следующие значения сезонной компоненты:

1 квартал: S1= 0,915

2 квартал: S2= 1,111

3 квартал: S3= 1,0739

4 квартал: S4= 0,9002

Проверим условие равенства четырем суммы значений сезонной компоненты:

0,921+1,091+1,081+0,907=4

Занесем полученные значения в таблицу 8 для соответствующих кварталов каждого года (графа 3).

Шаг 3.

Разделим каждый уровень исходного ряда на соответствующие значения сезонной компоненты. Получим T E = Y / S (графа 4 таблицы 8). Эти значения рассчитываются для каждого момента времени и содержат только тенденцию и случайную компоненту.

Таблица 4.8 Расчет выровненных значений Т и ошибок Е в мультипликативной модели

Т Е =

Т

Т S

Е = yt / (TS)

Е = yt - (TS)

1

2

3

4

5

6

7

8

9

10

1

7,72

0,915

8,440

8,751

8,005

0,964

-0,285

0,081

1,613

2

9,68

1,111

8,712

8,795

9,772

0,991

-0,092

0,009

0,476

3

9,69

1,0739

9,023

8,838

9,491

1,021

0,199

0,039

0,49

4

8,08

0,9002

8,976

8,882

7,995

1,011

0,085

0,007

0,828

5

8,3

0,915

9,074

8,925

8,164

1,017

0,136

0,019

0,476

6

10,1

1,111

9,090

8,968

9,965

1,014

0,135

0,018

1,232

7

9,63

1,0739

8,967

9,012

9,678

0,995

-0,048

0,002

0,41

8

8,24

0,9002

9,153

9,055

8,151

1,011

0,089

0,008

0,563

9

8,34

0,915

9,118

9,098

8,323

1,002

0,017

0,000

0,422

10

10,14

1,111

9,126

9,142

10,158

0,998

-0,018

0,000

1,323

11

9,73

1,0739

9,060

9,185

9,864

0,986

-0,134

0,018

0,547

12

8,23

0,9002

9,142

9,229

8,308

0,991

-0,078

0,006

0,578

0,208

8,96

Шаг 4.

Определим компоненту Т в мультипликативной модели. Для этого проведем выравнивание ряда (Т Е) с помощью линейного тренда.

Таблица 4.9 Расчет линейного тренда уровней временного ряда

№п/п

Т

1

1

8,440

8,440

1

8,751

2

2

8,712

17,423

4

8,795

3

3

9,023

27,069

9

8,838

4

4

8,976

35,903

16

8,882

5

5

9,074

45,369

25

8,925

6

6

9,090

54,538

36

8,968

7

7

8,967

62,770

49

9,012

8

8

9,153

73,228

64

9,055

9

9

9,118

82,058

81

9,098

10

10

9,126

91,256

100

9,142

11

11

9,060

99,664

121

9,185

12

12

9,142

109,708

144

9,229

Итого

78

107,88

707,425

650

107,88

Для оценки параметров и необходимо составить систему нормальных уравнений:

Система нормальных уравнений составит:

Решаем ее:

Итак, линейный тренд имеет вид:

.

Найдем уровни Т для каждого момента времени (графа 5 таблицы 8).

Шаг 5.

Найдем уровни ряда по мультипликативной модели, умножив уровни Т на значения сезонной компоненты для соответствующих кварталов (графа 6 таблицы 8).

Шаг 6.

Расчет ошибки в мультипликативной модели проводится по формуле

Е = yt /(T S).

Численные значения ошибки приведем в графе 7 таблицы 8.

Итак, рассчитаны количественные значения трендовой, сезонной и случайной компонент уровней временного ряда за каждый квартал за три года по мультипликативной модели. Выводы можно сделать аналогично построенной ранее аддитивной модели.

Чтобы сравнить мультипликативную модель ряда с построенной ранее аддитивной моделью, используем сумму квадратов абсолютных ошибок. Абсолютные ошибки в мультипликативной модели определяются по формуле:

Е = yt - (TS).

В данной модели сумма квадратов абсолютных ошибок составляет 0,208. Общая сумма квадратов отклонений фактических уровней ряда от среднего значения . Доля объясненной дисперсии уровней ряда динамики равна:

или 97,67% -

мультипликативная модель объясняет 97,67% общей вариации уровней временного ряда ввода в действие жилых домов в Российской Федерации за 2001 - 2003 гг.

Таким образом, аддитивная модель лучше описывает данный временной ряд, чем мультипликативная.

Чтобы на основе построенной мультипликативной модели дать прогноз производства яиц, сделаем точечный прогноз ожидаемого производства яиц в Российской Федерации в течение первого квартала 2004 года. Прогнозное значение уровня временного ряда Ft в мультипликативной модели есть произведение трендового значения Тt и соответствующего значения сезонной компоненты St. Для расчета трендовых значений воспользуемся уравнением тренда, рассчитанным нами на шаге 4:

Т= 8,708+0,0434t:

первый квартал 2004 г. будет стоять под номером 13 в ряду, поэтому

Т13= 8,708+0,0434*13= 9,272

Значение сезонной компоненты за первый квартал равно S1=0,915

Прогнозное значение составит:

Производство яиц в Российской Федерации в первом квартале 2004 года составит 8,484 млрд. шт. (меньше, чем рассчитанный по аддитивной модели, и более приближенный к фактическому известному уровню (8,18 млрд. шт.)).

Размещено на Allbest.ru


Подобные документы

  • Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.

    задача [142,0 K], добавлен 20.03.2010

  • Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.

    курсовая работа [233,1 K], добавлен 21.03.2015

  • Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.

    контрольная работа [108,5 K], добавлен 28.03.2018

  • Расчет уравнений линейной и нелинейной парной регрессии. Оценка тесноты связи расходов на перевозки и грузооборота с помощью показателей корреляции и детерминации. Оценка ошибки аппроксимации уравнений регрессии. Расчет прогнозного значения расходов.

    курсовая работа [2,5 M], добавлен 26.12.2014

  • Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

    контрольная работа [141,3 K], добавлен 05.05.2010

  • Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.

    контрольная работа [110,4 K], добавлен 28.07.2012

  • Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.

    лабораторная работа [100,5 K], добавлен 02.06.2014

  • Построение модели парной регрессии и расчет индекса парной корреляции. Построение производственной функции Кобба-Дугласа, коэффициент детерминации . Зависимость среднедушевого потребления от размера дохода и цен. Расчет параметров структурной модели.

    контрольная работа [1,6 M], добавлен 05.01.2012

  • Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.

    контрольная работа [155,8 K], добавлен 11.12.2010

  • Параметры уравнений линейной парной регрессии. Показатели корреляции и детерминации. Изменение средней заработной платы и выплат социального характера. Средняя ошибка аппроксимации. Коэффициент эластичности и стоимость активных производственных фондов.

    контрольная работа [1,1 M], добавлен 23.06.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.