Эконометрическое моделирование стоимости квартир в Московской области

Расширение матрицы парных коэффициентов корреляции; оценка статистической значимости коэффициентов корреляции. Построение поля корреляции результативного признака и связанного с ним фактора. Оценка качества каждой модели, прогнозирование показателей.

Рубрика Экономико-математическое моделирование
Вид задача
Язык русский
Дата добавления 11.02.2012
Размер файла 105,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Задача

Эконометрическое моделирование стоимости квартир в Московской области. Наименование показателей и исходных данных для эконометрического моделирования представлены в таблице:

№ п.п.

Цена квартиры, тыс. долл.

(Y)

Город области, 1 - Подольск, 0 - Люберцы

1)

Число комнат в квартире

2)

Жилая площадь квартиры, кв. м

4)

1

38

1

1

19

2

62,2

1

2

36

3

125

0

3

41

4

61,1

1

2

34,8

5

67

0

1

18,7

6

93

0

2

27,7

7

118

1

3

59

8

132

0

3

44

9

92,5

0

3

56

10

105

1

4

47

11

42

1

1

18

12

125

1

3

44

13

170

0

4

56

14

38

0

1

16

15

130,5

0

4

66

16

85

0

2

34

17

98

0

4

43

18

128

0

4

59,2

19

85

0

3

50

20

160

1

3

42

21

60

0

1

20

22

41

1

1

14

23

90

1

4

47

24

83

0

4

49,5

25

45

0

1

18,9

26

39

0

1

18

27

86,9

0

3

58,7

28

40

0

1

22

29

80

0

2

40

30

227

0

4

91

31

235

0

4

90

32

40

1

1

15

33

67

1

1

18,5

34

123

1

4

55

35

100

0

3

37

36

105

1

3

48

37

70,3

1

2

34,8

38

82

1

3

48

39

280

1

4

85

40

200

1

4

60

Задание:

Расширить матрицу парных коэффициентов корреляции; оценить статистическую значимость коэффициентов корреляции.

Построить поле корреляции результативного признака и наиболее тесно связанного с ним фактора.

Рассчитать параметры линейных парных регрессий для всех факторов Х.

Оценить качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F - критерия Фишера. Выбрать лучшую модель.

С использованием лучшей модели осуществить прогнозирование среднего значения показателя Y при уровне значимости б = 0,1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представить графически и модельные значения Y, результаты прогнозирования.

Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель формирования цены квартиры за счет значимых факторов. Дать экономическую интерпретацию коэффициентов модели регрессии.

Оценить качество модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дать оценку влияния значимых факторов на результат с помощью коэффициента эластичности, в- и Д-коэффициентов.

Решение

1. Расширить матрицу парных коэффициентов корреляции; оценить статистическую значимость коэффициентов корреляции.

Используем Exel / сервис / анализ данных / корреляция. Получим матрицу коэффициентов парной корреляции между всеми имеющимися переменными:

Y

Х1

Х2

Х4

Y

1

Х1

-0,01126

1

Х2

0,751061

-0,0341

1

Х4

0,874012

-0,0798

0,868524

1

Проанализируем коэффициенты корреляции между результирующим признаком Y и каждым из факторов Хj:

r (Y, X1) = - 0,01 < 0, значит, между переменными Y и Х1 наблюдается обратная корреляционная зависимость: цена на квартиры выше в Люберцах.

|r (Y, X1)| = 0,01 < 0,4 - эта зависимость слабая.

r (Y, X2) = 0,75 > 0, значит, между переменными Y и Х2 наблюдается прямая корреляционная зависимость: чем больше комнат в квартире, тем выше ее цена.

|r (Y, X2)| = 0,75 > 0,7 - эта зависимость тесная, ближе к умеренной.

r (Y, X4) = 0,87 > 0, значит, между переменными Y и Х4 наблюдается прямая корреляционная зависимость: чем больше жилая площадь в квартире, тем выше ее цена.

|r (Y, X4)| = 0,87 > 0,7 - эта зависимость тесная.

Для проверки значимости найденных коэффициентов корреляции используем критерий Стьюдента.

Для каждого коэффициента r (Y, Xj) вычислим t-статистику по формуле

t = и занесем результаты расчетов в корреляционную таблицу:

Y

Х1

Х2

Х4

t-статистики

Y

1

Х1

-0,01126

1

0,069411185

Х2

0,751061

-0,0341

1

7,012446419

Х4

0,874012

-0,0798

0,868524

1

11,08813705

По таблице критических точек распределения Стьюдента при уровне значимости б = 5% и числе степеней свободы k = n - 2 = 40 - 2 = 38 определим критическое значение tкр = 2,02 (или с помощью функции СТЬЮДРАСПОБР).

Сопоставим фактическое значение t с критическим tкр, и сделаем выводы в соответствии со схемой:

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

t (r(Y, X1)) = 0,07 < tкр = 2,02, следовательно коэффициент r (Y, X1) не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой квартиры Y и городом области Х1 существует.

t (r(Y, X2)) = 7,01 > tкр = 2,02, следовательно коэффициент r (Y, X2) значимо отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной зависимости между признаками Y и Х2. Зависимость между ценой квартиры Y и числом комнат в квартире Х2 является достоверной.

t (r(Y, X4)) = 11,09 > tкр = 2,02, следовательно коэффициент r (Y, X4) значимо отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной зависимости между признаками Y и Х4. Зависимость между ценой квартиры Y и жилой площадью квартиры Х4 является достоверной.

Таким образом, наиболее тесная и значимая зависимость наблюдается между ценой квартиры Y и жилой площадью квартиры Х4.

2. Построить поле корреляции результативного признака и наиболее тесно связанного с ним фактора.

Для построения поля корреляции используем Мастер диаграмм (точечная) - покажем исходные данные Y и значение наиболее информативного фактора Х4. В результате получим диаграмму «поле корреляции»:

3. Рассчитать параметры линейных парных регрессий для всех факторов Х.

Для построения парной линейной модели Yt = a+b*X1. используем программу РЕГРЕССИЯ. В качестве входного интервала Х покажем значение фактора Х1.

Результаты вычислений представлены в таблицах:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,011259

R-квадрат

0,000127

Нормированный R-квадрат

-0,02619

Стандартная ошибка

58,03646

Наблюдения

40

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

16,22784

16,22784

0,004818

0,945026

Остаток

38

127992,8

3368,231

Итого

39

128009

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

101,8136

12,37341

8,228419

5,73E-10

76,76497

126,8623

76,76497

126,8623

Х1

-1,2803

18,4452

-0,06941

0,945026

-38,6207

36,06005

-38,6207

36,06005

Коэффициенты модели содержатся в третьей таблице итогов Регрессии (столбец Коэффициенты).

Таким образом, уравнение модели (1) имеете вид:

YТ = 101,81 - 1,28*X1.

Коэффициент регрессии b = -1,28, следовательно цена реализации квартиры в Подольске в среднем на 1,28 тыс. долл. ниже цены реализации в Люберцах. Свободный член a = 101,81 не имеет реального смысла.

Аналогичные расчеты проведем для построения модели зависимости цены реализации Y от числа комнат в квартире Х2:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,751061

R-квадрат

0,564092

Нормированный R-квадрат

0,552621

Стандартная ошибка

38,32002

Наблюдения

40

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

72208,88

72208,88

49,1744

2,37E-08

Остаток

38

55800,11

1468,424

Итого

39

128009

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

7,539299

14,67125

0,513882

0,61031

-22,1611

37,23969

-22,1611

37,23969

Х2

36,03777

5,139115

7,012446

2,37E-08

25,63418

46,44136

25,63418

46,44136

Модель (2) построена, ее уравнение имеет вид:

YТ = 7,54 + 36,04*X2.

Коэффициент регрессии b = 36,04, следовательно при увеличении на 1 комнату в квартире в среднем на 36,04 тыс. долл. увеличивается цена квартиры. Свободный член a = 7,54 не имеет реального смысла.

Также построим модель зависимости цены квартиры Y от жилой площади квартиры Х4.

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,874012

R-квадрат

0,763897

Нормированный R-квадрат

0,757684

Стандартная ошибка

28,20195

Наблюдения

40

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

97785,7

97785,7

122,9468

1,79E-13

Остаток

38

30223,29

795,3498

Итого

39

128009

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-2,86485

10,39375

-0,27563

0,784324

-23,9059

18,17619

-23,9059

18,17619

Х4

2,475975

0,223299

11,08814

1,79E-13

2,023929

2,928021

2,023929

2,928021

Модель (3) построена, ее уравнение имеет вид:

YТ = - 2,86 + 2,48*X4.

Коэффициент регрессии b = 2,48, следовательно при увеличении жилой площади квартиры на 1 кв. м в среднем на 2,48 тыс. долл. увеличивается цена квартиры. Свободный член a = -2,86 не имеет реального смысла.

4. Оценить качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F - критерия Фишера. Выбрать лучшую модель.

Для удобства все результаты будем заносить в сводную таблицу.

Коэффициенты детерминации R-квадрат определены для каждой модели программой РЕГРЕССИЯ (таблица «Регрессионная статистика») и составляют:

Модель

R-квадрат

отн

F

YТ = 101,81 - 1,28*X1 (1)

0,000127

YТ = 7,54 + 36,04*X2 (2)

0,564092

YТ = - 2,86 + 2,48*X4 (3)

0,763897

Таким образом, вариация цены квартиры Y на 0,01% объясняется по уравнению (1) изменением города области Х1; на 56,41% по уравнению (2) вариацией числа комнат в квартире Х2; на 76,39% по уравнению (3) изменением жилой площади квартиры Х4.

Для вычисления средней относительной ошибки аппроксимации рассмотрим остатки модели Еi = Yi - YТi, содержащиеся в столбце Остатки итогов программы РЕГРЕССИЯ (таблица «вывод остатка»). Дополним таблицу столбцом относительных погрешностей, которые вычислим по формуле Еотн.i = 100 с помощью функции ABS.

Выполнение расчетов для модели (1)

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

Отн. погр-ти

1

100,5333

-62,5333

164,5614

2

100,5333

-38,3333

61,62915

3

101,8136

23,18636

18,54909

4

100,5333

-39,4333

64,53901

5

101,8136

-34,8136

51,96065

6

101,8136

-8,81364

9,477028

7

100,5333

17,46667

14,80226

8

101,8136

30,18636

22,86846

9

101,8136

-9,31364

10,0688

10

100,5333

4,466667

4,253968

11

100,5333

-58,5333

139,3651

12

100,5333

24,46667

19,57333

13

101,8136

68,18636

40,10963

14

101,8136

-63,8136

167,9306

15

101,8136

28,68636

21,98189

16

101,8136

-16,8136

19,78075

17

101,8136

-3,81364

3,891466

18

101,8136

26,18636

20,4581

19

101,8136

-16,8136

19,78075

20

100,5333

59,46667

37,16667

21

101,8136

-41,8136

69,68939

22

100,5333

-59,5333

145,2033

23

100,5333

-10,5333

11,7037

24

101,8136

-18,8136

22,66703

25

101,8136

-56,8136

126,2525

26

101,8136

-62,8136

161,0606

27

101,8136

-14,9136

17,16184

28

101,8136

-61,8136

154,5341

29

101,8136

-21,8136

27,26705

30

101,8136

125,1864

55,14818

31

101,8136

133,1864

56,67505

32

100,5333

-60,5333

151,3333

33

100,5333

-33,5333

50,04975

34

100,5333

22,46667

18,26558

35

101,8136

-1,81364

1,813636

36

100,5333

4,466667

4,253968

37

100,5333

-30,2333

43,00616

38

100,5333

-18,5333

22,60163

39

100,5333

179,4667

64,09524

40

100,5333

99,46667

49,73333

По столбцу относительных погрешностей найдем среднее значение отн = 54,13% (с помощью функции СРЗНАЧ).

Выполнение расчетов для модели (2)

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

Отн. погр-ти

1

43,57707

-5,57707

14,6765

2

79,61484

-17,4148

27,99813

3

115,6526

9,347392

7,477914

4

79,61484

-18,5148

30,30252

5

43,57707

23,42293

34,9596

6

79,61484

13,38516

14,39265

7

115,6526

2,347392

1,989315

8

115,6526

16,34739

12,38439

9

115,6526

-23,1526

25,02985

10

151,6904

-46,6904

44,46703

11

43,57707

-1,57707

3,754925

12

115,6526

9,347392

7,477914

13

151,6904

18,30962

10,77037

14

43,57707

-5,57707

14,6765

15

151,6904

-21,1904

16,23784

16

79,61484

5,385162

6,335485

17

151,6904

-53,6904

54,7861

18

151,6904

-23,6904

18,50811

19

115,6526

-30,6526

36,06189

20

115,6526

44,34739

27,71712

21

43,57707

16,42293

27,37155

22

43,57707

-2,57707

6,285533

23

151,6904

-61,6904

68,54486

24

151,6904

-68,6904

82,75949

25

43,57707

1,422932

3,16207

26

43,57707

-4,57707

11,73607

27

115,6526

-28,7526

33,08701

28

43,57707

-3,57707

8,942671

29

79,61484

0,385162

0,481452

30

151,6904

75,30962

33,17605

31

151,6904

83,30962

35,4509

32

43,57707

-3,57707

8,942671

33

43,57707

23,42293

34,9596

34

151,6904

-28,6904

23,32551

35

115,6526

-15,6526

15,65261

36

115,6526

-10,6526

10,14534

37

79,61484

-9,31484

13,25013

38

115,6526

-33,6526

41,03977

39

151,6904

128,3096

45,82487

40

151,6904

48,30962

24,15481

По столбцу относительных погрешностей найдем среднее значение отн = 23,46%.

Выполнение расчетов для модели (3)

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

Отн. погр-ти

1

44,17867

-6,17867

16,25965

2

86,27023

-24,0702

38,69812

3

98,65011

26,34989

21,07991

4

83,29906

-22,1991

36,33235

5

43,43587

23,56413

35,17034

6

65,71964

27,28036

29,33372

7

143,2176

-25,2176

21,37089

8

106,078

25,92197

19,63786

9

135,7897

-43,2897

46,7997

10

113,506

-8,50595

8,100909

11

41,70269

0,297309

0,707878

12

106,078

18,92197

15,13758

13

135,7897

34,21027

20,12369

14

36,75074

1,249258

3,287521

15

160,5495

-30,0495

23,02641

16

81,31828

3,681716

4,33143

17

103,6021

-5,60206

5,716383

18

143,7128

-15,7128

12,27566

19

120,9339

-35,9339

42,27515

20

101,1261

58,87392

36,7962

21

46,65464

13,34536

22,24227

22

31,79879

9,201207

22,44197

23

113,506

-23,506

26,11773

24

119,6959

-36,6959

44,21192

25

43,93107

1,068932

2,375404

26

41,70269

-2,70269

6,929977

27

142,4749

-55,5749

63,95265

28

51,60659

-11,6066

29,01647

29

96,17413

-16,1741

20,21766

30

222,4488

4,551164

2,004918

31

219,9729

15,02714

6,394527

32

34,27477

5,725233

14,31308

33

42,94068

24,05932

35,90944

34

133,3138

-10,3138

8,385163

35

88,74621

11,25379

11,25379

36

115,9819

-10,9819

10,45898

37

83,29906

-12,9991

18,49085

38

115,9819

-33,9819

41,44138

39

207,593

72,40701

25,85965

40

145,6936

54,30638

27,15319

По столбцу относительных погрешностей найдем среднее значение отн = 21,89%.

Разнесем результаты в сводную таблицу:

Модель

R-квадрат

отн

F

YТ = 101,81 - 1,28*X1 (1)

0,000127

54,13%

YТ = 7,54 + 36,04*X2 (2)

0,564092

23,46%

YТ = - 2,86 + 2,48*X4 (3)

0,763897

21,89%

Оценим точность построенных моделей в соответствии со схемой:

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

отн1 = 54,13% > 15%, отн2 = 23,46% > 15%, отн3 = 21,89% > 15%. Точность всех трех моделей неудовлетворительная. Ближе к 15% отн модели (3).

Проверим значимость полученных уравнений с помощью F - критерия Фишера.

F - статистики определены программой РЕГРЕССИЯ (таблицы «Дисперсионный анализ») и составляют:

Модель

R-квадрат

отн

F

YТ = 101,81 - 1,28*X1 (1)

0,000127

54,13%

0,004818

YТ = 7,54 + 36,04*X2 (2)

0,564092

23,46%

49,1744

YТ = - 2,86 + 2,48*X4 (3)

0,763897

21,89%

122,9468

С помощью функции FРАСПОБР найдем значение Fкр = 4,1 для уровня значимости б = 5%, и чисел степеней свободы k1 = 1, k2 = 38.

Схема проверки:

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

F = 0,0048 < Fкр = 4,1, следовательно уравнение модели (1) не является значимой и ее использование нецелесообразно.

F = 49,17 > Fкр = 4,1, F = 122,95 > Fкр = 4,1, следовательно, уравнения моделей (2) и (3) являются значимыми, их использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель (2) факторной переменной Х2 и включенной в модель (3) факторной переменной Х4.

Вывод: на основании оценки качества моделей по коэффициенту детерминации, средней ошибке аппроксимации и критерию Фишера наилучшей является модель (3) зависимости цены квартиры от ее жилой площади. Однако эту модель нецелесообразно использовать для прогнозирования в реальных условиях, поскольку ее точность неудовлетворительная, и дальнейшие расчеты проведем в учебных целях.

5. С использованием лучшей модели осуществить прогнозирование среднего значения показателя Y при уровне значимости б = 0,1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представить графически и модельные значения Y, результаты прогнозирования.

Согласно условию задачи прогнозное значение фактора Х4 составляет 80% от его максимального значения. Максимальное значение Х4 = 91 найдем с помощью функции МАКС. Тогда прогнозное значение Х4* = 72,8. Рассчитаем по уравнению модели (3) прогнозное значение Y:

Y*Т = - 2,86 + 2,48* Х4* = - 2,86 + 2,48 * 72,8 = 177,39.

Таким образом, если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая цена квартиры будет составлять около 177,39 тыс. долл.

Зададим доверительную вероятность p = 1 - б = 1 - 0,1 = 0,9 и построим доверительный прогнозный интервал для среднего значения Y.

Для этого нужно рассчитать стандартную ошибку прогнозирования для среднего значения результирующего признака:

S(Y*Т) = SE * .

Предварительно подготовим:

- стандартная ошибка SE = 28,2 (таблица «регрессионная статистика» итогов РЕГРЕССИИ);

- по столбцу данных Х4 найдем среднее значение = 42,04 (функция СРЗНАЧ) и определим = 15950,82 (функция КВАДРОТКЛ);

- tкр - коэффициент Стьюдента для уровня значимости б=10% и числа степеней свободы k = 38. tкр = 1,686 (функция СТЬЮДРАСПОБР).

Следовательно, стандартная ошибка прогнозирования для среднего значения составляет:

S(Y*Т) = 28,2 * = 8,188.

Размах доверительного интервала для среднего значения:

U(Y*Т) = tкр * S(Y*Т) = 1,686 * 8,188 = 13,805.

Границами прогнозного интервала будут:

Uнижн = Y*Т - U(Y*Т) = 177,39 - 13,805 = 163,58;

Uверх = Y*Т + U(Y*Т) = 177,39 + 13,805 = 191,19.

Таким образом, с надежностью 90% можно утверждать, что если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая средняя цена квартиры будет от 163,58 тыс. долл. до 191,19 тыс. долл.

Для построения чертежа используем Мастер диаграмм (точечная) - покажем исходные данные (поле корреляции). Затем с помощью опции Добавить линию тренда, построим линию модели и покажем на графике результаты прогнозирования.

6. Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель формирования цены квартиры за счет значимых факторов. Дать экономическую интерпретацию коэффициентов модели регрессии.

Методом включения построим двух факторные модели, сохраняя в них наиболее информативный фактор - жилую площадь квартиры (Х4).

В качестве «входного интервала Х» укажем значения факторов Х1 и Х4, с помощью программы РЕГРЕССИЯ получим:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,875979

R-квадрат

0,767339

Нормированный R-квадрат

0,754763

Стандартная ошибка

28,3714

Наблюдения

40

Коэффициенты

Y-пересечение

-6,4361

Х1

6,692936

Х4

2,48928

Таким образом, модель (4) зависимости цены квартиры Y от города области Х1 и жилой площади квартиры Х4 построена, ее уравнение имеет вид:

YТ = -6,44 + 6,69*X1 + 2,49*Х4.

Используем в качестве «входного интервала Х» значения факторов Х2 и Х4, с помощью РЕГРЕССИИ найдем:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,874163

R-квадрат

0,76416

Нормированный R-квадрат

0,751412

Стандартная ошибка

28,56458

Наблюдения

40

Коэффициенты

Y-пересечение

-2,16757

Х2

-1,57033

Х4

2,556497

Таким образом, модель (5) зависимости цены квартиры Y от числа комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:

YТ = -2,17 - 1,57*X2 + 2,56*Х4.

Построим множественную модель регрессии, учитывая все факторы (Х1, Х2, и Х4):

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,876218

R-квадрат

0,767758

Нормированный R-квадрат

0,748404

Стандартная ошибка

28,73688

Наблюдения

40

Коэффициенты

Y-пересечение

-5,64357

Х1

6,859631

Х2

-1,98516

Х4

2,591406

Таким образом, трехфакторная модель (6) зависимости цены квартиры Y от города области Х1, числа комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:

YТ = -5,67 + 6,86*Х1 - 1,99*X2 + 2,59*Х4.

Выберем лучшую из построенных.

Для сравнения моделей с различным количеством учтенных в них факторов используем нормированные коэффициенты детерминации, которые содержатся в строке «нормированный R-квадрат» итогов программы РЕГРЕССИЯ. Чем больше величина нормированного коэффициента детерминации, тем лучше модель.

Модель

Нормированный R-квадрат

YТ = -6,44 + 6,69*X1 + 2,49*Х4 (4)

0,754763

YТ = -2,17 - 1,57*X2 + 2,56*Х4 (5)

0,751412

YТ = -5,67 + 6,86*Х1 - 1,99*X2 + 2,59*Х4 (6)

0,748404

Таким образом, лучшей является модель (4) зависимости цены квартиры Y от города области Х1 и жилой площади квартиры Х4:

YТ = -6,44 + 6,69*X1 + 2,49*Х4.

Коэффициент регрессии b1 = 6,69, следовательно, при покупке квартиры в Люберцах (Х1) той же жилой площади (Х4), что и в Подольске цена квартиры (Y) увеличится в среднем на 6,69 тыс. долл.

Коэффициент регрессии b2 = 2,49, следовательно, при увеличении жилой площади (Х4) на 1 кв. м в одном городе (Х1), цена квартиры (Y) увеличится в среднем на 2,48 тыс. долл.

Свободный коэффициент не имеет экономического смысла.

7. Оценить качество модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дать оценку влияния значимых факторов на результат с помощью коэффициента эластичности, в- и Д-коэффициентов.

Для оценки качества выбранной множественной модели (4) YТ = -6,44 + 6,69*X1 + 2,49*Х4 аналогично п. 4 данной задачи используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F - критерий Фишера.

Коэффициент детерминации R-квадрат выпишем из итогов РЕГРЕССИИ (таблица «Регрессионная статистика» для модели (4)).

R2 = 0,767, следовательно, вариация цены квартиры Y на 76,7% объясняется по данному уравнению вариацией города области Х1 и жилой площади Х4.

Используем исходные данные Yi и найденные программой РЕГРЕССИЯ остатки Еi (таблица «Вывод остатка» для модели (4)). Рассчитаем относительные погрешности и найдем среднее значение отн.

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

Отн. погр-ти

1

47,55316

-9,55316

25,13988493

2

89,87092

-27,6709

44,48700502

3

95,62438

29,37562

23,50049523

4

86,88378

-25,7838

42,19931434

5

40,11344

26,88656

40,12920021

6

62,51696

30,48304

32,77746634

7

147,1244

-29,1244

24,68165955

8

103,0922

28,90778

21,89983249

9

132,9636

-40,4636

43,74441266

10

117,253

-12,253

11,66952159

11

45,06388

-3,06388

7,294943394

12

109,7852

15,21484

12,17187399

13

132,9636

37,03642

21,7861284

14

33,39238

4,60762

12,12531651

15

157,8564

-27,3564

20,96274499

16

78,19942

6,800579

8,000681624

17

100,6029

-2,60294

2,656062313

18

140,9293

-12,9293

10,10099834

19

118,0279

-33,0279

38,85635461

20

104,8066

55,1934

34,49587661

21

43,3495

16,6505

27,75083346

22

35,10676

5,893244

14,37376579

23

117,253

-27,253

30,28110852

24

116,7833

-33,7833

40,70272457

25

40,61129

4,388708

9,752684736

26

38,37094

0,62906

1,612974811

27

139,6846

-52,7846

60,7418157

28

48,32806

-8,32806

20,82015006

29

93,1351

-13,1351

16,41887615

30

220,0884

6,911617

3,044764999

31

217,5991

17,4009

7,40463685

32

37,59604

2,403964

6,009909809

33

46,30852

20,69148

30,88281157

34

137,1672

-14,1672

11,51807973

35

85,66726

14,33274

14,33273923

36

119,7423

-14,7423

14,04026449

37

86,88378

-16,5838

23,59001573

38

119,7423

-37,7423

46,02716795

39

211,8456

68,15436

24,34084302

40

149,6136

50,38636

25,19318084

По столбцу относительных погрешностей найдем среднее значение отн = 22,69% (с помощью функции СРЗНАЧ).

Сравнение показывает, что 22,69% > 15%. Следовательно, точность модели неудовлетворительная.

С помощью F - критерия Фишера проверим значимость модели в целом. Для этого выпишем из итогов РЕГРЕССИИ (таблица «дисперсионный анализ» для модели (4)) F = 61,01.

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

98226,35

49113,17573

61,01499

1,92E-12

Остаток

37

29782,64

804,9362779

Итого

39

128009

С помощью функции FРАСПОБР найдем значение Fкр = 3,25 для уровня значимости б = 5%, и чисел степеней свободы k1 = 2, k2 = 37.

F = 61,01 > Fкр = 3,25, следовательно, уравнения модели (4) является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель (4) факторными переменными Х1 и Х4.

Дополнительно с помощью t - критерия Стьюдента проверим значимость отдельных коэффициентов модели.

t - статистики для коэффициентов уравнения регрессии приведены в итогах программы РЕГРЕССИЯ. Для выбранной модели (4) получены следующие значения:

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

-6,4361

11,51649

-0,558859663

0,579624

Х1

6,692936

9,045869

0,739888746

0,464037

Х4

2,48928

0,22536

11,04580516

2,85E-13

Критическое значение tкр найдено для уровня значимости б = 5% и числа степеней свободы k = 40 - 2 - 1 = 37. tкр = 2,03 (функция СТЬЮДРАСПОБР).

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Для свободного коэффициента a= -6,44 определена статистика t(a) = -0,56.

|t(a)| = 0,56 < tкр = 2,03, следовательно, свободный коэффициент a = -6,44 не является значимым, его можно исключить из модели.

Для коэффициента регрессии b1 = 6,69 определена статистика t(b1)= 0,74.

|t(b1)| = 0,74 < tкр = 2,03, следовательно, коэффициента регрессии b1 не является значимым, его и фактор города области можно исключить из модели.

Для коэффициента регрессии b2=2,49 определена статистика t(b2)= 11,05.

|t(b2)| = 11,05 > tкр = 2,03, следовательно, коэффициента регрессии b2 является значимым, его и фактор жилой площади квартиры нужно сохранить в модели.

Выводы о значимости коэффициентов модели сделаны на уровне значимости б = 5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент a можно считать значимым на уровне 0,58 = 58%; коэффициент регрессии b1 - на уровне 0,46 = 46%;, а коэффициент регрессии b2 - на уровне 2,85E-13 = 0,000000000000285 = 0,000000000001%.

При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества модели (3) и выбранной множественной модели (4) используем нормированные коэффициенты детерминации.

Модель

Нормированный R-квадрат

YТ = - 2,86 + 2,48*X4 (3)

0,757684

YТ = -6,44 + 6,69*X1 + 2,49*Х4 (4)

0,754763

Таким образом, при добавлении в уравнение регрессии фактора «город области» Х1 качество модели ухудшилось, что говорит не в пользу сохранения фактора Х1 в модели.

Дальнейшие расчеты проведем в учебных целях.

Средние коэффициенты эластичности в случае линейной модели определяются формулами

Эj = bj * .

С помощью функции СРЗНАЧ найдем: = 0,45, = 42,045, = 101,24. Тогда Э1 = 6,69 * = 0,03, Э2 = 2,49 * = 1,03.

Следовательно, при покупке квартиры в Люберцах (Х1) и неизменной жилой площади цена квартиры увеличится в среднем на 0,03%.

Увеличение жилой площади Х4 в том же городе на 1% приводит к увеличению цены квартиры в среднем на 1,03%.

Бета-коэффициенты определяются формулами

вj = bj * .

С помощью функции СТАНДОТКЛОН найдем SX1 = 0,5; SX4 = 20,22; SY = 57,29. Тогда

в1 = 6,69 * = 0,06; в2 = 2,49 * = 0,88.

Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0,06 своего стандартного отклонения SY, а при увеличении только фактора Х4 на одно его стандартное отклонение - увеличивается на 0,88 SY.

Дельта-коэффициенты определяются формулами

Дj = вj * .

Коэффициенты парной корреляции r (Y, X1) = - 0,01, и r (Y, X4) = 0,87 найдены с помощью программы КОРРЕЛЯЦИЯ. Коэффициент детерминации R2 = 0,77 определен для рассматриваемой двухфакторной модели программой РЕГРЕССИЯ.

Вычислим дельта-коэффициенты:

Д1 = 0,06 * = - 0,0009; Д2 = 0,88 * = 1,0009.

Поскольку Д1 < 0, то факторная переменная Х1 выбрана неудачно и ее нужно исключить из модели.

Значит, по уравнению полученной линейной двухфакторной модели изменение результирующего фактора Y (цены квартиры) на 100% объясняется воздействием фактора Х4 (жилой площадью квартиры).

Размещено на Allbest.ru


Подобные документы

  • Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.

    контрольная работа [298,2 K], добавлен 19.01.2011

  • Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.

    лабораторная работа [214,2 K], добавлен 17.10.2009

  • Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.

    лабораторная работа [30,9 K], добавлен 05.12.2010

  • Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.

    курсовая работа [314,1 K], добавлен 21.01.2011

  • Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.

    лабораторная работа [890,1 K], добавлен 06.12.2014

  • Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.

    задача [83,2 K], добавлен 20.01.2010

  • Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.

    контрольная работа [71,7 K], добавлен 17.09.2016

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Оценка корреляционной матрицы факторных признаков. Оценки собственных чисел матрицы парных коэффициентов корреляции. Анализ полученного уравнения регрессии, определение значимости уравнения и коэффициентов регрессии, их экономическая интерпретация.

    контрольная работа [994,1 K], добавлен 29.06.2013

  • Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.

    лабораторная работа [1,8 M], добавлен 25.05.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.