Эконометрическое моделирование стоимости квартир в Московской области
Расширение матрицы парных коэффициентов корреляции; оценка статистической значимости коэффициентов корреляции. Построение поля корреляции результативного признака и связанного с ним фактора. Оценка качества каждой модели, прогнозирование показателей.
Рубрика | Экономико-математическое моделирование |
Вид | задача |
Язык | русский |
Дата добавления | 11.02.2012 |
Размер файла | 105,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Задача
Эконометрическое моделирование стоимости квартир в Московской области. Наименование показателей и исходных данных для эконометрического моделирования представлены в таблице:
№ п.п. |
Цена квартиры, тыс. долл. (Y) |
Город области, 1 - Подольск, 0 - Люберцы (Х1) |
Число комнат в квартире (Х2) |
Жилая площадь квартиры, кв. м (Х4) |
|
1 |
38 |
1 |
1 |
19 |
|
2 |
62,2 |
1 |
2 |
36 |
|
3 |
125 |
0 |
3 |
41 |
|
4 |
61,1 |
1 |
2 |
34,8 |
|
5 |
67 |
0 |
1 |
18,7 |
|
6 |
93 |
0 |
2 |
27,7 |
|
7 |
118 |
1 |
3 |
59 |
|
8 |
132 |
0 |
3 |
44 |
|
9 |
92,5 |
0 |
3 |
56 |
|
10 |
105 |
1 |
4 |
47 |
|
11 |
42 |
1 |
1 |
18 |
|
12 |
125 |
1 |
3 |
44 |
|
13 |
170 |
0 |
4 |
56 |
|
14 |
38 |
0 |
1 |
16 |
|
15 |
130,5 |
0 |
4 |
66 |
|
16 |
85 |
0 |
2 |
34 |
|
17 |
98 |
0 |
4 |
43 |
|
18 |
128 |
0 |
4 |
59,2 |
|
19 |
85 |
0 |
3 |
50 |
|
20 |
160 |
1 |
3 |
42 |
|
21 |
60 |
0 |
1 |
20 |
|
22 |
41 |
1 |
1 |
14 |
|
23 |
90 |
1 |
4 |
47 |
|
24 |
83 |
0 |
4 |
49,5 |
|
25 |
45 |
0 |
1 |
18,9 |
|
26 |
39 |
0 |
1 |
18 |
|
27 |
86,9 |
0 |
3 |
58,7 |
|
28 |
40 |
0 |
1 |
22 |
|
29 |
80 |
0 |
2 |
40 |
|
30 |
227 |
0 |
4 |
91 |
|
31 |
235 |
0 |
4 |
90 |
|
32 |
40 |
1 |
1 |
15 |
|
33 |
67 |
1 |
1 |
18,5 |
|
34 |
123 |
1 |
4 |
55 |
|
35 |
100 |
0 |
3 |
37 |
|
36 |
105 |
1 |
3 |
48 |
|
37 |
70,3 |
1 |
2 |
34,8 |
|
38 |
82 |
1 |
3 |
48 |
|
39 |
280 |
1 |
4 |
85 |
|
40 |
200 |
1 |
4 |
60 |
Задание:
Расширить матрицу парных коэффициентов корреляции; оценить статистическую значимость коэффициентов корреляции.
Построить поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Рассчитать параметры линейных парных регрессий для всех факторов Х.
Оценить качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F - критерия Фишера. Выбрать лучшую модель.
С использованием лучшей модели осуществить прогнозирование среднего значения показателя Y при уровне значимости б = 0,1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представить графически и модельные значения Y, результаты прогнозирования.
Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель формирования цены квартиры за счет значимых факторов. Дать экономическую интерпретацию коэффициентов модели регрессии.
Оценить качество модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дать оценку влияния значимых факторов на результат с помощью коэффициента эластичности, в- и Д-коэффициентов.
Решение
1. Расширить матрицу парных коэффициентов корреляции; оценить статистическую значимость коэффициентов корреляции.
Используем Exel / сервис / анализ данных / корреляция. Получим матрицу коэффициентов парной корреляции между всеми имеющимися переменными:
Y |
Х1 |
Х2 |
Х4 |
||
Y |
1 |
||||
Х1 |
-0,01126 |
1 |
|||
Х2 |
0,751061 |
-0,0341 |
1 |
||
Х4 |
0,874012 |
-0,0798 |
0,868524 |
1 |
Проанализируем коэффициенты корреляции между результирующим признаком Y и каждым из факторов Хj:
r (Y, X1) = - 0,01 < 0, значит, между переменными Y и Х1 наблюдается обратная корреляционная зависимость: цена на квартиры выше в Люберцах.
|r (Y, X1)| = 0,01 < 0,4 - эта зависимость слабая.
r (Y, X2) = 0,75 > 0, значит, между переменными Y и Х2 наблюдается прямая корреляционная зависимость: чем больше комнат в квартире, тем выше ее цена.
|r (Y, X2)| = 0,75 > 0,7 - эта зависимость тесная, ближе к умеренной.
r (Y, X4) = 0,87 > 0, значит, между переменными Y и Х4 наблюдается прямая корреляционная зависимость: чем больше жилая площадь в квартире, тем выше ее цена.
|r (Y, X4)| = 0,87 > 0,7 - эта зависимость тесная.
Для проверки значимости найденных коэффициентов корреляции используем критерий Стьюдента.
Для каждого коэффициента r (Y, Xj) вычислим t-статистику по формуле
t = и занесем результаты расчетов в корреляционную таблицу:
Y |
Х1 |
Х2 |
Х4 |
t-статистики |
||
Y |
1 |
|||||
Х1 |
-0,01126 |
1 |
0,069411185 |
|||
Х2 |
0,751061 |
-0,0341 |
1 |
7,012446419 |
||
Х4 |
0,874012 |
-0,0798 |
0,868524 |
1 |
11,08813705 |
По таблице критических точек распределения Стьюдента при уровне значимости б = 5% и числе степеней свободы k = n - 2 = 40 - 2 = 38 определим критическое значение tкр = 2,02 (или с помощью функции СТЬЮДРАСПОБР).
Сопоставим фактическое значение t с критическим tкр, и сделаем выводы в соответствии со схемой:
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
t (r(Y, X1)) = 0,07 < tкр = 2,02, следовательно коэффициент r (Y, X1) не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой квартиры Y и городом области Х1 существует.
t (r(Y, X2)) = 7,01 > tкр = 2,02, следовательно коэффициент r (Y, X2) значимо отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной зависимости между признаками Y и Х2. Зависимость между ценой квартиры Y и числом комнат в квартире Х2 является достоверной.
t (r(Y, X4)) = 11,09 > tкр = 2,02, следовательно коэффициент r (Y, X4) значимо отличается от нуля. На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии линейной корреляционной зависимости между признаками Y и Х4. Зависимость между ценой квартиры Y и жилой площадью квартиры Х4 является достоверной.
Таким образом, наиболее тесная и значимая зависимость наблюдается между ценой квартиры Y и жилой площадью квартиры Х4.
2. Построить поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Для построения поля корреляции используем Мастер диаграмм (точечная) - покажем исходные данные Y и значение наиболее информативного фактора Х4. В результате получим диаграмму «поле корреляции»:
3. Рассчитать параметры линейных парных регрессий для всех факторов Х.
Для построения парной линейной модели Yt = a+b*X1. используем программу РЕГРЕССИЯ. В качестве входного интервала Х покажем значение фактора Х1.
Результаты вычислений представлены в таблицах:
ВЫВОД ИТОГОВ |
|||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,011259 |
||||||||
R-квадрат |
0,000127 |
||||||||
Нормированный R-квадрат |
-0,02619 |
||||||||
Стандартная ошибка |
58,03646 |
||||||||
Наблюдения |
40 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
1 |
16,22784 |
16,22784 |
0,004818 |
0,945026 |
||||
Остаток |
38 |
127992,8 |
3368,231 |
||||||
Итого |
39 |
128009 |
|||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
101,8136 |
12,37341 |
8,228419 |
5,73E-10 |
76,76497 |
126,8623 |
76,76497 |
126,8623 |
|
Х1 |
-1,2803 |
18,4452 |
-0,06941 |
0,945026 |
-38,6207 |
36,06005 |
-38,6207 |
36,06005 |
Коэффициенты модели содержатся в третьей таблице итогов Регрессии (столбец Коэффициенты).
Таким образом, уравнение модели (1) имеете вид:
YТ = 101,81 - 1,28*X1.
Коэффициент регрессии b = -1,28, следовательно цена реализации квартиры в Подольске в среднем на 1,28 тыс. долл. ниже цены реализации в Люберцах. Свободный член a = 101,81 не имеет реального смысла.
Аналогичные расчеты проведем для построения модели зависимости цены реализации Y от числа комнат в квартире Х2:
ВЫВОД ИТОГОВ |
||||||
Регрессионная статистика |
||||||
Множественный R |
0,751061 |
|||||
R-квадрат |
0,564092 |
|||||
Нормированный R-квадрат |
0,552621 |
|||||
Стандартная ошибка |
38,32002 |
|||||
Наблюдения |
40 |
|||||
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
72208,88 |
72208,88 |
49,1744 |
2,37E-08 |
|
Остаток |
38 |
55800,11 |
1468,424 |
|||
Итого |
39 |
128009 |
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
7,539299 |
14,67125 |
0,513882 |
0,61031 |
-22,1611 |
37,23969 |
-22,1611 |
37,23969 |
|
Х2 |
36,03777 |
5,139115 |
7,012446 |
2,37E-08 |
25,63418 |
46,44136 |
25,63418 |
46,44136 |
Модель (2) построена, ее уравнение имеет вид:
YТ = 7,54 + 36,04*X2.
Коэффициент регрессии b = 36,04, следовательно при увеличении на 1 комнату в квартире в среднем на 36,04 тыс. долл. увеличивается цена квартиры. Свободный член a = 7,54 не имеет реального смысла.
Также построим модель зависимости цены квартиры Y от жилой площади квартиры Х4.
ВЫВОД ИТОГОВ |
||||||
Регрессионная статистика |
||||||
Множественный R |
0,874012 |
|||||
R-квадрат |
0,763897 |
|||||
Нормированный R-квадрат |
0,757684 |
|||||
Стандартная ошибка |
28,20195 |
|||||
Наблюдения |
40 |
|||||
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
97785,7 |
97785,7 |
122,9468 |
1,79E-13 |
|
Остаток |
38 |
30223,29 |
795,3498 |
|||
Итого |
39 |
128009 |
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
-2,86485 |
10,39375 |
-0,27563 |
0,784324 |
-23,9059 |
18,17619 |
-23,9059 |
18,17619 |
|
Х4 |
2,475975 |
0,223299 |
11,08814 |
1,79E-13 |
2,023929 |
2,928021 |
2,023929 |
2,928021 |
Модель (3) построена, ее уравнение имеет вид:
YТ = - 2,86 + 2,48*X4.
Коэффициент регрессии b = 2,48, следовательно при увеличении жилой площади квартиры на 1 кв. м в среднем на 2,48 тыс. долл. увеличивается цена квартиры. Свободный член a = -2,86 не имеет реального смысла.
4. Оценить качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F - критерия Фишера. Выбрать лучшую модель.
Для удобства все результаты будем заносить в сводную таблицу.
Коэффициенты детерминации R-квадрат определены для каждой модели программой РЕГРЕССИЯ (таблица «Регрессионная статистика») и составляют:
Модель |
R-квадрат |
отн |
F |
|
YТ = 101,81 - 1,28*X1 (1) |
0,000127 |
|||
YТ = 7,54 + 36,04*X2 (2) |
0,564092 |
|||
YТ = - 2,86 + 2,48*X4 (3) |
0,763897 |
Таким образом, вариация цены квартиры Y на 0,01% объясняется по уравнению (1) изменением города области Х1; на 56,41% по уравнению (2) вариацией числа комнат в квартире Х2; на 76,39% по уравнению (3) изменением жилой площади квартиры Х4.
Для вычисления средней относительной ошибки аппроксимации рассмотрим остатки модели Еi = Yi - YТi, содержащиеся в столбце Остатки итогов программы РЕГРЕССИЯ (таблица «вывод остатка»). Дополним таблицу столбцом относительных погрешностей, которые вычислим по формуле Еотн.i = 100 с помощью функции ABS.
Выполнение расчетов для модели (1)
ВЫВОД ОСТАТКА |
||||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погр-ти |
|
1 |
100,5333 |
-62,5333 |
164,5614 |
|
2 |
100,5333 |
-38,3333 |
61,62915 |
|
3 |
101,8136 |
23,18636 |
18,54909 |
|
4 |
100,5333 |
-39,4333 |
64,53901 |
|
5 |
101,8136 |
-34,8136 |
51,96065 |
|
6 |
101,8136 |
-8,81364 |
9,477028 |
|
7 |
100,5333 |
17,46667 |
14,80226 |
|
8 |
101,8136 |
30,18636 |
22,86846 |
|
9 |
101,8136 |
-9,31364 |
10,0688 |
|
10 |
100,5333 |
4,466667 |
4,253968 |
|
11 |
100,5333 |
-58,5333 |
139,3651 |
|
12 |
100,5333 |
24,46667 |
19,57333 |
|
13 |
101,8136 |
68,18636 |
40,10963 |
|
14 |
101,8136 |
-63,8136 |
167,9306 |
|
15 |
101,8136 |
28,68636 |
21,98189 |
|
16 |
101,8136 |
-16,8136 |
19,78075 |
|
17 |
101,8136 |
-3,81364 |
3,891466 |
|
18 |
101,8136 |
26,18636 |
20,4581 |
|
19 |
101,8136 |
-16,8136 |
19,78075 |
|
20 |
100,5333 |
59,46667 |
37,16667 |
|
21 |
101,8136 |
-41,8136 |
69,68939 |
|
22 |
100,5333 |
-59,5333 |
145,2033 |
|
23 |
100,5333 |
-10,5333 |
11,7037 |
|
24 |
101,8136 |
-18,8136 |
22,66703 |
|
25 |
101,8136 |
-56,8136 |
126,2525 |
|
26 |
101,8136 |
-62,8136 |
161,0606 |
|
27 |
101,8136 |
-14,9136 |
17,16184 |
|
28 |
101,8136 |
-61,8136 |
154,5341 |
|
29 |
101,8136 |
-21,8136 |
27,26705 |
|
30 |
101,8136 |
125,1864 |
55,14818 |
|
31 |
101,8136 |
133,1864 |
56,67505 |
|
32 |
100,5333 |
-60,5333 |
151,3333 |
|
33 |
100,5333 |
-33,5333 |
50,04975 |
|
34 |
100,5333 |
22,46667 |
18,26558 |
|
35 |
101,8136 |
-1,81364 |
1,813636 |
|
36 |
100,5333 |
4,466667 |
4,253968 |
|
37 |
100,5333 |
-30,2333 |
43,00616 |
|
38 |
100,5333 |
-18,5333 |
22,60163 |
|
39 |
100,5333 |
179,4667 |
64,09524 |
|
40 |
100,5333 |
99,46667 |
49,73333 |
По столбцу относительных погрешностей найдем среднее значение отн = 54,13% (с помощью функции СРЗНАЧ).
Выполнение расчетов для модели (2)
ВЫВОД ОСТАТКА |
||||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погр-ти |
|
1 |
43,57707 |
-5,57707 |
14,6765 |
|
2 |
79,61484 |
-17,4148 |
27,99813 |
|
3 |
115,6526 |
9,347392 |
7,477914 |
|
4 |
79,61484 |
-18,5148 |
30,30252 |
|
5 |
43,57707 |
23,42293 |
34,9596 |
|
6 |
79,61484 |
13,38516 |
14,39265 |
|
7 |
115,6526 |
2,347392 |
1,989315 |
|
8 |
115,6526 |
16,34739 |
12,38439 |
|
9 |
115,6526 |
-23,1526 |
25,02985 |
|
10 |
151,6904 |
-46,6904 |
44,46703 |
|
11 |
43,57707 |
-1,57707 |
3,754925 |
|
12 |
115,6526 |
9,347392 |
7,477914 |
|
13 |
151,6904 |
18,30962 |
10,77037 |
|
14 |
43,57707 |
-5,57707 |
14,6765 |
|
15 |
151,6904 |
-21,1904 |
16,23784 |
|
16 |
79,61484 |
5,385162 |
6,335485 |
|
17 |
151,6904 |
-53,6904 |
54,7861 |
|
18 |
151,6904 |
-23,6904 |
18,50811 |
|
19 |
115,6526 |
-30,6526 |
36,06189 |
|
20 |
115,6526 |
44,34739 |
27,71712 |
|
21 |
43,57707 |
16,42293 |
27,37155 |
|
22 |
43,57707 |
-2,57707 |
6,285533 |
|
23 |
151,6904 |
-61,6904 |
68,54486 |
|
24 |
151,6904 |
-68,6904 |
82,75949 |
|
25 |
43,57707 |
1,422932 |
3,16207 |
|
26 |
43,57707 |
-4,57707 |
11,73607 |
|
27 |
115,6526 |
-28,7526 |
33,08701 |
|
28 |
43,57707 |
-3,57707 |
8,942671 |
|
29 |
79,61484 |
0,385162 |
0,481452 |
|
30 |
151,6904 |
75,30962 |
33,17605 |
|
31 |
151,6904 |
83,30962 |
35,4509 |
|
32 |
43,57707 |
-3,57707 |
8,942671 |
|
33 |
43,57707 |
23,42293 |
34,9596 |
|
34 |
151,6904 |
-28,6904 |
23,32551 |
|
35 |
115,6526 |
-15,6526 |
15,65261 |
|
36 |
115,6526 |
-10,6526 |
10,14534 |
|
37 |
79,61484 |
-9,31484 |
13,25013 |
|
38 |
115,6526 |
-33,6526 |
41,03977 |
|
39 |
151,6904 |
128,3096 |
45,82487 |
|
40 |
151,6904 |
48,30962 |
24,15481 |
По столбцу относительных погрешностей найдем среднее значение отн = 23,46%.
Выполнение расчетов для модели (3)
ВЫВОД ОСТАТКА |
||||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погр-ти |
|
1 |
44,17867 |
-6,17867 |
16,25965 |
|
2 |
86,27023 |
-24,0702 |
38,69812 |
|
3 |
98,65011 |
26,34989 |
21,07991 |
|
4 |
83,29906 |
-22,1991 |
36,33235 |
|
5 |
43,43587 |
23,56413 |
35,17034 |
|
6 |
65,71964 |
27,28036 |
29,33372 |
|
7 |
143,2176 |
-25,2176 |
21,37089 |
|
8 |
106,078 |
25,92197 |
19,63786 |
|
9 |
135,7897 |
-43,2897 |
46,7997 |
|
10 |
113,506 |
-8,50595 |
8,100909 |
|
11 |
41,70269 |
0,297309 |
0,707878 |
|
12 |
106,078 |
18,92197 |
15,13758 |
|
13 |
135,7897 |
34,21027 |
20,12369 |
|
14 |
36,75074 |
1,249258 |
3,287521 |
|
15 |
160,5495 |
-30,0495 |
23,02641 |
|
16 |
81,31828 |
3,681716 |
4,33143 |
|
17 |
103,6021 |
-5,60206 |
5,716383 |
|
18 |
143,7128 |
-15,7128 |
12,27566 |
|
19 |
120,9339 |
-35,9339 |
42,27515 |
|
20 |
101,1261 |
58,87392 |
36,7962 |
|
21 |
46,65464 |
13,34536 |
22,24227 |
|
22 |
31,79879 |
9,201207 |
22,44197 |
|
23 |
113,506 |
-23,506 |
26,11773 |
|
24 |
119,6959 |
-36,6959 |
44,21192 |
|
25 |
43,93107 |
1,068932 |
2,375404 |
|
26 |
41,70269 |
-2,70269 |
6,929977 |
|
27 |
142,4749 |
-55,5749 |
63,95265 |
|
28 |
51,60659 |
-11,6066 |
29,01647 |
|
29 |
96,17413 |
-16,1741 |
20,21766 |
|
30 |
222,4488 |
4,551164 |
2,004918 |
|
31 |
219,9729 |
15,02714 |
6,394527 |
|
32 |
34,27477 |
5,725233 |
14,31308 |
|
33 |
42,94068 |
24,05932 |
35,90944 |
|
34 |
133,3138 |
-10,3138 |
8,385163 |
|
35 |
88,74621 |
11,25379 |
11,25379 |
|
36 |
115,9819 |
-10,9819 |
10,45898 |
|
37 |
83,29906 |
-12,9991 |
18,49085 |
|
38 |
115,9819 |
-33,9819 |
41,44138 |
|
39 |
207,593 |
72,40701 |
25,85965 |
|
40 |
145,6936 |
54,30638 |
27,15319 |
По столбцу относительных погрешностей найдем среднее значение отн = 21,89%.
Разнесем результаты в сводную таблицу:
Модель |
R-квадрат |
отн |
F |
|
YТ = 101,81 - 1,28*X1 (1) |
0,000127 |
54,13% |
||
YТ = 7,54 + 36,04*X2 (2) |
0,564092 |
23,46% |
||
YТ = - 2,86 + 2,48*X4 (3) |
0,763897 |
21,89% |
Оценим точность построенных моделей в соответствии со схемой:
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
отн1 = 54,13% > 15%, отн2 = 23,46% > 15%, отн3 = 21,89% > 15%. Точность всех трех моделей неудовлетворительная. Ближе к 15% отн модели (3).
Проверим значимость полученных уравнений с помощью F - критерия Фишера.
F - статистики определены программой РЕГРЕССИЯ (таблицы «Дисперсионный анализ») и составляют:
Модель |
R-квадрат |
отн |
F |
|
YТ = 101,81 - 1,28*X1 (1) |
0,000127 |
54,13% |
0,004818 |
|
YТ = 7,54 + 36,04*X2 (2) |
0,564092 |
23,46% |
49,1744 |
|
YТ = - 2,86 + 2,48*X4 (3) |
0,763897 |
21,89% |
122,9468 |
С помощью функции FРАСПОБР найдем значение Fкр = 4,1 для уровня значимости б = 5%, и чисел степеней свободы k1 = 1, k2 = 38.
Схема проверки:
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
F = 0,0048 < Fкр = 4,1, следовательно уравнение модели (1) не является значимой и ее использование нецелесообразно.
F = 49,17 > Fкр = 4,1, F = 122,95 > Fкр = 4,1, следовательно, уравнения моделей (2) и (3) являются значимыми, их использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель (2) факторной переменной Х2 и включенной в модель (3) факторной переменной Х4.
Вывод: на основании оценки качества моделей по коэффициенту детерминации, средней ошибке аппроксимации и критерию Фишера наилучшей является модель (3) зависимости цены квартиры от ее жилой площади. Однако эту модель нецелесообразно использовать для прогнозирования в реальных условиях, поскольку ее точность неудовлетворительная, и дальнейшие расчеты проведем в учебных целях.
5. С использованием лучшей модели осуществить прогнозирование среднего значения показателя Y при уровне значимости б = 0,1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представить графически и модельные значения Y, результаты прогнозирования.
Согласно условию задачи прогнозное значение фактора Х4 составляет 80% от его максимального значения. Максимальное значение Х4 = 91 найдем с помощью функции МАКС. Тогда прогнозное значение Х4* = 72,8. Рассчитаем по уравнению модели (3) прогнозное значение Y:
Y*Т = - 2,86 + 2,48* Х4* = - 2,86 + 2,48 * 72,8 = 177,39.
Таким образом, если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая цена квартиры будет составлять около 177,39 тыс. долл.
Зададим доверительную вероятность p = 1 - б = 1 - 0,1 = 0,9 и построим доверительный прогнозный интервал для среднего значения Y.
Для этого нужно рассчитать стандартную ошибку прогнозирования для среднего значения результирующего признака:
S(Y*Т) = SE * .
Предварительно подготовим:
- стандартная ошибка SE = 28,2 (таблица «регрессионная статистика» итогов РЕГРЕССИИ);
- по столбцу данных Х4 найдем среднее значение = 42,04 (функция СРЗНАЧ) и определим = 15950,82 (функция КВАДРОТКЛ);
- tкр - коэффициент Стьюдента для уровня значимости б=10% и числа степеней свободы k = 38. tкр = 1,686 (функция СТЬЮДРАСПОБР).
Следовательно, стандартная ошибка прогнозирования для среднего значения составляет:
S(Y*Т) = 28,2 * = 8,188.
Размах доверительного интервала для среднего значения:
U(Y*Т) = tкр * S(Y*Т) = 1,686 * 8,188 = 13,805.
Границами прогнозного интервала будут:
Uнижн = Y*Т - U(Y*Т) = 177,39 - 13,805 = 163,58;
Uверх = Y*Т + U(Y*Т) = 177,39 + 13,805 = 191,19.
Таким образом, с надежностью 90% можно утверждать, что если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая средняя цена квартиры будет от 163,58 тыс. долл. до 191,19 тыс. долл.
Для построения чертежа используем Мастер диаграмм (точечная) - покажем исходные данные (поле корреляции). Затем с помощью опции Добавить линию тренда, построим линию модели и покажем на графике результаты прогнозирования.
6. Используя пошаговую множественную регрессию (метод исключения или метод включения), построить модель формирования цены квартиры за счет значимых факторов. Дать экономическую интерпретацию коэффициентов модели регрессии.
Методом включения построим двух факторные модели, сохраняя в них наиболее информативный фактор - жилую площадь квартиры (Х4).
В качестве «входного интервала Х» укажем значения факторов Х1 и Х4, с помощью программы РЕГРЕССИЯ получим:
ВЫВОД ИТОГОВ |
||
Регрессионная статистика |
||
Множественный R |
0,875979 |
|
R-квадрат |
0,767339 |
|
Нормированный R-квадрат |
0,754763 |
|
Стандартная ошибка |
28,3714 |
|
Наблюдения |
40 |
|
Коэффициенты |
||
Y-пересечение |
-6,4361 |
|
Х1 |
6,692936 |
|
Х4 |
2,48928 |
Таким образом, модель (4) зависимости цены квартиры Y от города области Х1 и жилой площади квартиры Х4 построена, ее уравнение имеет вид:
YТ = -6,44 + 6,69*X1 + 2,49*Х4.
Используем в качестве «входного интервала Х» значения факторов Х2 и Х4, с помощью РЕГРЕССИИ найдем:
ВЫВОД ИТОГОВ |
||
Регрессионная статистика |
||
Множественный R |
0,874163 |
|
R-квадрат |
0,76416 |
|
Нормированный R-квадрат |
0,751412 |
|
Стандартная ошибка |
28,56458 |
|
Наблюдения |
40 |
Коэффициенты |
||
Y-пересечение |
-2,16757 |
|
Х2 |
-1,57033 |
|
Х4 |
2,556497 |
Таким образом, модель (5) зависимости цены квартиры Y от числа комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:
YТ = -2,17 - 1,57*X2 + 2,56*Х4.
Построим множественную модель регрессии, учитывая все факторы (Х1, Х2, и Х4):
ВЫВОД ИТОГОВ |
||
Регрессионная статистика |
||
Множественный R |
0,876218 |
|
R-квадрат |
0,767758 |
|
Нормированный R-квадрат |
0,748404 |
|
Стандартная ошибка |
28,73688 |
|
Наблюдения |
40 |
|
Коэффициенты |
||
Y-пересечение |
-5,64357 |
|
Х1 |
6,859631 |
|
Х2 |
-1,98516 |
|
Х4 |
2,591406 |
Таким образом, трехфакторная модель (6) зависимости цены квартиры Y от города области Х1, числа комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:
YТ = -5,67 + 6,86*Х1 - 1,99*X2 + 2,59*Х4.
Выберем лучшую из построенных.
Для сравнения моделей с различным количеством учтенных в них факторов используем нормированные коэффициенты детерминации, которые содержатся в строке «нормированный R-квадрат» итогов программы РЕГРЕССИЯ. Чем больше величина нормированного коэффициента детерминации, тем лучше модель.
Модель |
Нормированный R-квадрат |
|
YТ = -6,44 + 6,69*X1 + 2,49*Х4 (4) |
0,754763 |
|
YТ = -2,17 - 1,57*X2 + 2,56*Х4 (5) |
0,751412 |
|
YТ = -5,67 + 6,86*Х1 - 1,99*X2 + 2,59*Х4 (6) |
0,748404 |
Таким образом, лучшей является модель (4) зависимости цены квартиры Y от города области Х1 и жилой площади квартиры Х4:
YТ = -6,44 + 6,69*X1 + 2,49*Х4.
Коэффициент регрессии b1 = 6,69, следовательно, при покупке квартиры в Люберцах (Х1) той же жилой площади (Х4), что и в Подольске цена квартиры (Y) увеличится в среднем на 6,69 тыс. долл.
Коэффициент регрессии b2 = 2,49, следовательно, при увеличении жилой площади (Х4) на 1 кв. м в одном городе (Х1), цена квартиры (Y) увеличится в среднем на 2,48 тыс. долл.
Свободный коэффициент не имеет экономического смысла.
7. Оценить качество модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дать оценку влияния значимых факторов на результат с помощью коэффициента эластичности, в- и Д-коэффициентов.
Для оценки качества выбранной множественной модели (4) YТ = -6,44 + 6,69*X1 + 2,49*Х4 аналогично п. 4 данной задачи используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F - критерий Фишера.
Коэффициент детерминации R-квадрат выпишем из итогов РЕГРЕССИИ (таблица «Регрессионная статистика» для модели (4)).
R2 = 0,767, следовательно, вариация цены квартиры Y на 76,7% объясняется по данному уравнению вариацией города области Х1 и жилой площади Х4.
Используем исходные данные Yi и найденные программой РЕГРЕССИЯ остатки Еi (таблица «Вывод остатка» для модели (4)). Рассчитаем относительные погрешности и найдем среднее значение отн.
ВЫВОД ОСТАТКА |
||||
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погр-ти |
|
1 |
47,55316 |
-9,55316 |
25,13988493 |
|
2 |
89,87092 |
-27,6709 |
44,48700502 |
|
3 |
95,62438 |
29,37562 |
23,50049523 |
|
4 |
86,88378 |
-25,7838 |
42,19931434 |
|
5 |
40,11344 |
26,88656 |
40,12920021 |
|
6 |
62,51696 |
30,48304 |
32,77746634 |
|
7 |
147,1244 |
-29,1244 |
24,68165955 |
|
8 |
103,0922 |
28,90778 |
21,89983249 |
|
9 |
132,9636 |
-40,4636 |
43,74441266 |
|
10 |
117,253 |
-12,253 |
11,66952159 |
|
11 |
45,06388 |
-3,06388 |
7,294943394 |
|
12 |
109,7852 |
15,21484 |
12,17187399 |
|
13 |
132,9636 |
37,03642 |
21,7861284 |
|
14 |
33,39238 |
4,60762 |
12,12531651 |
|
15 |
157,8564 |
-27,3564 |
20,96274499 |
|
16 |
78,19942 |
6,800579 |
8,000681624 |
|
17 |
100,6029 |
-2,60294 |
2,656062313 |
|
18 |
140,9293 |
-12,9293 |
10,10099834 |
|
19 |
118,0279 |
-33,0279 |
38,85635461 |
|
20 |
104,8066 |
55,1934 |
34,49587661 |
|
21 |
43,3495 |
16,6505 |
27,75083346 |
|
22 |
35,10676 |
5,893244 |
14,37376579 |
|
23 |
117,253 |
-27,253 |
30,28110852 |
|
24 |
116,7833 |
-33,7833 |
40,70272457 |
|
25 |
40,61129 |
4,388708 |
9,752684736 |
|
26 |
38,37094 |
0,62906 |
1,612974811 |
|
27 |
139,6846 |
-52,7846 |
60,7418157 |
|
28 |
48,32806 |
-8,32806 |
20,82015006 |
|
29 |
93,1351 |
-13,1351 |
16,41887615 |
|
30 |
220,0884 |
6,911617 |
3,044764999 |
|
31 |
217,5991 |
17,4009 |
7,40463685 |
|
32 |
37,59604 |
2,403964 |
6,009909809 |
|
33 |
46,30852 |
20,69148 |
30,88281157 |
|
34 |
137,1672 |
-14,1672 |
11,51807973 |
|
35 |
85,66726 |
14,33274 |
14,33273923 |
|
36 |
119,7423 |
-14,7423 |
14,04026449 |
|
37 |
86,88378 |
-16,5838 |
23,59001573 |
|
38 |
119,7423 |
-37,7423 |
46,02716795 |
|
39 |
211,8456 |
68,15436 |
24,34084302 |
|
40 |
149,6136 |
50,38636 |
25,19318084 |
По столбцу относительных погрешностей найдем среднее значение отн = 22,69% (с помощью функции СРЗНАЧ).
Сравнение показывает, что 22,69% > 15%. Следовательно, точность модели неудовлетворительная.
С помощью F - критерия Фишера проверим значимость модели в целом. Для этого выпишем из итогов РЕГРЕССИИ (таблица «дисперсионный анализ» для модели (4)) F = 61,01.
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
2 |
98226,35 |
49113,17573 |
61,01499 |
1,92E-12 |
|
Остаток |
37 |
29782,64 |
804,9362779 |
|||
Итого |
39 |
128009 |
С помощью функции FРАСПОБР найдем значение Fкр = 3,25 для уровня значимости б = 5%, и чисел степеней свободы k1 = 2, k2 = 37.
F = 61,01 > Fкр = 3,25, следовательно, уравнения модели (4) является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель (4) факторными переменными Х1 и Х4.
Дополнительно с помощью t - критерия Стьюдента проверим значимость отдельных коэффициентов модели.
t - статистики для коэффициентов уравнения регрессии приведены в итогах программы РЕГРЕССИЯ. Для выбранной модели (4) получены следующие значения:
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
||
Y-пересечение |
-6,4361 |
11,51649 |
-0,558859663 |
0,579624 |
|
Х1 |
6,692936 |
9,045869 |
0,739888746 |
0,464037 |
|
Х4 |
2,48928 |
0,22536 |
11,04580516 |
2,85E-13 |
Критическое значение tкр найдено для уровня значимости б = 5% и числа степеней свободы k = 40 - 2 - 1 = 37. tкр = 2,03 (функция СТЬЮДРАСПОБР).
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Для свободного коэффициента a= -6,44 определена статистика t(a) = -0,56.
|t(a)| = 0,56 < tкр = 2,03, следовательно, свободный коэффициент a = -6,44 не является значимым, его можно исключить из модели.
Для коэффициента регрессии b1 = 6,69 определена статистика t(b1)= 0,74.
|t(b1)| = 0,74 < tкр = 2,03, следовательно, коэффициента регрессии b1 не является значимым, его и фактор города области можно исключить из модели.
Для коэффициента регрессии b2=2,49 определена статистика t(b2)= 11,05.
|t(b2)| = 11,05 > tкр = 2,03, следовательно, коэффициента регрессии b2 является значимым, его и фактор жилой площади квартиры нужно сохранить в модели.
Выводы о значимости коэффициентов модели сделаны на уровне значимости б = 5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент a можно считать значимым на уровне 0,58 = 58%; коэффициент регрессии b1 - на уровне 0,46 = 46%;, а коэффициент регрессии b2 - на уровне 2,85E-13 = 0,000000000000285 = 0,000000000001%.
При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества модели (3) и выбранной множественной модели (4) используем нормированные коэффициенты детерминации.
Модель |
Нормированный R-квадрат |
|
YТ = - 2,86 + 2,48*X4 (3) |
0,757684 |
|
YТ = -6,44 + 6,69*X1 + 2,49*Х4 (4) |
0,754763 |
Таким образом, при добавлении в уравнение регрессии фактора «город области» Х1 качество модели ухудшилось, что говорит не в пользу сохранения фактора Х1 в модели.
Дальнейшие расчеты проведем в учебных целях.
Средние коэффициенты эластичности в случае линейной модели определяются формулами
Эj = bj * .
С помощью функции СРЗНАЧ найдем: = 0,45, = 42,045, = 101,24. Тогда Э1 = 6,69 * = 0,03, Э2 = 2,49 * = 1,03.
Следовательно, при покупке квартиры в Люберцах (Х1) и неизменной жилой площади цена квартиры увеличится в среднем на 0,03%.
Увеличение жилой площади Х4 в том же городе на 1% приводит к увеличению цены квартиры в среднем на 1,03%.
Бета-коэффициенты определяются формулами
вj = bj * .
С помощью функции СТАНДОТКЛОН найдем SX1 = 0,5; SX4 = 20,22; SY = 57,29. Тогда
в1 = 6,69 * = 0,06; в2 = 2,49 * = 0,88.
Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0,06 своего стандартного отклонения SY, а при увеличении только фактора Х4 на одно его стандартное отклонение - увеличивается на 0,88 SY.
Дельта-коэффициенты определяются формулами
Дj = вj * .
Коэффициенты парной корреляции r (Y, X1) = - 0,01, и r (Y, X4) = 0,87 найдены с помощью программы КОРРЕЛЯЦИЯ. Коэффициент детерминации R2 = 0,77 определен для рассматриваемой двухфакторной модели программой РЕГРЕССИЯ.
Вычислим дельта-коэффициенты:
Д1 = 0,06 * = - 0,0009; Д2 = 0,88 * = 1,0009.
Поскольку Д1 < 0, то факторная переменная Х1 выбрана неудачно и ее нужно исключить из модели.
Значит, по уравнению полученной линейной двухфакторной модели изменение результирующего фактора Y (цены квартиры) на 100% объясняется воздействием фактора Х4 (жилой площадью квартиры).
Размещено на Allbest.ru
Подобные документы
Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.
контрольная работа [298,2 K], добавлен 19.01.2011Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.
лабораторная работа [214,2 K], добавлен 17.10.2009Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.
лабораторная работа [30,9 K], добавлен 05.12.2010Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.
курсовая работа [314,1 K], добавлен 21.01.2011Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.
лабораторная работа [890,1 K], добавлен 06.12.2014- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.
задача [83,2 K], добавлен 20.01.2010 Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.
контрольная работа [71,7 K], добавлен 17.09.2016Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Оценка корреляционной матрицы факторных признаков. Оценки собственных чисел матрицы парных коэффициентов корреляции. Анализ полученного уравнения регрессии, определение значимости уравнения и коэффициентов регрессии, их экономическая интерпретация.
контрольная работа [994,1 K], добавлен 29.06.2013Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.
лабораторная работа [1,8 M], добавлен 25.05.2009