Парная линейная регрессия и корреляция
Характеристика зависимостей между среднедневной заработной платой и расходами на покупку продовольственных товаров. Расчет параметров линейной регрессии. Оценка модели через ошибку аппроксимации. Определение индекса корреляции по данным регионов.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 17.04.2011 |
Размер файла | 478,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Задача 1
По семи территориям уральского региона за 200Х год известны значения двух признаков
Таблица 1
район |
Расходы на покупку продовольственных товаров в общих расходах, %, У |
Среднедневная заработная плата одного работающего, руб. х |
|
Удмуртская республика |
68,8 |
45,1 |
|
Свердловская область |
61,2 |
59 |
|
Башкортостан |
59,9 |
57,2 |
|
Челябинская область |
56,7 |
61,8 |
|
Пермская область |
55 |
58,8 |
|
Курганская область |
54,3 |
47,2 |
|
Оренбургская область |
49,3 |
55,2 |
Решение:
1а. Линейная функция
Для расчета параметров a и b линейной регрессии у= а +b*х решаем систему нормальных уравнений относительно a и b:
По исходным данным рассчитываем ?y,?x,?y*x,?,?.
Таблица 2
|
y |
x |
yx |
x^2 |
y^2 |
Y^x |
y-y^x |
Ai |
|
|
68,8 |
45,1 |
3102,88 |
2034,01 |
4733,44 |
61,3 |
7,5 |
10,9 |
|
|
61,2 |
59,0 |
3610,80 |
3481,00 |
3745,44 |
56,5 |
4,7 |
7,7 |
|
|
59,9 |
57,2 |
3426,28 |
3271,84 |
3588,01 |
57,1 |
2,8 |
4,7 |
|
|
56,7 |
61,8 |
3504,06 |
3819,24 |
3214,89 |
55,5 |
1,2 |
2,1 |
|
|
55,0 |
58,8 |
3234,00 |
3457,44 |
3025,00 |
56,5 |
-1,5 |
2,79 |
|
|
54,3 |
47,2 |
2562,96 |
2227,84 |
2948,49 |
60,5 |
-6,2 |
11,5 |
|
|
49,3 |
55,2 |
2721,36 |
3047,04 |
2430,49 |
57,8 |
-8,5 |
17,2 |
|
Итого |
405,2 |
384,3 |
22162,3 |
21338,41 |
23685,76 |
405,2 |
0,0 |
57,0 |
|
Среднее |
57,89 |
54,90 |
3166,05 |
3048,34 |
3383,68 |
|
|
8,14 |
|
cигма |
5,74 |
5,86 |
|
|
|
|
|
|
|
сигма в кв. |
32,92 |
34,33 |
|
|
|
|
|
|
|
b |
-0,35 |
|
|
|
|
|
|
|
|
a |
76,88 |
|
|
|
|
|
|
|
|
Y^=76,88-0,35x |
|
|
|
|
|
|
|
|
|
коэффициент корреляции rxy |
|
|
-0,357 |
|
|
|
|
|
|
коэффициент детерминации r^2xy |
|
|
0,127 |
|
|
|
|
|
|
F-критерий |
|
|
0,71292 |
|
|
|
|
|
Рассчитаем среднее квадратичное отклонение:
у==5,86
у==5,74
Рассчитаем дисперсию:
=34,33
=32,92
Рассчитаем параметры a и b:
b===-0,35
a=yср-b*xср=50,89+0,35*54,9=76,88
Уравнение регрессии: y^=76,88-0,35*x. С увеличением среднедневной заработной платы на 1 руб. доля расходов на покупку продовольственных товаров снижается в среднем на 0,35%-ых пункта.
Рассчитаем линейный коэффициент парной корреляции:
Rxy=b*=-0,35*=-0,357
Можно сделать вывод, что связь умеренная, обратная.
Определим коэффициент детерминации:
R2xy=(-0,35)2=0,127
Вариация результата на 12,7% объясняется вариацией фактора x. Подставляя в уравнение регрессии фактические значения x, определим теоретические (расчетные) значения y^x . Найдем величину средней ошибки аппроксимации:
Аср.=1/n*?Ai=1/n*?*100%=*100%=8,14%
В среднем расчетные значения отклоняются от фактических на 8,14%.
Рассчитаем F-критерий:
F=*(n-2) ==0,71292
Полученное значение указывает на необходимость принять гипотезу Н0 о случайной природе выявленной зависимости и статистической незначимости параметров уравнения и показателя тесноты связи.
1б.Степенная функция
Построению степенной модели y=a*xb предшествует процедура линеаризации переменных. В примере линеаризация производится путем логарифмирования обеих частей уравнения:
lgy=lga+b*lgx;
Y=C+b*X
Для расчетов использованы данные таблицы 3.
Таблица 3
|
y |
x |
Y |
X |
YX |
Y^2 |
X^2 |
Y^x |
y-y^x |
(y-y^x)^2 |
|
|
68,8 |
45,1 |
1,8376 |
1,6542 |
3,0397 |
3,3767 |
2,7363 |
61,0 |
7,8 |
61,2 |
|
|
61,2 |
59,0 |
1,7868 |
1,7709 |
3,1641 |
3,1925 |
3,1359 |
56,3 |
4,9 |
24,2 |
|
|
59,9 |
57,2 |
1,7774 |
1,7574 |
3,1236 |
3,1592 |
3,0884 |
56,8 |
3,1 |
9,6 |
|
|
56,7 |
61,8 |
1,7536 |
1,7910 |
3,1406 |
3,0751 |
3,2076 |
55,5 |
1,2 |
1,4 |
|
|
55,0 |
58,8 |
1,7404 |
1,7694 |
3,0794 |
3,0289 |
3,1307 |
56,3 |
-1,3 |
1,8 |
|
|
54,3 |
47,2 |
1,7348 |
1,6739 |
2,9040 |
3,0095 |
2,8021 |
60,2 |
-5,9 |
34,3 |
|
|
49,3 |
55,2 |
1,6928 |
1,7419 |
2,9488 |
2,8657 |
3,0344 |
57,4 |
-8,1 |
65,8 |
|
Итого |
405,2 |
384,3 |
12,3234 |
12,1587 |
21,4002 |
21,7076 |
21,1354 |
403,5 |
1,7 |
198,2 |
|
среднее |
57,89 |
54,90 |
1,7605 |
1,7370 |
3,0572 |
3,1011 |
3,0193 |
|
|
28,27 |
|
сигма |
|
|
0,0424 |
0,0484 |
|
|
|
|
|
|
|
сигма в кв. |
|
|
0,0018 |
0,0023 |
|
|
|
|
|
|
|
b |
-0,298 |
|
|
|
|
|
|
|
|
|
|
C |
2,279 |
|
|
|
|
|
|
|
|
|
|
Y=2,279-0,298X |
|
|
|
|
|
|
|
|
|
|
|
A |
190,033 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
индекс корреляции Pxy |
|
|
0,3758 |
|
|
|
|
|
|
|
Рассчитаем С и b:
b===-0,298
С=Yср-b*Xср=1,7605+0,298*1,7370=2,279
Получим линейное уравнение Y^=2,279-0,298*X. Выполнив его потенцирование, получим:
Y^=102,279*x-0,298=189,7*x-0,298
Подставляем в данное уравнение фактические значения x, получаем теоретические значения результата y^x. По ним рассчитаем показатели: тесноты связи - индекс корреляции и среднюю ошибку аппроксимации:
Рxy==
Aср=8,0%
Характеристики степенной модели указывают, что она несколько лучше линейной функции описывает взаимосвязь.
Рассчитаем F-критерий:
F=*(n-2) ==0,8221
1в.Показательная функция
Построению уравнения показательной кривой y=a*bx предшествует процедура линеаризации переменных при логарифмировании обеих частей уравнения:
lgy=lga+x*lgb;
Y=C+B*x, где Y=lgy, С=lga,B=lgb.
Для расчетов используем данные таблицы 4
Таблица 4
|
Y |
x |
Yx |
Y^2 |
x^2 |
Y^x |
y-y^x |
(y-y^x)^2 |
Ai |
|
|
1,8376 |
45,1 |
82,8758 |
3,3768 |
2034,01 |
60,7 |
8,1 |
66,11 |
11,8 |
|
|
1,7868 |
59,0 |
105,4212 |
3,1927 |
3481,00 |
56,3 |
4,9 |
23,53 |
7,9 |
|
|
1,7774 |
57,2 |
101,6673 |
3,1592 |
3271,84 |
56,9 |
3,0 |
9,05 |
5,0 |
|
|
1,7536 |
61,8 |
108,3725 |
3,0751 |
3819,24 |
55,5 |
1,2 |
1,40 |
2,1 |
|
|
1,7404 |
58,8 |
102,3355 |
3,0290 |
3457,44 |
56,4 |
-1,4 |
1,99 |
2,6 |
|
|
1,7348 |
47,2 |
81,8826 |
3,0095 |
2227,84 |
60,0 |
-5,7 |
32,44 |
10,5 |
|
|
1,6928 |
55,2 |
93,4426 |
2,8656 |
3047,04 |
57,5 |
-8,2 |
67,22 |
16,6 |
|
итого |
12,3234 |
384,3 |
675,9974 |
21,7078 |
21338,41 |
403,3 |
1,87 |
201,74 |
56,5 |
|
среднее значения |
1,7605 |
54,9 |
96,5711 |
3,1011 |
3048,34 |
|
|
28,68 |
8,1 |
|
сигма |
0,0425 |
5,860 |
|
|
|
|
|
|
|
|
сигма в кв. |
0,0018 |
34,3343 |
|
|
|
|
|
|
|
|
B |
-0,0023 |
|
|
|
|
|
|
|
|
|
С |
1,887 |
|
|
|
|
|
|
|
|
|
Y=1,887-0,0023*x |
|
|
|
|
|
|
|
|
|
|
теснота связи |
|
0,3589 |
|
|
|
|
|
|
|
Значения параметров регрессии A и B составили:
B===-0,0023
С=Yср-b*xср=1,7605+0,0023*54,9=1,887
Получено линейное уравнение:
Y^=1,887-0,0023*x
Произведем потенцирование полученного уравнения и запишем его в обычной форме
Y^=101,887*10-0,0023*x=77,1*0,9947x
Тесноту связи оценим через индекс корреляции:
Pxy===0,3589
Можно сделать вывод о том, что связь умеренная.
Aср=8,0% , что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Показательная функция чуть хуже, чем степенная, описывает изучаемую зависимость.
Рассчитаем F-критерий:
F=*(n-2) ==0,7392
1г.Равносторонняя гипербола
Уравнение равносторонней гиперболы y=a+b* линеаризуется при замене:
тогда y=a+b*z.
Для расчетов используем данные таблицы 5.
корреляция регрессия модель аппроксимация
Таблица 5
|
y |
x |
y*x |
y^2 |
x^2 |
y^x |
y-y^x |
(y-y^x)^2 |
Ai |
|
|
68,80 |
0,0222 |
1,52736 |
4733,44 |
0,000493 |
61,81 |
7,0 |
48,82 |
10,15605 |
|
|
61,20 |
0,0169 |
1,03428 |
3745,44 |
0,000286 |
56,32 |
4,9 |
23,81 |
7,973302 |
|
|
59,90 |
0,0175 |
1,04825 |
3588,01 |
0,000306 |
56,88 |
3,0 |
9,11 |
5,039868 |
|
|
56,70 |
0,0162 |
0,91854 |
3214,89 |
0,000262 |
55,51 |
1,2 |
1,41 |
2,093571 |
|
|
55,00 |
0,017 |
0,935 |
3025,00 |
0,000289 |
56,38 |
-1,4 |
1,91 |
2,510823 |
|
|
54,30 |
0,0212 |
1,15116 |
2948,49 |
0,000449 |
60,78 |
-6,5 |
41,93 |
11,92527 |
|
|
49,30 |
0,0181 |
0,89233 |
2430,49 |
0,000328 |
57,55 |
-8,2 |
68,01 |
16,7284 |
|
Итого |
405,20 |
0,1291 |
7,50692 |
23685,76 |
0,002413 |
405,23 |
0,0 |
195,01 |
56,43 |
|
Среднее |
57,9 |
0,0184 |
1,072417 |
3383,68 |
0,000345 |
|
|
27,84 |
8,06 |
|
cигма |
5,74 |
0,002145 |
|
|
|
|
|
|
|
|
сигма в кв. |
32,924 |
0,000005 |
|
|
|
|
|
|
|
|
а |
38,5 |
|
|
|
|
|
|
|
|
|
b |
1051,4 |
|
|
|
|
|
|
|
|
|
индекс корреляции |
|
0,3944 |
|
|
|
|
|
|
|
Значения параметров а и b составили:
a=yср-b*zср=57,89-1051,4*0,0184=38,5
b===1051,4
Получено уравнение:
Y^=38,5+1051,4*1/x
Индекс корреляции:
Pxy===0,3944
Aср=8,1%. По уравнению равносторонней гиперболы получена наибольшая оценка тесноты связи:
Pxy=0,3944 (По сравнению с линейной, степенной и показательной регрессиями).
Aср остается на допустимом уровне.
Рассчитаем F-критерий:
F=*(n-2) ==0,92
Следовательно принимается гипотеза Н0 о статистически незначимых параметрах этого уравнения. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.
Построим график рассчитанных уравнений (рис. 1):
Рис. 1
Задача 2
Округ |
y |
x |
lg Y |
lg X |
1/Y |
1/X |
y=a+b*x |
y=a*x^b |
y=a*b^x |
|
Брянская обл. |
1674 |
1322 |
3,224 |
3,121 |
0,0006 |
0,00076 |
1716,5 |
1710,3 |
1716,8 |
|
Владимирская обл. |
1782 |
1409 |
3,251 |
3,149 |
0,0006 |
0,00071 |
1732,7 |
1730,6 |
1732,4 |
|
Ивановская обл. |
1758 |
1594 |
3,245 |
3,202 |
0,0006 |
0,00063 |
1767,1 |
1770,4 |
1766 |
|
Калужская обл. |
1763 |
1567 |
3,246 |
3,195 |
0,0006 |
0,00064 |
1762 |
1764,8 |
1761 |
|
Костромская обл. |
1721 |
1506 |
3,236 |
3,178 |
0,0006 |
0,00066 |
1750,7 |
1752 |
1749,9 |
|
г.Москва |
1874 |
2283 |
3,273 |
3,359 |
0,0005 |
0,00044 |
1895,1 |
1891,8 |
1896,9 |
|
Московская обл. |
1864 |
1712 |
3,27 |
3,234 |
0,0005 |
0,00058 |
1789 |
1793,9 |
1787,7 |
|
Орловская обл. |
1725 |
1302 |
3,237 |
3,115 |
0,0006 |
0,00077 |
1712,8 |
1705,5 |
1713,2 |
|
Рязанская обл. |
1686 |
1482 |
3,227 |
3,171 |
0,0006 |
0,00067 |
1746,3 |
1746,8 |
1745,5 |
|
Смоленская обл. |
1703 |
1443 |
3,231 |
3,159 |
0,0006 |
0,00069 |
1739 |
1738,2 |
1738,5 |
|
Тверская обл. |
1761 |
1583 |
3,246 |
3,199 |
0,0006 |
0,00063 |
1765 |
1768,2 |
1763,9 |
|
Тульская обл. |
1750 |
1404 |
3,243 |
3,147 |
0,0006 |
0,00071 |
1731,8 |
1729,4 |
1731,5 |
|
Ярославская обл. |
1796 |
1497 |
3,254 |
3,175 |
0,0006 |
0,00067 |
1749 |
1750 |
1748,3 |
|
итого |
22857 |
20104 |
42,18 |
41,4 |
0,0074 |
0,00857 |
22857 |
22852 |
22852 |
|
среднее |
1758 |
1546 |
3,245 |
3,185 |
0,0006 |
0,00066 |
1758,2 |
1757,8 |
1757,8 |
|
у |
6091 |
5357 |
||||||||
Rxy |
0,163 |
|||||||||
линейная |
y=a+b*x |
|||||||||
0,185815128 |
1470,875 |
|||||||||
0,048123123 |
75,30361 |
|||||||||
0,575440488 |
41,45821 |
|||||||||
14,90920632 |
11 |
|||||||||
25625,69285 |
18906,61 |
|||||||||
cтепенная |
lgy=lga+b*lgx |
|||||||||
b |
c |
|||||||||
0,184540231 |
2,657087 |
|||||||||
0,04688944 |
0,149366 |
|||||||||
0,584738116 |
0,010037 |
|||||||||
15,48930811 |
11 |
|||||||||
0,00156051 |
0,001108 |
|||||||||
экспоненциальная |
lgy=lga+x*lgb |
|||||||||
1,000103849 |
1496,562 |
|||||||||
2,74373E-05 |
0,042934 |
|||||||||
0,565636636 |
0,023637 |
|||||||||
14,3244194 |
11 |
|||||||||
0,008003389 |
0,006146 |
|||||||||
полулогарифмическая |
y=a+b*lgx |
|||||||||
759,541489 |
-660,87 |
|||||||||
189,4796712 |
603,5878 |
|||||||||
0,593624929 |
40,56064 |
|||||||||
16,06858958 |
11 |
|||||||||
26435,48801 |
18096,82 |
|||||||||
обратная |
1/y=a+b*x |
|||||||||
-5,80818E-08 |
0,000659 |
|||||||||
1,56619E-08 |
2,45E-05 |
|||||||||
0,555604695 |
1,35E-05 |
|||||||||
13,75273678 |
11 |
|||||||||
2,50376E-09 |
2E-09 |
|||||||||
гиперболическая |
y=a+b*1/x |
|||||||||
-560468,1648 |
2127,518 |
|||||||||
138253,3524 |
91,77676 |
|||||||||
0,599041713 |
40,28941 |
|||||||||
16,43427525 |
11 |
|||||||||
26676,7099 |
17855,6 |
Рассчитаем индекс корреляции:
для степенной |
0,999999988 |
|
для экспоненциальной |
0,999999931 |
|
для полулогарифмической |
0,77047059 |
|
для обратной |
1 |
|
для гиперболической |
0,773977851 |
Рассчитаем линейный коэф. корреляции:
Rxy= b*=-0,185815128*=0,163
Построим график рассчитанных уравнений:
Рис. 2
Размещено на Allbest.ru
Подобные документы
Оценка моделей, описывающих зависимость между среднедневной заработной платой работающего и долей расходов на покупку продовольственных товаров через среднюю ошибку аппроксимации и F-критерий Фишера. Прогноз заработной платы и оценка его точности.
контрольная работа [1,6 M], добавлен 19.05.2011Расчёт параметров линейного уравнения регрессии. Оценка регрессионного уравнения через среднюю ошибку аппроксимации, F-критерий Фишера, t-критерий Стьюдента. Анализ корреляционной матрицы. Расчёт коэффициентов множественной детерминации и корреляции.
контрольная работа [241,8 K], добавлен 29.08.2013Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.
лабораторная работа [67,8 K], добавлен 26.12.2010Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [3,6 M], добавлен 29.05.2010Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.
контрольная работа [179,4 K], добавлен 25.03.2014Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.
лабораторная работа [100,5 K], добавлен 02.06.2014Измерения в эконометрике. Парная регрессия и корреляция эконометрических исследований. Оценка существования параметров линейной регрессии и корреляции. Стандартная ошибка прогноза. Коэффициенты эластичности для различных математических функций.
курс лекций [474,5 K], добавлен 18.04.2011Поля корреляции, характеризующие зависимость ВРП на душу населения от размера инвестиций в основной капитал. Оценка параметров уравнения парной линейной регрессии. Коэффициент множественной корреляции. Способы оценки параметров структурной модели.
контрольная работа [215,1 K], добавлен 22.11.2010Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Построение доверительного интервала для коэффициента регрессии в заданной модели. Оценка качества модели по анализу ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности спроса в зависимости от цены. Уравнение авторегрессии.
контрольная работа [156,8 K], добавлен 28.02.2011