Построение регрессионных моделей
Анализ графиков исходных данных и корреляционной связи. Парный коэффициент корреляции между всеми парами факторов. Регрессионные модели, значимость параметров уравнений, коэффициенты детерминации. Устранение мультиколлинеарности, регрессионные уравнения.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 30.10.2014 |
Размер файла | 285,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МНИИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
Кафедра теории рынка
Расчетно-графическая работа
по дисциплине «Эконометрика»
Вариант 6
Выполнил
Студент Цыганков А.А
Факультет бизнеса
Группа ВиЗО 101
Преподаватель Щеколдин В.Ю
Новосибирск 2013
Контрольная работа по эконометрике
Робинзон Крузо живет на необитаемом острове. Каждый раз, идя на охоту на уток, Робинзон берет с собой связку бумерангов и флягу с пивом собственного приготовления, поскольку в жарких условиях тропиков ему необходимо утолять жажду. При этом он отмечает, какое количество уток он убил (в штуках, y), какая была средняя температура (в градусах Цельсия, x1) в день охоты и сколько при этом выпил пива(в процентах от объема фляги, x2)
Цель: Построение анализа и моделей регрессии
Исходные данные нанести на координатную плоскость и сделать предварительное заключение о наличии (отсутствии) связи между факторами X1, Х2 и Y
ВАРИАНТ 5 |
||||
X2 |
Y |
X1 |
||
дни |
пиво |
утки |
темп |
|
1 |
43 |
6 |
31 |
|
2 |
0 |
11 |
27 |
|
3 |
31 |
9 |
30 |
|
4 |
4 |
8 |
29 |
|
5 |
78 |
5 |
36 |
|
6 |
45 |
6 |
31 |
|
7 |
41 |
5 |
31 |
|
8 |
20 |
7 |
27 |
|
9 |
70 |
3 |
37 |
|
10 |
33 |
6 |
28 |
|
11 |
96 |
3 |
36 |
|
12 |
38 |
6 |
31 |
|
13 |
94 |
4 |
35 |
|
14 |
73 |
4 |
37 |
|
15 |
41 |
6 |
32 |
|
16 |
69 |
5 |
36 |
|
17 |
38 |
7 |
29 |
|
18 |
24 |
9 |
29 |
|
19 |
89 |
3 |
36 |
|
20 |
70 |
5 |
34 |
|
21 |
84 |
3 |
34 |
|
22 |
20 |
8 |
30 |
|
23 |
65 |
3 |
33 |
|
24 |
62 |
6 |
34 |
|
25 |
48 |
7 |
33 |
X1 - температура в градусах Цельсия Y - количество убитых уток в штуках
X1ср=32,24Yср=5,8
Согласно графическому представлению данных можно предположить, что корреляционная связь существует. Эта связь близка к линейной, прямая (отрицательная). То есть, при увеличении температуры в среднем, количество убитых уток в среднем уменьшается.
корреляция регрессионный уравнение
Х2 - выпито пива в процентах от объёма фляги Y- количество убитых уток в штуках
Х2ср= 51,04 Yср=5,8
Согласно графическому представлению данных можно предположить, что корреляционная связь существует. Эта связь близка к линейной, прямая (отрицательная). То есть, при увеличении потребляемого пива в среднем, число подбитых уток, в среднем, уменьшается.
X1 - температура в градусах Цельсия Х2 - выпито пива в процентах от объёма фляги
X1ср=32,24Х2ср= 51,04
Согласно графическому представлению данных можно предположить, что корреляционная связь существует. Эта связь близка к линейной, прямая (положительная). То есть, при увеличении температуры в среднем, количество потребляемого пива в среднем увеличивается.
Рассчитать парный коэффициент корреляции между всеми парами факторов и проверить их на значимость. Сделать выводы о тесноте связи между факторами.
, где.
, это означает, что зависимость между Х1и X2 - прямая, близка к линейной.
Используя t-критерий Стьюдента, проверим значимость полученного коэффициента корреляции.
Для этого проверим выполнение гипотезы:
H0: сxy= 0,
H1: сxy? 0.
t = =9,95
tкр= 2,069 (при б = 0,05-вероятность ошибки) и N-2=23 (степенях свободы) - из таблицы распределения Стъюдента.
По t-критерию Стьюдента, так как ,то гипотеза H0 отвергается, значит полученный нами коэффициент корреляции значимый, т.е. с вероятностью 1- б =0,95 можно утверждать о наличии линейной связи между потребляемым пивом Х2 и увеличением температуры в общем Х1.
, где.
, это означает, что зависимость между Х1и Y - прямая, близка к линейной.
Используя t-критерий Стьюдента, проверим значимость полученного коэффициента корреляции.
Для этого проверим выполнение гипотезы:
H0: сxy= 0,
H1: сxy? 0.
t = = -6,21
tкр= 2,069 (при б = 0,05-вероятность ошибки) и N-2=23 (степенях свободы) - из таблицы распределения Стъюдента.
По t-критерию Стьюдента, так как ,то гипотеза H0 отвергается, значит полученный нами коэффициент корреляции значимый, т.е. с вероятностью 1- б =0,95 можно утверждать о наличии линейной связи между убитыми утками Y и уменьшением температуры в общем Х1.
, где.
, это означает, что зависимость между Х2и Y - прямая, близка к линейной.
Используя t-критерий Стьюдента, проверим значимость полученного коэффициента корреляции.
Для этого проверим выполнение гипотезы:
H0: сxy= 0,
H1: сxy? 0.
t = = -8,82
tкр= 2,069 (при б = 0,05-вероятность ошибки) и N-2=23 (степенях свободы) - из таблицы распределения Стъюдента.
По t-критерию Стьюдента, так как ,то гипотеза H0 отвергается, значит полученный нами коэффициент корреляции значимый, т.е. с вероятностью 1- б =0,95 можно утверждать о наличии линейной связи между потребляемого пива Х2 и уменьшением количества убитых уток Y.
Построить три регрессионных модели.
y=и01+и11x1+е ; y=и02+и12x2+е; y=и0+и1x1+и2x2+е;
1. Найдем оценки неизвестных параметров для: y= и01+и11x1+е
В результате:
= -05,3542
23,06186
Следовательно:
Т.к. параметр >0, положительный знак параметра означает, что относительное количество убитых уток увеличивается при относительном уменьшении температуры. Параметр и01 не несет никакого экономического содержания.
Величина параметра показывает среднее изменение количества убитых уток изменением регрессора на единицу. Т.к. - отрицательное значение говорит о том, что с увеличением регрессора x1 отклик уменьшается. При увеличении температуры на 1,8 градус количество убитых уток уменьшится в среднем на 1 штуку.
2. Найдем оценки неизвестных параметров для:
y = и02+и12x2+е
В результате:
= -0,06903
9,3233
y = 9,3233 -0,069032+ е
Т.к. параметр >0, положительный знак параметра означает, что относительное количество убитых уток увеличится при уменьшении выпитого пива.
Т.к. - отрицательно значение говорит о том, что с увеличением регрессора х2 отклик уменьшается. При увеличении, в среднем, выпитого пива на 14% количество убитых уток уменьшится на 1.
3. Найдем оценки неизвестных параметров для:y = и0+и1x1+и2x2+е
Для удобства вычислений введем матричные обозначения:
- вектор значений отклика;
- вектор неизвестных параметров модели;
- вектор случайных ошибок.
,
Вектор оценок неизвестных параметров может быть найден следующим образом: .
Уравнение множественной регрессии имеет следующий вид:
y = 8,1104 + 0,032219х1 -0,073852+ е
. Так как .
Проверит значимость параметров уравнений по критерию Стьюдента. Сформулировать выводы
SQ1^= |
0,587803409 |
t1= |
14,27839952 |
гипотеза отвергается |
|
SQ2^= |
0,007961651 |
t2= |
-0,4027568 |
гипотеза не отвергается |
|
S^2= |
0,043478261 |
Вычислить коэффициенты детерминации, проверить регрессионные уравнения на значимость по критерию Фишера. Уравнение множественной регрессии проанализировать на предмет наличия мультиколлинеарности. Сделать выводы, выбрать наилучшее уравнение регрессии.
Для y=и01+и11x1+е =
Разложим полную сумму квадратов отклонений значений отклика от его среднего на две части: объясненную и остаточную.
TSS = RSS + ESS, где
- полная сумма квадратов,
- объясненная сумма квадратов,
- остаточная сумма квадратов.
После необходимых расчетов получены следующие результаты:
TSS=ESS+RSS
130,24=41,03824+79,20176
Чтобы дать более полную оценку полученному результату, найдем коэффициент детерминации, показывающий долю объясненной дисперсии в общей дисперсии зависимой переменной.
Полученное значение коэффициента детерминации говорит о том, что уравнение регрессии объясняет 65,9% вариации результативного признака. Однако по одному значению коэффициента нельзя точно утверждать, что такое значение означает достаточную пригодность уравнения регрессии, поэтому проверим его на значимость по критерию Фишера на 5%-ном уровне значимости.
Вычислим F-статистику по формуле:
= 44,39
, Fкр= (б ,1, N-2)
Поскольку статистика превышает критическое значение, то гипотеза отвергается, что говорит о значимости регрессионного уравнения.
Таким образом, проведенный анализ свидетельствует об адекватности составленной модели и возможности ее дальнейшего использования.
После необходимых расчетов получены следующие результаты:
Поскольку остаточная сумма квадратов значительно меньше объясненной, то линия регрессии достаточно хорошо аппроксимирует исходные данные, уравнение регрессии следует рекомендовать для дальнейшего использования.
Чтобы дать более полную оценку полученному результату, найдем коэффициент детерминации, показывающий долю объясненной дисперсии в общей дисперсии зависимой переменной.
Полученное значение коэффициента детерминации говорит о том, что уравнение регрессии объясняет 79,1% вариации результативного признака. Однако по одному значению коэффициента нельзя точно утверждать, что такое значение означает достаточную пригодность уравнения регрессии, поэтому проверим его на значимость по критерию Фишера на 5%-ном уровне значимости.
Вычислим F-статистику по формуле:
= 87,160
, Fкр= (б ,1, N-2)
Поскольку статистика превышает критическое значение, то гипотеза отвергается, что говорит о значимости регрессионного уравнения.
Таким образом, проведенный анализ свидетельствует об адекватности составленной модели и возможности ее дальнейшего использования.
Для y=и0+и1x1+и2x2+е = y = 8,1104 + 0,032219х1 -0,073852+ е
Коэффициент детерминации, показывающий долю объясненной дисперсии в общей дисперсии зависимой переменной, находится по формуле:
R2=1 - -
Разложим полную сумму квадратов отклонений значений отклика от его среднего на две части: объясненную и остаточную.
TSS = RSS + ESS.
= - полная сумма квадратов,
= YTY-2ИTXTY+ИTXTXИ - остаточная сумма квадратов.
Полученное значение коэффициента детерминации говорит о том, что уравнение регрессии объясняет 74,6% вариации результативного признака. В данном случае нельзя точно утверждать, что такое значение коэффициента детерминации означает достаточную пригодность уравнения регрессии, поэтому проверим его на значимость по критерию Фишера на 5%-ном уровне значимости.
Вычислим F-статистику по формуле:
F=32,38
Найдем критическое значение из таблицы распределения Фишера.
Статистика превышает критическое значение, значит, гипотеза отвергается, что говорит о значимости регрессионного уравнения. Таким образом, проведенный анализ свидетельствует об адекватности составленной модели и возможности ее дальнейшего использования.
По результатам проведенного анализа мы получили, что рассматриваемое уравнение
y = 8,1104 + 0,032219х1 -0,073852+ е
является сильно значимым (R2=74,6%), но не все оценки параметровданного уравненияявляются значимыми, что является одним из характерных признаков мультиколлениарности, то в данном случае можно предположить,что в данном уравнении присутствуетмультиколлениарность.
При наличии мультиколлениарности дать рекомендации по способам ее устранения.
Рассмотрим уравнение
y = 8,1104 + 0,032219х1 -0,073852+ е
Выявим тот фактор, который в большей степени оказывает влияние на общее время уборки камней с участка (отклик).
Построим матрицу межфакторных корреляций.
Для этого найдем парные коэффициенты корреляции: , , .
Парный коэффициент корреляции вычисляется по следующей формуле:
,
где; ; ; ;
.
Итак, матрица межфакторных корреляций будет иметь вид:
у |
х1 |
х2 |
||
у |
1 |
0,791786 |
0,87851 |
|
х1 |
0,791786 |
1 |
0,99493 |
|
х2 |
0,87851 |
0,90078 |
1 |
|R|=0,02372
По величине определителя матрицы межфакторных корреляций можно судить о степени мультиколлинеарности. Чем ближе к 1, тем слабее мультиколлинерность. Степень близости к 1 можно проверить помощью критерия .
H0:=1
Считаем статистику:
m=3, N=25
S>, H0с вероятностью 0,95 отвергается, что свидетельствует о наличии мультиколлинеарности в этом уравнении.
Избавимся от мультиколлинеарности.
Сравним
=0,791786
= 0,87851
Таким образом, так как ||>||, следовательно, из модели следует исключить фактор х1, так как он в меньшей степени (по сравнению с фактором х2) связан с откликом. Значит его исключение из рассматриваемой регрессионной модели приведет к ослаблению эффекта мультиколлениарности.
Выберем наилучшее регрессионное уравнение.
Для этого проанализируем коэффициенты детерминации, показывающие долю объясненной дисперсии в общей дисперсии зависимой переменой.
Наибольший коэффициент детерминации мы можем наблюдать в уравнении 2, коэффициент детерминации близок к единице. Кроме того само уравнение, и оценки его неизвестных параметров являются значимыми. Следовательно, это уравнение является наилучшим для дальнейшего анализа.
С помощью метода построения модели в стандартизованных переменных проранжировать факторы по степени влияния на отклик, сделать выводы.
(y-yсре)/СКО |
(x1-x1сре)/СКО |
(x2-x2сре)/СКО |
|
0 |
-0,251142318 |
-0,17984987 |
|
2,626424642 |
-1,506853907 |
-1,875802595 |
|
1,575854785 |
-0,565070215 |
-0,653139003 |
|
1,050569857 |
-0,878998112 |
-1,71803955 |
|
-0,525284928 |
1,318497168 |
1,200576766 |
|
0 |
-0,251142318 |
-0,100968348 |
|
-0,525284928 |
-0,251142318 |
-0,258731392 |
|
0,525284928 |
-1,506853907 |
-1,086987374 |
|
-1,575854785 |
1,632425065 |
0,885050677 |
|
0 |
-1,192926009 |
-0,574257481 |
|
-1,575854785 |
1,318497168 |
1,910510464 |
|
0 |
-0,251142318 |
-0,377053675 |
|
-1,050569857 |
1,004569271 |
1,831628942 |
|
-1,050569857 |
1,632425065 |
1,003372961 |
|
0 |
0,062785579 |
-0,258731392 |
|
-0,525284928 |
1,318497168 |
0,845609916 |
|
0,525284928 |
-0,878998112 |
-0,377053675 |
|
1,575854785 |
-0,878998112 |
-0,92922433 |
|
-1,575854785 |
1,318497168 |
1,634425137 |
|
-0,525284928 |
0,690641374 |
0,885050677 |
|
-1,575854785 |
0,690641374 |
1,437221332 |
|
1,050569857 |
-0,565070215 |
-1,086987374 |
|
-1,575854785 |
0,376713477 |
0,687846872 |
|
0 |
0,690641374 |
0,569524589 |
|
0,525284928 |
0,376713477 |
0,017353935 |
Q = 0,0001 На -0,0001 один фактор больше, чем другой
Изобразить в одной системе координат исходные данные, наилучшую линию регрессии, 95% доверительный интервал для значений отклика, проанализировать полученный график.
где - критическое значение, найденное по таблицам квантилей распределения Стъюдента.
Для оценки точности прогноза необходимо вычислить стандартную ошибку прогноза
2,069
Данные расчетов представим в виде следующей таблицы
Ymin |
Ymax |
|
6,305995165 |
6,480990892 |
|
9,801574605 |
10,151839 |
|
7,287996379 |
7,490565454 |
|
9,420783733 |
9,748980554 |
|
3,284019927 |
3,544465049 |
|
6,14685974 |
6,320176093 |
|
6,46467474 |
6,642261541 |
|
8,253495114 |
8,500416248 |
|
3,905895699 |
4,130515739 |
|
7,203101754 |
7,39925872 |
|
1,796874683 |
2,152058277 |
|
6,701883569 |
6,884978048 |
|
1,998361014 |
2,342396603 |
|
3,659547475 |
3,896938628 |
|
6,428737523 |
6,606324324 |
|
4,023844869 |
4,244416114 |
|
6,773758001 |
6,95685248 |
|
7,870489753 |
8,099772295 |
|
2,376019847 |
2,979 |
|
4,013707348 |
2,979 |
|
2,861006091 |
3,136 |
|
8,145683465 |
3,136 |
|
4,459102197 |
3,212 |
|
-0,09789612 |
3,212 |
|
-0,08628050 |
3,392 |
Сделать общие выводы по результатам проделанной работы
Вычислив оценки неизвестных параметров по методу наименьших квадратов мы получили следующие результаты:
Для уравнения
Т.к. параметр >0, положительный знак параметра означает, что относительное количество убитых уток увеличивается при относительном уменьшении температуры. Параметр и01 не несет никакого экономического содержания.
Величина параметра показывает среднее изменение количества убитых уток изменением регрессора на единицу. Т.к. - отрицательное значение говорит о том, что с увеличением регрессора x1 отклик уменьшается. При увеличении температуры на 1,8 градус количество убитых уток уменьшится в среднем на 1 штуку.
Для уравнения
y = 9,3233 -0,069032+ е
Т.к. параметр >0, положительный знак параметра означает, что относительное количество убитых уток увеличится при уменьшении выпитого пива.
Т.к. - отрицательно значение говорит о том, что с увеличением регрессора х2 отклик уменьшается. При увеличении, в среднем, выпитого пива на 14% количество убитых уток уменьшится на 1.
Для уравнения
y = 8,1104 + 0,032219х1 -0,073852+ е
. Так как .
Если в среднем он выпит 8л пива и при увеличении в среднем температуры на 1 градус, он будет убивать в среднем на 1 утку меньше.
Мы вычисляли коэффициенты детерминации, проверяли регрессионные уравнения на значимость по критерию Фишера.Также мы проанализировали уравнение множественной регрессии на предмет наличия мультиколлинеарности.
1)
Гипотеза отвергается, что говорит о значимости регрессионного уравнения. Таким образом, проведенный анализ свидетельствует об адекватности составленной модели и возможности ее дальнейшего использования.
2) y = 9,3233 -0,069032+ е
Гипотеза отвергается, что говорит о значимости регрессионного уравнения. Таким образом, проведенный анализ свидетельствует об адекватности составленной модели и возможности ее дальнейшего использования.
3)y = 8,1104 + 0,032219х1 -0,073852+ е
Гипотеза не отвергается, что говорит о незначимости регрессионного уравнения. По результатам проведенного анализа мы получили, что рассматриваемое уравнение является незначимым (R2=74,6%), что является одним из характерных признаков мультиколлениарности, в данном случае можно предположить, что в данном уравнении присутствует мультиколлениарность.
- Для устранения мультиколлинеарности рекомендуется из модели следует исключить фактор х1, так как он в меньшей степени (по сравнению с фактором х2) связан с откликом. Значит его исключение из рассматриваемой регрессионной модели приведет к ослаблению эффекта мультиколлениарности.
В результате наилучшим уравнением признаем второе уравнение:
y = 9,3233 -0,069032+ е
Исходя из графика, построенного для данного уравнения, который отображает исходные данные, линию регрессионного уравнения и 95%-ный доверительный интервал для данного уравнения, построенного на всем диапазоне исходных данных, можно сделать вывод о том, что построенная нами модель зависимости убитых уток от выпитого пива достаточно точно описывает исходные данные.
Размещено на Аllbest.ru
Подобные документы
Оценить влияние определенных факторов на изучаемый показатель и друг на друга с помощью коэффициентов линейной корреляции. Среднее квадратическое отклонение фактора. Коэффициент линейной корреляции. Линейные регрессионные модели изучаемого показателя.
контрольная работа [381,3 K], добавлен 21.04.2010Построение уравнения регрессии. Эластичность степенной модели. Уравнение равносторонней гиперболы. Оценка тесноты связи, качества и точности модели. Индекс корреляции и коэффициент детерминации. Оценка статистической значимости регрессионных уравнений.
курсовая работа [1,3 M], добавлен 25.03.2015Построение эконометрической модели. Описания, анализ и прогнозирование явлений и процессов в экономике. Использование регрессионных моделей. Построение корреляционной матрицы. Коэффициент множественной детерминации. Значение статистики Дарбина-Уотсона.
курсовая работа [61,0 K], добавлен 10.03.2013Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.
контрольная работа [681,9 K], добавлен 03.08.2010Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.
контрольная работа [155,8 K], добавлен 11.12.2010Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.
контрольная работа [173,8 K], добавлен 22.11.2010Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.
курсовая работа [1,1 M], добавлен 07.08.2011Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.
контрольная работа [136,3 K], добавлен 25.09.2014Построение эконометрической модели спроса в виде уравнений парной и множественной регрессии. Отбор факторов для построения функции потребления. Расчет коэффициентов корреляции и детерминации, проверка правильности выбранных факторов и формы связи.
контрольная работа [523,7 K], добавлен 18.08.2010Построение модели парной регрессии и расчет индекса парной корреляции. Построение производственной функции Кобба-Дугласа, коэффициент детерминации . Зависимость среднедушевого потребления от размера дохода и цен. Расчет параметров структурной модели.
контрольная работа [1,6 M], добавлен 05.01.2012