Расчет F-статистики для коэффициента детерминации. Оценка коэффициентов линейной регрессии
Оценка статистической значимости параметров регрессии. Прогнозирование чистого дохода и расчет доверительного интервала для коэффициентов регрессии и математического ожидания. Вычисление коэффициента детерминации, анализ наличия автокорреляции остатков.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 20.05.2012 |
Размер файла | 100,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru/
Задача 1
Имеется информация о деятельности 10 компаний. X - оборот капитала (млрд. руб.), Y - чистый доход (млрд. руб.):
№ п/п |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
X |
31,3 |
13,4 |
4,5 |
10,0 |
20,0 |
15,0 |
60,1 |
17,9 |
40,2 |
2,0 |
|
Y |
2,2 |
1,7 |
0,7 |
1,7 |
2,2 |
1,3 |
4,1 |
1,6 |
2,5 |
0,5 |
1. Оцените коэффициенты линейной регрессии Y = 0 + 1X + по методу наименьших квадратов.
2. Проверьте статистическую значимость оценок b0, b1, теоретических коэффициентов 0, 1 при уровне значимости = 0,05.
3. Рассчитайте 95%-ные доверительные интервалы для теоретических коэффициентов регрессии.
4. Спрогнозируйте чистый доход при обороте капитала X = 50,0 и рассчитайте 95% доверительный интервал для условного математического ожидания M(YX = 50,0).
5. Рассчитайте границы интервала, в котором будет сосредоточено не менее 95% возможных значений чистого дохода при обороте капитала X = 50,0.
6. Оцените, на сколько изменится чистый доход, если оборот капитала вырастет на 3 млрд. руб.
7. Рассчитайте F-статистику для коэффициента детерминации и оцените его статистическую значимость.
Решение.
1. Уравнение регрессии будем искать в виде линейного уравнения:
.
Параметры найдем из системы нормальных уравнений:
,
,
Необходимые расчеты выполним в таблице 1.
Таблица 1
№ п/п |
|||||||||
1 2 3 4 5 6 7 8 9 10 |
2,2 1,7 0,7 1,7 2,2 1,3 4,1 1,6 2,5 0,5 |
31,3 13,4 4,5 10,0 20,0 15,0 60,1 17,9 40,2 2,0 |
68,86 22,78 3,15 17,0 44,0 19,5 246,41 28,64 100,5 1,0 |
979,69 179,56 20,25 100,00 400,00 225,00 3612,01 320,41 1616,04 4,00 |
4,84 2,89 0,49 2,89 4,84 1,69 16,81 2,56 6,25 0,25 |
2,38 1,42 0,94 1,23 1,77 1,50 3,94 1,66 2,86 0,80 |
0,0324 0,0784 0,0576 0,2209 0,1849 0,0400 0,0256 0,0036 0,1296 0,0900 |
97,22 64,64 286,96 130,87 2,07 41,47 1494,60 12,53 351,94 377,91 |
|
18,5 |
214,4 |
551,84 |
7456,96 |
43,51 |
18,5 |
0,863 |
2860,21 |
||
Сред. знач. |
1,85 |
21,44 |
55,184 |
745,696 |
4,351 |
286,021 |
;
.
.
Из полученного уравнения регрессии следует, что при увеличении оборота капитала X на 1 млрд. руб. чистый доход Y увеличивается на 0,054 млрд. руб.
2. Оценку статистической значимости параметров регрессии проведем с помощью t-статистики Стьюдента. Выдвигаем гипотезу Н0 о статистически незначимом отличии показателей от нуля: b0 = b1 = 0.
tтабл для числа степеней свободы df = n - 2 = 10 - 2 = 8 и = 0,05 составит:
tтабл = 2,306.
Определим случайные ошибки:
,
;
.
.
.
;
.
Так как tтабл и tтабл, то гипотеза Н0 отклоняется, то есть параметры b0 и b1 не случайно отклоняются от нуля, а статистически значимы.
3. Рассчитаем доверительный интервал для b0 и b1. Для этого определим предельную ошибку для каждого показателя:
;
.
статистический регрессия детерминация автокорреляция
Доверительные интервалы:
;
;
.
;
;
.
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p = 1 - = 0,95 параметры b0 и b1, находясь в указанных границах, не принимают нулевых значений, то есть являются статистически значимыми.
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза.
Если оборот капитала составит X = 50 млрд. руб., то чистый доход будет:
млрд. руб.
Для построения доверительного интервала для М(YX=50) необходимо найти дисперсию его оценки, то есть .
Выборочная остаточная дисперсия:
;
;
млрд. руб.
Из приложения находим .
;
;
;
Итак, чистый доход при обороте капитала X = 50 млрд. руб. с надежностью 0,95 находится в пределах от 2,92 до 3,86 млрд. руб.
5. Чтобы построить доверительный интервал для индивидуального значения , необходимо найти дисперсию его оценки по формуле:
;
млрд. руб.
;
;
.
Таким образом, возможные значения чистого дохода Y при обороте капитала X = 50 млрд. руб. с надежностью 0,95 находятся в пределах от 2,5 до 4,28 млрд. руб.
6. (млрд. руб.) - средний оборот капитала по 10 компаниям.
(млрд. руб.) - чистый доход компании при среднем обороте капитала X = 21,44 млрд. руб.
(млрд. руб.);
(млрд. руб.);
.
Следовательно, если оборот капитала вырастет на 3 млрд. руб., то чистый доход компании увеличится на 0,16 млрд. руб.
7. Вначале вычислим коэффициент корреляции:
.
Выборочные средние квадратические отклонения:
;
.
,
то есть связь между переменными X и Y достаточно тесная и прямая (с ростом оборота капитала чистый доход компании увеличивается).
В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции:
.
Это означает, что вариация зависимой переменной Y - чистого дохода - на 90,6% объясняется вариацией переменной X - оборота капитала.
8. F-тест - оценивание качества уравнения регрессии - состоит в проверке гипотезы H0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполним сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера.
.
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости .
При = 0,05 и числе степеней свободы k = n - 2 = 8:
Fтабл = 5,32.
Так как Fфакт Fтабл, то Н0 - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
Задача 2
Имеется информация за 15 лет относительно среднего дохода X и среднего потребления Y (млн. руб.):
Таблица
Годы |
X |
Y |
|
1986 |
10,5 |
8,8 |
|
1987 |
11,6 |
12,0 |
|
1988 |
12,3 |
13,0 |
|
1989 |
13,7 |
12,6 |
|
1990 |
14,5 |
11,2 |
|
1991 |
16,1 |
11,9 |
|
1992 |
17,3 |
13,5 |
|
1993 |
18,7 |
15,0 |
|
1994 |
20,1 |
18,2 |
|
1995 |
21,8 |
21,2 |
|
1996 |
23,1 |
20,5 |
|
1997 |
24,3 |
19,5 |
|
1998 |
25,5 |
19,1 |
|
1999 |
27,8 |
19,3 |
|
2000 |
30,0 |
24,0 |
1. Оцените коэффициенты линейной регрессии Y = 0 + 1X + по методу наименьших квадратов.
2. Вычислите значение DW статистики Дарбина-Уотсона и проанализируйте наличие автокорреляции остатков.
3. При наличии автокорреляции переоцените уравнение регрессии, используя для этого один цикл метода Кохрейна-Оркатта.
Решение.
1. Уравнение регрессии будем искать в виде линейного уравнения:
.
Параметры найдем по формулам:
; ,
Необходимые расчеты выполним в таблице 2.
Таблица 2
№ п/п |
|||||||
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
8,8 12,0 13,0 12,6 11,2 11,9 13,5 15,0 18,2 21,2 20,5 19,5 19,1 19,3 24,0 |
10,5 11,6 12,3 13,7 14,5 16,1 17,3 18,7 20,1 21,8 23,1 24,3 25,5 27,8 30,0 |
92,4 139,2 159,9 172,62 162,4 191,59 233,55 280,5 365,82 462,16 473,55 473,85 487,05 536,54 720,0 |
110,25 134,56 151,29 187,69 210,25 259,21 299,29 349,69 404,01 475,24 533,61 590,49 650,25 772,84 900,00 |
77,44 144,00 169,00 158,76 125,44 141,61 182,25 225,00 331,24 449,44 420,25 380,25 364,81 372,49 576,00 |
10,1 10,8 11,3 12,3 12,8 13,9 14,7 15,7 16,6 17,8 18,7 19,5 20,3 21,9 23,4 |
|
239,8 |
287,3 |
4951,13 |
6028,67 |
4117,98 |
239,8 |
||
Среднее значение |
15,987 |
19,153 |
330,0753 |
401,911 |
274,532 |
;
.
.
Из полученного уравнения регрессии следует, что при увеличении среднего дохода X на 1 млн. руб. уровень потребления Y увеличивается в среднем на 0,681 млн. руб.
2. Тест Дарбина-Уотсона определяет наличие автокорреляции между соседними членами. Он основан на простой идее: если корреляция ошибок регрессии не равна нулю, то она присутствует и в остатках регрессии , получающихся в результате применения обычного метода наименьших квадратов. В тесте Дарбина-Уотсона для оценки корреляции используется статистика вида:
.
При большом числе наблюдений n используется формула:
.
Расчет сумм, необходимых для вычисления d-статистики приведем в таблице 3.
Таблица 3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
8,8 12,0 13,0 12,6 11,2 11,9 13,5 15,0 18,2 21,2 20,5 19,5 19,1 19,3 24,0 |
10,1 10,8 11,3 12,3 12,8 13,9 14,7 15,7 16,6 17,8 18,7 19,5 20,3 21,9 23,4 |
-1,3 1,2 1,7 0,3 -1,6 -2,0 -1,2 -0,7 1,6 3,4 1,8 0 -1,2 -2,6 0,6 |
- -1,3 1,2 1,7 0,3 -1,6 -2,0 -1,2 -0,7 1,6 3,4 1,8 0 -1,2 -2,6 |
- -1,56 2,04 0,51 -0,48 3,2 2,4 0,84 -1,12 5,44 6,12 0 0 3,12 -1,56 |
1,69 1,44 2,89 0,09 2,56 4,00 1,44 0,49 2,56 11,56 3,24 0 1,44 6,76 0,36 |
|
- |
- |
0 |
-0,6 |
18,95 |
40,52 |
По таблице приложений при n=15 критические значения , то есть фактически найденное значение находится в интервале . Таким образом, для рассматриваемого временного ряда на уровне значимости 0,05 гипотеза Н0 об отсутствии автокорреляции возмущений отвергается, то есть принимается альтернативная гипотеза о положительной автокорреляции.
3. Переоценим уравнение регрессии, используя для этого один цикл метода Кохрейна-Оркатта.
Получим оценочное значение параметра . Для этого применим обычный метод наименьших квадратов к регрессионному уравнению
.
Итак, .
Перейдем от наблюдений и к наблюдениям
,
.
Применим обычный метод наименьших квадратов к уравнению:
.
Необходимые расчеты выполним в таблице 4.
Таблица 4
№ п/п |
||||||
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
7,6 7,0 6,1 4,9 6,3 7,55 8,25 10,7 12,1 9,9 9,25 9,35 9,75 14,35 |
6,35 6,5 7,55 7,65 8,85 9,25 10,05 10,75 11,75 12,2 12,75 13,35 15,05 16,1 |
48,26 45,5 46,055 37,485 55,755 69,8375 82,9125 115,025 142,175 120,78 117,9375 124,8225 146,7375 231,035 |
40,3225 42,25 57,0025 58,5225 78,3225 85,5625 101,0025 115,5625 138,0625 148,84 162,5625 178,2225 226,5025 259,21 |
6,01 6,11 6,80 6,87 7,65 7,92 8,44 8,90 9,56 9,86 10,22 10,61 11,73 12,42 |
|
123,1 |
148,15 |
1384,318 |
1691,9475 |
123,1 |
;
.
.
Получив оценку параметра , образуем новый вектор остатков:
.
Задача 3
Имеются следующие значения переменных X и Y:
X |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Y |
2,6 |
4,6 |
6 |
9,4 |
9 |
12,3 |
15,1 |
14,3 |
17,9 |
23,1 |
Рассчитайте коэффициент корреляции , проверьте гипотезу о наличии (отсутствии) корреляционной связи.
Решение. Коэффициент корреляции вычисляется по формуле:
.
Выборочные средние квадратические отклонения:
; .
Необходимые расчеты выполним в таблице 5.
Таблица 5
№ п/п |
||||||
1 2 3 4 5 6 7 8 9 10 |
2,6 4,6 6 9,4 9 12,3 15,1 14,3 17,9 23,1 |
1 2 3 4 5 6 7 8 9 10 |
2,6 9,2 18 37,6 45 73,8 105,7 114,4 161,1 231 |
1 4 9 16 25 36 49 64 81 100 |
6,76 21,16 36,00 88,36 81,00 151,29 228,01 204,49 320,41 533,61 |
|
114,3 |
55 |
798,4 |
385 |
1671,09 |
||
Среднее значение |
11,43 |
5,5 |
79,84 |
38,5 |
167,109 |
;
.
Коэффициент корреляции значим на уровне (иначе - гипотеза Н0 о равенстве генерального коэффициента корреляции нулю, то есть Н0: , отвергается), если
,
где - табличное значение t-критерия Стьюдента, определенное на уровне значимости при числе степеней свободы .
.
.
Так как , то гипотеза Н0 о равенстве генерального коэффициента корреляции нулю отвергается. Другими словами, коэффициент корреляции значим на уровне , то есть гипотеза о наличии линейной корреляционной связи между переменными X и Y принимается.
Задача 4
Как действует на величину коэффициента корреляции увеличение в n раз всех значений переменных X и Y?
Решение.
Если все значения переменных X и Y увеличить в n раз, то величина коэффициента корреляции не изменится.
Докажем это.
Размещено на Allbest.ru
Подобные документы
Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.
курсовая работа [233,1 K], добавлен 21.03.2015Ковариационная матрица оценок коэффициентов регрессии. Оценка дисперсии ошибок. Сущность теоремы Гаусса-Маркова. Проверка статистических гипотез, доверительные интервалы. Расчет коэффициента детерминации, скорректированного коэффициента детерминации.
контрольная работа [1,4 M], добавлен 28.07.2013Определение коэффициентов линейной регрессии. Проверка гипотезы о присутствии гомоскедастичности, наличии автокорреляции. Оценка статистической значимости эмпирических коэффициентов регрессии и детерминации. Прогнозирование объемов производства консервов.
контрольная работа [440,1 K], добавлен 15.04.2014Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.
лабораторная работа [100,5 K], добавлен 02.06.2014Экономическая интерпретация коэффициента регрессии. Нахождение статочной суммы квадратов и оценка дисперсии остатков. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента. Расчет средней относительной ошибки аппроксимации.
контрольная работа [261,1 K], добавлен 23.03.2010Определение параметров уравнения линейной регрессии. Экономическая интерпретация коэффициента регрессии. Вычисление остатков, расчет остаточной суммы квадратов. Оценка дисперсии остатков и построение графика остатков. Проверка выполнения предпосылок МНК.
контрольная работа [1,4 M], добавлен 25.06.2010Методика определения параметров линейной регрессии, составления экономической интерпретации коэффициентов регрессии. Проверка выполнения предпосылок МНК. Графическое представление физических и модельных значений. Нахождение коэффициентов детерминации.
контрольная работа [218,0 K], добавлен 25.05.2009Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.
лабораторная работа [30,9 K], добавлен 05.12.2010Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012