Экономическая статистика
Оценка коэффициентов линейной регрессии по методу наименьших квадратов. Расчет доверительных интервалов для теоретических коэффициентов регрессии. Оценка параметров модели с распределенным лагом. Определения коэффициентов, входящих в уравнения регрессии.
Рубрика | Экономика и экономическая теория |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 20.05.2012 |
Размер файла | 200,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Задача 1
Имеется информация по 10 предприятиям оптовой торговли об объеме реализации Y относительно размера торговой площади X:
№ п/п |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
X |
700 |
750 |
800 |
830 |
850 |
900 |
920 |
950 |
980 |
890 |
|
Y |
6350 |
7800 |
7600 |
8600 |
8600 |
9200 |
9000 |
9100 |
9950 |
9000 |
1. Оцените коэффициенты линейной регрессии по методу наименьших квадратов.
2. Проверьте статистическую значимость оценок теоретических коэффициентов при уровне значимости 0,05.
3. Рассчитайте 95%-е доверительные интервалы для теоретических коэффициентов регрессии.
4. Спрогнозируйте объем реализации при размере торговой площади X=1000 и рассчитайте 95% доверительный интервал для условного математического ожидания .
5. Рассчитайте границы интервала, в котором будет сосредоточено не менее 95% возможных объемов реализации при торговой площади X=1000.
6. Оцените на сколько единиц изменится объем реализации, если площадь вырастет на 100.
7. Рассчитайте коэффициент детерминации .
8. Рассчитайте F-статистику для коэффициента детерминации и оцените его статистическую значимость.
Решение
1. Оценим коэффициенты линейной регрессии по методу наименьших квадратов.
Уравнение регрессии имеет вид:
.
Параметры найдем из системы нормальных уравнений:
,
,
Необходимые расчеты выполним в таблице 1.
Таблица 1
Предприятие |
||||||||
1 |
700 |
6350 |
490000 |
40322500 |
4445000 |
6806,99 |
208840 |
|
2 |
750 |
7800 |
562500 |
60840000 |
5850000 |
7352,53 |
200225 |
|
3 |
800 |
7600 |
640000 |
57760000 |
6080000 |
7898,08 |
88851,3 |
|
4 |
830 |
8600 |
688900 |
73960000 |
7138000 |
8225,41 |
140321 |
|
5 |
850 |
8600 |
722500 |
73960000 |
7310000 |
8443,62 |
24453,5 |
|
6 |
900 |
9200 |
810000 |
84640000 |
8280000 |
8989,17 |
44450 |
|
7 |
920 |
9000 |
846400 |
81000000 |
8280000 |
9207,39 |
43008,9 |
|
8 |
950 |
9100 |
902500 |
82810000 |
8645000 |
9534,71 |
188975 |
|
9 |
980 |
9950 |
960400 |
99002500 |
9751000 |
9862,04 |
7737,09 |
|
10 |
890 |
9000 |
792100 |
81000000 |
8010000 |
8880,06 |
14385,8 |
|
сумма |
8570 |
85200 |
7415300 |
735295000 |
73789000 |
85200 |
961248 |
|
среднее |
857 |
8520 |
741530 |
73529500 |
7378900 |
х |
х |
;
.
Тогда уравнение регрессии имеет вид:
.
Из полученного уравнения регрессии следует, что при увеличении торговой площади X на 1 кв.м. объем реализации Y увеличивается на 10,91 у.е.
2. Проверим статистическую значимость оценок теоретических коэффициентов при уровне значимости 0,05
Оценку статистической значимости параметров регрессии проведем с помощью t-статистики Стьюдента. Выдвигаем гипотезу Н0 о статистически незначимом отличии показателей от нуля: b0 = b1 = 0.
tтабл для числа степеней свободы df = n - 2 = 10 - 2 = 8 и = 0,05 составит:
tтабл = 2,306.
Определим случайные ошибки:
,
;
.
.
.
;
.
Так как tтабл, то гипотеза Н0 отклоняется, то есть параметр b1 не случайно отклоняются от нуля, а статистически значим. Так как < tтабл параметр b0 статистически незначим.
3. Рассчитаем 95%-е доверительные интервалы для теоретических коэффициентов регрессии.
Для этого определим предельную ошибку для каждого показателя:
;
.
Доверительные интервалы:
;
;
.
;
;
.
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p = 1 - = 0,95 параметр b1, находясь в указанных границах, не принимает нулевых значений, то есть является статистически значимым, параметр b0 принимает нулевые значения, то есть является статистически незначимым.
4. Спрогнозируем объем реализации при размере торговой площади X=1000.
Полученные оценки уравнения регрессии позволяют использовать его для прогноза.
При размере торговой площади X=1000 объем реализации составит:
у.е.
Для построения доверительного интервала для необходимо найти дисперсию его оценки, то есть .
Выборочная остаточная дисперсия:
;
;
у.е.
Из приложения находим .
;
;
;
Итак, средний объем реализации при торговой площади X = 1000 кв.м. с надежностью 0,95 находится в пределах от 9580,98 до 10579,53 у.е.
5. Рассчитаем границы интервала, в котором будет сосредоточено не менее 95% возможных объемов реализации при торговой площади X=1000
Чтобы построить доверительный интервал для индивидуального значения , необходимо найти дисперсию его оценки по формуле:
;
у.е.
;
;
.
Таким образом, возможные значения среднего объема реализации Y при доходе X = 1000 кв.м. с надежностью 0,95 находятся в пределах от 9136,625 до 11023,89 у.е.
6. Оценим на сколько единиц изменится объем реализации, если площадь вырастет на 100
(кв.м.) - средняя площадь 10 предприятий.
(у.е.) - объем реализации при X = 857 кв.м.
(кв.м.)
(у.е.);
.
Следовательно, если площадь вырастет на 100 кв.м., то объем реализации увеличится на 1091,09 у.е.
7. Рассчитаем коэффициент детерминации . Вначале вычислим коэффициент корреляции:
.
Выборочные средние квадратические отклонения:
;
.
,
то есть связь между переменными X и Y очень тесная и прямая (с увеличением площади объем реализации увеличивается).
В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции:
.
Это означает, что вариация зависимой переменной Y - объем реализации - на 89,8 % объясняется вариацией переменной X - площадь.
8. Рассчитаем F-статистику для коэффициента детерминации.
F-тест - оценивание качества уравнения регрессии - состоит в проверке гипотезы H0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполним сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера.
.
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости .
При = 0,05 и числе степеней свободы k = n - 2 = 8:
Fтабл = 5,32.
Так как Fфакт Fтабл, то Н0 - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
Задача 2
Имеются данные о динамике оборота розничной торговли и потребительских цен региона за два года. Используя метод Ш. Алмон, оцените параметры модели с распределенным лагом. Длину лага выберите не более 4, степень аппроксимирующего полинома - не более 3. Оцените качество построенной модели.
Месяц |
Оборот розничной торговли, % к предыдущему месяцу |
Индекс потребительских цен, % к предыдущему месяцу |
|
Январь |
70,8 |
101,7 |
|
Февраль |
98,7 |
101,1 |
|
Март |
97,9 |
100,4 |
|
Апрель |
99,6 |
100,1 |
|
Май |
96,1 |
100 |
|
Июнь |
103,4 |
100,1 |
|
Июль |
95,5 |
100 |
|
Август |
102,9 |
105,8 |
|
Сентябрь |
77,6 |
145 |
|
Октябрь |
102,3 |
99,8 |
|
Ноябрь |
102,9 |
102,7 |
|
Декабрь |
123,1 |
109,4 |
|
Январь |
74,3 |
110 |
|
Февраль |
92,9 |
106,4 |
|
Март |
106 |
103,2 |
|
Апрель |
99,8 |
103,2 |
|
Май |
105,2 |
102,9 |
|
Июнь |
99,7 |
100,8 |
|
Июль |
99,7 |
101,6 |
|
Август |
107,9 |
101,5 |
|
Сентябрь |
98,8 |
101,4 |
|
Октябрь |
104,6 |
101,7 |
|
Ноябрь |
106,4 |
101,7 |
|
Декабрь |
122,7 |
101,2 |
Решение
Длину лага выберем равную 3 в предположении, что структура лага описывается полиномом второй степени, т.е.
Тогда модель примет вид:
Для оценки параметров построим вспомогательную таблицу:
Таблица
Месяц |
Оборот розничной торговли, % к предыдущему месяцу, y |
Индекс потребительских цен, % к предыдущему месяцу, x |
z0 |
z1 |
z2 |
z0^2 |
z1^2 |
z2^2 |
z0z1 |
z1z2 |
z0z2 |
yz0 |
yz1 |
yz2 |
|
Январь |
70,8 |
101,7 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
|
Февраль |
98,7 |
101,1 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
|
Март |
97,9 |
100,4 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
|
Апрель |
99,6 |
100,1 |
403,3 |
607,7 |
1420,1 |
162650,89 |
369299,29 |
2016684,01 |
245085,41 |
862994,77 |
572726,33 |
40168,68 |
60526,92 |
141441,96 |
|
Май |
96,1 |
100 |
401,6 |
604,2 |
1411,6 |
161282,56 |
365057,64 |
1992614,56 |
242646,72 |
852888,72 |
566898,56 |
38593,76 |
58063,62 |
135654,76 |
|
Июнь |
103,4 |
100,1 |
400,6 |
601,4 |
1404 |
160480,36 |
361681,96 |
1971216 |
240920,84 |
844365,6 |
562442,4 |
41422,04 |
62184,76 |
145173,6 |
|
Июль |
95,5 |
100 |
400,2 |
600,4 |
1401 |
160160,04 |
360480,16 |
1962801 |
240280,08 |
841160,4 |
560680,2 |
38219,1 |
57338,2 |
133795,5 |
|
Август |
102,9 |
105,8 |
405,9 |
600,2 |
1400,4 |
164754,81 |
360240,04 |
1961120,16 |
243621,18 |
840520,08 |
568422,36 |
41767,11 |
61760,58 |
144101,16 |
|
Сентябрь |
77,6 |
145 |
450,9 |
606,1 |
1406,7 |
203310,81 |
367357,21 |
1978804,89 |
273290,49 |
852600,87 |
634281,03 |
34989,84 |
47033,36 |
109159,92 |
|
Октябрь |
102,3 |
99,8 |
450,6 |
656,6 |
1468,2 |
203040,36 |
431123,56 |
2155611,24 |
295863,96 |
964020,12 |
661570,92 |
46096,38 |
67170,18 |
150196,86 |
|
Ноябрь |
102,9 |
102,7 |
453,3 |
707,2 |
1632 |
205480,89 |
500131,84 |
2663424 |
320573,76 |
1154150,4 |
739785,6 |
46644,57 |
72770,88 |
167932,8 |
|
Декабрь |
123,1 |
109,4 |
456,9 |
737,3 |
1806,9 |
208757,61 |
543611,29 |
3264887,61 |
336872,37 |
1332227,37 |
825572,61 |
56244,39 |
90761,63 |
222429,39 |
|
Январь |
74,3 |
110 |
421,9 |
614,2 |
1418,4 |
177999,61 |
377241,64 |
2011858,56 |
259130,98 |
871181,28 |
598422,96 |
31347,17 |
45635,06 |
105387,12 |
|
Февраль |
92,9 |
106,4 |
428,5 |
636,9 |
1471,9 |
183612,25 |
405641,61 |
2166489,61 |
272911,65 |
937453,11 |
630709,15 |
39807,65 |
59168,01 |
136739,51 |
|
Март |
106 |
103,2 |
429 |
654,6 |
1531 |
184041 |
428501,16 |
2343961 |
280823,4 |
1002192,6 |
656799 |
45474 |
69387,6 |
162286 |
|
Апрель |
99,8 |
103,2 |
422,8 |
646 |
1518,8 |
178759,84 |
417316 |
2306753,44 |
273128,8 |
981144,8 |
642148,64 |
42195,44 |
64470,8 |
151576,24 |
|
Май |
105,2 |
102,9 |
415,7 |
628,8 |
1473,6 |
172806,49 |
395389,44 |
2171496,96 |
261392,16 |
926599,68 |
612575,52 |
43731,64 |
66149,76 |
155022,72 |
|
Июнь |
99,7 |
100,8 |
410,1 |
618,9 |
1444,5 |
168182,01 |
383037,21 |
2086580,25 |
253810,89 |
894001,05 |
592389,45 |
40886,97 |
61704,33 |
144016,65 |
|
Июль |
99,7 |
101,6 |
408,5 |
616,2 |
1441,2 |
166872,25 |
379702,44 |
2077057,44 |
251717,7 |
888067,44 |
588730,2 |
40727,45 |
61435,14 |
143687,64 |
|
Август |
107,9 |
101,5 |
406,8 |
611,9 |
1430,9 |
165486,24 |
374421,61 |
2047474,81 |
248920,92 |
875567,71 |
582090,12 |
43893,72 |
66024,01 |
154394,11 |
|
Сентябрь |
98,8 |
101,4 |
405,3 |
607,1 |
1415,1 |
164268,09 |
368570,41 |
2002508,01 |
246057,63 |
859107,21 |
573540,03 |
40043,64 |
59981,48 |
139811,88 |
|
Октябрь |
104,6 |
101,7 |
406,2 |
609,2 |
1421,8 |
164998,44 |
371124,64 |
2021515,24 |
247457,04 |
866160,56 |
577535,16 |
42488,52 |
63722,32 |
148720,28 |
|
Ноябрь |
106,4 |
101,7 |
406,3 |
609 |
1420,8 |
165079,69 |
370881 |
2018672,64 |
247436,7 |
865267,2 |
577271,04 |
43230,32 |
64797,6 |
151173,12 |
|
Декабрь |
122,7 |
101,2 |
406 |
609,3 |
1421,1 |
164836 |
371246,49 |
2019525,21 |
247375,8 |
865876,23 |
576966,6 |
49816,2 |
74761,11 |
174368,97 |
|
Сумма |
2388,8 |
2501,7 |
8790 |
13183,2 |
30760 |
3686860,24 |
8302056,64 |
45241056,64 |
5529318,48 |
19377547,2 |
12901557,88 |
887788,59 |
1334847,35 |
3117070,19 |
Тогда система уравнений по методу наименьших квадратов имеет вид:
В результате получим эмпирическое уравнение регрессии:
Следовательно,
Рассчитаем коэффициенты регрессии исходной модели:
Возвращаясь к исходным переменным, получим модель с распределенным лагом:
Анализ этой модели показывает, что при увеличении индекса потребительских цен на 1% в текущем периоде приведет через 3 месяца к увеличению объема розничной торговли в среднем на 0,08 %.
Оценим качество построенной модели. Для этого найдем коэффициент детерминации по формуле:
означает, что фактором индекса потребительских цен можно объяснить 46,7 % изменения объема розничной торговли.
Задача 3
(1) - теоретическое уравнение регрессии,
(2) - эмпирическое уравнение регрессии.
Какое из уравнений и почему лучше описывает выборочные данные?
Решение
Для определения значений теоретических коэффициентов, входящих в уравнения регрессии, необходимо знать и использовать все значения переменных генеральной совокупности, что практически невозможно. В связи с этим по выборке ограниченного объема строится так называемое выборочное (эмпирическое) уравнение регрессии. В силу несовпадения статистической базы для генеральной совокупности и выборки оценки коэффициентов, входящих в уравнение регрессии, практически всегда отличаются от истинных (теоретических) значений, что приводит к несовпадению эмпирической и теоретической линий регрессии. Различные выборки из одной и той же генеральной совокупности обычно приводят к отличающимся друг от друга оценкам. Задача состоит в том, чтобы по конкретной выборке найти оценки неизвестных параметров так, чтобы построенная линия регрессии являлась бы наилучшей, среди всех других линий.
Данное соотношение называется теоретической линейной регрессионной моделью; коэффициенты - теоретическими параметрами регрессии; - случайным отклонением.
По выборке ограниченного объема строится выборочное (эмпирическое) уравнение регрессии:
где - оценки неизвестных параметров, называемые выборочными (эмпирическими) коэффициентами регрессии, - оценка условного математического ожидания . Справедлива формула:
где отклонение - оценка теоретического отклонения .
Возможное соотношение между теоретическим и эмпирическим уравнениями регрессии схематично изображено на рис.
Рис. Возможное соотношение между теоретическим и эмпирическим уравнениями регрессии
Построенная прямая выборочной регрессии должна наилучшим образом описывать эмпирические данные, т.е. коэффициенты должны быть такими, чтобы случайные отклонения были минимальны.
Поэтому эмпирическое уравнение регрессии лучше описывает выборочные данные.
Задача 4
Если построить модель , где - прибыль, - доход, - затраты, то каким будет коэффициент детерминации?
Решение
При увеличении дохода на 1 ед. прибыль увеличивается (не учитывая влияние других факторов), следовательно, коэффициент , а при увеличении затрат на 1 ед. прибыль уменьшается (не учитывая влияние других факторов) и следовательно, коэффициент . Но это никак не влияет на коэффициент детерминации.
Коэффициент детерминации выражается формулой:
линейная регрессия
Множественный коэффициент детерминации характеризует, какая доля вариации (изменения) результирующего признака y определяется совместным изменением независимых факторов .
Значение принадлежит отрезку [0;1]. Таким образом, коэффициент детерминации и для модели , где - прибыль, - доход, - затраты будет находиться в пределах .
Размещено на Allbest.ru
Подобные документы
Изучение и оценка коэффициентов и уравнения линейной регрессии показателей грузоперевозок по РБ за 2011-2012 гг. Проверка гипотез о значениях коэффициентов регрессии, построение доверительных интервалов, анализ статистической однородности и независимости.
курсовая работа [773,3 K], добавлен 23.10.2012Экономическая интерпретация коэффициентов регрессии. Графическое представление фактических и модельных значений точки прогноза, уравнений регрессии (гиперболической, степенной, показательной). Нахождение коэффициентов детерминации и эластичности.
контрольная работа [324,1 K], добавлен 13.04.2010Классическая линейную модель множественной регрессии. Значимость уравнения регрессии и его коэффициентов. Доверительный интервал. Матрица парных коэффициентов корреляции. Модель множественной регрессии. Автокорреляция.
контрольная работа [172,9 K], добавлен 17.01.2004Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.
контрольная работа [47,3 K], добавлен 15.06.2009Основные этапы многофакторного корреляционного анализа и интерпретация его параметров. Назначение коэффициентов эластичности и стандартизированных бетта-коэффициентов. Расчет значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента.
контрольная работа [605,2 K], добавлен 29.07.2010Расчет параметров уравнения линейной регрессии, экономическая интерпретация регрессии. Определение остаточной суммы квадратов. Выполнение предпосылок МНК. Расчет коэффициента детерминации, проверка значимости уравнения регрессии с помощью критерия Фишера.
контрольная работа [317,0 K], добавлен 11.05.2009Парная линейная регрессия. Полный регрессионный анализ. Коэффициент корреляции и теснота линейной связи. Стандартная ошибка регрессии. Значимость уравнения регрессии. Расположение доверительных интервалов. Расчет параметров множественной регрессии.
контрольная работа [932,7 K], добавлен 09.06.2012Составление матрицы парных коэффициентов корреляции. Построение уравнения регрессии, характеризующего зависимость цены от всех факторов. Проведение регрессионного анализа с помощью пакета SPSS. Экономическая интерпретация коэффициентов модели регрессии.
лабораторная работа [2,5 M], добавлен 27.09.2012Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.
контрольная работа [1,3 M], добавлен 24.09.2013Расчет параметров линейного уравнения множественной регрессии с перечнем факторов по данным о деятельности компаний США. Оценка силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности. Доверительный интервал прогноза.
лабораторная работа [666,9 K], добавлен 21.04.2015