Эконометрический анализ
Построение количественно определенных экономико-математических моделей, разработка методов оценки их параметров по статистическим данным и анализ свойств. Прогнозирование на уровне предприятий. Построение точечных прогнозов на основе регрессионной модели.
Рубрика | Экономико-математическое моделирование |
Вид | методичка |
Язык | русский |
Дата добавления | 03.11.2014 |
Размер файла | 159,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Частное образовательное учреждение высшего профессионального образования «Южно-Уральский институт управления и экономики»
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ по выполнению домашней контрольной работы по дисциплине «ЭКОНОМЕТРИКА»
Челябинск, 2012
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ КОНТРОЛЬНЫХ ЗАДАНИЙ
ЗАДАНИЯ ДЛЯ ДОМАШНЕЙ КОНТРОЛЬНОЙ РАБОТЫ
РЕКОМЕНДУЕМЫЙ СПИСОК ЛИТЕРАТУРЫ
ВВЕДЕНИЕ
Дисциплина «Эконометрика» имеет целью ознакомить обучающихся с методами экономических измерений, методами оценки параметров моделей микро- и макроэкономики.
Основные задачи эконометрики: построение количественно определенных экономико-математических моделей, разработка методов оценки их параметров по статистическим данным и анализ их свойств.
Целью данной контрольной работы является закрепление и проверка знаний, полученных студентами в процессе самостоятельного изучения учебной литературы.
Вопросы и задания, включенные в контрольную работу, предусматривают знание студентами основных вопросов теории и умение применить их на практике решения задач.
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ КОНТРОЛЬНЫХ ЗАДАНИЙ
Эконометрика - наука, изучающая количественные закономерности и взаимозависимости в экономике методами математической статистики.
Цель эконометрики - эмпирический вывод экономических законов.
Задачи эконометрики - построение экономических моделей и оценивание их параметров, проверка гипотез о свойствах экономических показателей и формах их связи.
Эконометрический анализ служит основой для экономического анализа и прогнозирования, создавая возможность для принятия обоснованных экономических решений.
Типы данных
При моделировании экономических процессов оперируют двумя типами данных: пространственными и временными.
Пространственные данные - данные по какому-либо экономическому показателю, полученные от разных однотипных объектов, но относящиеся к одному и тому же времени.
Временные ряды - данные, характеризующие один и тот же объект в различные моменты времени.
Любые экономические данные представляют собой характеристики какого-либо экономического объекта и имеют статистическую природу. Для их анализа и обработки необходимо применять специальные методы.
Классы моделей и их оценка
Выделяют три основных класса экономических моделей: модели временных рядов, регрессионные модели с одним уравнением и системы одновременных уравнений.
К моделям временных рядов относятся модели тренда и модели сезонности.
В регрессионных моделях с одним уравнение объясняемая переменная представляется в виде функции от объясняющих переменных. По виду функции регрессионные модели делятся на линейные и нелинейные.
После построения модели необходимо проверить совместимость модели с реальными экономическими данными. Различают два уровня анализа: теоретический и эмпирический.
На теоретическом уровне предполагаем, что известны все возможные реализации экономических показателей, на основе которых можно теоретически определить параметры модели.
На эмпирическом уровне, располагая выборочными значениями экономических показателей, можно оценить значения параметров модели.
Цель оценивания - получить как можно более точно значения неизвестных параметров экономических показателей.
Типы зависимостей
В экономических исследованиях одной из основных задач является анализ зависимостей между переменными.
Функциональная зависимость задается в виде точной формулы, в которой каждому значению одной переменной соответствует строго определенное значение другой, воздействием случайных факторов при этом пренебрегают.
Статистической зависимостью называется связь переменных, на которую накладывается воздействие случайных факторов.
Уравнение регрессии - это формула статистической связи между переменными. Формула статистической связи двух переменных называется парной регрессией, зависимость от нескольких переменных - множественной регрессией.
Ковариация и корреляция
Выборочной ковариацией двух переменных x, y называется средняя величина произведения отклонений этих переменных от своих средних, т.е.
,
где - выборочные средние переменных x, y. Выборочная ковариация является мерой взаимосвязи между двумя переменными.
Более точной мерой зависимости между величинами является коэффициент корреляции. Различают выборочный и теоретический коэффициенты корреляции.
Выборочный коэффициент корреляции определяется выражением
-1 r 1,
он является безмерной величиной и показывает степень линейной связи двух переменных. Выборочный коэффициент корреляции является случайной величиной.
Теоретический коэффициент корреляции определяется выражением
,
где X, Y - средние квадратичные отклонения случайных величин X,Y. Теоретический коэффициент корреляции показывает тесноту линейной связи двух случайных величин:
· 0 при положительной связи и = 1 при строгой положительной линейной связи;
· 0 при отрицательной связи и = -1 при строгой отрицательной линейной связи;
· = 0 при отсутствии линейной связи.
В качестве критерия проверки гипотезы H0: = 0 принимается случайная величина . Величина t при справедливости гипотезы H0 имеет распределение Стьюдента (t-статистика) с v = n - 2 степенями свободы. Сравнивая наблюдаемые значение критерия t с критическими значениями tкр, определяемым по таблице по заданному уровню значимости и по числу степеней свободы, получают, что:
· если t tкр, то H0 принимается, т.е. нет линейной связи между переменными;
· еслиt tкр, то H0 отвергается, т.е. имеется линейная связь между переменными.
Нелинейные регрессии
Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций.
Уравнение линейной регрессии имеет вид: .
Уравнение степенной модели имеет вид: . Для построения этой модели необходимо произвести линеаризацию переменных. Для этого нужно произвести логарифмирование обеих частей уравнения.
Уравнение показательной кривой: . Для построения этой модели необходимо произвести линеаризацию переменных. Для этого нужно произвести логарифмирование обеих частей уравнения.
Уравнение гиперболической функции: . Для построения этой модели нужно произвести линеаризацию путем замены X = 1/x.
Расчет средней относительной ошибки:
Прогнозирование с применением уравнения регрессии
Регрессионные модели могут быть использованы для прогнозирования возможных ожидаемых значений зависимой переменной.
Прогнозируемое значение переменной y получается при подстановке в уравнение регрессии
ожидаемой величины фактора x. Данный прогноз называется точечным.
Вероятность реализации точечного прогноза практически равна нулю. Поэтому рассчитывается средняя ошибка прогноза или доверительный интервал прогноза с достаточно большой надежностью.
Доверительные интервалы зависят от стандартной ошибки, удаления xпрогн от своего среднего значения , количества наблюдений n и уровня значимости прогноза .
.
Модель парной регрессии
В модели парной регрессии зависимость между переменными в генеральной совокупности представляется в виде
Y = + X + ,
где X - неслучайная величина, а Y и - случайные величины.
Величина Y называется объясняемой (зависимой) переменной, а X - объясняющей (независимой) переменной. Постоянные , - параметры уравнения.
Не основе выборочного наблюдения оценивается выборочное уравнение регрессии:
,
где (a, b) - оценки параметров (, ). Величина описывается как расчетное значение переменнойy, соответствующее xi.
Остаток ei в i-м наблюдении определяется как разность между фактическим и расчетным значениями зависимой переменной, т.е.
.
Неизвестные значения (a, b) определяются методом наименьших квадратов (МНК):
.
Коэффициент b есть угловой коэффициент регрессии, он показывает, на сколько единиц в среднем изменяется переменная y при увеличении независимой переменной x на единицу.
Постоянная a дает прогнозируемое значение зависимой переменной при x=0.
Выборочные дисперсии величин y, , e:
- дисперсия наблюдаемых значений y;
- дисперсия расчетных значений y;
- дисперсия остатков.
Коэффициентом детерминации R2 называется отношение
,
при чем 0 R2 1, характеризующее долю вариации (разброса) зависимой переменной, объясненную с помощью уравнения регрессии.
Если R2 = 1, то подгонка точная, т.е. все точки наблюдения лежат на одной прямой. Если R2 = 0, регрессия ничего не дает, т.е. переменная x не улучшает качества предсказания y по сравнению с горизонтальной прямой . Чем ближе к единице R2, тем лучше качество подгонки, т.е. более точно аппроксимирует y.
F-тест на качество оценивания. Для определения статистической значимости коэффициента детерминации R2 проверяется гипотеза H0: F = 0 для F-статистики, рассчитываемой по формуле
.
Величина F имеет распределение Фишера с v1=1, v2=n - 2 степенями свободы. Вычисленный критерий F сравнивается с критическим значением Fкр:
· если F Fкр, то H0 принимается, т.е. R2 незначим;
· если F Fкр то H0 отклоняется, т.е. R2 значим.
В силу того, что случайные отклонения I по выборке определены быть не могут, при анализе надежности оценок они заменяются наблюдаемыми остатками ei и их выборочной дисперсией.
Несмещенной оценкой дисперсии 2 является величина
,
которая служит мерой разброса зависимой переменной вокруг линии регрессии. Величина S называется стандартной ошибкой регрессии.
Величины Sa, Sb называются стандартными ошибками коэффициентов регрессии и вычисляются по формулам:
.
Пример 1
По семи предприятиям легкой промышленности получена информация, характеризующая зависимость объема выпуска продукции (Y, млн руб.) от объема капиталовложений (X, млн руб.).
Y |
64 |
56 |
52 |
48 |
50 |
46 |
38 |
|
X |
64 |
68 |
82 |
76 |
84 |
96 |
100 |
Требуется:
1. Для характеристики Y от x построить следующие модели:
· линейную (для сравнения с нелинейными),
· степенную,
· показательную,
· гиперболическую.
2. Оценить каждую модель, определив:
· индекс корреляции,
· среднюю относительную ошибку, коэффициент детерминации,
· F-критерий Фишера.
3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.
4. Рассчитать прогнозные значения результативного признака по лучшей модели, если объем капиталовложений составит 89,573 млн руб.
5. Результаты расчетов отобразить на графике.
Решение
1 Построение моделей регрессии
Построение линейной модели парной регрессии.
Определим линейный коэффициент парной корреляции по следующей формуле, используя данные таблицы 1.1:
Можно сказать, что связь между объемом капиталовложений X и объемом выпуска продукции Y обратная, достаточно сильная.
Уравнение линейной регрессии имеет вид: .
Значения параметров a и b линейной модели определим, используя данные таблицы 1.1.
Уравнение регрессии имеет вид: .
С увеличением объема капиталовложений на 1 млн руб. объем выпускаемой продукции уменьшится в среднем на 550 тыс. руб. Это свидетельствует о неэффективности работы предприятий, и необходимо принять меры для выяснения причин и устранения этого недостатка.
Таблица 1.1
t |
y |
x |
yx |
x 2 |
|
|||||||
1 2 3 4 5 6 7 |
64 56 52 48 50 46 38 |
64 68 82 76 84 96 100 |
4096 3808 4264 3648 4200 4416 3800 |
4096 4642 6724 5776 7056 9216 10000 |
13,43 5,43 1,43 -2,57 -0,57 -4,57 -12,6 |
180,36 29,485 2,0449 6,6049 0,3249 20,885 158,0 |
-17,4 -13,4 0,57 -5,43 2,57 14,57 18,57 |
303,8 180,36 0,3249 29,485 6,6049 212,28 344,84 |
60,2 58,0 50,3 53,6 49,2 42,6 40,4 |
3,84 -1,96 1,74 -5,56 0,84 3,44 -2,36 |
6,000 -3,500 3,346 -11,583 1,680 7,478 -6,211 |
|
Итого Ср. знач |
354,00 50,57 |
570,00 81,43 |
28232 4033,14 |
47492 6784,57 |
0,01 |
397,71 |
1077,7 |
-0,02 |
39,798 5,685 |
Рассчитаем коэффициент детерминации:
Вариация результата Y (объема выпуска продукции) на 82,2% объясняется вариацией фактора X (объемом капиталовложений).
Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера:
;
FFтабл = 6,61 для =0,05; k1 = m = 1, k2 = n - m - 1 = 5/
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F Fтабл.
Определим среднюю ошибку:
.
В среднем расчетные значения для линейной модели отличаются от фактических значений на 5,685%.
Построение степенной модели парной регрессии
Уравнение степенной модели имеет вид: .
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
lg = lg a +b lg x. данные приведены в таблице 1.2.
Таблица 1.2
Факт. Y(t) |
lg(y) |
Переменная X(t) |
lg(x) |
||
1 2 3 4 5 6 7 28 |
64,0 56,0 52,0 48,0 50,0 46,0 38,0 354,0 |
1,806 1,748 1,716 1,681 1,699 1,633 1,580 11,893 |
64 68 82 76 84 96 100 570 |
1,806 1,833 1,914 1,881 1,924 1,982 2,000 13,340 |
|
Сред. знач |
50,5714 |
1,699 |
81,429 |
1,906 |
Обозначим Y = lg , X = lg x, A = lg a. тогда уравнение примет вид: Y = A + bX - линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 1.3.
Таблица 1.3
y |
Y |
x |
X |
YX |
X2 |
|
Ei |
|
|||
1 2 3 4 5 6 7 |
64 56 52 48 50 46 38 |
1,8062 1,7482 1,7160 1,6812 1,6990 1,6628 1,5798 |
64 68 82 76 84 96 100 |
1,8062 1,8325 1,9138 1,8808 1,9243 1,9823 2,000 |
3,2623 3,2036 3,2841 3,1621 3,2693 3,2960 3,1596 |
3,2623 3,3581 3,6627 3,5375 3,7029 3,9294 4,0000 |
61,294 58,066 49,133 52,580 48,088 42,686 41,159 |
2,706 -2,066 2,867 -4,580 1,912 3,314 -3,159 |
4,23 3,69 5,51 9,54 3,82 7,20 8,.31 |
7,322 4,270 8,220 20,976 3,657 10,982 9,980 |
|
итого |
354 |
11,8931 |
13,3399 |
22,6370 |
25,4528 |
0,51 |
42,32 |
65,407 |
Уравнение регрессии будет иметь вид: Y = 3,3991 - 0,8921X.
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения.
Получим уравнение степенной модели регрессии: = 2506,915 x-0,892.
Определим индекс корреляции:
связь между показателем y и фактором x можно считать достаточно сильной.
Коэффициент детерминации равен 0,836:
Вариация результата Y (объем выпуска продукции) на 83,6% объясняется вариацией фактора X (объемом капиталовложений).
Рассчитаем F-критерий Фишера:
F Fтабл = 6,61 для = 0,05; k1 = m = 1, k2 = n -m -1 = 5.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F Fтабл.
Средняя относительная ошибка
В среднем расчетные значения для степенной модели отличаются от фактических значений на 6,04%.
Построение показательной функции
Уравнение показательной кривой: .
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения:
.
Обозначим: .
Получим линейное уравнение регрессии:
Y=A+Bx.
Рассчитаем его параметры, используя данные таблицы 1.4.
Таблица 1.4
t |
y |
Y |
x |
Yx |
x2 |
Ei |
||||||||
1 2 3 4 5 6 7 |
64 56 52 48 50 46 38 |
1,8062 1,7482 1,7160 1,6812 1,.6990 1,6628 1,5798 |
64 68 82 76 84 96 100 |
115,60 118,88 140,71 127,77 142,71 159,62 157,98 |
4096 4624 6724 5776 7056 9216 10000 |
0,1072 0,0492 0,0170 -0,017 0,0000 -0,036 -0,119 |
0,0115 0,0024 0,0003 0,0003 0,0000 0,0013 0,0142 |
-17,43 -13,43 0,57 -5,43 2,57 14,57 18,57 |
303,76 180,33 0,33 29,47 6,61 212,33 344,90 |
60,6 58 49,7 53,1 48,6 42,5 40,7 |
11,464 3,9632 5,4221 25,804 2,0031 11,933 7,3132 |
3,3859 -1,991 2,3285 -5,08 1,4153 3,4544 -2,704 |
||
итого |
354 |
11,8931 |
550 |
963,28 |
47495 |
0,0300 |
1077,7 |
67,903 |
0,8093 |
|||||
сред знач |
50,57 |
1,6990 |
81,4 |
137,61 |
6785 |
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
Определим индекс корреляции:
Связь между показателем y и фактором x можно считать достаточно сильной.
Индекс детерминации: R2 = = 0,912 = 0,828.
Вариация результата Y (объема выпуска продукции) на 82,8% объясняется вариацией фактора X (объемом капиталовложений).
Рассчитаем F-критерий Фишера:
F Fтабл = 6,61 для = 0,05; k1=m=1, k2 = n - m - 1 = 5.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F Fтабл.
Средняя относительная ошибка:
В среднем расчетные значения для показательной функции отличаются от фактических на 5,909%.
Построение гиперболической функции
Уравнение гиперболической функции:
Произведем линеаризацию модели путем замены X=. В результате получим линейное уравнение
.
Рассчитаем его параметры по данным таблицы 1.5.
Получим следующее уравнение гиперболической модели:
.
Определим индекс детерминации: R2 = = 0,9142 = 0,835.
Таблица 1. 5.
t |
y |
x |
X |
yX |
X2 |
|
Ei |
|
||||
1 2 3 4 5 6 7 |
64 56 52 48 50 46 38 |
64 68 82 76 84 96 100 |
0,0156 0,0147 0,0122 0,0132 0,0119 0,0104 0,0100 |
1,0000 0,8235 0,6341 0,6316 0,5952 0,4792 0,3800 |
0,0002441 0,0002163 0,0001487 0,0001731 0,0001417 0,0001085 0,0001000 |
13,43 5,43 1,43 -2,57 -0,57 -4,57 -12,57 |
180,33 29,47 2,04 6,61 0,32563 20,90 158,04 |
61,5 58,2 49,3 52,7 48,2 42,9 41,4 |
6,1954 4,9637 7,5089 22,078 3,1591 9,5648 11,69 |
2,489 -2,228 2,740 -4,699 1,777 3,093 -3,419 |
3,889 3,978 5,270 9,789 3,555 6,723 8,997 |
|
итого |
354 |
0,0880 |
4,5437 |
0,0011325 |
397,71 |
354,2 |
65,159 |
-0,246 |
42,202 |
|||
сред знач |
50,57 |
0,0126 |
0,6491 |
0,0001618 |
6,029 |
Вариация результата Y (объема выпуска продукции) на 83,6% объясняется вариацией фактора X (объемом капиталовложений).
F-критерий Фишера:
F Fтабл= 6,61 для = 0,05; k1=m=1, k2 = n - m - 1 = 5.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F Fтабл.
Средняя относительная ошибка:
В среднем расчетные значения для гиперболической модели отличаются от фактических значений на 6,029%.
Выбор лучшей модели
Для выбора лучшей модели построим сводную таблицу результатов.
Таблица 1.6.
Параметры Модель |
Коэффициент детерминации R2 |
F-критерий Фишера |
Индекс корреляции YX (ryx) |
Средняя относительная ошибка Eотн |
|
Линейная |
0,822 |
23,09 |
0,907 |
5,685 |
|
Степенная |
0,828 |
24,06 |
0,910 |
6,054 |
|
Показательная |
0,828 |
24,06 |
0,910 |
5,909 |
|
Гиперболичская |
0,835 |
25,30 |
0,914 |
6,029 |
Все модели имеют примерно одинаковые характеристики, но большее значение F-критерия Фишера и большее значение коэффициента детерминации R2 имеет гиперболическая модель. Ее можно взять в качестве лучшей для построения прогноза.
Расчет прогнозного значения результативного показателя
Прогнозное значение результативного признака (объема выпуска продукции) определяется по уравнению гиперболической модели, подставив в него планируемую (заданную по условию) величину объема капиталовложений:
(млн руб.).
Фактические, расчетные и прогнозные значения по лучшей модели отображаются на графике.
рис. 1.1
Модель множественной регрессии
Линейная модель множественной регрессии имеет вид:
Yi = 0 + 1xi1 + 2xi2 + mxim + i.
Коэффициент регрессии j показывает, на какую величину в среднем измениться результативный признак Y, если переменную xj увеличить на единицу измерения, т.е. j является нормативным коэффициентом.
Анализ уравнения множественной регрессии и методика определения параметров становиться более наглядными, а расчетные процедуры существенно упрощаются, если воспользоваться матричной формой записи уравнения
Y = X + ,
где Y - вектор зависимой переменной размерности n1, представляющий собой n наблюдений значений yi,
X - матрица n наблюдений независимых переменных X1, X2, X3, …Xm, размерность матрицы X равна n(m + 1);
- подлежащий оцениванию вектор неизвестных параметров размерности
(m + 1) 1;
- вектор случайных отклонений (возмущений) размерности n1.
Таким образом,
.
Уравнение множественной регрессии содержит значения неизвестных параметров 0, 1, 2, …, m. Эти величины оцениваются на основе выборочных наблюдений, поэтому полученные расчетные показатели представляют собой статистические оценки. Модель линейной регрессии, в которой вместо истинных значений параметров подставлены их оценки, имеет вид:
,
где - вектор оценок параметров;
e - вектор «оцененных» отклонений регрессии, остатки регрессии e = Y - Xa;
- оценка значений Y, равная Xa.
Оценка параметров модели множественной регрессии с помощью МНК.
Формула для вычисления параметров регрессионного уравнения:
A = (XTX)-1XTY.
Одним из условий регрессионной модели является предположение о линейной независимости объясняющих переменных. Линейная или близкая к ней связь между факторами называется мультиколлинеарностью и приводит к линейной зависимости нормальных уравнений, что делает вычисление пераметров либо невозможным, либо затрудняет содержательную интерпретацию параметров модели. Чтобы избавиться от мультиколлинеарности, в модель включают лишь один из линейно связанных между собой факторов, причем тот, который в большей степени связан с зависимой переменной.
В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств: ryxi rxixk, ryxk rxixk, rxixk 0,8. если приведенные неравенства (или хотя бы одно из них) не выполняется, то в модель включают тот фактор, который наиболее тесно связан с Y.
Анализ статистической значимости параметров модели.
Значимость отдельных коэффициентов регрессии проверяется по t-статистике путем проверки гипотезы о равенстве нулю j-го параметра уравнения (кроме свободного члена):
,
где Saj - стандартное отклонение коэффициента уравнения регрессии aj.
Величина Saj вычисляется по формуле:
,
где bij - диагональный элемент матрицы (XTX)-1.
Если расчетное значение t-критерия с (n - k - 1) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели.
Проверка значимости модели регрессии.
Для проверки значимости модели регрессии используется F-критерий Фишера.
Оценка качества модели регрессии.
Качество модели оценивается стандартным для математических моделей образом: по адекватности и точности на основе анализа остатков регрессии e. Расчетные значения получаются путем подстановки в модель фактических значений всех включенных факторов.
Анализ остатков позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа остатки должны вести себя как независимые одинаково распределенные случайные величины. Независимость остатков проверяется с помощью критерия Дарбина - Уотсона. Исследование остатков полезно начинать с изучения их графика. Он может показать наличие какой-то зависимости, не учтенной в модели.
Выбросы. График остатков хорошо показывает и резко отклоняющиеся от модели наблюдения - выбросы. Присутствие выбросов может грубо искажать значения оценок. Устранение эффектов выбросов может проводится либо с помощью удаления этих точек из анализируемых данных, либо с помощью применения методов оценивания параметров, устойчивых к подобным грубым отклонениям.
Для оценки качества модели множественной регрессии вычисляют коэффициент множественной корреляции R и коэффициент детерминации R2.
В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, он должен быть скорректирован с учетом числа независимых переменных. Скорректированный R2, или, рассчитывается так:
,
где n - число наблюдений;
k - число независимых переменных.
Важную роль при оценке влияния факторов играют коэффициенты регрессионного анализа. Однако непосредственно с их помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Для устранения таких различий при интерпретации применяются средние частные коэффициенты эластичности Э(j) и бетта-коэффициенты (j), которые рассчитываются по формулам:
где - среднестатистическое отклонение фактора j.
.
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент, но не учитывает степень колеблемости факторов.
Бетта-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy измениться зависимая переменная Y с изменением соответствующей независимой переменной Xj на величину своего среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных.
Указанные коэффициенты позволяют упорядочить факторы по степени влияния факторов на зависимую переменную.
Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта-коэффициентов(j):
,
где - коэффициент парной корреляции между фактором j (J = 1, …,m) и зависимой переменной.
Одна из важнейших целей моделирования заключается в прогнозировании поведения исследуемого объекта. При использовании построенной модели для прогнозирования делается предположение о сохранении в период прогнозирования существования ранее взаимосвязей переменных.
Для прогнозирования зависимой переменной на l шагов вперед необходимо знать прогнозные значения всех входящих в нее факторов. Их оценки могут быть получены на основе временных экстраполяционных моделей или заданы пользователем. Эти оценки подставляются в модель и получаются прогнозные оценки.
Построение точечных и интервальных прогнозов на основе регрессионной модели
Для того, чтобы определить область возможных значений результативного показателя, при рассчитанных значениях факторов следует учитывать два возможных источника ошибок: рассеивание наблюдений относительно линии регрессии и ошибки, обусловленные математическим аппаратом построения самой линии регрессии. Ошибки первого рода измеряются с помощью характеристик точности, в частности величиной Sy. Ошибки второго рода обусловлены фиксацией численного значения коэффициентов регрессии, в то время как они в действительности являются случайными, нормально распределенными.
Для линейной регрессии доверительный интервал рассчитывается следующим образом. Оценивается величина отклонения от линии регрессии U:
,
где .
Пример 2
Задача состоит в построении модели для предсказания объема реализации одного из продуктов фирмы.
Объем реализации - зависимая переменная Y (млн руб.). в качестве независимых, объясняющих переменных выбраны: время - X1, расходы на рекламу X2 (тыс. руб.), цена товара X3 (руб), средняя цена товара у конкурентов X4 (руб.), индекс потребительских расходов X5 (%).
Требуется:
1. Осуществить выбор факторных признаков для построения двухфакторной регрессионной модели.
2. Рассчитать параметры модели.
3. Для оценки качества модели определить
· линейный коэффициент множественной корреляции,
· коэффициент детерминации.
4. Осуществить оценку значимости уравнения регрессии.
5. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.
6. Оценить влияние факторов на зависимую переменную по модели.
7. Построить точечный и интервальный прогноз результирующего показателя.
Решение.
1. Построение системы показателей (факторов). Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели.
Статистические данные по всем переменным приведены в таблице 2.1. В этом примере n = 16, m = 5.
В таблице 2.2 приведены промежуточные результаты при вычислении коэффициента корреляции по формуле:
.
В таблице 2.3 приведены сводные результаты корреляционного анализа. экономический предприятие регрессионный
Таблица 2.1.
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
|
Объем реализации |
Время |
Реклама |
Цена |
Цена конкурента |
Индекс потребительских расходов |
|
126 137 148 191 274 370 432 445 367 367 321 307 331 345 364 384 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
4,0 4,8 3,8 8,7 8,2 9,7 14,7 18,7 19,8 10,6 8,6 6,5 12,6 6,5 5,8 5,7 |
15,0 14,8 15,2 15,5 15,5 16,0 18,1 13,0 15,8 16,9 16,3 16,1 15.4 15,7 16,0 15,1 |
17,0 17,3 16,8 16,2 16,0 18,0 20,2 15,8 18,2 16,8 17,0 18,3 16,4 16,2 17,7 16,2 |
100,0 98,4 101,2 103,5 104,1 107,0 107,4 108,5 108,3 109,2 110,1 110,7 110,3 111,8 112,3 112,9 |
Таблица 2.2.
t |
Y |
X2 |
||||||
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
126 137 148 191 274 370 432 445 367 367 321 307 331 345 364 384 |
4,0 4,8 3,8 8,7 8,2 9,7 14,7 18,7 19,8 10,6 8,6 6,5 12,6 6,5 5,8 5,7 |
-180,813 -169,813 -158,813 -115,813 -32,8125 63,1875 125,1875 138,1875 60,1875 60,1875 14,1875 0,1875 24,1875 38,1875 57,1875 77,1875 |
32693,16 28836,29 25221,41 13412,54 1076,66 3992,66 15671,91 19095,79 3622,535 3622,535 201,2852 0,035156 585,0352 1458,258 3270,41 5957,91 |
-5,29375 -4,49375 -5,49375 -0,59375 -1,09375 0,40625 5,40625 9,40625 10,50625 1,30625 -0,69375 -2,79375 3,30625 -2,79375 -3,49375 -3,59375 |
28,02379 20,19379 30,18129 0,352539 1,196289 0,165039 29,22754 88,47754 110,3813 1,706289 0,481289 7,805039 10,93129 7,805039 12,20629 12,91504 |
957,1762 763,0949 872,4762 68,76367 35,88867 25,66992 676,7949 1299,826 632,3449 78,61992 -9,84258 -0,52383 79,96992 -106,686 -199,799 -277,393 |
|
|
4909 |
148,7 |
0 |
158718,4 |
0 |
362,0494 |
4896,381 |
|
сред знач |
9,29375 |
0 |
Таблица 2.3.
Объем реализации |
Время |
Реклама |
Цена |
Цена конкурента |
Индекс потребительских расходов |
||
Столбец 1 |
Столбец 2 |
Столбец 3 |
Столбец 4 |
Столбец 5 |
Столбец 6 |
||
Объем реализации Время Реклама Цена Цена конкурента Индекс потребительских расходов |
1 0,678 0,646 0,233 0,226 0,816 |
1 0,106 0,174 -0,051 0,960 |
1 -0,003 0,204 0,273 |
1 0,698 0,235 |
1 0,03 |
1 |
Анализ результатов коэффициентов парной корреляции показывает, что зависимая переменная, т.е. объем реализации имеет тесную связь с индексом потребительских расходов (), с расходами на рекламу () и со временем (). Однако факторы X2 и X5 тесно связаны между собой (), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели X5 - индекс потребительских расходов. В этом примере n=16, m = 5, после исключения незначимых факторов n = 16, k = 2.
2 Выбор вида модели и оценка ее параметров
Оценка параметров регрессии осуществляется по методу наименьших квадратов, используя данные, приведенные в таблице 2.4.
Таблица 2.4.
Y |
X0 |
X1 |
X2 |
|
Объем реализации |
Реклама |
Индекс потребительских расходов |
||
126 137 148 191 274 370 432 445 367 367 321 307 331 345 364 384 |
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 |
4,0 4,8 3,8 8,7 8,2 9,7 14,7 18,7 19,8 10,6 8,6 6,5 12,6 6,5 5,8 5,7 |
100,0 98,4 101,2 103,5 104,1 107,0 107,4 108,5 108,3 109,2 110,1 110,7 110,3 111,8 112,3 112,9 |
.
Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в следующем виде:
y = -1471,314 + 9,568x1 + 15,754x2.
Расчетные значения Y определяются путем последовательной подстановки в эту модель значений факторов, взятых для каждого наблюдения.
Регрессионный анализ
Результат регрессионного анализа содержится в таблицах 2.5 - 2.7.
Таблица 2.5
Регрессионная статистика |
||||
№ |
Принятые наименования |
формула |
Результат |
|
1 |
Коэффициент множественной корреляции |
|
0,927 |
|
2 |
Коэффициент детерминации, R2 |
|
0,859 |
|
3 |
Скорректированный R2 |
|
0,837 |
|
4 |
Стандартная ошибка |
41,473 |
||
5 |
Количество наблюдений |
n |
16 |
Таблица 2.6.
df - число степеней свободы |
SS - сумма квадратов |
MS |
F-критерий Фишера |
||
Регрессия |
k=2 |
||||
Остаток |
n - k - 1=13 |
|
|||
Итого |
N - 1 =15 |
Таблица 2.7.
Коэффициенты |
Стандартная ошибка |
t-статистика |
||
Y - пересечение Реклама Индекс потребительских расходов |
-1471б31 9б568 15б753 |
259б766 2б266 2б467 |
-5б667 4б223 6б386 |
Пояснения к таблице 2.7. Во втором столбце содержаться коэффициенты уравнения регрессии a0, a1, a3. В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии, а в четвертом - t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии.
Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекс потребительских расходов можно записать в виде:
Y = -1471,314 + 9,568x1 + 15,754x2.
2 Оценка качества модели
В таблице 2.8 приведены вычисленные по модели значения Y и значения остаточной компоненты.
Таблица 2.8.
Вывод остатков |
|||
Наблюдение |
Предсказанное |
Остатки |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
142,25 124,70 159,24 242,35 247,02 307,06 361,20 416,80 424,18 350,32 345,37 334,72 386,79 352,05 353,23 361,73 |
-16,25 12,30 -11,24 -51,35 26,98 62,94 70,80 28,20 -57,18 16,68 -24,37 -27,72 -55,79 -7,05 10,77 22,27 |
Проверку независимости проведем с помощью d-критерия Дарбина - Уотсона.
В качестве критических табличных уровней при N = 16 двух объясняющих факторов при уровне значимости в 5% возьмем величины d = 0,98 и d = 1,54.
Так как расчетное значение попало в интервал от d1 до d2, то нельзя сделать окончательный вывод по этому критерию. Для определения степени автокорреляции вычислим коэффициент автокорреляции и проверим его значимость при помощи критерия стандартной ошибки.
В качестве критических табличных уровней при N = 16, двух объясняющих факторах при уровне значимости в 5% возьмем величины d1 = 0,98 и d2 = 1,54.
Так как расчетное значение попало в интервал от d1 до d2, то нельзя сделать вывод по этому критерию. Для определения степени автокорреляции вычислим коэффициент автокорреляции и проверим его значимость при помощи критерия стандартной ошибки.
Стандартная ошибка коэффициента корреляции рассчитывается по формуле:
.
Коэффициенты автокорреляции случайных данных обладают выборочным распределением, приближающимся к нормальному с нулевым математическим ожиданием и средним квадратическим отклонением, равным .
Если r1 находится в интервале 1,960,25 r11,96 0,25, то можно считать, что данные не показывают наличие автокорреляции первого порядка, т.к.
-0,49 r1 = 0,309 0,49, и свойство независимости выполняется.
Вычислим для модели коэффициент детерминации.
.
Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 86% вариация зависимой переменной учтено в модели и обусловлено влиянием включенных факторов. Значение коэффициента детерминации находится в таблице 2.5.
Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера:
.
Значение F-критерия Фишера можно найти в таблице 2.6.
Так как Fрас Fтабл, уравнение регрессии следует признать адекватным.
4 Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии
Значимость коэффициентов уравнения регрессии a0, a1, a2 оценим с использованием t-критерия Стьюдента.
b11 = 39,2314
b22 = 0,00299
b33 = 0,00354
расчетные значения t-критерия Стьюдента для коэффициентов уравнения регрессии a1, a2 приведены в четвертом столбце таблице 2.7.
Табличное значение t-критерия при 5% уровне значимости и степенях свободы (16 - 2 - 1 = 13) составляет 2,16. так как , коэффициенты a1, a2 и существенны (значимы).
5 Проанализировать влияние факторов на зависимую переменную по модели (для каждого коэффициента регрессии вычислить коэффициент эластичности, -коэффициент)
Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения, используем коэффициент эластичности (Э) и бета-коэффициент, которые рассчитываются по формулам:
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент.
Бетта-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных. Это означает, что при увеличении затрат на рекламу на 4,91 тыс. руб. объем реализации увеличится на 47 тыс. руб.
6 Определить точечные и интервальные прогнозные оценки объема реализации на два квартала вперед (t0,7=1,12)
Прогнозные значения X1,17, X2,17 и X1,18, X2,18 можно определить с помощью методов экспертных оценок, с помощью средних абсолютных приростов или вычислить на основе экстраполяционных методов. Для фактора X1 Затраты на рекламу выбрана модель
X1 = 12,83 - 11,616t + 4,319t2 - 0,552t3 + 0,020t4 - 0,0006t5,
по которой получен прогноз на два месяца вперед.
Для временного ряда Индекс потребительских расходов в качестве аппроксимирующей функции выбран полином второй степени (парабола), по которой построен прогноз на два шага вперед:
X2 = 97,008 + 1,739t - 0,0488t2.
Для получения прогнозных оценок зависимостей переменных по модели
Y = -1471,438 + 9,568X1 + 15,754 X2.
Подставим в нее найденные прогнозные значения факторов X1 и X2.
Yt=17 = -1471,438 + 9,5685,75 + 15,754112,468 = 355,399
Yt=18 = -1471,438 + 9,5684,85 + 15,754112,488 = 344,179.
Доверительный интервал прогноза будет иметь следующие границы:
Верхняя граница прогноза: Yp (N+1) + U(1)
Нижняя граница прогноза: Yp (N+1) - U(1).
Результаты прогнозных оценок модели регрессии, представлены в таблице 2.9
Таблица 2.9
Таблица прогнозов (р=95%) |
||||
Упреждение |
Прогноз |
Нижняя граница |
Верхняя граница |
|
1 |
355,399 |
312,368 |
398,367 |
|
2 |
344,179 |
298,43 |
389,928 |
Контрольная работа состоит из двух заданий.
Номер варианта заданий выбирается в соответствии с начальной буквы фамилии студента.
Например:
Номер зачетной книжки |
Номер выполняемого варианта |
|
А, Б, В |
Первый |
|
Г, Д, Е |
Второй |
|
Ж, З, И |
Третий |
|
К, Л |
Четвертый |
|
М, Н, О |
Пятый |
|
П, Р, С |
Шестой |
|
Т, У, Ф |
Седьмой |
|
Х, Ц, Ч |
Восьмой |
|
Ш, Щ |
Девятый |
|
Э, Ю, Я |
Десятый |
При выполнении заданий нужно привести полное решение каждого пункта задания с подробными комментариями к процессу его выполнения с указанием формул. В конце каждого пункта выполненного задания дать анализ ответа.
При выполнении заданий можно использовать пакет анализа данных Excel (программы «Корреляция» и «Регрессия»), а также программу «Олимп:СтатЭксперт».
ЗАДАНИЯ ДЛЯ ДОМАШНЕЙ КОНТРОЛЬНОЙ РАБОТЫ
Задача №1
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (У, млн. руб) от объема капиталовложений (Х, млн. руб).
Требуется:
1. Для характеристики У от Х построить следующие модели:
Ш линейную,
Ш степенную,
Ш показательную,
Ш гиперболическую.
2. Оценить каждую модель, определив:
Ш индекс корреляции,
Ш среднюю относительную ошибку,
Ш коэффициент детерминации,
Ш F - критерий Фишера.
3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.
4. Рассчитать прогнозное значение результативного признака, если прогнозное значение фактора увеличится на 110% относительно среднего уровня.
5. Результаты расчетов отобразить на графике.
Задание к задаче №1:
Вариант |
Наблюдения |
|
1 |
Y 36 38 46 44 48 42 40X 60 68 64 72 78 74 70 |
|
2 |
Y 26 28 36 34 38 44 42X 40 39 43 46 50 53 57 |
|
3 |
Y 176 170 156 172 162 160 166X 150 154 146 134 132 126 133 |
|
4 |
Y 60 68 74 76 84 86 92X 50 54 60 62 70 66 74 |
|
5 |
Y 32 40 44 28 50 56 50X 60 68 80 76 74 87 96 |
|
6 |
Y 36 38 46 44 48 42 40X 70 78 74 82 88 84 80 |
|
7 |
Y 152 148 146 134 130 136 134X 86 94 100 96 93 104 122 |
|
8 |
Y 64 56 52 48 50 46 38X 64 68 82 76 84 96 100 |
|
9 |
Y 50 54 60 62 70 74 81X 60 68 74 82 88 94 100 |
|
10 |
Y 40 44 48 52 56 64 70X 22 28 30 32 44 51 58 |
Задача №2
По десяти кредитным учреждениям получены данные, характеризующие зависимость объема прибыли (Y) от среднегодовой ставки по кредитам (X1), ставки по депозитам (X2) и размера внутрибанковских расходов (X3).
Подобные документы
Оценка адекватности эконометрических моделей статистическим данным. Построение доверительных зон регрессий спроса и предложения. Вычисление коэффициента регрессии. Построение производственной мультипликативной регрессии, оценка ее главных параметров.
контрольная работа [1,2 M], добавлен 25.04.2010Эконометрическое исследование признаков деятельности предприятий: доля расходов на закупку товаров, среднедневная заработная плата одного работающего. Построение линейного графика регрессионной зависимости между показателями, оценка адекватности модели.
контрольная работа [93,3 K], добавлен 14.12.2011Теоретико-методологический подход к построению множественных регрессионных моделей. Моделирование и прогнозирование основных экономических показателей при использовании панельных данных. Исследование объемов продаж пяти предприятий с течением времени.
курсовая работа [2,0 M], добавлен 02.12.2013Проектирование регрессионной модели по панельным данным. Скрытые переменные и индивидуальные эффекты. Расчет коэффициентов однонаправленной модели с фиксированными эффектами по панельным данным в MS Excel. Выбор переменных для построения данной регрессии.
курсовая работа [2,3 M], добавлен 26.08.2013Построение эконометрической модели. Описания, анализ и прогнозирование явлений и процессов в экономике. Использование регрессионных моделей. Построение корреляционной матрицы. Коэффициент множественной детерминации. Значение статистики Дарбина-Уотсона.
курсовая работа [61,0 K], добавлен 10.03.2013Содержание и построение экономико-математических методов. Роль оптимальных методов в планировании и управлении производством. Экономико-математические модели оптимальной загрузки производственных мощностей. Отраслевое прогнозирование и регулирование.
контрольная работа [62,1 K], добавлен 30.08.2010Статистический анализ по выборке. Проведение регрессионного анализа исходных данных и выбор аналитической формы записи производственной функции. Выполнение экономического анализа в выбранной регрессионной модели на основе коэффициентов эластичности.
курсовая работа [2,2 M], добавлен 22.07.2015Анализ основных способов построения математической модели. Математическое моделирование социально-экономических процессов как неотъемлемая часть методов экономики, особенности. Общая характеристика примеров построения линейных математических моделей.
курсовая работа [1,3 M], добавлен 23.06.2013Построение математических моделей по определению плана выпуска изделий, обеспечивающего максимальную прибыль, с помощью графического и симплексного метода. Построение моделей по решению транспортных задач при применении метода минимальной стоимости.
задача [169,2 K], добавлен 06.01.2012Анализ данных о среднедушевых денежных доходах и расходах населения регионов РФ. Определение параметров линейной регрессионной модели. Построение линии регрессии на диаграмме рассеивания. Определение остатков. Значимость оценки коэффициента регрессии.
контрольная работа [181,7 K], добавлен 10.03.2012