Методические указания к практическим занятиям по курсу "Эконометрика"
Расчет линейного коэффициента парной корреляции и доверительного интервала. Определение коллинеарности переменных. Уравнение парной линейной регрессии. Оценка качества модели с помощью коэффициента детерминации. Расчет среднего коэффициента эластичности.
Рубрика | Экономика и экономическая теория |
Вид | методичка |
Язык | русский |
Дата добавления | 11.12.2015 |
Размер файла | 244,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
4
Федеральное агентство железнодорожного транспорта
Федеральное государственное образовательное учреждение высшего профессионального образования
Петербургский государственный университет путей сообщения
Кафедра «Экономика транспорта»
ЭКОНОМЕТРИКА
Методические указания к практическим занятиям
Часть I
Санкт-Петербург - 2014
Предназначены для студентов-бакалавров, обучающихся по направлению 080100.62 «Экономика» профиль «Экономика предприятий и организаций» (транспорт).
Лабораторная работа №1. Парная линейная и нелинейная корреляция
Социально-экономические явления, обладая большим разнообразием, характеризуются множеством признаков, отражающих те или иные их свойства. При этом для данных явлений характерно то, что наряду с существенными факторами на них оказывают воздействие многие другие, в том числе случайные факторы. В этом случае говорят о статистической зависимости.
Частным случаем статистической зависимости является корреляционная зависимость, имеющая огромное значение в эконометрике. Корреляционная зависимость - это связь, при которой каждому значению независимой переменной х соответствует определенное математическое ожидание (среднее значение) зависимой переменной у. Корреляция между двумя переменными может быть линейной и нелинейной.
Аналитически линейная корреляция определяется уравнением прямой:
(1.1)
К нелинейным относятся все другие виды корреляционных зависимостей, аналитически выражаемых уравнениями вида:
,
,
и т.п.
Тесноту линейной связи между двумя коррелирующими переменными без разделения их на зависимую и независимую переменные характеризуют линейным коэффициентом парной корреляции :
, (1.2)
где - данные наблюдений переменных и ; - количество наблюдений; - средние значения переменных и (простое среднее арифметическое); - средние квадратические отклонения переменных и :
,
(1.3)
Линейный коэффициент парной корреляции изменяется в диапазоне . При связь между переменными является прямой, при связь обратная. Чем ближе к 1, тем теснее линейная связь между переменными и тем точнее аналитическое уравнение отражает данные наблюдений.
Часто используется следующая градация степени тесноты связи парной линейной корреляции: - связь практически отсутствует, - связь слабая, - связь умеренная, - связь сильная, - связь функциональная.
Теснота нелинейной связи между двумя коррелирующими переменными характеризуется индексом корреляции :
, (1.4)
где - расчётные значения переменной , т.е. значения переменной , вычисленные по уравнению нелинейной связи .
Индекс корреляции принимает значения в диапазоне . Чем ближе величина к 1, тем теснее нелинейная связь. При нелинейная связь является функциональной.
Для оценки статистической значимости линейного коэффициента парной корреляции используют расчётный критерий Стьюдента
. (1.5)
Значение сравнивается с критическим табличным значением критерия Стьюдента для количества степеней свободы и заданного уровня значимости . Если , то значение признается статистически значимым, в противном случае - статистически незначимым.
Уровень значимости статистического теста представляет собой вероятность отвергнуть нулевую статистическую гипотезу (обычно принимается на уровне 0,05 или 0,01), если она верна.
Для оценки статистической значимости индекса корреляции используется расчётное значение F-критерия Фишера
. (1.6)
сравнивается с критическим табличным значением критерия Фишера для количества степеней свободы , и заданного уровня значимости . Если , то значение признается статистически значимым, в противном случае - статистически незначимым.
Помимо проверки значимости полученного значения линейного коэффициента парной корреляции важное значение имеет построение доверительного интервала для . Доверительный интервал характеризует границы, в которых находится точное значение оцениваемого показателя с заданной вероятностью .
При построении доверительного интервала для сначала производится расчёт величины с использованием Z-преобразования Фишера
(1.7)
Далее производится интервальная оценка для величины
, (1.8)
где , рассчитанное по формуле 1.7; - квентиль стандартного нормального распределения порядка .
Границы доверительного интервала для рассчитываются на основе границ доверительного интервала для с использованием обратного Z-преобразования Фишера :
,
. (1.9)
Задание
Исходные данные для лабораторной работы представлены табл. 1.1 значений переменных x и y (по вариантам). Расчёты произвести с помощью таблиц MS Excel. Принять уровень значимости .
1. Рассчитать линейный коэффициент парной корреляции и индекс корреляции . В случае необходимости изменить уравнение нелинейной зависимости для математически корректного расчёта индекса корреляции . Сделать выводы о тесноте и характере связи между переменными.
2. Оценить значимость линейного коэффициента парной корреляции и индекса корреляции .
3. Рассчитать доверительный интервал для статистически значимого коэффициента парной корреляции .
Таблица 1.1
Исходные данные к лабораторной работе №1 по вариантам
№ варианта |
Переменная x (из табл. 1 Приложения 1) |
Переменная y (из табл. 1 Приложения 1) |
Уравнение нелинейной зависимости |
|
1 |
Х6 |
Y1 |
||
2 |
Х7 |
Y1 |
||
3 |
Х8 |
Y1 |
||
4 |
Х2 |
Y1 |
||
5 |
Х3 |
Y1 |
||
6 |
Х4 |
Y1 |
||
7 |
Х5 |
Y1 |
||
8 |
Х10 |
Y2 |
||
9 |
Х1 |
Y2 |
||
10 |
Х9 |
Y3 |
||
11 |
Х2 |
Y3 |
||
12 |
Х3 |
Y3 |
||
13 |
Х4 |
Y3 |
||
14 |
Х1 |
Y3 |
||
15 |
Х5 |
Y3 |
Решение типового примера
Пусть даны следующие значения переменных x и y по месяцам 2012 г., а также вид уравнения нелинейной зависимости (табл. 1.2):
Таблица 1.2
Исходные данные типового примера
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
||
x - эксплуатационные расходы, тыс. руб. |
107371 |
88847 |
97500 |
98875 |
96488 |
104853 |
90827 |
94001 |
98028 |
112626 |
94667 |
105943 |
|
y - себестоимость перевозок, руб./ваг-км |
1,63 |
1,44 |
1,41 |
1,50 |
1,32 |
1,44 |
1,22 |
1,24 |
1,41 |
1,63 |
1,43 |
1,49 |
|
Уравнение нелинейной зависимости |
1. Для расчёта линейного коэффициента парной корреляции и индекса корреляции произведём промежуточные вычисления с помощью таблиц MS Excel согласно формулам 1.2, 1.3 и 1.4 в табл. 1.3
корреляция доверительный коллинеарность регрессия
Таблица 1.3
Промежуточные расчёты типового примера
№ п/п |
||||||||||
1 |
107371 |
1,63 |
8202 |
0,20 |
1640,4 |
67275538 |
0,0400 |
22,82 |
520,79 |
|
2 |
88847 |
1,44 |
-10322 |
0,01 |
-103,2 |
106540243 |
0,0001 |
15,56 |
241,99 |
|
3 |
97500 |
1,41 |
-1669 |
-0,02 |
33,4 |
2785005 |
0,0004 |
18,90 |
357,12 |
|
4 |
98875 |
1,50 |
-294 |
0,07 |
-20,6 |
86338 |
0,0049 |
19,36 |
374,86 |
|
5 |
96488 |
1,32 |
-2681 |
-0,11 |
294,9 |
7186867 |
0,0121 |
18,58 |
345,39 |
|
6 |
104853 |
1,44 |
5684 |
0,01 |
56,8 |
32309751 |
0,0001 |
21,92 |
480,35 |
|
7 |
90827 |
1,22 |
-8342 |
-0,21 |
1751,8 |
69586183 |
0,0441 |
16,51 |
272,49 |
|
8 |
94001 |
1,24 |
-5168 |
-0,19 |
981,9 |
26706501 |
0,0361 |
17,69 |
313,02 |
|
9 |
98028 |
1,41 |
-1141 |
-0,02 |
22,8 |
1301501 |
0,0004 |
19,11 |
365,16 |
|
10 |
112626 |
1,63 |
13457 |
0,20 |
2691,4 |
181095335 |
0,0400 |
25,19 |
634,31 |
|
11 |
94667 |
1,43 |
-4502 |
0,00 |
0,0 |
20266503 |
0,0000 |
17,76 |
315,43 |
|
12 |
105943 |
1,49 |
6774 |
0,06 |
406,5 |
45889334 |
0,0036 |
22,34 |
498,95 |
|
Сумма |
1190026 |
17,16 |
7756,1 |
561029100 |
0,1818 |
4719,86 |
||||
Среднее арифметическое суммы |
99169 |
1,43 |
646,3 |
46752425 |
0,0152 |
Тогда согласно формулам 1.2 и 1.3 имеем следующее значение линейного коэффициента парной корреляции:
,
,
Таким образом, для рассматриваемых переменных характерна сильная линейная корреляционная связь, причём положительная (прямая) - с ростом эксплуатационных расходов растёт себестоимость и наоборот.
Индекс корреляции лежит в интервале , т.е. является вещественным числом. Поэтому необходимо изменить предлагаемое уравнение нелинейной зависимости из условия работы (в противном случае подкоренное выражение по данным табл. 1.3 получается отрицательным). Заменяем коэффициент при с на в уравнении и пересчитываем суммы в табл. 1.3. Тогда получаем следующее значение индекса корреляции согласно формуле 1.4:
Как видно из расчёта индекса корреляции нелинейная зависимость между переменными проявляется слабее, нежели линейная.
2. Расчётный критерий Стьюдента для оценки значимости согласно формуле 1.5 равен
Критическое значение статистики Стьюдента находим по табл. 1 Приложения 2 для заданного уровня значимости и количества степеней свободы : . Так как , то найденное значение признается статистически значимым.
Расчётный критерий Фишера для оценки значимости согласно формуле 1.6 равен
.
Критическое значение статистики Фишера находим по табл. 2 Приложения 2 для заданного уровня значимости и количества степеней свободы и : . Так как то найденное значение признается статистически незначимым.
3. Для построения доверительного интервала для статистически значимого рассчитаем величину по формуле 1.7 (Z-преобразование Фишера):
Квентиль стандартного нормального распределения порядка можно получить с помощью функции MS Excel НОРМСТОБР (0,975):
Тогда имеем следующие границы доверительного интервала для согласно формуле 1.8:
,
.
Теперь оценим границы доверительного интервала для на основе границ доверительного интервала для с использованием обратного Z-преобразования Фишера согласно формуле 1.9 с помощью функции ФИШЕРОБР (z) из MS Excel:
,
.
Таким образом, доверительный интервал для равен (0,3471; 0,9314).
Лабораторная работа №2. Парная линейная регрессия
Наиболее простой эконометрической моделью, построенной на основе парной линейной корреляционной связи, является модель парной линейной регрессии, имеющая вид:
, (2.1)
где - независимая (факторная) переменная; - зависимая (результативная) переменная; - параметры (коэффициенты) уравнения регрессии; - независимая, нормально распределённая случайная величина, остаток с нулевым математическим ожиданием и постоянной дисперсией.
Оценка параметров производится классическим методом наименьших квадратов (МНК) путём минимизации суммы квадратов остатков:
(2.2)
В результате минимизации остатков строится система нормальных уравнений. Решением системы находятся следующие формулы для расчёта оценок параметров через наблюдаемые значения переменных
,
. (2.3)
Качество регрессионной модели оценивают с помощью коэффициента детерминации , который определяется по формуле
, (2.4)
где , - расчётные (прогнозные) значения величины , полученные подстановкой соответствующих значений в уравнение регрессии. Коэффициент детерминации показывает, какую часть вариации (дисперсии) зависимой переменной объясняет построенное уравнение регрессии.
Для проверки значимости уравнения регрессии рассчитывается значение критерия Фишера по формуле (k - число факторов):
, (2.5)
где ,
(2.6)
Далее находится критическое значение критерия Фишера для заданного уровня значимости и количества степеней свободы и . Если , то делается вывод о значимости уравнения регрессии (нулевая гипотеза о статистической незначимости уравнения регрессии отвергается), в противном случае уравнение регрессии признается статистически незначимым.
Одним из методов оценки значимости коэффициентов регрессионного уравнения является построение доверительных интервалов. Доверительные интервалы для коэффициентов регрессии имеют соответственно вид
(2.7)
(2.8)
При этом исправленные выборочные оценки стандартных отклонений (ошибок) МНК-коэффициентов регрессии вычисляются по формулам
,
, (2.9)
а критическое значение критерия Стьюдента определяется для количества степеней свободы и заданного уровня значимости .
Если по результатам расчёта доверительного интервала окажется, что доверительный интервал включает 0, то соответствующий коэффициент регрессии объявляется незначимым, в противном случае соответствующий коэффициент значим.
Альтернативным методом оценки значимости рассчитанных коэффициентов регрессионного уравнения является использование расчётных значений t-критерия Стьюдента, которые определяются по формулам:
,
( в общем случае). (2.10)
Расчётные значения t-статистик сравниваются (по модулю) с критическими значениями t -статистик, определёнными для количества степеней свободы и заданного уровня значимости . Если расчётное значение превосходит критическое, то нулевая гипотеза о равенстве нулю коэффициента регрессии отвергается и соответствующий параметр признается значимым, в противном случае - незначимым.
Точность построенного уравнения регрессии можно оценить с помощью средней ошибки аппроксимации (допустимый предел значений - не более 8-10%):
(2.11)
Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат от своей величины при изменении фактора на 1% от своего значения:
(2.12)
Прогнозное значение (точечный прогноз) определяется путём подстановки в уравнение регрессии соответствующего (прогнозного) значения независимой переменной .
Для построения доверительного интервала прогноза сначала вычисляется средняя стандартная ошибка прогноза :
(2.13)
Затем строится сам доверительный интервал по формуле (для заданного уровня значимости ):
(2.14)
Быстрое развитие эконометрики во второй половине ХХ - начале ХХI века одновременно с развитием компьютерных технологий привело к появлению специализированных эконометрических пакетов для построения и анализа эконометрических моделей на компьютерах. К получившим известность эконометрическим пакетам относятся SAS, GAUSS, STATA, TSP, SPSS, Microfit386, Econometric Views. В данной лабораторной работе для расчетов используется некоммерческий эконометрический пакет Gretl, версия 1.9.14.
Задание
Исходные данные для лабораторной работы представлены табл. 1.1 значений переменных x и y (по вариантам, см. лабораторную работу №1, столбцы «№ варианта», «Переменная x», «Переменная y»). Для пунктов 1-8 ниже расчёты произвести в MS Excel, для пунктов 9-10 - в Gretl. Принять для данной лабораторной работы уровень значимости .
1. Составить уравнение парной линейной регрессии .
2. С помощью коэффициента детерминации оценить качество построенной модели.
3. Оценить значимость уравнения регрессии с помощью дисперсионного анализа.
4. Построить доверительные интервалы для оценки параметров регрессии и сделать вывод о значимости параметров.
5. С помощью значений t-статистики Стьюдента для параметров регрессии подтвердить вывод о значимости параметров, полученный в п. 4.
6. Оценить точность построенного уравнения регрессии с помощью средней ошибки аппроксимации.
7. Рассчитать и интерпретировать средний коэффициент эластичности.
8. Определить точечный прогноз при . Построить доверительный интервал прогноза .
9. Определить параметры уравнения регрессии, коэффициент детерминации, расчётные и критические значения t- и F-статистик, исправленные выборочные оценки стандартных отклонений (ошибок) МНК-коэффициентов, доверительные интервалы для коэффициентов регрессии, стандартную ошибку модели с помощью эконометрического пакета Gretl и сравнить с результатами расчёта в MS Excel (результаты должны совпасть).
10. Построить график наблюдаемых значений и прямую регрессии в Gretl, объяснить порядок построения графика.
Решение типового примера
Пусть даны следующие значения переменных x и y по месяцам 2012 г. (табл. 1.2, см. лабораторную работу №1).
1. Для расчётов согласно формулам 2.3, 2.4, 2.6, 2.9, 2.11, 2.12, 2.13, 2.14 произведём промежуточные вычисления с помощью таблиц MS Excel в табл. 2.1.
Таблица 2.1
Промежуточные расчёты типового примера
№ п/п |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
1 |
107371 |
1,63 |
11528531641 |
2,66 |
175014,7 |
1,5434 |
-0,0866 |
|
2 |
88847 |
1,44 |
7893789409 |
2,07 |
127939,7 |
1,2873 |
-0,1527 |
|
3 |
97500 |
1,41 |
9506250000 |
1,99 |
137475,0 |
1,4069 |
-0,0031 |
|
4 |
98875 |
1,50 |
9776265625 |
2,25 |
148312,5 |
1,4259 |
-0,0741 |
|
5 |
96488 |
1,32 |
9309934144 |
1,74 |
127364,2 |
1,3929 |
0,0729 |
|
6 |
104853 |
1,44 |
10994151609 |
2,07 |
150988,3 |
1,5086 |
0,0686 |
|
7 |
90827 |
1,22 |
8249543929 |
1,49 |
110808,9 |
1,3147 |
0,0947 |
|
8 |
94001 |
1,24 |
8836188001 |
1,54 |
116561,2 |
1,3586 |
0,1186 |
|
9 |
98028 |
1,41 |
9609488784 |
1,99 |
138219,5 |
1,4142 |
0,0042 |
|
10 |
112626 |
1,63 |
12684615876 |
2,66 |
183580,4 |
1,6160 |
-0,0140 |
|
11 |
94667 |
1,43 |
8961840889 |
2,04 |
135373,8 |
1,3678 |
-0,0622 |
|
12 |
105943 |
1,49 |
11223919249 |
2,22 |
157855,1 |
1,5237 |
0,0337 |
|
Сумма |
1190026 |
17,16 |
118574519156 |
24,72 |
1709493,3 |
17,1600 |
0,0000 |
|
Среднее арифм. суммы |
99169 |
1,43 |
142457,8 |
1,4300 |
0,0000 |
Продолжение табл. 2.1
№ п/п |
|||||||
1 |
10 |
11 |
12 |
13 |
14 |
15 |
|
1 |
0,0075 |
0,11 |
0,01 |
8202,17 |
67275538,03 |
0,0531 |
|
2 |
0,0233 |
-0,14 |
0,02 |
-10321,83 |
106540243,36 |
0,1060 |
|
3 |
0,0000 |
-0,02 |
0,00 |
-1668,83 |
2785004,69 |
0,0022 |
|
4 |
0,0055 |
0,00 |
0,00 |
-293,83 |
86338,03 |
0,0494 |
|
5 |
0,0053 |
-0,04 |
0,00 |
-2680,83 |
7186867,36 |
0,0553 |
|
6 |
0,0047 |
0,08 |
0,01 |
5684,17 |
32309750,69 |
0,0476 |
|
7 |
0,0090 |
-0,12 |
0,01 |
-8341,83 |
69586183,36 |
0,0776 |
|
8 |
0,0141 |
-0,07 |
0,01 |
-5167,83 |
26706501,36 |
0,0956 |
|
9 |
0,0000 |
-0,02 |
0,00 |
-1140,83 |
1301500,69 |
0,0030 |
|
10 |
0,0002 |
0,19 |
0,03 |
13457,17 |
181095334,69 |
0,0086 |
|
11 |
0,0039 |
-0,06 |
0,00 |
-4501,83 |
20266503,36 |
0,0435 |
|
12 |
0,0011 |
0,09 |
0,01 |
6774,17 |
45889334,03 |
0,0226 |
|
Сумма |
0,0746 |
0,0000 |
0,1072 |
0,0000 |
561029099,67 |
0,5645 |
|
Среднее арифметическое суммы |
0,0062 |
0,0470 |
Согласно формулам 2.3 и промежуточным вычислениям в табл. 2.1 имеем следующие значения оценок коэффициентов регрессии:
,
,
тогда искомое уравнение парной линейной регрессии выглядит следующим образом:
2. Согласно формуле 2.4 и промежуточным вычислениям в таблице 2.1 рассчитаем коэффициент детерминации :
,
таким образом, построенное уравнение регрессии объясняет 59% вариации (дисперсии) зависимой переменной .
3. Для проверки значимости уравнения регрессии рассчитаем значение критерия Фишера по формуле 2.5:
,
,
.
При этом критическое значение критерия Фишера для заданного уровня значимости и количества степеней свободы и согласно табл. 2 Приложения 2 равно . Так как , то делаем вывод о значимости уравнения регрессии.
4. Для построения доверительных интервалов для коэффициентов регрессионного уравнения воспользуемся формулами 2.9 для расчёта исправленных выборочных оценок стандартных отклонений :
,
.
Критическое значение статистики Стьюдента находим по табл. 1 Приложения 2 для заданного уровня значимости и количества степеней свободы : . Соответственно, согласно формулам 2.7 и 2.8 искомые доверительные интервалы для следующие:
,
Т.к. доверительный интервал для включает в себя 0, то коэффициент незначим. Доверительный интервал для не включает в себя 0, поэтому коэффициент значим.
5. Определим расчётные значения t-критерия Стьюдента для коэффициентов регрессии по формулам 2.10:
,
Критическое значение статистики Стьюдента находим по табл. 1 Приложения 2 для заданного уровня значимости и количества степеней свободы : .
Так как , то коэффициент незначим; т.к. , то коэффициент значим. Таким образом, вывод о значимости коэффициентов, полученный в п. 4 лабораторной работы с использованием доверительных интервалов, подтверждён.
6. Оценим точность построенного уравнения регрессии с помощью расчёта средней ошибки аппроксимации по формуле 2.11:
,
т.е. в среднем расчётные значения отклоняются от фактических значений на 4,7%, точность построенного уравнения регрессии высокая.
7. Рассчитаем средний коэффициент эластичности по формуле 2.12:
.
Таким образом, при изменении фактора (эксплуатационные расходы) на +1% от своего значения, результат (себестоимость перевозок) изменится на +0,96% от своей величины в среднем по совокупности.
8. Прогнозное значение независимой переменной , тогда прогнозное значение (точечный прогноз) равен:
Рассчитаем среднюю стандартную ошибку прогноза по формуле 2.13:
Тогда по формуле 2.14 искомый доверительный интервал для ( для и количества степеней свободы ) при :
9. Данные для расчёта в Gretl проще всего импортировать в эконометрический пакет из MS Excel. Перенесём исходные данные (табл. 2.1, столбцы 2 и 3) на лист Excel.
Импортируем данные из подготовленной таблицы Excel в Gretl с помощью функции Файл-Открыть-Импорт-Excel. Теперь построим модель линейной парной регрессии в Gretl с помощью функции Модель-Метод наименьших квадратов с выбором зависимой и независимой переменных.
Рассмотрим построенную в окне Gretl модель.
В столбце «Коэффициенты» показаны коэффициенты регрессии (0,059 и 1,38210-5 соответственно); R-квадрат (коэффициент детерминации) равен 0,589; расчетные значения t-статистик для показаны в столбце «t-статистика» (0,1628 и 3,792 соответственно); расчетное значение F-статистики (F(1, 10)) для уравнения регрессии равно 14,38; стандартные отклонения (ошибки) равны 0,362 и 3,64310-6 соответственно (столбец «Ст. ошибка»); стандартная ошибка модели («Ст. ошибка модели») равна 0,0864.
Критическое значения t-статистики Стьюдента в Gretl может быть получено из основного окна программы с помощью функции Инструменты-Критические значения с последующим выбором соответствующей статистики, степеней свободы и уровня значимости. Аналогично находится критическое значение F-статистики Фишера.
Доверительные интервалы для коэффициентов регрессии могут быть рассчитаны в Gretl с помощью функции Анализ-Доверительные интервалы для коэффициентов в окне модели Gretl.
Результаты расчёта в эконометрическом пакете совпадают с результатами расчёта в MS Excel, приведенными выше в типовом примере данной лабораторной работы.
10. График наблюдаемых значений и прямая регрессии в Gretl строится с помощью функции Графики-График наблюдаемых и расчётных значений-В зависимости от Х в окне построенной модели.
Лабораторная работа №3. Множественная линейная регрессия
Общим случаем линейной регрессии является модель множественной линейной регрессии, имеющая вид:
, (3.1)
где - независимые (факторные) переменные;
- зависимая (результативная) переменная;
- параметры (коэффициенты) уравнения регрессии;
- остаток уравнения регрессии;
- количество факторов регрессии.
Часто модель множественной линейной регрессии записывается в матричной форме:
, (3.2)
где Y - вектор выборочных данных наблюдений зависимой переменной (n элементов), X - матрица выборочных данных наблюдений факторных переменных (n (k+1)-элементов, k - количество факторов), B - вектор параметров уравнения (k+1)-элементов, E - вектор случайных отклонений (n-элементов).
Оценка параметров модели множественной линейной регрессии производится (как и для парной линейной регрессии) классическим методом наименьших квадратов (МНК) путём минимизации суммы квадратов остатков (формула 2.2). Решением полученной системы нормальных уравнений находится вектор B оценок параметров уравнения регрессии:
. (3.3)
При построении уравнения множественной линейной регрессии может возникнуть проблема мультиколлинеарности факторов, их тесной линейной связанности. Две переменные считаются явно коллинеарными (т.е. находящимися между собой в линейной зависимости) если их коэффициент парной линейной корреляции больше или равен 0,7. При рассмотрении факторов для включения в модель один из двух коллинеарных факторов отбрасывается, предпочтение же отдаётся тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.
По величине парных коэффициентов корреляции выясняется лишь явная коллинеарность факторов. В случае сильной межфакторной корреляции для ее преодоления используют ряд подходов, таких как: исключение из модели одного или нескольких факторов, преобразование факторов, переход к совмещенным уравнениям регрессии.
После мер по устранению мультиколлинеарности осуществляется отбор факторов, наиболее влияющих на изменение результативного признака, в уравнение регрессии включают только статистически значимые факторы.
Проверка статистической значимости уравнения множественной линейной регрессии и коэффициентов регрессии осуществляется аналогично случаю парной линейной регрессии с помощью критериев Фишера и Стьюдента (см. лабораторную работу №2, формулы 2.5, 2.6, 2.10). Часто при тестировании используют не сами t- и F-статистики, а рассчитанные для них p-значения. p-значение - это расчётная вероятность допустить ошибку 1-го рода при тестировании, т.е. расчётная вероятность отклонить нулевую гипотезу, если на самом деле она верна. p-значение сравнивается с уровнем значимости статистического теста. Если p-значение оказывается меньше уровня значимости, то нулевая гипотеза отвергается, в противном случае нет оснований для отвержения нулевой гипотезы.
Коэффициент множественной детерминации для множественной регрессии аналогичен по расчёту (формула 2.4) и интерпретации случаю парной линейной регрессии. При добавлении числа факторов значение увеличивается, поэтому скорректированный коэффициент множественной детерминации содержит поправку на число степеней свободы:
(3.4)
Коэффициент множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с результативным признаком, коэффициент лежит в пределах от 0 до 1. Чем ближе значение коэффициента к 1, тем теснее связь. рассчитывается как квадратный корень из коэффициента множественной детерминации.
Для применения МНК требуется, чтобы дисперсия остатков для каждого наблюдения была гомоскедастичной, т.е. постоянной. Если это условие не соблюдается, то имеет место гетероскедастичность остатков, при которой
.
Оценить остатки на гетероскедастичность можно с помощью теста Вайта, являющегося универсальным тестом на гетероскедастичность. Тест позволяет проверить значимость регрессии квадратов остатков относительно комплекса переменных модели и их квадратов.
Если и
,
то для нулевой гипотезы
статистика имеет распределение с k степенями свободы - коэффициент детерминации вспомогательной дисперсии). При нулевой гипотезе о гомоскедастичности остатков модели вспомогательная регрессия должна быть незначимой. Если значение статистики больше критического значения этого распределения для заданного уровня значимости, то нулевая гипотеза отвергается, то есть имеется гетероскедастичность. В противном случае гетероскедастичность признается незначимой. Соответственно, если расчётное р-значение для статистики меньше заданного уровня значимости, то нулевую гипотезу следует отклонить, в противном случае нет оснований для отклонения нулевой гипотезы.
Расчёт среднего коэффициента эластичности для фактора множественной линейной регрессии производится по формуле:
, (3.5)
коэффициент показывает, на сколько процентов в среднем по совокупности изменится результат от своей величины при изменении фактора на 1% от своего значения при неизменных значениях других факторов.
Расчёт бета-коэффициента для фактора производится по формуле:
, (3.6)
где - среднее квадратичное отклонение , - среднее квадратичное отклонение . Бета-коэффициент показывает, на какую часть величины изменится с изменением на величину при фиксированном значении остальных независимых переменных.
Расчёт дельта-коэффициента для фактора производится по формуле:
, (3.7)
где - коэффициент парной линейной корреляции между и , - коэффициент множественной детерминации уравнения регрессии. Дельта-коэффициент показывает долю влияния фактора в суммарном влиянии всех факторов.
Задание
Исходные данные для лабораторной работы представлены табл. 3.1 значений зависимой и независимых переменных (по вариантам). Для пунктов 1-6 ниже расчёты произвести в Gretl, для пункта 7 - в Gretl и MS Excel. Принять уровень значимости .
Таблица 3.1
Исходные данные к лабораторной работе №3 по вариантам
№ варианта |
Независимые переменные (из табл. 2 Прил. 1) |
Зависимая переменная (из табл. 2 Прил. 1) |
|
1 |
X3, X9, X12, X6 |
Y3 |
|
2 |
X2, X8, X12, X1 |
Y3 |
|
3 |
X6, X10, X8, X7 |
Y3 |
|
4 |
X3, X8, X9, X5 |
Y3 |
|
5 |
X1, X3, X5, X6 |
Y1 |
|
6 |
X2, X4, X12, X10 |
Y1 |
|
7 |
X7, X9, X11, X3 |
Y1 |
|
8 |
X7, X3, X12, X2 |
Y1 |
|
9 |
X3, X4, X8, X10 |
Y4 |
|
10 |
X1, X10, X11, X2 |
Y4 |
|
11 |
X6, X9, X12, X5 |
Y4 |
|
12 |
X8, X10, X12, X7 |
Y4 |
|
13 |
X1, X3, X4, X7 |
Y2 |
|
14 |
X8, X10, X12, X2 |
Y2 |
|
15 |
X1, X4, X5, X3 |
Y2 |
1. Построить матрицу парных линейных коэффициентов корреляции для зависимой и всех независимых переменных. Установить, какие факторы коллинеарны.
2. Построить уравнение множественной линейной регрессии, обосновав выбор факторов.
3. Оценить статистическую значимость уравнения множественной регрессии и статистическую значимость коэффициентов уравнения регрессии с использованием p-значений t- и F-статистик.
4. Построить уравнение множественной регрессии со статистически значимыми факторами.
5. Определить значение коэффициента множественной корреляции и детерминации, скорректированное значение коэффициента множественной детерминации.
6. Провести тестирование ошибок уравнения множественной регрессии на гетероскедастичность с использованием теста Вайта.
7. Рассчитать и интерпретировать средние коэффициенты эластичности, бета- и дельта-коэффициенты.
Решение типового примера
Пусть даны следующие значения зависимой и независимых переменных (табл. 3.2).
Таблица 3.2
Исходные данные типового примера
№ варианта |
Независимые переменные (из табл. 2 Приложения 1) |
Зависимая переменная (из табл. 2 Приложения 1) |
|
1 |
X1, X4, X10, X11 |
Y3 |
1. Импортируем данные в Gretl и построим матрицу парных линейных коэффициентов корреляции для зависимой и всех независимых переменных с помощью функции Вид - Корреляционная матрица.
По результатам расчета 0,1688, , , , , . Таким образом, переменные X10 и X11 явно коллинеарны.
2. Построим уравнение множественной линейной регрессии с помощью функции Модель-Метод наименьших квадратов. Фактор X11 исключаем из построения, т.к. он коллинеарен с X10 и его связь с другими факторами сильнее, нежели у X10 (). При этом теснота связи X10 с результативным признаком высокая (). Итак, искомое уравнение множественной линейной регрессии выглядит следующим образом:
3. Построенное уравнение множественной линейной регрессии статистически значимо, так как p-значение для расчётной статистики Фишера (количество степеней свободы и ) меньше уровня значимости : .
Коэффициент статистически незначим, т.к. для расчётного значения t-статистики (количество степеней свободы ) p-значение больше уровня значимости : . Аналогичные p-значения для коэффициентов меньше , следовательно коэффициенты статистически значимы.
4. Построим уравнение множественной линейной регрессии с помощью функции Модель-Метод наименьших квадратов, исключив фактор X4. Полученное уравнение множественной линейной регрессии выглядит следующим образом:
На основе анализа р-значений для расчётных t- и F-статистик построенное уравнение регрессии и все коэффициенты регрессии являются статистически значимыми.
5. Рассчитанное значение коэффициента множественной детерминации: ; скорректированное значение коэффициента множественной детерминации: . Таким образом, построенное уравнение регрессии объясняет 54% вариации (дисперсии) зависимой переменной .
Рассчитаем значение коэффициента множественной корреляции: , т.е. теснота связи результативного признака с набором включённых в модель факторов достаточно высокая.
6. Проведём тестирование ошибок уравнения множественной регрессии на гетероскедастичность с использованием теста Вайта в Gretl с помощью функции Тесты - Гетероскедастичность - Тест Вайта в окне построенной модели. Расчётная вероятность допустить ошибку (p-значение = 7,4810-12) меньше уровня значимости и свидетельствует о том, что нулевую гипотезу (гетероскедастичность отсутствует) нужно отклонить, т. е. дисперсия остатков модели неоднородна.
Вероятная причина неоднородности дисперсии - наличие во множестве данных выпадающих значений (т.е. объектов, обладающих особыми свойствами, которые резко отличаются от свойств большинства других объектов рассматриваемой совокупности). Действительно, валовой региональный продукт г. Москва, г. Санкт-Петербург, Тюменской обл. (зависимая переменная), а также численность обучающихся по программам среднего профессионального образования в г. Москва, г. Санкт-Петербург, Краснодарском крае, республике Башкортостан (независимая переменная X10) существенно превышают средние значения.
7. Рассчитаем средние коэффициенты эластичности, бета- и дельта-коэффициенты по формулам 3.5, 3.6, 3.7 (средние значения зависимой и независимых переменных, а также их средние квадратические отклонения получаем в Gretl с помощью функции Вид-Описательная статистика):
, ,
, ,
, .
Следовательно, при изменении фактора X1 (плотность железнодорожных путей общего пользования) на +1% от своего значения результат Y3 (валовой региональный продукт) изменится на +0,65% от своей величины в среднем по совокупности при неизменных значениях других факторов. При изменении фактора X10 (численность обучающихся по программам среднего профессионального образования) на +1% от своего значения результат Y3 (валовой региональный продукт) изменится на +1,70% от своей величины в среднем по совокупности при неизменных значениях других факторов.
Трактовка полученных значений бета-коэффициентов аналогична трактовке средних коэффициентов эластичности (разница заключается только в том, что используются величины средних квадратичных отклонений переменных, а не проценты).
По рассчитанным значениям дельта-коэффициентов видно, что в суммарном влиянии всех факторов доля влияния фактора X1 составляет 0,16, а фактора X10-0,84.
Библиографический список
1. Елисеева И.И. и др. Эконометрика. Учебник для бакалавров. - М.: Проспект, 2014. - 288 с.
2. Тимофеев В. и др. Эконометрика. - М.: Юрайт, 2014. - 336 с.
3. Кремер Н.Ш., Путко Б.А. Эконометрика. - М.: Юнити-Дана, 2010. - 328 с.
4. Гореева Н.М., Демидова Л.Н. и др. Эконометрика: Учебное пособие в схемах и таблицах. - М.: Эксмо, 2008 г. - 224 с.
5. Елисеева И.И. Практикум по эконометрике. - М.: Финансы и статистика, 2007. - 344 с.
6. Куфель Т. Эконометрика. Решение задач с применением пакета программ Gretl. - М.: Горячая линия-Телеком, 2007. - 200 с.
Интернет-ресурсы
1. Gnu Regression, Econometrics and Time-series Library - интернет-сайт эконометрического пакета Gretl
2. Эконометрика. Библиотека. Единое окно доступа к образовательным ресурсам
3. Ресурсы по статистике и эконометрике
4. Экономическая библиотека онлайн
5. Электронные библиотеки России. Полнотекстовые pdf-учебники
6. Российский статистический ежегодник. Федеральная служба государственной статистики
7. Транспорт и связь в России. Федеральная служба государственной статистики
8. Отчетность ОАО «РЖД»
Приложение 1
Таблица 1
Выполнение некоторых основных показателей предприятием железнодорожного транспорта по месяцам 2012 года (отчёт)
Переменная |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
Х1 |
1594,0 |
1522,0 |
1726,0 |
1610,0 |
1715,0 |
1706,0 |
1725,0 |
1740,0 |
1662,0 |
1731,0 |
1659,0 |
1775,0 |
|
Х2 |
51709,0 |
50608,0 |
55919,0 |
52826,0 |
57353,0 |
54828,0 |
54999,0 |
55839,0 |
53737,0 |
55608,0 |
53116,0 |
57667,0 |
|
Х3 |
14335,0 |
11220,0 |
13069,0 |
12981,0 |
15957,0 |
17736,0 |
19444,0 |
19716,0 |
15755,0 |
13448,0 |
12880,0 |
13657,0 |
|
Х4 |
2349 |
2511 |
2485 |
2346 |
2364 |
2714 |
2808 |
2664 |
2680 |
2479 |
2189 |
2268 |
|
Х5 |
2,82 |
2,48 |
2,49 |
2,24 |
2,14 |
2,08 |
2,00 |
2,05 |
2,25 |
2,19 |
2,30 |
3,07 |
|
Х6 |
34,0 |
33,8 |
32,2 |
28,8 |
29,8 |
32,1 |
32,3 |
30,8 |
31,6 |
28,4 |
26,9 |
29,1 |
|
Х7 |
1273,1 |
1231,8 |
1199,7 |
1074,1 |
1154,0 |
1184,2 |
1194,2 |
1178,8 |
1193,5 |
1160,0 |
1089,0 |
1133,4 |
|
Х8 |
3333 |
3288 |
3358 |
3298 |
3283 |
3332 |
3321 |
3331 |
3314 |
3338 |
3355 |
3359 |
|
Х9 |
1990 |
2010 |
2022 |
2017 |
1957 |
1970 |
1956 |
1950 |
1942 |
1938 |
1954 |
1945 |
|
Х10 |
73942 |
58531 |
63443 |
69515 |
64597 |
70067 |
62941 |
63230 |
64615 |
75967 |
62624 |
66894 |
|
Y1 |
1,63 |
1,44 |
1,41 |
1,50 |
1,32 |
1,44 |
1,22 |
1,24 |
1,41 |
1,63 |
1,43 |
1,49 |
|
Y2 |
107371 |
88847 |
97500 |
98875 |
96488 |
104853 |
90827 |
94001 |
98028 |
112626 |
94667 |
105943 |
|
Y3 |
33,2 |
30,8 |
34,1 |
32,6 |
37,5 |
36,8 |
38,1 |
38,7 |
35,8 |
35,6 |
33,8 |
36,7 |
|
Примечание: 1. Независимые переменные: Х1 - грузооборот, млн. ткм; Х2 - вагоно-км (грузовое движение), тыс. ваг-км; Х3 - вагоно-км (пассажирское движение), тыс. ваг-км; Х4 - производительность вагона, ткм нетто; Х5 - оборот местного вагона, сутки; Х6 - участковая скорость, км/ч; Х7 - производительность локомотива, ткм брутто; Х8 - вес поезда брутто, тонны; Х9 - контингент по эксплуатации, чел.; Х10 - фонд оплаты труда (ФОТ) по основной деятельности, тыс. руб. 2. Зависимые переменные: Y1 - себестоимость перевозок, руб./ваг.-км; Y2 - эксплуатационные расходы, тыс. руб.; Y3 - производительность труда, тыс. ваг-км/чел. |
Таблица 2
Некоторые показатели социально-экономического развития и железнодорожная статистика по регионам Российской Федерации в 2011 году
Субъект РФ |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
X10 |
X11 |
X12 |
Y1 |
Y2 |
Y3 |
Y4 |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
|
Белгородская область |
258 |
56,8 |
4,581 |
0 |
0 |
111 |
4,5 |
0,77 |
18,8 |
20 |
73,4 |
3,32 |
23,2 |
26 |
511,7 |
166,6 |
|
Брянская область |
289 |
21,4 |
6,568 |
0 |
0 |
108 |
7,7 |
0,64 |
15,3 |
18,1 |
51,8 |
0,05 |
30,4 |
26 |
179,9 |
135,8 |
|
Владимирская область |
317 |
2 |
6,667 |
0 |
0 |
108 |
5,2 |
0,77 |
14,3 |
19,3 |
49,4 |
0,52 |
27,1 |
26 |
256,4 |
122,5 |
|
Воронежская область |
220 |
11,1 |
9,253 |
0 |
0 |
108 |
14 |
1,17 |
15,9 |
36,4 |
125 |
0,80 |
26,0 |
26 |
447,2 |
264,4 |
|
Ивановская область |
161 |
1,1 |
1,778 |
0 |
0 |
117 |
2,6 |
0,55 |
13,0 |
13,4 |
45,7 |
0,27 |
21,6 |
24 |
127,2 |
90,9 |
|
Калужская область |
293 |
1,1 |
5,373 |
0 |
0 |
106 |
2,8 |
0,56 |
17,6 |
13,9 |
33,8 |
0,93 |
30,4 |
26 |
234,3 |
119,1 |
|
Костромская область |
107 |
1,9 |
2,245 |
0 |
0 |
108 |
5,4 |
0,35 |
14,6 |
9,2 |
20,5 |
0,05 |
24,6 |
25 |
111,5 |
57,6 |
|
Курская область |
352 |
19 |
2,554 |
0 |
0 |
105 |
2,7 |
0,57 |
16,4 |
18,7 |
67,7 |
0,06 |
29,3 |
27 |
233,4 |
116,0 |
|
Липецкая область |
315 |
22,1 |
1,26 |
0 |
0 |
108 |
6 |
0,61 |
16,8 |
15,8 |
38,4 |
0,53 |
23,7 |
26 |
285,9 |
138,6 |
|
Московская область |
400 |
12,2 |
254,4 |
0 |
0 |
107 |
19 |
4,02 |
25,6 |
59,8 |
157 |
5,46 |
39,6 |
30 |
2243,3 |
1207,8 |
|
Орловская область |
241 |
1,1 |
1,794 |
0 |
0 |
118 |
3,9 |
0,39 |
14,8 |
11,6 |
41 |
0,02 |
27,2 |
25 |
131,0 |
73,9 |
|
Рязанская область |
243 |
14,5 |
3,583 |
0 |
0 |
106 |
6,4 |
0,57 |
14,8 |
19,4 |
54,1 |
0,11 |
32,4 |
26 |
210,4 |
112,9 |
|
Смоленская область |
232 |
9,7 |
2,373 |
0 |
0 |
107 |
7,5 |
0,55 |
16,0 |
16,8 |
43,4 |
0,36 |
29,8 |
26 |
183,2 |
109,6 |
|
Тамбовская область |
214 |
4,1 |
3,066 |
0 |
0 |
108 |
6,9 |
0,54 |
15,2 |
15,4 |
38,7 |
0,01 |
23,1 |
25 |
182,3 |
115,0 |
|
Тверская область |
214 |
1,6 |
6,91 |
0 |
0 |
109 |
6,7 |
0,72 |
14,9 |
20,6 |
39,9 |
0,14 |
27,5 |
28 |
253,8 |
142,3 |
|
Тульская область |
369 |
11,2 |
3,37 |
1 |
0 |
105 |
7,4 |
0,81 |
17,0 |
19,3 |
49,2 |
0,51 |
29,0 |
26 |
272,5 |
171,4 |
|
Ярославская область |
181 |
14 |
6,255 |
0 |
0 |
109 |
7,8 |
0,68 |
15,5 |
19,2 |
48,3 |
0,06 |
35,1 |
25 |
285,2 |
128,1 |
|
Москва |
605 |
6,1 |
294,75 |
0 |
0 |
114 |
44 |
6,64 |
47,3 |
123 |
1029 |
123,08 |
52,4 |
19 |
10021,6 |
3322,0 |
|
Республика Карелия |
123 |
23,7 |
1,48 |
0 |
0 |
107 |
11 |
0,34 |
17,5 |
10,8 |
22 |
0,42 |
36,4 |
25 |
142,9 |
69,9 |
|
Республика Коми |
41 |
19,9 |
3,014 |
0 |
1 |
112 |
10 |
0,50 |
23,9 |
15 |
31,6 |
0,35 |
40,0 |
25 |
433,8 |
126,6 |
|
Архангельская область |
30 |
12,3 |
4,495 |
0 |
0 |
110 |
13 |
0,66 |
21,5 |
18,4 |
37,9 |
0,79 |
38,1 |
25 |
440,2 |
144,7 |
|
Вологодская область |
53 |
18,9 |
3,337 |
0 |
0 |
107 |
10 |
0,65 |
15,6 |
17,5 |
41,3 |
1,11 |
30,4 |
27 |
317,0 |
100,0 |
|
Калининградская область |
417 |
3,7 |
2,927 |
1 |
1 |
107 |
4,9 |
0,53 |
16,9 |
14 |
40,3 |
0,31 |
27,8 |
24 |
230,3 |
100,9 |
|
Ленинградская область |
289 |
36,9 |
25,674 |
0 |
0 |
98,4 |
1,6 |
0,98 |
15,9 |
11,5 |
14,7 |
0,74 |
28,2 |
26 |
563,6 |
209,7 |
|
Мурманская область |
60 |
28,2 |
0,996 |
0 |
0 |
108 |
7,7 |
0,47 |
25,3 |
10,5 |
28,3 |
0,03 |
44,8 |
25 |
260,3 |
112,8 |
|
Новгородская область |
210 |
5,9 |
1,411 |
0 |
0 |
111 |
2,1 |
0,34 |
17,0 |
7,9 |
19,1 |
0,39 |
24,7 |
28 |
149,0 |
67,7 |
|
Псковская область |
197 |
5,5 |
2,046 |
0 |
1 |
125 |
6,7 |
0,36 |
14,2 |
7,5 |
24,2 |
0,08 |
24,6 |
28 |
102,3 |
69,0 |
|
Санкт-Петербург |
410 |
7,5 |
56,701 |
0 |
1 |
105 |
26 |
2,86 |
26,1 |
62,5 |
401 |
6,12 |
36,7 |
23 |
2071,8 |
742,1 |
|
Республика Адыгея |
205 |
2,2 |
0,1 |
0 |
0 |
108 |
0,1 |
0,20 |
14,3 |
5,3 |
18,2 |
0,11 |
21,8 |
24 |
55,2 |
45,0 |
|
Республика Калмыкия |
22 |
0 |
0,004 |
0 |
0 |
107 |
0 |
0,15 |
8,8 |
4,7 |
12,7 |
0,00 |
23,3 |
22 |
28,8 |
12,4 |
|
Краснодарский край |
277 |
40 |
15,714 |
1 |
1 |
113 |
22 |
2,59 |
18,8 |
81,3 |
174 |
0,77 |
24,1 |
23 |
1229,7 |
731,4 |
|
Астраханская область |
128 |
25,9 |
1,3 |
1 |
0 |
112 |
7,5 |
0,53 |
16,0 |
20,2 |
41,6 |
0,01 |
28,8 |
21 |
170,5 |
116,8 |
|
Волгоградская область |
143 |
16 |
4,334 |
0 |
1 |
116 |
13 |
1,34 |
14,5 |
43,1 |
105 |
0,42 |
23,9 |
22 |
499,0 |
254,4 |
|
Ростовская область |
182 |
25 |
16,177 |
0 |
1 |
108 |
24 |
2,17 |
16,0 |
63,4 |
201 |
2,30 |
25,4 |
22 |
761,8 |
542,5 |
|
Республика Дагестан |
101 |
2,7 |
0,716 |
0 |
0 |
108 |
3 |
1,36 |
18,3 |
25,9 |
97,4 |
0,09 |
21,6 |
17 |
327,0 |
358,2 |
|
Республика Ингушетия |
108 |
0,1 |
0,041 |
0 |
0 |
135 |
0,5 |
0,19 |
11,6 |
2,1 |
11,7 |
0,00 |
21,5 |
14 |
26,1 |
13,3 |
|
Кабардино-Балкарская республика |
107 |
0,6 |
0,624 |
0 |
0 |
107 |
1 |
0,37 |
12,6 |
7,1 |
24,6 |
0,00 |
18,8 |
18 |
90,6 |
73,1 |
|
Карачаево-Черкесская республика |
35 |
2,8 |
0,056 |
0 |
0 |
109 |
0,1 |
0,23 |
11,7 |
4,7 |
15,4 |
0,00 |
22,4 |
19 |
49,6 |
31,0 |
|
Республика Северная Осетия |
180 |
1,6 |
0,54 |
0 |
0 |
107 |
0,3 |
0,36 |
13,8 |
7,8 |
31,6 |
0,00 |
18,8 |
26 |
85,2 |
67,4 |
|
Чеченская республика |
195 |
0,2 |
0,382 |
0 |
0 |
118 |
1,1 |
0,55 |
14,0 |
12,8 |
33,2 |
0,00 |
19,5 |
14 |
86,3 |
73,1 |
|
Ставропольский край |
139 |
0,9 |
8,08 |
0 |
0 |
108 |
6,6 |
1,38 |
14,4 |
42,4 |
127 |
0,55 |
22,4 |
22 |
399,9 |
332,4 |
|
Республика Башкортостан |
102 |
8,7 |
5,974 |
0 |
0 |
113 |
15 |
2,08 |
19,0 |
76,6 |
159 |
0,31 |
26,1 |
22 |
951,8 |
578,0 |
|
Республика Марий Эл |
65 |
29,4 |
0,406 |
0 |
0 |
109 |
0,4 |
0,37 |
11,3 |
11,2 |
27,8 |
0,01 |
21,7 |
23 |
96,6 |
50,3 |
|
Республика Мордовия |
208 |
1,6 |
1,469 |
0 |
0 |
108 |
3,7 |
0,47 |
11,9 |
13,2 |
38,1 |
0,14 |
24,5 |
25 |
126,8 |
53,0 |
|
Республика Татарстан |
126 |
3,1 |
10,33 |
0 |
0 |
107 |
15 |
2,04 |
20,2 |
61,2 |
200 |
0,86 |
26,2 |
23 |
1275,5 |
534,9 |
|
Удмуртская республика |
185 |
11,7 |
3,917 |
0 |
0 |
112 |
4,4 |
0,84 |
14,5 |
25,9 |
65,2 |
0,04 |
25,4 |
20 |
335,4 |
140,0 |
|
Чувашская республика |
217 |
4,3 |
1,446 |
0 |
0 |
107 |
2,1 |
0,66 |
12,1 |
19,1 |
59,5 |
0,02 |
23,3 |
24 |
188,4 |
97,0 |
|
Пермский край |
98 |
1 |
8,771 |
0 |
0 |
107 |
17 |
1,39 |
21,3 |
46 |
95,9 |
1,71 |
27,3 |
22 |
803,3 |
365,9 |
|
Кировская область |
91 |
40,1 |
6,531 |
0 |
1 |
108 |
8,3 |
0,71 |
14,7 |
21,5 |
48,7 |
0,14 |
28,2 |
23 |
202,2 |
116,6 |
|
Нижегородская область |
158 |
7 |
20,747 |
0 |
0 |
116 |
21 |
1,79 |
18,3 |
49,8 |
152 |
1,00 |
28,5 |
24 |
770,4 |
421,5 |
|
Оренбургская область |
117 |
18,5 |
3,544 |
0 |
0 |
107 |
12 |
1,05 |
14,9 |
40,1 |
76,7 |
0,59 |
26,1 |
23 |
553,8 |
187,1 |
|
Пензенская область |
191 |
34,8 |
3,004 |
0 |
0 |
109 |
5,3 |
0,69 |
14,2 |
21,1 |
54,2 |
0,05 |
23,2 |
25 |
200,1 |
131,0 |
|
Самарская область |
256 |
1,2 |
10,654 |
0 |
0 |
107 |
23 |
1,75 |
21,8 |
52 |
151 |
1,87 |
26,2 |
23 |
832,6 |
463,9 |
|
Саратовская область |
228 |
23,2 |
7,849 |
0 |
1 |
107 |
23 |
1,31 |
13,1 |
44,4 |
111 |
0,17 |
25,8 |
26 |
427,3 |
214,5 |
|
Ульяновская область |
187 |
13,9 |
1,681 |
0 |
0 |
112 |
4,7 |
0,69 |
14,3 |
21 |
53,8 |
0,07 |
22,1 |
24 |
223,4 |
115,4 |
|
Курганская область |
104 |
3,8 |
3,008 |
0 |
0 |
106 |
4,4 |
0,45 |
14,4 |
14,5 |
33,9 |
0,07 |
32,3 |
22 |
136,8 |
80,0 |
|
Свердловская область |
183 |
10 |
20,02 |
1 |
0 |
106 |
45 |
2,31 |
24,9 |
74,5 |
186 |
1,57 |
28,9 |
23 |
1265,7 |
764,6 |
|
Тюменская область |
17 |
62,1 |
7,999 |
0 |
0 |
108 |
17 |
1,92 |
30,7 |
47,4 |
143 |
12,61 |
43,8 |
21 |
4091,6 |
574,4 |
|
Челябинская область |
203 |
30 |
7,95 |
0 |
0 |
107 |
28 |
1,88 |
18,5 |
53,9 |
167 |
3,80 |
28,5 |
23 |
775,9 |
421,4 |
|
Республика Бурятия |
35 |
62 |
2,585 |
0 |
0 |
116 |
5,2 |
0,46 |
15,7 |
19,9 |
46,3 |
0,03 |
40,7 |
20 |
154,7 |
100,9 |
|
Республика Хакасия |
108 |
13,4 |
0 |
0 |
0 |
109 |
6,4 |
0,27 |
14,2 |
9,3 |
15,4 |
0,20 |
35,1 |
21 |
115,7 |
46,0 |
|
Алтайский край |
86 |
15,1 |
0,713 |
0 |
0 |
111 |
9,7 |
1,22 |
12,5 |
34,1 |
82,8 |
0,02 |
26,8 |
22 |
336,2 |
218,1 |
|
Забайкальский край |
56 |
18,3 |
0 |
0 |
0 |
107 |
29 |
0,54 |
16,0 |
18,7 |
38 |
0,15 |
40,8 |
20 |
208,3 |
106,4 |
|
Красноярский край |
9 |
12,4 |
8,223 |
0 |
0 |
117 |
29 |
1,51 |
20,1 |
47 |
112 |
1,28 |
36,1 |
23 |
1188,8 |
361,6 |
|
Иркутская область |
32 |
52,7 |
2,265 |
0 |
1 |
109 |
14 |
1,26 |
16,0 |
40,5 |
113 |
0,26 |
42,9 |
22 |
627,9 |
225,8 |
|
Кемеровская область |
176 |
59,3 |
0,791 |
1 |
0 |
107 |
23 |
1,41 |
16,7 |
43,5 |
87,6 |
1,30 |
28,6 |
22 |
740,7 |
287,3 |
|
Новосибирская область |
85 |
222 |
10,756 |
1 |
1 |
104 |
25 |
1,45 |
18,2 |
37,3 |
141 |
0,53 |
30,2 |
22 |
576,8 |
368,3 |
|
Омская область |
53 |
15,6 |
3,256 |
0 |
0 |
107 |
11 |
1,07 |
17,2 |
40,8 |
102 |
0,62 |
25,8 |
23 |
448,7 |
228,6 |
|
Томская область |
11 |
17,1 |
8,219 |
0 |
0 |
108 |
0,8 |
0,51 |
16,5 |
14,7 |
78 |
0,41 |
23,5 |
22 |
337,7 |
93,1 |
|
Республика Саха (Якутия) |
2 |
2,3 |
18,059 |
0 |
0 |
113 |
1,8 |
0,49 |
25,6 |
18 |
41,8 |
1,40 |
48,8 |
20 |
483,0 |
119,6 |
|
Приморский край |
95 |
9,3 |
8,5 |
0 |
0 |
107 |
17 |
1,06 |
19,2 |
32,5 |
89,7 |
0,08 |
37,4 |
21 |
546,6 |
195,8 |
|
Хабаровский край |
27 |
15,8 |
23,758 |
0 |
0 |
107 |
21 |
0,75 |
23,8 |
22,9 |
78,7 |
0,12 |
44,6 |
22 |
401,5 |
167,1 |
|
Амурская область |
81 |
20,7 |
4,419 |
0 |
0 |
111 |
15 |
0,45 |
17,8 |
16,7 |
27,3 |
0,48 |
43,0 |
23 |
223,7 |
86,0 |
|
Сахалинская область |
96 |
22,4 |
0,943 |
0 |
0 |
108 |
3,5 |
0,29 |
32,3 |
8,2 |
12,8 |
7,09 |
44,8 |
24 |
596,9 |
97,4 |
|
Еврейская автономная область |
141 |
2,6 |
0,169 |
1 |
0 |
105 |
3,7 |
0,09 |
16,5 |
2,4 |
7,4 |
0,10 |
39,7 |
23 |
36,5 |
15,5 |
|
Примечание: 1. Независимые переменные: Х1 - плотность железнодорожных путей общего пользования, км на 1000 км2 территории; Х2 - отправление грузов железнодорожного транспорта общего пользования по субъектам РФ (млн. тонн); Х3 - отправление пассажиров железнодорожного транспорта общего пользования по субъектам РФ (млн. чел.); Х4 - ввод в действие новых железнодорожных линий (1-вводились, 0-не вводились - фиктивная переменная); Х5 - ввод в действие вторых железнодорожных путей (1-вводились, 0-не вводились - фиктивная переменная); Х6 - индексы тарифов на отдельные группы услуг пассажирского транспорта по субъектам РФ (железнодорожного транспорта); Х7 - среднегодовая численность работников железнодорожного транспорта (тысяч человек) по субъектам РФ; Х8 - численность экономически активного населения по субъектам РФ, млн. чел.; Х9 - среднедушевые денежные доходы населения по субъектам РФ в месяц, тыс. руб.; Х10 - численность обучающихся по программам среднего профессионального образования по субъектам РФ(на начало учебного года; тысяч человек); Х11 - численность обучающихся по программам высшего профессионального образования по субъектам РФ(на начало учебного года; тысяч человек); Х12 - поступление иностранных инвестиций по субъектам РФ, млрд. долл. США. 2. Зависимые переменные: Y1 - среднемесячная номинальная начисленная заработная плата работников железнодорожного транспорта по субъектам РФ (тыс. рублей); Y2 - общая площадь жилых помещений, приходящаяся в среднем на 1 жителя, по субъектам РФ, м2; Y3 - валовой региональный продукт, млрд. руб.; Y4 - оборот розничной торговли по субъектам РФ (в фактически действовавших ценах; млрд. рублей). |
Приложение 2
Таблица 1
Критические точки распределения Стьюдента (сокращённая версия)
Уровень значимости (двусторонняя критическая область) |
||||
0,10 |
0,05 |
0,01 |
||
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 |
6,31 2,92 2,35 2,13 2,01 1,94 1,89 1,86 1,83 1,81 1,80 1,78 1,77 1,76 1,75 1,75 1,74 1,73 1,73 1,73 1,72 1,72 1,71 1,71 1,71 1,71 1,71 1,70 1,70 1,70 1,68 1,67 1,66 1,64 |
12,7 4,30 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23 2,20 2,18 2,16 2,14 2,13 2,12 2,11 2,10 2,09 2,09 2,08 2,07 2,07 2,06 2,06 2,06 2,05 2,05 2,05 2,04 2,02 2,00 1,98 1,96 |
63,7 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17 3,11 3,05 3,01 2,98 2,95 2,92 2,90 2,88 2,86 2,85 2,83 2,82 2,81 2,80 2,79 2,78 2,77 2,76 2,76 2,75 2,70 2,66 2,62 2,58 |
|
0,05 |
0,025 |
0,005 |
||
Уровень значимости (односторонняя критическая область) |
Таблица 2
Критические точки распределения Фишера (сокращённая версия) (уровень значимости ; число степеней свободы большей дисперсии, число степеней свободы меньшей дисперсии)
1 |
2 |
3 |
4 |
||
1 |
161 |
200 |
216 |
225 |
|
2 |
18,5 |
19,0 |
19,2 |
19,2 |
|
3 |
10,1 |
9,55 |
9,28 |
9,12 |
|
4 |
7,71 |
6,94 |
6,59 |
6,39 |
|
5 |
6,61 |
5,79 |
5,41 |
5,19 |
|
6 |
5,99 |
5,14 |
4,76 |
4,53 |
|
7 |
5,59 |
4,74 |
4,35 |
4,12 |
|
8 |
5,32 |
4,46 |
4,07 |
3,84 |
|
9 |
5,12 |
4,26 |
3,86 |
3,63 |
|
10 |
4,96 |
4,10 |
3,71 |
3,48 |
|
11 |
4,84 |
3,98 |
3,59 |
3,36 |
|
12 |
4,75 |
3,88 |
3,49 |
3,26 |
|
13 |
4,67 |
3,80 |
3,41 |
3,18 |
|
14 |
4,60 |
3,74 |
3,34 |
3,11 |
|
15 |
4,54 |
3,68 |
3,29 |
3,06 |
|
16 |
4,49 |
3,63 |
3,24 |
3,01 |
|
17 |
4,45 |
3,59 |
3,20 |
2,96 |
|
18 |
4,41 |
3,55 |
3,16 |
2,93 |
|
19 |
4,38 |
3,52 |
3,13 |
2,90 |
|
20 |
4,35 |
3,49 |
3,10 |
2,87 |
|
21 |
4,32 |
3,47 |
3,07 |
2,84 |
|
22 |
4,30 |
3,44 |
3,05 |
2,82 |
|
23 |
4,28 |
3,42 |
3,03 |
2,80 |
|
24 |
4,26 |
3,40 |
3,01 |
2,78 |
|
25 |
4,24 |
3,39 |
2,99 |
2,76 |
|
30 |
4,17 |
3,32 |
2,92 |
2,69 |
|
40 |
4,08 |
3,23 |
2,84 |
2,61 |
|
3,84 |
3,00 |
3,60 |
2,37 |
Размещено на Allbest.ru
Подобные документы
Параметры уравнений линейной, степенной парной. Оценка тесноты связи с помощью показателей корреляции и детерминации, качества уравнений с помощью средней ошибки аппроксимации. Определение прогнозного значения от среднего значения заданного параметра.
контрольная работа [150,5 K], добавлен 22.02.2016Расчет параметров уравнения линейной регрессии, экономическая интерпретация регрессии. Определение остаточной суммы квадратов. Выполнение предпосылок МНК. Расчет коэффициента детерминации, проверка значимости уравнения регрессии с помощью критерия Фишера.
контрольная работа [317,0 K], добавлен 11.05.2009Изучение зависимости доли сельского населения от величины среднедушевых денежных доходов. Расчет параметров линейной функции на основании исходных данных по областям. Определение среднего коэффициента эластичности. Расчет коэффициента корреляции.
методичка [55,1 K], добавлен 02.06.2012Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.
контрольная работа [1,3 M], добавлен 24.09.2013Расчет параметров линейной и степенной парной регрессии. Показатели корреляции и детерминации, методика их расчета. Средняя ошибка аппроксимации. Оценка с помощью F-критерия Фишера статистической надежности результатов регрессионного моделирования.
контрольная работа [25,2 K], добавлен 20.11.2014Структурная группировка статистических наблюдений на предприятиях по объёму перевезённого груза. Расчет показателей вариации. Оценка значимости коэффициента корреляции. Расчет связей между случайными величинами и для линейной парной зависимости.
курсовая работа [411,3 K], добавлен 13.01.2014Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.
контрольная работа [47,3 K], добавлен 15.06.2009Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.
контрольная работа [513,5 K], добавлен 02.05.2015Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.
лабораторная работа [1,6 M], добавлен 13.04.2010Автоматический анализ тренда на базе диаграммы экспериментальных данных Х и У с помощью программы MSExcel. Прогноз заработной платы при заданном значении среднедушевого прожиточного минимума с помощью пакета анализа. Уравнение линейной парной регрессии.
контрольная работа [363,4 K], добавлен 22.01.2015