Корреляционный и регрессионный анализ
Корреляционный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчёт частных и множественных коэффициентов. Проверка исходных данных на мультиколлинеарность. Построение регрессионной модели, её интерпретация.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 16.12.2011 |
Размер файла | 477,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Московский государственный университет экономики, статистики и информатики (МЭСИ)
Курсовая работа
«Корреляционный и регрессионный анализ»
Оглавление
1. Введение
2. Корреляционный анализ экономических показателей
2.1 Построение матрицы парных коэффициентов корреляции
2.2 Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции
2.3 Расчёт множественных коэффициентов корреляции
3. Регрессионный анализ экономических показателей
3.1 Проверка исходных данных на мультиколлинеарность
3.2 Построение регрессионной модели и её интерпретация
3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии
Введение
В банковской, финансовой сфере, при проведении маркетинговых и социологических исследований, при обработке различных экономических данных требуется оценка взаимосвязи показателей и моделирование их зависимости для дальнейшего прогнозирования. Эти задачи призваны решать методы корреляционного и регрессионного анализов.
Указанные методы статистической обработки данных реализованы в настоящее время во многих программных продуктах и статистических пакетах анализа переменных. Акцент на использование в данной работе именно ППП Microsoft Excel сделан потому, что Microsoft Office, в состав которого входит указанный программный продукт, имеет в настоящее время наибольшее распространение и доступен всем пользователям современных компьютеров, в отличие от многих специальных статистических пакетов.
Пособие предназначено студентам, аспирантам и научным сотрудникам, использующим методы прикладной статистики в социально-экономических исследованиях.
2. Корреляционный анализ экономических показателей
2.1 Построение матрицы парных коэффициентов корреляции
Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.
Матрица парных коэффициентов корреляции исследуемых экономических показателей
Y |
X1 |
X2 |
X3 |
X4 |
||
Y |
1 |
0,332401129 |
0,637532978 |
0,577299 |
0,334637 |
|
X1 |
0,332401 |
1 |
0,264683853 |
0,232864 |
0,485923 |
|
X2 |
0,637533 |
0,264683853 |
1 |
0,915877 |
0,191735 |
|
X3 |
0,577299 |
0,232864344 |
0,915876826 |
1 |
0,077981 |
|
X4 |
0,334637 |
0,485923242 |
0,191735405 |
0,077981 |
1 |
Необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу H0: с=0. Для этого рассчитываем наблюдаемые значения t-статистик для всех коэффициентов по формуле:
и строим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij (таб.2).
Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n-2.
tкр= 2,01063472192628
Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей
tнабл |
Y |
X1 |
X2 |
X3 |
X4 |
|
Y |
2,441787 |
5,733159 |
4,898333 |
2,460274 |
||
X1 |
2,441787 |
1,901604 |
1,658937 |
3,85191 |
||
X2 |
5,733159 |
1,901604 |
15,80579 |
1,353494 |
||
X3 |
4,898333 |
1,658937 |
15,80579 |
0,54192 |
||
X4 |
2,460274 |
3,85191 |
1,353494 |
0,54192 |
По результатам, представленным в табл. 2, наблюдаемое значение t-статистики больше критического tкр=2,01063472192628 по модулю для парных коэффициентов корреляции . Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.
Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, т.е. коэффициенты - незначимы.
Если соответствующий коэффициент | rij | > rкр, то он считается значимым.
Отметим в матрице парных коэффициентов корреляции значимые.
Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)
Y |
X1 |
X2 |
X3 |
X4 |
||
Y |
1 |
0,332401129 |
0,637532978 |
0,577299 |
0,334637 |
|
X1 |
0,332401 |
1 |
0,264683853 |
0,232864 |
0,485923 |
|
X2 |
0,637533 |
0,264683853 |
1 |
0,915877 |
0,191735 |
|
X3 |
0,577299 |
0,232864344 |
0,915876826 |
1 |
0,077981 |
|
X4 |
0,334637 |
0,485923242 |
0,191735405 |
0,077981 |
1 |
Для значимых парных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку сmin ? с ? сmax с помощью Z-преобразования Фишера:
Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий.
1). Zr По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Zr , являющееся гиперболическим арктангенсом r :
Z-функция - нечетная, т.е. Z(-r)= - Z(r).
Можно найти значение Zr и по таблице Z-преобразования Фишера
2). ДZ Найдём значение tг, соответствующее заданной надёжности г=0,95. - значение функции Лапласа.
Находим
3). Zmin и Zmax Теперь можно найти Zmin и Zmax:
Zmin = Zr - ДZ; Zmax= Zr + ДZ
4). сmin и сmax Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции сmin и сmax , соответствующие Zmin и Zmax.
Соответствующие значения сmin и сmax являются гиперболическими тангенсами Zmin и Zmax : .
Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95
|
r |
Zr |
Zmin |
Zmax |
сmin |
сmax |
|
yx1 |
0,3324011 |
0,345525 |
0,059635 |
0,631415 |
0,059565 |
0,559026 |
|
yx2 |
0,637533 |
0,754006 |
0,468116 |
1,039896 |
0,436676 |
0,777847 |
|
yx3 |
0,5772995 |
0,658403 |
0,372513 |
0,944293 |
0,356188 |
0,737188 |
|
yx4 |
0,3346368 |
0,348041 |
0,062151 |
0,633931 |
0,062071 |
0,560753 |
|
x1x4 |
0,4859232 |
0,530709 |
0,244819 |
0,8166 |
0,240043 |
0,673215 |
|
x2x3 |
0,9158768 |
1,562824 |
1,276934 |
1,848714 |
0,855666 |
0,951625 |
Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:
P(0,059565? сYX1 ? 0,559026)=0,95
P(0,436676? сYX2 ? 0,777847)=0,95
P(0,356188? сYX3 ? 0,737188)=0,95
P(0,062071? сYX4 ? 0,560753)=0,95
P(0,240043? сX1X4 ? 0,673215)=0,95
P(0,855666? сX2X3 ? 0,951625)=0,95
По полученным данным можно сделать следующие выводы:
Между исследуемыми показателями выявлены значимые корреляционные зависимости.
1). Значимые корреляционные обратные взаимосвязи обнаружены между изучаемым признаком Y - рентабельностью и факторными признаками X1 - оборачиваемость ненормируемых средств и X4 - оборачиваемость нормируемых средств.
2). Между рентабельностью (Y) и фондоотдачей (X2) и (X3)существует прямая умеренная связь.
3). Наиболее сильная связь существует между факторными признаками фондоотдачей (X2) и фондовооруженностью труда (X3), причем отмеченная связь обратная.
2.2 Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции
Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными при исключении влияния остальных показателей (т.е. характеризуют «чистую» связь только между этими признаками) и важны для понимания взаимодействия всего комплекса показателей, т.к. позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.
Частный коэффициент (k-2)-го порядка между переменными, например, между Y и X1, равен:
,
где Rij - алгебраическое дополнение элемента rij корреляционной матрицы R , равное Rij =(-1)i+j ? Mij
Mij - минор элемента rij корреляционной матрицы R, т.е. определитель матрицы на 1 меньшего порядка, полученной из R путём вычёркивания i-й строки и j-го столбца.
Алгебраическое дополнение R12 рассчитывается следующим образом:
1 |
0,332401129 |
0,637532978 |
0,577299 |
0,334637 |
|
0,332401 |
1 |
0,264683853 |
0,232864 |
0,485923 |
|
0,637533 |
0,264683853 |
1 |
0,915877 |
0,191735 |
|
0,577299 |
0,232864344 |
0,915876826 |
1 |
0,077981 |
|
0,334637 |
0,485923242 |
0,191735405 |
0,077981 |
1 |
0,332401 |
0,264684 |
0,232864 |
0,485923 |
|
0,637533 |
1 |
0,915877 |
0,191735 |
|
0,577299 |
0,915877 |
1 |
0,077981 |
|
0,334637 |
0,191735 |
0,077981 |
1 |
Аналогично рассчитываются остальные.
Таким образом, для расчёта частных коэффициентов корреляции нужно сформировать соответствующие матрицы размерности (k-1)Ч(k-1).
Выборочные частные коэффициенты корреляции рассчитываются по формуле
И равны:
R12= |
0,102221 |
|
R13= |
0,25507 |
|
R14= |
0,041263 |
|
R15= |
0,210651 |
|
R23= |
-0,04145 |
|
R24= |
0,098888 |
|
R25= |
0,433987 |
|
R34= |
0,87571 |
|
R35= |
0,204355 |
|
R45= |
-0,26881 |
Таким образом, получаем матрицу следующего вида:
Матрица выборочных частных коэффициентов корреляции исследуемых экономических показателей
Y |
X1 |
X2 |
X3 |
X4 |
||
Y |
1 |
0,102221 |
0,255070 |
0,041263 |
0,210651 |
|
X1 |
0,102221 |
1 |
-0,041450 |
0,098888 |
0,433987 |
|
X2 |
0,255070 |
-0,041450 |
1 |
0,875710 |
0,204355 |
|
X3 |
0,041263 |
0,098888 |
0,875710 |
1 |
-0,268813 |
|
X4 |
0,210651 |
0,433987 |
0,204355 |
-0,268813 |
1 |
Теперь необходимо проверить значимость полученных частных коэффициентов корреляции, т.е. гипотезу H0: сij/{..} = 0.
Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:
где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например ), а n - количество наблюдений. n= 50.
l
Построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij/{..}
Матрица наблюдаемыx значений t-статистик частных коэффициентов корреляции исследуемых экономических показателей
|
Y |
X1 |
X2 |
X3 |
X4 |
|
Y |
|
0,689332 |
1,769593 |
0,277037 |
1,445525 |
|
X1 |
0,689332 |
-0,278296 |
0,666626 |
3,231447 |
||
X2 |
1,769593 |
-0,278296 |
12,166521 |
1,400411 |
||
X3 |
0,277037 |
0,666626 |
12,166521 |
-1,872165 |
||
X4 |
1,445525 |
3,231447 |
1,400411 |
-1,872165 |
Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - l - 2.
По результатам, представленным в таблице 6, наблюдаемое значение t-статистики больше критического tкр=2,014103 по модулю для частных коэффициентов корреляции .
Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.
Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается
Для проверки значимости частных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса.
Отметим в матрице частных коэффициентов корреляции значимые.
Матрица частных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)
|
Y |
X1 |
X2 |
X3 |
X4 |
|
Y |
|
0,689332 |
1,769593 |
0,277037 |
1,445525 |
|
X1 |
0,689332 |
-0,278296 |
0,666626 |
3,231447 |
||
X2 |
1,769593 |
-0,278296 |
12,166521 |
1,400411 |
||
X3 |
0,277037 |
0,666626 |
12,166521 |
-1,872165 |
||
X4 |
1,445525 |
3,231447 |
1,400411 |
-1,872165 |
Для значимых частных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку сmin ? с ? сmax с помощью Z-преобразования Фишера:
Алгоритм построения интервальной оценки для частного генерального коэффициента корреляции такой же, как и для парного; единственное отличие заключается в расчёте ДZ :
,
где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=1), а n - количество наблюдений.
Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых частных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы 8.
Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95
|
R |
Zr |
Zmin |
Zmax |
сmin |
сmax |
|
Х2Х3 |
0,87571 |
1,35706 |
1,06159 |
1,65254 |
0,78627 |
0,92921 |
|
Х1Х4 |
0,43399 |
0,46480 |
0,46480 |
0,46480 |
0,43399 |
0,43399 |
Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых частных генеральных коэффициентов корреляции выглядят следующим образом:
P(0,78627? ? 0,92921)=0,95
P(0,43399? ? 0,43399)=0,95
Теперь построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.
Сравнение парных и частных коэффициентов играет важную роль в выявлении механизмов воздействия переменных друг на друга.
Парный коэффициент корреляции показывает тесноту связи между двумя признаками на фоне действия остальных переменных, а частный характеризует взаимосвязь этих двух признаков при исключении влияния остальных переменных, т.е. их «личную» взаимосвязь.
Таким образом, если оказывается, что парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные усиливают связь между этими двумя признаками. Соответственно, если парный коэффициент корреляции между двумя переменными по абсолютной величине меньше частного, то остальные признаки ослабляют связь между рассматриваемыми двумя.
Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов (при б=0,05)
Между переменными |
Коэффициент корреляции |
||
парный |
Частный |
||
Y X1 |
0,3324011 |
0,102221 |
|
Y X2 |
0,637533 |
0,255070 |
|
Y X3 |
0,5772995 |
0,041263 |
|
Y X4 |
0,3346368 |
0,210651 |
|
X1 X2 |
0,26468385 |
-0,041450 |
|
X1 X3 |
0,23286434 |
0,098888 |
|
X1 X4 |
0,4859232 |
0,433987 |
|
X2 X3 |
0,9158768 |
0,875710 |
|
X2 X4 |
0,1917354 |
0,204355 |
|
X3 X4 |
0,07798125 |
-0,268813 |
По полученным данным можно сделать следующие выводы.
Значимые корреляционные зависимости, полученные на этапе расчёта парных коэффициентов корреляции, подтвердились и при вычислении частных коэффициентов корреляции. При этом выявлены следующие механизмы воздействия переменных друг на друга:
1. Наиболее тесная связь наблюдается изучаемым признаком Y - рентабельностью и факторными признаками X4
2. Воздействие других переменных (фондоотдачи X2, фондовооруженности труда X3 и оборачиваемости нормируемых оборотных средств X4) ослабляет отрицательную взаимосвязь между рентабельностью (Y) и оборачиваемостью ненормируемых оборотных средств (X1)
3. Для связи между рентабельностью (Y) и фондовооруженностью труда (X3) характерна обратная ситуация: воздействие других переменных значительно усиливает эту взаимосвязь (частный коэффициент корреляции по абсолютной величине меньше соответствующего парного коэффициента), хотя оба коэффициента корреляции являются незначимыми.
2.2 Расчёт множественных коэффициентов корреляции
Множественные коэффициенты корреляции служат мерой связи одной переменной с совместным действием всех остальных показателей.
Вычислим точечные оценки множественных коэффициентов корреляции. Множественный коэффициент корреляции, например, для 1-го показателя Y вычисляется по формуле:
где |R| - определитель корреляционной матрицы R;
Rii - алгебраическое дополнение элемента rii корреляционной матрицы R.
Все алгебраические дополнения Rii были найдены в п.2.2 на этапе расчёта частных коэффициентов корреляции, поэтому осталось вычислить только определитель самой корреляционной матрицы.
R11=(-1)1+1?M11= 0,105708;
R22=(-1)2+2?M22= 0,07945.
R33=(-1)3+3?M33= 0,416211;
R44=(-1)4+4?M44= 0,381775;
R55=(-1)5+5?M55= 0,08457;
Чтобы найти определитель корреляционной матрицы, необходимо воспользоваться встроенной математической функцией Excel МОПРЕД.
Получим |R| = 0,057034
.
Таким образом, получаем:
;
Множественный коэффициент детерминации R2i/{..}) (и его выборочная оценка r2i/{..}) показывает долю дисперсии рассматриваемой случайной величины, обусловленную влиянием остальных переменных, включённых в корреляционную модель.
Соответственно (1- R2i/{..}) показывает долю остаточной дисперсии данной случайной величины, обусловленную влиянием других, не включённых в исследуемую модель факторов.
Множественные коэффициенты детерминации получаются возведением соответствующих множественных коэффициентов корреляции в квадрат (таб. 10).
Проверим значимость полученных множественных коэффициентов корреляции и детерминации.
Проверка значимости, т.е. гипотезы о равенстве нулю соответствующего множественного коэффициента корреляции, осуществляется с помощью статистики:
,
где l - порядок множественного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например, ), а n - количество наблюдений.
Произведя расчёты, получим (таб.10).
Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F-распределения для заданного уровня значимости б и числа степеней свободы числителя н1=l и знаменателя н2=n-l-1.
Множественные коэффициенты корреляции и детерминации исследуемых показателей с выделением значимых коэффициентов
(на уровне значимости б=0,05)
Множественный коэффициент корреляции |
Множественный коэффициент детерминации r2 |
Значение статистики |
||
F набл |
||||
rY /{..} |
0,6785671 |
0,46045327 |
9,600835284 |
|
rX1/{..} |
0,5311625 |
0,282133606 |
4,421439823 |
|
rX2/{..} |
0,9289605 |
0,862967702 |
70,84743382 |
|
rX3/{..} |
0,9222838 |
0,850607416 |
64,05494305 |
|
rX4/{..} |
0,5706101 |
0,325595856 |
5,431392158 |
Полученные данные позволяют сделать следующие выводы.
Если наблюдаемое значение F-статистики превосходит ее критическое значение Fкр= 2,578739, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, у нас все коэффициенты, значимо отличаются от нуля.
Множественный коэффициент детерминации r2Y/{..})=0,4605 показывает, что 46,05% доли дисперсии Y - объёма промышленной продукции, обусловлены изменениями факторных признаков.
3. Регрессионный анализ экономических показателей
коэффициент корреляция мультиколлинеарность регрессионный
После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, обычно переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. С этой целью подбирают класс функций, связывающий результативный показатель Y и аргументы X1, X2, X3 ,... Xk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.
Наиболее часто используется множественная линейная модель регрессионного анализа, уравнение которой имеет вид:
для всех i=1,2,…n, или в матричной форме:
,
где
Исследуем на основе линейной регрессионной модели зависимость рентабельности (Y) от оборачиваемости ненормируемых оборотных средств (X1), фондоотдачи (X2), фондовооруженности труда (X3) и оборачиваемости нормируемых оборотных средств (X4).
3.1 Проверка исходных данных на мультиколлинеарность
Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она возникает в случаях существования достаточно тесных линейных статистических связей между объясняющими переменными X1, X2, X3 ,... Xk. В результате мультиколлинеарности матрица парных коэффициентов корреляции становится слабообусловленной, близкой к вырожденной.
Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Однако существуют некоторые рекомендации по выявлению этого негативного явления, на которые следует обратить внимание. На практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы R больше 0,8 , т.е. | rij | > 0,8 , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей Xi или Xj (как правило, тот, который имеет наибольшую связь с Y).
Прежде, чем переходить к построению регрессионной модели, необходимо проверить объясняющие переменные на наличие мультиколлинеарности. Для этого рассмотрим матрицу парных коэффициентов корреляции между факторными признаками Xi.
Матрица парных коэффициентов корреляции факторных признаков
X1 |
X2 |
X3 |
X4 |
||
X1 |
1 |
0,264683853 |
0,232864 |
0,485923 |
|
X2 |
0,264683853 |
1 |
0,915877 |
0,191735 |
|
X3 |
0,232864344 |
0,915876826 |
1 |
0,077981 |
|
X4 |
0,485923242 |
0,191735405 |
0,077981 |
1 |
Х2Х3>0,8. Наблюдается мультиколлинеарность. Так как у Х2 связь с У сильнее, чем у Х3 с У. Следовательно, исключаем Х3.
3.2 Построение регрессионной модели и её интерпретация
Необходимо использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты.
Построение и оценка регрессионной модели осуществляется в Excel с помощью модуля регрессии пакета анализа данных.
В модель включены следующие факторные признаки (X1, X2, X4).
ВЫВОД ИТОГОВ |
||||||
Регрессионная статистика |
||||||
Множественный R |
0,67788867 |
|||||
R-квадрат |
0,45953305 |
|||||
Нормированный R-квадрат |
0,4242852 |
|||||
Стандартная ошибка |
1,66035267 |
|||||
Наблюдения |
50 |
|||||
Дисперсионный анализ |
||||||
|
df |
SS |
MS |
F |
Значимость F |
|
Регрессия |
3 |
107,8217 |
35,9405624 |
13,03719558 |
2,7254E-06 |
|
Остаток |
46 |
126,8115 |
2,75677098 |
|||
Итого |
49 |
234,6332 |
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 98,0% |
Верхние 98,0% |
|
Y-пересечение |
2,97948449 |
2,364876 |
1,25989029 |
0,214063543 |
-1,7807642 |
7,73973 |
-2,72031 |
8,679281 |
|
X1 |
1,44577968 |
1,982362 |
0,72932177 |
0,469502312 |
-2,54450775 |
5,43607 |
-3,33209 |
6,223645 |
|
X2 |
0,00012544 |
2,44E-05 |
5,13501861 |
5,57998E-06 |
7,627E-05 |
0,00017 |
6,66E-05 |
0,000184 |
|
X4 |
0,16072248 |
0,111796 |
1,43764177 |
0,157304027 |
-0,06431103 |
0,38576 |
-0,10873 |
0,430172 |
ВЫВОД ОСТАТКА |
|||||
Наблюдение |
Предсказанное Y |
Остатки |
Стандартные остатки |
||
1 |
9,2510839 |
0,008916 |
0,00554235 |
||
2 |
9,38979754 |
-0,0098 |
-0,0060903 |
||
3 |
9,46367902 |
2,646321 |
1,64498257 |
||
4 |
8,96408885 |
1,845911 |
1,14743891 |
||
5 |
6,71867408 |
2,631326 |
1,63566147 |
||
6 |
8,03364747 |
1,836353 |
1,14149717 |
||
7 |
8,71773928 |
-0,54774 |
-0,3404808 |
||
8 |
6,57852724 |
2,541473 |
1,57980775 |
||
9 |
6,66619082 |
-0,78619 |
-0,488705 |
||
10 |
6,5538776 |
-0,25388 |
-0,1578131 |
||
11 |
6,54154631 |
-0,32155 |
-0,1998768 |
||
12 |
6,27711824 |
-0,78712 |
-0,4892815 |
||
13 |
8,6869898 |
-2,18699 |
-1,3594572 |
||
14 |
6,70830031 |
-0,0983 |
-0,0611046 |
||
15 |
6,80467269 |
-2,48467 |
-1,5445002 |
||
16 |
7,90501541 |
-0,53502 |
-0,3325715 |
||
17 |
6,94433766 |
0,075662 |
0,04703255 |
||
18 |
6,65955524 |
1,590445 |
0,98863816 |
||
19 |
8,04680478 |
0,103195 |
0,0641473 |
||
20 |
6,85091023 |
1,86909 |
1,161847 |
||
21 |
7,69241355 |
-1,05241 |
-0,654192 |
||
22 |
7,4979688 |
0,602031 |
0,37422929 |
||
23 |
7,07275803 |
-1,55276 |
-0,9652117 |
||
24 |
8,79372368 |
0,576276 |
0,35821977 |
||
25 |
12,9707925 |
0,199208 |
0,12382962 |
||
26 |
7,19618982 |
-0,52619 |
-0,3270854 |
||
27 |
7,93829353 |
-2,25829 |
-1,4037804 |
||
28 |
7,78419875 |
-2,5642 |
-1,5939345 |
||
29 |
6,54162933 |
3,478371 |
2,16219392 |
||
30 |
7,86314488 |
0,296855 |
0,18452845 |
||
31 |
6,3310574 |
-2,55106 |
-1,5857657 |
||
32 |
6,4190127 |
0,060987 |
0,03791039 |
||
33 |
9,05574341 |
1,384257 |
0,8604693 |
||
34 |
7,29573105 |
0,354269 |
0,22021752 |
||
35 |
7,00420721 |
1,765793 |
1,09763645 |
||
36 |
7,05078708 |
-0,05079 |
-0,0315698 |
||
37 |
11,1677778 |
-0,10778 |
-0,0669959 |
||
38 |
10,1740716 |
-1,15407 |
-0,7173838 |
||
39 |
11,108195 |
2,171805 |
1,35001816 |
||
40 |
8,27688554 |
0,993114 |
0,617331 |
||
41 |
6,66839483 |
0,031605 |
0,01964612 |
||
42 |
7,16933721 |
-0,47934 |
-0,2979613 |
||
43 |
6,34191524 |
3,078085 |
1,91337174 |
||
44 |
6,69483773 |
0,545162 |
0,33887893 |
||
45 |
6,56476555 |
-1,17477 |
-0,7302473 |
||
46 |
5,85971869 |
-0,24972 |
-0,1552279 |
||
47 |
7,53630961 |
-1,94631 |
-1,2098477 |
||
48 |
8,06583727 |
-1,49584 |
-0,9298291 |
||
49 |
9,95759991 |
-3,4176 |
-2,1244181 |
||
50 |
6,32414591 |
-2,09415 |
-1,3017444 |
В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков (что совпадает с полученными ранее значениями в корреляционном анализе).
Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.
Нижняя часть таблицы - точечные оценки bi генеральных коэффициентов регрессии вi, проверка их значимости и интервальная оценка.
Оценка вектора коэффициентов b просиходит следующим образом:
Тогда оценка уравнения регрессии имеет вид:
Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.
Нужно проверить на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в1=в2=в3=…=вk=0. Для этого рассчитывается наблюдаемое значение F-статистики:
По таблицам F-распределения для уровня значимости б=0,05 и числа степеней свободы числителя н1=k=3 и знаменателя н2=n-k-1=46 находим критическое значение F-статистики, равное :
Так как наблюдаемое значение F-статистики превосходит ее критическое значение > , то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в1,в2,в4)T значимо отличается от нуля.
Проверку значимости регрессионных коэффициентов проводят на основе t-статистики для уровня значимости .
Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.
|
Коэффициенты |
t-статистика |
|
Y-пересечение |
2,97948449 |
1,25989029 |
|
X1 |
1,44577968 |
0,72932177 |
|
X2 |
0,00012544 |
5,13501861 |
|
X4 |
0,16072248 |
1,43764177 |
Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - k - 1.
tкр= 2,014103.
Для наблюдаемое значение t-статистики больше критического по модулю , следовательно, гипотеза о равенстве нулю этого коэффициента отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующий коэффициент значим.
Для наблюдаемое значение t-статистики меньше критического по модулю , , , следовательно, гипотеза H0 не отвергается, т.е. - незначимы.
Как видно из таблицы, для коэффициентов p-значения >0,05 и все, кроме X2, доверительные интервалы включают ноль, т.е. по всем проверочным критериям эти коэффициенты является незначимым.
Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X4 (оборачиваемость ненормированных оборотных средств), имеющую незначимый коэффициент регрессии .
II ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.
В модель включены факторные признаки X1, X2 исключён X4.
ВЫВОД ИТОГОВ |
|||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,659734 |
||||||||
R-квадрат |
0,435249 |
||||||||
Нормированный R-квадрат |
0,411218 |
||||||||
Стандартная ошибка |
1,67909 |
||||||||
Наблюдения |
50 |
||||||||
Дисперсионный анализ |
|||||||||
|
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
2 |
102,124 |
51,06198 |
18,11129 |
1,47E-06 |
||||
Остаток |
47 |
132,5092 |
2,819345 |
||||||
Итого |
49 |
234,6332 |
|||||||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 98,0% |
Верхние 98,0% |
|
Y-пересечение |
2,156103 |
2,32037 |
0,929207 |
0,35753 |
-2,51188 |
6,824085 |
-3,43215 |
7,744355 |
|
Переменная X 1 |
2,756173 |
1,780249 |
1,548195 |
0,128283 |
-0,82523 |
6,337573 |
-1,53128 |
7,043628 |
|
Переменная X 2 |
0,000128 |
2,46E-05 |
5,198777 |
4,28E-06 |
7,85E-05 |
0,000178 |
6,87E-05 |
0,000187 |
Оценка коэффициентов в случае двух объясняющих переменных имеет вид:
Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в0,=в1=в2=0. Для этого в результатах дисперсионного анализа находим наблюдаемое значение F-статистики Fнабл=18,11129.
Так как наблюдаемое значение F-статистики превосходит ее критическое значение 18,11129> 3,195056, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=( в0,в1,в2,в3)T значимо отличается от нуля.
Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.
Коэффициенты |
t-статистика |
||
Y-пересечение |
2,156103 |
0,929207 |
|
Переменная X 1 |
2,756173 |
1,548195 |
|
Переменная X 2 |
0,000128 |
5,198777 |
Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - k - 1.
tкр= 2,01174;
Для всех рассматриваемых коэффициентов в0,в1 наблюдаемое значение t-статистики меньше критического по модулю: |0,929207|>2,01174; |1,548195|>2,01174 гипотеза H0 не отвергается, т.е. - в0,в1 незначим.
Для наблюдаемое значение t-статистики больше критического по модулю следовательно, гипотеза о равенстве нулю этого коэффициента отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующий коэффициент значим.
Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X1 (оборачиваемость ненормированных оборотных средств), имеющую незначимый коэффициент регрессии .
III ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.
ВЫВОД ИТОГОВ |
||||||
Регрессионная статистика |
||||||
Множественный R |
0,637533 |
|||||
R-квадрат |
0,406448 |
|||||
Нормированный R-квадрат |
0,394083 |
|||||
Стандартная ошибка |
1,703348 |
|||||
Наблюдения |
50 |
|||||
Дисперсионный анализ |
||||||
|
df |
SS |
MS |
F |
Значимость F |
|
Регрессия |
1 |
95,36625 |
95,36625 |
32,869 |
6,39235E-07 |
|
Остаток |
48 |
139,2669 |
2,901394 |
|||
Итого |
49 |
234,6332 |
||||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
|
Y-пересечение |
5,686597 |
0,435056 |
13,07095 |
1,98016E-17 |
4,811858449 |
|
Переменная X 2 |
0,000138 |
2,41E-05 |
5,733159 |
6,39235E-07 |
8,97119E-05 |
Оценка коэффициентов в случае двух объясняющих переменных имеет вид:
Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в0,=в1 =0. Для этого в результатах дисперсионного анализа находим наблюдаемое значение F-статистики Fнабл=32,869.
Так как наблюдаемое значение F-статистики превосходит ее критическое значение 32,869> 4,042652, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=( в0,в1)T значимо отличается от нуля.
Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.
Коэффициенты |
t-статистика |
||
Y-пересечение |
5,686597 |
13,07095 |
|
Переменная X 2 |
0,000138 |
5,733159 |
Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - k - 1.
tкр= 2,010635;
Для всех рассматриваемых коэффициентов в0,в1 наблюдаемое значение t-статистики больше критического по модулю: |13,07095|>2,010635; |5,733159|>2,010635, следовательно, гипотеза о равенстве нулю этого коэффициента отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующий коэффициент значим.
Т.к. в данном случае все коэффициенты оказались значимыми, процесс исключения переменных прекращается
Окончательная оценка регрессии со значимыми коэффициентами имеет вид:
|
Коэффициенты |
Нижние 95% |
Верхние 95% |
Нижние 98,0% |
Верхние 98,0% |
|
Y-пересечение |
5,686597 |
4,811858449 |
6,561337 |
4,639599 |
6,733596 |
|
Переменная X 2 |
0,000138 |
8,97119E-05 |
0,000187 |
8,02E-05 |
0,000196 |
Величина R2 характеризует долю общей дисперсии зависимой переменной, обусловленную воздействием объясняющих переменных. Множественный коэффициент детерминации r2Y/{..})=0,4605 показывает, что 46,05% доли дисперсии Y - объёма промышленной продукции, обусловлены изменениями факторных признаков.
Коэффициент регрессии показывает среднюю величину изменения зависимой переменной Y при изменении объясняющей переменной X на единицу собственного изменения. Знак при коэффициенте указывает направление этого изменения.
Коэффициент регрессии при X2 показывает, что при росте удельного веса покупных изделий на единицу производительность труда Y в среднем увеличивается на 0,000138 единиц. Построенная выше интервальная оценка показывает, что с вероятностью 0,95 при росте удельного веса покупных изделий на единицу уменьшение производительности труда будет в пределах от до единиц.
3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии
Сравнительная таблица исходных данных показателя производительности труда (Y) с рассчитанными с помощью построенной линейной регрессионной модели
Наблюдение |
Предсказанное Y |
Остатки |
Стандартные остатки |
Y |
|
1 |
9,279785526 |
-0,019785526 |
-0,011736043 |
9,26 |
|
2 |
8,993640312 |
0,386359688 |
0,229174283 |
9,38 |
|
3 |
8,807666649 |
3,302333351 |
1,958822057 |
12,11 |
|
4 |
8,618515129 |
2,191484871 |
1,299907807 |
10,81 |
|
5 |
6,70820913 |
2,64179087 |
1,567012677 |
9,35 |
|
6 |
7,28740794 |
2,58259206 |
1,531898132 |
9,87 |
|
7 |
9,363100622 |
-1,193100622 |
-0,70770318 |
8,17 |
|
8 |
6,764443366 |
2,355556634 |
1,397229111 |
9,12 |
|
9 |
7,287546108 |
-1,407546108 |
-0,834904314 |
5,88 |
|
10 |
6,99573602 |
-0,69573602 |
-0,412684886 |
6,3 |
|
11 |
7,180328008 |
-0,960328008 |
-0,569631071 |
6,22 |
|
12 |
6,566863619 |
-1,076863619 |
-0,638755687 |
5,49 |
|
13 |
9,384102105 |
-2,884102105 |
-1,710742744 |
6,5 |
|
14 |
6,268283317 |
0,341716683 |
0,202693703 |
6,61 |
|
15 |
6,178059838 |
-1,858059838 |
-1,102132404 |
4,32 |
|
16 |
7,641393472 |
-0,271393472 |
-0,160980574 |
7,37 |
|
17 |
7,05058858 |
-0,03058858 |
-0,018144015 |
7,02 |
|
18 |
6,512149228 |
1,737850772 |
1,03082883 |
8,25 |
|
19 |
7,988746957 |
0,161253043 |
0,095649343 |
8,15 |
|
20 |
6,953042215 |
1,766957785 |
1,048094034 |
8,72 |
|
21 |
7,775416098 |
-1,135416098 |
-0,673486853 |
6,64 |
|
22 |
7,265715618 |
0,834284382 |
0,494866652 |
8,1 |
|
23 |
6,579436876 |
-1,059436876 |
-0,628418787 |
5,52 |
|
24 |
9,089390497 |
0,280609503 |
0,166447183 |
9,37 |
|
25 |
12,55726047 |
0,612739529 |
0,363454436 |
13,17 |
|
26 |
7,271380492 |
-0,601380492 |
-0,356716675 |
6,67 |
|
27 |
8,373682044 |
-2,693682044 |
-1,597792604 |
5,68 |
|
28 |
8,306670731 |
-3,086670731 |
-1,830898964 |
5,22 |
|
29 |
6,955667401 |
3,064332599 |
1,81764881 |
10,02 |
|
30 |
8,101491764 |
0,058508236 |
0,034704923 |
8,16 |
|
31 |
6,552217848 |
-2,772217848 |
-1,644377139 |
3,78 |
|
32 |
6,90385453 |
-0,42385453 |
-0,251414837 |
6,48 |
|
33 |
8,126500109 |
2,313499891 |
1,372282605 |
10,44 |
|
34 |
7,115527377 |
0,534472623 |
0,3170294 |
7,65 |
|
35 |
6,916427786 |
1,853572214 |
1,099470511 |
8,77 |
|
36 |
6,847482127 |
0,152517873 |
0,090467964 |
7 |
|
37 |
10,19431723 |
0,865682765 |
0,513491012 |
11,06 |
|
38 |
9,99190162 |
-0,97190162 |
-0,57649611 |
9,02 |
|
39 |
12,10600491 |
1,17399509 |
0,696370485 |
13,28 |
|
40 |
7,597870661 |
1,672129339 |
0,991845305 |
9,27 |
|
41 |
6,569626972 |
0,130373028 |
0,07733246 |
6,7 |
|
42 |
7,222330975 |
-0,532330975 |
-0,315759054 |
6,69 |
|
43 |
6,592286468 |
2,827713532 |
1,677295127 |
9,42 |
|
44 |
7,218185945 |
0,021814055 |
0,012939291 |
7,24 |
|
45 |
6,996979529 |
-1,606979529 |
-0,953200847 |
5,39 |
|
46 |
6,234708577 |
-0,624708577 |
-0,370554032 |
5,61 |
|
47 |
7,798213761 |
-2,208213761 |
-1,309830766 |
5,59 |
|
48 |
8,57070912 |
-2,00070912 |
-1,186746684 |
6,57 |
|
49 |
8,369537015 |
-1,829537015 |
-1,085213719 |
6,54 |
|
50 |
6,149597301 |
-1,919597301 |
-1,138634152 |
4,23 |
Проанализировав графу Стандартные остатки (Standart Residuals) можно прийти к выводу, что предприятия № 3, 5, 6, 29 демонстрируют большую рентабельность, чем в среднем по всем рассматриваемым предприятиям. А для предприятия № 28 характерна обратная ситуация - отрицательное отклонение от линии регрессии.
Рис.1. Диаграмма сравнения исходных данных показателя производительности труда (Y) с рассчитанными с помощью линейной регрессионной модели
Рис.2. Диаграмма сравнения расчётных и реальных значений исследуемого показателя (ряды ранжированы)
Размещено на Allbest.ru
Подобные документы
Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.
курсовая работа [314,1 K], добавлен 21.01.2011Выбор факторных признаков для построения регрессионной модели неоднородных экономических процессов. Построение диаграммы рассеяния. Анализ матрицы коэффициентов парной корреляции. Определение коэффициентов детерминации и средних ошибок аппроксимации.
контрольная работа [547,6 K], добавлен 21.03.2015- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.
задача [83,2 K], добавлен 20.01.2010 Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.
лабораторная работа [214,2 K], добавлен 17.10.2009Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.
лабораторная работа [890,1 K], добавлен 06.12.2014Определение методом регрессионного и корреляционного анализа линейных и нелинейных связей между показателями макроэкономического развития. Расчет среднего арифметического по столбцам таблицы. Определение коэффициента корреляции и уравнения регрессии.
контрольная работа [4,2 M], добавлен 14.06.2014Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.
курсовая работа [1,1 M], добавлен 07.08.2011Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.
лабораторная работа [1,8 M], добавлен 25.05.2009Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.
курсовая работа [243,1 K], добавлен 17.01.2016