Главная Коллекция "Otherreferats" Экономико-математическое моделирование Корреляционный и регрессионный анализ

Корреляционный и регрессионный анализ

Корреляционный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчёт частных и множественных коэффициентов. Проверка исходных данных на мультиколлинеарность. Построение регрессионной модели, её интерпретация.

Рубрика	Экономико-математическое моделирование
Вид	курсовая работа
Язык	русский
Дата добавления	16.12.2011
Размер файла	477,1 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Московский государственный университет экономики, статистики и информатики (МЭСИ)

Курсовая работа

«Корреляционный и регрессионный анализ»

Оглавление

1. Введение

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

2.2 Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции

2.3 Расчёт множественных коэффициентов корреляции

3. Регрессионный анализ экономических показателей

3.1 Проверка исходных данных на мультиколлинеарность

3.2 Построение регрессионной модели и её интерпретация

3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии

Введение

В банковской, финансовой сфере, при проведении маркетинговых и социологических исследований, при обработке различных экономических данных требуется оценка взаимосвязи показателей и моделирование их зависимости для дальнейшего прогнозирования. Эти задачи призваны решать методы корреляционного и регрессионного анализов.

Указанные методы статистической обработки данных реализованы в настоящее время во многих программных продуктах и статистических пакетах анализа переменных. Акцент на использование в данной работе именно ППП Microsoft Excel сделан потому, что Microsoft Office, в состав которого входит указанный программный продукт, имеет в настоящее время наибольшее распространение и доступен всем пользователям современных компьютеров, в отличие от многих специальных статистических пакетов.

Пособие предназначено студентам, аспирантам и научным сотрудникам, использующим методы прикладной статистики в социально-экономических исследованиях.

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.

Матрица парных коэффициентов корреляции исследуемых экономических показателей

	Y	X1	X2	X3	X4
Y	1	0,332401129	0,637532978	0,577299	0,334637
X1	0,332401	1	0,264683853	0,232864	0,485923
X2	0,637533	0,264683853	1	0,915877	0,191735
X3	0,577299	0,232864344	0,915876826	1	0,077981
X4	0,334637	0,485923242	0,191735405	0,077981	1

Необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу H₀: с=0. Для этого рассчитываем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

и строим матрицу наблюдаемыx значений t-статистик для всех коэффициентов r_ij (таб.2).

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением t_кр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n-2.

t_кр= 2,01063472192628

Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей

t_набл	Y	X₁	X₂	X₃	X₄
Y		2,441787	5,733159	4,898333	2,460274
X₁	2,441787		1,901604	1,658937	3,85191
X₂	5,733159	1,901604		15,80579	1,353494
X₃	4,898333	1,658937	15,80579		0,54192
X₄	2,460274	3,85191	1,353494	0,54192

По результатам, представленным в табл. 2, наблюдаемое значение t-статистики больше критического t_кр=2,01063472192628 по модулю для парных коэффициентов корреляции . Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H₀ не отвергается, т.е. коэффициенты - незначимы.

Если соответствующий коэффициент | r_ij | > r_кр, то он считается значимым.

Отметим в матрице парных коэффициентов корреляции значимые.

Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

	Y	X1	X2	X3	X4
Y	1	0,332401129	0,637532978	0,577299	0,334637
X1	0,332401	1	0,264683853	0,232864	0,485923
X2	0,637533	0,264683853	1	0,915877	0,191735
X3	0,577299	0,232864344	0,915876826	1	0,077981
X4	0,334637	0,485923242	0,191735405	0,077981	1

Для значимых парных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку с_min ? с ? с_maxс помощью Z-преобразования Фишера:

Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий.

1). Z_r По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Z_r , являющееся гиперболическим арктангенсом r :

Z-функция - нечетная, т.е. Z(-r)= - Z(r).

Можно найти значение Z_r и по таблице Z-преобразования Фишера

2). ДZ Найдём значение t_г, соответствующее заданной надёжности г=0,95. - значение функции Лапласа.

Находим

3). Z_min и Z_max Теперь можно найти Z_min и Z_max:

Z_min = Z_r - ДZ; Z_max= Z_r + ДZ

4). с_min и с_max Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции с_min и с_max , соответствующие Z_min и Z_max_.

Соответствующие значения с_min и с_maxявляются гиперболическими тангенсами Z_min и Z_max:.

Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

	r	Z_r	Z_min	Z_max	с_min	с_max
yx₁	0,3324011	0,345525	0,059635	0,631415	0,059565	0,559026
yx₂	0,637533	0,754006	0,468116	1,039896	0,436676	0,777847
yx₃	0,5772995	0,658403	0,372513	0,944293	0,356188	0,737188
yx₄	0,3346368	0,348041	0,062151	0,633931	0,062071	0,560753
x₁x4	0,4859232	0,530709	0,244819	0,8166	0,240043	0,673215
x2x3	0,9158768	1,562824	1,276934	1,848714	0,855666	0,951625

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:

P(0,059565? с_YX₁ ? 0,559026)=0,95

P(0,436676? с_YX₂ ? 0,777847)=0,95

P(0,356188? с_YX₃ ? 0,737188)=0,95

P(0,062071? с_YX₄ ? 0,560753)=0,95

P(0,240043? с_X₁_X₄ ? 0,673215)=0,95

P(0,855666? с_X₂_X₃ ? 0,951625)=0,95

По полученным данным можно сделать следующие выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1). Значимые корреляционные обратные взаимосвязи обнаружены между изучаемым признаком Y - рентабельностью и факторными признаками X₁ - оборачиваемость ненормируемых средств и X₄ - оборачиваемость нормируемых средств.

2). Между рентабельностью (Y) и фондоотдачей (X₂) и (X₃)существует прямая умеренная связь.

3). Наиболее сильная связь существует между факторными признаками фондоотдачей (X₂) и фондовооруженностью труда (X₃), причем отмеченная связь обратная.

2.2 Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции

Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными при исключении влияния остальных показателей (т.е. характеризуют «чистую» связь только между этими признаками) и важны для понимания взаимодействия всего комплекса показателей, т.к. позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.

Частный коэффициент (k-2)-го порядка между переменными, например, между Y и X₁, равен:

где R_ij - алгебраическое дополнение элемента r_ij корреляционной матрицы R , равное R_ij =(-1)^i+j ? M_ij

M_ij - минор элемента r_ij корреляционной матрицы R, т.е. определитель матрицы на 1 меньшего порядка, полученной из R путём вычёркивания i-й строки и j-го столбца.

Алгебраическое дополнениеR₁₂ рассчитывается следующим образом:

1	0,332401129	0,637532978	0,577299	0,334637
0,332401	1	0,264683853	0,232864	0,485923
0,637533	0,264683853	1	0,915877	0,191735
0,577299	0,232864344	0,915876826	1	0,077981
0,334637	0,485923242	0,191735405	0,077981	1

0,332401	0,264684	0,232864	0,485923
0,637533	1	0,915877	0,191735
0,577299	0,915877	1	0,077981
0,334637	0,191735	0,077981	1

Аналогично рассчитываются остальные.

Таким образом, для расчёта частных коэффициентов корреляции нужно сформировать соответствующие матрицы размерности (k-1)Ч(k-1).

Выборочные частные коэффициенты корреляции рассчитываются по формуле

И равны:

R12=	0,102221
R13=	0,25507
R14=	0,041263
R15=	0,210651
R23=	-0,04145
R24=	0,098888
R25=	0,433987
R34=	0,87571
R35=	0,204355
R45=	-0,26881

Таким образом, получаем матрицу следующего вида:

Матрица выборочных частных коэффициентов корреляции исследуемых экономических показателей

	Y	X₁	X₂	X₃	X₄
Y	1	0,102221	0,255070	0,041263	0,210651
X₁	0,102221	1	-0,041450	0,098888	0,433987
X₂	0,255070	-0,041450	1	0,875710	0,204355
X₃	0,041263	0,098888	0,875710	1	-0,268813
X₄	0,210651	0,433987	0,204355	-0,268813	1

Теперь необходимо проверить значимость полученных частных коэффициентов корреляции, т.е. гипотезу H₀: с_ij_/{..}= 0.

Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например ), а n - количество наблюдений. n= 50.

Построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов r_ij_/{..}

Матрица наблюдаемыx значений t-статистик частных коэффициентов корреляции исследуемых экономических показателей

	Y	X₁	X₂	X₃	X₄
Y		0,689332	1,769593	0,277037	1,445525
X₁	0,689332		-0,278296	0,666626	3,231447
X₂	1,769593	-0,278296		12,166521	1,400411
X₃	0,277037	0,666626	12,166521		-1,872165
X₄	1,445525	3,231447	1,400411	-1,872165

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением t_кр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - l - 2.

По результатам, представленным в таблице 6, наблюдаемое значение t-статистики больше критического t_кр=2,014103 по модулю для частных коэффициентов корреляции .

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H₀ не отвергается

Для проверки значимости частных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса.

Отметим в матрице частных коэффициентов корреляции значимые.

Матрица частных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

	Y	X₁	X₂	X₃	X₄
Y		0,689332	1,769593	0,277037	1,445525
X₁	0,689332		-0,278296	0,666626	3,231447
X₂	1,769593	-0,278296		12,166521	1,400411
X₃	0,277037	0,666626	12,166521		-1,872165
X₄	1,445525	3,231447	1,400411	-1,872165

Для значимых частных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку с_min ? с ? с_maxс помощью Z-преобразования Фишера:

Алгоритм построения интервальной оценки для частного генерального коэффициента корреляции такой же, как и для парного; единственное отличие заключается в расчёте ДZ :

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=1), а n - количество наблюдений.

Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых частных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы 8.

Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

	R	Z_r	Z_min	Z_max	с_min	с_max
Х2Х3	0,87571	1,35706	1,06159	1,65254	0,78627	0,92921
Х1Х4	0,43399	0,46480	0,46480	0,46480	0,43399	0,43399

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых частных генеральных коэффициентов корреляции выглядят следующим образом:

P(0,78627? ? 0,92921)=0,95

P(0,43399? ? 0,43399)=0,95

Теперь построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.

Сравнение парных и частных коэффициентов играет важную роль в выявлении механизмов воздействия переменных друг на друга.

Парный коэффициент корреляции показывает тесноту связи между двумя признаками на фоне действия остальных переменных, а частный характеризует взаимосвязь этих двух признаков при исключении влияния остальных переменных, т.е. их «личную» взаимосвязь.

Таким образом, если оказывается, что парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные усиливают связь между этими двумя признаками. Соответственно, если парный коэффициент корреляции между двумя переменными по абсолютной величине меньше частного, то остальные признаки ослабляют связь между рассматриваемыми двумя.

Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Между переменными	Коэффициент корреляции
	парный	Частный
Y X₁	0,3324011	0,102221
Y X₂	0,637533	0,255070
Y X₃	0,5772995	0,041263
Y X₄	0,3346368	0,210651
X₁ X₂	0,26468385	-0,041450
X₁ X₃	0,23286434	0,098888
X₁ X₄	0,4859232	0,433987
X₂ X₃	0,9158768	0,875710
X₂ X₄	0,1917354	0,204355
X₃ X₄	0,07798125	-0,268813

По полученным данным можно сделать следующие выводы.

Значимые корреляционные зависимости, полученные на этапе расчёта парных коэффициентов корреляции, подтвердились и при вычислении частных коэффициентов корреляции. При этом выявлены следующие механизмы воздействия переменных друг на друга:

1. Наиболее тесная связь наблюдается изучаемым признаком Y - рентабельностью и факторными признаками X₄

2. Воздействие других переменных (фондоотдачи X₂, фондовооруженности труда X₃ и оборачиваемости нормируемых оборотных средств X₄) ослабляет отрицательную взаимосвязь между рентабельностью (Y) и оборачиваемостью ненормируемых оборотных средств (X₁)

3. Для связи между рентабельностью (Y) и фондовооруженностью труда (X₃) характерна обратная ситуация: воздействие других переменных значительно усиливает эту взаимосвязь (частный коэффициент корреляции по абсолютной величине меньше соответствующего парного коэффициента), хотя оба коэффициента корреляции являются незначимыми.

2.2 Расчёт множественных коэффициентов корреляции

Множественные коэффициенты корреляции служат мерой связи одной переменной с совместным действием всех остальных показателей.

Вычислим точечные оценки множественных коэффициентов корреляции. Множественный коэффициент корреляции, например, для 1-го показателя Y вычисляется по формуле:

где |R| - определитель корреляционной матрицы R;

R_i_i - алгебраическое дополнение элемента r_i_iкорреляционной матрицы R.

Все алгебраические дополнения R_i_i были найдены в п.2.2 на этапе расчёта частных коэффициентов корреляции, поэтому осталось вычислить только определитель самой корреляционной матрицы.

R₁₁=(-1)¹⁺¹?M₁₁= 0,105708;

R₂₂=(-1)²⁺²?M₂₂= 0,07945.

R₃₃=(-1)³⁺³?M₃₃= 0,416211;

R₄₄=(-1)⁴⁺⁴?M₄₄= 0,381775;

R₅₅=(-1)⁵⁺⁵?M₅₅= 0,08457;

Чтобы найти определитель корреляционной матрицы, необходимо воспользоваться встроенной математической функцией Excel МОПРЕД.

Получим |R| = 0,057034

Таким образом, получаем:

;

Множественный коэффициент детерминации R²_i_/{..}) (и его выборочная оценка r²_i_/{..}) показывает долю дисперсии рассматриваемой случайной величины, обусловленную влиянием остальных переменных, включённых в корреляционную модель.

Соответственно (1- R²_i_/{..}) показывает долю остаточной дисперсии данной случайной величины, обусловленную влиянием других, не включённых в исследуемую модель факторов.

Множественные коэффициенты детерминации получаются возведением соответствующих множественных коэффициентов корреляции в квадрат (таб. 10).

Проверим значимость полученных множественных коэффициентов корреляции и детерминации.

Проверка значимости, т.е. гипотезы о равенстве нулю соответствующего множественного коэффициента корреляции, осуществляется с помощью статистики:

где l - порядок множественного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например, ), а n - количество наблюдений.

Произведя расчёты, получим (таб.10).

Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F-распределения для заданного уровня значимости б и числа степеней свободы числителя н₁=l и знаменателя н₂=n-l-1.

Множественные коэффициенты корреляции и детерминации исследуемых показателей с выделением значимых коэффициентов

(на уровне значимости б=0,05)

Множественный коэффициент корреляции	Множественный коэффициент детерминации r²	Значение статистики
		F _набл
r_Y _/{..}	0,6785671	0,46045327	9,600835284
r_X1/{..}	0,5311625	0,282133606	4,421439823
r_X2/{..}	0,9289605	0,862967702	70,84743382
r_X3/{..}	0,9222838	0,850607416	64,05494305
r_X4/{..}	0,5706101	0,325595856	5,431392158

Полученные данные позволяют сделать следующие выводы.

Если наблюдаемое значение F-статистики превосходит ее критическое значение F_кр= 2,578739, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, у нас все коэффициенты, значимо отличаются от нуля.

Множественный коэффициент детерминации r²_Y_/{..})=0,4605 показывает, что 46,05% доли дисперсии Y - объёма промышленной продукции, обусловлены изменениями факторных признаков.

3. Регрессионный анализ экономических показателей

коэффициент корреляция мультиколлинеарность регрессионный

После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, обычно переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. С этой целью подбирают класс функций, связывающий результативный показатель Y и аргументы X₁, X₂, X_{3 ,...}X_k, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Наиболее часто используется множественная линейная модель регрессионного анализа, уравнение которой имеет вид:

для всех i=1,2,…n, или в матричной форме:

где

Исследуем на основе линейной регрессионной модели зависимость рентабельности (Y) от оборачиваемости ненормируемых оборотных средств (X₁), фондоотдачи (X₂), фондовооруженности труда (X₃) и оборачиваемости нормируемых оборотных средств (X₄).

3.1 Проверка исходных данных на мультиколлинеарность

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она возникает в случаях существования достаточно тесных линейных статистических связей между объясняющими переменными X₁, X₂, X_{3 ,...}X_k. В результате мультиколлинеарности матрица парных коэффициентов корреляции становится слабообусловленной, близкой к вырожденной.

Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Однако существуют некоторые рекомендации по выявлению этого негативного явления, на которые следует обратить внимание. На практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы R больше 0,8 , т.е. | r_ij | > 0,8 , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей X_iили X_j(как правило, тот, который имеет наибольшую связь с Y).

Прежде, чем переходить к построению регрессионной модели, необходимо проверить объясняющие переменные на наличие мультиколлинеарности. Для этого рассмотрим матрицу парных коэффициентов корреляции между факторными признаками X_i.

Матрица парных коэффициентов корреляции факторных признаков

	X1	X2	X3	X4
X1	1	0,264683853	0,232864	0,485923
X2	0,264683853	1	0,915877	0,191735
X3	0,232864344	0,915876826	1	0,077981
X4	0,485923242	0,191735405	0,077981	1

Х2Х3>0,8. Наблюдается мультиколлинеарность. Так как у Х2 связь с У сильнее, чем у Х3 с У. Следовательно, исключаем Х3.

3.2 Построение регрессионной модели и её интерпретация

Необходимо использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты.

Построение и оценка регрессионной модели осуществляется в Excel с помощью модуля регрессии пакета анализа данных.

В модель включены следующие факторные признаки (X₁, X₂, X₄).

ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R	0,67788867
R-квадрат	0,45953305
Нормированный R-квадрат	0,4242852
Стандартная ошибка	1,66035267
Наблюдения	50

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	3	107,8217	35,9405624	13,03719558	2,7254E-06
Остаток	46	126,8115	2,75677098
Итого	49	234,6332

	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%	Нижние 98,0%	Верхние 98,0%
Y-пересечение	2,97948449	2,364876	1,25989029	0,214063543	-1,7807642	7,73973	-2,72031	8,679281
X1	1,44577968	1,982362	0,72932177	0,469502312	-2,54450775	5,43607	-3,33209	6,223645
X2	0,00012544	2,44E-05	5,13501861	5,57998E-06	7,627E-05	0,00017	6,66E-05	0,000184
X4	0,16072248	0,111796	1,43764177	0,157304027	-0,06431103	0,38576	-0,10873	0,430172

ВЫВОД ОСТАТКА

Наблюдение	Предсказанное Y	Остатки	Стандартные остатки
1	9,2510839	0,008916	0,00554235
2	9,38979754	-0,0098	-0,0060903
3	9,46367902	2,646321	1,64498257
4	8,96408885	1,845911	1,14743891
5	6,71867408	2,631326	1,63566147
6	8,03364747	1,836353	1,14149717
7	8,71773928	-0,54774	-0,3404808
8	6,57852724	2,541473	1,57980775
9	6,66619082	-0,78619	-0,488705
10	6,5538776	-0,25388	-0,1578131
11	6,54154631	-0,32155	-0,1998768
12	6,27711824	-0,78712	-0,4892815
13	8,6869898	-2,18699	-1,3594572
14	6,70830031	-0,0983	-0,0611046
15	6,80467269	-2,48467	-1,5445002
16	7,90501541	-0,53502	-0,3325715
17	6,94433766	0,075662	0,04703255
18	6,65955524	1,590445	0,98863816
19	8,04680478	0,103195	0,0641473
20	6,85091023	1,86909	1,161847
21	7,69241355	-1,05241	-0,654192
22	7,4979688	0,602031	0,37422929
23	7,07275803	-1,55276	-0,9652117
24	8,79372368	0,576276	0,35821977
25	12,9707925	0,199208	0,12382962
26	7,19618982	-0,52619	-0,3270854
27	7,93829353	-2,25829	-1,4037804
28	7,78419875	-2,5642	-1,5939345
29	6,54162933	3,478371	2,16219392
30	7,86314488	0,296855	0,18452845
31	6,3310574	-2,55106	-1,5857657
32	6,4190127	0,060987	0,03791039
33	9,05574341	1,384257	0,8604693
34	7,29573105	0,354269	0,22021752
35	7,00420721	1,765793	1,09763645
36	7,05078708	-0,05079	-0,0315698
37	11,1677778	-0,10778	-0,0669959
38	10,1740716	-1,15407	-0,7173838
39	11,108195	2,171805	1,35001816
40	8,27688554	0,993114	0,617331
41	6,66839483	0,031605	0,01964612
42	7,16933721	-0,47934	-0,2979613
43	6,34191524	3,078085	1,91337174
44	6,69483773	0,545162	0,33887893
45	6,56476555	-1,17477	-0,7302473
46	5,85971869	-0,24972	-0,1552279
47	7,53630961	-1,94631	-1,2098477
48	8,06583727	-1,49584	-0,9298291
49	9,95759991	-3,4176	-2,1244181
50	6,32414591	-2,09415	-1,3017444

В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков (что совпадает с полученными ранее значениями в корреляционном анализе).

Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.

Нижняя часть таблицы - точечные оценки b_iгенеральных коэффициентов регрессии в_i, проверка их значимости и интервальная оценка.

Оценка вектора коэффициентов b просиходит следующим образом:

Тогда оценка уравнения регрессии имеет вид:

Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.

Нужно проверить на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H₀: в₁=в₂=в₃=…=в_k=0. Для этого рассчитывается наблюдаемое значение F-статистики:

По таблицам F-распределения для уровня значимости б=0,05 и числа степеней свободы числителя н₁=k=3 и знаменателя н₂=n-k-1=46 находим критическое значение F-статистики, равное :

Так как наблюдаемое значение F-статистики превосходит ее критическое значение > , то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в₁,в₂,в₄)^T значимо отличается от нуля.

Проверку значимости регрессионных коэффициентов проводят на основе t-статистики для уровня значимости .

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.

	Коэффициенты	t-статистика
Y-пересечение	2,97948449	1,25989029
X1	1,44577968	0,72932177
X2	0,00012544	5,13501861
X4	0,16072248	1,43764177

Их необходимо сравнить с критическим значением t_кр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - k - 1.

tкр= 2,014103.

Для наблюдаемое значение t-статистики больше критического по модулю , следовательно, гипотеза о равенстве нулю этого коэффициента отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующий коэффициент значим.

Для наблюдаемое значение t-статистики меньше критического по модулю , , , следовательно, гипотеза H₀ не отвергается, т.е. - незначимы.

Как видно из таблицы, для коэффициентов p-значения >0,05 и все, кроме X2, доверительные интервалы включают ноль, т.е. по всем проверочным критериям эти коэффициенты является незначимым.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X4 (оборачиваемость ненормированных оборотных средств), имеющую незначимый коэффициент регрессии .

II ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены факторные признаки X₁, X₂исключён X₄.

ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R	0,659734
R-квадрат	0,435249
Нормированный R-квадрат	0,411218
Стандартная ошибка	1,67909
Наблюдения	50

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	2	102,124	51,06198	18,11129	1,47E-06
Остаток	47	132,5092	2,819345
Итого	49	234,6332

	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%	Нижние 98,0%	Верхние 98,0%
Y-пересечение	2,156103	2,32037	0,929207	0,35753	-2,51188	6,824085	-3,43215	7,744355
Переменная X 1	2,756173	1,780249	1,548195	0,128283	-0,82523	6,337573	-1,53128	7,043628
Переменная X 2	0,000128	2,46E-05	5,198777	4,28E-06	7,85E-05	0,000178	6,87E-05	0,000187

Оценка коэффициентов в случае двух объясняющих переменных имеет вид:

Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H₀: в_0,=в₁=в₂=0. Для этого в результатах дисперсионного анализа находим наблюдаемое значение F-статистики F_набл=18,11129.

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 18,11129> 3,195056, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=( в_0,в₁,в₂,в₃)^T значимо отличается от нуля.

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.

	Коэффициенты	t-статистика
Y-пересечение	2,156103	0,929207
Переменная X 1	2,756173	1,548195
Переменная X 2	0,000128	5,198777

tкр= 2,01174;

Для всех рассматриваемых коэффициентов в₀,в₁ наблюдаемое значение t-статистики меньше критического по модулю: |0,929207|>2,01174; |1,548195|>2,01174 гипотеза H₀ не отвергается, т.е. - в₀,в₁незначим.

Для наблюдаемое значение t-статистики больше критического по модулю следовательно, гипотеза о равенстве нулю этого коэффициента отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующий коэффициент значим.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X1 (оборачиваемость ненормированных оборотных средств), имеющую незначимый коэффициент регрессии .

III ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R	0,637533
R-квадрат	0,406448
Нормированный R-квадрат	0,394083
Стандартная ошибка	1,703348
Наблюдения	50

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1	95,36625	95,36625	32,869	6,39235E-07
Остаток	48	139,2669	2,901394
Итого	49	234,6332

	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%
Y-пересечение	5,686597	0,435056	13,07095	1,98016E-17	4,811858449
Переменная X 2	0,000138	2,41E-05	5,733159	6,39235E-07	8,97119E-05

Оценка коэффициентов в случае двух объясняющих переменных имеет вид:

Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H₀: в_0,=в₁ =0. Для этого в результатах дисперсионного анализа находим наблюдаемое значение F-статистики F_набл=32,869.

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 32,869> 4,042652, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=( в_0,в₁)^T значимо отличается от нуля.

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.

	Коэффициенты	t-статистика
Y-пересечение	5,686597	13,07095
Переменная X 2	0,000138	5,733159

tкр= 2,010635;

Для всех рассматриваемых коэффициентов в₀,в₁ наблюдаемое значение t-статистики больше критического по модулю: |13,07095|>2,010635; |5,733159|>2,010635, следовательно, гипотеза о равенстве нулю этого коэффициента отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующий коэффициент значим.

Т.к. в данном случае все коэффициенты оказались значимыми, процесс исключения переменных прекращается

Окончательная оценка регрессии со значимыми коэффициентами имеет вид:

	Коэффициенты	Нижние 95%	Верхние 95%	Нижние 98,0%	Верхние 98,0%
Y-пересечение	5,686597	4,811858449	6,561337	4,639599	6,733596
Переменная X 2	0,000138	8,97119E-05	0,000187	8,02E-05	0,000196

Величина R² характеризует долю общей дисперсии зависимой переменной, обусловленную воздействием объясняющих переменных. Множественный коэффициент детерминации r²_Y_/{..})=0,4605 показывает, что 46,05% доли дисперсии Y - объёма промышленной продукции, обусловлены изменениями факторных признаков.

Коэффициент регрессии показывает среднюю величину изменения зависимой переменной Y при изменении объясняющей переменной X на единицу собственного изменения. Знак при коэффициенте указывает направление этого изменения.

Коэффициент регрессии при X₂ показывает, что при росте удельного веса покупных изделий на единицу производительность труда Y в среднем увеличивается на 0,000138 единиц. Построенная выше интервальная оценка показывает, что с вероятностью 0,95 при росте удельного веса покупных изделий на единицу уменьшение производительности труда будет в пределах от до единиц.

3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии

Сравнительная таблица исходных данных показателя производительности труда (Y) с рассчитанными с помощью построенной линейной регрессионной модели

Наблюдение	Предсказанное Y	Остатки	Стандартные остатки	Y
1	9,279785526	-0,019785526	-0,011736043	9,26
2	8,993640312	0,386359688	0,229174283	9,38
3	8,807666649	3,302333351	1,958822057	12,11
4	8,618515129	2,191484871	1,299907807	10,81
5	6,70820913	2,64179087	1,567012677	9,35
6	7,28740794	2,58259206	1,531898132	9,87
7	9,363100622	-1,193100622	-0,70770318	8,17
8	6,764443366	2,355556634	1,397229111	9,12
9	7,287546108	-1,407546108	-0,834904314	5,88
10	6,99573602	-0,69573602	-0,412684886	6,3
11	7,180328008	-0,960328008	-0,569631071	6,22
12	6,566863619	-1,076863619	-0,638755687	5,49
13	9,384102105	-2,884102105	-1,710742744	6,5
14	6,268283317	0,341716683	0,202693703	6,61
15	6,178059838	-1,858059838	-1,102132404	4,32
16	7,641393472	-0,271393472	-0,160980574	7,37
17	7,05058858	-0,03058858	-0,018144015	7,02
18	6,512149228	1,737850772	1,03082883	8,25
19	7,988746957	0,161253043	0,095649343	8,15
20	6,953042215	1,766957785	1,048094034	8,72
21	7,775416098	-1,135416098	-0,673486853	6,64
22	7,265715618	0,834284382	0,494866652	8,1
23	6,579436876	-1,059436876	-0,628418787	5,52
24	9,089390497	0,280609503	0,166447183	9,37
25	12,55726047	0,612739529	0,363454436	13,17
26	7,271380492	-0,601380492	-0,356716675	6,67
27	8,373682044	-2,693682044	-1,597792604	5,68
28	8,306670731	-3,086670731	-1,830898964	5,22
29	6,955667401	3,064332599	1,81764881	10,02
30	8,101491764	0,058508236	0,034704923	8,16
31	6,552217848	-2,772217848	-1,644377139	3,78
32	6,90385453	-0,42385453	-0,251414837	6,48
33	8,126500109	2,313499891	1,372282605	10,44
34	7,115527377	0,534472623	0,3170294	7,65
35	6,916427786	1,853572214	1,099470511	8,77
36	6,847482127	0,152517873	0,090467964	7
37	10,19431723	0,865682765	0,513491012	11,06
38	9,99190162	-0,97190162	-0,57649611	9,02
39	12,10600491	1,17399509	0,696370485	13,28
40	7,597870661	1,672129339	0,991845305	9,27
41	6,569626972	0,130373028	0,07733246	6,7
42	7,222330975	-0,532330975	-0,315759054	6,69
43	6,592286468	2,827713532	1,677295127	9,42
44	7,218185945	0,021814055	0,012939291	7,24
45	6,996979529	-1,606979529	-0,953200847	5,39
46	6,234708577	-0,624708577	-0,370554032	5,61
47	7,798213761	-2,208213761	-1,309830766	5,59
48	8,57070912	-2,00070912	-1,186746684	6,57
49	8,369537015	-1,829537015	-1,085213719	6,54
50	6,149597301	-1,919597301	-1,138634152	4,23

Проанализировав графу Стандартные остатки (Standart Residuals) можно прийти к выводу, что предприятия № 3, 5, 6, 29 демонстрируют большую рентабельность, чем в среднем по всем рассматриваемым предприятиям. А для предприятия № 28 характерна обратная ситуация - отрицательное отклонение от линии регрессии.

Рис.1. Диаграмма сравнения исходных данных показателя производительности труда (Y) с рассчитанными с помощью линейной регрессионной модели

Рис.2. Диаграмма сравнения расчётных и реальных значений исследуемого показателя (ряды ранжированы)

Размещено на Allbest.ru

курсовая работа "Корреляционный и регрессионный анализ" скачать

Подобные документы

Пакет программ Майкрософт, как эффективное средство эконометрического анализа
Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.

курсовая работа [314,1 K], добавлен 21.01.2011
Построение регрессионной модели экономической деятельности компаний нефтегазовой отрасли
Выбор факторных признаков для построения регрессионной модели неоднородных экономических процессов. Построение диаграммы рассеяния. Анализ матрицы коэффициентов парной корреляции. Определение коэффициентов детерминации и средних ошибок аппроксимации.

контрольная работа [547,6 K], добавлен 21.03.2015
Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.

задача [83,2 K], добавлен 20.01.2010
Определение зависимости цены товара
Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.

лабораторная работа [214,2 K], добавлен 17.10.2009
Построение классической линейной регрессии
Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.

лабораторная работа [890,1 K], добавлен 06.12.2014
Определение коэффициентов корреляции и оценка адекватности регрессионной модели
Определение методом регрессионного и корреляционного анализа линейных и нелинейных связей между показателями макроэкономического развития. Расчет среднего арифметического по столбцам таблицы. Определение коэффициента корреляции и уравнения регрессии.

контрольная работа [4,2 M], добавлен 14.06.2014
Однофакторный регрессионно-корреляционный анализ экономической модели
Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.

курсовая работа [1,1 M], добавлен 07.08.2011
Корреляционный и регрессионный анализ
Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

контрольная работа [141,3 K], добавлен 05.05.2010
Составление уравнения корреляции
Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.

лабораторная работа [1,8 M], добавлен 25.05.2009
Построение и анализ модели множественной регрессии
Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.

курсовая работа [243,1 K], добавлен 17.01.2016

Другие документы, подобные "Корреляционный и регрессионный анализ"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.