Корреляционный и регрессионный анализ

Корреляционный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчёт частных и множественных коэффициентов. Проверка исходных данных на мультиколлинеарность. Построение регрессионной модели, её интерпретация.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 16.12.2011
Размер файла 477,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Московский государственный университет экономики, статистики и информатики (МЭСИ)

Курсовая работа

«Корреляционный и регрессионный анализ»

Оглавление

1. Введение

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

2.2 Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции

2.3 Расчёт множественных коэффициентов корреляции

3. Регрессионный анализ экономических показателей

3.1 Проверка исходных данных на мультиколлинеарность

3.2 Построение регрессионной модели и её интерпретация

3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии

Введение

В банковской, финансовой сфере, при проведении маркетинговых и социологических исследований, при обработке различных экономических данных требуется оценка взаимосвязи показателей и моделирование их зависимости для дальнейшего прогнозирования. Эти задачи призваны решать методы корреляционного и регрессионного анализов.

Указанные методы статистической обработки данных реализованы в настоящее время во многих программных продуктах и статистических пакетах анализа переменных. Акцент на использование в данной работе именно ППП Microsoft Excel сделан потому, что Microsoft Office, в состав которого входит указанный программный продукт, имеет в настоящее время наибольшее распространение и доступен всем пользователям современных компьютеров, в отличие от многих специальных статистических пакетов.

Пособие предназначено студентам, аспирантам и научным сотрудникам, использующим методы прикладной статистики в социально-экономических исследованиях.

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.

Матрица парных коэффициентов корреляции исследуемых экономических показателей

Y

X1

X2

X3

X4

Y

1

0,332401129

0,637532978

0,577299

0,334637

X1

0,332401

1

0,264683853

0,232864

0,485923

X2

0,637533

0,264683853

1

0,915877

0,191735

X3

0,577299

0,232864344

0,915876826

1

0,077981

X4

0,334637

0,485923242

0,191735405

0,077981

1

Необходимо проверить значимость полученных коэффициентов корреляции, т.е. гипотезу H0: с=0. Для этого рассчитываем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

и строим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij (таб.2).

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n-2.

tкр= 2,01063472192628

Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей

tнабл

Y

X1

X2

X3

X4

Y

2,441787

5,733159

4,898333

2,460274

X1

2,441787

1,901604

1,658937

3,85191

X2

5,733159

1,901604

15,80579

1,353494

X3

4,898333

1,658937

15,80579

0,54192

X4

2,460274

3,85191

1,353494

0,54192

По результатам, представленным в табл. 2, наблюдаемое значение t-статистики больше критического tкр=2,01063472192628 по модулю для парных коэффициентов корреляции . Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, т.е. коэффициенты - незначимы.

Если соответствующий коэффициент | rij | > rкр, то он считается значимым.

Отметим в матрице парных коэффициентов корреляции значимые.

Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Y

X1

X2

X3

X4

Y

1

0,332401129

0,637532978

0,577299

0,334637

X1

0,332401

1

0,264683853

0,232864

0,485923

X2

0,637533

0,264683853

1

0,915877

0,191735

X3

0,577299

0,232864344

0,915876826

1

0,077981

X4

0,334637

0,485923242

0,191735405

0,077981

1

Для значимых парных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку сmin ? с ? сmax с помощью Z-преобразования Фишера:

Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий.

1). Zr По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Zr , являющееся гиперболическим арктангенсом r :

Z-функция - нечетная, т.е. Z(-r)= - Z(r).

Можно найти значение Zr и по таблице Z-преобразования Фишера

2). ДZ Найдём значение tг, соответствующее заданной надёжности г=0,95. - значение функции Лапласа.

Находим

3). Zmin и Zmax Теперь можно найти Zmin и Zmax:

Zmin = Zr - ДZ; Zmax= Zr + ДZ

4). сmin и сmax Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции сmin и сmax , соответствующие Zmin и Zmax.

Соответствующие значения сmin и сmax являются гиперболическими тангенсами Zmin и Zmax : .

Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

r

Zr

Zmin

Zmax

сmin

сmax

yx1

0,3324011

0,345525

0,059635

0,631415

0,059565

0,559026

yx2

0,637533

0,754006

0,468116

1,039896

0,436676

0,777847

yx3

0,5772995

0,658403

0,372513

0,944293

0,356188

0,737188

yx4

0,3346368

0,348041

0,062151

0,633931

0,062071

0,560753

x1x4

0,4859232

0,530709

0,244819

0,8166

0,240043

0,673215

x2x3

0,9158768

1,562824

1,276934

1,848714

0,855666

0,951625

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:

P(0,059565? сYX1 ? 0,559026)=0,95

P(0,436676? сYX2 ? 0,777847)=0,95

P(0,356188? сYX3 ? 0,737188)=0,95

P(0,062071? сYX4 ? 0,560753)=0,95

P(0,240043? сX1X4 ? 0,673215)=0,95

P(0,855666? сX2X3 ? 0,951625)=0,95

По полученным данным можно сделать следующие выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1). Значимые корреляционные обратные взаимосвязи обнаружены между изучаемым признаком Y - рентабельностью и факторными признаками X1 - оборачиваемость ненормируемых средств и X4 - оборачиваемость нормируемых средств.

2). Между рентабельностью (Y) и фондоотдачей (X2) и (X3)существует прямая умеренная связь.

3). Наиболее сильная связь существует между факторными признаками фондоотдачей (X2) и фондовооруженностью труда (X3), причем отмеченная связь обратная.

2.2 Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции

Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными при исключении влияния остальных показателей (т.е. характеризуют «чистую» связь только между этими признаками) и важны для понимания взаимодействия всего комплекса показателей, т.к. позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.

Частный коэффициент (k-2)-го порядка между переменными, например, между Y и X1, равен:

,

где Rij - алгебраическое дополнение элемента rij корреляционной матрицы R , равное Rij =(-1)i+j ? Mij

Mij - минор элемента rij корреляционной матрицы R, т.е. определитель матрицы на 1 меньшего порядка, полученной из R путём вычёркивания i-й строки и j-го столбца.

Алгебраическое дополнение R12 рассчитывается следующим образом:

1

0,332401129

0,637532978

0,577299

0,334637

0,332401

1

0,264683853

0,232864

0,485923

0,637533

0,264683853

1

0,915877

0,191735

0,577299

0,232864344

0,915876826

1

0,077981

0,334637

0,485923242

0,191735405

0,077981

1


0,332401

0,264684

0,232864

0,485923

0,637533

1

0,915877

0,191735

0,577299

0,915877

1

0,077981

0,334637

0,191735

0,077981

1

Аналогично рассчитываются остальные.

Таким образом, для расчёта частных коэффициентов корреляции нужно сформировать соответствующие матрицы размерности (k-1)Ч(k-1).

Выборочные частные коэффициенты корреляции рассчитываются по формуле

И равны:

R12=

0,102221

R13=

0,25507

R14=

0,041263

R15=

0,210651

R23=

-0,04145

R24=

0,098888

R25=

0,433987

R34=

0,87571

R35=

0,204355

R45=

-0,26881

Таким образом, получаем матрицу следующего вида:

Матрица выборочных частных коэффициентов корреляции исследуемых экономических показателей

Y

X1

X2

X3

X4

Y

1

0,102221

0,255070

0,041263

0,210651

X1

0,102221

1

-0,041450

0,098888

0,433987

X2

0,255070

-0,041450

1

0,875710

0,204355

X3

0,041263

0,098888

0,875710

1

-0,268813

X4

0,210651

0,433987

0,204355

-0,268813

1

Теперь необходимо проверить значимость полученных частных коэффициентов корреляции, т.е. гипотезу H0: сij/{..} = 0.

Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например ), а n - количество наблюдений. n= 50.

l

Построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij/{..}

Матрица наблюдаемыx значений t-статистик частных коэффициентов корреляции исследуемых экономических показателей

Y

X1

X2

X3

X4

Y

0,689332

1,769593

0,277037

1,445525

X1

0,689332

-0,278296

0,666626

3,231447

X2

1,769593

-0,278296

12,166521

1,400411

X3

0,277037

0,666626

12,166521

-1,872165

X4

1,445525

3,231447

1,400411

-1,872165

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - l - 2.

По результатам, представленным в таблице 6, наблюдаемое значение t-статистики больше критического tкр=2,014103 по модулю для частных коэффициентов корреляции .

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается

Для проверки значимости частных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса.

Отметим в матрице частных коэффициентов корреляции значимые.

Матрица частных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Y

X1

X2

X3

X4

Y

0,689332

1,769593

0,277037

1,445525

X1

0,689332

-0,278296

0,666626

3,231447

X2

1,769593

-0,278296

12,166521

1,400411

X3

0,277037

0,666626

12,166521

-1,872165

X4

1,445525

3,231447

1,400411

-1,872165

Для значимых частных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку сmin ? с ? сmax с помощью Z-преобразования Фишера:

Алгоритм построения интервальной оценки для частного генерального коэффициента корреляции такой же, как и для парного; единственное отличие заключается в расчёте ДZ :

,

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=1), а n - количество наблюдений.

Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых частных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы 8.

Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

R

Zr

Zmin

Zmax

сmin

сmax

Х2Х3

0,87571

1,35706

1,06159

1,65254

0,78627

0,92921

Х1Х4

0,43399

0,46480

0,46480

0,46480

0,43399

0,43399

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых частных генеральных коэффициентов корреляции выглядят следующим образом:

P(0,78627? ? 0,92921)=0,95

P(0,43399? ? 0,43399)=0,95

Теперь построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.

Сравнение парных и частных коэффициентов играет важную роль в выявлении механизмов воздействия переменных друг на друга.

Парный коэффициент корреляции показывает тесноту связи между двумя признаками на фоне действия остальных переменных, а частный характеризует взаимосвязь этих двух признаков при исключении влияния остальных переменных, т.е. их «личную» взаимосвязь.

Таким образом, если оказывается, что парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные усиливают связь между этими двумя признаками. Соответственно, если парный коэффициент корреляции между двумя переменными по абсолютной величине меньше частного, то остальные признаки ослабляют связь между рассматриваемыми двумя.

Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Между переменными

Коэффициент корреляции

парный

Частный

Y X1

0,3324011

0,102221

Y X2

0,637533

0,255070

Y X3

0,5772995

0,041263

Y X4

0,3346368

0,210651

X1 X2

0,26468385

-0,041450

X1 X3

0,23286434

0,098888

X1 X4

0,4859232

0,433987

X2 X3

0,9158768

0,875710

X2 X4

0,1917354

0,204355

X3 X4

0,07798125

-0,268813

По полученным данным можно сделать следующие выводы.

Значимые корреляционные зависимости, полученные на этапе расчёта парных коэффициентов корреляции, подтвердились и при вычислении частных коэффициентов корреляции. При этом выявлены следующие механизмы воздействия переменных друг на друга:

1. Наиболее тесная связь наблюдается изучаемым признаком Y - рентабельностью и факторными признаками X4

2. Воздействие других переменных (фондоотдачи X2, фондовооруженности труда X3 и оборачиваемости нормируемых оборотных средств X4) ослабляет отрицательную взаимосвязь между рентабельностью (Y) и оборачиваемостью ненормируемых оборотных средств (X1)

3. Для связи между рентабельностью (Y) и фондовооруженностью труда (X3) характерна обратная ситуация: воздействие других переменных значительно усиливает эту взаимосвязь (частный коэффициент корреляции по абсолютной величине меньше соответствующего парного коэффициента), хотя оба коэффициента корреляции являются незначимыми.

2.2 Расчёт множественных коэффициентов корреляции

Множественные коэффициенты корреляции служат мерой связи одной переменной с совместным действием всех остальных показателей.

Вычислим точечные оценки множественных коэффициентов корреляции. Множественный коэффициент корреляции, например, для 1-го показателя Y вычисляется по формуле:

где |R| - определитель корреляционной матрицы R;

Rii - алгебраическое дополнение элемента rii корреляционной матрицы R.

Все алгебраические дополнения Rii были найдены в п.2.2 на этапе расчёта частных коэффициентов корреляции, поэтому осталось вычислить только определитель самой корреляционной матрицы.

R11=(-1)1+1?M11= 0,105708;

R22=(-1)2+2?M22= 0,07945.

R33=(-1)3+3?M33= 0,416211;

R44=(-1)4+4?M44= 0,381775;

R55=(-1)5+5?M55= 0,08457;

Чтобы найти определитель корреляционной матрицы, необходимо воспользоваться встроенной математической функцией Excel МОПРЕД.

Получим |R| = 0,057034

.

Таким образом, получаем:

;

Множественный коэффициент детерминации R2i/{..}) (и его выборочная оценка r2i/{..}) показывает долю дисперсии рассматриваемой случайной величины, обусловленную влиянием остальных переменных, включённых в корреляционную модель.

Соответственно (1- R2i/{..}) показывает долю остаточной дисперсии данной случайной величины, обусловленную влиянием других, не включённых в исследуемую модель факторов.

Множественные коэффициенты детерминации получаются возведением соответствующих множественных коэффициентов корреляции в квадрат (таб. 10).

Проверим значимость полученных множественных коэффициентов корреляции и детерминации.

Проверка значимости, т.е. гипотезы о равенстве нулю соответствующего множественного коэффициента корреляции, осуществляется с помощью статистики:

,

где l - порядок множественного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например, ), а n - количество наблюдений.

Произведя расчёты, получим (таб.10).

Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F-распределения для заданного уровня значимости б и числа степеней свободы числителя н1=l и знаменателя н2=n-l-1.

Множественные коэффициенты корреляции и детерминации исследуемых показателей с выделением значимых коэффициентов

(на уровне значимости б=0,05)

Множественный коэффициент корреляции

Множественный коэффициент детерминации r2

Значение статистики

F набл

rY /{..}

0,6785671

0,46045327

9,600835284

rX1/{..}

0,5311625

0,282133606

4,421439823

rX2/{..}

0,9289605

0,862967702

70,84743382

rX3/{..}

0,9222838

0,850607416

64,05494305

rX4/{..}

0,5706101

0,325595856

5,431392158

Полученные данные позволяют сделать следующие выводы.

Если наблюдаемое значение F-статистики превосходит ее критическое значение Fкр= 2,578739, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, у нас все коэффициенты, значимо отличаются от нуля.

Множественный коэффициент детерминации r2Y/{..})=0,4605 показывает, что 46,05% доли дисперсии Y - объёма промышленной продукции, обусловлены изменениями факторных признаков.

3. Регрессионный анализ экономических показателей

коэффициент корреляция мультиколлинеарность регрессионный

После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, обычно переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. С этой целью подбирают класс функций, связывающий результативный показатель Y и аргументы X1, X2, X3 ,... Xk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Наиболее часто используется множественная линейная модель регрессионного анализа, уравнение которой имеет вид:

для всех i=1,2,…n, или в матричной форме:

,

где

Исследуем на основе линейной регрессионной модели зависимость рентабельности (Y) от оборачиваемости ненормируемых оборотных средств (X1), фондоотдачи (X2), фондовооруженности труда (X3) и оборачиваемости нормируемых оборотных средств (X4).

3.1 Проверка исходных данных на мультиколлинеарность

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она возникает в случаях существования достаточно тесных линейных статистических связей между объясняющими переменными X1, X2, X3 ,... Xk. В результате мультиколлинеарности матрица парных коэффициентов корреляции становится слабообусловленной, близкой к вырожденной.

Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Однако существуют некоторые рекомендации по выявлению этого негативного явления, на которые следует обратить внимание. На практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы R больше 0,8 , т.е. | rij | > 0,8 , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей Xi или Xj (как правило, тот, который имеет наибольшую связь с Y).

Прежде, чем переходить к построению регрессионной модели, необходимо проверить объясняющие переменные на наличие мультиколлинеарности. Для этого рассмотрим матрицу парных коэффициентов корреляции между факторными признаками Xi.

Матрица парных коэффициентов корреляции факторных признаков

X1

X2

X3

X4

X1

1

0,264683853

0,232864

0,485923

X2

0,264683853

1

0,915877

0,191735

X3

0,232864344

0,915876826

1

0,077981

X4

0,485923242

0,191735405

0,077981

1

Х2Х3>0,8. Наблюдается мультиколлинеарность. Так как у Х2 связь с У сильнее, чем у Х3 с У. Следовательно, исключаем Х3.

3.2 Построение регрессионной модели и её интерпретация

Необходимо использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты.

Построение и оценка регрессионной модели осуществляется в Excel с помощью модуля регрессии пакета анализа данных.

В модель включены следующие факторные признаки (X1, X2, X4).

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,67788867

R-квадрат

0,45953305

Нормированный R-квадрат

0,4242852

Стандартная ошибка

1,66035267

Наблюдения

50

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

3

107,8217

35,9405624

13,03719558

2,7254E-06

Остаток

46

126,8115

2,75677098

Итого

49

234,6332

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 98,0%

Верхние 98,0%

Y-пересечение

2,97948449

2,364876

1,25989029

0,214063543

-1,7807642

7,73973

-2,72031

8,679281

X1

1,44577968

1,982362

0,72932177

0,469502312

-2,54450775

5,43607

-3,33209

6,223645

X2

0,00012544

2,44E-05

5,13501861

5,57998E-06

7,627E-05

0,00017

6,66E-05

0,000184

X4

0,16072248

0,111796

1,43764177

0,157304027

-0,06431103

0,38576

-0,10873

0,430172

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

Стандартные остатки

1

9,2510839

0,008916

0,00554235

2

9,38979754

-0,0098

-0,0060903

3

9,46367902

2,646321

1,64498257

4

8,96408885

1,845911

1,14743891

5

6,71867408

2,631326

1,63566147

6

8,03364747

1,836353

1,14149717

7

8,71773928

-0,54774

-0,3404808

8

6,57852724

2,541473

1,57980775

9

6,66619082

-0,78619

-0,488705

10

6,5538776

-0,25388

-0,1578131

11

6,54154631

-0,32155

-0,1998768

12

6,27711824

-0,78712

-0,4892815

13

8,6869898

-2,18699

-1,3594572

14

6,70830031

-0,0983

-0,0611046

15

6,80467269

-2,48467

-1,5445002

16

7,90501541

-0,53502

-0,3325715

17

6,94433766

0,075662

0,04703255

18

6,65955524

1,590445

0,98863816

19

8,04680478

0,103195

0,0641473

20

6,85091023

1,86909

1,161847

21

7,69241355

-1,05241

-0,654192

22

7,4979688

0,602031

0,37422929

23

7,07275803

-1,55276

-0,9652117

24

8,79372368

0,576276

0,35821977

25

12,9707925

0,199208

0,12382962

26

7,19618982

-0,52619

-0,3270854

27

7,93829353

-2,25829

-1,4037804

28

7,78419875

-2,5642

-1,5939345

29

6,54162933

3,478371

2,16219392

30

7,86314488

0,296855

0,18452845

31

6,3310574

-2,55106

-1,5857657

32

6,4190127

0,060987

0,03791039

33

9,05574341

1,384257

0,8604693

34

7,29573105

0,354269

0,22021752

35

7,00420721

1,765793

1,09763645

36

7,05078708

-0,05079

-0,0315698

37

11,1677778

-0,10778

-0,0669959

38

10,1740716

-1,15407

-0,7173838

39

11,108195

2,171805

1,35001816

40

8,27688554

0,993114

0,617331

41

6,66839483

0,031605

0,01964612

42

7,16933721

-0,47934

-0,2979613

43

6,34191524

3,078085

1,91337174

44

6,69483773

0,545162

0,33887893

45

6,56476555

-1,17477

-0,7302473

46

5,85971869

-0,24972

-0,1552279

47

7,53630961

-1,94631

-1,2098477

48

8,06583727

-1,49584

-0,9298291

49

9,95759991

-3,4176

-2,1244181

50

6,32414591

-2,09415

-1,3017444

В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков (что совпадает с полученными ранее значениями в корреляционном анализе).

Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.

Нижняя часть таблицы - точечные оценки bi генеральных коэффициентов регрессии вi, проверка их значимости и интервальная оценка.

Оценка вектора коэффициентов b просиходит следующим образом:

Тогда оценка уравнения регрессии имеет вид:

Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.

Нужно проверить на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в1=в2=в3=…=вk=0. Для этого рассчитывается наблюдаемое значение F-статистики:

По таблицам F-распределения для уровня значимости б=0,05 и числа степеней свободы числителя н1=k=3 и знаменателя н2=n-k-1=46 находим критическое значение F-статистики, равное :

Так как наблюдаемое значение F-статистики превосходит ее критическое значение > , то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в1,в2,в4)T значимо отличается от нуля.

Проверку значимости регрессионных коэффициентов проводят на основе t-статистики для уровня значимости .

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.

Коэффициенты

t-статистика

Y-пересечение

2,97948449

1,25989029

X1

1,44577968

0,72932177

X2

0,00012544

5,13501861

X4

0,16072248

1,43764177

Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - k - 1.

tкр= 2,014103.

Для наблюдаемое значение t-статистики больше критического по модулю , следовательно, гипотеза о равенстве нулю этого коэффициента отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующий коэффициент значим.

Для наблюдаемое значение t-статистики меньше критического по модулю , , , следовательно, гипотеза H0 не отвергается, т.е. - незначимы.

Как видно из таблицы, для коэффициентов p-значения >0,05 и все, кроме X2, доверительные интервалы включают ноль, т.е. по всем проверочным критериям эти коэффициенты является незначимым.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X4 (оборачиваемость ненормированных оборотных средств), имеющую незначимый коэффициент регрессии .

II ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены факторные признаки X1, X2 исключён X4.

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,659734

R-квадрат

0,435249

Нормированный R-квадрат

0,411218

Стандартная ошибка

1,67909

Наблюдения

50

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

102,124

51,06198

18,11129

1,47E-06

Остаток

47

132,5092

2,819345

Итого

49

234,6332

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 98,0%

Верхние 98,0%

Y-пересечение

2,156103

2,32037

0,929207

0,35753

-2,51188

6,824085

-3,43215

7,744355

Переменная X 1

2,756173

1,780249

1,548195

0,128283

-0,82523

6,337573

-1,53128

7,043628

Переменная X 2

0,000128

2,46E-05

5,198777

4,28E-06

7,85E-05

0,000178

6,87E-05

0,000187

Оценка коэффициентов в случае двух объясняющих переменных имеет вид:

Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в0,=в1=в2=0. Для этого в результатах дисперсионного анализа находим наблюдаемое значение F-статистики Fнабл=18,11129.

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 18,11129> 3,195056, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=( в0,в1,в2,в3)T значимо отличается от нуля.

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.

Коэффициенты

t-статистика

Y-пересечение

2,156103

0,929207

Переменная X 1

2,756173

1,548195

Переменная X 2

0,000128

5,198777

Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - k - 1.

tкр= 2,01174;

Для всех рассматриваемых коэффициентов в0,в1 наблюдаемое значение t-статистики меньше критического по модулю: |0,929207|>2,01174; |1,548195|>2,01174 гипотеза H0 не отвергается, т.е. - в0,в1 незначим.

Для наблюдаемое значение t-статистики больше критического по модулю следовательно, гипотеза о равенстве нулю этого коэффициента отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующий коэффициент значим.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X1 (оборачиваемость ненормированных оборотных средств), имеющую незначимый коэффициент регрессии .

III ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,637533

R-квадрат

0,406448

Нормированный R-квадрат

0,394083

Стандартная ошибка

1,703348

Наблюдения

50

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

95,36625

95,36625

32,869

6,39235E-07

Остаток

48

139,2669

2,901394

Итого

49

234,6332

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Y-пересечение

5,686597

0,435056

13,07095

1,98016E-17

4,811858449

Переменная X 2

0,000138

2,41E-05

5,733159

6,39235E-07

8,97119E-05

Оценка коэффициентов в случае двух объясняющих переменных имеет вид:

Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в0,=в1 =0. Для этого в результатах дисперсионного анализа находим наблюдаемое значение F-статистики Fнабл=32,869.

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 32,869> 4,042652, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=( в0,в1)T значимо отличается от нуля.

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.

Коэффициенты

t-статистика

Y-пересечение

5,686597

13,07095

Переменная X 2

0,000138

5,733159

Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - k - 1.

tкр= 2,010635;

Для всех рассматриваемых коэффициентов в0,в1 наблюдаемое значение t-статистики больше критического по модулю: |13,07095|>2,010635; |5,733159|>2,010635, следовательно, гипотеза о равенстве нулю этого коэффициента отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующий коэффициент значим.

Т.к. в данном случае все коэффициенты оказались значимыми, процесс исключения переменных прекращается

Окончательная оценка регрессии со значимыми коэффициентами имеет вид:

Коэффициенты

Нижние 95%

Верхние 95%

Нижние 98,0%

Верхние 98,0%

Y-пересечение

5,686597

4,811858449

6,561337

4,639599

6,733596

Переменная X 2

0,000138

8,97119E-05

0,000187

8,02E-05

0,000196

Величина R2 характеризует долю общей дисперсии зависимой переменной, обусловленную воздействием объясняющих переменных. Множественный коэффициент детерминации r2Y/{..})=0,4605 показывает, что 46,05% доли дисперсии Y - объёма промышленной продукции, обусловлены изменениями факторных признаков.

Коэффициент регрессии показывает среднюю величину изменения зависимой переменной Y при изменении объясняющей переменной X на единицу собственного изменения. Знак при коэффициенте указывает направление этого изменения.

Коэффициент регрессии при X2 показывает, что при росте удельного веса покупных изделий на единицу производительность труда Y в среднем увеличивается на 0,000138 единиц. Построенная выше интервальная оценка показывает, что с вероятностью 0,95 при росте удельного веса покупных изделий на единицу уменьшение производительности труда будет в пределах от до единиц.

3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии

Сравнительная таблица исходных данных показателя производительности труда (Y) с рассчитанными с помощью построенной линейной регрессионной модели

Наблюдение

Предсказанное Y

Остатки

Стандартные остатки

Y

1

9,279785526

-0,019785526

-0,011736043

9,26

2

8,993640312

0,386359688

0,229174283

9,38

3

8,807666649

3,302333351

1,958822057

12,11

4

8,618515129

2,191484871

1,299907807

10,81

5

6,70820913

2,64179087

1,567012677

9,35

6

7,28740794

2,58259206

1,531898132

9,87

7

9,363100622

-1,193100622

-0,70770318

8,17

8

6,764443366

2,355556634

1,397229111

9,12

9

7,287546108

-1,407546108

-0,834904314

5,88

10

6,99573602

-0,69573602

-0,412684886

6,3

11

7,180328008

-0,960328008

-0,569631071

6,22

12

6,566863619

-1,076863619

-0,638755687

5,49

13

9,384102105

-2,884102105

-1,710742744

6,5

14

6,268283317

0,341716683

0,202693703

6,61

15

6,178059838

-1,858059838

-1,102132404

4,32

16

7,641393472

-0,271393472

-0,160980574

7,37

17

7,05058858

-0,03058858

-0,018144015

7,02

18

6,512149228

1,737850772

1,03082883

8,25

19

7,988746957

0,161253043

0,095649343

8,15

20

6,953042215

1,766957785

1,048094034

8,72

21

7,775416098

-1,135416098

-0,673486853

6,64

22

7,265715618

0,834284382

0,494866652

8,1

23

6,579436876

-1,059436876

-0,628418787

5,52

24

9,089390497

0,280609503

0,166447183

9,37

25

12,55726047

0,612739529

0,363454436

13,17

26

7,271380492

-0,601380492

-0,356716675

6,67

27

8,373682044

-2,693682044

-1,597792604

5,68

28

8,306670731

-3,086670731

-1,830898964

5,22

29

6,955667401

3,064332599

1,81764881

10,02

30

8,101491764

0,058508236

0,034704923

8,16

31

6,552217848

-2,772217848

-1,644377139

3,78

32

6,90385453

-0,42385453

-0,251414837

6,48

33

8,126500109

2,313499891

1,372282605

10,44

34

7,115527377

0,534472623

0,3170294

7,65

35

6,916427786

1,853572214

1,099470511

8,77

36

6,847482127

0,152517873

0,090467964

7

37

10,19431723

0,865682765

0,513491012

11,06

38

9,99190162

-0,97190162

-0,57649611

9,02

39

12,10600491

1,17399509

0,696370485

13,28

40

7,597870661

1,672129339

0,991845305

9,27

41

6,569626972

0,130373028

0,07733246

6,7

42

7,222330975

-0,532330975

-0,315759054

6,69

43

6,592286468

2,827713532

1,677295127

9,42

44

7,218185945

0,021814055

0,012939291

7,24

45

6,996979529

-1,606979529

-0,953200847

5,39

46

6,234708577

-0,624708577

-0,370554032

5,61

47

7,798213761

-2,208213761

-1,309830766

5,59

48

8,57070912

-2,00070912

-1,186746684

6,57

49

8,369537015

-1,829537015

-1,085213719

6,54

50

6,149597301

-1,919597301

-1,138634152

4,23

Проанализировав графу Стандартные остатки (Standart Residuals) можно прийти к выводу, что предприятия № 3, 5, 6, 29 демонстрируют большую рентабельность, чем в среднем по всем рассматриваемым предприятиям. А для предприятия № 28 характерна обратная ситуация - отрицательное отклонение от линии регрессии.

Рис.1. Диаграмма сравнения исходных данных показателя производительности труда (Y) с рассчитанными с помощью линейной регрессионной модели

Рис.2. Диаграмма сравнения расчётных и реальных значений исследуемого показателя (ряды ранжированы)

Размещено на Allbest.ru


Подобные документы

  • Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.

    курсовая работа [314,1 K], добавлен 21.01.2011

  • Выбор факторных признаков для построения регрессионной модели неоднородных экономических процессов. Построение диаграммы рассеяния. Анализ матрицы коэффициентов парной корреляции. Определение коэффициентов детерминации и средних ошибок аппроксимации.

    контрольная работа [547,6 K], добавлен 21.03.2015

  • Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.

    задача [83,2 K], добавлен 20.01.2010

  • Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.

    лабораторная работа [214,2 K], добавлен 17.10.2009

  • Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.

    лабораторная работа [890,1 K], добавлен 06.12.2014

  • Определение методом регрессионного и корреляционного анализа линейных и нелинейных связей между показателями макроэкономического развития. Расчет среднего арифметического по столбцам таблицы. Определение коэффициента корреляции и уравнения регрессии.

    контрольная работа [4,2 M], добавлен 14.06.2014

  • Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.

    курсовая работа [1,1 M], добавлен 07.08.2011

  • Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

    контрольная работа [141,3 K], добавлен 05.05.2010

  • Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.

    лабораторная работа [1,8 M], добавлен 25.05.2009

  • Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.

    курсовая работа [243,1 K], добавлен 17.01.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.