Построение множественных регрессионных моделей

Подготовка данных и построение модели. Корреляционный анализ экономических показателей. Расчёт частных и множественных коэффициентов корреляции. Построение регрессионной модели и её интерпретация. Проверка исходных данных на мультиколлинеарность.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 16.01.2016
Размер файла 635,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1

Содержание

Введение

1. Подготовка данных и построение модели

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

2.2 Расчёт частных коэффициентов корреляции

2.3 Расчёт множественных коэффициентов корреляции

3. Регрессионный анализ экономических показателей

3.1 Проверка исходных данных на мультиколлинеарность

3.2 Построение регрессионной модели и её интерпретация

3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии

Заключение

Список литературы

Введение

корреляционный экономический мультиколлинеарность

Актуальность темы работы обусловлена тем, что множественная регрессия используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики. Множественная регрессия является одним из наиболее распространенных методов в эконометрике. Основной целью множественной регрессии является построение модели с большим числом факторов, при этом определив влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Построение множественных регрессионных моделей используется в анализе информации, собираемой в процессе эмпирических социологических исследований, представляет собой не просто совокупность технических приемов и методов, позволяющих в той или иной форме визуализировать полученные данные. Анализ данных является ключевым этапом всего исследования, в ходе которого происходит непосредственная проверка соответствия собранной информации тем моделям социальных явлений, которые, явно или латентно, имеются у социологов. И более того, в ходе анализа формулируются и проверяются новые модели, адекватно отражающие те закономерности, которые есть в собранных данных. Большаков А.А. Методы обработки многомерных данных и временных рядов: учебное пособие для вузов / А.А. Большаков. - М.: Горячая линия-Телеком, 2007. - с. 102.

Методы корреляционного и регрессионного анализов призваны решать такие задачи, как оценка взаимосвязи показателей и моделирование их зависимости для дальнейшего прогнозирования.

Данные методы статистической обработки данных реализованы во многих программных продуктах и статистических пакетах анализа переменных. Но в настоящее время Microsoft Office, в состав которого входит ППП Microsoft Excel, имеет наибольшее распространение и доступен всем пользователям современных компьютеров, в отличие от многих специальных статистических пакетов.

Для анализа взаимосвязи показателей эффективности производства продукции для курсовой работы были предоставлены показатели производственно-хозяйственной деятельности 50 предприятий машиностроения.

В данной курсовой работе будет проводиться анализ взаимосвязи данных экономических показателей и моделирование их зависимости с целью дальнейшего исследования.

Цель работы: рассмотреть уравнение множественной регрессии и условия его применения.

Задачи работы:

- рассмотреть общий вид модели множественной регрессии;

- выявить условия оценки параметров модели с помощью МНК;

- привести методику анализа статистической значимости параметров модели;

- рассмотреть примеры построения регрессионных моделей и оценку их качества.

Объект работы: теория и методы эконометрического анализа.

Предмет работы; уравнение множественной регрессии.

Теоретической и методологической основой исследования являются работы, посвященные теории, методологии и практике анализа данных.

Информационную базу исследования составляют специализированные статистические, официальные и информационные Интернет-материалы и другие информационные источники.

Теоретические знания, практические навыки, основные положения и выводы контрольной работы могут быть использованы при проведении профессиональных исследований в сфере социологии.

1. Подготовка данных и построение модели

Для статистического исследования в рамках курсовой работы необходимо подготовить данные в виде матрицы X размерностью (nЧk), столбцами которой будут k изучаемых переменных (не менее 5 переменных), а строками - их n значений (не менее 30 наблюдений).

Необходимо провести анализ взаимосвязи следующих экономических показателей:

Результативный признак:

Y - рентабельность;

Факторные признаки Xi:

X8 - премии и вознаграждения на одного работника;

X10 - фондоотдача;

X15 - оборачиваемость нормируемых оборотных средств;

X16 - оборачиваемость ненормируемых оборотных средств.

Исходные данные представлены в таблице 1.

Гипотеза. Предположим, что рассматриваемые признаки Y, X8, X10, X15, X16 в генеральной совокупности подчиняются нормальному закону распределения и указанные данные представляют выборку из этой генеральной совокупности.

Таблица 1. Исходные данные

№п/п

Y

X8

X10

X15

X16

1

13,26

1,23

1,45

166,32

10,08

2

10,16

1,04

1,3

92,88

14,76

3

13,72

1,8

1,37

158,04

6,48

4

12,85

0,43

1,65

93,96

21,96

5

10,63

0,88

1,91

173,88

11,88

6

9,12

0,57

1,68

162,3

12,6

7

25,83

1,72

1,94

88,56

11,52

8

23,39

1,7

1,89

101,16

8,28

9

14,68

0,84

1,94

166,32

11,52

10

10,05

0,6

2,06

140,76

32,4

11

13,99

0,82

1,96

128,52

11,52

12

9,68

0,84

1,02

177,84

17,28

13

10,03

0,67

1,85

114,48

16,2

14

9,13

1,04

0,88

93,24

13,32

15

5,37

0,66

0,62

126,72

17,28

16

9,86

0,86

1,09

91,8

9,72

17

12,62

0,79

1,6

69,12

16,2

18

5,02

0,34

1,53

66,24

24,84

19

21,18

1,6

1,4

67,68

14,76

20

25,17

1,46

2,22

50,4

7,56

21

19,4

1,27

1,32

70,56

8,64

22

21

1,58

1,48

72

8,64

23

6,57

0,68

0,68

97,2

9

24

14,19

0,86

2,3

80,28

14,76

25

15,81

1,98

1,37

51,48

10,08

26

5,23

0,33

1,51

105,12

14,76

27

7,99

0,45

1,43

128,52

10,44

28

17,5

0,74

1,82

94,68

14,76

29

17,16

0,03

2,62

85,32

20,52

30

14,54

0,99

1,75

76,32

14,4

31

6,24

0,24

1,54

153

24,84

32

12,08

0,57

2,25

107,64

11,16

33

9,49

1,22

1,07

90,72

6,48

34

9,28

0,68

1,44

82,44

9,72

35

11,42

1

1,4

79,92

3,24

36

10,31

0,81

1,31

120,96

6,48

37

8,65

1,27

1,12

84,6

5,4

38

10,94

1,14

1,16

85,32

6,12

39

9,87

1,89

0,88

101,52

8,64

40

6,14

0,67

1,07

107,64

11,88

41

12,93

0,96

1,24

85,32

7,92

42

9,78

0,67

1,49

131,76

10,08

43

13,22

0,98

2,03

116,64

18,72

44

17,29

1,16

1,84

138,24

13,68

45

7,11

0,54

1,22

156,96

16,56

46

22,49

1,23

1,72

137,52

14,76

47

12,14

0,78

1,75

135,72

7,92

48

15,25

1,16

1,46

155,52

18,36

49

31,34

4,44

1,6

48,6

8,28

50

11,56

1,06

1,47

42,84

14,04

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.

Отдельный выборочный коэффициент корреляции rij между двумя выбранными признаками Xi и Xj в Excel можно вычислить с помощью встроенных статистических функций КОРРЕЛ или ПИРСОН. Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных. Елисеева И.И. Общая теория статистики: учебник для вузов / И.И. Елисеева, М.М. Юзбашев; под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2006. - с. 106.

Итак, получаем матрицу парных коэффициентов корреляции размерности kЧk (в нашем случае 5Ч5).

Таблица 2. Матрица парных коэффициентов корреляции исследуемых экономических показателей

Y

X8

X10

X15

X16

Y

1

0,688511

0,450862

-0,32518

-0,21266

X8

0,688511

1

-0,0929

-0,3302

-0,41979

X10

0,450862

-0,0929

1

0,008075

0,278902

X15

-0,32518

-0,3302

0,008075

1

0,206628

X16

-0,21266

-0,41979

0,278902

0,206628

1

Теперь необходимо проверить значимость полученных коэффициентов корреляции, то есть гипотезу H0: с=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij (таблица 3).

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n-2.

Для этого используем встроенную функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-2=50-2=48.

Можно найти значения tкр по таблицам математической статистики. Получаем tкр= 2,010635.

Таблица 3. Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей

tнабл

Y

X8

X10

X15

X16

Y

6,57746

3,49954

-2,38235

-1,50784

X8

6,57746

-0,64641

-2,42367

-3,20439

X10

3,49954

-0,64641

0,05595

2,01213

X15

-2,3824

-2,42367

0,05595

1,46313

X16

-1,50784

-3,20439

2,01213

1,46313

По результатам, представленным в таблице 3, наблюдаемое значение t-статистики больше критического tкр по модулю для парных коэффициентов корреляции . Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, и это значит, что коэффициенты - незначимы.

Для проверки значимости парных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения rкр для уровня значимости б=0,05 и числа степеней свободы н=n-2=50-2=48.

По таблице rкр (б=0,05; н=48)=0,273.

Если соответствующий коэффициент |rij|>rкр, то он считается значимым. Отметим в матрице парных коэффициентов корреляции значимые.

Таблица 4. Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Y

X8

X10

X15

X16

Y

1

0,688511

0,45086

-0,32518

-0,21266

X8

0,688511

1

-0,09290

-0,3302

-0,41979

X10

0,450862

-0,0929

1

0,008075

0,278902

X15

-0,32518

-0,3302

0,00807

1

0,206628

X16

-0,21266

-0,41979

0,27890

0,206628

1

Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий: Елисеева И.И. Общая теория статистики: учебник для вузов / И.И. Елисеева, М.М. Юзбашев; под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2006. - с. 167.

1). Zr По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Zr , являющееся гиперболическим арктангенсом r:

Для этого в Excel есть встроенная функция ATANH, где в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r. Следует учитывать, что Z-функция - нечетная, т.е. Z(-r)= - Z(r). Можно найти значение Zr и по таблице Z-преобразования Фишера.

2). ДZ Найдём значение tг, соответствующее заданной надёжности г=0,95. - значение функции Лапласа.

Для нахождения значения tг можно использовать встроенную функцию Excel НОРМСТОБР. Необходимо заметить, что Excel с помощью функции НОРМСТОБР выдаёт не значения функции Лапласа, а значение функции распределения стандартного нормального закона F(t):

.

Поэтому при расчёте всех интервальных оценок нужно пересчитывать г=0,95 в , а по этому значению уже вычислять t.

В нашем случае для надёжности г=0,95: F(t)=0,975; tг =1,959964.

Находим

3). Zmin и Zmax Теперь можно найти Zmin и Zmax:

Zmin = Zr - ДZ; Zmax= Zr + ДZ

4). сmin и сmax Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции сmin и сmax , соответствующие Zmin и Zmax.

Соответствующие значения сmin и сmax являются гиперболическими тангенсами Zmin и Zmax:

.

Для их нахождения в Excel используем встроенную функцию TANH, введя в качестве аргумента значения соответствующих Zmin и Zmax. Можно найти значения сmin и сmax и по таблице Z-преобразования Фишера.

Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых парных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы.

Таблица 5. Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

r

Zr

Zmin

Zmax

сmin

сmax

yx8

0,688511

0,845119

0,559229

1,131009

0,507405

0,811364

yx10

0,450862

0,485782

0,199891

0,771672

0,197271

0,6479

yx15

-0,32518

-0,33742

-0,62331

-0,05153

-0,55343

-0,05149

x8x15

-0,3302

-0,34306

-0,62895

-0,05717

-0,55733

-0,05711

x8x16

-0,41979

-0,44744

-0,73333

-0,16155

-0,6251

-0,16015

x10x16

0,278902

0,286491

0,000601

0,572381

0,000601

0,517106

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:

P(-0,507405? сYX8 ? 0,811364)=0,95

P(0,197271? сYX10 ? 0,6479)=0,95

P(-0,55343? сYX15 ? -0,05149)=0,95

P(-0,55733? сX8X15 ? -0,05711)=0,95

P(-0,6251? сX8X16 ? -0,16015)=0,95

P(0,000601? сX10X16 ? 0,517106)=0,95

По полученным данным можно сделать следующие выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1) Значимая корреляционная прямая взаимосвязь обнаружена между изучаемым признаком Y - рентабельностью и факторными признаками X8 - премиями и вознаграждениями на одного работника и X10 - фондоотдачей.

2) Между рентабельностью (Y) и оборачиваемостью нормируемых оборотных средств (X15) существует обратная умеренная связь.

3) Более умеренная обратная связь существует между факторным признаком X8 - премиями и вознаграждениями на одного работника и факторными признаками X15 - оборачиваемостью нормируемых оборотных средств и X16 - оборачиваемостью ненормируемых оборотных средств.

4) Так же умеренная прямая взаимосвязь обнаружена между X10 - фондоотдачей и X16 - оборачиваемостью ненормируемых оборотных средств.

2.2 Расчёт частных коэффициентов корреляции

Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными при исключении влияния остальных показателей, то есть они характеризуют «чистую» связь только между этими признаками. Они важны для понимания взаимодействия всего комплекса показателей, так как позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.

Частный коэффициент (k-2)-го порядка между переменными, например, между Y и X1, равен:

,

где Rij - алгебраическое дополнение элемента rij корреляционной матрицы R, равное Rij =(-1)i+j ? Mij

Mij - минор элемента rij корреляционной матрицы R, т.е. определитель матрицы на 1 меньшего порядка, полученной из R путём вычёркивания i-й строки и j-го столбца. Таким образом, для расчёта частных коэффициентов корреляции нужно сформировать в Excel соответствующие матрицы размерности (k-1)Ч(k-1) (в нашем случае 4Ч4). Чтобы найти определители этих матриц, воспользуемся встроенной функцией Excel МОПРЕД, указав в качестве массива соответствующую матрицу переменных. Воспользовавшись этой функцией, получаем результаты в таблице 6:

Таблица 6. Алгебраические дополнения корреляционной матрицы

R11

0,670601

R12

-0,4591

R24

0,013062

R22

0,532685

R13

-0,35562

R25

0,05615

R33

0,369498

R14

0,06184

R34

-0,02413

R44

0,194005

R15

0,03629

R35

-0,07265

R55

0,220938

R23

0,240709

R45

-0,01472

Рассчитав выборочные частные коэффициенты корреляции, получаем матрицу следующего вида:

Таблица 7. Матрица выборочных частных коэффициентов корреляции исследуемых экономических показателей

Y

X8

X10

X15

X16

Y

1

0,768136

0,714408

-0,17145

-0,09428

X8

0,768136

1

-0,54256

-0,04063

-0,16368

X10

0,714408

-0,54256

1

0,090117

0,254258

X15

-0,17145

-0,04063

0,090117

1

0,071116

X16

-0,09428

-0,16368

0,254258

0,071116

1

Теперь необходимо проверить значимость полученных частных коэффициентов корреляции, т.е. гипотезу H0: сij/{..} = 0.

Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин, а n - количество наблюдений.

При l = 3 построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij/{..} (таблица 8).

Таблица 8. Матрица наблюдаемыx значений t-статистик частных коэффициентов корреляции исследуемых экономических показателей

tнабл

Y

X8

X10

X15

X16

Y

8,047659

6,848919

-1,16739

-0,63529

X8

8,047665

-4,33282

-0,27279

-1,11297

X10

6,848926

-4,33282

0,606996

1,763575

X15

-1,16739

-0,27279

0,606993

0,478273

X16

-0,63529

-1,11298

1,763572

0,478272

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - l - 2. Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-l-2=50-3-2=45. (Можно найти значения tкр по таблицам математической статистики).

Получаем tкр=2,014103.

По результатам, представленным в таблице 7, наблюдаемое значение t-статистики больше критического tкр по модулю для частных коэффициентов корреляции

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, то есть они незначимы.

Для проверки значимости частных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения rкр с учётом уровня значимости б=0,05 и числа степеней свободы н=n-l-2=50-3-2=45. По таблице rкр (б=0,05; н=45)=0,288. Если соответствующий коэффициент |r|> rкр, то он считается значимым.

Отметим в матрице частных коэффициентов корреляции значимые.

Таблица 9. Матрица частных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Y

X8

X10

X15

X16

Y

1

0,768136

0,714408

-0,17145

-0,09428

X8

0,768136

1

-0,54256

-0,04063

-0,16368

X10

0,714408

-0,54256

1

0,090117

0,254258

X15

-0,17145

-0,04063

0,090117

1

0,071116

X16

-0,09428

-0,16368

0,254258

0,071116

1

Для значимых частных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку сmin ? с ? сmax с помощью Z-преобразования Фишера:

Алгоритм построения интервальной оценки для частного генерального коэффициента корреляции такой же, как и для парного; единственное отличие заключается в расчёте ДZ:

,

где l - порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=3), а n - количество наблюдений.

Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых частных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы 10.

Таблица 10. Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

r

Zr

Zmin

Zmax

сmin

сmax

yx8

0,768136

1,015765

0,720289

1,311241

0,617089

0,864589

yx10

0,714408

0,896129

0,600654

1,191605

0,537515

0,831076

x8x10

-0,54256

-0,60778

-0,90326

-0,31231

-0,71788

-0,30253

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых частных генеральных коэффициентов корреляции выглядят следующим образом:

P(0,617089? ? 0,864589)=0,95

P(0,537515? ? 0,831076)=0,95

P(-0,71788? ? -0,30253)=0,95

Теперь построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.

Сравнение парных и частных коэффициентов играет важную роль в выявлении механизмов воздействия переменных друг на друга. Парный коэффициент корреляции показывает тесноту связи между двумя признаками на фоне действия остальных переменных, а частный характеризует взаимосвязь этих двух признаков при исключении влияния остальных переменных, то есть их «личную» взаимосвязь.

Таким образом, если оказывается, что парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные усиливают связь между этими двумя признаками. Соответственно, если парный коэффициент корреляции между двумя переменными по абсолютной величине меньше частного, то остальные признаки ослабляют связь между рассматриваемыми двумя.

Далее рассмотрим таблицу сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов при б=0,05, и по данным сделаем вывод о воздействии переменных друг на друга.

Таблица 11. Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Между переменными

Коэффициент корреляции

парный

частный

Y X8

0,688511

0,768136

Y X10

0,450862

0,714408

Y X15

-0,325176

-0,171447

Y X16

-0,212659

-0,094281

X8 X10

-0,092898

-0,542564

X8 X15

-0,330204

-0,040631

X8 X16

-0,419788

-0,163675

X2 X15

0,008075

0,090117

X10 X16

0,278902

0,254258

X15 X16

0,206628

0,071116

По полученным данным можно сделать вывод, что выявлены следующие механизмы воздействия переменных друг на друга:

1. Наиболее сильная связь присутствует между изучаемым признаком Y - рентабельностью и факторным признаком X8 - премиями и вознаграждениями на одного работника. Эта связь является прямой и весьма сильной и значимой, хотя частный коэффициент по модулю несколько больше парного. Таким образом, можно сделать вывод, что остальные переменные, включённые в корреляционную модель, ослабляют взаимосвязь между указанными факторными признаками.

2. Наиболее тесная связь наблюдается между изучаемым признаком Y - рентабельностью и факторным признаком фондоотдачей X10. Влияние прочих переменных немного ослабляет значимую положительную связь между рентабельностью Y и фондоотдачей X10.

Так же тесная связь наблюдается между изучаемым признаком Y - рентабельностью и факторным признаком X15 - оборачиваемостью нормируемых оборотных средств, при этом наблюдается обратная зависимость. Поскольку парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные будут усиливать связь между данными двумя признаками.

Воздействие других переменных ослабляет отрицательную взаимосвязь между факторными признаками X8 - премиями и вознаграждениями на одного работника и фондоотдачей X10, так как абсолютная величина частного коэффициента корреляции превышает абсолютное значение парного коэффициента корреляции.

Противоположная ситуация наблюдается для обратной связи между рентабельностью Y и оборачиваемостью ненормируемых оборотных средств X16. Поскольку абсолютная величина парного коэффициента корреляции по модулю превышает абсолютное значение частного коэффициента корреляции, отсюда можно сделать вывод, что воздействие других переменных будет усиливать отрицательную взаимосвязь между рентабельностью Y и оборачиваемостью ненормируемых оборотных средств X16, хотя оба коэффициента корреляции являются незначимыми.

Поскольку парный коэффициент корреляции, хоть и не намного, но по модулю несколько больше частного коэффициента корреляции, влияние прочих переменных будет немного усиливать положительную связь между двумя факторными признаками - фондоотдачей X10 и оборачиваемостью ненормируемых оборотных средств X16.

Воздействие остальных переменных будет усиливать отрицательную взаимосвязь между факторным признаком X8 - премиями и вознаграждениями на одного работника и факторным признаком X15 - оборачиваемостью нормируемых оборотных средств.

Такая же ситуация наблюдается и в обратной взаимосвязи между факторными признаками X8 - премиями и вознаграждениями на одного работника и X16 - оборачиваемостью ненормируемых оборотных средств. То есть остальные переменные усиливают данную взаимосвязь.

2.3 Расчёт множественных коэффициентов корреляции

Множественные коэффициенты корреляции Ri/{..} служат мерой связи одной переменной с совместным действием всех остальных показателей.

Вычислим точечные оценки множественных коэффициентов корреляции. Множественный коэффициент корреляции, например, для 1-го показателя Y вычисляется по формуле:

где |R| - определитель корреляционной матрицы R;

Rii - алгебраическое дополнение элемента rii корреляционной матрицы R.

Все алгебраические дополнения Rii были найдены на этапе расчёта частных коэффициентов корреляции, поэтому нам остается вычислить только определитель самой корреляционной матрицы. Чтобы найти определитель корреляционной матрицы, воспользуемся встроенной математической функцией Excel МОПРЕД.

Получим |R| = 0,166346.

Множественный коэффициент детерминации R2i/{..} (и его выборочная оценка r2i/{..}) показывает долю дисперсии рассматриваемой случайной величины, обусловленную влиянием остальных переменных, включённых в корреляционную модель. Соответственно (1- R2i/{..}) показывает долю остаточной дисперсии данной случайной величины, обусловленную влиянием других, не включённых в исследуемую модель факторов. Множественные коэффициенты детерминации получаются возведением соответствующих множественных коэффициентов корреляции в квадрат. Минашкин В.Г. Статистика: учебник для вузов / В.Г. Минашкин и др.; под ред. В.Г. Минашкина. - М.: Проспект, 2006. - с. 201.

Проверим значимость полученных множественных коэффициентов корреляции и детерминации.

Проверка значимости, т.е. гипотезы о равенстве нулю соответствующего множественного коэффициента корреляции, осуществляется с помощью статистики:

,

где l - порядок множественного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например, ), а n - количество наблюдений.

Произведя расчёты, получим результаты в таблице 12.

Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F-распределения для заданного уровня значимости б и числа степеней свободы числителя н1=l и знаменателя н2=n-l-1. Для определения Fкр можно воспользоваться встроенной функцией Excel FРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н1=l=4 и н2=n-l-1=50-4-1=45. Так же можно найти значения Fкр по таблицам математической статистики.

Получаем Fкр(0,05; 4; 25)= 2,578739.

Таблица 12. Множественные коэффициенты корреляции и детерминации исследуемых показателей с выделением значимых коэффициентов (на уровне значимости б=0,05)

R

R2

Fнабл

Ry/{…}=

0,867148

0,751945

34,10287

Rx1/{…}=

0,82929

0,687722

24,77562

Rx2/{…}=

0,741489

0,549806

13,73924

Rx3/{…}=

0,377582

0,142568

1,870579

Rx4/{…}=

0,497085

0,247094

3,692094

Если наблюдаемое значение F-статистики превосходит ее критическое значение Fкр=2,578739, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, у нас все коэффициенты, кроме переменной X15, значимо отличаются от нуля.

Полученные данные позволяют сделать следующие выводы:

Множественный коэффициент корреляции =0,8671 значим и имеет достаточно высокое значение, что говорит о том, показатель Y - рентабельность имеет тесную связь с многомерным массивом факторных признаков X8 - премии и вознаграждения на одного работника, X10 - фондоотдача, X15 - оборачиваемость нормируемых оборотных средств и X16 - оборачиваемость ненормируемых оборотных средств. Это даёт основание для проведения дальнейшего регрессионного анализа.

Множественный коэффициент детерминации r2Y/{..}=0,7519 показывает, что 75,19% доли дисперсии Y - объёма промышленной продукции, обусловлены изменениями факторных признаков.

Факторные признаки тоже имеют достаточно высокие значения множественных коэффициентов корреляции и детерминации, что говорит об их сильной взаимосвязанности, за исключением переменной X15 - её множественный коэффициент не значим, и это подтверждается тем фактом, что только 14,26% доли её дисперсии обусловлены изменениями переменных, включённых в рассматриваемую модель, а, соответственно 85,74% дисперсии обусловлены влиянием других, не включённых в корреляционную модель остаточных факторов.

Итак, полученные результаты корреляционного анализа, показавшие, что показатель Y - рентабельность имеет тесную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования - построению регрессионной модели.

3. Регрессионный анализ экономических показателей

После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. Для этого подбирают класс функций, связывающий результативный показатель Y и аргументы X1, X2, X3 ,... Xk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Наиболее часто используется множественная линейная модель регрессионного анализа, уравнение которой имеет вид:

для всех i=1,2,…n, или в матричной форме:

,

Исследуем на основе линейной регрессионной модели зависимость рентабельности () от премий и вознаграждений на одного работника (X8), фондоотдачи (X10), оборачиваемости нормируемых оборотных средств (X15) и оборачиваемости ненормируемых оборотных средств (X16).

3.1 Проверка исходных данных на мультиколлинеарность

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она возникает в случаях существования достаточно тесных линейных статистических связей между объясняющими переменными X1, X2, X3 ,... Xk. В результате мультиколлинеарности матрица парных коэффициентов корреляции становится слабообусловленной, близкой к вырожденной.

Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Однако на практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции.

Если один из элементов матрицы R больше 0,8 , т.е. | rij | > 0,8 , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей Xi или Xj (как правило, тот, который имеет наибольшую связь с Y).

Прежде, чем переходить к построению регрессионной модели, необходимо проверить объясняющие переменные на наличие мультиколлинеарности. Для этого рассмотрим матрицу парных коэффициентов корреляции между факторными признаками Xi.

Таблица 13. Матрица парных коэффициентов корреляции факторных признаков

Y3

X8

X10

X15

X16

Y3

1

0,688511

0,450862

-0,32518

-0,21266

X8

0,688511

1

-0,0929

-0,3302

-0,41979

X10

0,450862

-0,0929

1

0,008075

0,278902

X15

-0,32518

-0,3302

0,008075

1

0,206628

X16

-0,21266

-0,41979

0,278902

0,206628

1

Поскольку значения коэффициентов корреляции для всех пар объясняющих переменных не превышают по модулю 0,8, то в нашем случае нет необходимости сокращать набор объясняющих переменных.

3.2 Построение регрессионной модели и её интерпретация

Будем использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты. Построение и оценка регрессионной модели осуществляется в Excel с помощью модуля регрессии пакета анализа данных.

Приступим к анализу.

I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены все факторные признаки (X8, X10, X15, X16).

Результаты регрессионного анализа

Регрессионная статистика

Множественный R

0,86715

R-квадрат

0,75195

Нормированный R-квадрат

0,72990

Стандартная ошибка

3,00422

Наблюдения

50

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

4

1231,157

307,7894

34,10287

4,27E-13

Остаток

45

406,1394

9,025321

Итого

49

1637,297

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 98,0%

Верхние 98,0%

Y-пересечение

-2,03350

2,58972

-0,78522

0,43644

-7,24946

3,18246

-8,28020

4,21320

X8

6,01042

0,74685

8,04766

2,9E-10

4,50618

7,51466

4,20892

7,81192

X10

7,32188

1,06906

6,84892

1,7E-08

5,16869

9,47507

4,74319

9,90057

X15

-0,01487

0,01274

-1,16739

0,24920

-0,04054

0,01079

-0,04561

0,01586

X16

-0,05583

0,08789

-0,63529

0,52846

-0,23285

0,12118

-0,26783

0,15616

В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков, что совпадает с полученными ранее значениями в корреляционном анализе.

Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.

Нижняя часть таблицы - точечные оценки bi генеральных коэффициентов регрессии вi, проверка их значимости и интервальная оценка.

Оценка вектора коэффициентов b (столбец «Коэффициенты»):

Тогда оценка уравнения регрессии имеет вид:

Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.

Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в123=…=вk=0. Для этого рассчитывается наблюдаемое значение F-статистики:

Excel выдаёт это в результатах дисперсионного анализа:

В столбце F указывается значение Fнабл.

По таблицам F-распределения или с помощью встроенной статистической функции FРАСПОБР для уровня значимости б=0,05 и числа степеней свободы числителя н1=k=4 и знаменателя н2=n-k-1=45 находим критическое значение F-статистики, равное Fкр = 2,578739.

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 34,10287 > 2,578739, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в1234)T значимо отличается от нуля.

Проверим значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу .

Проверку значимости регрессионных коэффициентов проводят на основе t-статистики для уровня значимости .

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце «t-статистика».

Коэффициенты (bi)

t-статистика (tнабл)

Y-пересечение

b0 = - 2,0335

-0,78522

Переменная X8

b1 = 6,01042

8,04766

Переменная X10

b2 = 7,32188

6,84892

Переменная X15

b3 = - 0,01487

-1,16739

Переменная X16

b4 = - 0,05583

-0,63529

При отсутствии пакета анализа данных, t-статистики можно получить, исходя из результатов оценки коэффициентов модели и их стандартных ошибок:

Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - k - 1.

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н= n-k-1=50-4-1=45.

Получаем tкр=2,01410.

Для наблюдаемое значение t-статистики больше критического по модулю ,

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для наблюдаемое значение t-статистики меньше критического значения по модулю ,, следовательно, гипотеза H0 не отвергается, т.е. - незначимы.

Значимость регрессионных коэффициентов проверяют и следующие столбцы результирующей таблицы:

Столбец «p-значение» показывает значимость параметров модели граничным 5%-ым уровнем, т.е. если p?0,05, то соответствующий коэффициент считается значимым, если p>0,05, то незначимым.

И последние столбцы - «нижние 95%» и «верхние 95%» и «нижние 98%» и «верхние 98%» - это интервальные оценки регрессионных коэффициентов с заданными уровнями надёжности для г=0,95 и г=0,98.

Если нижние и верхние границы имеют одинаковый знак (ноль не входит в доверительный интервал), то соответствующий коэффициент регрессии считается значимым, в противном случае - незначимым.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения:

Переменную (рентабельность), имеющую незначимый коэффициент регрессии .

Переменную X15 (оборачиваемость нормируемых оборотных средств), имеющую незначимый коэффициент регрессии .

Переменную X16 (оборачиваемость ненормируемых оборотных средств), имеющую незначимый коэффициент регрессии .

В случае, когда при оценке регрессии выявлено несколько незначимых коэффициентов, первым из уравнения регрессии исключается регрессор, для которого t-статистика () минимальна по модулю.

II ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены факторные признаки X8, X10, X15, исключён X16.

Регрессионная статистика

Множественный R

0,86586

R-квадрат

0,74972

Нормированный R-квадрат

0,73340

Стандартная ошибка

2,98468

Наблюдения

50

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

3

1227,51492

409,17164

45,93149

6,99E-14

Остаток

46

409,78197

8,90830

Итого

49

1637,29689

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 98,0%

Верхние 98,0%

Y-пересечение

-2,57219

2,43105

-1,05806

0,29555

-7,46564

2,32125

-8,43147

3,28708

X8

6,18616

0,68922

8,97553

1,127E-11

4,79882

7,57349

4,52500

7,84732

X10

7,13966

1,02316

6,97804

9,83E-09

5,08015

9,19918

4,67365

9,60567

X15

-0,01560

0,01261

-1,23684

0,22242

-0,04098

0,00979

-0,04599

0,01479

Оценка коэффициентов в случае трех объясняющих переменных имеет вид:

а уравнение регрессии имеет вид:

Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в123=0. Для этого в результатах «дисперсионного анализа» находим наблюдаемое значение F-статистики Fнабл=45,93149.

С помощью встроенной статистической функции FРАСПОБР или по таблицам F-распределения для уровня значимости б=0,05 и числа степеней свободы числителя н1=k=3 и знаменателя н1=n-k-1=46 находим критическое значение F-статистики, равное Fкр = 2,806845. Так как наблюдаемое значение F-статистики превосходит ее критическое значение 45,93149> 2,806845, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в123)T значимо отличается от нуля. Проверим значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу .

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце «t-статистика».

Коэффициенты (bi)

t-статистика (tнабл)

Y-пересечение

b0= - 2,57219

-1,05806

Переменная X8

b1= 6,18616

8,97553

Переменная X10

b2=7,13966

6,97804

Переменная X15

b3= - 0,01560

-1,23684

Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - k - 1.

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н= n-k-1=50-3-1=46. (Можно найти значения tкр по таблицам математической статистики).

Получаем tкр=2,012896.

Для рассматриваемых коэффициентов в12, наблюдаемое значение t-статистики больше критического по модулю:

, .

Следовательно, гипотеза о равенстве нулю данных коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть значимы.

Для коэффициента в0 и в3 наблюдаемое значение t-статистики меньше критического значения по модулю:

, .

Следовательно, гипотеза H0 не отвергается, т.е. - незначимы.

На следующем этапе необходимо исключить из рассмотрения:

Переменную (рентабельность), имеющую незначимый коэффициент регрессии .

Переменную X15 (оборачиваемость нормируемых оборотных средств), имеющую незначимый коэффициент регрессии .

III ЭТАП РЕГРЕССИОННОГО АНАЛИЗА

В модель включены факторные признаки X8, X10 , исключён X15 и X16.

Регрессионная статистика

Множественный R

0,86104

R-квадрат

0,74140

Нормированный R-квадрат

0,73039

Стандартная ошибка

3,00145

Наблюдения

50

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

1213,88725

606,94362

67,37294

1,57E-14

Остаток

47

423,40964

9,00872

Итого

49

1637,29689

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 98,0%

Верхние 98,0%

Y-пересечение

-4,57825

1,82108

-2,51403

0,01542

-8,24179

-0,91471

-8,96404

-0,19246

X8

6,46823

0,65405

9,88945

4,579E-13

5,15244

7,78402

4,89304

8,04342

X10

7,17009

1,02861

6,97064

9,056E-09

5,10079

9,23940

4,69284

9,64735

Оценка коэффициентов в случае двух объясняющих переменных имеет вид:

а уравнение регрессии имеет вид:

Проверим на уровне б=0,05 значимость уравнения регрессии, т.е. гипотезу H0: в123=0. Для этого в результатах «дисперсионного анализа» находим наблюдаемое значение F-статистики Fнабл=67,37294.

С помощью встроенной статистической функции FРАСПОБР или по таблицам F-распределения для уровня значимости б=0,05 и числа степеней свободы числителя н1=k=2 и знаменателя н1=n-k-1=47 находим критическое значение F-статистики, равное Fкр = 3,195056

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 67,37294> 3,195056, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в12)T значимо отличается от нуля. Проверим значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу . Наблюдаемые значения t-статистик указаны в таблице результатов в столбце «t-статистика».

Y-пересечение

b0= - 4,57825

-2,51403

Переменная X8

b1= 6,46823

9,88945

Переменная X10

b2= 7,17009

6,97064

Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n - k - 1. Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н= n-k-1=50-2-1=47. (Можно найти значения tкр по таблицам математической статистики). Получаем tкр=2,0117405. Для рассматриваемых коэффициентов в0, в1, в2 наблюдаемое значение t-статистики больше критического по модулю: ,, .

Следовательно, гипотеза о равенстве нулю данных коэффициентов отвергается с вероятностью ошибки, равной 0,05, то есть в0, значимы.

Также для всех этих коэффициентов p-значения не превышают 0,05 и доверительные интервалы не включают ноль, то есть по всем проверочным критериям эти коэффициенты являются значимыми.

Поскольку в данном случае все коэффициенты оказались значимыми, процесс исключения переменных прекращается. Окончательная оценка регрессии со значимыми коэффициентами имеет вид:

Для значимых коэффициентов регрессии можно найти с заданной доверительной вероятностью г интервальные оценки.

Доверительные интервалы для регрессионных коэффициентов выдаются Excel в последних столбцах таблицы результатов - «нижние 95%» и «верхние 95%» и «нижние 98%» и «верхние 98%» - с заданными уровнями надёжности для г=0,95 и г=0,98.

Коэффициенты (bi)

Нижние 95% (вimin)

Верхние 95% (вimax)

Нижние 98% (вimin)

Верхние 98% (вimax)

Y-пересечение

b0= - 4,57825

-8,24179

-0,91471

-8,96404

-0,19246

Переменная X8

b1= 6,46823

5,15244

7,78402

4,89304

8,04342

Переменная X10

b2= 7,17009

5,10079

9,23940

4,69284

9,64735

Таким образом, интервальные оценки значимых генеральных коэффициентов регрессии имеют вид:

При отсутствии пакета анализа данных, интервальные оценки коэффициентов регрессионной модели можно найти о формуле:

,

Для определения используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=1- г =0,05 и число степеней свободы н=n-k-1=50-2-1=47. (Можно найти значения tг по таблицам математической статистики).

Получаем tг=2,01174. Следовательно, для надежности г=0,95:

Отсюда следует, что:

Аналогичные расчёты проводятся и для любого другого заданного уровня надёжности г.

Интерпретация результатов

Величина R2 характеризует долю общей дисперсии зависимой переменной, обусловленную воздействием объясняющих переменных. Около 74,14% вариации рентабельности (Y) объясняется вариацией премий и вознаграждений на одного работника (X8) и фондоотдачей (X10), а 25,86% вариации вызвано воздействием неучтенных в модели и случайных факторов. Таким образом, можно сделать вывод, что модель достаточно адекватно отражает исследуемый процесс.

Коэффициент регрессии показывает среднюю величину изменения зависимой переменной Y при изменении объясняющей переменной X на единицу собственного изменения. Знак при коэффициенте указывает направление этого изменения.

Коэффициент регрессии при X8 показывает, что при росте премий и вознаграждений на одного работника на единицу рентабельность Y в среднем увеличивается на 6,46823 единиц. Построенная выше интервальная оценка показывает, что с вероятностью 0,95 при росте оборачиваемости ненормируемых оборотных средств на единицу увеличение рентабельности будет в пределах от 5,152 до 7,784 единиц.

Аналогично, коэффициент при X10 свидетельствует о том, что при росте фондоотдачи на единицу рентабельность в среднем увеличивается на 7,17009 единиц, а с вероятностью 0,95 при росте фондоотдачи на единицу увеличение рентабельности будет в пределах от 5,1008 до 9,2394 единиц.

3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии

В графе «Предсказанное Y» мы получили Y, рассчитанное по уравнению регрессии, то есть Y. Добавим столбец исходных данных Y (в таблице 14) и, выделив область этих двух столбцов, построим диаграмму сравнения расчётных и реальных значений исследуемого показателя. Можно ранжировать предприятия в порядке возрастания значения признака и построить другую диаграмму сравнения.

Отклонения расчетного значения Y от фактического показаны в графе «Остатки». Проанализировав графу «Стандартные остатки» можно прийти к выводу, что предприятия № 21 и № 46 демонстрируют большую рентабельность, чем в среднем по всем рассматриваемым предприятиям. А для предприятий № 49, № 39 и № 5 характерна обратная ситуация - отрицательное отклонение от линии регрессии.

Далее представлена сравнительная таблица исходных данных показателя рентабельности (Y) с рассчитанными с помощью построенной линейной регрессионной модели

Таблица 14

Наблюдение

Наблюдаемое Y

Предсказанное Y

Остатки

Стандартные остатки

1

13,26

13,7743

-0,5143

-0,1750

2

10,16

11,4698

-1,3098

-0,4456

3

13,72

16,8876

-3,1676

-1,0776

4

12,85

10,0337

2,8163

0,9581

5

10,63

14,8087

-4,1787

-1,4215

6

9,12

11,1544

-2,0344

-0,6921

7

25,83

20,4571

5,3729

1,8278

8

23,39

19,9692

3,4208

1,1637

9

14,68

14,7650

-0,0850

-0,0289

10

10,05

14,0731

-4,0231

-1,3686

11

13,99

14,7791

-0,7891

-0,2684

12

9,68

8,1686

1,5114

0,5142

13

10,03

13,0201

-2,9901

-1,0172

14

9,13

8,4584

0,6716

0,2285

15

5,37

4,1362

1,2338

0,4197

16

9,86

8,7998

1,0602

0,3607

17

12,62

12,0038

0,6162

0,2096

18

5,02

8,5912

-3,5712

-1,2149

19

21,18

15,8091

5,3709

1,8271

20

25,17

20,7830

4,3870

1,4924

21

19,4

13,1009

6,2991

2,1429

22

21

16,2533

4,7467

1,6148

23

6,57

4,6958

1,8742

0,6376

24

14,19

17,4756

-3,2856

-1,1177

25

15,81

18,0519

-2,2419

-0,7627

26

5,23

8,3831

-3,1531

-1,0726

27

7,99

8,5857

-0,5957

-0,2026

28

17,5

13,2578

4,2422

1,4431

29

17,16

14,4014

2,7586

0,9384

30

14,54

14,3730

0,1670

0,0568

31

6,24

8,0161

-1,7761

-0,6042

32

12,08

15,2414

-3,1614

-1,0755

33

9,49

10,9850

-1,4950

-0,5086

34

9,28

10,1451

-0,8651

-0,2943

35

11,42

11,9281

-0,5081

-0,1729

36

10,31

10,0538

0,2562

0,0871

37

8,65

11,6669

-3,0169

-1,0263

38

10,94

11,1128

-0,1728

-0,0588

39

9,87

13,9564

-4,0864

-1,3901

40

6,14

7,4275

-1,2875

-0,4380

41

12,93

10,5222

2,4078

0,8191

42

9,78

10,4389

-0,6589

-0,2242

43

13,22

16,3159

-3,0959

-1,0532

44

17,29

16,1179

1,1721

0,3987

45

7,11

7,6621

-0,5521

-0,1878

46

22,49

15,7102

6,7798

2,3064

47

12,14

13,0146

-0,8746

-0,2975

48

15,25

13,3932

1,8568

0,6316

49

31,34

35,6128

-4,2728

-1,4536

50

11,56

12,8181

-1,2581

-0,4280

Рисунок 1. Диаграммы сравнения исходных данных показателя рентабельности (Y) с рассчитанными с помощью линейной регрессионной модели

Заключение

В банковской, финансовой сфере, при проведении маркетинговых и социологических исследований, при обработке различных экономических данных требуется применение корреляционного и регрессионного анализов. Основной задачей корреляционного анализа состоит в выявлении связи между переменными и оценка ее тесноты. В регрессионном анализе задачами являются установление формы зависимости между переменными, оценка функции регрессии, прогноз значений зависимой переменной.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.