Корреляционный и регрессионный анализ

Оценка статистической значимости уравнения регрессии и ее параметров, с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции, установление мультиколлинеарных факторов. Результаты, оформление аналитической записки.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 10.03.2011
Размер файла 1,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ЗАДАЧА 1

По данным представленным в таблице, изучается зависимость результативного признака (У) от факторного (У).

Номера результативного, факторного признаков, наблюдений определяются в соответствии с номером варианта.

№ п/п

Запасы влаги в почве, мм

Бонитировочный балл

Номер признака

Х

У

1

144

75

2

110

54

3

110

61

4

177

64

5

186

72

6

112

69

7

148

79

8

151

73

9

110

60

10

151

72

11

131

54

12

113

77

13

110

57

14

127

72

15

136

72

16

136

67

17

144

72

18

100

55

19

148

68

20

129

68

Задание:

1. Рассчитайте параметры парной линейной регрессии.

2. Оцените тесноту связи с помощью показателей корреляции и детерминации.

3. Оцените с помощью средней ошибки аппроксимации качество уравнений.

4. Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.

5. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня (). Определите доверительный интервал прогноза для уровня значимости .

6. Оцените полученные результаты, выводы оформите в аналитической записке.

Для решения задачи составим вспомогательную таблицу:

Запасы влаги в почве, мм

Бонитировочный балл

х

у

ху

х2

у2

144

75

10800

20736

5625

68,798

6,202

38,465

10,350

107,123

110

54

5940

12100

2916

63,256

-9,256

85,674

-23,650

559,323

110

61

6710

12100

3721

63,256

-2,256

5,090

-23,650

559,323

177

64

11328

31329

4096

74,177

-10,177

103,571

43,350

1879,223

186

72

13392

34596

5184

75,644

-3,644

13,279

52,350

2740,523

112

69

7728

12544

4761

63,582

5,418

29,355

-21,650

468,723

148

79

11692

21904

6241

69,45

9,55

91,202

14,350

205,923

151

73

11023

22801

5329

69,939

3,061

9,370

17,350

301,023

110

60

6600

12100

3600

63,256

-3,256

10,602

-23,650

559,323

151

72

10872

22801

5184

69,939

2,061

4,248

17,350

301,023

131

54

7074

17161

2916

66,679

-12,679

160,757

-2,650

7,023

113

77

8701

12769

5929

63,745

13,255

175,695

-20,650

426,423

110

57

6270

12100

3249

63,256

-6,256

39,138

-23,650

559,323

127

72

9144

16129

5184

66,027

5,973

35,677

-6,650

44,223

136

72

9792

18496

5184

67,494

4,506

20,304

2,350

5,522

136

67

9112

18496

4489

67,494

-0,494

0,244

2,350

5,522

144

72

10368

20736

5184

68,798

3,202

10,253

10,350

107,123

100

55

5500

10000

3025

61,626

-6,626

43,904

-33,650

1132,323

148

68

10064

21904

4624

69,45

-1,45

2,103

14,350

205,923

129

68

8772

16641

4624

66,353

1,647

2,713

-4,650

21,623

2673

1341

180882

367443

91065

1342,22

-1,219

881,640

10,500

110,250

133,65

67,05

9044,1

18372,2

4553,25

509,827

57,548

22,579

7,586

1. Построение уравнения регрессии сводятся к оценке ее параметров. Для оценки параметров регрессии, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических минимальна т.е

Для линейных уравнений, решается следующая система уравнений:

Можно воспользоваться готовыми формулами, которые вытекают из этой системы:

Уравнение регрессии:

2.Рассчитаем линейный коэффициент парной корреляции:

Значение коэффициентов парной корреляции лежит в интервале от -1 до +1. его положительное значение свидетельствует о прямой связи, отрицательное - об обратной, т.е. когда растет одна переменная, другая уменьшается. Чем ближе значение к 1, тем теснее связь. Связь считается достаточно сильной, если коэффициент корреляции по абсолютной величине превышает 0,7, и слабой, если меньше 0,4. При равенстве его нулю связь полностью отсутствует. Это коэффициент дает объективную оценку тесноты связи лишь при линейной зависимости переменных.

Рассчитаем коэффициент детерминации. Он показывает долю вариации результативного признака, находящего под воздействием изучаемых факторов .

3. Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения . Найдем величину средней ошибки аппроксимации , которая показывает среднее отклонение расчетных значеий от фактических. Допустимый предел ее значений 8-10%.

4. Рассчитаем F-критерий Фишера, применяемый для оценки качества уравнения регрессии. Выполняется сравнение Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Если табличное значение меньше фактического, то признается статистическая значимость и надежность характеристик, если наоборот, то признается статистическая незначимость, ненадежность уравнения регрессии.:

Рассчитаем t-критерий Стьюдента, применяемый для оценки статистической значимости коэффициентов регрессии и корреляции. Если табличное значение показателя меньше фактического, то значения коэффициентов не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х, Если наоборот, то признается случайная природа формирования коэффициентов.

для числа степеней свободы и .

Определим случайные ошибки:

тогда

Рассчитаем доверительный интервал для a и b. Для этого определим предельную ошибку для каждого показателя:

Доверительные интервалы:

Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр признается нулевым, т.к. он не может одновременно принимать отрицательное и положительное значение.

5. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение фактора составит тогда прогнозное значение результата будет

Ошибка прогноза составит:

Предельная ошибка прогноза:

Доверительный интервал прогноза:

6. Аналитическая записка:

Линейный коэффициент парной корреляции равен 0,484, следовательно связь изучаемых явлений является умеренной, прямой.

Коэффициент детерминации равен 0,234, т.е. вариация результата на 23,4% объясняется вариацией фактора х.

Средняя ошибка аппроксимации равна 4,010%, что попадает в допустимый предел значений 8-10% и говорит о том, что расчетные значения отклоняются от фактических примерно на 4%.

Полученное значение F-критерия превышает табличное, следовательно параметры уравнения и показателя тесноты статистически незначимы.

Полученные значения t-критерия показывают, что параметры a и b статистически незначимы, т.к. их фактические значения t-критерия меньше табличного. А коэффициент парной корреляции статистически значим, т.к. фактическое значение его t-критерия больше табличного.

Определение доверительных интервалов показало, что параметр b является статистически незначимым и равен нулю, т.к. в границы его доверительного интервала попадает ноль:

ЗАДАЧА 2

По данным, представленным в таблице, изучается зависимость бонитировочного балла (У) от трех факторов .

№ п/п

Внесено минеральных удобрений на посевную площадь, ц

Коэффициент износа основных средств

Запасы влаги в почве, мм

Бонитировочный балл

Х1

Х2

Х3

У

1

13,9

57,6

144

75

2

8,8

41,6

110

54

3

4

66,5

110

61

4

0,01

52,8

177

64

5

4,2

51,6

186

72

6

0,7

37,3

112

69

7

6,7

44,2

148

79

8

15,9

46,3

151

73

9

1,9

39,6

110

60

10

1,9

28,3

151

72

11

0,01

64,6

131

54

12

0,01

49,4

113

77

13

0,01

58,4

110

57

14

1,2

58,9

127

72

15

0,01

49,6

136

72

16

0,01

51,9

136

67

17

3,7

49,7

144

72

18

0,01

37,6

100

55

19

0,01

50,3

148

68

20

1,6

43,2

129

68

21

2,5

36,2

125

73

22

0,01

53,5

113

61

23

6,3

49,6

129

70

24

0,01

54,3

168

70

25

13,1

42,9

125

69

26

0,4

31,1

125

75

27

0,01

49,7

131

47

28

0,8

24,6

146

70

29

0,01

58,7

88

66

30

0,01

56,3

127

66

31

0,5

48,4

113

69

32

0,01

50,6

151

68

33

2,3

49,4

129

68

34

0,01

56,8

177

67

35

0,01

40,1

131

46

Задание следует решить с помощью ППП MS EXCEL или любого другого статистического пакета прикладных программ.

Задание.

1. Постройте матрицу парных коэффициентов корреляции. Установите какие факторы мультиколлинеарны.

2. Постройте уравнение множественной регрессии в линейной форме с полным набором факторов.

3. Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.

4. Отберите информативные факторы по пунктам 1 и 3. Постройте уравнение регрессии со статистически значимыми факторами.

5. Оцените полученные результаты, выводы оформите в аналитической записке.

Для проведения корреляционного анализа воспользуемся программой «Excel»:

1) загрузить среду Excel ;

2) выделить рабочее поле таблицы;

3) выбрать пункт меню «Сервис» и в появившемся меню выбрать «Анализ данных» (рис. 1);

Рис. 1 Меню «Сервис».

4) в появившемся диалоговом окне «Анализ данных» (рис. 2) выбрать «Корреляция;

Рис. 2. Диалоговое окно «Анализ данных».

5) в появившемся диалоговом окне «Корреляция» (рис. 3) убедиться, что все проставленные в нем установки соответствуют таблице исходных данных. После выполнения этих операций нажать клавишу «ОК»;

Рис. 3. Диалоговое окно «Корреляция».

В результате получим:

Х1

Х2

Х3

У

Х1

1

Х2

-0,03376

1

Х3

0,098684

0,033191

1

У

0,26943

-0,13538

0,312057

1

Анализ полученных коэффициентов парной корреляции показывает, что зависимая переменная, т.е. бонитировочный балл имеет слабую прямую связь со всеми независимыми переменными, т.к. значения коэффициентов парной корреляции ниже 0,4.

Мультиколлинеарность отсутствует

2.Для проведения регрессионного анализа, также используем Excel.

1) загрузить среду Excel ;

2) выделить рабочее поле таблицы;

3) выбрать пункт меню «Сервис» и в появившемся меню выбрать «Анализ данных» (рис. 4);

4) в появившемся диалоговом окне «Анализ данных» (рис. 5) выбрать «Регрессия»;

Рис. 4. Диалоговое окно «Анализ данных».

5) в появившемся диалоговом окне «Регрессия» (рис. 6) убедиться, что все проставленные в нем установки соответствуют таблице исходных данных. После выполнения этих операций нажать клавишу «ОК»;

Рис. 5. Диалоговое окно «Регрессия».

В результате получим:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,416713

R-квадрат

0,17365

Нормированный R-квадрат

0,09368

Стандартная ошибка

7,58219

Наблюдения

35

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

3

374,508

124,836

2,171453

0,111346483

Остаток

31

1782,178

57,4896

Итого

34

2156,686

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

56,84826

10,01268

5,677626

3,08E-06

36,42724917

77,26927

36,42725

77,26927

Х1

0,440965

0,306967

1,436523

0,16087

-0,185098139

1,067027

-0,1851

1,067027

Х2

-0,11314

0,13485

-0,83899

0,407899

-0,388166847

0,161891

-0,38817

0,161891

Х3

0,104629

0,058561

1,786669

0,083775

-0,014806871

0,224065

-0,01481

0,224065

Уравнение регрессии полученное с помощью Excel, имеет вид:

3. По данным проведенного корреляционного и регрессионного анализа оценим статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.

Общий F-критерий проверяет гипотезу о статистической значимости уравнения регрессии. Анализ выполняется при сравнении фактического и табличного значения F-критерия Фишера.

Частные F-критерии оценивают статистическую значимость присутствия факторов в уравнении регрессии, оценивают целесообразность включения в уравнение одного фактора после другого.

t-критерий проверяет гипотезу о статистической значимости факторов уравнения регрессии.

4. Согласно проведенному анализу информативными факторами являются х1 и х2, а также коэффициенты b1 и b2. Следовательно уравнение регрессии со статистически значимыми факторами будет иметь вид:

5. Аналитическая записка.

По результатам проведенного корреляционного анализа можно сказать, что межфакторная связь слабая, т.к. значения коэффициентов парной корреляции не превышают значения 0,4, хотя можно сказать, что наибольшая связь результативного признака с и .

Мультиколлинеарность отсутствует, т.к. ни одно значение коэффициентов не превышает 0,7.

Фактическое значение F-критерия Фишера меньше табличного, следовательно можно сказать, что полученное уравнение регрессии статистически незначимо.

По полученным значениям частных F-критериев Фишера, можно сказать, что включение фактора х2 после х3 оказался статистически незначимым: прирост факторной дисперсии (в расчете на одну степень свободы) оказался несущественным. Следовательно, регрессионная модель зависимости бонитировочного балла от количества минеральных удобрений, внесенных в почву и запасов влаги в почве является достаточно статистически значимой и что нет необходимости улучшать ее, включая дополнительный фактор х2 (коэффициент износа основных средств).

Это предположение подтверждает оценка с помощью t-критерия Стьюдента значимости коэффициентов. По результатам этой оценки:

т.е. можно сказать, что b2 и b3 статистически незначимы.

В совокупности с результатами F-статистики, делаем вывод, что из уравнения регрессии можно исключить х2 и b2.

ЗАДАЧА 3

регрессия стьюдент матрица корреляция

В таблице приведены данные по природно-экономической зоне за 15 лет об урожайности многолетних трав на сено У, внесении удобрений на 1 га пашни Х1 и осадках за май-июнь месяцы Х2.

номер года

у

х1

х2

1

13,6

161

360

2

14,1

170

223

3

13,2

188

144

4

18,6

209

324

5

16,9

240

227

6

21

334

212

7

22,2

377

230

8

29,6

399

204

9

31,3

404

156

10

32,1

451

200

11

26,7

501

163

12

32,8

538

315

13

31,4

579

280

14

31

600

251

15

26,1

614

386

Задание следует выполнить с помощью ППП MS EXCEL или любого статистического пакета прикладных программ.

Задание.

Необходимо проанализировать степень зависимости урожайности У от факторов Х1 и Х2, для этого:

1. Определить для каждого ряда данных У, Х1, Х2 первые разности (абсолютные приросты).

2. Рассчитать параметры двухфакторного линейного уравнения регрессии по первым разностям (по абсолютным приростам) и дать их интерпретацию. Охарактеризовать тесноту связи между рядами.

3. Оценить полученные результаты, выводы оформить в виде аналитической записки.

Решение.

1. Значения абсолютных приростов определяются по формулам:

Расчеты можно оформить в виде таблицы:

Номер года

1

2

0,5

9

-137

3

-0,9

18

-79

4

5,4

21

180

5

-1,7

31

-97

6

4,1

94

-15

7

1,2

43

18

8

7,4

22

-26

9

1,7

5

-48

10

0,8

47

44

11

-5,4

50

-37

12

6,1

37

152

13

-1,4

41

-35

14

-0,4

21

-29

15

-4,9

14

135

2. Для проведения корреляционного анализа воспользуемся программой «Excel»:

1) загрузить среду Excel ;

2) выделить рабочее поле таблицы;

3) выбрать пункт меню «Сервис» и в появившемся меню выбрать «Анализ данных» (рис. 7);

Рис. 7 Меню «Сервис».

4) в появившемся диалоговом окне «Анализ данных» (рис. 8) выбрать «Корреляция;

Рис. 8. Диалоговое окно «Анализ данных».

5) в появившемся диалоговом окне «Корреляция» (рис. 9) убедиться, что все проставленные в нем установки соответствуют таблице исходных данных. После выполнения этих операций нажать клавишу «ОК»;

Рис. 9. Диалоговое окно «Корреляция».

В результате получим:

1

0,849962

1

0,154498

0,381125

1

Анализ полученных коэффициентов парной корреляции показывает, что зависимая переменная, т.е. урожайность имеет слабую прямую связь с количеством осадков ( ) и сильную прямую связь с величиной внесения минеральных удобрений (

Мультиколлинеарность отсутствует, т.к. коэффициент парной корреляции , что не превышает значения 0,7-0,8.

2.Для проведения регрессионного анализа, также используем Excel.

1) загрузить среду Excel ;

2) выделить рабочее поле таблицы;

3) выбрать пункт меню «Сервис» и в появившемся меню выбрать «Анализ данных» (рис. 10);

Рис. 10. Меню «Сервис».

4) в появившемся диалоговом окне «Анализ данных» (рис. 11) выбрать «Регрессия»;

Рис. 11. Диалоговое окно «Анализ данных».

5) в появившемся диалоговом окне «Регрессия» (рис. 12) убедиться, что все проставленные в нем установки соответствуют таблице исходных данных. После выполнения этих операций нажать клавишу «ОК»;

Рис. 12. Диалоговое окно «Регрессия».

В результате получим:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,869497573

R-квадрат

0,756026029

Нормированный R-квадрат

0,711667125

Стандартная ошибка

3,770480303

Наблюдения

14

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

484,595404

242,297702

17,04338845

0,000426962

Остаток

11

156,3817388

14,21652171

Итого

13

640,9771429

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-1,295421622

3,285114475

-0,39433074

0,700874404

-8,525913487

5,935070243

-8,525913487

5,935070243

Переменная X 1

0,04178195

0,00727214

5,745482249

0,000129227

0,02577607

0,05778783

0,02577607

0,05778783

Переменная X 2

-0,020154418

0,016377196

-1,230639128

0,244124417

-0,056200401

0,015891565

-0,056200401

0,015891565

Уравнение регрессии полученное с помощью Excel, имеет вид:

3. Аналитическая записка.

По данным регрессионного анализа можно сказать:

- т.к. коэффициент детерминации равен 0,756, то вариация результата на 75,6% объясняется вариацией факторов.

- F-критерий равен 17,043, его табличное значение 3,98. т.к. фактическое значение превышает табличное, то делаем вывод, что полученной уравнение регрессии статистически значимо.

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

1. Федеральный закон «О бухгалтерском учете» от 21.11.96 г., № 129-ФЗ. - М., 1996.

2. Концепция бухгалтерского учета в рыночной экономике России. Одобрена Методологическим советом по бухгалтерскому учету при Министерстве финансов РФ и Президентским советом Института профессиональных бухгалтеров 29.12.97 г. - М., 1997.

3. План счетов бухгалтерского учета финансово-хозяйственной деятельности организаций и инструкция по его применению. Утверждены приказом Минфина РФ от 31.10.2000 г. № 94н.

4. Абрютина М.С. Грачев А.В. Анализ финансово-хозяйственной деятельности предприятия. - М.: Финансы и статистика, 2002. - 428 с.

5. Бережная Е.В., Бережной В.И. Математические методы моделирования экономических систем. - М.: Финансы и статистика, 2003. - 368 с.

6. Вакуленко Т.Г., Фомина Л.Ф. Анализ бухгалтерской (финансовой) отчетности для принятия управленческих решений. - СПб.: «Издательский дом Герда», 2003. - 288 с.

7. Вендров А.М. Проектирование программного обеспечения экономических информационных систем. - М.: Финансы и статистика, 2000. - 352 с.

8. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 2001.-402 с.

9. Елисеева И.И. Эконометрика. - М.: «Финансы и статистика», 2004 г. - 344 с.

10. Елисеева И.И. Практикум по эконометрике. - М.: «Финансы и статистика», 2004 г. - 192 с.

11. Ефимова О.В. Финансовый анализ. - М.: Финансы и статистика, 2002. - 656 с.

Размещено на Allbest.ru


Подобные документы

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.

    лабораторная работа [30,9 K], добавлен 05.12.2010

  • Построение уравнения множественной регрессии в линейной форме с полным набором факторов, отбор информативных факторов. Проверка значимости уравнения регрессии по критерию Фишера и статистической значимости параметров регрессии по критерию Стьюдента.

    лабораторная работа [217,9 K], добавлен 17.10.2009

  • Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.

    курсовая работа [314,1 K], добавлен 21.01.2011

  • Оценка корреляционной матрицы факторных признаков. Оценки собственных чисел матрицы парных коэффициентов корреляции. Анализ полученного уравнения регрессии, определение значимости уравнения и коэффициентов регрессии, их экономическая интерпретация.

    контрольная работа [994,1 K], добавлен 29.06.2013

  • Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.

    лабораторная работа [1,8 M], добавлен 25.05.2009

  • Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

    контрольная работа [141,3 K], добавлен 05.05.2010

  • Построение регрессионных моделей. Смысл регрессионного анализа. Выборочная дисперсия. Характеристики генеральной совокупности. Проверка статистической значимости уравнения регрессии. Оценка коэффициентов уравнения регрессии. Дисперсии случайных остатков.

    реферат [57,4 K], добавлен 25.01.2009

  • Расчёт параметров линейного уравнения регрессии. Оценка регрессионного уравнения через среднюю ошибку аппроксимации, F-критерий Фишера, t-критерий Стьюдента. Анализ корреляционной матрицы. Расчёт коэффициентов множественной детерминации и корреляции.

    контрольная работа [241,8 K], добавлен 29.08.2013

  • Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.

    лабораторная работа [890,1 K], добавлен 06.12.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.