Оценка статистической надёжности результата регрессионного моделирования

Построение поля корреляции и формулировка гипотезы о форме связи. Расчет параметров уравнений парной регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка качества уравнений с помощью средней ошибки аппроксимации.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 07.03.2016
Размер файла 253,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Содержание

1. Постановка задачи

2. Построение поля корреляции и формулировка гипотезы о форме связи

3. Расчет параметров уравнений парной регрессии

4. Оценка тесноты связи с помощью показателей корреляции и детерминации

5. Сравнительная оценка силы связи фактора с результатом

6. Оценка качества уравнений с помощью средней ошибки аппроксимации

7. Оценка статистической надёжности результата регрессионного моделирования с помощью F-критерия Фишера

8. Расчет прогнозного значения результата

9. Оцените полученные результаты, выводы

Задача

По территориям Уральского и Западно-Сибирского районов известны данные за Ноябрь 1997 г.

Таблица 1

Район

Потребительские расходы на душу населения, тыс. руб., y

Денежные доходы на душу населения, тыс. руб., x

Уральский

Респ. Башкортостан

461

632

Удмуртская Респ.

524

738

Курганская обл.

298

515

Оренбургская обл.

351

640

Пермская обл.

624

942

Свердловская обл.

584

888

Челябинская обл.

425

704

Западно-Сибирский

Респ. Алтай

277

603

Алтайский край

321

439

Кемеровская обл.

573

985

Новосибирская обл.

576

735

Омская обл.

588

760

Томская обл.

497

830

Тюменская обл.

863

2093

Задание

1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.

2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.

3. Оцените тесноту связи с помощью показателей корреляции и детерминации.

4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.

5. Оцените качество уравнений с помощью средней ошибки аппроксимации.

6. Оцените статистическую надёжность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.

7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 8% от его среднего уровня значимости .

8. Оцените полученные результаты, выводы оформите в аналитической записке.

Построим поле корреляции и сформулируем гипотезу о форме связи

Гипотеза о форме связи: Визуальный анализ полученного графика показывает, что точки поля корреляции располагаются вдоль некоторой воображаемой линии, но не очень плотно, рассеиваясь около неё. Можно предположить, что связь между денежными доходами на душу населения и потребительскими расходами на душу населения обратная, не очень тесная.

Анализируя расположение точек поля корреляции, предполагаем ,что связь между признаками х и у может быть нелинейного вида.

Расчет параметров уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии

А) Рассчитаем параметры уравнений линейной парной регрессии. Для расчета параметров a и b линейной регрессии y = a + bx , решаем систему нормальных уравнений относительно a и b:

По исходным данным рассчитываем:

В таблице 2 рассчитаем средние величины значений х и у.

Таблица 2

y

x

x*y

x^2

y^2

A

y'

1

461

632

291352

399424

212521

0,062193

432,32915

2

524

738

386712

544644

274576

0,105682

468,62265

3

298

515

153470

265225

88804

-0,31634

392,26933

4

351

640

224640

409600

123201

-0,23951

435,06828

5

624

942

587808

887364

389376

0,137066

538,47053

6

584

888

518592

788544

341056

0,109621

519,98138

7

425

704

299200

495616

180625

-0,07525

456,98134

8

277

603

167031

363609

76729

-0,52491

422,39979

9

321

439

140919

192721

103041

-0,14096

366,24758

10

573

985

564405

970225

328329

0,034567

553,19336

11

576

735

423360

540225

331776

0,188202

467,59548

12

588

760

446880

577600

345744

0,190212

476,15526

13

497

830

412510

688900

247009

-0,00628

500,12267

14

863

2093

1806259

4380649

744769

-0,08061

932,5632

Cумма

6962

11504

6423138

11504346

3787556

-0,55631

6962

Среднее значение

497,28571

821,714

458795,5714

821739

270539,714

-0,03974

497,28571

Для расчета параметров a и b линейной регрессии y = a + bx используем формулы:

Следовательно, линейное уравнение регрессии будет выглядеть следующим образом:

Б) Рассчитаем параметры уравнений степенной парной регрессии. Уравнение степенной регрессии имеет вид:

Параметры a и b находятся также как и при линейной зависимости, но для уравнения

1. Определим параметры а* и b линейной регрессионной модели

Уравнение регрессии имеет вид:

Для того чтобы представить зависимость в виде степенной, необходимо найти a:

Таблица 3

В результате степенная зависимость имеет вид:

В) Рассчитаем параметры уравнений экспоненциальной парной регрессии. Построению экспоненциальной модели предшествует процедура линеаризации переменных. В примере линеаризация производится путем логарифмирования обеих частей уравнения:

Таблица 4

Рассчитаем С и b:

Получим линейное уравнение Y=. Выполнив его потенцирование, получим: а = 283,5;

Г) Рассчитаем параметры уравнений полулогарифмической парной регрессии.

Рассчитаем параметры а и b в регрессии:

уx =а +blnх.

Линеаризуем данное уравнение, обозначив: Z = lnx

Тогда: y = a + bz. Параметры a и b уравнения = a + bz

определяются методом наименьших квадратов:

Разделив на n и решая методом Крамера, получаем формулу для определения b:

Таблица 5

y

x

z

yz

z^2

y^2

y'

(y-y')^2

Ai

1

461

632

6,448889394

2972,938

41,58817

212521

422,66385

1469,66

0,083159

2

524

738

6,603943825

3460,4666

43,61207

274576

483,84158

1612,7

0,076638

3

298

515

6,244166901

1860,7617

38,98962

88804

341,88928

1926,27

-0,14728

4

351

640

6,461468176

2267,9753

41,75057

123201

427,62689

5871,68

-0,21831

5

624

942

6,848005275

4273,1553

46,89518

389376

580,13759

1923,91

0,070292

6

584

888

6,788971743

3964,7595

46,09014

341056

556,84553

737,365

0,046497

7

425

704

6,556778356

2786,6308

42,99134

180625

465,23214

1618,62

-0,09466

8

277

603

6,401917197

1773,3311

40,98454

76729

404,13067

16162,2

-0,45896

9

321

439

6,084499413

1953,1243

37,02113

103041

278,89144

1773,13

0,131179

10

573

985

6,892641641

3949,4837

47,50851

328329

597,74916

612,521

-0,04319

11

576

735

6,599870499

3801,5254

43,55829

331776

482,23442

8791,98

0,162787

12

588

760

6,633318433

3900,3912

44,00091

345744

495,43152

8568,92

0,157429

13

497

830

6,721425701

3340,5486

45,17756

247009

530,19481

1101,9

-0,06679

14

863

2093

7,646353722

6598,8033

58,46673

744769

895,13111

1032,41

-0,03723

Cумм.

6962

11504

92,93225028

46903,895

618,6348

3787556

6962

53203,3

-0,33844

Ср.зн.

497,286

821,7

6,638017877

3350,2782

44,1882

270539,7

497,28571

3800,23

-0,02417

Уравнение полулогарифмической парной регрессии имеет вид:

Д) Рассчитаем параметры уравнений обратной парной регрессии.

Рассчитаем параметры уравнений обратной парной регрессии. Для оценки параметров приведем обратную модель к линейному виду, заменив

Для расчетов используем данные таблицы 6.

регрессия корреляция детерминация аппроксимация

Таблица 6

y

x

xZ

x^2

y^2

y'

(y-y')^2

A

Z

1

461

632

1,370932755

399424

212521

407,7833

2832,0162

0,11544

0,002169

2

524

738

1,408396947

544644

274576

430,9535

8657,647

0,17757

0,001908

3

298

515

1,728187919

265225

88804

384,9393

7558,446

-0,29174

0,003356

4

351

640

1,823361823

409600

123201

409,4447

3415,7862

-0,16651

0,002849

5

624

942

1,509615385

887364

389376

483,8649

19637,849

0,22458

0,001603

6

584

888

1,520547945

788544

341056

468,6343

13309,24

0,19754

0,001712

7

425

704

1,656470588

495616

180625

423,2399

3,0980667

0,00414

0,002353

8

277

603

2,176895307

363609

76729

401,8721

15593,03

-0,4508

0,00361

9

321

439

1,367601246

192721

103041

371,4236

2542,5384

-0,15708

0,003115

10

573

985

1,719022688

970225

328329

496,7198

5818,672

0,13312

0,001745

11

576

735

1,276041667

540225

331776

430,2616

21239,677

0,25302

0,001736

12

588

760

1,292517007

577600

345744

436,0963

23074,727

0,25834

0,001701

13

497

830

1,670020121

688900

247009

453,3086

1908,9369

0,08791

0,002012

14

863

2093

2,425260718

4380649

744769

1574,72

506545,3

-0,8247

0,001159

Cумма

6962

11504

22,94487212

11504346

3787556

7173,262

632136,96

-0,43918

0,031028

Ср. зн.

497,286

821,7

1,638919437

821739

270539,7

512,3759

45152,64

-0,03137

0,002216

Рассчитаем a и b:

Получим линейное уравнение

Выполнив его потенцирование, получим:

Е) Рассчитаем параметры гиперболического уравнения парной регрессии.

Для оценки параметров приведем модель равносторонней гиперболы

к линейному виду, заменив , тогда .

Для расчетов используем данные табл. 7:

Таблица 7

y

x

X=1/x

x^2

Y^2

y'

xy

(y-y')^2

A

1

461

632

0,001582278

0,0000025036

212521

431,7602

0,7294304

854,967

0,063427

2

524

738

0,001355014

0,0000018361

274576

506,4381

0,7100271

308,419

0,033515

3

298

515

0,001941748

0,0000037704

88804

313,6407

0,5786408

244,632

-0,05249

4

351

640

0,0015625

0,0000024414

123201

438,2593

0,5484375

7614,18

-0,2486

5

624

942

0,001061571

0,0000011269

389376

602,8616

0,6624204

446,832

0,033876

6

584

888

0,001126126

0,0000012682

341056

581,6492

0,6576577

5,52622

0,004025

7

425

704

0,001420455

0,0000020177

180625

484,9346

0,6036932

3592,16

-0,14102

8

277

603

0,001658375

0,0000027502

76729

406,7554

0,4593698

16836,5

-0,46843

9

321

439

0,002277904

0,0000051888

103041

203,1816

0,7312073

13881,2

0,367036

10

573

985

0,001015228

0,0000010307

328329

618,0896

0,5817259

2033,07

-0,07869

11

576

735

0,001360544

0,0000018511

331776

504,6208

0,7836735

5094,99

0,123922

12

588

760

0,001315789

0,0000017313

345744

519,3269

0,7736842

4715,99

0,116791

13

497

830

0,001204819

0,0000014516

247009

555,7911

0,5987952

3456,39

-0,11829

14

863

2093

0,000477783

0,0000002283

744769

794,691

0,4123268

4666,12

0,079153

Cумма

6962

11504

0,019360135

0,0000291962

3787556

6962

8,8310896

63750,9

-0,28578

Ср. зн.

497,286

821,7

0,001382867

0,0000020854

270539,7

497,2857

0,6307921

4553,64

-0,02041

Рассчитаем a и b:

Получим линейное уравнение

Уравнение гиперболической регрессии примет вид:

Оценка тесноты связи с помощью показателей корреляции и детерминации.

A) Линейная регрессия. Тесноту линейной связи оценит коэффициент корреляции.

Линейная связь положительная, теснота связи (0.7 < rxy < 0.9) высокая и прямая.

Коэффициент детерминации показывает долю вариации результативного признака -x, объясненную вариацией факторного признака - y, равную 73,89%.

Б) Степенная регрессия. Оценим тесноту связи между признаками У и Х с помощью индекса парной корреляции ryx. Предварительно рассчитаем теоретическое значение для каждого значения фактора x, и , тогда: что говорит о средней умеренной связи, меньше чем в линейной модели. Коэффициент детерминации. Это означает, что 23,49% вариации результативного признака у объясняется вариацией фактора х - среднедушевой денежный доход в месяц.

В) Экспоненциальная регрессия. Получен следующий индекс корреляции: что говорит о том, что связь заметная и сильная. Коэффициент детерминации. Это означает, что 58,64% вариации результативного признака у объясняется вариацией фактора х.

Г) Полулогарифмическая регрессия. Был получен следующий индекс корреляции что говорит о том, что связь прямая и очень сильная. Коэффициент детерминации. Это означает, что 83,65% вариации результативного признака у объясняется вариацией фактора х

Д) Обратная регрессия. Был получен следующий индекс корреляции

Это означает, что 80,4% вариации результативного признака

Е) Гиперболическая регрессия. Был получен следующий индекс корреляции что говорит о том, что связь прямая и очень сильная. Коэффициент детерминации. Это означает, что 80,4% вариации результативного признака у объясняется вариацией фактора х.

Сравнительная оценка силы связи фактора с результатом с помощью среднего (общего) коэффициента эластичности

А) Рассчитаем коэффициент эластичности для линейной модели:

Для уравнения прямой:

Б) Для уравнения степенной модели

B) Для уравнения экспоненциальной модели

Г) Для уравнения полулогарифмической регрессии

Д) Для уравнения обратной регрессии

Е) Для уравнения равносторонней гиперболической модели

Сравнивая значения , характеризуем оценку силы связи фактора с результатом:

Известно, что коэффициент эластичности показывает связь между фактором и результатом, т.е. на сколько % изменится результат y от своей средней величины при изменении фактора х на 1% от своего среднего значения. В данном примере получилось, что самая большая сила связи между фактором и результатом в степенной модели, слабая сила связи в обратной модели.

Оценка качества уравнений с помощью средней ошибки аппроксимации

Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения . Найдем величину средней ошибки аппроксимации :

В среднем расчетные значения отклоняются от фактических на:

Линейная регрессия. =0,03974*100% = 3,9%, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.

Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.

Степенная регрессия. = *100% = 1,34%, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.

Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.

Экспоненциальная регрессия. = *100% = 2,1%, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.

Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.

Полулогарифмическая регрессия. = *100% = 2,4% что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.

Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.

Гиперболическая регрессия. =*100% = 2% что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.

Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.

Обратная регрессия. = *100% = 3,1% что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.

Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.

Расчет F-критерия:

А) Линейная регрессия. = 33,9626956

где =4,75<

Б) Степенная регрессия. = 3,6859056, где = 4,75>

В) Экспоненциальная регрессия. = 17,0142, где =4,75<

Г) Полулогарифмическая регрессия. = 61,40589,где =4,75<

Д) Гиперболическая регрессия. = 49,26083,где =4,75<

Е) Обратная регрессия. = -5,82185,где =4,75>

Таблица 8

А

R^2

Fфакт

Линейная модель

3,9

0,7389

33,9627

Степенная модель

1,34

0,23498

3,6859056

Полулогарифмическая модель

2,4

0,8365

61,40589

Экспоненциальная модель

2,1

0,5864

17,0142

Гиперболическая модель

2

0,804

49,26083

Обратная модель

3,1

-0,9423

-5,82185

Для всех регрессий = 4,75, из чего следует, что уравнения регрессии статистически значимы, кроме степенного и обратного уравнений регрессии, для которого = 4,75 - то есть уравнение регрессии статистически не значимое.

Вывод: остается на допустимом уровне для всех уравнений регрессий.

Расчет прогнозного значения результата по линейному уравнению регрессии, если прогнозное значение фактора увеличится на 8% от его среднего уровня. Определение доверительного интервала прогноза для уровня значимости б = 0,05

Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения .

где = 821,714*1,08 = 887,451;

Средняя стандартная ошибка прогноза :

где

Предельная ошибка прогноза:

Доверительный интервал прогноза для уровня значимости 0,05:

где

Выполненный прогноз среднедушевых денежных доходов в месяц, x оказался надежным (р = 1 - б = 1 - 0,05 = 0,95), но неточным, так как диапазон верхней и нижней границ доверительного интервала

Оценка полученных результатов

Полученный интервал от до является достаточно широким.

Коэффициент парной корреляции указывает на то, что связь прямая и средняя, коэффициент детерминации показывает, что вариация результата на %, Объясняется изменением x. Коэффициент эластичности показывает, что при изменении прожиточного … на 1% средний размер пенсий изменится примерно на %. Средняя ошибка аппроксимации указывает на то, что расчетные значения отличаются от фактических примерно на % .F-тест показал статистическую значимость и надежность оценок. Некоторое несовершенство модели можно устранить увеличением объема выборки.

Размещено на Allbest.ru


Подобные документы

  • Параметры уравнений линейной, степенной парной. Оценка тесноты связи с помощью показателей корреляции и детерминации, качества уравнений с помощью средней ошибки аппроксимации. Определение прогнозного значения от среднего значения заданного параметра.

    контрольная работа [150,5 K], добавлен 22.02.2016

  • Расчет параметров линейной и степенной парной регрессии. Показатели корреляции и детерминации, методика их расчета. Средняя ошибка аппроксимации. Оценка с помощью F-критерия Фишера статистической надежности результатов регрессионного моделирования.

    контрольная работа [25,2 K], добавлен 20.11.2014

  • Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.

    контрольная работа [1,3 M], добавлен 24.09.2013

  • Средние статистические величины и аналитическая группировка данных предприятия. Результаты расчета коэффициента Фехнера по цехам. Измерение степени тесноты связи в статистике с помощью показателя корреляции. Поля корреляции и уравнения регрессии для цеха.

    практическая работа [495,9 K], добавлен 26.11.2012

  • Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.

    лабораторная работа [1,6 M], добавлен 13.04.2010

  • Основные этапы многофакторного корреляционного анализа и интерпретация его параметров. Назначение коэффициентов эластичности и стандартизированных бетта-коэффициентов. Расчет значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента.

    контрольная работа [605,2 K], добавлен 29.07.2010

  • Эффективность оборотных средств. Оценка тесноты связи между факторным и результативным показателями на основе корреляционного анализа. Проверка значимости коэффициента корреляции. Оценка значимости уравнения линейной регрессии. Формы связи показателей.

    курсовая работа [143,2 K], добавлен 15.03.2015

  • Построение корреляционного поля и предложение гипотезы о связи между денежными доходами и потребительскими расходами, выдвижение предположения о наличии выбросов. Оценка статистической надежности и значимости вычисленного коэффициента корреляции.

    контрольная работа [3,0 M], добавлен 15.11.2012

  • Оценка силы вариации признака. Построение регрессионной модели. Парный линейный коэффициент корреляции. Оценка статистической надежности результатов. Значение коэффициента детерминации. Оценка силы связи признаков. Фактическое значение критерия Фишера.

    контрольная работа [165,8 K], добавлен 27.05.2015

  • Основные понятия корреляционно-регрессионного анализа. Вычисление показателей силы и тесноты связи между явлениями и процессами, специфика их интерпретации. Оценка результатов линейного регрессионного анализа. Коэффициент множественной детерминации.

    контрольная работа [228,2 K], добавлен 02.04.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.