Корреляционные связи

Построение поля корреляции и формулировка гипотезы о возможной форме и направлении связи. Оценка тесноты связи с помощью показателей корреляции и детерминации, анализ их значений. Интегральная и предельная ошибки прогноза, его доверительный интервал.

Рубрика Экономика и экономическая теория
Вид задача
Язык русский
Дата добавления 08.10.2012
Размер файла 97,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Задача

По территориям Южного федерального округа РФ приводятся данные за 2000 год:

Таблица №1. Исходные данные для расчета

Территории федерального округа

Валовой региональный продукт, млрд. руб., Y

Инвестиции в основной капитал, млрд. руб., X

1. Респ. Адыгея

5,1

1,264

2. Респ. Дагестан

13,0

3,344

3. Респ. Ингушетия

2,0

0,930

4. Кабардино-Балкарская Респ.

10,5

2,382

5. Респ. Калмыкия

2,1

6,689

6. Карачаево-Черкесская Респ.

4,3

0,610

7. Респ. Северная Осетия - Алания

7,6

1,600

8. Краснодарский край1)

109,1

52,773

9. Ставропольский край

43,4

15,104

10. Астраханская обл.

18,9

12,633

11. Волгоградская обл.

50,0

10,936

12. Ростовская обл.

69,0

20,014

Итого,

225,9

75,506

Средняя

20,536

6,8642

Среднее квадратическое отклонение,

21,852

6,4427

Дисперсия, D

477,50

41,5079

Предварительный анализ исходных данных выявил наличие одной территории (Краснодарский край) с аномальными значениями признаков. Эта территория исключена из дальнейшего анализа. Значения показателей в итоговых строках приведены без учёта указанной аномальной единицы.

Задание:

1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.

2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.

3. Рассчитайте параметры а1 и а0 парной линейной функции и линейно-логарифмической функции

4. Оцените тесноту связи с помощью показателей корреляции (ryx и зylnx) и детерминации (r2yx и з2ylnx), проанализируйте их значения.

5. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости =0,05.

6. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.

7. По лучшему уравнению регрессии рассчитайте теоретические значения результата (), по ним постройте теоретическую линию регрессии и определите среднюю ошибку аппроксимации - е'ср., оцените её величину.

8. Рассчитайте прогнозное значение результата, если прогнозное значение фактора () составит 1,062 от среднего уровня ().

9. Рассчитайте интегральную и предельную ошибки прогноза (для =0,05), определите доверительный интервал прогноза (; ), а также диапазон верхней и нижней границ доверительного интервала (), оценив точность выполненного прогноза.

Решение:

1. Для построения графика расположим территории по возрастанию значений фактора . Данные представим следующем виде:

Таблица №2. Исходные данные, расположенные по возрастанию значения фактора

Территории федерального округа

Инвестиции в основной капитал, млрд. руб.

Валовой региональный продукт, млрд. руб.

X

Y

6

0,61

4,3

3

0,93

2

1

1,264

5,1

7

1,6

7,6

4

2,382

10,5

2

3,344

13

5

6,689

2,1

11

10,936

50

10

12,633

18,9

9

15,104

43,4

12

20,014

69

Итого,

75,506

225,9

Средняя

6,8642

20,536

Среднее квадратическое отклонение,

6,4427

21,852

Дисперсия, D

41,5079

477,50

2. Построим поле корреляции:

2. Начнем моделирование с построения уравнения прямой:, отражающей линейную форму зависимости результата Y от фактора X.

Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка Д, Да0 и Да1 Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X. См. табл.3.

Таблица №3. Разработочная таблица

А

1

2

3

4

5

6

7

8

6

0,61

4,3

0,3721

2,623

1,674041

2,625959

6,895661

0,127871013

3

0,93

2

0,8649

1,86

2,639146

-0,63915

0,408508

0,031123201

1

1,264

5,1

1,597696

6,4464

3,646475

1,453525

2,112736

0,070779383

7

1,6

7,6

2,56

12,16

4,659835

2,940165

8,64457

0,143171259

4

2,382

10,5

5,673924

25,011

7,018311

3,481689

12,12216

0,169540766

2

3,344

13

11,18234

43,472

9,919658

3,080342

9,488505

0,149997162

5

6,689

2,1

44,74272

14,0469

20,00802

-17,908

320,6973

0,872030745

11

10,936

50

119,5961

546,8

32,81678

17,18322

295,2631

0,836736525

10

12,633

18,9

159,5927

238,7637

37,93485

-19,0349

362,3256

0,926901643

9

15,104

43,4

228,1308

655,5136

45,38727

-1,98727

3,949257

0,096770244

12

20,014

69

400,5602

1380,966

60,19561

8,804394

77,51735

0,428729725

Итого

75,506

225,9

974,8735

2927,663

225,9

4,97E-14

1099,425

385,3651666

Средняя

6,8642

20,536

--

--

--

--

35,03319697

у

6,4427

21,852

--

--

--

--

--

Дисперсия, D

41,5079

477,5

--

--

--

--

--

Д=

5022,452

Да0=

-832,174

-0,16569

Да1=

15147,48

3,015954

Расчёт определителя системы выполним по формуле:

9*974,8735 - 75,506*75,506 = 5022,452;

Расчёт определителя свободного члена уравнения выполним по формуле:

225,9*974,8735 - 2927,663*75,506 = -832,174.

Расчёт определителя коэффициента регрессии выполним по формуле:

9*2927,663 - 225,9*75,506 = 15147,48.

Полученное уравнение имеет вид . В уравнении коэффициент регрессии означает, что при увеличении инвестиций в основной капитал на 1 млрд. руб. валовой региональный продукт увеличится на 3,016 млрд. руб. Свободный член оценивает влияние прочих факторов, оказывающих воздействие на объем валового регионального продукта.

Относительную оценку силы связи даёт общий (средний) коэффициент эластичности:

В нашем случае, когда рассматривается линейная зависимость, расчётная формула преобразуется к виду:

Это означает, что при изменении инвестиций в основной капитал на 1% от своей средней валовой региональный продукт увеличивается на 1,008 процента от своей средней

3. Определим коэффициенты для логарифмической функции . Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции в линейную введём новую переменную , которая линейно связана с результатом. Следовательно, для определения параметров модели будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка. См. таблицу №4.

корреляция детерминация прогноз ошибка

Таблица №4. Разработочная таблица

А

1

2

3

4

5

6

7

8

6

0,61

-0,4943

4,3

0,2443

-2,1255

-6,3197

10,6197

0,5171

3

0,93

-0,0726

2

0,0053

-0,1451

-0,1491

2,1491

0,1046

1

1,264

0,2343

5,1

0,0549

1,1948

4,3407

0,7593

0,0369

7

1,6

0,47

7,6

0,2209

3,572

7,7898

-0,1898

0,0092

4

2,382

0,8679

10,5

0,7533

9,1134

13,6123

-3,1123

0,1515

2

3,344

1,2071

13

1,4573

15,6932

18,5758

-5,5758

0,2715

5

6,689

1,9005

2,1

3,6118

3,9909

28,72

-26,62

1,2963

11

10,936

2,3921

50

5,7219

119,603

35,9129

14,0871

0,6859

10

12,633

2,5363

18,9

6,4329

47,9363

38,0236

-19,1236

0,9312

9

15,104

2,7149

43,4

7,371

117,8292

40,6375

2,7624

0,1345

12

20,014

2,9964

69

8,9786

206,7538

44,7559

24,244

1,1806

Итого

75,506

14,7528

225,9

34,8521

523,4161

225,9

0

5,3196

Средняя

6,8642

1,3412

20,536

--

--

--

--

48,3598

у

6,4427

1,17033

21,852

--

--

--

--

--

Дисперсия, D

41,5079

1,3697

477,5

--

--

--

--

--

Д=

165,7301

Да0=

151,275

0,912779

Да1=

2424,93

14,6318

Расчёт определителя системы выполним по формуле:

;

Расчёт определителя свободного члена уравнения выполним по формуле:

Расчёт определителя коэффициента регрессии выполним по формуле:

Полученное уравнение имеет вид

4. Определим показатели корреляции и детерминации:

для линейной зависимости:

Коэффициент корреляции, равный 0,8892, показывает, что выявлена весьма тесная зависимость между инвестициями в основной капитал и валовым региональным продуктом. Коэффициент детерминации, равный 0,790684, устанавливает, что вариация валового регионального продукта на 79,1% из 100% предопределена вариацией инвестиций в основной капитал; роль прочих факторов, влияющих на валовой региональный продукт, определяется в 20,9%, что является сравнительно небольшой величиной.

для логарифмической функции:

5. Оценим надежность уравнений в целом через F-критерий Фишера для уровня значимости =0,05.

для линейной зависимости:

Для оценки статистической надёжности выявленной зависимости валового продукта от инвестиций рассчитаем фактическое значение F-критерия Фишера - Fфактич. и сравним его с табличным значением - Fтабл. По результатам сравнения примем решения по нулевой гипотезе , то есть, либо примем, либо отклоним её с вероятностью допустить ошибку, которая не превысит 5% (или с уровнем значимости б=0,05).

Фактическое значение критерия показывает, что факторная вариация результата почти в 34 раза больше остаточной вариации, сформировавшейся под влиянием случайных причин. Очевидно, что подобные различия не могут быть случайными, а являются результатом систематического взаимодействия валового регионального продукта и инвестиций в основной капитал. Для обоснованного вывода сравним полученный результат с табличным значением критерия: при степенях свободы d.f.1=k-1=1 и d.f.2=n-k=11-2=9 и уровне значимости б=0,05.

В силу того, что , нулевую гипотезу о статистической незначимости выявленной зависимости валового регионального продукта от инвестиций в основной капитал и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.

для логарифмической функции:

6. Полученные показатели позволяют сделать вывод о том, что линейно-логарифмическая функция описывает изучаемую связь хуже, чем линейная модель, т.к. сравнивая оценки тесноты выявленной связи, получим: >.Таким образом, по сравнению с линейной моделью линейно-логарифмическая модель менее пригодна для описания изучаемой связи.

7. По линейному уравнению регрессии рассчитаем теоретические значения результата (), например, . Результаты расчетов приведены в Таблице 3 и отображены на рис.2.

Рис. 2. Теоретическая линия регрессии и фактические значения

Определим среднюю ошибку аппроксимации - е'ср.

Результаты расчетов для линейной зависимости приведены в таблице №3, для линейно-логарифмической - в таблице №4.

Сравнивая полученные результаты, видно, что средняя ошибка аппроксимации для линейно-логарифмической зависимости больше, чем для линейной (48,35%>35,03%), что еще раз подтверждает правильность выбора модели. Тем не менее результат, полученный даже для линейной модели (35,03%) указывает на невысокое качество построенной модели и ограничивает ее использование для выполнения точных прогнозных расчетов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения ).

8. Заключительным этапом решения данной задачи является выполнение прогноза и его оценка.

Если предположить, что прогнозное значение инвестиций в основной капитал составит 1,062 от среднего уровня, то есть Xпрогнозн.= 6,8642*1,062=7,289, тогда прогнозное значение результата сформируется на уровне:Yпрогнозн. =-0,16569+3,015954*7,289=21,81995 (млрд. руб.). То есть, прирост фактора на 6,2% приводит к приросту результата на 6,25% процента (.

Рассчитаем интегральную ошибку прогноза - , которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии-и ошибки прогноза положения регрессии -. То есть, .

В нашем случае , где k- число факторов в уравнении, которое в данной задаче равно 1.

Ошибка положения регрессии составит:

=

= = 0,0664 (млрд. руб.).

Интегральная ошибка прогноза составит:

= =11,05272 (млрд. руб.).

Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,26*11,05272 = 24,97 ? 25 (млрд. руб.). Табличное значение t-критерия для уровня значимости б=0,05 и для степеней свободы n-k-1 = 11-1-1=9 составит 2,26. Следовательно, ошибка большинства реализаций прогноза не превысит млрд. руб.

В данном случае полученная ошибка больше, чем среднее значение, поэтому сложно говорить о какой-либо точности прогноза.

Причиной небольшой точности прогноза является повышенная ошибка аппроксимации из-за недостаточно высокой типичности линейной регрессии, которая проявляется в присутствии единиц с высокой индивидуальной ошибкой. Если удалить территории с предельно высокой ошибкой (например, Республика Калмыкия с ), тогда качество линейной модели и точность прогноза по ней заметно повысятся.

Размещено на Allbest.ru


Подобные документы

  • Классификация показателей тесноты связи. Основные способы расчета показателей и определение их значимости. Линейный коэффициент корреляции для несгруппированных данных. Принятие решений о тесноте связи на основе линейного коэффициента корреляции.

    презентация [146,4 K], добавлен 16.03.2014

  • Параметры уравнений линейной, степенной парной. Оценка тесноты связи с помощью показателей корреляции и детерминации, качества уравнений с помощью средней ошибки аппроксимации. Определение прогнозного значения от среднего значения заданного параметра.

    контрольная работа [150,5 K], добавлен 22.02.2016

  • Средние статистические величины и аналитическая группировка данных предприятия. Результаты расчета коэффициента Фехнера по цехам. Измерение степени тесноты связи в статистике с помощью показателя корреляции. Поля корреляции и уравнения регрессии для цеха.

    практическая работа [495,9 K], добавлен 26.11.2012

  • Построение корреляционного поля и предложение гипотезы о связи между денежными доходами и потребительскими расходами, выдвижение предположения о наличии выбросов. Оценка статистической надежности и значимости вычисленного коэффициента корреляции.

    контрольная работа [3,0 M], добавлен 15.11.2012

  • Эффективность оборотных средств. Оценка тесноты связи между факторным и результативным показателями на основе корреляционного анализа. Проверка значимости коэффициента корреляции. Оценка значимости уравнения линейной регрессии. Формы связи показателей.

    курсовая работа [143,2 K], добавлен 15.03.2015

  • Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.

    лекция [38,1 K], добавлен 13.02.2011

  • Система статистических показателей, характеризующих экономическую эффективность сельскохозяйственного производства в целом и молока в частности. Показатели деятельности предприятий. Определение тесноты связи и расчет коэффициента корреляции детерминации.

    курсовая работа [390,6 K], добавлен 09.07.2012

  • Диаграмма рассеивания и подтверждение гипотезы о линейной зависимости, криволинейной связи по заданным статистическим данным с помощью пакета "Excel". Построение корреляционного поля, матрицы, определение параметров линейной связи. Модель Кобба-Дугласа.

    контрольная работа [153,8 K], добавлен 26.06.2009

  • Основные понятия корреляционно-регрессионного анализа. Вычисление показателей силы и тесноты связи между явлениями и процессами, специфика их интерпретации. Оценка результатов линейного регрессионного анализа. Коэффициент множественной детерминации.

    контрольная работа [228,2 K], добавлен 02.04.2013

  • Оценка силы вариации признака. Построение регрессионной модели. Парный линейный коэффициент корреляции. Оценка статистической надежности результатов. Значение коэффициента детерминации. Оценка силы связи признаков. Фактическое значение критерия Фишера.

    контрольная работа [165,8 K], добавлен 27.05.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.