Корреляционные связи
Построение поля корреляции и формулировка гипотезы о возможной форме и направлении связи. Оценка тесноты связи с помощью показателей корреляции и детерминации, анализ их значений. Интегральная и предельная ошибки прогноза, его доверительный интервал.
Рубрика | Экономика и экономическая теория |
Вид | задача |
Язык | русский |
Дата добавления | 08.10.2012 |
Размер файла | 97,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Задача
По территориям Южного федерального округа РФ приводятся данные за 2000 год:
Таблица №1. Исходные данные для расчета
Территории федерального округа |
Валовой региональный продукт, млрд. руб., Y |
Инвестиции в основной капитал, млрд. руб., X |
|
1. Респ. Адыгея |
5,1 |
1,264 |
|
2. Респ. Дагестан |
13,0 |
3,344 |
|
3. Респ. Ингушетия |
2,0 |
0,930 |
|
4. Кабардино-Балкарская Респ. |
10,5 |
2,382 |
|
5. Респ. Калмыкия |
2,1 |
6,689 |
|
6. Карачаево-Черкесская Респ. |
4,3 |
0,610 |
|
7. Респ. Северная Осетия - Алания |
7,6 |
1,600 |
|
8. Краснодарский край1) |
109,1 |
52,773 |
|
9. Ставропольский край |
43,4 |
15,104 |
|
10. Астраханская обл. |
18,9 |
12,633 |
|
11. Волгоградская обл. |
50,0 |
10,936 |
|
12. Ростовская обл. |
69,0 |
20,014 |
|
Итого, |
225,9 |
75,506 |
|
Средняя |
20,536 |
6,8642 |
|
Среднее квадратическое отклонение, |
21,852 |
6,4427 |
|
Дисперсия, D |
477,50 |
41,5079 |
Предварительный анализ исходных данных выявил наличие одной территории (Краснодарский край) с аномальными значениями признаков. Эта территория исключена из дальнейшего анализа. Значения показателей в итоговых строках приведены без учёта указанной аномальной единицы.
Задание:
1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.
2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.
3. Рассчитайте параметры а1 и а0 парной линейной функции и линейно-логарифмической функции
4. Оцените тесноту связи с помощью показателей корреляции (ryx и зylnx) и детерминации (r2yx и з2ylnx), проанализируйте их значения.
5. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости =0,05.
6. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.
7. По лучшему уравнению регрессии рассчитайте теоретические значения результата (), по ним постройте теоретическую линию регрессии и определите среднюю ошибку аппроксимации - е'ср., оцените её величину.
8. Рассчитайте прогнозное значение результата, если прогнозное значение фактора () составит 1,062 от среднего уровня ().
9. Рассчитайте интегральную и предельную ошибки прогноза (для =0,05), определите доверительный интервал прогноза (; ), а также диапазон верхней и нижней границ доверительного интервала (), оценив точность выполненного прогноза.
Решение:
1. Для построения графика расположим территории по возрастанию значений фактора . Данные представим следующем виде:
Таблица №2. Исходные данные, расположенные по возрастанию значения фактора
Территории федерального округа |
Инвестиции в основной капитал, млрд. руб. |
Валовой региональный продукт, млрд. руб. |
|
X |
Y |
||
6 |
0,61 |
4,3 |
|
3 |
0,93 |
2 |
|
1 |
1,264 |
5,1 |
|
7 |
1,6 |
7,6 |
|
4 |
2,382 |
10,5 |
|
2 |
3,344 |
13 |
|
5 |
6,689 |
2,1 |
|
11 |
10,936 |
50 |
|
10 |
12,633 |
18,9 |
|
9 |
15,104 |
43,4 |
|
12 |
20,014 |
69 |
|
Итого, |
75,506 |
225,9 |
|
Средняя |
6,8642 |
20,536 |
|
Среднее квадратическое отклонение, |
6,4427 |
21,852 |
|
Дисперсия, D |
41,5079 |
477,50 |
2. Построим поле корреляции:
2. Начнем моделирование с построения уравнения прямой:, отражающей линейную форму зависимости результата Y от фактора X.
Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка Д, Да0 и Да1 Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X. См. табл.3.
Таблица №3. Разработочная таблица
№ |
|||||||||
А |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
6 |
0,61 |
4,3 |
0,3721 |
2,623 |
1,674041 |
2,625959 |
6,895661 |
0,127871013 |
|
3 |
0,93 |
2 |
0,8649 |
1,86 |
2,639146 |
-0,63915 |
0,408508 |
0,031123201 |
|
1 |
1,264 |
5,1 |
1,597696 |
6,4464 |
3,646475 |
1,453525 |
2,112736 |
0,070779383 |
|
7 |
1,6 |
7,6 |
2,56 |
12,16 |
4,659835 |
2,940165 |
8,64457 |
0,143171259 |
|
4 |
2,382 |
10,5 |
5,673924 |
25,011 |
7,018311 |
3,481689 |
12,12216 |
0,169540766 |
|
2 |
3,344 |
13 |
11,18234 |
43,472 |
9,919658 |
3,080342 |
9,488505 |
0,149997162 |
|
5 |
6,689 |
2,1 |
44,74272 |
14,0469 |
20,00802 |
-17,908 |
320,6973 |
0,872030745 |
|
11 |
10,936 |
50 |
119,5961 |
546,8 |
32,81678 |
17,18322 |
295,2631 |
0,836736525 |
|
10 |
12,633 |
18,9 |
159,5927 |
238,7637 |
37,93485 |
-19,0349 |
362,3256 |
0,926901643 |
|
9 |
15,104 |
43,4 |
228,1308 |
655,5136 |
45,38727 |
-1,98727 |
3,949257 |
0,096770244 |
|
12 |
20,014 |
69 |
400,5602 |
1380,966 |
60,19561 |
8,804394 |
77,51735 |
0,428729725 |
|
Итого |
75,506 |
225,9 |
974,8735 |
2927,663 |
225,9 |
4,97E-14 |
1099,425 |
385,3651666 |
|
Средняя |
6,8642 |
20,536 |
-- |
-- |
-- |
-- |
35,03319697 |
||
у |
6,4427 |
21,852 |
-- |
-- |
-- |
-- |
-- |
||
Дисперсия, D |
41,5079 |
477,5 |
-- |
-- |
-- |
-- |
-- |
||
Д= |
5022,452 |
||||||||
Да0= |
-832,174 |
-0,16569 |
|||||||
Да1= |
15147,48 |
3,015954 |
Расчёт определителя системы выполним по формуле:
9*974,8735 - 75,506*75,506 = 5022,452;
Расчёт определителя свободного члена уравнения выполним по формуле:
225,9*974,8735 - 2927,663*75,506 = -832,174.
Расчёт определителя коэффициента регрессии выполним по формуле:
9*2927,663 - 225,9*75,506 = 15147,48.
Полученное уравнение имеет вид . В уравнении коэффициент регрессии означает, что при увеличении инвестиций в основной капитал на 1 млрд. руб. валовой региональный продукт увеличится на 3,016 млрд. руб. Свободный член оценивает влияние прочих факторов, оказывающих воздействие на объем валового регионального продукта.
Относительную оценку силы связи даёт общий (средний) коэффициент эластичности:
В нашем случае, когда рассматривается линейная зависимость, расчётная формула преобразуется к виду:
Это означает, что при изменении инвестиций в основной капитал на 1% от своей средней валовой региональный продукт увеличивается на 1,008 процента от своей средней
3. Определим коэффициенты для логарифмической функции . Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции в линейную введём новую переменную , которая линейно связана с результатом. Следовательно, для определения параметров модели будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка. См. таблицу №4.
корреляция детерминация прогноз ошибка
Таблица №4. Разработочная таблица
№ |
|||||||||
А |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
6 |
0,61 |
-0,4943 |
4,3 |
0,2443 |
-2,1255 |
-6,3197 |
10,6197 |
0,5171 |
|
3 |
0,93 |
-0,0726 |
2 |
0,0053 |
-0,1451 |
-0,1491 |
2,1491 |
0,1046 |
|
1 |
1,264 |
0,2343 |
5,1 |
0,0549 |
1,1948 |
4,3407 |
0,7593 |
0,0369 |
|
7 |
1,6 |
0,47 |
7,6 |
0,2209 |
3,572 |
7,7898 |
-0,1898 |
0,0092 |
|
4 |
2,382 |
0,8679 |
10,5 |
0,7533 |
9,1134 |
13,6123 |
-3,1123 |
0,1515 |
|
2 |
3,344 |
1,2071 |
13 |
1,4573 |
15,6932 |
18,5758 |
-5,5758 |
0,2715 |
|
5 |
6,689 |
1,9005 |
2,1 |
3,6118 |
3,9909 |
28,72 |
-26,62 |
1,2963 |
|
11 |
10,936 |
2,3921 |
50 |
5,7219 |
119,603 |
35,9129 |
14,0871 |
0,6859 |
|
10 |
12,633 |
2,5363 |
18,9 |
6,4329 |
47,9363 |
38,0236 |
-19,1236 |
0,9312 |
|
9 |
15,104 |
2,7149 |
43,4 |
7,371 |
117,8292 |
40,6375 |
2,7624 |
0,1345 |
|
12 |
20,014 |
2,9964 |
69 |
8,9786 |
206,7538 |
44,7559 |
24,244 |
1,1806 |
|
Итого |
75,506 |
14,7528 |
225,9 |
34,8521 |
523,4161 |
225,9 |
0 |
5,3196 |
|
Средняя |
6,8642 |
1,3412 |
20,536 |
-- |
-- |
-- |
-- |
48,3598 |
|
у |
6,4427 |
1,17033 |
21,852 |
-- |
-- |
-- |
-- |
-- |
|
Дисперсия, D |
41,5079 |
1,3697 |
477,5 |
-- |
-- |
-- |
-- |
-- |
|
Д= |
165,7301 |
||||||||
Да0= |
151,275 |
0,912779 |
|||||||
Да1= |
2424,93 |
14,6318 |
Расчёт определителя системы выполним по формуле:
;
Расчёт определителя свободного члена уравнения выполним по формуле:
Расчёт определителя коэффициента регрессии выполним по формуле:
Полученное уравнение имеет вид
4. Определим показатели корреляции и детерминации:
для линейной зависимости:
Коэффициент корреляции, равный 0,8892, показывает, что выявлена весьма тесная зависимость между инвестициями в основной капитал и валовым региональным продуктом. Коэффициент детерминации, равный 0,790684, устанавливает, что вариация валового регионального продукта на 79,1% из 100% предопределена вариацией инвестиций в основной капитал; роль прочих факторов, влияющих на валовой региональный продукт, определяется в 20,9%, что является сравнительно небольшой величиной.
для логарифмической функции:
5. Оценим надежность уравнений в целом через F-критерий Фишера для уровня значимости =0,05.
для линейной зависимости:
Для оценки статистической надёжности выявленной зависимости валового продукта от инвестиций рассчитаем фактическое значение F-критерия Фишера - Fфактич. и сравним его с табличным значением - Fтабл. По результатам сравнения примем решения по нулевой гипотезе , то есть, либо примем, либо отклоним её с вероятностью допустить ошибку, которая не превысит 5% (или с уровнем значимости б=0,05).
Фактическое значение критерия показывает, что факторная вариация результата почти в 34 раза больше остаточной вариации, сформировавшейся под влиянием случайных причин. Очевидно, что подобные различия не могут быть случайными, а являются результатом систематического взаимодействия валового регионального продукта и инвестиций в основной капитал. Для обоснованного вывода сравним полученный результат с табличным значением критерия: при степенях свободы d.f.1=k-1=1 и d.f.2=n-k=11-2=9 и уровне значимости б=0,05.
В силу того, что , нулевую гипотезу о статистической незначимости выявленной зависимости валового регионального продукта от инвестиций в основной капитал и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.
для логарифмической функции:
6. Полученные показатели позволяют сделать вывод о том, что линейно-логарифмическая функция описывает изучаемую связь хуже, чем линейная модель, т.к. сравнивая оценки тесноты выявленной связи, получим: >.Таким образом, по сравнению с линейной моделью линейно-логарифмическая модель менее пригодна для описания изучаемой связи.
7. По линейному уравнению регрессии рассчитаем теоретические значения результата (), например, . Результаты расчетов приведены в Таблице 3 и отображены на рис.2.
Рис. 2. Теоретическая линия регрессии и фактические значения
Определим среднюю ошибку аппроксимации - е'ср.
Результаты расчетов для линейной зависимости приведены в таблице №3, для линейно-логарифмической - в таблице №4.
Сравнивая полученные результаты, видно, что средняя ошибка аппроксимации для линейно-логарифмической зависимости больше, чем для линейной (48,35%>35,03%), что еще раз подтверждает правильность выбора модели. Тем не менее результат, полученный даже для линейной модели (35,03%) указывает на невысокое качество построенной модели и ограничивает ее использование для выполнения точных прогнозных расчетов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения ).
8. Заключительным этапом решения данной задачи является выполнение прогноза и его оценка.
Если предположить, что прогнозное значение инвестиций в основной капитал составит 1,062 от среднего уровня, то есть Xпрогнозн.= 6,8642*1,062=7,289, тогда прогнозное значение результата сформируется на уровне:Yпрогнозн. =-0,16569+3,015954*7,289=21,81995 (млрд. руб.). То есть, прирост фактора на 6,2% приводит к приросту результата на 6,25% процента (.
Рассчитаем интегральную ошибку прогноза - , которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии-и ошибки прогноза положения регрессии -. То есть, .
В нашем случае , где k- число факторов в уравнении, которое в данной задаче равно 1.
Ошибка положения регрессии составит:
=
= = 0,0664 (млрд. руб.).
Интегральная ошибка прогноза составит:
= =11,05272 (млрд. руб.).
Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,26*11,05272 = 24,97 ? 25 (млрд. руб.). Табличное значение t-критерия для уровня значимости б=0,05 и для степеней свободы n-k-1 = 11-1-1=9 составит 2,26. Следовательно, ошибка большинства реализаций прогноза не превысит млрд. руб.
В данном случае полученная ошибка больше, чем среднее значение, поэтому сложно говорить о какой-либо точности прогноза.
Причиной небольшой точности прогноза является повышенная ошибка аппроксимации из-за недостаточно высокой типичности линейной регрессии, которая проявляется в присутствии единиц с высокой индивидуальной ошибкой. Если удалить территории с предельно высокой ошибкой (например, Республика Калмыкия с ), тогда качество линейной модели и точность прогноза по ней заметно повысятся.
Размещено на Allbest.ru
Подобные документы
Классификация показателей тесноты связи. Основные способы расчета показателей и определение их значимости. Линейный коэффициент корреляции для несгруппированных данных. Принятие решений о тесноте связи на основе линейного коэффициента корреляции.
презентация [146,4 K], добавлен 16.03.2014Параметры уравнений линейной, степенной парной. Оценка тесноты связи с помощью показателей корреляции и детерминации, качества уравнений с помощью средней ошибки аппроксимации. Определение прогнозного значения от среднего значения заданного параметра.
контрольная работа [150,5 K], добавлен 22.02.2016Средние статистические величины и аналитическая группировка данных предприятия. Результаты расчета коэффициента Фехнера по цехам. Измерение степени тесноты связи в статистике с помощью показателя корреляции. Поля корреляции и уравнения регрессии для цеха.
практическая работа [495,9 K], добавлен 26.11.2012Построение корреляционного поля и предложение гипотезы о связи между денежными доходами и потребительскими расходами, выдвижение предположения о наличии выбросов. Оценка статистической надежности и значимости вычисленного коэффициента корреляции.
контрольная работа [3,0 M], добавлен 15.11.2012Эффективность оборотных средств. Оценка тесноты связи между факторным и результативным показателями на основе корреляционного анализа. Проверка значимости коэффициента корреляции. Оценка значимости уравнения линейной регрессии. Формы связи показателей.
курсовая работа [143,2 K], добавлен 15.03.2015Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.
лекция [38,1 K], добавлен 13.02.2011Система статистических показателей, характеризующих экономическую эффективность сельскохозяйственного производства в целом и молока в частности. Показатели деятельности предприятий. Определение тесноты связи и расчет коэффициента корреляции детерминации.
курсовая работа [390,6 K], добавлен 09.07.2012Диаграмма рассеивания и подтверждение гипотезы о линейной зависимости, криволинейной связи по заданным статистическим данным с помощью пакета "Excel". Построение корреляционного поля, матрицы, определение параметров линейной связи. Модель Кобба-Дугласа.
контрольная работа [153,8 K], добавлен 26.06.2009Основные понятия корреляционно-регрессионного анализа. Вычисление показателей силы и тесноты связи между явлениями и процессами, специфика их интерпретации. Оценка результатов линейного регрессионного анализа. Коэффициент множественной детерминации.
контрольная работа [228,2 K], добавлен 02.04.2013Оценка силы вариации признака. Построение регрессионной модели. Парный линейный коэффициент корреляции. Оценка статистической надежности результатов. Значение коэффициента детерминации. Оценка силы связи признаков. Фактическое значение критерия Фишера.
контрольная работа [165,8 K], добавлен 27.05.2015