Определение тесноты связи параметров

Построение поля корреляции. Гипотеза о возможной форме и направлении связи. Расчет параметров степенной, парной линейной функции и параболы второго порядка. Оценка тесноты связи с помощью показателей корреляции и детерминации, анализ их значений.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 14.04.2013
Размер файла 263,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования России

Государственное образовательное учреждение высшего профессионального образования

Санкт-Петербургский Университет Сервиса и Экономики

Контрольная работа

По дисциплине «Эконометрика»

Выполнила:

студентка з. о. 2 курса

Специальности 080501

Группа 0611 ПТ

Дудина В.М.

Проверила:

Подгорная Е.А.

Санкт-Петербург

2012

Задача 1

корреляция детерминация парабола связь линейный

По территориям Южного федерального округа приводятся статистические данные за 2000 год:

Таблица 1

Территории федерального округа

Оборот розничной торговли, млрд. руб., Y

Среднегодовая численность занятых в экономике, млн. чел., X

1. Респ. Адыгея

2,78

0,157

2. Респ. Дагестан

9,61

0,758

3. Респ. Ингушетия

1,15

0,056

4. Кабардино-Балкарская Респ.

6,01

0,287

5. Респ. Калмыкия

0,77

0,119

6. Карачаево-Черкесская Респ.

2,63

0,138

7. Респ. Северная Осетия - Алания

7,31

0,220

8. Краснодарский край

54,63

2,033

9. Ставропольский край

30,42

1,008

10. Астраханская обл.

9,53

0,422

11. Волгоградская обл.

18,58

1,147

12. Ростовская обл.

60,59

1,812

Итого,

204,01

8,157

Средняя

17,001

0,6798

Среднее квадратическое отклонение,

19,89

0,6550

Дисперсия, D

395,59

0,4290

Задание:

1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.

2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.

3. Рассчитайте параметры а1 и а0 парной линейной функции , степенной , линейно-логарифмической функции и параболы второго порядка .

4. Оцените тесноту связи с помощью показателей корреляции (r и с) и детерминации (r2 и с2), проанализируйте их значения.

5. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости =0,05.

6. На основе оценочных характеристик выберите лучшее уравнение регрессии.

7. По лучшему уравнению регрессии рассчитайте теоретические значения результата (), по ним постройте теоретическую линию регрессии и определите скорректированную среднюю ошибку аппроксимации - е'ср., оцените её величину.

8. Рассчитайте прогнозное значение результата, если прогнозное значение фактора () составит 1,062 от среднего уровня ().

9. Рассчитайте интегральную и предельную ошибки прогноза (для =0,05), определите доверительный интервал прогноза (; ), а также диапазон верхней и нижней границ доверительного интервала (), оценивая точность выполненного прогноза.

Решение:

1. Для построения графика расположим территории по возрастанию значений фактора . См. табл. 2. Если график строится в табличном процессоре EXCEL, то в исходной таблице фактор должен находиться на первом месте, а результат - на втором. Из графика может быть сделан вывод о возможной форме связи оборота розничной торговли (Y) с общей суммой доходов населения (X). В этом случае для описания зависимости следует построить несколько моделей разного вида и на основе оценочных характеристик выбрать оптимальную форму модели.

Таблица 2

Территории федерального округа, А

Оборот розничной торговли, млрд. руб., Y

Среднегодовая численность занятых в экономике, млн. чел., X

3. Респ. Ингушетия

1,15

0,056

5. Респ. Калмыкия

0,77

0,119

6. Карачаево-Черкесская Респ.

2,63

0,138

1. Респ. Адыгея

2,78

0,157

7. Респ. Северная Осетия - Алания

7,31

0,22

4. Кабардино-Балкарская Респ.

6,01

0,287

10. Астраханская обл.

9,53

0,422

2. Респ. Дагестан

9,61

0,758

9. Ставропольский край

30,42

1,008

11. Волгоградская обл.

18,58

1,147

12. Ростовская обл.

60,59

1,812

8. Краснодарский край

54,63

2,033

Итого, S

204,01

8,157

Средняя

17,001

0,6798

Среднее квадратическое отклонение, s

19,89

0,655

Дисперсия, D

395,59

0,429

2. Обычно моделирование начинается в построения уравнения прямой:, отражающей линейную форму зависимости результата Y от фактора X.

3. Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, оносительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка Д, Да0 и Да1 Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X.

Таблица 3

А

1

2

3

4

5

6

7

8

1

0,056

1,15

134,6

84,7

8,1

-0,8

0,6

5,2

2

0,119

0,77

219,0

137,6

9,4

-0,1

0,0

0,4

3

0,138

2,63

361,0

266,0

11,1

2,9

8,4

19,5

4

0,157

2,78

364,8

179,5

11,1

-1,7

2,9

11,2

5

0,22

7,31

686,4

408,7

13,9

1,7

2,9

10,9

6

0,287

6,01

756,3

332,8

14,5

-2,4

5,7

15,7

7

0,422

9,53

900,0

489,0

15,5

0,8

0,6

5,5

8

0,758

9,61

1391,3

622,9

18,4

-1,7

2,9

11,3

9

1,008

30,42

1560,3

809,8

19,3

1,2

1,4

8,0

Итого

225,0

121,2

6373,6

3331,0

121,2

0,0

25,4

98,4

Средняя

25,0

13,5

--

--

--

--

--

10,9

Сигма

9,12

4,04

--

--

--

--

--

--

Дисперсия, D

83,18

16,29

--

--

--

--

--

--

Д=

6737,76

--

--

--

--

--

--

--

Да0=

23012,4

3,415

--

--

--

--

--

Да1=

2708,91

0,402

--

--

--

--

--

3. Расчёт определителя системы выполним по формуле:

9*6373,6 - 225,0*225,0 = 6737,76;

Расчёт определителя свободного члена уравнения выполним по формуле:

121,2*6373,6 - 3331,0*225,0 = 23012,4.

Расчёт определителя коэффициента регрессии выполним по формуле:

9*3331,0 - 121,2*225,0 = 2708,91.

4. Расчёт параметров уравнения регрессии даёт следующие результаты:

; .

В конечном счёте, получаем теоретическое уравнение регрессии следующего вида:

В уравнении коэффициент регрессии а0 = 0,415 означает, что при увеличении доходов населения на 1 тыс. руб. (от своей средней) объём розничного товарооборота возрастёт на 0,415 млрд. руб. (от своей средней).

Свободный член уравнения а0 =3,415 оценивает влияние прочих факторов, оказывающих воздействие на объём розничного товарооборота.

5. Относительную оценку силы связи даёт общий (средний) коэффициент эластичности:

В нашем случае, когда рассматривается линейная зависимость, расчётная формула преобразуется к виду:

Это означает, что при изменении общей суммы доходов населения на 1% от своей средней оборот розничной торговли увеличивается на 0,744 процента от своей средней.

6. Для оценки тесноты связи рассчитаем линейный коэффициент парной корреляции:

Коэффициент корреляции, равный 0,9075, показывает, что выявлена весьма тесная зависимость между общей суммой доходов населения за год и оборотом розничной торговли за год. Коэффициент детерминации, равный 0,824, устанавливает, что вариация оборота розничной торговли на 82,4% из 100% предопределена вариацией общей суммы доходов населения; роль прочих факторов, влияющих на розничный товарооборот, определяется в 17,6%, что является сравнительно небольшой величиной.

7. Для оценки статистической надёжности выявленной зависимости дохода от доли занятых рассчитаем фактическое значение F-критерия Фишера - Fфактич. и сравним его с табличным значением - Fтабл. По результатам сравнения примем решения по нулевой гипотезе , то есть, либо примем, либо отклоним её с вероятностью допустить ошибку, которая не превысит 5% (или с уровнем значимости б=0,05).

В нашем случае,

.

Фактическое значение критерия показывает, что факторная вариация результата почти в 33 раза больше остаточной вариации, сформировавшейся под влиянием случайных причин. Очевидно, что подобные различия не могут быть случайными, а являются результатом систематического взаимодействия оборота розничной торговли и общей суммы доходов населения. Для обоснованного вывода сравним полученный результат с табличным значением критерия: при степенях свободы d.f.1=k-1=1 и d.f.2=n-k=9-2=7 и уровне значимости б=0,05.

Значения представлены в таблице «Значения F-критерия Фишера для уровня значимости 0,05 (или 0,01)». См. приложение 1 данных «Методических указаний…».

В силу того, что , нулевую гипотезу о статистической незначимости выявленной зависимости оборота розничной торговли от общей суммы доходов населения и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.

8. Определим теоретические значения результата Yтеор. Для этого в полученное уравнение последовательно подставим фактические значения фактора X и выполним расчёт.

Например, . См. гр. 5 расчётной таблицы. По парам значений Yтеор. и Xфакт. строится теоретическая линия регрессии, которая пересечётся с эмпирической регрессией в нескольких точках. См. график 1.

9. Оценку качества модели дадим с помощью скорректированной средней ошибки аппроксимации:

.

В нашем случае скорректированная ошибка аппроксимации составляет 10,2%. Она указывает на невысокое качество построенной линейной модели и ограничивает её использование для выполнения точных прогнозных расчётов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения ).

График 1

10. Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции в линейную введём новую переменную , которая линейно связана с результатом. Следовательно, для определения параметров модели будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка. См. расчётную таблицу 4.

Расчётная таблица 4

А

1

2

3

4

5

6

7

8

9

1

0,056

2,451

1,15

6,007

17,892

7,0

0,3

0,1

2,4

2

0,119

2,695

0,77

7,261

25,060

9,3

0,0

0,0

0,4

3

0,138

2,944

2,63

8,670

41,222

11,6

2,4

5,8

17,9

4

0,157

2,950

2,78

8,701

27,727

11,6

-2,2

4,8

16,6

5

0,22

3,266

7,31

10,665

50,946

14,6

1,0

1,0

7,6

6

0,287

3,314

6,01

10,984

40,102

15,0

-2,9

8,4

21,8

7

0,422

3,401

9,53

11,568

55,440

15,8

0,5

0,3

3,4

8

0,758

3,619

9,61

13,097

60,437

17,9

-1,2

1,4

8,8

9

1,008

3,676

30,42

13,515

75,364

18,4

2,1

4,4

15,5

Итого

28,316

121,2

90,468

394,190

121,2

0,0

26,2

94,2

Средняя

3,146

13,5

--

--

--

--

2,9

10,5

Сигма

0,391

4,04

Дисперсия, D

0,153

16,29

Расчёт определителей второго порядка даёт следующие результаты:

; ; . Отсюда получаем параметры уравнения:

Полученное уравнение имеет вид

.

Оценочные показатели позволяют сделать вывод, что линейно-логарифмическая функция описывает изучаемую связь хуже, чем линейная модель: оценка тесноты выявленной связи с=0,9066 (сравните с 0,9075), скорректированная средняя ошибка аппроксимации здесь выше и составляет 10,5%, то есть возможности использования для прогноза данной модели более ограничены.

11. Выполним расчёт параметров уравнения параболы второго порядка. В этом случае используются определители третьего порядка, расчёт которых выполняется по стандартным формулам и требует особого внимания и точности. См. расчётную таблицу 5. По материалам табл. 5 выполним расчёт четырёх определителей третьего порядка по следующим формулам:

Д = n*Уx2*Уx4 + Уx*Уx3*Уx2 + Уx*Уx3*Уx2 - Уx2*Уx2*Уx2 - Уx*Уx*Уx4 - Уx3*Уx3*n = = 331.854.860,7;

Дa0 = Уy*Уx2*Уx4 + Уx*Уx3*У(y*x2)+ У(y*x)*Уx3*Уx2 - У(y*x2)*Уx2*Уx2 -

У(y*x)*Уx*Уx4 - Уx3*Уx3*Уy = 751.979.368,8

Дa1 = n*У(y*x)*Уx4 + Уy*Уx3*Уx2 + Уx*У(y*x2)*Уx2 - Уx2*У(y*x)* Уx2 - Уx*Уy* Уx4 - У(y*x2)*Уx3*n = 167.288.933,1

Дa2 = n*Уx2*У(y*x2) + Уx*Уyx*Уx2 + Уx*Уx3*Уy - Уx2*Уx2*Уy - Уx*Уx*У(y*x2) - Уx3*У(y*x)*n = - 656.926,8

В результате получаем следующие значения параметров уравнения параболы:

;

;

Уравнение имеет следующий вид: . Для него показатель детерминации составляет 82,7%, Fфактич.= 14,3, а ошибка аппроксимации 10,7%.

Как видим, по сравнению с линейной функцией построить уравнения параболы гораздо сложнее, а изучаемую зависимость она описывает почти с той же точностью, хотя надёжность уравнения параболы значительно ниже (для линейной модели Fфактич.= 32,8, а для параболы Fфактич.= 14,3). Поэтому в дальнейшем анализе парабола второго порядка использоваться не будет.

Расчётная таблица 5

А

1

2

3

4

5

6

7

8

9

10

11

1

0,056

1,15

84,7

6,007

17,892

18106,4

982,3

7,8

-0,5

0,3

4,1

2

0,119

0,77

137,6

7,261

25,060

47978,5

2037,1

9,3

0,0

0,0

0,1

3

0,138

2,63

266,0

8,670

41,222

130321,0

5054,0

11,1

2,9

8,4

21,3

4

0,157

2,78

179,5

8,701

27,727

133086,3

3429,2

11,2

-1,8

3,2

13,2

5

0,22

7,31

408,7

10,665

50,946

471199,9

10708,5

14,1

1,5

2,3

11,0

6

0,287

6,01

332,8

10,984

40,102

571914,1

9150,6

14,6

-2,5

6,3

18,8

7

0,422

9,53

489,0

11,568

55,440

810000,0

14670,0

15,6

0,7

0,5

5,1

8

0,758

9,61

622,9

13,097

60,437

1935687,9

23234,5

18,3

-1,6

2,6

12,0

9

1,008

30,42

809,8

13,515

75,364

2434380,1

31985,1

19,1

1,4

2,0

10,5

Итого

225

121,2

3331,0

90,468

394,190

6552674,1

101251,3

121,2

0,0

25,6

96,0

Средняя

25,0

13,5

--

--

--

--

--

--

--

2,8

10,7

Сигма

9,12

4,04

D

83,18

16,29

12. Проведём расчёт параметров степенной функции, которому также предшествует процедура линеаризации исходных переменных. В данном случае выполняется логарифмирование обеих частей уравнения, в результате которого получаем уравнение, где линейно связаны значения логарифмов фактора и результата. Исходное уравнение после логарифмирования приобретает следующий вид: . Порядок расчёта приведён в таблице 6.

Расчётная таблица №6

А

1

2

3

4

5

6

7

8

9

10

1

0,056

7,3

2,4510

1,9879

4,8723

4,8723

2,0330

0,0020

7,6

2,5

2

0,119

9,3

2,6946

2,2300

6,0091

6,0091

2,2148

0,0002

9,2

1,0

3

0,138

14,0

2,9444

2,6391

7,7705

7,7705

2,4011

0,0566

11,0

22,0

4

0,157

9,4

2,9497

2,2407

6,6094

6,6094

2,4050

0,0270

11,1

12,5

5

0,22

15,6

3,2658

2,7473

8,9719

8,9719

2,6408

0,0113

14,0

11,7

6

0,287

12,1

3,3142

2,4932

8,2629

8,2629

2,6770

0,0338

14,5

18,1

7

0,422

16,3

3,4012

2,7912

9,4933

9,4933

2,7419

0,0024

15,5

5,8

8

0,758

16,7

3,6190

2,8154

10,1889

10,1889

2,9044

0,0079

18,3

11,5

9

1,008

20,5

3,6763

3,0204

11,1040

11,1040

2,9471

0,0054

19,1

10,8

Итого

121,2

28,3162

22,9651

73,2824

73,2824

22,9651

0,1467

120,3

96,0

Средняя

13,5

3,1462

2,5517

--

--

--

--

--

10,7

Сигма

0,3914

0,3187

D

0,1532

0,1016

В результате расчёта получены следующие значения определителей второго порядка:

12,4075;

2,5371;

9,25642.

Параметры степенной функции составляют:

; .

Уравнение имеет вид: lnY=ln a0 + a1*ln X = 0,2045 + 0,7460*X , а после процедуры потенцирования уравнение приобретает окончательный вид:

или .

Полученное уравнение несколько лучше описывает изучаемую зависимость и более надёжно по сравнению с линейной моделью. Степенная модель имеет детерминацию на уровне 84,0% (против 82,4% по линейной модели), Fфакт.=36,6 (против 33,1 для линейной модели) и ошибку аппроксимации на уровне 10,7% (сравните с 10,9% для уравнения прямой).

Очевидно, что преимущества степенной модели по сравнению с линейной не столь значительны, но её построение заметно сложнее и требует значительно больших усилий. Поэтому окончательный выбор, в данном конкретном случае, сделаем в пользу модели, которая является более простой при построении, анализе и использовании, то есть в пользу линейной модели:

Заключительным этапом решения данной задачи является выполнение прогноза и его оценка.

Если предположить, что прогнозное значение общей суммы доходов населения, например, Новгородской области, (см. табл.2 строка 2) возрастёт с 14,8 млрд. руб. на 5,7% и составит 15,6 млрд. руб., то есть Xпрогнозн.= 14,8*1,057=15,6, тогда прогнозное значение результата сформируется на уровне:Yпрогнозн. =3,415+0,402*15,6=9,7 (млрд. руб.). То есть, прирост фактора на 5,7% приводит к приросту результата на 4,2 процента (.

Рассчитаем интегральную ошибку прогноза - , которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии-и ошибки прогноза положения регрессии -. То есть, .

В нашем случае

,

где k- число факторов в уравнении, которое в данной задаче равно 1. Тогда (млрд. руб.).

Ошибка положения регрессии составит:

=

= = = 0,914 (млрд. руб.).

Интегральная ошибка прогноза составит:

= = 2,1 (млрд. руб.).

Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,365*2,1 = 5,011 ? 5,0 (млрд. руб.). Табличное значение t-критерия для уровня значимости б=0,05 и для степеней свободы n-k-1 = 9-1-1=7 составит 2,365. (См. табл. приложения 2). Следовательно, ошибка большинства реализаций прогноза не превысит млрд. руб.

Это означает, что фактическая реализация прогноза будет находиться в доверительном интервале . Верхняя граница доверительного интервала составит

= 9,7 + 5,0 = 14,7(млрд. руб.).

Нижняя граница доверительного интервала составит:

= 9,7 - 5,0 = 4,7(млрд. руб.).

Относительная величина различий значений верхней и нижней границ составит: = раза. Это означает, что верхняя граница в 3,12 раза больше нижней границы, то есть точность выполненного прогноза весьма невелика, но его надёжность на уровне 95% оценивается как высокая. Причиной небольшой точности прогноза является повышенная ошибка аппроксимации. Здесь её значение выходит за границу 5-7% из-за недостаточно высокой типичности линейной регрессии, которая проявляется в присутствии единиц с высокой индивидуальной ошибкой. Если удалить территории с предельно высокой ошибкой (например, Калининградскую область с ), тогда качество линейной модели и точность прогноза по ней заметно повысятся.

Размещено на Allbest.ru


Подобные документы

  • Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.

    контрольная работа [136,3 K], добавлен 25.09.2014

  • Построение поля корреляции по данным, гипотеза о форме связи. Оценка тесноты связи с помощью показателей корреляции и детерминации. Определение коэффициента эластичности и индекса корреляции. Расчет критериев Фишера. Модель денежного и товарного рынков.

    контрольная работа [353,7 K], добавлен 21.06.2011

  • Построение поля корреляции. Оценка данной зависимости линейной, степенной и гиперболической регрессией. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициента эластичности. Определение доверительного интервала прогноза.

    контрольная работа [508,1 K], добавлен 13.11.2011

  • Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.

    контрольная работа [173,8 K], добавлен 22.11.2010

  • Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.

    курсовая работа [1,1 M], добавлен 07.08.2011

  • Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.

    контрольная работа [71,7 K], добавлен 17.09.2016

  • Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.

    контрольная работа [157,9 K], добавлен 06.08.2010

  • Этапы и проблемы эконометрических исследований. Параметры парной линейной регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициентов автокорреляции второго порядка для временного ряда расходов на потребление.

    контрольная работа [60,3 K], добавлен 05.01.2011

  • Построение поля корреляции, оценка тесноты связи с помощью показателей корреляции и детерминации, адекватности линейной модели. Статистическая надёжность нелинейных моделей по критерию Фишера. Модель сезонных колебаний и расчёт прогнозных значений.

    практическая работа [145,7 K], добавлен 13.05.2014

  • Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [58,3 K], добавлен 17.10.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.