Методы решения типовых задач по эконометрике

Построение поля корреляции, формулировка гипотезы о возможной форме и направлении связи. Расчет параметров парной линейной, степенной и линейно-логарифмической функций, а также параболы второго порядка. Построение уравнения регрессии и методы его решения.

Рубрика Экономико-математическое моделирование
Вид лабораторная работа
Язык русский
Дата добавления 25.03.2012
Размер файла 475,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

11

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Примечание к решению типовых задач.

При решении типовых задач в табличном процессоре EXCEL и вручную, на калькуляторе из-за особенностей программы при округления цифр промежуточных расчётов некоторые из итоговых результатов могут отличаться. Это не является ошибкой, а лишь особенностью пакетного и ручного решения.

Задача 1.

Приводятся данные за 2000 год по территориям Северо-Западного федерального округа

Таблица № 1.

Территории Северо-Западного федерального округа

Оборот розничной торговли за год, млрд. руб.

Общая сумма доходов населения за год, млрд. руб.

А

Y

X

1.Респ. Карелия

9,4

19,1

2.Респ. Коми

16,7

37,3

3.Архангельская обл.

16,3

30,0

4.Вологодская обл.

12,1

27,5

5.Калининградская обл.

14,0

19,0

6.Ленинградская обл.

15,6

26,2

7.Мурманская обл.

20,5

39,5

8.Новгородская обл.

9,3

14,8

9.Псковская обл.

7,3

11,6

10.г.Санкт-Петербург1)

83,1

133,6

Итого

121,2

225

Средняя

13,47

25,0

4,036

9,120

Дисперсия, D

16,289

83,182

1) Предварительный анализ исходных данных выявил наличие одной территории (г.Санкт-Петербург) с аномальными значениями признаков. Эта территория исключена из дальнейшего анализа. Значения показателей в итоговых строках приведены без учёта указанной аномальной единицы.

Задание

1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.

2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.

3. Рассчитайте параметры а1 и а0 парной линейной функции , степенной , линейно-логарифмической функции и параболы второго порядка .

4. Оцените тесноту связи с помощью показателей корреляции (r и с) и детерминации (r2 и с2), проанализируйте их значения.

5. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости =0,05.

6. На основе оценочных характеристик выберите лучшее уравнение регрессии.

7. По лучшему уравнению регрессии рассчитайте теоретические значения результата (), по ним постройте теоретическую линию регрессии и определите скорректированную среднюю ошибку аппроксимации - е'ср., оцените её величину.

8. Рассчитайте прогнозное значение результата, если прогнозное значение фактора () составит 1,062 от среднего уровня ().

9. Рассчитайте интегральную и предельную ошибки прогноза (для =0,05), определите доверительный интервал прогноза (; ), а также диапазон верхней и нижней границ доверительного интервала (), оценивая точность выполненного прогноза.

Решение

1.Для построения графика расположим территории по возрастанию значений фактора . См. табл.2. Если график строится в табличном процессоре EXCEL, то в исходной таблице фактор должен находиться на первом месте, а результат - на втором. Из графика может быть сделан вывод о возможной форме связи оборота розничной торговли (Y) с общей суммой доходов населения (X). В этом случае для описания зависимости следует построить несколько моделей разного вида и на основе оценочных характеристик выбрать оптимальную форму модели.

корреляция регрессия функция связь уравнение

Таблица № 2.

Территории Северо-Западного федерального округа

Общая сумма доходов населения за год, млрд. руб.

Оборот розничной торговли за год, млрд. руб.

А

1.Псковская обл.

11,6

7,3

2.Новгородская обл.

14,8

9,3

3.Калининградская обл.

19,0

14,0

4.Респ. Карелия

19,1

9,4

5.Ленинградская обл.

26,2

15,6

6.Вологодская обл.

27,5

12,1

7.Архангельская обл.

30,0

16,3

8.Респ. Коми

37,3

16,7

9.Мурманская обл.

39,5

20,5

Итого

225,0

121,2

Средняя

25,0

13,47

9,120

4,036

Дисперсия, D

83,182

16,289

2.Обычно моделирование начинается в построения уравнения прямой:, отражающей линейную форму зависимости результата Y от фактора X.

3.Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка Д, Да0 и Да1. Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X. См. табл.3.

Расчётная таблица № 3

А

1

2

3

4

5

6

7

8

1

11,6

7,3

134,6

84,7

8,1

-0,8

0,6

5,9

2

14,8

9,3

219,0

137,6

9,4

-0,1

0,0

0,7

3

19,0

14,0

361,0

266,0

11,1

2,9

8,4

21,5

4

19,1

9,4

364,8

179,5

11,1

-1,7

2,9

12,6

5

26,2

15,6

686,4

408,7

13,9

1,7

2,9

12,6

6

27,5

12,1

756,3

332,8

14,5

-2,4

5,7

17,8

7

30,0

16,3

900,0

489,0

15,5

0,8

0,6

5,9

8

37,3

16,7

1391,3

622,9

18,4

-1,7

2,9

12,6

9

39,5

20,5

1560,3

809,8

19,3

1,2

1,4

8,9

Итого

225,0

121,2

6373,6

3331,0

121,2

0,0

25,4

98,5

Средняя

25,0

13,5

--

--

--

--

--

10,9

Сигма

9,12

4,04

--

--

--

--

--

--

Дисперсия, D

83,18

16,29

--

--

--

--

--

--

Д=

6737,76

--

--

--

--

--

--

--

Да0=

23012,4

3,415

--

--

--

--

--

Да1=

2708,91

0,402

--

--

--

--

--

3.Расчёт определителя системы выполним по формуле:

9*6373,6 - 225,0*225,0 = 6737,76;

Расчёт определителя свободного члена уравнения выполним по формуле:

121,2*6373,6 - 3331,0*225,0 = 23012,4.

Расчёт определителя коэффициента регрессии выполним по формуле:

9*3331,0 - 121,2*225,0 = 2708,91.

4.Расчёт параметров уравнения регрессии даёт следующие результаты:

; .

В конечном счёте, получаем теоретическое уравнение регрессии следующего вида:

В уравнении коэффициент регрессии а1 = 0,402 означает, что при увеличении доходов населения на 1 тыс. руб. (от своей средней) объём розничного товарооборота возрастёт на 0,402 млрд. руб. (от своей средней).

Свободный член уравнения а0 = 3,415 оценивает влияние прочих факторов, оказывающих воздействие на объём розничного товарооборота.

5.Относительную оценку силы связи даёт общий (средний) коэффициент эластичности:

В нашем случае, когда рассматривается линейная зависимость, расчётная формула преобразуется к виду:

Это означает, что при изменении общей суммы доходов населения на 1% от своей средней оборот розничной торговли увеличивается на 0,744 процента от своей средней.

6.Для оценки тесноты связи рассчитаем линейный коэффициент парной корреляции:

Коэффициент корреляции, равный 0,9075, показывает, что выявлена весьма тесная зависимость между общей суммой доходов населения за год и оборотом розничной торговли за год. Коэффициент детерминации, равный 0,824, устанавливает, что вариация оборота розничной торговли на 82,4% из 100% предопределена вариацией общей суммы доходов населения; роль прочих факторов, влияющих на розничный товарооборот, определяется в 17,6%, что является сравнительно небольшой величиной.

7.Для оценки статистической надёжности выявленной зависимости дохода от доли занятых рассчитаем фактическое значение F-критерия Фишера - Fфактич. и сравним его с табличным значением - Fтабл. По результатам сравнения примем решения по нулевой гипотезе , то есть, либо примем, либо отклоним её с вероятностью допустить ошибку, которая не превысит 5% (или с уровнем значимости б=0,05).

В нашем случае, ; где -число факторов в уравнении; - число изучаемых объектов. Фактическое значение критерия показывает, что факторная вариация результата почти в 33 раза больше остаточной вариации, сформировавшейся под влиянием случайных причин. Очевидно, что подобные различия не могут быть случайными, а являются результатом систематического взаимодействия оборота розничной торговли и общей суммы доходов населения. Для обоснованного вывода сравним полученный результат с табличным значением критерия: при степенях свободы d.f.1=k=1 и d.f.2=n-k-1=9-1-1=7 и уровне значимости б=0,05.

Значения представлены в таблице «Значения F-критерия Фишера для уровня значимости 0,05 (или 0,01)». См. приложение 1 данных «Методических указаний…».

В силу того, что , нулевую гипотезу о статистической незначимости выявленной зависимости оборота розничной торговли от общей суммы доходов населения и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.

8.Определим теоретические значения результата Yтеор. Для этого в полученное уравнение последовательно подставим фактические значения фактора X и выполним расчёт.

Например, . См. гр. 5 расчётной таблицы. По парам значений Yтеор. и Xфакт. строится теоретическая линия регрессии, которая пересечётся с эмпирической регрессией в нескольких точках. См. график 1.

График 1

9.Оценку качества модели дадим с помощью скорректированной средней ошибки аппроксимации:

.

В нашем случае, скорректированная ошибка аппроксимации составляет 10,2%. Она указывает на невысокое качество построенной линейной модели и ограничивает её использование для выполнения точных прогнозных расчётов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения ).

10.Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции в линейную введём новую переменную , которая линейно связана с результатом. Следовательно, для определения параметров модели будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка. См. расчётную таблицу №4.

Расчётная таблица № 4

А

1

2

3

4

5

6

7

8

9

1

11,6

2,451

7,3

6,007

17,892

7,0

0,3

0,1

2,2

2

14,8

2,695

9,3

7,261

25,060

9,3

0,0

0,0

0,0

3

19,0

2,944

14,0

8,670

41,222

11,6

2,4

5,8

17,8

4

19,1

2,950

9,4

8,701

27,727

11,6

-2,2

4,8

16,3

5

26,2

3,266

15,6

10,665

50,946

14,6

1,0

1,0

7,4

6

27,5

3,314

12,1

10,984

40,102

15,0

-2,9

8,4

21,5

7

30,0

3,401

16,3

11,568

55,440

15,8

0,5

0,3

3,7

8

37,3

3,619

16,7

13,097

60,437

17,9

-1,2

1,4

8,9

9

39,5

3,676

20,5

13,515

75,364

18,4

2,1

4,4

15,6

Итого

28,316

121,2

90,468

394,190

121,2

0,0

26,2

93,4

Средняя

3,146

13,5

--

--

--

--

2,9

10,4

Сигма

0,391

4,04

Дисперсия, D

0,153

16,29

Расчёт определителей второго порядка даёт следующие результаты:

; ; .

Отсюда получаем параметры уравнения:

Полученное уравнение имеет вид:.

Оценочные показатели позволяют сделать вывод, что линейно-логарифмическая функция описывает изучаемую связь хуже, чем линейная модель: оценка тесноты выявленной связи с=0,9066 (сравните с 0,9075), скорректированная средняя ошибка аппроксимации здесь выше и составляет 10,4%, то есть возможности использования для прогноза данной модели более ограничены.

Таким образом, можно придти к выводу, что по сравнению с линейной моделью данное уравнение менее пригодно для описания изучаемой связи.

11.Выполним расчёт параметров уравнения параболы второго порядка. В этом случае используются определители третьего порядка,расчёт которых выполняется по стандартным формулам и требует особого внимания и точности. См. расчётную таблицу 5.

По материалам табл. 5 выполним расчёт четырёх определителей третьего порядка по следующим формулам:

Д = n*Уx2*Уx4 + Уx*Уx3*Уx2 + Уx*Уx3*Уx2 - Уx2*Уx2*Уx2 - Уx*Уx*Уx4 - Уx3*Уx3*n = = 331.854.860,7;

Дa0 = Уy*Уx2*Уx4 + Уx*Уx3*У(y*x2)+ У(y*x)*Уx3*Уx2 - У(y*x2)*Уx2*Уx2 - У(y*x)*Уx*Уx4 - Уx3*Уx3*Уy = 751.979.368,8

Дa1 = n*У(y*x)*Уx4 + Уy*Уx3*Уx2 + Уx*У(y*x2)*Уx2 - Уx2*У(y*x)* Уx2 - Уx*Уy* Уx4 -

-- У(y*x2)*Уx3*n = 167.288.933,1

Дa2 = n*Уx2*У(y*x2) + Уx*Уyx*Уx2 + Уx*Уx3*Уy - Уx2*Уx2*Уy - Уx*Уx*У(y*x2) -
- Уx3*У(y*x)*n = - 656.926,8
В результате получаем следующие значения параметров уравнения параболы:
; ;
Уравнение имеет следующий вид: . Для него показатель детерминации составляет 82,7%, Fфактич.= 14,3, а ошибка аппроксимации 10,6%.
Как видим, по сравнению с линейной функцией построить уравнения параболы гораздо сложнее, а изучаемую зависимость она описывает почти с той же точностью, хотя надёжность уравнения параболы значительно ниже (для линейной модели Fфактич.= 32,8, а для параболы Fфактич.= 14,3). Поэтому в дальнейшем анализе парабола второго порядка использоваться не будет.

Расчётная таблица № 5

А

1

2

3

4

5

6

7

8

9

10

11

1

11,6

7,3

84,7

134,56

1560,90

18106,39

982,3

7,8

-0,5

0,3

4,1

2

14,8

9,3

137,6

219,04

3241,79

47978,52

2037,1

9,3

0,0

0,0

0,0

3

19

14,0

266,0

361,00

6859,00

130321,00

5054,0

11,1

2,9

8,4

21,5

4

19,1

9,4

179,5

364,81

6967,87

133086,34

3429,2

11,2

-1,8

3,2

13,3

5

26,2

15,6

408,7

686,44

17984,73

471199,87

10708,5

14,1

1,5

2,3

11,1

6

27,5

12,1

332,8

756,25

20796,88

571914,06

9150,6

14,6

-2,5

6,3

18,5

7

30

16,3

489,0

900,00

27000,00

810000,00

14670,0

15,6

0,7

0,5

5,2

8

37,3

16,7

622,9

1391,29

51895,12

1935687,86

23234,5

18,3

-1,6

2,6

11,9

9

39,5

20,5

809,8

1560,25

61629,88

2434380,06

31985,1

19,1

1,4

2,0

10,4

Итого

225

121,2

3331,0

6373,64

197936,15

6552674,11

101251,3

121,2

0,0

25,6

95,6

Средняя

25,0

13,5

--

--

--

--

--

--

--

2,8

10,6

Сигма

9,12

4,04

D

83,18

16,29

12.Проведём расчёт параметров степенной функции, которому также предшествует процедура линеаризации исходных переменных. В данном случае, выполняется логарифмирование обеих частей уравнения, в результате которого получаем уравнение, в котором линейно связаны значения логарифмов фактора и результата. Исходное уравнение после логарифмирования приобретает следующий вид: . Порядок расчёта приведён в табл.6.

Расчётная таблица № 6

А

1

2

3

4

5

6

7

8

9

10

1

11,6

7,3

2,4510

1,9879

4,8723

4,8723

2,0330

0,0020

7,6

2,2

2

14,8

9,3

2,6946

2,2300

6,0091

6,0091

2,2148

0,0002

9,2

0,7

3

19,0

14,0

2,9444

2,6391

7,7705

7,7705

2,4011

0,0566

11,0

22,2

4

19,1

9,4

2,9497

2,2407

6,6094

6,6094

2,4050

0,0270

11,1

12,6

5

26,2

15,6

3,2658

2,7473

8,9719

8,9719

2,6408

0,0113

14,0

11,9

6

27,5

12,1

3,3142

2,4932

8,2629

8,2629

2,6770

0,0338

14,5

17,8

7

30,0

16,3

3,4012

2,7912

9,4933

9,4933

2,7419

0,0024

15,5

5,9

8

37,3

16,7

3,6190

2,8154

10,1889

10,1889

2,9044

0,0079

18,3

11,9

9

39,5

20,5

3,6763

3,0204

11,1040

11,1040

2,9471

0,0054

19,1

10,4

Итого

121,2

28,3162

22,9651

73,2824

73,2824

22,9651

0,1467

120,3

95,6

Средняя

13,5

3,1462

2,5517

--

--

--

--

--

10,6

Сигма

0,3914

0,3187

D

0,1532

0,1016

В результате расчёта получены следующие значения определителей второго порядка:

12,4075;

2,5371;

9,25642.

Параметры степенной функции составляют:

; .

Уравнение имеет вид: lnY=ln a0 + a1*ln X = 0,2045 + 0,7460*X , а после процедуры потенцирования уравнение приобретает окончательный вид:

или .

Полученное уравнение несколько лучше описывает изучаемую зависимость и более надёжно по сравнению с линейной моделью. Степенная модель имеет детерминацию на уровне 84,0% (против 82,4% по линейной модели), Fфакт.=36,6 (против 33,1 для линейной модели) и ошибку аппроксимации на уровне 10,6% (сравните с 10,9% для уравнения прямой).

Очевидно, что преимущества степенной модели по сравнению с линейной не столь значительны, но её построение заметно сложнее и требует значительно больших усилий. Поэтому окончательный выбор, в данном конкретном случае, сделаем в пользу модели, которая является более простой при построении, анализе и использовании, то есть в пользу линейной модели:

Заключительным этапом решения данной задачи является выполнение прогноза и его оценка.

Если предположить, что прогнозное значение общей суммы доходов населения, например, Новгородской области, (см. табл.2 строка 2) возрастёт с 14,8 млрд. руб.на 5,7% и составит 15,6 млрд. руб., то есть Xпрогнозн.= 14,8*1,057=15,6, тогда прогнозное значение результата сформируется на уровне:Yпрогнозн. =3,415+0,402*15,6=9,7 (млрд. руб.). То есть, прирост фактора на 5,7% приводит к приросту результата на 4,2 процента (.

Рассчитаем интегральную ошибку прогноза - , которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии-и ошибки прогноза положения регрессии -. То есть, .

В нашем случае

,

где k- число факторов в уравнении, которое в данной задаче равно 1. Тогда (млрд. руб.).

Ошибка положения регрессии составит:

=

= = = 0,914 (млрд. руб.).

Интегральная ошибка прогноза составит: = = 2,1 (млрд. руб.).

Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,365*2,1 = 5,011 ? 5,0 (млрд. руб.). Табличное значение t-критерия для уровня значимости б=0,05 и для степеней свободы n-k-1 = 9-1-1=7 составит 2,365. (См. табл. приложения 2). Следовательно, ошибка большинства реализаций прогноза не превысит млрд. руб.

Это означает, что фактическая реализация прогноза будет находиться в доверительном интервале . Верхняя граница доверительного интервала составит

= 9,7 + 5,0 = 14,7(млрд. руб.).

Нижняя граница доверительного интервала составит: = 9,7 - 5,0 = 4,7(млрд. руб.).

Относительная величина различий значений верхней и нижней границ составит: = раза. Это означает, что верхняя граница в 3,12 раза больше нижней границы, то есть точность выполненного прогноза весьма невелика, но его надёжность на уровне 95% оценивается как высокая. Причиной небольшой точности прогноза является повышенная ошибка аппроксимации. Здесь её значение выходит за границу 5-7% из-за недостаточно высокой типичности линейной регрессии, которая проявляется в присутствии единиц с высокой индивидуальной ошибкой. Если удалить территории с предельно высокой ошибкой (например, Калининградскую область с ), тогда качество линейной модели и точность прогноза по ней заметно повысятся.

Задача № 2.

Выполняется изучение социально-экономических процессов в регионах Южного федерального округа РФ по статистическим показателям за 2000 год.

- Оборот розничной торговли, млрд. руб.;

- Инвестиции 2000 года в основной капитал, млрд. руб.;

- Средний возраст занятых в экономике, лет;

- Среднегодовая численность населения, млн. чел.

Требуется изучить влияние указанных факторов на оборот розничной торговли.

Предварительный анализ исходных данных по 12 территориям выявил наличие двух территорию (Краснодарский край и Ростовская обл.) с аномальными значениями признаков. Эти территории должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.

При обработке исходных данных получены следующие значения:

а) - линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -у:

N=10.

1

0,7938

0,2916

0,8891

0,7938

1

0,2994

0,6693

0,2916

0,2994

1

0,0113

0,8891

0,6693

0,0113

1

Средняя

8,878

5,549

38,79

1,160

8,7838

5,1612

1,0483

0,90107

б) - коэффициентов частной корреляции

1

0,4726

0,5169

0,8511

0,4726

1

0,0521

-0,0793

0,5169

0,0521

1

-0,5598

0,8511

-0,0793

-0,5598

1

Задание:

1. По значениям линейных коэффициентов парной и частной корреляции выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Произведите окончательный отбор информативных факторов во множественную регрессионную модель.

2. Выполните расчёт бета коэффициентов () и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов () силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.

3. По значениям -коэффициентов рассчитайте параметры уравнения в естественной форме (то есть a1, a2, и a0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности -.

4. Оцените тесноту множественной связи с помощью R и R2, а статистическую значимость уравнения и тесноту выявленной связи - через F-критерий Фишера (для уровня значимости =0,05).

5. Рассчитайте прогнозное значение результата , предполагая, что прогнозные значения факторов ()составят 101,3 процента от их среднего уровня.

6. Основные выводы оформите аналитической запиской.

Решение.

Представленные в условии задачи значения линейных коэффициентов парной корреляции позволяют установить, что оборот розничной торговли -Y более тесно связан со среднегодовой численностью населения- () и с инвестициями 2000 года в основной капитал - (); наименее тесно результат Y связан со средним возрастом занятых в экономике -. Поэтому, в силу небольшой информативности фактора,, предполагаем, что его можно исключить из дальнейшего анализа. Проверим наши предположения с помощью анализа матрицы коэффициентов частной корреляции. Очевидно, что наиболее тесная связь результата Y со среднегодовой численностью населения () и примерно одинаково тесно связан результат с инвестициями () и со средним возрастом занятых (). Поэтому для уточнения окончательного вывода выполним расчёт серии коэффициентов частной корреляции Y с двумя возможными комбинациями факторных признаков: для Y с и с , а также для Y c и .

Расчёты частных коэффициентов корреляции выполним по следующим формулам:

Как видим, факторы и , действительно, тесно связаны с результатом, а между собой практически не взаимодействуют.

Расчёт аналогичных показателей по следующей паре факторов приводит к иным результатам:

В данном случае, межфакторное взаимодействие оценивается как заметное ( ) и по абсолютной величине сравнимо с теснотой связи розничного товарооборота со средним возрастом. Таким образом, первая из рассмотренных пар факторных признаков (X1 и X3 ) в большей мере отвечает требованиям, предъявляемым МНК к исходным данным и, в частности, к отсутствию межфакторного взаимодействия. Указанные обстоятельства позволяют использовать X1 и X3 в качестве информативных факторов уравнения множественной регрессии.

При построении двухфакторной регрессионной модели воспользуемся для упрощения расчётов методом стандартизованных переменных. В этом случае, исходное уравнение приобретает вид: . Выполним расчёт -коэффициентов, используя значения известных по условию линейных коэффициентов парной корреляции.

;

;

В результате получено уравнение в стандартизованном масштабе:

Параметры данного уравнения представляют собой относительные оценки силы влияния каждого из факторов на результат. При увеличении инвестиций в основной капитал на одну сигму - (от своей средней) оборот розничной торговли увеличится на 0,360 своей сигмы (); с увеличением среднегодовой численности населения на результат увеличится на 0,648.Сравнивая -коэффициентов, определяем, какой из признаков влияет на результат сильнее, а какой - слабее. В данном случае, увеличение розничного товарооборота происходит, прежде всего, под влиянием увеличения численности населения и в меньшей степени - в результате увеличения инвестиций в экономику региона.

Используя значения -коэффициентов, можно рассчитать параметров уравнения в естественной форме:

.

В конечном счёте, имеем уравнение: . По значениям коэффициентов регрессии можно судить о том, на какую абсолютную величину изменяется результат при изменении каждого фактора на единицу (от своей средней).

С увеличением инвестиций в экономику на 1 млрд. руб. розничный товарооборот увеличивается на 0,613 млрд. руб., с увеличением численности населения на 1 млн. чел. розничный товарооборот возрастает на 6,318 млрд. руб.

Но так как признаки-факторы измеряются в разных единицах, сравнивать значения их коэффициентов регрессии не следует. Точную оценку силы связи факторов с результатом дают коэффициенты эластичности и в - коэффициенты.

Для сравнительной оценки силы связи выполним расчёт средних коэффициентов эластичности. С их помощью можно определить, на сколько процентов изменяется результат при изменении фактора на 1% (от своего среднего значения). В нашем случае, расчёт показал, что влияние численности населения на розничный товарооборот оказалось более сильным по сравнению с влиянием инвестиций в экономику: с ростом численности населения на 1% розничный товарооборот увеличивается на 0,825%, а при увеличении инвестиций на 1% розничный товарооборот возрастает на 0,383%. Различия в силе влияния весьма значительны: первый фактор влияет на результат в два с лишним раза сильнее, чем второй. Поэтому регулирование величины розничного товарооборота через численность населения будет более результативным, чем через объём инвестиций в экономику региона.

; .

6. Тесноту выявленной зависимости розничного товарооборота от инвестиций в экономику региона и от численности населения оценивают множественный коэффициент корреляции и детерминации. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и в - коэффициентов: В нашем случае 2-х факторной зависимости расчёт строится следующим образом:

.

Как показали расчёты, установлена весьма тесная зависимость розничного товарооборота от численности населения и размеров инвестиций в экономику региона. Это означает, что 86,2% вариации розничного товарооборота определены вариацией данных факторов. Оставшиеся 13,8% вариации результата сформировались под влиянием прочих причин, роль которых незначительна.

7. Оценка статистической значимости или надёжности установленной формы зависимости, её параметров, оценок её силы и тесноты является важным этапом анализа результатов. Для выполнения оценки формулируется нулевая гипотеза, которая рассматривает предположение о случайной природе полученных результатов. То есть,

.

Для проверки выдвинутой нулевой гипотезы используется F-критерия Фишера. Его фактическое значение определяется, исходя из соотношения факторной и останочной дисперсий и их степеней свободы: d.f.1=k и d.f.2=n-k-1; где: n -число изучаемых единиц; k - число ограничений, которые накладываются на исходные данные при расчёте данного показателя. Здесь k равно числу факторов уравнения, то есть k=2.

.

В нашем случае, когда рассматривается зависимость результата от двух факторов, расчёт выглядит следующим образом:

.

Фактическое значение критерия показывает, что детерминация, сформированная под воздействием двух изучаемых факторов, почти в 22 раза больше, чем детерминация, связанная с действием прочих причин. Очевидно, что подобное соотношение случайно сформироваться не может, а является результатом влияния существенных, систематических факторов.

Для принятия обоснованного решения Fфактич. сравнивается с Fтабличн., которое формируется случайно и зависит степеней свободы факторной (d.f.1 = k) и остаточной (d.f.2 = n-k-1) дисперсий, а также от уровня значимости б=0,05. В нашем примере, где d.f.1=k= 2 и d.f.2=n-k-1 = 10-2-1=7 при б=0,05 Fтабл = 4,74. См. табл. приложения 1. В силу того, что Fфактич =21,9> Fтабл. = 4,74, можно с высокой степенью надёжности отклонить нулевую гипотезу, а в качестве альтернативы - согласиться с утверждением, что проверяемые параметры множественной регрессионной модели неслучайны, что коэффициенты уравнения и показатели тесноты связи не являются случайными величинами.

8. Техническая часть прогнозных расчётов по уравнению множественной регрессии сравнительно проста. Достаточно определить прогнозные значения каждого факторного признака , подставить их в уравнение и выполнить с ними расчёт прогнозного значения результата - . При этом следует помнить, что требования к точности и надёжности прогноза предъявляют к используемой модели повышенные требования. В нашем случае, прогнозное значение каждого из факторов, то есть и , получено на основе средней величины:

. .

После подстановки в уравнение получаем следующий результат:

(млрд. руб.)

Если инвестиции в экономику региона возрастут до 5,621 млрд. руб., а численность населения составит 1,175 млн. чел, тогда следует ожидать, что розничный товарооборот возрастёт до 9,02 млрд. руб., то есть увеличится на 1,6% от своего среднего уровня.

Задача 3.

Для проверки рабочих гипотез (№1 и №2) о связи социально-экономических показателей в регионе используется статистическая информация за 2000 год по территориям Центрального федерального округа.

- Стоимость валового регионального продукта, млрд. руб.;

Y2 - Среднемесячная начисленная заработная плата 1-го занятого в экономике, тыс. руб.;

- Инвестиции текущего, 2000, года в основной капитал, млрд. руб.;

- Среднегодовая стоимость основных фондов в экономике, млрд. руб.;

-.Доля занятых в экономике в общей численности населения, %.

Рабочие гипотезы:

Предварительный анализ исходных данных по 18 территориям выявил наличие трёх территорий (г. Москва, Московская обл., Воронежская обл.) с аномальными значениями признаков. Эти единицы должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.

При обработке исходных данных получены следующие значения линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -у:

N=15.

Для проверки рабочей гипотезы №1. Для проверки рабочей гипотезы №2.

Y1

Y2

Y1

1

0,8171

0,8498

Y2

1

0,6043

0,6712

0,8171

1

0,7823

0,6043

1

0,2519

0,8498

0,7823

1

0,6712

0,2519

1

Средняя

23,77

5,600

115,833

Средняя

1,5533

23,77

44,23

7,2743

2,4666

30,0303

0,2201

7,2743

2,1146

Задание:

1. Составьте систему уравнений в соответствии с выдвинутыми рабочими гипотезами.

2. Определите вид уравнений и системы.

3. На основе приведённых в условии значений матриц коэффициентов парной корреляции, средних и средних квадратических отклонений:

- определите бета коэффициенты () и постройте уравнения множественной регрессии в стандартизованном масштабе;

- дайте сравнительную оценку силы влияния факторов на результат;

- рассчитайте параметры a1, a2 и a0 уравнений множественной регрессии в естественной форме;

- с помощью коэффициентов парной корреляции и - коэффициентов рассчитайте для каждого уравнения линейный коэффициент множественной корреляции (R) и детерминации (R2);

- цените с помощью F-критерия Фишера статистическую надёжность выявленных связей.

4. Выводы оформите краткой аналитической запиской.

Решение:

1.В соответствии с выдвинутыми рабочими гипотезами о связи признаков составим систему уравнений. Коэффициенты при эндогенных переменных обозначим через b , коэффициенты при экзогенных переменных - через a. Каждый коэффициент имеет двойную индексацию: первый индекс - номер уравнения, второй - индивидуальный номер признака. Тогда:

2. Особенность данной системы в том, что в первом уравнении факторы представлены перечнем традиционных экзогенных переменных, значения которых формируются вне данной системы уравнений. Во втором уравнении в состав факторов входит эндогенная переменная Y1, значения которой формируются в условиях данной системы, а именно, в предыдущем уравнении. Системы уравнений, в которых переменные первоначально формируются как результаты, а в дальнейшем выступают в качестве факторов, называются рекурсивными. Именно с подобной системой уравнений имеем дело в данной задаче.

3. Выполним расчёт -коэффициентов и построим уравнения множественной регрессии в стандартизованном масштабе. Для уравнения №1:

По полученным результатам построено уравнение в стандартизованном виде:

По данным первого уравнения сделаем вывод, что инвестиции текущего года в основной капитал () влияют на стоимость валового регионального продукта () слабее, чем среднегодовая стоимость основных фондов в экономике (), т.к. .

Второе уравнение можно построить на основе следующих результатов:

Второе уравнение в стандартизованной форме имеет вид:

.

Из второго уравнения очевидно, что на уровень среднемесячной заработной палаты более сильное влияние оказывает доля занятых, и менее сильное - стоимость ВРП.

Расчёт параметров уравнения регрессии в естественной форме даёт следующие результаты:

= 23,77 - 1,15*5,6 - 0,13*115,833 = 2,27.

По полученным результатам построено уравнение №1 в естественной форме:

.

Параметры уравнения №2 рассчитываются аналогичным образом. Но главная отличительная особенность их расчёта в том, что в качестве одного из факторов выступают не фактические значения , а его теоретические значения , полученные расчётным путём при подстановке в уравнение №1 фактических значений факторов и .

Указанным способом рассчитаны параметры рекурсивного уравнения:

;

;

.

По полученным результатам построено уравнение №2 в естественной форме:

.

Представим результаты построения уравнений в виде рекурсивной системы:

Значения коэффициентов регрессии каждого из уравнений могут быть использованы для анализа силы влияния каждого из факторов на результат. Но для сравнительной оценки силы влияния факторов необходимо использовать либо значения -коэффициентов, либо средних коэффициентов эластичности - , , и .

5. Для каждого из уравнений системы рассчитаем показатели корреляции и детерминации.

.

.

В первом уравнении факторы и объясняют 76,7% вариации стоимости валового регионального продукта, а 23,3% его вариации определяется влиянием прочих факторов.

Во втором уравнении переменные и объясняют 65,3% изменений заработной платы, а 34,7% изменений заработной платы зависят от прочих факторов. Обе регрессионные модели выявляют тесную связь результата с переменными факторного комплекса.

6.Оценим существенность выявленных зависимостей. Для этого сформулируем нулевые гипотезы о статистической незначимости построенных моделей и выявленных ими зависимостей:

и .

Для проверки нулевых гипотез используется F-критерий Фишера. Выполняется расчёт его фактических значений, которые сравниваются с табличными значениями критерия. По результата сравнения принимается решение относительно нулевой гипотезы.

В нашей задаче:

;

Табличные значения F-критерия формируются под влиянием случайных причин и зависят от трёх условий: а) от числа степеней свободы факторной дисперсии - , где k - число факторных переменных в модели; б) от числа степеней свободы остаточной дисперсии - , где n - число изучаемых объектов; в) от уровня значимости , который определяет вероятность допустить ошибку, принимая решение по нулевой гипотезе. Как правило, значение берут на уровне 5% (=0,05), но при высоких требованиях к точности принимаемых решений уровень значимости составляет 1% (=0,01) или 0,1% ((=0,001).

Значения представлены в таблице «Значения F-критерия Фишера». (См. приложение 1 данных «Методических указаний…»).

В рассматриваемой задаче для и =0,05 соствляет 3,88. В силу того, что нулевую гипотезу о статистической незначимости характеристик уравнения №1 следует отклонить, то есть . Аналогичное решение принимается и относительно второй нулевой гипотезы, т.к. . То есть, .Отклоняя нулевую гипотезу, допустимо (с определённой степенью условности) принять одну из альтернативных гипотез. В частности, может быть рассмотрена и принята гипотеза о том, что параметры моделей величины неслучайные, то есть они формируются под воздействием представленных в моделях факторов, влияние которых на результат носит систематический, устойчивый характер. Это означает, что полученные результаты могут быть использованы в аналитической работе и в прогнозных расчётах среднемесячной заработной платы и стоимости валового регионального продукта, которые основаны не только на влиянии , но и на влиянии эндогенной переменной Рекурсивные модели связей предоставляют возможность подобного анализа и прогноза.

Задача 4

Предлагается изучить взаимосвязи социально-экономических характеристик региона за период.

инвестиции текущего года в экономику региона, млрд. руб.;

стоимость продукции промышленности и АПК в текущем году, млрд. руб.;

оборот розничной торговли в текущем году, млрд. руб.;

инвестиции прошлого года в экономику региона, млрд. руб.;

среднегодовая стоимость основных фондов в экономике региона, млрд. руб.;

среднегодовая численность занятых в экономике региона, млн. чел.

Приводится система рабочих гипотез, которые необходимо проверить.

Задание

1.Используя рабочие гипотезы, постройте систему уравнений, определите их вид и проведите их идентификацию;

2.Укажите, при каких условиях может быть найдено решение каждого из уравнений и системы в целом. Дайте обоснование возможных вариантов подобных решений и аргументируйте выбор оптимального варианта рабочих гипотез;

3.Опишите методы, с помощью которых будет найдено решение уравнений (косвенный МНК, двухшаговый МНК).

Решение.

1.В соответствии с предложенными рабочими гипотезами построим график, отображающий связи каждой из представленных переменных с другими переменными. Отличительной особенностью уравнений системы является наличие прямых и обратных зависимостей между переменными Y1, Y2 и Y3. Указанная особенность характерна для так называемых структурных уравнений. В состав структурных уравнений входят: а) эндогенные переменные (Yj), значения которых формируется в условиях данной системы признаков и их взаимозависимостей и б) экзогенные переменные (xm), значения которых формируются вне данной системы признаков и условий, но сами экзогенные переменные участвуют во взаимосвязях данной системы и оказывают влияние на эндогенные переменные. Коэффициенты при эндогенных переменных обозначаются через , коэффициенты при экзогенных переменных обозначаются через , где i-число изучаемых объектов; m -число экзогенных переменных, которые обычно обозначают через x; j - число эндогенных переменных, обычно обозначаемых через Y. Таким образом, в каждом уравнении системы каждый коэффициент при переменной имеет двойную индексацию: 1) - номер эндогенной переменной, расположенной в левой части уравнения и выступающей в качестве результата; 2) - номер переменной, находящейся в правой части уравнения и выступающей в качестве фактора.

В нашей задаче система уравнений для описания выдвигаемых рабочих гипотез будет иметь следующий вид:

2.Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос - имеют ли решения каждое из уравнений и система в целом. Воспользуемся счётным правилом, по которому в каждом уравнении системы необходимо сравнить HY - число эндогенных переменных в данном уравнении и Dx - число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня. Для удобства анализа представим результаты в таблице.

Результаты идентификации структурных уравнений и всей системы.

Номер уравнения

Число эндогенных переменных в уравнении, HY

Число экзогенных переменных из общего их списка, отсутствующих в уравнении, Dx

Сравнение параметров HY и Dx + 1

Решение об идентификации уравнения

1

2

0

2 > 0+1

Неидентифицировано

2

2

1

2 = 1+1

Точно идентифицировано

3

3

3

3 < 3+1

Сверхидентифицировано

Вся система уравнений в целом

Неидентифицирована

3. В том случае, когда хотя бы одно из уравнений не имеет решения, система в целом также не имеет решения. Если подобный результат нас не устраивает, необходимо внести коррективы в исходные рабочие гипотезы и отредактировать их таким образом, чтобы идентификация была возможна.

4. Теоретический анализ содержания взаимосвязи, отражённой в уравнении № 1, позволяет рассмотреть варианты возможной корректировки. Во-первых, из правой части может быть исключёна одна из экзогенных переменных. Скорее всего, ею может оказаться x3 - среднегодовая численность занятых в экономике региона, (млн. чел.), так как по своему экономическому смыслу она менее тесно связана с инвестициями, чем инвестиции прошлого года () и среднегодовая стоимость основных фондов в экономике региона, ().

Во-вторых, возможна корректировка путём исключения из правой части уравнения эндогенной переменной Y2 - стоимость продукции промышленности и АПК в текущем году, млрд. руб. Но в этом случае, уравнение перестанет быть структурным, следовательно, изучить обратную связь Y1 и Y2 будет невозможно. По этой причине подобная корректировка является нецелесообразной.

При корректировке рабочей гипотезы путём удаления x3 уравнение №1 становится точно идентифицированным, а вся система - сверхидентифицированной.

5. Для поиска решений сверхидентифицированной системы уравнений применяются: а) косвенный метод наименьших квадратов (КМНК) для решения точно идентифицированных уравнений и б) двухшаговый МНК (ДМНК) для поиска решений сверхидентифицированных уравнений.

Задача № 5.

По территориям Центрального федерального округа России имеются данные за 2000 год о следующих показателях:

Y1 -валовой региональный продукт, млрд. руб.

Y2 - розничный товарооборот, млрд. руб.

- основные фонды в экономике, млрд. руб.

-инвестиции в основной капитал, млрд. руб.

- численность занятых в экономике, млн. чел.

- среднедушевые расходы населения за месяц, тыс. руб.

Изучения связи социально-экономических показателей предполагает проверку следующих рабочих гипотез:

Для их проверки выполнена обработка фактических данных и получена следующая система приведённых уравнений:

Задание:

1.Построить систему структурных уравнений и провести её идентификацию;

2.Проанализировать результаты решения приведённых уравнений;

3.Используя результаты построения приведённых уравнений, рассчитать параметры структурных уравнений (косвенный МНК); проанализируйте результаты;

4.Укажите, каким образом можно применить полученные результаты для прогнозирования эндогенных переменных и

Решение

Построение системы структурных уравнений выполняется в соответствии с рабочими гипотезами:

В соответствии со счётным правилом оба уравнения и система в целом являются точно идентифицированными и это означает, что они имеют единственное решение, которое может быть получено косвенным МНК (КМНК).


Подобные документы

  • Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.

    контрольная работа [157,9 K], добавлен 06.08.2010

  • Исследование зависимости часового заработка одного рабочего от общего стажа работы после окончания учебы с помощью построения уравнения парной линейной регрессии. Вычисление описательных статистик. Построение поля корреляции и гипотезы о форме связи.

    контрольная работа [226,6 K], добавлен 11.08.2015

  • Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.

    контрольная работа [136,3 K], добавлен 25.09.2014

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Расчет параметров уравнения линейной регрессии, экономическая интерпретация ее коэффициента. Проверка равенства математического ожидания уровней ряда остатков нулю. Построение степенной модели парной регрессии. Вариация объема выпуска продукции.

    контрольная работа [771,6 K], добавлен 28.04.2016

  • Построение гипотезы о форме связи денежных доходов на душу населения с потребительскими расходами в Уральском и Западно-Сибирском регионах РФ. Расчет параметров уравнений парной регрессии, оценка их качества с помощью средней ошибки аппроксимации.

    контрольная работа [4,5 M], добавлен 05.11.2014

  • Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

    контрольная работа [141,3 K], добавлен 05.05.2010

  • Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.

    лабораторная работа [100,5 K], добавлен 02.06.2014

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Определение параметров уравнения линейной регрессии. Экономическая интерпретация коэффициента регрессии. Вычисление остатков, расчет остаточной суммы квадратов. Оценка дисперсии остатков и построение графика остатков. Проверка выполнения предпосылок МНК.

    контрольная работа [1,4 M], добавлен 25.06.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.