Расчет аномальных показателей территории на примере Краснодарского края

Расположение территории Краснодарского края по возрастанию фактора X и формулирование рабочей гипотезы о возможной связи X и Y. Построение поля корреляции и формулировка гипотезы о форме и направлении связи. Расчет линии регрессии и ошибки аппроксимации.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 17.04.2012
Размер файла 347,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

КОНТРОЛЬНАЯ РАБОТА

на тему: «Расчет аномальных показателей территории на примере Краснодарского края»

Задача №1.

По территориям Южного федерального округа РФ приводятся данные за 2000 год:

Таблица №1. Исходные данные для расчета.

Территории федерального округа

Валовой региональный продукт, млрд. руб., Y

Инвестиции в основной капитал, млрд. руб., X

1. Респ. Адыгея

5,1

1,264

2. Респ. Дагестан

13,0

3,344

3. Респ. Ингушетия

2,0

0,930

4. Кабардино-Балкарская Респ.

10,5

2,382

5. Респ. Калмыкия

2,1

6,689

6. Карачаево-Черкесская Респ.

4,3

0,610

7. Респ. Северная Осетия - Алания

7,6

1,600

8. Краснодарский край1)

109,1

52,773

9. Ставропольский край

43,4

15,104

10. Астраханская обл.

18,9

12,633

11. Волгоградская обл.

50,0

10,936

12. Ростовская обл.

69,0

20,014

Итого,

225,9

75,506

Средняя

20,536

6,8642

Среднее квадратическое отклонение,

21,852

6,4427

Дисперсия, D

477,50

41,5079

Предварительный анализ исходных данных выявил наличие одной территории (Краснодарский край) с аномальными значениями признаков. Эта территория исключена из дальнейшего анализа. Значения показателей в итоговых строках приведены без учёта указанной аномальной единицы.

Задание:

1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.

2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.

3. Рассчитайте параметры а1 и а0 парной линейной функции и линейно-логарифмической функции

4. Оцените тесноту связи с помощью показателей корреляции (ryx и зylnx) и детерминации (r2yx и з2ylnx), проанализируйте их значения.

5. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости =0,05.

6. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.

7. По лучшему уравнению регрессии рассчитайте теоретические значения результата (), по ним постройте теоретическую линию регрессии и определите среднюю ошибку аппроксимации - е'ср., оцените её величину.

8. Рассчитайте прогнозное значение результата, если прогнозное значение фактора () составит 1,062 от среднего уровня ().

9. Рассчитайте интегральную и предельную ошибки прогноза (для =0,05), определите доверительный интервал прогноза (; ), а также диапазон верхней и нижней границ доверительного интервала (), оценив точность выполненного прогноза.

Решение:

1. Для построения графика расположим территории по возрастанию значений фактора . Данные представим следующем виде:

территория регрессия корреляция аппроксимация

Таблица №2. Исходные данные, расположенные по возрастанию значения фактора .

Территории федерального округа

Инвестиции в основной капитал, млрд. руб.

Валовой региональный продукт, млрд. руб.

X

Y

6

0,61

4,3

3

0,93

2

1

1,264

5,1

7

1,6

7,6

4

2,382

10,5

2

3,344

13

5

6,689

2,1

11

10,936

50

10

12,633

18,9

9

15,104

43,4

12

20,014

69

Итого,

75,506

225,9

Средняя

6,8642

20,536

Среднее квадратическое отклонение,

6,4427

21,852

Дисперсия, D

41,5079

477,50

2. Построим поле корреляции:

3. Начнем моделирование с построения уравнения прямой:, отражающей линейную форму зависимости результата Y от фактора X.

Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка Д, Да0 и Да1 Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X. См. табл.3.

Таблица №3. Разработочная таблица.

Yфа

А

1

2

3

4

5

6

7

8

6

0,61

4,3

0,3721

2,623

1,674041

2,625959

6,895661

0,127871013

3

0,93

2

0,8649

1,86

2,639146

-0,63915

0,408508

0,031123201

1

1,264

5,1

1,597696

6,4464

3,646475

1,453525

2,112736

0,070779383

7

1,6

7,6

2,56

12,16

4,659835

2,940165

8,64457

0,143171259

4

2,382

10,5

5,673924

25,011

7,018311

3,481689

12,12216

0,169540766

2

3,344

13

11,18234

43,472

9,919658

3,080342

9,488505

0,149997162

5

6,689

2,1

44,74272

14,0469

20,00802

-17,908

320,6973

0,872030745

11

10,936

50

119,5961

546,8

32,81678

17,18322

295,2631

0,836736525

10

12,633

18,9

159,5927

238,7637

37,93485

-19,0349

362,3256

0,926901643

9

15,104

43,4

228,1308

655,5136

45,38727

-1,98727

3,949257

0,096770244

12

20,014

69

400,5602

1380,966

60,19561

8,804394

77,51735

0,428729725

Итого

75,506

225,9

974,8735

2927,663

225,9

4,97E-14

1099,425

385,3651666

Средняя

6,8642

20,536

--

--

--

--

35,03319697

у

6,4427

21,852

--

--

--

--

--

Дисперсия, D

41,5079

477,5

--

--

--

--

--

Д=

5022,452

Да0=

-832,174

-0,16569

Да1=

15147,48

3,015954

Расчёт определителя системы выполним по формуле:

9*974,8735 - 75,506*75,506 = 5022,452;

Расчёт определителя свободного члена уравнения выполним по формуле:

225,9*974,8735 - 2927,663*75,506 = -832,174.

Расчёт определителя коэффициента регрессии выполним по формуле:

9*2927,663 - 225,9*75,506 = 15147,48.

Полученное уравнение имеет вид . В уравнении коэффициент регрессии означает, что при увеличении инвестиций в основной капитал на 1 млрд. руб. валовой региональный продукт увеличится на 3,016 млрд. руб. Свободный член оценивает влияние прочих факторов, оказывающих воздействие на объем валового регионального продукта.

Относительную оценку силы связи даёт общий (средний) коэффициент эластичности:

В нашем случае, когда рассматривается линейная зависимость, расчётная формула преобразуется к виду:

Это означает, что при изменении инвестиций в основной капитал на 1% от своей средней валовой региональный продукт увеличивается на 1,008 процента от своей средней

1. Определим коэффициенты для логарифмической функции . Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции в линейную введём новую переменную , которая линейно связана с результатом. Следовательно, для определения параметров модели будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка. См. таблицу №4.

Таблица №4. Разработочная таблица.

А

1

2

3

4

5

6

7

8

6

0,61

-0,4943

4,3

0,2443

-2,1255

-6,3197

10,6197

0,5171

3

0,93

-0,0726

2

0,0053

-0,1451

-0,1491

2,1491

0,1046

1

1,264

0,2343

5,1

0,0549

1,1948

4,3407

0,7593

0,0369

7

1,6

0,47

7,6

0,2209

3,572

7,7898

-0,1898

0,0092

4

2,382

0,8679

10,5

0,7533

9,1134

13,6123

-3,1123

0,1515

2

3,344

1,2071

13

1,4573

15,6932

18,5758

-5,5758

0,2715

5

6,689

1,9005

2,1

3,6118

3,9909

28,72

-26,62

1,2963

11

10,936

2,3921

50

5,7219

119,603

35,9129

14,0871

0,6859

10

12,633

2,5363

18,9

6,4329

47,9363

38,0236

-19,1236

0,9312

9

15,104

2,7149

43,4

7,371

117,8292

40,6375

2,7624

0,1345

12

20,014

2,9964

69

8,9786

206,7538

44,7559

24,244

1,1806

Итого

75,506

14,7528

225,9

34,8521

523,4161

225,9

0

5,3196

Средняя

6,8642

1,3412

20,536

--

--

--

--

48,3598

у

6,4427

1,17033

21,852

--

--

--

--

--

Диспер-сия, D

41,5079

1,3697

477,5

--

--

--

--

--

Д=

165,7301

Да0=

151,275

0,912779

Да1=

2424,93

14,6318

Расчёт определителя системы выполним по формуле:

;

Расчёт определителя свободного члена уравнения выполним по формуле:

Расчёт определителя коэффициента регрессии выполним по формуле:

Полученное уравнение имеет вид

4. Определим показатели корреляции и детерминации:

для линейной зависимости:

Коэффициент корреляции, равный 0,8892, показывает, что выявлена весьма тесная зависимость между инвестициями в основной капитал и валовым региональным продуктом. Коэффициент детерминации, равный 0,790684, устанавливает, что вариация валового регионального продукта на 79,1% из 100% предопределена вариацией инвестиций в основной капитал; роль прочих факторов, влияющих на валовой региональный продукт, определяется в 20,9%, что является сравнительно небольшой величиной.

для логарифмической функции:

5. Оценим надежность уравнений в целом через F-критерий Фишера для уровня значимости =0,05.

для линейной зависимости:

Для оценки статистической надёжности выявленной зависимости валового продукта от инвестиций рассчитаем фактическое значение F-критерия Фишера - Fфактич. и сравним его с табличным значением - Fтабл. По результатам сравнения примем решения по нулевой гипотезе , то есть, либо примем, либо отклоним её с вероятностью допустить ошибку, которая не превысит 5% (или с уровнем значимости б=0,05).

Фактическое значение критерия показывает, что факторная вариация результата почти в 34 раза больше остаточной вариации, сформировавшейся под влиянием случайных причин. Очевидно, что подобные различия не могут быть случайными, а являются результатом систематического взаимодействия валового регионального продукта и инвестиций в основной капитал. Для обоснованного вывода сравним полученный результат с табличным значением критерия: при степенях свободы d.f.1=k-1=1 и d.f.2=n-k=11-2=9 и уровне значимости б=0,05.

В силу того, что , нулевую гипотезу о статистической незначимости выявленной зависимости валового регионального продукта от инвестиций в основной капитал и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.

для логарифмической функции:

6. Полученные показатели позволяют сделать вывод о том, что линейно-логарифмическая функция описывает изучаемую связь хуже, чем линейная модель, т.к. сравнивая оценки тесноты выявленной связи, получим: >.Таким образом, по сравнению с линейной моделью линейно-логарифмическая модель менее пригодна для описания изучаемой связи.

7. По линейному уравнению регрессии рассчитаем теоретические значения результата (), например, . Результаты расчетов приведены в Таблице 3 и отображены на рис.2.

Рис. 2. Теоретическая линия регрессии и фактические значения.

Определим среднюю ошибку аппроксимации - е'

ср.

Результаты расчетов для линейной зависимости приведены в таблице №3, для линейно-логарифмической - в таблице №4.

Сравнивая полученные результаты, видно, что средняя ошибка аппроксимации для линейно-логарифмической зависимости больше, чем для линейной (48,35%>35,03%), что еще раз подтверждает правильность выбора модели. Тем не менее результат, полученный даже для линейной модели (35,03%) указывает на невысокое качество построенной модели и ограничивает ее использование для выполнения точных прогнозных расчетов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения ).

8. Заключительным этапом решения данной задачи является выполнение прогноза и его оценка.

Если предположить, что прогнозное значение инвестиций в основной капитал составит 1,062 от среднего уровня , то есть Xпрогнозн.= 6,8642*1,062=7,289, тогда прогнозное значение результата сформируется на уровне:Yпрогнозн. =-0,16569+3,015954*7,289=21,81995 (млрд. руб.). То есть, прирост фактора на 6,2% приводит к приросту результата на 6,25% процента (.

Рассчитаем интегральную ошибку прогноза - , которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии-и ошибки прогноза положения регрессии -. То есть, .

В нашем случае , где k- число факторов в уравнении, которое в данной задаче равно 1.

Ошибка положения регрессии составит: = = 0,0664 (млрд. руб.).

Интегральная ошибка прогноза составит: = =11,05272 (млрд. руб.).

Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,26*11,05272 = 24,97 ? 25 (млрд. руб.). Табличное значение t-критерия для уровня значимости б=0,05 и для степеней свободы n-k-1 = 11-1-1=9 составит 2,26. Следовательно, ошибка большинства реализаций прогноза не превысит млрд. руб.

В данном случае полученная ошибка больше, чем среднее значение, поэтому сложно говорить о какой-либо точности прогноза.

Причиной небольшой точности прогноза является повышенная ошибка аппроксимации из-за недостаточно высокой типичности линейной регрессии, которая проявляется в присутствии единиц с высокой индивидуальной ошибкой. Если удалить территории с предельно высокой ошибкой (например, Республика Калмыкия с ), тогда качество линейной модели и точность прогноза по ней заметно повысятся.

Задача №2

Проводится анализ значений социально-экономических показателей по территориям Северо-Западного федерального округа РФ за 2000 год.

Y - Валовой региональный продукт, млрд. руб.;

X1 - Инвестиции 2000 года в основной капитал, млрд. руб.;

X2 - Среднегодовая стоимость основных фондов в экономике, млрд. руб.;

X3 - Кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам, млрд. руб.

Требуется изучить влияние указанных факторов на стоимость валового регионального продукта.

Предварительный анализ исходных данных по 10 территориям выявил наличие одной территории (г. Санкт-Петербург) с аномальными значениями признаков. Эта единица должна быть исключена из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанной аномальной единицы.

При обработке исходных данных получены следующие значения:

А) - линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -у:

N=9.

Y

X1

X2

X3

Y

1

0,7677

0,8653

0,4237

X1

0,7677

1

0,8897

0,0157

X2

0,8653

0,8897

1

-0,0179

X3

0,4237

0,0157

-0,0179

1

Средняя

31,92

8,87

121,18

0,5683

у

14,61

5,198

48,19

0,6942

Б) - коэффициентов частной корреляции

Y

X1

X2

X3

Y

1

-0,1462

0,8737

0,8791

X1

-0,1462

1

0,5562

0,1612

X2

0,8737

0,5562

1

-0,7842

X3

0,8791

0,1612

-0,7842

1

Задание:

1. По значениям линейных коэффициентов парной и частной корреляции выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Проведите окончательный отбор информативных факторов во множественную регрессионную модель.

2. Выполните расчёт бета коэффициентов () и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов () силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.

3. По значениям -коэффициентов рассчитайте параметры уравнения в естественной форме (a1, a2 и a0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности -.

4. Оцените тесноту множественной связи с помощью R и R2, а статистическую значимость уравнения и тесноту выявленной связи - через F-критерий Фишера (для уровня значимости =0,05).

5. Рассчитайте прогнозное значение результата, предполагая, что прогнозные значения факторов составят 102,1 процента от их среднего уровня.

6. Основные выводы оформите аналитической запиской.

Решение:

1. Анализируя, таблицу линейных коэффициентов парной корреляции, можно заметить, что валовой региональный продукт Y наиболее тесно связан со среднегодовой стоимостью основных фондов - X2 (), немного меньше с инвестициями 2000 года в основной капитал - X1 () и менее всего связан с кредитами, предоставленными в 2000 году - X3 ().Анализируя, таблицу коэффициентов частной корреляции, можно заметить, что валовой региональный продукт Y примерно одинаково тесно связан с X2 и X3 (,) и наименее тесно связан с X1 (). Для выбора информативных факторов проведем расчет серии коэффициентов частной корреляции для трех возможных комбинаций факторных признаков. Пример расчета приведем только для одной пары факторных признаков, при этом остальные расчеты проведем аналогичным образом с подстановкой соответствующих каждой паре значений коэффициентов.

Полученные результаты позволяют отбросить пару факторов X1 и X2, поскольку они тесно связаны между собой, а связь X1 с результатом незначительна. Выбрать между парами факторов X2 и X3 и X1 и X3 достаточно сложно, т.к. обе пары показывают как достаточно сильную связь с результатом, так и между собой. Руководствуясь требованиями МНК к исходным данным и, в частности, к отсутствию межфакторного взаимодействия, можно было выбрать пару X1 и X3, т.к. они меньше связаны между собой, но пара X2 и X3 показывает большую связь с результатом. Для большей надежности проведем построение двухфакторной регрессионной модели для обеих пар признаков.

2. При построении двухфакторной регрессионной модели воспользуемся для упрощения расчётов методом стандартизованных переменных. В этом случае исходное уравнение приобретает вид: или . Выполним расчёт -коэффициентов, используя значения известных по условию линейных коэффициентов парной корреляции.

;

;

Для второй пары факторов расчеты будем проводить аналогичным образом, например:

В результате получено уравнение в стандартизованном масштабе:

и

3. Используя полученные коэффициенты, рассчитаем параметры уравнения в естественной форме:

.

В конечном счёте, имеем уравнение:

.

.

В конечном счёте, имеем уравнение: .

4. Для сравнительной оценки силы связи выполним расчёт средних коэффициентов эластичности.

;

;

5. Тесноту выявленной зависимости оценивают множественный коэффициент корреляции и детерминации. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и в - коэффициентов. В нашем случае 2-х факторной зависимости расчёт строится следующим образом:

.,

.,

По полученным данным видно, что факторы Х2 и Х3 теснее связаны с Y (0,97>0,87), они же описывают большей процент вариации валового регионального продукта ( 94% ). Поэтому в дальнейшем будем рассматривать именно эту пару факторов.

6. Оценка статистической значимости или надёжности установленной формы зависимости, её параметров, оценок её силы и тесноты является важным этапом анализа результатов. Для выполнения оценки формулируется нулевая гипотеза, которая рассматривает предположение о случайной природе полученных результатов. То есть, .

Для проверки выдвинутой нулевой гипотезы используется F-критерия Фишера. Его фактическое значение определяется, исходя из соотношения факторной и остаточной дисперсий и их степеней свободы: d.f.1=k и d.f.2=n-k-1; где: n -число изучаемых единиц; k - число ограничений, которые накладываются на исходные данные при расчёте данного показателя. Здесь k равно числу факторов уравнения, то есть k=2.

В нашем случае расчёт выглядит следующим образом:

.

Для принятия обоснованного решения Fфактич. сравнивается с Fтабличн., которое формируется случайно и зависит степеней свободы факторной (d.f.1 = k) и остаточной (d.f.2 = n-k-1) дисперсий, а также от уровня значимости б=0,05. В нашем примере, где d.f.1=k= 2 и d.f.2=n-k-1 = 9-2-1=6 при б=0,05 Fтабл = 4,74. В силу того, что Fфактич =48,5> Fтабл. = 5,14, можно с высокой степенью надёжности отклонить нулевую гипотезу, а в качестве альтернативы - согласиться с утверждением, что проверяемые параметры множественной регрессионной модели неслучайны, что коэффициенты уравнения и показатели тесноты связи не являются случайными величинами.

7. Техническая часть прогнозных расчётов по уравнению множественной регрессии сравнительно проста. Достаточно определить прогнозные значения каждого факторного признака , подставить их в уравнение и выполнить с ними расчёт прогнозного значения результата - . При этом следует помнить, что требования к точности и надёжности прогноза предъявляют к используемой модели повышенные требования. В нашем случае, прогнозное значение каждого из факторов, то есть и , получено на основе средней величины:

. .

После подстановки в уравнение получаем следующий результат:

(млрд. руб.)

8. Аналитическая записка

- Полученные коэффициенты корреляции и детерминации , показывают, что выявлена достаточно тесная связь между Х2, Х3 и Y, кроме того они описывают 94%вариации валового регионального продукта.

- Уравнение, полученное в стандартизированном масштабе показывает, что при увеличении среднегодовой стоимости основных фондов в экономике на одну сигму от своей средней валовой региональный продукт увеличится на 0,873 от своей сигмы , с увеличением кредитов на результат увеличится на 0,439.

- Сравнивая -коэффициенты, определяем, какой из признаков влияет на результат сильнее, а какой - слабее. В данном случае,, то есть увеличение валового регионального продукта происходит в основном под влиянием среднегодовой стоимости основных фондов в экономике, кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам оказывают влияние в меньшей степени.

- Уравнение, полученное в естественной форме показывает, что с увеличением среднегодовой стоимости основных фондов в экономике на 1 млрд. руб. валовой региональные продукт увеличится на 0,265 млрд. руб., с увеличением кредитов, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам на 1 млрд. руб. валовой региональный продукт увеличится на 9,246 млрд. руб.

Полученные коэффициенты эластичности ; показывают, что с ростом среднегодовой стоимости основных фондов в экономике на 1% валовой региональный продукт увеличиться на 1, 005% и с ростом кредитов, предоставленных в 2000 году предприятиям, организациям, банкам и физическим лицам, на 1% валовой региональный продукт увеличится на 0, 165%. Таким образом, регулирование валового регионального продукта через среднегодовую стоимость основных фондов в экономике будет более результативным, чем через кредиты.

- Полученной значение критерия Фишера позволяет сделать вывод о том, что детерминация, сформированная под воздействием двух изучаемых факторов, почти в 48,5 раз больше, чем детерминация, связанная с действием прочих причин. Очевидно, что подобное соотношение случайно сформироваться не может и является результатом влияния существенных, систематических факторов.

- Выполненный прогноз показывает, что если среднегодовая стоимость основных фондов в экономике возрастет до 123,7248 млрд. руб., а кредит, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам до 0,58023, тогда следует ожидать, что валовой региональный продукт возрастет на 2,46% от своего среднего уровня.

Задача №3.

Для проверки рабочих гипотез (№1 и №2) о связи социально-экономических показателей в регионе используется статистическая информация за 2000 год по территориям Центрального федерального округа.

Y1- среднегодовая стоимость основных фондов в экономике, млрд. руб.;

Y2 - стоимость валового регионального продукта, млрд. руб.;

X1 - инвестиции 2000 года в основной капитал, млрд. руб.;

X2 - кредиты, предоставленные предприятиям, организациям, банкам и физическим лицам;

X3 - среднегодовая численность занятых в экономике, млн. чел.

Предварительный анализ исходных данных по 18 территориям выявил наличие трёх территорий (г. Москва, Московская обл., Воронежская обл.) с аномальными значениями признаков. Эти единицы должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.

При обработке исходных данных получены следующие значения линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -у:

N=15.

Для проверки рабочей гипотезы №1. Для проверки рабочей гипотезы №2.

Y1

X1

X2

Y2

X3

Y1

1

0,7823

0,7093

Y2

1

0,8474

0,7337

X1

0,7823

1

0,6107

0,8474

1

0,7061

X2

0,7093

0,6107

1

X3

0,7337

0,7061

1

Средняя

115,83

5,600

0,2701

Средняя

23,77

115,83

0,5697

30,0303

2,4666

0,2036

7,2743

30,0303

0,1160

Задание:

1. Составьте систему уравнений в соответствии с выдвинутыми рабочими гипотезами.

2. Определите вид уравнений и системы.

3. На основе приведённых в условии значений матриц коэффициентов парной корреляции, средних и средних квадратических отклонений:

- определите бета коэффициенты () и постройте уравнения множественной регрессии в стандартизованном масштабе;

- дайте сравнительную оценку силы влияния факторов на результат;

- рассчитайте параметры a1, a2 и a0 уравнений множественной регрессии в естественной форме;

- с помощью коэффициентов парной корреляции и коэффициентов рассчитайте для каждого уравнения линейный коэффициент множественной корреляции (R) и детерминации (R2);

- оцените с помощью F-критерия Фишера статистическую надёжность выявленных связей.

4. Выводы оформите краткой аналитической запиской.

Решение:

1. В соответствии с выдвинутыми рабочими гипотезами о связи признаков составим систему уравнений. Коэффициенты при эндогенных переменных обозначим через b , коэффициенты при экзогенных переменных - через a. Каждый коэффициент имеет двойную индексацию: первый индекс - номер уравнения, второй - индивидуальный номер признака. Тогда:

2. Особенность данной системы в том, что в первом уравнении факторы представлены перечнем традиционных экзогенных переменных, значения которых формируются вне данной системы уравнений. Во втором уравнении в состав факторов входит эндогенная переменная Y1, значения которой формируются в условиях данной системы., а именно, в предыдущем уравнении. Системы уравнений, в которых переменные первоначально формируются как результаты, а в дальнейшем выступают в качестве факторов, называются рекурсивными. Именно с подобной системой уравнений имеем дело в данной задаче.

3. Выполним расчёт -коэффициентов и построим уравнения множественной регрессии в стандартизованном масштабе. Для уравнения №1:

По полученным результатам построено уравнение в стандартизованном виде:

Второе уравнение можно построить на основе следующих результатов:

Второе уравнение в стандартизованной форме имеет вид: .

4. Расчёт параметров уравнения регрессии в естественной форме даёт следующие результаты:

= 115,83-6,7788*5,6 - 54,4661*0,2701 = 63,1577.

По полученным результатам построено уравнение №1 в естественной форме: .

Параметры уравнения №2 рассчитываются аналогичным образом. Но главная отличительная особенность их расчёта в том, что в качестве одного из факторов выступают не фактические значения , а его теоретические значения , полученные расчётным путём при подстановке в уравнение №1 фактических значений факторов и .

Указанным способом рассчитаны параметры рекурсивного уравнения:

; ;

.

По полученным результатам построено уравнение №2 в естественной форме:.

Представим результаты построения уравнений в виде рекурсивной системы:

Значения коэффициентов регрессии каждого из уравнений могут быть использованы для анализа силы влияния каждого из факторов на результат. Но для сравнительной оценки силы влияния факторов необходимо использовать либо значения -коэффициентов, либо средних коэффициентов эластичности - , , и .

5. Для каждого из уравнений системы рассчитаем показатели корреляции и детерминации.

.

.

6. Оценим существенность выявленных зависимостей. Для этого сформулируем нулевые гипотезы о статистической незначимости построенных моделей и выявленных ими зависимостей:

и .

Для проверки нулевых гипотез используется F-критерий Фишера. Выполняется расчёт его фактических значений, которые сравниваются с табличными значениями критерия. По результата сравнения принимается решение относительно нулевой гипотезы.

В нашей задаче:

;

В рассматриваемой задаче для и =0,05 составляет 3,88. В силу того, что нулевую гипотезу о статистической незначимости характеристик уравнения №1 следует отклонить, то есть . Аналогичное решение принимается и относительно второй нулевой гипотезы, т.к. . То есть, .Отклоняя нулевую гипотезу, допустимо (с определённой степенью условности) принять одну из альтернативных гипотез. В частности, может быть рассмотрена и принята гипотеза о том, что параметры моделей неслучайны, то есть формируются под воздействием представленных в моделях факторов, влияние которых на результат носит систематический, устойчивый характер. Это означает, что полученные результаты могут быть использованы в аналитической работе и в прогнозных расчётах среднегодовой стоимости основных фондов в экономике и стоимость валового регионального продукта, которые основаны не только на влиянии , но и на влиянии эндогенной переменной Рекурсивные модели связей предоставляют возможность подобного анализа и прогноза.

7. Аналитическая записка:

- Получены уравнения в стандартизированном виде и . По данным первого уравнения сделаем вывод, что инвестиции 2000 года в основной капитал () влияют на среднегодовую стоимость основных фондов в экономике () сильнее, чем кредиты, предоставленные предприятиям, организациям, банкам и физическим лицам (), т.к. . Из второго уравнения, очевидно, что на стоимость валового регионального продукта более сильное влияние среднегодовая стоимость основных фондов в экономике, и менее сильное - среднегодовая численность занятых в экономике.

- Получены коэффициенты корреляции и детерминации и , которые показываю, что факторы и объясняют 69,7% среднегодовой стоимости основных фондов в экономике, а 30,03% его вариации определяется влиянием прочих факторов, переменные и объясняют 75,4% изменений стоимости валового регионального продукта, а 24,6% изменений стоимости валового регионального продукта зависят от прочих факторов. Обе регрессионные модели выявляют тесную связь результата с переменными факторного комплекса.

Задача № 4.

Предлагается изучить взаимозависимость социально-экономических показателей региона.

Y1 -инвестиции текущего года в экономику региона, млрд. руб.;

Y2 -среднегодовая стоимость основных фондов в экономике региона, млрд. руб.;

Y3 -стоимость валового регионального продукта региона, млрд. руб.

X1 -инвестиции прошлого года в экономику региона, млрд. руб.

X2 -темп роста производства промышленной продукции в регионе, %

X3 -среднегодовая численность занятых в экономике региона, млн. чел.

При этом, сформулированы следующие исходные рабочие гипотезы:

Задание:

1. На основе рабочих гипотез постройте систему структурных уравнений и проведите их идентификацию;

2. Укажите, при каких условиях может быть найдено решение каждого из уравнений и системы в целом. Дайте обоснование возможных вариантов подобных решений и аргументируйте выбор оптимального варианта рабочих гипотез;

3. Опишите методы, с помощью которых будет найдено решение уравнений (косвенный МНК, двухшаговый МНК).

Решение:

1. Отличительной особенностью уравнений системы является наличие прямых и обратных зависимостей между переменными Y1, Y2 и Y3. Указанная особенность характерна для так называемых структурных уравнений. В состав структурных уравнений входят: а) эндогенные переменные (Yj), значения которых формируется в условиях данной системы признаков и их взаимозависимостей и б) экзогенные переменные (xm), значения которых формируются вне данной системы признаков и условий, но сами экзогенные переменные участвуют во взаимосвязях данной системы и оказывают влияние на эндогенные переменные. Коэффициенты при эндогенных переменных обозначаются через , коэффициенты при экзогенных переменных обозначаются через , где i-число изучаемых объектов; m -число экзогенных переменных, которые обычно обозначают через x; j - число эндогенных переменных, обычно обозначаемых через Y. Таким образом, в каждом уравнении системы каждый коэффициент при переменной имеет двойную индексацию: 1) - номер эндогенной переменной, расположенной в левой части уравнения и выступающей в качестве результата; 2) - номер переменной, находящейся в правой части уравнения и выступающей в качестве фактора.

В нашей задаче система уравнений для описания выдвигаемые рабочие гипотезы будет иметь следующий вид:

2. Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос - имеют ли решения каждое из уравнений и система в целом. Воспользуемся счётным правилом, по которому в каждом уравнении системы необходимо сравнить число эндогенных переменных в данном уравнении - YH и число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня - . Для удобства анализа представим результаты в таблице.

Результаты идентификации структурных уравнений и всей системы.

Номер уравнения

Число эндогенных переменных в уравнении, H

Число экзогенных переменных из общего их списка, отсутствующих в уравнении, D

Сравнение параметров H и D+1

Решение об идентификации уравнения

1

2

1

2=2

Точно идентифицировано

2

2

2

2<3

Сверхидентифицировано

3

3

0

3>1

Неидентифицировано

Вся система уравнений в целом

Неидентифицирована

3. В том случае, когда хотя бы одно из уравнений не имеет решения, система в целом также не имеет решения. Если подобный результат нас не устраивает, необходимо внести коррективы в исходные рабочие гипотезы и отредактировать их таким образом, чтобы идентификация была возможна.

Теоретический анализ содержания взаимосвязи, отражённой в уравнении №3, позволяет рассмотреть варианты возможной корректировки. Во-первых, из правой части может быть исключёна одна из экзогенных переменных (инвестиции прошлого года в экономику региона или темп роста производства промышленной продукции в регионе)

Во-вторых, возможна корректировка путём исключения из правой части уравнения одой эндогенной переменной, но в этом случае, уравнение перестанет быть структурным. По этой причине подобная корректировка является нецелесообразной.

При корректировке рабочей гипотезы путём удаления экзогенной переменной №3 становится точно идентифицированным, а вся система - сверхидентифицированной.

4. Для поиска решений сверхидентифицированной системы уравнений применяются: а) косвенный метод наименьших квадратов (КМНК) для решения точно идентифицированных уравнений и б) двухшаговый МНК (ДМНК) для поиска решений сверхидентифицированных уравнений.

5. Использование косвенного метода наименьших квадратов заключается просто в составлении приведенной формы для определения численных значений параметров каждого уравнения посредством обычного МНК. После этого с помощью алгебраических преобразований переходят опять к исходной структурной форме модели и получают тем самым численные оценки структурных параметров.

5. Двухшаговый метод наименьших квадратов (ДМНК) использует следующую центральную идею: на основе приведенной формы модели получают для сверхидентифицируемого уравнения теоретические значения эндогенных переменных, содержащихся в правой части уравнения. Затем они подставляются вместо фактических значений и применяют обычный МНК к структурной форме сверхидентифицируемого уравнения. В свою очередь, сверхидентифицируемая структурная модель может быть двух типов: либо все уравнения системы сверхидентифицируемы, либо же система содержит наряду со сверхидентифицируемыми и точно идентифицируемые уравнения. В первом случае, если все уравнения системы сверхидентифицируемые, для оценки структурных коэффициентов каждого уравнения используется ДМНК. Если в системе есть точно идентифицируемые уравнения, то структурные коэффициенты по ним находятся из системы приведенных уравнений.

Задача №5.

По 18 территориям Центрального федерального округа России имеются данные за 2000 год о следующих показателях:

Y1 - розничный товарооборот, млрд. руб.

Y2- сумма доходов населения за год, млрд. руб.

X1- численность занятых в экономике, млн. чел.

X2 - основные фонды в экономике, млрд. руб.

X3 - объём промышленной продукции, млрд. руб.

Изучения связи социально-экономических показателей предполагает проверку следующих рабочих гипотез:

Для их проверки выполнена обработка фактических данных и получена следующая система приведённых уравнений:

Задание:

1. Постройте систему структурных уравнений и проведите её идентификацию;

2. Проанализируйте результаты решения приведённых уравнений;

3. Используя результаты построения приведённых уравнений, рассчитайте параметры структурных уравнений (косвенный МНК); проанализируйте результаты;

4. Укажите, каким образом можно применить полученные результаты для прогнозирования эндогенных переменных и

Решение:

1. Построение системы структурных уравнений выполняется в соответствии с рабочими гипотезами:

2. В соответствии со счётным правилом оба уравнения и система в целом являются точно идентифицированными и это означает, что они имеют единственное решение, которое может быть получено косвенным МНК (КМНК).

Номер уравнения

Число эндогенных переменных в уравнении, H

Число экзогенных переменных из общего их списка, отсутствующих в уравнении, D

Сравнение параметров H и D+1

Решение об идентификации уравнения

1

2

1

2 = 1+1

точно идентифицировано

2

2

1

2 = 1+1

точно идентифицировано

Система уравнений в целом

точно идентифицирована

3. Процедура КМНК состоит в том, чтобы путём преобразования результатов решения приведённых уравнений получить искомые структурные уравнения. Используемый приём подстановок обеспечивает получение точных результатов только в том случае, если выполняемые преобразования точны и безошибочны. Чтобы получить первое структурное уравнение из первого приведённого необходимо отсутствующий в структурном уравнении признак выразить через Y2, используя результаты второго приведённого уравнения.

То есть: .

После подстановки значения в первое приведённое уравнение и преобразования подобных членов, получаем следующий результат:

Как видим, полученный результат соответствует исходной рабочей гипотезе. Анализ показывает, что стоимость розничного товарооборота находится в прямой зависимости от численности занятых в экономике, основных фондов в экономике и от суммы доходов населения за год. Указанные переменные объясняют 79,1% вариации результата, а характеристики установленной зависимости являются статистически значимыми и надёжными.

Так как для .

Следовательно, есть основания для отклонения нулевой гипотезы о случайной природе выявленной зависимости.

Аналогично выполняем преобразования для определения параметров второго структурного уравнения. Выразим отсутствующий в уравнении через Y1, используя результаты построения первого приведённого уравнения. То есть: . После подстановки значения во второе приведённое уравнение и преобразования подобных членов получаем следующий результат:

Уравнение описывает линейную зависимость суммы доходов населения за год от розничного товарооборота, от основных фондов в экономике, от объёма промышленной продукции. Данный перечень переменных объясняет 89,7% вариации суммы доходов населения за год, а соотношение позволяет отклонить нулевую гипотезу о случайной природе выявленной зависимости.

4. Для выполнения прогнозных расчётов и наиболее простым является вариант, по которому прогнозные значения экзогенных переменных () подставляются в приведённые уравнения. Точность и надёжность прогнозов в этом случае зависит от качества приведённых моделей и от того, как сильно отличаются прогнозные значения экзогенных переменных от их средних значений.

Задача 6.

Имеются сведения о среднем размере земельного участка крестьянского (фермерского) хозяйства - Qt, га, за период с 1993 по 2001 год (на конец года) в Российской Федерации.

Годы

Qt

Годы

Qt

1993

43

1998

48

1994

42

1999

51

1995

43

2000

55

1996

43

2001

58

1997

44

Задание:

1. Постройте график фактических уровней динамического ряда - Qt

2. Рассчитайте параметры уравнения линейного тренда

3. Оцените полученные результаты:

- с помощью показателей тесноты связи ( r и r2 );

- значимость модели тренда (F-критерий);

- качество модели через корректированную среднюю ошибку аппроксимации , а также через коэффициент автокорреляции отклонений от тренда -

4. Выполните прогноз до 2003 года, рассчитайте ошибки прогноза, доверительный интервал прогноза и оцените его точность.

5. Проанализируйте полученные результаты.

Решение:

Общее представление о форме основной тенденции в уровнях ряда даёт график их фактических значений. Для его построения введём дополнительные обозначения для комплекса систематически действующих факторов, который по традиции обозначим через t и условно отождествим с течением времени. Для обозначения комплекса систематических факторов используются числа натурального ряда: 1, 2, 3, …,n. См. табл. 1.

В первую очередь выявим линейный тренд и проверим его статистическую надёжность и качество. Параметры рассчитаем с помощью определителей второго порядка, используя формулы, рассмотренные нами в зад. 1. Получены значения определителей:; ; . С их помощью получены следующие параметры линейного тренда: ; , уравнение имеет вид:. Уравнение детерминирует 92,2% вариации численности занятых (; ).

Таблица 1.

Годы

Qt

T

t2

Qt*t

Qt расч.

DQt

(dQt)2

А

1

2

3

4

5

6

7

8

1993

43

1

1

43

39,44

3,56

0,075035

1994

42

2

4

84

41,44

0,56

0,011803

1995

43

3

9

129

43,44

-0,44

0,009274

1996

43

4

16

172

45,44

-2,44

0,051429

1997

44

5

25

220

47,44

-3,44

0,072506

1998

48

6

36

288

49,44

-1,44

0,030351

1999

51

7

49

357

51,44

-0,44

0,009274

2000

55

8

64

440

53,44

1,56

0,032881

2001

58

9

81

522

55,44

2,56

0,053958

Итого

427

45

285

2255

426,96

0,04

0

0,346511

Средняя

47,4444

5

--

--

--

--

--

3,8501

Сигма

5,59982

2,5819

--

--

--

--

--

--

Дисперсия, D

--

--

--

--

--

--

Средняя ошибка аппроксимации очень невелика (= 3,85%), что указывает на высокое качество модели тренда и возможность её использования для решения прогнозных задач. Фактическое значение F-критерия составило 39,823 и сравнение с 5,59 его табличного значения позволяет сделать вывод о высокой степени надёжности уравнения тренда.

Для дополнительной проверки качества тренда выполним расчёт коэффициента корреляции отклонений фактических уровней от рассчитанных по уравнению тренда. Если будет установлено отсутствие связи отклонений, это укажет на их случайную природу, то есть на то, что тренд выбран верно, что он полностью исключил основную тенденцию из фактических уровней ряда и что он сформировал случайный значения отклонений.

Выполним расчёт в табл.2. Поместим во второй графе фактические отклонения от тренда , для удобства расчёта обозначим их через Y. В соседней графе поместим эти же отклонения, но, сместив их относительно первой строки на один год вниз; обозначим их через и рассмотрим в качестве фактора X. Линейный коэффициент корреляции отклонений рассчитаем по формуле:

Используем значения определителей второго порядка для расчёта коэффициента регрессии с1, который отражает силу связи отклонений и . Получены следующие значения определителей:

Отсюда . При этом, коэффициент корреляции отклонений составит:

, то есть установлено отсутствие связи отклонений и тренд выбран верно.

Таблица 2

(Y)

(X)

3,56

--

--

--

1

0,56

3,56

1,9936

12,6736

2

-0,44

0,56

-0,2464

0,3136

3

-2,44

-0,44

1,0736

0,1936

4

-3,44

-2,44

8,3936

5,9536

5

-1,44

-3,44

4,9536

11,8336

6

-0,44

-1,44

0,6336

2,0736

7

1,56

-0,44

-0,6864

0,1936

8

2,56

1,56

3,9936

2,4336

Итого

-3,52

-2,52

20,1088

35,6688

Средняя

-0,44

-0,315

--

--

Сигма

1,870829

2,087912

--

--

Заканчиваем решение проведением прогноза.

га;

га;

В нашем случае , где k- число факторов в уравнении, которое в данной задаче равно 1.

Ошибка положения регрессии составит:

= = 0,4873 га.

Интегральная ошибка прогноза составит:

= =2,5038 га.

Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,37*2,5038 = 5,93 ? 6 (га). Табличное значение t-критерия для уровня значимости б=0,05 и для степеней свободы n-k-1 = 9-1-1=7 составит 2,37. Следовательно, ошибка большинства реализаций прогноза не превысит га.

Это означает, что фактическая реализация прогноза будет находиться в доверительном интервале . Верхняя граница доверительного интервала составит = 47,44 + 6,0 = 53,44(га). Нижняя граница доверительного интервала составит: = 47,44 - 6,0 = 41,44(га).

Относительная величина различий значений верхней и нижней границ составит: = раза. Это означает, что верхняя граница в 1,29 раза больше нижней границы, то есть точность выполненного прогноза достаточна, велика и его надёжность на уровне 95% оценивается как высокая.

Задача 7.

Данные о стоимости экспорта (St) и импорта (Kt) Индии, млрд. $, приводятся за 1990-1999 гг.

В уровнях рядов выявлены линейные тренды:

для экспорта - , а для импорта -

По указанным трендам произведено выравнивание каждого ряда, то есть, рассчитаны теоретические значения их уровней: и .

Годы

Экспорт (St)

Импорт (Kt)

Sфакт.

=

K факт..

1990

18,0

16,4

23,6

18,5

1991

17,7

18,7

20,4

21,4

1992

19,6

21,0

23,6

24,3

1993

21,6

23,3

22,8

27,2

1994

25,1

25,6

26,8

30,1

1995

30,8

27,9

34,5

33,0

1996

33,1

30,2

37,4

35,9

1997

34,2

32,5

41,0

38,8

1998

32,9

34,8

42,2

41,7

1999

36,3

37,1

44,9

44,6

Предварительная обработка исходной информации дала следующие результаты:

St

Kt

t

St

1

0,9725

0,9658

Kt

0,9725

1

0,9558

T

0,9658

0,9558

1

Итого

269,3

317,2

55

Средняя

26,93

31,72

5,5

6,926

8,795

2,872

Задание:

1. Для изучения связи рядов рассчитайте отклонения фактических значений каждого ряда от теоретических ( );

2. Для оценки тесноты связи рассчитайте: 1) линейный коэффициент парной корреляции отклонений от линии тренда: ; 2) уровней рядов: и 3) коэффициент частной корреляции уровней: ; поясните их значения, укажите причины различий значений парных коэффициентов корреляции (пп. 1 и 2) и схожести коэффициентов парной корреляции отклонений и частной корреляции уровней (пп.1 и 3);

3. Постройте уравнение множественной регрессии с участием временной составляющей:

4. Проанализируйте полученные результаты.

Решение:

1. Изучение связи рядов выполним двумя способами, сравним их результаты и выберем из них правильный. Для оценки тесноты связи рядов через величины отклонений от оптимального тренда рассчитаем значения отклонений: и (см. табл. 1)

Таблица 1.

Годы

1990

18

16,4

23,6

18,5

1,6

5,1

8,16

2,56

26,01

1991

17,7

18,7

20,4

21,4

-1

-1

1

1

1

1992

19,6

21

23,6

24,3

-1,4

-0,7

0,98

1,96

0,49

1993

21,6

23,3

22,8

27,2

-1,7

-4,4

7,48

2,89

19,36

1994

25,1

25,6

26,8

30,1

-0,5

-3,3

1,65

0,25

10,89

1995

30,8

27,9

34,5

33

2,9

1,5

4,35

8,41

2,25

1996

33,1

30,2

37,4

35,9

2,9

1,5

4,35

8,41

2,25

1997

34,2

32,5

41

38,8

1,7

2,2

3,74

2,89

4,84

1998

32,9

34,8

42,2

41,7

-1,9

0,5

-0,95

3,61

0,25

1999

36,3

37,1

44,9

44,6

-0,8

0,3

-0,24

0,64

0,09

Итого

269,3

317,2

1,8

1,7

30,52

32,62

67,43

Средняя

26,93

31,72

0,18

0,17

Сигма

6,926478

8,794521

1,7971

2,5911

D

47,9761

77,3436

3,2296

6,7141

Выполним расчёт коэффициента корреляции отклонений от трендов через коэффициент регрессии отклонений с1, и . Но для этого предварительно рассчитаем определители второго порядка по уравнению регрессии отклонений:

.

:

Вид уравнения будет следующим:. С изменением отклонений импорта от своего тренда на единицу отклонения экспорта от своего тренда изменятся в том же направлении на 0,103 часть своей единицы. В дальнейшем коэффициент с1 используется для расчёта показателей тесноты связи двух рядов отклонений:

;

Выявлена не тесная связь отклонений от трендов, которая означает, что на 32,6% вариация размеров отклонений по импорту детерминирует изменения по экспорту, а на 68,4% вариация размеров отклонений происходит под влиянием прочих факторов.

Второй вариант оценки связи двух рядов основан на традиционной оценке корреляции их уровней:

.

Данный подход к решению задачи предполагает традиционный расчёт определителей уравнения регрессии уровней, нахождение коэффициента регрессии а1 и далее с помощью и расчёт коэффициента корреляции. Информация для расчёта представлена в табл. 2.

Расчёт определителей дал следующие результаты:

Значения параметров регрессии: ; , а уравнение имеет вид: .

Коэффициенты тесноты связи уровней составят:; . Это значит, что в уровнях существует весьма тесная связь, при которой вариации импорта предопределяет 94,6% вариации экспорта.

Таблица 2.

Годы

1990

18

23,6

324

556,96

424,8

1991

17,7

20,4

313,29

416,16

361,08

1992

19,6

23,6

384,16

556,96

462,56

1993

21,6

22,8

466,56

519,84

492,48

1994

25,1

26,8

630,01

718,24

672,68

1995

30,8

34,5

948,64

1190,25

1062,6

1996

33,1

37,4

1095,61

1398,76

1237,94

1997

34,2

41

1169,64

1681

1402,2

1998

32,9

42,2

1082,41

1780,84

1388,38

1999

36,3

44,9

1317,69

2016,01

1629,87

Итого

269,3

317,2

7732,01

10835,02

9134,59

Средняя

26,93

31,72

Сигма

6,926478

8,794521

2. Однако, делать подобный вывод было бы глубоко ошибочно потому, что в уровнях и одного, и другого рядов выявлены устойчивые, статистически значимые линейные тренды. В подобных условиях выявленное взаимодействие уровней не является причинной зависимостью, а представляет собой ложную связь, вызванную наличием трендов схожей линейной формы. В силу того, что оба тренда сформированы под влиянием разного комплекса факторов, схожесть их формы могут создавать иллюзию связи рядов. Подобные соображения позволяют отказаться от результатов изучения связи уровней, содержащих тренд. В подобной ситуации пристального внимания заслуживает связь случайных отклонений от трендов. Именно этот подход позволяет выявить и количественно оценить истинную связь рядов.

Для формализованного представления подобных зависимостей и использования моделей связи динамических рядов в прогнозных расчётах предлагается построить множественную регрессионную модель связи рядов, включая в неё в качестве обязательной составляющей фактор времени t. Речь идёт о построении модели следующего вида: . В данной задаче в уровнях обоих рядов присутствует линейный тренд. Поэтому включение в модель фактора времени позволит через коэффициент а2 отразить наличие линейного тренда в уровнях обоих рядов. Если в уровнях рядов представлены тренды иной, более сложной формы, тогда уравнение множественной регрессии должно через фактор времени отразить эту более сложную форму трендов.

Истинную силу и направление связи рядов отразит коэффициент регрессии а1 , а тесноту их связи оценит частный коэффициент корреляции: .

Используем для расчёта параметров множественной регрессии матрицу парных коэффициентов корреляции, представленную в исходных данных.

Для построения уравнения в стандартизованном масштабе: рассчитаем значения -коэффициентов:

Получено следующее уравнение: .

Его параметры позволяют сделать вывод о том, что влияния импорта на экспорт сильнее, чем влияние систематических факторов, формирующих линейный тренд:

По значениям -коэффициентов рассчитаем параметры множественной регрессии в естественной форме:

;

.

Уравнение имеет вид:. С увеличением импорта на 1 млрд. $ экспорт увеличивается на 0,4499 млрд.$; под влиянием комплекса систематических факторов (которые условно обозначили через t ) экспорт увеличивается в среднем за год на 1,0122 млрд. $.

Оценку тесноты связи рядов, очищенную от влияния комплекса систематических факторов, даёт частный коэффициент корреляции:


Подобные документы

  • Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.

    контрольная работа [136,3 K], добавлен 25.09.2014

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.

    контрольная работа [157,9 K], добавлен 06.08.2010

  • Исследование зависимости часового заработка одного рабочего от общего стажа работы после окончания учебы с помощью построения уравнения парной линейной регрессии. Вычисление описательных статистик. Построение поля корреляции и гипотезы о форме связи.

    контрольная работа [226,6 K], добавлен 11.08.2015

  • Построение гипотезы о форме связи денежных доходов на душу населения с потребительскими расходами в Уральском и Западно-Сибирском регионах РФ. Расчет параметров уравнений парной регрессии, оценка их качества с помощью средней ошибки аппроксимации.

    контрольная работа [4,5 M], добавлен 05.11.2014

  • Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.

    контрольная работа [179,4 K], добавлен 25.03.2014

  • Построение поля корреляции по данным, гипотеза о форме связи. Оценка тесноты связи с помощью показателей корреляции и детерминации. Определение коэффициента эластичности и индекса корреляции. Расчет критериев Фишера. Модель денежного и товарного рынков.

    контрольная работа [353,7 K], добавлен 21.06.2011

  • Расчет уравнений линейной и нелинейной парной регрессии. Оценка тесноты связи расходов на перевозки и грузооборота с помощью показателей корреляции и детерминации. Оценка ошибки аппроксимации уравнений регрессии. Расчет прогнозного значения расходов.

    курсовая работа [2,5 M], добавлен 26.12.2014

  • Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.

    контрольная работа [173,8 K], добавлен 22.11.2010

  • Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.

    контрольная работа [71,7 K], добавлен 17.09.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.