Парная и множественная корреляция и регрессия

Уравнение парной регрессии. Расчет линейного коэффициента парной корреляции, параметров линейного и экспоненциального трендов. Оценка статистической значимости и параметров уравнения с помощью t-критерия. Оценка надежности уравнения с помощью F-критерия.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 18.06.2014
Размер файла 339,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное учреждение высшего профессионального образования

Поволжский государственный технологический университет

Кафедра информационных систем в экономике

РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА

по дисциплине

«Эконометрика»

на тему

«Парная и множественная корреляция и регрессия»

вариант №1

Выполнил:

студент группы ЭКО-21

направления 080100.62 «Экономика»

Проверил: доц. каф. ИС

Йошкар-Ола

2012

Задача №1

парная регрессия корреляция тренд

Существует связь между начисленной заработной платой и денежными доходами, направленными на прирост сбережений и покупку валюты населения.

По территориям Центрального района известны данные за X год.

Исходные данные

Район

Доля денежных доходов, направленных на прирост сбережений во вкладах, займах, сертификатах и на покупку валюты, в общей сумме среднедушевого денежного дохода, %

Среднемесячная начисленная заработная плата, тыс.р.

Брянская обл.

6,9

289

Владимирская обл.

8,7

334

Ивановская обл.

6,4

300

Калужская обл.

8,4

343

Костромская обл.

6,1

356

Орловская обл.

9,4

289

Рязанская обл.

11,0

341

Смоленская обл.

6,4

327

Тверская обл.

9,3

357

Тульская обл.

8,2

352

Ярославская обл.

8,6

381

Требуется:

1. Построить уравнение парной регрессии y от x.

2. Рассчитать линейный коэффициент парной корреляции.

3. Оценить статистическую значимость уравнения регрессии, его параметров.

4. Объяснить экономический смысл полученного уравнения.

Решение

1. В исходной экономической системе из 11 регионов Центрального района определим независимый факторный признак Х и результативный признак У. За независимый признак Х примем начисленную заработную плату в тыс. р., а за результативный - денежные доходы населения, направленные на прирост сбережений и покупку валюты (в % от тыс.р.).

Выдвинем гипотезу Н0 о том, что между вышеуказанными признаками существует линейная зависимость. Чтобы проверить выдвинутую гипотезу на истинность, воспользуемся статистической функцией ЛИНЕЙН в прикладной программе Microsoft Excel.

Таблица 1

Линейн а сущ.

Линейн а=0

1,001407172

5,002444287

0,024268703

0

0,002065044

0,691294057

0,001395693

#Н/Д

0,048996439

0,195129986

0,967984869

1,549600884

0,463686964

9

302,3523045

10

0,017655211

0,342681403

726,027371

24,01262899

Рис.1. Графики линии тренда зависимости между факторным и результативным признаком.

В результате графического решения (см. прил. 1), получим два линейных уравнения (с наличием свободного члена и с её отсутствием):

y = 4,4949x + 0,01089

y = 0,0243x.

(см. табл. 1 и рис.1). Первое уравнение объясняет исходную статистику на 4,5%, а при втором индекс детерминации R2 имеет отрицательное значение, равное -3,42. Это означает, что выдвигаемая нами гипотеза Н0 не верна, и для анализа факторов необходимо взять функцию, обратную ей, т.е. нелинейную функцию.

Типичным представителем нелинейной функции является статистическая функция ЛГРФПРИБЛ в Microsoft Excel. Используя её при решении нашей задачи, получим уравнение

y = 5*1,001407x,

которое объясняет исходную статистику на 4,9%. (см. табл. 2)

Таблица 2

Лгрфприбл

1,001407172

5,002444287

0,002065044

0,691294057

0,048996439

0,195129986

0,463686964

9

0,017655211

0,342681403

2. Так как полученная функция не является линейной, то найти линейный коэффициент парной корреляции rxy не представляется возможным. Для нелинейной регрессии эту задачу выполняет индекс корреляции pxy, равный арифметическому квадратному корню из индекса детерминации. Итак, получим:

pxy = = = 0,22

3. Теперь оценим статистическую значимость уравнения регрессии

y = 5*1,001407x

и значения его параметров.

а = 5,002444287 член уравнения, характеризующий начальный уровень изменения функции, т.е. денежные доходы населения, направленные на прирост сбережений и покупку валюты в размере примерно 5% от среднемесячной заработной платы не зависит от уровня этой заработной платы.

1,001407 - параметр b, характеризующий темп изменения функции под влиянием аргумента, т.е. такими темпами должна возрастать доля денежных средств, направленных на сбережения и покупку валюты при росте начисленной заработной платы на 1 тыс.р.

4. Коэффициент детерминации R2, равный 0,048996, показывает, что примерно 4,9% изменения функции объясняется изменениями аргумента Х. Это означает, что между факторами существует слабая связь, и существуют другие, более весомые факторы, влияющие на результативный признак У. Этот же самый вывод можно сделать, проанализировав корреляционно-регрессионный анализ для линейной функции

y = 4,4949x + 0,01089,

результаты которого представлены в таблицах 3 и 4.

Таблица 3

Регрессионная статистика

Множественный R

0,212448221

R-квадрат

0,045134246

Нормированный R-квадрат

-0,060961948

Стандартная ошибка

1,577722927

Наблюдения

11

Таблица 4

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

1,058931

1,058931

0,425409

0,530553771

Остаток

9

22,40289

2,48921

Итого

10

23,46182

Проанализировав таблицы 3 и 4, можно сделать вывод, что индекс детерминации R2 объясняет исходную статистику для линейной функции на 4,5%, что не сильно отличается от подобного показателя для функции ЛГРФПРИБЛ. Значимость по критерию Фишера не приемлема, т.к. Fзнач. = 0,531>0,05, следовательно, качество уравнения регрессии не отвечает предъявленным требованиям.

Рис. 2. График остатков для независимого факторного признака

На полученном графике остатков расстояния между наибольшими и наименьшими значениями функции до линии «0» не равны, а это значит, что метод наименьших квадратов не выполняется. Причиной этого могут быть малое количество наблюдений (необходимо как минимум 14 вместо 11-ти), а также имеет место быть множественная регрессия, о чём выше и шла речь.

Задача №2

Имеются поквартальные данные о составе и численности рынка труда Республики Марий Эл за 2000-2011 гг.

Исходные данные

Периоды времени

Численность всего населения

Число занятых

Численность безработных

Численность экономически активного населения

Число вакантных мест, шт.

Численность пенсионеров по старости и инвалидности

1 кв. 2000г.

741,5

331,6

50,2

381,8

2975

138,22

2 кв. 2000г.

741,2

324,6

48,3

372,9

2950

138,16

3 кв. 2000г.

739,8

319,1

45,9

365

2945

137,90

1 кв. 2001г.

739,5

325,5

39,6

365,1

2930

137,84

2 кв. 2001г.

739,1

330,8

34,1

364,9

2900

137,77

3 кв. 2001г.

735,6

326,3

34,2

360,5

2965

137,12

1 кв. 2002г.

735,2

324,4

40,1

364,5

2985

137,04

2 кв. 2002г.

733,1

321,5

50,6

372,1

3000

136,65

3 кв. 2002г.

732,8

320

47,7

367,7

3100

136,59

1кв. 2003г.

729,8

321,4

44

365,4

3150

136,03

2 кв. 2003г.

726,7

319,1

43,5

362,6

3200

135,46

3 кв. 2003г.

723,5

324,4

41,2

365,6

3200

134,86

1 кв. 2004г.

721,9

338,6

37,1

375,7

3150

134,56

2 кв. 2004г.

720

346,4

34,7

381,1

3100

134,21

3 кв. 2004г.

717,7

345,2

35,8

381

3000

133,78

1 кв. 2005г.

717,3

344,7

36,8

381,5

2900

133,70

2 кв. 2005г.

716,9

343,3

37,6

380,9

2800

133,63

3 кв. 2005г.

713,9

339,4

37,3

376,7

2900

133,07

1 кв. 2006г.

711,6

331,1

37

368,1

3100

132,64

2 кв. 2006г.

711,5

325,0

36,9

361,9

3200

132,62

3 кв. 2006г.

708,1

325,4

36,2

361,6

3300

131,99

1 кв. 2007г.

707,4

335

35,5

370,5

3950

131,86

2 кв. 2007г.

706,7

346,6

34,2

380,8

4025

131,73

3 кв. 2007г.

702,2

342,2

37,1

379,3

3865

130,89

1 кв. 2008г.

703,2

341,7

36,2

377,9

2500

131,08

2 кв. 2008г.

701,6

341,7

34,4

376,1

2334

130,78

3 кв. 2008г.

701

339,3

36,4

375,7

2225

130,67

1 кв. 2009г.

700,4

327,6

39,7

367,3

1883

130,55

2 кв. 2009г.

700,1

323,7

42,5

366,2

1695

130,50

3 кв. 2009г.

700,2

326,8

41,8

368,6

1846

130,52

1 кв. 2010г.

699,6

334,1

41,2

375,3

1976

130,41

2 кв. 2010г.

698,8

337,2

39,7

376,9

2460

130,26

3 кв. 2010г.

697,2

337,2

38,2

375,4

2467

129,96

1 кв. 2011г.

696,4

337

37,5

374,5

3276

129,81

2 кв. 2011г.

695,5

337,1

37,3

374,4

3498

129,64

3 кв. 2011г.

696

338,6

36,9

375,5

3537

129,73

Требуется:

1. Построить гипотезу о влиянии факторов на результативный признак.

2. Рассчитать матрицу парных коэффициентов корреляции, на их основе отобрать информативные факторы в модель.

3. Оценить статистическую значимость параметров регрессионной модели с помощью t-критерия; с помощью F-критерия оценить статистическую надежность уравнения регрессии, пояснить их экономический смысл.

4. Рассчитать ошибки и доверительный интервал прогноза для уровня значимости 5 или 10%.

Решение:

1. За результативный признак У примем численность экономически активного населения на территории Республики Марий Эл, а за независимые факторные признаки - относительные показатели рынка труда:

а) Уровень вакантности (Х1);

б) Коэффициент напряженности на рынке труда (Х2);

в) Коэффициент занятости (Х3);

г) Коэффициент экономической нагрузки на 1 чел. экономически активного населения (Х4);

д) Уровень экономической активности населения (Х5);

е) Коэффициент пенсионной нагрузки (Х6);

ж) Коэффициент безработицы (Х7).

Выдвинем гипотезу о наличии линейной связи между факторными и результативным признаками.

2. Далее рассчитаем матрицу парных коэффициентов корреляции, используя инструмент анализа данные Корреляция, результаты вычислений которого представлены в табл. 5.

Таблица 5

У

Х1

Х2

Х3

Х4

Х5

Х6

Х7

У

1

Х1

0,064228

1

Х2

-0,09322

0,867839

1

Х3

0,287948

-0,01843

-0,50702

1

Х4

-0,77689

-0,38238

-0,09273

-0,48542

1

Х5

-0,28225

0,013542

0,502654

-0,99991

0,484661

1

Х6

-0,77689

-0,38238

-0,09273

-0,48542

1

0,484661

1

Х7

-0,28795

0,01843

0,507021

-1

0,485424

0,999909

0,485424

1

Рассмотрим факторы Х17. Коэффициент парной корреляции независимых признаков Х1 и Х2 и результативного признака У равен 0,064 и -0,093 соответственно, из чего можно сделать вывод о слабой связи между ними. В то же время корреляционная связь между факторами Х1 и Х2 весьма значимая (0,867), что говорит о невозможности одновременного рассмотрения уровня вакантности и коэффициента напряжённости на рынке труда в модели. Исключаем эти признаки из перечня факторов.

Далее с помощью матрицы значений линейных коэффициентов и инструмента обработки данных Регрессия, последовательно исключаем факторы Х4, Х5, Х6 и Х7. В результате, вместо уравнения множественной регрессии получим линейное уравнение парной регрессии.

3. Чтобы получить искомую модель и оценить значимость ее параметров, воспользуемся инструментом анализа данных Регрессия, результаты вычислений которой представлены в таблицах 6-8.

Таблица 6

Регрессионная статистика

Множественный R

0,287947507

R-квадрат

0,082913767

Нормированный R-квадрат

0,05333034

Стандартная ошибка

6,722346287

Наблюдения

33

Коэффициент парной корреляции примерно равен 0,29, по которой можно судить о наличии связи между фактором Х3 и У. Индекс детерминации объясняет исходную статистику на 8%, иными словами, 8% статистики (связи между факторным и результативным признаком) объясняется линейным уравнением.

Для проверки значимости показателя R2 представим результаты дисперсионного анализа (см. табл. 7).

Таблица 7

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

126,6542967

126,6542967

2,80271

0,104167049

Остаток

31

1400,888128

45,1899396

Итого

32

1527,542424

Значение уровня значимости F-критерия Фишера, соответствующее расчетному значению, равно 0,10416 < 2,8, следовательно, качество уравнения регрессии отвечает предъявленным требованиям.

В таблице 10 представим результаты регрессионного анализа для оценки статистической значимости параметров регрессионной модели.

Таблица 8

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пер-е

236,33441

80,87481236

2,92222509

0,006434

71,38913

401,2797

Коэф-т занятости, Х3

1,5151932

0,905063244

1,67412963

0,104167

-0,330695

3,361082

Исходя из таблицы, коэффициента детерминации, равной 8%, а также из невозможности выполнения метода наименьших квадратов (рис. 1), сделаем вывод, что выдвигаемая нами гипотеза о существовании линейной связи между факторным и результативным признаками не верна, т.е. между факторами Х и У существует нелинейная связь. В итоге, уравнение будет выглядеть:

у = 236,334 + 1,51519х

Иными словами, ежеквартальный темп роста коэффициента занятости в среднем равен значению 1,51519.

Рис. 3. График остатков фактора Х3, коэффициента занятости за 2000-2011гг.

t - статистика, являющаяся отношением коэффициентов к их стандартным ошибкам, в обоих случаях больше 1:

t1 = = 2,92 > 1;

t2 = = 1,67 > 1.

Следовательно коэффициенты значимы и принимаются в регрессионную модель.

Таким образом, можно сделать вывод, что из относительных показателей, описывающих рынок труда в Республике Марий Эл, численность экономически активного населения лучше всего характеризует коэффициент занятости, т.к. он имеет наибольшую корреляционную связь с результативным признаком, и, соответственно, наиболее чувствителен к различным изменениям в статистике.

Коэффициент занятости определяется как отношение числа занятых к числу экономически активного населения. Этот показатель напрямую влияет социальную стабильность в нашем обществе. Несмотря на тенденцию к уменьшению этого индекса в последние годы, необходимы дополнительные инструменты её минимизации, т.к. это обеспечит социальную стабильность Марий Эл. Это вопрос о создании рабочих мест или условий дополнительного заработка.

Задача №3

Импорт продукции страны за 1966-1986 гг. характеризуется данными, представленными в таблице 9.

Таблица 9

Год

Импорт страны, млн. у.е.

1966

337

1967

351

1968

400

1969

474

1970

533

1971

581

1972

633

1973

811

1974

1109

1975

1061

1976

1261

1977

1499

1978

1570

1979

1866

1980

2125

1981

2537

1982

2694

1983

2864

1984

3277

1985

3379

1986

3187

Требуется:

1. Построить графики ряда динамики и трендов.

2. Провести расчет параметров линейного и экспоненциального трендов.

3. Выбрать наилучший вид тренда на основании графического изображения и значения коэффициента детерминации.

Решение:

Примем за независимый факторный признак Х рассматриваемый период времени - год, а за результативный признак У - импорт продукции страны в млн. у.е.

В прикладной программе Microsoft Excel построим график динамики результативного признака в течение рассматриваемого периода.

Рис. 4. Динамика импорта продукции страны за 1966-1986 гг.

Полученный график позволяет сделать вывод о существовании тенденции в исходном временном ряде и необходимости определения тренда.

Далее, учитывая выборку в количестве 21 года, рассчитаем количество лагов (временных промежутков) для вычисления коэффициентов автокорреляции. Количество лагов

ф = 21/4 = 5.

Результаты расчетов представим в таблице 10.

Таблица 10

Год

Импорт страны, млн. у.е.

ф=1

ф=2

ф=3

ф=4

ф=5

Коэффициент автокорреляции

Лаг

1966

337

0,989986089

ф=1

1967

351

337

0,98129679

ф=2

1968

400

351

337

0,982064594

ф=3

1969

474

400

351

337

0,969786309

ф=4

1970

533

474

400

351

337

0,957451801

ф=5

1971

581

533

474

400

351

337

1972

633

581

533

474

400

351

1973

811

633

581

533

474

400

1974

1109

811

633

581

533

474

1975

1061

1109

811

633

581

533

1976

1261

1061

1109

811

633

581

1977

1499

1261

1061

1109

811

633

1978

1570

1499

1261

1061

1109

811

1979

1866

1570

1499

1261

1061

1109

1980

2125

1866

1570

1499

1261

1061

1981

2537

2125

1866

1570

1499

1261

1982

2694

2537

2125

1866

1570

1499

1983

2864

2694

2537

2125

1866

1570

1984

3277

2864

2694

2537

2125

1866

1985

3379

3277

2864

2694

2537

2125

1986

3187

3379

3277

2864

2694

2537

3187

3379

3277

2864

2694

3187

3379

3277

2864

3187

3379

3277

3187

3379

3187

Из таблицы видно, что наивысшее значение коэффициентов корреляции получено для первого порядка. Это означает, что для исследуемого временного ряда следует прогнозировать только тенденцию. Этот факт можно рассмотреть также и на графике коэффициентов автокорреляции (см. рис. 5)

Рис. 5. График коэффициентов автокоррелции

Для определения параметров линейного тренда по методу наименьших квадратов воспользуемся функцией ЛИНЕЙН, а для определения экспоненциального тренда - функцией ЛГРФПРИБЛ (см. табл. 11)

Таблица 11

ЛИНЕЙН

ЛГРФПРИБЛ

167,1909

-328819

1,135346

1,4E-106

9,032087

17847,49

0,003725

7,36058

0,947463

250,6302

0,983902

0,103364

342,6487

19

1161,274

19

21523656

1193495

12,40714

0,202997

В результате получим 2 уравнения:

у = -328819 + 167,19t

- ежегодно импорт продукции страны в среднем увеличивается на сумму 167,19 млн. у.е.

у = (1,4Е-106) + 1,135t

- ежегодно импорт продукции страны в среднем увеличивается на сумму 1,135 млн. у.е.

Сравнивая коэффициент детерминации, видим, что лучше исходную статистику объясняет нелинейная функция (R2 = 98,39%). Чтобы убедиться в не выполнении метода наименьших квадратов (наименьшая и наибольшая величина остатков не симметричны относительно линии «0») и для отвержения линейной функции, построим график остатков исходной статистики (см. рис. 6).

Рис. 6. График остатков

Теперь построим график функции полинома.

Рис. 7. График функции полинома

Получим, что лучше всего связь между факторами Х (годы) и У (импорт страны в млн. у.е.) объясняет нелинейная функция ЛГРФПРИБЛ, а линейная не применима ввиду невыполнения метода наименьших квадратов. А для расчета прогнозных значений следует использовать полиномиальное уравнение. К примеру, полином 3-ей степени, коэффициент детерминации при котором равен 98,91%.

Размещено на Allbest.ru


Подобные документы

  • Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.

    контрольная работа [1,3 M], добавлен 24.09.2013

  • Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.

    лабораторная работа [1,6 M], добавлен 13.04.2010

  • Расчет параметров уравнения линейной регрессии, экономическая интерпретация регрессии. Определение остаточной суммы квадратов. Выполнение предпосылок МНК. Расчет коэффициента детерминации, проверка значимости уравнения регрессии с помощью критерия Фишера.

    контрольная работа [317,0 K], добавлен 11.05.2009

  • Расчет параметров линейной и степенной парной регрессии. Показатели корреляции и детерминации, методика их расчета. Средняя ошибка аппроксимации. Оценка с помощью F-критерия Фишера статистической надежности результатов регрессионного моделирования.

    контрольная работа [25,2 K], добавлен 20.11.2014

  • Основные этапы многофакторного корреляционного анализа и интерпретация его параметров. Назначение коэффициентов эластичности и стандартизированных бетта-коэффициентов. Расчет значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента.

    контрольная работа [605,2 K], добавлен 29.07.2010

  • Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.

    контрольная работа [253,4 K], добавлен 17.03.2011

  • Построение корреляционного поля между ценой акции и доходностью капитала. Гипотеза о тесноте и виде зависимости между доходностью и ценой. Расчет коэффициента детерминации. Оценка статистической значимости уравнения регрессии с помощью F-критерия Фишера.

    контрольная работа [274,3 K], добавлен 25.09.2013

  • Оценка силы вариации признака. Построение регрессионной модели. Парный линейный коэффициент корреляции. Оценка статистической надежности результатов. Значение коэффициента детерминации. Оценка силы связи признаков. Фактическое значение критерия Фишера.

    контрольная работа [165,8 K], добавлен 27.05.2015

  • Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.

    контрольная работа [513,5 K], добавлен 02.05.2015

  • Расчет показателей динамики стоимости имущества ОАО "Сургутнефтегаз". Построение линейного уравнения тренда роста балансовой стоимости имущества. Однофакторный дисперсионный анализ. Параметры уравнения регрессии. Значимость коэффициента корреляции.

    дипломная работа [146,6 K], добавлен 29.11.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.