Парная и множественная регрессия. Временные ряды

Построение поля корреляции, уравнения линейной и степенной парной регрессии. Расчет значения спроса, его квадратичного отклонения и коэффициентов автокорреляции. Выполнение сглаживания временного ряда методом скользящих средних с интервалом сглаживания.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 30.12.2010
Размер файла 267,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Тема 1. Парная регрессия

Задача. В таблице 1 приводятся данные по различным регионам России о среднедушевом прожиточном минимуме в день одного трудоспособного x (руб.) и среднедневной заработной плате y (руб.).

Таблица 1

Номер региона

1

2

3

4

5

6

7

8

9

10

x (руб.)

79

86

80

95

98

106

117

108

92

87

y (руб.)

176

179

176

181

215

232

241

208

205

180

Требуется:

1. Построить поле корреляции и сформулировать гипотезу о форме связи y и x .

2. Построить уравнение линейной и степенной парной регрессии; определить для них коэффициенты детерминации и среднюю относительную ошибку аппроксимации и сравнить полученные модели на точность.

3. Оценить статистическую значимость параметров линейной регрессии и коэффициента корреляции, а также построить интервальную оценку коэффициентов линейной регрессии с надежностью 0,95.

4. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x, составляющего 107% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

Решение.

1. В координатной плоскости Оxy построим точки с координатами

Поле корреляции

По виду поля корреляции можно сделать вывод о том, что форма связи между y и x может быть как линейной, так и нелинейной.

2. Для расчета параметров уравнения парной регрессии построим вспомогательную расчетную таблицу 2.

Таблица 2

N п/п

1

2

3

4

5

6

7

8

9

10

1

79

176

13904

6241

30976

171,66

4,34

18,806

2,46

2

86

179

15394

7396

32041

183,91

-4,91

24,083

2,74

3

80

176

14080

6400

30976

173,41

2,59

6,695

1,47

4

95

181

17195

9025

32761

199,65

-18,65

347,816

10,30

5

98

215

21070

9604

46225

204,90

10,10

102,065

4,70

6

106

232

24592

11236

53824

218,89

13,11

171,859

5,65

7

117

241

28197

13689

58081

238,13

2,87

8,230

1,19

8

108

208

22464

11664

43264

222,39

-14,39

207,038

6,92

9

92

205

18860

8464

42025

194,40

10,60

112,310

5,17

10

87

180

15660

7569

32400

185,66

-5,66

31,997

3,14

948

1993

191416

91288

402573

-

-

1030,899

43,75

Среднее значение

94,8

199,3

19141,6

9128,8

40257,3

-

-

-

4,38

Найдем параметры линейной регрессии по следующим формулам:

(1)

В строке "Среднее значение" таблицы 2 приводятся значения 19141,6; 94,8, 199,3. В колонке 5 этой же таблицы в строке "" записано значение 9128,8.

Подставляя эти числа в формулы (1), получим

В итоге получено линейное уравнение парной регрессии

(2)

Из него следует, что с увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 1,75 руб.

Для оценки тесноты связи вычислим коэффициент парной корреляции

(3)

Вычислим выборочные среднеквадратические отклонения величин и :

(4)

Подставляя найденные значения в формулу (3), находим

Связь между среднедушевым прожиточным минимумом и средней заработной платой высокая.

Найдем коэффициент детерминации

Это означает, что вариации заработной платы () на 80% объясняется вариацией фактора - среднедушевого прожиточного минимума.

Качество модели определяет средняя относительная ошибка аппроксимации:

Чтобы ее найти, заполним колонку 7 таблицы 2 значениями , которые вычисляются по формуле (2) после подстановки в нее вместо переменной значений :

Далее вычислим отклонения , запишем их в колонку 8 таблицы и подсчитаем величины

,

которые поместим в колонку 10 таблицы 2. В итоге получаем В среднем расчетные значения переменной отклоняются от фактических на 4,38%, что говорит о высокой точности аппроксимации.

Построим степенную парную регрессию в виде зависимости . Выполним линеаризацию уравнения путем его логарифмирования:

или

где .

Для расчета параметров степенной регрессии построим вспомогательную таблицу 3.

Таблица 3

N п/п

1

2

3

4

5

6

7

8

9

1

4,3695

5,1705

22,5922

19,0921

26,7339

171,57

4,43

19,66

2

4,4544

5,1874

23,1064

19,8412

26,9089

183,95

-4,95

24,48

3

4,3820

5,1705

22,6572

19,2022

26,7339

173,35

2,65

7,04

4

4,5539

5,1985

23,6733

20,7378

27,0244

199,61

-18,61

346,22

5

4,5850

5,3706

24,6242

21,0219

28,8437

204,77

10,23

104,72

6

4,6634

5,4467

25,4005

21,7477

29,6669

218,39

13,61

185,23

7

4,7622

5,4848

26,1196

22,6783

30,083

236,83

4,17

17,42

8

4,6821

5,3375

24,9911

21,9224

28,4893

221,77

-13,77

189,52

9

4,5218

5,3230

24,0695

20,4466

28,3344

194,42

10,58

111,97

10

4,4659

5,1929

23,1913

19,9443

26,9668

185,70

-5,70

32,52

45,440

52,882

240,425

206,634

279,785

-

-

1038,79

Среднее значение

4,5440

5,2882

24,0425

20,6634

27,9785

-

-

103,87

Найдем параметры и :

Тогда линейное уравнение запишется:

.

После потенцирования получаем искомую степенную регрессию

. (5)

Подставляя в уравнение (5) фактические значения , получаем значения , которые поместим в колонку 7 таблицы 3. По ним рассчитаем отклонения и их квадраты (колонки 8 и 9 таблицы 3).

Для оценки тесноты связи между переменными y и x в нелинейной модели вычислим индекс корреляции:

.

Значение подсчитано в строке"" колонки 9 таблицы 3 .

Так как (значение выборочной дисперсии найдено ранее по формуле (4) 536,81), то отсюда находим :

Вычислим коэффициент детерминации

Таким образом, вариация результата по степенной модели на 80,6% объясняется вариацией фактора .

Средняя относительная ошибка аппроксимации составляет (колонка 10 таблицы 3):

По коэффициенту детерминации и по средней ошибке аппроксимации линейная модель регрессии несколько лучше степенной.

3. Известно, что случайная величина:

где - выборочная остаточная дисперсия, - гипотетическое значение оцениваемого коэффициента регрессии, имеет распределение Стьюдента с степенями свободы.

Оценку значимости параметра выполним с помощью указанного критерия Стьюдента. Выдвигаем нулевую гипотезу о статистически незначимом отличии коэффициента от нуля: Если ввести в рассмотрение величину:

,

которую называют стандартной ошибкой оценки , то при выдвинутой гипотезе фактическое значение критерия находят из выражения . Это значение сравнивают с . Табличное значение критерия для числа степеней свободы и при заданном уровне значимости составит величину =2,30.

Найдем остаточную дисперсию , используя колонку 9 таблицы 3:

Тогда и

Определим фактическое значение - критерия

Так как фактическое значение - критерия превосходит табличное: , то гипотеза отклоняется и параметр является статистически значимым.

Аналогично выполняется оценка значимости параметра и коэффициента корреляции . Стандартные ошибки для этих параметров находится по формулам:

Подставляя в них численные значения, определяем:

Далее вычисляем фактические значения - критерия

Поскольку фактические значения - критерия превосходят табличные (),то параметр и коэффициент корреляции являются статистически значимыми.

Интервальная оценка коэффициентов заключается в построении для них доверительных интервалов. Найдем с надежностью 0,95 предельную ошибку для каждого показателя

.

Тогда найдутся искомые доверительные интервалы

или .

Окончательно: .

Таким образом, с надежностью 0,95 интервал (-33,03; 99,83) накрывает неизвестный коэффициент , а интервал (1,05; 2,44) - коэффициент .

4. Найдем вначале прогнозное значение прожиточного минимума

.

Тогда на основе линейной регрессии заработная плата увеличится до величины (руб.).

Стандартная ошибка прогноза найдется по формуле:

.

После подстановки численных значений величин получим:

(руб.).

Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит

(руб.).

Отсюда находится доверительный интервал прогноза:

или .

Таким образом, среднедневная заработная плата при среднедушевом прожиточном минимуме в день на одного трудоспособного 101,44 руб. с надежностью 0,95 находится в пределах от 182,64 до 239,16 руб.

Тема 2. Множественная регрессия

Задача. Изучается влияние стоимости основных x1 и оборотных x2 средств на величину валового дохода y торговых предприятий. Для этого по 12 торговым предприятиям были получены данные, приведенные в таблице 1 (все величины измеряются в млн. руб.).

Требуется:

1. Полагая, что между переменными y, x1, x2 существует линейная корреляционная зависимость, найти ее аналитическое выражение (уравнение регрессии y по x1 и x2 ) и пояснить экономический смысл параметров регрессии.

2. Установить раздельное влияние на величину валового дохода двух факторов - основных и оборотных средств через коэффициенты эластичности.

3. Сравнить значения скорректированного и нескорректированного коэффициентов множественной детерминации и проверить значимость полученного уравнения регрессии на уровне =0,05.

4. С помощью частных F-критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора x1 после x2 , и фактора x2 после x1.

Таблица 1

Переменные

Номер предприятия

1

2

3

4

5

6

7

8

9

10

11

12

x1

3,9

4,1

3,8

5

4,8

5,6

5,6

4,8

6

7,6

6,9

7,4

x2

11

14

15

16

18

20

20

21

21

20

22

21

y

7

7

8

7

8

7

9

9

8

10

10

11

Решение. 1. Линейное уравнение множественной регрессии для двух объясняющих переменных и записывается в виде: . Найдем значения (оценки) параметров , методом наименьших квадратов, опираясь на исходные выборочные данные. Эти данные запишем в виде следующих матриц:

,

(в матрицу вводится дополнительный столбец, состоящий из единиц). Тогда вектор параметров линейной регрессии найдется из следующей формулы

. (5)

Для удобства вычислений составим вспомогательную таблицу 2.

Таблица 2

1

2

3

4

5

6

7

8

9

10

11

12

1

3,9

11

7

15,21

121

49

42,9

27,3

77

0,96

36,426

2

4,1

14

7

16,81

196

49

57,4

28,7

98

0,98

36,256

3

3,8

15

8

14,44

225

64

57

30,4

120

0,96

49,597

4

5

16

7

25

256

49

80

35

112

1,04

35,494

5

4,8

18

8

23,04

324

64

86,4

38,4

144

1,03

48,606

6

5,6

20

7

31,36

400

49

112

39,2

140

1,08

34,991

7

5,6

20

9

31,36

400

81

112

50,4

180

1,08

62,652

8

4,8

21

9

23,04

441

81

100,8

43,2

189

1,03

63,550

9

6

21

8

36

441

64

126

48

168

1,11

47,431

10

7,6

20

10

57,76

400

100

152

76

200

1,23

76,983

11

6,9

22

10

47,61

484

100

151,8

69

220

1,18

77,853

12

7,4

21

11

54,76

441

121

155,4

81,4

231

1,21

95,807

65,5

219

101

376,39

4129

871

1233,7

567

1879

-

665,647

Найдем произведения матриц:

Матрицу определим по формуле

,

где - определитель матрицы , - присоединенная матрица из алгебраических дополнений элементов матрицы.

Вначале найдем определитель матрицы:

Далее вычислим алгебраические дополнения:

; ;

; ;

; ;

; ;

В результате находим обратную матрицу:

и вектор параметров линейной регрессии:

.

В итоге линейное уравнение множественной регрессии имеет вид:

. (6)

Оно показывает, что при изменении влияния стоимости основных средств х1 на величину валового дохода торговых предприятий, увеличивается в среднем на 0,688 млн. руб. А увеличение только оборотных средств х2 приводит к увеличению валового дохода торговых предприятий в среднем на 0,070 млн. руб.

2. Коэффициенты эластичности определяются по формуле:

С использованием данных таблицы 2 (последней строки) находим:

; ; .

Отсюда:

; .

Таким образом, увеличение переменных х1 , х2 приводит в среднем к увеличению валового дохода торговых предприятий соответственно на 0,44% и 0,15%. Из этого следует, что фактор «основные средства» оказывает большее влияние на величину валового дохода, нежели второй фактор «оборотные средства».

3. Множественный коэффициент детерминации определяется по формуле:

.

Вычислим матричное произведение:

,

а значение возьмем из итоговой строки колонки 7 таблицы 2.

Из таблицы 2 также находим (млн. руб.).

В итоге имеем .

Коэффициент показывает, что вариация - величина валового дохода торговых предприятий на 63,8% объясняется изменчивостью включенных в модель объясняющих факторов: основных средств и оборотных средств . Остальные 36,2% приходится на неучтенные или случайные факторы.

Найдем скорректированный коэффициент детерминации:

.

Видим, что скорректированный коэффициент детерминации незначительно отличается от .

Зная =0,638, проверим значимость уравнения регрессии по - критерию Фишера. Для этого вычислим вначале фактическое значение критерия:

.

Из таблицы критических значений для критерия Фишера по уровню значимости =0,05 и числу степеней свободы и находим . В силу того, что делаем вывод, что уравнение регрессии значимо и исследуемая зависимая переменная достаточно хорошо описывается включенными в регрессионную модель переменными и .

4. Частные - критерии и оценивают целесообразность включения в уравнение одного фактора после другого фактора. Критерий оценивает целесообразность включения в уравнение фактора после того, как в него был включен фактор . Соответственно указывает на целесообразность включения в модель фактора после фактора . Фактическое значение частого критерия находится по формуле:

.

Здесь: .

Вычислим парный коэффициент корреляции валового дохода с оборотными средствами (численные данные берем из итоговой строки таблицы 2):

Тогда:

.

Сравнивая со значением (), делаем вывод о том, что включение фактора после фактора оказалось статистически значимым и оправданным.

Вычислим значение другого частного критерия:

Где: .

Определим парный коэффициент корреляции валового дохода с основными средствами:

Тогда

Поскольку меньше, то включение фактора после фактора оказывается бесполезным: влияние не является устойчивым, систематическим (в этом убедились ранее, признав незначимым).

Тема 3. Временные ряды

Задача. В таблице 1 приведены данные, отражающие спрос y (в усл. ед.) на некоторый товар за 8 лет по одному из микрорайонов г. Казани.

Требуется:

1. Найти среднее значение спроса, его среднее квадратическое отклонение, коэффициенты автокорреляции (для лагов =1,2).

2. Полагая тренд линейным, найти его уравнение и проверить значимость полученного уравнения регрессии по F-критерию на 5% уровне значимости.

3. Выполнить сглаживание временного ряда методом скользящих средних с интервалом сглаживания m=3 года.

4. На уровне значимости =0,05 выявить наличие автокорреляции возмущений для данного временного ряда, используя критерий Дарбина-Уотсона.

корреляция линейный регрессия квадратичный

Таблица 1

Год,

1

2

3

4

5

6

7

8

Спрос,

193

198

235

213

290

316

287

346

Решение. 1. Среднее значение спроса находим по формуле

.

Подставляя численные значения из таблицы 1, получим:

.

Далее определим среднее значение дисперсии из соотношения:

,

где - среднее значение квадратов спроса . После подстановки чисел имеем:

.

Отсюда вычисляем среднее квадратическое отклонение:

.

Найдем коэффициент автокорреляции для лага , т. е. между последовательностями семи пар наблюдений и

Таблица 2

193

198

235

213

290

316

287

198

235

213

290

316

287

346

Вначале вычислим необходимые суммы:

;

;

;

;

Тогда по формуле:

Находим:

.

Для вычисления коэффициента автокорреляции при лаге (между элементами ряда и ) составим таблицу из 6 пар:

Таблица 3

193

198

235

213

290

316

235

213

290

316

287

346

Предварительно вычислим суммы:

; ; ; ; .

Отсюда определяем:

.

Поскольку , то ряд содержит циклические колебания и, скорее всего, ряд имеет пилообразную структуру.

2. Для получения системы нормальных уравнений запишем необходимые суммы для всего ряда (таблица 1):

; ;

;

; .

Тогда система нормальных уравнений примет вид:

Решая ее по формулам Крамера, найдем:

,

, .

В итоге получили линейное уравнение тренда:

.

Для проверки значимости полученного уравнения регрессии вычисляют фактическое значение - статистики Фишера по формуле:

,

где - сумма квадратов отклонений зависимой переменной, обусловленная регрессией, - сумма квадратов отклонений, обусловленная влиянием неучтенных факторов.

Найдем :

.

Далее вычислим:

,

.

Отсюда . По значениям

Находим табличное значение - критерия Фишера . Так как , то уравнение тренда признается статистически значимым.

В нашем случае . Когда - нечетное число, то скользящее среднее определяется по формуле

.

Для вычислим:

,

В итоге получим сглаженный ряд:

Таблица 4

1

2

3

4

5

6

7

8

-

208,66

215,33

246,0

273,0

297,66

316,33

-

Уравнение тренда получено в виде .

Для ее вычисления составим таблицу 5.

Таблица 5

1

193

183,25

9,7

95,1

-

-

2

198

205,11

-7,1

50,5

9,7

-69,3

3

235

226,96

8,0

64,6

-7,1

-57,1

4

213

248,82

-35,8

1283,2

8,0

-287,8

5

290

270,68

19,3

373,3

-35,8

-692,1

6

316

292,54

23,5

550,6

19,3

453,4

7

287

314,39

-27,4

750,4

23,5

-642,8

8

346

336,25

9,8

95,1

-27,4

-267,1

-

-

-

3262,6

-

-1562,8

В таблицу 5 добавим столбцы и для подсчета необходимых сумм - статистики Дарбина-Уотсона. Далее определим фактическое значение статистики по формуле:

.

Фактическое значение сравним с табличными значениями при 5% уровне значимости. При n=8 и 1 (число объясняющих факторов модели) нижнее значение равно 0,76, а верхнее - 1,33. Так как фактическое значение статистики Дарбина-Уотсона =2,95 находится в пределах от =0,76 до (4-)=3,24, то для рассматриваемого временного ряда принимается гипотеза об отрицательной автокорреляции возмущений.

Список использованной литературы

Эконометрика. Под ред. И.И. Елисеевой. М.: Финансы и статистика, 2002.

Практикум по эконометрике. Под ред. И.И. Елисеевой. М.: Финансы и статистика, 2002.

Кремер Н.Ш., Путко Б.А. Эконометрика. М.: ЮНИТИ, 2002.

Брадис В.М. Четырехзначные математические таблицы. М.: Просвещение, 1990.

Все расчеты производились в программе MS Excel.

Размещено на Allbest.ru


Подобные документы

  • Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.

    презентация [387,8 K], добавлен 25.05.2015

  • Определение частных производных первого и второго порядков заданной функции, эластичности спроса, основываясь на свойствах функции спроса. Выравнивание данных по прямой методом наименьших квадратов. Расчет параметров уравнения линейной парной регрессии.

    контрольная работа [99,4 K], добавлен 22.07.2009

  • Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.

    контрольная работа [814,0 K], добавлен 19.12.2013

  • Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.

    контрольная работа [380,9 K], добавлен 05.04.2015

  • Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.

    задача [133,0 K], добавлен 21.12.2008

  • Аппроксимация функции y = f(x) линейной функцией y = a1 + a2x. Логарифмирование заданных значений. Расчет коэффициентов корреляции и детерминированности. Построение графика зависимости и линии тренда. Числовые характеристики коэффициентов уравнения.

    курсовая работа [954,7 K], добавлен 10.01.2015

  • Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.

    контрольная работа [68,7 K], добавлен 21.09.2009

  • Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.

    контрольная работа [1,2 M], добавлен 05.08.2010

  • Сортировка размера пенсии по возрастанию прожиточного минимума. Параметры уравнений парных регрессий. Значения параметров логарифмической регрессии. Оценка гетероскедастичности линейного уравнения с помощью проведения теста ранговой корреляции Спирмена.

    контрольная работа [178,0 K], добавлен 23.11.2013

  • Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.

    лабораторная работа [22,3 K], добавлен 15.04.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.