Парная регрессия и корреляция

Регрессионный анализ как статистический метод исследования влияния одной или нескольких независимых переменных на зависимую переменную. Индекс корреляции и коэффициент детерминации. Методы наименьших квадратов. Пути решения системы нормальных уравнений.

Рубрика Математика
Вид практическая работа
Язык русский
Дата добавления 07.11.2014
Размер файла 1,5 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Московский государственный университет путей сообщений

Институт экономики и финансов

Практическая работа

«Парная регрессия и корреляция»

по дисциплине: «Эконометрика»

Исходные данные регрессионный корреляция детерминация

Результативный признак y=1. Факторный признак x=5

Xi(Удельный вес рабочих в составе ППП)

Yi(Производительность труда)

1

0,78

9,26

2

0,75

9,38

3

0,68

12,11

4

0,7

10,81

5

0,62

9,35

6

0,76

9,87

7

0,73

8,17

8

0,71

9,12

9

0,69

5,88

10

0,73

6,3

11

0,68

6,22

12

0,74

5,49

13

0,66

6,5

14

0,72

6,61

15

0,68

4,32

16

0,77

7,37

17

0,78

7,02

18

0,78

8,25

19

0,81

8,15

20

0,79

8,72

21

0,77

6,64

22

0,78

8,1

23

0,72

5,52

24

0,79

9,37

25

0,77

13,17

26

0,8

6,67

27

0,71

5,68

28

0,79

5,22

29

0,76

10,02

30

0,78

8,16

31

0,62

3,78

32

0,75

6,48

33

0,71

10,44

34

0,74

7,65

35

0,65

8,77

36

0,66

7

37

0,84

11,06

38

0,74

9,02

39

0,75

13,28

40

0,75

9,27

41

0,79

6,7

42

0,72

6,69

43

0,7

9,42

44

0,66

7,24

45

0,69

5,39

46

0,71

5,61

47

0,73

5,59

48

0,65

6,57

49

0,82

6,54

50

0,8

4,23

51

0,83

5,22

52

0,7

18

53

0,74

11,03

Сумма

38,98

422,43

Среднее значение

0,735471698

7,970377358

1. Линейная регрессия

Построим уравнения парной линейной регрессии вида для пар переменных y, x.

Параметры b0 и b1 уравнения линейной регрессии рассчитываются методом наименьших квадратов путем решения системы нормальных уравнений:

Для нахождения параметров b0 и b1 используем ППП «Анализ данных» MS Excel. Результаты расчетов приведены в приложениях

Уравнения регрессии имеют вид:

Для пары признаков y, x

Рисунок 1. Линия регрессии на корреляционном поле. Ось ординат - значения y(Производительность труда), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)

Рисунок 2 Линия регрессии на корреляционном поле. Ось ординат - значения y(лин. регрессия), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)

Оценим каждое уравнение регрессии через среднюю ошибку аппроксимации и F-критерий Фишера, t-критерий Стьюдента.

Найдем среднюю относительную ошибку аппроксимации по формуле:

.

Полученное значение между 20% и 50%, что свидетельствует о существенности удовлетворительного отклонения расчетных данных от фактических, по которым построена эконометрическая модель.

Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Расчетное значение критерия находится по формуле:

.

Для парного уравнения p = 1.

Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора по уровню значимости по уровню значимости б и двум числам степеней свободы k1 = p = 1 и k2 = n - p - 1 = 51.

.

Если Fрасч<Fтабл,

то гипотеза принимается, а уравнение линейной регрессии в целом считается статистически незначимым (с вероятностью ошибки 5%).

Для уравнения Fрасч = 2,48981E-07 (меньше 0,0001). Неравенство выполняется. Уравнение в целом статистически незначимо.

Для статистически значимого линейного уравнения регрессии проверяется статистическая значимость оценок его параметров b0, b1 с помощью t_критерия Стъюдента. Выдвигается гипотеза Н0: параметр bj = 0 (j = 0, 1) (статистически незначим, случайно отличается от 0), при конкурирующей гипотезе Н1: параметр bj ? 0 (статистически значим, неслучайно отличается от 0). Находится расчетное значение критерия

,

где средние квадратические ошибки параметров bj равны

,

.

Теоретическое значение критерия tтабл находится по таблице критических значений распределения Стъюдента по уровню значимости б и числу степеней свободы k = n - p - 1 . Если tbj > tтабл , то гипотеза Н0 отвергается с вероятность ошибки б , т.е. оценка коэффициента регрессии bj признается статистически значимой, в противном случае (tbj < tтабл) - незначимой.

Табличное значение критерия для уровня значимости б=0,05 и числа степеней свободы k = n - 2 = 51 равно.

Найдем доверительные интервалы для параметров b0 и b1 уравнения (1).

?b0= tтабл·mb0=2,007·5,0636=10,1626;

?b1 = tтабл·mb1 =2,007·7,0059=14,0608.

Сами доверительные интервалы имеют вид:

;

.

Проверка критерия Стъюдента

Уравнение регрессии

Параметр уравнения bj

Среднеквадратическая ошибка параметра

Расчетное значение критерия

Табличное значение критерия tтабл

Вывод о статистической значимости

Границы доверительных интервалов

левая

правая

b0

5,0636

1,576

2,007

незначим

b1

7,0059

0,002

незначим

13,9202

Доверительный интервал для параметра b1 и b2 имеет разные знаки, что подтверждает вывод критерия Стъюдента о его статистической незначимости.

Коэффициент корреляции находится по формуле:

Из таблицы «Вывод итогов» (см. приложение )

Следовательно, между признаками существует прямая слабая линейная регрессионная зависимость.

Коэффициент детерминации для пары признаков y и x1:

- вариация признака y.

Т.е. всего 13,39% изменчивости «y» объясняется показателем «x». А остальные 86,61% приходится на другие факторы, не учтённые в модели.

2. Нелинейная регрессия

2.1 Степенное уравнение регрессии

1. Построим уравнения степенной нелинейной регрессии вида для пар переменных y, x.

Нахождение модели парной регрессии сводится к оценке уравнения в целом и по параметрам (b0, b1). Для оценки параметров однофакторной модели используют метод наименьших квадратов (МНК). В МНК получается, что сумма квадратов отклонений фактических значений показателя у от теоретических ух минимальна

Сущность нелинейных уравнений заключается в приведении их к линейному виду и как при линейных уравнениях решается система относительно коэффициентов b0 и b1.

Рисунок 3 Линия регрессии на корреляционном поле. Ось ординат - значения y(Производительность труда), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)

Рисунок 4 Линия регрессии на корреляционном поле. Ось ординат - значения y(степ.функция), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)

Найдем среднюю относительную ошибку аппроксимации по формуле:

.

Полученное значение между 20% и 50%, что свидетельствует о существенности удовлетворительного отклонения расчетных данных от фактических, по которым построена эконометрическая модель.

Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Расчетное значение критерия находится по формуле:

.

Для парного уравнения p = 1.

Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора по уровню значимости по уровню значимости б и двум числам степеней свободы k1 = p = 1 и k2 = n - p - 1 = 51.

.

Если Fрасч<Fтабл,

то гипотеза принимается, а уравнение линейной регрессии в целом считается статистически незначимым (с вероятностью ошибки 5%).Для уравнения Fрасч = 0,01609). Неравенство выполняется. Уравнение в целом статистически незначимо.

Теснота нелинейной корреляционной связи определяется с помощью корреляционных отношений (индекс корреляции).

Коэффициент детерминации:

Индекс корреляции находится в промежутке 0<0,999842<1. Он имеет тесную связь, т.к. близок к 1-е. Коэффициент детерминации 99,9 % . На столько вариация признака «y» объясняется изменчивостью «x».

2.2 Гиперболическое уравнение регрессии

1. Построим уравнения гиперболической нелинейной регрессии вида для пар переменных y, x.

Нахождение модели парной регрессии сводится к оценке уравнения в целом и по параметрам (b0, b1). Для оценки параметров однофакторной модели используют метод наименьших квадратов (МНК). В МНК получается, что сумма квадратов отклонений фактических значений показателя у от теоретических ух минимальна

Сущность нелинейных уравнений заключается в приведении их к линейному виду и как при линейных уравнениях решается система относительно коэффициентов b0 и b1.

Рисунок 5 Линия регрессии на корреляционном поле. Ось ординат - значения y(Производительность труда), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)

Найдем среднюю относительную ошибку аппроксимации по формуле:

.

Полученное значение между 20% и 50%, что свидетельствует о существенности удовлетворительного отклонения расчетных данных от фактических, по которым построена эконометрическая модель.

Рисунок 6 Линия регрессии на корреляционном поле. Ось ординат - значения y(гиперб. функция), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)

Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Расчетное значение критерия находится по формуле:

.

Для парного уравнения p = 1.

Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора по уровню значимости по уровню значимости б и двум числам степеней свободы k1 = p = 1 и k2 = n - p - 1 = 51.

.

Если Fрасч<Fтабл,

то гипотеза принимается, а уравнение линейной регрессии в целом считается статистически незначимым (с вероятностью ошибки 5%).Для уравнения Fрасч = 0,00061). Неравенство выполняется. Уравнение в целом статистически незначимо.

Теснота нелинейной корреляционной связи определяется с помощью корреляционных отношений (индекс корреляции).

Коэффициент детерминации:

Индекс корреляции находится в промежутке 0<0,999999<1. Он имеет тесную связь, т.к. близок к 1-е.

Коэффициент детерминации 99,9 % . На столько вариация признака «y» объясняется изменчивостью «x».

Показательное уравнение регрессии нельзя построить

B1 имеет значение -0.014066, т.е. отрицательное. Весь массив переменной “x” имеет «коридор» значений от 0,6 до 0,9. Следовательно возведение в степень приведёт к квадратному корню. В основании корня лежит отрицательное число. Подробнее на последней странице отчёта.

2.2 Показательное уравнение регрессии

1. Построим уравнения показательной нелинейной регрессии вида для пар переменных y, x.

Нахождение модели парной регрессии сводится к оценке уравнения в целом и по параметрам (b0, b1). Для оценки параметров однофакторной модели используют метод наименьших квадратов (МНК). В МНК получается, что сумма квадратов отклонений фактических значений показателя у от теоретических ух минимальна.

Рисунок 7 Линия регрессии на корреляционном поле. Ось ординат - значения y(Производительность труда), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)

Сущность нелинейных уравнений заключается в приведении их к линейному виду и как при линейных уравнениях решается система относительно коэффициентов b0 и b1.

Найдем среднюю относительную ошибку аппроксимации по формуле:

.

Полученное значение между 20% и 50%, что свидетельствует о существенности удовлетворительного отклонения расчетных данных от фактических, по которым построена эконометрическая модель.

Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Расчетное значение критерия находится по формуле:

.

Для парного уравнения p = 1.

Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора по уровню значимости по уровню значимости б и двум числам степеней свободы k1 = p = 1 и k2 = n - p - 1 = 51.

.

Если Fрасч<Fтабл,

то гипотеза принимается, а уравнение линейной регрессии в целом считается статистически незначимым (с вероятностью ошибки 5%).Для уравнения Fрасч = 1,39). Неравенство выполняется. Уравнение в целом статистически незначимо.

Теснота нелинейной корреляционной связи определяется с помощью корреляционных отношений (индекс корреляции).

Коэффициент детерминации:

Индекс корреляции находится в промежутке 0<0,999999<1. Он имеет тесную связь, т.к. близок к 1-е.

Коэффициент детерминации 99,9 % . На столько вариация признака «y» объясняется изменчивостью «x».

3. Линейная, степенная, гиперболическая регрессия в одном корреляционном поле

3.1 Гиперболическая регрессия имеет индекс корреляции и коэффициент детерминации

Она имеет очень тесную связь. Коэффициент детерминации 99,99 % . На столько вариация признака «y» объясняется изменчивостью «x».

3.2 Степенная регрессия имеет индекс корреляции и коэффициент детерминации

Она имеет очень тесную связь (слабее гиперболической регрессии). Коэффициент детерминации 99,96 % . Настолько вариация признака «y» объясняется изменчивостью «x».

3.3 Линейная регрессия

Следовательно, между признаками существует прямая слабая линейная регрессионная зависимость.

Коэффициент детерминации для пары признаков y и x1:

- вариация признака y.

Т.е. всего 13,39% изменчивости «y» объясняется показателем «x». А остальные 86,61% приходится на другие факторы, не учтённые в модели.

4. Приложения уравнений парной регрессии

4.1 По линейному уравнению регрессии найти прогнозное значение признака Y при прогнозном значении X , составляющем 105% от его среднего уровня, оценить точность прогноза по стандартной ошибке и доверительному интервалу

Найдем прогнозное значение yпр путем подстановки значения x1пр в уравнение регрессии

xпр = 0,7354*1,05 = 0,7721

Стандартную ошибку прогноза найдем по формуле

= 56,96 2,67

Доверительный интервал прогнозного значения имеет вид

, или

(2,6111; 13,32855).

Определим с помощью коэффициентов эластичности силу влияния признаков xj на результирующий признак y.

Для парного линейного уравнения регрессии средний коэффициент эластичности находится по формуле:

Для признаков y и x1 уравнение регрессии имеет вид

Фактор «Удельный вес рабочих составе ППП» в (X) оказывает слабое влияние на величину экономической преступности (Y): при его росте на 1% средняя производительность труда увеличивается всего на 0,001%.

Частные коэффициенты эластичности находятся по формулам

.

Расчеты эластичности приведены таблице

Таблица Exel

Xi

Эластичность(xi)

1

0,78

0,259299302

2

0,75

0,251837843

3

0,68

0,233829099

4

0,7

0,239062316

5

0,62

0,217688464

6

0,76

0,254341643

7

0,73

0,246779458

8

0,71

0,241652207

9

0,69

0,236454674

10

0,73

0,246779458

11

0,68

0,233829099

12

0,74

0,249317172

13

0,66

0,228523403

14

0,72

0,244224528

15

0,68

0,233829099

16

0,77

0,25682874

17

0,78

0,259299302

18

0,78

0,259299302

19

0,81

0,266613403

20

0,79

0,261753491

21

0,77

0,25682874

22

0,78

0,259299302

23

0,72

0,244224528

24

0,79

0,261753491

25

0,77

0,25682874

26

0,8

0,264191472

27

0,71

0,241652207

28

0,79

0,261753491

29

0,76

0,254341643

30

0,78

0,259299302

31

0,62

0,217688464

32

0,75

0,251837843

33

0,71

0,241652207

34

0,74

0,249317172

35

0,65

0,225842903

36

0,66

0,228523403

37

0,84

0,273784469

38

0,74

0,249317172

39

0,75

0,251837843

40

0,75

0,251837843

41

0,79

0,261753491

42

0,72

0,244224528

43

0,7

0,239062316

44

0,66

0,228523403

45

0,69

0,236454674

46

0,71

0,241652207

47

0,73

0,246779458

48

0,65

0,225842903

49

0,82

0,269019443

50

0,8

0,264191472

51

0,83

0,271409747

52

0,7

0,239062316

53

0,74

0,249317172

Сумма

38,98

13,14

Среднее значение

0,735471698

0,247931082

Размещено на Allbest.ru


Подобные документы

  • Вероятностное обоснование метода наименьших квадратов как наилучшей оценки. Прямая и обратная регрессии. Общая линейная модель. Многофакторные модели. Доверительные интервалы для оценок метода наименьших квадратов. Определение минимума невязки.

    реферат [383,7 K], добавлен 19.08.2015

  • Изучение аппроксимации таблично заданной функции методом наименьших квадратов при помощи вычислительной системы Mathcad. Исходные данные и функция, вычисляющая матрицу коэффициентов систему уравнений. Выполнение вычислений для разных порядков полинома.

    лабораторная работа [166,4 K], добавлен 13.04.2016

  • Методы решений иррациональных уравнений. Метод замены переменных. Линейные комбинации двух и более радикалов. Уравнение с одним радикалом. Умножение на сопряженное выражение. Метод решения уравнений путем выделения полных квадратов под знаком радикала.

    контрольная работа [116,6 K], добавлен 15.02.2016

  • Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.

    презентация [100,3 K], добавлен 16.12.2014

  • Численные методы решения систем линейных уравнений: Гаусса, простой итерации, Зейделя. Методы аппроксимации и интерполяции функций: неопределенных коэффициентов, наименьших квадратов. Решения нелинейных уравнений и вычисление определенных интегралов.

    курсовая работа [322,7 K], добавлен 27.04.2011

  • Неизвестная функция, ее производные и независимые переменные - элементы дифференциального уравнения. Семейство численных алгоритмов решения обыкновенных дифференциальных уравнений, их систем. Методы наименьших квадратов, золотого сечения, прямоугольников.

    контрольная работа [138,9 K], добавлен 08.01.2016

  • Описание методов решения системы линейного алгебраического уравнения: обратной матрицы, Якоби, Гаусса-Зейделя. Постановка и решение задачи интерполяции. Подбор полиномиальной зависимости методом наименьших квадратов. Особенности метода релаксации.

    лабораторная работа [4,9 M], добавлен 06.12.2011

  • Основные виды линейных интегральных уравнений. Метод последовательных приближений, моментов, наименьших квадратов и коллокации. Решение интегральное уравнение методом конечных сумм и методом моментов. Ненулевые решения однородной линейной системы.

    контрольная работа [288,4 K], добавлен 23.10.2013

  • Сортировка размера пенсии по возрастанию прожиточного минимума. Параметры уравнений парных регрессий. Значения параметров логарифмической регрессии. Оценка гетероскедастичности линейного уравнения с помощью проведения теста ранговой корреляции Спирмена.

    контрольная работа [178,0 K], добавлен 23.11.2013

  • Анализ влияния радиуса кривошипа на величину максимальной температуры рабочего тела в цилиндре двигателя. Получение функциональной зависимости между данными величинами методом наименьших квадратов. Проверка работоспособности регрессионной модели.

    контрольная работа [57,1 K], добавлен 23.09.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.