Парная регрессия и корреляция
Регрессионный анализ как статистический метод исследования влияния одной или нескольких независимых переменных на зависимую переменную. Индекс корреляции и коэффициент детерминации. Методы наименьших квадратов. Пути решения системы нормальных уравнений.
Рубрика | Математика |
Вид | практическая работа |
Язык | русский |
Дата добавления | 07.11.2014 |
Размер файла | 1,5 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Московский государственный университет путей сообщений
Институт экономики и финансов
Практическая работа
«Парная регрессия и корреляция»
по дисциплине: «Эконометрика»
Исходные данные регрессионный корреляция детерминация
Результативный признак y=1. Факторный признак x=5
№ |
Xi(Удельный вес рабочих в составе ППП) |
Yi(Производительность труда) |
|
1 |
0,78 |
9,26 |
|
2 |
0,75 |
9,38 |
|
3 |
0,68 |
12,11 |
|
4 |
0,7 |
10,81 |
|
5 |
0,62 |
9,35 |
|
6 |
0,76 |
9,87 |
|
7 |
0,73 |
8,17 |
|
8 |
0,71 |
9,12 |
|
9 |
0,69 |
5,88 |
|
10 |
0,73 |
6,3 |
|
11 |
0,68 |
6,22 |
|
12 |
0,74 |
5,49 |
|
13 |
0,66 |
6,5 |
|
14 |
0,72 |
6,61 |
|
15 |
0,68 |
4,32 |
|
16 |
0,77 |
7,37 |
|
17 |
0,78 |
7,02 |
|
18 |
0,78 |
8,25 |
|
19 |
0,81 |
8,15 |
|
20 |
0,79 |
8,72 |
|
21 |
0,77 |
6,64 |
|
22 |
0,78 |
8,1 |
|
23 |
0,72 |
5,52 |
|
24 |
0,79 |
9,37 |
|
25 |
0,77 |
13,17 |
|
26 |
0,8 |
6,67 |
|
27 |
0,71 |
5,68 |
|
28 |
0,79 |
5,22 |
|
29 |
0,76 |
10,02 |
|
30 |
0,78 |
8,16 |
|
31 |
0,62 |
3,78 |
|
32 |
0,75 |
6,48 |
|
33 |
0,71 |
10,44 |
|
34 |
0,74 |
7,65 |
|
35 |
0,65 |
8,77 |
|
36 |
0,66 |
7 |
|
37 |
0,84 |
11,06 |
|
38 |
0,74 |
9,02 |
|
39 |
0,75 |
13,28 |
|
40 |
0,75 |
9,27 |
|
41 |
0,79 |
6,7 |
|
42 |
0,72 |
6,69 |
|
43 |
0,7 |
9,42 |
|
44 |
0,66 |
7,24 |
|
45 |
0,69 |
5,39 |
|
46 |
0,71 |
5,61 |
|
47 |
0,73 |
5,59 |
|
48 |
0,65 |
6,57 |
|
49 |
0,82 |
6,54 |
|
50 |
0,8 |
4,23 |
|
51 |
0,83 |
5,22 |
|
52 |
0,7 |
18 |
|
53 |
0,74 |
11,03 |
|
Сумма |
38,98 |
422,43 |
|
Среднее значение |
0,735471698 |
7,970377358 |
1. Линейная регрессия
Построим уравнения парной линейной регрессии вида для пар переменных y, x.
Параметры b0 и b1 уравнения линейной регрессии рассчитываются методом наименьших квадратов путем решения системы нормальных уравнений:
Для нахождения параметров b0 и b1 используем ППП «Анализ данных» MS Excel. Результаты расчетов приведены в приложениях
Уравнения регрессии имеют вид:
Для пары признаков y, x
Рисунок 1. Линия регрессии на корреляционном поле. Ось ординат - значения y(Производительность труда), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)
Рисунок 2 Линия регрессии на корреляционном поле. Ось ординат - значения y(лин. регрессия), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)
Оценим каждое уравнение регрессии через среднюю ошибку аппроксимации и F-критерий Фишера, t-критерий Стьюдента.
Найдем среднюю относительную ошибку аппроксимации по формуле:
.
Полученное значение между 20% и 50%, что свидетельствует о существенности удовлетворительного отклонения расчетных данных от фактических, по которым построена эконометрическая модель.
Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Расчетное значение критерия находится по формуле:
.
Для парного уравнения p = 1.
Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора по уровню значимости по уровню значимости б и двум числам степеней свободы k1 = p = 1 и k2 = n - p - 1 = 51.
.
Если Fрасч<Fтабл,
то гипотеза принимается, а уравнение линейной регрессии в целом считается статистически незначимым (с вероятностью ошибки 5%).
Для уравнения Fрасч = 2,48981E-07 (меньше 0,0001). Неравенство выполняется. Уравнение в целом статистически незначимо.
Для статистически значимого линейного уравнения регрессии проверяется статистическая значимость оценок его параметров b0, b1 с помощью t_критерия Стъюдента. Выдвигается гипотеза Н0: параметр bj = 0 (j = 0, 1) (статистически незначим, случайно отличается от 0), при конкурирующей гипотезе Н1: параметр bj ? 0 (статистически значим, неслучайно отличается от 0). Находится расчетное значение критерия
,
где средние квадратические ошибки параметров bj равны
,
.
Теоретическое значение критерия tтабл находится по таблице критических значений распределения Стъюдента по уровню значимости б и числу степеней свободы k = n - p - 1 . Если tbj > tтабл , то гипотеза Н0 отвергается с вероятность ошибки б , т.е. оценка коэффициента регрессии bj признается статистически значимой, в противном случае (tbj < tтабл) - незначимой.
Табличное значение критерия для уровня значимости б=0,05 и числа степеней свободы k = n - 2 = 51 равно.
Найдем доверительные интервалы для параметров b0 и b1 уравнения (1).
?b0= tтабл·mb0=2,007·5,0636=10,1626;
?b1 = tтабл·mb1 =2,007·7,0059=14,0608.
Сами доверительные интервалы имеют вид:
;
.
Проверка критерия Стъюдента
Уравнение регрессии |
|||||||
Параметр уравнения bj |
Среднеквадратическая ошибка параметра |
Расчетное значение критерия |
Табличное значение критерия tтабл |
Вывод о статистической значимости |
Границы доверительных интервалов |
||
левая |
правая |
||||||
b0 |
5,0636 |
1,576 |
2,007 |
незначим |
|||
b1 |
7,0059 |
0,002 |
незначим |
13,9202 |
Доверительный интервал для параметра b1 и b2 имеет разные знаки, что подтверждает вывод критерия Стъюдента о его статистической незначимости.
Коэффициент корреляции находится по формуле:
Из таблицы «Вывод итогов» (см. приложение )
Следовательно, между признаками существует прямая слабая линейная регрессионная зависимость.
Коэффициент детерминации для пары признаков y и x1:
- вариация признака y.
Т.е. всего 13,39% изменчивости «y» объясняется показателем «x». А остальные 86,61% приходится на другие факторы, не учтённые в модели.
2. Нелинейная регрессия
2.1 Степенное уравнение регрессии
1. Построим уравнения степенной нелинейной регрессии вида для пар переменных y, x.
Нахождение модели парной регрессии сводится к оценке уравнения в целом и по параметрам (b0, b1). Для оценки параметров однофакторной модели используют метод наименьших квадратов (МНК). В МНК получается, что сумма квадратов отклонений фактических значений показателя у от теоретических ух минимальна
Сущность нелинейных уравнений заключается в приведении их к линейному виду и как при линейных уравнениях решается система относительно коэффициентов b0 и b1.
Рисунок 3 Линия регрессии на корреляционном поле. Ось ординат - значения y(Производительность труда), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)
Рисунок 4 Линия регрессии на корреляционном поле. Ось ординат - значения y(степ.функция), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)
Найдем среднюю относительную ошибку аппроксимации по формуле:
.
Полученное значение между 20% и 50%, что свидетельствует о существенности удовлетворительного отклонения расчетных данных от фактических, по которым построена эконометрическая модель.
Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Расчетное значение критерия находится по формуле:
.
Для парного уравнения p = 1.
Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора по уровню значимости по уровню значимости б и двум числам степеней свободы k1 = p = 1 и k2 = n - p - 1 = 51.
.
Если Fрасч<Fтабл,
то гипотеза принимается, а уравнение линейной регрессии в целом считается статистически незначимым (с вероятностью ошибки 5%).Для уравнения Fрасч = 0,01609). Неравенство выполняется. Уравнение в целом статистически незначимо.
Теснота нелинейной корреляционной связи определяется с помощью корреляционных отношений (индекс корреляции).
Коэффициент детерминации:
Индекс корреляции находится в промежутке 0<0,999842<1. Он имеет тесную связь, т.к. близок к 1-е. Коэффициент детерминации 99,9 % . На столько вариация признака «y» объясняется изменчивостью «x».
2.2 Гиперболическое уравнение регрессии
1. Построим уравнения гиперболической нелинейной регрессии вида для пар переменных y, x.
Нахождение модели парной регрессии сводится к оценке уравнения в целом и по параметрам (b0, b1). Для оценки параметров однофакторной модели используют метод наименьших квадратов (МНК). В МНК получается, что сумма квадратов отклонений фактических значений показателя у от теоретических ух минимальна
Сущность нелинейных уравнений заключается в приведении их к линейному виду и как при линейных уравнениях решается система относительно коэффициентов b0 и b1.
Рисунок 5 Линия регрессии на корреляционном поле. Ось ординат - значения y(Производительность труда), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)
Найдем среднюю относительную ошибку аппроксимации по формуле:
.
Полученное значение между 20% и 50%, что свидетельствует о существенности удовлетворительного отклонения расчетных данных от фактических, по которым построена эконометрическая модель.
Рисунок 6 Линия регрессии на корреляционном поле. Ось ординат - значения y(гиперб. функция), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)
Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Расчетное значение критерия находится по формуле:
.
Для парного уравнения p = 1.
Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора по уровню значимости по уровню значимости б и двум числам степеней свободы k1 = p = 1 и k2 = n - p - 1 = 51.
.
Если Fрасч<Fтабл,
то гипотеза принимается, а уравнение линейной регрессии в целом считается статистически незначимым (с вероятностью ошибки 5%).Для уравнения Fрасч = 0,00061). Неравенство выполняется. Уравнение в целом статистически незначимо.
Теснота нелинейной корреляционной связи определяется с помощью корреляционных отношений (индекс корреляции).
Коэффициент детерминации:
Индекс корреляции находится в промежутке 0<0,999999<1. Он имеет тесную связь, т.к. близок к 1-е.
Коэффициент детерминации 99,9 % . На столько вариация признака «y» объясняется изменчивостью «x».
Показательное уравнение регрессии нельзя построить
B1 имеет значение -0.014066, т.е. отрицательное. Весь массив переменной “x” имеет «коридор» значений от 0,6 до 0,9. Следовательно возведение в степень приведёт к квадратному корню. В основании корня лежит отрицательное число. Подробнее на последней странице отчёта.
2.2 Показательное уравнение регрессии
1. Построим уравнения показательной нелинейной регрессии вида для пар переменных y, x.
Нахождение модели парной регрессии сводится к оценке уравнения в целом и по параметрам (b0, b1). Для оценки параметров однофакторной модели используют метод наименьших квадратов (МНК). В МНК получается, что сумма квадратов отклонений фактических значений показателя у от теоретических ух минимальна.
Рисунок 7 Линия регрессии на корреляционном поле. Ось ординат - значения y(Производительность труда), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)
Сущность нелинейных уравнений заключается в приведении их к линейному виду и как при линейных уравнениях решается система относительно коэффициентов b0 и b1.
Найдем среднюю относительную ошибку аппроксимации по формуле:
.
Полученное значение между 20% и 50%, что свидетельствует о существенности удовлетворительного отклонения расчетных данных от фактических, по которым построена эконометрическая модель.
Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Расчетное значение критерия находится по формуле:
.
Для парного уравнения p = 1.
Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора по уровню значимости по уровню значимости б и двум числам степеней свободы k1 = p = 1 и k2 = n - p - 1 = 51.
.
Если Fрасч<Fтабл,
то гипотеза принимается, а уравнение линейной регрессии в целом считается статистически незначимым (с вероятностью ошибки 5%).Для уравнения Fрасч = 1,39). Неравенство выполняется. Уравнение в целом статистически незначимо.
Теснота нелинейной корреляционной связи определяется с помощью корреляционных отношений (индекс корреляции).
Коэффициент детерминации:
Индекс корреляции находится в промежутке 0<0,999999<1. Он имеет тесную связь, т.к. близок к 1-е.
Коэффициент детерминации 99,9 % . На столько вариация признака «y» объясняется изменчивостью «x».
3. Линейная, степенная, гиперболическая регрессия в одном корреляционном поле
3.1 Гиперболическая регрессия имеет индекс корреляции и коэффициент детерминации
Она имеет очень тесную связь. Коэффициент детерминации 99,99 % . На столько вариация признака «y» объясняется изменчивостью «x».
3.2 Степенная регрессия имеет индекс корреляции и коэффициент детерминации
Она имеет очень тесную связь (слабее гиперболической регрессии). Коэффициент детерминации 99,96 % . Настолько вариация признака «y» объясняется изменчивостью «x».
3.3 Линейная регрессия
Следовательно, между признаками существует прямая слабая линейная регрессионная зависимость.
Коэффициент детерминации для пары признаков y и x1:
- вариация признака y.
Т.е. всего 13,39% изменчивости «y» объясняется показателем «x». А остальные 86,61% приходится на другие факторы, не учтённые в модели.
4. Приложения уравнений парной регрессии
4.1 По линейному уравнению регрессии найти прогнозное значение признака Y при прогнозном значении X , составляющем 105% от его среднего уровня, оценить точность прогноза по стандартной ошибке и доверительному интервалу
Найдем прогнозное значение yпр путем подстановки значения x1пр в уравнение регрессии
xпр = 0,7354*1,05 = 0,7721
Стандартную ошибку прогноза найдем по формуле
= 56,96 2,67
Доверительный интервал прогнозного значения имеет вид
, или
(2,6111; 13,32855).
Определим с помощью коэффициентов эластичности силу влияния признаков xj на результирующий признак y.
Для парного линейного уравнения регрессии средний коэффициент эластичности находится по формуле:
Для признаков y и x1 уравнение регрессии имеет вид
Фактор «Удельный вес рабочих составе ППП» в (X) оказывает слабое влияние на величину экономической преступности (Y): при его росте на 1% средняя производительность труда увеличивается всего на 0,001%.
Частные коэффициенты эластичности находятся по формулам
.
Расчеты эластичности приведены таблице
Таблица Exel
№ |
Xi |
Эластичность(xi) |
|
1 |
0,78 |
0,259299302 |
|
2 |
0,75 |
0,251837843 |
|
3 |
0,68 |
0,233829099 |
|
4 |
0,7 |
0,239062316 |
|
5 |
0,62 |
0,217688464 |
|
6 |
0,76 |
0,254341643 |
|
7 |
0,73 |
0,246779458 |
|
8 |
0,71 |
0,241652207 |
|
9 |
0,69 |
0,236454674 |
|
10 |
0,73 |
0,246779458 |
|
11 |
0,68 |
0,233829099 |
|
12 |
0,74 |
0,249317172 |
|
13 |
0,66 |
0,228523403 |
|
14 |
0,72 |
0,244224528 |
|
15 |
0,68 |
0,233829099 |
|
16 |
0,77 |
0,25682874 |
|
17 |
0,78 |
0,259299302 |
|
18 |
0,78 |
0,259299302 |
|
19 |
0,81 |
0,266613403 |
|
20 |
0,79 |
0,261753491 |
|
21 |
0,77 |
0,25682874 |
|
22 |
0,78 |
0,259299302 |
|
23 |
0,72 |
0,244224528 |
|
24 |
0,79 |
0,261753491 |
|
25 |
0,77 |
0,25682874 |
|
26 |
0,8 |
0,264191472 |
|
27 |
0,71 |
0,241652207 |
|
28 |
0,79 |
0,261753491 |
|
29 |
0,76 |
0,254341643 |
|
30 |
0,78 |
0,259299302 |
|
31 |
0,62 |
0,217688464 |
|
32 |
0,75 |
0,251837843 |
|
33 |
0,71 |
0,241652207 |
|
34 |
0,74 |
0,249317172 |
|
35 |
0,65 |
0,225842903 |
|
36 |
0,66 |
0,228523403 |
|
37 |
0,84 |
0,273784469 |
|
38 |
0,74 |
0,249317172 |
|
39 |
0,75 |
0,251837843 |
|
40 |
0,75 |
0,251837843 |
|
41 |
0,79 |
0,261753491 |
|
42 |
0,72 |
0,244224528 |
|
43 |
0,7 |
0,239062316 |
|
44 |
0,66 |
0,228523403 |
|
45 |
0,69 |
0,236454674 |
|
46 |
0,71 |
0,241652207 |
|
47 |
0,73 |
0,246779458 |
|
48 |
0,65 |
0,225842903 |
|
49 |
0,82 |
0,269019443 |
|
50 |
0,8 |
0,264191472 |
|
51 |
0,83 |
0,271409747 |
|
52 |
0,7 |
0,239062316 |
|
53 |
0,74 |
0,249317172 |
|
Сумма |
38,98 |
13,14 |
|
Среднее значение |
0,735471698 |
0,247931082 |
Размещено на Allbest.ru
Подобные документы
Вероятностное обоснование метода наименьших квадратов как наилучшей оценки. Прямая и обратная регрессии. Общая линейная модель. Многофакторные модели. Доверительные интервалы для оценок метода наименьших квадратов. Определение минимума невязки.
реферат [383,7 K], добавлен 19.08.2015Изучение аппроксимации таблично заданной функции методом наименьших квадратов при помощи вычислительной системы Mathcad. Исходные данные и функция, вычисляющая матрицу коэффициентов систему уравнений. Выполнение вычислений для разных порядков полинома.
лабораторная работа [166,4 K], добавлен 13.04.2016Методы решений иррациональных уравнений. Метод замены переменных. Линейные комбинации двух и более радикалов. Уравнение с одним радикалом. Умножение на сопряженное выражение. Метод решения уравнений путем выделения полных квадратов под знаком радикала.
контрольная работа [116,6 K], добавлен 15.02.2016Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.
презентация [100,3 K], добавлен 16.12.2014Численные методы решения систем линейных уравнений: Гаусса, простой итерации, Зейделя. Методы аппроксимации и интерполяции функций: неопределенных коэффициентов, наименьших квадратов. Решения нелинейных уравнений и вычисление определенных интегралов.
курсовая работа [322,7 K], добавлен 27.04.2011Неизвестная функция, ее производные и независимые переменные - элементы дифференциального уравнения. Семейство численных алгоритмов решения обыкновенных дифференциальных уравнений, их систем. Методы наименьших квадратов, золотого сечения, прямоугольников.
контрольная работа [138,9 K], добавлен 08.01.2016Описание методов решения системы линейного алгебраического уравнения: обратной матрицы, Якоби, Гаусса-Зейделя. Постановка и решение задачи интерполяции. Подбор полиномиальной зависимости методом наименьших квадратов. Особенности метода релаксации.
лабораторная работа [4,9 M], добавлен 06.12.2011Основные виды линейных интегральных уравнений. Метод последовательных приближений, моментов, наименьших квадратов и коллокации. Решение интегральное уравнение методом конечных сумм и методом моментов. Ненулевые решения однородной линейной системы.
контрольная работа [288,4 K], добавлен 23.10.2013Сортировка размера пенсии по возрастанию прожиточного минимума. Параметры уравнений парных регрессий. Значения параметров логарифмической регрессии. Оценка гетероскедастичности линейного уравнения с помощью проведения теста ранговой корреляции Спирмена.
контрольная работа [178,0 K], добавлен 23.11.2013Анализ влияния радиуса кривошипа на величину максимальной температуры рабочего тела в цилиндре двигателя. Получение функциональной зависимости между данными величинами методом наименьших квадратов. Проверка работоспособности регрессионной модели.
контрольная работа [57,1 K], добавлен 23.09.2010