Расчет корреляции и регрессии
Расчет оценки параметров уравнения парной линейной регрессии. Оценка тесноты связи между признаками с помощью выборочного коэффициента корреляции. Построение доверительного интервала для коэффициента регрессии. Осуществление дисперсионного анализа.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 16.03.2017 |
Размер файла | 198,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
6
Содержание
1. Условие задачи
2. Решение задачи
3. Таблица ответов
Список использованной литературы
1. Условие задачи
По 10 странам Западной Европы имеются следующие данные: Х - доля расходов домашних хозяйств на конечное потребление, % к ВВП; Y - индекс развития человеческого потенциала, %. Признаки Х и Y имеют нормальный закон распределения.
Х |
57 |
67 |
78 |
64 |
83 |
75 |
88 |
61 |
71 |
82 |
|
Y |
0,71 |
0,80 |
0,95 |
0,77 |
0,95 |
0,89 |
0,99 |
0,80 |
0,86 |
0,95 |
регрессия линейный корреляция дисперсионный
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи между долей расходов домашних хозяйств на конечное потребление и индексом развития человеческого потенциала.
2. Рассчитайте оценки параметров , уравнения парной линейной регрессии.
3. Оцените тесноту связи между признаками с помощью выборочного коэффициента корреляции (rв). Проверьте значимость коэффициента корреляции (б = 0,05).
4. Рассчитайте выборочный коэффициент детерминации (R2в). Сделайте экономический вывод.
5. Проверьте значимость оценки параметра с помощью критерия Стьюдента при уровне значимости б = 0,05.
6. Постройте 95-процентный доверительный интервал для коэффициента регрессии b. Сделайте экономический вывод.
7. Проверьте значимость оценки параметра с помощью критерия Стьюдента при уровне значимости б = 0,05.
8. Постройте 95-процентный доверительный интервал для свободного члена уравнения а.
9. Составьте таблицу дисперсионного анализа.
10. Оцените с помощью F-критерия Фишера - Снедекора значимость уравнения линейной регрессии (б = 0,05).
11. Рассчитайте индекс развития человеческого потенциала (), если расходы домашних хозяйств составят 80% к ВВП. Постройте 95-процентный доверительный интервал для прогнозного значения объясняемой переменной (). Сделайте экономический вывод.
12. Рассчитайте средний коэффициент эластичности (). Сделайте экономический вывод.
13. Проверьте гипотезу Н0: b = b0, (b0 = 0,01).
14. На поле корреляции постройте линию регрессии.
2. Решение задачи
1. Построим поле корреляции и сформулируем гипотезу о форме связи между признаками:
Х - доля расходов домашних хозяйств на конечное потребление (%))
У - индекс развития человеческого потенциала (%)
Рис. 1 Поле корреляции
По расположению точек на поле корреляции можно предположить наличие прямой линейной связи между долей расходов домашних хозяйств на конечное потребление и индексом развития человеческого потенциала.
2. Рассчитаем оценки параметров линейной связи модели у=а+bx+е методом наименьших квадратов (МНК). Оценкой модели по выборке является выборочное уравнение регрессии .
Составим таблицу 1, которую будем заполнять расчетами по мере решения задачи.
Таблица 1
№ п/п |
xi |
yi |
x2i |
xi*yi |
y2i |
||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
|
1 |
57 |
0,71 |
3 249 |
40,47 |
0,50 |
0,73 |
0,0003335 |
0,0192486 |
0,0246490 |
243,36 |
|
2 |
67 |
0,8 |
4 489 |
53,60 |
0,64 |
0,82 |
0,0002957 |
0,0024804 |
0,0044890 |
31,36 |
|
3 |
78 |
0,95 |
6 084 |
74,10 |
0,90 |
0,92 |
0,0012232 |
0,0023064 |
0,0068890 |
29,16 |
|
4 |
64 |
0,77 |
4 096 |
49,28 |
0,59 |
0,79 |
0,0004209 |
0,0058499 |
0,0094090 |
73,96 |
|
5 |
83 |
0,95 |
6 889 |
78,85 |
0,90 |
0,96 |
0,0000901 |
0,0085549 |
0,0068890 |
108,16 |
|
6 |
75 |
0,89 |
5 625 |
66,75 |
0,79 |
0,89 |
0,0000027 |
0,0004556 |
0,0005290 |
5,76 |
|
7 |
88 |
0,99 |
7 744 |
87,12 |
0,98 |
1,00 |
0,0001949 |
0,0187582 |
0,0151290 |
237,16 |
|
8 |
61 |
0,8 |
3 721 |
48,80 |
0,64 |
0,76 |
0,0013079 |
0,0106430 |
0,0044890 |
134,56 |
|
9 |
71 |
0,86 |
5 041 |
61,06 |
0,74 |
0,85 |
0,0000523 |
0,0002025 |
0,0000490 |
2,56 |
|
10 |
82 |
0,95 |
6 724 |
77,90 |
0,90 |
0,95 |
0,0000004 |
0,0069888 |
0,0068890 |
88,36 |
|
Итого |
726 |
8,67 |
53 662 |
637,93 |
7,60 |
8,67 |
0,0039216 |
0,0754884 |
0,0794100 |
954,40 |
Заполним столбцы 3 и 4 в таблице 1.
Найдем оценки параметров и из системы нормальных уравнений линейной зависимости, которая имеет вид:
Отсюда можно выразить и :
Необходимые суммы рассчитаны в таблице 1 столбцах 1-4.
Занесем полученные ответы в таблицу 4. Подставим рассчитанные значения и в уравнение (1) и запишем линейную модель в виде:
3. Оценим тесноту взаимосвязи между признаками с помощью выборочного коэффициента корреляции:
Заполним столбец 5 и подставим рассчитанные суммы из таблицы 1.
Проверим значимость выборочного коэффициента корреляции. Для этого выдвигаем нулевую гипотезу Н0 об отсутствии линейной зависимости между признаками Х и У:
Н0: rген = 0
Н1: rген ? 0
Конкурирующая гипотеза Н1 определяет двустороннюю критическую область.
Данная гипотеза проверяется с помощью случайной величины , которая имеет распределение Стьюдента с k=n-2=10-2=8 степенями свободы.
По выборочным данным найдем:
По таблице критических точек распределения Стьюдента находим:
Построим график распределения Стьюдента (Рис. 2) и сравним и Тн.
Рис. 2 График плотности распределения Стьюдента
Т.к. , то Тн попало в критическую область, следовательно, нулевая гипотеза об отсутствии линейной связи между долей расходов домашних хозяйств на конечное потребление и индексом развития человеческого потенциала при 5%-ном уровне значимости отвергается, справедлива конкурирующая гипотеза Н1: rген ? 0, rв значим, признаки Х и У коррелированны.
Коэффициент корреляции rв по модулю близок к 1, значит, связь между признаками тесная, rв > 0, следовательно, между признаками существует прямая зависимость, что подтверждается экономической теорией.
4. Рассчитаем выборочный коэффициент детерминации . Для этого возведем коэффициент корреляции rв в квадрат:
Коэффициент детерминации характеризует вариацию признака У, объясненную линейным уравнением регрессии.
Таким образом, в среднем 95,06% вариации индекса развития человеческого потенциала объясняется вариацией долей расходов домашних хозяйств на конечное потребление, а 4,94% зависит от вариации неучтенных в модели факторов.
5. Проверим значимость оценки параметра регрессии с помощью критерия Стьюдента. Выдвигаем нулевую гипотезу о незначимости коэффициента регрессии:
Н0: b = 0
Н1: b ? 0
Конкурирующая гипотеза Н1 определяет двустороннюю критическую область.
Данная гипотеза проверяется с помощью случайной величины , которая имеет распределение Стьюдента с k=n-2=10-2=8 степенями свободы.
Заполним столбцы 6 и 7 таблицы 1.
Предварительно найдем стандартную ошибку коэффициента регрессии по формуле:
, где - это несмещенная оценка остаточной дисперсии ,
Тогда стандартная ошибка регрессии:
Дисперсия фактора Х вычисляется по формуле:
Итак,
Найдем наблюдаемое значение критерия Стьюдента:
По таблице критических точек распределения Стьюдента находим:
Построим график распределения Стьюдента (Рис. 3) и сравним и Тн.
Рис. 3 График плотности распределения Стьюдента
Т.к. , то Тн попало в критическую область, следовательно, нулевая гипотеза о незначимости коэффициента регрессии отвергается при 5%-ном уровне значимости, справедлива конкурирующая гипотеза Н1: b ? 0, оценка параметра статистически значима, признаки Х и У взаимосвязаны.
Таким образом, если доля расходов домашних хозяйств на конечное потребление увеличится на 1% в ВВП, то индекс развития человеческого потенциала увеличится в среднем на 0,0089%.
6. Построим доверительный интервал для коэффициента регрессии b:
Подставим ранее рассчитанные значения , , :
Таким образом, при увеличении расходов домашних хозяйств на конечное потребление увеличится на 1% в ВВП индекс развития человеческого потенциала увеличится в среднем с 0,0072 до 0,011 %.
7. Проверим значимость оценки параметра регрессии с помощью критерия Стьюдента. Выдвигаем нулевую гипотезу о незначимости свободного члена уравнения:
Н0: a = 0
Н1: a ? 0
Конкурирующая гипотеза Н1 определяет двустороннюю критическую область.
Данная гипотеза проверяется с помощью случайной величины , которая имеет распределение Стьюдента с k=n-2=10-2=8 степенями свободы.
Предварительно найдем стандартную ошибку по формуле:
Найдем наблюдаемое значение критерия Стьюдента:
По таблице критических точек распределения Стьюдента находим:
Построим график распределения Стьюдента (Рис. 4) и сравним и Тн.
Рис. 4 График плотности распределения Стьюдента
Т.к. , то Тн попало в критическую область, следовательно, нулевая гипотеза о незначимости свободного члена при 105%-ном уровне значимости отвергается. Оценка параметра статистически значима.
8. Построим доверительный интервал для коэффициента регрессии a:
Подставим ранее рассчитанные значения , , :
Границы доверительного интервала имеют одинаковые знаки, линейную модель оставляем в общем виде:
9. Составим таблицу дисперсионного анализа по общей схеме.
Таблица 2
Источник вариации |
Число степеней свободы |
Суммы квадратов отклонений |
Средние квадраты |
Fн |
|
df |
SS |
MS |
F-статистика |
||
Регрессия |
1 |
||||
Остаток |
n-2 |
||||
Итого |
n-1 |
Сначала найдем среднее значение признака У:
Затем в таблице 1 заполним столбцы 8 и 9.
- регрессионная сумма квадратов отклонений.
- остаточная сумма квадратов отклонений.
- общая сумма квадратов отклонений.
F-статистика рассчитана по формуле:
Таблица 3
Источник вариации |
Число степеней свободы |
Суммы квадратов отклонений |
Средние квадраты |
Fн |
|
df |
SS |
MS |
F-статистика |
||
Регрессия |
1 |
0,0750 |
0,0075 |
153,8 |
|
Остаток |
8 |
0,0039 |
0,0004 |
||
Итого |
9 |
0,0790 |
10. Оценим значимость линейной модели в целом при 5%-ном уровне значимости. Выдвигаем нулевую гипотезу о незначимости линейной модели:
Н0: модель незначима
Н1: модель значима
Конкурирующая гипотеза Н1 определяет правостороннюю критическую область.
Данная гипотеза проверяется с помощью случайной величины F, которая имеет распределение Фишера-Снедекора с k1=1 и k2=n-2=10-2=8 степенями свободы.
Наблюдаемое значение критерия берем из схемы дисперсионного анализа: Fн=153,8.
Критическое значение критерия находим в таблице критических точек Фишера-Снедекора:
Построим график распределения Фишера-Снедекора (Рис. 5) и сравним и Fн.
Рис. 5 График плотности распределения Фишера-Снедекора
Т.к. , то Fн попало в критическую область, следовательно, нулевая гипотеза о незначимости линейной модели при 5%-ном уровне значимости отвергается, справедлива конкурирующая гипотеза Н1. Модель значима и ее можно использовать для прогноза.
11. Рассчитаем индекс развития человеческого потенциала (), если доля расходов домашних хозяйств на конечное потребление составит 80% к ВВП: х0=80.
Для этого подставим х0 в уравнение регрессии:
Таким образом, если доля расходов домашних хозяйств на конечное потребление составит 80% к ВВП, то индекс развития человеческого потенциала составит 0,933%.
Построим 95%-ный доверительный интервал прогноза:
Предварительно заполним столбец 10 таблицы 1 и найдем стандартную ошибку прогноза :
, где
Итак,
Подставим значения в формулу доверительного интервала:
Таким образом, если доля расходов домашних хозяйств на конечное потребление составит 80% к ВВП, то индекс развития человеческого потенциала будет колебаться в среднем от 0,878 до 0,988 %.
12. Найдем средний коэффициент эластичности:
Таким образом, с увеличением доли расходов домашних хозяйств на конечное потребление на 1% объем индекс развития человеческого потенциала увеличивается в среднем на 0,745%.
13. Проверим гипотезу о равенстве параметра b некоторому теоретическому значению b0. Например: b0=0,009.
Н0: b = 0,009
Н1: b ? 0,009
Конкурирующая гипотеза Н1 определяет двустороннюю критическую область.
Данная гипотеза проверяется с помощью случайной величины , которая имеет распределение Стьюдента с k=n-2=10-2=8 степенями свободы.
Заполним столбцы 6 и 7 таблицы 1.
Стандартная ошибка коэффициента регрессии:
По выборочным данным:
По таблице критических точек распределения Стьюдента находим:
Построим график распределения Стьюдента (Рис. 6) и сравним и .
Рис. 6 График плотности распределения Стьюдента
Т.к. , то попало в область принятия гипотезы, следовательно, нулевая гипотеза о равенстве параметра b некоторому теоретическому значению b0 при 5%-ном уровне значимости принимается.
Таким образом, b и b0 различаются несущественно, незначимо, случайно.
14. На поле корреляции построим график уравнения линейной регрессии (Рис. 1).
Графиком является прямая, которую можно построить по данным столбцов 1 (xi) и 6 ().
3. Таблица ответов
Оценки |
Стандартные ошибки (s) |
Тн |
Доверительные интервалы |
|||
Нижняя граница |
Верхняя граница |
|||||
Свободный член а |
0,221 |
= 0,052 |
4,21 |
0,1003 |
0,342 |
|
Коэффициент регрессии b |
0,0089 |
= 0,00072 |
12,41 |
0,0072 |
0,011 |
|
Прогноз y0 |
0,933 |
= 0,0238 |
0,878 |
0,988 |
||
Уравнение регрессии |
0,221+0,0089 |
= 0,221 |
Список использованной литературы
1. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс [Текст]: Учеб. 6-е изд., перераб. и доп. М.: Дело, 2004. 576 с.
2. Практикум по эконометрике [Текст]: Учебное пособие / И.И Елисеева [и др.]; под ред. И.И. Елисеевой. УМО, 2-е изд. перераб. и доп. М.: Финансы и статистика, 2010. 344 с.: ил.
3. Соколов Г.А. Эконометрика: теоретические основы [Текст]: Учебное пособие. М.: ИНФРА-М, 2015. 216 с.
4. Суханова Е.И., Ширяева Л.К. Начальный курс эконометрики: руководство к решению задач [Текст]: Учебное пособие / Суханова Е.И., Ширяева Л.К., Л. К. Ширяева. УМО. Самара: СГЭУ, 2006. 192 с.
Размещено на Allbest.ru
Подобные документы
Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.
контрольная работа [157,9 K], добавлен 06.08.2010Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.
лабораторная работа [100,5 K], добавлен 02.06.2014Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.
контрольная работа [71,7 K], добавлен 17.09.2016Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.
контрольная работа [817,3 K], добавлен 01.04.2010Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.
контрольная работа [155,8 K], добавлен 11.12.2010Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.
контрольная работа [250,5 K], добавлен 11.04.2015Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.
контрольная работа [222,5 K], добавлен 08.05.2014Исследование зависимости часового заработка одного рабочего от общего стажа работы после окончания учебы с помощью построения уравнения парной линейной регрессии. Вычисление описательных статистик. Построение поля корреляции и гипотезы о форме связи.
контрольная работа [226,6 K], добавлен 11.08.2015Поиск несмещенных оценок математического ожидания и для дисперсии X и Y. Расчет выборочного коэффициента корреляции, анализ степени тесноты связи между X и Y. Проверка гипотезы о силе линейной связи между X и Y, о значении параметров линейной регрессии.
контрольная работа [19,2 K], добавлен 25.12.2010