Расчет корреляции и регрессии

Расчет оценки параметров уравнения парной линейной регрессии. Оценка тесноты связи между признаками с помощью выборочного коэффициента корреляции. Построение доверительного интервала для коэффициента регрессии. Осуществление дисперсионного анализа.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 16.03.2017
Размер файла 198,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

6

Содержание

1. Условие задачи

2. Решение задачи

3. Таблица ответов

Список использованной литературы

1. Условие задачи

По 10 странам Западной Европы имеются следующие данные: Х - доля расходов домашних хозяйств на конечное потребление, % к ВВП; Y - индекс развития человеческого потенциала, %. Признаки Х и Y имеют нормальный закон распределения.

Х

57

67

78

64

83

75

88

61

71

82

Y

0,71

0,80

0,95

0,77

0,95

0,89

0,99

0,80

0,86

0,95

регрессия линейный корреляция дисперсионный

Задание

1. Постройте поле корреляции и сформулируйте гипотезу о форме связи между долей расходов домашних хозяйств на конечное потребление и индексом развития человеческого потенциала.

2. Рассчитайте оценки параметров , уравнения парной линейной регрессии.

3. Оцените тесноту связи между признаками с помощью выборочного коэффициента корреляции (rв). Проверьте значимость коэффициента корреляции (б = 0,05).

4. Рассчитайте выборочный коэффициент детерминации (R2в). Сделайте экономический вывод.

5. Проверьте значимость оценки параметра с помощью критерия Стьюдента при уровне значимости б = 0,05.

6. Постройте 95-процентный доверительный интервал для коэффициента регрессии b. Сделайте экономический вывод.

7. Проверьте значимость оценки параметра с помощью критерия Стьюдента при уровне значимости б = 0,05.

8. Постройте 95-процентный доверительный интервал для свободного члена уравнения а.

9. Составьте таблицу дисперсионного анализа.

10. Оцените с помощью F-критерия Фишера - Снедекора значимость уравнения линейной регрессии (б = 0,05).

11. Рассчитайте индекс развития человеческого потенциала (), если расходы домашних хозяйств составят 80% к ВВП. Постройте 95-процентный доверительный интервал для прогнозного значения объясняемой переменной (). Сделайте экономический вывод.

12. Рассчитайте средний коэффициент эластичности (). Сделайте экономический вывод.

13. Проверьте гипотезу Н0: b = b0, (b0 = 0,01).

14. На поле корреляции постройте линию регрессии.

2. Решение задачи

1. Построим поле корреляции и сформулируем гипотезу о форме связи между признаками:

Х - доля расходов домашних хозяйств на конечное потребление (%))

У - индекс развития человеческого потенциала (%)

Рис. 1 Поле корреляции

По расположению точек на поле корреляции можно предположить наличие прямой линейной связи между долей расходов домашних хозяйств на конечное потребление и индексом развития человеческого потенциала.

2. Рассчитаем оценки параметров линейной связи модели у=а+bx+е методом наименьших квадратов (МНК). Оценкой модели по выборке является выборочное уравнение регрессии .

Составим таблицу 1, которую будем заполнять расчетами по мере решения задачи.

Таблица 1

п/п

xi

yi

x2i

xi*yi

y2i

1

2

3

4

5

6

7

8

9

10

11

1

57

0,71

3 249

40,47

0,50

0,73

0,0003335

0,0192486

0,0246490

243,36

2

67

0,8

4 489

53,60

0,64

0,82

0,0002957

0,0024804

0,0044890

31,36

3

78

0,95

6 084

74,10

0,90

0,92

0,0012232

0,0023064

0,0068890

29,16

4

64

0,77

4 096

49,28

0,59

0,79

0,0004209

0,0058499

0,0094090

73,96

5

83

0,95

6 889

78,85

0,90

0,96

0,0000901

0,0085549

0,0068890

108,16

6

75

0,89

5 625

66,75

0,79

0,89

0,0000027

0,0004556

0,0005290

5,76

7

88

0,99

7 744

87,12

0,98

1,00

0,0001949

0,0187582

0,0151290

237,16

8

61

0,8

3 721

48,80

0,64

0,76

0,0013079

0,0106430

0,0044890

134,56

9

71

0,86

5 041

61,06

0,74

0,85

0,0000523

0,0002025

0,0000490

2,56

10

82

0,95

6 724

77,90

0,90

0,95

0,0000004

0,0069888

0,0068890

88,36

Итого

726

8,67

53 662

637,93

7,60

8,67

0,0039216

0,0754884

0,0794100

954,40

Заполним столбцы 3 и 4 в таблице 1.

Найдем оценки параметров и из системы нормальных уравнений линейной зависимости, которая имеет вид:

Отсюда можно выразить и :

Необходимые суммы рассчитаны в таблице 1 столбцах 1-4.

Занесем полученные ответы в таблицу 4. Подставим рассчитанные значения и в уравнение (1) и запишем линейную модель в виде:

3. Оценим тесноту взаимосвязи между признаками с помощью выборочного коэффициента корреляции:

Заполним столбец 5 и подставим рассчитанные суммы из таблицы 1.

Проверим значимость выборочного коэффициента корреляции. Для этого выдвигаем нулевую гипотезу Н0 об отсутствии линейной зависимости между признаками Х и У:

Н0: rген = 0

Н1: rген ? 0

Конкурирующая гипотеза Н1 определяет двустороннюю критическую область.

Данная гипотеза проверяется с помощью случайной величины , которая имеет распределение Стьюдента с k=n-2=10-2=8 степенями свободы.

По выборочным данным найдем:

По таблице критических точек распределения Стьюдента находим:

Построим график распределения Стьюдента (Рис. 2) и сравним и Тн.

Рис. 2 График плотности распределения Стьюдента

Т.к. , то Тн попало в критическую область, следовательно, нулевая гипотеза об отсутствии линейной связи между долей расходов домашних хозяйств на конечное потребление и индексом развития человеческого потенциала при 5%-ном уровне значимости отвергается, справедлива конкурирующая гипотеза Н1: rген ? 0, rв значим, признаки Х и У коррелированны.

Коэффициент корреляции rв по модулю близок к 1, значит, связь между признаками тесная, rв > 0, следовательно, между признаками существует прямая зависимость, что подтверждается экономической теорией.

4. Рассчитаем выборочный коэффициент детерминации . Для этого возведем коэффициент корреляции rв в квадрат:

Коэффициент детерминации характеризует вариацию признака У, объясненную линейным уравнением регрессии.

Таким образом, в среднем 95,06% вариации индекса развития человеческого потенциала объясняется вариацией долей расходов домашних хозяйств на конечное потребление, а 4,94% зависит от вариации неучтенных в модели факторов.

5. Проверим значимость оценки параметра регрессии с помощью критерия Стьюдента. Выдвигаем нулевую гипотезу о незначимости коэффициента регрессии:

Н0: b = 0

Н1: b ? 0

Конкурирующая гипотеза Н1 определяет двустороннюю критическую область.

Данная гипотеза проверяется с помощью случайной величины , которая имеет распределение Стьюдента с k=n-2=10-2=8 степенями свободы.

Заполним столбцы 6 и 7 таблицы 1.

Предварительно найдем стандартную ошибку коэффициента регрессии по формуле:

, где - это несмещенная оценка остаточной дисперсии ,

Тогда стандартная ошибка регрессии:

Дисперсия фактора Х вычисляется по формуле:

Итак,

Найдем наблюдаемое значение критерия Стьюдента:

По таблице критических точек распределения Стьюдента находим:

Построим график распределения Стьюдента (Рис. 3) и сравним и Тн.

Рис. 3 График плотности распределения Стьюдента

Т.к. , то Тн попало в критическую область, следовательно, нулевая гипотеза о незначимости коэффициента регрессии отвергается при 5%-ном уровне значимости, справедлива конкурирующая гипотеза Н1: b ? 0, оценка параметра статистически значима, признаки Х и У взаимосвязаны.

Таким образом, если доля расходов домашних хозяйств на конечное потребление увеличится на 1% в ВВП, то индекс развития человеческого потенциала увеличится в среднем на 0,0089%.

6. Построим доверительный интервал для коэффициента регрессии b:

Подставим ранее рассчитанные значения , , :

Таким образом, при увеличении расходов домашних хозяйств на конечное потребление увеличится на 1% в ВВП индекс развития человеческого потенциала увеличится в среднем с 0,0072 до 0,011 %.

7. Проверим значимость оценки параметра регрессии с помощью критерия Стьюдента. Выдвигаем нулевую гипотезу о незначимости свободного члена уравнения:

Н0: a = 0

Н1: a ? 0

Конкурирующая гипотеза Н1 определяет двустороннюю критическую область.

Данная гипотеза проверяется с помощью случайной величины , которая имеет распределение Стьюдента с k=n-2=10-2=8 степенями свободы.

Предварительно найдем стандартную ошибку по формуле:

Найдем наблюдаемое значение критерия Стьюдента:

По таблице критических точек распределения Стьюдента находим:

Построим график распределения Стьюдента (Рис. 4) и сравним и Тн.

Рис. 4 График плотности распределения Стьюдента

Т.к. , то Тн попало в критическую область, следовательно, нулевая гипотеза о незначимости свободного члена при 105%-ном уровне значимости отвергается. Оценка параметра статистически значима.

8. Построим доверительный интервал для коэффициента регрессии a:

Подставим ранее рассчитанные значения , , :

Границы доверительного интервала имеют одинаковые знаки, линейную модель оставляем в общем виде:

9. Составим таблицу дисперсионного анализа по общей схеме.

Таблица 2

Источник вариации

Число степеней свободы

Суммы квадратов отклонений

Средние квадраты

Fн

df

SS

MS

F-статистика

Регрессия

1

Остаток

n-2

Итого

n-1

Сначала найдем среднее значение признака У:

Затем в таблице 1 заполним столбцы 8 и 9.

- регрессионная сумма квадратов отклонений.

- остаточная сумма квадратов отклонений.

- общая сумма квадратов отклонений.

F-статистика рассчитана по формуле:

Таблица 3

Источник вариации

Число степеней свободы

Суммы квадратов отклонений

Средние квадраты

Fн

df

SS

MS

F-статистика

Регрессия

1

0,0750

0,0075

153,8

Остаток

8

0,0039

0,0004

Итого

9

0,0790

10. Оценим значимость линейной модели в целом при 5%-ном уровне значимости. Выдвигаем нулевую гипотезу о незначимости линейной модели:

Н0: модель незначима

Н1: модель значима

Конкурирующая гипотеза Н1 определяет правостороннюю критическую область.

Данная гипотеза проверяется с помощью случайной величины F, которая имеет распределение Фишера-Снедекора с k1=1 и k2=n-2=10-2=8 степенями свободы.

Наблюдаемое значение критерия берем из схемы дисперсионного анализа: Fн=153,8.

Критическое значение критерия находим в таблице критических точек Фишера-Снедекора:

Построим график распределения Фишера-Снедекора (Рис. 5) и сравним и Fн.

Рис. 5 График плотности распределения Фишера-Снедекора

Т.к. , то Fн попало в критическую область, следовательно, нулевая гипотеза о незначимости линейной модели при 5%-ном уровне значимости отвергается, справедлива конкурирующая гипотеза Н1. Модель значима и ее можно использовать для прогноза.

11. Рассчитаем индекс развития человеческого потенциала (), если доля расходов домашних хозяйств на конечное потребление составит 80% к ВВП: х0=80.

Для этого подставим х0 в уравнение регрессии:

Таким образом, если доля расходов домашних хозяйств на конечное потребление составит 80% к ВВП, то индекс развития человеческого потенциала составит 0,933%.

Построим 95%-ный доверительный интервал прогноза:

Предварительно заполним столбец 10 таблицы 1 и найдем стандартную ошибку прогноза :

, где

Итак,

Подставим значения в формулу доверительного интервала:

Таким образом, если доля расходов домашних хозяйств на конечное потребление составит 80% к ВВП, то индекс развития человеческого потенциала будет колебаться в среднем от 0,878 до 0,988 %.

12. Найдем средний коэффициент эластичности:

Таким образом, с увеличением доли расходов домашних хозяйств на конечное потребление на 1% объем индекс развития человеческого потенциала увеличивается в среднем на 0,745%.

13. Проверим гипотезу о равенстве параметра b некоторому теоретическому значению b0. Например: b0=0,009.

Н0: b = 0,009

Н1: b ? 0,009

Конкурирующая гипотеза Н1 определяет двустороннюю критическую область.

Данная гипотеза проверяется с помощью случайной величины , которая имеет распределение Стьюдента с k=n-2=10-2=8 степенями свободы.

Заполним столбцы 6 и 7 таблицы 1.

Стандартная ошибка коэффициента регрессии:

По выборочным данным:

По таблице критических точек распределения Стьюдента находим:

Построим график распределения Стьюдента (Рис. 6) и сравним и .

Рис. 6 График плотности распределения Стьюдента

Т.к. , то попало в область принятия гипотезы, следовательно, нулевая гипотеза о равенстве параметра b некоторому теоретическому значению b0 при 5%-ном уровне значимости принимается.

Таким образом, b и b0 различаются несущественно, незначимо, случайно.

14. На поле корреляции построим график уравнения линейной регрессии (Рис. 1).

Графиком является прямая, которую можно построить по данным столбцов 1 (xi) и 6 ().

3. Таблица ответов

Оценки

Стандартные ошибки (s)

Тн

Доверительные интервалы

Нижняя граница

Верхняя граница

Свободный член а

0,221

= 0,052

4,21

0,1003

0,342

Коэффициент регрессии b

0,0089

= 0,00072

12,41

0,0072

0,011

Прогноз y0

0,933

= 0,0238

0,878

0,988

Уравнение регрессии

0,221+0,0089

= 0,221

Список использованной литературы

1. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс [Текст]: Учеб. 6-е изд., перераб. и доп. М.: Дело, 2004. 576 с.

2. Практикум по эконометрике [Текст]: Учебное пособие / И.И Елисеева [и др.]; под ред. И.И. Елисеевой. УМО, 2-е изд. перераб. и доп. М.: Финансы и статистика, 2010. 344 с.: ил.

3. Соколов Г.А. Эконометрика: теоретические основы [Текст]: Учебное пособие. М.: ИНФРА-М, 2015. 216 с.

4. Суханова Е.И., Ширяева Л.К. Начальный курс эконометрики: руководство к решению задач [Текст]: Учебное пособие / Суханова Е.И., Ширяева Л.К., Л. К. Ширяева. УМО. Самара: СГЭУ, 2006. 192 с.

Размещено на Allbest.ru


Подобные документы

  • Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.

    контрольная работа [157,9 K], добавлен 06.08.2010

  • Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.

    лабораторная работа [100,5 K], добавлен 02.06.2014

  • Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.

    контрольная работа [71,7 K], добавлен 17.09.2016

  • Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.

    контрольная работа [817,3 K], добавлен 01.04.2010

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.

    контрольная работа [155,8 K], добавлен 11.12.2010

  • Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.

    контрольная работа [250,5 K], добавлен 11.04.2015

  • Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.

    контрольная работа [222,5 K], добавлен 08.05.2014

  • Исследование зависимости часового заработка одного рабочего от общего стажа работы после окончания учебы с помощью построения уравнения парной линейной регрессии. Вычисление описательных статистик. Построение поля корреляции и гипотезы о форме связи.

    контрольная работа [226,6 K], добавлен 11.08.2015

  • Поиск несмещенных оценок математического ожидания и для дисперсии X и Y. Расчет выборочного коэффициента корреляции, анализ степени тесноты связи между X и Y. Проверка гипотезы о силе линейной связи между X и Y, о значении параметров линейной регрессии.

    контрольная работа [19,2 K], добавлен 25.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.