Линейная парная регрессия

Порядок вычисления параметров и построения поля корреляции и эмпирической линии регрессии. Расчет значимости коэффициентов регрессии с помощью t-статистики Стьюдента, определение доверительных интервалов, коэффициентов детерминации и корреляции.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 27.09.2011
Размер файла 87,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Вариант 11: Имеются данные о деятельности крупнейших компаний в течение 12 месяцев. Известны - чистый доход У (у.е.)и оборот компании Х(у.е.)

Месяц

Вариант 11

У

Х

1

6,6

6,9

2

3,0

18,0

3

6,5

107,9

4

3,3

16,7

5

0,1

76,6

6

3,6

16,2

7

2,4

18,8

8

3,0

35,3

9

1,8

13,8

10

2,4

64,8

11

1,6

30,4

12

1,4

12,1

Вариант 21: Имеются данные о величине национального продукта Y (у.е.) в зависимости от инвестиций X (у.е.)

i

Вариант 21

Y

X

1

6,6

83,6

2

3,0

6,5

3

6,5

50,4

4

3,3

15,4

5

0,1

29,6

6

3,6

13,3

7

2,4

11,2

8

3,0

16,4

9

1,8

6,5

10

2,4

22,7

11

1,6

15,8

12

1,4

9,3

Линейная парная регрессия

Предполагается, что генеральное уравнение регрессии - линейное:

Для исходных данных, приведенных в задаче, требуется

1. Построить поле корреляции (на отдельном листе), сформулировать гипотезу о форме связи и построить эмпирическую линию регрессии (линию тренда).

2. Найти оценки b0 и b1 параметров модели парной линейной регрессии .

3. С надежностью 0,95 проверить значимость оценок b0 и b1 теоретических коэффициентов регрессии с помощью t-статистики Стьюдента и сделать соответствующие выводы о значимости этих оценок.

4. С надежностью 0,95 определить интервальные оценки теоретических коэффициентов регрессии.

5. Определить коэффициент детерминации R2 и коэффициент корреляции rxy сделать соответствующие выводы о качестве уравнения регрессии.

6. Проверить при уровне значимости 0,05 значимость уравнения регрессии с помощью F статистики Фишера и сделать соответствующие выводы о значимости уравнения регрессии.

7. Оцените с помощью средней ошибки аппроксимации качество уравнения регрессии.

8. Рассчитайте прогнозное значение результата Yp, если прогнозное значение фактора Xр увеличится на 15% от его среднего уровня.

9. С уровнем значимости 0,05 определить интервальную оценку условного математического ожидания Уp для вычисленного Хp .

10. С надежностью 0,95 определить доверительный интервал значения Уp для вычисленного значения Хp.

11. Найдите основные регрессионные характеристики используя функцию Регрессия (У,Х) из надстройки "Анализ данных". Уровень надежности установить 95%. Запомните ( или подпишите) основные характеристики регрессии.

Задача

В качестве примера рассмотрим зависимость между сменной добычей угля одного рабочего У (тонн) и мощностью Х пласта (в метрах) по данным, приведенным в таблице 1

Таблица 1

i

1

2

3

4

5

6

7

8

9

10

хi

8

9,5

11

12

13

14

15

16,5

17

18

yi

14

16

18

20

23

23,5

25

26,5

28,5

30,5

Для исходных данных, приведенных в таблице 1, требуется:

1. Построить поле корреляции (на отдельном листе), сформулировать гипотезу о форме связи и построить эмпирическую линию регрессии (линию тренда).

2. Найти оценки b0 и b1 параметров модели парной линейной регрессии .

3. С надежностью 0,95 проверить значимость оценок b0 и b1 теоретических коэффициентов регрессии с помощью t-статистики Стьюдента и сделать соответствующие выводы о значимости этих оценок.

4. С надежностью 0,95 определить интервальные оценки теоретических коэффициентов регрессии и сделать соответствующие выводы о значимости этих оценок.

5. Определить коэффициент детерминации R2 и коэффициент корреляции rxy сделать соответствующие выводы о качестве уравнения регрессии.

6. Проверить при уровне значимости 0,05 значимость уравнения регрессии с помощью F статистики Фишера и сделать соответствующие выводы о значимости уравнения регрессии.

7. Оцените с помощью средней ошибки аппроксимации качество уравнения.

8. Рассчитайте прогнозное значение результата Yp, если прогнозное значение фактора Xр увеличится на 10% от его среднего уровня.

9. С уровнем значимости 0,05 определить интервальную оценку условного математического ожидания Уp для вычисленного Хp .

10. С надежностью 0,95 определить доверительный интервал значения Уp для вычисленного значения Хp.

11. Найдите основные регрессионные характеристики используя функцию Регрессия (У,Х) из надстройки "Анализ данных". Уровень надежности установить 95%. Запомните ( или подпишите) основные характеристики регрессии.

Решение

Порядок вычислений с использованием MS Excel: Вычисляем параметры, которые приведены в таблице 2. В таблице 2 первые три столбца включают исходные данные. В четвертом, пятом и шестом столбцах выполняются операции умножения столбцов XY, возведения значений столбца X и Y в квадрат. Для каждого из столбцов с номерами 2, 3, 4, 5 и 6 подсчитывается их суммы и средние значения. Результаты расчетов величин приведены в столбце 7. Величина остаточной (необъяснимой) ошибки вычисляется по формуле и приведена в столбце 8. В столбцах 10 и 11, 12 и 13, 14 и 15 приведены значения центрированных величин, квадраты центрированных величин:

.

Столбец 16 используется для вычисления средней ошибки аппроксимации А.

Суммы и средние значения записываются в строки 11 и 12.

Решение.

1. Построим поле корреляции (на отдельном листе) и сформулируем гипотезу о форме связи, предполагая, что генеральное уравнение регрессии - линейное:

2. Найдем оценки b0 и b1 параметров модели парной линейной регрессии по следующим формулам:

Тогда уравнение эмпирической линии регрессии (линии тренда) имеет вид:

y = 1,6254x + 0,7199

3. С надежностью 0,95 проверим значимость оценок b0 и b1 теоретических коэффициентов регрессии с помощью t-статистики Стьюдента и сделаем соответствующие выводы о значимости этих оценок.

Для уровня значимости =0,05 и числа степеней свободы к=n-2=10-2=8 критерий Стьюдента (см таблица распределения Стьюдента ) равен

Дисперсии средние квадратичные отклонения коэффициентов b0 и b1 уравнения регрессии определим из равенств с использованием результатов табл. 2.

Для определения статистической значимости коэффициентов b0 и b1 найдем t - статистики Стьюдента:

Сравнение расчетных и табличных величин критерия Стьюдента показывает, что или и или 25,4774>2,306, т.е.с надежностью 0,95 оценка b0 теоретического коэффициента регрессии 0 статистически незначима, оценка b1 теоретического коэффициента регрессии 1 статистически значима.

4. С надежностью 0,95 определим интервальные оценки теоретических коэффициентов регрессии и сделаем соответствующие выводы о значимости этих оценок.

Доверительные интервалы для этих коэффициентов равны:

Подставив числовые значения, значения коэффициентов b0 и b1, их средние квадратичные отклонения и значение для t имеем:

Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента 0 статистически незначима.

Так как точка 0 (ноль) не лежит внутри доверительного интервала, то интервальная оценка коэффициента 1 статистически значима.

5. Определим коэффициент детерминации R2 и коэффициент корреляции rxy и сделаем соответствующие выводы о качестве уравнения регрессии.

Определяем дисперсии и средние квадратичные отклонения независимого X и результативного Y факторов:

Тесноту связи между переменными X и Y определяем через ковариацию и коэффициент корреляции.

Величина rxy=0,9939 , близка к 1, что характеризует тесную линейную связь между независимым и результативным признаками.

Для определения коэффициента детерминации воспользуемся результатами расчетов таблицы 2.

По таблице 2 найдем:

· общую ошибку (столбец 13):

· ошибку объясняемую регрессией (столбец 15)

· остаточную ошибку (столбец 9)

Причем имеем TSS=RSS+ESS

Тогда коэффициент детерминации равен

Полученная величина коэффициента детерминации свидетельствует о том, что необъясненная ошибка составляет менее 2 процентов от общей ошибки.

6. Проверим при уровне значимости 0,05 значимость уравнения регрессии с помощью F статистики Фишера и сделаем соответствующие выводы о значимости уравнения регрессии.

Статистика Фишера вычисляется по формуле: .

Имеем F = (261,28/3,2203)·8=649,0826.

Найдем для заданной доверительной вероятности 0,05 критическое значение статистики Фишера:

По таблице .

Имеем F > Fкр, поэтому уравнение значимо с надежностью 0,95.

7. Оценим с помощью средней ошибки аппроксимации качество уравнения регрессиии.

A=1/10·(0,0198 + 0,0101 + 0,0333 + 0,0112 + 0,0500 + 0,0011 + 0,0040 + 0,0392 + 0,0052 + 0,0172)·100% =1,91%.

Судя по величине средней ошибки, качество уравнения регрессии очень хорошее.

корреляция регрессия детерминация

8. Рассчитаем прогнозное значение результата Yp, если прогнозное значение фактора Xр увеличится на 10% от его среднего уровня.

Хр = 1,10*Хср = 1,1*13,4 = 14,74.

Прогнозируемую величину yp определяем из равенства:

9. С уровнем значимости 0,05 определим интервальную оценку условного математического ожидания Уp для вычисленного значения Хp.

Дисперсия математического ожидания прогнозируемой величины yp равна

Среднее квадратичное отклонение математического ожидания прогнозируемой величины равно

С уровнем значимости =0,05 доверительный интервал для условного математического ожидания yp при данном xp равен:

или

.

10. С надежностью 0,95 определим доверительный интервал значения Уp для вычисленного значения Хp

Имеем

Дисперсия конкретного значения прогнозируемой величины yp равна

Среднее квадратичное отклонение ожидаемой прогнозируемой величины yp равно

Тогда получим,

или 23,1311 yp 26,2253.

11. Найдем основные регрессионные характеристики используя функцию Регрессия (У,Х) из надстройки "Анализ данных". Уровень надежности установим 95%.

Регрессионный анализ с использованием процедуры «Регрессия»

Для реализации процедуры «Регрессия» необходимо;

1. Ввести исходные данные Х и У, расположив , например, их в столбцах А и В, начиная с ячеек А2 и В2, соответственно.

2. Выполнить команду Сервис/Анализ данных.

3. В появившимся диалоговом окне Анализ данных в списке Инструментов анализа выбрать строку Регрессия, указав курсором мыши и левой кнопкой мыши, затем нажать кнопку ОК.

4. В появившемся диалоговом окне Регрессия задать Входной интервал У, то есть ввести ссылку на диапазон анализируемых зависимых данных, содержащих один столбец данных. Для этого следует навести указатель мыши на верхнюю ячейку столбца зависимых данных, нажав левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши.

5. Указать Входной интервал X, то есть ввести ссылку на диапазон независимых данных, содержащий столбец анализируемых независимых данных. Для этого следует навести указатель мыши на поле ввода Входной интервал X и щелкнуть левой кнопкой мыши. Затем навести указатель мыши на верхнюю левую ячейку диапазона независимых данных, нажать левую кнопку мыши и, не отпуская ее протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши.

6. Установить флажок уровень надежности.

7. Установить флажок Остатки

8. Указать в Параметры вывода в Выходном интервале, например, ячейку D2.

9. Если необходимо визуально проверить отличие экспериментальных точек от предсказанных по регрессионной модели, следует установить флажок в поле График подбора.(не установлен)

8. Нажать кнопку ОК.

Интерпретируем полученные результаты .

В шаблоне Дисперсионный анализ оценивает общее качество полученной модели; её достоверность по уровню значимости критерия Фишера и коэффициент детерминации.

Коэффициенты модели определяются в столбце Коэффициенты: в строке Y- коэффициент b0, в строке X- коэффициент при независимой переменной b1.

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,9939

R-квадрат

0,9878

Нормированный R-квадрат

0,9863

Стандартная ошибка

0,6345

Наблюдения

10

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

261,2797

261,2797

649,0820

6,03762E-09

Остаток

8

3,2203

0,402537285

Итого

9

264,5

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

0,7199

0,87818

0,8198

0,4360

-1,3050

2,7449

Переменная X 1

1,62537

0,06380

25,4770

6,03762E-09

1,4783

1,7725

Таблица 2

x

y

xy

x^2

y^2

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

1

8

14

112

64

196

13,7229

0,2771

0,0768

-5,4

29,16

-8,5

72,25

-8,7771

77,0368

0,0198

2

9,5

16

152

90,25

256

16,1610

-0,1610

0,0259

-3,9

15,21

-6,5

42,25

-6,3390

40,1828

0,0101

3

11

18

198

121

324

18,5991

-0,5991

0,3589

-2,4

5,76

-4,5

20,25

-3,9009

15,2172

0,0333

4

12

20

240

144

400

20,2245

-0,2245

0,0504

-1,4

1,96

-2,5

6,25

-2,2755

5,1781

0,0112

5

13

23

299

169

529

21,8498

1,1502

1,3229

-0,4

0,16

0,5

0,25

-0,6502

0,4227

0,0500

6

14

23,5

329

196

552,25

23,4752

0,0248

0,0006

0,6

0,36

1

1

0,9752

0,9511

0,0011

7

15

25

375

225

625

25,1006

-0,1006

0,0101

1,6

2,56

2,5

6,25

2,6006

6,7631

0,0040

8

16,5

26,5

437,25

272,25

702,25

27,5387

-1,0387

1,0788

3,1

9,61

4

16

5,0387

25,3882

0,0392

9

17

28,5

484,5

289

812,25

28,3514

0,1486

0,0221

3,6

12,96

6

36

5,8514

34,2384

0,0052

10

18

30,5

549

324

930,25

29,9767

0,5233

0,2738

4,6

21,16

8

64

7,4767

55,9016

0,0172

ЎЖ

134

225

3176

1895

5327

3,22

0,00

98,9

0,00

264,5

0,00

261,2800

0,1910

Ср.знач

13,4

22,5

317,6

189,5

532,7

9,89

26,45

26,12800

0,0191

bo

0,7199

b1

1,6254

Размещено на Allbest.ru


Подобные документы

  • Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.

    контрольная работа [110,4 K], добавлен 28.07.2012

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [3,6 M], добавлен 29.05.2010

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.

    лабораторная работа [890,1 K], добавлен 06.12.2014

  • Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.

    лабораторная работа [30,9 K], добавлен 05.12.2010

  • Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.

    контрольная работа [155,8 K], добавлен 11.12.2010

  • Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.

    лабораторная работа [67,8 K], добавлен 26.12.2010

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [914,4 K], добавлен 01.12.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.