Линейная парная регрессия
Порядок вычисления параметров и построения поля корреляции и эмпирической линии регрессии. Расчет значимости коэффициентов регрессии с помощью t-статистики Стьюдента, определение доверительных интервалов, коэффициентов детерминации и корреляции.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 27.09.2011 |
Размер файла | 87,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Вариант 11: Имеются данные о деятельности крупнейших компаний в течение 12 месяцев. Известны - чистый доход У (у.е.)и оборот компании Х(у.е.)
Месяц |
Вариант 11 |
||
У |
Х |
||
1 |
6,6 |
6,9 |
|
2 |
3,0 |
18,0 |
|
3 |
6,5 |
107,9 |
|
4 |
3,3 |
16,7 |
|
5 |
0,1 |
76,6 |
|
6 |
3,6 |
16,2 |
|
7 |
2,4 |
18,8 |
|
8 |
3,0 |
35,3 |
|
9 |
1,8 |
13,8 |
|
10 |
2,4 |
64,8 |
|
11 |
1,6 |
30,4 |
|
12 |
1,4 |
12,1 |
Вариант 21: Имеются данные о величине национального продукта Y (у.е.) в зависимости от инвестиций X (у.е.)
i |
Вариант 21 |
||
Y |
X |
||
1 |
6,6 |
83,6 |
|
2 |
3,0 |
6,5 |
|
3 |
6,5 |
50,4 |
|
4 |
3,3 |
15,4 |
|
5 |
0,1 |
29,6 |
|
6 |
3,6 |
13,3 |
|
7 |
2,4 |
11,2 |
|
8 |
3,0 |
16,4 |
|
9 |
1,8 |
6,5 |
|
10 |
2,4 |
22,7 |
|
11 |
1,6 |
15,8 |
|
12 |
1,4 |
9,3 |
Линейная парная регрессия
Предполагается, что генеральное уравнение регрессии - линейное:
Для исходных данных, приведенных в задаче, требуется
1. Построить поле корреляции (на отдельном листе), сформулировать гипотезу о форме связи и построить эмпирическую линию регрессии (линию тренда).
2. Найти оценки b0 и b1 параметров модели парной линейной регрессии .
3. С надежностью 0,95 проверить значимость оценок b0 и b1 теоретических коэффициентов регрессии с помощью t-статистики Стьюдента и сделать соответствующие выводы о значимости этих оценок.
4. С надежностью 0,95 определить интервальные оценки теоретических коэффициентов регрессии.
5. Определить коэффициент детерминации R2 и коэффициент корреляции rxy сделать соответствующие выводы о качестве уравнения регрессии.
6. Проверить при уровне значимости 0,05 значимость уравнения регрессии с помощью F статистики Фишера и сделать соответствующие выводы о значимости уравнения регрессии.
7. Оцените с помощью средней ошибки аппроксимации качество уравнения регрессии.
8. Рассчитайте прогнозное значение результата Yp, если прогнозное значение фактора Xр увеличится на 15% от его среднего уровня.
9. С уровнем значимости 0,05 определить интервальную оценку условного математического ожидания Уp для вычисленного Хp .
10. С надежностью 0,95 определить доверительный интервал значения Уp для вычисленного значения Хp.
11. Найдите основные регрессионные характеристики используя функцию Регрессия (У,Х) из надстройки "Анализ данных". Уровень надежности установить 95%. Запомните ( или подпишите) основные характеристики регрессии.
Задача
В качестве примера рассмотрим зависимость между сменной добычей угля одного рабочего У (тонн) и мощностью Х пласта (в метрах) по данным, приведенным в таблице 1
Таблица 1
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
хi |
8 |
9,5 |
11 |
12 |
13 |
14 |
15 |
16,5 |
17 |
18 |
|
yi |
14 |
16 |
18 |
20 |
23 |
23,5 |
25 |
26,5 |
28,5 |
30,5 |
Для исходных данных, приведенных в таблице 1, требуется:
1. Построить поле корреляции (на отдельном листе), сформулировать гипотезу о форме связи и построить эмпирическую линию регрессии (линию тренда).
2. Найти оценки b0 и b1 параметров модели парной линейной регрессии .
3. С надежностью 0,95 проверить значимость оценок b0 и b1 теоретических коэффициентов регрессии с помощью t-статистики Стьюдента и сделать соответствующие выводы о значимости этих оценок.
4. С надежностью 0,95 определить интервальные оценки теоретических коэффициентов регрессии и сделать соответствующие выводы о значимости этих оценок.
5. Определить коэффициент детерминации R2 и коэффициент корреляции rxy сделать соответствующие выводы о качестве уравнения регрессии.
6. Проверить при уровне значимости 0,05 значимость уравнения регрессии с помощью F статистики Фишера и сделать соответствующие выводы о значимости уравнения регрессии.
7. Оцените с помощью средней ошибки аппроксимации качество уравнения.
8. Рассчитайте прогнозное значение результата Yp, если прогнозное значение фактора Xр увеличится на 10% от его среднего уровня.
9. С уровнем значимости 0,05 определить интервальную оценку условного математического ожидания Уp для вычисленного Хp .
10. С надежностью 0,95 определить доверительный интервал значения Уp для вычисленного значения Хp.
11. Найдите основные регрессионные характеристики используя функцию Регрессия (У,Х) из надстройки "Анализ данных". Уровень надежности установить 95%. Запомните ( или подпишите) основные характеристики регрессии.
Решение
Порядок вычислений с использованием MS Excel: Вычисляем параметры, которые приведены в таблице 2. В таблице 2 первые три столбца включают исходные данные. В четвертом, пятом и шестом столбцах выполняются операции умножения столбцов XY, возведения значений столбца X и Y в квадрат. Для каждого из столбцов с номерами 2, 3, 4, 5 и 6 подсчитывается их суммы и средние значения. Результаты расчетов величин приведены в столбце 7. Величина остаточной (необъяснимой) ошибки вычисляется по формуле и приведена в столбце 8. В столбцах 10 и 11, 12 и 13, 14 и 15 приведены значения центрированных величин, квадраты центрированных величин:
.
Столбец 16 используется для вычисления средней ошибки аппроксимации А.
Суммы и средние значения записываются в строки 11 и 12.
Решение.
1. Построим поле корреляции (на отдельном листе) и сформулируем гипотезу о форме связи, предполагая, что генеральное уравнение регрессии - линейное:
2. Найдем оценки b0 и b1 параметров модели парной линейной регрессии по следующим формулам:
Тогда уравнение эмпирической линии регрессии (линии тренда) имеет вид:
y = 1,6254x + 0,7199
3. С надежностью 0,95 проверим значимость оценок b0 и b1 теоретических коэффициентов регрессии с помощью t-статистики Стьюдента и сделаем соответствующие выводы о значимости этих оценок.
Для уровня значимости =0,05 и числа степеней свободы к=n-2=10-2=8 критерий Стьюдента (см таблица распределения Стьюдента ) равен
Дисперсии средние квадратичные отклонения коэффициентов b0 и b1 уравнения регрессии определим из равенств с использованием результатов табл. 2.
Для определения статистической значимости коэффициентов b0 и b1 найдем t - статистики Стьюдента:
Сравнение расчетных и табличных величин критерия Стьюдента показывает, что или и или 25,4774>2,306, т.е.с надежностью 0,95 оценка b0 теоретического коэффициента регрессии 0 статистически незначима, оценка b1 теоретического коэффициента регрессии 1 статистически значима.
4. С надежностью 0,95 определим интервальные оценки теоретических коэффициентов регрессии и сделаем соответствующие выводы о значимости этих оценок.
Доверительные интервалы для этих коэффициентов равны:
Подставив числовые значения, значения коэффициентов b0 и b1, их средние квадратичные отклонения и значение для t имеем:
Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента 0 статистически незначима.
Так как точка 0 (ноль) не лежит внутри доверительного интервала, то интервальная оценка коэффициента 1 статистически значима.
5. Определим коэффициент детерминации R2 и коэффициент корреляции rxy и сделаем соответствующие выводы о качестве уравнения регрессии.
Определяем дисперсии и средние квадратичные отклонения независимого X и результативного Y факторов:
Тесноту связи между переменными X и Y определяем через ковариацию и коэффициент корреляции.
Величина rxy=0,9939 , близка к 1, что характеризует тесную линейную связь между независимым и результативным признаками.
Для определения коэффициента детерминации воспользуемся результатами расчетов таблицы 2.
По таблице 2 найдем:
· общую ошибку (столбец 13):
· ошибку объясняемую регрессией (столбец 15)
· остаточную ошибку (столбец 9)
Причем имеем TSS=RSS+ESS
Тогда коэффициент детерминации равен
Полученная величина коэффициента детерминации свидетельствует о том, что необъясненная ошибка составляет менее 2 процентов от общей ошибки.
6. Проверим при уровне значимости 0,05 значимость уравнения регрессии с помощью F статистики Фишера и сделаем соответствующие выводы о значимости уравнения регрессии.
Статистика Фишера вычисляется по формуле: .
Имеем F = (261,28/3,2203)·8=649,0826.
Найдем для заданной доверительной вероятности 0,05 критическое значение статистики Фишера:
По таблице .
Имеем F > Fкр, поэтому уравнение значимо с надежностью 0,95.
7. Оценим с помощью средней ошибки аппроксимации качество уравнения регрессиии.
A=1/10·(0,0198 + 0,0101 + 0,0333 + 0,0112 + 0,0500 + 0,0011 + 0,0040 + 0,0392 + 0,0052 + 0,0172)·100% =1,91%.
Судя по величине средней ошибки, качество уравнения регрессии очень хорошее.
корреляция регрессия детерминация
8. Рассчитаем прогнозное значение результата Yp, если прогнозное значение фактора Xр увеличится на 10% от его среднего уровня.
Хр = 1,10*Хср = 1,1*13,4 = 14,74.
Прогнозируемую величину yp определяем из равенства:
9. С уровнем значимости 0,05 определим интервальную оценку условного математического ожидания Уp для вычисленного значения Хp.
Дисперсия математического ожидания прогнозируемой величины yp равна
Среднее квадратичное отклонение математического ожидания прогнозируемой величины равно
С уровнем значимости =0,05 доверительный интервал для условного математического ожидания yp при данном xp равен:
или
.
10. С надежностью 0,95 определим доверительный интервал значения Уp для вычисленного значения Хp
Имеем
Дисперсия конкретного значения прогнозируемой величины yp равна
Среднее квадратичное отклонение ожидаемой прогнозируемой величины yp равно
Тогда получим,
или 23,1311 yp 26,2253.
11. Найдем основные регрессионные характеристики используя функцию Регрессия (У,Х) из надстройки "Анализ данных". Уровень надежности установим 95%.
Регрессионный анализ с использованием процедуры «Регрессия»
Для реализации процедуры «Регрессия» необходимо;
1. Ввести исходные данные Х и У, расположив , например, их в столбцах А и В, начиная с ячеек А2 и В2, соответственно.
2. Выполнить команду Сервис/Анализ данных.
3. В появившимся диалоговом окне Анализ данных в списке Инструментов анализа выбрать строку Регрессия, указав курсором мыши и левой кнопкой мыши, затем нажать кнопку ОК.
4. В появившемся диалоговом окне Регрессия задать Входной интервал У, то есть ввести ссылку на диапазон анализируемых зависимых данных, содержащих один столбец данных. Для этого следует навести указатель мыши на верхнюю ячейку столбца зависимых данных, нажав левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши.
5. Указать Входной интервал X, то есть ввести ссылку на диапазон независимых данных, содержащий столбец анализируемых независимых данных. Для этого следует навести указатель мыши на поле ввода Входной интервал X и щелкнуть левой кнопкой мыши. Затем навести указатель мыши на верхнюю левую ячейку диапазона независимых данных, нажать левую кнопку мыши и, не отпуская ее протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши.
6. Установить флажок уровень надежности.
7. Установить флажок Остатки
8. Указать в Параметры вывода в Выходном интервале, например, ячейку D2.
9. Если необходимо визуально проверить отличие экспериментальных точек от предсказанных по регрессионной модели, следует установить флажок в поле График подбора.(не установлен)
8. Нажать кнопку ОК.
Интерпретируем полученные результаты .
В шаблоне Дисперсионный анализ оценивает общее качество полученной модели; её достоверность по уровню значимости критерия Фишера и коэффициент детерминации.
Коэффициенты модели определяются в столбце Коэффициенты: в строке Y- коэффициент b0, в строке X- коэффициент при независимой переменной b1.
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множественный R |
0,9939 |
||||||
R-квадрат |
0,9878 |
||||||
Нормированный R-квадрат |
0,9863 |
||||||
Стандартная ошибка |
0,6345 |
||||||
Наблюдения |
10 |
||||||
Дисперсионный анализ |
|||||||
|
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
261,2797 |
261,2797 |
649,0820 |
6,03762E-09 |
||
Остаток |
8 |
3,2203 |
0,402537285 |
||||
Итого |
9 |
264,5 |
|
|
|
||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
|
Y-пересечение |
0,7199 |
0,87818 |
0,8198 |
0,4360 |
-1,3050 |
2,7449 |
|
Переменная X 1 |
1,62537 |
0,06380 |
25,4770 |
6,03762E-09 |
1,4783 |
1,7725 |
|
Таблица 2
№ |
x |
y |
xy |
x^2 |
y^2 |
|||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
|
1 |
8 |
14 |
112 |
64 |
196 |
13,7229 |
0,2771 |
0,0768 |
-5,4 |
29,16 |
-8,5 |
72,25 |
-8,7771 |
77,0368 |
0,0198 |
|
2 |
9,5 |
16 |
152 |
90,25 |
256 |
16,1610 |
-0,1610 |
0,0259 |
-3,9 |
15,21 |
-6,5 |
42,25 |
-6,3390 |
40,1828 |
0,0101 |
|
3 |
11 |
18 |
198 |
121 |
324 |
18,5991 |
-0,5991 |
0,3589 |
-2,4 |
5,76 |
-4,5 |
20,25 |
-3,9009 |
15,2172 |
0,0333 |
|
4 |
12 |
20 |
240 |
144 |
400 |
20,2245 |
-0,2245 |
0,0504 |
-1,4 |
1,96 |
-2,5 |
6,25 |
-2,2755 |
5,1781 |
0,0112 |
|
5 |
13 |
23 |
299 |
169 |
529 |
21,8498 |
1,1502 |
1,3229 |
-0,4 |
0,16 |
0,5 |
0,25 |
-0,6502 |
0,4227 |
0,0500 |
|
6 |
14 |
23,5 |
329 |
196 |
552,25 |
23,4752 |
0,0248 |
0,0006 |
0,6 |
0,36 |
1 |
1 |
0,9752 |
0,9511 |
0,0011 |
|
7 |
15 |
25 |
375 |
225 |
625 |
25,1006 |
-0,1006 |
0,0101 |
1,6 |
2,56 |
2,5 |
6,25 |
2,6006 |
6,7631 |
0,0040 |
|
8 |
16,5 |
26,5 |
437,25 |
272,25 |
702,25 |
27,5387 |
-1,0387 |
1,0788 |
3,1 |
9,61 |
4 |
16 |
5,0387 |
25,3882 |
0,0392 |
|
9 |
17 |
28,5 |
484,5 |
289 |
812,25 |
28,3514 |
0,1486 |
0,0221 |
3,6 |
12,96 |
6 |
36 |
5,8514 |
34,2384 |
0,0052 |
|
10 |
18 |
30,5 |
549 |
324 |
930,25 |
29,9767 |
0,5233 |
0,2738 |
4,6 |
21,16 |
8 |
64 |
7,4767 |
55,9016 |
0,0172 |
|
ЎЖ |
134 |
225 |
3176 |
1895 |
5327 |
3,22 |
0,00 |
98,9 |
0,00 |
264,5 |
0,00 |
261,2800 |
0,1910 |
|||
Ср.знач |
13,4 |
22,5 |
317,6 |
189,5 |
532,7 |
9,89 |
26,45 |
26,12800 |
0,0191 |
|||||||
bo |
0,7199 |
|||||||||||||||
b1 |
1,6254 |
Размещено на Allbest.ru
Подобные документы
Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [3,6 M], добавлен 29.05.2010Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.
лабораторная работа [890,1 K], добавлен 06.12.2014Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.
лабораторная работа [30,9 K], добавлен 05.12.2010Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.
контрольная работа [155,8 K], добавлен 11.12.2010Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.
лабораторная работа [67,8 K], добавлен 26.12.2010Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.
контрольная работа [681,9 K], добавлен 03.08.2010Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [914,4 K], добавлен 01.12.2013