Анализ данных в линейной регрессионной модели
Основные особенности построения таблицы частот с использованием графической группировки данных. Характеристика и сущность нанесения графики выборочных регрессионных прямых на диаграмму рассеивания. Получение уравнения выборочной линейной регрессии.
Рубрика | Экономика и экономическая теория |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 16.11.2011 |
Размер файла | 213,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Анализ данных в линейной регрессионной модели
Вариант 7
графический группировка линейный регрессия
X=[6.09 16.59 15.50 11.98 13.85 0.95 6.31 0.93 18.27 5.60 17.59 8.97 8.38 8.34 20.17 12.21 4.53 11.75 19.47 13.24 0.44 8.56 12.15 5.98 17.09 5.03 4.78 5.78 6.20 17.19 9.93 10.44 12.61 13.62 12.20 17.79 9.85 16.41 18.11 11.73 17.14 4.09 9.74 7.79 8.20 10.29 1.39 12.46 0.64 -0.55]
Y=[6.71 14.51 15.90 12.84 18.37 0.87 6.83 -0.91 20.94 4.71 17.62 10.71 10.55 5.48 19.20 11.72 9.83 11.91 18.42 15.45 -1.88 5.13 13.07 1.51 14.34 6.26 6.86 3.64 5.50 20.35 12.11 12.04 11.76 16.23 13.87 18.96 5.69 15.47 14.60 10.06 15.25 6.20 9.54 9.86 8.42 10.21 -5.16 10.01 6.19 -0.68]
Задание №1. Выполнить предварительную обработку результатов наблюдений, включающую:
1) построение диаграммы рассеивания (корреляционного поля);
2) группировку данных и построение корреляционной таблицы;
3) оценку числовых характеристик для негруппированных и группированных данных.
Решение.
1. Диаграмма рассеивания с нанесенной на нее сеткой горизонтальных и вертикальных прямых () представлена на рисунке 1.1.
Рисунок 1.1. Диаграмма рассеивания с нанесенной на нее сеткой для группировки данных
2. Используя графическую группировку данных (с помощью нанесенной на рисунок 1 сетки), построим таблицу частот (таблица 1.2).
Таблица
X\Y |
-7,5 |
-2,5 |
2,5 |
7,5 |
12,5 |
17,5 |
22,5 |
||
-2,5 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
1 |
|
2,5 |
1 |
2 |
1 |
5 |
0 |
0 |
0 |
9 |
|
7,5 |
0 |
0 |
3 |
9 |
3 |
0 |
0 |
15 |
|
12,5 |
0 |
0 |
0 |
0 |
10 |
3 |
0 |
13 |
|
17,5 |
0 |
0 |
0 |
0 |
3 |
6 |
2 |
11 |
|
22,5 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
1 |
|
1 |
3 |
4 |
14 |
16 |
10 |
2 |
50 |
В первом столбце и в первой строке таблицы 1.2 указаны середины интервалов группировки по и по соответственно.
Проведем вычисление выборочных числовых характеристик:
- для негруппированных данных (расчеты выполняются в Matlab, см. приложение):
, ;
, ;
;
;
, ;
;
;
.
- для группированных данных:
, ;
, ;
;
;
, ;
;
;
;
.
Задание №2. Для негруппированных данных проверить гипотезу об отсутствии линейной статистической связи между компонентами и при альтернативной гипотезе (уровень значимости ).
Решение.
Для негруппированных данных выборочная оценка коэффициента корреляции равна . Используя Matlab, найдем квантиль распределения Стьюдента:
.
Тогда выборочное значение статистики равно:
;
;
Так как , то гипотеза отклоняется в пользу гипотезы . Корреляция значима.
Задание №3. Для негруппированных данных получить интервальную оценку для истинного значения коэффициента корреляции при уровне значимости .
Решение. Для негруппированных данных выборочная оценка коэффициента корреляции равна . Тогда, используя Matlab, найдем:
;
, ;
, ;
.
Задание №4. Для негруппированных и группированных данных составить уравнения линейной регрессии на и на .
Решение.
1) Рассмотрим случай негруппированных данных.
При доверительный интервал для коэффициента корреляции принимает значение:
.
Этот интервал не содержит нуля, то есть с доверительной вероятностью существует корреляция между и и имеет смысл построения уравнений регрессии.
, ;
, .
Проверка.
, .
, ;
,
, ;
2) Рассмотрим случай группированных данных.
Подставим найденные значения , , , , в уравнения линейной регрессии на и на. Получим:
, ;
Проверка.
, ;
, ;
Задание №5. Для негруппированных данных нанести графики выборочных регрессионных прямых на диаграмму рассеивания.
Рисунок 1.3. Диаграмма рассеивания с нанесенной для нее сеткой для группировки данных и графики уравнений выборочных линейных регрессий: на , 2 - на .
Задание №6. Для негруппированных данных по найденным оценкам параметров линейной регрессии на получить оценку для дисперсии ошибок наблюдений , найти коэффициент детерминации , построить доверительные интервалы для параметров регрессии и , дисперсии ошибок наблюдений и среднего значения при .
Решение.
Для негруппированных данных были получены следующие оценки числовых характеристик и коэффициентов регрессии: , , , , , , , .
Используя Matlab, найдем сумму квадратов, обусловленную регрессией:
;
;
;
;
.
Тогда оценка дисперсии ошибок наблюдений равна
.
Коэффициент детерминации равен
.
Поскольку (знак ), то сделаем проверку правильности расчетов:
(верно).
Полученный результат для коэффициента детерминации означает, что уравнение регрессии на 83,8% объясняет общий разброс результатов наблюдений относительно горизонтальной прямой .
Построим доверительные интервалы для параметров линейной регрессии и дисперсии ошибок наблюдений.
С помощью Matlab найдем квантили распределений Стьюдента и :
, , ;
- доверительный интервал для параметра :
.
;
- доверительный интервал для параметра :
;
;
- доверительный интервал для дисперсии ошибок наблюдений :
;
.
Найдем границы доверительных интервалов для среднего значения при :
;
.
Задание №7. Для негруппированных данных проверить значимость линейной регрессии на (уровень значимости ).
Решение.
Гипотеза : отклоняется на уровне значимости , так как доверительный интервал не накрывает нуль с доверительной вероятностью 0,95.
Этот же результат можно получить, используя для проверки гипотезу : и статистику .
С помощью Matlab найдем квантили распределения Фишера:
, .
Выборочное значение статистики равно:
.
Поскольку , то гипотеза : отклоняется на уровне значимости . Таким образом, линейная регрессия на статистически значима.
Задание №8. Для данных, сгруппированных только по , проверить адекватность линейной регрессии на (уровень значимости ).
Решение.
Для проверки адекватности воспользуемся корреляционной таблицей. Будем считать, что середины интервалов группировки , , являются значениями компоненты . Тогда число повторных наблюдений равно 6. Запишем результаты этих наблюдений в виде таблицы 1.4.
Таблица 1.4. Повторные наблюдения, сгруппированные по
-2,5 |
2,5 |
7,5 |
12,5 |
17,5 |
22,5 |
||
-0,68 |
-0,91-1,88-5,160,876,196,206,266,869,86 |
1,513,644,715,135,485,505,696,716,838,429,549,8310,5510,7112,11 |
10,0110,0610,2111,7211,7611,9112,0412,8413,0713,8715,4516,2318,37 |
14,3414,5114,6015,2515,4715,9017,6218,4218,9620,3520,94 |
19,20 |
||
1 |
9 |
15 |
13 |
11 |
1 |
||
-0,68 |
3,14 |
7,09 |
12,89 |
16,94 |
19,20 |
Для удобства расчетов в последней строке таблицы приведены средние значения , .
.
Получим уравнение выборочной линейной регрессии на для данных, сгруппированных по : ;
; .
Выборочное значение статистики равно
.
Так как квантиль распределения Фишера, вычисленный с помощью Matlab, равен
2,5837;
то , а значит, линейная регрессия Y на x для данных, сгруппированных по X, адекватна результатам наблюдений.
Приложение
X=[6.09 16.59 15.50 11.98 13.85 0.95 6.31 0.93 18.27 5.60 17.59 8.97 8.38 8.34 20.17 12.21 4.53 11.75 19.47 13.24 0.44 8.56 12.15 5.98 17.09 5.03 4.78 5.78 6.20 17.19 9.93 10.44 12.61 13.62 12.20 17.79 9.85 16.41 18.11 11.73 17.14 4.09 9.74 7.79 8.20 10.29 1.39 12.46 0.64 -0.55]
Y=[6.71 14.51 15.90 12.84 18.37 0.87 6.83 -0.91 20.94 4.71 17.62 10.71 10.55 5.48 19.20 11.72 9.83 11.91 18.42 15.45 -1.88 5.13 13.07 1.51 14.34 6.26 6.86 3.64 5.50 20.35 12.11 12.04 11.76 16.23 13.87 18.96 5.69 15.47 14.60 10.06 15.25 6.20 9.54 9.86 8.42 10.21 -5.16 10.01 6.19 -0.68]
clc
n=50
Xsr=sum(X)/50
Ysr=sum(Y)/50
A=X.^2;
Sxkv=(sum(A)-n*Xsr^2)/(n-1)
B=Y.^2;
Sykv=(sum(B)-n*Ysr^2)/(n-1)
C=X.*Y;
Kxy=(sum(C)-n*Xsr*Ysr)/(n-1)
ROxy=Kxy/(sqrt(Sxkv)*sqrt(Sykv))
a1=1.0011;
b1=-0.0258;
Y1=X.*a1+b1;
Y2=Y-Y1;
Y3=Y2.^2;
Qe=sum(Y3)/7
Y1=Y.^2;
Qy=(sum(Y1)-n*Ysr^2)/45
Qr=((n-1)*Kxy^2)/(Sxkv*40)
X=[-2.5 2.5 7.5 12.5 17.5 22.5];
Yv=-0.2069+X.*1.0145;
Ych=[-0.68 3.14 7.09 12.89 16.94 19.20];
Yr=Ych-Yv;
n=[1 9 15 13 11 1];
Qn=(Yr.^2).*n;
Qn=sum(Qn)
Yi1=[-0.68];
Yi2=[-0.91 -1.88 -5.16 0.87 6.19 6.20 6.26 6.86 9.86];
Yi3=[1.51 3.64 4.71 5.13 5.48 5.50 5.69 6.71 6.83 8.42 9.54 9.83 10.55 10.71 12.11];
Yi4=[10.01 10.06 10.21 11.72 11.76 11.91 12.04 12.84 13.07 13.87 15.45 16.23 18.37];
Yi5=[14.34 14.51 14.60 15.25 15.47 15.90 17.62 18.42 18.96 20.35 20.94];
Yi6=[19.20];
Yr1=(Yi1-(-0.68)).^2;
Yr2=(Yi2-3.14).^2;
Yr3=(Yi3-7.09).^2;
Yr4=(Yi4-12.89).^2;
Yr5=(Yi5-16.94).^2;
Yr6=(Yi6-19.20).^2;
Qp=sum(Yr1)+sum(Yr2)+sum(Yr3)+sum(Yr4)+sum(Yr5)+sum(Yr6)
Размещено на Allbest.ru
Подобные документы
Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.
контрольная работа [150,5 K], добавлен 14.12.2010Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.
контрольная работа [47,3 K], добавлен 15.06.2009Выявление определенной зависимости между выбранными экономическими показателями на основе построения эконометрической регрессионной модели. Построение адекватной модели линейной регрессии.. Способы выявления мультиколлинеарности и её коррекции.
курсовая работа [912,1 K], добавлен 22.03.2016Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.
контрольная работа [253,4 K], добавлен 17.03.2011Расчет корреляции между экономическими показателями. Построение линейной и не линейной множественной регрессии. Проверка на гетероскедастичность моделей с использованием теста Бреуша-Пагана. Корреляция между наблюдаемыми экономическими показателями.
курсовая работа [82,2 K], добавлен 23.03.2011Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.
контрольная работа [712,1 K], добавлен 30.03.2014Расчет выборочных параметров ряда. Построение диаграммы накопленных частот и гистограммы выборки. Линейная диаграмма исходного временного ряда. Его аналитическое выравнивание с помощью линейной функции, статистические показатели и прогнозирование.
курсовая работа [1006,5 K], добавлен 22.01.2015Исходные данные о продаже квартир на вторичном рынке жилья исследуемого региона, этапы нахождения на данной основе парной регрессии, уравнения линейной регрессии, выборочной дисперсии и ковариации. Определение средней стоимости квартиры, ее вариации.
контрольная работа [80,7 K], добавлен 14.04.2011Представление данных результатов наблюдения, сводки и группировки с помощью статистических таблиц как рациональной формы. Подлежащее и сказуемое таблицы. Виды таблиц по характеру подлежащего и сказуемого. Основные правила построения статистических таблиц.
презентация [895,2 K], добавлен 06.06.2014Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.
курсовая работа [367,5 K], добавлен 21.08.2008