Анализ данных в линейной регрессионной модели

Основные особенности построения таблицы частот с использованием графической группировки данных. Характеристика и сущность нанесения графики выборочных регрессионных прямых на диаграмму рассеивания. Получение уравнения выборочной линейной регрессии.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 16.11.2011
Размер файла 213,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Анализ данных в линейной регрессионной модели

Вариант 7

графический группировка линейный регрессия

X=[6.09 16.59 15.50 11.98 13.85 0.95 6.31 0.93 18.27 5.60 17.59 8.97 8.38 8.34 20.17 12.21 4.53 11.75 19.47 13.24 0.44 8.56 12.15 5.98 17.09 5.03 4.78 5.78 6.20 17.19 9.93 10.44 12.61 13.62 12.20 17.79 9.85 16.41 18.11 11.73 17.14 4.09 9.74 7.79 8.20 10.29 1.39 12.46 0.64 -0.55]

Y=[6.71 14.51 15.90 12.84 18.37 0.87 6.83 -0.91 20.94 4.71 17.62 10.71 10.55 5.48 19.20 11.72 9.83 11.91 18.42 15.45 -1.88 5.13 13.07 1.51 14.34 6.26 6.86 3.64 5.50 20.35 12.11 12.04 11.76 16.23 13.87 18.96 5.69 15.47 14.60 10.06 15.25 6.20 9.54 9.86 8.42 10.21 -5.16 10.01 6.19 -0.68]

Задание №1. Выполнить предварительную обработку результатов наблюдений, включающую:

1) построение диаграммы рассеивания (корреляционного поля);

2) группировку данных и построение корреляционной таблицы;

3) оценку числовых характеристик для негруппированных и группированных данных.

Решение.

1. Диаграмма рассеивания с нанесенной на нее сеткой горизонтальных и вертикальных прямых () представлена на рисунке 1.1.

Рисунок 1.1. Диаграмма рассеивания с нанесенной на нее сеткой для группировки данных

2. Используя графическую группировку данных (с помощью нанесенной на рисунок 1 сетки), построим таблицу частот (таблица 1.2).

Таблица

X\Y

-7,5

-2,5

2,5

7,5

12,5

17,5

22,5

-2,5

0

1

0

0

0

0

0

1

2,5

1

2

1

5

0

0

0

9

7,5

0

0

3

9

3

0

0

15

12,5

0

0

0

0

10

3

0

13

17,5

0

0

0

0

3

6

2

11

22,5

0

0

0

0

0

1

0

1

1

3

4

14

16

10

2

50

В первом столбце и в первой строке таблицы 1.2 указаны середины интервалов группировки по и по соответственно.

Проведем вычисление выборочных числовых характеристик:

- для негруппированных данных (расчеты выполняются в Matlab, см. приложение):

, ;

, ;

;

;

, ;

;

;

.

- для группированных данных:

, ;

, ;

;

;

, ;

;

;

;

.

Задание №2. Для негруппированных данных проверить гипотезу об отсутствии линейной статистической связи между компонентами и при альтернативной гипотезе (уровень значимости ).

Решение.

Для негруппированных данных выборочная оценка коэффициента корреляции равна . Используя Matlab, найдем квантиль распределения Стьюдента:

.

Тогда выборочное значение статистики равно:

;

;

Так как , то гипотеза отклоняется в пользу гипотезы . Корреляция значима.

Задание №3. Для негруппированных данных получить интервальную оценку для истинного значения коэффициента корреляции при уровне значимости .

Решение. Для негруппированных данных выборочная оценка коэффициента корреляции равна . Тогда, используя Matlab, найдем:

;

, ;

, ;

.

Задание №4. Для негруппированных и группированных данных составить уравнения линейной регрессии на и на .

Решение.

1) Рассмотрим случай негруппированных данных.

При доверительный интервал для коэффициента корреляции принимает значение:

.

Этот интервал не содержит нуля, то есть с доверительной вероятностью существует корреляция между и и имеет смысл построения уравнений регрессии.

, ;

, .

Проверка.

, .

, ;

,

, ;

2) Рассмотрим случай группированных данных.

Подставим найденные значения , , , , в уравнения линейной регрессии на и на. Получим:

, ;

Проверка.

, ;

, ;

Задание №5. Для негруппированных данных нанести графики выборочных регрессионных прямых на диаграмму рассеивания.

Рисунок 1.3. Диаграмма рассеивания с нанесенной для нее сеткой для группировки данных и графики уравнений выборочных линейных регрессий: на , 2 - на .

Задание №6. Для негруппированных данных по найденным оценкам параметров линейной регрессии на получить оценку для дисперсии ошибок наблюдений , найти коэффициент детерминации , построить доверительные интервалы для параметров регрессии и , дисперсии ошибок наблюдений и среднего значения при .

Решение.

Для негруппированных данных были получены следующие оценки числовых характеристик и коэффициентов регрессии: , , , , , , , .

Используя Matlab, найдем сумму квадратов, обусловленную регрессией:

;

;

;

;

.

Тогда оценка дисперсии ошибок наблюдений равна

.

Коэффициент детерминации равен

.

Поскольку (знак ), то сделаем проверку правильности расчетов:

(верно).

Полученный результат для коэффициента детерминации означает, что уравнение регрессии на 83,8% объясняет общий разброс результатов наблюдений относительно горизонтальной прямой .

Построим доверительные интервалы для параметров линейной регрессии и дисперсии ошибок наблюдений.

С помощью Matlab найдем квантили распределений Стьюдента и :

, , ;

- доверительный интервал для параметра :

.

;

- доверительный интервал для параметра :

;

;

- доверительный интервал для дисперсии ошибок наблюдений :

;

.

Найдем границы доверительных интервалов для среднего значения при :

;

.

Задание №7. Для негруппированных данных проверить значимость линейной регрессии на (уровень значимости ).

Решение.

Гипотеза : отклоняется на уровне значимости , так как доверительный интервал не накрывает нуль с доверительной вероятностью 0,95.

Этот же результат можно получить, используя для проверки гипотезу : и статистику .

С помощью Matlab найдем квантили распределения Фишера:

, .

Выборочное значение статистики равно:

.

Поскольку , то гипотеза : отклоняется на уровне значимости . Таким образом, линейная регрессия на статистически значима.

Задание №8. Для данных, сгруппированных только по , проверить адекватность линейной регрессии на (уровень значимости ).

Решение.

Для проверки адекватности воспользуемся корреляционной таблицей. Будем считать, что середины интервалов группировки , , являются значениями компоненты . Тогда число повторных наблюдений равно 6. Запишем результаты этих наблюдений в виде таблицы 1.4.

Таблица 1.4. Повторные наблюдения, сгруппированные по

-2,5

2,5

7,5

12,5

17,5

22,5

-0,68

-0,91

-1,88

-5,16

0,87

6,19

6,20

6,26

6,86

9,86

1,51

3,64

4,71

5,13

5,48

5,50

5,69

6,71

6,83

8,42

9,54

9,83

10,55

10,71

12,11

10,01

10,06

10,21

11,72

11,76

11,91

12,04

12,84

13,07

13,87

15,45

16,23

18,37

14,34

14,51

14,60

15,25

15,47

15,90

17,62

18,42

18,96

20,35

20,94

19,20

1

9

15

13

11

1

-0,68

3,14

7,09

12,89

16,94

19,20

Для удобства расчетов в последней строке таблицы приведены средние значения , .

.

Получим уравнение выборочной линейной регрессии на для данных, сгруппированных по : ;

; .

Выборочное значение статистики равно

.

Так как квантиль распределения Фишера, вычисленный с помощью Matlab, равен

2,5837;

то , а значит, линейная регрессия Y на x для данных, сгруппированных по X, адекватна результатам наблюдений.

Приложение

X=[6.09 16.59 15.50 11.98 13.85 0.95 6.31 0.93 18.27 5.60 17.59 8.97 8.38 8.34 20.17 12.21 4.53 11.75 19.47 13.24 0.44 8.56 12.15 5.98 17.09 5.03 4.78 5.78 6.20 17.19 9.93 10.44 12.61 13.62 12.20 17.79 9.85 16.41 18.11 11.73 17.14 4.09 9.74 7.79 8.20 10.29 1.39 12.46 0.64 -0.55]

Y=[6.71 14.51 15.90 12.84 18.37 0.87 6.83 -0.91 20.94 4.71 17.62 10.71 10.55 5.48 19.20 11.72 9.83 11.91 18.42 15.45 -1.88 5.13 13.07 1.51 14.34 6.26 6.86 3.64 5.50 20.35 12.11 12.04 11.76 16.23 13.87 18.96 5.69 15.47 14.60 10.06 15.25 6.20 9.54 9.86 8.42 10.21 -5.16 10.01 6.19 -0.68]

clc

n=50

Xsr=sum(X)/50

Ysr=sum(Y)/50

A=X.^2;

Sxkv=(sum(A)-n*Xsr^2)/(n-1)

B=Y.^2;

Sykv=(sum(B)-n*Ysr^2)/(n-1)

C=X.*Y;

Kxy=(sum(C)-n*Xsr*Ysr)/(n-1)

ROxy=Kxy/(sqrt(Sxkv)*sqrt(Sykv))

a1=1.0011;

b1=-0.0258;

Y1=X.*a1+b1;

Y2=Y-Y1;

Y3=Y2.^2;

Qe=sum(Y3)/7

Y1=Y.^2;

Qy=(sum(Y1)-n*Ysr^2)/45

Qr=((n-1)*Kxy^2)/(Sxkv*40)

X=[-2.5 2.5 7.5 12.5 17.5 22.5];

Yv=-0.2069+X.*1.0145;

Ych=[-0.68 3.14 7.09 12.89 16.94 19.20];

Yr=Ych-Yv;

n=[1 9 15 13 11 1];

Qn=(Yr.^2).*n;

Qn=sum(Qn)

Yi1=[-0.68];

Yi2=[-0.91 -1.88 -5.16 0.87 6.19 6.20 6.26 6.86 9.86];

Yi3=[1.51 3.64 4.71 5.13 5.48 5.50 5.69 6.71 6.83 8.42 9.54 9.83 10.55 10.71 12.11];

Yi4=[10.01 10.06 10.21 11.72 11.76 11.91 12.04 12.84 13.07 13.87 15.45 16.23 18.37];

Yi5=[14.34 14.51 14.60 15.25 15.47 15.90 17.62 18.42 18.96 20.35 20.94];

Yi6=[19.20];

Yr1=(Yi1-(-0.68)).^2;

Yr2=(Yi2-3.14).^2;

Yr3=(Yi3-7.09).^2;

Yr4=(Yi4-12.89).^2;

Yr5=(Yi5-16.94).^2;

Yr6=(Yi6-19.20).^2;

Qp=sum(Yr1)+sum(Yr2)+sum(Yr3)+sum(Yr4)+sum(Yr5)+sum(Yr6)

Размещено на Allbest.ru


Подобные документы

  • Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.

    контрольная работа [150,5 K], добавлен 14.12.2010

  • Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.

    контрольная работа [47,3 K], добавлен 15.06.2009

  • Выявление определенной зависимости между выбранными экономическими показателями на основе построения эконометрической регрессионной модели. Построение адекватной модели линейной регрессии.. Способы выявления мультиколлинеарности и её коррекции.

    курсовая работа [912,1 K], добавлен 22.03.2016

  • Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.

    контрольная работа [253,4 K], добавлен 17.03.2011

  • Расчет корреляции между экономическими показателями. Построение линейной и не линейной множественной регрессии. Проверка на гетероскедастичность моделей с использованием теста Бреуша-Пагана. Корреляция между наблюдаемыми экономическими показателями.

    курсовая работа [82,2 K], добавлен 23.03.2011

  • Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.

    контрольная работа [712,1 K], добавлен 30.03.2014

  • Расчет выборочных параметров ряда. Построение диаграммы накопленных частот и гистограммы выборки. Линейная диаграмма исходного временного ряда. Его аналитическое выравнивание с помощью линейной функции, статистические показатели и прогнозирование.

    курсовая работа [1006,5 K], добавлен 22.01.2015

  • Исходные данные о продаже квартир на вторичном рынке жилья исследуемого региона, этапы нахождения на данной основе парной регрессии, уравнения линейной регрессии, выборочной дисперсии и ковариации. Определение средней стоимости квартиры, ее вариации.

    контрольная работа [80,7 K], добавлен 14.04.2011

  • Представление данных результатов наблюдения, сводки и группировки с помощью статистических таблиц как рациональной формы. Подлежащее и сказуемое таблицы. Виды таблиц по характеру подлежащего и сказуемого. Основные правила построения статистических таблиц.

    презентация [895,2 K], добавлен 06.06.2014

  • Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.

    курсовая работа [367,5 K], добавлен 21.08.2008

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.