Многофакторная модель корреляционно-регрессионного анализа

Определение динамики стоимости недвижимости при помощи корреляционно-регрессионного анализа. Ввод исходных данных и построение корреляционной матрицы. Поиск доверительных интервалов для коэффициентов уравнения регрессии. Расчёт коэффициента эластичности.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 26.03.2014
Размер файла 1,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

Многофакторная модель корреляционно-регрессионного анализа

С помощью корреляционно-регрессионного анализа мы сможем определить динамику стоимости недвижимости, и влияние отдельных факторов на стоимость недвижимости, а так же установим, какие из этих факторов оказывают наибольшее влияние на стоимость недвижимости.

Система факторов всегда формируется на стадии логического анализа. Конкретное построение модели осуществляется на основе собранной исходной информации с количественными оценками факторов.

Показатели, включаемые в статистическую модель, должны быть качественно однородны, независимы друг от друга, достаточны по количеству измерителей для статистической обоснованности результатов регрессионного анализа. Количество измерений должно превосходить число факторов не менее чем в 2 раза.

Этапы выполнения работы:

1. Ввод исходных данных;

2. Расчет корреляционной матрицы;

3. Определить коллинеарность;

4. Определить параметры уравнения регрессии;

5. Анализ факторов по коэффициенту эластичности;

6. Оценка параметров уравнения регрессии;

7. Оценить значимость показателей тесноты связи r;

8. Оценка значимости коэффициента детерминации R2;

9. Доверительные интервалы для коэффициентов уравнения регрессии;

10. Доверительные интервалы для средних значений факторных признаков;

11. Автокорреляция

Пример расчета

1. Ввод исходных данных

Систему функциональных показателей формируем на стадии логического анализа.

При построении многофакторной модели прогнозирования стоимости недвижимости, могут быть включены следующие факторы:

Результирующий признак: Y -стоимость недвижимости, $;

Факторные признаки:

Х1-стоимость одного квадратного метра объекта, $;

Х2 - валютный курс;

Х3 - уровень доходности населения, $;

Х4 - социально-политическое положение, баллы;

Х5 - инфраструктура, баллы;

Х6 - состояние объекта, ремонт, баллы;

Х7 - количество телефонов, штук;

Х8 - количество телефонов

Так как для статистического анализа требуется ввести факторы за какой-то промежуток времени, то нами была составлена таблица данных факторов для нескольких наблюдений за 10 лет, которая представлена ниже:

Годы

Х1

Х2

Х3

Х4

Х5

Х6

Х7

Х8

Y

1 год

70

17,4

43

4

5

5

2

2

38500

2 год

80

29,4

45

3

4

3

1

1

43590

3 год

180

44,6

48

4

4

2

1

1

84500

4 год

230

48,3

55

3

4

3

1

1

92500

5 год

250

45

65

4

5

5

5

2

102520

6 год

230

42,2

50

4

4

4

3

2

104500

7 год

250

42,1

66

5

5

4

4

2

112500

8 год

430

41,3

68

4

3

3

5

1

180500

9 год

650

41

65

2

4

4

2

1

272550

10 год

750

41

70

3

5

5

7

2

372500

2. Расчет корреляционной матрицы

Введем составленную матрицу в Excel. С помощью надстройки Анализ данных в меню Сервис рассчитаем корреляционную матрицу. Для этого в появившемся окне “Анализ данных” в поле “Инструменты анализа” активизируем строку “Корреляция”. В окне “Корреляция” введем входной интервал, выделяя с помощью мыши столбы и строки исходной таблицы, включая заголовки (за исключением столбца годы); установим флаг на “Метки в первой строке”; затем в поле “Выходной интервал” укажем левую верхнюю ячейку, начиная с которой должна появиться матрица результатов - корреляционная матрица.

Корреляционная матрица:

Х1

Х2

Х3

Х4

Х5

Х6

Х7

Х8

Y

Х1

1

Х2

0,115

1

Х3

0,743

0,292

1

Х4

-0,475

0,219

0,036

1

Х5

0,118

0,126

0,289

0,189

1

Х6

0,509

0,067

0,630

-0,047

0,688

1

Х7

0,590

0,109

0,798

0,254

0,394

0,731

1

Х8

0,131

0,168

0,360

0,478

0,751

0,791

0,669

1

Y

0,989

0,066

0,707

-0,446

0,183

0,524

0,626

0,190

1

Корреляционная матрица - симметричная матрица, в которой относительно главной диагонали, на пересечении i-ой строки и j-го столбца, расположены коэффициенты парной корреляции между i-мы и j-ми факторами. По главной диагонали коэффициенты равны 1.

В последней строке корреляционной матрицы расположены коэффициенты парной корреляции между факторными и результирующим признаками.

Учитывая, что , при r < 0 связь обратная, при r > 0 - связь прямая.

Анализируя первый столбец корреляционной матрицы, отберем факторы, влияющие на результирующий признак.

Если коэффициент корреляции , то связь между i-ым фактором и результирующим признаком тесная, тогда этот фактор влияет на среднемесячную заработную плату и остается в модели. В соответствии с этим выпишем соответствующие коэффициенты корреляции:

; ;

; ;

; ;

;

Вывод: Анализ последней строчки корреляционной матрицы показывает, что факторы Х2, Х4, Х5, Х6, Х8 исключаются из модели, так как коэффициент корреляции , а для дальнейшего рассмотрения в данной модели остаются факторы Х1, Х3, Х7.

3. Определение колинеарности

Колинеарность - это зависимость факторных признаков между собой. Связь между факторными и результирующим признаками должна быть более тесная, чем связь между самими факторами, то есть для любой пары отобранных факторов должно выполнять отношение:

Если соотношения данной системы выполняются, то оба фактора остаются в модели. Если соотношения не выполняются, то один из факторов нужно исключить из модели. Обычно исключаются факторы с меньшим коэффициентом корреляции, зависимость которых с результирующим меньше. Но при удалении факторов в каждой конкретной задаче необходимо смотреть смысловое содержание факторов. Формальный подход не допустим.

Определяем колинеарность между факторами :

1)

условие выполняется, оба фактора остаются в модели;

2)

условие выполняется, оба фактора остаются в модели;

3)

условие не выполняется, фактор Х7 исключается, так как ;

Вывод: Таким образом, в результате анализа, для составления прогнозируемой функции оставляем фактор Х1, Х3. Тогда уравнение регрессии приобретает следующий вид:

Y0+a1x1 + a2x3

4. Определение параметров уравнения регрессии.

В рабочем поле Excel с помощью команды копирования создадим новую таблицу с исходными данными из оставшихся факторов и найдем средние значения по столбцам:

Годы

Х1

Х3

Y

1 год

70

43

26000

2 год

80

45

32000

3 год

180

48

72000

4год

230

55

80000

5 год

250

65

100000

6 год

230

50

92000

7 год

250

66

100000

8 год

430

68

168000

9 год

650

65

280000

10 год

750

70

360000

Х1

Х3

Y

Х1

1

Х3

0,783

1

Y

0,994

0,789

1

Для решения полученного уравнения регрессии после активизации сервисной программы Анализ данных в меню Сервис воспользуемся инструментом анализа - Регрессия. В данном диалоговом окне введем с помощью мыши входной интервал Y и X-ов; устанавим флаг на Метки; укажем начальную ячейку для выходного интервала и подтвердим начало расчета кнопкой ОК. В третьей из полученных таблиц ВЫВОДА ИТОГОВ найдем коэффициенты Y-пересечения и Х1 , Х3 и подставим полученные значения вместе со средними значениями Х-ов в уравнение регрессии:

Описательная статистика

Х1

Х3

Y

Среднее

312,00

57,50

131000,00

Стандартная ошибка

72,34

3,28

34377,32

Стандартное отклонение

228,76

10,38

108710,63

Эксцесс

0,19

-1,94

1,11

Асимметричность

1,09

-0,21

1,38

Интервал

680,00

27,00

334000,00

Минимум

70,00

43,00

26000,00

Максимум

750,00

70,00

360000,00

Сумма

3120,00

575,00

1310000,00

Счет

10,00

10,00

10,00

Регрессионная статистика

Множественный R

0,995

R-квадрат

0,99

Нормированный R-квадрат

0,987

Стандартная ошибка

12487,32

Наблюдения

10

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

1,0527E+11

5,2635E+10

337,55

1,0949E-07

Остаток

7

1091532162

155933166

Итого

9

1,0636E+11

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

19840,79

30696,94

0,646

0,539

-52745,89

92427,48

Х1

499,99

29,25

17,091

0,000

430,81

569,16

Х3

-779,76

644,42

-1,210

0,266

-2303,58

744,06

корреляционный регрессия матрица эластичность

Вывод:

1. Уравнение регресс имеет следующий вид:

2. Зависимость между стоимостью недвижимости (У) и стоимостью одного квадратного метра (Х1), между стоимостью недвижимости (У) и уровнем доходности населения (Х3), является более тесной, чем между стоимостью недвижимости и остальными факторами.

5. Анализ факторов по коэффициенту эластичности

О значимости факторов нельзя судить по значению коэффициента регрессии. Анализ осуществляется по коэффициенту эластичности.

Коэффициент эластичности показывает, на сколько процентов изменяется результирующий признак при изменении факторного признака на 1%. Обычно берется 10%. Знак коэффициента эластичности всегда совпадает со знаком коэффициентов регрессии. Чем больше по модулю значение коэффициента эластичности, тем большее влияние оказывает этот фактор на результирующий признак.

.

Увеличим каждый фактор на 10%:

Подставляя средние значения факторов Х1, Х3, а также их последовательно увеличенные на 10% значения в соответствующие уравнения регрессии, вычислим коэффициенты эластичности:

Коэффициент эластичности принято изображать графически.

Зависимость между Х1 (стоимостью одного метра квадратного) и Y (стоимостью недвижимости объекта):

Вывод: при увеличении факторного признака Х1 на 10 % результативный признак увеличивается на 11,91 %.

Зависимость между Х3 (уровнем доходности населения) и Y (стоимостью недвижимости объекта)

Вывод: при увеличении факторного признака Х3 на 10 % результативный признак сокращается на 3,42 %.

ВЫВОД: Анализ факторов по коэффициенту эластичности показал, что наибольшее влияние на стоимость недвижимости оказывает стоимость одного метра квадратного (фактор Х1), затем уровень доходности населения (фактор Х3).

6. Оценка параметров уравнения регрессии

Для того, чтобы оценить параметры уравнения регрессии используется t- критерий Стьюдента. В таблице «дисперсионный анализ», в графе «t- статистика» содержатся рассчитанные на компьютере данные:

Эти значения сравниваются t - критическим, учитывая принятый уровень значимости б = 0,05 и k - число степеней свободы k = n-m-1; k=10-2-1=7, затем по таблице Стьюдента определяем, что: tкр= 2,365, либо рассчитываем это значение в Excel с помощью вставки функции < fx > в поле «Категория» выбираем Статистические в поле «выберите функцию» активизируем строку СТЮДРАСПОБР, с помощью которой компьютер возвращает t-значение распределения Стьюдента как функцию вероятности и числа степеней свободы, затем нажимаем «ОК». Компьютер запрашивает аргументы функции: в поле вероятность ставим значение 0,05, а в поле степень свободы -7

Параметры уравнения регрессии признаются типичными, если выполняются неравенства:

Подставим имеющие данные для сравнения:

, условие не выполняется

, условие не выполняется.

Вывод: Анализ параметров уравнения регрессии показал, что рассчитанные на компьютере данные не удовлетворяют условию сравнения. Поэтому математическая формула регрессии не может быть использована для прогнозирования стоимости недвижимости, а может быть использована только для практических расчетов.

7. Оценить значимость показателей тесноты связи r

Для этого применяется t- критерий Стьюдента. Расчетные значения tr для факторов Х1, Х3 определяется по формуле:

где r - значения, рассчитанные в корреляционной матрице ( столбец У) для объясняющих факторов

n - количество наблюдений.

Подставляя имеющиеся данные в формулу, получаем:

Рассчитанные значения надо сравнить с t- критическим равное 2,365. Показатели тесноты связи признаются типичными, если

Подставляя полученные данные, получим:

- условие выполняется

- условие выполняется

Вывод: все коэффициенты корреляции, соответствующие оставшимся факторам, признаются типичным, так как условие неравенства выполняется.

8. Оценка значимости коэффициента детерминации R2

Для этого используется F- критерий Фишера, величина которого берется из таблицы Фишера со степенями свободы:

б = 0,05

к1 = m = 2 - число объясняющих факторов.

к 2 = n-m-1= 10-2-1=7

, либо рассчитываем это значение в Excel с помощью вставки функции < fx > в поле «Категория» выбираем Статистические в поле «выберите функцию» активизируем строку FРАСПОБР, с помощью которой компьютер возвращает обратное значение для F-распределения вероятностей, затем нажимаем «ОК». Компьютер запрашивает аргументы функции: в поле вероятность ставим значение 0,05, в поле степень свободы1 ставим число объясняющих факторов, т.е. 2, а в поле степень свободы2 вводим к 2 = 7

Для определения статистической значимости коэффициента детерминации R2 используется неравенство:

Значение FR рассчитывается по формуле:

Подставляя данные в неравенство получим: Fрасч =337,55 Fкрит.=4,737

Вывод:

- Коэффициент детерминации R2 является значимым, так как неравенство выполняется;

- величина R2 =0,990- это означает, что 99 % общей вариации результативного признака объясняется изменением факторных признаков Х13, а 1 % объясняется изменениями других факторов.

9. Доверительные интервалы для коэффициентов уравнения регрессии

Доверительные интервалы для коэффициентов множественной регрессии определяются:

а=499,986; Sa=29,254; tкрит.= 2,365

a2=-779,762; Sa2=644,425; tкрит.= 2,365

Вывод:

- 95% коэффициента регрессии а1 лежит в интервале , а 5% вне этого интервала.

- 95% коэффициента регрессии а2 лежит в интервале , а 5% вне этого интервала.

10. Доверительные интервалы для средних значений факторных признаков

Доверительные интервалы для средних значений факторных признаков определяются:

,

где -стандартное отклонение (среднеквадратическое отклонение);

n - число наблюдений;

t находится по функции таблицы Лапласа

t=1,96; n=10;

t=1,96; n=10;

Вывод:

- 95% факторного признака ( стоимость 1 м2) лежит в интервале , а 5% вне этого интервала.

- 95% факторного признака (уровень доходности населения) лежит в интервале , а 5% вне этого интервала.

11. Автокорреляция

А) Для определения величины коэффициента автокорреляции используются значения остатков, которые имеют следующий вид:

ВЫВОД ОСТАТКА

Дополнительные расчеты

Наблюдение

Предсказанное Y

Остатки i

i2

i-i-1

(i-i-1)2

1

21310,03

4689,97

21995795,26

2

24750,37

7249,63

52557205,69

2559,67

6551896,96

3

72409,64

-409,64

167803,63

-7659,27

58664467,15

4

91950,59

-11950,59

142816514,7

-11540,95

133193479,87

5

94152,68

5847,32

34191125,44

17797,90

316765392,98

6

95849,39

-3849,39

14817836,19

-9696,71

94026224,81

7

93372,92

6627,08

43918181,06

10476,47

109756499,91

8

181810,80

-13810,80

190738248,8

-20437,88

417706990,59

9

294146,91

-14146,91

200135182,7

-336,11

112971,52

10

340246,66

19753,34

390194268,6

33900,25

1149226941,72

СУММА

1310000,00

0,00

1091532162,

15063,37

2286004865,50

Для определения величины коэффициента автокорреляции используется формула Дарвина - Оутсона:

использование, которой связано с дополнительными расчетами. Подставим данные в формулу и получим:

Коэффициент корреляции изменяется в пределах 0?dw?4.

Значит и размер автокорреляционного поля должен иметь эти же пределы.

Б) В автокорреляции содержатся (слева направо):

1. Зона положительной автокорреляции

2. Зона неопределенности

3. Зона отсутствия автокорреляции

4. Зона неопределенности

5. Зона отрицательной автокорреляции.

Размер зон неопределенности зависят от показателей таблицы Дарвина-Оутсона.

Для того чтобы найти в таблице нужные показатели надо знать номер столбца и строки.

Номер нужного столбца - это число объясняющих факторов уравнения регрессии: k=m=2;

Номер строки- это количество наблюдений: n=10.

В таблице находятся показатели dl и du :

В левой половине автокорреляционного поля:

Нижняя граница зоны равна dl =0,697

Верхняя граница зоны равна du = 1,641

Для правой половины автокорреляционного поля границы неопределенности надо рассчитать:

Верхняя граница зоны равна 4-du = 4-1,641= 2,359

Нижняя граница зоны равна 4-dl =4-0,697= 3,303

Общая картина автокорреляционного поля может быть представлена в виде:

В) Коэффициент автокорреляции , его значение соответствует зоне отсутствия автокорреляции.

Размещено на Allbest.ru


Подобные документы

  • Сущность корреляционно-регрессионного анализа и его использование в сельскохозяйственном производстве. Этапы проведения корреляционно-регрессионного анализа. Области его применения. Анализ объекта и разработка числовой экономико-математической модели.

    курсовая работа [151,0 K], добавлен 27.03.2009

  • Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.

    задача [83,2 K], добавлен 20.01.2010

  • Расчёт параметров линейного уравнения регрессии. Оценка регрессионного уравнения через среднюю ошибку аппроксимации, F-критерий Фишера, t-критерий Стьюдента. Анализ корреляционной матрицы. Расчёт коэффициентов множественной детерминации и корреляции.

    контрольная работа [241,8 K], добавлен 29.08.2013

  • Сущность корреляционно-регрессионного анализа и экономико-математической модели. Обеспечение объема и случайного состава выборки. Измерение степени тесноты связи между переменными. Составление уравнений регрессии, их экономико-статистический анализ.

    курсовая работа [440,3 K], добавлен 27.07.2015

  • Построение регрессионных моделей. Смысл регрессионного анализа. Выборочная дисперсия. Характеристики генеральной совокупности. Проверка статистической значимости уравнения регрессии. Оценка коэффициентов уравнения регрессии. Дисперсии случайных остатков.

    реферат [57,4 K], добавлен 25.01.2009

  • Построение математической модели выбранного экономического явления методами регрессионного анализа. Линейная регрессионная модель. Выборочный коэффициент корреляции. Метод наименьших квадратов для модели множественной регрессии, статистические гипотезы.

    курсовая работа [1,1 M], добавлен 22.05.2015

  • Ознакомление с основами модели простой регрессии. Рассмотрение основных элементов эконометрической модели. Характеристика оценок коэффициентов уравнения регрессии. Построение доверительных интервалов. Автокорреляция и гетероскедастичность остатков.

    лекция [347,3 K], добавлен 23.12.2014

  • Статистический анализ по выборке. Проведение регрессионного анализа исходных данных и выбор аналитической формы записи производственной функции. Выполнение экономического анализа в выбранной регрессионной модели на основе коэффициентов эластичности.

    курсовая работа [2,2 M], добавлен 22.07.2015

  • Оценка корреляционной матрицы факторных признаков. Оценки собственных чисел матрицы парных коэффициентов корреляции. Анализ полученного уравнения регрессии, определение значимости уравнения и коэффициентов регрессии, их экономическая интерпретация.

    контрольная работа [994,1 K], добавлен 29.06.2013

  • Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.

    контрольная работа [71,7 K], добавлен 17.09.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.