Оценка недвижимости коттеджа в городе Тольятти
Понятие множественной регрессии, основные этапы построения многофакторной регрессионной модели, ее спецификация. Ранжирование факторов места положения, шкала оценки. Сущность коэффициента корреляции, его задачи. Анализ связи при ранговых факторах.
Рубрика | Экономика и экономическая теория |
Вид | отчет по практике |
Язык | русский |
Дата добавления | 14.12.2012 |
Размер файла | 190,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«Самарский государственный аэрокосмический
Университет имени академика С.П. Королёва
(Национальный исследовательский университет)»
Факультет экономики и управления
Кафедра финансов и кредита
Отчет об оценке недвижимости
(на примере коттеджа в городе Тольятти)
Исходные данные по объекту оценки
Рассмотрим частный дом (коттедж), находящийся на территории города Тольятти по адресу Ленинский проспект в коттеджном районе. Коттедж был построен в 2010 году, площадь земельного участка составляет 10 соток, имеется гараж. Дом имеет улучшенный уровень отделки. Стоимость 1 кв.м. составляет 570 д.е.
Исходная информация по объектам аналогам
№ п/п |
Местоположение |
Уровень отделки |
Наличие гаража |
Площадь земельного участка, соток |
Расположение на территории коттеджного поселка |
Год строительства |
Стоимость 1, у.е. |
|
1 |
П. Выселки |
Отсутствие отделки |
Нет |
8 |
Нет |
2011 |
250 |
|
2 |
П. Лужки |
Отсутствие отделки |
Нет |
8 |
Нет |
2011 |
250 |
|
3 |
П. Лужки |
Простая отделка |
Нет |
9 |
Нет |
2010 |
280 |
|
4 |
П. Лужки |
Простая отделка |
Нет |
10 |
Нет |
2009 |
310 |
|
5 |
П. Русская Бобровка |
Отсутствие отделки |
Нет |
11 |
Нет |
2009 |
310 |
|
6 |
Ул. Транспортная |
Простая отделка |
Нет |
10 |
Нет |
2009 |
330 |
|
7 |
Ул. Офицерская |
Высококачественная отделка |
Нет |
11 |
Да |
2008 |
350 |
|
8 |
Южное шоссе |
Высококачественная отделка |
Есть |
11 |
Нет |
2007 |
360 |
|
9 |
Южное шоссе |
Высококачественная отделка |
Нет |
12 |
Нет |
2007 |
370 |
|
10 |
Ул. Транспортная |
Простая отделка |
Есть |
13 |
Нет |
2011 |
390 |
|
11 |
П. Выселки |
Простая отделка |
Есть |
14 |
Нет |
2006 |
400 |
|
12 |
П. Лужки |
Простая отделка |
Нет |
15 |
Нет |
2011 |
410 |
|
13 |
П. Русская Бобровка |
Улучшенная отделка |
Есть |
16 |
Нет |
2008 |
420 |
|
14 |
П. Лужки |
Улучшенная отделка |
Есть |
16 |
Нет |
2005 |
440 |
|
15 |
Ул. Дзержинского |
Улучшенная отделка |
Нет |
14 |
Да |
2008 |
460 |
|
16 |
П. Лужки |
Улучшенная отделка |
Есть |
12 |
Да |
2009 |
480 |
|
17 |
П. Русская Бобровка |
Отсутствие отделки |
Есть |
14 |
Да |
2009 |
490 |
|
18 |
П. Лужки |
Отсутствие отделки |
Нет |
14 |
Да |
2010 |
510 |
|
19 |
П. Лужки |
Отсутствие отделки |
Есть |
13 |
Нет |
2010 |
520 |
|
20 |
Ул. Дзержинского |
Отсутствие отделки |
Нет |
15 |
Да |
2009 |
550 |
|
21 |
Ул. Дзержинского |
Отсутствие отделки |
Есть |
15 |
Да |
2008 |
570 |
|
22 |
Ленинский проспект |
Отсутствие отделки |
Нет |
10 |
Да |
2008 |
580 |
|
23 |
Ленинский проспект |
Отсутствие отделки |
Нет |
12 |
Да |
2010 |
590 |
|
24 |
Ленинский проспект |
Простая отделка |
Есть |
10 |
Да |
2011 |
590 |
|
25 |
Ленинский проспект |
Простая отделка |
Нет |
16 |
Да |
2007 |
600 |
Содержание
1. Понятие множественной регрессии
1.1 Этапы построения модели
2. Спецификация модели
3. Анализ связи при ранговых факторах
4. Однофакторный дисперсионный анализ
5. Расчет коэффициентов логарифмической (линеаризованной) модели
1. Понятие множественной регрессии
Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчётах и целого ряда других вопросов. Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное воздействие их на моделируемый показатель. Специфика множественной регрессии заключается в исследовании комплексного воздействия факторов в условиях их независимости друг от друга.
Рассмотрим задачи исследования зависимости одной переменной y от нескольких факторных переменных x1, x2, …, xk. Эту задачу можно решить с помощью множественного (многофакторного) регрессионного анализа.
Обобщенная модель множественной регрессии записывается в виде:
Y=(f) x1x2xkU
где Y - результирующая переменная;
x1,x2,xk - факторные переменные;
k - число факторных переменных;
U - отклонения.
Факторные переменные x1, x2, …, xk оказывают совместное одновременное влияние на Y. Мы не можем охватить весь комплекс причин и учесть случайность, присущую в том или ином качестве, поэтому в выражение функции регрессии введена случайная величина U, позволяющая учесть суммарный эффект от воздействия всех факторов и их случайности.
1.1 Этапы построения модели
Построение любой регрессионной модели осуществляется в несколько этапов:
Содержательная постановка задачи исследования и формирование массива исходной информации.
На этом этапе на основе экономической теории выявляют основные причины следственной связи в исследуемой модели. Выявляют гипотезы о взаимосвязи. Такой предварительный анализ позволяет определить результирующие показатели. Проводится сбор и проверку на однородность исходных статистических данных, при необходимости осуществляется сбор дополнительной информации
Классификация модели.
На данном этапе принимаются решения относительно того, какие из факторов, влияющие на результирующий показатель Y следует включать в модель и анализируют особенности Y, то есть решается вопрос носит ли фактор временный характер.
Калибровка модели. На данном этапе находят оценки коэффициентов регрессионной модели. Осуществляется проверка качества модели, если результаты проверки не удовлетворительны, то необходимо внести изменения в классификацию модели, то есть вернутся к этапу 2. На данном этапе проводят проверку теоретическим представления о модели.
Применение модели для прогноза и принятие решений. Построенная модель применяется для нахождения прогнозируемого значения регрессирующего показателя Y, а также для анализа степени влияния факторов X на результирующий показатель. Схематично все этапы построения многофакторной регрессионной модели представлены на рисунке 1.
Размещено на http://www.allbest.ru/
Рисунок 1 Этапы построения многофакторной регрессионной модели
2. Спецификация модели
На этом этапе принимается решение относительного того, какие из факторов, влияющих на стоимость, следует включать в модель, а также анализируется влияние этих факторов на результирующий показатель (увеличивают или уменьшают они стоимость; является ли эта зависимость линейной или носит более сложный характер).
При этом в процессе такого исследования можно несколько раз возвращаться к этапу спецификации модели, уточняя перечень включаемых факторов или вид функции. Когда вид функции или её составляющие не соответствуют реальным процессам, то говорят об ошибках спецификации модели. Эти ошибки могут быть трёх видов:
игнорирование при построении модели существенного фактора;
введение в модель переменной, которая не является существенной для объясняемого показателя;
использование неподходящих математических функций для описания зависимости.
Непосредственный отбор факторов для включения их в модель, должен осуществляться на основе качественного анализа, исходя из целей и задач исследования. Наряду с факторами, непосредственно формирующими уровень исследуемого результативного показателя, в анализ необходимо вводить так называемые глубинные факторы, действующие опосредовано.
Введение в модель большого числа факторов вовсе не так целесообразно, как иногда кажется. Правильнее отобрать только сравнительно небольшое число основных факторов, находящихся в корреляционной связи с выбранным функциональным (результирующим) показателем. Это объясняется двумя причинами. Во-первых, чрезмерное увеличение числа факторов может не прояснить, а напротив, затушевать картину множественных связей. А во-вторых, статистические методы исследования могут быть использованы, когда на каждый оцениваемый коэффициент модели приходится не менее 4-5 выборочных данных. А объём выборки, как правило, всегда ограничен из-за недостатка информации.
Выбор факторов, включаемых в модель, прежде всего предопределяется возможностью получения исходной статистической информации.
Факторы, включаемые в модель, не должны находиться между собой в функциональной связи. Наличие таких связей носит название мультиколлинеарности. С одной стороны, мультиколлинеарность свидетельствует о том, что некоторые факторы характеризуют одну и ту же сторону изучаемого объекта, поэтому их одновременное включение в модель нецелесообразно, так как они в какой-то мере дублируют друг друга. С другой стороны, мультиколлинеарность приводит к чисто математическим проблемам в оценке коэффициентов модели, а также ведёт к неустойчивости и ненадёжности результатов решения.
Факторы, включаемые в модель, должны быть, как правило, количественно измеримы. Правда, современный математический аппарат позволяет учитывать и качественные показатели, например, такие как зона, в которой расположен объект недвижимости.
Чтобы включить качественные переменные в модель, их нужно преобразовать в бинарные. Для этого, каждому значению качественной переменной ставится в соответствие 0 или 1. Например, если объект недвижимости находится в центральной части города, то соответствующее значение переменной равно 1, в противном случае -- 0. Затем эти бинарные переменные вводятся в модель, наряду с другими факторами.
Имущественная информация о некоторых факторах места положения, площади участка, года строительства, уровня отделки, наличия гаража представлена ниже:
При ранжировании фактора места положения используется шкала 1-9, при этом учитывается удаленность от центра города, экономическая обстановка, расположение, относительно магистрали, пешеходная доступность к маршрутам общественного транспорта. Значение 1-2 - наихудшее значение фактора, 3-4 - незначительные преимущества, 5-6 - значительные преимущества, 7-8 - явные преимущества, значение 9 - абсолютные преимущества.
При ранжировании фактора уровня отделки использовался прием исчисления ранговых переменных, основанный на средней уровня затрат. В результате анализа рыночной информации различных строительных организаций города были рассчитаны средние уровня затрат на выполнение различного уровня отделочных работ в жилых домах.
50 у.е за м2 - простая отделка из недорогих материалов;
150 у.е за м2 - улучшенная отделка с использованием современных высококачественных материалов;
250 у.е за м2 - высококачественная отделка с индивидуальным интерьером помещений, архитектурной отделки фасада дома.
Разделив каждый из этих величин на средние затраты на выполнение проектной отделки, то есть на 50 у.е., получим следующие ранговые величины:
0 - отсутствие отделки;
1 - простая отделка;
3 - улучшенная отделка;
5 - высококачественная отделка.
Фактор наличия гаража имеет два качественных уровня: да и нет (1 и 0 соответственно). Фактор площади земельного участка является количественным, следовательно преобразования в этом случаи не потребуются. С помощью данных о годе строительства было рассчитано количество лет с даты введения в эксплуатацию. Для проведения исследований нами были проанализированы данные по оценке объектов недвижимости по Тольятти. На этом этапе в выборку вошло 25 объектов.
Таблица 1 Исходная информация по объектам-аналогам в количественном виде
№ п/п |
Местоположение |
Уровень отделки |
Наличие гаража |
Площадь земельного участка, соток |
Расположение на территории коттеджного поселка |
Срок эксплуатации, лет |
Стоимость 1 кв.м., д/е |
|
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
y |
||
1 |
1 |
0 |
0 |
8 |
0 |
1 |
250 |
|
2 |
2 |
0 |
0 |
8 |
0 |
1 |
250 |
|
3 |
2 |
1 |
0 |
9 |
0 |
2 |
280 |
|
4 |
2 |
1 |
0 |
10 |
0 |
3 |
310 |
|
5 |
3 |
0 |
0 |
11 |
0 |
3 |
310 |
|
6 |
4 |
1 |
0 |
10 |
0 |
3 |
330 |
|
7 |
6 |
5 |
0 |
11 |
1 |
4 |
350 |
|
8 |
5 |
5 |
1 |
11 |
0 |
5 |
360 |
|
9 |
5 |
5 |
0 |
12 |
0 |
5 |
370 |
|
10 |
4 |
1 |
1 |
13 |
0 |
1 |
390 |
|
11 |
1 |
1 |
1 |
14 |
0 |
6 |
400 |
|
12 |
2 |
1 |
0 |
15 |
0 |
1 |
410 |
|
13 |
3 |
3 |
1 |
16 |
0 |
4 |
420 |
|
14 |
2 |
3 |
1 |
16 |
0 |
7 |
440 |
|
15 |
7 |
3 |
0 |
14 |
1 |
4 |
460 |
|
16 |
2 |
3 |
1 |
12 |
1 |
3 |
480 |
|
17 |
3 |
0 |
1 |
14 |
1 |
3 |
490 |
|
18 |
2 |
0 |
0 |
14 |
1 |
2 |
510 |
|
19 |
2 |
0 |
1 |
13 |
0 |
2 |
520 |
|
20 |
7 |
0 |
0 |
15 |
1 |
3 |
550 |
|
21 |
7 |
0 |
1 |
15 |
1 |
4 |
570 |
|
22 |
9 |
0 |
0 |
10 |
1 |
4 |
580 |
|
23 |
9 |
0 |
0 |
12 |
1 |
2 |
590 |
|
24 |
9 |
1 |
1 |
10 |
1 |
1 |
590 |
|
25 |
9 |
1 |
0 |
16 |
1 |
5 |
600 |
Количественно оценить степень тесноты связи между признаками при линейной форме связи можно с помощью коэффициента корреляции. Были рассчитаны коэффициенты корреляции между функциональным показателем (стоимость 1 м2 внутренней площади в тыс.руб.) и предложенными факторами. В результате анализа этих данных были получены следующие коэффициенты корреляции, перечислены в таблице 2. Можно сделать вывод что, эти фактор срока эксплуатации несущественно влияет на оценочную стоимость, а фактор площади земельного участка существенно влияет, так как стремится к 1.
В обоих случаях значение коэффициента корреляции попадает в интервал от 0 до 1, это говорит о том, что связь прямая.
Таблица 2 Факторы, отобранные для включения в модель
№ |
Название фактора |
Коэффициент корреляции |
|
1 |
Срок эксплуатации, лет |
0,14 |
|
2 |
Площадь земельного участка, соток |
0,55 |
После того, как были выявлены наиболее существенные факторы, влияющие на стоимость рассматриваемых объектов, встал вопрос о подборе вида функциональной зависимости, то есть виде многофакторной регрессионной модели. От правильности этого выбора зависит то, насколько построенная модель будет адекватна изучаемому явлению, то есть будет ли она соответствовать ему при заданном уровне точности, что, в свою очередь, предопределяет практическую ценность получаемых результатов.
Запас кривых для описания статистических данных, которыми располагает математический анализ, бесконечно разнообразен. Для выбора той из них, которая наиболее адекватна не только имеющемуся эмпирическому материалу, но и истинной зависимости между изучаемым показателем и обуславливающими его факторами, исходят из соображений самого различного характера -- логического, графического и статистического.
При прочих равных условиях предпочтение отдается модели, зависящей от меньшего числа параметров, так как для их оценки требуется меньшее количество эмпирических данных.
При анализе связи между двумя количественными факторами можно увидеть структуру зависимости между величинами.
Чем сильнее связь между признаками, тем ближе друг к другу будут формироваться точки по определенной линии, выражающей форму связи.
Рисунок 2 График зависимости между двумя переменными: стоимости 1 м2 и сроком эксплуатации
Точки сконцентрированы вокруг линии, которая переходит из левого нижнего к правому верхнему углу - это свидетельствует, что связь прямая линейная.
На рисунке 3 представлена связь между двумя показателями - стоимости 1 м2 объекта оценки и площадью земельного участка.
Рисунок 3 График зависимости между двумя переменными: стоимости 1 м2 и площадью земельного участка
Точки сконцентрированы вокруг линии, которая переходит из левого нижнего к правому верхнему углу - это свидетельствует, что связь прямая линейная.
3. Анализ связи при ранговых факторах
Коэффициент корреляции Спирмена -- мера линейной связи между случайными величинами. Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.
Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:
1) Сопоставить каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).
2) Определить разности рангов каждой пары сопоставляемых значений.
3) Возвести в квадрат каждую разность и суммировать полученные результаты.
4) Вычислить коэффициент корреляции рангов по формуле:
где - значение ранга для 1-го признака по j - му объекту;
- значение ранга для 2-го признака по j - му объекту;
n - число наблюдений.
Коэффициент Спирмена принимает значения из отрезка .
При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.
Расчёты оценки ранга стоимости представлены в таблице 3.
Таблица 3 Оценка ранга стоимости
Стоимость 1 кв.м., д/е |
Оценка ранга стоимости, Ry |
Местоположение |
|
250 |
1,5 |
1 |
|
250 |
1,5 |
2 |
|
280 |
3 |
2 |
|
310 |
4,5 |
2 |
|
310 |
4,5 |
3 |
|
330 |
6 |
4 |
|
350 |
7 |
6 |
|
360 |
8 |
5 |
|
370 |
9 |
5 |
|
390 |
10 |
4 |
|
400 |
11 |
1 |
|
410 |
12 |
2 |
|
420 |
13 |
3 |
|
440 |
14 |
2 |
|
460 |
15 |
7 |
|
480 |
16 |
2 |
|
490 |
17 |
3 |
|
510 |
18 |
2 |
|
520 |
19 |
2 |
|
550 |
20 |
7 |
|
570 |
21 |
7 |
|
580 |
22 |
9 |
|
590 |
23,5 |
9 |
|
590 |
23,5 |
9 |
|
600 |
25 |
9 |
Расчёты оценки ранга местоположения и сумма квадратов разностей рангов представлены в таблице 4.
Таблица 4 Оценка ранга местоположения
Стоимость 1 кв.м., д/е |
Оценка ранга стоимости, Ry |
Местоположение |
Оценка ранга местоположения, Rx |
(Ry-Rx)2 |
|
250 |
1,5 |
1 |
1,5 |
0 |
|
400 |
11 |
1 |
1,5 |
90,25 |
|
250 |
1,5 |
2 |
6,5 |
25 |
|
280 |
3 |
2 |
6,5 |
12,25 |
|
310 |
4,5 |
2 |
6,5 |
4 |
|
410 |
12 |
2 |
6,5 |
30,25 |
|
440 |
14 |
2 |
6,5 |
56,25 |
|
480 |
16 |
2 |
6,5 |
90,25 |
|
510 |
18 |
2 |
6,5 |
132,25 |
|
520 |
19 |
2 |
6,5 |
156,25 |
|
310 |
4,5 |
3 |
12 |
56,25 |
|
420 |
13 |
3 |
12 |
1 |
|
490 |
17 |
3 |
12 |
25 |
|
330 |
6 |
4 |
14,5 |
72,25 |
|
390 |
10 |
4 |
14,5 |
20,25 |
|
360 |
8 |
5 |
16,5 |
72,25 |
|
370 |
9 |
5 |
16,5 |
56,25 |
|
350 |
7 |
6 |
18 |
121 |
|
460 |
15 |
7 |
20 |
25 |
|
550 |
20 |
7 |
20 |
0 |
|
570 |
21 |
7 |
20 |
1 |
|
580 |
22 |
9 |
20 |
2,25 |
|
590 |
23,5 |
9 |
23,5 |
0 |
|
590 |
23,5 |
9 |
23,5 |
0 |
|
600 |
25 |
9 |
23,5 |
2,25 |
В результате расчётов значение коэффициента Спирмена получилось почти равным, что говорит о том, что связь между рангом стоимости объекта и рангом местоположения очень сильная.
4. Однофакторный дисперсионный анализ
Дисперсионный анализ -- это анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов.
Однофакторный дисперсионный анализ используется в тех случаях, когда есть в распоряжении три или более независимые выборки, полученные из одной генеральной совокупности путем изменения какого-либо независимого фактора, для которого по каким-либо причинам нет количественных измерений.
Это средство служит для анализа дисперсии по данным двух или нескольких выборок.
При анализе сравнивается гипотеза о том, что каждый пример извлечен из одного и того же базового распределения вероятности, с альтернативной гипотезой, предполагающей, что базовые распределения вероятности во всех выборках разные.
Для более двух выборок можно воспользоваться моделью однофакторного дисперсионного анализа. Для анализа необходимо сортировать стоимость объектов по наличию гаража, таблица 5.
Таблица 5 Сортировка стоимости 1 м2 по признаку наличия гаража
Наличие гаража |
Стоимость 1 кв.м., д/е |
|
0 |
250 |
|
0 |
250 |
|
0 |
280 |
|
0 |
310 |
|
0 |
310 |
|
0 |
330 |
|
0 |
350 |
|
0 |
370 |
|
0 |
410 |
|
0 |
460 |
|
0 |
510 |
|
0 |
550 |
|
0 |
580 |
|
0 |
590 |
|
0 |
600 |
|
1 |
360 |
|
1 |
390 |
|
1 |
400 |
|
1 |
420 |
|
1 |
440 |
|
1 |
480 |
|
1 |
490 |
|
1 |
520 |
|
1 |
570 |
|
1 |
590 |
Затем группируются 2 столбца стоимости 1 м2 по признаку наличия и отсутствия гаража, таблица 6.
Таблица 6 Группировка стоимостей 1 м2 по признаку наличия и отсутствия гаража
360 |
250 |
|
390 |
250 |
|
400 |
280 |
|
420 |
310 |
|
440 |
310 |
|
480 |
330 |
|
490 |
350 |
|
520 |
370 |
|
570 |
410 |
|
590 |
460 |
|
510 |
||
550 |
||
580 |
||
590 |
||
600 |
Рассчитываем однофакторный дисперсионный анализ с помощью программы Excell. Для проведения данной процедуры необходимо вызвать команду «Данные - Анализ - Однофакторный дисперсионный анализ». В результате получились следующие данные, представленные в таблице 7.
Таблица 7 Однофакторный дисперсионный анализ
Итоги |
|||||||
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
|||
Столбец 1 |
10 |
4660 |
466 |
6004,444 |
|||
Столбец 2 |
15 |
6150 |
410 |
16371,43 |
|||
Дисперсионный анализ |
|||||||
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
|
Между группами |
18816 |
1 |
18816 |
1,52792 |
0,228901 |
4,279344 |
|
Внутри групп |
283240 |
23 |
12314,78 |
||||
Итого |
302056 |
24 |
Для выборки объема n выборочная дисперсия вычисляется как сумма квадратов отклонений от выборочного среднего, деленная на n-1 (объем выборки минус единица). Таким образом, при фиксированном объеме выборки n дисперсия есть функция суммы квадратов (отклонений), обозначаемая, для краткости, SS (Сумма квадратов). Далее слово выборочная мы часто опускаем, прекрасно понимая, что рассматривается выборочная дисперсия или оценка дисперсии.
Внутригрупповая изменчивость (SS) обычно называется остаточной компонентой или дисперсией ошибки. Это означает, что обычно при проведении эксперимента она не может быть предсказана или объяснена. С другой стороны, SS эффекта (или компоненту дисперсии между группами) можно объяснить различием между средними значениями в группах. Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.
Проверка значимости в дисперсионном анализе основана на сравнении компоненты дисперсии, обусловленной межгрупповым разбросом (называемой средним квадратом эффекта или MSэффект) и компоненты дисперсии, обусловленной внутригрупповым разбросом. Если верна нулевая гипотеза (равенство средних в двух популяциях), то можно ожидать сравнительно небольшое различие выборочных средних из-за чисто случайной изменчивости. Поэтому, при нулевой гипотезе, внутригрупповая дисперсия будет практически совпадать с общей дисперсией, подсчитанной без учета групповой принадлежности. Полученные внутригрупповые дисперсии можно сравнить с помощью F-критерия. В рассмотренном выше примере F-критерий показывает, что различие между средними статистически значимо.
Целью дисперсионного анализа является проверка статистической значимости различия между средними (для групп или переменных). Эта проверка проводится с помощью разбиения суммы квадратов на компоненты, т.е. с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними.
Повторим расчеты. Просортируем стоимость объектов по расположению на территории коттеджного поселка, таблица 8.
Таблица 8 Сортировка стоимости 1 м2 по признаку расположения на территории коттеджного поселка
Расположение на территории коттеджного поселка |
Стоимость 1 кв.м., д/е |
|
0 |
250 |
|
0 |
250 |
|
0 |
280 |
|
0 |
310 |
|
0 |
310 |
|
0 |
330 |
|
0 |
360 |
|
0 |
370 |
|
0 |
390 |
|
0 |
400 |
|
0 |
410 |
|
0 |
420 |
|
0 |
440 |
|
0 |
520 |
|
1 |
350 |
|
1 |
460 |
|
1 |
480 |
|
1 |
490 |
|
1 |
510 |
|
1 |
550 |
|
1 |
570 |
|
1 |
580 |
|
1 |
590 |
|
1 |
590 |
|
1 |
600 |
Затем группируются 2 столбца стоимости 1 м2 по признаку расположения на территории коттеджного поселка от Тольятти, таблица 9.
Таблица 9 Группировка стоимостей 1 м2 по признаку расположения на территории коттеджного поселка
350 |
250 |
|
460 |
250 |
|
480 |
280 |
|
490 |
310 |
|
510 |
310 |
|
550 |
330 |
|
570 |
360 |
|
580 |
370 |
|
590 |
390 |
|
590 |
400 |
|
600 |
410 |
|
420 |
||
440 |
||
520 |
Рассчитываем однофакторный дисперсионный анализ с помощью программы Excell. Для проведения данной процедуры необходимо вызвать команду «Данные - Анализ - Однофакторный дисперсионный анализ». В результате получились следующие данные, представленные в таблице 10.
Таблица 10 Однофакторный дисперсионный анализ
Итоги |
|||||||
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
|||
Столбец 1 |
11 |
5770 |
524,5455 |
5807,273 |
|||
Столбец 2 |
14 |
5040 |
360 |
5938,462 |
|||
Дисперсионный анализ |
|||||||
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
|
Между группами |
166783,3 |
1 |
166783,3 |
28,35764 |
2,09E-05 |
4,279344 |
|
Внутри групп |
135272,7 |
23 |
5881,423 |
||||
Итого |
302056 |
24 |
регрессия многофакторный корреляция ранг
5. Расчет коэффициентов логарифмической (линеаризованной) модели
Расчет коэффициентов модели осуществляется на компьютере с помощью пакета прикладных программ. Так, например, в среде MS EXCEL в пакете Анализ данных имеется функция Регрессия, позволяющая получит значения коэффициентов модели.
Для расчета коэффициентов модели в качестве входного интервала Y нужно указать столбец, содержащий данные о логарифмах цен, а в качестве входного интервала X ? указать массив данных обо всех ценообразующих факторах таблицы 1. После нажатия кнопки ОК на экране под рубрикой ВЫВОД ИТОГОВ выводится информация о показателях статистической надежности модели и значениях ее коэффициентов в виде трех таблиц 11, 12, 13.
Таблица 11 Регрессионная статистика
Регрессионная статистика |
||
Множественный R |
0,931471674 |
|
R-квадрат |
0,86763948 |
|
Нормированный R-квадрат |
0,823519306 |
|
Стандартная ошибка |
47,12883601 |
|
Наблюдения |
25 |
Таблица 12 Дисперсионный анализ
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
6 |
262075,7 |
43679,28511 |
19,66536875 |
5,32229E-07 |
|
Остаток |
18 |
39980,29 |
2221,127184 |
|||
Итого |
24 |
302056 |
Таблица 13 Нахождение коэффициентов
Коэффи циенты |
Стандарт ошибка |
t ста тистика |
P Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
120,70837 |
52,39459 |
2,3038328 |
0,033368221 |
10,63142665 |
230,7853244 |
10,63143 |
230,7853 |
|
Переменная X 1 |
17,486670 |
4,851462 |
3,6044124 |
0,002027203 |
7,294126632 |
27,67921375 |
7,294127 |
27,67921 |
|
Переменная X 2 |
-16,554872 |
6,838064 |
2,4209881 |
0,026268886 |
-30,92111259 |
-2,188632376 |
-30,9211 |
-2,18863 |
|
Переменная X 3 |
56,64082 |
21,13032 |
2,6805470 |
0,015269054 |
12,24766471 |
101,0339947 |
12,24766 |
101,034 |
|
Переменная X 4 |
16,715751 |
4,755354 |
3,5151432 |
0,002472177 |
6,72512301 |
26,7063808 |
6,725123 |
26,70638 |
|
Переменная X 5 |
76,517907 |
27,07574 |
2,8260693 |
0,011192947 |
19,63389796 |
133,4019177 |
19,6339 |
133,4019 |
|
Переменная X 6 |
-0,7216722 |
7,846739 |
-0,0919709 |
0,927736953 |
-17,20706006 |
15,76371554 |
-17,2071 |
15,76372 |
Для логарифмической модели в таблицы 11 представлено значение нормированного коэффициента детерминации R-квадрат = 0,86, скорректированного на число степеней свободы (учитывающее объем выборки и количество независимых переменных). Данный коэффициент говорит о том, что модель объясняет приблизительно 86% вариации логарифмов цен на рынке жилой недвижимости данного поселения при вариации по всей выборке логарифмов учтенных в модели факторов. По величине этого показателя нельзя напрямую сравнивать качество линейных и линеаризованных регрессионных моделей, поэтому в дальнейшем значение коэффициента детерминации рассчитывается в исходных координатах рыночных цен и их модельных оценок. На практике в качестве минимального (критического) значения данного коэффициента обычно принимают значение, равное 0,7.
Оценку надежности уравнения регрессии в целом и показателя тесноты связи (множественный R - таблица 11) проводят с помощью F-критерия Фишера. Его расчетное значение должно быть больше критического (табличного). Расчетное значение критерия Фишера для логарифмической модели представлено в столбце 5 таблицы 12: Fрасч=19,66. Оно на порядки больше критического значения. Вероятность случайно получить такое значение F-критерия составляет бесконечно малую величину 5,32E-07. Уровень вероятности, с которой модель можно считать статистически значимой, определяется вычитанием из единицы значения значимость F. В данном случае эта вероятность практически равна 1.
Кроме проверки значимости регрессионного уравнения в целом, целесообразно выполнить оценку надежности получения отдельных коэффициентов модели. Необходимо проверить статистическую надежность выявленной связи между моделируемой величиной (средней ценой объекта) и конкретным влияющим фактором. В таблицах 9 и 10 представлена информация о значимости коэффициентов рассматриваемой модели, оцененной с помощью t- критерия Стьюдента. Для того чтобы каждый коэффициент модели считался значимым, необходимо, чтобы абсолютное значение t-статистики для этого коэффициента превышало критическое значение. В столбце 5 таблицы 13 представлен уровень значимости значений коэффициентов модели в долях единицы (Р-значение). Если этот показатель меньше принятого уровня (обычно 0,05; что соответствует надежности принятия решения с 5% вероятностью ошибки), делают вывод о неслучайной природе данного значения коэффициента, т.е. о том, что он статистически значим и надежен. Для того чтобы коэффициент, например, с не менее чем 90% вероятностью считался статистически надежным, необходимо, чтобы уровень значимости P-Значение ? 0,1.
Следует обращать внимание на совпадение знаков оценок границ доверительного интервала для значений коэффициентов регрессионной модели (столбцы 6 и 7 таблицы 13). Если знаки величин Нижние 95% и Верхние 95% , являющихся границами доверительного интервала для коэффициента модели, различаются, это означает, что доверительный интервал включает в себя нулевое значение проверяемого коэффициента. Такой случай следует рассматривать как необоснованное включение факторного признака в состав основных влияющих факторов модели и проводить объединение данной группы (или градации) с ближайшей к ней по величине коэффициента модели. Расчет коэффициентов модели при этом необходимо провести заново.
В данном случае, что переменная x6 "срок эксплуатации" имеет значение 0,93.. - это намного больше 0,05. Это говорит о том, что фактор срока эксплуатации не оказывает значимого влияния на стоимость нашего объекта недвижимости. Чтобы были более точные данные о стоимости необходимо произвести регрессионный анализ с пятью переменными.
Таблица 14 Исходные данные для проведения регрессионного анализа с пятью переменными
№ п/п |
Местоположение |
Уровень отделки |
Наличие гаража |
Площадь земельного участка, соток |
Расположение на территории коттеджного поселка |
Стоимость 1 кв.м., д/е |
|
x1 |
x2 |
x3 |
x4 |
x5 |
y |
||
1 |
1 |
0 |
0 |
8 |
0 |
250 |
|
2 |
2 |
0 |
0 |
8 |
0 |
250 |
|
3 |
2 |
1 |
0 |
9 |
0 |
280 |
|
4 |
2 |
1 |
0 |
10 |
0 |
310 |
|
5 |
3 |
0 |
0 |
11 |
0 |
310 |
|
6 |
4 |
1 |
0 |
10 |
0 |
330 |
|
7 |
6 |
5 |
0 |
11 |
1 |
350 |
|
8 |
5 |
5 |
1 |
11 |
0 |
360 |
|
9 |
5 |
5 |
0 |
12 |
0 |
370 |
|
10 |
4 |
1 |
1 |
13 |
0 |
390 |
|
11 |
1 |
1 |
1 |
14 |
0 |
400 |
|
12 |
2 |
1 |
0 |
15 |
0 |
410 |
|
13 |
3 |
3 |
1 |
16 |
0 |
420 |
|
14 |
2 |
3 |
1 |
16 |
0 |
440 |
|
15 |
7 |
3 |
0 |
14 |
1 |
460 |
|
16 |
2 |
3 |
1 |
12 |
1 |
480 |
|
17 |
3 |
0 |
1 |
14 |
1 |
490 |
|
18 |
2 |
0 |
0 |
14 |
1 |
510 |
|
19 |
2 |
0 |
1 |
13 |
0 |
520 |
|
20 |
7 |
0 |
0 |
15 |
1 |
550 |
|
21 |
7 |
0 |
1 |
15 |
1 |
570 |
|
22 |
9 |
0 |
0 |
10 |
1 |
580 |
|
23 |
9 |
0 |
0 |
12 |
1 |
590 |
|
24 |
9 |
1 |
1 |
10 |
1 |
590 |
|
25 |
9 |
1 |
0 |
16 |
1 |
600 |
Таблица 15 Регрессионная статистика
Регрессионная статистика |
||
Множественный R |
0,931438 |
|
R-квадрат |
0,867577 |
|
Нормированный R-квадрат |
0,832729 |
|
Стандартная ошибка |
45,88262 |
|
Наблюдения |
25 |
Таблица 16 Дисперсионный анализ
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
5 |
262056,9 |
52411,38459 |
24,89598211 |
9,97053E-08 |
|
Остаток |
19 |
39999,08 |
2105,214583 |
Таблица 17 Нахождение коэффициентов
Коэффициенты |
Стандартная ошибка |
T статистика |
P Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
121,4293 |
50,43501 |
2,407639671 |
0,0263822 |
15,867641 |
226,991 |
15,86764 |
226,991 |
|
Переменная X 1 |
17,41603 |
4,663605 |
3,734455853 |
0,0014049 |
7,6549900 |
27,17707 |
7,65499 |
27,17707 |
|
Переменная X 2 |
-16,8778 |
5,71239 |
-2,954601272 |
0,0081388 |
-28,834003 |
-4,92166 |
-28,834 |
-4,92166 |
|
Переменная X 3 |
56,56349 |
20,55528 |
2,751773849 |
0,0126860 |
13,540788 |
99,58619 |
13,54079 |
99,58619 |
|
Переменная X 4 |
16,52932 |
4,187933 |
3,946893084 |
0,0008650 |
7,7638784 |
25,29477 |
7,763878 |
25,29477 |
|
Переменная X 5 |
76,78366 |
26,20924 |
2,929641258 |
0,0085992 |
21,927098 |
131,6402 |
21,9271 |
131,6402 |
При регрессионном анализе с пятью переменными значимость всех влияющих факторов не вызывает сомнений.
Полученные коэффициенты подставляем в выражение
у=В0+В1х1+В2х2+В3х3+В4х4+В5х5,
где В0, В1..В5 - это и есть коэффициенты, были получены в результате регрессионного анализа,
х1, х2..х5 - это данные объекта оценки.
Найдем стоимость за 1 м2 объекта оценки: это х1 - местоположение: центральная часть - Ленинский проспект, и с учетом принятого ранжирования =9; х2 - у оцениваемого дома улучшенная отделка, х2=3; Х3 - у оцениваемого дома имеется гараж, Х3=1; S участка=10 соток, х4=10; расположен на территории коттеджного поселка с хорошим уровнем инфраструктуры, значит х5=1. Стоимость данного объекта недвижимости получается:
у = 121,43+17,41*9-16,87*3+56,56*1+16,53*10+76,78=526,15 д.е.
Размещено на Allbest.ru
Подобные документы
Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.
лабораторная работа [1,6 M], добавлен 13.04.2010Классическая линейную модель множественной регрессии. Значимость уравнения регрессии и его коэффициентов. Доверительный интервал. Матрица парных коэффициентов корреляции. Модель множественной регрессии. Автокорреляция.
контрольная работа [172,9 K], добавлен 17.01.2004Парная линейная регрессия. Полный регрессионный анализ. Коэффициент корреляции и теснота линейной связи. Стандартная ошибка регрессии. Значимость уравнения регрессии. Расположение доверительных интервалов. Расчет параметров множественной регрессии.
контрольная работа [932,7 K], добавлен 09.06.2012Оценка силы вариации признака. Построение регрессионной модели. Парный линейный коэффициент корреляции. Оценка статистической надежности результатов. Значение коэффициента детерминации. Оценка силы связи признаков. Фактическое значение критерия Фишера.
контрольная работа [165,8 K], добавлен 27.05.2015Расчет параметров линейного уравнения множественной регрессии с перечнем факторов по данным о деятельности компаний США. Оценка силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности. Доверительный интервал прогноза.
лабораторная работа [666,9 K], добавлен 21.04.2015Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.
контрольная работа [1,3 M], добавлен 24.09.2013Основы линейного регрессионного анализа. Особенности использования функции Кобба-Дугласа. Применение множественной линейной регрессии. Сущность метода наименьших квадратов. Пути избегания ложной корреляции. Проверка значимости коэффициентов регрессии.
реферат [101,8 K], добавлен 31.10.2009Понятие, экономическая сущность, виды, причины и процедура банкротства, модели его диагностики. Общая характеристика деятельности и оценка вероятности банкротства ООО "Тольятти". Анализ путей финансовой стабилизации предприятия при угрозе банкротства.
курсовая работа [89,5 K], добавлен 17.11.2010Расчет максимального размера арендной платы при сохранении необходимой нормы прибыли. Оценка стоимости коттеджа с земельным участком с определением процентных корректировок. Рыночная стоимость объекта оценки. Расчет коэффициента капитализации капитала.
контрольная работа [187,4 K], добавлен 30.07.2012Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.
контрольная работа [513,5 K], добавлен 02.05.2015