Эконометрика. Модели парной и множественной регрессии
Характеристика принципа конкретных количественных и качественных взаимосвязей экономических объектов и процессов с помощью математических и статистических методов. Построение уравнения парной регрессии. Статистический анализ модели и оценка её качества.
Рубрика | Экономика и экономическая теория |
Вид | лекция |
Язык | русский |
Дата добавления | 22.07.2014 |
Размер файла | 126,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ЭКОНОМЕТРИКА. МОДЕЛИ ПАРНОЙ И МНОЖЕСТВЕННОЙ РЕГРЕССИИ
Лекция
Модели парной и множественной регрессии
Построение уравнения парной регрессии
Уравнение адекватно реальному моделируемому явлению или процессу в случае соблюдения следующих требований:
- cовокупность исходных данных должна быть однородной и математически описываться непрерывными функциями;
- наличие достаточно большого объема исследуемой выборочной совокупности;
- возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей;
- причинно-следственные связи между явлениями и процесса ми, по возможности, следует описывать линейной (или при водимой к линейной) формой зависимости;
- отсутствие количественных ограничений на параметры модели
- количественное выражение факторных признаков;
- постоянство территориальной и временной структуры изучаемой совокупности.
Теоретическая обоснованность моделей взаимосвязи явлений обеспечивается соблюдением определенных условий:
- все признаки и их совместные распределения должны подчиняться нормальному закону распределения;
Построение уравнения парной регрессии
Уравнение адекватно реальному моделируемому явлению или процессу в случае соблюдения следующих требований по его построению:
- cовокупность исходных данных должна быть однородной и математически описываться непрерывными функциями;
- наличие достаточно большого объема исследуемой выборочной совокупности;
- возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей;
- причинно-следственные связи между явлениями и процесса ми, по возможности, следует описывать линейной (или при водимой к линейной) формой зависимости;
- отсутствие количественных ограничений на параметры модели
- количественное выражение факторных признаков;
- постоянство территориальной и временной структуры изучаемой совокупности.
Теоретическая обоснованность моделей взаимосвязи явлений обеспечивается соблюдением определенных условий:
- все признаки и их совместные распределения должны подчиняться нормальному закону распределения;
- дисперсия моделируемого признака должна всё время оставаться постоянной при изменении значений факторного признака;
- отдельные наблюдения должны быть независимы, т.е. результаты полученные в i наблюдении, не должны быть связаны с предыдущими и содержать информацию о последующих наблюдениях, а также влиять на них.
При линейной связи параметры ( и ) уравнения парной регрессии:
(1)
находятся с помощью метода наименьших квадратов. Суть метода заключается в минимизации суммы квадратов отклонений теоритических значений результативного признака () от его фактических значений ():
(2)
Условие (2) выполняется при равенстве нулю частных производных по параметрам и :
(3)
сократим каждое уравнение системы (3) на (-2), раскроем скобки и получим следующую систему нормальных уравнений:
(4)
Поделим каждое уравнение системы (4) на объём статистической совокупности (n), тогда упомянутую систему можно представить в более наглядном виде:
(5)
Из первого уравнения системы (5) следует, что:
(6)
Подставив полученное выражение во второе уравнение, получим:
. (7)
Коэффициент корреляции определяется по формуле:
(8)
Учитывая (6) и (7) получим
(9)
или . (10) Зная значения r, и можно вычислить по выражениям (10) и (9) параметры и линейного уравнения регрессии.
Параметр , нельзя использовать для непосредственной оценки влияния факторного признака на результативный при знак из-за различия единиц измерения исследуемых показателей. Для этих целей вычисляют значение среднего коэффициента эластичности и бета-коэффициент:
(11)
экономический статистический парный регрессия
Коэффициент эластичности показывает, на сколь ко процентов изменяется результативный признак у при изменении факторного признака x на один процент.
Бета-коэффициент показывает, на какую часть своего среднего квадратического отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину своего среднего квадратического оотклонения.
Статистический анализ модели
Оценка параметров парной регрессии выполняется исходя из следующих предпосылок. Допустим, что в генеральной совокупности связь между x и y линейна. Наличие случайных отклонений, вызванных воздействием на переменную y множества других, неучтенных в уравнении факторов и ошибок измерения, приведет к тому, что связь наблюдаемых величин и приобретает вид:
Здесь - случайные ошибки (отклонения, возмущения). Если были бы известны точные значения отклонений , то можно было бы рассчитать значения параметров и . Так как они неизвестны, то по наблюдениям и можно получить только оценки параметров и , которые сами являются случайными величинами в связи с тем, что соответствуют случайной выборке. Пусть - оценка параметра , - оценка параметра , тогда оцененное уравнение регрессии будет иметь вид:
Для того чтобы оценки и обладали адекватностью ряд остатков
должен удовлетворять следующим требованиям:
- математическое ожидание равно нулю (критерий нулевого среднего);
- величина является случайной переменной (критерий серий);
- значения независимы между собой (критерий Дарбина-Уотсона);
- дисперсия постоянна: для всех i, j (тест Гольдфельда-Квандта);
- остатки распределены по нормальному закону (свойство используется для проверки статистической значимости и построения доверительных интервалов при прогнозировании).
Известно, что если данные условия выполняются, то оценки, сделанные с помощью метода наименьших квадратов, обладают следующими свойствами:
- оценки являются несмещенными, т.е. математическое ожидание оценки каждого параметра равно его истинному значению:
Это вытекает из того, что и свидетельствует об отсутствии систематической ошибки в определении положения линии регрессии;
- оценки состоятельны, т.к. дисперсии оценок параметров при возрастании числа наблюдений стремятся к нулю:
;
т.е. надежность оценки при увеличении выборки растёт;
- оценки эффективны, т.е. они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра.
Если предположения 3 и 4 нарушены, т.е. дисперсия возмущений непостоянна или значения связаны друг с другом, то свойства не смещёности и состоятельности сохраняется, но свойства эффективности - нет.
Отметим, что аппроксимировать уравнением парной регрессии у на х, имеет смысл только в том случае, если существует достаточно тесная статистическая зависимость между случайными величинами и линейный коэффициент корреляции является значимым, что и имеет место в рассматриваемом примере.
Оценка качества построенной модели
Формально качество модели определяется ее адекватностью и точностью. Эти свойства исследуются на основе анализа ряда остатков, значения которых вычислены по выражению
.
Табл.1 содержит:- остатки для задачи, исходные данные которой приведены в табл. 5.2; - ранжированные значения ряда остатков;- остатки за вычетом медианы остатков; - стандартные остатки.
Адекватность является более важной составляющей качества, но сначала рассмотрим характеристики точности и нормальности ряда остатков, так как некоторые из них используются при расчете различных критериев адекватности.
Таблица 1
Характеристики точности
Под точностью понимается величина случайных ошибок. Сравнительный анализ точности имеет смысл только для адекватных моделей: среди них лучшей признается модель с меньшими значениями характеристик точности, к которым относятся:
- максимальная ошибка соответствует максимальному отклонению расчетных значений от фактических;
- средняя абсолютная ошибка
показывает, насколько в среднем отклоняются фактические значения от модели;
- средняя относительная ошибка
;
- остаточная дисперсия
;
- средняя квадратическая ошибка
.(7.36)
Средняя квадратическая ошибка является наиболее часто используемой характеристикой точности (что объясняется ее связью с остаточной дисперсией, которая играет центральную роль в регрессионном анализе). Значение средней квадратической ошибки всегда несколько больше значения средней абсолютной ошибки, но они имеют схожий смысл - характеризуют среднюю удаленность расчетных значений модели от фактических исходных данных. Обычно точность модели признается удовлетворительной если выполняется условие:
.
К характеристикам точности можно отнести также множественный коэффициент детерминации
,
характеризующий долю дисперсии зависимой переменной, объясненной с помощью регрессии, и множественный коэффициент корреляции (индекс корреляции):
.
В случае парной линейной регрессии значение множественного коэффициента корреляции совпадает с линейным коэффициентом корреляции.
Проверка нормальности ряда остатков может быть выполнена приближенно по условиям (2). В связи с тем, что каждый из относительных показателей формы распределения () меньше 1,5 эмпирическое распределение ряда остатков не противоречит нормальному.
Проверка адекватности модели
Проверка адекватности модели заключается в определении её значимости и наличии или отсутствии систематической ошибки. Сначала проверяется значимость параметров уравнения. Если, например, параметр является незначимым, то необходимо с помощью метода наименьших квадратов получить соответствующее уравнение из которого определяется значение параметра .
Проверка значимости осуществляется на основе t - критерия Стьюдента, т.е. проверяется гипотеза о том, что параметр, измеряющий связь, равен нулю.
Средняя ошибка параметра равна:
,
а для параметра :
.
Расчетные значения t- критерия вычисляются по формуле:
Параметр считается значимым, если . Входами в табл. являются уровень значимости и количество степеней свободы
,
где - количество факторов в уравнении регрессии. При и .
Следовательно, в рассматриваемом примере параметры являются значимыми.
Параметр лежит в пределах
;,
а параметр
- ;.
Значимость уравнения регрессии в целом определяется с помощью F - критерия Фишера:
Расчетное значение F сопоставляется с критическимдля числа степеней свободы
при заданном уровне значимости (например, ),где . .
Если , то уравнение считается значимым.
Проверка наличия или отсутствия систематической ошибки Проверка свойства нулевого среднего
Рассчитывается среднее значение ряда остатков
. (7.44)
Если оно близко к нулю, то считается, что модель не содержит систематической ошибки и адекватна по критерию нулевого среднего, иначе - модель неадекватна по данному критерию. Если средняя ошибка не точно равна нулю, то для определения степени ее близости к нулю используется t - критерий Стьюдента. Расчётное значение критерия вычисляется по формуле
и сравнивается с критическим . Если выполняется неравенство , то модель неадекватна по данному критерию.
Проверка случайности ряда остатков
Осуществляется по методу серий. Серией называется последовательность расположенных подряд значений ряда остатков, для которых разность (графа 4 табл. 1) имеет один и тот же знак, где - медиана ряда остатков, значение которой рассчитано по данным графы 3 упомянутой таблицы.
Если модель хорошо отражает исследуемую зависимость, то она часто пересекает линию графика исходных данных и тогда серий много, а их длина невелика. Иначе - серий мало и некоторые из них включают большое число членов.
В качестве серий рассматриваются расположенные подряд ошибки с одинаковыми знаками. Далее подсчитывается число серий и длина максимальной из них . Полученные значения сравниваются с критическими
(7.46)
(квадратные скобки означают округление вниз до ближайшего целого).
Если выполняется система неравенств:
,
то модель признается адекватной по критерию случайности, если хотя бы одно из неравенств нарушено, то модель признается неадекватной по данному критерию.
Размещено на Allbest.ru
Подобные документы
Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.
курсовая работа [131,7 K], добавлен 03.10.2014Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.
контрольная работа [132,1 K], добавлен 10.03.2013Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.
контрольная работа [1,3 M], добавлен 24.09.2013Определение среднего значения показателя в совокупности. Вариационный анализ статистической совокупности по показателю. Проведение выборочного наблюдения и корреляционно-регрессионного анализа. Построение уравнения парной регрессии, ряды динамики.
курсовая работа [290,2 K], добавлен 29.11.2011Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.
лабораторная работа [1,6 M], добавлен 13.04.2010Классическая линейную модель множественной регрессии. Значимость уравнения регрессии и его коэффициентов. Доверительный интервал. Матрица парных коэффициентов корреляции. Модель множественной регрессии. Автокорреляция.
контрольная работа [172,9 K], добавлен 17.01.2004Автоматический анализ тренда на базе диаграммы экспериментальных данных Х и У с помощью программы MSExcel. Прогноз заработной платы при заданном значении среднедушевого прожиточного минимума с помощью пакета анализа. Уравнение линейной парной регрессии.
контрольная работа [363,4 K], добавлен 22.01.2015Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.
контрольная работа [253,4 K], добавлен 17.03.2011Анализ, расчет и построение исходных динамических рядов признака-функции и признака-фактора. Расчет показателей вариации динамических рядов. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции.
курсовая работа [92,7 K], добавлен 24.09.2014Расчет параметров линейной и степенной парной регрессии. Показатели корреляции и детерминации, методика их расчета. Средняя ошибка аппроксимации. Оценка с помощью F-критерия Фишера статистической надежности результатов регрессионного моделирования.
контрольная работа [25,2 K], добавлен 20.11.2014