Эконометрика. Модели парной и множественной регрессии

Характеристика принципа конкретных количественных и качественных взаимосвязей экономических объектов и процессов с помощью математических и статистических методов. Построение уравнения парной регрессии. Статистический анализ модели и оценка её качества.

Рубрика Экономика и экономическая теория
Вид лекция
Язык русский
Дата добавления 22.07.2014
Размер файла 126,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ЭКОНОМЕТРИКА. МОДЕЛИ ПАРНОЙ И МНОЖЕСТВЕННОЙ РЕГРЕССИИ

Лекция

Модели парной и множественной регрессии

Построение уравнения парной регрессии

Уравнение адекватно реальному моделируемому явлению или процессу в случае соблюдения следующих требований:

- cовокупность исходных данных должна быть однородной и математически описываться непрерывными функциями;

- наличие достаточно большого объема исследуемой выборочной совокупности;

- возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей;

- причинно-следственные связи между явлениями и процесса ми, по возможности, следует описывать линейной (или при водимой к линейной) формой зависимости;

- отсутствие количественных ограничений на параметры модели

- количественное выражение факторных признаков;

- постоянство территориальной и временной структуры изучаемой совокупности.

Теоретическая обоснованность моделей взаимосвязи явлений обеспечивается соблюдением определенных условий:

- все признаки и их совместные распределения должны подчиняться нормальному закону распределения;

Построение уравнения парной регрессии

Уравнение адекватно реальному моделируемому явлению или процессу в случае соблюдения следующих требований по его построению:

- cовокупность исходных данных должна быть однородной и математически описываться непрерывными функциями;

- наличие достаточно большого объема исследуемой выборочной совокупности;

- возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей;

- причинно-следственные связи между явлениями и процесса ми, по возможности, следует описывать линейной (или при водимой к линейной) формой зависимости;

- отсутствие количественных ограничений на параметры модели

- количественное выражение факторных признаков;

- постоянство территориальной и временной структуры изучаемой совокупности.

Теоретическая обоснованность моделей взаимосвязи явлений обеспечивается соблюдением определенных условий:

- все признаки и их совместные распределения должны подчиняться нормальному закону распределения;

- дисперсия моделируемого признака должна всё время оставаться постоянной при изменении значений факторного признака;

- отдельные наблюдения должны быть независимы, т.е. результаты полученные в i наблюдении, не должны быть связаны с предыдущими и содержать информацию о последующих наблюдениях, а также влиять на них.

При линейной связи параметры ( и ) уравнения парной регрессии:

(1)

находятся с помощью метода наименьших квадратов. Суть метода заключается в минимизации суммы квадратов отклонений теоритических значений результативного признака () от его фактических значений ():

(2)

Условие (2) выполняется при равенстве нулю частных производных по параметрам и :

(3)

сократим каждое уравнение системы (3) на (-2), раскроем скобки и получим следующую систему нормальных уравнений:

(4)

Поделим каждое уравнение системы (4) на объём статистической совокупности (n), тогда упомянутую систему можно представить в более наглядном виде:

(5)

Из первого уравнения системы (5) следует, что:

(6)

Подставив полученное выражение во второе уравнение, получим:

. (7)

Коэффициент корреляции определяется по формуле:

(8)

Учитывая (6) и (7) получим

(9)

или . (10) Зная значения r, и можно вычислить по выражениям (10) и (9) параметры и линейного уравнения регрессии.

Параметр , нельзя использовать для непосредственной оценки влияния факторного признака на результативный при знак из-за различия единиц измерения исследуемых показателей. Для этих целей вычисляют значение среднего коэффициента эластичности и бета-коэффициент:

(11)

экономический статистический парный регрессия

Коэффициент эластичности показывает, на сколь ко процентов изменяется результативный признак у при изменении факторного признака x на один процент.

Бета-коэффициент показывает, на какую часть своего среднего квадратического отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину своего среднего квадратического оотклонения.

Статистический анализ модели

Оценка параметров парной регрессии выполняется исходя из следующих предпосылок. Допустим, что в генеральной совокупности связь между x и y линейна. Наличие случайных отклонений, вызванных воздействием на переменную y множества других, неучтенных в уравнении факторов и ошибок измерения, приведет к тому, что связь наблюдаемых величин и приобретает вид:

Здесь - случайные ошибки (отклонения, возмущения). Если были бы известны точные значения отклонений , то можно было бы рассчитать значения параметров и . Так как они неизвестны, то по наблюдениям и можно получить только оценки параметров и , которые сами являются случайными величинами в связи с тем, что соответствуют случайной выборке. Пусть - оценка параметра , - оценка параметра , тогда оцененное уравнение регрессии будет иметь вид:

Для того чтобы оценки и обладали адекватностью ряд остатков

должен удовлетворять следующим требованиям:

- математическое ожидание равно нулю (критерий нулевого среднего);

- величина является случайной переменной (критерий серий);

- значения независимы между собой (критерий Дарбина-Уотсона);

- дисперсия постоянна: для всех i, j (тест Гольдфельда-Квандта);

- остатки распределены по нормальному закону (свойство используется для проверки статистической значимости и построения доверительных интервалов при прогнозировании).

Известно, что если данные условия выполняются, то оценки, сделанные с помощью метода наименьших квадратов, обладают следующими свойствами:

- оценки являются несмещенными, т.е. математическое ожидание оценки каждого параметра равно его истинному значению:

Это вытекает из того, что и свидетельствует об отсутствии систематической ошибки в определении положения линии регрессии;

- оценки состоятельны, т.к. дисперсии оценок параметров при возрастании числа наблюдений стремятся к нулю:

;

т.е. надежность оценки при увеличении выборки растёт;

- оценки эффективны, т.е. они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра.

Если предположения 3 и 4 нарушены, т.е. дисперсия возмущений непостоянна или значения связаны друг с другом, то свойства не смещёности и состоятельности сохраняется, но свойства эффективности - нет.

Отметим, что аппроксимировать уравнением парной регрессии у на х, имеет смысл только в том случае, если существует достаточно тесная статистическая зависимость между случайными величинами и линейный коэффициент корреляции является значимым, что и имеет место в рассматриваемом примере.

Оценка качества построенной модели

Формально качество модели определяется ее адекватностью и точностью. Эти свойства исследуются на основе анализа ряда остатков, значения которых вычислены по выражению

.

Табл.1 содержит:- остатки для задачи, исходные данные которой приведены в табл. 5.2; - ранжированные значения ряда остатков;- остатки за вычетом медианы остатков; - стандартные остатки.

Адекватность является более важной составляющей качества, но сначала рассмотрим характеристики точности и нормальности ряда остатков, так как некоторые из них используются при расчете различных критериев адекватности.

Таблица 1

Характеристики точности

Под точностью понимается величина случайных ошибок. Сравнительный анализ точности имеет смысл только для адекватных моделей: среди них лучшей признается модель с меньшими значениями характеристик точности, к которым относятся:

- максимальная ошибка соответствует максимальному отклонению расчетных значений от фактических;

- средняя абсолютная ошибка

показывает, насколько в среднем отклоняются фактические значения от модели;

- средняя относительная ошибка

;

- остаточная дисперсия

;

- средняя квадратическая ошибка

.(7.36)

Средняя квадратическая ошибка является наиболее часто используемой характеристикой точности (что объясняется ее связью с остаточной дисперсией, которая играет центральную роль в регрессионном анализе). Значение средней квадратической ошибки всегда несколько больше значения средней абсолютной ошибки, но они имеют схожий смысл - характеризуют среднюю удаленность расчетных значений модели от фактических исходных данных. Обычно точность модели признается удовлетворительной если выполняется условие:

.

К характеристикам точности можно отнести также множественный коэффициент детерминации

,

характеризующий долю дисперсии зависимой переменной, объясненной с помощью регрессии, и множественный коэффициент корреляции (индекс корреляции):

.

В случае парной линейной регрессии значение множественного коэффициента корреляции совпадает с линейным коэффициентом корреляции.

Проверка нормальности ряда остатков может быть выполнена приближенно по условиям (2). В связи с тем, что каждый из относительных показателей формы распределения () меньше 1,5 эмпирическое распределение ряда остатков не противоречит нормальному.

Проверка адекватности модели

Проверка адекватности модели заключается в определении её значимости и наличии или отсутствии систематической ошибки. Сначала проверяется значимость параметров уравнения. Если, например, параметр является незначимым, то необходимо с помощью метода наименьших квадратов получить соответствующее уравнение из которого определяется значение параметра .

Проверка значимости осуществляется на основе t - критерия Стьюдента, т.е. проверяется гипотеза о том, что параметр, измеряющий связь, равен нулю.

Средняя ошибка параметра равна:

,

а для параметра :

.

Расчетные значения t- критерия вычисляются по формуле:

Параметр считается значимым, если . Входами в табл. являются уровень значимости и количество степеней свободы

,

где - количество факторов в уравнении регрессии. При и .

Следовательно, в рассматриваемом примере параметры являются значимыми.

Параметр лежит в пределах

;,

а параметр

- ;.

Значимость уравнения регрессии в целом определяется с помощью F - критерия Фишера:

Расчетное значение F сопоставляется с критическимдля числа степеней свободы

при заданном уровне значимости (например, ),где . .

Если , то уравнение считается значимым.

Проверка наличия или отсутствия систематической ошибки Проверка свойства нулевого среднего

Рассчитывается среднее значение ряда остатков

. (7.44)

Если оно близко к нулю, то считается, что модель не содержит систематической ошибки и адекватна по критерию нулевого среднего, иначе - модель неадекватна по данному критерию. Если средняя ошибка не точно равна нулю, то для определения степени ее близости к нулю используется t - критерий Стьюдента. Расчётное значение критерия вычисляется по формуле

и сравнивается с критическим . Если выполняется неравенство , то модель неадекватна по данному критерию.

Проверка случайности ряда остатков

Осуществляется по методу серий. Серией называется последовательность расположенных подряд значений ряда остатков, для которых разность (графа 4 табл. 1) имеет один и тот же знак, где - медиана ряда остатков, значение которой рассчитано по данным графы 3 упомянутой таблицы.

Если модель хорошо отражает исследуемую зависимость, то она часто пересекает линию графика исходных данных и тогда серий много, а их длина невелика. Иначе - серий мало и некоторые из них включают большое число членов.

В качестве серий рассматриваются расположенные подряд ошибки с одинаковыми знаками. Далее подсчитывается число серий и длина максимальной из них . Полученные значения сравниваются с критическими

(7.46)

(квадратные скобки означают округление вниз до ближайшего целого).

Если выполняется система неравенств:

,

то модель признается адекватной по критерию случайности, если хотя бы одно из неравенств нарушено, то модель признается неадекватной по данному критерию.

Размещено на Allbest.ru


Подобные документы

  • Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.

    курсовая работа [131,7 K], добавлен 03.10.2014

  • Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.

    контрольная работа [132,1 K], добавлен 10.03.2013

  • Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.

    контрольная работа [1,3 M], добавлен 24.09.2013

  • Определение среднего значения показателя в совокупности. Вариационный анализ статистической совокупности по показателю. Проведение выборочного наблюдения и корреляционно-регрессионного анализа. Построение уравнения парной регрессии, ряды динамики.

    курсовая работа [290,2 K], добавлен 29.11.2011

  • Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.

    лабораторная работа [1,6 M], добавлен 13.04.2010

  • Классическая линейную модель множественной регрессии. Значимость уравнения регрессии и его коэффициентов. Доверительный интервал. Матрица парных коэффициентов корреляции. Модель множественной регрессии. Автокорреляция.

    контрольная работа [172,9 K], добавлен 17.01.2004

  • Автоматический анализ тренда на базе диаграммы экспериментальных данных Х и У с помощью программы MSExcel. Прогноз заработной платы при заданном значении среднедушевого прожиточного минимума с помощью пакета анализа. Уравнение линейной парной регрессии.

    контрольная работа [363,4 K], добавлен 22.01.2015

  • Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.

    контрольная работа [253,4 K], добавлен 17.03.2011

  • Анализ, расчет и построение исходных динамических рядов признака-функции и признака-фактора. Расчет показателей вариации динамических рядов. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции.

    курсовая работа [92,7 K], добавлен 24.09.2014

  • Расчет параметров линейной и степенной парной регрессии. Показатели корреляции и детерминации, методика их расчета. Средняя ошибка аппроксимации. Оценка с помощью F-критерия Фишера статистической надежности результатов регрессионного моделирования.

    контрольная работа [25,2 K], добавлен 20.11.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.