Моделирование в эконометрике

Общие понятия эконометрических моделей и задачи экономического анализа, решаемые на их основе. Применение регрессионного анализа в экономике. Определение параметров модели парной линейной регрессии. Модели стационарных и нестационарных временных рядов.

Рубрика Экономико-математическое моделирование
Вид курс лекций
Язык русский
Дата добавления 14.10.2017
Размер файла 602,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

ЦЕНТРОСОЮЗА РОССИЙСКОЙ ФЕДЕРАЦИИ

«РОССИЙСКИЙ УНИВЕРСИТЕТ КООПЕРАЦИИ»

КАЗАНСКИЙ КООПЕРАТИВНЫЙ ИНСТИТУТ (ФИЛИАЛ)

ЭКОНОМЕТРИКА

ЛЕКЦИОННЫЙ МАТЕРИАЛ

специальности 080109.65 «Бухгалтерский учет, анализ и аудит»,

080105.65 «Финансы и кредит»

Казань 2010

Составитель Тихонова О. А. Эконометрика: Лекционный материал.- Казань: Казанский кооперативный институт, 2010.- с.

Лекционный материал по дисциплине «Эконометрика» для студентов специальностей 080109.65 «Бухгалтерский учет, анализ и аудит», 080105.65 «Финансы и кредит» составлена Тихоновой О. А, ст. преподавателем кафедры «Инженерно-технические дисциплины и сервис» Казанского кооперативного института, в соответствии с учебной программой от 21.09.2010 и учебным планом от 14 апреля 2009 г., протокол № 6

Рецензент: к.ф.-м. н., доцент Шешукова Ф. И.

Лекционный материал:

согласован с кафедрой «Бухгалтерский учёт и финансы »

Зав. кафедрой М.Н.Хабриева

«10»сентября 2010 г.

обсужден и рекомендован к изданию решением кафедры «Инженерно-технических дисциплин и сервиса» от «07» октября 2010г., протокол №2.

Зав. кафедрой Э.А.Гатина

одобрен Методическим советом института от «07» октября 2010г., протокол №3

Председатель З.Н. Мирзагалямова

©Казанский кооперативный институт (филиал) Российского университета кооперации, 2010

Введение

Эконометрика - наука, исследующая количественные закономерности и взаимозависимости в экономике при помощи методов математической статистики. Основа этих методов - корреляционно-регрессионный анализ.

Преподавание эконометрики имеет цель: ознакомить студента с основами математического аппарата, необходимого для теоретического и практического решения эконометрических задач; развить логическое мышление; привить умение самостоятельно изучать научную литературу по эконометрике и ее приложениям; выработать навыки практических эконометрических исследований и умение перевести экономическую задачу на математический язык.

Курс эконометрики включает следующие основные разделы:

- линейные модели регрессии;

- нелинейные модели регрессии и их линеаризация;

- модели стационарных и нестационарных временных рядов;

- системы линейных одновременных уравнений.

Тема 1 Введение в эконометрику

Общие понятия эконометрических моделей и задачи экономического анализа, решаемые на их основе

1.Определение эконометрики и ее место в системе наук

2.Предмет и методы эконометрики

3. Основные задачи эконометрики

Эконометрика как наука возникла в первой половине 20-го века в результате активного использования для решения задач экономической теории математических и статистических методов. Термин эконометрика введен в научную литературу в 1930 году норвежским статистиком Рагнаром Фришем. Он первым определил эконометрику, как научную дисциплину, базирующуюся на синтезе экономической теории, статистики и математики. В дословном переводе слово эконометрика означает «экономические измерения». Это очень широкое толкование данного понятия. Как правило, термин эконометрика применяется в более узком смысле. А именно, под эконометрикой понимается раздел науки, изучающий конкретные количественные и качественные взаимосвязи экономических объектов и процессов с помощью математических и статистических методов и моделей (БСЭ).

Можно сказать, что главной задачей эконометрики является количественная оценка имеющихся взаимосвязей между экономическими явлениями и процессами.

Экономические явления взаимосвязаны и взаимообусловлены. Следствием этого является то, что значения соответствующих экономических показателей изменяются во времени с учетом этих взаимосвязей. Так, например, известно, что совокупный спрос зависит от уровня цен, потребление - от располагаемого дохода, инвестиции - от процентной ставки и так далее. Перед исследователем стоит задача выявления таких связей, количественная их оценка и изучение возможности использования выявленных связей в экономическом анализе и прогнозировании. Разработкой соответствующего инструментария и его применением для решения конкретных практических экономических задач как раз и занимается эконометрика. В основе любого эконометрического исследования лежит построение экономико-математической модели, адекватной изучаемым реальным экономиче-ским явлениям и процессам. Процесс построения эконометрических моделей начинается с качественного исследования проблемы методами экономической теории, формулируются цели исследования, выделяются факторы, влияющие на изучаемый показатель, и формулируются предположения о характере предполагаемой зависимости. На этой основе изучаемые зависимости выражаются в виде математических формул и соотношений. Следует отметить, что ввиду невозможности одновременно учесть большое количество факторов, влияющих на изучаемый показатель, предполагаемые зависимости между переменными будут выполняться не точно, а с определенной погрешностью. Кроме того, экономическим явлениям присуща внутренняя неопределенность, связанная с целенаправленной деятельностью субъектов экономики. Вышесказанное обуславливает применение статистических методов, с помощью которых осуществляется отбор значимых факторов, определяется наличие и степень тесноты связи между изучаемыми показателями, дается количественная оценка параметров предполагаемых зависимостей и исследуется степень их соответствия реальной действительности.

Основным инструментом математической статистики, используемым для построения эконометрических моделей, являются методы корреляционного и регрессионного анализа. Корреляционный анализ ставит своей целью проверку наличия и значимости линейной зависимости между переменными без разделения переменных на зависимые и объясняющие. Ответ на эти вопросы дается с помощью вычисления показателей (коэффициентов) корреляции.

Регрессионный анализ направлен на выражение изучаемой зависимости в виде аналитической формулы с предварительным выделением зависимых и объясняющих переменных.

Регрессионный анализ призван ответить на такие вопросы, как:

- какие переменные определяют поведение других величин и, следовательно, могут использоваться как объясняющие переменные?

- какова формула зависимости и каков экономический смысл ее коэффициентов?

Результатом проведения регрессионного анализа является построение, так называемого, уравнения регрессии.

После построения уравнения регрессии осуществляется проверка его статистического качества, включающая:

- проверку статистической значимости коэффициентов уравнения регрессии;

- проверку общего качества уравнения регрессии;

- проверку наличия свойств данных, предполагавшихся при оценивании

уравнения регрессии.

Рассматривая эконометрическое исследование в целом, в нем можно выделить следующие этапы:

1. Постановка проблемы, т. е. определение цели и задач исследования, выделение зависимых (уj) и независимых (xk) экономических переменных на основе качественного анализа изучаемых взаимосвязей методами экономической теории.

2. Сбор необходимых исходных данных.

3. Построение эконометрической модели и оценка ее адекватности и степени соответствия исходным данным.

4. Использование модели для целей анализа и прогнозирования параметров исследуемого явления.

5. Качественная и количественная интерпретация полученных на основе модели результатов.

6. Практическое использование результатов.

В процессе экономической интерпретации результатов необходимо ответить на следующие вопросы:

- являются ли статистически значимыми объясняющие факторы, важные с теоретической точки зрения?

- соответствуют ли оценки параметров модели качественным представлениям?

Примером эконометрической модели может служить аналитическое выражение взаимосвязи показателей инфляции и безработицы, записанное без учета инфляционных ожиданий (1.1) и с учетом последних (1.2):

р=-в(u-u*) (1.1)

р=рe-в(u-u*) (1.2)

где р - фактический и ре - ожидаемый темпы инфляции (в процентах), u - фактический и u* - естественный уровни безработицы (в процентах), в - постоянный параметр. При проведении исследования определяется, какая из этих зависимостей лучше соответствует реальной взаимосвязи между уровнями инфляции и безработицы, а также оценивается значение величины естественного уровня безработицы.

Основная задача эконометрики заключается в исследовании и количественной оценке объективно существующих взаимосвязей и зависимостей между экономическими явлениями. Наибольший интерес для исследователя представляют причинно-следственные отношения между явлениями, что позволяет выявлять факторы, оказывающие основное влияние на вариацию изучаемых явлений и процессов.

Причинно-следственное отношение - это такая связь между явлениями, при которой изменение одного из них, называемого причиной, ведет к изменению другого, называемого следствием. Следовательно, причина всегда предшествует следствию.

Причинно-следственные связи в социально-экономических явлениях обладают следующими особенностями. Во-первых, причина Х и следствие Y взаимодействуют не непосредственно, а через промежуточные факторы, которые, как правило, при анализе опускаются. Формально это может быть выражено с помощью схемы Х-->Х'-->Х"-->Y, где Х' и Х" изображают такие промежуточные факторы. Во-вторых, социально-экономические явления развиваются и формируются в результате одновременного воздействия большого числа факторов. Поэтому одной из главных проблем при изучении этих явлений становится задача выявления главных, существенных причин и абстрагирование от второстепенных. Признаки по их роли в изучаемой взаимосвязи делятся на два класса: факторные и результативные.

Факторными признаками (факторами) называются признаки, обусловливающие изменения других, связанных с ними признаков. Факторные признаки называются также независимыми, объясняющими или входными переменными. Результативными называются признаки, изменяющиеся под действием факторных признаков. Результативные признаки называются также зависимыми, объясняемыми или выходными переменными. По направлению изменения связи подразделяются на прямые (когда изменение результативного и факторного признаков происходит в одном направлении) и обратные (когда изменение результативного и факторного признаков происходит в противоположных направлениях). По характеру проявления различают функциональную связь и стохастическую зависимость.

Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Функциональная связь проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности. Такие связи изучаются в основном в естественных науках. В эконометрике в основном изучаются причинные зависимости, которые проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений. То есть одним и тем же значениям факторных признаков, как правило, соответствуют различные значения результативного признака.

Но, тем не менее, рассматривая всю совокупность наблюдений можно отметить наличие определенной зависимости между значениями признаков. Такие причинные зависимости называются стохастическими. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков. По аналитическому выражению выделяют связи линейные и нелинейные. Линейной называется связь, в которой изменение результативного признака прямо пропорционально изменению факторных признаков. В противном случае связь называется нелинейной. Аналитически линейная стохастистическая связь между явлениями может быть представлена уравнением прямой линии на плоскости, либо уравнением гиперплоскости в n-мерном пространстве (при наличии n факторных переменных).

Основные этапы построения эконометрической модели

Построение эконометрической модели является основой эконометрического исследования. Оно основывается на предположении о реально существующей зависимости между признаками. От того, насколько хорошо полученная модель описывает изучаемые закономерности между экономическими процессами, зависит степень достоверности результатов анализа и их применимости.

Построение эконометрической модели начинается со спецификации модели, заключающейся в получении ответа на два вопроса: 1) какие экономические показатели (признаки) должны быть включены в модель; 2) какой вид имеет аналитическая зависимость между отобранными признаками. В обобщенной форме эконометрическая модель, описывающая взаимосвязи между явлениями или закономерности их развития, представляется с помощью соотношения:

y = f(б, x) + е, (1.3)

где f(б, x) - функционал, выражающий вид и структуру взаимосвязей. Здесь величина y выражает уровень исследуемого явления и называется зависимой (объясняемой) переменной или результативным признаком; величина x = (x1, x2,…, x n) представляет собой вектор значений независимых (объясняющих) переменных xi или факторных признаков (факторов); через б = (б0, б1, б2,…, бn) обозначен вектор некоторых произвольных констант, называемых параметрами модели; е - ошибка модели.

Ошибка модели е характеризует отличие наблюдаемого (реализованного) значения переменной у от вычисленных согласно соотношения (1.3) в конкретных условиях (при конкретных значениях переменных факторов xi) и рассматривается как случайная величина.

Для расчета численных значений параметров б0, б1, б2,…, бn используется предварительно накопленный массив наблюдений за совместным проявлением изучаемого процесса и рассматриваемых факторов. Одно наблюдение представляет собой множество значений (yt, x1t, x2t,…, xnt). Индекс t соответствует отдельному наблюдению.

Зависимую переменную у часто называют эндогенной (внутренней) переменной модели, отражая тот факт, что значения зависимой переменной у определяются только значениями независимых переменных xi.

Независимые переменные (факторы) x1, x2,…, xn называют экзогенными (внешними) переменными. Термин «внешний» говорит о том, что значения переменных xi определяются вне рассматриваемой модели, для которой они являются заданными. В эконометрике переменная у согласно (1.3) всегда рассматривается как случайная величина. Независимые переменные xi могут считаться как случайными или детерминированными. В классической эконометрической модели они рассматриваются как детерминированные величины. В этом случае при ошибке модели, обладающей свойствами «белого шума», функционал f(б, x) можно рассматривать как математическое ожидание условного распределения переменной у при заданных значениях x1t, x2t,…, xnt, t = 1, 2,…. T.

Представление значений независимых переменных эконометрических моделей как проявлений случайных величин, как правило, не вносит существенных изменений в методы оценки параметров моделей.

В классических регрессионных моделях обычно предполагается, что факторы независимы между собой и с ошибкой модели, обладающей свойствами «белого шума». Вместе с тем, ряд ошибки может характеризоваться свойствами непостоянства дисперсии для различных наблюдений; наличием автокорреляционных связей между соседними значениями еt и еt-1 (для упорядоченных значений факторной переменной) и т. д. Могут иметь место корреляционные связями с экзогенными переменными xi и др.

В моделях, описывающих динамику процессов или явлений, т. е. в моделях, когда состояние явления в последующие периоды времени зависит от состояний, достигнутых в предыдущие моменты времени, в качестве экзогенных переменных используются значения переменных (эндогенных или экзогенных) в предыдущие моменты времени (yt-1, yt-2, …; xit-1, xit-2, …), называемые лаговыми переменными. В исследованиях, посвященных разработке методов прогнозирования таких финансовых показателей, как курсы валют, ценных бумаг, индексов широко применяются модели, основанные на предположении, что динамика этих процессов полностью определяется внутренними условиями. В этом случае модели соответствующих временных рядов включают в качестве факторов только лаговые значения результативного показателя yt-1, yt-2, … и (или) ошибки еt-1, еt-2, …. После выделения совокупности рассматриваемых переменных следующим этапом является определение конкретного вида модели, наилучшим образом соответствующего изучаемому явлению. По характеру связей факторов с переменной у модели подразделяются на линейные и нелинейные.

По свойствам своих параметров модели подразделяются на модели с постоянной и переменной структурой.

Особый вид моделей составляют системы взаимосвязанных эконометрических уравнений, включающие несколько уравнений вида (1.3). Каждому уравнению соответствует своя зависимая переменная yi, которая в других уравнениях системы может выступать в качестве независимого фактора.

Если на основе предварительного качественного анализа рассматриваемого явления не удается однозначно выбрать наиболее подходящий тип модели, то рассматриваются несколько альтернативных моделей, среди которых в процессе исследования выбирается та, которая в наибольшей степени соответствует изучаемому явлению.

В общем случае процедуру построения эконометрической модели можно представить в виде следующих этапов:

1. Спецификация модели, т. е. выбор класса моделей, наиболее подходящих для описания изучаемых явлений и процессов. Этот этап предполагает решение двух задач:

а) отбор существенных факторов для их последующего включения в модель;

б) выбор типа модели, т. е. выбор вида аналитической зависимости, связывающей включенные в модель переменные.

2. Оценка параметров модели, т. е. получение численных значений констант модели. При этом используется предварительно полученный массив исходных данных.

3. Проверка качества построенной модели и обоснование возможности ее дальнейшего использования.

Наиболее сложным и трудоемким в эконометрическом исследовании является этап оценки параметров модели, где применяются методы теории вероятностей и математической статистики.

Тема 2 Линейная модель парной регрессии

Введение в регрессионный анализ. Модель парной линейной регрессии.

1. Метод наименьших квадратов (МНК).

2. Свойства оценок МНК

3.Модель парной линейной регрессии

Регрессионный анализ и его применения в экономике. Диаграмма рассеяния

С помощью функции регрессии

количественно оценивается усредненная зависимость между исследуемыми переменными. Наблюдая за интересующей его зависимостью при сложном взаимодействии объясняющих переменных, исследователь с помощью регрессии отвечает на вопрос: какова была бы зависимость между следствием и выделенными существенными причинами, если бы прочие факторы не изменялись?

Результаты наблюдений можно представить в виде таблицы.

№ наблюдения

Переменные

Зависимая

Объясняющие

y

x1

xk

xm

1

y1

x11

x1k

x1m

2

y2

x21

x2k

x2m

i

yi

xi1

xik

xim

n

yn

xn1

xnk

xnm

Каждый столбец этой таблицы представляет ряд наблюдений над одной переменной. Номер столбца k показывает номер соответствующей объясняющей переменной, номер строки i показывает номер наблюдения. Значения yi и xik являются эмпирическими или опытными данными.

Случайная переменная , характеризующая отклонение переменной y от средней величины y, называется возмущающей переменной (латентной переменной) или возмущением. Значения u нельзя получить непосредственно. Значения возмущающей переменной u можно получить лишь после количественной оценки зависимости в виде функции регрессии. Вычисленные оценки ы значений переменной u и называются остатками. Избранная функция регрессии должна отображать экономическую закономерность, поэтому перед построением функции регрессии необходимо провести качественный экономический анализ изучаемого явления, позволяющий вскрыть все сторонние связи изучаемого явления.

При анализе зависимости между двумя переменными (например, y и xk) по таблице можно построить в декартовой системе координат диаграмму рассеяния:

Размещено на http://www.allbest.ru/

В результате действия побочных факторов

(x1, x2, …, xk-1, xk, xk+1, …, xm)

каждому фиксированному значению переменной xk может соответствовать несколько значений переменной y.

Диаграмма рассеяния позволяет произвести визуальный анализ эмпирических данных, по ней можно графическим путем определить функцию регрессии, которая обязательно должна проходить через точку - центр рассеяния, и которая должна по возможности хорошо отражать характер скопления точек.

Пример

Проанализируем зависимость (по месяцам) общей суммы налогов и платежей (переменная y) от поступлений по налогу на добавленную стоимость в 1999 г. по данным Министерства по налогам и сборам РФ.

Время наблюдения

№ наблюдения

y (общая сумма налогов и платежей в консолидированный бюджет РФ), млрд. руб.

x (общая сумма поступлений в консолидированный бюджет РФ по НДС), млрд. руб.

январь

1

38,9

13,4

февраль

2

45,3

15,4

март

3

61,1

16,7

апрель

4

70,4

16,2

май

5

63,8

13,0

июнь

6

67,7

15,0

июль

7

70,6

20,8

август

8

78,9

16,4

сентябрь

9

73,2

17,4

октябрь

10

78,1

23,6

ноябрь

11

103,0

23,9

декабрь

12

133,4

34,4

январь-декабрь

884,4

226,1

Диаграмма рассеяния будет иметь следующий вид:

Линия регрессии y на x проходит через точку М(18,85; 73,7).

Метод частных средних

Среднее, связанное с определенными предположениями или вычисленное при определенных условиях, называется частным, условным или групповым средним. Частные средние переменных x и y вычисляются по формулам:

где - частное среднее переменной x для i -группы значений переменной y (значения переменной y разбиты q групп), - частное среднее переменной y для p-группы значений переменной x (значения переменной x разбиты на s групп); nj и np - число отдельных значений в группе j и группе

p;

Пример

Время наблюю-дения

№ наблюю-дения

y (общая сумма налогов и платежей в консолидированный бюджет РФ), млрд. руб.

№ группы значений y

x (общая сумма поступлений в консолидированный бюджет РФ по НДС), млрд. руб.

№ группы значений x

январь

1

38,9

1

13,4

1

февраль

2

45,3

1

15,4

2

март

3

61,1

2

16,7

3

апрель

4

70,4

2

16,2

3

май

5

63,8

2

13,0

1

июнь

6

67,7

2

15,0

2

июль

7

70,6

2

20,8

5

август

8

78,9

3

16,4

3

сентябрь

9

73,2

3

17,4

4

октябрь

10

78,1

3

23,6

6

ноябрь

11

103,0

4

23,9

6

декабрь

12

133,4

5

34,4

7

Группировка значений переменной y построена так, что вариация значений переменной yi и yj из одной группы не превосходит 10.

Группировка значений переменной x построена так, что вариация значений переменной xi и xj из одной группы не превосходит 1.

Представим полученные значения частных средних графически. Для этого из точек, соответствующих значениям переменной x, нужно восставить перпендикуляры к оси абсцисс и отложить их на значения . Вершины ординат нужно последовательно соединить прямолинейными отрезками, то есть прямое соединяем следующие точки:

М1(13,2; 42,1); М2(15,2; 42,1); М3(16,4; 66,7); М4(16,4; 66,7);

М5(13,2; 66,7); М6(15,2; 66,7); М7(20,8; 66,7); М8(16,4; 76,7);

М9(17,4; 76,7); М10(23,7; 76,7); М11(23,7; 103,0); М12(34,4; 133,4).

Эмпирическая линия регрессии y на x:

Эмпирическая линия регрессии x на y не совпадает с эмпирической линией регрессии y на x. Поэтому при изучении зависимости необходимо отмечать направление зависимости между изучаемыми переменными.

Простая линейная регрессия

Простой регрессией называется односторонняя стохастическая зависимость результативной переменной только от одной объясняющей переменной:

Простая линейная регрессия задается следующей формулой:

b0 и b1 - неизвестные параметры регрессии; имеются n наблюдений над переменной x: x1, x2, …, xn; b0 выполняет в уравнении регрессии функцию выравнивания; b1 характеризует наклон прямой к оси ОХ.

b1 - это мера, которая в среднем показывает влияние изменения объясняющей переменной x на зависимую переменную y. При экономических исследованиях чаще интересуются не столько самой прямой регрессии, сколько влиянием, которое одно экономическое явление оказывает на другое, т.е. речь идет о вычислении коэффициентов регрессии.

Если b1>0, то регрессия является положительной, при b1<0 регрессия является отрицательной. Значения функции регрессии yi (предсказанные и рассчитанные) являются оценками средних значений переменной y для некоторого фиксированного значения переменной x.

После экономического анализа можно приступать к выравниванию опытных данных, заключающемуся в построении гипотетической линии. При этом требуется минимизировать ошибки при определении формы связи между переменными. Эти ошибки обнаруживаются через отклонения ыi эмпирических данных от значений регрессии yi. Они являются значениями возмущающей переменной u:

, i = 1, …, n.

Размещено на http://www.allbest.ru/

В качестве меры отклонения функции от набора наблюдений можно взять:

· сумму квадратов отклонений:

· сумму модулей отклонений:

· , где g - некоторая мера. Например, в качестве меры можно взять функцию Хубера, которая при малых отклонениях квадратична, а при больших линейна:

Размещено на http://www.allbest.ru/

Каждая из указанных мер отклонений имеет свои недостатки и достоинства. Мера суммы квадратов отклонений обладает легкостью вычислений, простотой математических выводов, хорошими статистическими свойствами, но чувствителен к выбросам.

Мера суммы модулей не чувствительна к выбросам, но сложна в вычислениях и неоднозначна.

Мера Хубера является попыткой совместить достоинства двух предыдущих методов.

Самым распространенным и теоретически обоснованным является метод нахождения коэффициентов, при котором минимизируется первая сумма. Он получил названия метода наименьших квадратов.

Метод наименьших квадратов

Вычисляют выборочную дисперсию, характеризующую меру разброса опытных данных (xi; yi) вокруг значений регрессии, то есть дисперсию остатков

.

Знаменатель показывает число степеней свободы. Оно определяется как разность между объемом выборки и числом параметров регрессии, подлежащих оценке. Стандартной ошибкой регрессии называется

.

Стандартная ошибка должна быть минимальна, это равносильно условию:

. (1)

Размещено на http://www.allbest.ru/

Геометрическая интерпретация формулы (1) следующая: сумма площадей заштрихованных квадратов должна быть наименьшей.

Пусть yi = b0 + b1x1; i = 1, 2, …, n; тогда

и надо найти b0 и b1.

Для наличия экстремума S(b0; b1) необходимо выполнение равенств:

(2)

Для вторых частных производных функции S(b0; b1) справедливы соотношения:

Существование минимума обеспечивается выполнением условия:

После преобразований уравнений (2) получаем систему двух уравнений первой степени (систему нормальных уравнений) относительно неизвестных b0 и b1:

(3)

Применяя к ней правило Крамера, получаем:

Получить b0 и b1 из уравнений (3) можно по-другому. Первое из уравнений системы почленно разделим на n. Тогда

; или

, откуда ;

; .

Коэффициент регрессии b1 можно представить следующим образом:

, где

- ковариация между переменными x и y, - дисперсия переменной x.

Вычислим коэффициенты регрессии общей суммы налогового сбора (переменная y) на сумму поступлений налога на добавленную стоимость по несгруппированным данным:

Время наблюдения

№ наблюдения

y (общая сумма налогов и платежей в консолидированный бюджет РФ), млрд. руб.

x (общая сумма поступлений в консолидированный бюджет РФ по НДС), млрд. руб.

xi2

yi2

xiyi

январь

1

38,9

13,4

179,56

1513,21

521,26

февраль

2

45,3

15,4

237,16

2052,09

697,62

март

3

61,1

16,7

278,89

3733,21

1020,37

апрель

4

70,4

16,2

262,44

4956,16

1140,48

май

5

63,8

13,0

169

4070,44

829,4

июнь

6

67,7

15,0

225

4583,29

1015,5

июль

7

70,6

20,8

432,64

4984,36

1468,48

август

8

78,9

16,4

268,96

6225,21

1293,96

сентябрь

9

73,2

17,4

302,76

5358,24

1273,68

октябрь

10

78,1

23,6

556,96

6099,61

1843,16

ноябрь

11

103,0

23,9

571,21

10609

2461,7

декабрь

12

133,4

34,4

1183,36

17795,56

4588,96

У

884,4

226,1

4667,94

71980,4

18154,6

График уравнения регрессии y на x выглядит следующим образом:

Размещено на http://www.allbest.ru/

Экономические явления обычно находятся во взаимодействии, то есть переменная y зависит от переменной x, и наоборот, переменная x зависит от переменной y. В этом случае говорят о логически обратимой регрессии. При переходе от одной зависимости к другой нельзя из уравнения

выразить x выразить через y, так как эмпирические точки лежат не на прямой, а подвержены рассеянию и фиксированному значению x может соответствовать несколько значений y и наоборот.

Уравнения регрессии и не выводимы друг из друга. Они задают сопряженные регрессионные прямые.

Построим регрессию x на y для рассматриваемого нами примера.

;

График регрессии x на y будет выглядеть следующим образом:

Размещено на http://www.allbest.ru/

Совместим графики регрессии x на y и y на x:

Регрессионные прямые образуют «ножницы». По величине раствора ножниц можно судить приблизительно о степени зависимости обеих переменных. Чем более раскрыты ножницы, тем слабее связь. Если обе прямые регрессии пересекаются под прямым углом, то эмпирические данные не позволяют подтвердить гипотезу о существовании зависимости между переменными. Если отсутствует регрессия x на y, то не существует также регрессии y на x, и наоборот. При b1 = 0 обязательно b1* = 0 и обратно.

Построение регрессионной прямой по сгруппированным данным

При большом числе наблюдений обычно производят группировку данных по одной или нескольким переменным. Для исследования зависимостей желательно использовать равные по ширине интервалы группировок. Неравные интервалы могут привести к искажению регрессии и ошибочным выводам. При большом объеме изучаемой совокупности наиболее целесообразно образовывать 9 - 10 интервалов, равномерно заполненных частотами. При небольших объемах совокупности нет смысла производить группировку данных. Оценки, вычисленные по сгруппированному материалу, отличаются от оценок, вычисленных по несгруппированному материалу. Причина этого - в переходе при расчетах к серединам интервалов и условно принятому равномерному распределению частот по ширине этих интервалов. При большом объеме данных считается, что неточности в результатах за счет группировки вполне искупаются упрощением процедуры вычисления.

Тема 3 Модель множественной линейной регрессии

1. Определение параметров модели парной линейной регрессии методом наименьших квадратов

2. Оценка тесноты связи между переменными

3. Оценка качества уравнения регрессии

4. Предпосылки метода наименьших квадратов

Линейная множественная регрессия

В действительности каждое явление определяется действием не одной причины, а нескольких, а точнее целым комплексом причин. Сложное сочетание причин приводит к различным результатам. Например, действуя в одном и том же направлении, они усиливают действие, действуя в противоположном направлении - ослабляют друг друга. Возникает вопрос об измерении воздействия комплекса причин на изучаемое явление. Задача изучения зависимости одной зависимой переменной от нескольких объясняющих переменных x1, x2, …, xm в условиях конкретного времени решается с помощью множественного или многофакторного регрессионного анализа. Рассмотрим линейное соотношение между переменной y и объясняющими переменными x1, x2, …, xm.

Коэффициенты bk, k = 0, 1, 2, …, m называются параметрами регрессии. Постоянная регрессии b0 выполняет в уравнении регрессии функцию выравнивания. Она определяет точку пересечения гиперповерхности регрессии с осью y. Значения b1, b2, …, bm являются оценками коэффициентов регрессии. Коэффициент регрессии bk измеряет усредненное частное влияние изменения переменной xk, k = 1, 2, …, m, в предположении, что остальные объясняющие переменные (x1, x2, …, xk-1, xk, xk+1, …, xm) остаются без изменения на постоянном уровне. Поэтому с точки зрения статистической методологии нет различия между множественной и частной регрессией. По этой причине в литературе параметры bk, k = 1, 2, …, m называются как коэффициентами множественной, так и частной регрессии. Но заключение о том, что для определения коэффициентов регрессии достаточно определить несколько простых линейных регрессий y на xk, k = 1, 2, …, m является ошибочным. Для достоверных оценок нужны методы оценивания, учитывающие многосторонние связи совместно зависимых переменных. Наиболее часто используют двухшаговый метод наименьших квадратов, который является обобщением метода наименьших квадратов.

Рассмотрим сначала линейную множественную регрессию с двумя объясняющими переменными:

Метод наименьших квадратов приводит к условию:

, откуда

После дифференцирования S(b0, b1, b2) по каждому из параметров b0, b1, b2 и приравнивания к нулю всех частных производных функции S(b0, b1, b2) по каждому из параметров b0, b1, b2, получаем следующую систему нормальных уравнений:

Решить полученную систему нормальных уравнений относительно неизвестных параметров можно по формулам Крамера.

Коэффициенты множественной или частной регрессии можно представить через дисперсии и ковариации:

где

Пример

Построим линейную множественную регрессию общей суммы налогов и платежей на общую сумму поступлений по налогу на добавленную стоимость и налогу на прибыль (доход).

Время наблюдения

y (общая сумма налогов и платежей в консолидированный бюджет РФ), млрд. руб.

x1 (общая сумма поступлений в консолидированный бюджет РФ по налогу на прибыль), млрд. руб.

x2 (общая сумма поступлений в консолидированный бюджет РФ по НДС), млрд. руб.

январь

38,9

5,6

13,4

февраль

45,3

6,7

15,4

март

61,1

13,1

16,7

I квартал

145,3

25,3

45,5

апрель

70,4

16,9

16,2

май

63,8

18,4

13

июнь

67,7

19,1

15

II квартал

201,9

54,4

44,2

I полугодие

347,2

79,8

89,7

июль

70,6

16,1

20,8

август

78,9

23,3

16,4

сентябрь

73,2

19,2

17,4

III квартал

222,7

58,6

54,6

9 месяцев

569,9

138,3

144,3

октябрь

78,1

16,1

23,6

ноябрь

103

31,8

23,9

декабрь

133,4

35,4

34,4

IV квартал

314,5

83,3

81,9

II полугодие

537,2

141,9

136,5

январь-декабрь

884,4

221,6

226,1

Уy

Уx1

Уx2

Уx1y

Уx2y

Уx12

Уx22

Уx1x2

884,4

221,6

226,1

18614,15

18154,57

4931,19

4667,94

4605,29

Полученные значения b1 и b2 подставим в уравнение

и выразим b0.

Для описания линейной множественной регрессии с количеством объясняющих переменных больше двух будем использовать матричное исчисление. Пусть

, или

Введем фиктивную переменную x0 полагая xi0 = 1, i=1, 2, …, n.

Положим

где xij - переменная для обозначения переменной xj при наблюдении i, j = 1, 2, …, m; i = 1, 2, …, n.

Тогда уравнение регрессии запишется следующим образом:

Применяя метод наименьших квадратов, получим:

,

где Аt - матрица, транспонированная к А. Подставляя вместо y в последнюю формулу Xb, получаем

Дифференцируя последнее выражение по b и приравнивая его к нулю, получаем:

Нормальное уравнение имеет следующий вид:

Если матрица XtX обратима, то

Исходные предположения регрессионного анализа и свойства оценок

1. Предполагается, что при заданных значениях переменных xk, k = 1, …, m; на зависимую переменную y не оказывают влияние никакие другие систематически действующие факторы и случайности. Влияние этих прочих факторов и случайностей учитывается случайной возмущающей переменной и равно 0:

2. Свойство гомоскедастичности. Дисперсия случайной переменной u должна быть для всех ui одинакова и постоянна:

3. Значения случайной переменной u попарно некоррелированы или, еще более сильная предпосылка, они попарно независимы в вероятностном смысле:

4. Число наблюдений должно превышать число параметров (n > m).

5. Объясняющие переменные не должны коррелировать с возмущающей переменной u, то есть

6. Возмущающая переменная удовлетворяет нормальному закону распределения. Кроме того, предполагается, что она не оказывает существенного влияния на переменную y и представляет собой суммарный эффект от большого числа незначительных некоррелированных влияющих факторов; тем самым предполагается, что переменные y и xk, k = 1, …, m распределены нормально.

Тема 4 Проблемы линейных регрессионных моделей

1. Предпосылки метода наименьших квадратов.

2. Проблема мультиколлинеарности.

3. Гомоскедатичность и гетероскедатичность. Линейные регрессионные модели с гетероскедатичными и автокоррелированными остатками.

4. Регрессионные модели с переменной структурой (фиктивные переменные)

Предпосылки метода наименьших квадратов (условия Гаусса-Маркова)

1. Математическое ожидание случайного отклонения равно нулю для всех наблюдений. Данное условие означает, что случайное отклонение в среднем не оказывает влияния на зависимую переменную. В каждом конкретном наблюдении случайный член может быть либо положительным, либо отрицательным, но он не должен иметь систематического смещения.

2. Дисперсия случайных отклонений постоянна для любых наблюдений. Это условие подразумевает, что несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть либо большим, либо меньшим, не должно быть некой априорной причины, вызывающей большую ошибку (отклонение).

Выполнимость данной предпосылки называется гомоскедастичностью (постоянством дисперсии отклонений). Невыполнимость данной предпосылки называется гетероскедастичностью (непостоянством дисперсии отклонений).

3. Случайные отклонения ui и uj являются независимыми друг от друга для ij. Выполнимость данной предпосылки предполагает, что отсутствует систематическая связь между любыми случайными отклонениями. Другими словами, величина и определенный знак любого случайного отклонения не должны быть причинами величины и знака любого другого отклонения. Выполнимость данной предпосылки влечет следующее соотношение:

Поэтому, если данное условие выполняется, то говорят об отсутствии автокорреляции.

4. Случайное отклонение должно быть независимо от объясняющих переменных.

Обычно это условие выполняется автоматически, если объясняющие переменные не являются случайными в данной модели. Данное условие предполагает выполнимость следующего соотношения:

5. Модель является линейной относительно параметров.

Теорема Гаусса-Маркова. Если предпосылки 1-5 выполнены, то оценки, полученные по МНК, обладают следующими свойствами:

1) Оценки являются несмещенными, то есть М(b0) = 0, М(b1) = 1, где b0, b1) - коэффициенты эмпирического уравнения регрессии, а 0, 1 - их теоретические прототипы. Это вытекает из первой предпосылки и говорит об отсутствии систематической ошибки в определении положения линии регрессии.

2) Оценки состоятельны, так как дисперсия оценок параметров при возрастании числа n наблюдений стремится к нулю. Другими словами, при увеличении объема выборки надежность оценок увеличивается (коэффициенты теоретического и эмпирического уравнений регрессии практически совпадают).

3) Оценки эффективны, то есть они имеют наименьшую дисперсию по сравнению с любыми оценками данных параметров, линейными относительно величин yi.

Если предпосылки 2 и 3 нарушены, то есть дисперсия отклонений непостоянна и (или) значения случайных отклонений связаны друг с другом, то свойства несмещенности и состоятельности сохраняются, но свойство эффективности - нет.

Наряду с выполнимостью указанных предпосылок при построении классических линейных регрессионных моделей делаются еще некоторые предположения. Например:

- объясняющие переменные не являются СВ;

- случайные отклонения имеют нормальное распределение;

- число наблюдений существенно больше числа объясняющих переменных.

Одним из условий регрессионной модели является предположение о линейной независимости объясняющих переменных, т.е., решение задачи возможно лишь тогда, когда столбцы и строки матрицы исходных данных линейно независимы. Для экономических показателей это условие выполняется не всегда. Линейная или близкая к ней связь между факторами называется мультиколлинеарностью и приводит к линейной зависимости нормальных уравнений, что делает вычисление параметров либо невозможным, либо затрудняет содержательную интерпретацию параметров модели. Мультиколлинеарность может возникать в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания. В частности, так может случиться, когда значения одной независимой переменной являются датированными значениями другой. Считают явление мультиколлинеарности в и сходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,8. Чтобы избавиться от мультиколлинеарности, в модель включают лишь один из линейно связанных между собой факторов, причем тот, который в большей степени связан с зависимой переменной.


Подобные документы

  • Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.

    лабораторная работа [67,8 K], добавлен 26.12.2010

  • Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.

    курсовая работа [233,1 K], добавлен 21.03.2015

  • Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.

    задача [142,0 K], добавлен 20.03.2010

  • Методологические основы эконометрики. Проблемы построения эконометрических моделей. Цели эконометрического исследования. Основные этапы эконометрического моделирования. Эконометрические модели парной линейной регрессии и методы оценки их параметров.

    контрольная работа [176,4 K], добавлен 17.10.2014

  • Эконометрическое моделирование стоимости квартир в Московской области. Исследование динамики экономического показателя на основе анализа одномерного временного ряда. Параметры линейной парной регрессии. Оценка адекватности модели, осуществление прогноза.

    контрольная работа [925,5 K], добавлен 07.09.2011

  • Основные элементы эконометрического анализа временных рядов. Задачи анализа и их первоначальная обработка. Решение задач кратко- и среднесрочного прогноза значений временного ряда. Методы нахождения параметров уравнения тренда. Метод наименьших квадратов.

    контрольная работа [37,6 K], добавлен 03.06.2009

  • Создание комбинированных моделей и методов как современный способ прогнозирования. Модель на основе ARIMA для описания стационарных и нестационарных временных рядов при решении задач кластеризации. Модели авторегрессии AR и применение коррелограмм.

    презентация [460,1 K], добавлен 01.05.2015

  • Модели стационарных и нестационарных рядов, их идентификация. Системы эконометрических уравнений, оценка длины периода. Определение и свойства индексов инфляции. Использование потребительской корзины и индексов инфляции в экономических расчетах.

    книга [5,0 M], добавлен 19.05.2010

  • Построение математической модели выбранного экономического явления методами регрессионного анализа. Линейная регрессионная модель. Выборочный коэффициент корреляции. Метод наименьших квадратов для модели множественной регрессии, статистические гипотезы.

    курсовая работа [1,1 M], добавлен 22.05.2015

  • Понятие параметрической идентификации парной линейной эконометрической модели. Критерий Фишера, параметрическая идентификация парной нелинейной регрессии. Прогнозирование спроса на продукцию предприятия. Использование в MS Excel функции "Тенденция".

    контрольная работа [73,3 K], добавлен 24.03.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.