Основные проблемы эконометрического моделирования

Метод наименьших квадратов при оценке параметров линейной модели. Показатели разброса случайной величины, коэффициент детерминации, функция эластичности, гетероскедастичность и автокоррелированность ошибок в Гауссовском распределении и статистике Фишера.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 28.07.2011
Размер файла 343,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Контрольная работа по дисциплине «Эконометрика»

Вопрос 1. Назовите некоторые основные проблемы эконометрического моделирования.
Ответ
Некоторые проблемы эконометрического моделирования
Одно из условий, на которое опирается эконометрическое моделирование, состоит в том, что функциональное соотношение не меняется в течение рассматриваемого периода. Однако это условие часто нереалистично, особенно в случае, когда приходится иметь дело с переходной экономикой. Это обычная проблема, с которой экономист сталкивается при исследовании экономических процессов с изменчивой структурой. Как бы то ни было, приходится делать предположение о неизменности формы модели, иначе моделирование не было бы возможно.
Один из возможных способов учета структурных сдвигов состоит в использовании различного рода сконструированных переменных, таких как, фиктивные переменные и тренды. Включение в эконометрическую модель трендов позволяет учитывать изменения во всех коэффициентах регрессионного уравнения: свободном члене и коэффициентах при “экономических” переменных. Фиктивные переменные (принимающие только два значения -- 0 и 1) позволяют учесть резкие структурные скачки.
Кроме того, использование фиктивных переменных и гармонических трендов (синусов и косинусов) позволяет учесть в модели сезонные колебания.

Все же эти методы не позволяют адекватно учесть изменения, если неизвестен их характер или момент изменения (в случае скачка). Особенно большие проблемы создают структурные сдвиги для прогнозирования. Если резкое изменение в параметрах экономического процесса произошло в течение исследуемого периода, то это изменение можно заметить и учесть в модели. Если же неожиданное изменение произойдет после исследуемого периода, то сделанные прогнозы окажутся неверными.

Недостаточный набор данных

Имеющихся данных может быть недостаточно для того, чтобы определить функциональную связь между переменными, либо они недостаточно варьируются, чтобы можно было отличить влияние одного фактора от влияния другого. Последняя проблема получила в эконометрическом моделировании название “мультиколлинеарности”. В отличие от экспериментальных наук, у отдельного исследователя, изучающего экономические процессы, как правило, нет возможности сколько-нибудь заметно на них повлиять. Обычно за него это делает правительство. «...От правительственного манипулирования экономикой могла бы выиграть только эконометрика».

Чтобы восполнить недостаток данных, исследователю приходится делать некоторые априорные допущения, зачастую недостаточно обоснованные.

Как правило, функциональная форма модели заранее неизвестна. В этом случае хорошим выходом из положения было бы использование непараметрических методов оценивания. Однако для применения таких методов необходим довольно значительный набор данных. Поэтому на практике, как правило, предполагают, что зависимость между двумя переменными линейна. Часто линейная зависимость дает хорошую аппроксимацию гладкой зависимости в некоторой небольшой окрестности, но, вообще говоря, нет никакой гарантии, что “истинная” зависимость не окажется сильно нелинейной как раз в том интервале, к которому относятся данные.

При применении статистических методов следует помнить, что постулируемые свойства, как правило, носят асимптотический характер, то есть, проявляются в пределе, при стремлении количества наблюдений к бесконечности. В частности, если в линейной регрессии в качестве регрессоров используются лаги (запаздывание) зависимой переменной, то, даже если выполнены стандартные предположения регрессионного анализа, полученные оценки будут состоятельными, но смещенными.

Проблема ложной регрессии

Для того, чтобы получить высокий коэффициент детерминации, достаточно, чтобы в зависимой переменной и в регрессоре (независимой переменной) имелся тренд и динамика трендов до некоторой степени совпала. Коэффициент детерминации, как правило, бывает высок в регрессии одного растущего показателя по другому растущему показателю.

С другой стороны, коэффициент детерминации, как правило, бывает низким в регрессии одного процесса типа “белый шум” по другому такому же процессу.

Двумя основными причинами наличия “тренда” во временных рядах являются

детерминированная составляющая (тогда говорят о детерминированном тренде),

нестационарность (тогда говорят о стохастическом тренде).

Наличие детерминированного тренда может приводить к появлению ложной регрессии. Пусть, например Yt и Xt порождаются процессами Yt = a + bt + et, Xt = c + dt + xt, где et, xt -- независимые, одинаково распределенные ошибки. Регрессия Yt по константе и Xt может иметь высокий коэффициент детерминации и этот эффект только усиливается с ростом размера выборки. К счастью, с “детерминированным” вариантом ложной регрессии достаточно легко бороться. В рассматриваемом случае достаточно добавить в уравнение тренд в качестве регрессора, и эффект ложной регрессии исчезает.

Если существует стационарная линейная комбинация нестационарных случайных процессов, то эти процессы называют коинтегрированными. Коинтегрированность гарантирует (по крайней мере, асимптотически, то есть для больших выборок), что не возникнет ложная регрессия. Теория коинтеграции -- быстро развивающийся раздел современной эконометрики.

Для оценивания моделей с нестационарными, но коинтегрированными переменными, вообще говоря, следует использовать специальные методы. К сожалению, методы оценивания коинтеграционных регрессий сложны с точки зрения реализации, и способы проверки их спецификации плохо разработаны. Поэтому, несмотря на указанные недостатки, обычный метод наименьших квадратов остается наиболее мощным инструментом эконометрики.

Вопрос 2. Как называется метод, который наиболее часто используется при оценке параметров линейной модели в эконометрике?

Ответ

Метод наименьших квадратов.

При наличии объективной тенденции поддержания линейной связи между переменными и естественно рассмотреть линейную модель наблюдений

Если и -- «истинные» значения параметров линейной модели связи, то

представляет собой ошибку в - м наблюдении (error, или disturbance). Однако, даже при действительном существовании линейной связи, параметры и такой связи остаются неизвестными, и мы можем судить об их истинных значениях лишь приближенно, оценивая значения и на основании ограниченного количества имеющихся данных наблюдений (статистических таблиц).

Поиск подходящих оценок для и можно осуществлять, например, путем поиска на диаграмме рассеяния прямой, проходящей через точку -- «центр» системы точек и «наилучшим образом» выражающей на направление вытянутости этой системы (облака) точек. Пусть прямая

рассматривается в числе прочих в процессе такого поиска. Для - го наблюдения мы будем наблюдать тогда расхождение («невязку»)

причем значения могут быть как положительными, так и отрицательными. При изменении значений и будет изменяться и алгебраическая сумма невязок . С этой точки зрения, мы можем остановить свой выбор на прямой, для которой соблюдается баланс положительных и отрицательных невязок, так что

Соответствующие этой прямой значения и будем обозначать как и . Итак, прямая

проходит через точку , и если обозначить еще

то тогда

Значение называется остатком в i - м наблюдении. Для реальных данных, как правило, все остатки отличны от нуля, так что часть из них имеет положительный знак, а остальные -- отрицательный.

Оказывается, что ту же самую прямую можно получить, исходя из другого принципа -- принципа наименьших квадратов. Согласно этому принципу, среди всех возможных значений ,, претендующих на роль оценок параметров и , следует выбирать такую пару ,, для которой

Иначе говоря, выбирается такая пара ,, для которой сумма квадратов невязок оказывается наименьшей. Получаемые при этом оценки называются оценками наименьших квадратов, и можно показать, что они совпадают с ранее определенными оценками и , так что

При построении оценок наименьших квадратов заранее не требуется, чтобы Соответствующая прямая проходила через точку ; этот факт является свойством оценок наименьших квадратов. Наличие такого свойства мы докажем чуть позднее, а сейчас обратимся к вопросу о том, как практически найти указанные оценки и .

Если исходить из первого определения, то, прежде всего, следует заметить, что если прямая проходит через точку , то тогда , так что и для поиска «наилучшей» прямой достаточно определить ее угловой коэффициент . Изменяя значения и следя за изменением значений , мы можем, в принципе, найти искомое с любой наперед заданной точностью.

Использование непосредственного перебора значений , с целью минимизации суммы квадратов

при реализации метода наименьших квадратов также возможно, хотя и требует, конечно, существенно больших вычислительных усилий.

Было бы идеальным, если бы существовала возможность прямого вычисления значений и по какой-нибудь формуле на основании известных значений .

Однако, существует еще один способ получения точных формул для и , исходящий из принципа наименьших квадратов.

Согласно этому принципу, оценки и находятся путем минимизации суммы квадратов

по всем возможным значениям и при заданных (наблюдаемых) значениях. Функция как функция двух переменных описывает поверхность в трехмерном пространстве с прямоугольной системой координат , и дело сводится к известной математической задаче поиска точки минимума функции двух переменных.

Такая точка находится путем приравнивания нулю частных производных функции по переменным и , т. е. приравниванием нулю производной функции как функции только от при фиксированном ,

и производной функции как функции только от при фиксированном ,

Это приводит к так называемой системе нормальных уравнений

решением которой и является пара , . Остается заметить, что согласно правилам вычисления производных,

так что искомые значения , удовлетворяют соотношениям

Эту систему двух уравнений можно записать также в виде

Последняя система является системой двух линейных уравнений с двумя неизвестными и может быть легко решена, например, методом подстановки.

Из первого уравнения системы находим:

так что точка действительно лежит на прямой . Подстановка полученного выражения для во второе уравнение системы дает

откуда

Заметим еще, что

Последние соотношения позволяют получить более употребительную форму записи выражения для (в отклонениях от средних значений)

которая в паре с выражением

дает явное и простое решение задачи отыскания оценок , на основе принципа наименьших квадратов.

Разумеется, такое решение может существовать только при выполнении условия

что равносильно отличию от нуля определителя системы. Действительно, этот определитель равен

Последнее условие называется условием идентифицируемости модели наблюдений , и означает попросту, что не все значения совпадают между собой. При нарушении этого условия все точки , лежат на одной вертикальной прямой

Оценки и обычно называют оценками наименьших квадратов (least squares estimates), или LS -- оценками. Обратим еще раз внимание на полученное выражение для . Нетрудно видеть, что в это выражение входят уже знакомые нам суммы квадратов, участвовавшие ранее в определении выборочной дисперсии и выборочной ковариации так что, в этих терминах,

Отсюда, в частности, видно, что значения близки к нулю, если ковариация между наблюдаемыми значениями переменных и близка к нулю. (Однако, близость к нулю здесь следует понимать как относительную, с учетом реальных значений выборочной дисперсии .) Кроме того, знак совпадает со знаком ковариации , поскольку .

Вычисление значений и для нашего примера дает значения

Таким образом, «наилучшая» прямая имеет вид

и мы принимаем ее в качестве аппроксимации для «истинной» модели линейной связи между переменными и . Эта аппроксимация указывает на то, что при изменении переменной на единицу (измерения ) переменная изменяется «в среднем» на единиц (измерения ).

Факт горизонтальности прямой при и наличие у этой прямой наклона при , позволяют произвести некоторую детализацию структуры остатков С этой целью, опять рассмотрим диаграмму рассеяния, сосредоточившись на какой-нибудь одной точке. Пусть в нашем примере это точка A = (7.1, 3.3). Опустим из этой точки перпендикуляр на ось абсцисс. Он пересечет прямую в точке B = (7.1, 3.118) и прямую в точке C = (7.1, 3.183), так что расстояние по вертикали от точки A до прямой , равное AB = 3.3 -- 3.118= 0.182, раскладывается в сумму

Отсюда находим, что расстояние по вертикали от точки A до прямой равно AC = AB -- CB = 0.182 -- (3.183 -- 3.118) = 0.117.

Вообще, для любой точки на диаграмме рассеяния можно записать:

где - ордината точки «наилучшей» прямой, имеющей абсциссу . Возведем обе части последнего представления в квадрат и просуммируем левые и правые части полученных для каждого i равенств:

Входящая в правую часть сумма

называется чаще всего остаточной суммой квадратов (residual sum of squares) и имеет аббревиатуру RSS (Доугерти, Айвазян-Мхитарян, Себер), хотя в литературе по эконометрике можно встретить и такие варианты аббревиатур как SSR (Green), а также ESS (error sum of squares -- Harvey, Chatterjie) и SSE (Магнус-Катышев-Пересецкий). При чтении различных руководств по эконометрике следует обратить особое внимание на то, какие именно термины и обозначения используются авторами.

Заметим, что если , то и . Следовательно, при

При , по самому определению прямой , имеем

Тенденция линейной связи между и выражена в максимальной степени, если . При этом, все точки , i = 1, 2,..., n, располагаются на одной прямой . Тенденция линейной связи между переменными и не обнаруживается вовсе, если совпадает с Таким образом, есть определенные основания предложить в качестве «меры выраженности» в данных наблюдений линейной связи между переменными величину

называемую коэффициентом детерминации. Этот коэффициент изменяется в пределах от (при , т. е. ) до (при ),

Вернемся, однако, к полученному ранее представлению в виде

и рассмотрим третью сумму в правой части этого представления. Имеем:

Но

(см. первое уравнение из системы нормальных уравнений). К тому же,

(см. второе уравнение из системы нормальных уравнений). Таким образом,

и, следовательно, справедливо представление

так что

т. е. получено второе представление для в виде

Стоящую здесь в числителе сумму квадратов мы будем называть суммой квадратов, объясненной моделью (explained sum of squares), и будем использовать для ее обозначения аббревиатуру ESS, так что

Сумму квадратов, стоящую в знаменателе, будем называть полной суммой квадратов (total sum of squares) и будем использовать для ее обозначения аббревиатуру TSS, так что

Напомним также, что нами уже была определена остаточная сумма квадратов

Все эти три суммы квадратов связаны соотношением

которое представляет собой разложение полной суммы квадратов на сумму квадратов, объясненную моделью, и остаточную сумму квадратов. Используя эти три суммы, мы находим также, что

Таким образом, значение Rтем выше, чем больше доля объясненной моделью суммы квадратов ESS по отношению к полной сумме квадратов TSS.

Термины «полная» и «объясненная моделью» суммы квадратов имеют следующее происхождение. Полная сумма квадратов Соответствует значению RSS в ситуации, когда и «наилучшая» прямая имеет вид , отрицающий наличие линейной зависимости от . Вследствие этого, привлечение информации о значениях переменной не дает ничего нового для объяснения изменений значений от наблюдения к наблюдению. Степень этой изменчивости мы уже характеризовали значением выборочной дисперсии

при этом, и .

В ситуации, когда , мы имеем нетривиальное представление с , и поэтому можно записать:

Но

где -- переменная, принимающая в i - м наблюдении значение . (Здесь мы использовали тот факт, что

так что

и .) К тому же,

где -- переменная, принимающая в i - м наблюдении значение . (Здесь мы использовали тот факт, что

.)

В итоге, мы получаем разложение показывающее, что изменчивость переменной (степень которой характеризуется значением ) частично объясняется изменчивостью переменной (степень которой характеризуется значением ). Не объясненная переменной часть изменчивости переменной Соответствует изменчивости переменной (степень которой характеризуется значением ).

Таким образом, вспомогательная переменная берет на себя объяснение некоторой части изменчивости значений переменной , и эта объясненная часть будет тем больше, чем выше значение коэффициента детерминации , который мы теперь можем записать также в виде

Поскольку переменная получается линейным преобразованием переменной , то изменчивость однозначно связана с изменчивостью , так что, в конечном счете, построенная модель объясняет часть изменчивости переменной изменчивостью переменной . Поэтому, принять говорить о переменной как об объясняемой переменной, а о переменной -- как об объясняющей переменной.

Вернемся опять к нашему примеру. В этом примере

ESS = 0.043474

RSS = 0.161231

TSS = 0.204705,

так что

= 0.043474/16 = 0.002717,

= 0.161231/16 = 0.010077,

= 0.012784,

= 0.043474/0.204705 = 0.212374.

Значение коэффициента детерминации оказалось достаточно малым, и один из последующих вопросов будет состоять в том, сколь близким к нулю должно быть значение R2, чтобы мы могли говорить о практическом отсутствии линейной связи между переменными.

Вопрос 3. Как называются показатели, которые характеризует степень разброса случайной величины вокруг ее среднего значения?

Ответ

Наиболее простыми показателями, характеризующими последовательности и , являются их средние значения (means)

а также дисперсии (точнее, выборочные дисперсии - sample variances)

характеризующие степень разброса значений () вокруг своего среднего ( , Соответственно), или вариабельность (изменчивость) этих переменных на множестве наблюдений. Отсюда обозначение Var (variance). Впрочем, более естественным было бы измерение степени разброса значений переменных в тех же единицах, в которых измеряется и сама переменная. Эту задачу решает показатель, называемый стандартным отклонением (standard deviance - Std.Dev.) переменной (переменной ), определяемый соотношением

(Соответственно).

Вопрос 4. Какой физический смысл несет коэффициент детерминации в эконометрической линейной модели связи двух переменных, таких как расходы и доходы, цена и спрос, число занятых и уровень безработицы и т.д.?

Ответ

Пример 1

В следующей таблице приведены данные об изменении потребительского спроса на куриные яйца семи семейных хозяйств в зависимости от цены на этот продукт в течение 15 недель:

i

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Спрос

12

10

13

11.5

12

13

12

12

12

13

13.5

14

13.5

14.5

13

Цена

0.54

0.51

0.49

0.49

0.48

0.48

0.48

0.47

0.44

0.44

0.43

0.42

0.41

0.40

0.39

(спрос измерялся в дюжинах, цена -- в долларах). Диаграмма рассеяния для этих данных имеет следующий вид:

Предполагая, что модель наблюдений имеет вид где -- спрос в i-ю неделю, а -- цена в i-ю неделю, мы получаем следующие оценки для неизвестных параметров и модели линейной связи между ценой и спросом: Таким образом, подобранная модель линейной связи имеет вид При этом,

так что коэффициент детерминации оказывается равным т. е. изменчивость цен объясняет 51.4% изменчивости спроса на куриные яйца. На диаграмме рассеяния изображена прямая линия, Соответствующая подобранной модели линейной связи.

Пример 2. В следующей таблице приведены данные о годовом потреблении свинины на душу населения в США (в фунтах) и оптовых ценах на свинину (в долларах за фунт) за период с 1948 по 1961 год:

Год

Потр.

Цена

Год

Потр.

Цена

1948

67.8

0.5370

1955

66.6

0.4256

1949

67.7

0.4726

1956

67.4

0.4111

1950

69.2

0.4556

1957

61.5

0.4523

1951

71.9

0.4655

1958

60.2

0.4996

1952

72.4

0.4735

1959

67.6

0.4183

1953

63.5

0.5047

1960

65.2

0.4433

1954

60.0

0.5165

1961

62.2

0.4448

Для этих данных диаграмма рассеяния имеет вид

Предполагая, что модель наблюдений имеет вид где -- потребление свинины в i-й год рассматриваемого периода, а -- оптовая цена на свинину в этом году, мы получаем следующие оценки для неизвестных параметров и модели линейной связи между оптовой ценой и потреблением: Таким образом, подобранная модель линейной связи имеет вид При этом,

, ,

так что коэффициент детерминации здесь оказывается равным . Изменчивость оптовой цены объясняет здесь лишь 5.5% изменчивости потребления свинины.

Пример 3. Рассмотрим данные о размерах совокупного располагаемого дохода и совокупных расходах на личное потребление в США в период с 1970 по 1979 год. Обе величины выражены в текущих долларах США.

Год

Расп. доход

Потребление

1970

695.2

621.7

1971

751.9

672.4

1972

810.3

737.1

1973

914.0

811.7

1974

998.1

887.9

1975

1096.2

976.6

1976

1194.3

1084.0

1977

1313.5

1204.0

1978

1474.3

1346.7

1979

1650.5

1506.4

Этим данным Соответствует диаграмма рассеяния

Предполагая, что модель наблюдений имеет вид где -- совокупные расходы на личное потребление в i-й год рассматриваемого периода, а -- совокупный располагаемый доход в этом году, мы получаем следующие оценки для неизвестных параметров и модели линейной связи между совокупным располагаемым доходом и совокупными расходами на личное потребление: Таким образом, подобранная модель линейной связи имеет вид При этом,

, ,

так что коэффициент детерминации здесь оказывается равным . Изменчивость совокупного располагаемого дохода объясняет здесь более 99.95% изменчивости совокупных расходов на личное потребление.

Впрочем, не следует слишком оптимистически интерпретировать близкие к единице значения коэффициента детерминации как указание на то, что изменения значений объясняемой переменной практически полностью определяются именно изменениями значений объясняющей переменной. В этой связи, рассмотрим следующий поучительный пример.

Пример 4. Рассмотрим динамику изменений в период с 1957 по 1966 годы трех совершенно различных по природе показателей: E -- суммарного производства электроэнергии в США (в млрд. квт-час), C -- совокупных потребительских расходов в Тайланде (в млрд. бат) и H -- мирового рекорда на конец года в прыжках в высоту с шестом среди мужчин (в см). Значения этих показателей приведены в таблице:

Год

Потребление Тайланд млрд бат

Эл. энергия США млрд квт-час

Мир. рекорд (прыжки с шестом), см

1957

34.9

716

478

1958

35.9

724

478

1959

37.9

797

478

1960

41.1

844

481

1961

43.5

881

483

1962

46.7

946

493

1963

48.9

1011

520

1964

52.0

1083

528

1965

56.1

1157

528

1966

62.6

1249

534

Динамика изменений показателей показана на графике:

По этим данным мы можем формально, используя метод наименьших квадратов, подобрать модели линейной зависимости каждого из трех показателей от каждого из остальных показателей. Это приводит, например, к моделям

(Заметим, кстати, что произведение угловых коэффициентов двух последних прямых, Соответствующих моделям линейной связи, в которых объясняемая и объясняющая переменная меняются местами, равно и совпадает со значением коэффициента детерминации в этих двух подобранных моделях.)

Во всех подобранных моделях значения коэффициента детерминации весьма высоки, и это формально означает, что изменчивость «объясняющих» переменных в этих моделях составляет значительный процент от изменчивости «объясняемой» переменной, стоящей в левой части уравнения. Однако, вряд ли мы всерьез можем полагать, что динамика роста суммарного производства электроэнергии в США действительно объясняется динамикой роста мирового рекорда по прыжкам в высоту с шестом, несмотря на высокое значение 0.9 коэффициента детерминации в первом из четырех уравнений.

В ситуациях, подобных последнему примеру, принято говорить о фиктивной (ложной, паразитной -- spurious) линейной связи между Соответствующими показателями. И такие ситуации часто встречаются при рассмотрении показателей, динамика изменений которых обнаруживает заметный тренд (убывание или возрастание) -- именно такой характер имеют исследуемые показатели в последнем примере.

Чтобы понять, почему это происходит, вспомним полученное в свое время равенство

Из этого равенства вытекает, что близкие к единице значения коэффициента детерминации Соответствуют близким по абсолютной величине к единице значениям коэффициента корреляции между переменными и . Но этот коэффициент корреляции равен

где

При фиксированных значениях и , значение будет тем ближе к , чем большим будет значение Последнее же обеспечивается совпадением знаков разностей и для максимально возможной доли наблюдений переменных и , что как раз и имеет место, когда в процессе наблюдения обе переменные возрастают или обе переменные убывают по величине. (В этом случае превышение одной из переменных своего среднего значения сопровождается, как правило, и превышением второй переменной своего среднего значения. Напротив, если одна из переменных принимает значение, меньшее среднего значения этой переменной, то и вторая переменная, как правило, принимает значение, меньшее своего среднего.)

Аналогичным образом, значение будет тем ближе к , чем меньшим будет значение Последнее же обеспечивается несовпадением знаков разностей и для максимально возможной доли наблюдений переменных и , что имеет место, когда в процессе наблюдения одна из переменных возрастает, а вторая убывает. (В этом случае, если одна из переменных принимает значение, меньшее среднего значения этой переменной, то вторая переменная, как правило, принимает значение, большее своего среднего.)

Из сказанного следует, что близость к единице наблюдаемого значения коэффициента детерминации не обязательно означает наличие причинной связи между двумя рассматриваемыми переменными, а может являться лишь следствием тренда значений обеих переменных.

Последнее обстоятельство часто наблюдается при анализе различных экономических показателей, вычисленных без поправки на инфляцию (недефлированные данные). Проиллюстрируем это следующим примером.

Пример 5

Обратимся к данным о совокупном располагаемом доходе и совокупных личных расходах на местный транспорт в США за период с 1970 по 1983 год. Данные представлены как в текущих долларах США, так и в долларах 1972 года - пересчет к последним выполнен с учетом динамики индекса потребительских цен в указанном периоде. (Уровень цен в 1972 г. принят за 100%.)

Год

Распол. Доход номинал.

Расходы номинал.

Распол. Доход дефлир.

Расходы дефлир.

1970

695.2

3.1

751.6

3.4

1971

751.9

3.3

779.2

3.4

1972

810.3

3.4

810.3

3.4

1973

914.0

3.6

864.7

3.4

1974

998.1

4.0

857.5

3.5

1975

1096.2

4.4

874.5

3.5

1976

1194.3

4.7

906.4

3.6

1977

1313.5

5.0

942.9

3.6

1978

1474.3

5.5

988.8

3.7

1979

1650.5

6.2

1015.7

3.8

1980

1828.7

6.3

1021.6

3.5

1981

2040.9

6.2

1049.3

3.2

1982

2180.1

6.6

1058.3

3.2

1983

2333.2

6.6

1095.4

3.1

Диаграммa рассеяния для недефлированных величин имеет вид

Соответствующая модель линейной связи: Коэффициент детерминации равен . Диаграмме рассеяния дефлированных величин

соответствует модель линейной связи Коэффициент детерминации равен на этот раз всего лишь .

В связи с последним примером, вернемся к примеру 3 и выясним, не является ли обнаруженная там сильная линейная связь между совокупным располагаемым доходом и совокупными расходами на личное потребление лишь следствием использования недефлированных величин.

Для этого рассмотрим дефлированные значения, представленные следующей таблицей, в последнем столбце которой приведены значения индекса потребительских цен (уровень цен 1972 г. принят за 100%).

Год

Дефлир. доход

Дефлир. потребл.

1970

695.2

621.7

1971

751.9

672.4

1972

810.3

737.1

1973

914.0

811.7

1974

998.1

887.9

1975

1096.2

976.6

1976

1194.3

1084.0

1977

1313.5

1204.0

1978

1474.3

1346.7

1979

1650.5

1506.4

Соответствующая этой таблице диаграмма рассеяния имеет вид

Подобранная модель линейной связи Коэффициент детерминации при переходе от номинальных величин к дефлированным остается очень высоким: . Следовательно, наличие сильной линейной связи между совокупным располагаемым доходом и совокупными расходами на личное потребление не является только лишь следствием инфляционных процессов.

Вопрос 5. Что обозначает и как рассчитывается функция эластичности в линейной эконометрической модели ?

Ответ

В модели функция эластичности имеет вид

и при возрастает от до с возрастанием значений от до . Если , то . При функция эластичности убывает от до , когда изменяется от до .

К линейной форме связи можно привести и некоторые другие виды зависимости, характерные для экономических моделей.

Вопрос 6. Что мы подразумеваем под свойствами линейной модели , если считаем, что ошибки - случайные величины?

Ответ

Базовая, и наиболее простая модель для последовательности предполагает, что -- независимые случайные величины, имеющие одинаковое распределение (i. i. d. -- independent, identically distributed random variables).

Для нас (пока!) достаточно представлять случайную величину как переменную величину, такую, что до наблюдения ее значения невозможно предсказать это значение абсолютно точно, и, в то же время, для любого , определена вероятность

того, что наблюдаемое значение переменной не превзойдет ; . Функция называется функцией распределения случайной величины (c. d. f. -- cumulative distribution function).

Говоря об ошибках как о случайных величинах, мы, Соответственно, понимаем указанную линейную модель наблюдений таким образом, что

а) существует (теоретическая, объективная или в виде тенденции) линейная зависимость значений переменной от значений переменной с вполне определенными, хотя обычно и не известными исследователю, значениями параметров и;

б) эта линейная связь для реальных статистических данных не является строгой: наблюдаемые значения переменной отклоняются от значений , указываемых моделью линейной связи

в) при заданных (известных) значениях конкретные значения отклонений

не могут быть точно предсказаны до наблюдения значений даже если значения параметров и известны точно;

г) для каждого определена вероятность того, что наблюдаемое значение отклонения не превзойдет , причем эта вероятность не зависит от номера наблюдения;

д) вероятность того, что наблюдаемое значение отклонения в i-м наблюдении не превзойдет , не зависит от того, какие именно значения принимают отклонения в остальных наблюдениях.

Вопрос 7. В каких пределах будет заключена случайная ошибка с вероятностью 0.95, если она имеет Гауссовское распределение с параметром ?

Ответ

Итак, предположив, что в модели наблюдений

ошибки -- независимые случайные величины, имеющие одинаковое распределение (i. i. d), мы должны сделать и предположение о том, каким именно является это распределение.

Классические методы статистического анализа линейных моделей наблюдений предполагают, что таковым является распределение Гаусса (Gaussian distribution), функция плотности которого имеет вид

График указанной функции плотности имеет колоколообразную форму

Параметр характеризует степень рассредоточения распределения вдоль оси абсцисс. На диаграмме представлены графики функций плотности гауссовского распределения при трех различных значениях параметра. Из трех представленных функций наибольшее значение в нуле имеет функция плотности с , наименьшее -- функция плотности с , а промежуточное между ними -- функция плотности с . Эти значения равны, Соответственно,

Гауссовское распределение симметрично относительно нуля, и это предполагает, что положительные ошибки столь же вероятны, как и отрицательные; при этом, малые ошибки встречаются чаще, чем большие. Если случайная ошибка имеет гауссовское распределение с параметром , то с вероятностью ее значение будет заключено в пределах от до . Соответственно, для трех рассмотренных случаев получаем: с вероятностью значение случайной ошибки заключено в интервале

-- при , - при , - при .

Хотя гауссовское распределение довольно часто вполне приемлемо для описания случайных ошибок в моделях наблюдений, оно вовсе не является универсальным. Такое распределение характерно для ситуаций, когда результирующая ошибка является следствием сложения большого количества независимых случайных ошибок, каждая из которых достаточно мала.

Вопрос 8. При каких значениях статистики Фишера нулевая гипотеза отвергается, и какова вероятность того, что мы отвергнем верную гипотезу?

Ответ

Применение критериев, основанных на статистиках, имеющих при нулевой гипотезе -распределение Фишера (F-критерии), отнюдь не ограничивается только что рассмотренным анализом статистической значимости регрессии. Такие критерии широко применяются в процессе подбора модели.

Пусть мы находимся в рамках множественной линейной модели регрессии

c объясняющими переменными, и гипотеза состоит в том, что в модели последние коэффициентов равны нулю, т. е.

Тогда при гипотезе (т. е. в случае, когда она верна) мы имеем редуцированную модель

уже с объясняющими переменными.

Пусть - остаточная сумма квадратов в полной модели , а -- остаточная сумма квадратов в редуцированной модели . Если гипотеза верна и выполнены стандартные предположения о модели (в частности, i. i. d. ), то тогда F-статистика

рассматриваемая как случайная величина, имеет при гипотезе H0 (т. е. когда действительно p p-1 p-q+1 ) F-распределение Фишера F (q, n-p) с q и (n-p) степенями свободы.

В рассмотренном ранее случае проверки значимости регрессии в целом мы имели , и при этом там имело равенство которое не выполняется в общем случае.

Пусть -- сумма квадратов, объясняемая полной моделью ,

-- сумма квадратов, объясняемая редуцированной моделью .

Тогда

так что -статистику можно записать в виде

из которого следует, что F-статистика измеряет, в Соответствующем масштабе, возрастание объясненной суммы квадратов вследствие включения в модель дополнительного количества объясняющих переменных.

Естественно считать, что включение дополнительных переменных существенно, если указанное возрастание объясненной суммы квадратов достаточно велико. Это приводит нас к критерию проверки гипотезы

основанному на F-статистике

и отвергающему гипотезу , когда наблюдаемое значение этой статистики удовлетворяет неравенству

где -- выбранный уровень значимости критерия (вероятность ошибки 1-го рода).

Вопрос 9. Какая из трех нулевых гипотезе , , является простой, а какая - сложной?.

Ответ:

является сложной

,

гетероскедастичность автокоррелированность детерминация

является простой

Вопрос 10. Что такое гетероскедастичность и автокоррелированность ошибок?

Ответ

Неоднородность дисперсий ошибок (гетероскедастичность, heteroscedasticity). Этот вид нарушений стандартных предположений характерен для статистических данных, относящихся к одному моменту времени, но собранных по различным регионам, различным предприятиям, различным социальным группам (данные в сечениях, cross-section data). Неоднородность дисперсий возникает также как результат тех или иных структурных изменений в экономике, например связанных с мировыми экономическими кризисами. Последний пример как раз и иллюстрирует подобную ситуацию: резкое возрастание абсолютных величин остатков в этом примере относится к периоду глобального нефтяного кризиса.

Последствия неоднородности дисперсий ошибок:

Оценки дисперсий случайных величин (оценок коэффициентов линейной модели) оказываются смещенными.

Построенные доверительные интервалы для не Соответствуют заявленным уровням значимости.

Вычисленные значения - и - отношений уже нельзя рассматривать как наблюдаемые значения случайных величин, имеющих - и -распределения, Соответствующие стандартным предположениям. Поэтому сравнение вычисленных значений - и - отношений с квантилями указанных - и -распределений может приводить к ошибочным статистическим выводам в отношении гипотез о значениях коэффициентов линейной модели.

Автокоррелированность (сериальная корреляция) ошибок (autocorrelation, serial correlation). Этот вид нарушений стандартных предположений характерен для статистических данных, развернутых во времени (продольные данные, longitudial data). Автокоррелированность ошибок обычно возникает вследствие направильной спецификации модели, например, при невключении в модель существенной объясняющей переменной с выраженной автокорреляцией.

Последствия автокоррелированности ошибок:

Оценка дисперсии случайных ошибок смещена вниз в случае положительной и смещена вверх в случае отрицательной автокоррелированности ошибок.

Оценки дисперсий случайных величин (оценок коэффициентов линейной модели) оказываются заниженными в случае положительной и завышенными в случае отрицательной автокоррелированности ошибок.

Построенные доверительные интервалы для не Соответствуют заявленным уровням значимости: в случае положительной автокоррелированности ошибок построенные интервалы неоправденно узки, а в случае отрицательной автокоррелированности ошибок неоправданно широки.

Вычисленные значения - и - отношений нельзя рассматривать как наблюдаемые значения случайных величин, имеющих - и -распределения, Соответствующие стандартным предположениям. Поэтому сравнение вычисленных значений - и - отношений с квантилями указанных - и -распределений может приводить к ошибочным статистическим выводам в отношении гипотез о значениях коэффициентов линейной модели. Вычисленные значения - и - отношений завышены в случае положительной и занижены в случае отрицательной автокоррелированности ошибок.

При обнаружении нарушений стандартных предположений следует либо улучшить спецификацию модели, привлекая подходящие дополнительные объясняющие переменные, либо использовать для оценивания коэффициентов и оценивания дисперсий коэффициентов модели специальные методы оценивания, принимающие во внимание обнаруженные нарушения (далее мы рассмотрим два таких метода: взвешенный метод наименьших квадратов и авторегрессионное преобразование переменных).

Размещено на Allbest.ru


Подобные документы

  • Основные проблемы эконометрического моделирования. Использование фиктивных переменных и гармонических трендов. Метод наименьших квадратов и выборочная дисперсия. Смысл коэффициента детерминации. Расчет функции эластичности. Свойства линейной модели.

    контрольная работа [18,6 K], добавлен 06.11.2009

  • Основные проблемы эконометрического моделирования. Показатели, характеризующие степень разброса случайной величины вокруг ее среднего значения. Физический смысл коэффициента детерминации. Расчет функции эластичности в линейной эконометрической модели.

    контрольная работа [18,1 K], добавлен 23.11.2009

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Поле корреляции и гипотеза о виде уравнения регрессии. Оценка величины влияния фактора на исследуемый показатель с помощью коэффициента корреляции и детерминации. Определение основных параметров линейной модели с помощью метода наименьших квадратов.

    контрольная работа [701,1 K], добавлен 29.03.2011

  • Методологические основы эконометрики. Проблемы построения эконометрических моделей. Цели эконометрического исследования. Основные этапы эконометрического моделирования. Эконометрические модели парной линейной регрессии и методы оценки их параметров.

    контрольная работа [176,4 K], добавлен 17.10.2014

  • Параметры уравнения и экономическое толкование коэффициента линейной регрессии. Расчет коэффициентов детерминации и средних относительных ошибок аппроксимации. Построение структурной формы модели с использованием косвенного метода наименьших квадратов.

    контрольная работа [99,2 K], добавлен 27.04.2011

  • Понятие взаимосвязи между случайными величинами. Ковариация и коэффициент корреляции. Модель парной линейной регрессии. Метод наименьших квадратов, теорема Гаусса-Маркова. Сравнение регрессионных моделей. Коррекция гетероскедастичности, логарифмирование.

    курс лекций [485,1 K], добавлен 02.06.2011

  • Понятие модели множественной регрессии. Сущность метода наименьших квадратов, который используется для определения параметров уравнения множественной линейной регрессии. Оценка качества подгонки регрессионного уравнения к данным. Коэффициент детерминации.

    курсовая работа [449,1 K], добавлен 22.01.2015

  • Эффективность линейной несмещенной оценки вектора для обобщенной регрессионной модели, теорема Айткена. Обобщенный метод наименьших квадратов. Преобразования Фурье, их применение; разложение временного ряда. Ряды Фурье, многомерные преобразования.

    реферат [345,4 K], добавлен 09.05.2012

  • Оценка влияния разных факторов на среднюю ожидаемую продолжительность жизни по методу наименьших квадратов. Анализ параметров линейной двухфакторной эконометрической модели с помощью метода наименьших квадратов. Графическое изображение данной зависимости.

    практическая работа [79,4 K], добавлен 20.10.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.