Эконометрика и эконометрическое моделирование
Основные понятия и определения эконометрики и эконометрического моделирования. Парная корреляция и регрессия, проверка значимости параметров парной линейной модели. Виды линейной модели множественной регрессии. Системы линейных одновременных уравнений.
Рубрика | Экономико-математическое моделирование |
Вид | курс лекций |
Язык | русский |
Дата добавления | 26.11.2013 |
Размер файла | 205,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
1
24
Размещено на http://www.allbest.ru
Всероссийский заочный финансово-экономический институт
Эконометрика
Конспект лекций
Тема 1. Введение. Эконометрика и эконометрическое моделирование: основные понятия и определения
Эконометрика - это наука, которая даёт количественное выражение взаимосвязей экономических явлений и процессов.
Основные задачи эконометрики: построение количественно определённых экономико-математических моделей, разработка методов оценки их параметров по статистическим данным, анализ свойств построенных моделей и прогнозирование на их основе экономических процессов.
Можно выделить три основных класса моделей, которые применяются для анализа и прогнозирования экономических процессов:
модели временных рядов,
регрессионные модели с одним уравнением,
системы одновременных уравнений.
При этом все переменные любой эконометрической модели по способу их вхождения в эту модель можно разбить на объясняемые (зависимые, исследуемые) переменные и объясняющие (предопределённые, факторные) переменные.
Например, если мы будем решать задачу прогнозирования продаж мороженого в определённый день каким-либо торговым предприятием, то объясняемой переменной будет объём продаж, а объясняющими переменными могут выступать: температура воздуха, торговая наценка, среднедушевой доход населения и другие.
Необходимым условием использования той или иной переменной при построении модели является наличие ряда данных наблюдений (измерений) величины этой переменной, либо получение ряда значений с использованием дополнительных вычислений на основе наблюдений о показателях, объясняющих интересующую нас переменную.
Например, определение достоверных значений среднедушевого дохода непосредственно по результатам опросов и бухгалтерской отчётности может оказаться сложнее оценки изменения дохода на основе информации об изменении розничного оборота товаров и услуг, а также изменении общей суммы банковских вкладов населения.
В эконометрике выделяют три типа данных:
I. Кросс секционные (перекрёстные) данные представляют ситуацию в группе переменных в отдельный момент времени. Таковыми, например, являются публикуемые в деловых разделах газет списки цен на различные акции, процентные ставки по разным видам вкладов и обменные курсы разных валют. Другим примером может служить информация о продажах торговым предприятием в определённый день товаров различных групп (пищевых, хозяйственных и т.д.)
II. Пространственные данные характеризуют ситуацию по конкретной переменной (или набору переменных), относящейся к пространственно разделённым однотипным объектам в один момент времени. Например, данные о курсах валют в один день по разным обменным пунктам города или продажи мороженого в различных киосках в один день.
Временные ряды отражают изменения (динамику) какой-либо переменной на промежутке времени. Например, данные об обменном курсе валюты за каждый день в конкретном обменном пункте или данные о продажах мороженого в одном киоске за каждый день будут являться ежедневным временным рядом.
Эконометрическое моделирование состоит из следующих этапов:
На постановочном этапе формулируются конечные цели моделирования, определяется наборы возможных исследуемых (объясняемых) переменных и факторных (объясняющих) переменных .
На предварительном этапе осуществляется предварительный анализ экономической сути изучаемого явления, возможностей сбора и обработки статистических данных.
На этапе параметризации производится выбор общего вида модели, в том числе состава и формы входящих в неё связей. Например, может быть выбрана модель с одной объясняющей и одной объясняемой переменными - модель парной регрессии. Если объясняющих (факторных) переменных используется две или более, то говорят об использовании модели множественной регрессии. При этом, в качестве вариантов могут быть выбраны линейная, экспоненциальная, гиперболическая, показательная и другие виды функций, связывающие эти переменные.
Информационный этап заключается в сборе информации (проведение наблюдений, использование материалов отчётности и т.д.) и предварительном анализе данных (проверка аномальных значений показателей, сглаживание, тестирование на наличие тенденции исследуемых показателей к изменению).
5. Идентификация модели посвящена определению неизвестных параметров (коэффициентов) модели с использованием имеющегося набора данных. Наибольшее распространение для оценки параметров получил метод наименьших квадратов.
Проверка (верификация) модели и прогнозирование предполагает сопоставление реальных и модельных данных, проверку адекватности модели, оценку точности модельных данных. Если модель адекватна и имеет приемлемую точность, то на её основе строится прогноз - точечный и интервальный.
Тема 2. Парная корреляция и регрессия
Изучение действительности показывает, что изменение каждого исследуемого (объясняемого) показателя находится в связи и взаимодействии с изменением объясняющих (факторных) показателей. Например, изменение производительности труда работников предприятия зависит от степени совершенства применяемого оборудования, технологии, организации труда, управления и других факторов.
Рассматривая зависимости между признаками, необходимо выделить два вида зависимостей: функциональные и корреляционные.
Функциональные связи характеризуются полным соответствием между изменением факторного признака (признаков) и исследуемого показателя. Так, величина начисленной зарплаты при повременной оплате труда однозначно определяется количеством отработанных часов.
В корреляционных связях между изменением факторного и результативного признаков нет однозначного соответствия, воздействие факторов проявляется лишь в среднем при многократном наблюдении фактических данных. Например, чем больше у человека заработная плата, тем больше он тратит денег на покупку одежды. Однако, точную величину таких расходов при определенной величине заработной платы назвать нельзя. Можно только определить среднюю величину расходов на одежду у людей с определённым размером заработной платы.
В отличие от жёсткости функциональной связи корреляционные связи характеризуются множеством причин и следствий и устанавливаются лишь тенденции изменения исследуемого признака при изменении факторного признака (признаков).
2.1 Ковариация. Выборочный коэффициент парной корреляции
Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными переменными путём оценки коэффициентов корреляции и детерминации, а также проверки значимости полученных значений.
В эконометрике корреляционный анализ применяется для отбора факторов, оказывающих наибольшее влияние на исследуемый показатель и оценки качества построенных эконометрических моделей.
Мерой взаимосвязи между двумя переменными v и w является выборочная ковариации, вычисляемая по правилу:
,
где - результаты наблюдений, n - число наблюдений,
Обозначения переменных специально выбраны отличные от x и y, чтобы подчеркнуть возможность наличия связи между двумя любыми переменными, не обязательно являющимися объясняющей и объясняемой переменными.
Существенным недостатком ковариации является зависимость от единиц, в которых измеряются переменные v и w. Если мы одни и те же данные запишем с использованием различных единиц измерения, то получим различные значения ковариации. То есть любое ненулевое значение ковариации само по себе не позволяет сделать вывод о тесноте связи между переменными.
Поэтому для измерения силы связи между двумя переменными используется парный коэффициент корреляции. Парный коэффициент корреляции является показателем тесноты связи между переменными v и w лишь в случае линейной зависимости между этими переменными.
В практических расчётах обычно используется выборочный парный коэффициент парной корреляции, определяемый по имеющемуся набору фактических данных:
, (2.1)
где - выборочные значения дисперсии переменных v и w.
Парный коэффициент корреляции обладает следующими свойствами:
принимает значение в интервале [-1;1], то есть ;
не зависит от выбора начала отсчёта и единицы измерения
,
где a, b, c, d - постоянные величины, причём a и с - положительны;
если , то между переменными имеется прямая связь, то есть при возрастании (убывании) одной из них другая также возрастает (убывает); если , то связь является обратной, то есть при возрастании одной переменной другая убывает;
если , то между переменными имеется функциональная линейная зависимость, а если , то линейная связь между переменными отсутствует; соответственно, чем ближе модуль коэффициента парной корреляции к единице, тем теснее связь между переменными.
Заметим, что при отсутствии линейной связи между двумя переменными, между ними может существовать тесная связь другого вида.
Пример 1. В таблице приведены данные об объёмах продаж мороженого в магазине за день y, в зависимости от температуры воздуха в городе x2 и процента торговой надбавки x3. Видно, что спрос быстро растёт при повышении температуры воздуха. При наступлении очень высоких температур, предприятие резко увеличивает наценку, поскольку оказывается не в состоянии физически удовлетворить резко возрастающий спрос и сдерживает его повышением цен.
Требуется определить наличие между переменными линейных корреляционных связей, сделать выводы об их тесноте и охарактеризовать как прямые или обратные.
Таблица 1
y |
x1 |
x2 |
|
2 |
5 |
20 |
|
3,5 |
10 |
20 |
|
5 |
15 |
20 |
|
12 |
20 |
20 |
|
22 |
25 |
20 |
|
40 |
30 |
25 |
|
42 |
35 |
50 |
Решение. В первую очередь вычислим средние значения переменных в предложенной выборке данных:. Аналогично, . Тогда выборочные коэффициенты парной корреляции:
Следовательно, мы можем сказать, что между переменными y (объём продаж) и x1 (температура воздуха) имеется тесная прямая линейная связь. Между переменными x1 (температура воздуха) и x2 (торговая наценка) также наблюдается тесная прямая линейная зависимость. То же самое можно сказать о взаимосвязи между переменными y и x2.
Для того, чтобы проверить, можем ли мы делать вывод о наличии линейной корреляционной связи между переменными по полученному значению коэффициента парной корреляции производится оценка его значимости, то есть определяется действительно ли полученное значение отражает наличие линейной связи, или же ненулевое значение коэффициента получено в результате случайных колебаний показателей или является следствием погрешности в вычислениях.
2.2 Оценка значимости выборочного коэффициента парной корреляции
Для оценки значимости выборочного коэффициента парной корреляции применяется t-критерий Стьюдента. При этом фактическое значение этого критерия определяется по формуле:
, (2.2)
где n - число наблюдений. Полученное значение сравнивается с табличным критическим значением , зависящим от уровня значимости б и числа степеней свободы . Критическое значение может быть найдено по соответствующим таблицам, а при использовании табличного процессора Excel - с помощью функции СТЬЮДРАСПОБР (б; г).
При полученное значение коэффициента корреляции r признается значимым, то есть между переменными имеется линейная корреляционная зависимость.
Для рассмотренного Примера 1 при , с учётом количества степеней свободы критическое значение . Вычислим для каждой пары переменных и сделаем вывод о значимости соответствующих коэффициентов корреляции.
Для пары переменных y, x1: .
Следовательно, значение коэффициента является значимым.
Для пары переменных y, x2: .
Следовательно, мы можем утверждать, что значение коэффициента является значимым.
Для пары переменных x1, x2: .
Следовательно, значение коэффициента является значимым.
Поскольку мы выбрали уровень значимости , то с вероятностью 10% мы сделали ошибочные выводы, а с вероятностью наши выводы верны.
2.3 Модель парной регрессии. Основные понятия. Линейная парная регрессия
Регрессионное уравнение, разрешённое относительно исследуемой переменной у при наличии одной факторной переменной x, в общем виде записывается как: , и показывает, каково будет в среднем значение переменной y, если переменная х примет конкретное значение. Индекс р указывает на то, что мы получаем расчётное значение переменной y. Мы говорим в среднем, поскольку под влиянием неучтённых в модели факторов и в результате погрешностей измерения фактическое значение переменной y может принимать различные значения для одного значения x.
Если f(x) является линейной функцией, то мы имеем общий вид модели парной линейной регрессии:
, (2.3)
где a - постоянная величина (или свободный член уравнения), b - коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны наблюдения. Коэффициент регрессии характеризует изменение переменной y при изменении значения x на единицу. Если , то переменные положительно коррелированны, если - отрицательно коррелированны. Фактическое значение исследуемой переменной y тогда может быть представлено в виде:
, (2.4)
где е - разность между фактическим значением (результатом наблюдения) и значением, рассчитанным по уравнению модели. Если модель адекватно описывает исследуемый процесс, то е - независимая нормально распределённая случайная величина с нулевым математическим ожиданием (Ме = 0) и постоянной дисперсией (Dе = у2). Наличие случайной компоненты е отражает тот факт, что присутствуют другие факторы, влияющие на исследуемую переменную и не учтённые в модели.
2.4 Определение параметров линейной парной модели методом МНК
Для оценки параметров a и b линейной парной регрессии с использованием имеющегося набора результатов наблюдений наиболее часто используют метод наименьших квадратов (МНК), который минимизирует сумму квадратов еi - отклонения результатов наблюдений yi от рассчитанных по линейной модели (2.3) значений yрi:
(2.5)
Такое решение может существовать только при выполнении условия , то есть когда не все наблюдения проводились при одном и том же значении факторной переменной (сумма квадратов равна нулю, если каждое слагаемое равно нулю). Это условие называется условием идентифицируемости модели.
По данным, приведённым в Примере 1, построим линейную модель для объёма продаж мороженного y в зависимости от температуры воздуха x1. Промежуточные данные вычислений и модельные значения yр приведены в Таблице 2.
Таблица 2
x1 |
y |
x1i-x1ср |
yi-yср |
(x1i-x1ср)2 |
(x1i-x1ср)*(yi-yср) |
yр |
е |
||
5,0 |
2 |
-15,0 |
-16,07 |
225,00 |
241,07 |
-4,43 |
6,43 |
||
10,0 |
3,5 |
-10,0 |
-14,57 |
100,00 |
145,71 |
3,07 |
0,43 |
||
15,0 |
5 |
-5,0 |
-13,07 |
25,00 |
65,36 |
10,57 |
-5,57 |
||
20,0 |
12 |
0,0 |
-6,07 |
0,00 |
0,00 |
18,07 |
-6,07 |
||
25,0 |
22 |
5,0 |
3,93 |
25,00 |
19,64 |
25,57 |
-3,57 |
||
30,0 |
40,0 |
10,0 |
21,93 |
100,00 |
219,29 |
33,07 |
6,93 |
||
35,0 |
42,0 |
15,0 |
23,93 |
225,00 |
358,93 |
40,57 |
1,43 |
||
Сумма |
140,0 |
126,5 |
0,0 |
0,00 |
700,00 |
1050,00 |
126,50 |
0,00 |
|
Среднее |
20,0 |
18,1 |
b= |
1,5 |
a= |
-11,93 |
Рис 1. Модель парной линейной регрессии
Исходные данные наблюдений и результаты расчётов приведены на следующем рисунке
Таблица и график построены средствами табличного процессора Excel.
Таким образом уравнение парной линейной модели имеет вид:
.
2.5 Проверка значимости параметров парной линейной модели
Поскольку в результате наблюдений мы имеем случайные значения yi, то и вычисленные с их помощью параметры парной линейной модели a и b также являются случайными величинами. Для оценки надёжности полученных значений a и b производится проверка их значимости с использованием стандартной ошибки оценки, которая, в свою очередь, определяется по значениям ряда остатков еi:
, (2.6)
где n - количество наблюдений, m - количество факторных переменных в модели. Выражение (2.6) для определения стандартной ошибки оценки будет использоваться нами в дальнейшем неоднократно, поскольку применимо в случае нелинейных моделей, а также при наличии в модели двух и более факторных переменных, то есть является универсальным.
Собственно проверка значимости параметров линейной модели производится в три этапа, аналогично тому, как это делалось для проверки значимости выборочного коэффициента корреляции.
На первом этапе вычисляются t -статистики:
, (2.7)
где
. (2.8)
На втором этапе определяется критическое значение tкр(б;n-m-1) по таблицам или с помощью функции СТЮДРАСПОБР в Excel. Уровень значимости б задаётся, а число степеней свободы вычисляется по числу наблюдений n и числу факторов m (в парной модели фактор x единственный).
Наконец, на третьем этапе вычисленные значения t-статистик сравниваются с критическими значениями tкр. Если расчётное значение больше табличного, то соответствующий параметр (коэффициент уравнения) считается значимым. В противном случае коэффициент значимым не является, то есть его можно положить равным нулю.
Произведём проверку значимости линейной модели парной регрессии, которую мы построили по данным Примера 1. Стандартная ошибка оценки вычисляется по значениям ряда остатков линейной модели еi (приведён в последней колонке Таблицы 2): .
Тогда, с использованием результатов вычислений из Таблицы 2, получаем:
При уровне значимости 10% и числе степеней свободы 7-1-1=5 имеем tкр=2,02. Поскольку расчётные значения t-статистик для обоих параметров больше критического значения, то с вероятностью 90% можно утверждать, что оба параметра линейного уравнения - а и b являются значимыми.
2.6 Проверка выполнения предпосылок МНК
Проверка выполнения предпосылок МНК выполняется на основе анализа остаточной компоненты . Ряд остатков должен удовлетворять ряду требований, а именно: равенство нулю математического ожидания, случайный характер отклонений от математического ожидания, отсутствие автокорреляции и неизменность дисперсии остатков при изменении факторной переменной, нормальный закон распределения. Рассмотрим способы проверки этих условий:
Проверка равенства математического ожидания уровней ряда остатков нулю осуществляется в ходе проверки соответствующей . С этой целью строится t-статистика
, (5.5)
где - среднее арифметическое значение уровней ряда остатков , - среднеквадратическое отклонение для этой последовательности, рассчитанное по формуле для малой выборки. На уровне значимости б гипотеза отклоняется, если , где - критерий распределения Стьюдента с доверительной вероятностью (1-б) и степенями свободы.
Для проверки условия случайности возникновения отдельных отклонений от тренда часто используется критерий поворотных точек. Значение случайной переменной считается поворотной точкой, если оно одновременно больше (или одновременно меньше) значений предыдущего и последующего члена. Если остатки случайны, то поворотная точка приходится в среднем примерно на каждые 1,5 наблюдения.
Существует определённая зависимость между средней арифметической , дисперсией количества поворотных точек в ряде остатков р и числом членов исходного ряда наблюдений n. С использованием этих зависимостей критерий случайности отклонений от тренда при с доверительной вероятностью 0,95 можно представить в виде:
, (5.6)
где квадратные скобки означают, что от результата вычисления в правой части необходимо взять целую часть (не путать с процедурой округления!).
Если неравенство (5.6) не выполняется, то ряд остатков нельзя назвать случайным (то есть он содержит регулярную компоненту) и, следовательно, модель не является адекватной.
Наличие (отсутствие) автокорреляции в отклонениях фактических значений от модели роста проще всего проверить с помощью критерия Дарбина-Уотсона. С этой целью строится статистика Дарбина-Уотсона (d - статистика), в основе которой лежит расчётная формула
. (5.7)
Для формулирования вывода о наличии (отсутствии) автокорреляции полученное значение необходимо сравнить с критическими значениями (нижнее) и (верхнее), которые определяются по специальным таблицам для трёх уровней значимости (=0,01; =0,025; =0,05). При сравнении могут возникнуть следующие ситуации: - остатки содержат автокорреляцию; - область неопределённости, когда нет оснований принять или отвергнуть гипотезу о существовании автокорреляции; - ряд остатков некоррелирован. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед входом в таблицу такие значения следует преобразовать по формуле .
Если установлено наличие автокорреляции остатков, нужно улучшить модель (изменить кривые роста, попытаться выделить дополнительные регулярные компоненты и т.п.). Если же ситуация оказалась неопределённой, применяют другие критерии. В частности можно воспользоваться первым коэффициентом автокорреляции:
. (5.8)
Для суждения о наличии или отсутствии автокорреляции с исследуемом ряду фактическое значение коэффициента автокорреляции (5.8) сопоставляется с табличным (критическим) для 5%-го или 1%-го уровня значимости (вероятность допустить ошибку при принятии гипотезы о независимости уровней ряда). Если , то гипотеза об отсутствии автокорреляции в ряду может быть принята. Когда же фактическое значение больше табличного, делают вывод о наличии автокорреляции во временном ряду.
Неизменность дисперсии остатков при изменении факторной переменной (исследование на гетероскедастичность) обычно проверяется с помощью трёх тестов, в которых делаются различные предположения о зависимости между дисперсией случайной компоненты и факторной переменной: тест ранговой корреляции Спирмена, тест Голдфельда-Квандта и тест Глейзера.
При малом объёме выборки для оценки гетероскедастичности может использоваться метод Голдфельда-Квандта. Для проведения такого теста необходимо выполнить следующие шаги:
- упорядочить n наблюдений по мере возрастания переменной x;
- разделить совокупность наблюдений на две группы (соответственно с малыми и большими значениями фактора x) и построить по каждой из групп уравнение регрессии
- определить остаточную сумму квадратов для первой регрессии и второй регрессии .
- вычислить отношения Fнабл = S2/S1 (или S1/S2). В числителе должна быть большая сумма квадратов. F распреде
- полученное отношение имеет сравнит с Fкр(, k1, k2), где k1 = n1 - m, k2 = n2 - m. Здесь n1 и n2 - количество наблюдений попавших в 1-ю и 2-ю группы. Если Fнабл > Fкр, то гетероскедастичность имеет место, то есть условие о неизменности дисперсии при изменении факторной переменной не выполняется.
Соответствие ряда остатков нормальному закону распределения проверим с помощью R/S - критерия:
. (5.9)
Полученное значение проверяется на предмет попадания в интервал, границы которого являются табличными значениями, и зависят от уровня доверия б и количества наблюдений n.
Если все четыре пункта проверки 1-5 дают положительный результат, делается вывод о том, что выбранная трендовая модель является адекватной реальному ряду наблюдений. Только в этом случае её можно использовать для построения прогнозных оценок. В противном случае модель нужно улучшать.
2.7 Оценка качества уравнения регрессии
Для общей оценки качества построенной эконометрической определяются такие характеристики как коэффициент детерминации, индекс корреляции, средняя относительная ошибка аппроксимации, а также проверяется значимость уравнения регрессии с помощью F-критерия Фишера. Перечисленные характеристики являются достаточно универсальными и могут применяться как для линейных, так и для нелинейных моделей, а также моделей с двумя и более факторными переменными. Определяющее значение при вычислении всех перечисленных характеристик качества играет ряд остатков еi, который вычисляется путем вычитания из фактических (полученных по наблюдениям) значений исследуемого признака yi значений, рассчитанных по уравнению модели yрi.
Коэффициент детерминации
(2.9)
показывает, какая доля изменения исследуемого признака учтена в модели. Другими словами коэффициент детерминации показывает, какая часть изменения исследуемой переменной может быть вычислена, исходя из изменений включённых в модель факторных переменных с помощью выбранного типа функции, связывающей факторные переменные и исследуемый признак в уравнении модели.
Коэффициент детерминации R2 может принимать значения от 0 до 1. Чем ближе коэффициент детерминации R2 к единице, тем лучше качество модели.
Индекс корреляции можно легко вычислить, зная коэффициент детерминации:
. (2.10)
Индекс корреляции R характеризует тесноту выбранного при построении модели типа связи между учтёнными в модели факторами и исследуемой переменной. В случае линейной парной регрессии его значение по абсолютной величине совпадает с коэффициентом парной корреляции r(x, y), который мы рассмотрели ранее, и характеризует тесноту линейной связи между x и y. Значения индекса корреляции, очевидно, также лежат в интервале от 0 до 1. Чем ближе величина R к единице, тем теснее выбранный вид функции связывает между собой факторные переменные и исследуемый признак, тем лучше качество модели.
Средняя относительная ошибка аппроксимации
(2.11)
выражается в процентах и характеризует точность модели. Приемлимая точность модели при решении практических задач может определяться, исходя из соображений экономической целесообразности с учётом конкретной ситуации. Широко применяется критерий, в соответствии с которым точность считается удовлетворительной, если средняя относительная погрешность меньше 15%. Если Eотн.ср. меньше 5%, то говорят, что модель имеет высокую точность. Не рекомендуется применять для анализа и прогноза модели с неудовлетворительной точностью, то есть, когда Eотн.ср. больше 15%.
F-критерий Фишера используется для оценки значимости уравнения регрессии. Расчётное значение F-критерия определяется из соотношения:
. (2.12)
Критическое значение F-критерия определяется по таблицам при заданном уровне значимости б и степенях свободы (можно использовать функцию FРАСПОБР в Excel). Здесь, по-прежнему, m - число факторов, учтённых в модели, n - количество наблюдений. Если расчётное значение больше критического, то уравнение модели признаётся значимым. Чем больше расчётное значение F-критерия, тем лучше качество модели.
Определим характеристики качества построенной нами линейной модели для Примера 1. Воспользуемся данными Таблицы 2. Коэффициент детерминации:
.
Следовательно, в рамках линейной модели изменение объёма продаж на 90,1% объясняется изменением температуры воздуха.
Индекс корреляции .
Значение индекса корреляции в случае парной линейной модели как мы видим, действительно по модулю равно коэффициенту корреляции между соответствующими переменными (объём продаж и температура). Поскольку полученное значение достаточно близко к единице, то можно сделать вывод о наличии тесной линейной связи между исследуемой переменной (объём продаж) и факторной переменноё (температура).
F-критерий Фишера
Критическое значение Fкр при б = 0,1; н1=1; н2=7-1-1=5 равно 4,06. Расчётное значение F-критерия больше табличного, следовательно, уравнение модели является значимым.
Средняя относительная ошибка аппроксимации
.
Построенная линейная модель парной регрессии имеет неудовлетворительную точность (>15%), и её не рекомендуется использовать для анализа и прогнозирования.
В итоге, несмотря на то, что большинство статистических характеристик удовлетворяют предъявляемым к ним критериям, линейная модель парной регрессии непригодна для прогнозирования объёма продаж в зависимости от температуры воздуха. Нелинейный характер зависимости между указанными переменными по данным наблюдений достаточно хорошо виден на Рис.1. Проведённый анализ это подтвердил.
2.8 Нелинейные модели парной регрессии
Если между исследуемыми и факторными переменными связь имеет нелинейный характер, то для построения модели необходимо использовать нелинейные функции.
Рассмотрим наиболее распространённые парные нелинейные модели.
Парабола второй степени определяет следующий вид модели:
. (2.13)
Параболическую модель целесообразно использовать, если связь меняет свой характер: прямая связь меняется на обратную или, наоборот, обратная связь меняется на прямую. Например, размер заработной платы работников физического труда в среднем растёт до некоторого возраста, а затем начинает убывать. Для определения параметров модели a, b, c модель (2.13) сводится путём замены переменных к линейной модели двухфакторной модели
(2.14)
Для оценки параметров модели вида (2.14), как будет показано далее, используется метод наименьших квадратов (МНК).
В основе гиперболической модели лежит уравнение гиперболы:
(2.15)
Классическим примером гиперболической модели является кривая Филипса, характеризующая нелинейное соотношение между нормой безработицы x и процентом прироста заработной платы y: при росте x до некоторого уровня y также растёт, а при дальнейшем росте x рост y приостанавливается. Этот же характер связи проявляется при изучении зависимости расходов на единицу продукции сырья, материалов, топлива (то есть переменных затрат) от объёма выпускаемой продукции. Другим примером гиперболической зависимости является зависимость времени оборота товаров в зависимости от величины товарооборота. Кривые Энгеля, описывающие долю доходов, расходуемых на непродовольственные товары, в зависимости от размера доходов также описываются гиперболическими функциями.
Сделав замену , мы сведём уравнение (2.15) к линейному виду:
эконометрический моделирование линейный регрессия
, (2.16)
для оценки параметров которого используется МНК.
Степенная модель
(2.17)
применяется для описания изменения спроса при изменении цены на товар. Параметр b в ней показывает, на сколько процентов уменьшится в среднем спрос, если цена увеличится на 1% (то есть b - отрицательная величина) и называется коэффициентом эластичности. Логарифмирование соотношения (2.17) приводит его к линейному виду:
(2.18)
Применение метода наименьших квадратов (с использованием прологарифмированных данных рядов наблюдений x и y) позволит нам найти коэффициенты уравнения (2.18) ln a и b, тем самым позволит найти параметры исходной степенной модели a и b.
В эконометрических исследованиях применяется также показательная модель:
. (2.19)
Она также сводится к линейному виду путём логарифмирования:
. (2.20)
После логарифмирования ряда фактических значений y и применения МНК получим значения ln a и ln b. Возводя основание логарифма (в данном случае число e) в степень с использованием полученных значений, мы получим оценки параметров а и b исходной показательной модели.
Необходимо отметить, что не все нелинейные модели можно свести к линейной. Если модель не сводится к линейной, то она называется внутренне нелинейной.
Построим показательную модель по данным Примера 1. Для этого построим таблицу, аналогичную Таблице 2, в качестве исходных данных которой будут выступать x1 и, z = ln y.
Таблица 3
x1 |
z |
x1i-x1cp |
zi - zср |
(x1i-x1ср)2 |
(x1i-x1ср)*(zi - zср) |
||
5,0 |
0,69 |
-15,00 |
-1,67 |
225,000 |
25,084 |
||
10,0 |
1,25 |
-10,00 |
-1,11 |
100,000 |
11,126 |
||
15,0 |
1,61 |
-5,00 |
-0,76 |
25,000 |
3,780 |
||
20,0 |
2,48 |
0,00 |
0,12 |
0,000 |
0,000 |
||
25,0 |
3,09 |
5,00 |
0,73 |
25,000 |
3,628 |
||
30,0 |
3,69 |
10,00 |
1,32 |
100,000 |
13,235 |
||
35,0 |
3,74 |
15,00 |
1,37 |
225,000 |
20,584 |
||
Сумма |
700,000 |
77,437 |
|||||
Среднее |
20,00 |
2,37 |
ln b |
0,111 |
ln a |
0,153 |
Тогда . Зная параметры степенной модели a и b, мы можем вычислить расчётные значения исследуемого признака по формуле (2.17) и составить ряд остатков.
Таблица 4
x1 |
5,0 |
10,0 |
15,0 |
20,0 |
25,0 |
30,0 |
35,0 |
|
y |
2,0 |
3,5 |
5,0 |
12,0 |
22,0 |
40,0 |
42,0 |
|
yр |
2,03 |
3,52 |
6,12 |
10,65 |
18,51 |
32,19 |
55,97 |
|
е |
-0,03 |
-0,02 |
-1,12 |
1,35 |
3,49 |
7,81 |
-13,97 |
Вычислим характеристики качества полученной показательной модели:
Характеристики качества показательной модели оказались лучше соответствующих характеристик линейной модели. Точность модели можно считать удовлетворительной.
Построив несколько моделей, выбрав из них лучшую, удовлетворяющую необходимым требованиям к качеству и точности модели, мы можем использовать эту модель для прогнозирования.
2.9 Прогнозирование с применением парного уравнения регрессии
Регрессионные модели могут использоваться для прогнозирования возможных ожидаемых значений исследуемой переменной при заданных (или определённых за рамками модели) значениях факторной переменной. При этом различают точечный и интервальный прогнозы.
Рассмотрим прогнозирование на основе парной линейной модели регрессии ,
Точечный прогноз вычисляем путём подстановки в уравнение прогнозного значения факторной переменной:
. (2.21)
Вероятность реализации точечного прогноза практически равна нулю. Поэтому в дополнение к точечному прогнозу рассчитывается средняя ошибка прогноза или доверительный интервал прогноза с достаточно большой надёжностью. Размах прогнозного интервала L зависит от стандартной ошибки (3.8), удаления xпрогн от своего среднего значения в ряде наблюдений xср, количества наблюдений n и уровня значимости прогноза б:
. (2.22)
Тогда фактические значения исследуемого признака с вероятностью (1-б) попадут в интервал
(2.23)
Чем больше количество наблюдений n и чем ближе прогнозное значение факторной переменной xпрогн к среднему в ряду наблюдений значению xср, тем меньше прогнозный интервал, то есть лучше качество прогнозирования. Качество самой эконометрической модели влияет на величину прогнозного интервала через стандартную ошибку, которая зависит от величин элементов ряда остатков еi. Чем хуже качество модели, тем больше величины остатков е, тем больше размах доверительного интервала. Наконец, на величину прогнозного интервала влияет задаваемый уровень значимости (вероятность ошибки). Чем меньше мы задаём уровень значимости, тем больше будет надёжность прогноза. Однако размах доверительного интервала при этом будет расти, поскольку величина t-статистики будет увеличиваться.
При определённых значениях размаха доверительного интервала прогноз теряет актуальность. Например, прогноз температуры воздуха на завтра с размером прогнозного интервала в 20-30 градусов никого не интересует.
Рассчитаем точечный и интервальный прогноз для объёма продаж в Примере 1 с использованием построенной нами в п. 2.4 линейной модели парной регрессии. Прогнозное значение факторной переменной x1прогн мы можем взять по данным Гидрометеоцентра, который, в свою очередь, делает прогноз на основе соответствующих математических моделей. Допустим прогнозное значение температуры воздуха x1прогн = 28 градусов. Тогда точечный прогноз по линейной модели: .
Для построения доверительного интервала используем стандартную ошибку, вычисленную нами в п. 2.5 и данные Таблицы 2. С учётом получим размах доверительного интервала:
.
Следовательно, ожидаемое значение объёма продаж с вероятностью 90% будет находиться в интервале: .
Прогнозный интервал получился достаточно большой, что и следовало ожидать исходя из неудовлетворительной точности линейной модели в данной задаче.
Прогнозирование на основе парных нелинейных моделей, которые заменой переменных сводятся к линейной модели, можно произвести, применив формулы (2.21)-(2.23) к линеаризованному виду нелинейной модели. Если исследуемая переменная не участвовала в заменах переменных, то полученный прогнозный интервал является конечным результатом прогнозирования. Если же мы произвели замену исследуемой переменной, то с помощью обратной замены мы должны будем вычислить прогнозный интервал для исходной исследуемой переменной.
Построим прогноз по данным нашего Примера 1 на основе построенной в п.2.7 парной показательной модели, у которой характеристики точности были выше, чем у линейной. В линеаризованном виде показательную модель можно записать в виде: .
Построим дополнительную вспомогательную таблицу:
Таблица 5
x1 |
5,0 |
10,0 |
15,0 |
20,0 |
25,0 |
30,0 |
35,0 |
|
z |
0,69 |
1,25 |
1,61 |
2,48 |
3,09 |
3,69 |
3,74 |
|
zр |
0,71 |
1,26 |
1,81 |
2,37 |
2,92 |
3,47 |
4,02 |
|
е |
-0,013 |
-0,006 |
-1,203 |
0,120 |
0,173 |
0,217 |
-0,287 |
Значение точечного прогноза для переменной z = ln y будет равно:
.
Для построения прогнозного интервала вычислим стандартную ошибку линеаризованной модели:
,
а с её использованием размах прогнозного интервала для z:
.
Таким образом, мы получаем прогнозный интервал:
.
Для определения прогнозного интервала исходной исследуемой переменной применим обратную замену:
.
В итоге получим прогнозный интервал для исходной исследуемой переменной с использованием показательной модели:
.
Длина интервала получилась меньше, чем длина прогнозного интервала, построенного с использованием линейной модели, чего и следовало ожидать, учитывая лучшие характеристики качества показательной модели по сравнению с линейной.
Однако, величина прогнозного интервала осталась достаточно большой, то есть прогноз остался достаточно грубым. Одним из способов улучшения качества модели, а значит, качества прогнозирования является введение в рассмотрение дополнительных факторных переменных, влияющих на исследуемый признак.
Тема 3. Модель множественной регрессии
3.1 Общий вид линейной модели множественной регрессии
Линейная модель множественной регрессии имеет вид:
, (3.1)
где - расчётные значения исследуемой переменной, - факторные переменные. Каждый из коэффициентов уравнения имеет следующую экономическую интерпретацию: он показывает, насколько изменится значение исследуемого признака при изменении соответствующего фактора на 1 при неизменных прочих факторных переменных.
Фактическое значение исследуемой переменной тогда представимо в виде:
(3.2)
Для адекватности модели необходимо, чтобы случайная величина е, являющаяся разностью между фактическими и расчётными значениями, имела нормальный закон распределения с математическим ожиданием равным нулю и постоянной дисперсией у2.
Имея n наборов данных наблюдений, с использованием представления (2.2), мы можем записать n уравнений вида:
, (3.3)
где - значения исследуемой и факторных переменных в i-м наблюдении, а еi - отклонение фактического значения yi от расчётного значения yрi, которое может быть рассчитано с помощью (2.1) по значениям факторных переменных в i-м наблюдении.
Систему уравнений (2.3) удобно исследовать в матричном виде:
, (3.4)
где Yв - вектор выборочных данных наблюдений исследуемой переменной (n элементов), Xв - матрица выборочных данных наблюдений факторных переменных (элементов), А - вектор параметров уравнения (m+1 элементов), а E - вектор случайных отклонений (n элементов):
(3.5)
3.2 Оценка параметров модели с помощью МНК. Отбор факторов
При построении модели множественной регрессии возникает необходимость оценки
(вычисления) коэффициентов линейной функции, которые в матричной форме записи обозначены вектором A. Формулу для вычисления параметров регрессионного уравнения методом наименьших квадратов (МНК) по данным наблюдений приведём без вывода:
. (3.6)
При m = 1 соотношение (3.6) принимает вид (2.5). Нахождение параметров с помощью соотношения (3.6) возможно лишь тогда, когда между различными столбцами и различными строками матрицы исходных данных X отсутствует строгая линейная зависимость (иначе не существует обратная матрица). Это условие не выполняется, если существует линейная или близкая к ней связь между результатами двух различных наблюдений, или же если такая связь существует между двумя различными факторными переменными. Линейная или близкая к ней связь между факторами называется мультиколлениарностью. Чтобы избавиться от мультиколлениарности, в модель включают один из линейно связанных между собой факторов, причём тот, который в большей степени связан с исследуемой переменной.
На практике чтобы избавиться от мультиколлениарности мы будем проверять для каждой пары факторных переменных выполнение следующих условий:
. (3.7)
То есть коэффициент корреляции между двумя факторными переменными должен быть меньше 0,8 и, одновременно, меньше коэффициентов корреляции между исследуемой переменной и каждой из этих двух факторных переменных. Если хотя бы одно из условий (3.7) не выполняется, то в модель включают только один из этих двух факторов, а именно, тот, у которого модуль коэффициента корреляции с Y больше.
Пример. Будем считать, что торговое предприятие из Примера 1 находится в г. Барнауле, x1 - температура воздуха в г. Барнауле. Дополним данные наблюдений значениями факторной переменной x3 - значениями температуры воздуха в г. Новосибирске в период наблюдений:
Таблица 6
y |
x1 |
x2 |
x3 |
|
2 |
5,0 |
20 |
4 |
|
3,5 |
10,0 |
20 |
8 |
|
5 |
15,0 |
20 |
14 |
|
12 |
20,0 |
20 |
21 |
|
22 |
25,0 |
20 |
23 |
|
40 |
30,0 |
25 |
30 |
|
42 |
35,0 |
50 |
32 |
Проверим наличие мультиколлениарности между факторными переменными, произведём отбор факторов и найдём параметры линейной модели множественной регрессии. Для нахождения коэффициентов парной корреляции можно воспользоваться формулой (2.1). Поскольку вычисления будут достаточно громоздкими, эффективнее использовать средства табличного процессора Microsoft Excel. Применив к данным из Таблицы 6 обработку Сервис/ Анализ данных/ Корреляция, получим набор коэффициентов парной корреляции:
y |
x1 |
x2 |
x3 |
||
y |
1 |
||||
x1 |
0,949 |
1 |
|||
x2 |
0,723 |
0,690 |
1 |
||
x3 |
0,938 |
0,992 |
0,630 |
1 |
Проверим выполнение условий (3.7) для каждой пары факторных переменных.
Для x1, x2:
- выполняется,
- выполняется,
- выполняется.
Все три условия (3.7) выполняются, значит мультиколлениарность между факторными переменными x1 (температура воздуха в г. Барнауле) и x2 (размер торговой наценки) отсутствует, то есть они могут использоваться в модели одновременно.
Для x1, x3:
- не выполняется,
- не выполняется,
- не выполняется.
Ни одно из условий не выполняется, следовательно, факторы x1 (температура воздуха в г. Барнауле) и x3 (температура воздуха в г. Новосибирске) мультиколлениарны, то есть не рекомендуется использовать их в модели одновременно. Поскольку , то фактор x1 теснее связан с исследуемой переменной y (объём продаж), чем фактор x3. Поэтому исключить из рассмотрения следует фактор x3.
Для x2, x3:
- выполняется,
- выполняется,
- выполняется.
Все три условия выполняются, значит мультиколлениарность между факторными переменными x2 и x3 отсутствует, и они могут использоваться в модели одновременно.
Можно резюмировать, что в модели можно оставить либо пару факторов x1, x2, либо пару x3, x2. То есть выбор необходимо сделать между факторами x1 и x3. Как уже отмечалось выше, фактор x1 имеет преимущество, поскольку теснее, чем x3, связан с y. Поэтому модель для объёма продаж y мы будем строить с учётом влияния факторов x1 и x2:
.
Для вычисления параметров модели по данным наблюдений выпишем вектор Yв и матрицу Xв:
Опуская операции транспонирования матрицы, перемножения матриц и нахождения обратной матрицы (можно воспользоваться в Excel функциями ТРАНСП, МУМНОЖ, МОБР), запишем промежуточный результат вычислений, необходимых для нахождения вектора параметров модели А по формуле (3.6):
.
Продолжая операции с матрицами в соответствии с (3.6), получим искомый вектор параметров модели:
.
То есть мы получили уравнение линейной регрессии следующего вида:
. (3.8)
Значения параметров модели указывают, что в среднем при увеличении температуры воздуха в г. Барнауле на 1 градус объём продаж на изучаемом предприятии увеличивается на 1,36 единицы, а при увеличении торговой наценки на 1% объём продаж увеличивается на 0,20 единицы. Последний вывод выглядит некорректно, поскольку в реальном процессе, наоборот, увеличение наценки сдерживает рост объёма продаж.
Определим по (3.8) расчётные значения исследуемой переменной для набора значений факторов, полученных в наблюдениях (Таблица 6), и составим ряд отклонений еi фактических значений объёма продаж от расчётных значений.
Таблица 7
y |
2 |
3,5 |
5 |
12 |
22 |
40 |
42 |
|
yр |
-3,30 |
3,49 |
10,29 |
17,09 |
23,88 |
31,66 |
43,39 |
|
е |
5,30 |
0,01 |
-5,29 |
-5,09 |
-1,88 |
8,34 |
-1,39 |
3.3 Анализ статистической значимости параметров модели
Значимость параметров модели множественной регрессии aj проверяется с помощью t-критерия Стьюдента аналогично тому, как мы проверяли значимость коэффициентов модели парной регрессии. Для каждого параметра уравнения вычисляется t-статистика:
. (3.9)
Здесь Sст - стандартная ошибка оценки, задаваемая соотношением (2.6), bjj - диагональный элемент матрицы .
Далее по таблицам (или в Excel с помощью функции СТЬЮДРАСПОБР) определяется значение tкр в зависимости от уровня значимости б и параметра n-m-1. Наконец, каждая из t-статистик (3.9) сравнивается с табличным значением. Если РtajР > tкр, то коэффициент aj считается значимым. В противном случае коэффициент не является значимым и его можно положить равным нулю, тем самым исключить из модели фактор xj (качество модели при этом не ухудшится).
Проверим значимость коэффициентов полученного нами уравнения регрессии (3.8). Вычислим стандартную ошибку оценки:
.
Тогда
.
Находим табличное значение . Для коэффициентов a0, a1 вычисленные t-статистики по модулю больше критического значения. Следовательно, с вероятностью 90% мы можем утверждать, что коэффициенты a0, a1 уравнения регрессии (3.8) являются значимыми.
,
следовательно, коэффициент a2 не является значимым, то есть его можно положить равным нулю, тем самым, исключив фактор x2 из рассмотрения.
3.4 Оценка качества линейной модели множественной регрессии
Качество модели оценивается стандартным способом для уравнений регрессии: по адекватности и точности на основе анализа остатков регрессии е.
Как и в случае парной линейной регрессии, коэффициент детерминации можно вычислить по формуле (2.9), индекс корреляции R (в случае линейной множественной регрессии он называется коэффициентом множественной регрессии) по формуле (2.10), среднюю относительную ошибку по формуле (2.11). Процедура проверка значимости уравнения регрессии в целом также производится аналогично случаю парной регрессии. Вычисляется F-критерий Фишера по формуле (2.12), затем определяется критическое значение и сравнивается с расчётным значением.
Произведём оценку качества модели (3.8) с использованием ряда остатков, приведённого в Таблице 6 и промежуточных результатов расчётов из Таблицы 2.
.
Исходя из полученного значения коэффициента детерминации, можно сказать, что в рамках линейной модели множественной регрессии изменение объёма продаж на 91% объясняется изменением температуры воздуха и торговой наценки.
.
Следовательно, связь между исследуемой переменной и используемым набором факторов тесная.
.
Критическое значение . Расчётное значение F-критерия больше критического, поэтому мы можем утверждать, что уравнение регрессии (3.8) является значимым.
Средняя относительная ошибка аппроксимации составила 63,73%, то есть точность модели следует признать неудовлетворительной и дальнейшее использованием модели признать нецелесообразным.
3.5 Оценка влияния отдельных факторов на исследуемую переменную
Важную роль при оценке влияния отдельных факторов играют коэффициенты регрессионной модели aj. Однако непосредственно с их помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разного масштаба колебаний (степени колеблемости) при использовании разных наборов результатов наблюдений.
Для устранения таких различий применяются частные коэффициенты эластичности:
, (3.10)
где - средние значения переменных в рядах наблюдений и бета - коэффициенты
, (3.11)
где - среднеквадратические отклонения переменных:
. (3.12)
Коэффициент эластичности показывает, на сколько процентов изменяется исследуемая переменная при изменении факторной переменной на 1 процент. Если коэффициент эластичности меньше 0, то при увеличении значения фактора исследуемая переменная уменьшается. Таким образом, коэффициенты эластичности можно сравнивать между собой по модулю для выяснения того, изменения какого фактора больше влияют на изменение исследуемой переменной. Однако коэффициент эластичности не учитывает степень колеблемости факторов.
Бета - коэффициент показывает, на какую часть величины среднеквадратического отклонения изменится переменная y с изменением соответствующей независимой переменной xj на величину своего среднеквадратического отклонения при фиксированном уровне значений остальных факторных переменных.
Указанные коэффициенты позволяют упорядочить факторы по степени их влияния на исследуемую переменную.
Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта - коэффициентов:
, (3.13)
где - коэффициент парной корреляции между фактором xj и исследуемой переменной y.
Рассчитаем значения коэффициентов эластичности, бета - и дельта - коэффициентов для уравнения регрессии (3.8), частично используя уже произведённые вычисления.
Таким образом, при увеличении температуры на 1% следует ожидать увеличения объёма продаж на 1,5%, а при увеличении торговой наценки на 1% ожидаемое увеличение объёма продаж составляет 0,27%.
Для определения бета - коэффициентов рассчитаем среднеквадратические отклонения:
Тогда
Значения бета - коэффициентов показывают, что при изменении x1 на одно своё среднеквадратическое отклонение значение y в среднем будет изменяться на 0,86 от своего среднеквадратического отклонения, а при изменении x2 на величину значение у в среднем изменится на .
Наконец дельта - коэффициенты:
.
Значения дельта - коэффициентов показывают, что доля влияния первого фактора составила 90%, а второго - 10%. Заметим, что сумма дельта - коэффициентов всегда равна 1. Этот факт можно использовать для проверки правильности произведённых вычислений.
3.6 Построение прогнозов на основе модели множественной линейной регрессии
Одной из важнейших целей построения эконометрической модели является прогнозирование поведения исследуемого процесса или объекта. Если в модели присутствует фактор времени, то прогнозирование подразумевает предсказание состояния системы в будущем. Если фактор времени в модели отсутствует, то прогнозирование величины исследуемой переменной (вычисление yпрогн) производится при некотором наборе (наборах) значений факторных переменных. Эти значения факторов (xпрогн1, xпрогн2, …, xпрогн m) должны быть заданы исследователем или вычислены с помощью других моделей.
Как и в случае парной регрессии вычисляются точечное и интервальное прогнозные значения исследуемой переменной.
Точечный прогноз осуществляется подстановкой прогнозного набора факторных переменных в уравнение регрессии:
. (3.14)
Если прогноз осуществляется не для одного набора факторных переменных, а для некоторого ряда наборов, то ряд точечных прогнозов исследуемой переменной можно представить в виде вектора, и вычислять его удобнее с использованием операций с матрицами:
, (3.15)
где
(3.16)
Интервальный прогноз в рамках модели множественной регрессии строится с использованием соотношений, являющихся обобщением формул (2.22), (2.23), позволяющих строить прогноз на основе парной регрессионной модели.
Для нахождения размаха доверительного интервала необходимо вычислить матрицу V:
. (3.17)
В выражении (3.17) участвуют матрица Xв, составленная из значений факторных переменных, имевших место в рядах наблюдений по правилу (3.5), и матрица Xпрогн, составленная из прогнозируемых значений факторных переменных по правилу (3.16). Размерность матрицы V равна , то есть зависит от числа прогнозируемых наборов факторных переменных. Если мы хотим рассчитать прогноз для одного набора факторных переменных, то получим матрицу V размером , то есть число. Размах прогнозного интервала для i-го набора факторных переменных равен:
. (3.18)
Величины вычисляются тем же образом, что и в (2.22), а является диагональным элементом матрицы (3.17). Тогда фактические значения исследуемой величины y для i-го набора значений факторных переменных с вероятностью (1-б) попадают в интервал:
Подобные документы
Методологические основы эконометрики. Проблемы построения эконометрических моделей. Цели эконометрического исследования. Основные этапы эконометрического моделирования. Эконометрические модели парной линейной регрессии и методы оценки их параметров.
контрольная работа [176,4 K], добавлен 17.10.2014Задачи эконометрики, ее математический аппарат. Взаимосвязь между экономическими переменными, примеры оценки линейности и аддитивности. Основные понятия и проблемы эконометрического моделирования. Определение коэффициентов линейной парной регрессии.
контрольная работа [79,3 K], добавлен 28.07.2013Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.
лабораторная работа [67,8 K], добавлен 26.12.2010Теоретические основы эконометрического анализа рождаемости в России. Эконометрика и эконометрическое моделирование. Парная регрессия и корреляция. Многомерный эконометрический анализ уровня рождаемости в России: с помощью множественной и парной регрессии.
курсовая работа [1,5 M], добавлен 25.03.2014Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.
курсовая работа [233,1 K], добавлен 21.03.2015Поля корреляции, характеризующие зависимость ВРП на душу населения от размера инвестиций в основной капитал. Оценка параметров уравнения парной линейной регрессии. Коэффициент множественной корреляции. Способы оценки параметров структурной модели.
контрольная работа [215,1 K], добавлен 22.11.2010Понятие о взаимосвязях в эконометрике. Сопоставление параллельных рядов. Корреляция альтернативных признаков. Оценка надежности параметров парной линейной регрессии и корреляции. Коэффициенты эластичности в парных моделях. Парная нелинейная корреляция.
курсовая работа [1,9 M], добавлен 29.06.2015Особенности расчета параметров уравнений линейной, степенной, полулогарифмической, обратной, гиперболической парной и экспоненциальной регрессии. Методика определения значимости уравнений регрессии. Идентификация и оценка параметров системы уравнений.
контрольная работа [200,1 K], добавлен 21.08.2010Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.
курсовая работа [243,1 K], добавлен 17.01.2016