Основы эконометрики
Изучение основных разделов эконометрики: парная и множественная регрессия и корелляция, системы эконометрических уравнений, временные ряды. По всем разделам представлены тесты и варианты контрольных работ, по 10 вариантам рассмотрены типовые задачи.
Рубрика | Экономико-математическое моделирование |
Вид | учебное пособие |
Язык | русский |
Дата добавления | 09.06.2009 |
Размер файла | 3,5 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Таблица 4.1
уравнение идентифицируемо |
||
уравнение неидентифицируемо |
||
уравнение сверхидентифицируемо |
Для оценки параметров структурной модели система должна быть идентифицируема или сверхидентифицируема.
Рассмотренное счетное правило отражает необходимое, но недостаточное условие идентификации. Более точно условия идентификации определяются, если накладывать ограничения на коэффициенты матриц параметров структурной модели. Уравнение идентифицируемо, если по отсутствующим в нем переменным (эндогенным и экзогенным) можно из коэффициентов при них в других уравнениях системы получить матрицу, определитель которой не равен нулю, а ранг матрицы не меньше, чем число эндогенных переменных в системе без одного.
Целесообразность проверки условия идентификации модели через определитель матрицы коэффициентов, отсутствующих в данном уравнении, но присутствующих в других, объясняется тем, что возможна ситуация, когда для каждого уравнения системы выполнено счетное правило, а определитель матрицы названных коэффициентов равен нулю. В этом случае соблюдается лишь необходимое, но недостаточное условие идентификации.
В эконометрических моделях часто наряду с уравнениями, параметры которых должны быть статистически оценены, используются балансовые тождества переменных, коэффициенты при которых равны . В этом случае, хотя само тождество и не требует проверки на идентификацию, ибо коэффициенты при переменных в тождестве известны, в проверке на идентификацию собственно структурных уравнений системы тождества участвуют.
Рассмотрим пример. Изучается модель вида
где - расходы на потребление в период , - совокупный доход в период , - инвестиции в период , - процентная ставка в период , - денежная масса в период , - государственные расходы в период , - расходы на потребление в период , инвестиции в период . Первое уравнение - функция потребления, второе уравнение - функция инвестиций, третье уравнение - функция денежного рынка, четвертое уравнение - тождество дохода.
Модель представляет собой систему одновременных уравнений. Проверим каждое ее уравнение на идентификацию.
Модель включает четыре эндогенные переменные и четыре предопределенные переменные (две экзогенные переменные - и и две лаговые переменные - и ).
Проверим необходимое условие идентификации для каждого из уравнений модели.
Первое уравнение: . Это уравнение содержит две эндогенные переменные и и одну предопределенную переменную . Таким образом, , а , т.е. выполняется условие . Уравнение сверхидентифицируемо.
Второе уравнение: . Оно включает две эндогенные переменные и и одну экзогенную переменную . Выполняется условие . Уравнение сверхидентифицируемо.
Третье уравнение: . Оно включает две эндогенные переменные и и одну экзогенную переменную . Выполняется условие . Уравнение сверхидентифицируемо.
Четвертое уравнение: . Оно представляет собой тождество, параметры которого известны. Необходимости в идентификации нет.
Проверим для каждого уравнения достаточное условие идентификации. Для этого составим матрицу коэффициентов при переменных модели.
I уравнение |
-1 |
0 |
0 |
0 |
0 |
0 |
|||
II уравнение |
0 |
-1 |
0 |
0 |
0 |
0 |
|||
III уравнение |
0 |
0 |
-1 |
0 |
0 |
0 |
|||
Тождество |
1 |
1 |
0 |
-1 |
0 |
0 |
0 |
1 |
В соответствии с достаточным условием идентификации ранг матрицы коэффициентов при переменных, не входящих в исследуемое уравнение, должен быть равен числу эндогенных переменных модели без одного.
Первое уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид
II уравнение |
-1 |
0 |
0 |
|||
III уравнение |
0 |
-1 |
0 |
0 |
||
Тождество |
1 |
0 |
0 |
0 |
1 |
Ранг данной матрицы равен трем, так как определитель квадратной подматрицы не равен нулю:
.
Достаточное условие идентификации для данного уравнения выполняется.
Второе уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид
I уравнение |
-1 |
0 |
0 |
|||
III уравнение |
0 |
0 |
0 |
|||
Тождество |
1 |
-1 |
0 |
0 |
1 |
Ранг данной матрицы равен трем, так как определитель квадратной подматрицы не равен нулю:
.
Достаточное условие идентификации для данного уравнения выполняется.
Третье уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид
I уравнение |
-1 |
0 |
0 |
0 |
||
II уравнение |
0 |
-1 |
0 |
0 |
||
Тождество |
1 |
1 |
0 |
0 |
1 |
Ранг данной матрицы равен трем, так как определитель квадратной подматрицы не равен нулю:
.
Достаточное условие идентификации для данного уравнения выполняется.
Таким образом, все уравнения модели сверхидентифицируемы. Приведенная форма модели в общем виде будет выглядеть следующим образом:
3.3 Методы оценки параметров структурной формы модели
Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений. Наибольшее распространение в литературе получили следующие методы оценивания коэффициентов структурной модели:
1) косвенный метод наименьших квадратов;
2) двухшаговый метод наименьших квадратов;
3) трехшаговый метод наименьших квадратов;
4) метод максимального правдоподобия с полной информацией;
5) метод максимального правдоподобия при ограниченной информации.
Рассмотрим вкратце сущность каждого из этих методов.
Косвенный метод наименьших квадратов (КМНК) применяется в случае точно идентифицируемой структурной модели. Процедура применения КМНК предполагает выполнение следующих этапов работы.
1. Структурная модель преобразовывается в приведенную форму модели.
2. Для каждого уравнения приведенной формы модели обычным МНК оцениваются приведенные коэффициенты .
3. Коэффициенты приведенной формы модели трансформируются в параметры структурной модели.
Если система сверхидентифицируема, то КМНК не используется, ибо он не дает однозначных оценок для параметров структурной модели. В этом случае могут использоваться разные методы оценивания, среди которых наиболее распространенным и простым является двухшаговый метод наименьших квадратов (ДМНК).
Основная идея ДМНК - на основе приведенной формы модели получить для сверхидентифицируемого уравнения теоретические значения эндогенных переменных, содержащихся в правой части уравнения.
Далее, подставив их вместо фактических значений, можно применить обычный МНК к структурной форме сверхидентифицируемого уравнения. Метод получил название двухшагового МНК, ибо дважды используется МНК: на первом шаге при определении приведенной формы модели и нахождении на ее основе оценок теоретических значений эндогенной переменной и на втором шаге применительно к структурному сверхидентифицируемому уравнению при определении структурных коэффициентов модели по данным теоретических (расчетных) значений эндогенных переменных.
Сверхидентифицируемая структурная модель может быть двух типов:
1) все уравнения системы сверхидентифицируемы;
2) система содержит наряду со сверхидентифицируемыми точно идентифицируемые уравнения.
Если все уравнения системы сверхидентифицируемые, то для оценки структурных коэффициентов каждого уравнения используется ДМНК. Если в системе есть точно идентифицируемые уравнения, то структурные коэффициенты по ним находятся из системы приведенных уравнений.
Для примера, рассмотренного в предыдущем параграфе, необходимо применить именно двухшаговый метод наименьших квадратов. Но можно сделать следующее замечание. Если из модели исключить тождество дохода, число эндогенных переменных модели снизится на единицу - переменная станет экзогенной. А число предопределенных переменных модели не изменится, т.к. из модели будет исключена эндогенная переменная , но ее место займет переменная . В правых частях функции потребления и функции денежного рынка будут находиться только предопределенные переменные. Функция инвестиций постулирует зависимость эндогенной переменной от эндогенной переменной (которая зависит только от предопределенных переменных) и предопределенной переменной . Таким образом, мы получим рекурсивную систему. Ее параметры можно оценивать обычным МНК, и нет необходимости исследования уравнения на идентификацию.
Косвенный и двухшаговый методы наименьших квадратов подробно описаны в литературе и рассматриваются как традиционные методы оценки коэффициентов структурной модели. Эти методы достаточно легко реализуемы.
Метод максимального правдоподобия рассматривается как наиболее общий метод оценивания, результаты которого при нормальном распределении признаков совпадают с МНК. Однако при большом числе уравнений системы этот метод приводит к достаточно сложным вычислительным процедурам. Поэтому в качестве модификации используется метод максимального правдоподобия при ограниченной информации (метод наименьшего дисперсионного отношения), разработанный в 1949 г. Т.Андерсоном и Н.Рубиным.
В отличие от метода максимального правдоподобия в данном методе сняты ограничения на параметры, связанные с функционированием системы в целом. Это делает решение более простым, но трудоемкость вычислений остается достаточно высокой. Несмотря на его значительную популярность, к середине 60-х годов он был практически вытеснен двухшаговым методом наименьших квадратов (ДМНК) в связи с гораздо большей простотой последнего.
Дальнейшим развитием ДМНК является трехшаговый МНК (ТМНК), предложенный в 1962 г. А.Зельнером и Г.Тейлом. Этот метод оценивания пригоден для всех видов уравнений структурной модели. Однако при некоторых ограничениях на параметры более эффективным оказывается ДМНК.
4. ВРЕМЕННЫЕ РЯДЫ
При построении эконометрической модели используются два типа данных:
1) данные, характеризующие совокупность различных объектов в определенный момент времени;
2) данные, характеризующие один объект за ряд последовательных моментов времени.
Модели, построенные по данным первого типа, называются пространственными моделями. Модели, построенные на основе второго типа данных, называются моделями временных рядов.
Временной ряд (ряд динамики) - это совокупность значений какого-либо показателя за несколько последовательных моментов или периодов времени. Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы:
1) факторы, формирующие тенденцию ряда;
2) факторы, формирующие циклические колебания ряда;
3) случайные факторы.
Рассмотрим воздействие каждого фактора на временной ряд в отдельности.
Большинство временных рядов экономических показателей имеют тенденцию, характеризующую совокупное долговременное воздействие множества факторов на динамику изучаемого показателя. Все эти факторы, взятые в отдельности, могут оказывать разнонаправленное воздействие на исследуемый показатель. Однако в совокупности они формируют его возрастающую или убывающую тенденцию. На рис. 4.1 показан гипотетический временной ряд, содержащий возрастающую тенденцию.
Рис. 4.1.
Также изучаемый показатель может быть подвержен циклическим колебаниям. Эти колебания могут носить сезонный характер, поскольку экономическая деятельность ряда отраслей экономики зависит от времени года (например, цены на сельскохозяйственную продукцию в летний период выше, чем в зимний; уровень безработицы в курортных городах в зимний период выше по сравнению с летним). При наличии больших массивов данных за длительные промежутки времени можно выявить циклические колебания, связанные с общей динамикой конъюнктуры рынка. На рис. 4.2 представлен гипотетический временной ряд, содержащий только сезонную компоненту.
Рис. 4.2.
Некоторые временные ряды не содержат тенденции и циклической компоненты, а каждый следующий их уровень образуется как сумма среднего уровня ряда и некоторой (положительной или отрицательной) случайной компоненты. Пример ряда, содержащего только случайную компоненту, приведен на рис. 4.3.
Рис. 4.3.
Очевидно, что реальные данные не следуют целиком и полностью из каких-либо описанных выше моделей. Чаще всего они содержат все три компоненты. Каждый их уровень формируется под воздействием тенденции, сезонных колебаний и случайной компоненты.
В большинстве случаев фактический уровень временного ряда можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной моделью временного ряда. Основная задача эконометрического исследования отдельного временного ряда - выявление и придание количественного выражения каждой из перечисленных выше компонент с тем, чтобы использовать полученную информацию для прогнозирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов.
4.1 Автокорреляция уровней временного ряда
При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда.
Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.
Формула для расчета коэффициента автокорреляции имеет вид:
(4.1)
где
Эту величину называют коэффициентом автокорреляции уровней ряда первого порядка, так как он измеряет зависимость между соседними уровнями ряда и .
Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями и и определяется по формуле:
(4.2)
где
Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило - максимальный лаг должен быть не больше .
Свойства коэффициента автокорреляции.
1. Он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Поэтому по коэффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, параболу второго порядка или экспоненту), коэффициент автокорреляции уровней исходного ряда может приближаться к нулю.
2. По знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных содержат положительную автокорреляцию уровней, однако при этом могут иметь убывающую тенденцию.
Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой.
Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, т.е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.
Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка , то ряд содержит циклические колебания с периодичностью в моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты и циклической (сезонной) компоненты.
Рассмотрим пример. Пусть имеются некоторые условные данные об общем количестве правонарушений на таможне одного из субъектов РФ (например, Республики Татарстан).
Таблица 4.1
Год |
Квартал |
Количество возбужденных дел, |
||
1999 |
I |
1 |
375 |
|
II |
2 |
371 |
||
III |
3 |
869 |
||
IV |
4 |
1015 |
||
2000 |
I |
5 |
357 |
|
II |
6 |
471 |
||
III |
7 |
992 |
||
IV |
8 |
1020 |
||
2001 |
I |
9 |
390 |
|
II |
10 |
355 |
||
III |
11 |
992 |
||
IV |
12 |
905 |
||
2002 |
I |
13 |
461 |
|
II |
14 |
454 |
||
III |
15 |
920 |
||
IV |
16 |
927 |
Построим поле корреляции:
Рис. 4.4.
Уже исходя из графика видно, что значения образуют пилообразную фигуру. Рассчитаем несколько последовательных коэффициентов автокорреляции. Для этого составляем первую вспомогательную таблицу.
Таблица 4.2
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
1 |
375 |
- |
- |
- |
- |
- |
- |
|
2 |
371 |
375 |
-328,33 |
-288,13 |
94601,72 |
107800,59 |
83018,90 |
|
3 |
869 |
371 |
169,67 |
-292,13 |
-49565,70 |
28787,91 |
85339,94 |
|
4 |
1015 |
869 |
315,67 |
205,87 |
64986,98 |
99647,55 |
42382,46 |
|
5 |
357 |
1015 |
-342,33 |
351,87 |
-120455,66 |
117189,83 |
123812,50 |
|
6 |
471 |
357 |
-228,33 |
-306,13 |
69898,66 |
52134,59 |
93715,58 |
|
7 |
992 |
471 |
292,67 |
-192,13 |
-56230,69 |
85655,73 |
36913,94 |
|
8 |
1020 |
992 |
320,67 |
328,87 |
105458,74 |
102829,25 |
108155,48 |
|
9 |
390 |
1020 |
-309,33 |
356,87 |
-110390,60 |
95685,05 |
127356,20 |
|
10 |
355 |
390 |
-344,33 |
-273,13 |
94046,85 |
118563,15 |
74600,00 |
|
11 |
992 |
355 |
292,67 |
-308,13 |
-90180,41 |
85655,73 |
94944,10 |
|
12 |
905 |
992 |
205,67 |
328,87 |
67638,69 |
42300,15 |
108155,48 |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
13 |
461 |
905 |
-238,33 |
241,87 |
-57644,88 |
56801,19 |
58501,10 |
|
14 |
454 |
461 |
-245,33 |
-202,13 |
49588,55 |
60186,81 |
40856,54 |
|
15 |
920 |
454 |
220,67 |
-209,13 |
-46148,72 |
48695,25 |
43735,36 |
|
16 |
927 |
920 |
227,67 |
256,87 |
58481,59 |
51833,63 |
65982,20 |
|
Сумма |
10499 |
9947 |
9,05 |
0,05 |
74085,16 |
1153766,39 |
1187469,73 |
|
Среднее значение |
699,33 |
663,13 |
- |
- |
- |
- |
- |
Следует заметить, что среднее значение получается путем деления не на 16, а на 15, т.к. у нас теперь на одно наблюдение меньше.
Теперь вычисляем коэффициент автокорреляции первого порядка по формуле (4.1):
.
Составляем вспомогательную таблицу для расчета коэффициента автокорреляции второго порядка.
Таблица 4.3
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
1 |
375 |
- |
- |
- |
- |
- |
- |
|
2 |
371 |
- |
- |
- |
- |
- |
- |
|
3 |
869 |
375 |
145,57 |
-269,79 |
-39273,33 |
21190,62 |
72786,64 |
|
4 |
1015 |
371 |
291,57 |
-273,79 |
-79828,95 |
85013,06 |
74960,96 |
|
5 |
357 |
869 |
-366,43 |
224,21 |
-82157,27 |
134270,94 |
50270,12 |
|
6 |
471 |
1015 |
-252,43 |
370,21 |
-93452,11 |
63720,90 |
137055,44 |
|
7 |
992 |
357 |
268,57 |
-287,79 |
-77291,76 |
72129,84 |
82823,08 |
|
8 |
1020 |
471 |
296,57 |
-173,79 |
-51540,90 |
87953,76 |
30202,96 |
|
9 |
390 |
992 |
-333,43 |
347,21 |
-115770,23 |
111175,56 |
120554,78 |
|
10 |
355 |
1020 |
-368,43 |
375,21 |
-138238,62 |
135740,66 |
140782,54 |
|
11 |
992 |
390 |
268,57 |
-254,79 |
-68428,95 |
72129,84 |
64917,94 |
|
12 |
905 |
355 |
181,57 |
-289,79 |
-52617,17 |
32967,66 |
83978,24 |
|
13 |
461 |
992 |
-262,43 |
347,21 |
-91118,32 |
68869,50 |
120554,78 |
|
14 |
454 |
905 |
-269,43 |
260,21 |
-70108,38 |
72592,52 |
67709,24 |
|
15 |
920 |
461 |
196,57 |
-183,79 |
-36127,60 |
38639,76 |
33778,76 |
|
16 |
927 |
454 |
203,57 |
-190,79 |
-38839,12 |
41440,74 |
36400,82 |
|
Сумма |
10128 |
9027 |
-0,02 |
-0,06 |
-1034792,71 |
1037835,43 |
1116776,36 |
|
Среднее значение |
723,43 |
644,79 |
- |
- |
- |
- |
- |
Следовательно
Аналогично находим коэффициенты автокорреляции более высоких порядков, а все полученные значения заносим в сводную таблицу.
Таблица 4.4
Лаг |
Коэффициент автокорреляции уровней |
|
1 |
0,063294 |
|
2 |
-0,961183 |
|
3 |
-0,036290 |
|
4 |
0,964735 |
|
5 |
0,050594 |
|
6 |
-0,976516 |
|
7 |
-0,069444 |
|
8 |
0,964629 |
|
9 |
0,162064 |
|
10 |
-0,972918 |
|
11 |
-0,065323 |
|
12 |
0,985761 |
Коррелограмма:
Рис. 4.5.
Анализ коррелограммы и графика исходных уровней временного ряда позволяет сделать вывод о наличии в изучаемом временном ряде сезонных колебаний периодичностью в четыре квартала.
4. 2 Моделирование тенденции временного ряда
Распространенным способом моделирования тенденции временного ряда является построение аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим выравниванием временного ряда.
Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные виды функций. Для построения трендов чаще всего применяются следующие функции:
линейный тренд: ;
гипербола: ;
экспоненциальный тренд: (или );
степенная функция: ;
полиномы различных степеней: .
Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время , а в качестве зависимой переменной - фактические уровни временного ряда . Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.
Существует несколько способов определения типа тенденции. К числу наиболее распространенных способов относятся качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени. В этих же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип тенденции можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни и тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов.
Выбор наилучшего уравнения в случае, когда ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации и средней ошибки аппроксимации. Этот метод легко реализуется при компьютерной обработке данных.
4.3 Моделирование сезонных колебаний
Простейший подход к моделированию сезонных колебаний - это расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда.
Общий вид аддитивной модели следующий:
. (4.3)
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой (), сезонной () и случайной () компонент.
Общий вид мультипликативной модели выглядит так:
. (4.4)
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой (), сезонной () и случайной () компонент.
Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.
Построение аддитивной и мультипликативной моделей сводится к расчету значений , и для каждого уровня ряда.
Процесс построения модели включает в себя следующие шаги.
1) Выравнивание исходного ряда методом скользящей средней.
2) Расчет значений сезонной компоненты .
3) Устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных () в аддитивной или () в мультипликативной модели.
4) Аналитическое выравнивание уровней () или () и расчет значений с использованием полученного уравнения тренда.
5) Расчет полученных по модели значений () или ().
6) Расчет абсолютных и/или относительных ошибок. Если полученные значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок для анализа взаимосвязи исходного ряда и других временных рядов.
Методику построения каждой из моделей рассмотрим на примерах.
Пример. Построение аддитивной модели временного ряда. Обратимся к данным об объеме правонарушений на таможне за четыре года, представленным в табл. 4.1.
Было показано, что данный временной ряд содержит сезонные колебания периодичностью 4, т.к. количество правонарушений в первый-второй кварталы ниже, чем в третий-четвертый. Рассчитаем компоненты аддитивной модели временного ряда.
Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:
1.1. Просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и определим условные годовые объемы потребления электроэнергии (гр. 3 табл. 4.5).
1.2. Разделив полученные суммы на 4, найдем скользящие средние (гр. 4 табл. 4.5). Полученные таким образом выровненные значения уже не содержат сезонной компоненты.
1.3. Приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних - центрированные скользящие средние (гр. 5 табл. 4.5).
Таблица 4.5
№ квартала, |
Количество правонарушений, |
Итого за четыре квартала |
Скользящая средняя за четыре квартала |
Центрированная скользящая средняя |
Оценка сезонной компоненты |
|
1 |
2 |
3 |
4 |
5 |
6 |
|
1 |
375 |
- |
- |
- |
- |
|
2 |
371 |
2630 |
657,5 |
- |
- |
|
3 |
869 |
2612 |
653 |
655,25 |
213,75 |
|
4 |
1015 |
2712 |
678 |
665,5 |
349,5 |
|
5 |
357 |
2835 |
708,75 |
693,75 |
-336,75 |
|
6 |
471 |
2840 |
710 |
709,375 |
-238,375 |
|
7 |
992 |
2873 |
718,25 |
714,125 |
277,875 |
|
8 |
1020 |
2757 |
689,25 |
703,75 |
316,25 |
|
9 |
390 |
2757 |
689,25 |
689,25 |
-299,25 |
|
10 |
355 |
2642 |
660,5 |
674,875 |
-319,875 |
|
11 |
992 |
2713 |
678,25 |
669,375 |
322,625 |
|
12 |
905 |
2812 |
703 |
690,625 |
214,375 |
|
13 |
461 |
2740 |
685 |
694 |
-233 |
|
14 |
454 |
2762 |
690,5 |
687,75 |
-233,75 |
|
15 |
920 |
- |
- |
- |
- |
|
16 |
927 |
- |
- |
- |
- |
Шаг 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими средними (гр. 6 табл. 4.5). Используем эти оценки для расчета значений сезонной компоненты (табл. 4.6). Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты . В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна нулю.
Таблица 4.6
Показатели |
Год |
№ квартала, |
||||
I |
II |
III |
IV |
|||
1999 |
- |
- |
213,75 |
349,5 |
||
2000 |
-336,75 |
-238,375 |
277,875 |
316,25 |
||
2001 |
-299,25 |
-319,875 |
322,625 |
214,375 |
||
2002 |
-233 |
-233,75 |
- |
- |
||
Всего за -й квартал |
-869 |
-792 |
814,25 |
880,125 |
||
Средняя оценка сезонной компоненты для -го квартала, |
-289,667 |
-264 |
271,417 |
293,375 |
||
Скорректированная сезонная компонента, |
-292,448 |
-266,781 |
268,636 |
290,593 |
Для данной модели имеем:
.
Корректирующий коэффициент: .
Рассчитываем скорректированные значения сезонной компоненты () и заносим полученные данные в таблицу 4.6.
Проверим равенство нулю суммы значений сезонной компоненты:
.
Шаг 3. Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины (гр. 4 табл. 4.7). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.
Таблица 4.7
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
1 |
375 |
-292,448 |
667,448 |
672,700 |
380,252 |
-5,252 |
27,584 |
|
2 |
371 |
-266,781 |
637,781 |
673,624 |
406,843 |
-35,843 |
1284,721 |
|
3 |
869 |
268,636 |
600,364 |
674,547 |
943,183 |
-74,183 |
5503,117 |
|
4 |
1015 |
290,593 |
724,407 |
675,470 |
966,063 |
48,937 |
2394,830 |
|
5 |
357 |
-292,448 |
649,448 |
676,394 |
383,946 |
-26,946 |
726,087 |
|
6 |
471 |
-266,781 |
737,781 |
677,317 |
410,536 |
60,464 |
3655,895 |
|
7 |
992 |
268,636 |
723,364 |
678,240 |
946,876 |
45,124 |
2036,175 |
|
8 |
1020 |
290,593 |
729,407 |
679,163 |
969,756 |
50,244 |
2524,460 |
|
9 |
390 |
-292,448 |
682,448 |
680,087 |
387,639 |
2,361 |
5,574 |
|
10 |
355 |
-266,781 |
621,781 |
681,010 |
414,229 |
-59,229 |
3508,074 |
|
11 |
992 |
268,636 |
723,364 |
681,933 |
950,569 |
41,431 |
1716,528 |
|
12 |
905 |
290,593 |
614,407 |
682,857 |
973,450 |
-68,450 |
4685,403 |
|
13 |
461 |
-292,448 |
753,448 |
683,780 |
391,332 |
69,668 |
4853,630 |
|
14 |
454 |
-266,781 |
720,781 |
684,703 |
417,922 |
36,078 |
1301,622 |
|
15 |
920 |
268,636 |
651,364 |
685,627 |
954,263 |
-34,263 |
1173,953 |
|
16 |
927 |
290,593 |
636,407 |
686,550 |
977,143 |
-50,143 |
2514,320 |
Шаг 4. Определим компоненту данной модели. Для этого проведем аналитическое выравнивание ряда () с помощью линейного тренда. Результаты аналитического выравнивания следующие:
.
Подставляя в это уравнение значения , найдем уровни для каждого момента времени (гр. 5 табл. 4.7).
Шаг 5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням значения сезонной компоненты для соответствующих кварталов (гр. 6 табл. 4.7).
На одном графике отложим фактические значения уровней временного ряда и теоретические, полученные по аддитивной модели.
Рис. 4.6.
Для оценки качества построенной модели применим сумму квадратов полученных абсолютных ошибок.
.
Следовательно, можно сказать, что аддитивная модель объясняет 97% общей вариации уровней временного ряда количества правонарушений по кварталам за 4 года.
Шаг 6. Прогнозирование по аддитивной модели. Предположим, что по нашему примеру необходимо дать прогноз об общем объеме правонарушений на I и II кварталы 2003 года. Прогнозное значение уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда
.
Получим
;
.
Значения сезонных компонент за соответствующие кварталы равны: и . Таким образом,
;
.
Т.е. в первые два квартала 2003 г. следовало ожидать порядка 395 и 422 правонарушений соответственно.
Построение мультипликативной модели рассмотрим на данных предыдущего примера.
Шаг 1. Методика, применяемая на этом шаге, полностью совпадает с методикой построения аддитивной модели.
Таблица 4.8
№ квартала, |
Количество правонарушений, |
Итого за четыре квартала |
Скользящая средняя за четыре квартала |
Центрированная скользящая средняя |
Оценка сезонной компоненты |
|
1 |
2 |
3 |
4 |
5 |
6 |
|
1 |
375 |
- |
- |
- |
- |
|
2 |
371 |
2630 |
657,5 |
- |
- |
|
3 |
869 |
2612 |
653 |
655,25 |
1,3262 |
|
4 |
1015 |
2712 |
678 |
665,5 |
1,5252 |
|
5 |
357 |
2835 |
708,75 |
693,75 |
0,5146 |
|
6 |
471 |
2840 |
710 |
709,375 |
0,6640 |
|
7 |
992 |
2873 |
718,25 |
714,125 |
1,3891 |
|
8 |
1020 |
2757 |
689,25 |
703,75 |
1,4494 |
|
9 |
390 |
2757 |
689,25 |
689,25 |
0,5658 |
|
10 |
355 |
2642 |
660,5 |
674,875 |
0,5260 |
|
11 |
992 |
2713 |
678,25 |
669,375 |
1,4820 |
|
12 |
905 |
2812 |
703 |
690,625 |
1,3104 |
|
13 |
461 |
2740 |
685 |
694 |
0,6643 |
|
14 |
454 |
2762 |
690,5 |
687,75 |
0,6601 |
|
15 |
920 |
- |
- |
- |
- |
|
16 |
927 |
- |
- |
- |
- |
Шаг 2. Найдем оценки сезонной компоненты как частное от деления фактических уровней ряда на центрированные скользящие средние (гр. 6 табл. 4.8). Эти оценки используются для расчета сезонной компоненты (табл. 4.9). Для этого найдем средние за каждый квартал оценки сезонной компоненты . Так же как и в аддитивной модели считается, что сезонные воздействия за период взаимопогашаются. В мультипликативной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна числу периодов в цикле. В нашем случае число периодов одного цикла равно 4.
Таблица 4.9
Показатели |
Год |
№ квартала, |
||||
I |
II |
III |
IV |
|||
1999 |
- |
- |
1,3262 |
1,5252 |
||
2000 |
0,5146 |
0,6640 |
1,3891 |
1,4494 |
||
2001 |
0,5658 |
0,5260 |
1,4820 |
1,3104 |
||
2002 |
0,6643 |
0,6601 |
- |
- |
||
Всего за -й квартал |
1,7447 |
1,8501 |
4,1973 |
4,2850 |
||
Средняя оценка сезонной компоненты для -го квартала, |
0,5816 |
0,6167 |
1,3991 |
1,4283 |
||
Скорректированная сезонная компонента, |
0,5779 |
0,6128 |
1,3901 |
1,4192 |
Имеем
.
Определяем корректирующий коэффициент:
.
Скорректированные значения сезонной компоненты получаются при умножении ее средней оценки на корректирующий коэффициент .
Проверяем условие равенство 4 суммы значений сезонной компоненты:
.
Шаг 3. Разделим каждый уровень исходного ряда на соответствующие значения сезонной компоненты. В результате получим величины (гр. 4 табл. 4.10), которые содержат только тенденцию и случайную компоненту.
Таблица 4.10
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
1 |
375 |
0,5779 |
648,9012 |
654,9173 |
378,4767 |
0,9908 |
|
2 |
371 |
0,6128 |
605,4178 |
658,1982 |
403,3439 |
0,9198 |
|
3 |
869 |
1,3901 |
625,1349 |
661,4791 |
919,5221 |
0,9451 |
|
4 |
1015 |
1,4192 |
715,1917 |
664,7600 |
943,4274 |
1,0759 |
|
5 |
357 |
0,5779 |
617,7539 |
668,0409 |
386,0608 |
0,9247 |
|
6 |
471 |
0,6128 |
768,6031 |
671,3218 |
411,3860 |
1,1449 |
|
7 |
992 |
1,3901 |
713,6177 |
674,6027 |
937,7652 |
1,0578 |
|
8 |
1020 |
1,4192 |
718,7148 |
677,8836 |
962,0524 |
1,0602 |
|
9 |
390 |
0,5779 |
674,8572 |
681,1645 |
393,6450 |
0,9907 |
|
10 |
355 |
0,6128 |
579,3081 |
684,4454 |
419,4281 |
0,8464 |
|
11 |
992 |
1,3901 |
713,6177 |
687,7263 |
956,0083 |
1,0377 |
|
12 |
905 |
1,4192 |
637,6832 |
691,0072 |
980,6774 |
0,9228 |
|
13 |
461 |
0,5779 |
797,7159 |
694,2881 |
401,2291 |
1,1490 |
|
14 |
454 |
0,6128 |
740,8616 |
697,5690 |
427,4703 |
1,0621 |
|
15 |
920 |
1,3901 |
661,8229 |
700,8499 |
974,2515 |
0,9443 |
|
16 |
927 |
1,4192 |
653,1849 |
704,1308 |
999,3024 |
0,9277 |
Шаг 4. Определим компоненту в мультипликативной модели. Для этого рассчитаем параметры линейного тренда, используя уровни . В результате получим уравнение тренда:
.
Подставляя в это уравнение значения , найдем уровни для каждого момента времени (гр. 5 табл. 4.10).
Шаг 5. Найдем уровни ряда, умножив значения на соответствующие значения сезонной компоненты (гр. 6 табл. 4.10). На одном графике откладываем фактические значения уровней временного ряда и теоретические, полученные по мультипликативной модели.
Рис. 4.7.
Расчет ошибки в мультипликативной модели производится по формуле:
.
Для сравнения мультипликативной модели и других моделей временного ряда можно, по аналогии с аддитивной моделью, использовать сумму квадратов абсолютных ошибок :
.
Сравнивая показатели детерминации аддитивной и мультипликативной моделей, делаем вывод, что они примерно одинаково аппроксимируют исходные данные.
Шаг 6. Прогнозирование по мультипликативной модели. Если предположить, что по нашему примеру необходимо дать прогноз об общем объеме правонарушений на I и II кварталы 2003 года, прогнозное значение уровня временного ряда в мультипликативной модели есть произведение трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда
.
Получим
;
.
Значения сезонных компонент за соответствующие кварталы равны: и . Таким образом
;
.
Т.е. в первые два квартала 2003 г. следовало ожидать порядка 409 и 436 правонарушений соответственно.
Таким образом, аддитивная и мультипликативная модели дают примерно одинаковый результат по прогнозу.
4.4 Автокорреляция в остатках. Критерий Дарбина-Уотсона
Автокорреляция в остатках может быть вызвана несколькими причинами, имеющими различную природу.
1. Она может быть связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака.
2. В ряде случаев автокорреляция может быть следствием неправильной спецификации модели. Модель может не включать фактор, который оказывает существенное воздействие на результат и влияние которого отражается в остатках, вследствие чего последние могут оказаться автокоррелированными. Очень часто этим фактором является фактор времени .
От истинной автокорреляции остатков следует отличать ситуации, когда причина автокорреляции заключается в неправильной спецификации функциональной формы модели. В этом случае следует изменить форму модели, а не использовать специальные методы расчета параметров уравнения регрессии при наличии автокорреляции в остатках.
Один из более распространенных методов определения автокорреляции в остатках - это расчет критерия Дарбина-Уотсона:
. (4.5)
Т.е. величина есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии.
Можно показать, что при больших значениях существует следующее соотношение между критерием Дарбина-Уотсона и коэффициентом автокорреляции остатков первого порядка :
. (4.6)
Таким образом, если в остатках существует полная положительная автокорреляция и , то . Если в остатках полная отрицательная автокорреляция, то и, следовательно, . Если автокорреляция остатков отсутствует, то и . Т.е. .
Алгоритм выявления автокорреляции остатков на основе критерия Дарбина-Уотсона следующий. Выдвигается гипотеза об отсутствии автокорреляции остатков. Альтернативные гипотезы и состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках. Далее по специальным таблицам (см. приложение E) определяются критические значения критерия Дарбина-Уотсона и для заданного числа наблюдений , числа независимых переменных модели и уровня значимости . По этим значениям числовой промежуток разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью осуществляется следующим образом:
- есть положительная автокорреляция остатков, отклоняется, с вероятностью принимается ;
- зона неопределенности;
- нет оснований отклонять , т.е. автокорреляция остатков отсутствует;
- зона неопределенности;
- есть отрицательная автокорреляция остатков, отклоняется, с вероятностью принимается .
Если фактическое значение критерия Дарбина-Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу .
Пример. Проверим гипотезу о наличии автокорреляции в остатках для аддитивной модели нашего временного ряда. Исходные данные и промежуточные расчеты заносим в таблицу:
Таблица 4.11
1 |
2 |
3 |
4 |
5 |
6 |
|
1 |
375 |
-5,252 |
- |
- |
27,584 |
|
2 |
371 |
-35,843 |
-5,252 |
935,8093 |
1284,7 |
|
3 |
869 |
-74,183 |
-35,843 |
1469,956 |
5503,1 |
|
4 |
1015 |
48,937 |
-74,183 |
15158,53 |
2394,8 |
|
5 |
357 |
-26,946 |
48,937 |
5758,23 |
726,09 |
|
6 |
471 |
60,464 |
-26,946 |
7640,508 |
3655,9 |
|
7 |
992 |
45,124 |
60,464 |
235,3156 |
2036,2 |
|
8 |
1020 |
50,244 |
45,124 |
26,2144 |
2524,5 |
|
9 |
390 |
2,361 |
50,244 |
2292,782 |
5,574 |
|
10 |
355 |
-59,229 |
2,361 |
3793,328 |
3508,1 |
|
11 |
992 |
41,431 |
-59,229 |
10132,44 |
1716,5 |
|
12 |
905 |
-68,450 |
41,431 |
12073,83 |
4685,4 |
|
13 |
461 |
69,668 |
-68,45 |
19076,58 |
4853,6 |
|
14 |
454 |
36,078 |
69,668 |
1128,288 |
1301,6 |
|
15 |
920 |
-34,263 |
36,078 |
4947,856 |
1174 |
|
16 |
927 |
-50,143 |
-34,263 |
252,1744 |
2514,3 |
|
Сумма |
-0,002 |
50,141 |
84921,85 |
37911,97 |
Фактическое значение критерия Дарбина-Уотсона для данной модели составляет:
.
Сформулируем гипотезы: - в остатках нет автокорреляции; - в остатках есть положительная автокорреляция; - в остатках есть отрицательная автокорреляция. Зададим уровень значимости . По таблице значений критерия Дарбина-Уотсона определим для числа наблюдений и числа независимых параметров модели (мы рассматриваем только зависимость от времени ) критические значения и . Фактическое значение -критерия Дарбина-Уотсона попадает в интервал (1,37<2,24<2,63). Следовательно, нет основания отклонять гипотезу об отсутствии автокорреляции в остатках.
Существует несколько ограничений на применение критерия Дарбина-Уотсона.
1. Он неприменим к моделям, включающим в качестве независимых переменных лаговые значения результативного признака.
2. Методика расчета и использования критерия Дарбина-Уотсона направлена только на выявление автокорреляции остатков первого порядка.
3. Критерий Дарбина-Уотсона дает достоверные результаты только для больших выборок.
Приложение A За основу приложения А взят учебник [4].
Случайные переменные. Дискретная случайная переменная
Ваше интуитивное понимание вероятности почти наверняка соответствует задачам этой книги, и поэтому мы опустим традиционный раздел чистой теории вероятностей, хотя он мог бы быть весьма увлекательным. Многие люди непосредственно сталкивались с вероятностями, участвуя в лотереях и азартных играх, и их заинтересованность в том, чем они занимались, часто приводила к удивительно высокой практической компетентности, обычно при полном отсутствии формальной подготовки.
Мы начнем непосредственно с дискретных случайных переменных. Случайная переменная - это любая переменная, значение которой не может быть точно предсказано. Дискретной называется случайная величина, имеющая определенный набор возможных значений. Пример - сумма выпавших очков при бросании двух игральных костей. Пример случайной величины, не являющейся дискретной, - температура в комнате. Она может принять любое из непрерывного диапазона значений и является примером непрерывной случайной величины. К рассмотрению таких величин в этом приложении мы перейдем позже.
Продолжая разговор о примере с двумя игральными костями, предположим, что одна из них зеленая, а другая - красная. Если их бросить, то возможны 36 элементарных исходов эксперимента, поскольку на зеленой кости может выпасть любое число от 1 до 6 и то же самое - на красной. Случайная переменная, определенная как их сумма, которую мы обозначим через , может принимать только одно из 11 числовых значений -- от 2 до 12. Взаимосвязь между исходами эксперимента и значениями случайной величины в данном случае показана в табл. A.1.
Таблица A.1
Красная |
Зеленая |
||||||
1 |
2 |
3 |
4 |
5 |
6 |
||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
5 |
6 |
7 |
8 |
9 |
10 |
11 |
|
6 |
7 |
8 |
9 |
10 |
11 |
12 |
Предположив, что кости «правильные», мы можем воспользоваться табл. A.1 для определения вероятности каждого значения . Поскольку на костях имеется 36 различных комбинаций, каждый исход имеет вероятность 1/36. Лишь одна из возможных комбинаций {зеленая=1, красная=1} дает сумму, равную 2, так что вероятность равна 1/36. Чтобы получить сумму , нам потребуются сочетания {зеленая=1, красная=6}, либо {зеленая=2, красная=5}, либо {зеленая=3, красная=4}, либо {зеленая=4, красная=3}, либо {зеленая=5, красная=2}, либо {зеленая=6, красная=1}. В данном случае нас устроят 6 возможных исходов, и поэтому вероятность получения 7 равна 6/36. Все эти вероятности приведены в табл. A.2. Если все их сложить, то получится ровно 1. Это будет так, поскольку с вероятностью 100% рассматриваемая сумма примет одно из значений от 2 до 12.
Таблица A.2
Значения |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
Вероятность |
1/36 |
2/36 |
3/36 |
4/36 |
5/36 |
6/36 |
5/36 |
4/36 |
3/36 |
2/36 |
1/36 |
Совокупность всех возможных значений случайной переменной описывается генеральной совокупностью, из которой извлекаются эти значения. В нашем случае генеральная совокупность - это набор чисел от 2 до 12.
Математическое ожидание дискретной случайной величины
Математическое ожидание дискретной случайной величины - это взвешенное среднее всех ее возможных значений, причем в качестве весового коэффициента берется вероятность соответствующего исхода. Вы можете рассчитать его, перемножив все возможные значения случайной величины на их вероятности и просуммировав полученные произведения. Математически если случайная величина обозначена как , то ее математическое ожидание обозначается как или .
Предположим, что может принимать конкретных значений и что вероятность получения равна . Тогда
. (A.1)
В случае с двумя костями величинами от до были числа от 2 до 12. Математическое ожидание рассчитывается так:
.
Прежде чем пойти дальше, рассмотрим еще более простой пример случайной переменной - число очков, выпадающее при бросании лишь одной игральной кости.
В данном случае возможны шесть исходов: , , …, . Каждый исход имеет вероятность 1/6, поэтому здесь
. (A.2)
В данном случае математическим ожиданием случайной переменной является число, которое само по себе не может быть получено при бросании кости.
Математическое ожидание случайной величины часто называют ее средним по генеральной совокупности. Для случайной величины это значение часто обозначается как .
Математические ожидания функций дискретных случайных переменных
Пусть - некоторая функция от . Тогда - математическое ожидание записывается как
, (A.3)
где суммирование производится по всем возможным значениям . В табл. A.3 показана последовательность практического расчета математического ожидания функции от .
Таблица A.3
Вероятность |
Функция от |
Функция, взвешенная по вероятности |
||
1 |
2 |
3 |
4 |
|
… |
… |
… |
… |
|
Всего |
Предположим, что может принимать различных значений от до с соответствующими вероятностями от до . В первой колонке записываются все возможные значения . Во второй - записываются соответствующие вероятности. В третьей колонке рассчитываются значения функции для соответствующих величин . В четвертой колонке перемножаются числа из колонок 2 и 3. Ответ приводится в суммирующей строке колонки 4.
Рассчитаем математическое ожидание величины . Для этого рассмотрим пример с числами, выпадающими при бросании одной кости. Использовав схему, приведенную в табл. A.3, заполним табл. A.4.
Таблица A.4
1 |
2 |
3 |
4 |
|
1 |
1/6 |
1 |
0,167 |
|
2 |
1/6 |
4 |
0,667 |
|
3 |
1/6 |
9 |
1,500 |
|
4 |
1/6 |
16 |
2,667 |
|
5 |
1/6 |
25 |
4,167 |
|
6 |
1/6 |
36 |
6,000 |
|
Всего |
15,167 |
В четвертой ее колонке даны шесть значений , взвешенных по соответствующим вероятностям, которые в данном примере все равняются 1/6. По определению, величина равна , она приведена как сумма в четвертой колонке и равна 15,167.
Математическое ожидание , как уже было показано, равно 3,5, и 3,5 в квадрате равно 12,25. Таким образом, величина не равна , и, следовательно, нужно аккуратно проводить различия между и .
Правила расчета математического ожидания
Существуют три правила, которые часто используются. Эти правила практически самоочевидны, и они одинаково применимы для дискретных и непрерывных случайных переменных.
Правило 1. Математическое ожидание суммы нескольких переменных равно сумме их математических ожиданий. Например, если имеются три случайные переменные , и , то
. (A.4)
Правило 2. Если случайная переменная умножается на константу, то ее математическое ожидание умножается на ту же константу. Если - случайная переменная и - константа, то
. (A.5)
Правило 3. Математическое ожидание константы есть она сама. Например, если - константа, то
. (A.6)
Следствие из трех правил:
.
Независимость случайных переменных
Две случайные переменные и называются независимыми, если
(A.7)
для любых функций и . Из независимости следует как важный частный случай, что .
Теоретическая дисперсия дискретной случайной переменной
Теоретическая дисперсия является мерой разброса для вероятностного распределения. Она определяется как математическое ожидание квадрата разности между величиной и ее средним, т.е. величины , где - математическое ожидание . Дисперсия обычно обозначается как или , и если ясно, о какой переменной идет речь, то нижний индекс может быть опущен:
. (A.8)
Из можно получить - среднее квадратическое отклонение - столь же распространенную меру разброса для распределения вероятностей; среднее квадратическое отклонение случайной переменной есть квадратный корень из ее дисперсии.
Мы проиллюстрируем расчет дисперсии на примере с одной игральной костью. Поскольку , то в этом случае равно . Мы рассчитаем математическое ожидание величины , используя схему, представленную в табл. A.5. Дополнительный столбец представляет определенный этап расчета . Суммируя последний столбец в табл. I.5, получим значение дисперсии , равное 2,92. Следовательно, стандартное отклонение () равно , то есть 1,71.
Таблица A.5
1 |
2 |
3 |
4 |
5 |
|
1 |
1/6 |
-2,5 |
6,25 |
1,042 |
|
2 |
1/6 |
-1,5 |
2,25 |
0,375 |
|
3 |
1/6 |
-0,5 |
0,25 |
0,042 |
|
4 |
1/6 |
0,5 |
0,25 |
0,042 |
|
5 |
1/6 |
1,5 |
2,25 |
0,375 |
|
6 |
1/6 |
2,5 |
6,25 |
1,042 |
|
Всего |
2,92 |
Одним из важных приложений правил расчета математического ожидания является формула расчета теоретической дисперсии случайной переменной, которая может быть записана как
. (A.9)
Это выражение иногда оказывается более удобным, чем первоначальное определение. Доказательство предоставляется читателю в качестве упражнения.
Вероятность в непрерывном случае
С дискретными случайными переменными очень легко обращаться, поскольку они по определению принимают значения из некоторого конечного набора. Каждое из этих значений связано с определенной вероятностью, характеризующей его «вес». Если эти «веса» известны, то не составит труда рассчитать теоретическое среднее (математическое ожидание) и дисперсию.
Вы можете представить указанные «веса» как определенные количества «пластичной массы», равные вероятностям соответствующих значений. Сумма вероятностей и, следовательно, суммарный «вес» этой «массы» равен единице. Это показано на рис. A.1 для примера, где величина есть сумма очков, выпавших при бросании двух игральных костей. Величина принимает значения от 2 до 12, и для всех этих значений показано количество соответствующей «массы».
Рис. A.1.
К сожалению, анализ часто проводится для непрерывных случайных величин, которые могут принимать бесконечное число значений. Поскольку невозможно представить себе «пластичную массу», разделенную на бесконечное число частей, используем далее другой подход.
Проиллюстрируем наши рассуждения на примере температуры в комнате. Для определенности предположим, что она меняется в пределах от 55 до 75° по Фаренгейту, и вначале допустим, что все значения в этом диапазоне равновероятны.
Поскольку число различных значений, принимаемых показателем температуры, бесконечно, здесь бессмысленно пытаться разделить «пластичную массу» на малые части. Вместо этого можно «размазать» ее по всему диапазону. Поскольку все температуры от 55 до 75° F равновероятны, она должна быть «размазана» равномерно, как это показано на рис. A.2.
Рис. A.2.
В этом примере, как и во всех остальных, мы будем полагать, что «пластичная масса размазана» на единичной площади. Это связано с тем, что совокупная вероятность всегда равняется единице. В данном случае наша «масса» покрыла прямоугольник, и поскольку основание этого прямоугольника равно 20, его высота определяется из соотношения:
, (A.10)
так как произведение основания и высоты равно площади. Следовательно, высота равна 0,05, как это показано на рисунке.
Найдя высоту прямоугольника, мы можем ответить на вопросы типа: с какой вероятностью температура будет находиться в диапазоне от 65 до 70°F? Ответ определяется величиной «замазанной» площади (или, говоря более формально, совокупной вероятностью), лежащей в диапазоне от 65 до 70°F, представленной заштрихованной фигурой на рис. A.3. Основание заштрихованного прямоугольника равно 5, его высота равна 0,05 и, соответственно, площадь - 0,25. Искомая вероятность равна 1/4, что в любом случае очевидно, поскольку промежуток от 65 до 70°F составляет 1/4 всего диапазона.
Рис. A.3.
Высота заштрихованной площади представляет то, что формально называется плотностью вероятности в этой точке, и если эта высота может быть записана как функция значений случайной переменной, то эта функция называется функцией плотности вероятности. В нашем примере она записывается как , где - температура, и
. (A.11)
В качестве первого приближения функция плотности вероятности показывает вероятность нахождения случайной переменной внутри единичного интервала вокруг данной точки. В нашем примере эта функция всюду равна 0,05, откуда вытекает, что температура находится, например, между 60 и 61°F с вероятностью 0,05.
В нашем случае график функции плотности вероятности горизонтален, и ее указанная интерпретация точна, однако в общем случае эта функция непрерывно меняется, и ее интерпретация дает лишь приближение. Далее мы рассмотрим пример, когда эта функция непостоянна, поскольку не все температуры равновероятны. Предположим, что центральное отопление работает таким образом, что температура никогда не падает ниже 65°F, а в жаркие дни температура превосходит этот уровень, не превышая, как и ранее, 75°F. Мы будем считать, что плотность вероятности максимальна при температуре 65°F и далее она равномерно убывает до нуля при 75°F (рис. A.4).
Подобные документы
Суть эконометрики как научной дисциплины, ее предмет и метод. Парная и множественная регрессия в экономических исследованиях. Регрессионные модели с переменной структурой. Обобщенный метод наименьших квадратов. Анализ систем экономических уравнений.
реферат [279,2 K], добавлен 11.09.2013Множественная корреляция и линейная регрессия. Оценка прогнозных качеств модели. Простейшие методы линеаризации. Вероятностный эксперимент, событие или вероятность. Фиктивные переменные в регрессионных моделях. Системы эконометрических уравнений.
курс лекций [2,0 M], добавлен 13.02.2014Взаимосвязи экономических переменных. Понятие эконометрической модели. Коэффициент корреляции и его свойства. Линейная парная регрессия. Метод наименьших квадратов. Основные предпосылки и принципы регрессионного анализа. Статистика Дарбина-Уотсона.
шпаргалка [142,4 K], добавлен 22.12.2011Содержание, цели и задачи эконометрики как научной дисциплины; ее составляющие. Описание этапов моделирования экономических процессов. Принципы построения спецификации неоклассической производной функции. Определение эндогенной и экзогенной переменных.
презентация [2,8 M], добавлен 22.08.2015Задачи эконометрики, ее математический аппарат. Взаимосвязь между экономическими переменными, примеры оценки линейности и аддитивности. Основные понятия и проблемы эконометрического моделирования. Определение коэффициентов линейной парной регрессии.
контрольная работа [79,3 K], добавлен 28.07.2013Методологические основы эконометрики. Проблемы построения эконометрических моделей. Цели эконометрического исследования. Основные этапы эконометрического моделирования. Эконометрические модели парной линейной регрессии и методы оценки их параметров.
контрольная работа [176,4 K], добавлен 17.10.2014Этапы и проблемы эконометрических исследований. Параметры парной линейной регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициентов автокорреляции второго порядка для временного ряда расходов на потребление.
контрольная работа [60,3 K], добавлен 05.01.2011Определение, цели и задачи эконометрики. Этапы построения модели. Типы данных при моделировании экономических процессов. Примеры, формы и моделей. Эндогенные и экзогенные переменные. Построение спецификации неоклассической производственной функции.
презентация [1010,6 K], добавлен 18.03.2014Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.
контрольная работа [136,3 K], добавлен 25.09.2014Количественное выражение общих закономерностей, обусловленных экономической теорией. Механизм функционирования экономической или социально-экономической системы. Связь эконометрики с другими дисциплинами. Сущность эконометрической модели, ее специфика.
презентация [107,3 K], добавлен 22.08.2015