Основы эконометрики

Изучение основных разделов эконометрики: парная и множественная регрессия и корелляция, системы эконометрических уравнений, временные ряды. По всем разделам представлены тесты и варианты контрольных работ, по 10 вариантам рассмотрены типовые задачи.

Рубрика Экономико-математическое моделирование
Вид учебное пособие
Язык русский
Дата добавления 09.06.2009
Размер файла 3,5 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Таблица 4.1

уравнение идентифицируемо

уравнение неидентифицируемо

уравнение сверхидентифицируемо

Для оценки параметров структурной модели система должна быть идентифицируема или сверхидентифицируема.

Рассмотренное счетное правило отражает необходимое, но недостаточное условие идентификации. Более точно условия идентификации определяются, если накладывать ограничения на коэффициенты матриц параметров структурной модели. Уравнение идентифицируемо, если по отсутствующим в нем переменным (эндогенным и экзогенным) можно из коэффициентов при них в других уравнениях системы получить матрицу, определитель которой не равен нулю, а ранг матрицы не меньше, чем число эндогенных переменных в системе без одного.

Целесообразность проверки условия идентификации модели через определитель матрицы коэффициентов, отсутствующих в данном уравнении, но присутствующих в других, объясняется тем, что возможна ситуация, когда для каждого уравнения системы выполнено счетное правило, а определитель матрицы названных коэффициентов равен нулю. В этом случае соблюдается лишь необходимое, но недостаточное условие идентификации.

В эконометрических моделях часто наряду с уравнениями, параметры которых должны быть статистически оценены, используются балансовые тождества переменных, коэффициенты при которых равны . В этом случае, хотя само тождество и не требует проверки на идентификацию, ибо коэффициенты при переменных в тождестве известны, в проверке на идентификацию собственно структурных уравнений системы тождества участвуют.

Рассмотрим пример. Изучается модель вида

где - расходы на потребление в период , - совокупный доход в период , - инвестиции в период , - процентная ставка в период , - денежная масса в период , - государственные расходы в период , - расходы на потребление в период , инвестиции в период . Первое уравнение - функция потребления, второе уравнение - функция инвестиций, третье уравнение - функция денежного рынка, четвертое уравнение - тождество дохода.

Модель представляет собой систему одновременных уравнений. Проверим каждое ее уравнение на идентификацию.

Модель включает четыре эндогенные переменные и четыре предопределенные переменные (две экзогенные переменные - и и две лаговые переменные - и ).

Проверим необходимое условие идентификации для каждого из уравнений модели.

Первое уравнение: . Это уравнение содержит две эндогенные переменные и и одну предопределенную переменную . Таким образом, , а , т.е. выполняется условие . Уравнение сверхидентифицируемо.

Второе уравнение: . Оно включает две эндогенные переменные и и одну экзогенную переменную . Выполняется условие . Уравнение сверхидентифицируемо.

Третье уравнение: . Оно включает две эндогенные переменные и и одну экзогенную переменную . Выполняется условие . Уравнение сверхидентифицируемо.

Четвертое уравнение: . Оно представляет собой тождество, параметры которого известны. Необходимости в идентификации нет.

Проверим для каждого уравнения достаточное условие идентификации. Для этого составим матрицу коэффициентов при переменных модели.

I уравнение

-1

0

0

0

0

0

II уравнение

0

-1

0

0

0

0

III уравнение

0

0

-1

0

0

0

Тождество

1

1

0

-1

0

0

0

1

В соответствии с достаточным условием идентификации ранг матрицы коэффициентов при переменных, не входящих в исследуемое уравнение, должен быть равен числу эндогенных переменных модели без одного.

Первое уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид

II уравнение

-1

0

0

III уравнение

0

-1

0

0

Тождество

1

0

0

0

1

Ранг данной матрицы равен трем, так как определитель квадратной подматрицы не равен нулю:

.

Достаточное условие идентификации для данного уравнения выполняется.

Второе уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид

I уравнение

-1

0

0

III уравнение

0

0

0

Тождество

1

-1

0

0

1

Ранг данной матрицы равен трем, так как определитель квадратной подматрицы не равен нулю:

.

Достаточное условие идентификации для данного уравнения выполняется.

Третье уравнение. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид

I уравнение

-1

0

0

0

II уравнение

0

-1

0

0

Тождество

1

1

0

0

1

Ранг данной матрицы равен трем, так как определитель квадратной подматрицы не равен нулю:

.

Достаточное условие идентификации для данного уравнения выполняется.

Таким образом, все уравнения модели сверхидентифицируемы. Приведенная форма модели в общем виде будет выглядеть следующим образом:

3.3 Методы оценки параметров структурной формы модели

Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений. Наибольшее распространение в литературе получили следующие методы оценивания коэффициентов структурной модели:

1) косвенный метод наименьших квадратов;

2) двухшаговый метод наименьших квадратов;

3) трехшаговый метод наименьших квадратов;

4) метод максимального правдоподобия с полной информацией;

5) метод максимального правдоподобия при ограниченной информации.

Рассмотрим вкратце сущность каждого из этих методов.

Косвенный метод наименьших квадратов (КМНК) применяется в случае точно идентифицируемой структурной модели. Процедура применения КМНК предполагает выполнение следующих этапов работы.

1. Структурная модель преобразовывается в приведенную форму модели.

2. Для каждого уравнения приведенной формы модели обычным МНК оцениваются приведенные коэффициенты .

3. Коэффициенты приведенной формы модели трансформируются в параметры структурной модели.

Если система сверхидентифицируема, то КМНК не используется, ибо он не дает однозначных оценок для параметров структурной модели. В этом случае могут использоваться разные методы оценивания, среди которых наиболее распространенным и простым является двухшаговый метод наименьших квадратов (ДМНК).

Основная идея ДМНК - на основе приведенной формы модели получить для сверхидентифицируемого уравнения теоретические значения эндогенных переменных, содержащихся в правой части уравнения.

Далее, подставив их вместо фактических значений, можно применить обычный МНК к структурной форме сверхидентифицируемого уравнения. Метод получил название двухшагового МНК, ибо дважды используется МНК: на первом шаге при определении приведенной формы модели и нахождении на ее основе оценок теоретических значений эндогенной переменной и на втором шаге применительно к структурному сверхидентифицируемому уравнению при определении структурных коэффициентов модели по данным теоретических (расчетных) значений эндогенных переменных.

Сверхидентифицируемая структурная модель может быть двух типов:

1) все уравнения системы сверхидентифицируемы;

2) система содержит наряду со сверхидентифицируемыми точно идентифицируемые уравнения.

Если все уравнения системы сверхидентифицируемые, то для оценки структурных коэффициентов каждого уравнения используется ДМНК. Если в системе есть точно идентифицируемые уравнения, то структурные коэффициенты по ним находятся из системы приведенных уравнений.

Для примера, рассмотренного в предыдущем параграфе, необходимо применить именно двухшаговый метод наименьших квадратов. Но можно сделать следующее замечание. Если из модели исключить тождество дохода, число эндогенных переменных модели снизится на единицу - переменная станет экзогенной. А число предопределенных переменных модели не изменится, т.к. из модели будет исключена эндогенная переменная , но ее место займет переменная . В правых частях функции потребления и функции денежного рынка будут находиться только предопределенные переменные. Функция инвестиций постулирует зависимость эндогенной переменной от эндогенной переменной (которая зависит только от предопределенных переменных) и предопределенной переменной . Таким образом, мы получим рекурсивную систему. Ее параметры можно оценивать обычным МНК, и нет необходимости исследования уравнения на идентификацию.

Косвенный и двухшаговый методы наименьших квадратов подробно описаны в литературе и рассматриваются как традиционные методы оценки коэффициентов структурной модели. Эти методы достаточно легко реализуемы.

Метод максимального правдоподобия рассматривается как наиболее общий метод оценивания, результаты которого при нормальном распределении признаков совпадают с МНК. Однако при большом числе уравнений системы этот метод приводит к достаточно сложным вычислительным процедурам. Поэтому в качестве модификации используется метод максимального правдоподобия при ограниченной информации (метод наименьшего дисперсионного отношения), разработанный в 1949 г. Т.Андерсоном и Н.Рубиным.

В отличие от метода максимального правдоподобия в данном методе сняты ограничения на параметры, связанные с функционированием системы в целом. Это делает решение более простым, но трудоемкость вычислений остается достаточно высокой. Несмотря на его значительную популярность, к середине 60-х годов он был практически вытеснен двухшаговым методом наименьших квадратов (ДМНК) в связи с гораздо большей простотой последнего.

Дальнейшим развитием ДМНК является трехшаговый МНК (ТМНК), предложенный в 1962 г. А.Зельнером и Г.Тейлом. Этот метод оценивания пригоден для всех видов уравнений структурной модели. Однако при некоторых ограничениях на параметры более эффективным оказывается ДМНК.

4. ВРЕМЕННЫЕ РЯДЫ

При построении эконометрической модели используются два типа данных:

1) данные, характеризующие совокупность различных объектов в определенный момент времени;

2) данные, характеризующие один объект за ряд последовательных моментов времени.

Модели, построенные по данным первого типа, называются пространственными моделями. Модели, построенные на основе второго типа данных, называются моделями временных рядов.

Временной ряд (ряд динамики) - это совокупность значений какого-либо показателя за несколько последовательных моментов или периодов времени. Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы:

1) факторы, формирующие тенденцию ряда;

2) факторы, формирующие циклические колебания ряда;

3) случайные факторы.

Рассмотрим воздействие каждого фактора на временной ряд в отдельности.

Большинство временных рядов экономических показателей имеют тенденцию, характеризующую совокупное долговременное воздействие множества факторов на динамику изучаемого показателя. Все эти факторы, взятые в отдельности, могут оказывать разнонаправленное воздействие на исследуемый показатель. Однако в совокупности они формируют его возрастающую или убывающую тенденцию. На рис. 4.1 показан гипотетический временной ряд, содержащий возрастающую тенденцию.

Рис. 4.1.

Также изучаемый показатель может быть подвержен циклическим колебаниям. Эти колебания могут носить сезонный характер, поскольку экономическая деятельность ряда отраслей экономики зависит от времени года (например, цены на сельскохозяйственную продукцию в летний период выше, чем в зимний; уровень безработицы в курортных городах в зимний период выше по сравнению с летним). При наличии больших массивов данных за длительные промежутки времени можно выявить циклические колебания, связанные с общей динамикой конъюнктуры рынка. На рис. 4.2 представлен гипотетический временной ряд, содержащий только сезонную компоненту.

Рис. 4.2.

Некоторые временные ряды не содержат тенденции и циклической компоненты, а каждый следующий их уровень образуется как сумма среднего уровня ряда и некоторой (положительной или отрицательной) случайной компоненты. Пример ряда, содержащего только случайную компоненту, приведен на рис. 4.3.

Рис. 4.3.

Очевидно, что реальные данные не следуют целиком и полностью из каких-либо описанных выше моделей. Чаще всего они содержат все три компоненты. Каждый их уровень формируется под воздействием тенденции, сезонных колебаний и случайной компоненты.

В большинстве случаев фактический уровень временного ряда можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной моделью временного ряда. Основная задача эконометрического исследования отдельного временного ряда - выявление и придание количественного выражения каждой из перечисленных выше компонент с тем, чтобы использовать полученную информацию для прогнозирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов.

4.1 Автокорреляция уровней временного ряда

При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда.

Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.

Формула для расчета коэффициента автокорреляции имеет вид:

(4.1)

где

Эту величину называют коэффициентом автокорреляции уровней ряда первого порядка, так как он измеряет зависимость между соседними уровнями ряда и .

Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями и и определяется по формуле:

(4.2)

где

Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило - максимальный лаг должен быть не больше .

Свойства коэффициента автокорреляции.

1. Он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Поэтому по коэффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, параболу второго порядка или экспоненту), коэффициент автокорреляции уровней исходного ряда может приближаться к нулю.

2. По знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных содержат положительную автокорреляцию уровней, однако при этом могут иметь убывающую тенденцию.

Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой.

Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, т.е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.

Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка , то ряд содержит циклические колебания с периодичностью в моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты и циклической (сезонной) компоненты.

Рассмотрим пример. Пусть имеются некоторые условные данные об общем количестве правонарушений на таможне одного из субъектов РФ (например, Республики Татарстан).

Таблица 4.1

Год

Квартал

Количество возбужденных дел,

1999

I

1

375

II

2

371

III

3

869

IV

4

1015

2000

I

5

357

II

6

471

III

7

992

IV

8

1020

2001

I

9

390

II

10

355

III

11

992

IV

12

905

2002

I

13

461

II

14

454

III

15

920

IV

16

927

Построим поле корреляции:

Рис. 4.4.

Уже исходя из графика видно, что значения образуют пилообразную фигуру. Рассчитаем несколько последовательных коэффициентов автокорреляции. Для этого составляем первую вспомогательную таблицу.

Таблица 4.2

1

2

3

4

5

6

7

8

1

375

-

-

-

-

-

-

2

371

375

-328,33

-288,13

94601,72

107800,59

83018,90

3

869

371

169,67

-292,13

-49565,70

28787,91

85339,94

4

1015

869

315,67

205,87

64986,98

99647,55

42382,46

5

357

1015

-342,33

351,87

-120455,66

117189,83

123812,50

6

471

357

-228,33

-306,13

69898,66

52134,59

93715,58

7

992

471

292,67

-192,13

-56230,69

85655,73

36913,94

8

1020

992

320,67

328,87

105458,74

102829,25

108155,48

9

390

1020

-309,33

356,87

-110390,60

95685,05

127356,20

10

355

390

-344,33

-273,13

94046,85

118563,15

74600,00

11

992

355

292,67

-308,13

-90180,41

85655,73

94944,10

12

905

992

205,67

328,87

67638,69

42300,15

108155,48

1

2

3

4

5

6

7

8

13

461

905

-238,33

241,87

-57644,88

56801,19

58501,10

14

454

461

-245,33

-202,13

49588,55

60186,81

40856,54

15

920

454

220,67

-209,13

-46148,72

48695,25

43735,36

16

927

920

227,67

256,87

58481,59

51833,63

65982,20

Сумма

10499

9947

9,05

0,05

74085,16

1153766,39

1187469,73

Среднее значение

699,33

663,13

-

-

-

-

-

Следует заметить, что среднее значение получается путем деления не на 16, а на 15, т.к. у нас теперь на одно наблюдение меньше.

Теперь вычисляем коэффициент автокорреляции первого порядка по формуле (4.1):

.

Составляем вспомогательную таблицу для расчета коэффициента автокорреляции второго порядка.

Таблица 4.3

1

2

3

4

5

6

7

8

1

375

-

-

-

-

-

-

2

371

-

-

-

-

-

-

3

869

375

145,57

-269,79

-39273,33

21190,62

72786,64

4

1015

371

291,57

-273,79

-79828,95

85013,06

74960,96

5

357

869

-366,43

224,21

-82157,27

134270,94

50270,12

6

471

1015

-252,43

370,21

-93452,11

63720,90

137055,44

7

992

357

268,57

-287,79

-77291,76

72129,84

82823,08

8

1020

471

296,57

-173,79

-51540,90

87953,76

30202,96

9

390

992

-333,43

347,21

-115770,23

111175,56

120554,78

10

355

1020

-368,43

375,21

-138238,62

135740,66

140782,54

11

992

390

268,57

-254,79

-68428,95

72129,84

64917,94

12

905

355

181,57

-289,79

-52617,17

32967,66

83978,24

13

461

992

-262,43

347,21

-91118,32

68869,50

120554,78

14

454

905

-269,43

260,21

-70108,38

72592,52

67709,24

15

920

461

196,57

-183,79

-36127,60

38639,76

33778,76

16

927

454

203,57

-190,79

-38839,12

41440,74

36400,82

Сумма

10128

9027

-0,02

-0,06

-1034792,71

1037835,43

1116776,36

Среднее значение

723,43

644,79

-

-

-

-

-

Следовательно

Аналогично находим коэффициенты автокорреляции более высоких порядков, а все полученные значения заносим в сводную таблицу.

Таблица 4.4

Лаг

Коэффициент автокорреляции уровней

1

0,063294

2

-0,961183

3

-0,036290

4

0,964735

5

0,050594

6

-0,976516

7

-0,069444

8

0,964629

9

0,162064

10

-0,972918

11

-0,065323

12

0,985761

Коррелограмма:

Рис. 4.5.

Анализ коррелограммы и графика исходных уровней временного ряда позволяет сделать вывод о наличии в изучаемом временном ряде сезонных колебаний периодичностью в четыре квартала.

4. 2 Моделирование тенденции временного ряда

Распространенным способом моделирования тенденции временного ряда является построение аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим выравниванием временного ряда.

Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные виды функций. Для построения трендов чаще всего применяются следующие функции:

линейный тренд: ;

гипербола: ;

экспоненциальный тренд: (или );

степенная функция: ;

полиномы различных степеней: .

Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время , а в качестве зависимой переменной - фактические уровни временного ряда . Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.

Существует несколько способов определения типа тенденции. К числу наиболее распространенных способов относятся качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени. В этих же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип тенденции можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни и тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов.

Выбор наилучшего уравнения в случае, когда ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации и средней ошибки аппроксимации. Этот метод легко реализуется при компьютерной обработке данных.

4.3 Моделирование сезонных колебаний

Простейший подход к моделированию сезонных колебаний - это расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда.

Общий вид аддитивной модели следующий:

. (4.3)

Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой (), сезонной () и случайной () компонент.

Общий вид мультипликативной модели выглядит так:

. (4.4)

Эта модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой (), сезонной () и случайной () компонент.

Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.

Построение аддитивной и мультипликативной моделей сводится к расчету значений , и для каждого уровня ряда.

Процесс построения модели включает в себя следующие шаги.

1) Выравнивание исходного ряда методом скользящей средней.

2) Расчет значений сезонной компоненты .

3) Устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных () в аддитивной или () в мультипликативной модели.

4) Аналитическое выравнивание уровней () или () и расчет значений с использованием полученного уравнения тренда.

5) Расчет полученных по модели значений () или ().

6) Расчет абсолютных и/или относительных ошибок. Если полученные значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок для анализа взаимосвязи исходного ряда и других временных рядов.

Методику построения каждой из моделей рассмотрим на примерах.

Пример. Построение аддитивной модели временного ряда. Обратимся к данным об объеме правонарушений на таможне за четыре года, представленным в табл. 4.1.

Было показано, что данный временной ряд содержит сезонные колебания периодичностью 4, т.к. количество правонарушений в первый-второй кварталы ниже, чем в третий-четвертый. Рассчитаем компоненты аддитивной модели временного ряда.

Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:

1.1. Просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и определим условные годовые объемы потребления электроэнергии (гр. 3 табл. 4.5).

1.2. Разделив полученные суммы на 4, найдем скользящие средние (гр. 4 табл. 4.5). Полученные таким образом выровненные значения уже не содержат сезонной компоненты.

1.3. Приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних - центрированные скользящие средние (гр. 5 табл. 4.5).

Таблица 4.5

№ квартала,

Количество правонарушений,

Итого за четыре квартала

Скользящая средняя за четыре квартала

Центрированная скользящая средняя

Оценка сезонной компоненты

1

2

3

4

5

6

1

375

-

-

-

-

2

371

2630

657,5

-

-

3

869

2612

653

655,25

213,75

4

1015

2712

678

665,5

349,5

5

357

2835

708,75

693,75

-336,75

6

471

2840

710

709,375

-238,375

7

992

2873

718,25

714,125

277,875

8

1020

2757

689,25

703,75

316,25

9

390

2757

689,25

689,25

-299,25

10

355

2642

660,5

674,875

-319,875

11

992

2713

678,25

669,375

322,625

12

905

2812

703

690,625

214,375

13

461

2740

685

694

-233

14

454

2762

690,5

687,75

-233,75

15

920

-

-

-

-

16

927

-

-

-

-

Шаг 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими средними (гр. 6 табл. 4.5). Используем эти оценки для расчета значений сезонной компоненты (табл. 4.6). Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты . В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна нулю.

Таблица 4.6

Показатели

Год

№ квартала,

I

II

III

IV

1999

-

-

213,75

349,5

2000

-336,75

-238,375

277,875

316,25

2001

-299,25

-319,875

322,625

214,375

2002

-233

-233,75

-

-

Всего за -й квартал

-869

-792

814,25

880,125

Средняя оценка сезонной компоненты для -го квартала,

-289,667

-264

271,417

293,375

Скорректированная сезонная компонента,

-292,448

-266,781

268,636

290,593

Для данной модели имеем:

.

Корректирующий коэффициент: .

Рассчитываем скорректированные значения сезонной компоненты () и заносим полученные данные в таблицу 4.6.

Проверим равенство нулю суммы значений сезонной компоненты:

.

Шаг 3. Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины (гр. 4 табл. 4.7). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.

Таблица 4.7

1

2

3

4

5

6

7

8

1

375

-292,448

667,448

672,700

380,252

-5,252

27,584

2

371

-266,781

637,781

673,624

406,843

-35,843

1284,721

3

869

268,636

600,364

674,547

943,183

-74,183

5503,117

4

1015

290,593

724,407

675,470

966,063

48,937

2394,830

5

357

-292,448

649,448

676,394

383,946

-26,946

726,087

6

471

-266,781

737,781

677,317

410,536

60,464

3655,895

7

992

268,636

723,364

678,240

946,876

45,124

2036,175

8

1020

290,593

729,407

679,163

969,756

50,244

2524,460

9

390

-292,448

682,448

680,087

387,639

2,361

5,574

10

355

-266,781

621,781

681,010

414,229

-59,229

3508,074

11

992

268,636

723,364

681,933

950,569

41,431

1716,528

12

905

290,593

614,407

682,857

973,450

-68,450

4685,403

13

461

-292,448

753,448

683,780

391,332

69,668

4853,630

14

454

-266,781

720,781

684,703

417,922

36,078

1301,622

15

920

268,636

651,364

685,627

954,263

-34,263

1173,953

16

927

290,593

636,407

686,550

977,143

-50,143

2514,320

Шаг 4. Определим компоненту данной модели. Для этого проведем аналитическое выравнивание ряда () с помощью линейного тренда. Результаты аналитического выравнивания следующие:

.

Подставляя в это уравнение значения , найдем уровни для каждого момента времени (гр. 5 табл. 4.7).

Шаг 5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням значения сезонной компоненты для соответствующих кварталов (гр. 6 табл. 4.7).

На одном графике отложим фактические значения уровней временного ряда и теоретические, полученные по аддитивной модели.

Рис. 4.6.

Для оценки качества построенной модели применим сумму квадратов полученных абсолютных ошибок.

.

Следовательно, можно сказать, что аддитивная модель объясняет 97% общей вариации уровней временного ряда количества правонарушений по кварталам за 4 года.

Шаг 6. Прогнозирование по аддитивной модели. Предположим, что по нашему примеру необходимо дать прогноз об общем объеме правонарушений на I и II кварталы 2003 года. Прогнозное значение уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда

.

Получим

;

.

Значения сезонных компонент за соответствующие кварталы равны: и . Таким образом,

;

.

Т.е. в первые два квартала 2003 г. следовало ожидать порядка 395 и 422 правонарушений соответственно.

Построение мультипликативной модели рассмотрим на данных предыдущего примера.

Шаг 1. Методика, применяемая на этом шаге, полностью совпадает с методикой построения аддитивной модели.

Таблица 4.8

№ квартала,

Количество правонарушений,

Итого за четыре квартала

Скользящая средняя за четыре квартала

Центрированная скользящая средняя

Оценка сезонной компоненты

1

2

3

4

5

6

1

375

-

-

-

-

2

371

2630

657,5

-

-

3

869

2612

653

655,25

1,3262

4

1015

2712

678

665,5

1,5252

5

357

2835

708,75

693,75

0,5146

6

471

2840

710

709,375

0,6640

7

992

2873

718,25

714,125

1,3891

8

1020

2757

689,25

703,75

1,4494

9

390

2757

689,25

689,25

0,5658

10

355

2642

660,5

674,875

0,5260

11

992

2713

678,25

669,375

1,4820

12

905

2812

703

690,625

1,3104

13

461

2740

685

694

0,6643

14

454

2762

690,5

687,75

0,6601

15

920

-

-

-

-

16

927

-

-

-

-

Шаг 2. Найдем оценки сезонной компоненты как частное от деления фактических уровней ряда на центрированные скользящие средние (гр. 6 табл. 4.8). Эти оценки используются для расчета сезонной компоненты (табл. 4.9). Для этого найдем средние за каждый квартал оценки сезонной компоненты . Так же как и в аддитивной модели считается, что сезонные воздействия за период взаимопогашаются. В мультипликативной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна числу периодов в цикле. В нашем случае число периодов одного цикла равно 4.

Таблица 4.9

Показатели

Год

№ квартала,

I

II

III

IV

1999

-

-

1,3262

1,5252

2000

0,5146

0,6640

1,3891

1,4494

2001

0,5658

0,5260

1,4820

1,3104

2002

0,6643

0,6601

-

-

Всего за -й квартал

1,7447

1,8501

4,1973

4,2850

Средняя оценка сезонной компоненты для -го квартала,

0,5816

0,6167

1,3991

1,4283

Скорректированная сезонная компонента,

0,5779

0,6128

1,3901

1,4192

Имеем

.

Определяем корректирующий коэффициент:

.

Скорректированные значения сезонной компоненты получаются при умножении ее средней оценки на корректирующий коэффициент .

Проверяем условие равенство 4 суммы значений сезонной компоненты:

.

Шаг 3. Разделим каждый уровень исходного ряда на соответствующие значения сезонной компоненты. В результате получим величины (гр. 4 табл. 4.10), которые содержат только тенденцию и случайную компоненту.

Таблица 4.10

1

2

3

4

5

6

7

1

375

0,5779

648,9012

654,9173

378,4767

0,9908

2

371

0,6128

605,4178

658,1982

403,3439

0,9198

3

869

1,3901

625,1349

661,4791

919,5221

0,9451

4

1015

1,4192

715,1917

664,7600

943,4274

1,0759

5

357

0,5779

617,7539

668,0409

386,0608

0,9247

6

471

0,6128

768,6031

671,3218

411,3860

1,1449

7

992

1,3901

713,6177

674,6027

937,7652

1,0578

8

1020

1,4192

718,7148

677,8836

962,0524

1,0602

9

390

0,5779

674,8572

681,1645

393,6450

0,9907

10

355

0,6128

579,3081

684,4454

419,4281

0,8464

11

992

1,3901

713,6177

687,7263

956,0083

1,0377

12

905

1,4192

637,6832

691,0072

980,6774

0,9228

13

461

0,5779

797,7159

694,2881

401,2291

1,1490

14

454

0,6128

740,8616

697,5690

427,4703

1,0621

15

920

1,3901

661,8229

700,8499

974,2515

0,9443

16

927

1,4192

653,1849

704,1308

999,3024

0,9277

Шаг 4. Определим компоненту в мультипликативной модели. Для этого рассчитаем параметры линейного тренда, используя уровни . В результате получим уравнение тренда:

.

Подставляя в это уравнение значения , найдем уровни для каждого момента времени (гр. 5 табл. 4.10).

Шаг 5. Найдем уровни ряда, умножив значения на соответствующие значения сезонной компоненты (гр. 6 табл. 4.10). На одном графике откладываем фактические значения уровней временного ряда и теоретические, полученные по мультипликативной модели.

Рис. 4.7.

Расчет ошибки в мультипликативной модели производится по формуле:

.

Для сравнения мультипликативной модели и других моделей временного ряда можно, по аналогии с аддитивной моделью, использовать сумму квадратов абсолютных ошибок :

.

Сравнивая показатели детерминации аддитивной и мультипликативной моделей, делаем вывод, что они примерно одинаково аппроксимируют исходные данные.

Шаг 6. Прогнозирование по мультипликативной модели. Если предположить, что по нашему примеру необходимо дать прогноз об общем объеме правонарушений на I и II кварталы 2003 года, прогнозное значение уровня временного ряда в мультипликативной модели есть произведение трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда

.

Получим

;

.

Значения сезонных компонент за соответствующие кварталы равны: и . Таким образом

;

.

Т.е. в первые два квартала 2003 г. следовало ожидать порядка 409 и 436 правонарушений соответственно.

Таким образом, аддитивная и мультипликативная модели дают примерно одинаковый результат по прогнозу.

4.4 Автокорреляция в остатках. Критерий Дарбина-Уотсона

Автокорреляция в остатках может быть вызвана несколькими причинами, имеющими различную природу.

1. Она может быть связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака.

2. В ряде случаев автокорреляция может быть следствием неправильной спецификации модели. Модель может не включать фактор, который оказывает существенное воздействие на результат и влияние которого отражается в остатках, вследствие чего последние могут оказаться автокоррелированными. Очень часто этим фактором является фактор времени .

От истинной автокорреляции остатков следует отличать ситуации, когда причина автокорреляции заключается в неправильной спецификации функциональной формы модели. В этом случае следует изменить форму модели, а не использовать специальные методы расчета параметров уравнения регрессии при наличии автокорреляции в остатках.

Один из более распространенных методов определения автокорреляции в остатках - это расчет критерия Дарбина-Уотсона:

. (4.5)

Т.е. величина есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии.

Можно показать, что при больших значениях существует следующее соотношение между критерием Дарбина-Уотсона и коэффициентом автокорреляции остатков первого порядка :

. (4.6)

Таким образом, если в остатках существует полная положительная автокорреляция и , то . Если в остатках полная отрицательная автокорреляция, то и, следовательно, . Если автокорреляция остатков отсутствует, то и . Т.е. .

Алгоритм выявления автокорреляции остатков на основе критерия Дарбина-Уотсона следующий. Выдвигается гипотеза об отсутствии автокорреляции остатков. Альтернативные гипотезы и состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках. Далее по специальным таблицам (см. приложение E) определяются критические значения критерия Дарбина-Уотсона и для заданного числа наблюдений , числа независимых переменных модели и уровня значимости . По этим значениям числовой промежуток разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью осуществляется следующим образом:

- есть положительная автокорреляция остатков, отклоняется, с вероятностью принимается ;

- зона неопределенности;

- нет оснований отклонять , т.е. автокорреляция остатков отсутствует;

- зона неопределенности;

- есть отрицательная автокорреляция остатков, отклоняется, с вероятностью принимается .

Если фактическое значение критерия Дарбина-Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу .

Пример. Проверим гипотезу о наличии автокорреляции в остатках для аддитивной модели нашего временного ряда. Исходные данные и промежуточные расчеты заносим в таблицу:

Таблица 4.11

1

2

3

4

5

6

1

375

-5,252

-

-

27,584

2

371

-35,843

-5,252

935,8093

1284,7

3

869

-74,183

-35,843

1469,956

5503,1

4

1015

48,937

-74,183

15158,53

2394,8

5

357

-26,946

48,937

5758,23

726,09

6

471

60,464

-26,946

7640,508

3655,9

7

992

45,124

60,464

235,3156

2036,2

8

1020

50,244

45,124

26,2144

2524,5

9

390

2,361

50,244

2292,782

5,574

10

355

-59,229

2,361

3793,328

3508,1

11

992

41,431

-59,229

10132,44

1716,5

12

905

-68,450

41,431

12073,83

4685,4

13

461

69,668

-68,45

19076,58

4853,6

14

454

36,078

69,668

1128,288

1301,6

15

920

-34,263

36,078

4947,856

1174

16

927

-50,143

-34,263

252,1744

2514,3

Сумма

-0,002

50,141

84921,85

37911,97

Фактическое значение критерия Дарбина-Уотсона для данной модели составляет:

.

Сформулируем гипотезы: - в остатках нет автокорреляции; - в остатках есть положительная автокорреляция; - в остатках есть отрицательная автокорреляция. Зададим уровень значимости . По таблице значений критерия Дарбина-Уотсона определим для числа наблюдений и числа независимых параметров модели (мы рассматриваем только зависимость от времени ) критические значения и . Фактическое значение -критерия Дарбина-Уотсона попадает в интервал (1,37<2,24<2,63). Следовательно, нет основания отклонять гипотезу об отсутствии автокорреляции в остатках.

Существует несколько ограничений на применение критерия Дарбина-Уотсона.

1. Он неприменим к моделям, включающим в качестве независимых переменных лаговые значения результативного признака.

2. Методика расчета и использования критерия Дарбина-Уотсона направлена только на выявление автокорреляции остатков первого порядка.

3. Критерий Дарбина-Уотсона дает достоверные результаты только для больших выборок.

Приложение A За основу приложения А взят учебник [4].

Случайные переменные. Дискретная случайная переменная

Ваше интуитивное понимание вероятности почти наверняка соответствует задачам этой книги, и поэтому мы опустим традиционный раздел чистой теории вероятностей, хотя он мог бы быть весьма увлекательным. Многие люди непосредственно сталкивались с вероятностями, участвуя в лотереях и азартных играх, и их заинтересованность в том, чем они занимались, часто приводила к удивительно высокой практической компетентности, обычно при полном отсутствии формальной подготовки.

Мы начнем непосредственно с дискретных случайных переменных. Случайная переменная - это любая переменная, значение которой не может быть точно предсказано. Дискретной называется случайная величина, имеющая определенный набор возможных значений. Пример - сумма выпавших очков при бросании двух игральных костей. Пример случайной величины, не являющейся дискретной, - температура в комнате. Она может принять любое из непрерывного диапазона значений и является примером непрерывной случайной величины. К рассмотрению таких величин в этом приложении мы перейдем позже.

Продолжая разговор о примере с двумя игральными костями, предположим, что одна из них зеленая, а другая - красная. Если их бросить, то возможны 36 элементарных исходов эксперимента, поскольку на зеленой кости может выпасть любое число от 1 до 6 и то же самое - на красной. Случайная переменная, определенная как их сумма, которую мы обозначим через , может принимать только одно из 11 числовых значений -- от 2 до 12. Взаимосвязь между исходами эксперимента и значениями случайной величины в данном случае показана в табл. A.1.

Таблица A.1

Красная

Зеленая

1

2

3

4

5

6

1

2

3

4

5

6

7

2

3

4

5

6

7

8

3

4

5

6

7

8

9

4

5

6

7

8

9

10

5

6

7

8

9

10

11

6

7

8

9

10

11

12

Предположив, что кости «правильные», мы можем воспользоваться табл. A.1 для определения вероятности каждого значения . Поскольку на костях имеется 36 различных комбинаций, каждый исход имеет вероятность 1/36. Лишь одна из возможных комбинаций {зеленая=1, красная=1} дает сумму, равную 2, так что вероятность равна 1/36. Чтобы получить сумму , нам потребуются сочетания {зеленая=1, красная=6}, либо {зеленая=2, красная=5}, либо {зеленая=3, красная=4}, либо {зеленая=4, красная=3}, либо {зеленая=5, красная=2}, либо {зеленая=6, красная=1}. В данном случае нас устроят 6 возможных исходов, и поэтому вероятность получения 7 равна 6/36. Все эти вероятности приведены в табл. A.2. Если все их сложить, то получится ровно 1. Это будет так, поскольку с вероятностью 100% рассматриваемая сумма примет одно из значений от 2 до 12.

Таблица A.2

Значения

2

3

4

5

6

7

8

9

10

11

12

Вероятность

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

Совокупность всех возможных значений случайной переменной описывается генеральной совокупностью, из которой извлекаются эти значения. В нашем случае генеральная совокупность - это набор чисел от 2 до 12.

Математическое ожидание дискретной случайной величины

Математическое ожидание дискретной случайной величины - это взвешенное среднее всех ее возможных значений, причем в качестве весового коэффициента берется вероятность соответствующего исхода. Вы можете рассчитать его, перемножив все возможные значения случайной величины на их вероятности и просуммировав полученные произведения. Математически если случайная величина обозначена как , то ее математическое ожидание обозначается как или .

Предположим, что может принимать конкретных значений и что вероятность получения равна . Тогда

. (A.1)

В случае с двумя костями величинами от до были числа от 2 до 12. Математическое ожидание рассчитывается так:

.

Прежде чем пойти дальше, рассмотрим еще более простой пример случайной переменной - число очков, выпадающее при бросании лишь одной игральной кости.

В данном случае возможны шесть исходов: , , …, . Каждый исход имеет вероятность 1/6, поэтому здесь

. (A.2)

В данном случае математическим ожиданием случайной переменной является число, которое само по себе не может быть получено при бросании кости.

Математическое ожидание случайной величины часто называют ее средним по генеральной совокупности. Для случайной величины это значение часто обозначается как .

Математические ожидания функций дискретных случайных переменных

Пусть - некоторая функция от . Тогда - математическое ожидание записывается как

, (A.3)

где суммирование производится по всем возможным значениям . В табл. A.3 показана последовательность практического расчета математического ожидания функции от .

Таблица A.3

Вероятность

Функция от

Функция, взвешенная по вероятности

1

2

3

4

Всего

Предположим, что может принимать различных значений от до с соответствующими вероятностями от до . В первой колонке записываются все возможные значения . Во второй - записываются соответствующие вероятности. В третьей колонке рассчитываются значения функции для соответствующих величин . В четвертой колонке перемножаются числа из колонок 2 и 3. Ответ приводится в суммирующей строке колонки 4.

Рассчитаем математическое ожидание величины . Для этого рассмотрим пример с числами, выпадающими при бросании одной кости. Использовав схему, приведенную в табл. A.3, заполним табл. A.4.

Таблица A.4

1

2

3

4

1

1/6

1

0,167

2

1/6

4

0,667

3

1/6

9

1,500

4

1/6

16

2,667

5

1/6

25

4,167

6

1/6

36

6,000

Всего

15,167

В четвертой ее колонке даны шесть значений , взвешенных по соответствующим вероятностям, которые в данном примере все равняются 1/6. По определению, величина равна , она приведена как сумма в четвертой колонке и равна 15,167.

Математическое ожидание , как уже было показано, равно 3,5, и 3,5 в квадрате равно 12,25. Таким образом, величина не равна , и, следовательно, нужно аккуратно проводить различия между и .

Правила расчета математического ожидания

Существуют три правила, которые часто используются. Эти правила практически самоочевидны, и они одинаково применимы для дискретных и непрерывных случайных переменных.

Правило 1. Математическое ожидание суммы нескольких переменных равно сумме их математических ожиданий. Например, если имеются три случайные переменные , и , то

. (A.4)

Правило 2. Если случайная переменная умножается на константу, то ее математическое ожидание умножается на ту же константу. Если - случайная переменная и - константа, то

. (A.5)

Правило 3. Математическое ожидание константы есть она сама. Например, если - константа, то

. (A.6)

Следствие из трех правил:

.

Независимость случайных переменных

Две случайные переменные и называются независимыми, если

(A.7)

для любых функций и . Из независимости следует как важный частный случай, что .

Теоретическая дисперсия дискретной случайной переменной

Теоретическая дисперсия является мерой разброса для вероятностного распределения. Она определяется как математическое ожидание квадрата разности между величиной и ее средним, т.е. величины , где - математическое ожидание . Дисперсия обычно обозначается как или , и если ясно, о какой переменной идет речь, то нижний индекс может быть опущен:

. (A.8)

Из можно получить - среднее квадратическое отклонение - столь же распространенную меру разброса для распределения вероятностей; среднее квадратическое отклонение случайной переменной есть квадратный корень из ее дисперсии.

Мы проиллюстрируем расчет дисперсии на примере с одной игральной костью. Поскольку , то в этом случае равно . Мы рассчитаем математическое ожидание величины , используя схему, представленную в табл. A.5. Дополнительный столбец представляет определенный этап расчета . Суммируя последний столбец в табл. I.5, получим значение дисперсии , равное 2,92. Следовательно, стандартное отклонение () равно , то есть 1,71.

Таблица A.5

1

2

3

4

5

1

1/6

-2,5

6,25

1,042

2

1/6

-1,5

2,25

0,375

3

1/6

-0,5

0,25

0,042

4

1/6

0,5

0,25

0,042

5

1/6

1,5

2,25

0,375

6

1/6

2,5

6,25

1,042

Всего

2,92

Одним из важных приложений правил расчета математического ожидания является формула расчета теоретической дисперсии случайной переменной, которая может быть записана как

. (A.9)

Это выражение иногда оказывается более удобным, чем первоначальное определение. Доказательство предоставляется читателю в качестве упражнения.

Вероятность в непрерывном случае

С дискретными случайными переменными очень легко обращаться, поскольку они по определению принимают значения из некоторого конечного набора. Каждое из этих значений связано с определенной вероятностью, характеризующей его «вес». Если эти «веса» известны, то не составит труда рассчитать теоретическое среднее (математическое ожидание) и дисперсию.

Вы можете представить указанные «веса» как определенные количества «пластичной массы», равные вероятностям соответствующих значений. Сумма вероятностей и, следовательно, суммарный «вес» этой «массы» равен единице. Это показано на рис. A.1 для примера, где величина есть сумма очков, выпавших при бросании двух игральных костей. Величина принимает значения от 2 до 12, и для всех этих значений показано количество соответствующей «массы».

Рис. A.1.

К сожалению, анализ часто проводится для непрерывных случайных величин, которые могут принимать бесконечное число значений. Поскольку невозможно представить себе «пластичную массу», разделенную на бесконечное число частей, используем далее другой подход.

Проиллюстрируем наши рассуждения на примере температуры в комнате. Для определенности предположим, что она меняется в пределах от 55 до 75° по Фаренгейту, и вначале допустим, что все значения в этом диапазоне равновероятны.

Поскольку число различных значений, принимаемых показателем температуры, бесконечно, здесь бессмысленно пытаться разделить «пластичную массу» на малые части. Вместо этого можно «размазать» ее по всему диапазону. Поскольку все температуры от 55 до 75° F равновероятны, она должна быть «размазана» равномерно, как это показано на рис. A.2.

Рис. A.2.

В этом примере, как и во всех остальных, мы будем полагать, что «пластичная масса размазана» на единичной площади. Это связано с тем, что совокупная вероятность всегда равняется единице. В данном случае наша «масса» покрыла прямоугольник, и поскольку основание этого прямоугольника равно 20, его высота определяется из соотношения:

, (A.10)

так как произведение основания и высоты равно площади. Следовательно, высота равна 0,05, как это показано на рисунке.

Найдя высоту прямоугольника, мы можем ответить на вопросы типа: с какой вероятностью температура будет находиться в диапазоне от 65 до 70°F? Ответ определяется величиной «замазанной» площади (или, говоря более формально, совокупной вероятностью), лежащей в диапазоне от 65 до 70°F, представленной заштрихованной фигурой на рис. A.3. Основание заштрихованного прямоугольника равно 5, его высота равна 0,05 и, соответственно, площадь - 0,25. Искомая вероятность равна 1/4, что в любом случае очевидно, поскольку промежуток от 65 до 70°F составляет 1/4 всего диапазона.

Рис. A.3.

Высота заштрихованной площади представляет то, что формально называется плотностью вероятности в этой точке, и если эта высота может быть записана как функция значений случайной переменной, то эта функция называется функцией плотности вероятности. В нашем примере она записывается как , где - температура, и

. (A.11)

В качестве первого приближения функция плотности вероятности показывает вероятность нахождения случайной переменной внутри единичного интервала вокруг данной точки. В нашем примере эта функция всюду равна 0,05, откуда вытекает, что температура находится, например, между 60 и 61°F с вероятностью 0,05.

В нашем случае график функции плотности вероятности горизонтален, и ее указанная интерпретация точна, однако в общем случае эта функция непрерывно меняется, и ее интерпретация дает лишь приближение. Далее мы рассмотрим пример, когда эта функция непостоянна, поскольку не все температуры равновероятны. Предположим, что центральное отопление работает таким образом, что температура никогда не падает ниже 65°F, а в жаркие дни температура превосходит этот уровень, не превышая, как и ранее, 75°F. Мы будем считать, что плотность вероятности максимальна при температуре 65°F и далее она равномерно убывает до нуля при 75°F (рис. A.4).


Подобные документы

  • Суть эконометрики как научной дисциплины, ее предмет и метод. Парная и множественная регрессия в экономических исследованиях. Регрессионные модели с переменной структурой. Обобщенный метод наименьших квадратов. Анализ систем экономических уравнений.

    реферат [279,2 K], добавлен 11.09.2013

  • Множественная корреляция и линейная регрессия. Оценка прогнозных качеств модели. Простейшие методы линеаризации. Вероятностный эксперимент, событие или вероятность. Фиктивные переменные в регрессионных моделях. Системы эконометрических уравнений.

    курс лекций [2,0 M], добавлен 13.02.2014

  • Взаимосвязи экономических переменных. Понятие эконометрической модели. Коэффициент корреляции и его свойства. Линейная парная регрессия. Метод наименьших квадратов. Основные предпосылки и принципы регрессионного анализа. Статистика Дарбина-Уотсона.

    шпаргалка [142,4 K], добавлен 22.12.2011

  • Содержание, цели и задачи эконометрики как научной дисциплины; ее составляющие. Описание этапов моделирования экономических процессов. Принципы построения спецификации неоклассической производной функции. Определение эндогенной и экзогенной переменных.

    презентация [2,8 M], добавлен 22.08.2015

  • Задачи эконометрики, ее математический аппарат. Взаимосвязь между экономическими переменными, примеры оценки линейности и аддитивности. Основные понятия и проблемы эконометрического моделирования. Определение коэффициентов линейной парной регрессии.

    контрольная работа [79,3 K], добавлен 28.07.2013

  • Методологические основы эконометрики. Проблемы построения эконометрических моделей. Цели эконометрического исследования. Основные этапы эконометрического моделирования. Эконометрические модели парной линейной регрессии и методы оценки их параметров.

    контрольная работа [176,4 K], добавлен 17.10.2014

  • Этапы и проблемы эконометрических исследований. Параметры парной линейной регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициентов автокорреляции второго порядка для временного ряда расходов на потребление.

    контрольная работа [60,3 K], добавлен 05.01.2011

  • Определение, цели и задачи эконометрики. Этапы построения модели. Типы данных при моделировании экономических процессов. Примеры, формы и моделей. Эндогенные и экзогенные переменные. Построение спецификации неоклассической производственной функции.

    презентация [1010,6 K], добавлен 18.03.2014

  • Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.

    контрольная работа [136,3 K], добавлен 25.09.2014

  • Количественное выражение общих закономерностей, обусловленных экономической теорией. Механизм функционирования экономической или социально-экономической системы. Связь эконометрики с другими дисциплинами. Сущность эконометрической модели, ее специфика.

    презентация [107,3 K], добавлен 22.08.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.