Модели бинарного выбора (логит- и пробит-модели)
Рассмотрение возможных альтернатив с помощью модели бинарного выбора. Эконометрическое моделирование переменных и гипотез. Статистическая значимость логит- и пробит-моделей выбора. Проверка значимости модели при помощи теста отношения правдоподобия.
Рубрика | Экономика и экономическая теория |
Вид | реферат |
Язык | русский |
Дата добавления | 26.04.2015 |
Размер файла | 375,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ФЕДЕРАЛЬНОЕ АГЕНТСТВО СВЯЗИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«СИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ТЕЛЕКОММУНИКАЦИЙ И ИНФОРМАТИКИ» (ФГОБУ ВПО «СибГУТИ»)
БУРЯТСКИЙ ФИЛИАЛ
Реферат
По дисциплине: «Эконометрика»
на тему «Модели бинарного выбора (логит- и пробит-модели)»
Выполнил: Бадмаев В.А. гр. Э-13
Проверил: Никифоров И.К.
Улан-удэ 2015
Содержание
Введение
1. Логит- и пробит-модели
2. Статистическая значимость логит и пробит-моделей и факторов этих моделей
Список использованной литературы
Введение
Модели бинарного выбора используются, когда субъект совершает выбор между двумя возможными альтернативами. Выбор основывается на наборе некоторых входных факторов, характеризующих альтернативы и субъект. Обозначим сделанный выбор переменной Y, которая принимает значение 0, когда выбрана первая альтернатива, иначе значение 1. Входные факторы могут выражать и качественные, и количественные признаки. Задача состоит в установлении взаимосвязи между зависимой переменной и одной или более независимыми переменными, в общем случае принимающими все действительные значения. В том случае, когда возможных альтернатив несколько, модель называется моделью множественного выбора. В данной работе рассматривается модель бинарного выбора, как первый этап в изучении моделей множественного выбора. В качестве примера применения таких моделей можно привести социологический опрос или маркетинговые исследования, где выбор между альтернативами зависит от предпочтений выбирающего и характеристик объекта исследования.
1. Логит- и пробит-модели
В эконометрическом моделировании работают с переменными, которые могут быть измерены в:
1) Метрической шкале (являться количественными).
2) Порядковой шкале.
3) Номинальной шкале.
В этой главе мы рассмотрим, в частности, эконометрические модели, которые используют в том случае, когда зависимая переменная измерена в номинальной или порядковой шкале.
Предположим, что результирующий показатель у, «поведение» которого существенно зависит от количественных объясняющих переменных (матрица Х)
Х = (1, х1, ,...,хm-1) ,
является качественной переменной, определяющей одно из двух возможных состояний характеризуемого ею объекта, то есть переменной измеренной в номинальной шкале (в общем случае этих состояний может быть больше). Например, результирующему показателю
yi может быть приписано значение равное 0, если i-й индивидуум оказался безработным в обследуемом периоде времени, и 1 -- в противном случае.
То есть:
альтернатива бинарный эконометрический гипотеза
В подобных ситуациях вектор
Y = (у1, y2,…,yn)T
исходных статистических данных зависимой переменной будет состоять только из: «0» или «1
Можно ли построить линейную регрессионную модель, описывающую зависимость у от х в данном случае?
Ответ: вряд ли. Неясно, как интерпретировать в этом случае оцененные при помощи регрессии значения у, которые будут уже измерены в метрической непрерывной (количественной) шкале и могут принимать различные значения.
Поэтому для исследования статистической связи между у и Х строят некоторую специальную регрессионную модель зависимости вероятности
Р{у = 1|Х}
от линейной функции наблюдаемых факторов.
Модель бинарного выбора обосновывают при помощи скрытой (латентной) переменной. Например, предположим, что мы изучаем информацию о том, какое решение принимает замужняя женщина: работать ей, или нет. Считают, что ее потребительское и трудовое поведение описывается некоторой функцией полезности. Эта функция зависит от многих характеристик: дохода, свободного времени, наличия детей, образования. Женщина может принять решение выйти на работу, чтобы увеличить доход семьи, но при этом произойдет уменьшение времени, уделяемого детям, домашней работе и т.п. Или, она может принять решение не работать. Каждой из рассмотренных ситуаций, соответствует своя величина функции полезности. Предположим, что это величина полезности, если женщина работает, а - величина полезности, если женщина не работает.
Если >, то женщине выгоднее пойти работать, так как получаемый дополнительный доход перевешивает уменьшение времени на детей и домашние дела.
Если <, то женщина не выходит на работу.
Обозначим разность -=
и предположим, что эта величина является линейной функцией от наблюдаемых характеристик хi: величины заработной платы, возраста, наличия детей и т.д.
Предположим, что
=0+1х1+...m-1xm- 1 +
Тогда
Р{у = 1}= Р{у*0}= Р{0+1х1+...m-1xm-1 + 0}= Р{ - (0+1х1+...m-1xm-1)}=Р{- <0+1х1+...m-1xm-1}=F(0+1х1+...m-1xm-1)
Таким образом,
Р{у = 1/х}= F(0+1х1+...m-1xm-1),
где, F-это функция распределения случайной величины (- )
Во многих экономических задачах, скрытую переменную вводят сразу, считая, что:
Отметим, что случайные величины i предполагаются независимыми друг от друга, а также независимыми от хi.
Описывать вероятность непосредственно линейной функцией (то есть, выбирать в качестве F-линейную функцию), нецелесообразно, так как в этом случае значения предсказанной (вычисленной по модели) вероятности могут быть как отрицательными, так и превосходящими единицу. Вместо этого для моделирования значений
Р{у = 1|Х}
подбирают функции, область значений которых определяется отрезком [0,1], а линейная функция
z=0+1х1+...m-1xm-1
играет роль аргумента этой функции, т.е.
Р{у =1|Х} =F(0+1х1+...m-1xm-1) =F(z)
причем функции F(z)(какую бы мы не выбрали!!!) должны удовлетворять следующим требованием
График одной из функций данного вида приведен на рисунке:
.
Модели рассмотренного типа для оценивания вероятности указанного события называют обычно моделями бинарного выбора. Наиболее распространенными моделями бинарного выбора являются так называемые логит- и пробит-модели.
ОПРЕДЕЛЕНИЕ 1. Логит-модель. Модель вида (1) при условиях (2) для функции F(z), называется логит-моделью, если в качестве F(z) рассматривается логистическая функция, т. е.
Нетрудно проверить, что эта функция удовлетворяет условиям (2), ее часто обозначают через Л(z).
ОПРЕДЕЛЕНИЕ. 2 Пробит-модель. Модель вида (1) называется пробит-моделью, если в качестве F(z) рассматривается функция распределения стандартного нормального распределения, т.е.
Так же, как и функция Л(z), нормальная функция распределения F(z) удовлетворяет всем условиям (2) и является симметричной относительно z = 0.
Рисунок заимствован из книги «REGRESSION MODELS FORCATEGORICAL DEPENDENT VARIABLES USING STATA»
Оценивание параметров в логит- и пробит- моделях.
Роль функции регрессии играет функция Л(z) в логит-модели и функция F(z) в пробит-модели. Для того, чтобы оценить параметры j, например, в логит-модели, используют метод максимального правдоподобия.
Что такое функция правдоподобия?
Согласно определению, функцией правдоподобия называют функцию вида:
L=L(y1,y2,..,yn)=P{Y=y1}P{Y=y2}P{Y=yn} =
(например!)=P{Y=1}P{Y=0}…P{Y=0}
В нашем случае, исходя из (1), мы можем записать эту функцию в виде:
L(y1,y2,…,yn)=
Неизвестные параметры I и для логит и для пробит модели ищут из условия максимума функции (6). Полученные при этом оценки вi называют оценками максимального правдоподобия.
Запишем формулы для оценивания вероятности события Р{У=1/х}, она имеет вид:
Для логит модели:
Для пробит модели,
где Ф-это функция Лапласа.
Реализация процедур оценивания параметров логит и пробит моделей проводится, например, в программе Stata.
Рассмотрим, как выглядит вывод итогов в Стате.
prate mrate totpart totelg age totemp sole ltotemp
Obs: 1534
1. prate participation rate, percent
2. mrate 401k plan match rate
3. totpart total 401k participants
4. totelg total eligible for 401k plan
5. age age of 401k plan
6. totemp total number of firm employees
7. sole = 1 if 401k is firm's sole plan
8. ltotemp log of totemp
2. Статистическая значимость логит и пробит-моделей и факторов этих моделей
Проверка значимости модели при помощи теста отношения правдоподобия(тест Вальда), начинается с выдвижения основной гипотезы:
Для проверки данной гипотезы вычисляется выборочная статистика
Z*=LR
LR=2(lnL-lnL0).
Здесь lnL величина максимального значения логарифма функции правдоподобия, а lnL0- величина логарифма функции правдоподобия в случае справедливости основной гипотезы.
Если основная гипотеза верна, то выборочная статистика (4.7.1) распределена по закону 2 с (m-1) степенью свободы. Границу правосторонней критической области К2 ищут по таблицам критических точек хи-квадрат по уровню значимости (1-б) и (m-1) степени свободы. Если выполняется неравенство:
Z*? К2,
то основную гипотезу отвергают, принимают альтернативную гипотезу и говорят, что модель статистически значима. В противном случае принимают гипотезу о не значимости модели и переходят к ее пересмотру.
Для моделей бинарного выбора, значимость факторов проверяется при помощи тестирования для каждого фактора хi, i=1,…, (m-1) гипотез вида:
Н0: i=0,
Ha: i? 0.
Выборочные статистики, которые используются для тестирования этих гипотез, имеют асимптотически нормальное распределение и называются z-статистиками. Границу двусторонней критической области ищут по таблицам Лапласа по заданному уровню значимости (1-б).
Если выполняется неравенство:
К 1<Z*<К2
то принимают основную гипотезу о незначимом отличии от нуля коэффициента i и делают вывод, что соответствующий ему фактор незначим для модели.
Для моделей бинарного выбора не определяется понятие коэффициента детерминации. Однако для них определяют так называемый псевдо коэффициент детерминации, который уже не характеризует объясняющую силу модели
Определение 4.7.1. Псевдо - коэффициентом детерминации называют следующую величину:
Определение 4.7.2. Индексом отношения правдоподобия Макфаддена (McFadden) называют характеристику:
Следует подчеркнуть, что если параметры модели бинарного выбора незначимо отличаются от нуля, то оба введенных коэффициента равны нулю.
На лекции мы рассмотрели нелинейные регрессионные модели, в частности, модели для бинарной зависимой переменной. Эти модели мы рассмотрели для двух функций регрессий: логит (использовали логистическую функцию) и пробит (использовали функцию распределения стандартного нормального закона распределения). Оценки параметров таких функций регрессии получают при помощи метода максимального правдоподобия. Модель тестируют при помощи теста Вальда, в основе которого статистика, имеющая хи-квадрат распределение. При изучении многофакторных регрессионных моделей мы интерпретировали оценки параметров вj, как предельный эффект влияния независимых переменных на у. Вернемся к моделям бинарного выбора. Если мы попытаемся найти производную от P{Y=1|X}, то придем к следующему выражению:
P{Y=1|X}=
где Z= 0+1х1+...m-1xm-1.
По теореме о производной сложной функции, и из свойства плотности (производная от функции распределения это плотность распределения f(Z)), получаем:
P{Y=1|X}=
или, используя второе обозначение для оценок параметров:
P{Y=1|X}=
P{Y=1|X}=вjf(Z)
Как и раньше, через вj обозначены оценки неизвестных параметров.
Тогда, мы можем рассуждать следующим образом: плотность распределения всегда неотрицательна, поэтому знак производной
P{Y=1|X}
будет зависеть только от знака оценки параметров, но будет являться функцией всех независимых переменных. Причем, если оценка параметра будет положительной, то увеличение переменной xj будет приводить к увеличению вероятности
P{Y=1|X},
а если оценка параметра будет отрицательной, то, соответственно, к уменьшению указанной вероятности.
Замечание. Если фактор х является бинарной переменной, то для него нельзя ввести понятие предельного эффекта.
Для каждой переменной х (количественной!!!) вводят так называемый средний предельный эффект. Для этого вычисляют выборочные средние для количественных переменных и процент «1» для бинарных, и подставляют их в выражение для плотности распределения вместо переменных.
Еще один вопрос для обсуждения: как после оценивания параметров логит (пробит) модели прогнозировать значение у? Поступают, например, следующим образом. Подставляют найденные значения оценок параметров и значения хj в Z и вычисляют значение переменной. Если Z>0, то считают, что У=1, если Z<0, то считают, что У=0. Замечание. Мы рассмотрели ситуацию, когда переменная у была измерена в номинальной шкале, но принимала всего два значения: 0 и 1. В общем случае, когда у может принимать несколько значений, например 0, 1, 2, 3, используют множественный (по у!!) логит или пробит. Кроме того, у может быть измерен в порядковой шкале, тогда в Стате используют порядковый логит (пробит) ologit (oprobit).
Замечание. Очень часто в исследованиях приходится проводить исследования на усеченной выборке. Например, если изучают доходы домохозяйств, то бывают ситуацию, когда респондентов с очень большим доходом (например, больше 1 млн.рубл.) следует исключить из исследования, то есть
То в таких случаях используют Тобит-модели.
Yi |
0 |
1 |
|
Pi |
F(0+1х1+...m-1xm-1) |
F(0+1х1+...m-1xm-1) |
|
E[Y] |
F(0+1х1+...m-1xm-1) |
||
V[Y] |
F(0+1х1+...m-1xm-1) - (F(0+1х1+...m-1xm-1))2 |
Список использованной литературы
1. Носко В.П. (2000) Эконометрика для начинающих. М., ИЭПП.
2. Носко В.П. (2004) Эконометрика. Элементарные методы и введение в регрессионный анализ временных рядов. М., ИЭПП.
3. Носко В.П. (2004) Эконометрика. М., ЛОГОС.
4. Aldrich J.H., F.D. Nelson (1984) Linear Probability, Logit, and Probit Models. Beverly Hills: Sage.
5. Amemiya T. (1985) Advanced Econometrics. Blackwell, Oxford.
6. Arellano M., S. Bond (1991) "Some Tests of Specification for Panel Data: Monte-Carlo Evidence and an Application to Employment Equations", Review of Economic Studies, 58, 277-294.
7. Davidson R., J.G. MacKinnon (1993) Estimation and Inference in Econometrics. Oxford University Press, Oxford.
8. Godfrey L.G., J. Hutton (1994) “Discriminating between errors-in-variables/simultaneity and misspecification in linear regression models”, Economic Letters, 44, 359-364.
9. Green W.H. (1993) Econometric Analysis. 2rd edition, Macmillan, New York.
10. Hausman J. A. (1978) “Specification tests in econometrics”, Econometrica, 46, 1251-1271.
Размещено на Allbest.ru
Подобные документы
Сущность экономических благ. Их классификация и общая характеристика основных видов. Предпосылки теории потребительского выбора. Экономические теории и модели потребительского выбора. Особенности неэкономических факторов потребительского выбора, их виды.
курсовая работа [225,9 K], добавлен 11.01.2011Модели капитала. Совершенный рынок капиталов. Гомогенные ожидания. Только благосостояние принимается в расчет. Модели стационарного отношения. Процедура банкротства. Модели асимметричной информации. Инвестиционные модели. Проблема замещения активов.
презентация [5,8 M], добавлен 09.04.2016Многофакторная и двухвакторная модели экономического роста. Сущность цикличности, длинные волны Кондратьева. Универсальные модели экономического роста. Реальные модели: Кейнсианские модели, модель Домара, модель Харрода, неоклассические модели.
курсовая работа [147,0 K], добавлен 27.09.2002Обзор математических моделей финансовых пирамид. Анализ модели динамики финансовых пузырей Чернавского. Обзор модели долгосрочного социально-экономического прогнозирования. Оценка приоритета простых моделей. Вывод математической модели макроэкономики.
курсовая работа [1,7 M], добавлен 27.11.2017Теоретичские основы работы фондовой биржи. Общетеоретические основы множественного корреляционно-регрессионного метода анализа. Оценка качества модели множественной регрессии. Апробирование модели для прогнозирования фондового индекса РТС на 2014 год.
курсовая работа [1,8 M], добавлен 10.05.2015Общественные потери при монополизации рынка. Характеристика стратегии государственного регулирования монополий. Критерий оптимума потребителя в ординалистской модели потребительского выбора. Различие между внутренним и угловым равновесием потребителя.
контрольная работа [308,5 K], добавлен 12.02.2013Построение многофакторной модели, описывающей линейную зависимость результативного признака факторов, входящих в нее, методом матрицы. Проверка на адекватность однофакторной модели. Интервалы доверия для прогнозного значения зависимой переменной.
контрольная работа [161,4 K], добавлен 02.12.2014Основные причины возникновения автокорреляции отклонения модели. Методы выявления автокорреляции. Исследование автокорреляции случайных отклонений модели временного ряда с помощью теста Сведа-Эйзенхарта, статистики Дарбина-Уотсона и графического метода.
курсовая работа [236,0 K], добавлен 29.03.2015Поквартальные данные о кредитах от коммерческого банка на жилищное строительство за 4 года. Построение адаптивной мультипликативной модели Хольта-Уинтерса с учетом сезонного фактора. Точность, адекватность и проверка качества построенной модели.
контрольная работа [138,2 K], добавлен 05.06.2010Экономические блага и их классификация. Экономические теории и модели потребительского выбора. Факторы, негативно влияющие на рынок недвижимости и пути их устранения. Исследование предпочтений потребителей рынка недвижимости в Ярославской области.
курсовая работа [49,3 K], добавлен 13.10.2011