Моделирование времени жизни ипотечного кредита

Подходы к моделированию рисков наступления досрочного погашения и реализации залога. Проверка правильности спецификации модели и выбор наилучшей модели. Моделирование риска наступления дефолта и реализации залога. Сущность модели с ненаблюдаемым эффектом.

Рубрика Экономико-математическое моделирование
Вид дипломная работа
Язык русский
Дата добавления 30.07.2016
Размер файла 72,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

В результате оценивания получаем, что вероятность принадлежности к классу mover для первой модели равна д=(exp?(2.4593))/(1+exp?(2.4593))=0.9212403. Для второй модели соответствующая вероятность зависит от фактора и равна в среднем по всем наблюдениям 0.24.

Правильность подогнанных спецификаций проверяем на графиках оценок NA интегральной функции риска для остатков Кокса-Снелла:

Видим, что для второй модели график оценки чуть менее точный, чем для первой модели.

Сравнение между собой моделей с ненаблюдаемым эффектом и гамма регрессии с моделями mover-stayer.

Используя графики оценок NA для остатков KS, построенные на обучающей части выборки и на тестовой части выборки, сравним между собой оцененные в разделах 2) и 3) модели: логнормальную с ненаблюдаемым эффектом (Lognormal with Frailty), гамма модель, 2 модели mover-stayer с логнормальной функцией дожития и 2 mover-stayer модели с функцией дожития гамма:

Отмечаем, что все отобранные модели хорошо подгоняют наши данные (если говорить о качестве подгонки на обучающей части данных). Можно уточнить только, что модели, основанные на гамма-распределении, чуть точнее приближают на правом хвосте, однако модель mover-stayer lognormal 2 также выправляет ситуацию на правом хвосте распределения. Что касается качества прогнозирования вне выборки (на тестовой части данных), то опять же все графики очень схожи и прилично прогнозируют. Отметим, что графики оценок NA для остатков в моделях гамма регрессии и mover-stayer gamma 1, построенные на тестовой части выборки, неотличимы друг от друга. График оценки NA для остатков в модели mover-stayer gamma 2 им уступает на правом хвосте.

Итак, можем утверждать, что визуальная обработка данных не позволяет однозначно сделать выбор в пользу какой-либо из моделей. Можно выделить только группу моделей. Поэтому необходимо дополнительно воспользоваться более тонким инструментом, позволяющим различить модели. Обратимся к формальному анализу оцененных моделей на основании значений AIC.

Для этого были написаны коды для оценки гамма регрессии и логнормальной регрессии с ненаблюдаемым эффектом, поскольку встроенная программная реализация некорректно рассчитывает значения ML и AIC.

Видим, что по формальному признаку модели, основанные на гамма распределении лучше, поскольку им соответствуют меньшие значение AIC. Об этом же свидетельствуют результаты визуального анализа.

Наименьшее значение AIC - у модели mover-stayer gamma 2. Таким образом, если опираться на критерий AIC, то наилучшим образом наши данные подгоняет модель mover-stayer, в которой длительность состояния в классе кочевых описывается гамма регрессией, а вероятность принадлежности к этому классу строится как регрессия на константу и фактор realty_house. Однако с точки зрения визуального анализа остатков, данная модель не является лучшей.

Итак, гамма модель и логнормальная модель с ненаблюдаемым эффектом - очень хорошо подгоняют данные и могут быть использованы для моделирования риска наступления дефолта. С точки зрения AIC лучше приближает данные гамма модель, однако с точки зрения прогнозирования (на основании индекса Somers D, а также анализа остатков на тестовой части выборки) логнормальная модель ничуть не хуже. Более сложные модели типа mover-stayer не приводят к заметному улучшению качества подгонки. Можно только отметить, что модель mover-stayer, в которой длительность состояния в классе кочевых описывается логнормальной регрессией, а вероятность принадлежности к этому классу строится как регрессия на константу и фактор realty_house, чуть улучшает ситуацию на правом хвосте по сравнению с логнормальной моделью с ненаблюдаемым эффектом, что также подтверждается AIC. Модели mover-stayer gamma 2, построенные на основе гамма регрессии, не смотря на преимущество с точки зрения AIC, не улучшает качество подгонки.

Моделирование риска реализации залога.

Напомним, что под событием «реализация залога» по кредиту, которому присвоен статус дефолт, мы понимаем реализацию объекта недвижимости, находящегося под залогом, в рынок с торгов или постановку его на баланс кредитора вследствие невозможности его продажи с торгов.

Одномерный анализ.

Видим, что функция дожития убывает довольно медленно и доходит примерно до 60%, а после отметки 2000 дней реализаций залога практически не наблюдается. Интегральная функция риска растёт сначала возрастающим темпом, а потом убывающим темпом: среди кредитов, проживших с момента дефолта уже продолжительное время, доля реализаций меньше, чем среди недавно вошедших в дефолт.

Модели с объясняющими переменными.

Для объяснения целевого события мы отобрали следующие факторы:

Переменные, описывающие портрет основного заемщика:

mainborr_contr_07, sex, marital, educ_level1.

Переменные, характеризующие параметры кредита:

term_120, term_180, LTV_50, LTV_70.

Показатели, характеризующие параметры жилого помещения, находящегося под залогом:

region_1, realty_house, rooms_1, live_tot_06, floor_num_9.

Описание вышеперечисленных переменных для моделирования риска реализации залога содержится в части IV.

Далее определим еще 2 переменные: time_to_fcl - время до реализации залога с момента дефолта кредита, censor_realis - индикатор реализации залога (1 - залог реализован и 0 - в противном случае).

Из 13 792 кредитов, вошедших в дефолт, по 3103 наступило целевое событие.

Данные случайным образом разбиваются на 2 части: обучающая выборка (60% данных), на которой мы строим различные модели и тестовая выборка (40% данных), которая используется для оценки качества прогнозирования моделей.

Подгонка моделей.

На тестовой части выборки произведена оценка регрессии Кокса с помощью процедуры Бреслоу оценки коэффициентов для связных событий:

Модель в целом оказывается значимой, поскольку p-value модели равно 0. Почти все оценки коэффициентов получились значимыми. Для проверки правильности спецификации модели Кокса посмотрим на график оценки Нельсона-Аалена для остатков Кокса-Снелла (KS):

На графике не видно заметных отступлений от линейности, так что регрессия Кокса демонстрирует отличную подгонку к нашим данным. Поэтому анализ остатков Кокса-Снелла не даёт веских оснований считать выбранную спецификацию ошибочной. Заметим, что модель Кокса чуть-чуть занижает риск наступления досрочного погашения.

По результатам оценивания регрессии Кокса посмотрим, как различаются оценки функции дожития при различных значениях показателя LTV:

Видим, что для кредитов, проживших одинаковое время с момента дефолта, с ростом LTV доля реализаций больше и, соответственно, вероятность дожития ниже.

Для подгонки параметрической спецификации, исследуется характер временной зависимости. График показывает, что скорость роста интегрального риска немонотонна: сначала возрастает, потом убывает. Аналогичную картинку мы получили при одномерном анализе (см. рис.46).

Поэтому на данных были аппробированы различные параметрические спецификации.

Анализ остатков Кокса-Снелла показывает, что только гамма регрессия обеспечивает приемлемую подгонку данных, остальные - непригодны для целей исследования. Приводим результаты оценивания гамма-регрессии.

Поговорим о полученных оценках. Наиболее сильно на время до реализации залога влияет показатель LTV, причем направление влияния регрессора на целевую функцию отрицательное: при прочих равных характеристиках при увеличении доли заемных средств в стоимости жилья (на момент выдачи кредита) время до реализации залога с момента дефолта кредита уменьшается. Так, при прочих равных характеристиках при LTV, превосходящем 70%, время до реализации залога наступает раньше в e^0.29=1.34 раза, чем в группе кредитов с LTV в промежутке от 50% до 70%; при LTV<50% время до реализации залога увеличивается в e^0.21=1.23 раза по сравнению с о средней группой.

Если предмет ипотеки находится в развитом регионе, то время до реализации залога при прочих равных характеристиках увеличивается в e^0.25=1.28 раз по сравнению с остальными регионами.

При высоком первоначальном сроке кредита выше 180 месяцев при прочих равных характеристиках время до реализации залога наступает в e^0.165=1.2 раза быстрее, чем для кредита со сроком от 120 до 180 месяцев.

Если предмет ипотеки представляет собой жилое помещение не выше 9 этажей, то при прочих равных характеристиках время до реализации залога наступает в e^0.15=1.2 раз быстрее, чем для домов другой этажности.

При наличии высшего образования у основного заемщика время до реализации залога при прочих равных характеристиках увеличивается в e^0.127=1.1 раз.

Остальные регрессоры влияют на целевую функцию не так значительно.

Модели с ненаблюдаемой разнородностью.

Модели с ненаблюдаемым эффектом.

Ввиду того, что основные параметрические модели (кроме гибкой гамма регрессии) не обеспечили приемлемой подгонки, то мы добавили при оценивании основных моделей ненаблюдаемый эффект, имеющий гамма распределение. Вот как изменились при этом оценки NA для остатков:

Видим, что модели с ненаблюдаемым эффектом выправляют ситуацию, так что качество подгонки практически неотличимо от того, что обеспечивает гамма регрессия (кроме модели Гомперца с ненаблюдаемым эффектом, который немного уступает остальным моделям).

Сравним между собой параметрические модели: с ненаблюдаемым эффектом и гамма модель на основании критерия AIC:

Видим, что все модели очень близки по AIC, кроме модели Гомперца с ненаблюдаемым эффектом. Этот вывод совпадает с результатами визуального теста на основании остатков Кокса-Снелла. Минимальное значение AIC у регрессии Вейбулла с ненаблюдаемым эффектом и логнормальной регрессии с ненаблюдаемым эффектом.

Модели mover-stayer.

Были апробированы модели mover-stayer, в которых длительность состояния в классе кочевых описывается логнормальной моделью и моделью Вейбулла, а вероятность принадлежности к классу mover, т.е. вероятность принадлежности к классу кредитов, по которым наступает реализация - моделью logit. Выбор данных моделей для описания поведения кредитов в классе кочевых был обусловлен хорошим качеством подгонки данных, обеспечиваемым соответствующими моделями с ненаблюдаемым эффектом (по аналогии со случаем анализа дефолтов).

Как и в случае анализа дефолтов, строим 2 модели, где для описания длительности состояния в классе кочевых используется логнормальная модель:

Логнормальная mover-stayer 1 - если вероятность принадлежности к классу «mover» не зависит от факторов.

Логнормальная mover-stayer 2 - если для объяснения вероятности принадлежности к классу mover используется объясняющий фактор LTV_70 - индикатор того, что соотношение доли заемных средств к стоимости жилья на момент выдачи кредита свыше 70%.

Оцененная вероятность принадлежности к классу «mover» в модели без факторов равна 0.5755029. В модели с фактором логнормальной mover-stayer 2 оцененная вероятность равна в среднем по всем наблюдениям 0.42.

Визуальный анализ остатков показывает, что выбранные спецификации верны и приближают похожим образом, так что различить, какая точнее, позволит только анализ на основании критерия AIC.

Модели mover-stayer, в которых длительность состояния в классе кочевых описывается моделью Вейбулла, не дали желаемого качества подгонки. Визуально видно, что характер приближения хуже, чем у логнормальных спецификаций:

Выбор наилучшей модели.

Сравним модели с ненаблюдаемым эффектом: Вейбулла и логнормальную с моделями mover-stayer на основании AIC. Для того, чтобы получить сопоставимые оценки, были переписаны коды для оценивания моделей с ненаблюдаемым эффектом. Примерные коды по оцениванию моделей с ненаблюдаемым эффектом приводятся в Приложении на стр. 83-84.

Видим, что наименьшее значения AIC у модели Логнормальной Mover-stayer 2, хотя с точки зрения визуального анализа остатков Кокса-Снелла все модели обеспечивают примерно одинаковое качество подгонки (см. рис. 54,56,57,58).

Теперь сравним между собой непараметрическую регрессию Кокса и, параметрические модели из таблицы 6 по прогнозной силе, следуя изложенному в III.II алгоритму.

Посмотрим, как прогнозируют модели вне выборки. Для этого проведем анализ остатков Кокса-Снелла данных моделей, построенных на данных тестовой части выборки:

Видим, что все модели прогнозируют похожим образом. Можно сказать, что модель Логнормальная mover-stayer 2 менее точно, хотя не очень значительно. Таким образом, визуальный анализ не позволяет однозначно выбрать, какая модель лучше прогнозирует вне выборки. Все они годятся для целей исследования.

Теперь сравним регрессию Кокса и, скажем, регрессию Вейбулла с ненаблюдаемым эффектом формально с помощью индекса Somer's D.

На обучающей выборке оценим 3 модели Кокса: на полном наборе факторов и 2 модели - на части факторов. По результатам оценивания создадим переменные invhr1, invhr2, и invhr3, равные обратной величине относительного риска hazard ratio. Далее на наблюдениях контрольной части выборки рассчитываем индекс Somers' D для всех трех моделей:

Различие между оцененными моделями:

Результаты сравнения показывают, что модели немного различаются: максимальное различие наблюдается между моделями 1 и 3, чуть меньше различаются модели 1 и 2. Из оценки заключаем, что модель с полным набором факторов (модель 1) обладает наибольшей прогнозной силой.

Повторим аналогичные манипуляции для регрессии Вейбулла с ненаблюдаемым эффектом, то есть на тестовой части выборки оценим 3 модели на том же наборе факторов и сравним их между собой, используя квантили medsurv1, medsurv2, medsurv3 - предсказанные медианы времени жизни. Далее на наблюдениях тестовой части выборки рассчитываем индекс Somers' D для всех трех моделей:

Различие между оцененными моделями:

В целом, результаты аналогичны выводам, полученным ранее для модели Кокса. Модели различаются, и модель с полным набором факторов обладает наибольшей прогнозной силой.

Если сравнивать между собой регрессию Кокса и регрессию Вейбулла с ненаблюдаемым эффектом, опираясь на индекс Somers' D, то можно сказать, что регрессия Кокса незначительно лучше прогнозирует вне выборки. Поскольку разница между моделями не очень значительная, то обе модели подходят для целей исследования.

Выводы

В настоящей работе были апробированы различные подходы к моделированию функций риска наступления досрочного погашения и дефолта, а также риска реализации залогового жилья с торгов или баланса кредитора для целей описания временной структуры рисков (досрочного погашения и дефолта) в денежных потоках по розничным кредитам. Моделирование производилось с помощью техники, разработанной для исследования моделей длительности состояния. Исследовалась зависимость данных функций от специфических факторов, свойственных определенной группе кредитов, и временного фактора - времени жизни кредита, оценивающего «эффект сезонности» одновременно с «эффектом выгорания». Все необходимые расчеты и оценки моделей были произведены в пакете Stata. В итоге достигнуты следующие результаты:

Риск наступления досрочного погашения.

Для объяснения риска наступления досрочного погашения были отобраны 2 модели:

непараметрическая модель пропорциональных рисков Кокса,

AFT модель (модель ускоренного времени) обобщенной гамма регрессии.

С точки зрения анализа остатков Кокса-Снелла, обе модели демонстрируют очень точную подгонку к данным. Если сравнивать модели по прогнозной силе, то гамма регрессия точнее прогнозирует вне выборки (на тестовой части данных).

Было выявлено, что на риск наступления досрочного погашения наиболее сильно влияет срок кредита. Оцененное направление влияния регрессора на целевую функцию свидетельствует об уменьшении риска наступления досрочного погашения с ростом срока кредита.

Показатель PTI, характеризующий долю платежа в совокупном доходе основного заемщика и созаемщиков, является вторым по силе влияния на целевую функцию. С увеличением значения показателя PTI, то есть с увеличением долговой нагрузки, заемщик менее интенсивно осуществляет досрочное погашение.

Среди значимых факторов, повышающих интенсивность досрочного погашения, можно отметить в порядке убывания влияния следующие показатели: однокомнатное жилье, наличие высшего образования или ученой степени у заемщика, кредитная ставка, LTV выше 70%, тип занятости основного заемщика, возраст основного заемщика до 35 лет.

В качестве продолжения исследования было бы интересно изучить влияние изменения платежеспособности заемщика на риск наступления досрочного погашения, то есть включить в модель динамический показатель (PTI)t. Для этого потребуется расширенная информация о клиенте в разные периоды жизни кредита, начиная с момента выдачи. К сожалению, данная информация отсутствует в базе данных Агентства.

Не слишком значительным оказалось влияние кредитной ставки на интенсивность досрочного погашения. Исходя из опыта американских ученых, для исследования влияния ставки лучше использовать динамический показатель - стимул рефинансирования (С/R)t, равный отношению собственной кредитной ставки coupon rate к рыночной ставке prevailing rate (ставке рефинансирования) в каждый момент жизни закладной, начиная с момента выдачи. Этот рыночный фактор является одной из важнейших детерминант досрочного погашения.

Риск наступления дефолта.

Для объяснения риска наступления дефолта была протестирована непараметрическая регрессия пропорциональных рисков Кокса. Она не обеспечила желаемую подгонку к данным, поскольку в данных была выявлена ненаблюдаемая, то есть не описываемая объясняющими переменными, разнородность. Ввиду того, что риски в модели не пропорциональны, для целей исследования были отобраны следующие параметрические спецификации:

AFT модель (модель ускоренного времени) обобщенной гамма регрессии,

логнормальная модель с ненаблюдаемым эффектом, имеющим гамма распределение.

Обе модели обеспечивают очень хорошую подгонку к данным, однако с точки зрения визуального анализа остатков Кокса-Снелла гамма регрессия чуть точнее объясняет на правом хвосте. Параметрический анализ на основании значения критерия Акаике рекомендует сделать выбор в пользу гамма регрессии, однако сравнение моделей по прогнозной силе показывает, что логнормальная модель с ненаблюдаемым эффектом чуть точнее прогнозирует вне выборки (на тестовой части данных).

Поскольку в данных был выявлен ненаблюдаемый эффект, также были протестированы различные модели разделенной совокупности mover-stayer, причем коды для их оценивания были написаны вручную ввиду их отсутствия в пакете Stata. Чтобы улучшить качество подгонки, обеспечиваемое гамма регрессией и логнормальной регрессией с ненаблюдаемым эффектом, в первую очередь, на правом хвосте, были построены модели, в которых для описания длительности состояния в классе mover использовались те же распределения - гамма функция и логнормальная функция. При этом вероятность принадлежности к классу mover описывалась с помощью logit модели.

В результате мы пришли к выводу, что более сложные модели типа mover-stayer не приводят к заметному улучшению качества подгонки, обеспечиваемому гамма регрессией и логнормальной регрессией с ненаблюдаемым эффектом. Можно только отметить, что модель mover-stayer, в которой длительность состояния в классе кочевых описывается логнормальной регрессией чуть улучшает качество подгонки на правом хвосте по сравнению с логнормальной моделью с ненаблюдаемым эффектом.

Отметим некоторые наиболее существенные зависимости, выявленные в результате оценивания гамма регрессии. Дефолт по кредиту наступает раньше,

если тип предмета ипотеки под залогом - дом или таунхаус,

чем выше доля заемных средств в стоимости жилья,

если предмет ипотеки находится в недостаточно развитом регионе,

и позже, если

если основной заемщик имеет высшее образование,

если предмет ипотеки представляет собой однокомнатное жилье.

В качестве дальнейшего исследования факторов, влияющих на риск наступления дефолта, было бы интересно включение в модель рыночного фактора - изменение рыночных цен на залоговый актив, то есть динамического показателя (LTV)t. Для включения данного показателя в модель необходим периодический мониторинг рыночных цен жилья на основании данных риэлторских агентств.

Исследование времени до реализации залога.

Для целей исследования отобраны следующие модели:

непараметрическая модель пропорциональных рисков Кокса,

параметрическая модель Вейбулла с ненаблюдаемым эффектом.

параметрическая логнормальная регрессия с ненаблюдаемым эффектом.

С точки зрения анализа остатков Кокса-Снелла, все три модели демонстрируют очень точную подгонку к данным. Параметрические модели практически неотличимы друг от друга, что подтверждает визуальный анализ и практически совпадающие значения AIC.

Если сравнивать модели по прогнозной силе, то регрессия Кокса точнее прогнозирует вне выборки (на тестовой части данных), чем регрессия Вейбулла с ненаблюдаемым эффектом, хотя не очень значительно.

Также на данных были протестированы модели mover-stayer, в которых длительность состояния в классе кочевых описывается логнормальной функцией. В результате получены оценки, очень схожие по характеру приближения данных с предыдущими моделями. Таким образом, усложнение моделей не приводит к заметному улучшению качества подгонки.

Отметим, что наиболее сильно на время до реализации залога влияет показатель LTV, а также нахождение предмета ипотеки в развитом регионе. При прочих равных характеристиках при увеличении доли заемных средств в стоимости жилья (на момент выдачи кредита) время до реализации залога с момента дефолта кредита уменьшается. Нахождение предмета ипотеки в развитом регионе увеличивает время до реализации залога при прочих равных характеристиках по сравнению с остальными регионами.

В качестве дальнейшего исследования факторов, влияющих на время до реализации залога, было бы интересно включение в модель рыночного фактора - изменение рыночных цен на залоговый актив, то есть динамического показателя (LTV)t.

Итак, отдельным направлением по развитию и расширению задач, связанных с описанием временной структуры рисков (досрочного погашения, дефолта и реализации залога) в денежных потоках по розничным кредитам, является внедрение рыночных факторов, а также совместная их оценка с индивидуальными характеристиками кредита и связанного с ним актива. Примерами таких рыночных факторов помимо рассмотренных выше эффектов рыночной ставки и динамики рыночных цен на залоговый актив, могут также выступать рыночные факторы, влияющие на входящий поток денежных средств, используемых клиентом (заемщиком) для облуживания кредита, как например уровень безработицы, рост инфляции и др.

Также интересным направлением для работы представляется исследование опционной модели рисков на данных российского рынка ипотеки, то есть учет рисков наступления досрочного погашения и дефолта в одной модели.

Библиография

Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики // М.: ЮНИТИ.1998.

Гнеденко Б.В., Беляев Ю.К., Соловьев А.Д. Математические методы в теории надежности. М.: Наука, 1965.

Ратникова Т.А., Фурманов К.К. Анализ панельных данных и данных о длительности состояния. Издательский дом Высшей школы экономики. 2014.

РИАРЭЙТИНГ Рейтинговое Агентство Рейтинг социально-экономического положения субъектов РФ. Итоги 2013 года. http://www.riarating.ru/

Aalen O.O. Nonparametric Inference for a Family of Counting Processes // Annals of Statistics.1978. Vol. 6. P. 701-726.

Asay M., Guillaume F.H., Mattu R.K. Duration and Convexity of Mortgage Backed Securities: Some Hedging Implications from a Prepayment Linked Present Value Model. In Mortgage Backed securities, edited by Frank Fabozzi. Chicago: Probus Publishing. 1987.

Breslow N.E. Covariance Analysis of Censored Survival Data. Biometrics. 1974. Vol. 30. P.89-99.

Chinloy P. The Option Structure of a Mortgage Contract// Journal of Housing Research. 1991. Vol. 2(1). P.21-38.

Cox D.R. Regression Models and Life-Tables // Journal of the Royal Statistical Society. Ser. B. 1972. Vol. 34. P.187-220.

Cox D.R., Oakes D. Analysis of Survival Data // London: Chapman and Hall. 1984.

Cleves M.A., Gould W.W., Gutierrez R.G. An Introduction to Survival Analysis Using Stata. Revised Edition. Stata Press, 2004.

Demyanyk Y., Hemert O.V. Understanding the Subprime Mortgage Crisis // The Review of Financial Studies. 2011. Vol. 24. 6. P. 1848-1880.

Deng Y., Quigley J.M., van Order R. Mortgage Terminations, Heterogeneity and the Exercise of Mortgage Options // Econometrica. 2000. Vol. 68. 2. P. 275-307.

Davidson A., Sanders A., Wolff L-L., Ching A. Securitization. Structuring and Investment Analysis. John Wiley @ Sons, Inc. Hoboken. New Jersey. 2003.

Box-Steffensmeier J. M., Jones B.S. Event History Modelling: A Guide for Social Scientists. Cambridge University Press, 2004.

Grambsch P.M., Therneau T.M. Proportional hazards tests and diagnostics based on weighted residuals. Biometrica. 81. 1994. P.515-526.

Green J.R., Shoven J.B. The effects of Interest Rates on Mortgage Payments// Journal of Money, Credit and Banking. 1986. Vol. 36(1). P.41-58.

Kalbfleisch J.D. and Prentice R.L. The Statistical Analysis of Failure Time Data. 2d ed. New York: John Wiley & Sons. 2002.

Kang P., Zenios S.A. Complete Prepayment Models for Mortgage-Backed Securities // Management Science. 1992. Vol. 38(11). P.1665-1685.

Kaplan E.L., Meier P. Non-parametric Estimation from Incomplete Observations // Journal of American Statistical Association. 1958. Vol. 53. P.457-481.

Nelson W. Theory and Applications of Hazard Plotting for Censored Failure Data // Technometrics.1972. Vol. 14. P. 945-965.

Newson R.B. Comparing the predictive powers of survival models using Harrell's C or Somers' D // The Stata Journal. 2010. 10. Number 3, P. 339-358.

Scott F. R., Roll R. Prepayments on Fixed-rate Mortgage-backed Securities // Journal of Portfolio Management.1989. P.73-82.

Rodriguez G. Survival Models // Quantile №.5. 2008. P.1-27.

Sasieni P.D., Winnett A. Martingale Difference Residuals as a Diagnostic Tool for the Cox Model. Biometrica. Vol. 90. 2003. P. 899-912.

Schmidt P., Witte A.D. Predicting Criminal Recidivism Using “Split Population” Survival Time Models. NBER Working Paper No. 2445. 1987.

Schmidt P., Witte A.D. Predicting Criminal Recidivism Using Survival Models. N.Y.:Springer-Verlag, 1988.

Schoenfeld D. Partial Residuals for the proportional hazards regression model. Biometrica. 69. 1982. P.239-241.

Schwartz E.S., Torous W.N. Prepayment and the Valuation of Mortgage Backed Securities // Journal of Finance. 1989. Vol 44(2). P.375-392.

Stepanova M., Thomas L. C. PHAB Scores: Proportional Hazards Analysis Behavioural Scores //The Journal of the Operational Research Society. 2001. Vol. 52. 9. P. 1007-1016.

Thomas L. C. Consumer Credit Models: Pricing, Profit and Portfolios. Oxford University Press. 2009.

Приложение

Модели mover-stayer для исследования риска наступления дефолта.

//Mover-stayer model for log-normal survival function and logit - mover-class probability

stset time_to_default , failure(censor_del)

program drop movstay_lnormal

program define movstay_lnormal

args lnf xb za sigma

tempvar p s d mu

quietly gen double `mu'=`xb'

quietly gen double `d'=exp(`za')/(1+exp(`za'))

quietly gen double `s'=1-`d'+`d'*(1-normal((ln($ML_y1)-`mu')/`sigma'))

quietly gen double `p'=ln(`d')+lnnormalden((ln($ML_y1)-`mu')/`sigma')-ln(`sigma'*$ML_y1)

quietly replace `lnf'=$ML_y2*(`p')+(1-$ML_y2)*ln(`s')

end

ml model lf movstay_lnormal (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_house rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = realty_house) /sigma if test==1

//ml model lf movstay_lnormal (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_house rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = ) /sigma if test==1

ml max

est store movst_lognorm_1

//est store movst_lognorm_2

estat ic

est tab movst_lognorm_1 movst_lognorm_2, b(%7.4f) star

//Mover class probability calculation

drop za prob

predict za, eq(logit)

gen prob=exp(za)/(1+exp(za))

sum prob

// Cox-Snell Residuals calculation

drop xb

drop S

drop H_na

drop S_mover S

predict xb, eq(duration)

gen S_mover=1-normal((ln(time_to_default)-xb)/ 1.401899)

gen S=prob*S_mover+(1-prob)

gen H_na=-ln(S)

// Cox-Snell Residuals on teaching data

drop H11

stset H_na if test==1, fail(censor_del)

sts gen H11=na

line H11 H_na H_na if test==1, sort ytitle("") legend(cols(1))

// Cox-Snell Residuals on test data

drop H11

stset H_na if test==0, fail(censor_del)

sts gen H11=na

line H11 H_na H_na if test==0, sort ytitle("") legend(cols(1))

//Mover-stayer model for gamma survival function and logit - mover-class probability

stset time_to_default , failure(censor_del)

program drop movstay_gamma

program define movstay_gamma

args lnf xb za ln_sigma kappa

tempvar p s d mu d sigma gamma z u surv

quietly gen double `mu'=`xb'

quietly gen double `d'=exp(`za')/(1+exp(`za'))

quietly gen double `sigma'=exp(`ln_sigma')

quietly gen double `gamma'=(abs(`kappa'))^(-2)

quietly gen double `z'=sign(`kappa')*((log($ML_y1)-`xb')/`sigma')

quietly gen double `u'=`gamma'*exp(abs(`kappa')*`z')

if `kappa'>0 quietly gen double `surv'=1-gammap(`gamma',`u')

else if `kappa'==0 quietly gen double `surv'=1-normal(`z')

else if `kappa'<0 quietly gen double `surv'=gammap(`gamma',`u')

quietly gen double `s'=1-`d'+`d'*`surv'

if `kappa'==0 quietly gen double `p'= ln(`d')-ln(`sigma'*$ML_y1)-0.5*ln(_pi*2)-0.5*`z'^2

else quietly gen double `p'= ln(`d')+`gamma'*ln(`gamma')+`z'*sqrt(`gamma')-`u'-ln(`sigma'*$ML_y1)-0.5*ln(`gamma')-lngamma(`gamma')

quietly replace `lnf'=$ML_y2*(`p')+(1-$ML_y2)*ln(`s')

end

//ml model lf movstay_gamma (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_h rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = realty_house) /sigma /kappa if test==1 , technique(dfp)

ml model lf movstay_gamma (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_h rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = ) /sigma /kappa if test==1 , technique(dfp)

ml max

est store movst_gamma_1

est store movst_gamma_2

estat ic

est tab movst_gamma_1 movst_gamma_2, b(%7.4f) star

Модели с ненаблюдаемым эффектом для исследования риска реализации залога.

//Fitting Weibull Distribution with Frailty Gamma

stset time_to_fcl , failure (censor_realis)

program drop WeibFrailty_llog

program define WeibFrailty_llog

args lnf xb p ln_theta

tempvar ln_dens s l theta surv

quietly gen double `l'=exp(`xb')

quietly gen double `theta'=exp(`ln_theta')

quietly gen double `surv'=exp(-`l'*($ML_y1)^`p')

quietly gen double `s'=(1-`theta'*ln(`surv'))^(-1/`theta') //survival

quietly gen double `ln_dens'=(1+`theta')*ln(`s')+ln(`l')-`l'*($ML_y1)^`p'+ln(`p')+(`p'-1)*ln($ML_y1)-ln(`surv')

quietly replace `lnf'=$ML_y2*(`ln_dens')+(1-$ML_y2)*ln(`s')

end

ml model lf WeibFrailty_llog (duration: time_to_fcl = floor_num_9 mainborr_contr_07 educ_level1 live_tot_06 region_1 marital realty_house rooms_1 LTV_50 LTV_70 term_120 term_180)(censor: censor_realis= ) /theta if test==1, technique(dfp)

ml max

estat ic

//Fitting Lognormal Distribution with Frailty Gamma

stset time_to_fcl , failure (censor_realis)

program drop LogNormalFrailty_llog

program define LogNormalFrailty_llog

args lnf xb ln_sigma ln_theta

tempvar p s l theta surv sigma

quietly gen double `l'=exp(`xb')

quietly gen double `theta'=exp(`ln_theta')

quietly gen double `sigma'=exp(`ln_sigma')

quietly gen double `surv'=1-normal(ln(`l'*$ML_y1)/`sigma')

quietly gen double `s'=(1-`theta'*ln(`surv'))^(-1/`theta') //survival

quietly gen double `p'=(1+`theta')*ln(`s')+lnnormalden(ln(`l'*$ML_y1)/`sigma')-ln(`sigma'*$ML_y1)-ln(`surv')

quietly replace `lnf'=$ML_y2*(`p')+(1-$ML_y2)*ln(`s')

end

ml model lf LogNormalFrailty_llog (duration: time_to_fcl = floor_num_9 mainborr_contr_07 educ_level1 live_tot_06 region_1 marital realty_house rooms_1 LTV_50 LTV_70 term_120 term_180)(censor: censor_realis = ) /theta if test==1 //, technique(dfp)

ml max

estat ic

Размещено на Allbest.ru


Подобные документы

  • Сущность экономико-математической модели, ее идентификация и определение достаточной структуры для моделирования. Построение уравнения регрессии. Синтез и построение модели с учетом ее особенностей и математической спецификации. Верификация модели.

    контрольная работа [73,9 K], добавлен 23.01.2009

  • Процедура проведения имитационных экспериментов с моделью исследуемой системы. Этапы имитационного моделирования. Построение концептуальной модели объекта. Верификация и адаптация имитационной модели. Метод Монте-Карло. Моделирование работы отдела банка.

    курсовая работа [549,5 K], добавлен 25.09.2011

  • Возможные ошибки спецификации модели. Симптомы наличия ошибки спецификации первого типа. Проблемы с использованием замещающих переменных. Построение функции Кобба-Дугласа. Проверка адекватности модели. Переменные социально-экономического характера.

    презентация [264,5 K], добавлен 19.01.2015

  • Графический метод решения и построение экономико-математической модели производства. Определение выручки от реализации готовой продукции и расчет оптимального плана выпуска продукции. Баланс производства проверка продуктивность технологической матрицы.

    задача [203,4 K], добавлен 03.05.2009

  • Сущность и содержание метода моделирования, понятие модели. Применение математических методов для прогноза и анализа экономических явлений, создания теоретических моделей. Принципиальные черты, характерные для построения экономико-математической модели.

    контрольная работа [141,5 K], добавлен 02.02.2013

  • Базовые принципы и приемы, используемые при имитационном моделировании доходности финансового актива. Построение модели, способной прогнозировать доходность акции компании "РосНефть" через индекс MICEX и нефть марки Brent. Проверка модели на адекватность.

    контрольная работа [415,5 K], добавлен 11.12.2014

  • Анализ роли инвестиций в накоплении капитала. Общая характеристика модели динамики капитала, предложенной выдающимся польским ученым Михаилом Калецким. Примеры оценки результатов реализации различных инвестиционных проектов при помощи моделирования.

    контрольная работа [112,5 K], добавлен 01.08.2010

  • Построение имитационной модели бизнес-процесса "Управление инцидентами" компании "МегаФон" с целью прогнозирования совокупной стоимость ИТ-сервиса по обслуживанию инцидентов. Разработка моделирующих алгоритмов для реализации компьютерных программ модели.

    курсовая работа [2,6 M], добавлен 09.04.2012

  • Понятие и сущность инвестиционной активности. Построение регрессионной модели и анализ деревообрабатывающей отрасли. Корректировка вида модели за счет выявленных особенностей. Статистический и описательный анализ выборки и эмпирическое моделирование.

    дипломная работа [1,9 M], добавлен 22.01.2016

  • Исследование особенностей разработки и построения модели социально-экономической системы. Характеристика основных этапов процесса имитации. Экспериментирование с использованием имитационной модели. Организационные аспекты имитационного моделирования.

    реферат [192,1 K], добавлен 15.06.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.