Моделирование вероятности банкротства предприятий: сравнительный анализ методов
Основные методы оценки вероятности банкротства предприятий: дискриминантный анализ, модели бинарного выбора, методы искусственного интеллекта. Особенности исследования зависимости банкротства предприятия от некоторых финансовых и нефинансовых показателей.
Рубрика | Экономика и экономическая теория |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 01.12.2019 |
Размер файла | 4,9 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
,
где: - вес k-ого нейрона на шаге обучения t+1,
- вес k-ого нейрона на шаге обучения t,
- параметр скорости спуска.
3. Описание и анализ исходных данных
3.1 Описание выборки и переменных
Массив данных был составлен на основе финансовых и нефинансовых показателей российских компаний. Источниками информации для сбора данных послужили:
база данных СПАРК;
федеральная служба государственной статистики;
единый федеральный реестр сведений о банкротстве.
Всего в массив вошло 1028 предприятий разного размера, организационно - правовой формы, отрасли, статута, из них предприятий, являющихся банкротами, всего 366.
Данные относятся к типу кросс-секционных. Информация по дефолтным компаниям бралась за год до их предположительного банкротства. Это позволит определять компании, которые окажутся несостоятельными в ближайший год.
В процессе формирования выборки возникли некоторого рода ограничения. Поскольку многие исследователи используют подход Альтмана, подразумевающий соотнесение активных и неактивных компаний по размеру, предполагалось отобрать предприятия по аналогичному принципу. Однако собственники обанкротившихся компаний в течение нескольких месяцев ликвидируют остатки отчетностей со всевозможных ресурсов, в связи с чем множество с данными банкротов достаточно мало.
В качестве данных использовались, как было сказано выше, нефинансовые показатели, и финансовые коэффициенты, составленные на основе годовых данных финансовой отчетности.
Описание нефинансовых переменных
Как уже было сказано в предыдущей главе, одних финансовых переменных бывает недостаточно для анализа, поскольку есть другие причины помимо финансов, оказывающие влияние на состоятельность компании. В массиве данных всего присутствует 5 переменных, характеризующих не финансовые показатели предприятия, из них 4 будут использоваться в качестве независимых переменных для моделирования.
Первый показатель, который впоследствии будет зависимой переменной при построении моделей - это статус предприятия. Переменная принимает значение 1, если компания является неактивной, и 0, если предприятие действующее. Стоит отметить, что из неактивных предприятий в выборку вошли только те, которые были ликвидированы исключительно вследствие банкротства. Случаи добровольной или принудительной ликвидации, а также предприятия, закрытые по другим причинам, не рассматривались.
Следующий показатель - отрасль компании. Все предприятия были разделены на 10 отраслей исходя из информации о виде их деятельности. Компании в массиве данных относятся к следующим отраслям:
металлообработка изделий;
черная металлургия;
цветная металлургия;
производство готовых металлических изделий;
литейная промышленность;
керамическая промышленность;
производство металлоконструкций;
ювелирная промышленность;
трубная промышленность (изготовление труб и трубных изделий);
прокатное производство.
Далее - форма организации предприятия. В данных присутствует разделение на три формы:
общества с ограниченной ответственностью;
непубличные акционерные общества;
публичные акционерные общества.
Четвертый показатель - размер компании. По размеру предприятия поделены на 4 вида:
микро-предприятия;
малые предприятия;
средние предприятия;
крупные предприятия.
Последняя переменная относится к организационно-правовой форме компании, из которых выделяются:
федеральная собственность,
иностранная собственность,
объединенная иностранная собственность;
смешанная частная и федеральная собственность;
частная собственность.
Описание финансовых переменных
Из множества финансовых показателей, посчитанных на основе данных финансовой отчетности предприятий, в выборку вошли 11 наиболее часто применяющихся в моделировании, в частности теми авторами, чьи работы были описаны в первой главе(HyunjoonK., ZhengG., 2010).
Первая переменная - уставной капитал предприятия (в рублях) - денежные средства, которые вносятся участниками при регистрации предприятия. Эти средства формируют ресурсную базу для ведения бизнеса на старте, и чем выше сумма уставного капитала, тем более привлекательной кажется компания для инвесторов.
Коэффициент текущей ликвидности - показывает способность компании погашать текущие (краткосрочные) обязательства за счёт только оборотных активов. Чем ниже данный показатель, тем выше вероятность банкротства компании.
Коэффициент концентрации собственного капитала (автономии) - показывает долю активов организации, которые покрываются за счет собственного капитала (обеспечиваются собственными источниками формирования). Оставшаяся доля активов покрывается за счет заемных средств.
Коэффициент обеспеченности собственными оборотными средствами - показывает степень обеспеченности организации собственными оборотными средствами, необходимыми для ее финансовой устойчивости.
Коэффициент соотношения заемных и собственных средств - показывает, сколько приходится заемных средств на 1 руб. собственных средств.
Рентабельность активов- характеризует степень эффективности использования имущества организации, профессиональную квалификацию менеджмента предприятия.
Рентабельность затрат - показывает сколько предприятие получает прибыли с каждого рубля, затраченного на производство и реализацию продукции.
Чистые активы (в рублях) - фактическая стоимость имущества, имеющаяся у компании - разница между активами и обязательствами предприятия.
Рентабельность капитала- показывает величину прибыли, которую получит предприятие на единицу стоимости собственного капитала.
Рентабельность продаж - показывает, какую сумму прибыли получает предприятие с каждого рубля проданной продукции.
Чистая прибыль (чистый доход в рублях) - часть прибыли организации, которая остается после уплаты налогов, отчислений, сборов и иных платежей в государственный бюджет.
3.2 Статистический анализ переменных
Ниже представлена таблица с обозначением переменных, использующихся для моделирования (Таблица 3).
Таблица 3 - Перечень моделируемых показателей
Обозначение |
Наименование |
|
status |
Статус |
|
industry |
Отрасль |
|
organization |
Организационно-правовая форма |
|
ownership |
Форма собственности |
|
size |
Размер компании |
|
equity_cap |
Уставный капитал (руб) |
|
current_liquid |
Коэффициент текущей ликвидности |
|
autonomy_ratio |
Коэффициент концентрации собственного капитала (автономии |
|
self_sufficiency |
Коэффициент обеспеченности собственными оборотными средствами |
|
debt_to_equity |
Коэффициент соотношения заемных и собственных средств |
|
net_assets |
Чистые активы (руб) |
|
roa |
Рентабельность активов |
|
value_for_money |
Рентабельность затрат |
|
roe |
Рентабельность капитала |
|
ros |
Рентабельность продаж |
|
net_income |
Чистая прибыль (руб) |
По каждой финансовой переменной были рассчитаны базовые описательные статистики, характеризующие показатели для средней фирмы (Таблица 4).
Из таблицы видно, что переменные имеют сильный разброс в значениях, особенно те, которые выражены в тысячах рублей. Для дальнейшего моделирование рациональным шагом будет масштабирование данных путем, например, взятия натурального логарифма от той или иной переменной.
Поскольку финансовые данные предприятий разного статуса отличаются, описательные статистики также были рассчитаны для двух подвыборок: банкротов и действующих предприятий (Таблицы 5-6).
Таблица 4 - Описательные статистики переменных
Переменная |
Среднее |
Минимум |
Максимум |
Стандартное отклонение |
|
equity_cap |
1.469*107 |
0 |
2.133*109 |
112284643 |
|
current_liquid |
2.758 |
0.017 |
363.01 |
13.42 |
|
autonomy_ratio |
0.288 |
-5.205 |
8.98 |
0.545 |
|
self_sufficiency |
-0.072 |
-50.672 |
3.18 |
1.952 |
|
debt_to_equity |
26.43 |
-940.206 |
3340.86 |
147.87 |
|
net_assets |
48206498 |
-665083000 |
2511177000 |
136167438 |
|
roa |
12.208 |
-1.632 |
3807.32 |
137.72 |
|
value_for_money |
0.079 |
-0.299 |
16.76 |
0.558 |
|
roe |
1.098 |
-822.34 |
1474 |
54.686 |
|
ros |
0.058 |
-0.545 |
2.77 |
0.163 |
|
net_income |
11449599 |
-384161000 |
401391000 |
40213244 |
Таблица 5 - Описательные статистики переменных для действующих предприятий
Действующие |
||||
Переменная |
Среднее |
Максимум |
Минимум |
|
equity_cap |
14 848 311 |
2 132 979 600 |
773 |
|
current_liquid |
2,67489922 |
363,0133 |
0,0173 |
|
autonomy_ratio |
0,33306946 |
32,7 |
-5,2051 |
|
self_sufficiency |
-0,0852649 |
11,7355 |
-50,672 |
|
debt_to_equity |
28,7474229 |
3340,8621 |
-940,2062 |
|
net_assets |
43 881 099 |
2 511 177 000 |
-1 483 786 000 |
|
roa |
21,0873663 |
3807,32 |
-1,6321 |
|
value_for_money |
0,02654863 |
16,7606 |
-49,9213 |
|
roe |
1,05979187 |
1474 |
-822,3471 |
|
ros |
0,06208503 |
3,3682 |
-4,4664 |
|
net_income |
9 665 105 |
401 391 000 |
-1 499 991 000 |
Таблица 6 - Описательные статистики переменных для недействующих предприятий
Недействующие |
||||
Переменная |
Среднее |
Максимум |
Минимум |
|
equity_cap |
12 645 919 |
1 599 700 000 |
773 |
|
current_liquid |
2,62821765 |
363,0133 |
0,0173 |
|
autonomy_ratio |
0,33270323 |
32,7 |
-5,2051 |
|
self_sufficiency |
-0,0859789 |
11,7355 |
-50,672 |
|
debt_to_equity |
28,8009182 |
3340,8621 |
-940,2062 |
|
net_assets |
41 497 975 |
1 293 048 000 |
-1 483 786 000 |
|
roa |
21,1298167 |
3807,32 |
-1,6321 |
|
value_for_money |
0,02570167 |
16,7606 |
-49,9213 |
|
roe |
1,06120312 |
1474 |
-822,3471 |
|
ros |
0,06170902 |
3,3682 |
-4,4664 |
|
net_income |
9 274 656 |
396 928 000 |
-1 499 991 000 |
Помимо описательных статистик был проведен анализ корреляционной матрицы, объясняющий тип и силу связи между переменными, а также наличие проблемы мультиколлинеарности (Рис.5). Матрица показывает, что наиболее сильные связи наблюдаются между уставным капиталом и чистыми активами (значение корреляции - 0,64), а также между чистыми активами и чистой прибылью (корреляция - 0,54). С финансовой точки зрения эти взаимосвязи объяснимы. Чистые активы характеризуют величину капитала компании после уплаты всех обязательств, эти средства должны преувеличивать первоначальный капитал предприятия. Чем выше величина чистых активов, то есть чем больше реальных средств у компании в обороте, тем выше будет ее доход после уплаты всех платежей в бюджет.
Рис. 5 - Корреляционная матрица
Несмотря на положительную корреляцию между двумя парами независимых переменных, можно судить об отсутствии проблемы мультиколлинеарности. Связь между переменными заметна, но не абсолютна.
3.3 Исследование зависимости банкротства предприятия от некоторых финансовых показателей
Одним из методов оценки вероятности банкротства предприятия является экспертный анализ (Журова Л.И., Шехтман А.Ю., 2010). Уже на данном этапе, имея все необходимые данные о финансовых и нефинансовых показателях, можно определить, какие предприятия более подвержены риску финансовой несостоятельности.
Для начала проверим зависимость банкротства предприятия от некоторых финансовых показателей, характеризующих экономическую эффективность, платежеспособность и финансовую устойчивость компании.
Уставный капитал предприятия.
На графике представлен размер уставного капитала для здоровых и обанкротившихся компаний (Рис.6).
Рис. 6 - Размер уставного капитала для банкротов и активных компаний
График показывает, что уставный капитал действующих предприятий на порядок выше, чем обанкротившихся. Уставный капитал является одним из показателей финансовой устойчивости компании. Чем выше его величина, тем ниже риск несостоятельности предприятия. Достаточность уставного капитала обеспечивает устойчивость компании в те моменты, когда размер поступлений невелик, и может быть использован для покрытия расходов.
Рис. 7 - Среднее значение уставного капитала для действующих и недействующих предприятий
Чистые активы предприятия
Чистые активы компании условно характеризуют рыночную стоимость существующего бизнеса. При ликвидации компании чистые активы - все средства, полученные от реализации активов после уплаты всех обязательств, распределяются между владельцами предприятия. На графике ниже представлена зависимость банкротства предприятия от чистых активов компании (Рис.8).
Рис. 8 - Размер чистых активов действующих и недействующих предприятий
Картина на графике неоднозначная. В целом можно сказать, что величина чистых активов для действующих компаний выше, однако наблюдаются некоторые интервалы, где активы банкротов превышают активы здоровых предприятий.
Чистые активы являются некоторой «подушкой безопасности» и используются компанией в случае возникновения убытков от деятельности фирмы. Однако несмотря на то, что размер чистых активов может быть достаточным, предприятие все равно может иметь высокий риск несостоятельности.
Гистограмма демонстрирует среднюю величину чистых активов для здоровых и обанкротившихся компаний (Рис. 9). Данный график нагляднее демонстрирует тот факт, что нормально функционирующие компании имеют гораздо больший размер активов, нежели банкроты.
Рис. 9 - Средняя величина чистых активов для действующих и недействующих предприятий
Коэффициент текущей ликвидности
Коэффициент текущей ликвидности показывает способность компании погашать краткосрочные обязательства за счет оборотных активов. Иными словами, данный показатель характеризует платежеспособность компании. На графике ниже отображена зависимость банкротства предприятия от коэффициента текущей ликвидности (Рис.10).
Рис. 10 - Величина коэффициента текущей ликвидности действующих и недействующих предприятий
Как и в предыдущем случае, график на первый взгляд показывает, что показатель текущей ликвидности действующих предприятий значительно выше. Хотя заметны пики среди обанкротившихся предприятий, где данный коэффициент превышает значение здоровых компаний.
Ниже показаны средние значения коэффициента для двух групп предприятий (Рис.11). На графике можно заметить, что в среднем коэффициент текущей ликвидности для действующих предприятий выше, чем для обанкротившихся, что говорит о том, что данный показатель существенен при оценке вероятности банкротства.
Рис. 11 - Средние значения коэффициента текущей ликвидности для действующих и недействующих компаний
Рентабельность затрат
Коэффициент рентабельности затрат характеризует экономическую эффективность компании. Он показывает, сколько прибыли получит предприятие с рубля, затраченного на производство продукции. Чем выше данный показатель, тем ниже вероятность банкротства компании, поскольку увеличение показателя рентабельности затрат свидетельствует об улучшении товарооборота и увеличении прибыли.
График ниже показывает величину коэффициента рентабельности затрат для действующих и обанкротившихся компаний (Рис. 12).
Рис. 12 - Значение коэффициента рентабельности затрат для действующих и недействующих предприятий
Рис. 13 - Средние значения коэффициента рентабельности затрат для действующих и недействующих предприятий
Рисунок 13 демонстрирует неоднозначную зависимость: среднее значение показателя для здоровых компаний оказалось ниже, чем для банкротов. Возможно, это с наличием выбросов в выборке: на рисунке 12 видно, как одно из значений сильно выбивается на общем фоне.
В целом можно сделать вывод, что снижение финансовых коэффициентов отрицательно сказывается на финансовой устойчивости компании. В некоторых случаях наблюдаются обратные зависимости, что говорит о том, что при оценке вероятности дефолта должен быть учтен не один показатель.
3.4 Исследование зависимости банкротства предприятия от нефинансовых показателей
Поскольку уже было обозначено, что на банкротство компании помимо финансовых коэффициентов влияют нефинансовые характеристики, рассмотрим зависимость банкротства от таковых (Шамсиева Р.Ф., 2016).
Отрасль предприятия
Как было описано ранее, предприятия, вошедшие в выборку, распределены по десяти основным отраслям реального сектора. В основном это компании отраслей, которые относятся к добывающей и обрабатывающей промышленности.
В выборку не вошли компании машиностроения, химической промышленности, электроэнергетические и строительные предприятия. Каждая из вышеперечисленных отраслей обладает специфическими особенностями, которые, по мнению некоторых исследователей, должны быть учтены отдельно. Таким образом ряд компаний не подлежит рассмотрению в данном исследовании.
Распределение предприятий по отраслям отражено ниже (Рис. 14).
Рис. 14 - Распределение действующих и недействующих предприятий по отраслям
На первый взгляд сложно оценить, какие компании больше подвергнуты финансовой несостоятельности, поскольку в целом количество компаний для каждой отрасли разнится. Для оценки риска банкротства по отрасли предприятия была рассчитана доля обанкротившихся компаний к общему количеству наблюдений в выборке (Рис.15).
Рис. 15 - Доля обанкротившихся компаний по отраслям
Из данной гистограммы лучше видно, что наибольшая доля обанкротившихся компаний приходится на производство строительных металлоконструкций (33,79%). Можно предположить, что данная тенденция наблюдается в связи с кризисом металлургии в 2015-2016 гг. и удорожанием сырья. Сектор строительной индустрии потребляет 60% металлопроката, причем на производство металлоконструкций отходит 15%, при этом на кризисы этот сектор реагирует быстрее прочих.
Также большую долю компаний с финансовой несостоятельностью имеют отрасли металлообработки и производства готовой металлической продукции. Это может быть так же связано с кризисом.
Форма организации предприятия
Следующая характеристика предприятия - форма организации. Предприятия подразделяются на 3 вида: ООО, НПАО, ПАО.
Ниже представлена гистограмма распределения компаний по формам (Рис.16).
Рис. 16 - Распределение действующих и недействующих предприятий по форме организации
Также была рассчитана доля недействующих предприятий, представленная на гистограмме ниже (Рис.17).
Рис. 17 - Доля недействующих предприятий по форме организации
Как и предполагалось, более подвержены риску банкротства предприятия, относящиеся к обществам с ограниченной ответственностью.
Организационно-правовая форма
Организационно-правовая форма является неотъемлемой характеристикой любой организации. Сегодня наиболее часто встречающейся формой является частная собственность, что и отражено на графике ниже (Рис.18).
Рис. 18 - Распределение действующих и недействующих предприятий по организационно-правовой форме
Не удивительно, что большая доля банкротов приходится на частные предприятия, поскольку компании государственного уровня и иностранные предприятия имеют достаточное финансирование и место на рынке, чтобы покрывать свои расходы и оставаться финансово устойчивыми (Рис.19).
Рис. 19 - Доля недействующих предприятий по организационно-правовой форме
Размер предприятия
Что касается размера, большая часть предприятий в России сейчас являются малыми (Рис.20). С точки зрения законодательства это подразумевает штат организации до 100 человек и среднюю выручку до 800 млн. руб.
Соответственно, такие компании чаще всего находятся под риском финансовой несостоятельности, поскольку в современных российских реалиях зачастую расходы составляют гораздо больше, чем полученная прибыль (Рис.21).
Рис. 20 - Распределение действующих и недействующих предприятий по размеру
Рис. 21 - Доля недействующих предприятий по размеру
На основе проанализированных финансовых и нефинансовых характеристик можно составить небольшой портрет организации, подверженной риску банкротства.
Как правило, это малое общество с ограниченной ответственностью, находящееся в частных руках, деятельность которого связана с металлопрокатом (чаще изготовлением строительных металлоконструкций), с небольшими показателями ликвидности и финансовой устойчивости, небольшим размером уставного капитала.
На следующем этапе перейдем непосредственно к моделированию, основной задачей которого является достоверный прогноз вероятности банкротства организации. Помимо подбора наиболее подходящей модели так же проверим значимость отобранных для исследования показателей и характер их влияния на финансовую несостоятельность компании.
4. Оценка вероятности банкротства предприятий
4.1 Эконометрическая модель
В результате анализа методов прогнозирования и их последующего сравнения, как уже было сказано выше, было принято решение остановиться на сравнении двух наиболее популярных методах. Начнем с модели бинарного выбора, в частности, с построения logit-модели. Было принято решение остановится именно на ней, поскольку в связи с особенностью данных, ошибки моделей маловероятно будут принадлежать нормальному распределению(MattssonB., SteinertO., 2017). К тому же, как правило, результаты оценки логит- и пробит-моделями мало отличаются друг от друга в большинстве случаев.
Для моделирования, как и для предварительного анализа данных, будет использован язык программирования R, предназначенный для статистической обработки данных, и графический интерфейс для вычислений RStudio.
Прежде чем перейти непосредственно к построению модели, необходимо подготовить данные. Во-первых, выборка из 1028 наблюдений была очищена от пропущенных значений (путем удаления наблюдений), в результате чего для моделирования осталось 955 наблюдений, из которых 517 являются обанкротившимися предприятиями.
Вторым шагом является разбиение выборки на обучающую и тестовую. Сегодня большинство исследователей склонны прибегать к данному подходу не только при построении сложных математических моделей, основанных на искусственном интеллекте, но и при менее комплексном моделировании, когда стоит задача классификации и прогнозирования (ZhanG. et.al., 1990).Как правило, большая часть выборки (70-90%) является обучающей (модель «тренируется» на части массива данных»), а оставшиеся 30-10% данных, не используемых при моделировании, являются тестовым множеством для проверки предсказательной силы модели. Такой подход позволяет проверить, действительно ли модель является хорошей с точки зрения прогноза, или она просто подстраивается под имеющиеся данные (ZhanG. et.al., 1990). В нашем случае выборка была разбита на обучающую и тестовую в соотношении 80:20, таким образом, модель будет обучена на 764 наблюдениях, и проверена на 191. Обучающая выборка будет использована как для построения модели, так и для проверки ее качества, тогда как тестовая - только для проверки качества (ZhanG. et.al., 1990).
При моделировании будет использован робастный метод оценивания. Поскольку метод максимального правдоподобия, с помощью которого оцениваются параметры в моделях бинарного выбора, достаточно чувствителен к выбросам, необходимо учитывать робастные стандартные ошибки. Робастный метод помогает снизить влияние выбросов и сделать оценки параметров более устойчивыми (MattssonB., SteinertO., 2017).
Базовая логит-модель содержит все финансовые и нефинансовые параметры, описанные в предыдущей главе. Для лучшей интерпретации, категориальные переменные, характеризующие нефинансовые факторы, были преобразованы в дамми-переменные. Каждая из таких переменных характеризует принадлежность компании к той или иной отрасли, размеру, организационно-правовой форме и форме организации. Во избежание проблемы полной мультиколлинеарности 4 переменных, отвечающих за ту или иную характеристику, не включались в модель. Таким образом, логит-модель, построенная на обучающей выборке, содержит 30 переменных (Таблица 7).
Таблица 7 - Оценки коэффициентов logit-модели
Переменная |
Оценка |
Переменная |
Оценка |
|
Константа |
3 921*1012*** (81 360 000) |
Частная собственность |
-4 653*1012*** (67 310 000) |
|
Черная металлургия |
79 730*109*** (40 790 000) |
Средние предприятия |
935 400*109*** (23 860 000) |
|
Пр-во готовых металлических изделий |
132 300*109*** (39 780 000) |
Микропредприятия |
-4 590*1012*** (29 970 000) |
|
Литейная промышленность |
-1 177*1012*** (44 150 000) |
Малые предприятия |
1 215*1012*** (22 930 000) |
|
Ювелирная промышленность |
1 085*1012*** (45 410 000) |
Уставной капитал |
-1 327*** (0) |
|
Пр-во металлоконструкций |
-442 300*109*** (39 680 000) |
Коэф.текущей ликвидности |
-28 240*109*** (170 300) |
|
Металообработка |
202 400*109*** (39 830 000) |
Коэф.автономии |
-1 158*1012*** (4 634 000) |
|
Цветная металлургия |
443 800*109*** (40 580 000) |
Коэф.обеспеченности |
-968 200*109*** (1 183 000) |
|
Трубная промышленность |
381 900*109*** (45 040 000) |
Коэф.финансового левериджа |
-395 100*106*** (14 930) |
|
Прокатное пр-во |
286 300*109*** (40 660 000) |
Чистые активы |
806 700*** (0) |
|
НПАО |
-32 090*109*** (8 194 000) |
Рентабельность активов |
-1 841*109*** (17 440) |
|
ПАО |
429 700*109*** (19 970 000) |
Рентабельность затрат |
332 500*109*** (4 422 000) |
|
Иностранная собственность |
-4 935*1012*** (67 970 000) |
Рентабельность капитала |
-9 032*109*** (39 810) |
|
Смешанная иностранная собственность |
-4 678*1012*** (68 410 000) |
Рентабельность продаж |
-696 400*109*** (15 580 000) |
|
Смешанная собственность |
-5 636*1012*** (74 280 000) |
Чистая прибыль |
-6 609*103*** (0) |
В скобках указаны значения стандартных ошибок; ***,**,* - уровни значимости на 1,5,10% соответственно
Стоит отметить, что все переменные, как финансовые, так и нефинансовые, оказались значимы на уровне 1%. Поскольку основная задача модели - прогнозирование, необходимо проверить предсказательную силу, то есть качество прогнозов, построенных с помощью данной модели. Базой для критериев качества служит так называемая матрица классификации (матрица сопряженности), показывающая количество верно и неверно предсказанных по модели значений (Таблица 8)(Федорова Е.А., et.al, 2016).
Таблица 8 - Матрица сопряженности
Actual class |
||||
Positive (0) |
Negative (1) |
|||
Predicted class |
Positive (0) |
True positives (TP) |
False positives (FP) |
|
Negative (1) |
False negatives (FN) |
True negatives (TN) |
Матрица сопряженности для logit-модели на обучающей выборке выглядит следующим образом (Таблица 9).
Таблица 9 - Матрица сопряженности для logit-модели на обучающей выборке
Actual class |
||||
Positive (0) |
Negative (1) |
|||
Predicted class |
Positive (0) |
235 |
92 |
|
Negative (1) |
115 |
322 |
Наиболее распространенным критерием качества модели является ее точность (доля верных предсказаний - Accuracy, ACC), то есть отношение истинно-предсказанных значений к общему числу наблюдений. Рассчитывается точность по формуле:
, |
(1) |
где:TP - количество истинно-положительных значений,
TN - количество истинно-отрицательных значений,
FP - количество ложно-положительных значений,
FN - количество ложно-отрицательных значений.
Точность модели, то есть ее прогнозная сила, на обучающей выборке составила 72,91%.
Помимо точности модели так же проверяется ее чувствительность и специфичность. Под чувствительностью (TruePositivesRate, TPR) понимается доля истинно-положительных классификаций, то есть отношение верно предсказанных положительных значений к общему количеству положительных исходов. Под специфичностью (TrueNegativesRate, TNR) - доля отрицательных значений - отношение верно предсказанных отрицательных значений к общему количеству отрицательных исходов. Вычисляются данные меры качества соответственно по формулам:
, |
(2) |
|
. |
(3) |
Чувствительность построенной модели в нашем случае равна 67,17%, специфичность - 77,78%.
То есть модель в большинстве случаев верно определяет предприятия, являющиеся банкротами. На следующем шаге необходимо проверить, как ведет себя модель на новых данных. Для этого определяются новые прогнозные значения, но уже на тестовой выборке, не входившей в массив данных, на котором были оценены параметры модели.
Матрица сопряженности модели на тестовой выборке выглядит следующим образом (Таблица 10).
Таблица 10 - Матрица сопряженности для logit-модели на тестовой выборке
Actual class |
||||
Positive (0) |
Negative (1) |
|||
Predicted class |
Positive (0) |
65 |
19 |
|
Negative (1) |
23 |
84 |
Точность модели (ACC) составляет 78,01%, чувствительность - 73,86%, специфичность - 81,55%. Модель так же чаще верно классифицирует негативные исходы, то есть обанкротившиеся компании. Показатели качества на тестовой выборке выше, и в целом можно сказать, что прогнозная сила модели достаточно высокая, более того, модель не переобучена, то есть не подстроилась под исходные данные.
Конечно, базовая модель является наиболее простой, и требует некой калибровки для повышения точности предсказания. Но, прежде чем приступить к повышению качества логит-модели, сравним точность прогнозов логит-модели с прогнозами, сделанными с помощью нейронной сети.
4.2 Модель на нейронной сети
Для построения нейронной сети также необходимо разделение выборки на обучающее и тестовое множество. Для начала, так же, как и с логит-моделью, будет построена базовая (первичная) сеть на той же обучающей выборке из 764 наблюдений, а проверка работы нейронной сети осуществится на тестовом множестве из 191 наблюдения. Впоследствии, как и модель логистической регрессии, нейросеть будет откалибрована посредством изменения количества скрытых слоев и количества нейронов на данных слоях.
Проектирование нейронной сети
Первоначальная структура нейронной сети выглядит следующим образом (Ясницкий Л.Н., 2009):
Количество нейронов на входном слое.
Для построения логит-модели было использовано 30 переменных, одна из которых - зависимая, 11 - финансовые независимые факторы, остальные - объясняющие дамми-переменные нефинансовых характеристик. Для нейронной сети используются данные с теми же объясняющими переменными (исключая зависимую), то есть на входном слое необходимо разместить 29 нейронов.
Количество нейронов на выходном слое.
Поскольку результатом моделирования является классификация того или иного предприятия (банкрот/не банкрот), за которую отвечает одна переменная, в данном случае, статус компании, то на выходе будет находиться всего один нейрон, определяющий, соответственно, статус предприятия.
Количество нейронов на скрытом слое.
Количество нейронов на скрытом слое - достаточно нетривиальная задача. Не существует определенного алгоритма или точной формулы для определения необходимого числа, и зачастую нейронная сеть не один раз пересчитывается с разным количеством нейронов для улучшения качества прогноза. Слишком маленькое число нейронов скрытого слоя может привести к ошибкам нейросети и слишком долгому обучению. Слишком большое, напротив, к переобучению сети и подстройки ее под исходные данные (BredartX., 2014).
В работе Л.Ясницкого представлен один из способов определения нейронов на скрытом слое (Ясницкий Л.Н., 2009). Данный алгоритм является следствием теорем Арнольда - Колмогорова - Хехт-Нильсена и описывается формулой:
, |
(4) |
где:- размерность выходного сигнала;
- размерность входного сигнала;
- необходимое число синаптических связей;
- число элементов обучающего множества.
В нашем случае, число элементов обучающего множество равно 764, размерность входного сигнала - 29, размерность выходного сигнала - 1.
По формуле получаем: .
Чтобы определить количество нейронов на скрытом слое двухслойной нейронной сети, воспользуемся еще одной формулой:
, |
(5) |
Таким образом, количество нейронов лежит на интервале .
В уже известных исследованиях среднее число нейронов на скрытом слое примерно равно 10. Для первоначальной, базовой нейросети возьмем 8 нейронов.
Количество скрытых слоев.
Как правило многослойные персептроны используются для более сложных задач, нежели задача классификации (определение статуса предприятия в терминах банкрот/не банкрот как раз является задачей классификации). Чтобы избежать переобучения нейронной сети и ее слишком долгой настройки, остановимся на одном скрытом слое. Для распознавания банкротства этого достаточно, согласно предыдущим исследованиям.
Функция активации.
Сегодня известно множество активационных функций, способных преобразовывать сигналы в конкретные для определенной задачи значения. В задачах классификации чаще всего используются пороговые, линейные или сигмоидные функции. Поскольку зависимая переменная бинарная, то есть принимает значения 0 или 1, наилучшим вариантом будет использование логистической функции активации, которая является более гибкой в отличие от пороговой, и схожа с логистической функцией распределения ошибки в логит-модели (Ясницкий Л.Н., 2009):
.
Для обучения нейронной сети будет применен описанный во второй главе метод градиентного спуска. Он не является наилучшим среди множества методов обучения, но он наиболее часто используется в подобных исследованиях (Ясницкий Л.Н., 2009).
Построение нейронной сети
Прежде чем приступить к построению нейросети, необходимо немного преобразовать данные. Поскольку в массиве присутствуют показатели финансовой отчетности предприятий, размерность переменных разная. Для более быстрого и безболезненного обучения нейронной сети необходимо нормализовать данные, то есть привести к одинаковой размерности. В некоторых исследованиях применяется следующий способ нормализации данных (ZhanG. et.al, 1999):
отбирается минимальное значение в каждой переменной;
значения наблюдений ранжируются, вычисляется разница между последовательными значениями в каждой переменной;
для каждого наблюдения высчитывается разница исходного и выбранного минимального значения, высчитывается отношение данной разницы и проранжированными значениями.
Путем подобных преобразований вычисляются значения переменных для каждого наблюдения, лежащие в пределах от 0 до 1. Данный способ значительно облегчает процесс обучения нейронной сети и не требует больших ресурсов машины (ZhanG. et.al, 1999).
Сама нейронная сеть, как уже было описано выше, будет состоять из одного скрытого слоя с 8 нейронами в ней и сигмоидной функцией активации. Для получения лучшего результата будет обучена не одна, а сто идентичных нейронных сетей с работой датчика случайных чисел (перебирание различных комбинаций исходных данных). При этом будут высчитываться ошибки модели, количество раз, когда нейронная сеть ошибается в распознавании того или иного наблюдения (компании).
Итогом выполнения алгоритма будет нейронная сеть с минимальным количеством ошибок, которая на следующем этапе будет обучаться с помощью метода скорейшего (градиентного) спуска(BredartX., 2014). Скорость обучения . Исследователи рекомендуют скорость чем ниже, тем лучше, конкретное значение выбирается опционально в зависимости от архитектуры сети, времени, которое исследователь готов потратить на ее обучение, а также ресурсов, необходимых для вычисления (мощность машины). Прогнозными значениями в данном случае являются значения, полученные на выходном слое после обучения сети. Пороговое значение для сумматора выберем такое же, как в модели логистической регрессии(MattssonB., SteinertO., 2017):
.
Результаты работы нейронной сети
Для проверки качества построенной нейросети построим матрицу сопряженности, идентичную таблице для логит-модели. На обучающем множестве нейросеть выдала следующие результаты (Таблица 11).
Таблица 11 - Матрица сопряженности для нейронной сети на обучающей выборке
Actual class |
||||
Positive (0) |
Negative (1) |
|||
Predicted class |
Positive (0) |
350 |
0 |
|
Negative (1) |
0 |
414 |
Судя по значениям истинно-положительных и истинно-отрицательных предсказаний, полученная модель нейронной сети не ошибается вообще. Все предприятия классифицированы абсолютно верно, точность модели составляет 100%.
Проверим результат на тестовом множестве (Таблица 12).
Таблица 12 - Матрица сопряженности для нейронной сети на тестовой выборке
Actual class |
||||
Positive (0) |
Negative (1) |
|||
Predicted class |
Positive (0) |
88 |
0 |
|
Negative (1) |
0 |
103 |
Как видно из таблицы, на новых данных нейронная сеть так же ни разу не ошиблась. Это может свидетельствовать о двух исходах:
построенная модель идеально предсказывает вероятность банкротства (подозрительно точно);
нейронная сеть переобучилась и подстраивается даже на новых данных (возможно ли подобное?).
Чтобы разобраться, действительно ли получилась хорошая модель, или она просто переобучена, необходимо провести калибровку нейронной сети путем изменения количества нейронов на скрытом слое.
4.3 Калибровка моделей
Прежде чем работать со структурой моделей и изменять их спецификации, необходимо было провести анализ имеющихся данных.
Работа с пропущенными значениями
В каждом исследовании аналитики сталкиваются с такой проблемой, как пропуски в имеющихся данных. Существует несколько способов решения данного вопроса (Odom M.D., Sharda R., 1990).
Первый, наиболее часто встречающийся способ - удаление данных. Ячейки, в которых содержатся пропуски, попросту отсеиваются из датафрейма. Этот способ является наиболее простым и безболезненным в том случае, когда в выборке содержится большое количество наблюдений, например, десятки или сотни тысяч. Как правило в таких больших массивах данных процент пропущенных значений по отношению к общей выборке ничтожно мал, и никоим образом не сказывается на дальнейшем анализе.
Альтернативным решением является удаление целых переменных (переменной) (Odom M.D., Sharda R., 1990). Например, если наибольшее количество пропусков содержится в одной колонке, ее можно убрать из анализа. Такое решение подойдет для массивов данных, где переменных больше, чем имеющихся наблюдений, и парочкой «лишних» показателей можно пренебречь.
Третий способ - замена пропущенных значений модой, медианой или средним(Odom M.D., Sharda R., 1990).Это грубый способ работы с пропусками, и в некоторых ситуациях уместнее будет совсем удалить пустые ячейки, нежели заменять их вышеперечисленными статистическими величинами. Подобная замена возможна в том случае, когда вариация в данных невелика, или переменная мало влияет на отклик. В противном случае оценки, получаемые в дальнейшем при моделировании, будут несостоятельными в связи с такой грубой аппроксимацией.
Последний, способ работы с пропусками - прогнозирование. С помощью некоторых подходов высчитывается оценка той или иной переменной, и пропущенные ячейки в данной переменной заменяются прогнозными значениями, рассчитанными с помощью полученной оценки. Это самый сложный, но самый точный подход к работе с пропусками в данных (Odom M.D., Sharda R., 1990).Существует несколько подходов к прогнозированию пропущенных значений, однако на практике доказана эффективность одного, который и будет рассмотрен далее.
Поскольку количество переменных в исследуемой выборке невелико, и все описанные переменные так или иначе (гипотетически) значимы для анализа, удаление переменных кажется нецелесообразным. Первый способ работы с пропусками - удаление ячеек данных - также плох, поскольку в выборке всего 1028 наблюдений. Чем меньше наблюдений в датафрейме, тем хуже это сказывается на обучении моделей, особенно нейронных сетей, соответственно, качество получаемых прогнозов также ухудшается. Аппроксимация средним или медианой ведет к несостоятельности оценок, что априори снижает качество любой модели.
Единственным подходящим способом работы с пропусками в данном исследовании является прогнозирование.
Оно будет осуществляться с помощью метода mice - многомерной оценки цепными уравнениями (ZhanG. et. al., 1999).В основе данного метода лежат сложные функции для работы с пропущенными значениями.
На первом шаге алгоритма создается несколько полных копий исходного датафрейма, каждая со своей оценкой пропущенных значений. На втором шаге генерируется набор данных, агрегированный из полученных оценок каждой копии для каждой переменной (OdomM.D., ShardaR., 1990).
После выполнения описанного алгоритма на выходе получился полный набор данных из 1028 наблюдений, не содержащий пропусков.
Дальнейшая работа будет осуществляться с этим набором данных.
Работа с переменными
Следующим этапом была работа с переменными, вошедшими в моделирование. Преобразование значений переменных позволило улучшить качество моделей, уменьшить количество выбросов за счет масштабирования данных, уменьшить разброс значений в переменных.
Большая часть переменных была масштабирована путем деления на среднее значение. Уставной капитал предприятий и коэффициент текущей ликвидности были преобразованы в натуральные логарифмы. Некоторые переменные, такие как коэффициент автономии и обеспеченности, остались неизменными, поскольку разброс значений был не критичен.
Что касается выбросов, несомненно, они присутствуют в данных. Поскольку компании разные по размерам и, соответственно, значениям финансовых коэффициентов, выбросы не удалялись. Более того, проведенный анализ моделей на выборке с выбросами и без них показал отсутствие влияния выбросов на значимость коэффициентов и значимость модели в целом.
Ниже показаны ящики с усами для некоторых переменных до преобразования и после (Рис.23, Рис.24). Графики для оставшихся показателей представлены в Приложении 2.
Рис. 23 - Ящики с усами для уставного капитала
Рис. 24 - Ящики с усами для коэффициента текущей ликвидности
Работа с моделями
После всех возможных преобразований исходных данных можно снова приступить к работе с моделями.
Модель логистической регрессии имеет вид:
, |
(6) |
где: - вектор финансовых переменных,
- вектор нефинансовых переменных,
- оценки коэффициентов финансовых переменных,
- оценки коэффициентов нефинансовых переменных.
Вероятность того, что предприятие примет статус «банкрот» выглядит следующим образом:
,
где:- линейная комбинация независимых факторов.
Оценки коэффициентов модели показаны в таблице ниже (Таблица 13).
Таблица 13 - Оценки коэффициентов для logit-модели
Переменная |
Оценка |
Переменная |
Оценка |
|
Константа |
213,80 (47660) |
Частная собственность |
-18,77 (28290) |
|
Черная металлургия |
-196,80 (37890) |
Средние предприятия |
5,69 (6,47) |
|
Пр-во готовых металлических изделий |
-196,70 (37890) |
Микропредприятия |
-26,08 (1142) |
|
Литейная промышленность |
-194,30 (37890) |
Малые предприятия |
5,69 (6,44) |
|
Ювелирная промышленность |
-191,60 (37890) |
Уставной капитал |
-0,06 (0,08) |
|
Пр-во металлокнострукций |
-197,00 (37890) |
Коэф,текущей ликвидности |
-2,70 (0,6) |
|
Металлообработка |
-196,90 (37890) |
Коэф,финансового левериджа |
-0,06 (0,08) |
|
Цветная металлургия |
-194,50 (37890) |
Чистые активы |
-0,36 (0,34) |
|
Трубная промышленность |
-195,30 (37890) |
Рентабельность активов |
-2,31*** (0,41) |
|
Прокатное пр-во |
-195,40 (37890) |
Рентабельность капитала |
-3,33*** (0,38) |
|
НПАО |
-0,55 (0,7) |
Рентабельность продаж |
0,47*** (0,09) |
|
ПАО |
-1,67 (1,9) |
Чистая прибыль |
-0,34 (0,35) |
|
Иностранная собственность |
-15,97 (28290) |
Коэф,автономии |
2,16* (1,21) |
|
Смешанная иностранная собственность |
-18,27 (28290) |
Коэф,обеспеченности |
-15,90*** (1,98) |
|
Смешанная собственность |
-40,26 (28290) |
Рентабельность затрат |
11,56*** (2,99) |
В скобках указаны значения стандартных ошибок; ***,**,* - уровни значимости на 1,5,10% соответственно
Стоит отметить, что вследствие устранения пропущенных значений изменилось количество наблюдений для обучающей и тестовой выборки. При аналогичном соотношении 80:20 количество элементов обучающей и тестовой выборки равно 822 и 206 соответственно.
По сравнению с первоначальной моделью, стандартные ошибки снизились, однако значимыми остались лишь несколько коэффициентов. Тем не менее, качество модели возросло (R2McFadden = 0,797), как и прогнозная сила (Таблицы 14-15).
Таблица 14 - Матрица сопряженности для logit-модели на обучающей выборке
Actual class |
||||
Positive (0) |
Negative (1) |
|||
Predicted class |
Positive (0) |
521 |
11 |
|
Negative (1) |
13 |
277 |
Точность модели на обучающей выборке составила 97,08%, чувствительность - 97,5%, специфичность - 96,18%.
Таблица 15 - Матрица сопряженности для logit-модели на тестовой выборке
Actual class |
||||
Positive (0) |
Negative (1) |
|||
Predicted class |
Positive (0) |
122 |
5 |
|
Negative (1) |
6 |
73 |
На тестовой выборке точность модели - 94,6%, чувствительность и специфичность - 95,3% и 93,5% соответственно.
Данная модель чаще предсказывает здоровые предприятия, как на обучающей, так и на тестовой выборке. На тестовой выборке точность на несколько процентов ниже, чем на обучающей, но прогнозная сила в любом случае достаточно высокая. Модель не переобучается, поскольку результаты на тестовом множестве удовлетворительные.
Далее приступим к работе с нейронной сетью. В предыдущей модели возникла проблема переобучения. Было выдвинуто предположение, что это связано:
с большим количеством нейронов на внутреннем слое (в предыдущей модели их было 8);
с большим количеством альтернативных нейронных сетей, используемых для обучения;
со слишком сильным масштабированием данных.
Таким образом, количество нейронов на внутреннем слое было сокращено до 6. Поскольку переменные были преобразованы и масштабированы, процедуру масштабирования датасета для нейронной сети была опущена. Это займет большее количество времени в процессе обучения, но мощность машины позволяет обучить двухслойную нейросеть на данных с подобным масштабом. Хотя обычно количество идентичных обучаемых нейронных не слишком сильно влияет на переобучение, поскольку из множества обучений выбирается одно, все же сократим величину сетей со 100 до 10.
Итак, преобразованная нейронная сеть показывает следующие результаты (Таблица 16-17).
Таблица 16 - Матрица сопряженности для нейронной сети на обучающей выборке
Actual class |
||||
Positive (0) |
Negative (1) |
|||
Predicted class |
Positive (0) |
534 |
2 |
|
Negative (1) |
0 |
286 |
Таблица 17 - Матрица сопряженности для нейронной сети на тестовой выборке
Actual class |
||||
Positive (0) |
Negative (1) |
|||
Predicted class |
Positive (0) |
128 |
1 |
|
Negative (1) |
0 |
77 |
Точность сети на обучающем и тестовом множестве составляет 99,7% и 99,5% соответственно.
Чувствительность - 100% на обоих множествах.
Специфичность - 99,3% и 98,7%.
Прогнозная сила нейронной сети по-прежнему высока, а предсказание положительных исходов осуществляется с точностью до 100%. Однако данная модель все же имеет ошибки, значит ее переобучение менее вероятно, чем в первоначальной модели.
Общая точность нейронной сети с учетом обучающего и тестового множества - 99,7%. Сеть ошиблась в трех случаях из 1028.
4.4 Сравнение результатов
В ходе исследования было разработано два метода оценки вероятности банкротства предприятий. Первый основан на построении эконометрической модели, относящейся к классу бинарных моделей логистического распределения, второй представляет собой искусственную нейронную сеть.
Оба метода реализованы на одном массиве данных, с одной зависимой переменной (откликом), характеризующей статус предприятия (банкрот - не банкрот), 11-ю финансовыми показателями и 4-мя нефинансовыми. Данные были преобразованы для улучшения качества моделей, переменные преобразованы, а пропущенные значения устранены.
Точность модели логистической регрессии с учетом обучающего и тестового множеств составила 96,6%, то есть модель ошиблась в прогнозах 35 раз из 1028. В случае работы нейронной сети процент ошибок гораздо ниже: в 3-х случаях из 1028 (99,7%).
Продемонстрируем более наглядно работу обеих моделей на примере двух случайно выбранных предприятий, характеристики которых указаны ниже (Таблица 18).
Таблица 18 - Характеристики компаний из контрольной выборки
Статус |
Действующее |
Недействующее |
|
Отрасль |
Металообработка |
Металообработка |
|
Форма организации |
ООО |
ООО |
|
Форма собственности |
Смешанная иностранная собственность |
Смешанная иностранная собственность |
|
Размер |
Среднее предприятие |
Среднее предприятие |
|
Уставной капитал |
150 544 651,00 |
10 000,00 |
|
Коэффициент текущей ликвидности |
1,24 |
1,01 |
|
Коэффициент автономии |
0,10 |
0,03 |
|
Коэффициент обеспеченности |
-0,05 |
-0,03 |
|
Финансовый леверидж |
9,12 |
34,29 |
|
Чистые активы |
93 723 000,00 |
15 895 000,00 |
|
Рентабельность активов |
0,17 |
0,002 |
|
Рентабельность затрат |
-0,06 |
0,015 |
|
Рентабельность капитала |
16,08 |
0,07 |
|
Рентабельность продаж |
-0,07 |
0,02 |
|
Чистая прибыль |
166 714 000,00 |
1 058 000,00 |
Модель, основанная на нейронной сети, сделала верный прогноз, а модель логистической регрессии допустила ошибку в распознавании, определив обанкротившееся предприятие, как действующее (Таблица 19).
Таблица 19 - Проверка работы моделей на контрольной выборке
Прогноз |
||||
Logit-модель |
Нейросеть |
|||
Исходные данные |
Действующее |
Верно |
Верно |
|
Недействующее |
Неверно |
Верно |
Проверим модели еще раз на другой случайной паре (Таблица 20).
Таблица 20 - Характеристики компаний из контрольной выборки
Статус |
Действующее |
Недействующее |
|
Отрасль |
Металообработка |
Металообработка |
|
Форма организации |
ООО |
ООО |
|
Форма собственности |
Смешанная иностранная собственность |
Смешанная иностранная собственность |
|
Размер |
Среднее предприятие |
Среднее предприятие |
|
Уставной капитал |
24 000 000 |
10 000 |
|
Коэффициент текущей ликвидности |
11,35 |
0,36 |
|
Коэффициент автономии |
0,94 |
-0,32 |
|
Коэффициент обеспеченности |
0,91 |
-2,00 |
|
Финансовый леверидж |
0,06 |
-4,11 |
|
Чистые активы |
260 439 000 |
-107 665 000 |
|
Рентабельность активов |
0,02 |
-0,74 |
|
Рентабельность затрат |
0,00 |
0,02 |
|
Рентабельность капитала |
0,02 |
-4,55 |
|
Рентабельность продаж |
0,00 |
0,02 |
|
Чистая прибыль |
6316000,00 |
-384 161 000 |
В данном случае обе модели верно определили статус предприятия (Таблица 21).
Таблица 21 - Проверка работы моделей на контрольной выборке
Прогноз |
||||
Logit-модель |
Нейросеть |
|||
Исходные данные |
Действующее |
Верно |
Верно |
|
Недействующее |
Верно |
Верно |
Таким образом, исходя из анализа двух случайно выбранных пар компаний, можно сказать, что нейронная сеть точнее предсказывает вероятность несостоятельности, чем модель логистической регрессии. Стоит отметить, что проверка осуществлялась на данных, не входивших ни в обучающую, ни в тестовую выборку.
Несмотря на ошибку logit-модели на контрольных данных, она рекомендована к использованию, при условии тщательного анализа и качественной обработки исходных данных. Она наиболее проста в построении и доступна для использования во многих современных статистических пакетах и ПО для анализа данных, за счет чего logit-модель легче внедрить для работы на реальном предприятии. Обучение такой модели возможно и на малых выборках (до 100 наблюдений), но необходимо учитывать соотношение наблюдений и количества необходимых показателей (по эмпирическому правилу квадрат количества переменных должен быть не более количества наблюдений).
Что касается нейронной сети, преимущество данной модели в высокой точности и минимальном проценте ошибок и на обучающих, и на тестовых, и на контрольных данных. Минус подобных моделей заключается в сложности реализации: не каждый экономист способен запрограммировать архитектуру и алгоритм обучения нейронной сети. В отличие от эконометрических моделей при работе с нейросетью важно количество наблюдений: на маленьких наборах данных модель просто не способна обучиться. Размер выборки, соответственно, влияет на время обучения сети и требования к мощности компьютера. Некоторые массивы данных могут быть настолько большими, что для обучения потребуются часы, а на корректировку весов - недели. С учетом вышеизложенных недостатков возникает вопрос в целесообразности внедрения процессов моделирования с помощью нейронных сетей на реальном предприятии.
Таким образом, преимущества моделей логистической регрессии в скорости оценки, относительной простоте реализации, возможности работы с маленькими массивами данных. Преимущества нейронных сетей в наивысшей точности оценки и возможности работы с данными без дополнительной чистки и преобразований (если позволяет мощность ресурсов).
Заключение
В современных условиях оценка вероятности банкротства предприятия является жизненно важной процедурой, поэтому, несмотря на существование разнообразных методов диагностики банкротства с середины XX века, вопрос дальнейшего исследования этой проблемы актуален и сегодня. Со времен открытия самой ранней модели У. Бивера произошел революционный скачок в подходе к предсказанию несостоятельности: сегодня наиболее популярными методами являются эконометрическое моделирование, а также прогнозирование с помощью машинного обучения. Однако, несмотря на существование новейших моделей искусственного интеллекта, позволяющих прогнозировать вероятность банкротства на огромных массивах данных с помощью сложнейших алгоритмов, количество дефолтов компаний разных секторов и отраслей неустанно растет. Все это заставляет экономистов работать над проблемными зонами в плане финансового положения компаний, выявлять новые взаимосвязи между множеством финансовых и нефинансовых факторов, строить новые модели, разрабатывать и реализовывать продвинутые алгоритмы. Кропотливые исследования ученых и аналитиков вдохновили на попытку моделирования оценки вероятности банкротства предприятий и в данной работе.
Подобные документы
Понятие и признаки банкротства. Причины и виды банкротства. Процедуры банкротства. Методы диагностики вероятности банкротства. Многокритериальный подход. Дискриминантные факторные модели. Оценка вероятности банкротства предприятия по модели Альтмана.
курсовая работа [59,3 K], добавлен 16.12.2007Экономическая сущность и виды банкротства. Нормативно-правовое регулирование процедур банкротства предприятия. Методики оценки вероятности банкротства организации. Составление прогнозной финансовой отчетности организации на примере ЗАО "Сибмашсервис".
дипломная работа [218,7 K], добавлен 12.12.2015Основные понятия финансовой несостоятельности предприятий. Создание математической модели прогнозирования банкротства компании. Выявление факторов финансового состояния ЗАО "Управление механизации №276", информационная база анализа угрозы банкротства.
курсовая работа [388,7 K], добавлен 18.05.2014Содержание банкротства и его признаки. Организационно-экономическая характеристика предприятия, оценка ликвидности его баланса. Анализ абсолютных и относительных показателей финансовой устойчивости предприятия, пути снижения вероятности банкротства.
курсовая работа [247,6 K], добавлен 09.06.2016Понятие, сущность, критерии и финансовые признаки банкротства. Характеристика ООО "Методлит.ру", оценка платежеспособности и финансовой устойчивости. Анализ финансовых признаков несостоятельности компании, определение вероятности наступления банкротства.
курсовая работа [82,1 K], добавлен 10.05.2018Понятие, виды и причины банкротства предприятий. Нормативное регулирование процесса банкротства хозяйствующих субъектов в РФ. Методы диагностики вероятности банкротства. Оценка эффективности мероприятий по улучшению финансового состояния ООО "Кристалл".
дипломная работа [103,2 K], добавлен 25.09.2009Понятие и сущность банкротства. Анализ финансового состояния и вероятности банкротства предприятия ООО "Торговый Дом "Альянс Упак". Предложения по использованию финансовых методов предупреждения банкротства. Расчеты эффективности предлагаемых мероприятий.
дипломная работа [752,5 K], добавлен 23.03.2015Понятие, виды, причины, методы диагностики банкротства, оценка вероятности его наступления. Сравнительный анализ отчета о прибылях и убытках предприятия. Анализ ликвидности баланса, финансовой устойчивости, показателей деловой активности и рентабельности.
курсовая работа [57,7 K], добавлен 16.01.2010Особенности и значение прогнозирования риска банкротства предприятия, формула расчета определения его вероятности. Сущность модели вероятности риска Таффлера, платежеспособности Спрингейта. Расчет пятифакторной модели Альтмана для акционерных обществ.
контрольная работа [24,1 K], добавлен 14.11.2010Понятие банкротства, его причины и способы диагностирования. Модели экспресс-диагностирования банкротства. Прогнозирование вероятности банкротства ФГУП "Кирпичный завод" по модели Сайфулина-Кадыкова, основные направления антикризисного управления.
курсовая работа [101,1 K], добавлен 30.09.2009