Прогнозирование доходности акций с использованием бухгалтерской информации
Анализ бухгалтерской информации, влияющей на цену акции. Соотношение балансовой стоимости к рыночной. Эмпирический анализ факторов, влияющих на доходность акций. Построение модели, объясняющей зависимость доходности акций от отчетности организации.
Рубрика | Бухгалтерский учет и аудит |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 14.07.2020 |
Размер файла | 126,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»
Факультет «Санкт-Петербургская школа экономики и менеджмента»
Подразделение (департамент, лаборатория, кафедра) «Департамент финансов»
Выпускная квалификационная работа - БАКАЛАВРСКАЯ РАБОТА
ПРОГНОЗИРОВАНИЕ ДОХОДНОСТИ АКЦИЙ С ИСПОЛЬЗОВАНИЕМ БУХГАЛТЕРСКОЙ ИНФОРМАЦИИ
Васильев Дмитрий Олегович
Руководитель к.ф-м.н.,
профессор департамента финансов
Волкова Ольга Николаевна
Санкт-Петербург 2020
Содержание
Введение
1. Бухгалтерская информация и доходность акций
1.1 Бухгалтерская информация, влияющая на цену акции
1.2 Соотношение балансовой стоимости к рыночной (B/M)
1.3 F-Score модель
2. Исследовательский дизайн
2.1 База данных и переменные
2.2 Методология
3. Эмпирический анализ факторов, влияющих на доходность акций
3.1 Метод опорных векторов (SVM)
3.2 Boosted Logistic Regression
3.3 Метод случайного леса (Random Forest)
3.4 Нейронные сети (Neural Networks)
Заключение
Список литературы
Приложение
Введение
Многие инвестируют в ценные бумаги и акции компаний. В наше время появляются все более доступные инструменты, которые позволяют людям торговать на фондовых рынках даже без определенной подготовки. Некоторые занимаются покупкой и продажей акций компаний профессионально и уделяют нахождению оптимальной стратегии инвестирования достаточно много времени. Цена зависит от новостей от компании. Если они хорошие, то акции растут. Но невозможно точно предугадать, когда выйдут плохие или хорошие новости. Единственное, что остается стабильным - квартальная отчетность компаний. Важно помнить, что плохие и хорошие новости забудутся, а финансовые показатели останутся навсегда. Публичные организации обязаны предоставлять свои финансовые показатели каждый квартал. Поэтому получить к ним доступ может каждый желающий. Также компании хранят свои предыдущие отчеты, что делает возможным сравнение новых показателей с теми, которые были раньше. Ежеквартальные отчеты служат важным показателем привлекательности акций организаций. Инвестор может многое понять до выхода годового отчета и использовать эту информацию при анализе акций компании. Если вся фундаментальная информация об объемах производства и все изменения в финансовых показателях правильно отражены в отчете, то это будет связано с ценой акций. Финансовые аналитики уделяют много времени и сил анализу предоставленных данных. Не многие торговцы сразу реагируют на отчеты организаций, что дает некоторую фору людям, которые используют бухгалтерскую информацию при прогнозировании цен акций. Это объясняется тем, что рынок не успевает сразу реагировать на данные из отчетов компаний, и это помогает инвесторам получить сверхприбыль при разумном распределении активов в портфеле. Чтобы понимать какие факторы влияют на движение цен акций следует проанализировать множество компонентов. Данное исследование направлено на изучение влияния бухгалтерской информации организации на доходность ценных бумаг компании. Работа может быть полезна для инвесторов на фондовом рынке, чтобы они смогли быстро реагировать на новейшие бухгалтерские отчеты организации. Это может обеспечить будущим акционерам прибыли с высокой доходностью.
Актуальность данного вопроса заключается в том, что многие люди начинают инвестировать свои свободные средства для получения пассивного дохода и упускают влияние различных финансовых показателей, уделяя большее внимание техническому анализу ценных бумаг. Также многие используют ситуацию в стране и отрасли при анализе доходности акций, тем самым упуская уникальность того или иного предприятия. Например, компания могла получить крупный контракт, что даже в период кризиса сможет удержать и, может быть, даже повысить стоимость компании. Поэтому, при анализе ценных бумаг компании всегда следует уделять должное внимание бухгалтерским отчетам.
Для анализа и прогнозирования будут использованы методы машинного обучения для повышения точности прогноза. В наши дни все больше отраслей переходят к таким методам анализа и обработки данных, поэтому мы считаем это актуальным для рынка ценных бумаг. В работе тестируются четыре метода машинного обучения - метод опорных векторов (SVM), boosted logit regression, метод случайного леса (random forest classification) и нейронные сети (Neural Networks).
Главный исследовательский вопрос - какой метод обучения наиболее точно объяснит зависимость доходности компании и бухгалтерской информации для прогнозирования результатов.
Объектом исследования является акции на фондовом рынке, а предметом - влияние бухгалтерской информации компаний.
Целью исследования является выявление факторов, влияющих на доходность акций компании и модели для объяснения этой зависимости.
Для достижения цели были поставлены следующие задачи:
1. Проанализировать литературу о бухгалтерской информации, влияющую на доходность ценных бумаг
2. Выявить наиболее значимые факторы, способствующие росту цен акций
3. Построить модель по четырем методам машинного обучения, объясняющую зависимость доходности акций от отчетности организации
4. Протестировать объясняющие способности полученных моделей
1. Бухгалтерская информация и доходность акций
бухгалтерский информация доходность акция
1.1 Бухгалтерская информация, влияющая на цену акции
Начиная с 1989 года важность показателей бухгалтерской отчетности стали изучаться для определения движения цен на акции публичных компаний. После этого многие зарубежные авторы начали обосновывать свои предположения на тему, как бухгалтерские показатели влияют на поведение компании на фондовом рынке. В данном обзоре литературы мы проанализируем разные гипотезы и результаты применения стратегий, основанных на влиянии показателей, известных из отчетов компании, на изменение цены акции компании. Также, приведем пример моделей, предсказывающих движение цен на фондовом рынке.
Котировки меняются каждый день под воздействием рыночных сил. Иными словами, цены акций меняются по законам спроса и предложения. Если тех, кто хочет купить акции), больше тех, кто хочет их продать, то цена акции будет расти. И наоборот, если на рынке больше людей хотят продать акции, чем купить, то предложение превысит спрос, и тогда курс акции упадет.
Главные причины колебания цены акции -- финансовые отчеты, новости и ожидания игроков рынка, которые проявляются как спрос и предложение. Хорошие показатели толкают цену акции вверх, а плохие -- вниз.
Эффективным рынком называют такую ситуацию, когда цена финансового инструмента в любой момент времени учитывает всю возможную информацию и является, таким образом, максимально «справедливой». Согласно гипотезе эффективного рынка, цена уже учла всё, включая даже события, происходящие в настоящий момент и инсайдерскую информацию (то, что известно лишь узкому кругу руководства компании).
Начнём с того, что на современном рынке нет никакого информационного равенства участников. Мало кто обладает действительно всей необходимой информацией касаемо того или иного рассматриваемого актива. Практически всегда есть узкий круг инсайдеров обладающих, так называемой, закрытой информацией, использованной для получения прибыли, существенно превышающей среднерыночную. Поэтому важно использовать информацию, которую многие инвесторы не используют.
В первом и базовом исследовании Ou and Penman (1989) предположили, что информация из бухгалтерских отчетов может повлиять на изменение цены акции компании. В своем исследовании авторы продемонстрировали влияние 68 бухгалтерских параметров на поведение цены акции, используя изменения годовых показателей цен акций с 1973 по 1983 годы. Параметрами были процентное изменение коэффициента текущей ликвидности, процентное изменение коэффициента быстрой ликвидности, процентное изменение в общих активах, процентное изменение (продажи / общие активы), процентное изменение в соотношении долга к собственному капиталу, процентное изменение (затраты на капитал / общие активы), процентное изменение (амортизация / активы завода), процентное изменение амортизации, процентное изменение продаж, процентное изменение запасов, процентное изменение (запасы / общие активы), процентное изменение оборачиваемости запасов, запасы / общие активы, изменение в дивиденде на акцию, доход на начальный капитал, изменение доходности на начальный капитал, коэффициент долга к собственному капиталу, доход на общую сумму активов, доход на окончательный капитал, коэффициент валовой маржи,% от (доход до вычета налогов / продажи), продажи к общей сумме денежных средств, поток денежных средств на задолженность, оборотный капитал / совокупные активы, операционная прибыль / совокупные активы, погашение долгосрочного долга как % от общей суммы долгосрочного долга, денежные дивиденды / денежные потоки. Ou и Penman (1989) сделали сводную оценку бухгалтерской информации за текущий год и назвали ее Pr. Этот параметр показывает нам вероятность положительных изменений прибыли на год вперед. Однако Ou и Penman (1989) отмечают, что доходность стратегии Pr увеличивается только в том случае, если мы инвестируем в покупку акций с Pr> 0,6 и низкой ценой относительно прибыли в кросс-секции, а также при продаже акций с Pr <= 0,4 и более высокой ценой относительно выручки в перекрестных данных.
Goslin, Chai и Gunasekarage (2012) во многом поддержали предыдущее исследование и получили некоторые аналогичные переменные, такие как доходность при окончательном капитале, доходность при стартовом капитале и доходность по всем активам. Также авторы использовали стратегию покупки акций с высоким Pr и продажи акций с низким Pr. Они утверждают, что эта стратегия дает положительные результаты на период от шести до восемнадцати месяцев. Даже после ряда тестов на чувствительность положительный результат остается стабильным.
Недостатком этих двух исследований является использование сложных методологий и большого количества исторической информации, чтобы сделать необходимый прогноз. Чтобы преодолеть эти сложные вычисления и избежать перерасчета данных, Lev и Thiagarajan (1993) используют 12 финансовых сигналов, которые, по их мнению, полезны для финансовых аналитиков. Lev and Thiagarajan (1993) показывают, что эти фундаментальные сигналы коррелируют одновременно с прибылью после учета текущих инноваций, размером фирмы и макроэкономическими условиями. Поскольку рынок не может своевременно собирать всю ценную информацию, Abarbanell and Bushee (1997) исследуют способность сигналов Lev and Thiagarajan (1993) прогнозировать будущие изменения в прибыли и будущие изменения в прогнозах аналитиков о предстоящих доходах. Они находят доказательства того, что эти факторы могут объяснить как будущие изменения доходов, так и будущие изменения в прогнозах аналитиков. В соответствии с этими выводами, Abarbanell and Bushee (1998) документируют, что инвестиционная стратегия, основанная на этих 12 фундаментальных сигналах, дает значительную высокую доходность.
Статья Piotroski (2000) расширяет предварительные исследования, используя контекстно-ориентированные показатели финансовой эффективности для разграничения сильных и слабых фирм. Вместо того, чтобы исследовать отношения между будущими доходами и конкретными финансовыми сигналами, автор собирает информацию, содержащуюся в массиве показателей эффективности, и формирует портфели на основе общего сигнала фирмы, который состоит из некоторых финансовых коэффициентов. Сосредоточив внимание на стоимостных фирмах, преимущества анализа финансовой отчетности исследуются в среде, где исторические финансовые отчеты представляют собой как лучший, так и наиболее релевантный источник информации о финансовом состоянии фирмы, и максимизируются путем выбора соответствующих финансовых мер с учетом основных экономических характеристик этих организаций с высоким B / M.
Louis Yang (2018) исследовал доходность индекса S&P 500 на предстоящий месяц и отрицательную корреляцию между прогнозированием бухгалтерской информации по доходам в следующем месяце и поведением инвесторов в текущем месяце. Он обнаружил, что, если инвесторы реагируют медленно, цена акций меняется относительно медленно. Дело в том, что люди, которые решают действовать сразу после появления отчетной информации, имеют некоторые информационные преимущества. Более того, Louis Yang (2018) использует только 8 репрезентативных переменных. Это общие активы, общие обязательства, выручка, чистый доход, акционерный капитал, общий налог на прибыль, непредвиденные доходы (убытки) и привилегированные дивиденды. В статье делается вывод, что бухгалтерские переменные прогнозируют прибыль на месяц вперед на высоком уровне объяснения.
В исследованиях Peter Chen and Guochang Zhang (2007) используется меньше параметров, чтобы показать связь между бухгалтерской информацией и ценами на акции. Они изучают изменение ставки дисконтирования, изменение возможностей роста, капиталовложения, изменение прибыльности и доходности в роли факторов, объясняющих доходность акций. Основным преимуществом этого метода является то, что модель намного ближе к реальности (теоретические и эмпирические результаты совпадают) и, конечно, теоретически определенные параметры имеют большее значение.
Другое интересное исследование (Tyler Atanasov, 2017) анализирует квартальные данные с целью повышения точности. Он обнаружил, что портфели с низким E / P в среднем получают более высокую абсолютную и скорректированную с учетом риска доходность, чем портфели с высоким E / P. Tyler Atanasov (2017) также, как и многие пришел к выводу, что общедоступная информация не сразу включается в цены на ценные бумаги и в процессе корректировки наблюдаются лаги. Он обращает внимание и на другой фундаментальный бухгалтерский коэффициент - отношение балансовой стоимости к рыночной (B / M). В результате Tyler Atanasov (2017) утверждает, что обычный инвестор может обеспечить повышенную доходность, создавая портфель инвестиций на основе анализа отношений E / P и B / M организации.
1.2 Соотношение балансовой стоимости к рыночной (B/M)
Рассмотрим соотношение балансовой стоимости к рыночной. Если у фирмы этот коэффициент высокий, то считается, что фирма оценена не очень высоко (баласовая стоимости меньше рыночной). Если же показатель низкий, то фирма торгуется на рынке выше, чем она себя оценивает. Фирмы с высоким коэффициентом B / M (>1) располагают уникальной возможностью исследовать способность простого фундаментального анализа эвристики для того, чтобы дифференцировать фирмы. Во-первых, ценностью акций, как правило, пренебрегают. За группой таких компаний редко следит аналитическое сообщество, поэтому они страдают от низкого уровня интереса инвесторов. Принимая во внимание недостаток охвата, можно утверждать, что прогнозы аналитиков и рекомендации по таким акциям недоступны для этих фирм. Во-вторых, такие фирмы имеют ограниченный доступ к большинству «неформальных» каналов распространения информации, и их самостоятельное раскрытие новостных событий может не рассматриваться как заслуживающее доверия, учитывая их плохие результаты в последнее время. Таким образом, финансовые отчеты представляют собой наиболее надежный и доступный источник информации об этих фирмах. В-третьих, фирмы с высоким B / M, как правило, испытывают финансовые затруднения. В результате оценка этих фирм фокусируется на таких основах бухгалтерского учета, как кредитное плечо, ликвидность, тенденции прибыльности и адекватность денежных потоков. Эти основные характеристики наиболее легко получить из уже выпущенных финансовых отчетов. Kourtis et al. (2017) считают, что в результате неудовлетворительных результатов деятельности этих компаний создают пессимистичные ожидания, недостаточно привлекают внимание инвесторов и демонстрируют более низкий спрос на их акции. Из этого следует, что всякий раз, когда их финансовые показатели улучшаются, это меняет их рыночной стоимости на более высокую.
При использовании портфелей с акциями компаний с высоким соотношением балансовой стоимости к рыночной (B / M) возможно увеличить доходность при отборе фирм с высокими показателями финансовых коэффициентов, указанных в бухгалтерской отчетности. Выбирая организации с такими показателями Piotroski (2000) удалось увеличить доходность инвестиций на 7,5%. Это объяснялось положительной зависимостью уровня финансового успеха компании и цены акций. Похожие результаты получились у Mikiharu Noma (2010), но автор добавил сделки по продажи акций компаний с низким B / M ratio и низким показателем уровня финансовых коэффициентов. В итоге, исследователь смог повысить доходность на 7,8%.
Можно сделать вывод, что при прогнозировании доходности акций с высоким B / M следует, как можно точнее оценить финансовое состояние организации исходя их бухгалтерской информации. Это поможет точнее выбрать активы для повышения рентабельности инвестиций.
1.3 F-Score модель
Чтобы оценить финансовое положение фирмы, в известной статье Piotroski (2000) им было предложено использовать модель F-Score. Она включает в себя 9 параметров, разделенных на 3 группы. Если параметр удовлетворяет условию, то начисляется 1 балл. В итоге, модель дает оценку от 0 до 9 баллов.
Таблица 1
F-Score model
Рентабельность (profitability): |
Начисляется 1 балл, если: |
|
· рентабельность активов (ROA) · операционный денежный поток (CFO) · изменение доходности активов (ДэROA) · начисления (ACCRUAL) |
· ROA>0 в текущем году · CFO>0 в текущем году · ROAt > ROAt-1 · CFO>ROA |
|
Рычаги, ликвидность и источники средств: |
||
· Коэффициент финансового левериджа (ДLEVER) · Показатель оборотного капитала (ДLIQUID) · Изменение количества акций (EQ_OFFER) |
· ДLEVER<0 · ДLIQUID>0 · Не было выпущено новых акций за последний год |
|
Эффективность эксплуатации: |
||
· Изменение валовой прибыли (ДMARGIN) · Изменение коэффициента оборачиваемости активов (ДTURN) |
· ДMARGIN>0 · ДTURN>0 |
Kourtis et al. (2017) предложили считать компании финансово благополучными при F-Score от 7 до 9, средними от 4 до 6, а компании с низкими финансовыми результатами от 1 до 3. Механизм скрининга F-Score поощряет использование фундаментального анализа, который использует данные финансовой отчетности. Модель четко подчеркивает необходимость надежных данных и разумной политики финансовой отчетности, которая в конечном итоге компенсирует все заинтересованные стороны и экономику. Piotroski (2000) признает проблемы, касающиеся качества финансовой отчетности. Вот почему F-Score модель в анализе показателей учитывает начисления и денежные потоки при рассмотрении рентабельности. Два из четырех коэффициентов прибыльности, которые включены в модель, относятся к прибыли, основанной на начислениях, а остальные два относятся к денежным потокам и их сумме по сравнению с начислениями. Такое разделение поддерживают Ball et al. (2015) в своем исследование, доказывая, что не стоит включать только начисления при прогнозировании. Тем самым Piotroski (2000) заботится о проблеме качества данных и, следовательно, повышает эффективность F-показателя как инструмента оценки реального текущего финансового состояния компаний, который также может быть использован для оценки будущих доходов и изменений доходности вовлеченных акций. Также, модель способствует более эффективному распределению ресурсов в экономике, направляя ресурсы компаниям, которые более обоснованно раскрывают бухгалтерскую информацию.
В целом, исходя из обзора литературы, можно сказать, что для прогнозирования доходности акции стоит уделять внимание финансовым коэффициентам, рассчитанным исходя из предоставленной бухгалтерской информации. Это важно для фирм с высоким соотношением балансовой стоимости к рыночной, потому что для таких акций отчетность играет особую роль. Инвесторы не реагируют на новостные известия о фирмах и доверяют только цифрам. Также стоит понимать, что компании с высоким B / M ratio считаются финансово неблагополучными. Считается, что признаками финансовых трудностей являются более высокий левередж, более низкая доходность капитала, более низкая ликвидность и колебания доходов. Поэтому F-Score модель подходит для прогнозирования таких фирм. Из-за неудовлетворительных результатов деятельности этих компаний создаются пессимистичные ожидания, не привлекающие достаточного внимания инвесторов, и поэтому спрос на их акции низкий. Следовательно, когда их финансовые показатели улучшаются, это переводит к увеличению рыночной стоимости. Но не стоит забывать про другие стоимостные показатели, такие как P/E. Учитывая множество факторов инвесторы смогут создать сбалансированный портфель акций с наибольшей доходность. Главной задачей остается нахождение таких фирм при анализе и прогнозировании.
2. Исследовательский дизайн
2.1 База данных и переменные
В ходе работы была собрана информация об отчетности 463-х Тайских компаний при помощи информационного портала Morningstar за период с 2005 по 2018 года. В работе Kourtis et al. (2017) исследовался фондовый рынок США, который не смог показать хорошие результаты при стоимостном инвестировании. Поэтому была выбрана развивающая биржа Таиланда, в которой еще возможно применение только фундаментального анализа финансового состояния компаний. После удаления компаний с неполной информацией итоговая база данных насчитывала 78 параметров и 1580 наблюдений. Мы рассматривали наблюдения как кросс-секцию, а не как панельные данные. Использовались годовые данные таких отчетов, как отчет о прибылях и убытках, бухгалтерский баланс, отчет о движении денежных средств. Далее были получены различные финансовые коэффициенты для оценки состояния фирмы, в том числе Joel Greenblatt's Magic Numbers, Peter Lynch's fair value, Piotroski F-score. Для измерения доходности акций были использованы исторические данные Тайской фондовой биржи. В качестве критерия оценки доходности был введен параметр set_return равный годовой доходности общего индекса биржи. При анализе доходов от инвестирования в акции был создан параметр priceg, рассчитывающийся по формуле . Если изменение цены акции превосходило значение годовой доходности индекса, фирма считалась прибыльной для инвестирования («winner»). В противном случае фирме присваивалось значение «looser». Полный перечень параметров смотрите в Приложении.
2.2 Методология
В исследовании была поставлена цель - найти модель, которая сможет объяснить зависимость доходности акций от бухгалтерской информации и с наибольшей точность спрогнозировать результат. Для определения «победителей» и «проигравших» использовалось значение разницы доходности акций и средней доходности по индексу рынка в целом. Если акции компании приносят больше дохода чем индекс рынка, то такие организации считались «победителями». Модель анализировала показатели компании и строили прогнозы по доходности, основываясь на бухгалтерской информации. Была сгенерирована переменная winloss равная разнице доходности акции и среднего индекса по рынку для того, чтобы отделить фирмы «победители» от «проигравших». Если компания являлась «победителем», то ее доходность оказывалась выше доходности индекса биржи. В современном мире многие отрасли экономики используют машинное обучение для улучшения анализа и прогнозов исходя из исторической информации. Hargreaves et al. (2017) в своей работе используют следующие методы машинного обучения - logistic regression, метод случайного леса (decision trees) и нейросети (neural networks). По результатам исследования в апреле 2017 года показатели портфелей акций в дереве решений были лучше, чем на фондовом рынке, но довольно похожи на результаты для логистической регрессии и портфелей акций нейронных сетей. Эта статья описала то, что подходы на основе методов машинного обучения могут с высокой точно предсказать, какие активы увеличатся в цене. Поэтому нами был выбран метод машинного обучения для дальнейшего прогнозирования результатов. Для достижения цели были протестированы такие методы машинного обучения, как метод опорных векторов (SVM), boosted logit regression, random forest classification и нейронные сети (Neural Networks). Мы случайным образом разделили базу данных на обучающую и тестовую в соотношении 60/40%. В результате в тренировочный набор попали 948 наблюдений, а в испытательный- 632. Мы также удалили переменные, мешающие обучению. Среди них оказались года, наименования акций, рост цен и доходность индекса. Между двумя методами Gradient Boosting Machine был выбран именно boosted logit, так как он позволяет более точно предсказать бинарные параметры. Так, как данные можно легко разделить прямой на «winner» и «looser», мы использовали С-classification support vector machine с линейным ядром (kernel).
Для работы с нейронными сетями нам понадобилось переименовать переменные win и lose в 1 и 0 соответственно. Далее нам нужно было создать формулу для вставки в модель машинного обучения. Функция neuralnet() принимает только общий датасет без разделений на обучающий и тестовый. С помощью правила большого пальца в качестве скрытых слоев (hidden layers) было выбрано два с семью нейронами каждый.
Чтобы понять какая из моделей машинного обучения лучше объясняет связь финансовых коэффициентов и показателей с доходностью акций, следует сравнить процент точности предсказания с помощью матриц ошибок (Confusion Matrix). Работа состоит в обучении по тренировочной базе данных и дальнейшем сравнении предсказанных значений с тестовым датасетом.
3. Эмпирический анализ факторов, влияющих на доходность акций
3.1 Метод опорных векторов (SVM)
Метод опорных векторов - самый популярный из методов классической классификации. Идея этого метода заключается в том, чтобы найти то, как надо провести две прямые между категориями, чтобы между ними образовался наибольший зазор. Для обучения методом опорных векторов была выбрана спецификация с линейным распределением. После проведения тренировки было выполнено тестирование. Результаты приведены в Таблице 2 и Таблице 3.
Таблица 2
Матрица ошибок
Reference |
|||
Prediction |
win |
lose |
|
win |
248 |
133 |
|
lose |
90 |
161 |
Исходя из данных Таблицы 2 можно сделать вывод, что при предсказанных моделью 381 win, действительно оказались win 248, а при определении параметра lose, модель предсказала неверно 90 значений. Из Таблицы 3 следует, что при обучении методом опорных векторов, модель оказалась точна на 64,72% и предсказала 64,14% из всех названных «победителей». Используя этот классификатор, можно выявить среднюю доходность акций на уровне 65,59% через команду:
mean(backtest[backtest$winloss==pred & pred=='win',]$priceg)
Средняя доходность индекса фондовой биржи Таиланда составляет 21,19%.
Таблица 3
Статистика по результатам прогноза SVM
Accuracy |
0.6472 |
|
95% CI |
(0.6085, 0.6844) |
|
No Information Rate |
0.5348 |
|
P-Value [Acc > NIR] |
6.937e-09 |
|
Kappa |
0.2841 |
|
Mcnemar's Test P-Value |
0.004915 |
|
Sensitivity |
0.5476 |
|
Specificity |
0.7337 |
|
Pos Pred Value |
0.6414 |
|
Neg Pred Value |
0.6509 |
|
Prevalence |
0.4652 |
|
Detection Rate |
0.2547 |
|
Detection Prevalence |
0.3972 |
|
Balanced Accuracy |
0.6407 |
3.2 Boosted Logistic Regression
Boosted logistic regression (LogitBoost) логистическая регрессия - статистическая модель, применяемая для прогнозирования вероятности возникновения некоторого события. Логистическая регрессия используется для описания данных и объяснения связи между одной зависимой двоичной переменной и одной или несколькими номинальными, порядковыми, интервальными или относительными независимыми переменными. При обучении методом Boosted Logit было задано 150 итераций и 25 повторений с шагом 0,1 при проверке начальной загрузки. После анализа оказалось, что только 64 переменные значимы. Ниже на Рис. 1 показаны 10 наиболее значимых переменных. К. ним относятся указанные ранее F-score (Piotroski, 2000) и earning yield (Tyler Atanasov, 2017). Они оказывают положительное влияние на доходность акций. В то время, как показатель price-to-book ratio негативно влияет на объясняемую переменную. Это объясняется тем, что недооцененные акции демонстрируют лучшую доходность при условии положительных финансовых показателей. При проверке результатов прогнозирования модели мы получили следующие данные, указанные в Таблице 4 и 5.
Таблица 4
Матрица ошибок Boosted Logistic Regression
Reference |
|||
Prediction |
win |
lose |
|
win |
271 |
166 |
|
lose |
67 |
128 |
Рис.1 10 наиболее значимых параметров при Boosted Logit
Таблица 5
Статистика по результатам прогноза Boosted Logit
Accuracy |
0.6313 |
|
95% CI |
(0.5924, 0.669) |
|
No Information Rate |
0.5348 |
|
P-Value [Acc > NIR] |
5.855e-07 |
|
Kappa |
0.2425 |
|
Mcnemar's Test P-Value |
1.361e-10 |
|
Sensitivity |
0.4354 |
|
Specificity |
0.8018 |
|
Pos Pred Value |
0.6564 |
|
Neg Pred Value |
0.6201 |
|
Prevalence |
0.4652 |
|
Detection Rate |
0.2025 |
|
Detection Prevalence |
0.3085 |
|
Balanced Accuracy |
0.6186 |
Исходя из данных, представленных в Таблицах 4 и 5, можно утверждать, что модель имеет 63,13% точности вне выборки и указывает верно искомые параметры на 65,64% в тестовом датасете. Данная модель имеет точность прогноза меньше, чем алгоритм с использованием техники опорных векторов и предсказывает среднюю доходность акций «победителей» на уровне 65,73%.
3.3 Метод случайного леса (Random Forest)
Случайный лес -- один из наиболее распространённых методов машинного обучения. Он сочетает в себе метод бэггинга (технология классификации, при которой каждый из алгоритмов обучается независимо) и метод случайных подпространств (базовые алгоритмы обучаются на различных подмножествах признакового описания (признаковое описание - вектор, составленный из значений, не обязательно числовых, соответствующих некоторому набору признаков для данного объекта), которые выделяются случайным образом. При анализе с помощью алгоритма случайного леса были выявлены наиболее значащие параметры, которые приведены ниже на Рис.2.
Рис. 2 10 наиболее значимых параметров при Random Forest
Мы можем наблюдать, что опять наибольшую значимость имеет параметр earning yield. Также другой стоимостной показатель, показывающий состояние начисленного расхода (accruals), имеет сильное влияние. Sloan Ratio = (Net Income - CFO - CFI) / Total Assets
После прогнозирования методом случайного леса мы получили матрицу ошибок (Таблица 6) и описательную статистику (Таблица 7). Исходя из этой информации, мы видим, что данный алгоритм дает наибольшую точность среди изученных моделей. Этот показатель доходит до 87,59%. Такие результаты очевидны, так как данный метод в большинстве случаев демонстрирует наибольшую точность, но не может объяснить такие высокие показатели. Метод случайного леса прогнозирует доходность акций в 58,05%.
Таблица 6
Матрица ошибок при Random Forest Classification
Reference |
|||
Prediction |
win |
lose |
|
win |
305 |
61 |
|
lose |
33 |
233 |
Таблица 7
Статистика по результатам прогноза Random Forest Classification
Accuracy |
0.8513 |
|
95% CI |
(0.8211, 0.8781) |
|
No Information Rate |
0.5348 |
|
P-Value [Acc > NIR] |
< 2.2e-16 |
|
Kappa |
0.6992 |
|
Mcnemar's Test P-Value |
0.005355 |
|
Sensitivity |
0.7925 |
|
Specificity |
0.9024 |
|
Pos Pred Value |
0.8759 |
|
Neg Pred Value |
0.8333 |
|
Prevalence |
0.4652 |
|
Detection Rate |
0.3687 |
|
Detection Prevalence |
0.4209 |
|
Balanced Accuracy |
0.8474 |
3.4 Нейронные сети (Neural Networks)
Нейросети (нейронные сети) - это последовательность нейронов и связей между ними. Эти связи - каналы, через которые нейроны принимают или отправляют информацию, при чем у каждой связи имеется единственный параметр - вес («прочность» связи). Задача нейронов - собрать числа со всех своих входов, выполнить функцию над ними и отправить результат на выход. При этом данные идут строго в одном направлении - от входов первого слоя нейронов к выходу последнего нейрона. Используя метод нейронных сетей при машинном анализе, мы получили графическую интерпретацию объясняющих параметров (Рис.3). Специфика метода состоит в том, что при анализе учитываются скрытые переменные, влияющие на объясняемую переменную. Было задано два таких «слоя» с семью нейронами в каждом. Этот алгоритм предсказал лишь 51,11% (Таблица 9) от общего числа «победителей» в тестовой выборке. То есть 323 из 632 (Таблица 8). Такое объясняется одним из недостатков этого метода, который не позволяет пошагово решать одну и ту же последовательную задачу. Нейросети лишь могут помочь увеличить точность будущего значения, но не предсказать его. Поэтому среднее значение предсказанной доходности акций равное 61,78% не так точно отражает реальность, как другие модели.
Рис 3. Графическая интерпретация анализа данных с помощью нейронных сетей
Таблица 8
Матрица ошибок при Neural Networks
Reference |
|||
Prediction |
win |
lose |
|
win |
197 |
168 |
|
lose |
141 |
126 |
Таблица 9
Статистика по результатам прогноза Neural Networks
Accuracy |
0.5111 |
|
95% CI |
(0.4713, 0.5507) |
|
No Information Rate |
0.5348 |
|
P-Value [Acc > NIR] |
0.8917 |
|
Kappa |
0.0115 |
|
Mcnemar's Test P-Value |
0.1391 |
|
Sensitivity |
0.4286 |
|
Specificity |
0.5828 |
|
Pos Pred Value |
0.4719 |
|
Neg Pred Value |
0.5397 |
|
Prevalence |
0.4652 |
|
Detection Rate |
0.1994 |
|
Detection Prevalence |
0.4225 |
|
Balanced Accuracy |
0.5057 |
Итак, мы протестировали 4 метода машинного обучения для анализа и прогнозирования - метод опорных векторов (SVM), boosted Logistic Regression, метод случайного леса (Random Forest) и нейронные сети (Neural Networks). Все модели продемонстрировали хорошие результаты. Модель случайных лесов и опорных векторов показывают наибольшую точность 85,13% и 64,72% соответственно.
Заключение
В результате исследования мы видим, что бухгалтерская информация позволяет спрогнозировать доходность акций. Финансовые показатели помогают определить фирму как «победителя» с доходностью выше средней по индексу рынка.
Данная работа в ходе анализа зарубежной литературы выявила финансовые показатели, объясняющие изменения доходности акций, и использовала их при выборе модели прогнозирования. Современное общество стремиться автоматизировать многие процессы, поэтому методом прогнозирования и анализа был выбран метод машинного обучения. Рынок не всегда успевает своевременно отреагировать на финансовую информацию компаний, поэтому чтобы увеличить прибыль стоит использовать машинные методы анализа и прогнозирования для более быстрого результата. В исследовании сравнивались различные методы - метод опорных векторов (SVM), boosted Logistic Regression, метод случайного леса (Random Forest) и нейронные сети (Neural Networks). В итоге анализа базы данных развивающейся фондовой биржи Таиланда были обучены и протестированы алгоритмы. Наибольшую точность прогноза показал метод случайного леса (85,13%).
Итак, цель работы выполнена: алгоритм позволяет выявить акции, привлекательные для инвесторов, и предсказать их доходность исходя из бухгалтерской информации для получения сверхприбыли. По итогам тестирования модель рассчитала среднюю доходность портфеля акций «победителей» на уровне 58,05% при том, что средняя доходность индекса биржи составляет 21,19%.
Подводя итоги, стоит сказать, что фундаментальный анализ финансового состояния компаний при помощи машинного обучения может помочь инвесторам составлять более сбалансированные и прибыльные портфели. При внедрении новых технологий следует больше времени уделять обучению роботов. В дальнейших исследованиях хотелось бы применить более сложные спецификации машинного обучения, которые сейчас недоступны для нас.
Список литературы
1. Abarbanell, J., & Bushee, B. (1998). Abnormal Returns to a Fundamental Analysis Strategy. The Accounting Review, 73(1), 19-45.
2. Alexakis, C., Patra, T., Poshakwale, S. (2010). Predictability of Stock Returns using Financial Statement Information: Evidence on Semi-strong Efficiency of Emerging Greek Stock Market. Applied Financial Economics, 20(16), 1321-1326.
3. Atanasov, T. (2017). Using Accounting Information to Forecast Market Performance. Honors Research Projects, 414.
4. Ball, R., Gerakos, J., Linnainmaa, J.T., Nikolaev, V. (2016). Accruals, cash flows, and operating profitability in the cross section of stock returns. Journal of Financial Economics, 121, 28-45.
5. Brennan, M.J. (1991). A Perspective on Accounting and Stock Prices. The Accounting Review, 66(1), 67-79.
6. Chen, P., Zhang, G. (2007). How do accounting variables explain stock price movements? Theory and evidence. Journal of Accounting and Economics, 43, 219-244.
7. Goslin, J., Chai, D., Gunasekarage, A. (2012). The Usefulness of Financial Statement Information in Predicting Stock Returns: New Zealand Evidence. Australasian Accounting, Business and Finance Journal, 6(2), 51-70.
8. Hargreaves, C.A., Reddy, V.C., Reddy, R.V. (2017). Machine learning application in the financial markets industry. Indian Journal of Scientific Research, 17(1), 253-256.
9. Kourtis, G.P., Кourtis, E.P., Kourtis, M.P., Curtis, P.G. (2017). Fundamental Analysis, Stock Returns and High B/M Companies. International Journal of Economics and Business Administration, 4, 3-18.
10. Liu, J., Thomas, J. (2000). Stock Returns and Accounting Earnings. Journal of Accounting Research, 38(1), 71-101.
11. Noma, M. (2010). Value investing and financial statement analysis. Hitotsubashi Journal of Commerce and Management, 44, 29-46.
12. Ou, J.A., Penman, S.H. (1989). Financial Statement Analysis and the Prediction of
13. Stock Returns. Journal of Accounting and Economics, 11, 295-330
14. Patra T., Poshakwale, S. (2008). Long-run and Short-run Relationships between the Main Stock Indexes: Evidence from the Athens Stock Exchange. Applied Financial Economics, 18, 1401-1410.
15. Piotroski, J. (2000). Value investing: The use of historical financial statement information to separate winners from losers. Journal of Accounting Research, 38, 1- 41.
16. Sohnke, M.B., Grinblatt, M. (2017). Fundamental analysis works.
17. Lev, B., Thiagarajan, R. (1993) Fundamental Information Analysis. Journal of Accounting Research, 31, 190-214.
18. Yang, L. (2018). Predicting Stock Market Returns with an Accounting Factor. Journal of University of Southern California.
Приложение
## [1] ".id"
## [2] "symbol"
## [3] "i"
## [4] "revenue"
## [5] "costofgoodssold"
## [6] "grossprofit"
## [7] "grossmargin"
## [8] "sellinggeneraladminexpense"
## [9] "advertising"
## [10] "researchdevelopment"
## [11] "otheroperatingexpense"
## [12] "operatingincome"
## [13] "operatingmargin"
## [14] "interestincome"
## [15] "interestexpense"
## [16] "netinterestincome"
## [17] "otherincomeexpense"
## [18] "otherincomeminorityinterest"
## [19] "pretaxincome"
## [20] "taxprovision"
## [21] "taxrate"
## [22] "netincomecontinuingoperations"
## [23] "netincomediscontinuedoperations"
## [24] "netincome"
## [25] "netmargin"
## [26] "preferreddividends"
## [27] "epsbasic"
## [28] "epsdiluted"
## [29] "sharesoutstandingdilutedaverage"
## [30] "depreciationdepletionandamortization"
## [31] "ebitda"
## [32] "cashandcashequivalents"
## [33] "marketablesecurities"
## [34] "cashcashequivalentsmarketablesecurities"
## [35] "accountsreceivable"
## [36] "inventoriesrawmaterialscomponents"
## [37] "inventoriesworkinprocess"
## [38] "inventoriesinventoriesadjustments"
## [39] "inventoriesfinishedgoods"
## [40] "inventoriesother"
## [41] "totalinventories"
## [42] "othercurrentassets"
## [43] "totalcurrentassets"
## [44] "investmentsandadvances"
## [45] "landandimprovements"
## [46] "buildingsandimprovements"
## [47] "machineryfurnitureequipment"
## [48] "constructioninprogress"
## [49] "grosspropertyplantandequipment"
## [50] "accumulateddepreciation"
## [51] "propertyplantandequipment"
## [52] "intangibleassets"
## [53] "goodwill"
## [54] "otherlongtermassets"
## [55] "totalassets"
## [56] "accountspayable"
## [57] "totaltaxpayable"
## [58] "otheraccruedexpense"
## [59] "accountspayableaccruedexpense"
## [60] "currentportionoflongtermdebt"
## [61] "currentdeferredrevenue"
## [62] "currentdeferredtaxesliabilities"
## [63] "deferredtaxandrevenue"
## [64] "othercurrentliabilities"
## [65] "totalcurrentliabilities"
## [66] "longtermdebt"
## [67] "capitalleaseobligation"
## [68] "debttoequity"
## [69] "pensionandretirementbenefit"
## [70] "noncurrentdeferredliabilities"
## [71] "minorityinterest"
## [72] "otherlongtermliabilities"
## [73] "totalliabilities"
## [74] "commonstock"
## [75] "preferredstock"
## [76] "retainedearnings"
## [77] "accumulatedothercomprehensiveincomeloss"
## [78] "additionalpaidincapital"
## [79] "treasurystock"
## [80] "totalequity"
## [81] "totalequitytototalasset"
## [82] "netincome.1"
## [83] "netforeigncurrencyexchangegain"
## [84] "netincomefromcontinuingoperations"
## [85] "depreciationdepletionandamortization.1"
## [86] "changeinreceivables"
## [87] "changeininventory"
## [88] "changeinprepaidassets"
## [89] "changeinpayablesandaccruedexpense"
## [90] "changeinworkingcapital"
## [91] "changeindeferredtax"
## [92] "stockbasedcompensation"
## [93] "cashflowfromdiscontinuedoperations"
## [94] "cashflowfromothers"
## [95] "cashflowfromoperations"
## [96] "purchaseofpropertyplantequipment"
## [97] "saleofpropertyplantequipment"
## [98] "purchaseofbusiness"
## [99] "saleofbusiness"
## [100] "purchaseofinvestment"
## [101] "saleofinvestment"
## [102] "netintangiblespurchaseandsale"
## [103] "cashfromdiscontinuedinvestingactivities"
## [104] "cashfromotherinvestingactivities"
## [105] "cashflowfrominvesting"
## [106] "issuanceofstock"
## [107] "repurchaseofstock"
## [108] "netissuanceofpreferredstock"
## [109] "netissuanceofdebt"
## [110] "cashflowfordividends"
## [111] "otherfinancing"
## [112] "cashflowfromfinancing"
## [113] "netchangeincash"
## [114] "capitalexpenditure"
## [115] "freecashflow"
## [116] "peratiottm"
## [117] "pricetobook"
## [118] "pricetotangiblebook"
## [119] "pricetofreecashflowratio"
## [120] "pricetooperatingcashflowratio"
## [121] "psratio"
## [122] "evtorevenue"
## [123] "evtoebitda"
## [124] "evtoebit"
## [125] "earningsyieldjoelgreenblatt"
## [126] "forwardrateofreturn"
## [127] "shillerperatio"
## [128] "marketcap"
## [129] "enterprisevalue"
## [130] "monthendstockprice"
## [131] "netcashpershare"
## [132] "netcurrentassetvaluepershare"
## [133] "netnetworkingcapitalpershare"
## [134] "projectedfcfpershare"
## [135] "medianpspershare"
## [136] "peterlynchfairvaluepershare"
## [137] "grahamnumberpershare"
## [138] "earningspowervalueepv"
## [139] "altmanzscore"
## [140] "piotroskifscore"
## [141] "beneishmscore"
## [142] "sloanratio"
## [143] "higheststockprice"
## [144] "loweststockprice"
## [145] "sharesbuybackratio"
## [146] "yoyrevpershgrowth"
## [147] "yoyepsgrowth"
## [148] "yoyebitdagrowth"
## [149] "ebitda5ygrowth"
## [150] "sharesoutstandingbasicaverage"
## [151] "sharesoutstandingeop"
## [152] "beta"
## [153] "filingdate"
## [154] "restatedfilingdate"
## [155] "returnonequity"
## [156] "returnonassets"
## [157] "returnoncapitaljoelgreenblatt"
## [158] "returnoninvestedcapital"
## [159] "weightedaveragecostofcapitalwacc"
## [160] "grossmargin.1"
## [161] "operatingmargin.1"
## [162] "netmargin.1"
## [163] "debttoequity.1"
## [164] "totalequitytototalasset.1"
## [165] "ltdebttototalasset"
## [166] "assetturnover"
## [167] "dividendpayoutratio"
## [168] "dayssalesoutstanding"
## [169] "daysaccountspayable"
## [170] "daysinventory"
## [171] "cashconversioncycle"
## [172] "inventoryturnover"
## [173] "cogstorevenue"
## [174] "inventorytorevenue"
## [175] "revenuepershare"
## [176] "ebitdapershare"
## [177] "ebitpershare"
## [178] "earningspersharediluted"
## [179] "epswithoutnri"
## [180] "freecashflowpershare"
## [181] "dividendspershare"
## [182] "bookvaluepershare"
## [183] "tangiblebookpershare"
## [184] "totaldebtpershare"
## [185] "monthendstockprice.1"
## [186] "fwd_price"
## [187] "priceg"
## [188] "pegratio"
## [189] "set_return"
Размещено на Allbest.ru
Подобные документы
Основы формирования бухгалтерской отчетности организации, система ее нормативного регулирования. Виды и функции бухгалтерской отчетности. Анализ полноты отражения учетной информации в бухгалтерской отчетности ОАО "Сибирь - Ноябрьскнефтегазгеофизика".
дипломная работа [751,1 K], добавлен 22.12.2010Понятие и значение бухгалтерской отчетности. Состав бухгалтерской отчетности. Порядок составления бухгалтерской отчетности. Правовая база бухгалтерской отчетности. Требования к информации, формируемой в бухгалтерской отчетности. Нормативные документы.
реферат [31,9 K], добавлен 13.01.2009Понятие и значение бухгалтерской отчетности. Требования к информации, формируемой в бухгалтерской отчетности. Состав бухгалтерской отчетности. Порядок составления бухгалтерской отчетности. Нормативные документы о бухгалтерской отчетности.
курсовая работа [20,3 K], добавлен 18.11.2005Система принципов формирования информации о финансовых результатах и распределения прибыли. Учет доходов и расходов, определяющих прибыль до налогообложения. Раскрытие информации об убытках в бухгалтерской отчетности. Анализ и оценка рентабельности.
дипломная работа [169,0 K], добавлен 22.02.2015Экономическое содержание понятия "информации о связанных сторонах". Операции между связанными сторонами. Состав информации, отражаемой в бухгалтерской отчетности. Анализ соответствия российского стандарта содержанию международного стандарта отчетности.
курсовая работа [29,4 K], добавлен 08.09.2011Теоретические основы и содержание бухгалтерской отчетности. Основные понятия и элементы, функции и виды. Требования к качественным характеристикам информации, представляемой в бухгалтерской отчетности. Состав и взаимосвязь форм бухгалтерской отчетности.
курсовая работа [51,3 K], добавлен 24.03.2010Финансово-экономическая характеристика ОАО ПСК "Строитель Астрахани". Особенности организации бухгалтерского учета на предприятии. Сущность и назначение бухгалтерской финансовой и статистической отчетности. Этапы составления бухгалтерской отчетности.
курсовая работа [53,7 K], добавлен 27.08.2013Понятие, назначение и содержание бухгалтерской отчетности. Этапы развития бухгалтерской отчетности в России. Международные требования к составу, содержанию и раскрытию информации в бухгалтерской отчетности. Отчет о прибылях и убытках, порядок составления.
курсовая работа [39,0 K], добавлен 29.03.2011Понятие, значение бухгалтерской отчетности и её пользователи, порядок составления. Требования к информации, формируемой в бухгалтерской отчетности. Нормативные документы, ее регулирующие. Значение бухгалтерского баланса и отдельных форм отчетности.
курсовая работа [50,3 K], добавлен 06.12.2013Сущность, задачи бухгалтерской отчетности. Элементы, формируемые в отчетности и состав форм бухгалтерской финансовой отчетности. Порядок составления бухгалтерской отчетности. Ответственность организации за допущенные искажения бухгалтерской отчетности.
курсовая работа [100,5 K], добавлен 23.11.2014