Развитие методов прогнозирования цен акций

Нейронные сети, их развитие и применение в прогнозировании динамики цен акций. Сущность классических моделей машинного обучения в работе Э. Герлейна и М. МакГиннити. Построение модели прогнозирования динамики цен акций средствами машинного обучения.

Рубрика Финансы, деньги и налоги
Вид дипломная работа
Язык русский
Дата добавления 27.08.2018
Размер файла 2,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Эксперименты Герлейна и МакГиннити и их успехи прогнозирования. Базовое тестирование модели на каждом классификаторе практически повторяет эксперимент Бело и Барбосы Barbosa, R. P., & Belo, O. Autonomous Forex Trading Agents. In Proc. of the 8th industrial conference on Advances in Data Mining: Medical Applications, E-Commerce, Marketing, and Theoretical Aspects. ICDM'08 (pp. 389-403). Leipzig, Germany: Springer-Verlag. 2008 года, а потому не выдало предсказательную способность существенно бульшую 50%. При этом единственный алгоритм, показавший положительную существенную прибыльность от операций, это OneR. В таблице 3 и на рис. 9. можно пронаблюдать различные показатели метрик и их изменения во времени:

Табл. 3

Результаты предсказаний для 6 классификаторов (+ рандомный) на 2510 сделках: одинарное обучение

Рис. 9 Графики кумулятивной точности на 100 первых сделках: одинарное обучение

Источник Gerlein E.A., Mcginnity M., Belatreche A., Coleman A., Evaluating machine learning classification for financial trading: an empirical approach, Expert Systems With Applications (2016).

Как видно из таблицы 3 и рис. 9, один раз обучиться на выборке одним из классификаторов явно недостаточно: точность не превосходит подбрасывание монетки. Логичным решением было бы постепенно дообучаться, используя фрагменты тестовой выборки. Каждые 50 периодов модель дообучается, увеличивая обучающую выборку за счет результатов новых сделок. Хотя, судя по графикам (рис. 10), это не слишком помогло:

Рис. 10 Кумулятивная точность для предсказателей, дообучающихся каждые 50 сделок

Табл. 4

Таблица метрик для 6 классификаторов при дообучении модели через каждые 50 сделок

Источник Gerlein E.A., Mcginnity M., Belatreche A., Coleman A., Evaluating machine learning classification for financial trading: an empirical approach, Expert Systems With Applications (2016).

Итак, дообучение также не приносит значительных результатов - точность предсказания все еще не поднимается выше точности подбрасывания монетки. Хотя совокупная прибыльность у трех из шести возросла на порядок (тем не менее, вполне возможно, что при повторном обучении она была бы не такой высокой, и зависимость этого показателя от точности предсказаний также рандомна).

Следующей попыткой улучшить показатели стала модель дообучения, основанная на гипотезе, что из-за постоянно растущей обучающей выборки классификаторы переобучаются, находя зависимости между слишком отдаленными во времени моментами. Поэтому в следующем эксперименте были использованы скользящие окна - диапазоны в n = [500, 1000, 2000, 4000] экземпляров; также варьировался период обучения - каждые 5, 10, 15 и 20 сделок, и количество атрибутов - пять или десять (таблица 5):

Табл. 5

Вариации атрибутов для модели Герлейна и МакГиннити - в количестве 5 и 9

Источник Gerlein E.A., Mcginnity M., Belatreche A., Coleman A., Evaluating machine learning classification for financial trading: an empirical approach, Expert Systems With Applications (2016).

Различными вариациями этих признаков были получены 12 предустановок, на которых было произведено дообучение и замерены метрики качества предсказаний. Соответствующие результаты приведены в таблице 6.

Табл. 6

Параметры предустановок и их результаты после проведения дообучения

Источник Gerlein E.A., Mcginnity M., Belatreche A., Coleman A., Evaluating machine learning classification for financial trading: an empirical approach, Expert Systems With Applications (2016).

Отсюда МакГиннити и Герлейн выводят окончательные результаты по своей модели: в таблице 7 колонка (а) посвящена предустановкам, показавшим максимальную совокупную прибыль, а в колонке (b) - максимальную точность предсказания.

Табл. 7

Комбинации параметров, способствующие получению (а) максимальной совокупной прибыли, (b) максимальной точности предсказания

Источник Gerlein E.A., Mcginnity M., Belatreche A., Coleman A., Evaluating machine learning classification for financial trading: an empirical approach, Expert Systems With Applications (2016).

2.2 Другие работы, посвященные применению машинного обучения в финансовых предсказаниях

Идеи машинного обучения с каждым днем приобретают все большую популярность, интегрируясь в различные сферы, а потому растущий интерес к применению их методов для получения прибыли на рынке вполне резонен. Так, за последние пять лет увидели свет сразу несколько статей о машинных предсказаниях на рынке. В этом параграфе мы рассмотрим некоторые из них, чтобы в дальнейшем воспользоваться уже имеющимся опытом в подборе параметров для нашей модели.

Первым исследованием, которое мы рассмотрим, станет работа студентов Стэндфордского университета с лаконичным названием «Machine Learning in Stock Price Trend Forecasting», 2016 года. Для создания обучающей выборки они использовали данные из Bloomberg Database, рынок акций компании 3M Co (NYSE: MMM), торгующихся на Нью-Йорской фондовой бирже. Данных использовалось достаточно мало - всего 1471 запись (для сравнения, для качественного обучения нейросетей данных должно быть на порядок, а то и два, больше). Тем не менее, признаки, на которых обучалась модель, здесь были гораздо более подробными и интересными, чем, к примеру, у Герлейна и МакГиннити:

Табл. 8

Основные характеристики модели Жанга и Даи: рынок, параметры и источник данных

Источник Dai, Y., Zhang, Y. Machine Learning in Stock Price Trend Forecasting. Stanford University, 2013.

Жанг и Даи используют более сложные предикторы (логистическая регрессия, гауссовский дискриминантный анализ, квадратичный дискриминантный анализ и SVM - метод опорных векторов); тем не менее, точность предсказания тренда следующего дня находится в районе 50% (для сравнения, если бы тренд предсказывался подбрасыванием монетки, точность была бы такая же).

Табл. 9

Точность предсказания моделей Жанга и Даи; слева направо: логистическая регрессия, гауссовский дискриминантный анализ, квадратичный дискриминантный анализ и метод опорных векторов

Источник32

Авторы также исследовали предсказания тренда в перспективе - поскольку некоторая информация о рынке отражается на тренде не сиюсекундно. Из графика (рис. 11) видно, что когда знак разницы тренда предсказывается на большее количество дней, Accuracy для двух моделей резко возрастает:

Рис. 11 Точность предсказания модели Жанга и Даи в перспективе Dai, Y., Zhang, Y. Machine Learning in Stock Price Trend Forecasting. Stanford University, 2013.

Следующее исследование - «A Comparative Study of Predictive Algorithms for Business Analytics and Decision Support systems: Finance as a Case Study» студентов марокканского университета - является больше обзорной методологической статьей, описывающей существующие методы предсказания трендов на рынке. Тем не менее, его результаты также будут полезны для нашей работы, поскольку авторы затрагивают важные аспекты подбора данных.

В качестве набора данных авторы «Comparative Study…» выбрали объем рынка - как один из важнейших параметров в техническом анализе. Данные были собраны компанией Л'Ореаль и отражают период с 1988 года по 2014. Для оценки качества предсказания выбраны относительная ошибка (relative error, RE) и средняя абсолютная процентная ошибка (mean absolute percentage error, MAPE):

(23)

где y' - предсказываемое значение, y - наблюдаемое значение.

Meryem Ouahilal и Mohammed El Mohajir также использовали технологию отложенной выборки, обучая модели на данных с 1998 года по ноябрь 2014 и тестируя их на данных за декабрь 2014. Для трех выбранных моделей (регрессия решающими деревьями, множественная линейная регрессия и регрессия методом опорных векторов) были получены следующие результаты (табл. 10 и рис. 12):

Табл. 10

Сравнение результатов предсказания трех моделей для 21 дня декабря 2014

Рис. 12 Результаты предсказания трех моделей для 21 дня декабря 2014 Dai, Y., Zhang, Y. Machine Learning in Stock Price Trend Forecasting. Stanford University, 2013.

Исходя из таблицы 10 и рисунка 12, можно заключить, что регрессия методом опорных векторов справляется с предсказанием тренда на данном датасете на порядок лучше других сложных моделей.

Выводы из главы 2

Во второй главе исследования были рассмотрены несколько самых примечательных и недавних работ, посвященных применению классических моделей машинного обучения в контексте предсказания динамики цен акций. Была изучена основная методология работы с данными и моделями, а также базовые классификаторы и точность их предсказания.

В качестве метрик качества исследователи рекомендуют брать не только привычные показатели ошибки модели. Поскольку задача предполагает работу с финансовыми данными, качество модели также должно тестироваться финансовыми показателями - например, прибылью, реализованной за счет выигрыша при торговле акциями, цены которых прогнозируются. Тем не менее, необходимо помнить, что прибыль может быть не связанной с точностью предсказания.

Касательно подбора набора данных и их атрибутов - в большинстве описанных случаев большее количество атрибутов способствовало лучшему предсказанию. Однако очевидно, что до бесконечности такой принцип не будет работать, и существует лимит количества атрибутов, после которого качество модели начинает стремительно падать.

В качестве моделей во всех изученных статьях использовалась бинарная классификация различными аппаратами - в том числе регрессорами, решающими лесами и применением метода опорных векторов. Тем не менее, ни одна из предложенных схем не использует бустинг - только решающие леса, что является вариацией бэггинга над решающими деревьями. Судя по тому, что полученные результаты не оправдали ожиданий (зачастую они едва поднимались над уровнем точности подбрасывания монетки), использование бустинга может существенно увеличить шансы качественно прогнозировать динамику акций.

3. Построение модели прогнозирования динамики цен акций средствами машинного обучения

В последней главе исследования будет сконструирована модель машинного обучения, подобраны подходящие данные, произведен их анализ посредством получившейся модели и оценены ее качественные характеристики. По результатам анализа модель можно немного трансформировать, чтобы повысить точность. Итоговая модель позволит подтвердить или опровергнуть гипотезы, сформулированные в ходе исследования.

3.1 Выбор модели, подбор данных и признаков

Изучение классических методов машинного обучения показало, что сложные композиционные модели гораздо надежнее и точнее, чем единичные классификаторы. Наиболее подходящей по сравнению с простыми моделями кажется модель бустинга: идея постепенной минимизации ошибки до нуля с каждым новым классификатором представляется наиболее оптимальной для достижения высоких показателей на тестовой выборке.

Изучение литературы по данной тематике показало, что из-за сложности в обработке данных и настройки модели бустинг наиболее редко использовался для прогнозирования динамики цен акций - чаще всего исследователи смотрели на результаты отдельных классификаторов и больше работали с выборкой и параметрами, чем с самой моделью. Если использовать бустинг даже над элементарными классификаторами, можно достичь гораздо больших результатов, чем используя простейшие классификаторы по отдельности.

Таким образом, модель, построенная в данном исследовании, будет базироваться на идее композиционного классификатора, а именно - градиентного бустинга над решающими деревьями (модель - extreme gradient boosting, xgboost).

В качестве данных, на которых будет производиться обучение, используем выборку из набора данных котировок акций Сбербанка с апреля 2005 года по апрель 2018-го. При этом, для того, чтобы избежать переобучения из-за незначительных временных отклонений и колебаний котировок, данные выбраны с интервалом раз в день. В качестве базовых столбцов в датасете выбраны «Дата» (ґDateґ), «Цена открытия» (ґOpenґ), «Наивысшая цена за день» (ґHighestґ), «Наименьшая цена за день» (ґLowestґ), «Цена закрытия» (ґCloseґ) и «Объем» (ґVolґ - от англ. Volume) - по этим базовым показателям в дальнейшем строятся признаки для обучения.

Итоговая модель не будет зависеть от самих данных, поскольку разработана таким образом, чтобы автоматически подстраиваться под них, подбирая необходимые коэффициенты. При выборе других данных модель попросту обучится на других зависимостях и подберет другие коэффициенты; важно лишь, чтобы данные содержали необходимые для расчета признаков столбцы. Таким образом, сами временные зависимости не имеют для модели значения, если они при этом оформлены в формате, позволяющем произвести обучение над ними.

Поскольку предсказание требует оценки временного ряда, нельзя основывать обучение только на текущих показателях - будущие прогнозы всецело зависят от корреляций в данных и зависимостях между показателями за разные периоды. Для того, чтобы корректно оценить всевозможные зависимости (с учетом того, что данные отражают финансовые показатели), в качестве признаков будут использованы различные экономические технические индикаторы, основанные на базовых показателях датасета.

Первый из использованных индикаторов - индекс относительной силы (Relative Strength Index, RSI). RSI классифицируется как импульсный осциллятор, измеряющий скорость и величину направленных ценовых движений. Импульс - это рост или падение цены. RSI вычисляет импульс как отношение более высоких цен закрытий к низким, т.е. акции, которые имели больше негативных изменений. RSI наиболее часто используется с 14-дневным периодом и измеряется в масштабе от 0 до 100, с высоким и низким уровнями. Более короткие или более длинные таймфреймы используются для более коротких или более длинных прогнозов соответственно. Более экстремальные высокие и низкие уровни - 80 и 20, или 90 и 10 - встречаются реже, но указывают на более сильный импульс. RSI вычисляется по следующим формулам:

(24)

(25)

Следующий показатель - стохастический осциллятор (Stochastic Oscillator, SO). Термин «стохастический» относится к показателю текущей цены по отношению к ее ценовому диапазону в течение определенного периода времени. С помощью этого показателя можно предсказать ценовые повороты, сравнивая цену закрытия ценной бумаги с ее ценовым диапазоном (например, так же 14-дневным).

(26)

где С - текущая цена закрытия, - самая низкая минимальная цена за последние 14 дней, самая высокая максимальная цена за последние 14 дней.

Третий используемый технический индикатор - процентный диапазон Вильямса (Williams %R). Williams %R колеблется от -100 до 0. Когда его значение превышает -20, оно указывает на сигнал продажи, а когда его значение ниже -80 - на сигнал покупки. Williams %R считается по следующей формуле:

(27)

где С - текущая цена закрытия, - самая низкая минимальная цена за последние 14 дней, самая высокая максимальная цена за последние 14 дней.

Также в качестве признаков для обучения модели используется осциллятор Схождение/Расхождение Скользящих Средних (Moving Average Convergence/Divergence, MACD) и его сигнальная линия (SignalLine). Когда MACD проходит ниже SignalLine, он указывает на сигнал продажи. Когда он проходит выше SignalLine - на сигнал покупки. Показатель осциллятора рассчитывается по следующей формуле:

(28)

(29)

где С - набор цен закрытия, - экспоненциальное скользящее среднее от показателей х за n дней.

Еще одним индикатором, чей показатель используется для обучения модели, становится индикатор скорости изменения цены акций (Price Rate of Change, PROC). Он измеряет последнее изменение цены по отношению к цене n-дневной давности. Расчет индикатора производится с помощью выражения:

(30)

где C(t) - цена закрытия в момент времени t.

Последний индикатор, используемый в качестве признака - индикатор балансового объема (On Balance Value, OBV). Он используется для определения тенденций покупки и продажи акций и рассчитывается по следующей составной формуле:

(31)

где Vol(t) - объем торгов в момент времени t, C(t) - цена закрытия в момент времени t.

3.2 Описание процесса обучения, предобработка данных и настройка параметров модели

После того, как модель, данные и признаки были выбраны, необходимо построить саму модель и обучить ее. Обозначим последовательность действий, необходимых для обучения, а затем подробнее опишем каждый из пунктов:

1. Выбор и загрузка данных;

2. Предобработка данных;

3. Подбор признаков;

4. Формирование признаков для выбранных данных;

5. Разделение данных на обучающую и тестовую выборки и кросс-валидация;

6. Непосредственное обучение;

7. Проверка адекватности полученной модели.

1. Выбор и загрузка данных

Подбор данных и обоснование выбора было произведено в предыдущем параграфе текущей главы. Далее данные в формате.csv загружаются и подвергаются обработке.

2. Предобработка данных

Предобработка заключается в том, чтобы поправить форматы текущих столбцов так, чтобы в дальнейшем их можно было корректно использовать для обучения; так, например, был отредактирован столбец с датой измерения: они были приведены к формату «дата», а также дублирован в отдельные столбцы для каждого блока даты (день, месяц, год).

3. Подбор признаков

(Произведен в предыдущем параграфе). Далее каждый из подобранных признаков описывается в качестве функции.

4. Формирование признаков для выбранных данных

Для каждого измерения (по датам) как для текущего подсчитываются семь признаков; кроме того, каждому измерению также сопоставляются признаки дней в течение прошедшего месяца - таким образом, в обучении будет учитываться влияние показателей прошедших дней на текущую дату. Всего получается более 200 признаков, подсчитанных для каждого измерения. Чтобы избежать ошибок в данных, первые 30 дней измерений не учитываются - тогда для последующих все показатели «за прошедший месяц» будут отображены корректно.

5. Разделение данных на обучающую и тестовую выборки и кросс-валидация

На данный момент соотношение обучающей выборки к тестовой - 0.7/0.3; то есть, 70% имеющихся данных используются для поиска зависимостей и 30% - для проверки корректности обучения; такое соотношение позволяет в достаточной мере обучиться, и при этом проверить на эффективность обучения на достаточном объеме выборки. Данное значение было использовано и для кросс-валидации - настройки алгоритма; ее ход был описан в предыдущих главах.

6. Непосредственное обучение

Осуществляется в одну строчку - полученные данные вместе с признаками загружаются в функцию из библиотеки xgboost, которая производит 1000 итераций обучения, на каждой из которых возвращается показатель ошибки обучения для дальнейшей корректировки модели.

7. Проверка адекватности полученной модели

Для того, чтобы оценить, насколько эффективно - на данный момент - подобраны используемые параметры и настроена модель, необходимо рассмотреть различные графики ошибок и показатели эффективности. Если полученные показатели не устраивают, параметры модели необходимо перенастроить и повторить процесс обучения заново, получив новые графики; сравнивая их с предыдущими, делаются выводы о том, в каком направлении должны быть изменены параметры для улучшения модели. Таким цикличным повторением обучения для модели находятся оптимальные параметры, позволяющие получить наилучшее качество на тестовой выборке.

В итоге после обучения получаем модель решающего дерева (на рис. 13 представлена только часть), а также необходимые пороговые значения и коэффициенты значимости признаков. Решающее дерево можно увидеть в Приложении 3. (наименования признаков можно сверить с таблицей в Приложении 4)

Рис. 13 Модель решающего дерева

Источник: построено автором

3.3 Оценка эффективности полученной модели

Первый показатель сам по себе никак не отражает качество модели, однако с его помощью можно корректировать данные. Как описано в первых главах данной работы, обучение производится на основе оценки значимости признаков - чем сильнее признак влияет на итоговый ответ, тем больше его значимость в данной модели. В предыдущих параграфах мы описывали, каким образом были подобраны более 200 признаков для нашей модели обучения. Следовательно, для каждого из них можно посмотреть, насколько значимым он оказался, насколько сильно влиял на успешность предсказания (на графике на рис. 14 представлена только часть признаков).

Рис. 14 Значимость признаков (показаны 30 лучших); в названии признака содержится название параметра, а также окно, для которого он взят

Источник: построено автором

Для корректировки модели, например, признаки из конца этого списка могут быть удалены из модели совсем: если их значимость минимальна, возможно, они, наоборот, вносят отрицательный вклад в обучение, добавляют шум в данные, и без них модель может быть обучена чуть лучше. В нашей модели 30% незначимых признаков были удалены для повышения эффективности.

Для того чтобы оценить, насколько хорошо работает полученная нами модель, оценим ее по нескольким параметрам. Ключевой из них - точность (accuracy) - отношение правильно распознанных данных из тестовой выборки ко всей тестовой выборке. Для нашей модели на данный момент лучшее значение accuracy составляет почти 71,3%:

Следовательно, 71% тестовой выборки в данный момент классифицируется корректно. Как видно из результатов других исследователей, рассмотренных в главе 2, данный показатель уже превышает их достижения. Например, модель Герлейна и МакГиннити едва смогла превзойти 51% точности, модель Жанга и Даи - 58%.

Далее, посмотрим на графики ошибки точности (рис. 15 и 16):

Рис. 15 Сравнительная точность предсказания полученной модели для обучающей (синий цвет) и тестовой выборки (оранжевый цвет)

Источник: построено автором

График на рис. 15 отображает, как изменяется точность в процессе обучения: для обучающей выборки она быстро уходит в ноль (соответственно, происходит обучение - на обучающей выборке алгоритм больше не допускает ошибок точности). Тестовая выборка должна стремиться к тому, чтобы ее график походил на график для обучающей выборки, однако полученный результат уже неплох: на графике не видно резких скачков ошибки обучения, то есть, модель стабильно предсказывает результат с вероятностью ошибки примерно в 28%.

Следующий график (рис. 16) похож на предыдущий по своей природе: он отражает ошибку логарифмических потерь (Log loss error). Для полученной модели он получается похожим только по направлению движения, однако останавливается на уровне 61% (в идеальном случае график должен стремиться к нулю, как и на обучающей выборке):

Рис. 16 Показатели ошибки log-loss для обучающей (синий цвет) и тестовой (оранжевый) выборки

Источник: построено автором

В чем же различие между этими двумя параметрами, и почему их результаты так разительно отличаются друг от друга на тестовой выборке, если их поведение на обучающей выборке достаточно схоже? Дело в том, что точность - это подсчет таких прогнозов, когда прогнозируемое значение равно фактическому значению. Поэтому accuracy не всегда является хорошим показателем: она учитывает только бинарный исход предсказания - верное ли оно, «да» или «нет».

Log Loss действует гораздо сложнее; он учитывает неопределенность прогноза, исходя из того, насколько он отличается от корректной метки; фактически, он измеряет расстояние между предсказанным значением и верным. Это дает возможность более тонко взглянуть на производительность модели. Таким образом, на данном этапе ошибка Log Loss гораздо больше, чем необходимо для качественного обучения модели.

Последний график, на который мы обратим внимание для оценки получившейся модели, будет график ROC-кривой - кривой ошибок. Эта кривая отображает зависимость доли корректных классификаций класса 1 от доли ложных классификаций класса 1 при изменении порога решающего правила. Первоначально задача поставлена следующим образом: тестовые точки необходимо классифицировать, в зависимости от того, будет ли тренд после них расти (класс 1) или падать (класс 0). Для каждой точки алгоритм выдает вероятность повышения тренда: эта вероятность впоследствии бинаризируется по порогу 0.5 (все, что выше или равно 0.5, попадает в класс 1, остальное - в класс 0).

Однако пороговое значение можно задать любым, не только 0.5. Для построения кривой ошибок используется следующая техника: перебираются все возможные пороги от 0 до 1, для каждого случая считаются следующие показатели:

(32)

(33)

где fpr отражает долю объектов класса 0, распознанных как класс 1, среди всех объектов класса 0, а tpr - долю правильно классифицированных объектов класса 1 среди всех объектов класса 1.

Если упорядочить все полученные вероятности на тестовой выборке и затем применять к ним различные пороги прохождения, можно оценить, сколько для каждого порога будет неправильно распознанных объектов класса 0 и корректно распознанных объектов класса 1. Для каждого порогового значения на графике отмечается точка, соответствующая fpr и tpr показателям на данном шаге (fpr по оси х, tpr - по оси y). ROC-кривые для наилучшего (AUC=1), случайного (AUC=0.5) и наихудшего (AUC=0) алгоритма выглядят следующим образом:

Рис. 17 Графики ROC-кривых и площадь под ними для наилучшего (AUC=1), случайного (AUC=0.5) и наихудшего (AUC=0) алгоритмf

Источник https://alexanderdyakonov.wordpress.com/2017/07/28/auc-roc- auc-roc-площадь-под-кривой-ошибок

Ключевым значением в таком случае будет являться площадь под графиком кривой - Area Under Curve (AUC-ROC); чем она больше, тем лучше осуществляется предсказание.

В нашем случае график кривой ошибок выглядит следующим образом (рис. 18):

Рис. 18 График ROC-кривой для полученной модели (синий цвет) и для случайного алгоритма (оранжевый)

Источник: построено автором

Как видно из графика, полученная модель работает существенно лучше случайного предсказателя и стремится к левому верхнему углу графика (возвышается над прямой случайного предсказателя). Тем не менее, достаточная площадь рисунка все еще находится выше полученной кривой, а значит, модели есть, над чем работать.

Таким образом, мы получили модель, которая с 71% вероятностью позволяет правильно предсказывать динамику цен акций. Это более чем на 10% превышает достижения предыдущих моделей, описанных в главе 2. Таким образом, можно считать, что гипотеза 2 (о том, что сложная/композиционная модель машинного обучения дает большую прогнозную точность, чем простые модели по отдельности) данного исследования является подтвержденной, поскольку предыдущие исследователи использовали исключительно простые модели обучения.

Также проверяется и гипотеза 1 - классические модели машинного обучения в контексте предсказания трендов на рынке могут конкурировать с нейросетями. Как мы помним из главы 1, полученные турецкими исследователями результаты оказались не сильно выше полученных нашей моделью (75% против 71%). Кроме того, учитывая, что графики предсказаний и реальных данных в их работах достаточно сильно расходятся (рис. 1). Можно утверждать, что классические модели могут конкурировать с нейронными сетями, в том смысле, что их успешность в контексте предсказания трендов акций может быть сравнима.

Гипотеза 3: c помощью точных машинных предсказаний трендов можно увеличить прибыль. Исходя из построения модели, точные данные по прибыли узнать невозможно - поскольку мы решаем задачу классификации, а значит, упрощаем все имеющиеся параметры до классов «растущий тренд» и «понижающийся тренд». Таким образом, с ростом точности прогнозов будет повышаться эффективность торговых стратегий, основанных на данных прогнозах, а, значит, инвестиционные управляющие будут увеличивать прибыль.

Заключение

Со все новыми достижениями технологического прогресса применявшиеся ранее методики постепенно уходят в прошлое. Чистый трейдинг, основанный исключительно на человеческом чутье, уже давно не демонстрирует высоких результатов на рынках. Любой аналитик, так или иначе, прибегает к дополнительным инструментам, помогающим корректно интерпретировать поступающие сигналы о тренде и инвестировать разумно, и если раньше профессионалы могли положиться только на базовые формулы, затем сложные схемы зависимостей, а затем и их воплощение в качестве компьютерных средств для анализа больших данных, то сейчас перед их взором открываются все более потрясающие технологии. С текущим трендом на классические методы машинного обучения и нейронные сети все больше возрастает интерес к самоориентирующимся механизмам; появилась необходимость удостовериться, что искусственный интеллект на сегодняшний день настолько хорош, что сможет заменить человека даже в таком неочевидном и интуитивном секторе, как экономический.

В ходе данного исследования были проанализированы существующие методы машинного обучения, выявлены наиболее подходящие для решения задачи прогнозирования тренда цен акций, а также их положительные и отрицательные стороны для решения поставленной задачи. Было установлено, что, хотя нейронные сети и более приспособлены к анализу сложных временных зависимостей, классические методы машинного обучения, в особенности составные, использующие простые модели в качестве отдельных элементов в едином комплексе, все-таки могут с ними посоревноваться в эффективности. Данные достижения соответствуют задачам 1-2, поставленным перед работой, а также подтверждают первую гипотезу исследования.

Далее, когда подходящие методы были изучены, требовалось подготовить модель и данные для нее (поставленная перед исследованием задача 3). В качестве датасета были выбраны данные о ценах акций Сбербанка с 2005 по 2018 годы с интервалом в 1 сутки. Выбор банка был непринципиален: модель способна обучаться на любых данных, однако для различения банков пока не приспособлена и может работать исключительно в рамках одной компании-эмитента акций. Создание модели, которая будет способна самостоятельно различать компании и строить предсказания в зависимости от этого, может стать темой для дальнейших исследований.

Используемые данные были дополнены индикаторами технического анализа для более досконального анализа и поиска более глубоких зависимостей в данных. Далее с помощью полученной модели были достигнуты довольно неплохие результаты, существенно превосходящие показатели простых моделей классического машинного обучения и сравнимые с результатами прогнозов, полученных нейронными сетями. Таким образом, все поставленные перед исследованием задачи были исчерпывающе выполнены, а все необходимые гипотезы - подтверждены.

Тем не менее, полученная модель, несмотря на свою сравнительную эффективность, все еще имеет достаточно большой процент ошибки, что не позволяет использовать ее в чистом виде для прогнозирования тренда цен акций. Для дальнейшего улучшения обучения необходимо будет исследовать, на каких данных чаще всего достигается ошибка, и возможно, обучить модель диагностировать их отдельно. Также может потребоваться человеческий контроль за прогнозированием, или же модели необходимы некоторые внешние данные (например, какие-либо ситуационные индикаторы состояния экономики, фиксирование внешнеполитических решений (к примеру, о введении санкций) или же принятия законов). Такой всесторонний анализ может быть достигнут анализом текстов актуальных RSS-каналов, либо же публикаций в Twitter Mittal, A., Goel, A., Stock prediction using twitter sentiment analysis, Standford University, 2011 (поскольку подобные новостные события в большинстве своем активно обсуждаются в интернете).

Список используемой литературы

1. Barbosa, R. P., & Belo, O. Algorithmic Trading Using Intelligent Agents. In H. R. Arabnia & Y. Mun (Eds.), Proceedings of the 2008 Int. Conf. on Artificial Intelligence, ICAI 2008 (pp. 136-142). Las Vegas, Nevada, USA: CSREA Press.

2. Barbosa, R. P., & Belo, O. Autonomous Forex Trading Agents. In Proc. of the 8th industrial conference on Advances in Data Mining: Medical Applications, E-Commerce, Marketing, and Theoretical Aspects. ICDM'08 (pp. 389-403). Leipzig, Germany: Springer-Verlag.

3. M. Casdagli, T. Sauer, J. Yorke, Embedology, Journal of Statistical Physics, 1991. 65, 579-616.

4. Dai, Y., Zhang, Y. Machine Learning in Stock Price Trend Forecasting. Stanford University, 2013.

5. Lawrence J. Fogel, U.S. Pаtent 2,920,138, “System fоr Improving Intelligibility,” January 5, 1960.

6. Lawrence J. Fogel, U.S. Patent 2,966,549, “Apparatus fоr Improving Intelligence Undеr High Ambient Nоisе Lеvеls,” Dесеmbеr 27, 1960.

7. Lawrence J. Fоgеl "Оn the Organization оf Intellect", 1964.

8. Gerlein E.A., Mcginnity M., Belatreche A., Coleman A., Evaluating machine learning classification for financial trading: an empirical approach, Expert Systems With Applications (2016).

9. Neil A. Gershenfield, Andreas S. Weigend, Times series prediction: Forecasting the future and understanding the past, Addison-Wesley, 1994.

10. Guresen, E. Kayakutlu, G., Daim, T. U., Using artificial neural network models in stock market index prediction, Expert Systems with Applications 38, 2011.

11. Hastie, T., Tibshirani, R., Friedman, J. The Elements of Statistical Learning, 2nd edition. Springer, 2009. 533 p.

12. G. Kaiser, A Friendly Guide to Wavelets, Birk, 1995.

13. Kara, Y., Acar Boyacioglu, M., Kaan Baykan, O. Predicting direction of stock price index movement using artificial neural networks and support vector machines: The sample of the Istanbul Stock Exchange, Expert Systems with Applications 38 (2011).

14. Mason L., Baxter J., Bartlett P., Frean M. Boosting algorithms as gradient descent. Advances in Neural Information Processing Systems. MIT Press, 2000. T. 12. 512--518 с.

15. Mitchell T., Machine Learning. McGraw-Hill Science/Engineering/Math, 1997.

16. Mittal, A., Goel, A., Stock prediction using twitter sentiment analysis, Standford University, 2011.

17. Ouahilal M, El Mohajir M, Chahhou M, El Mohajir B. A comparative study of predictive algorithms for business analytics and decision support systems: fnance as a case study. In: The Proceeding of the international conference on information technology for organizations development. 2016.

18. Володин С. Н. Эволюция систем искусственного интеллекта для прогнозирования динамики цен акций // Вестник Самарского государственного экономического университета. 2009. № 7(57). С. 22-25.

19. Куссул E., Байдук T., Касаткина Л., Лукович В., Перцептроны Розенблатта для распознавания рукописных цифр, 2001.

20. Стрижов В.В., Крымова Е.А. Методы выбора регрессионных моделей. М.: ВЦ РАН, 2010. 60 с

21. Финам. Экспорт котировок. - URL: http://www.finam.ru/analysis/quotes/?0=&t=6712610. - (дата обращения: 23.03.2018).

Размещено на Allbest.ru


Подобные документы

  • Возможности частного инвестора для вложения капитала и получения прибыли на рынке ценных бумаг. Капитализация и рыночная стоимость предприятия. Анализ динамики акций ОАО "Лукойл", показатели вариации курса акций. Построение интервального прогноза.

    курсовая работа [463,6 K], добавлен 18.04.2011

  • История развития финансового рынка России, сущность и виды акций. Фондовый рынок и крупнейшие эмитенты российского рынка акций, рынок акций "второго эшелона". Влияние мирового финансового кризиса на российский рынок, современное состояние рынка акций.

    курсовая работа [350,2 K], добавлен 18.04.2010

  • Дивидендная политика и возможность ее выбора. Регулирование курса акций. Порядок выплаты дивидендов. Анализ дивидендной политики ОАО "Печорская ГРЭС". Эмиссия акций предприятия. Дивидендная политика предприятия. Проблемы дробления и консолидация акций.

    курсовая работа [31,3 K], добавлен 30.03.2007

  • Сущность и классификация акций, определение номинальной цены обыкновенных акций. Инвестиции в обыкновенные акции, осуществляемые частным инвестором в условиях формирующегося фондового рынка. Сравнение счетов прибылей и убытков, дисконтирование дивиденда.

    контрольная работа [1,4 M], добавлен 27.06.2013

  • Теоретическое изучение основных методов оценки стоимости бизнеса и подходов компаний к оценке стоимости акций. Выявление и анализ особенностей оценки стоимости обыкновенных акций. Проведение оценки рыночной стоимости 100% пакета акций ОАО "Вертикаль".

    дипломная работа [322,7 K], добавлен 04.08.2012

  • Вложения в акции коммерческих банков. Основные методы оценки стоимости обыкновенных акций. Базовые модели дисконтирования дивидендов методом для вычисления цены акции или бизнеса. Оценка качества акций, а также их рейтинга на примере ОАО "Альфа-Банк".

    контрольная работа [384,2 K], добавлен 05.07.2013

  • Место и роль российского рынка акций в экономических отношения. Оценка динамики объема, состава и структуры фондовой системы. Анализ места рыночной концепции ценных бумаг в системе финансовых механизмов. Исследование капитализации компаний России.

    курсовая работа [607,8 K], добавлен 16.09.2017

  • Мотивы и интересы сторон в размещении акций, преимущества и недостатки, процедура проведения. Особенности вторичных размещений акций (SPO). Анализ долгосрочной доходности при проведении размещений акций российскими компаниями, обзор рынка в России.

    дипломная работа [2,0 M], добавлен 03.07.2017

  • Формы заимствования российскими компаниями денежных средств. Характеристика методов привлечения инвестиций. Преимущества и анализ практики проведения публичного размещения акций российскими компаниями. Размещение акций на зарубежных торговых площадках.

    дипломная работа [69,9 K], добавлен 19.02.2011

  • Основные методы оценки стоимости обыкновенных акций: номинальный, рыночный, балансовый, ликвидационный, инвестиционный. Оценка стоимости привилегированных акций, прогнозирование денежных потоков, определение ставки дисконтирования, стоимость облигаций.

    реферат [231,4 K], добавлен 03.03.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.