Определение оптимальной размерности по временному ряду цен на финансовых рынках

Нелинейные методы анализа временных рядов. Динамические системы, пространство состояний, орбиты и аттракторы систем. Вложение по Такенсу. Оценка временного лага. Функция взаимной информации. Ближайшие и средние ложные соседи. Регрессия опорных векторов.

Рубрика Экономико-математическое моделирование
Вид дипломная работа
Язык русский
Дата добавления 10.12.2019
Размер файла 5,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Как видно из Рис. 134, метод ближайших соседей выдает константное прогнозное значение на протяжении долгого периода в валидационной выборке. Это, как правило, связано с тем, что в обучающей выборке не присутствовало похожих наблюдений, поэтому ближайший сосед выдает константный прогноз. Доказательство этому представлено на Рис. 145.

Таким образом, валютный курс EURUSD ни разу не превышал в обучающей выборке. Чтобы решить эту задачу, обучим регрессию опорных векторов (2.6.2) и посмотрим на ее прогнозные значения.

В качестве линейной регрессии опорных векторов мы будем использовать реализацию LinearSVR из scikit-learn для Python, а для нелинейной - NuSVR.

Рис. 15. Отсутствующий участок временного ряда EURUSD в тренировочной выборке

Стоит отметить, что в стандартной реализации NuSVR в качестве стандартного ядра используется радиально базисная функция:

Свободные параметры регрессии опорных векторов и были оптимизированы на сетке с помощью реализации GridSearchCV в библиотеке scikit-learn для Python. В качестве иллюстрации результаты линейной регрессии опорных векторов представлены на Рис.15. 16.

Рис. 16. Прогнозные значения линейной регрессии опорных векторов (С=1.0; е=0.0) на валидационной выборке

Результаты прогнозных значений обоих моделей представлены в Табл. 43.

Таблица 4. Значения MASE на валидационной выборке для EURUSD

Таким образом, линейная регрессия опорных векторов (LinearSVR) на валидационной выборке превосходит случайное блуждание в среднем в раз, в то время как нелинейная регрессия опорных векторов (NuSVR) в в раз, поэтому мы будем использовать ее как основную модель в следующем разделе.

43.6 Торговая стратегия

Оптимизировав нашу модель на валидационной выборке, мы можем приступить к разработке торговой стратегии на тестовой выборке, чтобы оценить предсказательную силу модели. В качестве торгового правила мы будем использовать знак предсказываемого значения на каждый момент времени: если , то мы покупаем EURUSD, а если меньше нуля - продаем EURUSD.

Стоит заметить, что наше торговая стратегия несет чисто иллюстративный характер, поэтому в качестве временного ряда мы будем использоваться цены , которые не учитывают спред между ценами и , что, как правило, сильно влияет на результаты модели на практике.

Как видно из Рис. 167, нелинейная регрессия опорных векторов угадывает всех движений на тестовой выборке. Также результаты нашей стратегии оказались лучше, чем простая стратегия купить и держать. Тем не менее, попробуем дальше снизить волатильность доходности стратегии.

Рис. 17. Результаты стратегии на тестовой выборке EURUSD

Для этого введем некий барьер , при превышении которого торговое правило будет активизироваться: если , наша модель будет торговать. Таким образомобразом, мы избавимся от волатильности доходности стратегии на небольших движениях курса EURUSD. Параметр был выбран на основе валидационной выборки и будет равняться .

Результаты модифицированного торгового правила представлены на Рис. 178.

Рис. 18. Результаты модифицированной стратегии на тестовой выборке EURUSD

Как видно из Рис. 178, свободный параметр влияет на количество сделок в стратегии и, следовательно, на волатильность доходности стратегии. Чем больше значение параметра , тем сильнее нужен торговый сигнал, чтобы стратегия начала торговать.

Глава 5

Заключение

Данная работа несла в себе цель исследовать метод вложенных координат для анализа одномерных финансовых временных рядов. Процесс, используемый в этом исследовании, не является единственным и представляет возможности для имплементации других методов для выбора значений свободных параметров модели вложенных координат и под-методов для прогнозирования вложенных векторов. Тем не менее, описанный в этой работе подход к анализу временных рядов валютного курса EURUSD показал, что преобразованный формат данных при временном лаге и размерности вложения позволяет довольно успешно применить различные алгоритмы машинного обучения, такие как метод ближайших соседей и регрессия опорных векторов. На основе этих методов мы смогли разработать примеры торговых стратегий, чтобы проиллюстрировать практическое применение представленного подхода.

В заключение рассмотрим ожидаемые результаты, представленные в Главе 1.4.

В отличие от высокоуровневых синтетических данных реальные финансовые временные ряды могут выдавать неоднозначную оценку свободных параметров модели вложенных координат

Действительно, на примере синтетической динамической системы аттрактора Рёсслера мы смогли точно определить свободные параметры временного лага (См. Главу 32.2.1) и размерности вложения (См. Главу 32.2.2), в то время как для реальных финансовых временных рядов было затруднительно сказать о достоверности полученных значений параметров.

Свободные параметры модели вложенных координат могут быть оптимизированы более эффективно с помощью «грубой силы» путем минимизации средней абсолютной масштабированной ошибки в некой области значений временных лагов и размерности измерений.

Наиболее оптимальные значения свободных параметров модели были в действительности получены путем оптимизации на валидационной выборке, выбрав набор параметров, соответствующий минимальному значению абсолютной масштабированной ошибки.

Точность предлагаемого метода ближайших соседей может быть ниже, чем у продвинутых алгоритмов машинного обучения, таких как бустинговые градиентные деревья или нейронные сети.

Одним из ограничений метода ближайших соседей является тот факт, что предсказательная сила метода сильна ограничена областью значений обучающей выборки, поэтому на участке валидационной выборки метод выдавал константное предсказание (См. Главу 43.5). Чтобы решить эту задачу, мы использовали нелинейную регрессию опорных векторов, однако в дальнейшем было бы перспективно рассмотреть более сложные алгоритмы машинного обучения.

Список литературы

1. Alligood, K. T., Sauer, T. D., & Yorke, J. A. (1996). Chaos (pp. 105-147). Springer New York.

2. Arlt, J., & Arltovб, M. (2001). Financial time series and their features.

3. Bontempi, G., Taieb, S. B., & Le Borgne, Y. A. (2012, July). Machine learning strategies for time series forecasting. In European business intelligence summer school (pp. 62-77). Springer, Berlin, Heidelberg.

4. Bradley, E., & Kantz, H. (2015). Nonlinear time-series analysis revisited.  Chaos: An Interdisciplinary Journal of Nonlinear Science,  25(9), 097610.

5. Cao, L. (1997). Practical method for determining the minimum embedding dimension of a scalar time series. Physica D: Nonlinear Phenomena, 110(1-2), 43-50.

6. Dean, T. L., & Wellman, M. P. (1991).  Planning and control. Morgan Kaufmann Publishers Inc.

7. Dionнsio, A., Menezes, R., & Mendes, D. A. (2006). Entropy-based independence test. Nonlinear Dynamics, 44(1-4), 351-357.

8. Fletcher, R. (1989). Practical methods of optimization. John Wiley & Sons.

9. Fraser, A. M., & Swinney, H. L. (1986). Independent coordinates for strange attractors from mutual information. Physical review A, 33(2), 1134.

10. Garland, J., James, R. G., & Bradley, E. (2016). Leveraging information storage to select forecast-optimal parameters for delay-coordinate reconstructions.  Physical Review E,  93(2), 022221.

11. Garland, J., James, R., & Bradley, E. (2014). Model-free quantification of time-series predictability.  Physical Review E,  90(5), 052910.

12. Garland, J., & Bradley, E. (2015). Prediction in projection.  Chaos: An Interdisciplinary Journal of Nonlinear Science,  25(12), 123108.

13. Kantz, H., & Schreiber, T. (2004).  Nonlinear time series analysis(Vol. 7). Cambridge university press.

14. Kennel, M. B., Brown, R., & Abarbanel, H. D. (1992). Determining embedding dimension for phase-space reconstruction using a geometrical construction.  Physical review A,  45(6), 3403.

15. Kibriya, A. M., & Frank, E. (2007, September). An empirical comparison of exact nearest neighbour algorithms. In European Conference on Principles of Data Mining and Knowledge Discovery (pp. 140-151). Springer, Berlin, Heidelberg.

16. Kodba, S., Perc, M., & Marhl, M. (2004). Detecting chaos from a time series. European journal of physics, 26(1), 205.

17. Kumar, N., Zhang, L., & Nayar, S. (2008, October). What is a good nearest neighbors algorithm for finding similar patches in images?. In European conference on computer vision (pp. 364-378). Springer, Berlin, Heidelberg.

18. Lorenz, E. N. (1969). Atmospheric predictability as revealed by naturally occurring analogues. Journal of the Atmospheric sciences, 26(4), 636-646.

19. Moore, P. J., Little, M. A (2014). Enhancements to a method of analogues forecasting algorithm.  Nonlinear Theory and Its Applications, IEICE,  6(1), 2-4.

20. Packard, N. H., Crutchfield, J. P., Farmer, J. D., & Shaw, R. S. (1980). Geometry from a time series.  Physical review letters,  45(9), 712.

21. Shannon, C. E., & Weaver, W. (1949). The mathematical theory of information.

22. Smola, A. J., & Schцlkopf, B. (2004). A tutorial on support vector regression. Statistics and computing, 14(3), 199-222.

23. Takens, F. (1981). Detecting strange attractors in turbulence. In  Dynamical systems and turbulence, Warwick 1980  (pp. 366-381). Springer, Berlin, Heidelberg.

24. Vapnik, V. (1995). The nature of statistical learning theory. Springer science & business media.

25. Whitney, H. (1936). Differentiable manifolds. Annals of Mathematics, 645-680.

Размещено на Allbest.ru


Подобные документы

  • Теоретические выкладки в области теории хаоса. Методы, которые используются в математике, для прогнозирования стохастических рядов. Анализ финансовых рядов и рядов Twitter, связь между сентиметными графиками и поведением временного финансового ряда.

    курсовая работа [388,9 K], добавлен 01.07.2017

  • Основные элементы эконометрического анализа временных рядов. Задачи анализа и их первоначальная обработка. Решение задач кратко- и среднесрочного прогноза значений временного ряда. Методы нахождения параметров уравнения тренда. Метод наименьших квадратов.

    контрольная работа [37,6 K], добавлен 03.06.2009

  • Классические подходы к анализу финансовых рынков, алгоритмы машинного обучения. Модель ансамблей классификационных деревьев для прогнозирования динамики финансовых временных рядов. Выбор алгоритма для анализа данных. Практическая реализация модели.

    дипломная работа [1,5 M], добавлен 21.09.2016

  • Статистические методы анализа одномерных временных рядов, решение задач по анализу и прогнозированию, построение графика исследуемого показателя. Критерии выявления компонент рядов, проверка гипотезы о случайности ряда и значения стандартных ошибок.

    контрольная работа [325,2 K], добавлен 13.08.2010

  • Анализ временных рядов с помощью статистического пакета "Minitab". Механизм изменения уровней ряда. Trend Analysis – анализ линии тренда с аппроксимирующими кривыми (линейная, квадратическая, экспоненциальная, логистическая). Декомпозиция временного ряда.

    методичка [1,2 M], добавлен 21.01.2011

  • Временные ряды и их характеристики. Факторы, влияющие на значения временного ряда. Тренд и сезонные составляющие. Декомпозиция временных рядов. Метод экспоненциального сглаживания. Построение регрессионной модели. Числовые характеристики переменных.

    контрольная работа [1,6 M], добавлен 18.06.2012

  • Теория и анализ временных рядов. Построение линии тренда и прогнозирование развития случайного процесса на основе временного ряда. Сглаживание временного ряда, задача выделения тренда, определение вида тенденции. Выделение тригонометрической составляющей.

    курсовая работа [722,6 K], добавлен 09.07.2019

  • Влияние девальвации национальной валюты на цены активов и процентных ставок на фондовый рынок. Анализ отраслевых взаимосвязей и закономерностей в динамике биржевых индикаторов и множества других временных рядов. Оценка моделей методом "rolling window".

    дипломная работа [1,7 M], добавлен 06.11.2015

  • Структурные компоненты детерминированной составляющей. Основная цель статистического анализа временных рядов. Экстраполяционное прогнозирование экономических процессов. Выявление аномальных наблюдений, а также построение моделей временных рядов.

    курсовая работа [126,0 K], добавлен 11.03.2014

  • Двумерные автономные динамические системы. Классификация состояний равновесия динамических систем второго порядка. Определение автономной системы дифференциальных уравнений и матрицы линеаризации системы. Фазовый портрет системы Лотки–Вольтерра.

    лабораторная работа [1,1 M], добавлен 22.12.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.