Меры связи случайных величин и их применение в сетевом анализе

Критерии выбора мер зависимостей для сравнения случайных величин в приложении к сетевой модели рынка. Данные о доходности акций с фондового рынка США. Построение сетевой модели рынка с использованием различных метрик. Идентифицирование сетевых структур.

Рубрика Банковское, биржевое дело и страхование
Вид дипломная работа
Язык русский
Дата добавления 27.08.2018
Размер файла 4,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Меры связи случайных величин и их применение в сетевом анализе

ВВЕДЕНИЕ

Задача идентификации сетевых структур - одна из важнейших при работе со сложными сетями. Ее решение необходимо для получения необходимой информации о природе сети, о ее параметрах, что в свою очередь необходимо для решения многих практических задач, например, задач прогнозирования при работе с сетевой моделью фондового рынка.

Последние несколько десятилетий фондовый рынок играет значительную роль в экономике, и как способ преумножить капиталы бизнесменов, и как один из самых точных и надежных индикаторов процессов, происходящих в экономике. Индексы рынка взлетают и падают, определяя периоды стабильного роста и оповещая мир о начале нового экономического кризиса.

Для решения задачи по прогнозированию событий на рынке ценных бумаг существуют различные подходы и модели. На эту тему написано множество статей, а у каждого игрока на рынке ценных бумаг есть своя собственная стратегия, которую он едва ли раскроет. В большинстве эффективных подходов к анализу фондового рынка используется сетевая модель рынка, в основе которой лежит переход от активов и информации об их стоимости на протяжении некоторого времени к сетям и графам, полученным на основе данных о случайных величинах. Как будет показано далее, построение сетевой модели во многом зависит от того, какая мера зависимости случайных величин лежит в ее основе, определяя вес ребер сети.

В данной работе будет проведено сравнение наиболее популярных функций зависимости на предмет их устойчивости к изменениям на рынке ценных бумаг и способности отражать действительную связь между активами различных компаний.

Цель работы

Сравнить различные меры зависимости случайных величин в приложении к сетевой модели рынка.

Задачи

· Выбрать меры зависимости для сравнения

· Собрать данные о доходности акций с фондового рынка США

· Построить сетевую модель рынка, используя различные метрики

· Построить отсеченный граф рынка для каждой из сетей

· Идентифицировать в полученных графах сетевые структуры:

o Клики

o Максимальное остовное дерево

· Сравнить полученные графы и сетевые структуры при помощи F1 меры

ГЛАВА 1. Методы анализа рынка

Первые рынки ценных бумаг начали появляться в конце 15, начале 16 веков. Одним из первых фондовых рынков можно считать Амстердамскую биржу, где Ост-Индская торговая компания продавала документы, дающие право на часть ее прибыли. Первая американская биржа появилась значительно позже, в 1791 в Филадельфии. Почти через год после этого стартовали торги на Нью-Йоркской бирже.

С момента появления первых фондовых рынков, брокеры находятся в поисках универсального инструмента, который позволил бы им предсказывать рост и падение цен на акции, сводя риски к минимуму и устремляя прибыль в бесконечность. Множество научных статей написаны с одной целью - разобраться, как ведет себя фондовый рынок, какие факторы влияют на изменение цен и как можно предугадать эти изменения. Все работы по анализу фондового рынка можно отнести к одному из двух методов - фундаментальный или технический подход.

Фундаментальный подход

Фундаментальный анализ - метод определения стоимости компании, основывающийся на данных о финансовых и производственных показателях ее деятельности. Традиционно анализу подвергаются: чистая прибыль, чистая стоимость, обязательства и денежный поток компании, а кроме того целый ряд макроэкономических параметров.

Инвесторы, использующие фундаментальный анализ, отталкиваются от идеи о несовершенности рынка. Так предполагается, что у компании есть две стоимости - реальная и рыночная, а их разница показывает, в какую сторону будут изменяться цены акций этой компании на рынке ценных бумаг. Акции компаний, чья реальная стоимость по оценкам инвестора ниже рыночной, называются недооцененными и выгодны для вложения, так как обещают прирост цены. Идеи и методы фундаментального анализа подробно описаны в книге Бенджамина Грэма и Дэвида Додда «Анализ ценных бумаг».

Технический подход

Технический анализ - метод определения цен акций на основе информации об изменении цен в прошлом в схожей ситуации. Основывается на гипотезе об эффективности рынка, постулируется, что все макро и микроэкономические факторы немедленно и в полной мере находят отражение в текущей цене акции, чем полностью противоречит фундаментальному анализу. Поэтому, в отличие от фундаментального анализа, технический анализ не рассматривает причины изменения цен, а лишь констатирует факт, что цена движется в определенном направлении, имеет положительный или отрицательный тренд.

Постулаты технического анализа:

· Движение цен на рынке учитывает всю информацию

Все факторы, влияющие на формирование цены, учтены в изменении цены

· Движение цен на рынке подчинено тенденциям

На первый взгляд каждое отельное движение цены - случайно, однако, движения за определенный промежуток времени подчинено тренду

· История повторяется

Участники рынка в схожих обстоятельствах поступают одинаково

Больше про технический анализ рынка ценных бумаг можно узнать из книги Майкла Н. Кана «Технический анализ. Просто и ясно»

На основе данных технического анализа инвестор делает вывод о том, как будет себя вести цена дальше. Для этого часто используют паттерны или модели, например «двойная вершина» или «флаг». Про работу с паттернами можно подробнее ознакомиться в книге «Успешный трейдинг. От нуля до первого миллиона» Дмитрия Михнова.

ГЛАВА 2. Сетевая модель

Сетевая модель рынка - одна из наиболее часто используемых моделей. В ней цена акции каждой компании представлена случайной величиной с неизвестным распределением, над которой течении некоторого времени ведется наблюдение. Таким образом, для N компаний на рынке и n дней наблюдения мы имеем N-мерный случайный вектор с длиной выборки n. Далее строится взвешенный граф, в котором вершины соответствуют элементам такого случайного вектора, а вес ребер определяет мера зависимости случайных величин на его вершинах, например выборочная корреляция Пирсона.

Меры зависимости

Мерой зависимости - функция, которая отражает силу связи двух случайных величин. Так как истинные распределения при работе с реальными данными не известны, будем говорить о корреляционной зависимости (статистическая взаимосвязь). Как упоминалось выше, мера связи будет определять вес ребра в сетевой модели рынка.

Корреляция Пирсона

Одной из наиболее распространенных мер связи является выборочная корреляция Пирсона.

Определение:

Пусть даны выборки , коэффициент корреляции Пирсона рассчитывается по формуле:

Где - выборочные средние и , , - выборочные дисперсии, .

Также корреляцию Пирсона называют теснотой линейной связности, она показывает, насколько хорошо одна из случайных величин может быть представлена как линейная функция другой. Так, для можно говорить о линейной зависимости, а для - о линейной независимости.

Корреляция Спирмена

Как и в случае с корреляцией Пирсона, корреляция Спирмана - мера линейной связи между случайными величинами. Однако, при определении силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Определение:

Пусть даны выборки , коэффициент корреляции Спирмена рассчитывается по формуле:

Где - ранг наблюдения в ряду , - ранг наблюдения .

.

- строгая линейная зависимость

- строгая обратная линейная зависимость

Знаковая функция зависимости

Знаковая функция зависимости или знаковая корреляция - функция определяющая силу связи между случайными величинами и , как вероятность того, что их значение будет одновременно больше или меньше его математического ожидания.

Где .

Полный взвешенный и Отсеченный графы

Сеть - полный (каждая вершина соединена с каждой) взвешенный граф, вершины которого - случайные величины - соответствуют активам из индекса, характеризующего фондовый рынок. Вес ребра - корреляция между выборками активов, соответствующих вершинам этого ребра.

В ходе эксперимента будем использовать одношаговую процедуру генерации отсеченного графа - в отсеченный граф попадут ребра, вес которых выше некоторого порогового значения, заданного экспериментатором и выбранного эмпирическим путем.

Одношаговый алгоритм

Суть одношаговой процедуры в том, что в отсеченный граф попадают только ребра, вес которых превысит некоторое неизменное пороговое значение.

Так отсеченный граф G может быть построен по статистике T, с порогом с следующим образом:

Где , где .

Структуры и их значение

Целью создания сетевой модели, а соответственно и отсеченного графа является поиск и выявление сетевых структур, таких как клики и максимальные независимые множества для дальнейшего их изучения. Такие структуры нужны для получения информации о ситуации на рынке, что в свою очередь нужно для прогнозирования событий в будущем.

Клика

В теории графов кликой называют подмножество вершин, любые две из которых соединены ребром. В терминах фондового рынка - это группа компаний тесно связанных между собой.

Рисунок 1 клика размера 7

Рисунок 2 клика размера 11

Максимальное остовное дерево

Максимальное / минимальное остовное дерево графа - остовное дерево этого графа, с максимально / минимально возможным весом - суммой весов входящих в него ребер.

Рисунок 3 минимальное остовное дерево

Рисунок 4 минимальное остовное дерево

Рисунок 5 минимальное остовное дерево

ГЛАВА 3. Постановка эксперимента

Выбор данных

Реальные данные представлены в виде таблицы, где для каждого актива приведена информация по шести показателям на каждый рабочий день, в том числе: цена открытия, цена закрытия, скорректированная цена закрытия, объем продаж и прочее. Для построения сетевой модели будем использовать только скорректированную цену закрытия, как наиболее близкую к рыночной цене акции.

Построение сетевой модели предполагает работу только с частью активов, для уменьшения сложности операций. Наиболее репрезентативными можно считать активы, входящие в один из индексов фондового рынка. Для американского рынка традиционно используют индекс Dow-Jones.

Данные будут взяты по двум временным интервалам длиной один год и разбиты на две части по шесть месяцев. Первый набор - с первого января 2017 года по 31 декабря 2017 года, его середина придется на обвал индекса Dow-Jones, ознаменовавший начало экономического кризиса.

Второй - с 1 июля 2016 по 30 июня 2017. На протяжении всего 2016 года индекс Dow-Jones демонстрировал стабильный рост.

Рисунок 6 индекс Dow-Jones, временные интервалы

Эксперимент

Эксперимент заключается в том, чтобы программными методами собрать реальные данные об индексе Dow-Jones, за определенные выше промежутки времени и обработать их так, чтобы можно было на их основе построить сетевую модель фондового рынка, идентифицировать в этой сетевой модели сетевые структуры и сравнить их по F1 мере. Программный код, приложенный к данной работе, выполнен на Python 2.7.

Сбор данных

Все данные в работе взяты из открытого источника с помощью библиотеки quandl для python. (https://www.quandl.com/api/v3/datatables/WIKI/PRICES.csv)

Данные, полученные таким образом, могут содержать ошибки - пустые или нечисловые значения в таблице. Для замены пропущенного значения будем использовать среднее арифметическое его соседей.

Используемые алгоритмы и функции

С полным кодом программы можно ознакомиться в приложении. Далее будут описаны основные алгоритмы и функции, использованные в программе.

Cliques(graph, net, k) - функция, возвращающая граф сменности для графа, состоящего из k клик, обладающих наибольшим весом. Для того чтобы определить клики, используется алгоритм Брона-Кербоша, получающий на вход дополняющий граф к тому, в котором нужно найти клики.

MST(W) - функция, возвращающая граф смежности для максимального остовного дерева в графе W. Для поиска максимального остовного дерева используется алгоритм Прима.

Индекс Dow-Jones

Один из старейших фондовых индексов США - индекс Dow-Jones построен по 30 наиболее влиятельным компаниям Америки. Индекс составляется редакцией газеты The Wall Street Journal.

3M Co

MMM

American Express

AXP

Apple

AAPL

Boeing

BA

Caterpillar

CAT

Cisco Systems

CSCO

Chevron Corp.

CVX

Coca-Cola

KO

E.I. du Pont de Nemours & Co

DD

Exxon Mobil

XOM

General Electric

GE

The Goldman Sachs Group

GS

Home Depot

HD

Intel Corp

INTC

International Business Machines

IBM

JPMorgan Chase and Co

JPM

Johnson & Johnson

JNJ

McDonald's Corp.

MCD

Merck & Co

MRK

Microsoft Corp

MSFT

Nike

NKE

Pfizer

PFE

Procter & Gamble

PG

Travelers

TRV

UnitedHealth Group

UNH

United Technologies

UTX

Verizon Communications

VZ

Visa

V

Wal-Mart Stores

WMT

Walt Disney

DIS

F1 мера

Так как в процессе построения отсеченного графа происходит принятие или отвержение статистических гипотез о включении или не включении ребра в указанный граф, можно говорить об ошибке первого и второго рода - ребро принято, когда не должно было или отвергнуто, когда ему следовало быть графе. В связи с этим есть возможность описать меру схожести двух графов G1 и G2, как F1 меру, где включение ребра в граф G1 будем считать верным, если это ребро включено в граф G2 и наоборот, неверным, если данное ребро в G2 отсутствовало.

Для расчета F1 меры будем брать , что означает, что F1 мера будет представлять собой среднегармоническое точности и полноты. Очевидно, что в таком случае F1 мера симметрична относительно порядка графов. А именно:

Также очевидно, что F1 мера имеет область значений от 0 до 1, где 1 означает полное совпадение графов, а 0 - отсутствие общих ребер.

ГЛАВА 4. Результаты

Результаты представлены в виде таблиц. Сначала идут сравнения графов рынка, построенных при помощи различных метрик - корреляции Пирсона, корреляции Спирмена и знаковой корреляции, далее сравниваются последовательно максимальные остовные деревья и клики. В таблицах строки отвечают за метрику, столбцы соответственно за графы, построенные по выбранным данным и значения F1 метрики, которая и является основным способом определить степень схожести графов.

Временные промежутки выбраны так, чтобы в первой таблице показать разницу между структурами, полученными в спокойный период (2017 год), а во второй, между теми, что были идентифицированы в переломный для американской экономики период (до и после кризиса начала 2016 года). В связи с этим можно ожидать, что во вторых таблицах значения F1 меры будут малы для всех функций зависимости.

Графы рынка

При помощи одношаговой процедуры из сети рынка (которая является полным взвешенным графом) получаем отсеченный граф, в котором предстоит решить задачу идентификации сетевых структур - клики и максимальные остовные деревья.

Отсеченные графы, построенные по данным за 2017 год (стабильный рост индекса)

1 января 2017 - 30 июня 2017

1 июля 2017 -31 декабря 2017

F1 measure

Pr

0.11842

Sp

0.14754

Sn

0.14754

Рисунок 7 отсеченные графы по данным за 2017 год

Отсеченные графы, построенные по данным за период с середины 2015 года по середину 2016 (до и после кризиса)

1 июля 2015 - 31 декабря 2015

1 января 2016 - 30 июня 2016

F1 measure

Pr

0.16842

Sp

0.16667

Sn

0.10345

Рисунок 8 отсеченные графы 2015 - 2016 гг

Максимальное остовное дерево, полученное из отсеченного графа рынка при помощи алгоритма Прима

Максимальные остовные деревья в отсеченных графах, построенных по данным за 2017 год (стабильный рост индекса)

1 января 2017 - 30 июня 2017

1 июля 2017 -31 декабря 2017

F1 measure

Pr

0.21429

Sp

0.17857

Sn

0.17857

Максимальные остовные деревья в отсеченных графах, построенных по данным за период с середины 2015 года по середину 2016 (до и после кризиса)

1 июля 2015 - 31 декабря 2015

1 января 2016 - 30 июня 2016

F1 measure

Pr

0.5

Sp

0.5

Sn

0.17857

Рисунок 9 максимальное остовное дерево 2015 - 2016 гг

Клики

Сравнение проводится по 6ти наиболее значимым кликам (как мера значимости в алгоритме используется сумма весов соответствующих ребер в сети рынка), объединенным в один граф.

Клики в отсеченных графах, построенных по данным за 2017 год (стабильный рост индекса)

1 января 2017 - 30 июня 2017

1 июля 2017 -31 декабря 2017

F1 measure

Pr

0.09524

Sp

0.13462

Sn

0.14414

Рисунок 10 клики 2017 год

Клики в отсеченных графах, построенных по данным за период с середины 2015 года по середину 2016 (до и после кризиса)

1 июля 2015 - 31 декабря 2015

1 января 2016 - 30 июня 2016

F1 measure

Pr

0.08571

Sp

0.02273

Sn

0.04211

Рисунок 11 клики 2015 - 2016 гг

Итоговое сравнение мер зависимости на основе данных полученных в эксперименте.

ЗАКЛЮЧЕНИЕ

Вывод

В ходе сравнения мер зависимости, применяемых для определения весов в сетевой модели рынка, были выявлены результаты, приведенные выше, и по ним можно сделать следующие заключения:

1. Ни одна из функций не может быть названа лучшей по всем показателям. Разницы в значениях F1 меры малы и в значительной мере зависят от выбранного временного промежутка.

2. На выбранных данных знаковая функция зависимости показывает результаты в среднем несколько менее стабильные, чем две другие меры зависимости.

3. Как можно заметить из сравнения результатов для максимального остовного дерева за временной период, включающий в себя экономический кризис, результат анализа сетевой модели может значительно зависеть от применяемой функции связи случайных величин.

Итог: при работе с сетевой моделью фондового рынка имеет смысл проводить предварительное исследование для того, чтобы определить, какая мера зависимости даст лучший (в плане информативности) результат на конкретном наборе данных.

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

рынок сетевой фондовый акция

1. В.А. Калягин, А.П. Колданов, П.А. Колданов, П.М. Пардалос «Статистические процедуры идентификации сетевых структур фондовых рынков» 2017г

2. Valery A. Kalyagin, Alexander P. Koldanov, Petr A. Koldanov «Robust identification in random variable networks» 2016г

3. E. L. Lehman «Some concepts of dependence» 1966г

4. William H. Kruskal «Ordinal Measures of Association» 2012г

5. Бенджамин Грэм и Дэвид Додд «Анализ ценных бумаг» 2012г

6. Майкл Н. Кан «Технический анализ. Просто и ясно» 2008г

7. Дмитрий Михнов «Успешный трейдинг. От нуля до первого миллиона» 2016г

Размещено на Allbest.ru


Подобные документы

  • Понятие фондового рынка, его функции, структура и участники. Основные модели регулирования фондового рынка. История развития фондового рынка в Украине. Основные проблемы рынка ценных бумаг. Перспективы дальнейшего развития фондового рынка Украины.

    курсовая работа [88,7 K], добавлен 10.12.2010

  • Понятие и значение фондового рынка. Методология построения фондового индекса. Обработка и преобразование данных, построение модели прогнозирования. Регрессионный анализ влияния переменных на динамику индекса. Оценка и применение модели прогнозирования.

    дипломная работа [1,7 M], добавлен 30.11.2016

  • Общая характеристика субъектов фондового рынка. Потребители услуг фондового рынка. Эмитенты. Инвесторы. Профессиональная деятельность участников фондового рынка. Инвестиционные институты. Инфраструктура фондового рынка.

    реферат [29,3 K], добавлен 13.04.2004

  • Сущность рынка ценных бумаг. Понятие акции как ценной бумаги, её характеристика и классификация. Цена и доходность акций, методы анализа рынка акций. Спред-анализ рынка акций ОАО "Газпром". Проблемы и перспективы развития фондового рынка в России.

    курсовая работа [2,5 M], добавлен 29.01.2011

  • Теоретические основы функционирования рынка акций, их характеристика. Историческое развитие российского фондового рынка, особенности его функционирования. Оценка состояния рынка акций в России, проблематика и направления совершенствования деятельности.

    курсовая работа [2,0 M], добавлен 18.03.2018

  • Теоретические и эволюционные аспекты фондового рынка в России. Методические основы операторов фондового рынка. Сравнительный анализ работы крупнейших операторов фондового рынка в 2006 году. Рынок ценных бумаг.

    курсовая работа [36,9 K], добавлен 15.02.2007

  • Понятие, причины возникновения и структура фондового рынка. Роль фондового рынка в фазах процесса общественного воспроизводства. Этапы становления, тенденции и макроэкономическая среда развития фондового рынка России. Эффективность фондового рынка.

    реферат [35,4 K], добавлен 31.05.2012

  • Свободное обращение ценных бумаг и регулирование современного фондового рынка. Перераспределение капитала внутри экономики конкретной страны. Организация и структура фондового рынка Российской империи. Становление современного фондового рынка России.

    курсовая работа [31,7 K], добавлен 15.02.2015

  • Причины и основные этапы формирования рынка ценных бумаг, необходимость его функционирования. Оценка тенденций развития фондового рынка России на основе анализа состояния рынка акций. Разработка мероприятий, способствующих решению проблем развития рынка.

    дипломная работа [1,2 M], добавлен 01.08.2009

  • Понятие рынка ценных бумаг, его составные части и функции. Объекты и субъекты фондового рынка. Разновидности и классификация ценных бумаг. Меры по регулированию фондового рынка Министерством финансов РФ. Процесс становления рынка ценных бумаг в России.

    курсовая работа [105,8 K], добавлен 17.10.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.