Анализ статистических свойств процедуры построения минимального остовного дерева

Характеристика структуры и функций фондовой биржи. Формулировка задач анализа кредитного рынка с позиций математической статистики. Изучение поправки Бонферрони и метода Холма. Разработка статистического правила для решения задачи построения MST.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 15.12.2015
Размер файла 552,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Содержание

  • Введение

Глава 1. Структура и функции фондовой биржи

1.1 Фондовая биржа

1.2 Фондовый индекс

1.3 История биржи NASDAQ

1.4 Индексы NASDAQ

1.5 Индекс NASDAQ 100

Глава 2. Формулировка задач анализа фондового рынка с позиций математической статистики

2.1 Статистическая неопределенность и процедуры со многими решениями

2.2 Теория Леманна

2.3 Поправка Бонферрони

2.4 Метод Холма

2.5 Измерение статистической неопределенности, основанное на статистическом риске

Глава 3. Построение статистического правила для решения задачи построения MST

Глава 4. Эмпирические результаты для оценки качества предложенного правила построения MST

Заключение

Библиографический список

Приложение

  • Введение

Проблема исследования фондовых рынков возникла еще в середине 20 века.

Актуальность ее состоит в том, что фондовые рынки имеют решающее значение в экономике. Фондовые рынки направляют средства от вкладчиков для инвесторов, тем самым способствуя экономической эффективности. Рыночная активность влияет на личное богатство, поведение коммерческих фирм и экономику в целом. Хорошо функционирующие финансовые рынки, такие как рынок облигаций, рынок ценных бумаг и валютный рынок, являются ключевыми факторами в производстве высоких темпов экономического роста.

В 1952 году Гарри Марковиц опубликовал свою работу «Portfolio Selection» [13], где впервые была предложена математическая модель формирования оптимального портфеля. При помощи вероятностной формализации понятий «доходность» и «риск» Марковиц смог сформулировать задачу выбора оптимального портфеля на математическом языке. На базе данного языка было разработано огромное количество моделей, которые позволяют рассматривать фондовый рынок как сложный механизм или сеть, в которой ценные бумаги являются узлами, а взаимодействие между узлами определяется коэффициентами корреляции. Полученная сеть является полным взвешенным графом. В целях упрощения полученной сети и сохранения ключевой информации о ней используются различные методы фильтрации.

Одним из таких методов является выделение минимального остовного дерева. Для его построения список ребер сортируется в порядке убывания в зависимости от веса, в дальнейшем этот упорядоченный список добавляется к минимальному остовному дереву, при условии, что добавление последующего ребра не создает цикл [9]. Данный граф используется для определения топологической структуры акций, входящих на фондовый рынок, а также для построения иерархической структуры рынка, которую предложил в 1999 Mantegna R.N в своей работе «Hierarcical structure in financial markets».

Однако уменьшение до минимального остова приводит к потере ценной информации. Для того чтобы преодолеть данную проблему в 2005 году Tumminello M., Aste T., Matteo T.D., Mantegna R.N. [15] предложили использовать максимальный плоский отфильтрованный граф.

Еще одним методом фильтрации является концепция графа рынка, предложенная в 2003 году Boginski, Butenko, Pardalos [2]. В данной структуре каждая ценная бумага интерпретируется как отдельная вершина графа, а вершины соединяются ребром в том случае, если коэффициент корреляции выбранной характеристики ценных бумаг превышает определенное пороговое значение. Данный метод использован, например, в работе Визгунова А.Н, Гольденгорина Б.И, Замараева В.А., Калягина В.А., Колданова А.П., Колданова П.А., Пардалоса П.М. «Применение рыночных графов к анализу фондового рынка России» (2012 год).

На данный момент анализ фондовых рынков является привлекательной областью для исследований, самые разные направления разработаны для того, чтобы получить ценную информацию о них [1,5,6,15,15]. Большинство из этих подходов используют наблюдения временных рядов. Хорошо известно, что финансовые временные ряды имеют стохастический характер, и, как следствие, любой такой анализ должен быть дополнен оценкой статистической неопределенности полученных результатов.

Таким образом, в данной работе встала задача - проанализировать методологии для определения статистической неопределенности и исследовать один из широко используемых методов фильтрации-минимальное остовное дерево.

Объектом исследования является минимальное остовное дерево.

Предмет исследования: алгоритмы и методы исследования статистической неопределенности.

Цель работы: исследовать минимальное остовное дерево и проанализировать статистические свойства процедуры его построения.

Поставленные задачи:

1. Исследовать выбранный фондовый индекс NASDAQ 100

2. Собрать необходимую информацию о доходностях акций индекса

3. Исследовать методики для анализа статистической неопределенности

4. На основе изученных методологий предложить процедуру для определения статистической неопределенности минимального остовного дерева

5. Применить описанный метод для фондового индекса NASDAQ 100

6. Проанализировать полученные результаты

Теоретической и методологической основой послужили работы как зарубежных, так и отечественных авторов в области исследования фондовых рынков, инструментарий экономической теории, теории вероятностей и эконометрики. В качестве метода использован алгоритм, описанный исследователями из лаборатории ЛАТАС Высшей школы экономики [8]. Использован алгоритм Краскала для построения минимального остовного дерева.

Данная работа структурирована следующим образом: в первой главе рассмотрен общий механизм работы фондовой биржи, во второй главе рассмотрены основные фильтрационные методы для анализа фондовых рынков и статистические методы для оценки и контроля статистической неопределенности, в третьей главе предложена модель для оценки статистической неопределенности минимального остовного дерева, в четвертой главе описаны результаты после применения предложенной модели.

Глава 1. Структура и функции фондовой биржи

1.1 Фондовая биржа

Фондовая биржа - это организованный рынок, где владельцы ценных бумаг не напрямую, а через членов биржи, совершают сделки купли-продажи. Члены биржи могут являться как индивидуальными торговцами, так и кредитно-финансовыми институтами.

Совет директоров биржи осуществляет общее руководство, опираясь на устав биржи. Устав биржи - это документ, в котором определяется порядок управления биржей, состав ее членов, порядок их приема. Стоит отметить, что наряду с советом директоров существуют президент и вице-президент биржи, которые осуществляют повседневный контроль. Так как они не могут в полной мере контролировать все стороны деятельности биржи, избираются комитеты из ее членов. Существуют, например, аудиторский, бюджетный комитеты; комитеты по биржевым индексам, опционам, по приему членов. Главная функция комитета по приему членов - рассмотрение заявок на принятие в члены биржи, а комитета по арбитражу- решение спорных вопросов, которые возникают между клиентами и членами биржи.

Как правило, число комитетов меняется на разных биржах, однако есть некоторый обязательный список, определяющий комитеты, необходимые для функционирования биржи. В данный список входят:

· Клиринговая палата, которая занимается проверкой информации о заключенных сделках, полученной от членов биржи;

· Комитет по листингу, рассматривающий заявки на включение акций в листинг;

· Комитет по процедурам торгового зала, определяющий режим торговли и следящий за его соблюдением;

· Биржевой комитет после проверки, сделанной комитетом по листингу, вносит акции компаний в список биржи и определяет правила торговли ими.

Правила ведения биржевых операций устанавливают члены биржи или государственный орган, который контролирует их деятельность. Вместе с порядком проведения сделок они образуют главную часть механизма биржи. Биржи, как правило, являются некоммерческими структурами и освобождены от уплаты подоходного налога, поэтому биржа взимает со своих участников ряд платежей за осуществление сделок, а с компаний - плату за включение их акций в листинг, ежегодные взносы новых членов.

Фондовая биржа может организоваться в виде частных акционерных обществ или публично-правовых институтов. «По своему правовому статусу фондовые биржи могут являться ассоциациями (США), акционерными обществами (Великобритания, Япония) или правительственными органами, подчиненными министерству финансов (Франция)» [18].

В фондовой сделке есть три участника: продавец, покупатель и посредник. Посредник может быть не один: в случае, когда покупатель обращается к одному посреднику, а продавец - к другому. Когда эти двое посредников нуждаются в помощи, появляется еще один - центровой посредник. Членами биржи являются индивидуальные лица (брокеры), либо брокерские компании. По уставу фондовых бирж сами посредники не имеют права совершать собственные сделки, они получают комиссионные за посредничество, которые называются брокерскими. Членом биржи может стать лишь то индивидуальное лицо или компания, которая может внести крупную сумму денег и имеет рекомендации от других членов биржи.

На бирже, с одной стороны, находятся корпорации и кредитно-финансовые учреждения, которые продают свои акции и получают дополнительные средства, а с другой стороны - индивидуальные лица, желающие выгодно вложить свои сбережения.

Стоит отметить, что вместе с акцией вкладчик получает и долю собственности корпорации. Корпорации продают акции лишь старого выпуска, то есть, фактически, акции переходят от одного владельца к другому. Данные операции создают ликвидные средства, увеличивают количество наличных денег.

Как уже отмечалось ранее, не все компании входят в листинг биржи, так как они должны удовлетворять требованиям Биржевого комитета, отсюда вытекает, что круг ценных бумаг на рынке ограничен. Кроме того, биржа - это не весь рынок ценных бумаг, помимо нее осуществляется огромный внебиржевой оборот, то есть купля-продажа ценных бумаг через посреднические фирмы, минуя фондовую биржу, у дилеров, не являющихся биржевыми агентами покупателей и продавцов. В США в 1971 году была создана коммуникационная система NASDAQ, которая сейчас и является основой внебиржевого оборота.

Что касается роли государства на фондовом рынке, то с одной стороны, оно активно пользуется финансовыми возможностями рынка, но с другой стороны, оно пытается в целях государственно-монополистического регулирования воспроизводства капитала воздействовать административными, налоговыми и прочими методами, как на саму фондовую биржу, так и на поведение действующих там эмитентов, посредников и инвесторов. В Таблице 1 представлены 20 крупнейших фондовых бирж по объему рыночной капитализации [21].

Таблица 1 Топ-20 фондовых бирж мира по объему рыночной капитализации

Биржа

Сентябрь,2013

(в млрд. долларов)

Сентябрь,2012

(в млрд. долларов)

NYSE Euronext (США)

16 534,0

13 728,2

NASDAQ OMX

5 536,8

4 801,5

Токийская фондовая биржа

4 455,2

3 342,3

Лондонская фондовая биржа

4 088,4

3 482,4

NYSE Euronext (Европа)

3 354,5

2 622,4

Гонконгская фондовая биржа

2 942,1

2 534,2

Шанхайская фондовая биржа

2 518,4

2 307,2

Фондовая биржа Торонто

2 050,4

2 289,8

Deutsche Bцrse

1 718,2

1 346,1

Швейцарская биржа

1 422,7

1 097,0

Шэньчжэньская фондовая биржа

1 379,3

1 308,2

Австралийская фондовая биржа

1 470,1

1 147,6

Корейская биржа

1 199,9

1 137,9

NASDAQ OMX Nordic Exchange

1 020,1

1 243,5

Мадридская фондовая биржа

989,0

1 219,4

Фондовая биржа Сан-Паулу

1 188,0

948,5

Бомбейская фондовая биржа

1 086,3

956,6

Национальная фондовая биржа Индии

1 082,9

1 186,4

Йоханнесбургская фондовая биржа

870,5

849,1

Тайваньская фондовая биржа

779,1

724,0

1.2 Фондовый индекс

«Фондовый индекс - это составной показатель изменения цен определённой группы ценных бумаг -- «индексной корзины» [18].

3 июля 1884 года американским журналистом газеты Wall Street Journal, известным финансистом, основателем компании Dow Jones & Company Чарльзом Доу был разработан первый фондовый индекс Dow Jones Transportation Average. Он рассчитывался по 11 самым крупным американским транспортным компаниям. На сегодняшний день в него входят 20 компаний-грузоперевозчиков. Однако он получил не такую большую известность как Industrial Average. Данный индекс рассчитывается с 1928 года по 30 крупнейшим компаниям промышленности.

Изменения фондового индекса во времени помогают судить о движении направления рынка. В зависимости от выборки показателей, фондовый индекс может отражать поведение какой-то группы ценных бумаг (или других активов) или рынка (сектора рынка) в целом.

Существуют различные методы расчета фондовых индексов:

· Метод средней арифметической простой (невзвешенный). Главная идея состоит в том, что цены всех активов индекса складываются и делятся на число этих активов.

· Позже стали применять второй метод построения фондового индекса: взвешенное среднее арифметическое. Он отличается от предыдущего метода тем, что сначала цена каждой акции умножается на количество акций каждой компании в обращении, уже затем взвешенные цены суммируются и делятся на число активов.

· Метод средней геометрической является редко используемым на практике: он применяется для индекса FT 30 (индекс Financial Times, содержащий акции тридцати самых крупных промышленных и торговых компаний), а также для Value Line Composite Geometric Index. Данный метод учитывает темпы роста цен на акции; он используется не так часто, однако, в нем, как и в методе средней арифметической, отсутствуют веса, что приводит к максимизации влияния акций с самыми высокими темпами роста.

· Некоторые фондовые индексы рассчитываются как индексы суммарного дохода на капитал. При этом предполагается, что полученный в виде дивидендов доход немедленно реинвестируется в акции. Примером такого индекса является DAX -- самый важный фондовый индекс Германии.

1.3 История биржи NASDAQ

NASDAQ (National Association of Securities Dealers Automated Quotation) -американский внебиржевой рынок, который специализируется на акциях высокотехнологичных компаний. Является одной из трех основных бирж наряду с NYSE и AMEX.

В 1938 году Конгресс США принял документ Maloney Act, обязавший всех брокеров, которые на данный момент не являются членами какой-либо биржи, вступить в SRO. Таким образом, данная организация смогла бы оказывать влияние на своих членов, принимать собственные правила, а также санкции за их нарушения, за нарушения законов рынка ценных бумаг. Уже в 1939 году такая саморегулирующаяся компания была создана, она получила название National Association of Securities Dealers (Национальная ассоциация дилеров ценных бумаг). В обязанности компании вошли:

· Создание правил и процедур для устранения различных мошеннических действий на бирже

· Знакомство членов NASD с данными правилами, а также с правилами рынка ценных бумаг

· Поддержание честных принципов торговли

· Защита интересов инвесторов.

Однако в связи с тем, что некоторые компании не публиковали финансовую отчетность, либо она публиковалась только частично и нерегулярно, Конгрессу США в конце 60-х годов пришлось провести расследование. По его результатам Конгресс США обязал Национальную ассоциацию торговцев ценными бумагами (или NASD) систематизировать и автоматизировать рынок ценных бумаг. В то же время активно развивались компьютерные технологии, которые помогли решить поставленную перед ассоциацией задачу. В 1971 году появилась электронная система торговли ценными бумагами NASDAQ, а в феврале этого же года на ней были совершенны первые сделки. Система имела информационную базу, где можно было увидеть усредненные и лучшие котировки дилеров на рынке.

Позже, в 1982 году, для того, чтобы отсеять мелкие компании, ассоциация выделила организации, соответствующие самым высоким требованиям листинга. Именно тогда был создан рынок NNM (NASDAQ National Market). На данный момент на нем обращается более 4 000 ценных бумаг крупнейших корпораций. В 1990 году была создана вторая группа акций компаний с небольшой капитализацией, так появился NASDAQ SCM (Nasdaq Small Cap Market).

В 2006 году NASDAQ попытался приобрести Лондонскую фондовую биржу, но сделка не состоялась из-за того, что была предложена заниженная цена за акцию. После отказа, биржа приобрела пакет из 25,1% акций Лондонской фондовой биржи, став ее крупнейшим акционером. После этого в 2007 году NASDAQ предпринял вторую попытку, предложив Лондонской фондовой бирже около 2,7 млрд фунтов, однако и во второй раз биржа получила отрицательный ответ.

В том же году NASDAQ удалось приобрести своего конкурента OMX и выйти на европейский рынок. Объединенная компания получила название NASDAQ OMX Group. Акционеры NASDAQ получили 72% акций новой биржи, остальное получили акционеры OMX.

Существует несколько требований для компаний, которые хотят войти в систему NASDAQ. Сначала они должны зарегистрировать свои ценные бумаги согласно Закону о ценных бумагах от 1933 г. или Закону об инвестиционных компаниях от 1940 г.: компаниям необходимо иметь не менее 100 тысяч акций, размещенных по подписке, и объединить не менее 300 акционеров. Следование данным законам предполагает наложение дополнительных условий на цены каждой акции, объем активов и прибыли, наличие лиц, определяющих рынок этих акций и курирующих сделки с ними.

1.4 Индексы NASDAQ

Биржа NASDAQ имеет несколько индексов деловой активности. Если раньше на бирже имелись акции только высокотехнологичных компаний, то сейчас ситуация изменилась, что привело к появлению различных индексов, каждый из которых отражает ситуацию в определенной экономической отрасли.

a) Nasdaq Composite Index

Nasdaq Composite Index является сводным индексом биржи NASDAQ. В него входит более 5000 высокотехнологичных компаний, которые входят в листинг NASDAQ. Расчеты данного индекса начались уже в 1971 году. Расчет рыночной стоимости довольно прост: общее число акций компании умножается на текущую рыночную стоимость одной акции. В июле 1975 года индекс впервые закрылся на 1000 отметке.

Это послужило причиной для дальнейшего роста индекса. Однако в 2000 году после достижения рекордной отметки в 5132,52 пункта в течение торгов, при закрытии индекс упал до 5048,62 (Рис. 1) [22]. Это было связано со взлетом акций интернет-компаний и получило название dot-com bubble (пузырь доткомов). В результате данных событий большое количество интернет-компаний обанкротилось или было ликвидировано.

Рисунок 1. Изменение индекса Nasdaq Composite с 1970 г. по 2011г.

b) Индекс Nasdaq National Market Composite - это аналог индекса Nasdaq Composite, в него входят акции тех компаний, которые входят в листинг Национального рынка (National Market).

c) Nаsdaq Bаnk Index - индекс, включающий акции компаний банковского сектора

d) Nаsdaq Biotechnology Index включает акции медицинских и фармацевтических компаний

d) Nаsdaq Computer Index включает акции для компаний, разрабатывающих ПО для компьютеров.

e) Nasdaq Financial Index включает акции компаний финансового сектора.

f) Nasdaq Industrial Index включает акции промышленных компаний

g) Nasdaq Insurance Index включает акции страховых компаний

h) Nasdaq Telecommunications Index включает акции телекоммуникационных компаний.

1.5 Индекс NASDAQ 100

NASDAQ-100 является американским фондовым индексом, включающим в себя 100 крупнейших по капитализации организаций, акции которых включены в листинг NASDAQ. Стоит отметить, что данный индекс не учитывает компании финансового сектора.

Индекс NASDAQ-100 появился одновременно с NASDAQ Financial-100 в 1985 году. Первый учитывает акции промышленных высокотехнологичных компаний, а второй- акции финансовых компаний. Уже в 1998 году в индекс входили не только американские компании.

Функционирование индекса началось на отметке в 250 пунктов, а максимум был достигнут в 2000 году на волне дот-комов. (Рис. 2)

Рисунок 2. Изменение индекса NASDAQ-100 с 1985г. по 2014г.

В данной главе были рассмотрены основные функции биржи, ее структура, а также история создания и развития индекса NASDAQ 100.

Глава 2. Формулировка задач анализа фондового рынка с позиций математической статистики

2.1 Статистическая неопределенность и процедуры со многими решениями

Все существующие методы фильтрации (минимальное остовное дерево, максимальный плоский отфильтрованный граф, граф рынка и т.д.) с точки зрения математической статистики могут быть рассмотрены как процедуры со многими решениями, описанными Леманном в [10]. В данной главе будут рассмотрены различные подходы для оценки и контроля статистической неопределенности процедур со многими решениями.

Для работы со статистической неопределенностью необходимо рассмотреть следующие виды статистических ошибок:

· Ошибка первого рода - это ошибка, состоящая в опровержении верной гипотезы;

· Ошибка второго рода -это ошибка, состоящая в принятии ложной гипотезы.

В статистическом анализе часто возникает ситуация, когда на одной выборке наблюдений выполняется проверка большого числа гипотез. Предположим, мы проверяем истинность - гипотез:. В отношении каждой из гипотез мы применяем определенный статистический критерий, после чего делаем вывод о принятии или отклонении гипотезы. Если в ходе проверки было совершено V-ошибок первого рода и -ошибок второго рода, то задача множественной проверки заключается в том, чтобы минимизировать число ложных отклонений () и ложных принятий (). Традиционно принято минимизировать только величину . Если выполняется условие , то совершается как минимум одна ошибка первого рода.

Familywise error rate, FWER или групповая вероятность ошибки- это вероятность допущения как минимум одной ошибки первого рода при множественной проверке гипотез. Если говорят о контроле групповой вероятности ошибки на заданном уровне значимости б, подразумевают, что должно выполняться неравенство . Создано несколько методов множественной проверки гипотез для обеспечения этого контроля.

Существует несколько методов множественной проверки гипотез:

· Теория Леманна

· Измерение статистической неопределенности, основанное на статистическом риске;

· Поправка Бонферрони;

· Метод Холма.

Рассмотрим каждый из указанных методов подробнее.

2.2 Теория Леманна

Один из методов множественной проверки гипотез был предложен и подробно описан Леманном в [10]. Рассмотрим данный метод на примере выбора акций в рыночной сети. Эта проблема была поставлена и решена в [1].

В данной статье проблема выбора акций была поставлена следующим образом: выбирались акции, удовлетворяющие гипотезе , где -заданный порог. Основными трудностями при решении этой проблемы являются, с одной стороны, многомерный статистический характер проблемы, и с другой стороны, большой выбор возможных решений. В работе [1] проблема выбора акций ставилась как проблема множественного выбора одной гипотезы из множества гипотез:

,

,

,

,

где (общее количество всех гипотез),-количество акций на рынке. Для решения поставленной проблемы авторы строят оптимальную статистическую процедуру . В данном случае статистическая процедура - это отображение из выборочного пространства в пространство решений .

Порождающие гипотезы

Введем семейство порождающих гипотез

(1)

В данном случае

,

,

,

,

где символ обозначает пересечение в параметрическом пространстве параметра

· Совместимость

Пусть -решение принять гипотезу , -решение отклонить гипотезу . Для тестирования порождающих гипотез используются следующий тип тестов

,

где -тестовая статистика. Пусть тогда

.

Предположим, что статистика такова, что все пересечения , выборочных регионов о принятии или отклонении соответствующих порождающих гипотез не пусты. В данном случае есть однозначное соответствие между разбиением (2) в выборочном пространстве и разбиением (1) в параметрическом пространстве . Тогда процедура со многими решениями запишется следующим образом:

,

· Функция потерь

Пусть - потери от отклонения верной гипотезы , -потери от принятия неверной гипотезы (. Пусть - потери от решения , учитывая, что гипотеза верна (. Связь между потерями решающее значение в теории проверки многих статистических гипотез и известна как условие аддитивности. Это означает, что потери от неправильной классификации акций равны сумме потерь от неправильной классификации каждой отдельной акции.

В общем виде

,

где

· Условный риск

Качество каждой статистической процедуры измеряется условным риском. В данном случае условный риск определяется как

,

,

Согласно предположению об аддитивности, условный риск принимает форму

,

2.3 Поправка Бонферрони

Неравенство Бонферрони часто используется при множественном тестировании на значимость, главная идея состоит в установке верхней границы FWER. Пусть -, соответствующие для тестирования гипотез .

Если конкретная гипотеза отклоняется при , то неравенство Бонферрони

,

гарантирует, что вероятность отклонения по крайней мере одной гипотезы, когда они все верны, не больше .

2.4 Метод Холма

В статистике, метод Холма - метод, используемый для борьбы с проблемой множественных сравнений. Он предназначен для контроля FWER и предлагает простой равномерно более мощный тест, чем поправка Бонферрони.

Прежде чем перейти к описанию самого метода, обратимся к определению

-значение или достигаемый уровень значимости - это минимальный уровень значимости, при котором для заданного значения статистики критерия отвергается нулевая гипотеза:

,

где критическая область критерия.

Способ заключается в следующем:

Пусть -, соответствующие для тестирования гипотез ,

1. Упорядочим по убыванию:

2. Если , следует принять гипотезы и закончить процедуру проверки. Иначе, если , отвергнуть гипотезу и продолжить проверку оставшихся гипотез на уровне значимости .

3. Шаг 2. Если , ринять гипотезы и остановиться. Иначе, если , отвергнуть гипотезу и продолжить проверку оставшихся гипотез на уровне значимости .

4. Продолжить данную процедуру, пока все гипотезы не будут проверены.

2.5 Измерение статистической неопределенности, основанное на статистическом риске

Данный метод подробно описан в [8]. Пусть -количество акций, а -количество дней наблюдений за выбранными -акциями. В данном случае доходность акции в день определяется как:

,

где - цена акции в день .

Предположим, что для фиксированного , , , являются независимыми случайными величинами с тем же распределением, что и и случайный вектор имеет многомерное нормальное распределение , где

является ковариационной матрицей.

Для данной модели Калягин В.А., Колданов А.П., Колданов П.А., Замараев В.А., Пардалос П.М. вводят истинную сеть (reference network), которая представляет полный взвешенный граф с узлами и матрицей весов. Для данной сети можно построить соответствующие истинные структуры, например, истинное минимальное остовное дерево, истинный граф рынка и т.д.

Теперь пусть , -наблюдаемые значения доходностей. Тогда можно определить ковариацию для сети, построенную по наблюдениям за доходностью акций (:

,

, где .

Используя полученную ковариационную матрицу введем сеть, построенную по наблюдениям за доходностью акций (sample network), которая является полным взвешенным графом с узлами и весовой матрицей . Аналогично для полученной сети можно рассматривать соответствующие примеры структур (sample MST, sample PMFG, sample MG). фондовый биржа математический статистика

Для определения статистической ошибки минимального остовного дерева необходимо сравнивать sample MST с истинной структурой. Такое сравнение будет основано на частоте неправильно включенных ребер [2,3]. Для измерения этой частоты исследователи вводят:

,

,

Тогда

- количество некорректно включенных ребер в истинную структуру (ошибки первого рода), -максимальное значение ;

- количество некорректно не включенных ребер в истинную структуру (ошибки второго рода), -максимальное значение .

Случайная переменная описывает суммарную долю ошибок. В данном случае условный риск определяется следующей формулой:

,

В данной главе были рассмотрены основные методы множественной проверки гипотез. В качестве вывода можно выделить тот факт, что в настоящей работе был выбран метод измерения статистической неопределенности, основанный на статистическом риске. При использовании других способов возникает проблема на этапе генерирования гипотез, так как минимальное остовное дерево строится при попарном сравнении коэффициентов корреляции, а не при сравнении с заданным пороговым значением.

Глава 3. Построение статистического правила для решения задачи построения MST

Минимальное остовное дерево в связанном взвешенном неориентированном графе-это остовное дерево данного графа, в котором сумма весов, входящих в него ребер, минимальна.

Построение минимального остовного дерева начинается с выбора вершин, которые являются акциями фондового индекса, затем выбирается мера близости доходностей акций. Проведенный обзор литературы показал, что в качестве такой меры удобно использовать расстояние, предложенное Mantegna в 1999 году [12].

Данное расстояние высчитывается по следующей формуле:

),

где , а

определяет доходности ценной бумаги однодневный период.

,

определяет среднюю доходность ценной бумаги i за n дней,

,

определяет дисперсию доходности ценной бумаги i за n дней.

После вычисления матрицы расстояний для построения минимального остовного дерева в данной работе применяется алгоритм Краскала, который состоит из следующих шагов:

1. Полагаем множество ребер остовного дерева пустым .

2. Определяем множество , состоящее из множества вершин дерева.

3. Сортируем множество ребер E исходного графа в порядке возрастания их весов.

4. Формируем очередь Q, элементы которой-ребра графа G.

5. Если множество содержит более одной вершины и очередь не пуста, переходим на шаг 6, иначе -- на шаг 8.

6. Извлекаем из очереди ребро . Если концы ребра е принадлежат различным множествам вершин и из , то переходим на шаг 7, если иначе, то отбрасываем извлеченное ребро и возвращаемся на шаг 5.

7. Объединяем множества вершин и (полагая ), удаляем множества и из множества и добавляем в множество . Добавляем ребро в множество . Возвращаемся на шаг 5.

8. Прекращаем работу. Множество - это и есть множество ребер полученного остовного дерева.

В работе [8], описанной в главе 2, авторы исследуют статистическую неопределенность существующих методов фильтрации на основе статистического риска. Главный результат состоит в том, что граф рынка, максимальная клика, максимальное независимое множество являются более надежными по отношению к статистической неопределенности, чем минимальное остовное дерево. Однако в статье [8] ошибкой построения считалось хотя бы одно неверно включенное или не включенное ребро в истинную структуру. Возможно, данные требования слишком высоки для минимального остовного дерева. Основываясь на данном предположении, введем

,

После построения истинной структуры, сгенерируем наблюдения из нормального многомерного закона и построим структуру по наблюдениям за доходностями акций для выбранного индекса (sample-структуру), найдем значение . Для определения зависимости статистической неопределенности от , проведем данные сравнения 100 раз и подсчитаем частоту не более некорректно включенных ребер, где частота находится по формуле:

(

В данной главе была поставлена проблема измерения статистической неопределенности минимального остовного дерева и подробно описан предлагаемый алгоритм. Главная идея предложенного метода была основана на работе Калягина В.А., Колданова А.П., Колданова П.А., Замараева В.А. [8] и заключалась в том, что для определения статистической неопределенности минимального остовного дерева предъявляются слишком высокие требования.

Глава 4. Эмпирические результаты для оценки качества предложенного правила построения MST

В ходе данной работы были собраны данные о доходностях акций фондового индекса NASDAQ 100 в период с 03.12.2013 по 28.11.2014 года (250 наблюдений). На основе этих данных была рассчитана матрица расстояний и построена истинная структура (Представлена в Приложении 1). Затем на основе полученной ранее корреляционной матрицы были сгенерированы наблюдения для sample-структуры. После ее построения была оценена статистическая неопределенность и выявлена зависимость частоты совершения не более ошибок первого рода от количества наблюдений. Сравнительный анализ приведен в таблицах ниже.

Таблица 2 Необходимое количество наблюдений при совершении не более ошибок первого рода при заданной частоте 0,1

n

700000

400000

350000

125000

10000

5000

3500

2500

2300

1000

q

1

2

3

4

5

6

7

8

9

10

Таблица 3 Необходимое количество наблюдений при совершении не более ошибок первого рода при заданной частоте 0,3

n

250000

150000

130000

50000

4000

2100

1600

1200

1000

600

q

1

2

3

4

5

6

7

8

9

10

Таблица 4 Необходимое количество наблюдений при совершении не более ошибок первого рода при заданной частоте 0,5

n

150000

36000

10000

5000

3500

2000

1500

1100

600

550

q

1

2

3

4

5

6

7

8

9

10

Таблица 5 Необходимое количество наблюдений при совершении не более ошибок первого рода при заданной частоте 0,7

n

50000

13000

4000

2500

2000

1200

900

800

500

450

q

1

2

3

4

5

6

7

8

9

10

Таблица 6 Необходимое количество наблюдений при совершении не более ошибок первого рода при заданной частоте 0,9

n

40000

9000

2500

1500

1000

640

540

460

430

350

q

1

2

3

4

5

6

7

8

9

10

Как видно из представленных таблиц, при уменьшении , количество наблюдений, которые требуются для достижения заданной статистической ошибки, заметно снижается. Если в работе [8] необходимое количество наблюдений для достижения 10 уровня ошибки было равно 10 000, что соответствовало 50 годам наблюдения за фондовым индексом, в данной работе при снижении требований к статистической ошибке их требуется менее 5 000.

Таким образом, принимая за статистическую ошибку не одно ошибочно включенное ребро, или, другими словами, увеличивая , появляется возможность снизить число требуемых наблюдений для достижения определенного уровня ошибки. В настоящей работе были рассмотрены случаи для , но уже в случае нам необходимо собрать 1000 наблюдений для достижения 10 уровня ошибки, что заметно снижает период наблюдения за фондовым рынком.

Ниже представлены графики, показывающие зависимость частоты не более -совершенных ошибок первого рода от количества наблюдений.

Рис 3. Зависимость частоты совершения не более -ошибок первого рода в 100 проведенных тестах от количества наблюдений (=1,2,3,4)

Рисунок 4. Зависимость частоты совершения не более -ошибок первого рода в 100 проведенных тестах от количества наблюдений (=5,6,7)

Рисунок 5. Зависимость частоты совершения не более -ошибок первого рода в 100 проведенных тестах от количества наблюдений (=8,9,10)

Данные графики подтверждают вывод о том, что полученный метод позволяет анализировать сети рынков, сохраняя заданный уровень, при меньшем количестве наблюдений.

Таким образом, в последней главе предложенный ранее алгоритм для определения статистической неопределенности был применен на примере фондового индекса NASDAQ 100. Главным его преимуществом является то, что он позволяет анализировать сети рынков, сохраняя заданный уровень ошибки, при меньшем количестве наблюдений.

Заключение

В данной работе были проанализированы методологии для определения статистической неопределённости на примере одного из широко используемых методов фильтрации - минимального остовного дерева.

В первой главе были рассмотрены основные функции биржи, ее структура, а также история создания и развития индекса NASDAQ 100.

Вторая глава работы посвящена основным методам множественной проверки гипотез. После их изучения для дальнейшей работы был выбран метод измерения статистической неопределенности, основанный на статистическом риске. При использовании других способов возникает проблема на этапе генерирования гипотез, так как минимальное остовное дерево строится при попарном сравнении коэффициентов корреляции, а не при сравнении с заданным пороговым значением.

В третьей главе была поставлена проблема измерения статистической неопределенности минимального остовного дерева и подробно описан предлагаемый алгоритм. Главная идея предложенного метода была основана на работе Калягина В.А., Колданова А.П., Колданова П.А., Замараева В.А. [8] и заключалась в том, что для определения статистической неопределенности минимального остовного дерева предъявляются слишком высокие требования. Если в указанной ранее статье за ошибку первого рода считалось хотя бы одно неверно включенное ребро, то в данной работе были рассмотрены случаи не более -ошибочно включенных ребер. В последней главе настоящей работы предложенный алгоритм был применен к фондовому индексу NASDAQ100, была исследована зависимость от количества наблюдений для достижения определенного уровня ошибки.

Таким образом, главным результатом работы стала модификация метода, основанного на статистическом риске, для оценки минимального остовного дерева, при котором количество наблюдений для достижения заданного уровня ошибки значительно снижается. Это позволяет анализировать сети рынков, сохраняя заданный уровень, при меньшем количестве наблюдений. Если в работе [8] требовалось более 10 000 наблюдений, что соответствовало 50 годам наблюдений за доходностью акций, то в данной работе показано, что 4 000 наблюдений достаточно при условии, что ошибкой первого рода можно считать не более 5 неверно включенных ребер.

Библиографический список

1. Bautin G.A., Koldanov P.A., Pardalos P.M. Multiple decision problem for stock selection in market network //Learning and Intelligent Optimization. P. 98-110.-2014.

2. Boginski V., Butenko S., Pardalos P.M. On Structural Properties of the Market graph. In: «Innovations in financial and economic networks» / Nagurney A. (ed.) Northampton: Edward Elgar Publishing Inc. P. 29-45.-2003.

3. Boginski, V., Butenko, S. and Pardalos, P. M. Statistical analysis of financial networks. Computational statistics & data analysis, Vol. 48, pp. 431-443.-2005.

4. Boginski, V., Butenko, S. and Pardalos, P. M. Mining market data: A network approach. Computers & Operations Research, pp. 3171-3184.-2006.

5. Huang W.-Q., Zhuang X.-T., Yao S. A network analysis of the Chinese stock market// Physica A: Statistical Mechanics and its Applications. 388 (14) .P. 2956-2964.-2009.

6. Galazka M. Characteristics of the Polish Stock Market correlations// International Review of Financial Analysis V.20 (1). P.15.-2011.

7. Jallo D., Budai D., Boginski V., Goldengorin B., Pardalos P.M. Network-Based Representation of Stock Market Dynamics: An Application to American and Swedish Stock Markets. In Models, Algorithms, and Technologies for Network Analysis (Goldengorin. B; Kalyagin V., Pardalos P. Editors.), Springer Proceedings in Mathematics & Statistics, Vol. 32, pp. 91-98.-2012.

8. Kalyagin V.A., Koldanov A.P., Koldanov P.A., Pardalos P.M., Zamaraev V.A. Measures of uncertainty in market network analysis. // Physica A: Statistical Mechanics and its Applications. 413 (1).P. 59-70.-2014.

9. Kruskal J.B. On the Shortest Spanning Subtree of a Graph and the Traveling Salesman Problem // Proceedings of the American Mathematical Society. 7 (1). P. 48-50.-1956.

10. Lehmann E.L. A theory of some multiple decision procedures 1// Annals of Mathematical Statistics.28. P. 1-25.-1957.

11. Lehmann E.L.,Romano J. Generalizations of the familywise error rate.// Ann. Statist. 33. P.1138-1154.-2005.

12. Mantegna R.N. Hierarchical Structure in Financial Market // The European Physical Journal B - Condensed Matter and Complex Systems. Vol. 11. P. 193-197.-1999.

13. Markowitz H.M.Portfolio Selection // The J. of Finance. Vol. 7 (1). P. 77-91.-1952.

14. Onnela J.P., Kaski K., Kertesz K.J. Clustering and Information in Correlation Based Financial Networks // The European Physical Journal B - Condensed Matter and Complex Systems. Vol. 38. P. -2004

15. Wang G.-J., Xie C., Chen Y.-J., Chen S. Statistical Properties of the Foreign Exchange Network at Different Time Scales: Evidence from Detrended Cross-Correlation Coeffcient and Minimum Spanning Tree // PEntropy. 15 (5). P. 1643-1662.-2013

16. Wanga G.-J., Xiea C., Chena S., Yanga J.-J., Yanga M.-Y. Random matrix theory analysis of cross-correlations in the US stock market: Evidence from Pearsons correlation coeffcient and detrended cross-correlation coeffcient //Physica A .392. P. 3715-3730.-2013.

17. Берзон Н.И., Аршавский А.Ю., Буянова Е.А. Фондовые индексы // Фондовый рынок / 3-е изд. М.: Вита. С. 364-367. 559 с. ISBN 5-7755-0456-9.-2002.

18. Визгунов А.Н., Гольденгорин Б.И., Замараев В.А., Калягин В.А., Колданов А.П., Колданов П.А., Пардалос П.М. Применение рыночных графов к анализу фондового рынка //Журнал новой экономической ассоциации, № 3, стр. 66-81. -2012.

19. Федеральный закон от 22 апреля 1996 г. №39-ФЗ «О рынке ценных бумаг» // Собрание законодательства Российской Федерации. 22 апреля 1996г. №17. Ст.1918.

Приложение

Таблица 7 Компоненты фондового индекса NASDAQ 100

Символ

Название компании

AAPL

Apple Inc.

ADBE

Adobe Systems Incorporated

ADI

Analog Devices, Inc.

ADP

Automatic Data Processing, Inc.

ADSK

Autodesk, Inc.

AKAM

Akamai Technologies, Inc.

ALTR

Altera Corp.

ALXN

Alexion Pharmaceuticals, Inc.

AMAT

Applied Materials, Inc.

AMGN

Amgen Inc.

AMZN

Amazon.com Inc.

ATVI

Activision Blizzard, Inc.

AVGO

Avago Technologies Limited

BBBY

Bed Bath & Beyond Inc.

BIDU

Baidu, Inc.

BIIB

Biogen Inc.

BRCM

Broadcom Corp.

CA

CA, Inc.

CELG

Celgene Corporation

CERN

Cerner Corporation

CHKP

Check Point Software Technologies Ltd.

CHRW

CH Robinson Worldwide Inc.

CHTR

Charter Communications, Inc.

CMCSA

Comcast Corporation

CMCSK

Comcast Corporation

COST

Costco Wholesale Corporation

CSCO

Cisco Systems, Inc.

CTRX

Catamaran Corporation

CTSH

Cognizant Technology Solutions Corporation

CTXS

Citrix Systems, Inc.

DISCA

Discovery Communications, Inc.

DISCK

Discovery Communications, Inc.

DISH

Dish Network Corp.

DLTR

Dollar Tree, Inc.

DTV

DIRECTV

EA

Electronic Arts Inc.

EBAY

eBay Inc.

ESRX

Express Scripts Holding Company

EXPD

Expeditors International of Washington Inc.

FAST

Fastenal Company

FB

Facebook, Inc.

FISV

Fiserv, Inc.

FOXA

Twenty-First Century Fox, Inc.

GILD

Gilead Sciences Inc.

GMCR

Keurig Green Mountain, Inc.

GOOG

Google Inc.

GRMN

Garmin Ltd.

HSIC

Henry Schein, Inc.

ILMN

Illumina Inc.

INTC

Intel Corporation

INTU

Intuit Inc.

ISRG

Intuitive Surgical, Inc.

KLAC

KLA-Tencor Corporation

KRFT

Kraft Foods Group, Inc.

LBTYA

Liberty Global plc

LLTC

Linear Technology Corporation

LMCA

Liberty Media Corporation

LRCX

Lam Research Corporation

LVNTA

Liberty Ventures

MAR

Marriott International, Inc.

MAT

Mattel, Inc.

MDLZ

Mondelez International, Inc.

MNST

Monster Beverage Corporation

MSFT

Microsoft Corporation

MU

Micron Technology, Inc.

MYL

Mylan N.V.

NFLX

Netflix, Inc.

NTAP

NetApp, Inc.

NVDA

NVIDIA Corporation

NXPI

NXP Semiconductors NV

ORLY

O'Reilly Automotive Inc.

PAYX

Paychex, Inc.

PCAR

PACCAR Inc.

PCLN

The Priceline Group Inc.

QCOM

QUALCOMM Incorporated

QVCA

Liberty Interactive Corporation

REGN

Regeneron Pharmaceuticals, Inc.

ROST

Ross Stores Inc.

SBAC

SBA Communications Corp.

SBUX

Starbucks Corporation

SIAL

Sigma-Aldrich Corporation

SIRI

Sirius XM Holdings Inc.

SNDK

SanDisk Corp.

SPLS

Staples, Inc.

SRCL

Stericycle, Inc.

STX

Seagate Technology Public Limited Company

SYMC

Symantec Corporation

TRIP

TripAdvisor Inc.

TSCO

Tractor Supply Company

TSLA

Tesla Motors, Inc.

TXN

Texas Instruments Inc.

VIAB

Viacom, Inc.

VIP

VimpelCom Ltd.

VOD

Vodafone Group Public Limited Company

VRSK

Verisk Analytics, Inc.

VRTX

Vertex Pharmaceuticals Incorporated

WBA

Walgreens Boots Alliance, Inc.

WDC

Western Digital Corporation

WFM

Whole Foods Market, Inc.

WYNN

Wynn Resorts Ltd.

XLNX

Xilinx Inc.

YHOO

Yahoo! Inc.

Размещено на Allbest.ru


Подобные документы

  • Генеральная, выборочная совокупность. Методологические основы вероятностно-статистического анализа. Функции MathCad, предназначенные для решения задач математической статистики. Решение задач, в MS Excel, с помощью формул и используя меню "Анализ данных".

    курсовая работа [401,4 K], добавлен 20.01.2014

  • Формулировка проблемы в практической области. Построение моделей и особенности экономико-математической модели транспортной задачи. Задачи линейного программирования. Анализ постановки задач и обоснования метода решения. Реализация алгоритма программы.

    курсовая работа [56,9 K], добавлен 04.05.2011

  • Виды задач линейного программирования и формулировка задачи. Сущность оптимизации как раздела математики и характеристика основных методов решения задач. Понятие симплекс-метода, реальные прикладные задачи. Алгоритм и этапы решения транспортной задачи.

    курсовая работа [268,0 K], добавлен 17.02.2010

  • Классическая теория оптимизации. Функция скаляризации Чебышева. Критерий Парето-оптимальность. Марковские процессы принятия решений. Метод изменения ограничений. Алгоритм нахождения кратчайшего пути. Процесс построения минимального остовного дерева сети.

    контрольная работа [182,8 K], добавлен 18.01.2015

  • Понятие, правила построения и направления применения сетевого планирования. Особенности методов критического пути, статистических испытаний (способ Монте-Карло), оценки и пересмотр планов и графического анализа. Принципы построения диаграммы Ганта.

    курсовая работа [1,1 M], добавлен 24.10.2010

  • Особенности решения задач линейного программирования симплекс-методом. Управляемые параметры, ограничения. Изучение метода потенциалов в процессе решения транспортной задачи. Создание концептуальной модели. Понятие стратификации, детализации, локализации.

    лабораторная работа [869,0 K], добавлен 17.02.2012

  • Составление математической модели задачи. Расчёт оптимального плана перевозок с минимальной стоимостью с использованием метода потенциалов. Оптимальный вариант специального передвижного оборудования для технического обеспечения управления производством.

    контрольная работа [135,3 K], добавлен 01.06.2014

  • Изучение особенностей метода статистического моделирования, известного в литературе под названием метода Монте-Карло, который дает возможность конструировать алгоритмы для ряда важных задач. Решение задачи линейного программирования графическим методом.

    контрольная работа [1,2 M], добавлен 17.12.2014

  • Сущность многопериодической транспортной задачи, построение дерева проблем. Особенности морфологического, функционального и информационного описания логистической системы. Формулировка транспортной задачи, представление ее математической модели.

    курсовая работа [314,2 K], добавлен 12.05.2011

  • Исследование методики построения модели и решения на ЭВМ с ее помощью оптимизационных экономико-математических задач. Характеристика программных средств, позволяющих решать такие задачи на ЭВМ. Определение оптимального варианта производства продукции.

    лабораторная работа [79,3 K], добавлен 07.12.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.