Использование информации из Twitter для выявления инсайдерской торговли

Исследование обнаружения случаев незаконной инсайдерской деятельности в реальном времени при помощи информации из twitter на американском фондовом рынке. Ознакомление с теориями ценообразования и доходности активов. Характеристика частоты торгов.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 01.08.2017
Размер файла 571,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет «Высшая школа экономики»

Факультет экономических наук

Образовательная программа «Экономика»

Курсовая работа
«Использование информации из Twitter для выявления инсайдерской торговли»

Выполнил

Студент группы № БЭК 133

Кругляк Андрей Николаевич

Научный руководитель Столяров Андрей Иванович, доцент, Департамент финансов

2017

Введение

Проблема обнаружение незаконной инсайдерской деятельности уходит своими корнями в далекие 30-е годы прошлого века, когда Комиссия по ценным бумагам США в явном виде запретила инсайдерам при действиях с акциями использовать имеющуюся информацию о компании до её публичной публикации. Таким образом преследовалась цель соблюдения принципа честной конкуренции и защиты фондового рынка от манипуляций. Однако на протяжении многих лет и вплоть до начала 90-х годов не существовало системного принципа для обнаружения подозрительных случаев. Судебные процессы были довольно редкими, долгими и в основном заканчивались оправдательными приговорами. Сложность доказательств состояла не только в юридических аспектах, но в самой индикации на быстрорастущем фондовом рынке Америки. Компаний попросту становилось так много, что отслеживать все манипуляции в ручном режиме просто не представлялось возможным. Ситуация изменилась лишь после массовой компьютеризации и появлению эконометрических исследований в данной области. Довольно быстро многие модели стали применяться государственными структурами для выявления незаконной инсайдерской деятельности на наиболее ранних её этапах.

Несмотря на стремительное увеличение количества исследований в области инсайдерской деятельности и рыночных манипуляция, большинство работ так и остаются чисто теоретическими и имеют крайне узкий круг применимости. Целью же данной работы является создание алгоритма для практического обнаружение случаев незаконной инсайдерской деятельности в реальном времени при помощи информации из Twitter на американском фондовом рынке.

1. Обзор литературы

Перед тем как непосредственно перейти к обзору литературы, необходимо отметить, что в нашем случае речь пойдёт не только о теоретической базе для будущего исследования в области области обнаружения инсайдерской торговли, но и о применимости новейших методов сбора и анализа данных, которые ранее не применялись для данных целей. Именно поэтому в начале будет рассмотрена классическая литература в данной области, проанализированы плюсы и минусы представленных в них моделей. Затем обзор литературы перейдёт к рассмотрению различных вариаций и модернизаций, чтобы понять эволюционную структуру развития научной мысли. На основании полученного исследования будут выделены несколько предпочтительных для наших целей моделей, их недостатки и способы устранения. После чего уже можно будет перейти непосредственно к автоматизировать сбора данных для решения ключевой задачей данного исследования.

1.1 Теории ценообразования и доходности активов

Классическая теория оценки ценообразования финансовых активов берёт своё начало в 1960-х годах, когда William Sharp (1964) в своей работе показал, что рациональный индивид при условиях общедоступной информации будет формировать своё инвестиционный портфель исходя только из двух показателей - ожидаемой стоимость и стандартного отклонение. Данная теория основывается на более ранней модели линии рынка капитала, которая содержит в себе очень простую идею о том, что существует зависимость дохода от риска и её можно изобразить в виде монотонно возрастающей функции. Исходя из данных моделей в случае акций вся доступная информация по сути уже содержится в показателях нормы прибыли и объёма торгов. На основании анализа данных показателей и строятся базовые процедуры выявления незаконной инсайдерской деятельности. Задумка теории является довольно понятной: необходимо с помощью теоретической модели предсказать поведение необходимых показателей, а затем отдельно рассмотреть случаи резкого отклонения.

Прежде чем углубиться в рассмотрение данной модели и перейти к более сложным на её основе необходимо разобраться с предпосылками, которые играют крайне важную роль и накладывают определенные ограничения. Как и во многих других случаях в теоретической экономике, предполагается наличие совершенно конкурентных рынков с полной информацией, где все агенты рациональны, максимизируют своё благосостояние и нейтральный к риску. При таких предпосылках соответственно должны выполняться несколько требований, которые не соответствуют реальности, а именно:

· не существует возможности арбитража

· норма прибыли соответствует уровню безрисковых ценных бумаг

· невозможно создать инвестиционную стратегию, которая давала бы больше выигрыш, чем стратегия “buy&hold”

· автокорреляции избыточных прибылей нет

· невозможно предсказать будущие прибыли основываясь только на имеющейся в данный момент информации.

Однако предпосылки, как известно, вводятся не просто так. Главная цель в данном случае была в устранение сложностей при моделировании на ранних этапах развития теории. В дальнейшем теория подверглась множеству различных модернизаций, каждая из которых старалась избавиться от ограничений с помощью различных методологий. Одним из первых шагов на данном пути стало избавление от предположения о нейтральности агента к риску, что сразу усложнило модель по нескольким причинам. Во-первых, ожидаемая доходность в данном случаем может отличаться от безрисковой. Во-вторых, сложнее учитывать историческую динамику. В-третьих, при отсутствии нейтральности к риску доходности ценных бумаг могу быть автокоррелированы и появляется возможность предсказания будущих доходов на основе текущей информации (Fama, 1991).

Своего рода модификациями CAPM на данной основе стали ответвления в виде CCAPM и ICAPM. Первая из них была представлена Марком Рубенштейном в 1976 году в работе The Value of Uncertain income stream and the pricing of options. В работе, исходя из имеющихся предпосылок, выводится формула для оценки потока доходов в многопериодной модели, которая опирается на желаемый уровень доходности без каких-либо строгих ограничений на природу случайных факторов. Вторая работа An intertemporal asset pricing model with stochastic consumption and investment opportunitie написана Дугласом Бредом в 1979. Принципиальное отличие заключается в работе с непрерывным временем, а так же использовании агрегированного потребления в эмпирических тестах для упрощения расчётов.

Исследование автокорреляции доходностей в итоге привела к целому спектру исследований. Одним из ключевых выводов можно считать заключение о характере корреляции с течении времени. В краткосрочном периоде движение доходностей совпадают с линей тренда, но в долгосрочном они возвращаются к своим средним значениям. Наличие такого рода автокорреляции на недельных временных промежутках было подтверждено, к примеру, в статье Fads (1988). Lehman (1990) показывает, что компании с лучшими результатами на одной неделе, зачастую проседают в следующую. Обратная логика для недельных аутсайдеров тоже верна. Возвращение к среднему является довольно закономерным и на логическом уровне. Рост или падание редко могут быть постоянными, достигая определенной психологической отметки цены обычно начинают движение в противоположную сторону. Таким образом колебания меняют цены в обе стороны, но крайне медленно меняют среднее значение вокруг которого происходят изменения. Для того, чтобы учитывать такие автокорреляционные изменения и возвраты к среднему, необходимо прибегать в моделях к логарифмированию нормы прибыли, что показали Фама и Френч в своей работе Permanent and Temporary Components of Stock Prices.

С помощью рассмотренных выше концепций возможно определенным образом моделировать ожидаемое поведение рынков, а значит и различные отклонения. Выявления таких нетипичных случаев рыночного поведения и подробное их рассмотрение лежит в основе большинства методов обнаружения незаконной инсайдерской торговли.

1.2 Частота торгов

Другим показателем, на который принято смотреть для определения аномальных отклонений при анализе рыночной деятельность, является часто совершения торговых операций. По итогам дня, к примеру, цена акций конкретной компании может измениться незначительно, но объём операция быть крайне нетипичным, что свидетельствует о значительных внутридневных колебаниях и требует более пристального внимания. На показатель частоты торгов влияют множество факторов. Если увеличение частотности операций после публикации отчетности конкретной компании объяснить довольно просто, то некоторые другие причины не являются столь очевидным.

Подробнее стоит рассмотреть то, как влияют на частоту торгов рыночные спекуляции и хеджирование рисков. Конечно, если существуют предпосылки о совершенстве рынков и полной информации, то никаких значительных изменений данные факторы оказать не могу. Ведь спекуляция становится просто невозможной, а риски и так можно идеально распределить исходя заданным параметрам предпочтений. Однако в реальной жизни всё происходит несколько иначе. Рыночные спекуляции обычно возникают в тех случаях, когда есть большая волатильность значений цены. Причин для этого может быть несколько. Во-первых, влияет сам размер компании и её рыночной капитализации. Чем больше фирма, тем сложнее становится спекулировать на её акциях, ведь для этого банально нужно значительное количество финансовых средств. Во-вторых, важно значение играет новостной фон. Новая информация о компании оказывает влияние на отношение к ней рынка. Проблема заключается только в том, что огромный поток информации текущих реалий уже невозможно контролировать в ручном режиме.

В случае же хеджирования рисков увеличение частоты торговли происходит за счет того, что агенты пытаются в каждый конкретный момент времени поддерживать определенный уровень риска. Так как многие изменения оказываются неожиданными, то заложить их изначально просто не предоставляется возможным. При этом при хеджировании рисков, ровно как и в случае спекуляций, очень важными является авторегрессионный эффект. Gallant (1992) в своей работе отмечает, что изменения данного характера практически всегда несут за собой соответствующий отклик. Увеличение спекуляций в конкретный момент времени может ещё долго быть отражено в частоте торговли хотя изначальной причины давно уже нет.

1.3 Асимметричность информации

Одной из главных факторов, по которой вообще становится возможны рыночные манипуляции, является неоднородность распространения информации среди участников рынка. Далеко не всегда причиной является какая-либо незаконная деятельность или утечка информации - в основном различная даже не информации, а скорость её нахождении и анализа, которая не является абсолютно совершенной и однородной у всех рыночных агентов. В двухпериодной модели, учитывающей случайный компоненты (Kim and Verrecchia, 1991), приводится статистическое обоснования связности объёмов торгов и изменению в цене через заданный мультипликатор неоднородности распространения информации. Это в свою очередь ведёт к двум крайне важным выводам: инсайдерский twitter рынок

· Объём торгов и абсолютное значение ценовых изменений имеют позитивную корреляцию

· Степень взаимосвязи показателей определяется доступной для агентов информацией

Однако далеко не всегда объём торгов имеет под собой информационную причину, что так же необходимо учитывать. Важнейшее наблюдение в этой сфере (Campbell et al., 1993, Conrad et al., 1994) заключается в том, что как только величина торгов превышает уровень, объясняемый новой информацией, положительные доходности текущего момента начинают перекрываться отрицательными. Обратное движение так же справедливо. В случае же, когда публичной становится ранее бывшая приватной информация (Llorente, 2001), такое движение доходностей в обратную изначальной сторону вовсе не обязательно.

1.4 Проблематика обнаружение незаконной инсайдерской деятельности

Во многом само определение инсайдерской торговли вызывает у многих людей не до конца правильное понимание. Дело в том, что сама инсайдерская деятельность не является изначально какой-либо незаконной, ведь совершенно нормально, что владельцы доли в компании хотят её продать по каким-то своим причинам. Однако очень сложно доказать, что эти причины действительно носят личный характер и никак не связаны с информацией в их распоряжении. Именно поэтому многие рыночные агенты следуют за действиями инсайдеров, ведь информация о них является публичной согласно закону о торговле ценными бумагами (Security Exchange Act), принятому в 1934 году в США. Аналогичные законодательные акты действуют сейчас и на других торговых площадках за пределами Америки. Благодаря этому директора, члены совета директоров и владельцы больших пакетов акций должны отчитывать о совершении действий с принадлежащими им акциями. Как показал Meulbroek (1992) величина торговых операций резко возрастает в те дни, когда инсайдеры совершают операции на рынке из-за того, что это даёт определённый сигнал остальным участникам. Зачастую это не позволяет добиться какой-либо сверх доходности именно из-за доступности такой информации сразу всем. Этот же эффект возникает даже в тех случаях, когда инсайдеры совершают действительно не совсем законные действия и, к примеру, продают акции до публикации неблагоприятной отчетности компании. Однако разделить эти эффекты на практике, как отмечает Chackravarty (1999), практически невозможно. Всё это многократно усложняет индикацию незаконных случаев, а доказать из практически невозможно.

Для того, чтобы упростить процедуру контроля за инсайдерами Комиссия по ценными бумагам США финансирует научные исследования и построение финансовых моделей, которые помогают рассматривать только самые подозрительные случаи. Это позволяет не распыляться, сокращать потраченные ресурсы и доводить дела до судебных решений с полным пакетом необходимых доказательств. Большинство из таких внутренних моделей не доступны широкому кругу для того, чтобы предотвратить противостояние таким процедурам со стороны недобропорядочных рыночных игроков. Однако некоторые из них всё же доступны и могут быть проанализированы. К примеру, Mitchell и Netter (1994) разрабатывали модель для определения санкций, которая базируется на предыдущих исторических доходностях акций данной компании. В итоге была получена модель, задающая определенный интервал, в котором цена акций может колебаться с учетом законной инсайдерской. Как только доходность выходит из данных границ у контролирующего органа появляются основания для начала расследования данного факта. Это лишь один из параметров и суть, в том числе данной работы, заключается в нахождении других способов, которые позволяет в полуавтоматическом режиме обнаруживать по настоящему незаконную деятельность.

Теоретическую литература можно условно разделить на два блока: первый из них старится объяснить по каким причинам возникли возможности для зафиксированных случаев манипуляции; второй фиксирует случаи, в которых манипуляция потенциально возможно, но ранее не наблюдалась. Большинство из способов манипуляций довольно просто и могут быть смоделированы. Понимание их во многом помогает в определение круга показателей, за которым нужно следить определенным образом для обнаружений манипуляций различного характера.

Рассматривая примеры финского (Felixson, Pelli 1999), американского (Carhart 2002) и французского рынка (Similarly, Hillion, Suominen 2004) можно прийти к выводу об определенной сезонности распределения частоты торгов как в течении дня, так и в течение недель, месяцев и лет. Обычно наибольшие скачки цены происходят в конце зафиксированных периодов. Такого рода манипуляции для достижения наибольшей моментальной доходности вполне законны, однако, когда их совершают инсайдеры, то в их отношении появляются определенные подозрения.

Важно не только понимать конкретные момент манипуляции, но и стараться зафиксировать весь период. Зачастую одномоментные операции со значительным количеством акций всегда вызывают подозрения, поэтому для не добропорядочных участников рынка выгодно скрывать свои мотивы и стараться получать выгоду на более растянутом временно промежутке. На примере выборке с 1990 по 2001 Aggarwal и Wu (2006) установили, что минимальный период дневных манипуляций ограничения двумя сутками, а максимальный доходит почти до четырёх лет. Схема в данных случаях является довольно просто и распространённой: трейдер пытается стать драйвером цены и получить из этого в дальнейшем выгоду. Обычно стратегия Pump And Dump предполагает использование недостоверной информации, которую можно в правильном ключе преподать рынку, а затем и заработать на этом. В случае же инсайдерской торговли зачастую стимулом может являться само действие накануне какого-либо крупного события или анонса. Логично предположить, что если приближенное к компании лицо вдруг начинает продавать акции, то новости будут не очень положительными. Стоить отметить, что этим так же можно воспользоваться в свою пользу и при падении стоимости акций выкупить их обратно по более низкой цене. Именно по этим причинам нужно смотреть не только на очевидные решения инсайдеров, но и на более комплексные, в разрезе разных временных периодов.

Проблемы при обнаружении инсайдерской кроются ещё и в том, что объём анализируемой информации крайне велик и до определенного периода было просто невозможно предложить модели, которые позволяли бы находить отклонения в необходимом виде. Именно поэтому вплоть до 90-х годов практически не существовало крупных статистических исследований данной проблемы. Ранние работы (Mitchell, Netter 1994) используют в своей основе событийный анализ, который по сути предполагает рассмотрение конкретных случаев на основе новостного фона и дальнейшего изменений цены акций. Однако, данный процесс имеет существенный минус - невозможно предсказать будущее поведение, а только лишь оценить прошедшие события. Соответственно нельзя на основе данного подхода выстраивать собственную стратегию рыночной торговли. Для построения же более сложных моделей авторы в дальнейшем используют и множество других показателей, а не только уровни доходности. Minenna (2003) для обнаружения инсайдерской торговли в реальном времени так же учитывает объемы торгов и характер рыночной структуры. Идея довольно проста и заключается в экстраполировании цен закрытия на будущие периоды для обнаружения отклонений и их подробного рассмотрения.

В дальнейших работах (Dubow, Monteiro, 2006) простые авторегрессионные модели были заменены на более сложные с использованием структуры CAPM и её расширений для учитывания различных рыночных эффектов. Эволюция рынка вообще является отдельной проблемой для анализа, без решения которой прогнозная сила модели будет со временем уменьшаться. Учитывать данный эффект вместе с автокорреляцией и гетероскедостичностью можно с помощью различных дополнительных усложнений и параметризации движений несколько сонаправленных показателей. В итоге получается предсказывать многие ценовые изменений, но далеко не в все. Дело в том, что даже хорошо построенная модель является статичной пусть и в широких рамках.

Как видно из обзора литературы, тема обнаружение различных рыночных манипуляций является довольно популярной и активно развивается в последнее время благодаря появлению доступа к широкому спектру информации у исследователей по всему миру. Данные не только становятся более доступными и актуальными - их ещё значительно проще анализировать за счет применения современных технологий. Однако большинство работ в данной области по своей структуре практически не изменились с 90-х годов. Авторы действуют по следующей структуре:

1. Выбирают гипотезу для доказательства

2. Определяют рынок, на котором будет проводиться анализ

3. Сужают выборку по необходимым параметрам

4. На основании предыдущих работ усовершенствуют модель или создают новую

5. Делают выводы

На каждом из этапов, кроме первого и последнего, есть явные проблемы, которые делают практическое применение моделей крайне проблемными. Давайте подробнее рассмотрим каждый из этапов и постараемся выделить направления для улучшения.

В основном авторы работ рассматривают либо американский рынок, как самый развитый с наилучшим регулированием и наличием большого объема данных, либо локальный рынок автора статьи. Такой выбор кажется вполне логичным, но на самом деле довольно сильно ограничивает применимость моделей. Из-за юридических различий в разных странах переложить модель с одного рынка на другой крайне проблематично. То, что в одном месте незаконно - в другом может быть вполне нормально. Практически нет работ, в которых разрабатывается модель сразу дня нескольких рынков, с возможностью изменить отдельные части для адаптации отдельных параметров.

Сужают выборку по необходимым параметрам

Очень часто создаётся ощущение, что авторы специально подгоняют выборку таким образом, чтобы подтвердить свои гипотезы. К примеру, Cholewiski (2009) смотрит только на те компании, а отношении которых ранее уже были расследования из-за инсайдерской деятельности, что изначально даёт искажение. В других случаях зачастую берутся крайне маленькие выборки, чтобы экстраполировать результаты на весь рынок. Для каждой из гипотез просто находятся правильные компании, а обнаружение инсайда в реальном времени для обучение алгоритмов требует совершенного иного - всеобъемлющей выборки компаний с разными характеристиками.

На основании предыдущих работ усовершенствуют модель

В развитии уже имеющихся моделей нет ничего плохо - это вполне обоснованный и логичный шаг, но в связи с быстро изменяющимися рынками и увеличению скорости получения информации не всегда самый эффективны. Дело в том, что статические модели 30 лет назад использовались лишь для того, чтобы упростить расчёты с учётом ограниченных вычислительных мощностей. Прошло достаточно много времени, а изменения в статьях довольно незначительны: местами лучше учитывают автокорреляция и гетероскедостичность, местами добавляют различные скользящие показатели, местами анализируя большее количество случайных колебаний. Однако в целом это всё те же модели, которые довольно ограничены банальными рамками математических уравнений, которыми они описаны. Рынке же эволюционируют крайне динамично и инсайдерская торговля сейчас и 10 лет назад - это две абсолютно разные вещи, а значит и обнаруживать их нужно методами с быстрой адаптацией к данным.

2. Работа с данными

В основании модели, которая будет разработана и рассмотрена в данной работе, лежит очень простая идея - можно автоматизировать процесс событийного анализа и рассмотреть процесс обнаружение незаконной инсайдерской деятельности на большой выборке в динамике. Для этого нужно решить несколько задач:

- Определить какие использовать данные

- Понять с помощью каких методов прогнозировать значение рыночных показателей

- Сделать выборку и наладить процесс обучения алгоритмов

- Объединить части в единую взаимосвязанную систему

2.1 Автоматизация событийного анализа

Давайте поэтапно разберемся с каждой из поставленных задача, но для начала необходимо определиться с тем, что вообще представляет из себя событийный анализ и каким образом можно его автоматизировать. В классической интерпретации суть событийного анализа заключается в отслеживании реакции фондового рынка на происходящие в мире события, а в современных реалиях по сути на реакции СМИ и социальных сетях, который полностью отражают многогранную картину мира.

Проблема заключается лишь в том, что поток информации постоянно только увеличивается. Если в работе рассматривается какое-то конкретное событие, то собрать по нему значительный объём новостей ещё представляется реальным, но как только речь заходит об анализе длинных временных промежутков, анализировать каждый отдельный день даже для одной компании становится просто невозможно. Именно поэтому в большинстве работ подробно рассматривается только несколько отдельных случаев. Такой подход возможно и позволяет дойти до сути конкретного случая, но делать обобщающие выводы и экстраполировать результаты на весь рынок нужно с крайней опаской. Вопрос лишь в том, как решить проблему в общем виде?

Практически всем исследователям давно уже стали привычными программные статистические пакеты, который невероятно ускоряют процесс расчетов, а значит и проверки гипотез. Сбор данных тоже уже давно автоматизирован не только благодаря готовым базам данных, но и за счет возможности конвертации их из одного формата в другой. При этом найти статистические работы по инсайдерской торговли, где современные ресурсы используют для автоматизации событийного анализа, практически невозможно. Сложности возникают из-за того, что данные о событиях из разных мест крайне сложно адаптировать под единый формат. Анализ же смысла написанного в каждой отдельности новости на текущей стадии развития технологий кажется крайне проблематичным. Простым вариантом решения является анализ ключевых слов, которые могут быть определенны в определенные группы в зависимости от типа события. Такой семантический анализ довольно распространён в современной лингвистики для оценки содержания книг различных авторов. Однако данный подход требует довольно глубокого понимания всех аспектов конкретных сочетаний и смыслов. При анализе действительно больших объёмов однородных данных можно применить немного другую тактику.

Когда речь идёт о довольно крупных временных рядах, можно смотреть не на конкретное событие, а на среднюю частотность употребления того или иного термина. В нашем случае же главным показателем является количество употреблений имени тикера конкретной акции изо дня в день. Любое происходящие в современных реалиях событие получает отражение в социальных сетях, а значит эту информацию всего лишь нужно собрать в пригодном для анализа виде. Так как многогранность социальных сетей крайне велика, а информация в них подаётся в разном виде, необходимо сосредоточить своё внимание на какой-то конкретной. Для начала установим требования, которым должна удовлетворять социальная сеть, чтобы её можно было использовать для поставленных целей:

· Содержать достаточный объем однородных данных для анализа

· Отражать события фондового рынка

· Иметь простой инструмент для выгрузки дынных в нужном формате

Всем этим требованиям отвечает только Twitter, который уже давно являет одним из ключевых источников получения оперативной информации фондового рынка у трейдеров, а так же доступен на бесплатной основе и имеет строгие ограничений по формату сообщений. Для выгрузки данных открыто публичное API, подробнее о котором будет рассказано далее при описании источников данных и способов работы с ними.

Для того, чтобы решить какие источники использовать нужно первым делом установить какую информации вообще необходимо получать. Изначальная идея предполагает, что можно автоматизировать событийный анализ для выявления случаев незаконной инсайдерской деятельности, а значит нужно как минимум иметь следующую информацию:

· Данные фондового рынка

· Информация о всех инсайдерских сделках

· Частотность употребление тикеров компании в Twitter

После поисков для каждой из частей необходимой информации был найден свой подходящий источник. Рассмотрим в отдельности каждый из источников и способ работы с ними.

Данные фондового рынка

Самой просто из решаемых задач было найти источник для получение исторической информации о показателях фондового рынка, вроде цен закрытия и объемах торгов акций на конкретный из дней. Важно было не только получать историческую информацию, но и иметь возможность следить за показателями онлайн. Всё необходимую информацию удалось получить с помощью открытого и полностью бесплатного API Yahoo Finance. Для выгрузки данных используется соответствующий пакет, написанный на языке Python. Устанавливается он простой командой:

pip install yahoo-finance

После установки пакета уже можно обращаться непосредственно к необходимым историческим данным:

from yahoo_finance import Share #импортируем нужный пакет

yahoo = Share('YHOO') #задаем тикер акции

yahoo.get_historical ('2014-04-25', '2014-04-28') #получаем данные за указанный период

В ответ приходит массив данных в формате JSON в виде:

[{u'Adj_Close': u'33.99',

u'Close': u'33.99',

u'Date': u'2014-04-28',

u'High': u'35.00',

u'Low': u'33.65',

u'Open': u'34.67',

u'Symbol': u'YHOO',

u'Volume': u'30422000'},

{u'Adj_Close': u'34.48',

u'Close': u'34.48',

u'Date': u'2014-04-25',

u'High': u'35.10',

u'Low': u'34.29',

u'Open': u'35.03',

u'Symbol': u'YHOO',

u'Volume': u'19391100'}]

Важно отметить, что данные приходят только по дням, когда велись торговые операции. Как видно из выдачи выше, в субботу и воскресенье данных просто нет. Это довольно удобно, особенно когда речь идёт об одном рынке и нет необходимости сверять велась ли торговля или она была нарушена из-за каких-то локальных праздников.

Для дальнейшего удобства работы с полученными данными, было решено использовать широко распространенный пакет Pandas, который устанавливается соответствующей командой:

pip install pandas

После чего с данными можно работать, как с обычными таблицами, обращаясь к нужной ячейки, строке или столбцы. Если рассматривать наш пример, получим:

import pandas as pd #подключаем пакет

yh = pd.DataFrame(yahoo.get_historical ('2014-04-25', '2014-04-28'))

При обращении к заданной переменной yh получим соответствующую таблицу:

Работать с такими данными крайне удобно, однако, нужно решить ещё одну большую задачу. Хочется иметь возможность не только получать данные по конкретным акциям фирм, но иметь общее представление о том, какие они вообще существуют. К сожалению, получить полный список тикеров c Yahoo невозможно. Поэтому приходится использовать ещё одну базу данных Quandl, в которой уже представлены все необходимые тикеры. Для работы с ней необходимо сначала установить соответствующий пакет:

pip install quandl

Для использования пакета далее необходимо авторизоваться с использованием API ключа, после чего можно выкачать необходимые данные по американскому рынку:

import quandl

quandl.ApiConfig.api_key = "yrBdtPcWtF2rv1dNHfKZ"

allTicker = quandl.bulkdownload('WIKI')

Для удобства дальнейшей работы данные сохраним в отдельный csv файл:

allTicker.to_csv(`USMarket.csv')

Данные о инсайдерской торговле

Согласно принятому в 1934 года Закону о торговле ценными бумагами в США, существует так называемая 4 форма отчетности о любых действиях инсайдеров с акциями.

Инсайдерами считаются все топ-менеджеры, члены совета директоров и владельца пакетов акций более 10% компании. Сейчас все данные об инсайдерских сделках публикуются на официальном сайте Комиссии по ценным бумагам США insidertrading.org

Данные представлены в виде таблицы, где указан тикер компании, имя владельца акций, тип сделки и её объём:

К сожалению, удобного инструмента для работы с данными и их выгрузки в нужном формате не существует. На официальный запрос по предоставлению csv-файла за необходимый временной промежуток ответа так же не последовала. Именно поэтому пришлось написать собственный инструмент.

На первом этапе было решено сохранить все HTML страницы с данными за определенный период. Для этого использовалась стандартный пакет request, который является предустановленный во всех последних версиях Python. Алгоритм работы просто пробегается по всем доступным индексам страниц и сохраняет их в локальную копию на жесткий диск:

import requests

page = 1

while page < 6000:

url = 'http://insidertrading.org/index.php?sort_by=acceptance_datetime&asc=&symbol=&date_from=2009-01-01&date_to=2017-01-01&submit=+GO+&page=' + str(page)

r = requests.get(url)

with open('./page_%d.html' % (page), 'w') as output_file:

output_file.write(r.text)

page += 1

После завершения достаточно долгого процесса сохранения данных, следующим этапом необходимо привести их к нужному формату, чтобы работать с ними, как с датафреймом в Pandas. Для этих целей был написан парсер с использованием пакета BeautifulSoup, который устанавливается командой:

pip install beautifulsoup4

После чего был рассмотрен html-код страницы и установлен принцип, по которому формируется таблица. Следующий этап предполагает парсинг всех страниц в один общий csv-файл:

from bs4 import BeautifulSoup

import pandas as pd

results = []

page = 1

while page < 6000:

with open(`./page_%d.html' % (page), `r') as input_file:

text = input_file.read()

soup = BeautifulSoup(text, “lxml”)

table = soup.find(`table', {`id': `tracker'})

items = table.find_all(`tr', {`class': [`odd', `even']})

for item in items:

lines = item.find_all(`td')

helpid= 1

for line in lines:

if helpid== 1:

transaction_type = line.text

if helpid== 2:

transaction_date = line.text

if helpid== 3:

transaction_accept = line.text

if helpid== 4:

issuer_name = line.text

if helpid== 5:

ticker = line.text

if helpid== 6:

owner_name = line.text

if helpid== 7:

relations = line.text

if helpid== 8:

transaction_share = line.text

if helpid== 9:

price_per_share = line.text

if helpid== 10:

total_value = line.text

if helpid== 11:

shares_owned = line.text

if helpid> 0:

helpid+= 1

if helpid== 12:

results.append({

`transaction_type': transaction_type,

`transaction_date': transaction_date,

`transaction_accept': transaction_accept,

`issuer_name': issuer_name,

`ticker': ticker,

`owner_name': owner_name,

`relations': relations,

`transaction_share': transaction_share,

`price_per_share': price_per_share,

`total_value': total_value,

`shares_owned': shares_owned

})

page += 1

user_data_df = pd.DataFrame(results)

user_data_df.to_csv(`InsideData.csv')

С полученным в итоге файлом можно удобно работать для нахождение подозрительных случаев инсайдерской торговли.

Данные из Twitter

Последним этапом работы с данными является выгрузка необходимых сообщений из Twitter. Для этого существует открытое API, получить доступ к которому можно после регистрации, как разработчика в системе. Но прежде чем перейти к подробному рассмотрению работы с данными из данной социально сети необходимо объяснить почему же именно Twitter так хорошо подходит для решения исследовательских задача работы.

Twitter - социальная сеть для публичного обмена микро-сообщениями (длинной до 140 символов), которая начала работу в 2006 году. Благодаря резкому и динамичному росту довольно быстро обрела популярность, а позже стала местом, где публикуются самые актуальные новости из всех уголков мире. Оперативность информации и удобство настройки собственного потока сообщений и их источников привело в социальную сеть трейдеров, которым так важно быстро реагировать на происходящие события.

Для того, чтобы расширить собственный функционал за счет сторонних разработок Twitter представил публичное API, с помощью которого можно получать различную информацию в удобном для работы json-формате. Всего существует несколько вариация работы с данными в Twitter, каждый из которых имеет свои преимущества и недостатки. Для того, чтобы сделать правильный выбор, рассмотрим каждый из них:

REST APIs - ряд API, объединенных в один пакет, которые позволяют получить доступ к поиску, историческим данным и сообщениям пользователя. Данный инструмент крайне удобен в случаях, когда нужно проверить наличие упоминаний компании в конкретный день, но имеет ограничение, которое перекрывает достоинство. Дело в том, что для обычных пользователей количество запросов ограничено 150 в 15 минут. С учетом огромного количества твитов публикуем каждую секунду не представляется возможным выгрузить сколь либо значимую их часть для полноценного анализа.

Streaming APIs - ряд API, объединенных в один пакет, которые позволяют получить доступ к публикуемым в данный момент твитам, удовлетворяющим необходимым условиям. Данный инструмент не имеет ограничений по количеству получаемых запросов в секунду и даёт доступ к 1% от всего объёма текущих данных Twitter. Данное количество является довольно значимым, если учесть, что в секунду публикуется более 8 тысяч сообщений. К сожалению, получить доступ к историческим данным таким образом невозможно, а значит необходимо установить требования и получить данные за определенный временной промежуток для отладки всего механизма работы алгоритма.

Для начала работы необходимо установить пакет для работы с данными Twitter с помощью Python:

pip install twitter

После этого можно авторизоваться с помощью API ключа и обращаться к необходимым данным:

try:

import json

except ImportError:

import simplejson as json

import pandas as pd

from twitter import Twitter, OAuth, TwitterHTTPError, TwitterStream

ACCESS_TOKEN = '3313900227-QRu85ADWm8Cce4p4fMXVpVZ75eZcUJXFPlh0qMx'

ACCESS_SECRET = 'zYQ8R6oBIYAw4DBMFKdGCwaimloKXYrSeYAQhwxQHVCDu'

CONSUMER_KEY = 'do0jGRRGx7sg3tNydmRA7uCUq'

CONSUMER_SECRET = '6VlpLEOl1gGXHc8jewqQUGNLsicW2yWNPFlnfVtUiIFNbbQEMM'

oauth = OAuth(ACCESS_TOKEN, ACCESS_SECRET, CONSUMER_KEY, CONSUMER_SECRET)

twitter_stream = TwitterStream(auth=oauth)

tracking = " $YHOO"

iterator = twitter_stream.statuses.filter(track=tracking)

В данном примере обращение к iterator будет выводить публикуемые в данный момент твиты, в которых есть тикер $YHOO. Длина запроса для отслеживания разных ключевых слов ограничено на отметке в 2500 символом. Так как это значительно меньше, чем общая длина всех рыночных тикеров, нужно понять, каким образом сформировать выборку. Однако сначала нужно научиться из стандартного формата json-выдачи Твиттера получать только необходимую информацию. По сути для построение частотного распределения достаточно знать только о содержании сообщения и дате его публикации. Для этого пройдёмся по каждому из сообщений и выделим нужное:

for tweet in iterator:

if 'text' in json.dumps(tweet):

text = json.dumps(tweet['text'])

date = json.dumps(tweet['created_at'])

Как видно из кода, так же осуществляется проверка наличия параметра `text' в полученных данных. Делается это для того, чтобы правильно отрабатывать исключения и иметь возможность бесперебойной работы.

Теперь вернёмся к отбору тикеров, за которыми будет вестись наблюдение. Так как суть работы заключается в обнаружении инсайдерской деятельности, то максимально увеличить шанс её обнаружения можно у тех компаний, которые совершают наибольшее количество, попадающих под регуляцию сделок. Для этого отсортируем по количеству употреблений тикеров в данных об инсайде за весь рассматриваемый период:

df = pd.read_csv('InsideData.csv')

groups = df.groupby('ticker')

gropy = sorted(groups.groups.keys())

В итоге получается список всех тикеров, отсортированных по частоте употреблений, по которым хотя бы раз была совершена инсайдерская сделка. Важно гарантировать, что каждая из данных компаний так же присутствует в общей выборке доступных данных рыночных показателей. Для этого выбросим из списка все компании, которые отсутствуют во втором полученном ранее файле:

md = pd.read_csv('USMarket.csv')

tickers = md.groupby('ticker')

for ticker in tickers:

count = 0

for grop in gropy:

if grop == ticker:

count += 1

if count > 0:

tracking = tracking +"$"+str(ticker)+", "

На выходе мы получим переменную tracking, которая представляет из себя строку со всеми подготовленными тикерами, которые удовлетворяют указанным выше условиям. Всего включено около 2500 компаний, а выглядит строка следующим образом:

$STAR, $MOVE, $CSII, $NNA, $MSI, $CCBG, $PLD, $MDAS, $ANV, $ARII, $LB, $MIL, $MFLX, $OREX, $TRGT, $OPY …

Исходя из ограничений в 2500 символов запроса, одновременно получать данный об употреблении в сообщениях Твиттер возможно только о 400 компаний, что является достаточно большой выборкой, на которой можно делать обобщающие выводы.

Для того, чтобы собрать данные для дальнейшего анализа, на продолжении месяцы бесперебойно работал следующий скрипт:

tracking = "$STAR, $MOVE, $CSII, $NNA, ...*"

iterator = twitter_stream.statuses.filter(track=tracking)

for tweet in iterator:

with open('tweetlivedata.csv', 'a') as csvfile:

fieldnames = ['text', 'date']

writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

if 'text' in json.dumps(tweet):

if 'Trade with the best indicators' not in json.dumps(tweet['text']):

text = json.dumps(tweet['text'])

date = json.dumps(tweet['created_at'])

writer.writerow({'text': text, 'date': date})

Все основные данные на этом собраны, а теперь теперь их необходимо в правильном виде объединить в модель для достижения желаемых результатов.

3. Построение модели

Перед тем, как перейти непосредственно к описанию процесса построение алгоритма по обнаружению незаконной инсайдерской деятельности, необходимо объяснить логику самой идеи.

Изначально любая сделка, которая проводится инсайдером, является абсолютно законной. Свой легальный правовой статус она теряет лишь в том случае, когда за такими действиями публике становятся известны ранее скрытые факты о положении дел компании. К примеру, продажа акций членом совета директоров накануне публикации негативной отчетности компании может вызвать серьезные вопрос у регулирующего органа. Именно поэтому для установление характера инсайдерской деятельности в обязательном порядке нужно как минимум два события - сама продажа или покупка акций и наличие или отсутствие затем новостных событий по данной компании. Если движение цен в дни соответствующих событий совпадают, а между ними прошло не так много времени - сделку можно помечать потенциально незаконной. Так как обычно инсайдеры стараются скрыть большую осведомленность и заинтересованность, то совершают сделки заранее. Так как объём имеющихся в распоряжении данных о частотности употребления тикеров компаний ограничен, будет рассматривать три типичных периода между указанными выше событиями: день, неделя, месяц. Естественно каждый из больших периодов включает в себя меньшие. Нужно это для того, чтобы понимать вероятность того, насколько сделка незаконна. Чем меньше времени прошло от сделки до публикации новости, тем больше вероятность недобросовестности инсайдера.

В случае, когда речь идёт о рассмотрении единичных случаев, довольно просто понять произошло событие или нет - достаточно лишь найти и правильно интерпретировать новости. Как уже было отмечено ранее, на больших выборках такой принцип не работает. Просматривать ежедневные новости и интерпретировать их влияние на колебания стоимости акций даже для десятка компаний крайне сложно, а когда речь идёт о сотнях и тысячах, то задача превращается в невыполнимую. Без комплексного же подхода созданная модель принципиально ничем не будет отличаться от уже существующих. Благодаря Твиттеру и большому потоку входных данных появляется возможность наблюдать не за новостями, а за частотностью употребления необходимых ключевых слов и делать исходя из этого выводы о том были ли какие-то события связанные с компанией или же новостной фон находится в пределах формы. Соответственно важно понимать те самые границы нормы частотности употреблений. Причем нельзя забывать, что такие события, как действия инсайдеров, так же влияют на новостной фон. Так как в нашем случае речь идёт именно об инсайдерской деятельности, то для таких случаев должны быть зафиксированы отдельные уровни нормы частотности употреблений тикеров выбранных компаний в Твиттер.

Для решения данной задачи необходимо сопоставить характер движения двух показателей, которые были получены ранее: частоты ежедневного употребление тикеров выбранный компаний в Твиттере и данных об инсайдерской сделках. Для каждой компании таким образом мы получим доверительный интервалы, внутри которых будем считать, что количество употреблений не превышает норму и можно считать, что важных новостей опубликовано не было. Построение такой возможно с помощью регрессионного анализа, но, к сожалению, без серьезных модификаций добиться по настоящему качественных результатов невозможно. Именно поэтому было решено использовать внутренний инструмент компании Яндекс, который используется компанией для прогнозирования результатов выдачи на основании входных данных.

Метод машинного обучения, представленный Яндексом в 2009 году, получил название Матрикснет. Изначальная цель разработки заключалась в создании устойчивого к переобучению алгоритма для того, чтобы учитывать огромное число факторов при ранжировании поисковой выдачи. Важная особенность заключается в том, что при данном риск нахождение несуществующих закономерностей машиной крайне низок. При этом количество факторов в модели максимально возможное при наименьшей обучающей выборке.

Основным алгоритмом, лежащего в основе Матрикснета, является так называемый ансамбль решающих деревьев, который в свою очередь базируется на методах Бэггинга Бреймана, и случайных подпространств. Данное сочетание позволяет строить комитеты деревьев независимо друг от друга, что позволяет эффективно решать задачи как классификации, так и построения сложных регрессионных моделей. Именно такое сочетание позволяет схожим алгоритмам выигрывать все мировые чемпионаты по машинному обучения. Помимо ранжирование поисковой выдачи, Матрикснет с 2011 года используется для оптимизации обработки событий, фиксируемых в ходе эксперементов на Большом адронном коллайдере, что позволило в несколько тысяч раз сократить информацию, которую нужно просматривать непосредственно глазами ученых. Единственным минусом разработанной системы Матрикснета является ресурсоёмкость, что не позволяет использовать его вне кластеров суперкомпьютеров Яндекса. Доступ к соответствующим ресурсам можно получить только из внутренней сети компании, если вы являетесь её сотрудником. Так как данный доступ имеется в распоряжении, а основная цель работы заключается в индикации случаев незаконной инсайдерской деятельности, то для увеличения точности прогнозирования дальнейшие регрессионные модели будут строиться с применение методов машинного обучения Матрикснета.

Список литературы

1. Alexander C., (2001), Market models, John Wiley and Sons, Chichester. ?

2. Chou R., Engle R. F., Kane A., (1992), Measuring risk aversion from excess ?returns on a stock index, Journal of Econometrics 52.

3. Cholewiski R, Real-time market abuse detection with a stochastic parameter model, Central European Journal of Economic Modelling and Econometrics 1, 261 (2009) ?

4. Dubow B., Monteiro N., (2006), Measuring market cleanliness, Financial Securi- ?ties Authority Occasional Papers 23. ?

5. Efron B., (1987), The jackknife, the bootstrap, and other resampling plans, CBMS-NSF Regional Conference Series in Applied Mathematics 38. ?

6. Emerson R., Hall S. G., Zalewska-Mitura A., (1997), Evolving market efficiency with an application to some Bulgarian shares, Economics of Planning 30, 75-90. ?

7. Engle R. F., (2000), The econometrics of ultra-high-frequency data, Economet- rica 68, 1-22. ?

8. Engle R. F., Kroner K. F., (1995), Multivariate Simultaneous Generalized ARCH, Econometric Theory 11, 122-150. ?

9. Fama, E. and French, K. (1988) Permanent and Temporary Components of Stock Prices. Journal of Political Economy, 96, pp.246-273.

10. Hamilton J. D., (1986), A standard error for the estimated state vector of a state-space model, Journal of Econometrics 33, 387-397. ?

11. Hamilton J. D., (1994), Time Series Analysis, Princeton University Press.

12. He, H. and Wang, J. (1995) Di§erential Infor- mation and Dynamic Behavior of Stock Trad- ing Volume. Review of Financial Studies, 8, pp.919-972.

13. Kandel, S. and Pearson, N. (1995) Di§eren- tial Interpretation of Public Signals and Trade in Speculative Markets. Journal of Political Economy, 103, pp.831-872.

14. Lehman, B. (1990) Fads, Martingales, and Market Eў ciency. Quarterly Journal of Eco- nomics, 105, pp.1-28.

15. Meulbroek L., (1992), An empirical analysis of illegal insider trading, Journal of ?Finance 47, 1661-1700.

16. Minenna M. (2001) Insider trading, abnor- mal return and preferential information: su- pervising through a probabilistic approach, quaderni di Цnanza n. 45, CONSOB e Journal of Banking and Finance, 27 (2003), pp.59-86. ?

17. Minenna M., (2003), The detection of market abuse on financial markets: A ?quantitative approach, Quaderni Di Finanza 54. ?

18. Mitchell M. L., Netter J. M., (1994), The role of financial economics in securi- ties fraud cases: Applications at the securities and exchange commission, The Business Lawyer 40, 545--590. ?

19. Monteiro N., Zaman Q., Leitterstorf S., (2007), Updated measurement of market cleanliness, Financial Securities Authority Occasional Papers 25. ?

20. Rockinger M., Urga G., (2000), The evolution of stock markets in transition economies, Journal of Comparitive Economics 28, 456--472. ?

21. Sharpe, W. F. «Capital Asset Prices: A Theory of Market Equilibrium under Condition of Risk», J. Finance, 1964, p.425-430

22. Watson M. W., (1989), Recursive solution methods for dynamic linear rational expectations models, Journal of Econometrics 41, 65-89. ?

23. Worthington A. C., Higgs H., (2003), Weak-form market efficiency in European emerging and developed stock markets, School of Economics and Finance Discus- sion Papers and Working Papers Series 159, School of Economics and Finance, Queensland University of Technology. ?

24. Zalewska-Mitura A., Hall S. G. (1999), Examining the first stages of market performance: a test for evolving market efficiency, Economic Letters 64, 1-12

Приложение

Полный список тикеров компаний, по которым делалась выборка данных из Твиттера:

$MSI, $CCBG, $PLD, $MDAS, $ANV, $ARII, $LB, $MIL, $MFLX, $OREX, $TRGT, $OPY, $STSI, $GAS, $AEIS, $NNI, $CREE, $SCHN, $SLXP, $AMSC, $SSYS, $CTWS, $ODFL, $IG, $DTV, $ACM, $CYTK, $LL, $AMTD, $NKE, $KFX, $NL, $CLUB, $BRLI, $PLAB, $LPSN, $CCI, $DWSN, $ATRI, $EAC, $TWER, $FVE, $OII, $WEX, $DO, $IDIX, $OLP, $CTT, $SUN, $CYN, $NIHD, $FCN, $WBS, $SYX, $ODC, $SNHY, $PRO, $WIN, $RELL, $NSM, $WGL, $ZIGO, $SYMC, $ANR, $CCL, $CATM, $GORO, $ENTR, $CLI, $RSH, $CIA, $CACC, $PKOH, $CSS, $LRN, $WIBC, $RHI, $ENTG, $AIQ, $MSTR, $AEPI, $MDW, $WFD, $PNX, $CIX, $KEG, $ATLO, $FOSL, $CFNB, $SNX, $TITN, $TECD, $HOT, $VTR, $LSTR, $IPAR, $REV, $UNS, $BBBY, $CECE, $RVBD, $AOS, $PRAA, $TUP, $TIBX, $TAL, $RBCN, $MORN, $MWIV, $JNY, $PLL, $DLR, $ISRL, $WDR, $PKG, $ABFS, $VPRT, $UTIW, $PRKR, $BFIN, $PXD, $BBG, $GES, $NATH, $NASB, $PLCM, $OPLK, $BRKR, $EGOV, $ELNK, $BLK, $PTRY, $DRL, $FULT, $SXT, $CENX, $DELL, $COCO, $SEAC, $CNSL, $KNL, $OVTI, $MGEE, $BTX, $HLF, $SWS, $UTX, $DNDN, $KRA, $SIGA, $MHGC, $IRC, $FRBK, $DX, $SIGM, $SFY, $AZO, $HNR, $EE, $BODY, $DDS, $NX, $CNBC, $VECO, $SKX, $ARAY, $NATI, $OPEN, $MSO, $GERN, $OTTR, $LINC, $KVHI, $FMC, $TKR, $VOCS, $BTU, $LNCE, $AVEO, $CBRL, $ISRG, $CNK, $RKT, $PTIE, $HT, $ATHN, $ACO, $SRE, $EZPW, $GST, $OGE, $RAX, $SIF, $STL, $VSEC, $MCGC, $CLNE, $HRL, $QSII, $ALTR, $VNO, $DRQ, $SUI, $IGTE, $CUZ, $GHL, $WLL, $PMFG, $FTI, $HTS, $HE, $SPLS, $AVT, $TCB, $SUSQ, $CQB, $USTR, $MXL, $BBGI, $SCSS, $WBMD, $DDR, $ANN, $DLLR, $IVC, $UNTD, $BKE, $NLY, $ISIL, $STSA, $VOLC, $KEY, $LQDT, $RGS, $IMMR, $TWGP, $SPW, $COHR, $FF, $MYRG, $TTEC, $VRSN, $IBCA, $GSAT, $VVC, $ARR, $EXLS, $AXL, $AIRM, $MPW, $CHRW, $OABC, $SUPX, $FINL, $FCF, $LO, $CLF, $AZZ, $SCL, $CNQR, $PETM, $TPX, $BKMU, $MLR, $CPRT, $FSLR, $SHLO, $FHCO, $GRC, $MAN, $CVGI, $NEM, $ADTN, $SD, $MCRS, $EDMC, $MDCA, $LNN, $BSX, $CBL, $IRBT, $PGNX, $CORE, $OFC, $MCRL, $FRP, $NUS, $WDFC, $PPHM, $OMC, $DTSI, $PRFT, $IPI, $CHK, $ALGN, $LXK, $HSII, $ENZ, $BAC, $XOM, $NTCT, $JEC, $HCBK, $CAM, $BRC, $BUSE, $MO, $JWN, $KSU, $ZGNX, $ELRC, $G, $EXPD, $AVP, $TXI, $SMCI, $FCNCA, $GSIT, $TXRH, $DWA, $FSS, $MCF, $EMR, $CBK, $LTM, $CTRN, $RTI, $ABT, $UNF, $FCH, $GTXI, $VVUS, $WLT, $RATE, $VMI, $HELE, $UNIS, $CL, $DHR, $JAH, $CF, $CWST, $AMG, $FOE, $DNR, $STI, $PSMT, $JCOM, $AXE, $FDO, $ENS, $CVI, $MANH, $CTXS, $CROX, $VFC, $PCP, $PM, $NAV, $RYN, $COHU, $MKC, $TIVO, $ACI, $VMW, $HHC, $MCHX, $IBM, $APOL, $IDCC, $SAPE, $SBGI, $CPE, $MAT, $PSA, $BMS, $ITMN, $GBDC, $EXC, $LM, $HUM, $APA, $WAG, $PNC, $NVR, $SLH, $PCH, $MMS, $HTCO, $SPG, $POR, $GRIF, $URS, $SWY, $LOGM, $PBY


Подобные документы

  • Історія виникнення соціальної мережі коротких повідомлень "Twitter". Використання її в Україні. Користувальницький інтерфейс програми та його основні можливості. Створення особливого сленгу та приклади його застосування. Використання різних девайсів.

    реферат [11,8 K], добавлен 18.10.2014

  • Розгляд підходу до інтерактивного вивчення англійської мови професійного спрямування студентами-економістами з використанням соціальних мереж. Характеристика різноманітних видів діяльності в соціальних мережах Twitter, Facebook, YouTube, Wikipedia.

    статья [20,6 K], добавлен 27.08.2017

  • Виды социальных медиа. Критерии эффективности продвижения аккаунта в социальных сетях. Программная реализация алгоритма моделирования распространения информации в социальной сети "Twitter". Разработка клиентского приложения. Апробация интерфейса системы.

    дипломная работа [5,4 M], добавлен 08.02.2016

  • Классификация компьютерных сетей по распространенности и скорости передачи информации. Спутниковый или оптоволоконный канал связи с сервером Интернета. Использование браузера, программного обеспечения для просмотра веб-сайтов. Общение в реальном времени.

    презентация [1,5 M], добавлен 16.04.2015

  • Проблемы защиты информации человеком и обществом. Использование информации. Организация информации. Угроза информации. Вирусы, характеристика и классификация. Проблемы защиты информации в Интернете. Анализ и характеристики способов защиты информации.

    реферат [36,5 K], добавлен 17.06.2008

  • Использование социальных сетей и медиа компаниями. Программа исследования факторов подписки на официальные аккаунты брендов в Twitter и Instagram. Применение мобильного Интернета целевыми группами российских потребителей. Тестируемые гипотезы и модель.

    дипломная работа [2,9 M], добавлен 30.12.2015

  • Предотвращение несанкционированного распространения информации в текстовых файлах. Разработка подсистемы обнаружения утечки информации с фильтром идентификации текстовых областей в передаваемом потоке данных и их сходства с конфиденциальными данными.

    дипломная работа [1,8 M], добавлен 14.03.2013

  • Сбор и обработка информации при подготовке публикации. Признаки информационного общества, воздействие информации на развитие журналистской деятельности. Влияние Интернета на средства массовой информации. Использование компьютера в работе журналиста.

    презентация [235,4 K], добавлен 17.05.2016

  • Анализ организационной структуры ОАО "МегаФон". Информационные потоки отделов. Исследование процессов защиты информации отделов. Классификация информации по видам тайн. Модель нарушителя, каналы утечки информации. Исследование политики безопасности.

    курсовая работа [778,8 K], добавлен 07.08.2013

  • Первые электронно-вычислительные машины. Начало компьютерной индустрии США. Государственная поддержка зарождавшейся индустрии. Послевоенная ситуация на американском рынке устройств обработки информации. Оборудование IBM.

    реферат [15,1 K], добавлен 05.06.2004

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.