Таргетированная реклама с использованием цифровых следов клиентов как фактор изменения онлайн-продаж в социальной сети Вконтакте

Факторы, влияющие на онлайн-продажи. Применение цифровых следов в таргетированной рекламе и показатели оценки их эффективности. Изучение методологии полуструктуированного интервью. Проведение исследования частоты публикаций респондентов Вконтакте.

Рубрика Маркетинг, реклама и торговля
Вид дипломная работа
Язык русский
Дата добавления 01.09.2018
Размер файла 1,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

- Подписка на сообщества о играх;

- Подписки на сообщества с картинками и небольшими текстовыми подводками.

Основное внимание следует уделить количеству сообществ и 5 кластеру постов (предпочтение к дизайну интерьеров). Так как данные цифровые следы подтвердили свое влияние на продажи как в корреляционном, так и в регрессионном анализах.

Таким образом, основывая рекламные компании на данных пунктах, будут затронуты цифровые следы пользователей, которые в прошлом имели тенденцию влиять на онлайн-продажи. Однако стоит также учитывать факт оптимального количества подписок на сообщества у человека, а также то, что наблюдается смещение аудитории от женской к преимущественно мужской в разрезе с покупательской способностью.

4.7 Эксперимент

Таблица 11 Аудитории и таргетированные рекламные объявления

#

Аудитория

Особенности настройки

Объявления

1

Люди, интересующиеся дизайном интерьеров

Необходимо собрать базу сообществ о дизайне интерьера

Обычный пост с журналом

2

Люди, интересующиеся дизайном интерьеров

Необходимо собрать базу сообществ о дизайне интерьера

Пост «журнал в красивом интерьере»

3

Подписчики сообществ с картинками и небольшими текстовыми подводками

Необходимо собрать базу данных сообществ

Обычный пост с журналом

4

Подписчики сообществ с картинками и небольшими текстовыми подводками

Необходимо собрать базу данных сообществ

Пост с «журналом как отражением моды»

5

Мужчины из Санкт-Петербурга, которые подписаны на те же сообщества, что и мужчины, которые уже приобретали журнал

Необходимо составить список сообществ, на которые подписаны мужчины, которые уже купили

Обычный пост с журналом

6

Мужчины из Санкт-Петербурга, которые подписаны на те же сообщества, что и мужчины, которые уже приобретали журнал

Необходимо составить список сообществ, на которые подписаны мужчины, которые уже купили

Пост для мужчин с журналом

7

Сообщества о природе

Необходимо собрать базу сообществ о природе

Обычный пост с журналом

8

Сообщества о природе

Необходимо собрать базу сообществ о природе

Пост с «чтением журнала на природе»

Основываясь на выводах анализа, решено сделать 8 тестовых рекламных таргетированных объявлений в зависимости от аудитории.

Изображение и текст поста в формате «обычный пост с журналом» уже использовались ранее для других рекламных кампаний и показали наилучший показатель CTR, а также набрали 10 из 10 баллов на

После проведения рекламных кампаний необходимо также посмотреть люди с большим количеством сообществ покупают или с меньшим. Это необходимо для того, чтобы понять верные ли результаты показал дисперсионный анализ.

Так, 50% определенной аудитории увидят обычный пост, а 50% - пост основанный как минимум на 1 их цифровом следе. В каждой группе объявлений не выставлены дневной и общий лимит на каждое объявление, так как ограничение денежных средств влияет на результаты A/Б-тестирования каждой рекламной кампании. Ниже представлена схема процесса A/Б-тестирования.

Рис. 12. Процесс А/Б-тестирования

Таргетированная реклама была запущена на собранные заранее группы аудиторий с помощью программы Target Hunter. На Рисунке 13 представлено общее количество человек, которое состоит в каждой из определенных аудиторий, с включением ботов. Существующие подписчики журнала Stories были исключены из аудиторий. Итоговое количество человек в каждой категории аудиторий с исключением ботов составило:

- Аудитория людей, интересующаяся дизайном интерьеров - 3 835 246 человек;

- Аудитория подписчиков сообществ с картинками и небольшими текстовыми подводками - 174 238 человек;

- Аудитория мужчин СПб, которые подписаны на те жесообщества, что и мужчины, которые уже ранее приобретали журнал - 845 395 человек;

- Аудитория подписчиков сообществ о природе - 967 839 человек.

Рис. 13. Аудитории для таргетированной рекламы ВКонтакте

К первой группе людей были отнесены подписчики ТОП-10 сообществ о дизайне интерьера ВКонтакте. Ко второй группе людей были отнесены люди, которые подписаны на 11 выбранных случайным образом сообществ, относящихся к кластеру подписчиков сообществ с картинками и небольшими текстовыми подводками, определенном на моменте кластерного анализа. Третья группа людей представляет собой look-alike аудиторию мужчин, которая похожа на тех мужчин, которые уже ранее приобретали журнал Stories, по параметру подписка на схожие сообщества. Последняя четвертая аудитория представляет собой подписчиков ТОП-10 сообществ о природе ВКонтакте. Так, списки загружаются в рекламный кабинет ВКонтакте, в котором с помощью ретаргетинга будут настроены рекламные кампании.

Важным является также момент, что в категории «Книги и печатные издания» обязательно необходимо указывать возрастную маркировку. На всех рекламных объявлениях стояла возрастная маркировка 12+.

Основные параметры, по которым производилась настройка рекламных объявлений представлены на Рисунке 14. Объявления транслировалось на всех рекламных площадках ВКонтакте, было выставлено ограничение в 1 показ на 1 человека, к каждому объявлению была прикреплена своя аудитория ретаргетинга. Возраст целевой аудитории для каждого рекламного объявления - от 19 до 36 лет (по данным, полученным в описательной статистике). Рекламные объявления были ограничены по географии жителями Санкт-Петербурга.

Рис. 14. Параметры рекламного объявления для 2-й аудитории в рекламном кабинете ВКонтакте

Каждое объявление, которое набирает сверх 2.000 показов, оценивается автоматически в рекламном кабинете ВКонтакте. Метрика Quality Score помогает понять, как работает объявление в сравнении с записями того же типа от других рекламодателей. На повышения показателя влияют такие факторы как тщательно подобранная целевая аудитория, эффектные креативы и правильная ставка и лимит. Позитивные реакции - это переходы по ссылкам, просмотры видео, вступления в группу. Негативные реакции - это скрытия из ленты и жалобы на объявления. Так, объявление, содержащее в себе цифровые следы аудитории, набрало 8,1 балл из 10, что позволяет оценить определить позитивную реакцию на него как высокую, а негативную - низкую. Также у каждого рекламного объявления присутствует расширенная статистика записи.

Так, объявление были запущены в период с 4 апреля по 10 апреля. Бюджет каждой рекламной кампании составил 1200 рублей.

Результаты по первой рекламной кампании показали, что при одинаковой ставке за 1000 показов (CPM) равной 100 рублей, общий пост был менее успешен в сравнении с постом с цифровыми следами. Об этом свидетельствуют показатели CTR, которые были автоматически подсчитаны в рекламном кабинете ВКонтакте. В Приложении 4 представлены примеры таргетированных объявлений, которые увидели пользователи.

Рис. 15. Статистика рекламной кампании для 1-й аудитории

Так, цена клика на объявление без цифровых следов была на 11,1 рублей выше, чем цена клика поста с цифровыми следами. Количество переходов по объявлению с цифровыми следами также на 35 переходов превысило количество переходов по «обычному» посту (без цифровых следов). Таким образом, ВКонтакте посчитал объявление с цифровыми следами для аудитории, интересующейся дизайном интерьеров, более успешным, стимулируя количество его показов - 84499 в сравнении с 3494.

Вторая группа рекламных объявлений, направленная на изучение реакции подписчиков сообществ с картинками и небольшими текстовыми подводками на рекламное объявление с цифровыми следами, показало, что пост с цифровыми следами также более успешен в сравнении с «обычным» постом. Количество переходов хоть и ниже, чем в предыдущей аудитории, однако переходы по посту с цифровыми следами на 5 выше, чем по «обычному» посту. Показатель CTR у данных объявлений однако ниже в сравнении с предыдущей аудиторией. Средняя разница между ценой клика между объявлениями составила 2,05 рублей.

Таким образом, данная рекламная кампания также показала, что пост с цифровыми следами более привлекателен для аудитории нежели «обычный пост».

Рис. 16. Статистика рекламной кампании для 2-й аудитории

Третья целевая аудитория, в которой помимо основных ограничений было еще и ограничение по полу, также была использована в ходе рекламной кампании. Результаты А/Б-тестирования показали, что количество показов поста с цифровыми следами практически в 3 раза превышает количество показов «обычного» поста, вследствие чего практически при равном показателе CTR количество переходов по объявлению, содержащему цифровые следы, на 38 выше, чем по объявлению без цифровых следов. Так, выигрышнее для данной аудитории использовать рекламное объявление с цифровыми следами.

Рис. 17. Статистика рекламной кампании для 3-й аудитории

A/Б-тестирование рекламных объявлений аудитории подписчиков сообществ о природе показало достаточно схожие результаты. CTR обоих объявлений отличался всего лишь на 0,001%.

Рис. 18. Статистика рекламной кампании для 4-й аудитории

Количество переходов по посту с цифровыми следами на 6 выше, чем по посту, в котором цифровые следы отсутствуют. Стоимость клика между постами различается менее, чем на 1 рубль. Так, в данном случае нельзя однозначно сказать, что объявление с цифровыми следами значительно успешнее, чем рекламное объявление без цифровых следов.

Таблица 12 Сравнение таргетированных объявлений и конечных онлайн-продаж

#

Аудитория

Показы (шт.)

Переходы (шт.)

CPC (руб.)

CTR (%)

Количество проданных

журналов (шт.)

Конверсия по

продажам (%)

1

Люди, интересующиеся дизайном интерьеров // обычный пост

3494

12

29.18

0.343

2

16.67

2

Люди, интересующиеся дизайном интерьеров // пост с цифр.следами

8499

47

18.08

0.553

5

10.64

3

Подписчики сообществ с картинками и небольшими текстовыми подводками // обычный пост

5697

21

26.67

0.369

1

4.76%

4

Подписчики сообществ с картинками и небольшими текстовыми подводками // пост с цифр.следами

6392

26

24.62

0.407

3

11.54%

5

Мужчины из Санкт-Петербурга, которые подписаны на те же сообщества, что и мужчины, которые уже приобретали журнал // обычный пост

2977

15

19.85

0.504

4

26.67

6

Мужчины из Санкт-Петербурга, которые подписаны на те же сообщества, что и мужчины, которые уже приобретали журнал // пост с цифр.следами

9023

53

17.02

0.575

6

11.32

7

Сообщества о природе // обычный пост

5242

21

24.96

0.401

2

9.52

8

Сообщества о природе // пост с цифр.следами

6753

27

25.03

0.400

3

11.11

Так, три из четырех рекламных кампаний подтверждают гипотезу H2 «О цифровых следах в таргетированной рекламе», так как количество переходов по объявлениям и показатель CPC ниже у таргетированных объявлений с использованием цифровых следов. Исключение составила аудитория «Подписчиков сообществ о природе», в которой данная гипотеза не подтвердилась.

Из Таблицы 12 наглядно видно, что аудитория мужчин является наиболее перспективной среди целевый аудиторий. Аудитория же подписчиков сообществ с картинками и небольшими текстовыми подводками показала наихудшие показатели в сравнении с остальными.

Таким образом, после проведения эксперимента можно уверенно полагать, что таргетированная реклама с цифровыми следами действительно более привлекательна для людей, нежели «классические» рекламные посты в социальных сетях без четкого понимания того, чем товар или услуга может заинтересовать конкретного человека. Результаты эксперимента показали, что в 3 из 4-х группах рекламных кампаний посты с цифровыми следами собирали больший охват среди пользователей и показатель CTR у них превышает показатель второго варианта постов. Показатели продаж, полученные от компании Stories, содержали ID каждого человека, который приобрел тот или иной журнал онлайн через ВКонтакте. Каждый пользователь был из определенного списка аудитории. Именно поэтому возможно было отследить из какой именно рекламной кампании пришел тот или иной заказ.

Гипотеза H3 «О связи целевых показателей эффективности», как видно из Таблицы 12, подтвердилась.

Также одним из важных моментов являлось просмотр количества сообществ, на которые подписан каждый человек, который приобрел журнал во время рекламной кампании.

Общее количество онлайн-продаж через ВКонтакте составило 26 экземпляров журнала. Ниже на Рисунке 19 можно увидеть графическое распределение по количеству сообществ, на которые подписан каждый из покупателей.

Рис. 19. Распределение по количеству сообществ, на которые подписан каждый из покупателей

Общее количество подписок не превышает 300, большинство покупателей имеют до 150 подписок, 4 покупателя подписаны на менее, чем 250 сообществ, лишь 1 из покупателей подписан на более, чем 250 сообществ. Полученные данные подтверждают предположение, выдвинутое в ходе дисперсионного анализа, что в основном люди, которые приобретают журналы имеют количество подписок не более, чем 150. Так, они более избирательно относятся к контенту, который видят в ленте Новостей ВКонтакте и настроены благоприятно к журналу.

Стоимость каждого номера - 350 рублей. Потрачено на таргетированную рекламу - 4.800 рублей. Общая прибыль от онлайн-продаж журналов по рекламной кампании составила - 9.100 рублей. От компании Stories была получена информация о том, что общее количество журналов, проданных с 4 по 10 апреля, составило 46 штук, 6 из которых были приобретены через ВКонтакте пользователями, которые не входили в списки для таргетированной рекламы. Таким образом, 20 журналов были приобретены вне зависимости от таргетированной рекламы. Таким образом, гипотеза H1 «О влиянии таргетированной рекламы на онлайн-продажи» подтверждается. Также, стоит учесть тот факт, что за последние три месяца было продано всего 174 журнала, то есть в среднем 58 журналов в месяц. Данный показатель практически удалось достигнуть всего за 1 неделю проведения рекламной кампании ВКонтакте.

Рассчитаем и приведем также показатели эффективности, приведенные в теоретическом обосновании. Показатели CTR, CPC, конверсия, онлайн продаж приведены выше.

- Показатель качества: ВКонтакте автоматически подсчитывает данный показатель для каждого объявления. В Таблице 13 приведены данные по каждому рекламному объявлению. Данный показатель напрямую связан с CTR и также показывает, что таргетированные объявления с цифровыми следами более релевантны для целевой аудитории.

- CPA = 4800 / 26 = 184,62 рублей для всей рекламной кампании. Таким образом, стоимость привлечения 1 покупателя журнала достаточно высока и составляет 0,53% от общей стоимости розничной цены журнала.

- С момента запуска рекламы ВКонтакте число подписчиков сообщества увеличилось на 130 человек, что говорит о том, что примерно 60% тех, кто перешел по рекламе на страницу сообщества журнала Stories ВКонтакте подписались на него.

- В среднем каждое объявление было скрыто пользователями 100 раз при среднем количестве показов 12.020 штук. Таким образом, негативная реакция на все таргетированные объявления составляет лишь 0,008%.

- ROI = (9100-2600)/4800*100% = 1,35 ROI = 135%. Получается, что каждый вложенный рубль окупился и принес дополнительную прибыль в размере 1,35 рублей.

Таблица 13 Quality Score по аудиториям

#

Аудитория

Quality Score

1

Люди, интересующиеся дизайном интерьеров // обычный

6,3

2

Люди, интересующиеся дизайном интерьеров // следы

8,1

3

Подписчики сообществ с картинками и небольшими текстовыми подводками // обычный

5,9

4

Подписчики сообществ с картинками и небольшими текстовыми подводками // следы

7,0

5

Мужчины из Санкт-Петербурга, которые подписаны на те же сообщества, что и мужчины, которые уже приобретали журнал // обычный

7,1

6

Мужчины из Санкт-Петербурга, которые подписаны на те же сообщества, что и мужчины, которые уже приобретали журнал // следы

8,3

7

Сообщества о природе // обычный

6,1

8

Сообщества о природе // следы

7,2

Воронка продаж по проведенной рекламной кампании выглядит следующим образом:

Рис. 20. Итоговая воронка продаж рекламной кампании ВКонтакте

Подводя итоги, общие показатели таргетированной рекламы свидетельствуют о том, что она эффективна. Тем не менее, рекламные объявления, содержащие в себе информацию о цифровых следах пользователей, более эффективны в сравнении с таргетированными объявлениями без цифровых следов.

5. Практические рекомендации

Эксперимент, проведенный в пункте 4, наглядно показал, что использование цифровых следов в таргетированной рекламе действительно повышает значение онлайн-продаж и ключевых показателей рекламы в целом. Однако, так как данная работа является одной из первых в области исследования российской социальной сети ВКонтакте и цифровых следов, которые пользователи оставляют после себя на личных страницах, следует учитывать упомянутые выше ограничения. Тем не менее, приведенные ниже рекомендации могут помочь компаниям, которые хотят применять цифровые следы в рекламе, а также исследователям, чей интерес основывается на более глубоком изучении данного вопроса и поиске альтернативных путей использования социальных сетей, таргетированной рекламы или же цифровых следов.

Во-первых, необходимо четко определить предоставляет ли социальная сеть открытый доступ через API к данным пользователей. Недавний скандал Facebook с передачей данных о пользователях закончился появлением нового #deletefacebook и удалением большого количества не только личных, но и коммерческих страниц по причине нежелания выставлять свои цифровые следы напоказ (Kim, N., & Kim, W, 2018). Аналогичный скандал возник вокруг Youtube (Kim, N., & Kim, W, 2018). ВКонтакте пока в открытую собирают данные о пользователях, однако этот факт не вызвал широкого резонанса среди общественности. Поэтому данная социальная сеть может служить хорошей площадкой для сбора и анализа цифровых следов пользователей.

Во-вторых, необходимо провести завершающий этап исследования, заключающийся в формировании фокус-групп из участников, списки которых были собраны в качестве аудиторий для таргетированной рекламы. Особенно важно включить тех, кто приобрел журнал из-за того, что увидел объявление. Данный качественный метод, представляющий из себя по сути групповую дискуссию, позволит выявить причину, по которой пользователи переходили по рекламному объявлению и совершали онлайн-покупку, а также причину, по которой многие из увидевших рекламу не перешли по ней на страницу сообщества.

В-третьих, возможно дальнейшее расширение исследования в сторону контекстной рекламы, так как еще большее число цифровых следов пользователи оставляют в Интернет-среде в целом. Расширив выборку исследования и шагнув дальше социальных сетей, появляется возможность получить более точные данные о взаимосвязи цифровых следов пользователей и их покупательской способности.

Следование данным рекомендациям позволит исследователям не только апробировать аналогичное исследование на практике, но и расширить поле деятельности. Для компаний «грамотное» использование социальных сетей, как уже было доказано, благоприятно влияет на продажи, адаптировав результаты данного исследования в своей ниши, возможно получение иных показателей продаж. Именно поэтому перед введением таргетированной рекламы с использованием цифровых следов на долговременной основе необходимо проводить сплит-тестирование объявлений.

Таким образом, необходимо помнить, что социальные сети - это динамично и быстро развивающаяся среда, которая позволяет не только быть ближе к целевой аудитории, но и изучать ее.

Заключение

В данной дипломной выпускной работе был проведен анализ применения цифровых следов пользователей в таргетированной рекламе в социальной сети ВКонтакте с целью увеличения онлайн-продаж компании. На основе анализа цифровых следов, которые подписчики журнала Stories оставляют на личных страницах ВКонтакте и корреляцией их с количеством проданных журналов каждому из них, были выдвинуты предложения по аудиториям для таргетированной рекламы, запуск которой показал, что посты с цифровыми следами пользователей имеют более положительный отклик нежели, чем обычные рекламные посты с упоминанием и кратким описанием журнала.

Для конкретизации принимаемых авторами базовых понятий исследования и понимания общей специфики взаимосвязи онлайн-продаж, таргетированной рекламы и цифровых следов в первой главе были изучены факторы, которые влияют на процесс принятия решения при совершении онлайн-покупок, а также проанализированы работы авторов, изучающих влияние цифровых следов пользователей на онлайн-продажи без использования социальных сетей или с использованием зарубежных социальных сетей. Основной акцент теоретического обоснования был на формулировке понятия цифровые следы, их ключевых характеристик и особенностей сбора. В завершении теоретической части были приведены ключевые показатели эффективности, по которым можно оценивать эффективность применения цифровых следов в таргетированной рекламе.

Вторая глава посвящена постановке исследовательской проблемы исследования. В данной главе приводятся основные гипотезы, которые необходимо подтвердить или опровергнуть в ходе исследования, а также приводится общее описание дизайна дальнейшего исследования. Третья глава исследовательской работы представляет собой методологию исследования. В данной главе обосновываются основные методы, которые будут использованы в исследовании.

Завершающая глава содержит описание результатов и дальнейшие рекомендации для компаний и исследователей. В данной главе перечислены основные значимые результаты каждого этапа исследовательской работы. Так, разведывательный этап исследования показал, что пользователи положительно реагируют на таргетированную рекламу в социальных сетях, а также оставляют основные цифровые следы, которые необходимо было собрать на следующем этапе. Статистический анализ данных позволил выделить основные целевые сегменты аудитории. А эксперимент наглядно показал, что действительно использование цифровых следов влияет на результаты рекламных кампаний и конечные онлайн-продажи.

Рекомендации, предложенные для дальнейшего развития данного исследования, помогут компаниям корректно использовать цифровые следы для более точного понимания потребностей их целевой аудитории, а исследователи будут иметь возможность расширить поле изучаемого вопроса.

Нельзя однозначно сказать, что результаты полученные в компании Stories будут абсолютно идентичны и в других компаниях. Однако, касательно данной исследовательской работы все задачи были реализованы, цель достигнута. Компания Stories, на базе которой проходило данной исследование, выразила благодарность и решила продолжать таргетированную рекламу с использованием цифровых следов.

Список использованной литературы

1. Артамонов, В. Н. (2017). Повышение эффективности распределения бюджета между каналами интернет-продвижения товаров и услуг. Известия высших учебных заведений, 3, 52-59.

2. Красуля, А. К. (2016). Анализ способов эффективности Интернет-рекламы. Таврический научный обозреватель, 12(17), 85-86.

3. Ледовая, Я. А., Тихонов, Р.В., & Боголюбова, О.Н. (2017). Социальные сети как новая среда для междисциплинарных исследований поведения человека. Вестник СПбГУ, 7(3), 193-210.

4. Лужнова, Н. В., Береговая, И.Б., & Тарануха, И.А. (2017). Выбор инструментов продвижения в процессе организации рекламной кампании в сети Интернет. Интеллект. Инновации. Инвестиции, 2, 19-22.

5. Невоструев, П. Ю. (2017). Digital Footprints как инструмент профилирования потребителей в рамках концепции Smart-маркетинга. Вестник факультета управления СПбГЭУ, 1(1), 298-301.

6. Тультаева, И. В., Каптюхин, Р. В., & Тультаев, Т. А. (2014). Воздействие социальных сетей на коммуникационные процессы в современном обществе. Бизнес. Образование. Право, 4, 84-88.

7. Филькин, А. В. (2014). SMM как основа Интернет-маркетинга. Маркетинговые коммуникации, 4, 198-201.

8. Ahn, H., & Spangler, W. (2014). Sales Prediction with Social Media Analysis. IEEE ISSN 2166-0786, 3, 143-156.

9. Bocconcelli, R., Cioppi, M., & Pagano, A. (2017). Social media as a resource in SMEs' sales process. Journal of Business & Industrial Marketing, 32(5), 693-710.

10. Dehghani, M., Niaki, M., Ramezani, I., & Sali, R. (2016). Evaluating the influence of YouTube advertising for attraction of young customers. Computers in Human Behavior, 59, 165-172.

11. Dehghani, M., & Tumer, M. (2015). A research on effectiveness of Facebook advertising on enhancing purchase intention of consumers. Computers in Human Behaviour, 49, 597-600.

12. Dinner, I., Heerde, H., & Neslin, S. (2014, October). Driving Online and Offline Sales: The Cross-Channel Effects of Digital versus Traditional Advertising. Journal of Marketing Research, 51(5), 527-545.

13. Fournier, S., & Avery, J. (2011). The uninvited brand. Business Horizons, 5(3), 193-207.

14. Fulton, C., & McGuinness C. (2016). Digital Detectives: Solving Information Dilemmas in an Online World, 1/e. Chandos Publishing.

15. Galeotti, A., & Moraga-Gonzalez, J. (2004). A Model of Strategic Targeted Advertising. CESifo working paper series, 1196, 2-44.

16. Gironda, J., & Korgaonkar, P. (2014). Understanding consumers' social networking site usage. Journal of Marketing Management, 30(5-6), 571-605.

17. Gold, H. (2015). The Digital Advertising Guide. Overdrive Marketing Communications, LLC. Massachusetts, 3, 43-60.

18. Golder, S., Wilkinson, D., & Huberman, B. (2007). Rhythms of social interaction: messaging within a massive online network. Communities and Technologies, 1(2), 41-46.

19. Gopal, R. (2014). Impact of social media marketing of performance of micro and small business. Journal of the Academy of Marketing Science, 5(1), 315-331.

20. Hou, F., Li, B., Chong, A., Yannopoulou, N., & Liu, M. (2017). Understanding and predicting what influence online product sales? A neural network approach. Production Planning & Control, 28(11-12), 964-975.

21. Hulland, J., Nenkov, G., & Barclay, D. (2011). Perceived marketing-sales relationship effectiveness: a matter of justice. Journal of the Academy of Marketing Science, 40(3), 450-467.

22. Iyer, G., Soberman, D., & Villas-Boas, J. (2005). The Targeting of Advertising. Marketing Science, 24, 461-476.

23. Johnson, J. (2013). Targeted advertising and advertising avoidance. The RAND Journal of Economics, 44(1), 168-173.

24. Kaplan, A., & Haenlein, M. (2010). Users of the world, unite! The challenges and opportunities of social media. Business Horizons, 53(1), 59-68.

25. Kim, N., & Kim, W. (2018). Do your social media lead you to make social deal purchases? Consumer-generated social referrals for sales via social commerce. International Journal of Information Management, 39, 38-48.

26. Kwahk, K., & Kim, B. (2017). Effects of social media on consumers' purchase decisions: evidence from Taobao. Service Business, 11(4), 803-829.

27. Lambrecht, A., & Tucher, C. (2013). When Does Retargeting Work? Information Specificity in Online Advertising. American Marketing Association, 50(5), 561-576.

28. Langvinienл, N., & Guobytл, V. (2014). Online Group Buying Factors - Conceptual Model for Understanding Consumer Value. Social Sciences, 84(2), 21-28.

29. Lassen, N., & Madsen, R. (2014). Predicting iPhone Sales from iPhone Tweets. IEEE ISSN 1541-7719, 5, 34-61.

30. Li, Y., Lin, L., & Chiu, S. (2014). Enhancing Targeted Advertising with Social Context Endorsement. International Journal of Electronic Commerce, 19(1), 99-128.

31. Malhotra, A., Totti, L., Jr, W., Kumaraguru, P., & Almeida, V. (2013). Studying User Footprints in Different Online Social Networks. Cornell University Library, 9(2), 45-67.

32. Mikalef, P., Giannakos, M., & Pateli, A. (2013). Shopping and Word-of-Mouth Intentions on Social Media. Journal of Theorethical and Applied Electronic Commerce Research ISSN 0718-1876, 8(1), 17-34.

33. Onder, I., Koerbitz, W., & Hubmann-Haidvogel, A. (2014). Tracing Tourists by Their Digital Footprints: The Case of Austria. Journal of Austria, 11(2), 556-573.

34. Ranganathan, C., & Grandon, E. (2002). An Exploratory Examination of Factors Affecting Online Sales. Journal of Computer Information Systems, 42(3), 87-93.

35. Rehman, F., Yousoff, R., Zabri, S., & Ismail, F. (2002). Determinants of personal factors in influencing the buying behavior of consumers in sales promotion: a case of fashion industry. Young Consumers, 18(4), 408-424.

36. Rieder, B. (2013). Studying Facebook via Data Extraction: The Netvizz Application. Web Science Conference, 5(2), 346-355.

37. Roy, G., Datta, B., & Basu, R. (2017). Effect of eWOM Valence on Online Retail Sales. Global Business Review, 18(3), 198-209.

38. Taylor, C. (2009). The six principles of digital advertising. International Journal of Advertising, 28(3), 411-418.

39. Taylor, D., Lewin, J., & Strutton, D. (2011). Friends, Fans, and Followers: Do Ads Work on Social Networks? Journal of Advertising Research, 51(1), 258-275.

40. Thatcher, J. (2014). Living on Fumes: Digital Footprints, Data Fumes, and the Limitations of Spatial Big Data. International Journal of Communication, 8(1), 1765-1783.

41. Varnado, S. (2014). Your Digital Footprint Left Behind at Death: An Illustration of Technology Leaving the Law Behind. Louisiana Law Review, 74(3), 110-168.

42. Wang, C., & Katawetawaraks, C. (2013). Online Shopper Behavior: Influences of Online Shopping Decision. Asian Journal of Business Research, 1(2), 66-74.

43. Weaver, S., & Gahegan, M. (2007). Constructing, Visualizing, and Analyzing a Digital Footprint. Geographical Review, 97(3), 324-350.

Аннотация

Цель выпускной квалификационной работы - определить, каким образом взаимосвязаны таргетированная реклама, основанная на анализе цифровых следов пользователей в социальной сети ВКонтакте, и онлайн-продажи.

Объектом исследования являются цифровые следы пользователей ВКонтакте. Предметом исследования выступает природа и характеристики влияния использования цифровых следов в таргетированной рекламе ВКонтакте на онлайн-продажи. Исследование базируется на петербургском журнале Stories.

Для достижения поставленной цели в теоретическом разделе были рассмотрены социальные сети и их влияние на онлайн-продажи. Также, были изучены цифровые следы и их основные характеристики, рассмотрены предыдущие практики применения цифровых следов. Кроме того, в первой главе дипломной работы был разобран механизм функционирования таргетированной рекламы в социальных сетях, а также приведены основные показатели по оценке эффективности продвижения.

Во второй и третьих главах настоящей работы была определена основная проблема исследования и выдвинуты гипотезы. В данной работе использовались следующие методы: анализ и синтез, полуструктурированное интервью, контент-анализ, статистический анализ данных (корреляционный, регрессионный и дисперсионный анализы) и эксперимент. Для проведения практической части дипломной работы были использованы язык программирования Python и программное обеспечение SPSS для обработки и анализа данных.

В четвертой главе дипломной работы было проанализировано интервью с подписчиками журнала Stories ВКонтакте, собраны и проанализированы цифровые следы подписчиков, выделены целевые аудитории, проведено А/Б-тестирование. Исследование показало, что рекламные объявления, содержащие в себе информацию о цифровых следах пользователей, более эффективны в сравнении с таргетированными объявлениями без цифровых следов. В пятой главе настоящей работы даны рекомендации для дальнейших исследований в области изучения и применения цифровых следов в Интернет-маркетинге. Объем дипломной работы - 112 страниц, включая 11 приложений.

Ключевые слова: таргетированная реклама, цифровые следы, онлайн-продажи, журнал, социальные сети.a

This study explores the connection between targeted advertising obtained by analysis customer's digital footprints and online sales. The study is based on the Stories magazine. Following methods were used in this study: analysis and synthesis, semi-structured interview, content analysis, statistical data analysis and experiment.

It was found that the subscribers of the magazine VK leave behind a sufficient number of digital footprints and do not have a negative reaction to the targeted advertising in social networks. After statistical analysis of the data collected through the Open VK API target audiences were identified. These people see targeted advertising VK. A/B testing clearly showed that the use of digital footprints in targeted advertising VK has a positive impact on online sales. In conclusion, recommendations were made for future research in the field of study and application of digital footprints in Internet marketing.

The volume of the final paper - 112 pages including 11 Appendices.

Keywords: targeted advertising, digital footprints, online sales, magazine, social networks.

Приложение

Гайд полуструктурированного интервью

Таблица 2.1 Гайд для проведения и оценки интервью

Блок

Вопросы

Варианты ответов

Информация о себе

1. Сколько вам лет?

2. Как вы проводите свое свободное время? Указать первые 2 варианта, названные респондентом

3. Как часто вы заходите в Интернет?

4. Сколько в среднем времени в день в сумме вы проводите в Интернете?

1.

1 - От 14 до 20;

2 - От 21 до 27;

3 - От 28 до 34;

4 - Больше 35

2.

1 - В социальных сетях;

2 - С друзьями или родителями или второй половинкой;

3 - Занимаюсь хобби;

4 - Другое:_____

3.

1 - Несколько раз в час;

2 - Раз в несколько часов;

3 - 1 раз в день;

4 - 1 раз в несколько дней;

5 - 1 раз в неделю;

6 - 1 раз в месяц;

7 - Реже, чем 1 раз в месяц

4.

1 - Меньше 1 часа;

2 - 1-3 часа;

3 - 4-7 часов;

4 - 8-11 часов;

5 - Более 11 часов

Блок

Вопросы

Варианты ответов

Использование социальных сетей

1. Есть ли у вас аккаунты в социальных сетях?

2. В каких? Указать первые 2 варианта, названные респондентом

Вопросы только для тех, кто в п.2 ответил «1»:

3. Открыта ли у вас личная информация о себе ВКонтакте?

4. Какая? Указать первые 3 варианта, названные респондентом

5. С какой целью вы посещаете ВКонтакте? Указать первый вариант, названный респондентом

6. Как часто вы заходите в ВКонтакте?

7. Какие разделы ВКонтакте вы посещаете чаще всего? Указать первые 2 варианта, названные респондентом

8. Читаете ли вы ленту Новостей ВКонтакте?

1.

1 - Да;

2 - Нет

2.

1 - ВКонтакте;

2 - Instagram;

3 - Facebook;

4 - Twitter;

5 - Youtube;

6 - другие: ___________

3.

1 - Да;

2 - Нет

3 - Частично (информация доступна только ограниченному кругу лиц)

4.

Открытый вопрос (респондент может открыть ВКонтакте и посмотреть)

5.

1 - Для отдыха;

2 - Для общения;

3 - Для работы;

4 - Другая причина: ______

6.

1 - Несколько раз в час;

2 - Раз в несколько часов;

3 - 1 раз в день;

4 - 1 раз в несколько дней;

5 - 1 раз в неделю;

6 - 1 раз в месяц;

7 - Реже, чем 1 раз в месяц

7.

1 - Моя страница;

2 - Новости;

3 - Сообщения;

4 - Друзья;

5 - Группы;

6 - Фотографии;

7 - Музыка;

8 - Видео;

9 - Игры

10 - Другие: ______

8.

1 - Да;

2 - Нет

Блок

Вопросы

Варианты ответов

Таргетированная реклама ВКонтакте

*** Рекламные объявления могут показываться не только в ленте Новостей

1. Видели ли вы когда-нибудь рекламные объявления ВКонтакте? ***

2. Что они из себя представляли? Указать первый вариант, названный респондентом. Только для тех, кто в п.1 ответил «Да».

3. Были ли данные объявления связаны с вашими действиями в Интернете за последнее время? Только для тех, кто в п.1 ответил «Да».

4. Кажется ли вам, что данная реклама более привлекательна для вас, нежели чем другие виды рекламы (баннеры на улицах, листовки и прочее)? Только для тех, кто в п.1 ответил «Да».

1.

1 - Да;

2 - Нет

2.

1 - Фото и текст;

2 - Только текст;

3 - Видео и текст

3.

1 - Да;

2 - Нет

4.

1 - Да;

2 - Нет

Блок

Вопросы

Варианты ответов

Реакция

**программа, скрывающая рекламу автоматически

1. Бывали ли случаи, когда вас заинтересовала реклама в социальных сетях, которую вы видели? Только для тех, кто в п.1 в блоке «Таргетированная реклама» ответил «Да».

2. Вы когда-нибудь ставили лайк/комментировали/делились/сохраняли рекламные объявления? Только для тех, кто в п.1 в блоке «Таргетированная реклама» ответил «Да».

3. Скрывали ли вы когда-нибудь рекламные записи? Только для тех, кто в п.1 в блоке «Таргетированная реклама» ответил «Да».

4. Стоит ли у вас блокировщик рекламы в Интернете? **

1.

1 - Да;

2 - Нет

2.

1 - Да;

2 - Нет

3.

1 - Да;

2 - Нет

4.

1 - Да;

2 - Нет

Таблица 2.2 Систематизация интервью с читателями и подписчиками журнала Stories ВКонтакте

Вопрос

1

2

3

4

5

6

7

8

9

10

11

12

Блок «Информация о себе»

Сколько вам лет?

2

2

3

1

1

2

2

2

2

3

3

3

Как вы проводите свое свободное время?

1,2

1,3

2,3

1, 4

(Учусь)

2,3

2,4 (Смотрю фильмы)

1,3

1,2

2,3

2,3

2,4

(Занимаюсь бытовыми домашними делами)

2,1

Как часто вы заходите в Интернет?

1

1

1

2

1

3

1

1

2

1

1

1

Сколько в среднем времени в день в сумме вы проводите в Интернете?

4

3

3

2

3

2

3

3

4

3

3

2

Блок «Использование социальных сетей»

Есть ли у вас аккаунты в социальных сетях?

1

1

1

1

1

1

1

1

1

1

1

1

В каких?

1,2,3

1,2,4

1,2,3

1,3,4

1,2,5

1,2,6 (Pinterest)

1,6

(Telegram)

1,2,3

1,3,6

(Telegram)

1,2,5

1,2,6

(WhatsApp)

1,2,4

Вопрос

1

2

3

4

5

6

7

8

9

10

11

12

Открыта ли у вас личная информация о себе ВКонтакте?

1

1

1

1

1

2

2

2

1

1

1

3

Какая?

Образование, город проживания, интересы

Любимые цитаты, место работы, город проживания

Интересы, любимые книги, любимые фильмы

Жизненная позиция, место работы, образование

Языки, образование, город проживания

_

_

_

Город проживания, мобильный телефон, ссылки на другие социальные сети

Город проживание, ссылка на другие соц.сети, жизненная позиция

Год рождение, образование, место проживания

Город рождения, дата рождения, ссылка на другие социальные сети

С какой целью вы посещаете ВКонтакте?

3

1

2

1

2

1

2

1

1

2

2

2

Как часто вы заходите ВКонтакте?

1

1

1

2

1

2

1

1

2

1

1

1

Какие разделы ВКонтакте вы посещаете чаще всего?

3,7

2,3

3,5

1,5

3,5

2.3

2,3

2,3

3,7

3,4

3,9

3,2

Читаете ли вы ленту новостей ВКонтакте?

1

2

1

1

1

1

1

1

1

2

2

1

Вопрос

1

2

3

4

5

6

7

8

9

10

11

12

Блок «Таргетированная реклама ВКонтакте»

Видели ли вы когда-нибудь рекламные объявления ВКонтакте?

1

1

1

1

1

2

1

1

1

1

1

1

Что они из себя представляли?

1

3

1

1

3

_

1

1

1

1

1

1

Были ли данные объявления связаны с вашими действиями в Интернете за последнее время?

2

1

2

2

1

_

2

1

1

1

1

1

Кажется ли вам, что данная реклама более привлекательна для вас, нежели чем другие виды рекламы (баннеры на улицах, листовки и прочее)?

1

1

1

2

1

_

1

2

1

1

2

1

Вопрос

1

2

3

4

5

6

7

8

9

10

11

12

Блок «Цифровые следы ВКонтакте»

Выставляете ли вы интересы ВКонтакте?

2

2

1

1

2

2

1

2

2

2

2

2

Как часто вы делаете публикации ВКонтакте?

7

5

4

5

7

4

5

6

7

7

7

7

Что вы в основном публикуете?

1

3

1

4

3

1

3

1

1

1

1

1

Подписаны ли вы на сообщества, которые постоянно посещаете?

1

1

1

1

1

1

1

1

1

1

1

1

Указывали ли вы город проживания?

1

1

1

1

1

1

1

1

1

1

1

1

Указывали ли вы день рождения?

1

1

1

1

1

2

1

1

1

1

1

1

Вопрос

1

2

3

4

5

6

7

8

9

10

11

12

Указывали ли вы образование или место работы?

1

2

1

1

1

2

1

1

1

2

1

1

Указывали ли вы родственников или личные отношения с другим человеком?

2

2

1

2

2

2

1

1

1

2

2

1

Слушаете ли вы музыку ВКонтакте?

1

1

1

2

2

1

2

1

1

2

1

1

Добавляете ли вы понравившийся контент к себе на страницу (видеозаписи, картинки и прочее) ВКонтакте?

1

1

1

1

1

2

1

1

1

2

2

2

Ставите ли вы лайки?

1

1

1

1

1

1

1

1

2

1

1

1

Оставляете ли вы комментарии?

2

1

1

2

2

2

2

2

2

2

2

1

Вопрос

1

2

3

4

5

6

7

8

9

10

11

12

Делаете ли вы репосты?

1

1

1

2

2

2

1

2

2

1

2

2

Отмечали ли вы когда-нибудь свое местоположение ВКонтакте?

1

2

1

2

2

2

1

1

2

2

2

2

Блок «Реакция»

Бывали ли случаи, когда вас заинтересовала реклама в социальных сетях, которую вы видели, и вы кликнули на нее?

1

1

1

2

1

_

1

2

1

1

2

2

Вы когда-нибудь ставили лайк/комментировали/делились/сохраняли рекламные объявления?

2

1

1

2

2

_

2

2

2

2

2

2

Скрывали ли вы когда-нибудь рекламные записи?

1

2

1

1

2

_

2

1

1

2

2

2

Стоит ли у вас блокировщик рекламы в Интернете?

1

1

2

1

1

2

2

2

2

2

2

2

Код программы на Python для сбора цифровых следов пользователей через

Open API VK, лемматизации слов и кластеризации сообществ и постов

import requests

import json

import pandas as pd

from tqdm import *

import sys

### пункт 1 ###

# выполнить в адресной строке браузера и скопировать code

### пункт 2 ###

# вставить полученный code, выполнить команду

"client_secret=NvoT0uhruFZxR9M67lTm&redirect_uri="\

# скопировать полученный token_access

# вставить его в my_token

my_token = '5d834221a58518727226f62d89a4eea2b6091efc9b41342c16f6f4e89104e0f51882ff08e3a6122e87b3f'

### пункт 3 ###

def get_pageinfo(user_name):

"user_ids=" + user_name + "&access_token=" + my_token

pageinfo = json.loads(requests.get(url_pageinfo).text)['response'][0]

return pageinfo

def get_subscriptions(user_id, offset):

"&extended=1&count=200&fields=type%2Cis_favorite%2Cdescription&"\

"user_id=" + str(user_id) + "&offset=" + str(offset)

subscriptions = json.loads(requests.get(url_subscriptions).text)['response']['items']

return subscriptions

def get_wall(user_id):

"&count=100&filter=all&extended=1&" \

"owner_id=" + str(user_id) + "&access_token=" + my_token

wall = json.loads(requests.get(url_wall).text)['response']['items']

return wall

def process_wall(wall, id_):

wall = pd.DataFrame.from_dict(wall)

wall.fillna(0, inplace = True)

try: wall['comments'] = wall['comments'].apply(lambda x: x['count'] if x != 0 else 0)

except: False

try: wall['likes'] = wall['likes'].apply(lambda x: x['count'] if x != 0 else 0)

except: False

try: wall['reposts'] = wall['reposts'].apply(lambda x: x['count'] if x != 0 else 0)

except: False

try: wall['views'] = wall['views'].apply(lambda x: x['count'] if x != 0 else 0)

except: False

temp = [x if x != 0 else 0 for x in wall['attachments']]

l = [[]] * len(temp)

for i in range(len(temp)):

if temp[i] == 0:

l[i] = temp[i]

else:

temp_list = []

for ind in range(len(temp[i])):

temp_list.append(temp[i][ind]['type'])

l[i] = temp_list

try: wall['attachments'] = [','.join(x) if x != 0 else 0 for x in l ]

except: False # wall.drop(['copy_history', 'geo'], axis = 1, inplace = True)

wall['user_id'] = id_

return wall

def process_subscriptions(subscriptions, id_):

subscriptions = pd.DataFrame.from_dict(subscriptions)

subscriptions.fillna(0, inplace = True)

# subscriptions.drop(['photo_100','photo_200','photo_50', 'type'], axis = 1, inplace = True)

subscriptions['user_id'] = id_

return subscriptions

def fill_data(df, ind, pageinfo):

try: df.ix[ind, 'about'] = pageinfo['about']

except: False

try: df.ix[ind, 'activities'] = pageinfo['activities']

except: False

try: df.ix[ind, 'at_alcohol'] = pageinfo['personal']['alcohol']

except: False

try: df.ix[ind, 'at_inspiration'] = pageinfo['personal']['inspired_by']

except: False

try: df.ix[ind, 'at_lifemain'] = pageinfo['personal']['life_main']

except: False

try: df.ix[ind, 'at_peoplemain'] = pageinfo['personal']['people_main']

except: False

try: df.ix[ind, 'at_political'] = pageinfo['personal']['political']

except: False

try: df.ix[ind, 'at_religion'] = pageinfo['personal']['religion']

except: False

try: df.ix[ind, 'at_smoking'] = pageinfo['personal']['smoking']

except: False

try: df.ix[ind, 'bdate'] = pageinfo['bdate']

except: False

try: df.ix[ind, 'books'] = pageinfo['books']

except: False

try: df.ix[ind, 'city'] = pageinfo['city']['title']

except: False

# df.ix[ind, 'communities'] = pageinfo['communities']

try: df.ix[ind, 'country'] = pageinfo['country']['title']

except: False

try: df.ix[ind, 'education_status'] = pageinfo['education_status']

except: False

try: df.ix[ind, 'games'] = pageinfo['games']

except: False

try: df.ix[ind, 'user_id'] = pageinfo['id']

except: False

try: df.ix[ind, 'interests'] = pageinfo['interests']

except: False

try: df.ix[ind, 'movies'] = pageinfo['movies']

except: False

try: df.ix[ind, 'music'] = pageinfo['music']

except: False

try: df.ix[ind, 'nalbums'] = pageinfo['counters']['albums']

except: False

try: df.ix[ind, 'naudios'] = pageinfo['counters']['audios']

except: False

try: df.ix[ind, 'ncommunities'] = pageinfo['counters']['pages']

except: False

try: df.ix[ind, 'nfollowers'] = pageinfo['counters']['followers']

except: False

try: df.ix[ind, 'nfriends'] = pageinfo['counters']['friends']

except: False

try: df.ix[ind, 'nphotos'] = pageinfo['counters']['photos']

except: False

try: df.ix[ind, 'nvideos'] = pageinfo['counters']['videos']

except: False

try:

df.ix[ind, 'last_occupation_id'] = pageinfo['occupation']['id']

df.ix[ind, 'last_occupation_name'] = pageinfo['occupation']['name']

df.ix[ind, 'last_occupation_type'] = pageinfo['occupation']['type']

except:

try:

df.ix[ind, 'last_occupation_id'] = pageinfo['occupation'][0]['id']

df.ix[ind, 'last_occupation_name'] = pageinfo['occupation'][0]['name']

df.ix[ind, 'last_occupation_type'] = pageinfo['occupation'][0]['type']

except: False

try: df.ix[ind, 'photo'] = int(bool(pageinfo['photo_100']))

except: False

# df.ix[ind, 'posts'] = pageinfo['posts']

try: df.ix[ind, 'quotes'] = pageinfo['quotes']

except: False

try: df.ix[ind, 'relation'] = pageinfo['relation']

except: False

try: df.ix[ind, 'sex'] = pageinfo['sex']

except: False

try: df.ix[ind, 'status'] = pageinfo['status']

except: False

try: df.ix[ind, 'tv'] = pageinfo['tv']

except: False

try: df.ix[ind, 'last_uni_country'] = pageinfo['universities'][0]['country']

except: False

try: df.ix[ind, 'last_uni_name'] = pageinfo['universities'][0]['name']

except: False

try: df.ix[ind, 'last_uni_graduation'] = pageinfo['graduation']

except: False

try: df.ix[ind, 'banned'] = pageinfo['deactivated']

except: False

### пункт 4 ###

# загрузка данных о покупках клиентов

othermembers = all_ids = list(buyers['ids']) + list(othermembers['ids'].apply(lambda x: 'id'+ str(x)))

# создание 3-ех таблиц (люди, посты, группы) и заполнение их

df = pd.DataFrame({'user_id': '', 'sex': '', 'bdate': '',

'activities': '', 'books': '', 'games': '',

'movies': '', 'music': '', 'quotes': '',

'tv': '', 'relation': '', 'city': '',

'country': '', 'about': '', 'interests': '',

'last_occupation_name': '', 'last_occupation_type': '', 'last_occupation_id': '',

'nalbums': '', 'naudios': '', 'nfollowers': '',

'nfriends': '', 'ncommunities': '', 'nphotos': '',

'nvideos': '', 'education_status': '', 'last_uni_name': '',

'last_uni_graduation': '', 'last_uni_country': '', 'at_alcohol': '',

'at_inspiration': '', 'at_lifemain': '', 'at_peoplemain': '',

'at_political': '', 'at_religion': '', 'at_smoking': '',

'photo': '', 'status': '', 'posts': [],

'communities': []})

# df['communities'] = df['communities'].astype(object)

# df['posts'] = df['posts'].astype(object)

df_wall = pd.DataFrame()

df_subscriptions = pd.DataFrame()

ind = 0; offset = 0

for user_name in tqdm(all_ids):

pageinfo = get_pageinfo(user_name)

try:

df.ix[ind, 'number_magazines'] = buyers.ix[buyers['ids'] == user_name, 'сколько штук'].iloc[0]

df.ix[ind, 'number_purchase'] = buyers.ix[buyers['ids'] == user_name, 'сколько раз заказывали'].iloc[0]

except: False

fill_data(df, ind, pageinfo)

try:

subscriptions = process_subscriptions(get_subscriptions(pageinfo['id'], 0), pageinfo['id'])

df_subscriptions = pd.concat([df_subscriptions, subscriptions])

for i in range(int(df.ix[ind, 'ncommunities']/200)):

offset += 200

subscriptions = process_subscriptions(get_subscriptions(pageinfo['id'], offset), pageinfo['id'])

df_subscriptions = pd.concat([df_subscriptions, subscriptions])

wall = process_wall(get_wall(pageinfo['id']), pageinfo['id'])

df_wall = pd.concat([df_wall, wall])

except: False

ind += 1

offset = 0

for user_id in tqdm(user_id000):

break

try:

wall = process_wall(get_wall(user_id), user_id)

df_wall = pd.concat([df_wall, wall])

except: False

ind += 1

offset = 0

break

df.to_pickle('user_info.pickle')

df.to_excel('user_info.xlsx')

df_subscriptions.head()

df_subscriptions.drop(['deactivated','first_name', 'hidden', 'is_closed',

'is_favorite', 'last_name', 'photo_100', 'photo_200',

'photo_50', 'screen_name', 'type'], axis = 1, inplace = True)

df_subscriptions.to_pickle('subscriptions_info.pickle')

df_subscriptions.to_excel('subscriptions_info.xlsx')

temp = df_wall

df_wall.drop(['copy_history', 'final_post', 'geo',

'post_type'], axis = 1, inplace = True)

df_wall.to_pickle('wall_info2.pickle')

df_wall.to_excel('wall_info2.xlsx')

# лемматизация и токенизация описаний и названий групп

import pymorphy2

from nltk.stem import WordNetLemmatizer

from urllib.request import urlopen

import re

import numpy as np

import itertools

import collections

from sklearn.feature_extraction.text import TfidfVectorizer

df['corpus'] = df['description'].astype(str).replace('ё', 'е') + " " + df['name'].astype(str).replace('ё', 'е')

df['corpus'] = df['text'].astype(str).replace('ё', 'е') + ' ' + df['attachments_labels_rus'].astype(str).replace('ё', 'е')

df.reset_index(drop = True, inplace = True)

morph = pymorphy2.MorphAnalyzer()

wnl = WordNetLemmatizer()

stop = def get_tokens(df):

for ind in tqdm(range(len(df))):

words = re.findall('[0-9A-Za-zА-Яа-я_]*[A-Za-zА-Яа-я_]+[0-9A-Za-zА-Яа-я_]*', df.ix[ind, 'corpus'].lower().replace('ё', 'е'))

lemmas = [morph.parse(wnl.lemmatize(x))[0].normal_form for x in words]

tokens = [x for x in lemmas if x not in stop]

df.ix[ind, 'corpus'] = ' '.join(tokens)

get_tokens(df)

chain = itertools.chain.from_iterable(list(df.ix[:, 'corpus'].apply(lambda x: x.split(' '))))

temp = collections.Counter(list(chain))

dict_ = [x for x, y in temp.items() if y > 2]

# убираем редкоповторяющиеся слова

# df['corpus'] = df['corpus'].apply(lambda x: tqdm([item for item in x.split(' ') if item in dict_]))

for ind in tqdm(df.index):

df.ix[ind, 'corpus2'] = ' '.join([x for x in df.ix[ind, 'corpus' ].split() if x in dict_])

# убираем пустые новости

df = df.ix[df['corpus2'] != '', :]

vectorizer = TfidfVectorizer()

df_tfidf = vectorizer.fit_transform(df.ix[:, 'corpus2'])

# sdf = pd.SparseDataFrame(X)

temp_df = df

temp_df['cluster45'] = cluster_labels[45]

temp_df_7_25_28 = temp_df.ix[(temp_df['cluster45'] == 7) |

(temp_df['cluster45'] == 25) | (temp_df['cluster45'] == 28), :]

temp_df_14 = temp_df.ix[temp_df['cluster45'] == 14, :]

temp_df_18 = temp_df.ix[temp_df['cluster45'] == 18, :]

temp_df_22 = temp_df.ix[temp_df['cluster45'] == 22, :]

vectorizer = TfidfVectorizer()

df_tfidf_7_25_28 = vectorizer.fit_transform(temp_df_7_25_28.ix[:, 'corpus2'])

df_tfidf_14 = vectorizer.fit_transform(temp_df_14.ix[:, 'corpus2'])

df_tfidf_18 = vectorizer.fit_transform(temp_df_18.ix[:, 'corpus2'])

df_tfidf_22 = vectorizer.fit_transform(temp_df_22.ix[:, 'corpus2'])

#

# обработка картинок

#

from describe_images import describe_image

def process_table(ind):

labels_list = []

if df_wall.ix[ind, 'attachments_url'] != 0:


Подобные документы

  • Использование онлайн-исследований в сети Интернет. Технологии рекрутинга респондентов. Неограниченная, отобранная и специально завербованная выборка. Онлайн-опрос студентов Чувашского государственного педагогического университета им. И.Я. Яковлева.

    курсовая работа [32,2 K], добавлен 10.12.2013

  • Маркетинговое исследование на рынке страховых услуг. Особенности Интернет-рекламы компаний-конкурентов. Разработка и увеличение онлайн-продаж страхового продукта за счет проведения рекламной кампании в сети Интернет. Прибыль от внедрения инновации.

    дипломная работа [6,1 M], добавлен 27.06.2014

  • Особенности процесса принятия решения о покупке в онлайн-среде. Специфические факторы, влияющие на принятие решения о покупке в онлайн-магазинах одежды. Создание модели, описывающей влияние всех факторов на принятие решение о покупке в онлайн-магазине.

    дипломная работа [3,4 M], добавлен 11.02.2017

  • Понятие девиантного поведения, основные причины и предпосылки его проявления в ходе онлайн-продаж. Анализ результатов эмпирического исследования "Мошенничество интернет-магазинов". Пути борьбы и профилактики данного явления, его распространенность.

    дипломная работа [60,6 K], добавлен 18.06.2017

  • Оценка эффективности маркетинговых коммуникаций. Особенности маркетингового продвижения на рынке рекламных услуг. Анализ внутренней и внешней среды компании "Реклама онлайн". Выбор наиболее эффективных инструментов маркетинговых коммуникаций для компании.

    дипломная работа [183,9 K], добавлен 14.06.2014

  • Понятие, основные черты и отличительные характеристики качественного и количественного исследования. Методология проведения фокус-групп и онлайн-опросов. Характеристика товара, выводимого на рынок, цели, задачи и сценарий проведения исследований.

    курсовая работа [40,0 K], добавлен 10.01.2013

  • Основные характеристики интервью как метода маркетингового исследования. Практическое применение интервью в маркетинговых исследованиях музеев. Авторское социологическое и маркетинговое исследование PR-коммуникаций в музеях с использованием интервью.

    дипломная работа [267,7 K], добавлен 16.06.2017

  • Понятие SMM как процесса привлечения трафика или внимания к бренду или продукту через социальные платформы. Обзор популярных площадок. Виды рекламы в социальных медиа и их характеристики. Способы продвижения товаров и услуг на примере проекта "ВКонтакте".

    курсовая работа [4,3 M], добавлен 17.09.2014

  • Понятие и принципы работы социальных сетей, тенденции их развития. Продвижение товара в социальной сети как инструмент маркетинга. Анализ эффективности продвижения методами использования таргетинговой рекламы, создания сообщества бренда в социальной сети.

    курсовая работа [251,5 K], добавлен 03.03.2015

  • Интеграция традиционных и цифровых (офлайн и онлайн) медиа-каналов коммуникаций. Реклама на телевидении, в газетах и журналах. Проблемы цифрового маркетинга, умение планировать мультиплатформенные рекламные кампании, правильно определять их эффективность.

    статья [21,9 K], добавлен 28.04.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.