Исследование зависимости покупок в магазине от характеристик движения

Расчет времени, которое проводит покупатель в магазине и проходимого им среднего расстояния. Факторы, влияющие на скорость перемещения потребителей. Соотношение времени, проведенного в магазине, и количества купленного товара, обоснование зависимости.

Рубрика Маркетинг, реклама и торговля
Вид научная работа
Язык русский
Дата добавления 03.05.2019
Размер файла 387,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Исследование зависимости покупок в магазине от характеристик движения

Введение

Что такое большие данные

С развитием новых технологий, совершенствованием различных датчиков и устройств возможность собирать большое количество информации (о перемещении, разговорах, запросах в интернете, покупок и т.д.) не представляет особой сложности. Объем этих данных невероятно огромен.

Что же такое большие данные? Для того чтобы ответить на этот вопрос, давайте рассмотрим простой случай: Вы заходите в магазин за продуктами, чтобы купить самое необходимое. Давайте теперь посмотрим со стороны на ваши действия: Вы идёте, допустим, сначала за овощами, потом перемещаетесь в другой отдел, смотрите, выбираете, берёте продукт, затем идёте на кассу. Довольно обычная и знакомая каждому из нас ситуация. Но какие выводы можно сделать о Вашем перемещении? Почему Вы остановились в определённом отделе, а другой просто прошли мимо?

Теперь представьте, что перемещение Вашей тележки было ежесекундно записано, то есть создано пространственно-временное соответствие вашего передвижения по магазину. Если записывать эти данные в обычные столбцы, то, можно представить, сколько придётся вводить данных по Вашему перемещению. Сколько Вы обычно времени проводите в магазине? Допустим, минут 10-15. А теперь представьте, что каждые 5 секунд с тележки считывается её положение. Тогда, в одну минуту будет записано 12 таких положений, 2 минуты - 24, 10 минут - 120. А теперь представьте, что считываются положения всех тележек в магазине на протяжении всего дня, каждую секунду, на протяжении всего года. Именно для таких ситуаций и была придумана технология Big Data, в переводе означающая - Большие Данные.

Данная технология позволяет не только хранить огромные объёмы информации, но также и подразумевает определенный анализ, если поставлены какие-то цели. В настоящий момент в России данная технология почти не используется, за исключением банковской сферы.

Обычно о Больших Данных говорят в том случае, когда объём информации настолько велик, что вручную его считать практически невозможно, как и хранить эту информацию на обычных дисках или флэшках, и для этого используют огромные сервера. В качестве примера, давайте соберём данные с одного человека про его покупки за один месяц в определённом магазине - будет большая таблица. Если же собирать такого рода информацию со всех покупателей всей сети магазинов, то одной флэшкой уже не точно обойдёшься. Это как раз пример применения Больших данных.

Цели и задачи исследования

Как можно использовать эти данные во благо общества? Для оптимизации прибыли, улучшения качества жизни людей, обслуживания, транспортного сообщения и т.д. Все же в первую очередь сферой применения является маркетинг. Казалось бы, что может быть проще, чем просто посмотреть, какие зависимости существуют в рассматриваемой области и понять, при каких условиях достигается оптимизация в нужном аспекте. Проблема заклюпочается в том, что большая часть этих данных не используется для улучшения нашей жизни, проводится мало исследований, подсчетов, поисков различных зависимостей интересующих характеристик, которые помогли бы нам заметно улучшить текущие проблемы в любой сфере общества.

У нас появилась возможность поработать с Большими данными с целью выявления какой-то новой эмпирической зависимости. Эти данные содержат информацию, собранную в магазине и характеризующую покупательское поведение.

Объектом нашего исследования является этот магазин, а предметом - выявление взаимосвязи прибыли магазина и характеристик движения покупателей в нем. Целью является максимизация прибыли. Для достижения своей цели разобьем исследование на ряд задач, а точнее вопросов, ответы на которые помогут приблизиться к выявлению зависимости.

· Как много времени в среднем человек проводит в магазине?

· Какое расстояние проходит человек в магазине за один визит?

· Сколько в среднем покупают товаров?

· Как быстро человек перемещается?

· Как соотносится время, проведенное в магазине и количество купленного товара?

· Каким образом можно описать найденную зависимость?

Гипотеза

Предположим, что скорость, с которой человек перемещается по магазину, является фактором, который оказывает однозначное влияние на количество приобретенного товара.

Из логических рассуждений можем предположить, что когда человек намерен совершить покупку, скорость его передвижения по магазину уменьшается, он начинает присматриваться к товару, проверять срок годности, читать состав и т.д. То есть его внимание концентрируется на определенном продукте, который он впоследствии возможно приобретет. А возможно, не приобретет и тогда время, потраченное на промедление, не принесет никакой пользы производителю товара, вызвавшего интерес.

Проведем исследование, чтобы понять, каким образом влияет скорость передвижения покупателей на количество товаров, проданных в магазине и, соответственно подтвердить или опровергнуть нашу гипотезу.

1. Обзор литературы

покупатель магазин потребитель

Технология Big Data в настоящий момент только начинает развиваться. В нашей стране только ведущие компании начинают присматриваться к возможности ее использования для решения своих практических, производственных и коммерческих задач. В связи с этим в России пока мало источников, на которые можно было бы опереться при исследовании данной проблематики. Существуют авторы и исследователи из других стран, которые продвинулись в изучении этой области. В своей статье мы опирались на их мнения и исследования.

Исследования покупательского поведения получили широкое распространение за последние 25 лет. С увеличением конкуренции в сфере товаров и услуг и ростом потребностей населения, подобный анализ стал необходим для получения различных преимуществ перед конкурентами. Предлагались различные модели исследования. Например, Burke (1996) эмпирически установил, что «лабораторные данные могут точно прогнозировать долю рынка бренда и чувствительность потребительских цен, наблюдаемую в супермаркете». Его данные показали, что продажи виртуальных магазинов тесно коррелируют с продажами в реальных магазинах. Таким образам появилась возможность исследовать потребности покупателей в интерактивной 3D модели и применять потом на практике в конкретных магазинах.

С развитием новых технологий, в частности радиочастотной идентификации, исследователи получили возможность детальнее отслеживать покупательское поведение в магазине. Данные, полученные с помощью RFID (radio frequency identification), благодаря высокой частоте сканирования имеют большую ценность для исследования покупательского поведения.

Исследования при помощи больших данных провел Sorenson(2003). Он изучал модели покупок у потребителей с таблицей статистики покупки и времени пребывания в разных местах в фактическом продуктовом магазине. В 2005 году Jeffrey S. Larson, используя RFID, получил массив данных, который впоследствии разделили на различные конфигурации кластера для коротких, средних и длительных поездок. Полученные три набора кластеров идентифицируют в общей сложности 14 «типов канонических путей», которые характерны для путешествий в продуктовом магазине. Также подобные исследования проводили Loebbecke(2005), Yada(2009). В 2009 году была написана статья TSP в Нью-Йоркском университете было проведено исследование, в котором ставились в сравнение траектория движения покупателя в магазине и оптимальная траектория, по которой он мог бы двигаться, приобретая те же самые товары. Подсчет соотношений порядкового отклонения и путевого между двумя траекториями, привел к достаточно четкому диапазону значений, описывающему покупательское поведение.

2. Материалы и методы

Мы воспользовались большими данными, собранными в продуктовом магазине, чтобы провести свой анализ и выявить закономерности в покупательском поведении. Магазин состоит из 25 секций (по категориям товаров), 2 входов, центрального прохода и кассы. Информация собиралась в течение недели с 9:00 до 18:00.

Система RFID представляет собой устройства, которые фиксируют координаты тележки в магазине каждую секунду. Также кассовый аппарат собирает информацию о товарах, купленных покупателем (данные о цене, количестве, отделе, артикуле).

В нашем распоряжении появилась отсортированная таблица, которую нам предоставил научны руководитель, где убрали местоположение тележки, когда ей никто не пользуется, а также каждому новому покупателю, использующему тележку, присвоили номер. В результате получилось две Excel-таблицы.

· Первая отслеживает местоположение человека в магазине и имеет две характеристики движения человека: sus (покоится) и mig (перемещается), а также координаты и время.

· Вторая таблица в свою очередь предоставляет информацию о товаре, купленном каждым покупателем, количестве.

1184 покупателя было исследовано на основании более двух миллионов записей об их передвижении и покупках. Для обработки данных мы использовали исключительно программу Exсel. В ней производились все расчеты, создавались таблицы, строились графики.

3. Результаты

Расчет характеристик движения и покупок в общих чертах

Чтобы ответить на вопросы про среднее время, проведенное в магазине, среднее количество покупок, среднее расстояние, которое человек проходит, совершая одну покупку проведем несложные расчеты.

Время. Суммируем время проведенное каждым покупателем в магазине (время i-того покупателя) и делим на количество покупателей (N=1184 покупателя).

,

где N-количество покупателей за все исследуемое время.

Покупки. Аналогично, суммируем общее количество покупок и делим на количество покупателей. -количество покупок у i-того покупателя.

.

Расстояние. С расстоянием немного сложнее. Рассмотрим на примере перемещения между двумя сканированиями положения (начальная точка , конечная точка . Элементарное перемещение s задается изменением положения по оси Ох и Оу - x и y.

x = |X? - X?|

y =|Y? - Y?|

Найдем s через теорему Пифагора: s=.

Для нахождения среднего расстояния сначала находим расстояние, которое прошел каждый покупатель. (S?-общее расстояние, которое прошел i-тый покупатель.)

Чтобы найти среднее расстояние, суммируем расстояния для каждого человека и делим на их количество.

- среднее расстояние, которое проходит покупатель за одно посещение магазина.

Результаты подсчетов приведены в таблице ниже:

суммарное

Среднее

время, проведённое в магазине(секунды)

1335627

1128.06

пройденный путь (условные единицы)

8098597

6840.03

количество купленных товаров(штуки)

23837

20.13

Проведем расчет скорости - средняя скорость движения в магазине.

=, где S - общий пройденный путь.

T(mig) - время движения (не учитываем время, когда статус координаты sus.)

= 11.89.

Расчет характеристик движения для каждого отдела магазина

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Аналогичные вычисления проведем для каждого отдела. В случае, если две соседние точки, задающие положение покупателя в магазине, принадлежат к разным отделам, делим длину элементарного перемещения пополам, т.к. в таком случае в среднем половина длины приходится на одну из двух зон.

All Areas

All Length, S?

All Time, T?

Av Speed, V?

All Areas

All Length, S?

All Time, T?

Av Speed, V?

V1

922148,7

168948

5,46

S

179037,2

25808

6,94

G

914630,2

128264

7,13

I

159507,1

17652

9,04

F1

690825,7

114206

6,05

B4

144633,4

25866

5,59

H

595610,4

85460

6,97

B3

144015,2

28911

4,98

R

570585,3

86941

6,56

B2

137905

27762

4,97

V2

501789,4

92033

5,45

E

121084,8

38202

3,17

B6

463595,6

105623

4,39

C3

113974,2

18295

6,23

F2

462177

75387

6,13

C2

91242,14

14153

6,45

J

380631,4

61655

6,17

C1

83225,98

15171

5,49

L

354488,9

45946

7,72

B1

56834,12

8688

6,54

K

329992,3

52107

6,33

A3

54200,41

7145

7,59

M

327654,2

47531

6,89

A2

38410,72

7183

5,35

D2

192266

26157

7,35

A1

34528,75

6264

5,52

Введем величину средней скорости перемещения покупателя в каждом отделе V?

V? =

Где So? - расстояние, которое проходят суммарно все покупатели в отделе, Тo? - время, которое проводят суммарно все покупатели в отделе. (считаем время, когда тележка покоится).

Коэффициент скорости

Для дальнейшей обработки данных введем безразмерный коэффициент Sp, численно равный отношению средней скорости передвижения покупателя в отделе к скорости движения человека по магазину.

Sp =

Предположим, что коэффициент Sp отображает заинтересованность человека совершить покупку в отделе. Основываясь на логических рассуждениях, можем предположить, что когда человек намерен совершить покупку, он приостанавливается, тратит больше времени на то, чтобы выбрать товар, вследствие чего средняя скорость движения по отделу уменьшается, т.к. средняя скорость обратно пропорциональна времени, проведенному в отделе.

Расчеты для покупок

Теперь обратимся ко второй Exсel-таблице, в которой представлена информация совершаемых покупок. Проведем ряд расчетов:

1) Общее количество купленных товаров для каждого из отделов обозначим как P?. Посчитаем Pi для каждого из отделов путем суммирования, всех товаров, которые были куплены за время снятия эмпирических точек.

2) Введем величину p? - среднее количество товаров, которое было приобретено в расчете на одного покупателя, в данном i-том отделе.

n? =

3) Посчитаем количество людей, которые купили хотя бы один товар в каждом из отделов. Обозначим это количество за x?.

4) Рассчитаем среднее количество товаров, которое приходится на каждого человека, совершившего покупку в этом отделе. Обозначим эту величину k?.

k? =

Area

All Purch, P

Av Purch, n?

Purch, x?

Purch if Buy

Area

All Purch, P

Av Purch, n?

Purch, x?

Purch if Buy

E

0

0

0

-

J

2249

1,90

820

2,74

V1

4079

3,45

956

4,27

S

1

0,0008

1

1

V2

2153

1,82

722

2,98

R

161

0,14

111

1,45

F1

1694

1,43

718

2,36

M

1707

1,44

688

2,48

F2

1412

1,19

608

2,32

H

903

0,76

461

1,96

G

1644

1,39

554

2,97

L

874

0,74

330

2,65

B1

266

0,22

134

1,99

D1

124

0,10

73

1,70

B2

658

0,56

344

1,91

D2

347

0,29

157

2,21

B3

593

0,50

354

1,68

C1

327

0,28

157

2,08

B4

580

0,49

306

1,90

C2

502

0,42

216

2,32

B5

519

0,44

344

1,51

C3

373

0,32

200

1,87

B6

1500

1,27

593

2,53

A1

247

0,21

104

2,38

K

369

0,31

180

2,03

A2

151

0,13

90

1,68

I

280

0,24

173

1,62

A3

124

0,10

73

1,70

4. Анализ

Нам интересно понять, как завит количество приобретенного товара от скорости, с которой перемещается покупатель.

Сделаем предположение, что среднее количество товаров, приобретенных в отделе(n?) - это функция от двух коэффициентов - k? (коэффициент, характеризующий среднюю покупательскую способность в отделе) и Sp? (коэффициент, характеризующий скорость).

n? = f (k?, Sp?).

Зависимость данной функции от k вполне понятна. Действительно, чем больше единиц товара приходится на одного человека, совершающего покупку, тем сильнее увеличивается n в данном отделе, причем k зависимости имеет первую степень, то есть зависимость n? (k линейна. В то же время зависимость покупательской способности людей в данном отделе от безразмерной характеристики величины скорости передвижения в отделе предстоит доказать.

Вспомним, что такое Sp. Это отношение средней скорости перемещения человека по отделу к средней скорости движения. Т.к. Sp - величина, обратно пропорциональная времени, затраченному в каждом отделе, а соответственно, обратно пропорциональна заинтересованности совершить покупку по нашему предположению.

n? = f (k?, Sp?) = f (k?, 1/V?)

Значит, для доказательства справедливости функции, надо построить график зависимости n?(alpha), где alpha (безразмерный коэффициент) = k?/Sp?.

График полученной зависимости это прямая. Из этого следует что мы получили прямо пропорциональную зависимость. n? =f(alfa)=r**+b. Функция средних покупок прямо пропорциональна отношению количества купленного товара к количеству людей, купивших что-то в данном отделе (х?) и обратно пропорциональна отношению средней скорости перемещения в отделе к средней скорости движения, где r - безразмерный коэффициент.

Конкретно для нашего случая исследуемая зависимость задается следующим уравнением:

n? = 0,4109*alpha - 0,9666

Вывод

С технологиями больших данных теперь есть возможность проанализировать и свести воедино данные разных типов, которые не структурированы. Качество и достоверность анализа значительно повышаются. У нас получилось провести свое исследование и даже доказать предположенную гипотезу. В данном исследовании мы смогли не только увидеть зависимость количества покупок, совершенных покупателем, от средней скорости его перемещения в определённом отделе, но и найти данную зависимость, доказав её существование на конкретном примере. Также важно отметить что отдел не оказывает сильного влияния на эту зависимость. Данное исследование определённым образом может помочь аналитикам-маркетологам оптимизировать работу магазина и максимизировать его прибыль.

Список литературы

1. An exploratory look at supermarket shopping paths. Jeffrey S. Larson, Eric T. Bradlow, Peter S. Fader

2. The Science of Shopping by Herb Sorensen (Marketing Reserch), Ph.D

3. Burke, R.R. (1996), «Virtual Shopping: Breakthrough in Marketing Research,» Harvard Business Review, Mar-Apr, 120-131.

4. Hui, S.K., E.T. Bradlow, and P.S. Fader (2007), «An Integrated Model of Shopping Paths and Purchase Behavior,» Working Paper

5. Houser, D., M. Keane, and K. McCabe (2004), «Behavior in a Dynamic Decision Problem: An Analysis of Experimental Evidence Using a Bayesian Type Classification Algorithm,» Econometrica, 72 (May), 781-822.

6. Guadagni, P.M., J.D.C. Little. 1983. A logit model of brand choice calibrated on scanner data. Marketing Sci. 2 (3) 203-238.

7. MacGregor, J.N., T. Ormerod. 1996. Human performance on the traveling salesman problem. Perception Psychophysics 58 (4) 527-539.

8. Vickers, D., M. Butavicius, M. Lee, A. Medvedev. 2001. Human performance on visually presented traveling salesman problem. Psych. Res. 65 (1) 34-45.

9. Meyer, R.J., and J. Assuncao (1990), «The Optimality of Consumer Stockpiling Strategies,» Marketing Science, 9 (1), 18-41.

10. Underhill, Paco (1999), Why We Buy: The Science of Shopping. New York: Simon & Schuster.

11. Research Note The Traveling Salesman Goes Shopping: The Systematic Deviations of Grocery Paths from TSP Optimality (Sam K. Hui Stern School of Business, New York University, New York 10012, khui@stern.nyu.edu Peter S. Fader, Eric T. Bradlow The Wharton School of the University of Pennsylvania, Philadelphia, Pennsylvania 19104 {faderp@wharton.upenn.edu, ebradlow@wharton.upenn.edu})

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.