Оценка влияния характеристик мобильных игр на их коммерческий успех
Влияние характеристик мобильных неигровых приложений на их успех. Анализ метрики успешности и её предикторов. Описание существующих метрик и факторов успеха мобильных игровых приложений: методы их выявления. Выводы и рекомендации создателям игр.
| Рубрика | Маркетинг, реклама и торговля |
| Вид | дипломная работа |
| Язык | русский |
| Дата добавления | 28.11.2019 |
| Размер файла | 2,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Гипотеза 10: Приложения с описанием обновлений приносят значимо большую выручку, чем приложения без описаний.
Наличие внутриигровых покупок
Страница приложения Google Play
Покупки внутри игры приносят выручку приложениям, поэтому могут влиять на их коммерческий успех.
Гипотеза 11: Приложения со встроенными покупками приносят значимо большую выручку, чем приложения без них.
Наличие рекламы внутри приложения
Страница приложения Google Play
Реклама может раздражать пользователей и вести к более низким оценкам приложения, однако она приносит игре доход.
Гипотеза 12: Приложения с рекламой приносят значимо большую выручку, чем приложения без неё.
Уровень локализации приложения
Оценка Sensor Tower
То, насколько хорошо локализирована игра под разные языки, может влиять на размер аудитории приложения и на его выручку.
Гипотеза 13: уровень локализации приложения положительно связан с выручкой приложения
Месячная выручка приложения
Оценка Sensor Tower
Показатель коммерческого успеха игры - зависимая переменная для определения факторов успеха
Количество отзывов
Страница приложения Google Play
Показатель некоммерческого успеха игры, в свою очередь может влиять на коммерческий успех
Количество установок
Страница приложения Google Play
Показатель некоммерческого успеха игры, в свою очередь может влиять на коммерческий успех
Средний рейтинг (оценка пользователей в звёздах)
Страница приложения Google Play
Показатель некоммерческого успеха игры, в свою очередь может влиять на коммерческий успех
Источник: составлено автором
Глава 3. Эмпирическая
3.1 Сбор и обработка данных
Сбор данных производился со страниц приложений в Google Play и Sensor Tower Sensor Tower. Retrieved from https://sensortower.com с помощью поискового робота.
Код для поискового робота находится в приложении 1.
Алгоритм для робота был разработан для сбора значений указанных выше переменных с помощью описания проекта «Play Store Scraper» Play-scraper 0.5.3. (2019). Pypi website. Retrieved from https://pypi.org/project/play-scraper/.
Случайным образом были отобраны id приложений из Google Play, далее id были обработаны алгоритмом так, чтобы значения не повторялись, то есть из выборки были удалены все не уникальные приложения (дедубликация id).
Обработанные таким образом id были помещены в отдельный файл. Далее, данные по каждому приложению собирались со страницы Google Play, а потом из выдачи Sensor Tower.
Полученный набор данных был сохранён в формате csv.
Процесс получения данных с помощью поискового робота представлен на схеме ниже.
Диаграмма 1 Процесс получения данных с помощью поискового робота Источник: составлено автором
Дальнейшая обработка данных проводилась в SPSS. Все данные были перенесены в SPSS, им были присвоены ярлыки и метки значений (где необходимо), назначен тип данных.
Наблюдения, которые не соответствуют требованиям исследования, были удалены из выборки. Таким образом, были исключены 3 приложения, не являющиеся играми, а также все игры, которые не могут получать доход: бесплатные приложения без встроенных покупок и рекламы, - так как эти игры не нацелены на коммерческий успех.
Таблица 6До исключения
|
in_app_purchase Внутриигровые покупки |
||||||
|
0 нет |
1 есть iap |
|||||
|
contain_add Содержит рекламу |
contain_add Содержит рекламу |
|||||
|
0 нет рекламы |
1 есть реклама |
0 нет рекламы |
1 есть реклама |
|||
|
Count |
Count |
Count |
Count |
|||
|
free Бесплатное |
0 платное |
205 |
16 |
75 |
57 |
|
|
1 бесплатное |
66 |
687 |
318 |
1827 |
Источник: получено автором с помощью SPSS Statistics
Таблица 7После исключения
|
in_app_purchase Внутриигровые покупки |
||||||
|
0 нет |
1 есть iap |
|||||
|
contain_add Содержит рекламу |
contain_add Содержит рекламу |
|||||
|
0 нет рекламы |
1 есть реклама |
0 нет рекламы |
1 есть реклама |
|||
|
Count |
Count |
Count |
Count |
|||
|
free Бесплатное |
0 платное |
205 |
16 |
75 |
57 |
|
|
1 бесплатное |
0 |
687 |
318 |
1827 |
Источник: получено автором с помощью SPSS Statistics
Для переменной «жанр игры» было создано 17 фиктивных дихотомических переменных, где 1 - соответствие определенному жанру, а 0 - несоответствие или принадлежность к другому жанру. Таким образом, номинальная переменная жанр, перекодированная в набор фиктивных переменных, может участвовать в дальнейшем количественном анализе, в том числе в построении регрессии. Были удалены наблюдения с выбросами по основным количественным переменным, чтобы не было сильных искажений при анализе данных и построении моделей.
Диаграмма 2 Пример выброса Источник: получено автором с помощью SPSS Statistics
В результате обработки данных осталось 3170 наблюдений, в следующей части работы можно увидеть, как они распределились по жанрам, типам монетизации, возрастным рейтингам и другим характеристикам, важным для исследования.
3.2 Описательные статистики
Жанр казино оказался самым немногочисленным в данной выборке.
Диаграмма 3Распределение наблюдений по жанрам игр
Источник: построено автором
В выборку попало 11% платных и 89% бесплатных игр
Диаграмма 4Распределение платных и бесплатных приложений
Источник: построено автором
Большинство игр имеют видео в описании на странице магазина приложений.
Диаграмма 5Распределение игр с видео в описании и без него
Источник: построено автором
Только у четверти игр не было содержательного описания к последнему обновлению или было слишком короткое описание, например, «Исправлены баги».
Диаграмма 6 Распределение игр с описанием обновлений и без него
Источник: построено автором
Большинство приложений не поддерживают операционную систему Android ниже четвертой версии.
Диаграмма 7Распределение игр по минимальным требованиям к версии Android
Источник: построено автором
Большинство игр не имеют возрастных ограничений, то есть отмечены рейтингом 3+.
Диаграмма 8Распределение игр по возрастному рейтингу
Источник: построено автором
Самая распространенная средняя оценка игрового приложения 4,5 звёзд.
Диаграмма 9Распределение игр по средней оценке игроков
Источник: построено автором
Только у трети изучаемых приложений отсутствуют внутриигровые покупки.
Диаграмма 10Распределение игр по наличию в них внутренних покупок Источник: построено автором
Подавляющее большинство игр показывают пользователям рекламу внутри приложения.
Диаграмма 11Распределение игр по наличию в них рекламы
Источник: построено автором
Полученные и обработанные данные далее использовались для анализа в соответствии с задачами исследования.
3.3 Проверка гипотез с помощью корреляций и t-тестов
Для проверки поставленных гипотез использованы методы сравнения средних для двух независимых выборок и корреляции Спирмена.
Таблица с корреляциями представлена ниже, по ней будут делаться выводы относительно всех порядковых и непрерывных переменных, фигурирующих в гипотезах.
Таблица 8Корреляции Спирмена
|
Spearman's rho |
st_revenue_dollars Месячная выручка в $ |
||
|
st_revenue_dollars Месячная выручка в $ |
Correlation Coefficient |
1,000 |
|
|
Sig. (2-tailed) |
|||
|
N |
3170 |
||
|
size_mb Размер приложения MB |
Correlation Coefficient |
,442** |
|
|
Sig. (2-tailed) |
,000 |
||
|
N |
2780 |
||
|
days_from_update Дней с момента обновления |
Correlation Coefficient |
-,391** |
|
|
Sig. (2-tailed) |
,000 |
||
|
N |
3170 |
||
|
price_rub Цена в рублях |
Correlation Coefficient |
,002 |
|
|
Sig. (2-tailed) |
,922 |
||
|
N |
3170 |
||
|
age_content_rating_number Возрастной рейтинг |
Correlation Coefficient |
,290** |
|
|
Sig. (2-tailed) |
,000 |
||
|
N |
3170 |
||
|
required_android_version Минимальная версия android |
Correlation Coefficient |
,164** |
|
|
Sig. (2-tailed) |
,000 |
||
|
N |
2999 |
||
|
reviews Количество отзывов |
Correlation Coefficient |
,506** |
|
|
Sig. (2-tailed) |
,000 |
||
|
N |
3170 |
||
|
installs Количество установок |
Correlation Coefficient |
,380** |
|
|
Sig. (2-tailed) |
,000 |
||
|
N |
3170 |
||
|
score Средний рейтинг |
Correlation Coefficient |
,234** |
|
|
Sig. (2-tailed) |
,000 |
||
|
N |
3166 |
||
|
st_internationalization_score Оценка локализации |
Correlation Coefficient |
,268** |
|
|
Sig. (2-tailed) |
,000 |
||
|
N |
3170 |
||
|
st_downloads_month Загрузок в месяц |
Correlation Coefficient |
,429** |
|
|
Sig. (2-tailed) |
,000 |
||
|
N |
3170 |
Источник: получено автором с помощью SPSS Statistics
Гипотеза 1: размер приложения отрицательно коррелирует с его выручкой.
Гипотеза не принимается. Значимый коэффициент корреляции 0,442 говорит о существовании умеренной положительной связи между выручкой игрового приложения и его размером. Таким образом, чем больше размер приложения, тем больше его выручка.
Гипотеза 2: время с момента последнего обновления отрицательно связано с месячной выручкой приложения.
Гипотеза принимается, так как на уровне значимости меньше 0,01 существует умеренная линейная зависимость между выручкой приложения и количеством дней с момента последнего его обновления. Коэффициент корреляции -0,391 отрицательный, значит чем больше дней прошло с момента обновления игры, тем меньше её месячная выручка.
Гипотеза 3: Платные игровые приложения приносят значимо большую выручку, чем бесплатные.
В таблицах ниже представлены результаты t-теста для независимых выборок.
Таблица 9
|
Group Statistics |
||||||
|
free Бесплатное |
N |
Mean |
Std. Deviation |
Std. Error Mean |
||
|
st_revenue_dollars Месячная выручка в $ |
1 бесплатное |
2820 |
144540,74 |
855852,564 |
16116,636 |
|
|
0 платное |
350 |
13409,71 |
108807,461 |
5816,003 |
Источник: получено автором с помощью SPSS Statistics
Нулевая гипотеза о равенстве дисперсий отклоняется, так как sig < 0,05, нужно использовать вторую строку таблицы «Критерий для независимых выборок».
Таблица 10
|
Критерий для независимых выборок |
|||||||||||
|
Levene's Test for Equality of Variances |
t-test for Equality of Means |
||||||||||
|
F |
Sig. |
t |
df |
Sig. (2-tailed) |
Mean Difference |
Std. Error Difference |
95% Confidence Interval of the Difference |
||||
|
Lower |
Upper |
||||||||||
|
Месячная выручка в $ |
Equal variances assumed |
27,853 |
,000 |
2,863 |
3168 |
,004 |
131131,030 |
45799,321 |
41331,702 |
220930,359 |
|
|
Equal variances not assumed |
7,653 |
3167,174 |
,000 |
131131,030 |
17133,939 |
97536,289 |
164725,772 |
Источник: получено автором с помощью SPSS Statistics
Двусторонняя значимость меньше 0,05, поэтому гипотеза о равенстве средних отклоняется, результаты значимы.
Гипотеза 3 не принимается, по групповым статистикам можно сделать обратный вывод о том, что бесплатные приложения приносят большую выручку, нежели платные.
Гипотеза 4: цена игрового приложения положительно связана с его выручкой.
Гипотеза не принимается, так как по результатам анализа, коэффициент корреляции (0,002) близок к нулю, что может говорить об отсутствии линейной связи между переменными. Более того, коэффициент не значимый так как уровень значимости равен 0,922.
Гипотеза 5: приложения с видео на странице имеют значимо большую выручку, чем приложения без видео
Таблица 11
|
Group Statistics |
||||||
|
contain_video Содержит видео в описании |
N |
Mean |
Std. Deviation |
Std. Error Mean |
||
|
st_revenue_dollars Месячная выручка в $ |
1 с видео |
1861 |
184196,78 |
948488,513 |
21986,641 |
|
|
0 без видео |
1309 |
53100,15 |
544528,802 |
15050,504 |
Источник: получено автором с помощью SPSS Statistics
Нулевая гипотеза о равенстве дисперсий отклоняется, так как sig < 0,05, нужно использовать вторую строку таблицы «Критерий для независимых выборок».
Таблица 12
|
Independent Samples Test |
|||||||||||
|
Levene's Test for Equality of Variances |
t-test for Equality of Means |
||||||||||
|
F |
Sig. |
t |
df |
Sig. (2-tailed) |
Mean Difference |
Std. Error Difference |
95% Confidence Interval of the Difference |
||||
|
Lower |
Upper |
||||||||||
|
st_revenue_dollars Месячная выручка в $ |
Equal variances assumed |
58,572 |
,000 |
4,505 |
3168 |
,000 |
131096,623 |
29097,040 |
74045,675 |
188147,571 |
|
|
Equal variances not assumed |
4,920 |
3057,023 |
,000 |
131096,623 |
26644,513 |
78853,654 |
183339,593 |
Источник: получено автором с помощью SPSS Statistics
Двусторонняя значимость меньше 0,05, поэтому гипотеза о равенстве средних отклоняется, результаты значимы.
Гипотеза 5 принимается, по групповым статистикам можно сделать вывод о том, что приложения с видео в магазине Google Play приносят большую выручку, нежели игры без видео.
Гипотеза 6: Приложения с флагом «выбор издателя» имеют значимо большую выручку, чем приложения без флага.
Таблица 13
|
Group Statistics |
||||||
|
editors_choice Выбор издателя |
N |
Mean |
Std. Deviation |
Std. Error Mean |
||
|
st_revenue_dollars Месячная выручка в $ |
1 Выбор издателя |
264 |
565470,45 |
1789532,629 |
110138,120 |
|
|
0 нет |
2906 |
90507,26 |
636665,904 |
11810,378 |
Источник: получено автором с помощью SPSS Statistics
Нулевая гипотеза о равенстве дисперсий отклоняется, так как sig < 0,05, нужно использовать вторую строку таблицы «Критерий для независимых выборок».
Таблица 14
|
Independent Samples Test |
|||||||||||
|
Levene's Test for Equality of Variances |
t-test for Equality of Means |
||||||||||
|
F |
Sig. |
t |
df |
Sig. (2-tailed) |
Mean Difference |
Std. Error Difference |
95% Confidence Interval of the Difference |
||||
|
Lower |
Upper |
||||||||||
|
st_revenue_dollars Месячная выручка в $ |
Equal variances assumed |
209,395 |
,000 |
9,254 |
3168 |
,000 |
474963,194 |
51325,983 |
374327,667 |
575598,721 |
|
|
Equal variances not assumed |
4,288 |
269,080 |
,000 |
474963,194 |
110769,538 |
256877,987 |
693048,401 |
Источник: получено автором с помощью SPSS Statistics
Двусторонняя значимость меньше 0,05, поэтому гипотеза о равенстве средних отклоняется, результаты значимы.
Гипотеза 6 принимается, по групповым статистикам можно сделать вывод о том, что приложения с флагом «выбор издателя» приносят большую выручку, нежели игры без него.
Гипотеза 7 будет проверена в следующей части работы.
Гипотеза 8: возрастной рейтинг отрицательно связан с выручкой приложения
Гипотеза не принимается, коэффициент корреляции говорит об обратном. На уровне значимости ниже 0,01 существует слабая положительная связь между возрастным рейтингом и выручкой, коэффициент корреляции равен 0,29. Чем выше возрастные ограничения в игре, тем большую выручку она приносит.
Гипотеза 9: минимальная версия ОС отрицательно связана с выручкой приложения
Гипотеза не принимается, значимый коэффициент корреляции говорит об обратном. Существует слабая положительная корреляция между требованиями к операционной системе и величиной выручки. Более коммерчески успешные игры требуют от пользователей более высокую версию Android.
Гипотеза 10: Приложения с описанием обновлений приносят значимо большую выручку, чем приложения без описаний.
Таблица 15
|
Group Statistics |
||||||
|
recent_changes_with_description Описание обновлений |
N |
Mean |
Std. Deviation |
Std. Error Mean |
||
|
st_revenue_dollars Месячная выручка в $ |
1 есть описание |
2438 |
161972,40 |
906850,411 |
18366,179 |
|
|
0 нет описания |
732 |
23783,61 |
285231,759 |
10542,469 |
Источник: получено автором с помощью SPSS Statistics
Нулевая гипотеза о равенстве дисперсий отклоняется, так как sig < 0,05, нужно использовать вторую строку таблицы «Критерий для независимых выборок».
Таблица 16
|
Independent Samples Test |
|||||||||||
|
Levene's Test for Equality of Variances |
t-test for Equality of Means |
||||||||||
|
F |
Sig. |
t |
df |
Sig. (2-tailed) |
Mean Difference |
Std. Error Difference |
95% Confidence Interval of the Difference |
||||
|
Lower |
Upper |
||||||||||
|
st_revenue_dollars Месячная выручка в $ |
Equal variances assumed |
52,125 |
,000 |
4,063 |
3168 |
,000 |
138188,789 |
34015,597 |
71493,963 |
204883,614 |
|
|
Equal variances not assumed |
6,525 |
3162,796 |
,000 |
138188,789 |
21176,878 |
96666,980 |
179710,597 |
Источник: получено автором с помощью SPSS Statistics
Двусторонняя значимость меньше 0,05, поэтому гипотеза о равенстве средних отклоняется, результаты значимы.
Гипотеза 10 принимается, по групповым статистикам можно сделать вывод о том, что приложения с описанием к обновлениям приносят большую выручку, нежели игры без него.
Гипотеза 11: Приложения со встроенными покупками приносят значимо большую выручку, чем приложения без них.
Таблица 17
|
Group Statistics |
||||||
|
in_app_purchase Внутриигровые покупки |
N |
Mean |
Std. Deviation |
Std. Error Mean |
||
|
st_revenue_dollars Месячная выручка в $ |
1 есть iap |
2266 |
181399,38 |
952133,241 |
20001,740 |
|
|
0 нет |
904 |
1379,76 |
8303,521 |
276,171 |
Источник: получено автором с помощью SPSS Statistics
Нулевая гипотеза о равенстве дисперсий отклоняется, так как sig < 0,05, нужно использовать вторую строку таблицы «Критерий для независимых выборок».
Таблица 18
|
Independent Samples Test |
|||||||||||
|
Levene's Test for Equality of Variances |
t-test for Equality of Means |
||||||||||
|
F |
Sig. |
t |
df |
Sig. (2-tailed) |
Mean Difference |
Std. Error Difference |
95% Confidence Interval of the Difference |
||||
|
Lower |
Upper |
||||||||||
|
st_revenue_dollars Месячная выручка в $ |
Equal variances assumed |
102,560 |
,000 |
5,684 |
3168 |
,000 |
180019,626 |
31670,965 |
117921,951 |
242117,300 |
|
|
Equal variances not assumed |
8,999 |
2265,863 |
,000 |
180019,626 |
20003,646 |
140792,245 |
219247,006 |
Источник: получено автором с помощью SPSS Statistics
Двусторонняя значимость меньше 0,05, поэтому гипотеза о равенстве средних отклоняется, результаты значимы.
Гипотеза 11 принимается, по групповым статистикам можно сделать вывод о том, что приложения с внутриигровыми покупками приносят большую выручку, нежели игры без них.
Гипотеза 12: Приложения с рекламой приносят значимо большую выручку, чем приложения без неё.
Таблица 19
|
Group Statistics |
||||||
|
contain_add Содержит рекламу |
N |
Mean |
Std. Deviation |
Std. Error Mean |
||
|
st_revenue_dollars Месячная выручка в $ |
1 есть реклама |
2581 |
80391,79 |
605512,617 |
11918,708 |
|
|
0 нет рекламы |
589 |
347720,03 |
1364104,951 |
56206,965 |
Источник: получено автором с помощью SPSS Statistics
Нулевая гипотеза о равенстве дисперсий отклоняется, так как sig < 0,05, нужно использовать вторую строку таблицы «Критерий для независимых выборок».
Таблица 20
|
Independent Samples Test |
|||||||||||
|
Levene's Test for Equality of Variances |
t-test for Equality of Means |
||||||||||
|
F |
Sig. |
t |
df |
Sig. (2-tailed) |
Mean Difference |
Std. Error Difference |
95% Confidence Interval of the Difference |
||||
|
Lower |
Upper |
||||||||||
|
st_revenue_dollars Месячная выручка в $ |
Equal variances assumed |
146,246 |
,000 |
-7,295 |
3168 |
,000 |
-267328,248 |
36644,565 |
-339177,727 |
-195478,769 |
|
|
Equal variances not assumed |
-4,653 |
641,772 |
,000 |
-267328,248 |
57456,754 |
-380154,196 |
-154502,300 |
Источник: получено автором с помощью SPSS Statistics
Двусторонняя значимость меньше 0,05, поэтому гипотеза о равенстве средних отклоняется, результаты значимы.
Гипотеза 12 не принимается, по групповым статистикам можно сделать обратный вывод о том, что игровые приложения с рекламой приносят меньшую выручку, нежели без нее.
Гипотеза 13: уровень локализации приложения положительно связан с выручкой приложения.
Гипотеза подтверждается. Существует значимая, но слабая (0,268) положительная корреляция между выручкой игры и уровнем её локализации.
3.4 Однофакторный дисперсионный анализ
Для проверки седьмой гипотезы недостаточно проведения t-теста для независимых выборок, так как выборок в данном случае не две, а 17 соответственно количеству жанров игр.
Гипотеза 7: игры разных жанров не гомогенны по выручке. Среди жанров есть такие, которые значимо отличаются от других.
Для изучения этой гипотезы был использован однофакторный дисперсионный анализ.
Таблица 21
|
ANOVA |
||||||
|
st_revenue_dollars Месячная выручка в $ |
||||||
|
Sum of Squares |
df |
Mean Square |
F |
Sig. |
||
|
Between Groups |
18297755454181,125 |
16 |
1143609715886,320 |
1,754 |
,032 |
|
|
Within Groups |
2056059262371121,500 |
3153 |
652096182166,547 |
|||
|
Total |
2074357017825302,500 |
3169 |
Источник: получено автором с помощью SPSS Statistics
Значимость показывает вероятность того, что наблюдаемые различия между группами случайны. В данном случае, значимость ниже 0,05, однако уже на уровне значимости 0,01 нельзя говорить о статистически достоверных различиях между группами. В данном исследовании мы принимаем уровень значимости 0,05 и считаем, что найденные различия между группами не случайны.
Таблица 22Post Hoc Tests. Homogeneous Subsets
|
Месячная выручка в $ |
||||
|
Duncana,b |
||||
|
main_category_fin Жанр игры |
N |
Subset for alpha = 0.05 |
||
|
1 |
2 |
|||
|
9 GAME_MUSIC |
142 |
28707,75 |
||
|
4 GAME_BOARD |
110 |
39936,36 |
||
|
8 GAME_EDUCATIONAL |
220 |
59407,73 |
||
|
12 GAME_ROLE_PLAYING |
129 |
74515,50 |
||
|
2 GAME_ADVENTURE |
107 |
92064,49 |
||
|
3 GAME_ARCADE |
206 |
103390,29 |
||
|
7 GAME_CASUAL |
118 |
108064,41 |
||
|
11 GAME_RACING |
301 |
108811,63 |
||
|
16 GAME_TRIVIA |
271 |
111578,97 |
||
|
14 GAME_SPORTS |
206 |
116343,69 |
||
|
17 GAME_WORD |
286 |
128860,84 |
||
|
13 GAME_SIMULATION |
209 |
144944,02 |
||
|
10 GAME_PUZZLE |
237 |
162177,22 |
||
|
1 GAME_ACTION |
253 |
173374,31 |
||
|
5 GAME_CAR |
106 |
176900,00 |
||
|
15 GAME_STRATEGY |
230 |
251451,30 |
||
|
6 GAME_CASINO |
39 |
621956,41 |
||
|
Sig. |
,059 |
1,000 |
Источник: получено автором с помощью SPSS Statistics
Тест Дункана выделил две гомогенные подгруппы, при этом во вторую группу попали только игры жанра Казино. Это значит, что игры жанра казино значимо отличаются по выручке от игр всех других жанров. Средние выручки игр остальных жанров не различаются значимо между собой.
Гипотеза 7 принимается, так как не все жанры игр гомогенны по выручке.
В этой части работы сравнивалась средняя выручка по жанрам игр, но для более глубокого изучения различий в выручке игр разных жанров можно изучить, как меняется выручка с изменением других переменных внутри каждого жанра, это будет сделано в конце этой главы.
3.5 Множественная линейная регрессия
После того, как с помощью корреляций и t-тестов были проверены основные гипотезы, мы знаем, какие характеристики взаимосвязаны с коммерческим успехом мобильных игр, а также мы знаем направление этой взаимосвязи. Для подтверждения полученных результатов и для более четкого выражения взаимосвязи можно прибегнуть к методу регрессионного анализа. Построение множественной регрессии позволит вывести формулу коммерческого успеха мобильных игр, в которую войдет сразу несколько характеристик, при этом будет понятно, как увеличение значения каждой из характеристик увеличивает или уменьшает прогнозируемую выручку игры.
С помощью метода stepwise была построена множественная линейная регрессия. Вовлечение переменных в расчёт произошло за восемь шагов. В сводной таблице видно, что с добавлением каждой переменной в модель коэффициент детерминации увеличивается, это значит, что каждая из независимых переменных вносит вклад в объяснение зависимой. Скорректированный коэффициент детерминации немного ниже обычного, так как в модели большое число независимых переменных. В целом, значение коэффициента низкое, это означает, что только небольшая доля общей дисперсии объяснена моделью. Следовательно, модель требует улучшений, например, с помощью учета нелинейной связи или добавления предикторов.
P-значение для F-статистики стремится к нулю, это значит, что на любом уровне значимости гипотеза о незначимости регрессии отвергается, следовательно, хотя бы один коэффициент в регрессии не равен нулю.
Каждый отдельный коэффициент регрессии не равен нулю на уровне значимости не ниже 4%.
Таблица 23Сводная таблица по линейной модели
|
Model Summaryi |
||||||
|
Model |
R |
R Square |
Adjusted R Square |
Std. Error of the Estimate |
Durbin-Watson |
|
|
1 |
,169a |
,029 |
,028 |
714935,654 |
||
|
2 |
,214b |
,046 |
,045 |
708675,880 |
||
|
3 |
,240c |
,057 |
,056 |
704554,286 |
||
|
4 |
,255d |
,065 |
,064 |
701826,667 |
||
|
5 |
,265e |
,070 |
,069 |
699952,475 |
||
|
6 |
,271f |
,073 |
,071 |
698916,141 |
||
|
7 |
,276g |
,076 |
,074 |
697984,033 |
||
|
8 |
,279h |
,078 |
,075 |
697560,624 |
1,949 |
Источник: получено автором с помощью SPSS Statistics
На диаграмме ниже видно, что распределение остатков регрессии близко к нормальному. Тест Дарбина-Ватсона на автокорреляцию остатков показывает значение, близкое к 2 (1,949). Из этого можно сделать вывод, что проблемы гетероскедантичности нет.
Тест VIF последовательно строит несколько регрессий, где каждая переменная, включенная в модель, по очереди становится зависимой. Значения VIF, близкие к единице (ниже 8), говорят об отсутствии проблемы мультиколлинеарности в модели, мы можем сказать, что сильной зависимости между предикторами регрессии нет.
Диаграмма 12Распределение остатков линейной регрессии
Источник: получено автором с помощью SPSS Statistics
Со значимостью меньше 0,05 в уравнение регрессии вошли размер приложения, наличие флага «выбор издателя», наличие рекламы, цена в рублях, возрастной рейтинг, время с момента последнего обновления, оценка локализации приложения на разные языки и принадлежность к жанру стратегий. Остальные коэффициенты регрессии не показали значимого отличия от нуля на заданном уровне значимости, поэтому не вошли в модель.
Таблица 24Множественная линейная регрессия
|
Coefficientsa |
|||||||||
|
Model |
Unstandardized Coefficients |
Standardized Coefficients |
t |
Sig. |
Collinearity Statistics |
||||
|
B |
Std. Error |
Beta |
Tolerance |
VIF |
|||||
|
8 |
(Constant) |
38526,254 |
65072,926 |
,592 |
,554 |
||||
|
Размер приложения MB |
2235,922 |
530,654 |
,084 |
4,214 |
,000 |
,841 |
1,190 |
||
|
Выбор издателя |
329736,374 |
51102,087 |
,122 |
6,453 |
,000 |
,936 |
1,069 |
||
|
Содержит рекламу |
-272458,058 |
38777,910 |
-,147 |
-7,026 |
,000 |
,760 |
1,317 |
||
|
Цена в рублях |
-979,348 |
215,038 |
-,095 |
-4,554 |
,000 |
,774 |
1,291 |
||
|
Возрастной рейтинг |
13238,794 |
3549,079 |
,072 |
3,730 |
,000 |
,905 |
1,105 |
||
|
Дней с момента обновления |
-112,591 |
38,492 |
-,056 |
-2,925 |
,003 |
,911 |
1,098 |
||
|
Оценка локализации |
2396,141 |
843,369 |
,055 |
2,841 |
,005 |
,887 |
1,127 |
||
|
Стратегии |
106774,072 |
51185,008 |
,038 |
2,086 |
,037 |
,996 |
1,004 |
Источник: получено автором с помощью SPSS Statistics
Формула коммерческого успеха формируется через уравнение линейной регрессии следующим образом:
Месячная выручка в долларах = 38526,254 + 2235,922 * Размер приложения в MB + 329736,374 * Выбор издателя - 272458,058 * Наличие рекламы - 979,348 * Цена в рублях + 13238,794 * Возрастной рейтинг - 112,591 * Количество дней с момента обновления + 2396,141 * Оценка локализации + 106774,072 * Принадлежность к жанру стратегий
Таким образом, бесплатная мобильная головоломка размером 50 MB, содержащая рекламу, имеющая возрастной рейтинг 3+, обновлённая месяц назад, среднего уровня локализацией (на 50 баллов из 100) будет иметь предсказанную месячную выручку $11650:
38526,254 + 2235,922 * 40 + 0 - 272458,058 - 0 + 13238,794 * 3 - 112,591 * 30 + 2396,141 * 50 + 0 = 11650.778
Стоит отметить, что полученное по формуле значение может оказаться отрицательным. Так как зависимая переменная в уравнении регрессии - это выручка, она не может принимать отрицательных значений, поэтому, в случае получения по этой формуле отрицательного числа, необходимо принимать его за ноль (минимально возможную выручку).
Полученная модель обладает низкой степенью подгонки, поэтому можно предположить, что во взаимосвязи переменных есть нелинейности. Для проверки этого предположения были построены точечные диаграммы, на которых видно, что логарифмическая функция лучше описывает данные, чем линейная. В следующей части работы даны результаты построения логарифмической регрессии.
Диаграмма 13Пример нелинейной связи между изучаемыми переменными
Источник: получено автором с помощью SPSS Statistics
Проведенный анализ ограничивался проверкой линейной связи между переменными, однако стоит предположить, что существует нелинейная связь. Например, увеличение размера игры может положительно влиять на выручку до тех пор, пока этот размер не достигнет определенного значения, тогда зависимость будет логарифмической или квадратичной. Проверить это можно с помощью построения нелинейной регрессии.
3.6 Логарифмическая и полулогарифмическая регрессии
Как было сказано выше, взаимосвязь между исследуемыми переменными не линейна, поэтому была предпринята попытка построения нелинейных регрессий, среди которых полулогарифмическая и логарифмическая отличались лучшим качеством по качеству подгонки и значимости коэффициентов. Полулогарифмическая модель показала более высокое качество подгонки, чем логарифмическая, в этой части работы будут описаны результаты построения обеих моделей.
Для этого от всех не дихотомических переменных был взят натуральный логарифм, после чего каждая переменная пошаговым методом включалась в модель, в которой остались только те предикторы, коэффициент при которых был не нулевым на 5% уровне значимости. Вовлечение переменных в расчёт произошло за семь шагов.
Качество подгонки этой модели намного выше, чем для линейной. R2 показывает, что всего 26,5% общей дисперсии зависимой переменной объяснено моделью. Скорректированный на число наблюдений R2 равен 0,248 - это не очень большое значение, но при таком значении регрессия может быть адекватной.
P-значение для F-статистики стремится к нулю, это значит, что на любом уровне значимости гипотеза о незначимости регрессии отвергается, следовательно, хотя бы один коэффициент в регрессии не равен нулю.
Каждый отдельный коэффициент регрессии не равен нулю на уровне значимости не ниже 3%.
Таблица 25Сводная таблица по логарифмической модели
|
Model Summaryh |
||||||
|
Model |
R |
R Square |
Adjusted R Square |
Std. Error of the Estimate |
Durbin-Watson |
|
|
1 |
,269a |
,073 |
,069 |
2,29979 |
||
|
2 |
,366b |
,134 |
,128 |
2,22608 |
||
|
3 |
,433c |
,187 |
,179 |
2,15988 |
||
|
4 |
,468d |
,219 |
,209 |
2,12096 |
||
|
5 |
,489e |
,239 |
,226 |
2,09692 |
||
|
6 |
,503f |
,253 |
,238 |
2,08160 |
||
|
7 |
,515g |
,265 |
,248 |
2,06743 |
2,145 |
Источник: получено автором с помощью SPSS Statistics
На диаграмме ниже видно, что распределение остатков регрессии близко к нормальному. Тест Дарбина-Ватсона на автокорреляцию остатков показывает значение, близкое к 2 (2,145). Из этого можно сделать вывод, что проблемы гетероскедантичности нет.
Диаграмма 14Распределение остатков логарифмической регрессии
Источник: получено автором с помощью SPSS Statistics
Тест VIF последовательно строит несколько регрессий, где каждая переменная, включенная в модель, по очереди становится зависимой. Значения VIF, близкие к единице (ниже 8), говорят об отсутствии проблемы мультиколлинеарности в модели, мы можем сказать, что сильной зависимости между предикторами регрессии нет.
Таблица 26Коэффициенты логарифмической регрессии
|
Coefficientsa |
|||||||||
|
Model |
Unstandardized Coefficients |
Standardized Coefficients |
t |
Sig. |
Collinearity Statistics |
||||
|
B |
Std. Error |
Beta |
Tolerance |
VIF |
|||||
|
7 |
(Constant) |
,732 |
,897 |
,816 |
,415 |
||||
|
Выбор издателя |
2,402 |
,540 |
,225 |
4,447 |
,000 |
,966 |
1,035 |
||
|
ln_size_mb |
,507 |
,141 |
,190 |
3,587 |
,000 |
,879 |
1,137 |
||
|
ln_price_rub |
,644 |
,127 |
,263 |
5,069 |
,000 |
,916 |
1,092 |
||
|
ln_age_content_rating_number |
,728 |
,184 |
,200 |
3,962 |
,000 |
,964 |
1,038 |
||
|
Внутриигровые покупки |
,692 |
,261 |
,142 |
2,656 |
,008 |
,867 |
1,153 |
||
|
ln_days_from_update |
-,153 |
,065 |
-,122 |
-2,348 |
,020 |
,918 |
1,089 |
||
|
Ролевые |
-1,111 |
,491 |
-,113 |
-2,261 |
,024 |
,994 |
1,006 |
Источник: получено автором с помощью SPSS Statistics
Формула коммерческого успеха формируется через уравнение логарифмической регрессии следующим образом:
Ln месячной выручки в долларах = 0,732 + 2,402 * Выбор издателя + 0,507 * ln размера в MB + 0,644 * ln цены в рублях + 0,728 * ln возратного рейтинга + 0,692 * наличие внутриигровых покупок - 0,153 * ln дней с момента обновления - 1,111 * принадлежность к жанру ролевых игр
Таким образом, бесплатная мобильная головоломка с внутриигровыми покупками размером 50 MB, имеющая возрастной рейтинг 3+, обновлённая месяц назад, будет иметь предсказанную месячную выручку $159:
0,732 + 0 + 0,507 * ln50 + 0 + 0,728 * 3 + 0,692 - 0,153 * ln30 - 0 = 5,071
Выручка = е5,071 = 159.33
По данному уравнению видно, что приложения флагом «выбор издателя» имеют выручку на 240% больше, чем игры без флага. Повышение размера приложения на 1% увеличивает выручку на 51%. Повышение цены игры на 1% увеличивает выручку на 64%. При росте возрастного рейтинга на 1%, выручка увеличивается на 73%. Приложения с внутриигровыми покупками зарабатывают на 69% больше, чем приложения без них. При увеличении давности обновления на 1%, выручка приложения падает на 15%.
Для построения полулогарифмической модели от регрессора был взят натуральный логарифм. Вовлечение переменных в расчёт пошаговым методом произошло за тринадцать шагов, коэффициент при каждой переменной не нулевой на 5% уровне значимости.
Качество подгонки этой модели выше, чем для линейной и логарифмической. R2 показывает, что 41% общей дисперсии зависимой переменной объяснено моделью. Скорректированный на число наблюдений R2 равен 0,404 - но при таком значении регрессия может считаться адекватной.
P-значение для F-статистики стремится к нулю, это значит, что на любом уровне значимости гипотеза о незначимости регрессии отвергается, следовательно, хотя бы один коэффициент в регрессии не равен нулю.
Каждый отдельный коэффициент регрессии не равен нулю на уровне значимости не ниже 2%.
Таблица 27Сводная таблица по полулогарифмической модели
|
Model Summaryn |
||||||
|
Model |
R |
R Square |
Adjusted R Square |
Std. Error of the Estimate |
Durbin-Watson |
|
|
1 |
,462a |
,213 |
,213 |
2,63966 |
||
|
2 |
,519b |
,269 |
,269 |
2,54429 |
||
|
3 |
,559c |
,312 |
,311 |
2,46905 |
||
|
4 |
,587d |
,345 |
,344 |
2,41060 |
||
|
5 |
,602e |
,363 |
,362 |
2,37701 |
||
|
6 |
,619f |
,383 |
,382 |
2,33934 |
||
|
7 |
,626g |
,392 |
,390 |
2,32347 |
||
|
8 |
,630h |
,397 |
,395 |
2,31409 |
||
|
9 |
,633i |
,400 |
,398 |
2,30787 |
||
|
10 |
,635j |
,403 |
,401 |
2,30309 |
||
|
11 |
,636k |
,405 |
,402 |
2,30042 |
||
|
12 |
,637l |
,406 |
,403 |
2,29859 |
||
|
13 |
,638m |
,407 |
,404 |
2,29667 |
2,061 |
Источник: получено автором с помощью SPSS Statistics
На диаграмме ниже видно, что распределение остатков регрессии близко к нормальному. Тест Дарбина-Ватсона на автокорреляцию остатков показывает значение, близкое к 2 (2,061), значит, проблемы гетероскедантичности нет.
Значения VIF, близкие к единице (ниже 8), говорят об отсутствии проблемы мультиколлинеарности в модели, мы можем сказать, что сильной зависимости между предикторами регрессии нет.
Диаграмма 15Распределение остатков полулогарифмической регрессии
Источник: получено автором с помощью SPSS Statistics
Таблица 28 Коэффициенты полулогарифмической регрессии
|
Coefficientsa |
|||||||||
|
Model |
Unstandardized Coefficients |
Standardized Coefficients |
t |
Sig. |
Collinearity Statistics |
||||
|
B |
Std. Error |
Beta |
Tolerance |
VIF |
|||||
|
13 |
(Constant) |
3,082 |
,284 |
10,836 |
,000 |
||||
|
Размер приложения MB |
,028 |
,002 |
,260 |
15,591 |
,000 |
,772 |
1,296 |
||
|
Выбор издателя |
2,148 |
,169 |
,194 |
12,696 |
,000 |
,925 |
1,081 |
||
|
Содержит рекламу |
-1,881 |
,137 |
-,248 |
-13,723 |
,000 |
,659 |
1,518 |
||
|
Внутриигровые покупки |
,710 |
,111 |
,109 |
6,373 |
,000 |
,735 |
1,361 |
||
|
Возрастной рейтинг |
,105 |
,012 |
,139 |
8,951 |
,000 |
,897 |
1,115 |
||
|
Дней с момента обновления |
-,001 |
,000 |
-,134 |
-8,545 |
,000 |
,878 |
1,139 |
||
|
Оценка локализации |
,016 |
,003 |
,090 |
5,617 |
,000 |
,831 |
1,203 |
||
|
Бесплатное |
1,419 |
,224 |
,150 |
6,330 |
,000 |
,381 |
2,622 |
||
|
Описание обновлений |
,398 |
,108 |
,057 |
3,704 |
,000 |
,907 |
1,103 |
||
|
Цена в рублях |
,003 |
,001 |
,080 |
3,605 |
,000 |
,441 |
2,265 |
||
|
Ролевые |
-,604 |
,219 |
-,041 |
-2,762 |
,006 |
,994 |
1,006 |
||
|
Музыкальные |
-,502 |
,212 |
-,035 |
-2,374 |
,018 |
,995 |
1,005 |
||
|
Содержит видео в описании |
,234 |
,099 |
,039 |
2,365 |
,018 |
,801 |
1,248 |
Источник: получено автором с помощью SPSS Statistics
Формула коммерческого успеха формируется через уравнение полулогарифмической регрессии следующим образом:
Ln месячной выручки в долларах = 3,082 + 0,028 * Размер приложения + 2,148 * Выбор издателя - 1,881 * содержание рекламы + 0,710 * наличие внутриигровых покупок + 0,105 * Возрастной рейтинг - 0,001 * количество дней с момента обновления + 0,016 * Оценка локализации + 1,419 * Бесплатное + 0,398 * Описание обновлений + 0,003 * Цена в рублях - 0,604 * Ролевые - 0,502 * Музыкальные + 0,234 * Наличие видео в описании
Таким образом, бесплатная мобильная головоломка с внутриигровыми покупками и рекламой размером 50 MB, имеющая возрастной рейтинг 3+, обновлённая месяц назад, с хорошей локализацией (80 баллов), с видео в описании, но без подробного описания обновлений будет иметь предсказанную месячную выручку $685:
3,082 + 0,028 * 50 + 0 - 1,881 + 0,710 + 0,105 * 3 - 0,001 * 30 + 0,016 * 80 + 1,419 + 0 + 0 - 0 - 0 + 0,234 =6,529
Выручка = е5,071 = 684,713
Результаты, полученные с помощью регрессионного анализа, соответствуют результатам корреляций и t-тестов, что подтверждает правильность полученных взаимосвязей характеристик приложений и выручки. Однако с помощью уравнений регрессии можно можно точнее определить, насколько изменение той или иной характеристики приложения повлияет на его выручку.
3.7 Различия в выводах по жанрам игр
В начале работы было сделано предположение, что факторы, влияющие на выручку мобильных игр, имеют разное влияние на игры разного жанра. Если это так, то выводы, сделанные в предыдущих частях аналитической главы могут служить только ориентиром для мобильных игр в целом, а для получения более точной взаимосвязи характеристик мобильных игр и их выручки, нужно ориентироваться на жанр игры.
Для проверки этого предположения, были построены точечные диаграммы для каждой независимой переменной с отражением линейной связи этой переменной и выручки мобильных игр в разбивке по жанрам.
На диаграмме ниже представлена взаимосвязь цены игр и их выручки. Наблюдения из разных жанров закодированы цветом, как и регрессионные прямые, соответствующие каждому жанру. На диаграмме было отражено 3170 игр, поэтому большая часть наблюдений перекрывает друг друга, ось ординат представлена не полностью, так как максимальная выручка в выборке $15000000, однако игр с такой высокой выручкой немного и их представление на диаграмме сделало бы неразличимой основную часть наблюдений, находящуюся снизу оси выручки.
Регрессионная прямая для всех наблюдений представлена пунктирной линией. По этому типу будут представлены все последующие диаграммы.
Обратим внимание на взаимосвязь цены и выручки. На диаграмме видно, что большая часть регрессионных прямых имеет схожий наклон с общей регрессией, а также примерно одинаковый свободный член. Однако, есть прямые, которые визуально сильно отличаются от общей регрессионной прямой.
Диаграмма 16 Взаимосвязь цены и выручки
Источник: получено автором с помощью SPSS Statistics
Спортивные и настольные игры имеют противоположную связь цены и выручки, так как наклон их прямых положительный. В отличие от остальных игр, при повышении цены на настольные и спортивные игры повышается их выручка. Однако для настольных игр эта связь не сильно выражена, наклон прямой незначительный.
Прямая для музыкальных игр более пологая, чем общая регрессионная прямая. Это говорит о том, что для игр данного жанра повышение цены соответствует менее сильному падению выручки.
Диаграмма 17Взаимосвязь размера приложения и выручки
Источник: получено автором с помощью SPSS Statistics
Размер приложения положительно связан с выручкой игр всех жанров, однако сила этой связи различается между жанрами.
На диаграмме прямая для игр-симуляций более пологая, чем общая регрессионная прямая. Это говорит о том, что для игр-симуляций увеличение веса приложения соответствует менее сильному увеличению выручки, чем для остальных игр.
Диаграмма 18Взаимосвязь размера приложения и выручки
Источник: получено автором с помощью SPSS Statistics
На диаграмме видно, что наклон регрессионных прямых сильно различается между жанрами. Разные точки пересечения оси ординат говорят о различиях в свободном члене регрессий.
Наклон всех прямых положительный, значит повышение возрастного рейтинга связано с увеличением выручки во всех играх, независимо от жанра. Однако, сильно различающиеся наклоны прямых и пересечения с осью ординат, говорят о том, что данную взаимосвязь лучше изучать отдельно для каждого жанра игр, так как общая регрессионная прямая может давать плохое приближение.
Диаграмма 19Взаимосвязь требований к ПО и выручки
Источник: получено автором с помощью SPSS Statistics
Игры жанров казино и головоломки имеют обратную зависимость между требованиями к версии android и выручкой. В отличие от остальных жанров, головоломки и казино, требующие более высокую версию android, имеют более низкую выручку.
Словесные и музыкальные игры имеют более пологий наклон прямой, увеличение требований к ПО соответствует менее сильному повышению выручки, чем у игр других жанров.
Прямая для стратегий имеет крутой наклон и находится выше общей регрессионной прямой, что означает, что оба коэффициента регрессионного уравнения выше, чем для общей регрессии.
Диаграмма 20Взаимосвязь локализации приложения и выручки
Источник: получено автором с помощью SPSS Statistics
Локализация игр на разные языки имеет положительную связь с размером выручки для всех жанров игр. Однако сила этой связи различается по жанрам.
Образовательные, музыкальные, ролевые, настольные и спортивные игры отличаются более слабой положительной взаимосвязью между выручкой и локализацией.
Диаграмма 21Выручка платных и бесплатных игр
Источник: получено автором с помощью SPSS Statistics
Как видно из диаграммы, бесплатные приложения приносят более высокую выручку, чем платные для всех жанров игр. Однако, для настольных, спортивных и музыкальных игр эта взаимосвязь почти отсутствует, в то время как принадлежность казино и стратегий к бесплатным играм сильнее повышает их выручку, чем для игр других жанров.
Диаграмма 22Наличие внутриигровых покупок и выручка
Источник: получено автором с помощью SPSS Statistics
Внутриигровые покупки всегда связаны с более высокой выручкой игр, однако для казино и стратегий эта взаимосвязь более выражена. Предсказанная выручка казино и стратегий с внутренними покупками выше, чем для игр других жанров. Настольные и музыкальные игры, наоборот, имеют менее сильную связь выручки и внутриигровых покупок.
Диаграмма 23Наличие рекламы и выручка
Источник: получено автором с помощью SPSS Statistics
Содержание рекламы в играх связано с более низкой выручкой, об этом свидетельствует отрицательный наклон регрессионной прямой. Однако для некоторых жанров эта связь практически отсутствует.
Карточные игры отличаются обратной взаимосвязью. Карточные игры с рекламой имеют большую предсказанную выручку, чем игры этого жанра без рекламы.
Таким образом, подтвердилось предположение о том, что факторы, влияющие на выручку мобильных игр, имеют разное влияние на игры разного жанра. В данной части работы были описаны особенно яркие отличия. На основе этих отличий, нужно скорректировать выводы, сделанные в предыдущих частях, введя необходимые исключения.
3.8 Дерево классификации
Ещё одним методом спрогнозировать выручку игры по её характеристикам является построение деревьев классификации.
Для построения дерева была создана новая переменная high revenue, которая отделяла 25% игр с самой высокой выручкой от всех остальных игр. С помощью описательных статистик и построения коробчатой диаграммы было выявлено, что 25% игр имеют выручку выше $9000.
Диаграмма 24Распределение игр по выручке
Источник: получено автором с помощью SPSS statistics
После получения новой переменной были построены деревья классификации методами CHAID, CRT и QUEST. Дерево, построенное методом CRT имело самое высокое качество предсказаний - 83%, в этой части работы будет описано это дерево.
Таблица 29 Качество классификации
|
Classification |
||||
|
Observed |
Predicted |
|||
|
,00 |
1,00 |
Percent Correct |
||
|
,00 |
2215 |
161 |
93,2% |
|
|
1,00 |
370 |
424 |
53,4% |
|
|
Overall Percentage |
81,5% |
18,5% |
83,2% |
|
|
Growing Method: CRT Dependent Variable: High_revenue |
Источник: получено автором с помощью SPSS statistics
Как видно из таблицы, дерево верно предсказывает игры с невысокой выручкой в 93% случаев, а игры с высокой выручкой в 53%. Учитывая, что игр с высокой выручкой всего 25%, качество предсказаний 53% является хорошим, так как это в два раза выше, чем если бы принадлежность к группе с высокой выручкой предсказывалась случайным образом.
В диаграмме ниже можно увидеть само дерево классификации. Каждый терминальный узел дерева нужно рассматривать по отдельности.
Так, например узел 7 показывает, что с 99% вероятностью игра не будет иметь высокую выручку, если она имеет размер меньше 50,5MB, обновлялась меньше 30 дней назад и не имеет внутриигровых покупок.
Узел 42 показывает, что игра будет иметь высокую выручку с вероятностью 77%, если она имеет размер больше 89,5MB, обладает флагом «Выбор издателя» и не содержит рекламы.
Таким образом, зная комбинации характеристик игры можно с вероятностью 82% предсказывать её коммерческую успешность. Это может помочь команде, начинающей игровой проект определиться с целевым сочетанием характеристик игры.
Диаграмма 25Дерево классификации
3.9 Выводы и рекомендации создателям игр
На основе анализа данных и сделанных выводов, была составлена обобщающая таблица и даны рекомендации создателям игр.
Таблица 30Характеристики игр и их влияние на коммерческий успех
|
Характеристика |
Влияние на коммерческий успех |
Исключения и особенности жанров |
|
|
Размер приложения |
положительное |
· для игр-симуляций увеличение веса приложения соответствует менее сильному увеличению выручки, чем для остальных игр |
|
|
Бесплатное приложение |
положительное |
· для настольных, спортивных и музыкальных игр взаимосвязь почти отсутствует · принадлежность казино и стратегий к бесплатным играм сильнее повышает их выручку, чем для игр других жанров |
|
|
Возрастной рейтинг |
положительное |
- |
|
|
Требуемая версия ПО |
положительное |
· Казино и головоломки имеют обратную зависимость между требованиями к версии android и выручкой · Для словесных и музыкальных игр увеличение требований к ПО соответствует менее сильному повышению выручки, чем у игр других жанров |
|
|
Видео на странице маркета |
положительное |
- |
|
|
Наличие описания к обновлениям |
положительное |
- |
|
|
Наличие встроенных покупок |
положительное |
· Предсказанная выручка казино и стратегий с внутренними покупками выше, чем для игр других жанров. · Настольные и музыкальные игры имеют менее сильную связь выручки и внутриигровых покупок. |
|
|
Флаг «Выбор издателя» |
положительное |
- |
|
|
Уровень локализации |
положительное |
· Образовательные, музыкальные, ролевые, настольные и спортивные игры отличаются более слабой положительной взаимосвязью между выручкой и локализацией |
|
|
Жанры «Казино» и «Стратегии» |
положительное |
- |
|
|
Жанр «Ролевые» и «Музыкальные» |
отрицательное |
- |
|
|
Время с момента последнего обновления |
отрицательное |
- |
|
|
Цена приложения |
отрицательное |
· Спортивные и настольные игры имеют противоположную связь цены и выручки · Для музыкальных игр повышение цены соответствует менее сильному падению выручки |
|
|
Наличие рекламы |
отрицательное |
· Для карточных игр - положительное |
Источник: составлено автором
Исходя из этих выводов можно сделать следующие рекомендации разработчикам и дизайнерам мобильных игр:
1) не нужно пытаться ограничить размер приложения, так как приложения, занимающие больше памяти на смартфонах пользователей приносят большую выручку;
2) необходимо часто выпускать обновления игры;
3) лучше создавать бесплатное приложение с внутренними покупками, так как внутриигровые покупки связаны с большей выручкой игр (кроме настольных и музыкальных), а платные приложения и приложения с рекламой приносят значимо меньшую выручку, чем бесплатные и игры без рекламы;
4) не нужно бояться ограничить аудиторию игры возрастным рейтингом и более высокими требованиями к операционной системе, так как игры с более высокими возрастными ограничениями приносят большую выручку, как и игры с высокими требованиями к ОС;
5) стремление попасть в рекомендации магазина обосновано более высокой ожидаемой выручкой рекомендованных приложений, попадание в фичеринг действительно является фактором коммерческого успеха игры - флаг выбора издателя увеличивает прогнозируемую выручку в несколько раз;
Заключение. Выводы и предложения
В рамках этой работы были собраны данные о 3170 мобильных игровых приложениях, что позволило провести репрезентативное количественное исследование и анализировать данные об играх в разрезе жанров.
Для выбора методологии исследования была проанализирована литература по теме, на основе которой выбраны предикторы и показатель коммерческого успеха, а также оптимальные для проведения исследования методы.
Проведен анализ данных с целью проверки основных гипотез, построены корреляции, множественная, логарифмическая и полулогарифмическая регрессии, проведен однофакторный дисперсионный анализ. Для выявления жанровых особенностей и исключений из найденных закономерностей, проанализированы регрессионные прямые по характеристикам успеха в разрезе жанров игр. Построено дерево классификации, предсказывающее принадлежность к коммерчески успешным играм, исходя из значений характеристик мобильных игр.
. По результатам исследования сделаны выводы относительно характеристик мобильных игр и дана оценка их влияния на коммерческий успех. Даны рекомендации разработчикам и дизайнерам мобильных игровых приложений, указаны жанровые особенности предлагаемых рекомендаций, так как не все жанры игр подчиняются выявленным «законам коммерческого успеха».
С помощью анализа количественных данных были сделаны следующие выводы:
· чем больше размер приложения, тем больше его выручка;
· чем больше дней прошло с момента обновления игры, тем меньше её месячная выручка;
· бесплатные приложения приносят большую выручку, нежели платные, однако для настольных, спортивных и музыкальных игр эта взаимосвязь почти отсутствует;
· игровые приложения с рекламой приносят меньшую выручку, нежели без нее, исключение составляют карточные игры, где приложения с рекламой более коммерчески успешны;
· существует значимая, но слабая положительная корреляция между выручкой игры и уровнем её локализации;
· существует слабая положительная связь между возрастным рейтингом и выручкой. Чем выше возрастные ограничения в игре, тем большую выручку она приносит;
· существует слабая положительная корреляция между требованиями к операционной системе и величиной выручки. Более коммерчески успешные игры требуют от пользователей более высокую версию Android, исключение составляют игры жанра казино и головоломки;
· приложения с видео в магазине Google Play приносят большую выручку, нежели игры без видео;
· приложения с флагом «выбор издателя» приносят большую выручку, нежели игры без него;
· приложения с описанием к обновлениям приносят большую выручку, нежели игры без него;
· приложения с внутриигровыми покупками приносят большую выручку, нежели игры без них;
· принадлежность игры к жанрам «казино» и «стратегии» связано с большей выручкой приложения, а принадлежность к жанру «ролевые» - с меньшей.
Исходя из этого, были сделаны рекомендации разработчикам и дизайнерам мобильных игр, помогающие правильно расставить приоритеты и выбрать наиболее удачные характеристики игр. С помощью уравнений регрессий и дерева классификации, построенных в данной работе, можно предсказать, насколько будет коммерчески успешна игра с определенными характеристиками, и будет ли она вообще приносить выручку. Дерево классификации, построенное в работе, позволяет с вероятностью 82% предсказывать коммерческую успешность игры, исходя из её характеристик. Это может помочь команде, начинающей игровой проект определиться с целевым сочетанием характеристик игры.
Это исследование может быть продолжено в разных направлениях:
1) Можно взять для анализа приложения из других магазинов, например, App Store, Amazon Store и др. Таким образом, выводы можно будет обобщить на все мобильные игры, а не только игры из Google Play.
2) Могут быть привлечены другие предикторы коммерческого успеха, например, маркетинговые или командные. Вероятно, что благодаря этому увеличится качество подгонки моделей и улучшится достоверность прогнозов. Кроме того, включение в анализ большего числа характеристик, даёт больше ориентиров создателям игр и облегчает им организацию процесса разработки в самом начале пути.
3) Могут быть построены другие модели для получения более полной информации о изучаемых характеристиках и их влиянии на коммерческий успех. Многоуровневая регрессия помогла бы учесть особенности связи переменных на уровне групп, например, жанров игр. Структурные модели могут дать более четкое представление о структуре взаимосвязей между характеристиками игр и последовательности их влияния на коммерческий успех.
4) При наличии информации, прибыль игровых приложений, может быть взята в качестве показателя их коммерческого успеха, вместо выручки. Известно, что рынок мобильных игр отличается как высокими выручками, так и высокими издержками, вызванными необходимостью больших инвестиций в продвижение. Прибыль была бы более стабильным показателем коммерческого успеха.
5) На основе данного исследования возможно проведение качественного исследования для выявления глубинного понимания коммерческого успеха среди разработчиков и причин значимости тех или иных характеристик игр.
Список источников
1. Азаров, И. В., & Струнина, А. А. (2014). Анализ рынка мобильных приложений в России. Современные проблемы науки и образования, (6), 337-337.
Подобные документы
Классификация мобильных приложений. Способы монетизации мобильных приложений. Аналитика мобильных игр. Разработка маркетинговой стратегии для игрового продукта. Ценообразование и внутриигровые покупки, анализ целевого рынка и инструменты продвижения.
дипломная работа [1,1 M], добавлен 04.09.2016Основные критерии исследования мобильных телефонов. Оценка моделей мобильных телефонов: Nokia 3250; Nokia N70; Sony Ericsson w880i; Samsung d600, которые находятся приблизительно в одной ценовой группе, по ряду эстетических и функциональных характеристик.
курсовая работа [1,1 M], добавлен 17.03.2011Современное состояние сотовой связи в России. Характеристика основных видов мобильных телефонов, анализ динамики их продаж и описание наиболее популярных производителей. Состав и классификация йогуртов, исследование объемов их производства и потребления.
курсовая работа [2,7 M], добавлен 28.05.2013Анализ российского рынка мобильных телефонов, его основные представители и оценка конкуренции. Классификация и характеристика ассортимента данных продуктов. Комплекс торгового маркетинга и его инструменты. Оценка деятельности торгового предприятия.
курсовая работа [1,5 M], добавлен 13.05.2014Определение конкурентоспособности товара на примере рынка мобильных телефонов. Мобильные телефоны могут стать отличным каналом дистрибьюции, так же, как инструментом обратной связи и различных исследований. Анализ конъюнктуры рынка, его сегментации.
реферат [64,8 K], добавлен 11.04.2008Анализ рынка мобильных приложений. Распространение программных продуктов. Приложения для социальных сетей. Геоинформационная система WGS3-T. Потенциальные потребители системы в странах СНГ и регионах России. Локализация программ на рынке Евросоюза.
отчет по практике [3,0 M], добавлен 05.11.2013Анализ альтернативных способов продвижения алкогольной продукции. Разработка проекта глобальной стратегии сокращения вредного употребления алкоголя. Использование для рекламы социальных сетей, промо-кодов страниц в интернете, мобильных приложений.
реферат [39,0 K], добавлен 16.07.2016Потребительские предпочтения лицеистов старших классов в области мобильных телефонов, влияние на них социально-демографических характеристик. Факторы, определяющие выбор лицеиста относительно мобильного телефона, место рекламы в данном процессе.
практическая работа [826,4 K], добавлен 14.03.2012Исследование рынка мобильной и электронной коммерции. Методология сбора данных. Использование мобильных устройств, приложений и сервисов в интернет-торговле. Характеристика бизнес-моделей электронной коммерции, использующих мобильные приложения.
дипломная работа [1001,9 K], добавлен 31.08.2016Понятие конкуренции и конкурентоспособности. Классификация уровня конкурентоспособности фирмы. Этапы отраслевого и конкурентного анализа отрасли. Подходы к анализу фирм-конкурентов. Ключевые факторы успеха. Анализ конкурентной стратегии ООО "Шервуд".
курсовая работа [108,0 K], добавлен 17.06.2011
