Цифровая экономика: спрос на компетенции и инновации

Анализ существующих количественных методов анализа текста и выбор наиболее подходящего метода. Наиболее эффективные способы изучения спроса на компетенции. Факторы инновационной активности фирмы. Навыки, пользующиеся спросом у инновационных компаний.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 10.08.2020
Размер файла 1,4 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ПЕРМСКИЙ ФИЛИАЛ ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО АВТОНОМНОГО ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ

ВЫСШЕГО ОБРАЗОВАНИЯ

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»

Факультет экономики, менеджмента и бизнес-информатики

Цифровая экономика: спрос на компетенции и инновации

Выпускная квалификационная работа - БАКАЛАВРСКАЯ РАБОТА

студента образовательной программы бакалавриата «Экономика»

по направлению подготовки 38.03.01 Экономика

Чувызгалова Екатерина Дмитриевна

Пермь, 2020 год

Аннотация

В настоящей работе рассматриваются проблемы инновационной активности фирм в контексте цифровой экономики. Цель исследования - выявить цифровые навыки, наиболее сильно связанные с инновационной деятельностью компаний. Методологически исследование проводится в рамках рынка труда. Несмотря на то, что существует множество исследований, посвященных инновационной активности и спросу на компетенции, взаимосвязь между переменными оставалась неизученной. Методология исследования включает количественный анализ текста и применение модели LASSO. В результате исследования был получен список цифровых навыков, в наибольшей степени связанных с расходами на НИОКР 1000 крупнейших российских компаний. Работа состоит из введения, теоретического обоснования, постановки проблемы, методологии, описания результатов, заключения и списка использованной литературы.

Abstract

The study examines the problem of innovation activity in the context of digital economy. The purpose of the research is to reveal the factors that determine the potential and limitations of a company's innovation activity the most. Methodologically, the research is conducted within the framework of the labour market; this approach helps to establish broad connections between R&D expenditures and a company's demand for digital skills. Although there are many studies devoted to the determinants of R&D activity and digital competencies, there are few works which investigated the connection between these variables. Research methodology includes text mining techniques and application of the LASSO model. The result of the research is the list of digital skills that are related to innovation activity of Russian top 1000 firms the most. The study will consistently fit into a series of researches devoted to digital economy. The project consists of the introduction, the literature review, the problem statement, the methodology, the results, the conclusion, and references.

Введение

Цифровая экономика стремительно развивается и оказывает влияние на все сферы человеческой деятельности. Современные технологии стимулируют трансформацию бизнес-процессов и социальных взаимодействий, порождают новые тренды в образовательной сфере. Как следствие, возникает множество вопросов, представляющих интерес для исследования. Одними из самых обсуждаемых тем являются инновационная активность предприятий и изменения на рынке труда.

Известно, что существует некая взаимосвязь между инвестициями в исследования и разработки и компетенциями, которыми компания обладает: оба фактора теоретически влияют на финансовую эффективность компании; кроме того, для применения результатов исследований и разработок нужны релевантные человеческие ресурсы. Взаимосвязь между навыками и инновационной активностью фирмы имеет свои особенности: вакансии компании не всегда отражают ее реальные потребности. Также следует отметить, что в статьях, посвященных изучению спроса на рынке труда, инновационная активность фирмы не учитывалась количественно, а являлась признаком формирования выборки. Следовательно, неизвестно, как именно спрос компании на рынке труда связан с ее инновационной деятельностью и какие компетенции сотрудников наиболее сильно связаны с затратами фирмы на НИОКР. Вышеописанные факты формируют необходимость проведения исследования и обосновывают его научную новизну. В соответствии с обнаруженным пробелом в знаниях были сформулированы исследовательский вопрос и цель исследования.

Цель исследования - определить цифровые навыки, наиболее сильно связанные с инновационной активностью фирмы.

Для достижения поставленной цели нужно выполнить следующие задачи:

Проанализировать существующие количественные методы анализа текста и выбрать наиболее подходящий метод;

Проанализировать тексты вакансий, определить наиболее популярные цифровые навыки;

Выбрать контрольные переменные;

Выбрать подходящую к исследовательскому вопросу эконометрическую модель;

Интерпретировать полученные коэффициенты.

В работе будут использованы следующие методы:

Bag-of-words - метод количественного анализа текста, позволяющий получить словарь, отображающий количество упоминаний каждого слова. Метод будет применен с целью выявления наиболее популярных на рынке труда цифровых навыков;

Сквозная модель с регуляризацией, учитывающая особенности исследовательского вопроса и упрощающая интерпретацию коэффициентов. Метод будет использован для отбора переменных, наиболее сильно связанных с расходами на НИОКР.

Объектом исследования является инновационная активность фирмы, предметом - взаимосвязь между спросом компании на цифровые навыки и расходами на НИОКР.

Результаты будут полезны компаниям, которые планируют инвестировать в исследования и разработки и не знают, какие компетенции им следует искать. Также выводы позволят университетам составлять актуальные учебные программы и повышать конкурентоспособность выпускников. Кроме того, результаты помогут молодым специалистам, выходящим на рынок труда, определить навыки, которые необходимо освоить. При этом предполагается, что высокая инновационная активность позволяет фирме получить конкурентное преимущество, в результате чего прибыль компании также растет. Высокая прибыль дает компании возможность увеличить расходы на оплату труда. Далее необходимо рассмотреть исследования, оказавшие значительное влияние на дизайн настоящей работы.

Наиболее важными работами, связанными с исследованием ключевых компетенций на современном рынке труда, являются статьи Шматко и Лавриненко за 2018-2019 гг. Работы содержат информацию о трендах спроса на компетенции, в частности, спроса на цифровые навыки; результаты, полученные авторами, были полезны для выдвижения гипотез настоящей работы. Важнейшей работой также является доклад Апрельской конференции 2019 года, посвященный цифровой экономике в целом. Также необходимо отметить работы, рассматривающие факторы инновационной активности фирмы. Знаковым для настоящей работы является исследование Г. В. Теплых «Драйверы инновационной активности промышленных компаний в России»; набор контрольных переменных был сформирован на основе результатов именно этой статьи.

Настоящая работа состоит из трех глав, первая глава состоит из трех параграфов, вторая и третья - из двух. В первой главе содержатся основные определения работы, наиболее эффективные способы изучения спроса на компетенции, основные факторы инновационной активности фирмы; также подробно обсуждается постановка исследовательской проблемы. Во второй части работы описана методология исследования, в третьей - результаты. Объем выпускной квалификационной работы без приложений - 46 страниц. Количество использованных источников - 44.

1. Теоретическое обоснование

1.1 Основные определения и спрос на компетенции в литературе

Прежде всего, стоит рассмотреть ключевые термины данной работы. Необходимо определить понятия «инновационная активность» и «инновации», «спрос на компетенции», «цифровые навыки».

Под «цифровыми навыками» понимается набор возможностей использования цифровых устройств, приложений связи и сетей для доступа к информации и управления ей (Wu et al., 2018). Цифровыми навыками начального уровня являются составляющие цифровой грамотности - набора знаний и умений, которые необходимы для безопасного и эффективного использования цифровых технологий и ресурсов интернета (Берман, 2017). В литературе различаются понятия «цифровой» и «компьютерной» грамотности: последний термин подразумевает умения и навыки работы на компьютере, минимальные знания основных офисных программ; в то время как цифровая грамотность включает «личностные, технические и интеллектуальные навыки, необходимые для того, чтобы жить в цифровом мире» (Берман, 2017). Важно отметить, что в соответствии с данным определением цифровым навыком может являться, например, критическое мышление, несмотря на то что данная способность не связана со знанием информационных технологий напрямую. Следовательно, под цифровыми навыками начального уровня также понимаются компетенции, имеющие особое значение в цифровую эпоху; в настоящей работе подобные качества будут приниматься за «мягкие» навыки - качества, способности и опыт, связанные с личностными характеристиками работника (Lavrynenko et al., 2018).

В литературе также выделяют навыки промежуточного уровня (Wu et al., 2018). В данную группу входят навыки, требующие специальных знаний в области программного обеспечения, но не связанные со сферой IT напрямую. Например, к промежуточным цифровым компетенциям относятся навыки цифрового дизайна, владение издательским программным обеспечением, опыт работы с бухгалтерскими системами.

Цифровые навыки продвинутого уровня включают компетенции, присущие специалистам в области IT: программирование, методы машинного обучения, анализ больших данных, использование искусственного интеллекта.

В данной работе спрос на компетенции, по аналогии с потребительским спросом, подразумевает готовность фирмы приобрести человеческие ресурсы с определенными характеристиками. Стоит отметить, что в соответствии с определением американского экономиста Теодора Шульца человеческие ресурсы включают человеческий потенциал, или «индивидуальные комплексы генов», а также человеческий капитал - «приобретенные человеком ценные качества, которые могут быть усилены соответствующими вложениями» (Разнодежина, 2011). Следовательно, начальные и продвинутые навыки являются частью человеческого капитала. Таким образом, использование термина «человеческие ресурсы» в определении спроса на компетенции является обоснованным.

Инновационная активность в настоящей работе предполагает затраты компании на научно-исследовательские и опытно-конструкторские работы. Рассмотрим данный термин подробнее. Инновационная деятельность фирмы состоит из научных, технологических, организационных, финансовых и коммерческих решений, в конечном счете направленных на внедрение инноваций (OECD, 2002). При этом подобный вид деятельности компании включает как затраты на НИОКР, так и непосредственное применение результатов исследований и разработок в производстве; упомянутые результаты и являются инновациями. Также важно заметить, что в соответствии с ПБУ 17/02 расходы на НИОКР признаются только в случае получения положительного результата работ; таким образом, затраты на исследования и разработки действительно отражают желание фирмы создавать или приобретать инновации.

Далее будут описаны важные выводы, существующие в литературе, а также основные подходы к исследованию компетенций, пользующихся спросом на рынке труда. Работы будут представлены в обратном хронологическом порядке; данный подход позволит сфокусировать внимание на современных концепциях в исследованиях рынка труда, а также проанализировать развитие научной мысли по данной теме.

Одной из последних работ является статья Шматко и Лавриненко (Lavrynenko and Shmatko, 2019). Авторы исследовали влияние развития технологий на компетенции и функции работников банковской сферы, используя результаты майнинга текста, анализа кейсов и экспертных интервью. Для семантического анализа использовались описания вакансий, размещенные в сентябре-декабре 2018 г. на сайтах-агрегаторах (hh.ru, career.ru, finexecutive.com) организациями из топ-15 российского финансового сектора. Описания вакансий являются распространенным предметом анализа спроса на рынке труда, так как «объявления о найме содержат информацию как об ожиданиях работодателей, так и об эволюции навыков в целом» (Gallavin et al., 2004). По результатам анализа с использованием системы iFORA авторами была составлена семантическая карта, отражающая спрос на навыки. Важным выводом работы является значимость цифровых компетенций соискателей: владение языками программирования, соответствующим специфике отрасли программным обеспечением; умение работать с данными. Внедрение искусственного интеллекта является одним из главных трендов цифровой трансформации финансового сектора; ключевым навыком, определяющим конкурентоспособность соискателей, выступают знания в области аналитики больших данных. Кроме того, авторами был отмечен спрос на «мягкие» навыки - коммуникабельность, стрессоустойчивость, способность выдерживать высокий темп работы, стремление к достижениям.

Значимость данной статьи заключается в обозначении современных тенденций развития рынка труда, а также в описании эффективной методологии определения компетенций, пользующихся спросом. Востребованность цифровых навыков, рассмотренных в статье, также обсуждалась в докладе Апрельской конференции 2019 года (Гохберг и др., 2019): «аналитика больших данных является ключевой компетенцией, определяющей конкурентоспособность компаний будущего»; что также подтверждает релевантность выводов статьи.

Следующей значимой работой является отчет аналитической компании Burning Glass Technologies, посвященный фундаментальным компетенциям цифровой экономики. В исследовании были использованы более 150 миллионов уникальных вакансий, размещенных на сайтах-агрегаторах, в газетах и на сайтах компаний в период с 2007 года (Markow et al., 2018). Навыки, требуемые от соискателей, должны были отвечать одному из следующих критериев: минимальное количество появлений в вакансиях - 1 млн., минимальный рост популярности с 2012 г. - 70%; компетенции были либо присущи профессиям сферы IT, либо имели широкое распространение в сферах, менее связанных с цифровыми технологиями. Наиболее популярные навыки были разделены на 14 групп. Важным результатом работы является тот факт, что группа цифровых компетенций является самой востребованной; при этом управление данными пользуется наибольшим спросом среди работодателей, а популярность анализа данных растет быстрее всего. Авторы не описывают методологию подробно, однако результаты статьи подтверждают наличие устойчивых тенденций на рынке труда и могут быть основой для выдвижения гипотез о закономерностях в данных текущего исследования.

Наиболее востребованные цифровые навыки по результатам существующих исследований представлены в таблице 1.

Таблица 1

Навыки, пользующиеся спросом у инновационных компаний

Навык

Источник

Базы данных

Debortoli et al., 2014; Lee and Han, 2008; Markow et al., 2018; Lavrynenko and Shmatko, 2019; Lavrynenko et al., 2018

Анализ данных

Markow et al., 2018

Программирование

Debortoli et al., 2014; Lee and Han, 2008; Markow et al., 2018; Lavrynenko and Shmatko, 2019; Lavrynenko et al., 2018

Машинное обучение

Debortoli et al., 2014

цифровая экономика инновационный

Как показывают результаты, самыми востребованными навыками являются компетенции в сфере управления базами данных и программирования. Далее следует обратить внимание на техническую составляющую исследований спроса на человеческие ресурсы.

Рассмотрим методологические подходы к исследованию ключевых компетенций современного рынка труда. Одним из самых используемых методов является обработка естественного языка, а именно вышеупомянутый семантический анализ текста в различных модификациях. Данный подход был применен в статье Дебортоли и др. (Debortoli et al., 2014). Авторами был проведен количественный анализ 1807 вакансий в сфере бизнес-аналитики и анализа больших данных, размещенных на сайте monster.com, с использованием LSA (latent semantic analysis). Все компетенции разделены на бизнес-навыки и цифровые навыки. Следует отметить, что под цифровыми навыками в статье понимаются навыки продвинутого уровня вследствие специфики отрасли. Методология, примененная в статье, описывается следующим образом. Данные представляются в виде матрицы, столбцы которой соответствуют словам (термам), а строки - вакансиям (документам). Каждая ячейка матрицы показывает, сколько раз каждое слово встречается в каждом описании вакансии; на основе полученных значений с помощью меры TF-IDF каждому терму присваивается вес, отражающий важность слова в корпусе документов. Мера TF-IDF рассчитывается следующим образом. Первая часть формулы, TF (term frequency) показывает частоту появления слова в отдельном документе и определяется как отношение числа вхождений терма к общему количеству слов в документе. Вторая часть, IDF (inverse document frequency) позволяет скорректировать вес термов, часто встречающихся в отдельном документе, учитывая частоту появления термов в остальных документах корпуса и общее количество документов. IDF рассчитывается по следующей формуле (1):

,

(1)

где: D - число документов в корпусе,

- число документов, в которых встречается терм t.

Мера TF-IDF представляет собой произведение обеих частей формулы.

Далее размерность матрицы сокращается посредством сингулярного разложения; при этом выбирается k - максимальное количество тем, частоту которых необходимо отразить. За k в статье было принято количество групп навыков. Разложение матрицы А можно представить следующим образом (2):

,

(2)

где: A - исходная матрица m*m,

S - диагональная матрица k*k, значения которой являются сингулярными значениями матрицы A,

U и V - ортогональные матрицы m*k.

Результатом применения метода являются термы, объединенные в темы, имеющие устойчивую частоту появления в корпусе документов. Авторами были выявлены следующие группы навыков: NoSQL Databases, Digital Marketing, Software Engineering, Programming, Machine Learning (приведены группы навыков, процент появления которых в вакансиях особенно высок). Так как цифровые навыки являются предметом исследования, результаты будут полезны для выдвижения гипотез. Ценность статьи Дебортоли и др. заключается в том, что авторы одними из первых проанализировали спрос на компетенции в сфере бизнес-информатики и больших данных, а также составили сравнительную характеристику результатов для обеих отраслей.

Достоинством латентно-семантического анализа является возможность объединить связанные термы в темы, тем самым «почти имитируя процесс работы человеческого разума» (Landauer et al., 1998); однако метод не обладает мощностью, достаточной для выявления более сложных связей между значениями слов, интуитивно понятных людям.

Обработка естественного языка является не только актуальным, но и классическим методом исследования характеристик спроса на рынке труда. Например, в статье Литеки и др. авторы использовали кластерный анализ (Litecky et al., 2010). Одним из первых исследований, использовавших анализ текста для изучения рынка труда, была работа Тодда и др. (Todd et al. 1995), в которой использовались вакансии из четырех крупнейших изданий за 1970, 1975, 1980, 1985 и 1990 годы; выборка состояла из 1634 вакансий. Далее авторами была рассчитана частота появления навыков с помощью метрики, аналогичной вышеупомянутой IDF. Данная статья является основой для большинства исследований специфики человеческих ресурсов на рынке труда. Существует большое количество различных методов анализа текста, основные принципы которых были изложены при описании латентно-семантического анализа. В настоящей работе возможно применение упрощенной версии ЛСА, так как объединение навыков в группы не является основной целью исследования.

В работе Тодда и др. также обсуждался другой, не менее распространенный способ изучения спроса на компетенции - интервьюирование экспертов и опросы. Метод до сих пор пользуется значительной популярностью; например, в статье (Grzybowska and Јupicka, 2017) использовались результаты опроса экспертов - топ-менеджеров транснациональных корпораций в сфере автомобилестроения и фармацевтики. Несмотря на то, что подобный метод выявления закономерностей спроса на рынке труда не имеет недостатков, связанных с семантикой и лексикой, ответы респондентов не всегда точно отражают реальную ситуацию в отрасли. Результаты опросов показывают субъективную точку зрения людей; кроме того, ответы могут отражать лишь теоретические знания экспертов о том, какие навыки должны быть востребованы в данный момент (Todd et al., 1995).

Таким образом, наиболее эффективным способом изучения спроса на компетенции является комбинация методов анализа естественного языка и интервьюирования экспертов, как, например, в описанной ранее статье Шматко и Лавриненко. Подобный подход позволяет избавиться от недостатков обоих методов и объективно описать реальную ситуацию.

В следующем параграфе будут рассмотрены актуальные исследования НИОКР, предполагаемые факторы данного показателя финансовой отчетности фирмы, а также современная точка зрения на взаимосвязь между НИОКР и финансовой успешностью компании.

1.2 Инновационная деятельность фирмы и НИОКР

Исследование инновационной деятельности фирмы в англоязычной и русскоязычной литературе существенно различается. Основной причиной отличий являются особенности учета данного вида затрат в соответствии с РСБУ и стандартами МСФО. В российской практике затраты могут учитываться как НИОКР только тогда, когда существует документально подтвержденный положительный результат инновационной деятельности фирмы; исследования и разработки (R&D) предполагают учет затрат как на завершенные, так и не завершенные проекты (Макарова и др., 2012). Данная особенность является причиной популярности количества патентов как метрики инновационной активности фирмы в англоязычной литературе; как, например, в статье (Kleis и др., 2012). Затраты на исследования и разработки при этом выступают в качестве детерминанты инновационной продуктивности компании. Некоторые авторы считают, что количество патентов, принадлежащих фирме, показывает заинтересованность фирмы в инновациях и ее близость к инновационному прорыву (Breschi et al., 2003).

Несмотря на различия в стандартах учета, зарубежные авторы также признают эффективность показателя расходов на НИОКР в изучении инновационной активности. Основным преимуществом метрики является доступность информации и тот факт, что затраты на НИОКР всегда присутствуют в годовой отчетности крупных фирм, то есть, возможно проанализировать детерминанты инновационной деятельности в динамике. Кроме того, данный показатель измеряется в денежных единицах и точнее отражает затраченные фирмой ресурсы чем, например, количество патентов (Machin and Reenen, 1998). Чаще всего НИОКР корректируется на выручку фирмы, то есть, изучается интенсивность показателя, например, в Chen and Miller, 2007.

Таким образом, затраты на НИОКР достаточно точно характеризуют инновационную активность фирмы как при использовании отчетности российских компаний, так и в случае зарубежных фирм.

В исследованиях, посвященных факторам затрат на НИОКР, чаще всего выделяют детерминанты, представленные в таблице 2.

Таблица 2

Факторы НИОКР в литературе

Переменная

Влияние

Источник

Размер фирмы

+

Теплых, 2015; Lai et al., 2015; Artйs, 2009; Козлов и др., 2004

Финансовая независимость

+

Lai et al., 2014; Bond et al., 2005; Cumming and Macintosh, 2000

-

Теплых, 2015;

Близость университетов

+

Abramovsky and Simpson, 2011; Теплых, 2015; Abramovsky et al., 2007

Количество патентов

+

Lai et al., 2014; Теплых, 2015

Качество рабочей силы

+

Козлов и др., 2004; Теплых, 2015;

Интеллектуальная собственность

+

Теплых, 2015

Рентабельность продаж

+

Теплых, 2015

Ликвидность

+

Теплых, 2015

Доля государства в собственности

+

Козлов и др., 2004

-

Теплых, 2015; Aghion et al., 2002;

Результаты показывают, что почти все факторы оказывают положительное влияние на расходы фирмы на НИОКР. Чаще всего в качестве фактора НИОКР рассматривается размер фирмы, измеряемый с помощью количества работников, годовой выручки или рыночной капитализации фирмы. Контрольные переменные будут рассмотрены подробнее при описании данных настоящего исследования.

Влияние инвестиций в НИОКР на успешность фирмы в частности и экономический рост в целом является актуальным предметом изучения экономической науки с конца XX века. Многие авторы утверждают, что «инновации - источник экономического роста» (Griliches, 1979; Clark, Griliches, 1982); и что инвестиции в исследования и разработки стимулируют эффект участия фирме в экспорте на ее продуктивность (Aw et al., 2007). Однако с течением времени распространение получила следующая точка зрения: значимое влияние на прибыль фирмы оказывают не одни лишь инвестиции в исследования и разработки, а комбинация подходящих навыков и инвестиций (Leiponen, 2005); кроме того, для извлечения ценности из инноваций необходимы релевантные человеческие ресурсы (Siepel et al., 2019). Следовательно, влияние конкретных компетенций на инвестиции в НИОКР и, в конечном счете, на прибыль, представляет интерес.

Логично предположить, что инновационная деятельность фирмы подразумевает наличие специфических человеческих ресурсов. Такие виды научно-исследовательской деятельности, как поиск закономерностей в данных, построение математических моделей и представление результатов часто связаны с цифровыми навыками, как начального уровня, так и продвинутого. В статье Лавриненко и др. (Lavrynenko et al., 2018) авторы исследуют спрос на компетенции, предъявляемый инновационными компаниями в сфере биотехнологий. Одним из исследовательских вопросов работы является проверка соответствия навыков, которые компании ищут, и «инновационной философии», приверженцами которой фирмы являются. Результаты исследования свидетельствуют о том, что наиболее востребованными среди инновационных компаний являются знания в сфере биотехнологий и цифровые навыки; однако результаты интервью показывают, что политика компании в отношении человеческих ресурсов (описания вакансий) и компетенции, в которых фирма действительно нуждается, часто различаются; следовательно, возникает необходимость количественно проверить взаимосвязь спроса на компетенции и инновационной активности фирм.

Стоит отметить, что в вышеуказанной статье инновационная активность фирм не учитывается количественно, а является признаком формирования выборки. Таким образом, исследование количественной зависимости между спросом фирмы на компетенции и ее инновационной активностью представляет интерес.

Таким образом, результаты, описанные в существующей литературе, свидетельствуют о том, что существует некая взаимосвязь между инвестициями в исследования и разработки и компетенциями, которыми компания обладает: оба фактора теоретически влияют на финансовую эффективность компании; кроме того, для применения результатов исследований и разработок нужны релевантные человеческие ресурсы. Однако результаты также показывают, что взаимосвязь между навыками и инновационной активностью фирмы имеет свои особенности: вакансии компании не всегда отражают ее реальные потребности. Также следует отметить, что в статьях, посвященных изучению спроса на рынке труда, инновационная активность фирмы не учитывалась количественно, а являлась признаком формирования выборки. Следовательно, неизвестно, как именно спрос компании на рынке труда связан с ее инновационной деятельностью и какие компетенции сотрудников наиболее сильно связаны с затратами фирмы на НИОКР. На основе полученных выводов был сформулирован исследовательский вопрос, представленный в следующем разделе работы.

1.3 Постановка исследовательской проблемы

В процессе анализа существующих в литературе концепций был сформулирован исследовательский вопрос: «какие цифровые навыки наиболее связаны с инвестициями фирм в НИОКР?». Были выдвинуты следующие гипотезы:

Навыки, связанные с управлением базами данных, наиболее популярны среди крупнейших российских компаний;

Взаимосвязь затрат на НИОКР и спроса на специалистов, обладающих навыками анализа данных, является наиболее выраженной.

Первая гипотеза основана на результатах, полученных в существующих исследованиях (таб. 1); можно предположить, что описанная закономерность характерна и для данных, используемых в настоящей работе. Вторая гипотеза опирается на тот факт, что анализ данных для фирмы подразумевает анализ ее деятельности, и что компания не может получить конкурентное преимущество или увеличить свою эффективность, не анализируя собственные процессы и результаты. Однако существующие результаты не свидетельствуют о высокой популярности навыка анализа данных среди работодателей на современном рынке труда в целом. Следовательно, проверка гипотезы представляет особый интерес. Далее необходимо рассмотреть основные этапы исследования.

Результаты будут полезны компаниям, которые планируют инвестировать в исследования и разработки и не знают, какие компетенции им следует искать. Также выводы позволят университетам составлять актуальные учебные программы и повышать конкурентоспособность выпускников. Кроме того, результаты помогут молодым специалистам, выходящим на рынок труда, определить навыки, которые необходимо освоить.

Исследование проводится в соответствии со следующим алгоритмом. В первую очередь следует выбрать наиболее эффективный способ определения спроса компаний на компетенции в некоторый момент времени. На основе изученной литературы можно сделать вывод, что чаще всего популярность навыков определяется двумя способами: количественным анализом текста и с помощью опросов экспертов. Так как применение второго метода в настоящей работе не представляется возможным, анализ текста является единственным обоснованным подходом к изучению ситуации на рынке труда. Планируется применение соответствующих задаче пакетов и библиотек языков R и Python; процедуры обработки текста будут описаны в разделе методологии. В результате анализа текста будет получено n переменных-компетенций, показывающих количество упоминаний соответствующего навыка в вакансиях фирмы за определенный год, а также общую частоту упоминания всех компетенций. После получения количественных результатов необходимо определить, какие из наиболее популярных навыков относятся к группе цифровых, согласуются ли результаты с теоретической базой.

Вторым шагом является выбор переменной, отражающей инновационную активность фирмы. В соответствии с российскими стандартами бухгалтерского учета затраты на НИОКР показывают расходы компании на научные исследования и разработки, результат которых существует и документально подтвержден. Следовательно, данный финансовый показатель подходит для измерения инновационной активности фирмы. В литературе также используется количество зарегистрированных патентов, однако при использовании данного показателя возникают некоторые сложности. Во-первых, не все фирмы осуществляют деятельность, подразумевающую создание уникальных продуктов и регистрацию соответствующих патентов; инновационная деятельность гораздо более разнообразна. Во-вторых, можно предположить, что данный показатель изменяется реже, чем раз в год, и эта особенность не позволит точно измерить взаимосвязь между инновационной активностью фирмы и независимыми переменными. Таким образом, расходы на НИОКР являются наиболее удобной метрикой для изучения инновационной деятельности компании.

Следующим шагом является определение набора контрольных переменных, которые необходимо включить в уравнение регрессии. Как упоминалось ранее, обоснование дополнительных регрессоров будет наиболее уместным в разделе описания данных. Однако уже на данном этапе исследования можно утверждать, что в качестве контрольной переменной необходимо выбрать размер фирмы, выраженный через годовую выручку компании.

Наконец, важнейшим этапом исследования выступает выбор эконометрической модели. В таблице 3 представлены модели, являющиеся распространенными в литературе на тему НИОКР и инновационной активности фирмы в целом.

Таблица 3

Модели изучения инновационной активности в литературе

Модель

Источник

Тобит (I и II)

Gezici et al., 2018; Kwon and Park, 2013; Ouwersloot and Rietveld, 2000; Теплых, 2015

LASSO

Литвинцева и др., 2017

При изучении детерминантов НИОКР достаточно часто используется модель тобит; это обосновывается цензурированностью финансового показателя и смещением оценки коэффициентов регрессии в случае, когда ограниченный характер переменной игнорируется. Однако модель LASSO более проста и удобна, а также лучше согласуется с исследовательским вопросом и теорией в целом. Настоящее исследование предполагает ранжирование цифровых навыков по степени взаимосвязи с НИОКР, и для выполнения данной задачи модель LASSO является наиболее релевантной.

В работе будут использованы данные о расходах на НИОКР и других финансовых показателях 1000 крупнейших фирм за 2010-2017 гг., а также описания вакансий компаний с крупнейшего российского сайта-агрегатора.

В следующем разделе работы будет подробно описана методология исследования, включающая используемые данные, спецификацию модели, обоснование контрольных переменных и описание ограничений работы.

2. Методология

В данной части работы будет рассмотрена методология исследования, включающая подробное описание процедур, проведение которых необходимо для проверки гипотез и ответа на исследовательский вопрос; а также описание используемых данных. Основные этапы исследования включают количественный анализ текста, выбор и обоснование контрольных переменных, выбор спецификации и метода расчета коэффициентов модели. В первом параграфе будет описан процесс измерения спроса на компетенции с помощью модели bag-of-words, а также обоснование выбора контрольных переменных. Во втором параграфе будут представлены описательные статистики переменных и эконометрические модели.

2.1 Количественный анализ текста и выбор переменных

Как было упомянуто в прошлом разделе, в первую очередь необходимо определить переменные навыков, измерив спрос компаний на компетенции с помощью количественного анализа текстов вакансий. На данном этапе будет проверена гипотеза о востребованности навыков управления базами данных среди российских компаний; также будут определены переменные цифровых навыков, используемые на следующих этапах работы.

Модель bag-of-words (BOW, «набор слов») является достаточно распространенным подходом к анализу текста. Данный метод используется для создания словаря из одного или нескольких текстов. Результат применения метода представляет собой набор слов без учета их взаимного расположения (Нугуманова и др., 2016), а также количество упоминаний каждого слова в каждом тексте. Перед созданием bag-of-words необходимо очистить тексты от стоп-слов: предлогов, частиц, местоимений и других часто встречающихся элементов, не несущих смысла для исследовательской задачи. Применение метода также включает токенизацию (выделение уникальных слов) и стемминг (выделение корня слова). Стемминг позволяет исключить повторение одного и того же слова в разных падежах, что актуально для русскоязычных текстов.

В данной работе применение модели будет осуществлено с помощью библиотеки Scikit-learn языка Python, а именно модуля CountVectorizer. Модуль преобразует набор текстов в матрицу слов-токенов, каждое значение которой отображает количество упоминаний токена в каждом тексте. Данная матрица называется матрицей «термы-на-документы» и была подробно рассмотрена в теоретическом обосновании работы. Результат применения метода легко преобразуется в таблицу с общим количеством упоминаний каждого слова. Далее необходимо вручную отобрать термы, относящиеся к цифровым навыкам. Получившаяся после фильтрации таблица позволит проверить первую гипотезу и определить наиболее востребованные цифровые навыки.

Основным ограничением модели bag-of-words является игнорирование семантических связей между словами; именно поэтому были разработаны более сложные методы, такие как латентно-семантический анализ, представленный в теоретическом обосновании настоящего исследования. Объединение термов в темы позволяет провести более глубокий анализ спроса компаний на компетенции, что расширяет дальнейшие перспективы улучшения исследования. Однако для проверки первой гипотезы и получения набора независимых переменных достаточно применить модель bag-of-words и проинтерпретировать результаты. Следовательно, метод BOW является наиболее релевантным для данной работы.

Следующим этапом определения независимых переменных является описание контрольных переменных и их связи с инновационной активностью фирмы. В соответствии с доступными данными и результатами, описанными в литературе, были выбраны следующие детерминанты НИОКР:

Выручка. Затраты фирмы на НИОКР напрямую зависят от ее размера; данный факт был подтвержден в большом количестве работ, посвященных факторам инновационной активности. Достаточно часто размер фирмы выражается через годовую выручку; многие авторы также используют количество работников. Однако нельзя игнорировать существование компаний с относительно небольшим штатом сотрудников и значительными доходами; в таком случае у фирмы есть возможность инвестировать в НИОКР, так как компании могут привлекать сторонние организации к работе над исследовательскими проектами. В случае, когда количество работников значительно, а выручка низка, фирма скорее всего не будет проявлять инновационную активность. Следовательно, количество работников как показатель размера имеет существенные недостатки; годовая выручка при этом достаточно точно отражает масштабы деятельности предприятия и теоретически связана с инвестициями в НИОКР;

Расходы на персонал на работника. Данный показатель отражает качество рабочей силы, так как количество средств, которое компания тратит на своих сотрудников, показывает ценность человеческих ресурсов для фирмы. Поскольку выборка состоит из крупнейших российских компаний, можно предположить, что работодатели могут точно оценить качество рабочей силы и определить соответствующий размер расходов на персонал. Кроме того, в данный тип расходов часто входят затраты на обучение и добровольное медицинское страхование; такие привилегии призваны повысить эффективность рабочей силы. Логично предположить, что инновационная активность фирмы связана с высоким качеством человеческих ресурсов; существующие исследования факторов НИОКР российских компаний также подтверждают значимость данного показателя;

Финансовая независимость фирмы - отношение собственного капитала к совокупным активам. Существующие в литературе выводы свидетельствуют о неоднозначности взаимосвязи данного показателя с инновационной активностью компании. Можно предположить, что финансовая независимость позволяет компании более свободно принимать решения об инвестировании средств в различные инновационные проекты (Козлов и др., 2004; Lai et al., 2015); однако известно, что компании часто осуществляют вложения из заемных средств, так как стоимость заемного капитала ниже собственного (Теплых, 2015). Независимо от того, каким образом финансовая независимость влияет на инновационную активность фирмы, можно сделать вывод, что существуют теоретические предпосылки о наличии взаимосвязи между переменными;

Доля прибыли до налогообложения в выручке за прошлый период - рентабельность. Можно предположить, что чем выше рентабельность компании, тем больше у нее средств для инвестиций в НИОКР;

Доля чистого оборотного капитала в активах компании - ликвидность. Чем больше у компании свободных средств, тем выше вероятность, что она будет инвестировать в НИОКР, и наоборот - низкая ликвидность ограничивает инвестиционный потенциал фирмы;

Нематериальные активы. Служат «обобщенной оценкой неосязаемых активов компании» (Теплых, 2015);

Количество патентов. Показатель отражает уникальные знания в распоряжении компании, ее опыт в инновационной деятельности. Количество патентов и нематериальные активы позволяют учесть инновационный потенциал фирмы;

Прямая доля государства в собственности. Государство может финансировать инновационную активность фирм в рамках Стратегии инновационного развития; однако высокая доля государства в собственности также может подразумевать необходимость исполнения социально значимых обязательств, что не позволяет инвестировать в НИОКР (Теплых, 2015);

Прямая доля иностранного капитала. Можно предположить, что наличие зарубежных собственников позволяет компаниям обмениваться знаниями с иностранными коллегами и облегчает инновационную деятельность. Кроме того, высокая доля иностранного капитала может облегчить выход на международный рынок, что в целом стимулирует развитие компании;

Переменные цифровых навыков будут конкретизированы на этапе описания результатов, так как для их получения необходимо провести количественный анализ текста.

Рассмотрим зависимую переменную, отражающую инновационную активность фирмы. В теоретическом обосновании работы была упомянута интенсивность НИОКР, или отношение расходов на НИОКР к выручке. Однако использование данного показателя в настоящем исследовании приводит к проблемам, связанным со спецификацией эконометрической модели: так как в качестве независимой переменной размера была выбрана выручка, использование интенсивности НИОКР либо станет причиной ложной корреляции (в случае, если в знаменателе зависимой переменной находится выручка текущего периода), либо приведет к автокорреляции остатков (если в знаменателе находится выручка прошлого периода). Следовательно, предпочтительнее использовать расходы на НИОКР, включив выручку в контрольные переменные.

В следующем параграфе будут рассмотрены используемые данные, описательные статистики контрольных переменных, а также эконометрическая модель исследования.

2.2 Данные и эконометрическая модель

Изначальная выборка содержит финансовые показатели 1000 крупнейших фирм за 2008-2017 гг., а также описания вакансий компаний с крупнейшего российского сайта-агрегатора. Источниками данных о финансовых показателях служат базы Ruslana, Amadeus, Thomson. Данные являются панельными; это позволяет получить результаты, которые экстраполируются на более широкую совокупность, так как в выборке содержится информация о различных объектах в различные периоды времени (Ратникова, 2006).

Использование текстов вакансий, опубликованных на сайте-агрегаторе, связано с существенным ограничением. Многие работодатели обеспечивают свои потребности в персонале за счет внутреннего найма или публикуют вакансии на сайте компании; следовательно, измерить спрос на компетенции с максимальной точностью невозможно. Подобное ограничение можно преодолеть в дальнейшем, собрав данные о вакансиях с сайтов компаний; однако внутренние источники рабочей силы останутся недоступными для анализа.

После объединения таблиц финансовых показателей и описаний требований к соискателям размер выборки составил 4231 наблюдение. Рассмотрим некоторые описательные статистики выбранных показателей. В таблице 4 приведены переменные, характеристики которых позволяют сформировать начальное представление о компаниях в выборке и репрезентативности данных. Описательные статистики для показателей, требующих дополнительных расчетов (рентабельности, ликвидности, финансовой независимости) будут представлены после описания процедуры заполнения пропущенных значений.

Таблица 4

Описательная статистика переменных

НИОКР

Количество патентов, шт.

Выручка, млн руб.

Прибыль до налогообложения, млн руб.

Прямая доля государства, %

Доля иностранного капитала, %

Минимум

0

0

0

-432941

0

0

Максимум

30588

2040

6546143

1663000

100

100

Среднее

4033,51

22,84

82162,21

12307,95

1,16

29,73

Стандартное отклонение

6936,95

107,79

356012,80

86408,84

7,98

44,29

Средние значения расходов на НИОКР и количества патентов свидетельствует о том, что в целом фирмы имеют опыт инновационной деятельности. Наличие нулевых значений и относительно высокие стандартные отклонения обоих показателей позволяют утверждать, что в выборке представлены компании с различным уровнем опыта инноваций; следовательно, выборка достаточно репрезентативна. Тем не менее, распределение зависимой переменной позволяет сделать предположение о ее цензурированности (рис. 1)

Рис. 1. Распределение затрат на НИОКР

Как показывает гистограмма, значительное количество фирм имеет нулевые расходы на НИОКР.

Описательные статистики прибыли также показывают, что в выборке представлены компании с различным уровнем рентабельности. Кроме того, следует заметить, что наблюдения с нулевой выручкой следует рассматривать как статистические выбросы, так как их количество относительно невелико - всего 1,43% от размера выборки. Включение в таблицу информации за годы, в которые фирмы не осуществляли деятельность, не представляет интереса для настоящего исследования.

Особого внимания заслуживает информация о долях иностранного и государственного капитала. Среднее значение доли государства свидетельствует о том, что большую часть выборки составляют частные компании. Характеристики доли иностранного капитала показывает, что в целом компании склонны привлекать зарубежных инвесторов. Кроме того, около 31% фирм имеют ненулевую долю иностранного капитала. Однако несмотря на то, что значительная доля компаний привлекает инвесторов из-за рубежа, большая часть фирм все еще полагается на собственные средства. Можно предположить, что данная особенность снижает инновационный потенциал фирм.

Далее следует обратить внимание на описательные статистики контрольных показателей, рассчитанных после заполнения пропущенных значений. Важно упомянуть, что импутация данных проводилась c помощью линейной интерполяции - вычисления промежуточного значения функции по нескольким уже известным ее значениям. Метод был применен к каждому временному ряду отдельно. Количество пропущенных значений каждой переменной меньше 25%, следовательно, импутация данных не исказит результаты исследования. После заполнения пропущенных наблюдений были рассчитаны финансовые показатели фирмы, характеристики которых представлены в таблице 5.

Таблица 5

Описательная статистика переменных

Затраты на работника, млн руб.

Финансовая независимость

Рентабельность

Ликвидность

Минимум

0,71

0,12

-1134,05

-0,997

Максимум

3416,43

0,9997

353560

0,98

Среднее

13,03

0,33

172,07

0,14

Стандартное отклонение

174,39

0,26

6316,72

0,26

Среднее значение показателя финансовой независимости показывает, что в целом фирмы достаточно часто полагаются на заемный капитал; однако в выборке присутствуют компании, доля собственных средств которых выше 99%. Средняя рентабельность достаточно высока; это объясняется принципом формирования выборки.

Таким образом, описательный анализ показал, что выборка является достаточно репрезентативной. Данные имеют свои ограничения, но это не помешает получить достоверные результаты.

Следующим этапом исследования является выбор эконометрической модели. Так как основная цель работы - выявление цифровых навыков, наиболее сильно связанных с инновационной активностью компании, метод оценки коэффициентов должен быть применим к уравнениям с большим количеством независимых переменных. В таком случае уместно использовать регуляризацию - дополнительные ограничения модели, позволяющие отобрать наиболее значимые регрессоры; а именно регуляризацию LASSO (Least Absolute Shrinkage and Selection Operator). В таком случае при расчете коэффициентов минимизируемая функция примет следующий вид (3):

(3)

где - параметр, контролирующий силу регуляризации.

Чем больше параметр регуляризации, тем сильнее модель «сжимает» коэффициенты (Tibshirani, 1996). Данная модель хорошо подходит для отбора регрессоров, поэтому ее применение в исследованиях с большим количеством факторов обосновано. Большое количество независимых переменных чаще всего приводит к тому, что некоторые из них статистически взаимосвязаны, то есть, коэффициенты корреляции между регрессорами значимы. Например, логично предположить, что цифровые навыки из одной сферы будут иметь высокий коэффициент корреляции (рис. 2)

Рис. 2. Корреляционная матрица цифровых навыков.

Незначимые коэффициенты зачеркнуты

Модель LASSO принимает во внимание коллинеарность переменных и отбирает наиболее значимые регрессоры, тем самым снижая вероятность переобучения.

Важной особенностью данных является тот факт, что большинство переменных положительны: количество упоминаний навыков всегда больше или равно нулю. Кроме того, в соответствии с теоретическим обоснованием высокий спрос фирмы на цифровые навыки может быть взаимосвязан с инновационной активностью только положительно. Следовательно, теоретические предпосылки накладывают определенные ограничения: коэффициенты цифровых навыков всегда должны быть неотрицательны. В подобных случаях часто используются модели с неотрицательными коэффициентами, например, в Wu et al., 2014. Таким образом, необходимо использовать LASSO с неотрицательными коэффициентами.

Стоит отметить, что для применения регуляризации необходимо привести все независимые переменные к одной размерности, так как в противном случае суммирование абсолютных значений коэффициентов регрессии не имеет смысла. Данная особенность является ограничением модели; однако ограничение может быть преодолено с помощью стандартизации, или перехода к одной единице измерения - стандартному отклонению. Гиперпараметр выбирается автоматически с помощью кросс-валидации: для каждого значения определяется кросс-валидационный R2 и выбирается модель с максимальным коэффициентом детерминации. Для расчета параметров модели в настоящей работе планируется использование команды LassoCV языка Python и пакета glmnet языка R.

Далее стоит обратить внимание на спецификацию модели. При анализе панельных данных используются модель сквозной регрессии, модели с детерминированным или случайным индивидуальным эффектом. В общем виде модели могут быть представлены следующим образом:

(4)

где zi - вектор характеристик, не меняющихся во времени,

а ci и uit - случайные составляющие.

В модели со случайными эффектами предполагается, что E(ci|zi,Xi)=0. В модели с фиксированными эффектами допускается, что E(ci|Xi) зависит от Xi. Модель с фиксированными эффектами не позволяет оценить б и г. Таким образом, стоит определиться не только с методом нахождения коэффициентов регрессии, но и со спецификацией.

Сквозная модель не принимает во внимание гетерогенность, свойственную панельным данным. Гетерогенность коэффициентов регрессии может привести к смещенности оценок (Ратникова, 2006); данное свойство имеет место, когда для различных групп наблюдений (индивидов, стран, в данной работе - компаний) коэффициенты регрессии статистически различаются в силу ненаблюдаемых факторов, которые одинаковы во времени. Учитывая источник данных настоящей работы, нет оснований предполагать наличие гетерогенности инновационной активности и ее факторов.


Подобные документы

  • Понятие инновации и инновационного процесса. Оценка инновационной активности предприятий. Анализ динамики затрат и структуры инвестиций в инновационную деятельность, выявление их тенденций. Особенности статистического изучения инновационной деятельности.

    курсовая работа [99,9 K], добавлен 02.12.2014

  • Сущность, функции и значение инновационных компаний в процессе модернизации экономики страны. Европейский опыт развитития инновационных компаний при ВУЗах. Пути повышения эффективности инновационной деятельности ВУЗов и компаний, создаваемых при ВУЗах.

    дипломная работа [365,2 K], добавлен 21.05.2013

  • Анализ существующих барьеров и наиболее значимых сдерживающих факторов для успешного развития малых инновационных предприятий. Совершенствование механизмов государственной поддержки малого инновационного бизнеса (на примере Южного Федерального Округа).

    дипломная работа [2,5 M], добавлен 08.04.2015

  • Понятие инновационной деятельности. Инновационная модель развития и формы ее финансово-инвестиционного обеспечения. Факторы повышения инновационной активности в сфере энергетики. Анализ эффективности инновационных проектов на примере ОАО "Роснефть".

    дипломная работа [1,2 M], добавлен 30.07.2017

  • Анализ экономической роли малых инновационных компаний в технологической сфере. Становление инновационной инфраструктуры в развитых зарубежных странах. Процесс создания и становления инновационной инфраструктуры в России, правовая и налоговая поддержка.

    дипломная работа [1,5 M], добавлен 28.12.2015

  • Степень активности национальной экономики. Совокупный спрос и его составляющие. Неценовые факторы совокупного спроса и совокупного предложения. Изменения в потребительских расходах, государственных закупках, инвестициях. Изменение цен на ресурсы.

    курсовая работа [896,2 K], добавлен 12.02.2012

  • Рыночный спрос: экономическая сущность. Рынок и закон спроса. Изменение спроса. Спрос на ресурсы. Эластичность спроса. Спрос и предложение. Взаимосвязь спроса и предложения. Экономический кругооборот. Влияние спроса на экономику фирмы.

    курсовая работа [52,8 K], добавлен 23.06.2003

  • Спрос и предложение на рынках как важнейшая категория микроэкономического анализа. Закон спроса, факторы его изменения. Ценовая эластичность спроса. Факторы изменения предложения, его эластичность. Установление равновесной цены по Вальрасу и Маршаллу.

    курсовая работа [510,5 K], добавлен 25.02.2010

  • Понятие и характеристика спроса. Закон спроса, основные факторы, влияющие на него. Функции и способы представления спроса, сдвиг его линии. Характеристика предложения, его закон и факторы влияния на него. Индивидуальные и рыночные спрос и предложение.

    презентация [31,4 K], добавлен 30.04.2014

  • Понятие спроса и его отличия от понятия величины спроса. Сущность товара Гиффена и порядок определения спроса на него. Жилье и его характерные признаки, способы его применения. Основные факторы, определяющие спрос на жилье на рынке недвижимости.

    доклад [13,8 K], добавлен 29.10.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.