Контент-анализ материалов II Открытого российского статистического конгресса

В статье выполнен контент-анализ текста сборника материалов II Открытого российского статистического конгресса и построена абстрактная модель типичного для данного издания текста статьи. Статьи посвящены статистическому анализу уровня развития России.

Рубрика Экономика и экономическая теория
Вид статья
Язык русский
Дата добавления 15.12.2021
Размер файла 1,9 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Контент-анализ материалов II Открытого российского статистического конгресса

Кракашова О.А.,

Житников И.В.

Аннотация

В статье выполнен контент-анализ текста сборника материалов II Открытого российского статистического конгресса и построена абстрактная модель типичного для данного издания текста статьи. Использовались ШетеЕсервисы для семантического анализа текстов НЬо и построения облака тегов WordItOut. Выявлено, что содержание текстов статей соответствует тематике и стилистике конгресса. Статьи, опубликованные в сборнике, посвящены преимущественно статистическому анализу уровня развития России. Исследования имеют явно выраженную экономическую направленность, проведены преимущественно на годовых макро- и мезоданных, рассматриваемых в динамике.

Ключевые слова

Контент-анализ, статистика, статистический конгресс, семантический анализ, облако тегов. статья статистический конгресс

Krakashova O.A., Zhitnikov I. V.

CONTENT ANALYSIS OF ARTICLES OF THE II OPEN RUSSIAN STATISTICS CONGRESS

Annotation

The article presents a content analysis of the text of the proceedings of the II Open Russian statistical Congress and an abstract model of the typical for this publication text of the article. Internet services were used for semantic analysis of Istio texts and building a cloud of WordItOut tags. It is revealed that the content of the articles corresponds to the theme and style of the Congress. The articles published in the collection are mainly devoted to the statistical analysis of the level of development of Russia. Studies have a pronounced economic orientation, conducted mainly on the annual macro - and meso-data considered in the dynamics.

Keywords

Content analysis, statistics, statistical Congress, semantic analysis, tag cloud.

4-6 декабря 2018 года в Ростове- на-Дону на базе Ростовского государственного экономического университета (РИНХ) под девизом "Статистика - язык цифровой цивилизации" прошел II Открытый российский статистический конгресс - крупнейшее научное мероприятие международного уровня. Устроителями конгресса выступили Российская ассоциация статистиков и Федеральная служба государственной статистики. Организаторами конгресса были Ростовский государственный экономический университет (РИНХ), Ростовстат и Ростовское отделение Вольного экономического общества. Конгресс проводился при активной поддержке Правительства Ростовской области и лично губернатора Василия Юрьевича Голубева. Генеральным спонсором конгресса выступил банк "Центр-Инвест".

В мероприятиях конгресса приняли участие более 700 человек из 31 субъекта Российской Федерации, а также статистики Германии, Греции, Израиля, Испании, Казахстана, Латвии, Нидерландов, Польши, США, Финляндии. Участниками конгресса были представители вузов, науки, Федеральной службы государственной статистики, исполнительных органов власти, Банка России, Пенсионного фонда России, СМИ, Статкомитета СНГ и Международного статистического института (К 0.

В рамках конгресса прошли пленарные и секционные заседания, работали круглые столы, проводились панельные дискуссии, был организован международный видеомост. Большой популярностью среди участников конгресса пользовался организованный генеральным спонсором фестиваль "Анализ больших данных" и хакатон BIG DATA.

Тематика обсуждаемых на конгрессе проблем относилась как к сугубо академическим, так и практико-ориентированным темам. Это нашло отражение в докладах участников.

Материалы конгресса опубликованы в двух томах сборника докладов, который содержит 205 статей 302 авторов. Они сгруппированы по десяти основным научным направлениям: Основные направления статистической деятельности Банка России; Актуальные вопросы развития финансовой статистики; Доходы, бедность, неравенство: методы статистического измерения; Информационные технологии в статистике, большие данные; Квалиметрия и статистика качества продукции, услуг, процессов, систем, организаций и жизни; Мониторинг достижения целей устойчивого развития ООН. Применение современных подходов в сельскохозяйственной статистике и статистике окружающей среды; Статистика - бизнесу, бизнес - статистике; Статистическое образование и статистическая грамотность - движение к будущему; Математическая статистика, эконометрика и инструментальные методы анализа; Статистика как инструмент принятия управленческих решений.

Ежегодно публикуется множество сборников материалов всевозможных конференций, монографий, журналов и других научных изданий в России и мире в целом. Однако сколь стремительно растет их количество, столь же неуклонно снижается качество текстов, опубликованных во многих из них, поэтому все сложнее становится ориентироваться в этом многообразии не только молодым ученым, но и специалистам, отвечающим за включение изданий в различные базы научного цитирования. Попытки борьбы с псевдонаучными публикациями привели к росту бюрократизации процесса организации научных мероприятий и публикации научных изданий, создающей множество дополнительных проблем для организаторов, авторов и издателей, но зачастую функционально несостоятельной. Решить данную проблему, на наш взгляд, можно, формализовав процесс оценки публикаций путем контент- анализа их содержания, позволяющего придать процессу оценки изданий большую прозрачность и объективность. Методологии проведения контент-анализа посвящены труды таких ученых, как Мангейм Дж. Б., Рич Р.К. [1], Аверьянов Л.Я. [2], Таршис Е.Я. [3] и др.

Большой общественный резонанс, вызванный II Открытым российским статистическим конгрессом, обусловливает интерес к содержанию обсуждаемых в ходе мероприятий конгресса тем. Нами был проведен контент-анализ текста сборника материалов II Открытого российского статистического конгресса Статистика - язык цифровой цивилизации: сб. докладов международ. научно-практ. конф. "II Открытый российский статистический конгресс" (Ростов-на-Дону, 4-6 декабря 2018 г.): в 2 т. / Российская ассоциация статистиков; Федеральная служба государственной статистики РФ, Рост. гос. экон. ун-т (РИНХ), Ростовское региональное отделение ВЭО России. Ростов н/Д, 2018. Т. 1. 708 с.; Статистика - язык цифровой цивилизации: сб. докладов междуна- род. научно-практ. конф. "II Открытый российский статистический конгресс" (Ростов-на- и построена абстрактная модель типичного для данного издания текста статьи.

Цели анализа:

1) установить степень соответствия опубликованных статей специфической статистической направленности конгресса заявленным научным направлениям, названиям, аннотациям и ключевым словам, а также стилистике научного текста;

2) выявить направления и темы исследований, вызывающие наибольший интерес среди отечественных и зарубежных ученых и специалистов- практиков;

3) определить основные объекты, методы и средства представления результатов статистического анализа.

Контент-анализ сборника материалов проведен по четырем совокупностям источников:

1) названиям статей, разделов и сборника в целом;

2) аннотациям статей;

3) заявленным авторами статей ключевым словам;

4) текстам статей.

Такой подход позволяет достигнуть поставленных целей анализа и обеспечить при этом сопоставимость изучаемых источников по размеру, структуре, месту и времени распространения (статьи опубликованы в одном сборнике).

Единицей анализа было выбрано слово. Объем сборника составляет около 1400 страниц, что обеспечивает репрезентативную совокупность различных слов, позволяющую провести содержательный анализ. Единицей счета является частота вхождения слов в анализируемый текстовый источник.

Контент-анализ статей II Открытого российского статистического конгресса, проведенный с помощью Шете^сервиса для семантического анализа текстовДону, 4-6 декабря 2018 г.): в 2 т. / Российская ассоциация статистиков; Федеральная служба государственной статистики РФ, Рост. гос. экон. ун-т (РИНХ), Ростовское региональное отделение ВЭО России. Ростов н/Д, 2018. Т. 2. 684 с. (табл. 1), показал, что работы, опубликованные в сборнике, отличаются богатым словарным запасом (на это указывают показатели "словарь" и "словарь ядра"), высокой содержательностью (низкий показатель "водность") и насыщенностью текста ключевыми словами (высокий показатель "тошнота"). "Словарь" - количество используемых в тексте слов. "Словарь ядра" - количество слов в тексте без стоп-слов, или шумовых слов. "Водность" обозначает долю словесных связок и слов, которые не несут смысловой нагрузки. Как правило, "водность" повышают наличие избитых фраз и выражений, обилие союзов и предлогов, вводные слова, которые можно опустить и др. Нормальное значение для легко читаемых популярных текстов - 30-60%. "Тошнота" - "коэффициент, показывающий заспамлен- ность текста самым повторяющимся словом... Определяется как квадратный корень из количества повторений самого тошнотного слова. Оптимальное значение классической тошноты равно 7" [4, 5], что характерно для научного текста, предназначенного к прочтению специалистами в данной области.

Таблица 1 - Контент-анализ текста сборника материалов II Открытого российского статистического конгресса

Параметр

Значение

в заголовках

Значение

в ключевых

словах

Значение

3

в аннотациях

Значение

-4

в текстах статей

Длина с пробелами

18211 символов

23533 символов

143981 символов

2787343 символов Анализировались предварительно очищенные файлы. Анализировались предварительно очищенные файлы. Для неочищенного текста - 3159114 символов.

Длина без пробелов

16312 символов

21364 символов

129724 символов

2469918 символов Для неочищенного текста - 28824074 символов.

Всего слов

1891

2172

14133

75152

Водность

17%

4%

14% Для неочищенного текста - 30%.

16% Для неочищенного текста - 35%.

Тошнота

9,11

6,70

13,11 Для неочищенного текста - 26,72.

28,51 Для неочищенного текста - 61,49.

Топ 10 слов

Статистический,

анализ,

развитие,

оценка,

Россия,

статистика,

финансовый,

экономика,

население,

экономический

Статистический,

анализ,

финансовый,

развитие,

экономика,

оценка,

статистика,

риск,

цифровой,

метод

Развитие,

анализ,

оценка,

статистический,

уровень,

показатель,

Россия,

экономический,

система,

население

Год,

показатель,

уровень,

развитие,

статистический,

анализ,

Россия,

население,

система,

область

Словарь

638 слов

860 слов

3006 слов

7724 слов

Словарь ядра

590 слов

820 слов

2639 слов

7065 слов

Язык текста

rus

rus

rus

rus

Тематика

Аналитика,

администрации,

политика

Аналитика, страхование, бизнес и финансы

Аналитика,

безопасность,

политика

Администрации,

аналитика,

страхование

Таблица 2 - Топ-20 слов заголовков, ключевых слов, аннотаций и текстов сборника материалов II Открытого российского статистического конгресса

№ в

Словарь

Словарь

Словарь

Словарь

рейтинге

заголовков

ключевых слов

аннотаций

текстов статей

1

статистический

статистический

развитие

год

2

анализ

анализ

анализ

показатель

3

развитие

финансовый

оценка

уровень

4

оценка

развитие

статистический

развитие

5

Россия

экономика

уровень

статистический

6

статистика

оценка

показатель

анализ

7

финансовый

статистика

Россия

Россия

8

экономика

риск

экономический

население

9

население

цифровой

система

система

10

экономический

метод

население

область

11

система

система

регион

рисунок

12

условие

модель

модель

оценка

13

показатель

жизнь

экономика

деятельность

14

подход

рынок

исследование

информация

15

исследование

экономический

основа

экономика

16

уровень

пенсионный

подход

финансовый

17

регион

население

финансовый

таблица

18

российский

индекс

деятельность

экономический

19

цифровой

показатель

процесс

значение

20

моделирование

доход

использование

число

Топ-10 (табл. 1) и топ-20 (табл. 2) слов как в заголовках и выделенных авторами ключевых словах, так и в аннотациях и содержании статей полностью соответствуют друг другу и заявленной статистико-экономической тематике конгресса. Соответствие текстов статей тематике конгресса подтверждает и содержание графы "Тематика" табл. 1, которое также вполне соответствует названию и разделам сборника.

Результаты контент-анализа хорошо иллюстрируются при помощи облака тегов (рис.1-4), созданных при помощи Intemet-сервиса WordItOutШетеЬсервис для создания облака тегов WordItOut [Электронный ресурс]. Режим доступа: https://www. worditout.com/word-cloud/create..

Рассмотрим визуализированные результаты анализа (рис. 1-4) и дадим им содержательную интерпретацию.

Статьи, опубликованные в сборнике, посвящены преимущественно статистическому ("статистический") анализу ("анализ") уровня ("уровень") развития ("развитие") России ("Россия"). Исследования имеют явно выраженную экономическую ("экономики", "доходов", "расходов", "ресурсов" и др.) направленность, проведены преимущественно на годовых ("год") макро- ("страна") и мезо- ("регионы", "область", "Республика") данных ("данные"), рассматриваемых в динамике ("период", "лет").

Рисунок 1 - Облако тегов по заголовкам (названиям статей и разделов

Рисунок 2 - Облако тегов по ключевым словам к статьям сборника

Рисунок 3 - Облако по аннотациям к статьям сборника

Рисунок 4 - Облако тегов по текстам статей сборника

Большинство работ посвящено проблемам населения ("население"), оценкам ("оценка") уровня ("уровень") и качества ("качество") жизни ("жиз-ни"), его численности ("численности"), доходов ("доходов") и расходов ("расходов"). Однако отсутствие в лидирующих позициях рейтинга слов текстов статей (таблицы 1-2) таких слов, как "индивид", "домохозяйство", хотя они и присутствуют в рейтингах по ключевым словам и аннотациям, также свидетельствует о проведении анализа преимущественно на макроданных.

Деятельность юридических лиц (таких "субъектов", как "организации", "предприятие", "компании") также рассматриваются, как правило, агрегированно в контексте функционирования рынков ("рынок") ("продукции" ("товаров", "услуг"), "ресурсов" ("труда", "капитала")) и отдельных видов деятельности ("деятельности") - "страхования", "образования" и др.

Приоритетным методом ("метод") исследований ("исследования") является "анализ", в первую очередь "статистический", позволяющий выделить факторы ("фактор"), влияющие на результат ("результаты"), и определить систему ("система") показателей ("показатель"), которыми они будут ("будет") оцениваться ("оценка"), а также установить "связи" между ними и характер "изменения" и влияния друг на друга. Широко используются такие методы ("метод") сравнения ("сравнение"), как диалектический, о чем свидетельствует частота вхождения в текст категорий "качество", "количество", "связи" и др.; и прогнозирования ("будет").

В подавляющем большинстве случаев ("случай") используются периодические ("период", "лет") годовые ("год") данные ("данные"). Приоритетная абсолютная единица измерения - тысячи рублей ("тысячи", "рубли"). Использование относительных показателей обусловливает частоту включения в текст таких слов, как "доля" и "процент" . Слово не попало в облако тегов и ключевые слова из-за того, что в тексте используется в виде обозначения "%", и было отброшено.

Результаты исследований представлены в виде рисунков ("рисунок"), как правило, графиков и диаграмм, таблиц значений показателей ("таблица", "показатель"), в том числе индексов ("индекс") и коэффициентов ("коэффициент"), и моделей ("модель"), описывающих функционирование, "рост" и "развитие" экономических процессов ("процесс") и систем ("система"), а также качественной информации ("информация"), позволяющей ("позволяет") повысить "эффективность" "управления" как отдельных компаний, организаций и предприятий ("компании", "организации", "предприятие"), так и "экономики" в "целом".

Набор топ-слов свидетельствует о наличии как позитивных, так и нормативных ("следует") высказываний в тексте статей.

Результаты контент-анализа показали, что II Открытый статистический конгресс стал знаменательным научным мероприятием для статистического сообщества не только по составу и количеству участников, но и оправдал ожидания высоким профессиональным уровнем, содержательностью, практической направленностью докладов, полностью соответствующих заявленной тематике.

Библиографический список

1. Мангейм Дж. Б., Рич Р.К. Политология. Методы исследования: пер. с англ. / предисл. А.К. Соколова. - М.: Весь Мир, 1997. - 544 с.

2. Аверьянов Л.Я. Контент-анализ: монография. - М.: РГИУ, 2007. - 286 с.

3. Таршис Е.Я. Контент-анализ: Принципы методологии. (Построение теоретической базы. Онтология, аналитика и феноменология текста. Программа исследования). - Изд. стереотип. - М.: Книжный дом "ЛИБРОКОМ", 2014. - 182 с.

4. Горелова И.В. Анализ текстов территориальных стратегий как основа формируемого конкурентного преимущества // Финансово-экономическое и информационное обеспечение инновационного развития региона: сорник материалов Всероссийской научно-практической конференции. Посвящается 100-летию Крымского федерального университета имени В.И. Вернадского / ответственный редактор А.В. Олифи- ров. - 2018. - С. 16-20.

5. Терехова Е.И., Бондаренко А.В. SEO-оптимизация и аналитика WEB- портала // Международная научно-техническая конференция молодых ученых БГТУ им. В.Г. Шухова: сб. науч. тр. - 2017. - С. 4509-4513.

6. Bibliographic list

7. Manheim Jarol B., Rich Richard K. Empirical Political Analysis: Research Methods in Political Science / Foreword. A. K. Sokolov. - M.: Ves Mir, 1997. - 544 p.

8. Averyanov L. Ya. Content analysis. Monograph. - M.: RGIU, 2007. - 286 p.

9. Tarshis E.J. Content-analysis: Principles of methodology. (Construction of the theoretical base. Ontology, Analytics and phenomenology of the text. Research program). - Ed. stereotype. - Moscow: Book house "LIBROKOM", 2014. - 182 p.

10. Gorelova I.V. Analysis of texts of territorial strategies as a basis of the formed competitive advantage // Financial, economic and information support of innovative development of the region Collection of materials of the all-Russian scientific and practical conference. Dedicated to the 100th anniversary of the Crimean Federal University named after V. I. Vernadsky / Responsible editor V. Olifirov. - 2018. - P. 16-20.

11. Terekhova E., Bondarenko V. SEO-optimization and Analytics of webportal / In the collection: international scientific and technical conference of young scientists of BSTU. - 2017. - P. 4509-4513.

Размещено на Allbest.ru


Подобные документы

  • Статистическая практика. Понятие статистического наблюдения. Цель статистического наблюдения. Программа статистического наблюдения. Формы статистического наблюдения. Способы статистического наблюдения.

    реферат [17,2 K], добавлен 23.03.2004

  • Формирование информационной базы статистического исследования. Программно-методологические и организационные вопросы статистического наблюдения. Виды статистического наблюдения и их особенности. Статистический нализ предпочтения газет в г. Череповец.

    курсовая работа [41,2 K], добавлен 15.03.2008

  • Результаты сводки и группировки материалов статистического наблюдения. Таблица как наиболее рациональная, наглядная и компактная форма представления статистического материала. Основные элементы статистической таблицы. Общий, верхние и боковые заголовки.

    презентация [690,5 K], добавлен 06.12.2016

  • Статистическое наблюдение как первый этап статистического исследования. Формы организации статистического наблюдения. Виды и способы статистического наблюдения. Организация сбора данных, план статистического наблюдения, ошибки и меры борьбы с ними.

    реферат [19,6 K], добавлен 04.06.2010

  • Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.

    курсовая работа [667,1 K], добавлен 14.05.2013

  • Особенности лесного потенциала Российской Федерации: его состав, значение и экономическая оценка. Основные покупатели российского леса. Методы статистического анализа данных экспорта лесных ресурсов государства. Определение среднего уровня ряда динамики.

    курсовая работа [286,0 K], добавлен 12.12.2011

  • Программно-методологические вопросы статистического наблюдения. Этапы создания и классификация статистических сводок. Расчет средней арифметической из внутригрупповых дисперсий. Выравнивание ряда динамики выпуска продукции, анализ ее абсолютного прироста.

    контрольная работа [722,7 K], добавлен 27.03.2012

  • Перспективы развития отдельных подотраслей промышленности строительных материалов: горнодобывающей, производства теплоизоляционных материалов, цемента. Промышленность строительных материалов в ресурсном обеспечении экономического развития России.

    курсовая работа [62,5 K], добавлен 12.10.2011

  • Экономическая деятельность по производству машин и оборудования как объект для статистического исследования и прогнозирования развития отрасли. Описание методов статистического анализа. Прогнозирование развития производства машин в Тюменской области.

    курсовая работа [73,3 K], добавлен 27.07.2014

  • Задачи сводки и её основное содержание. Сведение воедино материалов статистического наблюдения и получение обобщающих статистических показателей как цель сводки. Разновидности группировок, задачи группировок и их значение в статистическом исследовании.

    реферат [15,1 K], добавлен 04.06.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.