Сравнительный анализ структурно-содержательных элементов машинных и журналистских новостных сообщений

Анализ особенностей алгоритмических решений в журналистике и медийной практике. Изучение результатов сравнения текстов, созданных алгоритмом и написанных человеком. Отечественный опыт роботизированной журналистики. Использование алгоритмов в "Интерфаксе".

Рубрика Журналистика, издательское дело и СМИ
Вид статья
Язык русский
Дата добавления 11.01.2021
Размер файла 36,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Сравнительный анализ структурно-содержательных элементов машинных и журналистских новостных сообщений

Мария Лукина, Екатерина Палашина

В статье впервые в отечественных медиаисследованиях продемонстрированы результаты сравнения текстов, созданных алгоритмом и написанных человеком.

Для пилотажного сравнительного анализа новостных сообщений на экономическую тему информационного агентства «Интерфакс» была использована основанная на структурно-функциональном анализе методика качественного разбора журналистских текстов.

Авторы полагают, что эта методика применима для осуществления дальнейших исследований, в частности количественного анализа, основанного на выборках больших массивов новостных текстов.

Ключевые слова: роботизированные новости, структурно-содержательный анализ, перевернутая пирамида, заголовок, лид и корпус новости.

журналистика роботизированный алгоритм интерфакс

Введение

Автоматизированное цифровое производство, управляемое интеллектуальными системами, проникло в разные структуры и процессы медиаиндустрии, в том числе в этап создания текстов. Одними из первых использовать алгоритмы для генерации контента стали крупные информационные агентства, работающие с большим потоком входящей финансовой информации. Алгоритмы, позволяющие создавать новости без участия человека, обеспечили молниеносную скорость создания сообщений, позволили максимально оперативно снабжать информацией свою аудиторию.

Первые опыты алгоритмизации новостей стали проводить такие информационные гиганты, как Associated Press, Bloomberg, затем к ним присоединились игроки журнального и газетного рынка. Эксперименты начали проводиться с 2013 г. Лидером по внедрению этих решений среди медийных компаний стало информационное агентство Associated Press. По словам его бизнес-редактора Филаны Паттерсон, к 2015 г. автоматизация освободила примерно 20% времени, необходимого журналистам на обработку данных и подготовку финансового блока новостей, что, в свою очередь, позволило им сконцентрироваться на творческой работе. Другим важным преимуществом применения алгоритмов Паттерсон назвала уменьшение вероятности ошибок в текстах1.

В отличие от зарубежных медиа, где практика использования готовых автоматизированных решений в производстве контента в последние годы стала неотъемлемой частью рабочего процесса, в России алгоритмы для создания новостных сообщений применяют лишь немногие редакции. К ним относятся информационные агентства «Интерфакс» и ТАСС, онлайн-издание Sports.Ru, женский глянцевый журнал ELLE и, конечно, поисковая система «Яндекс». По словам директора АНО «Информационная культура» Ивана Бегтина, применение алгоритмических решений в журналистике есть следствие «экономической целесообразности, о которой задумываются медиакомпании, чтобы не содержать человека, который писал бы про курсы ЦБ». Эксперт отметил, что «таких направлений в журналистике, где робот может заменить человека, найдется не более десятка, например, спорт, погода и др.»2.

Теоретический обзор

Теоретическим осмыслением алгоритмических решений в журналистике и медийной практике зарубежные исследователи начали заниматься с конца 2010 гг. Изучались разные аспекты, связанные с их применением, в том числе возникающие проблемы подотчетности (Hamilton, Turner, 2009), социологии феномена (Anderson, 2012), практики в разных ньюсрумах (Karlsen, Stavelin, 2014), изменения в характере журналистского труда (Carlson, 2015), авторства (Monta, Reich, 2017), этических перспектив алгоритмических решений (HoUbuncher, Dorr, 2017), описывался также их статус- кво на определенный период (Graefe, 2016) и др.

Российский исследовательский дискурс не столь разнообразен, статьи посвящены изучению опыта роботизации в зарубежных СМИ (Иванов, 2015), проблемам транспарентности роботизированной журналистики (Иванов, 2017), роботизации медиапроизводства в контексте «журналистики смысла» (Зорин, 2016), теоретизации в фокусе журналистского образования (Замков, Крашенинникова, Лукина, Цынарёва, 2017). Отечественных разработок в области исследования созданного алгоритмами контента не проводилось.

Отечественный опыт роботизированной журналистики

Безусловным лидером в создании автоматических новостных лент является поисковая система «Яндекс», которая осенью 2015 г. запустила специальный сервис для СМИ «Яндекс для медиа»3. В своем блоге компания объяснила, что «информация поступает от ряда сервисов "Яндекса" - Пробок, Погоды и Поиска, обрабатывается с помощью алгоритмов и отображается в специальном интерфейсе для СМИ или рассылается подписчикам <...> в нашем "агентстве" нет ни одного корреспондента - только статистика и алгоритмы»4.

Своим подписчикам «Яндекс для медиа» предлагает новости, сортированные в соответствии с шестью тематическими блоками: интересы пользователей, пробки, погода, кино, музыка и электронная коммерция. Роботы оперативно сообщают о заторах на дорогах, передают последние метеосводки. Особенность решений «Яндекса» в его персонализированном интерфейсе, а формат подачи контента зависит от типа СМИ. Телеканалам, например, предлагают тексты для бегущей строки или адаптированные под телевизионное вещание готовые виджеты, радиостанциям - специальный интерфейс с обновлением информации в режиме реального времени, а печатным и онлайн- изданиям - электронную рассылку или ленту уведомлений в виде RSS. Главный успех предлагаемой «Яндексом» автоматизированной новостной ленты создатели видят в высвобождении временных ресурсов сотрудников редакций: «Готовые сводки новостей, которые можно сразу же зачитать в эфире или использовать для подготовки сюжета, позволят новостникам сэкономить самый важный для них ресурс - время»5.

Из производителей новостей в отечественных СМИ первопроходцем по применению алгоритмических решений принято считать информагентство «Интерфакс». Ленты с автоматизированными сообщениями появились там еще в середине 1990 гг., и до сих пор с помощью обработки структурированных данных роботы освещают некоторые сегменты экономического сектора: котировки акций, курсы валют, изменение цен на товары и др., также частично автоматизирована статистика по банкам и отчетности ВВП. По словам заместителя генерального директора «Интерфакса» Юрия Погорелого, реализацией и постоянным апгрейдом роботизированных разработок занимается собственное подразделение службы новостей агентства, в которую входит группа (Т-специалистов6.

Производство автоматических новостей в «Интерфаксе» осуществляется, как правило, в цикле полной автоматизации. В этом случае работа алгоритма автономна и новость выпускается роботом на ленту автоматически, без участия журналиста. Однако существует режим и неполной автоматизации, когда подготовленный машиной текст перед отправкой на ленту утверждает редактор. Юрий Погорелый говорит, что схема автоматизации зависит от уровня сложности информации. Однако и в том, и в другом случае в конце каждой роботизированной новости ставится обязательная оповещающая читателя маркировка: «Это автоматическое сообщение».

Использование алгоритмов в «Интерфаксе» не ограничивается генерацией текстов, их применяют в ньюсрумах и в качестве помощников при работе журналистов с входящим потоком информации. «У нас каждый журналист мониторит в режиме реального времени как минимум 250 сайтов ежедневно, - говорит Юрий Погорелый, - это им помогают делать специальные программы, которые выявляют инфоповоды, а пишут текст сами журналисты на базе того, что узнали от роботов»7. В перспективе «Интерфакс» планирует развивать новые направления автоматизации, в частности в области обработки большого количества данных. Например, просмотреть в одиночку все решения арбитражных судов журналист не в состоянии, а вот роботу справиться с такой задачей под силу. По словам Погорелого, «роботы не создают какое-то новое знание, а лишь обрабатывают то, что уже есть». Ежедневно при участии роботов агентство публикует сотни единиц информации, включая статистику, отчетность, результаты торговли на организованных рынках и др. И такая частичная замена ручного труда обеспечивает при выполнении рутинных задач серьезную экономию времени журналистов.

ТАСС в отличие от «Интерфакса» роботизацией занимается последние несколько лет и по некоторым направлениям лишь в экспериментальном режиме. В частности, ТАСС реализует два ключевых проекта, связанных с роботожурналистикой. К первому относится написание заметок алгоритмами на основе входных данных. Находящаяся в разработке программа умеет анализировать дискретные данные и может создавать новостные сообщения о курсах валют, расходах бюджета и др. На момент тестирования нового инструмента процесс строго контролировался редакторами, что было связано в первую очередь с необходимостью предотвращения ошибок. Программисты информационного агентства также обучили программу мониторингу динамических данных с целью автоматизации биржевого и финансового потока информации в будущем. Налаживая этот механизм, ТАСС экспериментировал с оперативным отслеживанием новостей с сайта Московской биржи.

Однако особое внимание редакция уделяет второму проекту: системе автоматической категоризации текстов. Анализируя содержание каждого сообщения, робот классифицирует его в соответствии с рубриками, геолокациями и объектами. Кстати, аналогичная система применяется в американском новостном агентстве Associated Press, где каждый материал пропускается через специальные автоматизированные «фильтры».

Эту технологию первыми начали применять региональные ленты ТАСС, затем агентство категоризовало экономический раздел. «Эту разработку я считаю важным достижением, благодаря которой возможно "выпечь" любую новостную ленту, что позволяет информагентству охватить мелких клиентов и заработать на этом», - объясняет заместитель главного редактора ТАСС Михаил Лукин8. Категоризация также минимизировала трудовые затраты редакции. По словам Лукина, алгоритм, по сути, заменяет труд почти четырех журналистов, чья работа была бы необходимой в случае ручного создания такой персонализированной ленты.

Осознавая перспективность этой технологии, разработчики ТАСС намерены создать универсальный алгоритм, который будет обрабатывать более сложные данные - например, отчеты компаний, пресс- релизы и метеосводки. Для наполнения материалов предполагается автоматизировать также архивы информагентства. «Не человек будет смотреть, в какой период курс доллара поставил рекорд, а робот. У него это получается гораздо быстрее и с меньшими затратами», - говорит о планах ТАСС Михаил Лукин.

Методика

Для сравнительного анализа новостных сообщений была выбрана основанная на структурно-функциональном анализе методика качественного разбора журналистских текстов. В качестве эмпирической базы использовались новостные сообщения на экономическую тему информационного агентства «Интерфакс».

В рамках исследования был поставлен ключевой вопрос: в чем отличие текстов, созданных алгоритмом, от написанных профессиональными журналистами? Сравнивались машинные и журналистские тексты на предмет соответствия определенным критериям структуры и содержания новостного сообщения.

Алгоритм автоматической генерации «Интерфакса» участвует в написании новостей на темы, связанные с рынком ценных бумаг, курсами валют, деятельностью Банка России (ЦБ), включая остатки денежных средств на корреспондентских счетах, отзывы лицензий у коммерческих банков, установление цен на драгоценные металлы, анонсом макроэкономических показателей, праздниками ведущих стран мира.

В качестве единиц контент-анализа были выбраны новостные тексты, опубликованные на ленте финансово-экономической информации «Интерфакса» в октябре-ноябре 2018 г. Всего для исследования было отбрано 50 публикаций разного объема, в статье для разбора использовано шесть типовых новостей (три произведены роботом, (три написаны журналистами).

Ограниченность выборки объясняется тем, что для новостных сообщений информационного агентства, специализирующегося на финансово-экономической информации, характерно следование шаблонам и строгая композиция, соответствующая сформированным и устоявшимся редакционным стандартам. Новости, созданные как алгоритмом, так и человеком, должны отвечать этим статндартам, прописанным в разработанном агентством «Интерфакс» стайлгайде9, в связи с этим рандомно выбранные эмпирические объекты представляются релевантными для исследования.

В качестве индикаторов сравнительного контент-анализа новостных сообщений, произведенных роботами и журналистами, были выбраны следующие структурно-содержательные характеристики и элементы:

заголовок/хедлайн (вид, его соответствие теме);

лид (расставленные акценты);

корпус/тело новости (использование цитат, ссылок и их виды, фактологическая наполненность);

бэкграунд (наличие, функции);

полнота содержания (ответы на вопросы кто? что? где? когда? почему? как?);

насыщенность числовыми данными;

насыщенность расчетными величинами;

насыщенность специальной терминологией;

длина предложений.

Чтобы зафиксировать результаты сравнительного контент-анализа были разработаны рабочие таблицы (см. табл. 1 и 2), которые демонстрируют ключевые особенности новостных публикаций алгоритмической природы и публикаций, созданных человеком.

Результаты

Пилотный зондаж структурно-содержательных элементов новостныхзаметок проводился на материалах информационного агентства «Интерфакс/Финмаркет». Ниже приводятся результаты анализа новостных сообщений, которые рассмотрены на предмет наличия или отсутствия структурно-содержательных компонентов: заголовка/хедлайна; лида; корпуса/тела новости; бэкграунда. В ходе исследования анализировалось также использование структурного принципа «перевернутой пирамиды», т.е. изложение сообщения по степени важности от главного к второстепенному, и полноты содержания, которое раскрывается ответами на вопросы кто? что? где? когда? почему? как?

Сравнение проводилось и в соответствии с такими критериями, как объем сообщения, длина предложений, насыщенность числовыми данными, расчетными величинами, а также специальной терминологией.

Тексты, созданные алгоритмом

Пример 1.

Средний курс продажи наличного доллара США в банках Москвы достиг минимального значения за месяц и составляет 66,4822 руб.

23 ноября. «Финмаркет» - Минимальное значение за месяц (с 24 октября по 23 ноября) - 66,4822 руб. за доллар, максимальное значение - 68,6428 руб. за доллар, средний курс продажи за месяц снизился на 0,02 руб.

Это автоматическое сообщение (23.11.2018).

Анализируемая новость посвящена среднему курсу продажи наличного доллара США в банках Москвы за месячный период с 24 октября по 23 ноября 2018 г. Она относится к наиболее распространенному виду коротких автоматизированных сообщений о курсах иностранных валют. Новость включает заголовок (хедлайн), который отражает главную суть новости, а также изложенный в одном предложении корпус новости. По своей структуре новость напоминает срочную новость, или «молнию», так как в анализируемом случае вся информация сформулирована сжато, всего в нескольких фразах. Главной опорой текста служат цифры, которые являются основными смысловыми единицами контента, посвященного узкой обла сти финансовых отношений. Информация представлена в соответствии с правилом «перевернутой пирамиды». Текст отвечает лишь на часть вопросов «что произошло? где и когда произошло?». Структурные элементы лид и бэкграунд отсутствуют.

В новости используется принятый в «Интерфаксе» дейтлайн, указывающий, когда и кем передана информация10. В конце сообщения агентство маркирует алгоритмическую природу новости - «это автоматическое сообщение». Материал изобилует цифрами, причем не округленными, а максимально точными (дробные числовые значения).

Объем новостного сообщения составляет 50 слов, насыщенность текста числовыми данными исчисляется шестью словами, что от общего объема текста составляет 12%. В новости отсутствуют расчетные величины (выражаемые, как правила, в процентах, количестве раз), а также специальная терминология. Длина предложений не превышает 30 слов.

Пример 2.

Средневзвешенный курс доллара США к российскому рублю со сроком расчетов «завтра» по состоянию на 11:30 мск 28 ноября составил 66,9436 руб.

28 ноября. «Финмаркет» - На 11:30 мск средневзвешенный курс доллара США к российскому рублю со сроком расчетов «завтра» на торгах Московской биржи повысился на 789 пунктов (1 пункт соответствует 0,01 коп.) по сравнению со средневзвешенным курсом предыдущего торгового дня и составил 66,9436 руб. По сравнению с уровнем, сформировавшимся к этому времени накануне, средневзвешенный курс доллара вырос на 1636 пунктов.

Минимальная цена 66,76 руб., максимальная - 67,06 руб. Было заключено 4615 сделок. Объем торгов без учета внесистемных сделок составил 35982 млн руб., что на 175% выше среднего значения за последний месяц. Последняя сделка была совершена по курсу 67,0025 руб. за доллар.

С 15 апреля 2003 г. Банк России устанавливает официальный курс доллара США к российскому рублю на основе средневзвешенного значения курса доллара США на торгах со сроком расчетов «завтра», сложившегося по состоянию на 11:30 дня торгов.

Источник данных - Московская биржа. (28.11.2018).

Данная автоматическая новость также посвящена курсу валют, но по сравнению с предыдущим примером она более расширена и сочетает в себе все структурные элементы: заголовок (хедлайн), лид, корпус и бэкграунд. Хедлайн в соответствии со стандартами новостного агентства содержит основную информацию; контекстуальный бэкграунд состоит из одного предложения и выполняет функцию справочной информации. Новость также снабжена дейтлайном и строится по мере снижения значимости информации, отвечая при этом не на все возможные для жанра «перевернутой пирамиды» вопросы.

В представленной новости робот не только указывает на показатель курса доллара, но и детализирует ее, включая в сообщение сравнение курса и объемов торгов за предыдущие периоды, а также бэкграунд, рассказывающий с какого времени, как и когда Банк России устанавливает официальный курс доллара.

Как и в Примере 1, сообщение содержит большой объем количественной информации с максимальной точностью (дробные числовые значения). Помимо стандартной для автоматических сообщений «Интерфакса/Финмаркета» маркировки, обозначающей авторство алгоритма, в новости указан источник данных - Московская биржа.

Всего в новостной публикации 158 слов, насыщенность текста числовыми данными исчисляется в количестве 17 слов, что от общего объема текста составляет 10,7%. Всего одно слово (0,6%) указывает на расчетную величину. Насыщенность специальной терминологией равняется почти 2% (к экономической лексике относится три слова). Длина предложений варьируется от 11 до 39 слов.

Пример 3.

Загруженность Кутузовского проспекта значительно выше обычного.

Москва. 28 ноября, 21:03. «Яндекс. Пробки» Неожиданно плотное движение сейчас на Кутузовском проспекте. Загруженность магистрали из центра - 7 баллов, что на 4 балла выше обычного (28.11.2018).

Отдельного упоминания заслуживают автоматизированные новости, подготовленные «Интерфаксом» в сотрудничестве с «Яндексом». К ним относятся короткие сообщения, а также расширенные обзоры, посвященные пробкам и транспортной загруженности дорог больших российских городов, включая Москву и Санкт-Петербург. Публикация (пример 3) подготовлена роботом «Яндекса» и инкорпорирована в ленту новостного агентства в рамках проекта «Яндекс для медиа», в соответствии с которым «Интерфакс» вместе с пакетом собственного автоматизированного контента также использует пакет автоматических новостей «Яндекса» по пробкам. В частности, структурно-содержательный скелет представленной новости состоит из заголовка, дейтлайна, корпуса и содержит сообщение о загруженности одной из главных магистралей Москвы в максимальной упрощенной и краткой форме.

Новость, состоящая из 30 слов, содержит не более двух, относящихся к категории числовых данных, что в процентном соотношении от общего количества выражено как 6,6%. Расчетные величины и терминология в тексте отсутствуют. Предложения короткие - от шести до 12 слов.

Тексты, созданные журналистами

Пример 4.

Новости «Интерфакса»

Снижение цен на нефть и их волатильность практически не оказали влияния на динамику курса рубля в октябре - ЦБ РФ.

Москва. 20 ноября. «Интерфакс» - Существенное снижение нефтяных цен и рост их волатильности практически не оказали влияния на динамику курса рубля, говорится в обзоре рисков финансовых рынков, опубликованном на сайте ЦБ РФ.

«Даже на фоне столь существенного падения цен на нефть в октябре продолжилось снижение ожидаемой волатильности рубля по отношению к доллару США», - подчеркивает ЦБ. Регулятор отмечает, что уровень ожидаемой волатильности по паре «доллар США/рубль» на срок 3 месяца восстановился до значений, предшествующих всплеску волатильности на рынках стран с развивающимися рынками в августе. «Приостановка покупок валюты в рамках бюджетного правила позволяла сдерживать волатильность рубля даже в условиях значительного снижения мировых цен на нефть. Этому способствовали и принятые Банком России решения по ключевой ставке», - считает Банк России.

Регулятор отмечает, что согласно международным исследованиям, снижение волатильности валютного курса способствует сдерживанию доходностей государственных облигаций в национальных валютах. Отношение между уровнем волатильности на валютном рынке и стоимостью государственных заимствований в России соответствует пропорциям, характерным для emerging markets economies (EME) в целом.

«Текущая динамика обменного курса российского рубля была обусловлена общим характером движения потоков капитала на рынках ЕМЕ. Существенные отклонения вниз траектории движения обменного курса рубля от направления притока/оттока капитала на рынки ЕМЕ наблюдались в периоды повышенной волатильности в апреле и августе, однако нивелировались в последующие периоды по мере нормализации рыночной конъюнктуры», - говорится в обзоре.

«Ситуация на российском финансовом рынке в октябре являлась стабильной. Динамика рыночных индикаторов соответствовала тенденциям, характерным для стран с развивающимися рынками в целом. Риски являлись сбалансированными», - подчеркивается в обзоре.

ЦБ напоминает, что риски более серьезного снижения нефтяных цен были связаны с сообщениями Саудовской Аравии о нежелании допустить формирование дефицита сырья на мировом рынке и своей возможности нарастить добычу нефти до 12 млн баррелей в сутки. На этом фоне снижение мировых цен на нефть в октябре оказалось максимальным за два года: цены марок нефти Brent и Urals в долларах США снизились на 8,8% и 9,8% соответственно.

Служба финансово-экономической информации (20.11.2018).

Новость, написанная журналистом, посвящена динамике курса рубля. От предыдущих автоматических публикаций она отличается объемом, а также наличием цитат и прямой ссылки на источник в корпусе текста. В подтверждение своих слов журналист информагентства приводит выдержки из обзора финансовых рынков, опубликованных ЦБ, ссылаясь на регулятор банковской системы в каждом абзаце.

Новость также строится по принципу «перевернутой пирамиды», отвечая на ключевые вопросы, выраженные формулой 5W+H. Текст образован такими элементами, как заголовок (хедлайн), отражающий главную тему и суть новости, прямой лид и корпус. В соответствии с разработанными и принятыми агентством стандартами создания материалов в начале новости находится дейтлайн.

Объем публикации - 322 слова. В отличие от предыдущих примеров большинство предложений длинные, в среднем их размер более 20 слов. Числовые и расчетные величины представлены в меньшем количестве, по два-три слова на весь текст, что в процентном соотношении составляет 0,6% и 0,9% соответственно. Насыщенность специальной терминологией - 2,2% (семь слов на текст).

Пример 5.

ЦБ РФ 14 декабря рассмотрит и повышение, и сохранение ключевой ставки - Набиуллина

Москва. 28 ноября. «Интерфакс» - ЦБ РФ на заседании совета директоров 14 декабря будет рассматривать и повышение, и сохранение ключевой ставки, учтет все факторы, сообщила журналистам председатель Банка России Эльвира Набиуллина в кулуарах форума «ВТБ Капитала» «Россия зовет!».

«Мы будем рассматривать и повышение ставки, и сохранение ставки, и возможности», - сказала глава ЦБ.

«Мы 14 декабря собираемся на очередное заседание совета директоров и, как всегда, будем рассматривать все факторы, текущие тенденции, уточнять наш прогноз, будем рассматривать тенденции в инфляции, инфляционных ожиданиях, что происходит в экономике, на рынке труда, и принимать решение. Есть много факторов, которые мы будем принимать во внимание, для того чтобы принять решение после обсуждения», - добавила Э. Набиуллина.

ЦБ отмечает разные тенденции со стороны внешних и внутренних факторов. «Что касается, например, внешних рисков, на которые мы всегда обращаем внимание, мы видим, что чуть-чуть стабилизировалась ситуация с развивающимися рынками, это, прежде всего, связано со стабилизацией ситуации в странах, которые испытывали наибольшую волатильность. Чуть-чуть ослабли некоторые ожидания санкций, срок их введения. Но при этом мы видим изменения на рынке нефти», - отметила председатель Банка России.

Со стороны внутренних факторов ЦБ обращает внимание на приближение инфляции к цели. «Мы видим, что инфляция уже близка к нашей цели, и приближение к нашей цели снизу произошло быстрее, чем мы ожидали. Инфляционные ожидания пока остаются на повышенном уровне неровном: они в октябре снизились, в ноябре мы видим опять некоторое повышение инфляционных ожиданий. Ситуация на рынке труда при этом характеризуется практически полной занятостью», - добавила Э. Набиуллина.

Ключевая ставка ЦБ сейчас составляет 7,50% (26.11.2018).

В анализируемом примере представлена новость о возможном повышении ключевой ставки Центрального Банка. Текст построен на основе прямой речи главы ЦБ Эльвиры Набиуллиной. Журналист использует прямые цитаты председателя Банка России в качестве главного источника новости, упоминая при этом, что разговор с ньюсмейкером прошел в кулуарах инвестиционного форума. Так автор материала акцентирует внимание на эксклюзивности представленной в новости информации.

В структуре сообщения три элемента: заголовок (хедлайн), дэйтлайн, прямой лид и корпус, бэкграунд отсутствует. Уже в заголовке дается отсылка к главному источнику информации. Лид, по сути, является расширенной версией заголовка. Текст характеризуется полнотой содержания благодаря ответам на основные, присущие новостному жанру вопросы.

Всего новость состоит из 256 слов. Объем использования числовых данных, расчетных величин и терминов мал: три, одно и три слова, которые в процентном расчете составляют следующую величину: 1,2%, 0,4% и 1,2%. Длина предложений - от шести до 39 слов.

Пример 6.

К 2036 году ВВП РФ вырастет в 1,7 раза, реальные доходы населения - в 1,5 раза - прогноз Минэкономразвития

28 ноября. Finmarket.ru - Рост российского ВВП в базовом варианте прогноза в долгосрочной перспективе будет колебаться около 3% в год, что означает рост экономики в 1,7 раза к 2036 году относительно 2018 года, говорится в долгосрочном прогнозе Минэкономразвития, утвержденном на прошлой неделе правительством.

Согласно базовому варианту долгосрочного прогноза, инвестиции к 2036 году вырастут в 2,2 раза к 2018 году, промпроизводство - в 1,7 раза, реальные доходы населения - в 1,5 раза, реальная заработная плата - в 1,6 раза, розничная торговля - также в 1,6 раза.

Минэкономразвития России заложило в базовый сценарий предпосылку о постепенном снижении цен на нефть марки Urals до уровня $52-53 за баррель в 2025-2030 гг. с последующим ростом в номинальном выражении темпа долларовой инфляции - до $58 в 2036 году.

«В части внутренних условий социальноэкономического развития в базовый сценарий заложены следующие предпосылки. На прогнозном горизонте продолжится реализация денежно-кредитной политики в рамках режима инфляционного таргетирования. Особое внимание Банк России продолжит уделять мониторингу рисков финансовой стабильности и ее поддержанию. Бюджетная политика продолжит проводиться в рамках бюджетных правил, направленных прежде всего на изоляцию ключевых внутренних экономических параметров от волатильной внешнеэкономической конъюнктуры и создание условий для устойчивого экономического роста. Тарифная политика будет проводиться в соответствии с долгосрочными принципами тарифного регулирования, приоритетом которых сохранится ограничение темпов роста цен на услуги естественных монополий уровнем инфляции», - описывают в министерстве базовый сценарий долгосрочного прогноза.

Средний темп роста экономики ожидается министерством в 2018-2024 годах на уровне 2,7% в год, в 2025-2030 годах - 3,2% в год, в 2031-2036 года х - 3,0% в год.

Минэкономразвития также подготовило и консервативный вариант долгосрочного прогноза, где цены на нефть к 2020 году опускаются до $43 за баррель и плавно повышаются до $52 к 2030 году. В этом сценарии темпы роста ВВП ниже на несколько десятых процентных пунктов в год, чем в базовом варианте (28.11.18).

Таблица 1. Структурные элементы новостных заметок, созданных алгоритмом и человеком

Номер

новости

(пример)

Заголовок

Лид

Корпус

(тело)

Бэкграунд

Полнота содержания (ссылки на источники, цитаты ньюсмейкеров)

1

+

-

+

-

-

2

+

+

+

+

-

3

+

-

+

-

-

4

+

+

+

-

+

5

+

+

+

-

+

6

+

+

+

-

+

Таблица 2. Объем заметок, насыщенность числовыми данными, расчетными величинами и специальной терминологией

Номер

новости

(пример)

Объем новости (в словах)

Насыщенность числовыми данными, %

Насыщенность расчетными величинами, %

Насыщенность специальной терминологией, %

Длина

предложений (в словах)

1

50

12

--

--

18, 29

2

158

10,7

0,6

1,9

11, 16, 21, 29,

35, 39

3

30

6,6

--

--

6,7, 12

4

322

0,9

0,6

2,2

6, 9, 13, 13, 16,

18, 19, 20, 23, 23, 27, 28, 30, 36, 37

5

256

1,2

0,4

1,2

6, 8,10, 12, 12,

12, 13, 14, 18, 20, 21, 33, 33, 39

6

303

6,9

4,2

3,3

12, 12, 13, 17, 18 27, 28,28, 31, 37, 38, 39

Новость посвящена макроэкономической теме, а именно прогнозу роста ВВП в России. Структура сообщения стандартна для такого вида новостей и включает такие элементы, как заголовок, прямой лид и корпус, в каждом из которых содержится отсылка к ведомству Минэкономразвития. Информация излагается журналистом по принципу от главного к второстепенному, отвечая на основные вопросы за исключением объяснения причин -- «почему?».

Автор публикации детализирует свой текст подробной прямой цитатой из базового отчета-прогноза министерства. Новость также изобилует цифрами: точными датами, процентами и другими величинами, раскрывающими основные макроэкономические показатели, что, в свою очередь, делает сообщение информационно насыщенным.

Объем новостного сообщения - 303 слов. Насыщенность числовыми данными - 6,9% (21 слово от суммарного количества), а насыщенность расчетными величинами 4,3% (13 слов от суммарного количества). В тексте также было найдено 10 терминов, насыщенность которых измеряется в показателе 3,3%. Предложения в отличие от автоматических новостей также длинные. В составе более половины предложений от 25 до 39 слов в каждом.

В ходе проведенного авторами исследования изучалось в том числе использование структурного принципа «перевернутой пирамиды», т.е. изложения сообщения по степени важности от главного к второстепенному, а также полноты содержания, которое раскрывается ответами на вопросы кто? что? где? когда? почему? как? (см. табл. 1). Новостные сообщения также сравнивались в соответствии с такими критериями, как насыщеннось числовыми данными, расчетными величинами, специальной терминологией, длина предложений (см. табл. 2).

Заключение

Для пилотажного анализа созданных с помощью алгоритма и написанных журналистами новостных сообщений информационного агентства «Интерфакс» на экономическую тему была использована методика качественного разбора журналистских текстов. В результате сравнения исследователи пришли к следующим выводам. Существенных отличий между машинным и журналистским текстом в рассмотренных материалах выявлено не было, большинство структурно-содержательных компонентов, а именно заголовок/хедлайн; лид; корпус присутствуют в изученных как в алгоритмических, так и журналистских новостных сообщениях. И в тех, и в других новостях (кроме примера 2) отсутствовал бэкграунд в силу того, что в фокусе внимания были краткие новости, иногда в формате молний. Исследование показало, что по своим семантическим и стилистическим особенностям текст журналиста мало чем отличается от машинного текста в силу специфики письма, используемого для написания экономических информационных сводок по конкретным отраслям рынка. Тексты, выбранные для сравнения, не содержали ни языковых неточностей (включая орфографические, пунктуационные, стилистические), ни логических ошибок.

Однако при всей схожести новости, созданные журналистом, по сравнению с роботизированными текстами отличают следующие черты: во-первых, для них характерно наличие более разнообразного и исчерпывающего фактологического материала, во-вторых, привлекается информация, которую невозможно собрать с помощью алгоритма, - цитаты ньюсмейкеров, ссылки на «человеческие» источники, в-третьих, полнота содержания раскрывается с помощью вопросов как? и почему?, устанавливающих причинно-следственные связи события, которые алгоритмы пока не научились восстанавливать.

Автоматические новости по своему объему уступают новостям, подготовленным человеком. В машинных текстах также короче длина самих предложений. Такую разницу можно объяснить тем, что алгоритмы, не обладающие в отличие от профессионального журналиста способностью мыслить, анализировать и грамотно выстраивать в тексте причинно-следственные связи, пока не способны производить большие полноценные тексты. Освоение технологий автоматизации пока осуществляется в простых формах журналистского текста, поэтому работу алгоритма можно изучать исключительно в рамках коротких новостных сообщений, похожих по своей форме на оперативные оповещения.

Показатель насыщенности числовыми данными автоматических новостей выше, чем показатель текстов не алгоритмической природы. Это связано с тем, что алгоритмы работают в первую очередь с изменениями в насыщенных числовой информацией данными. Приоритетная задача автоматизированного подхода заключается в работе с готовыми текстовыми шаблонами, каждый раз требующими ввода новых данных, касающихся, например, точных значений изменившегося курса валют, стоимости ценных бумаг, драгоценных металлов или информации о загруженности дорог. Наличия точных числовых данных также постоянно требует унифицированность формата анонса макроэкономических показателей, в которых обязательным является указание даты и времени выхода нового анонса.

При этом автоматические сообщения редко содержат расчетные величины, указывающие на процентные показатели, а также сравнения, выраженные в количестве раз. Такая особенность объясняется тем, что авторы новостной ленты «Интерфакса» в отличие от алгоритма не только фиксируют информацию, но и перерабатывают ее, преобразуют в более простой вид, тем самым облегчая читателю процесс чтения и понимания и экономя его время. Анализ показал, что тексты журналистов могут отображать тенденции, динамики, зависимости, возможные прогнозы, которые сложно представить в публикации робота без привлечения расчетных величин.

Насыщенность специальной терминологией у автоматизированных и неавтоматизированных новостей относительно одинаковая. В силу специфики экономической тематики наличие в текстах специальной экономической лексики - естественное и необходимое условие, позволяющее осуществлять коммуникацию с целевой аудиторией, в которую входят преимущественно участники деловых отношений. Однако в отличие от новостей, подготовленных журналистами, употребление терминологии в автоматических новостях реализуется в рамках шаблонных речевых конструкций. Другая особенность заключается в отсутствии раскрытия значения терминов. Это можно объяснить целью адресной доставки информации.

Заместитель генерального директора «Интерфакса» Юрий Погорелый, рассказывая об особенностях автоматических новостей, отмечает: «Машинные тексты всегда одинаковые. По стилю это такое же информационное сообщение. Но если говорить о сути вещей, то такой текст всегда будет абсолютно стандартизованным»11. Заместитель главного редактора ТАСС Михаил Лукин также уверен в том, что пока преимущество сохраняется за журналистом, несмотря на огромную пользу алгоритмов в генерации новостей, благодаря которым удается анализировать большие массивы структурированных данных и в определенных ситуациях работать быстрее и эффективней человека. Он отмечает, что есть операции, которые человек делает лучше, чем машина, и, видимо, будет делать лучше всегда.

Примечания

Associated Press: Automated Insights. Режим доступа: https://automatedinsights. com/customer-stories/associated-press (дата обращения: 21.11.2018).

Выступление на круглом столе «Роботожурналистика: современное состояние и перспективы развития» (НИУ ВШЭ, 22 декабря 2017 г.).

Голицына А. «Яндекс» создает информагентство, где новости станут писать роботы // Ведомости. 2015. Окт., 25. Режим доступа: https://www.vedomosti.ru/ technology/articles/2015/10/25/614215-yandeks-informagentstvo-roboti (дата обращения: 21.11.2018).

Блог Яндекса: Яндекс для медиа. 2015. Ноябрь, 10. Режим доступа: https://yandex. ru/blog/company/99487 (дата обращения: 21.11.2018).

Там же.

Интервью авторов с заместителем генерального директора «Интерфакса» Ю. Погорелым. 2017. Дек., 13.

Там же.

Интервью авторов с заместителем главного редактора ТАСС М. Лукиным. 2017. Дек., 14.

Технология новостей от Интерфакса / под ред. Ю.А. Погорелого. М.: Аспект Пресс, 2011.

Там же. С. 10-11.

Интервью авторов с Ю. Погорелым.

Библиография

Замков А.В., Крашенинникова М.А.,Лукина М.М., Цынарёва Н.А. Роботизированная журналистика: от научного дискурса к журналистскому образованию // Медиаскоп. 2017. Вып. 2. Режим доступа: http://www.mediascope.ru/2295

Зорин К.А. Медиафутурология: «журналистика смысла» в условиях роботизации медиапроизводства и общества // Медиаскоп. 2016. Вып. 1. Режим доступа: http:// www.mediascope.ru/node/2078

Иванов А.Д. Роботизированная журналистика и первые алгоритмы на службе редакций международных СМИ // Знак: Проблемное поле медиаобразования. 2015. № 2 (16). С. 32-38.

Иванов А.Д. Транспарентность роботизированной журналистики: как новые технологии угрожают принципам профессии // Вестн. Челябинск. гос. ун-та. 2017. № 8 (404). С. 28-32.

Anderson W. (2012) Towards a Sociology of Computational and Algorithmic Journalism. New Media and Society 15 (7): 1005-1021.

Carlson M. (2015). The Robotic Reporter: Automated Journalism and the Redefinition of Labor, Compositional Forms, and Journalistic Authority. Digital Journalism 3: 416-431.

Graefe A. (2016) Guide to Automated Journalism. Tow Center for Digital Journalism, Columbia Journalism School.

Hamilton J.T., Turner F. (2009) Accountability Through Algorithm: Developing the Field of Computational Journalism. Режим доступа: http://cjlab.stanford.edu/files/Accountability%20 through%20algorithm_Developing%20the%20field%20of%20computational%20journa- lism.pdf

Hollbuncher K., Dorr K.N. (2017) Ethical Challenges of Algorithmic Journalism. Digital Journalism 5 (4): 404-419. DOI: 10.1080/21670811.2016.1167612

Karlsen J., Stavelin E. (2014) Computational Journalism in Norwegian Newsrooms. Journalism Practice 8 (1): 34-48. DOI: 10.1080/17512786.2013.813190

Monta T., Reich Z. (2017) I, Robot. You, Journalist. Who is the Author? Authorship, Bylines and Full Disclosure in Automated Journalism. Digital Journalism 5 (7): 829-849.

Размещено на Allbest.ru


Подобные документы

  • Роды, виды и жанры журналистики и типология рекламных сообщений. Жанровая характеристика и специфические особенности рекламы в СМИ: на радио, на телевидении, в печатной прессе и в сети Интернет. Сравнительный анализ журналистских и рекламных жанров.

    дипломная работа [81,3 K], добавлен 25.03.2011

  • Рассмотрение и анализ особенностей межличностных отношений в журналистских коллективах. Сущность понятия "культурная социализация". Журналистская деонтология как одна из самых молодых дисциплин в учебных планах факультетов журналистики российских вузов.

    дипломная работа [155,0 K], добавлен 07.12.2012

  • Общая характеристика журналистских текстов и способов подачи новостей в средствах массовой информации. Выборочный анализ подачи информации в BusinessWeek и анализ рейтинговых публикаций издания. Рассмотрение основных проблем журналистских текстов.

    курсовая работа [45,8 K], добавлен 27.11.2012

  • Многообразие методов в журналистике. Методы подачи материала (или методы предъявления информации) в журналистских текстах. Использование переосмысления в публицистических жанрах. Использование метода переосмысления в публикациях газеты "Ваш Ореол".

    курсовая работа [46,7 K], добавлен 22.11.2009

  • Анализ профессиональной деятельности по сбору, переработке и периодическому распространению актуальной социальной информации. Определение эффективность реализации целей журналистики. Результаты особенностей журналисткой деятельности и ее эффективность.

    курсовая работа [61,4 K], добавлен 25.04.2011

  • Анализ специфики телевизионных новостей. Структура выпуска новостной программы. Особенности языка информационной программы. Сравнительный анализ новостных программ "24 часа" и "Сегодня" на белорусском телевизионном канале "СТВ" и российском - "НТВ".

    курсовая работа [176,9 K], добавлен 03.04.2016

  • История и причины возникновения, пути развития социологического знания о журналистике и современное состояние. Социология журналистики в системе теории журналистики. Понятие социожурналитики, ее специфические признаки и значение, структура и практика.

    контрольная работа [11,5 K], добавлен 18.11.2010

  • Роль спортивной журналистики в России как предпосылки формирования особого медиадискурса. Контент спортивного медиадискурса в аспекте современного развития журналистики. Жанры в современной прессе. Анализ контента в спортивных журналистских материалах.

    дипломная работа [117,1 K], добавлен 05.09.2012

  • Коммуникативные стратегии и технологии современной спортивной журналистики. Проблема освещения спортивной тематики на региональном уровне, специфика журналистских текстов в печати, особенности и степень оригинальности сюжетов на местном телевидении.

    контрольная работа [31,2 K], добавлен 24.02.2016

  • Понятие жанра в теории журналистики. Характеристика жанрового разнообразия в современной журналистике. Особенности информационных, аналитических и художественно-публицистических жанров и разновидностей. Основные способы отображения в журналистике.

    курсовая работа [53,4 K], добавлен 25.06.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.