Вкалывают роботы,
а не человек
Как роботы пишут новости и создают тексты
Цифровая революция – вот что происходит в наши дни. Меняется облик и функции привычных вещей: позвонить можно хоть с утюга, а телевизоры могут не только показывать, но и «видеть». Не остаются в стороне и сферы деятельности, особенно те, которые напрямую связаны с диджитализацией: программирование, научные лаборатории и др. Цифровизация, однако, напрямую затрагивает и гуманитарные области – такие, как журналистика.

Как происходит роботизация журналистики, несет ли подобная цифровизация угрозу журналистам и какие существуют прогнозы на сегодняшний день – вы узнаете из нашего материала.

Может создаться впечатление, что речь идет о гуманизированных машинах, но это не так.

Что умеют делать роботы и заменят ли они человека?

Как закалялась сталь
Всё началось в 2009 году, когда исследователи Стэндфордского университета профессор Джеймс Гамильтон и доцент Фред Тёрнер предложили научному сообществу термин computational journalism (вычислительная журналистика). В их интерпретации «вычислительная журналистика» означает комбинацию алгоритмов данных и знаний в сфере общественных наук, дополняющих accountability journalism, или журналистику ответственности (это одна из категорий деловой журналистики). В своей работе учёные говорят о становлении журналистики, основанной на статистических данных, и об использовании различных баз знаний для подготовки материалов на всевозможные аналитические темы. По их словам, написанные таким способом материалы увеличивают значимость работы журналиста и способствуют решению социальных проблем. И всё же упоминаемые Гамильтоном и Тёрнером роботизированные журналисты (robotic reporters) имеют мало общего с современным представлением о них. Учёные делают больший акцент на работе с данными, чем на алгоритмах написания журналистских текстов без участия человека.
1
2010
В 2010 году в Токио презентовали первого андроида-журналиста, который при помощи датчикам и камере мог анализировать происходившие вокруг него события и готовить информационные отчёты о них.
2
2014
В 2014 роботы-журналисты начали появляться в редакциях крупных СМИ. Так Forbes обзавелись алгоритмом Narrative Science, для Los Angeles Times стал писать Quakebot, а для The Guardian – Guarbot.
3
2015
В 2015 году человечество познакомилось с Wordsmith – первой системой, способной самостоятельно писать тексты.
4
2017
В 2017 году агентство Press Association запустило проект RADAR, на поддержку которого выделила 807 тыс. долларов по программе Digital News Initiative. Кстати, проект действует до сих пор – на апрель 2019 роботом написано более 100 тыс. статей.




Несмотря на то, что роботы – вещь эксклюзивная, и действующие алгоритмы можно пересчитать по пальцам рук, некоторые корпорации и издательства могут себе позволить подобную роскошь. Ну а мы ограничимся одной рукой.
1. Джиа Джиа и её брат Сяо Нань (Sinkhoa, Southern Metropolis Daily)

Робот-журналист Джиа Джиа была первым алгоритмом, созданным в 2016 году в качестве эксперимента в Китае. Разработчики придали ей человеческий вид: Джиа Джиа была похожа на типичную китаянку, на ней были элементы национальной одежды, а стояла она, сложив в замочек ладони перед собой. Джиа Джиа должна была работать на китайское издание Sinkhoa.

К сожалению, «девочка» не справилась со своими задачами при первом же запуске программы: отвечала на вопросы очень медленно (в течение 10 секунд) и всего одним-двумя словами, хотя распознавала эмоции собеседника и даже шутила. Например, на вопрос «сколько тебе лет?» Джиа Джиа ответила «это секрет», а на вопрос «чего ты ждешь больше всего?» - «пятницы, так как это день зарплаты». Но все равно показательное интервью с сооснователем журнала Wired, Кейвином Келли, провалилось. По-видимому, китайский Бог программирования ошибся, создав первой женщину.

А вот со второй попытки, уже в 2017 году, все получилось: ученые пекинского университета назвали брата Джиа Джиа, робота-корреспондента, Сяо Нанем, который опубликовал свой первый материал объемом в 300 иероглифов в местной газете Southern Metropolis Daily. Статья была посвящена зашкаливающему количеству путешественников по Китаю в связи с китайским Новым Годом – Чуньцзе – и характерными пробками. Для написания материала такого объема Сяо понадобилась лишь одна секунда – поразительно короткий срок. Хороший журналист потратил бы на написание этой же статьи от 5 до 7 минуты. По словам Вань Сяоцзюня, одного из отцов робота, «по сравнению со штатными корреспондентами, Сяо обладает значительно большей способностью анализировать данные и быстрее писать тексты».

2. Wordsmith (Associated Press)

Wordsmith – информационная платформа, принадлежащая Associated Press (АP). Создана была в 2014 году в США, но изначально Wordsmith работал крайне медленно: 300 статей за 15 минут. Разработчики, памятуя неудачный опыт китайских коллег с Джиа Джиа, создавали Wordsmith не для коммуникации, а для анализа данных и генерирования статей на их основе. За один только 2014 год алгоритм создал более 3 тыс. отчетов и финансовых сводок.

Главным разработчиком алгоритма были «Automatic Insight»; они же утверждают, что бот может самостоятельно писать полноценные материалы, а не сухие отчеты и статистические данные. Джеймс Котеки, заинтересованное лицо компании, предполагал, что Wordsmith может создавать до 2 тыс. новостей в секунду, что на тот момент являлось абсолютным рекордом.

Как утверждают в редакции издания, сначала система выдавала много ошибок, но потом все улучшилось. Более того, журналистам, специализирующимся в этой области, удалось настроить алгоритм таким образом, что он «научился» писать живым языком, что, несомненно, для того времени являлось большим прорывом. На сегодняшний момент алгоритм генерирует больше 20 тыс. статей в месяц.

Не так просто настроить этот бот: любая погрешность в данных системы в дальнейшем выдаст ошибку. Таким образом, дело сугубо профессиональное. Несмотря на литературную составляющую и возможность «изобретать», программный код алгоритма составляет практически 90% начинки алгоритма. Писали как программисты, так и журналисты.

3. Quakebot (The Lost Angeles Times)

Широко известен следующий случай: 17 мая 2014 года в 6:25 в Калифорнии случились подземные толчки, и робот-журналист Quakebot спустя 3 минуты после первых колебаний земли смог охарактеризовать их природу и написал короткую статью об угрозе землетрясения с подробным указанием длин волн и последствий возможного крушения. При этом журналисту и программисту The Lost Angeles Times Кену Швенку не потребовалось делать ничего: он просто отправил эту новость, подписанную именем алгоритма, в редакцию своего издания («LAT»). Примечательно, что раньше новости, созданные роботом, подписывались именем журналиста, однако издательство посчитало это некорректным.

В то время Quakebot «работал» на издание уже 2 года, подключенный к американской службе геомониторинга, откуда он взял все необходимые ему данные (время первых толчков, их амплитуда, место землетрясения и др.), составил из них материал на основе этих данных, их сравнения с предыдущими землетрясениями, прогнозов последствия. Материал, созданный им, довольно полный, построен по правилу перевернутой пирамиды, в нем есть ссылки на источники информации. Не считая некоторых языковых ошибок, новость идеальная.

Quakebot до сих пор является членом команды The Lost Angeles Times. Его разработчик, Кен Швенке, утверждает, что алгоритм может не только регистрировать подземные толчки, но и делать обзор криминалистической «погоды» в США. Робот-журналист ежедневно мониторит огромную территорию в 10 млн. человек, отправляя в редакцию издания отчеты о том, сколько сегодня было жертв, где произошло ограбление и т.д . Таким образом, все преступления, вплоть до угона машины, просматриваются Quakebot и в отредактированном виде присылаются Кену Швенке. Такая информация может быть важна не только для сотрудников местных органов правоохранения, но и для застройщиков.
4. Narrative Science (Forbes)

Один из первых алгоритмов для работы с новостями. Создан по аналогии с информационной платформой «Биг Дата». Пишет «серьезные» материалы: отчеты для финансовых компаний о проделанной работе, об изменениях на рынках акций и др. Возможностями этого робота-журналиста активно пользуются Forbs, платя 10 долларов за новость в 3 тыс. знаков.

На этом работа алгоритма не заканчивается: в его задачи также входит освещение спортивных мероприятий. Например, когда в 2012 году проходил межуниверситетский турнир по бейсболу и был побит рекорд десятилетней давности, бот не преминул это упомянуть. Алгоритм пишет и о том, о чем «био-журналист», скорее всего, писать бы не стал: матчи детской лиги по баскетболу. В 2012 году он создал около 1,5 млн. статей на эту тему.

Отличительной чертой Narrative Science является его стиль написания статей: язык вполне приятный для чтения, текст хорошо структурирован, имеется большое внимание к деталям. «Био-журналисту» остается лишь сверстать текст.

У Narrative Science есть программа, аналога которой пока нет ни у кого: Quill. Этот сервис позволяет читателю выбирать и адаптировать под себя стиль новостных историй: насыщенный фактами или эмоциями, с длинными предложениями или обрывочными фразами.
5. Guarbot (The Guardian)

Самый известный бот Великобритании, работающий на издательство The Guardian с 2014 года. Основная его задача – создавать шаблонные новости. У этого алгоритма появляется то, чего нет у его американских «коллег»: язык написания статей регулируется внутренней библиотекой бота, а не человеком. Также алгоритм имеет доступ ко всем материалам издательства, созданным с 1999 года. Секрет успешной работы системы можно объяснить тем, что The Guardian взяли в штат рабочий высококвалифицированных специалистов в области IT-технологий, которые не позволяют программе бота допускать ошибки.

Отец Guarbot, Уилл Франклин, разработал для него специальные текстовые шаблоны с пробелами, которые автоматизированный алгоритм Guarbot заполнял актуальной информацией о происшествиях. По сути, в основу робота легла система создания фейковых новостей: сыграл опыт работы системы по генерации поддельных научных статей SCIgen, использующей метод контекстно-свободной грамматики.

Например, могла получиться следующая конструкция: имя собственное – последний раз видели – наречие – причастие – с – имя собственное. Правда, несмотря на то что созданные подобным способом заметки были грамматически правильны, им заметно недоставало смысла и связности. В попытках научить бота понимать контекст, Франклин опубликовал исходный код на сервисе GitHub, однако особо интереса среди программистов его задумка не вызвала и Guarbot так и не получил дальнейшего развития.
Итак – кто такие роботы – разобрались. А что они могут делать? Так ли они нужны людям? Да и кому нужны больше – журналистам или инженерам как поле для опытов и экспериментов? В чем их плюсы?
Скорость
Во многом это на руку журналисту, особенно новостникам – не нужно писать скучные материалы, пресс-релизы. Появляется возможность больше заниматься творчеством, исследовательской журналистикой. Кевин Руз, автор журнала New York, считает возможность «свалить всю рутину» на роботов-журналистов прекрасной возможностью расслабиться и перевести дух «в этой сумасшедшей гонке». Его поддерживает и Виктория Никс, консультант Decoded Everything.
Объём
Алгоритмы не просто создают статьи – они анализируют огромные массивы информации, работают с базами данных. Так, в 2016 году во время выборов американского президента робот Heliograph, спецкор The Washington Post, написал и опубликовал около 500 заметок. И хотя у робота нет четырех рук, как у Шивы и Брахмы, с огромным объемом информации он справляется запросто. По информации, предоставленной AP, роботы освещали Летние Олимпийские игры в Рио, будучи незаменимым подспорьем журналистам.

Во время выборов президента Франции в 2017 году события освещали компания Syllabus и газета Le Mound. Издания, объединившись и подключив к нудной рутинной работе роботов, меньше чем за 5 часов создали 150 тысяч страниц текста для сайта издания с результатами голосования 36 тыс. округов Франции. Поразительная скорость в совокупности с невероятной продуктивностью!
Персонализация
Роботы способны подогнать статьи в новостной ленте под тот формат, который удобен читателю. Делается это довольно тривиальными способами: программа отслеживает, какого типа материалы читает пользователь, что ему нравится, на чем останавливается дольше. Однако прогресс не стоит на месте: роботы вышли на новый уровень. Теперь алгоритм выбирает материалы для читателя, считывая его реакции: пульс, дрожание руки, влажность ладони.

Так как человек настраивает алгоритм в программе, то можно задать функции отслеживать те статьи, которых больше всего просматривали, лайкнули или сделали репост. Таким образом, робот отберет в свою словарную память те заголовки, которые больше всего нравятся, и будет создавать аналогичные.

Предлагает повестку дня
Время, уходящее у робота на определение повестки дня, исчисляется в секундах. Алгоритм действия простой: при включении программы (например, с утра) машина «переваривает» тысячи новостей, отбирая наиболее просматриваемые, копит данные (исторические или текущие). Также роботу можно задать функцию находить «важные» новости, те, на тематике которых специализируется издание. Тогда он будет выбирать необходимое из непрерывного потока информации (при создании самой новости также используется этот принцип: например, если новость о крушении поезда, то робот в начало новости, в лид, поставит данные о погибших и пострадавших людях, а не об убытках железнодорожной кампании).
Проводит параллели между событиями
Естественно, алгоритмы лишены человеческих чувств. Зато роботы могут такое, с чем на этот раз мозг человека не справляется: проводят параллели между самыми разными событиями. Например, человеку никогда не пришло бы в голову искать причинно-следственную связь между выборами Буша и красными автомобилями. А вот робот-журналист выявил её: как оказалось, владельцы красных «Жигулей» гораздо охотнее отдавали свои голоса за Буша.
Гибкость
Некоторые алгоритмы, вероятно, могут подстраиваться под стиль написания конкретного журналиста, меняя свой «почерк». Многие профессионалы своего дела не согласны с этим: по их мнению, бездушная машина не может обогнать человека в искусстве слова. Разработчики программ настаивают на обратном.
Беспристрастность
Так или иначе, журналист не может быть беспристрастным абсолютно во всех областях. Характер статьи может зависеть от настроения автора, от состояния его здоровья, от того, поссорился ли он утром с женой или нет. А вот роботу это не знакомо (как, впрочем, и все остальные чувства). Таким образом, статьи у робота получаются порой более беспристрастные, четкие, точные, чем у «био-журналиста». Так и хочется крикнуть журналистам: «Осторожно, они обходят вас! Будьте бдительны!».
Точность
Алгоритм никогда не ошибается. Точнее, он может ошибиться, но только один раз: специалист сразу перекодирует программу так, что в дальнейшем сбоев не будет. Так что необходимость в фактчекинге отпадает. Одна такая ошибка робота-журналиста получила довольно широкую огласку. Летом 2015 года алгоритм, принадлежащий американскому издательству, опубликовал в своем материале ошибочные данные: по словам робота-журналиста, акции компании Neftlix упали на 71%, тогда как в реальности они выросли почти вдвое. Причиной тому стала дисперсия акций, которую робот не смог учесть.
Несмотря на феерию и радостный ажиотаж, возникшие вокруг роботов в журналистике и не стихающие до сих пор, нельзя не признать, что это чудо техники не лишено минусов. Серьёзных минусов.
Низкие качество и глубина раскрытия темы
Ни одному роботу-журналисту не под силу написать аналитическую статью, материал с описательными элементами. Также роботы не различают сарказм, не понимают шуток: «обделены» чувством юмора. Среди пользователей сети Интернет был проведен опрос, в ходе которого выяснилось, что статьи, написанные «био-журналистом», более раскрытые, богатые лексикой и речевыми оборотами, что делает материал приятным для чтения.

В 2015 году Скотт Хорсли, бизнес-журналист, корреспондент NPR в Белом доме, решил проверить свои профессиональные способности и возможности типового алгоритма. Как уточняет редакция NPR, коллеги Скотта Хорсли хотели узнать, кто победит: чудо-машина или лучшее перо NPR. Условия для написания статьи сделали практически одинаковыми, насколько это было возможным. Так как, естественно, робот выигрывал бы по скорости написания материала, то выбрали такую тему, которую было бы комфортно развивать Скотту: финансовый отчет сети кафе Denny's. Журналист был завсегдатаем кафе, что позволило ему создать более полный материал, с использованием «приятных» читателю слов. Пишущий алгоритм Wordsmith компании Automated Insights написал материал среднего размера за 2 минуты, но он был сухим, с переизбытком цифр и статистического материала: робот знает 100 000 английских слов, и для того, чтобы выбрать нужные, он использует наиболее употребляемые людьми выражения, что делает его язык таким. Скотту же понадобилось около 7 минут, но его статья была мягче для восприятия: «Рост продаж показывает, что потребители не прочь раскрыть свои бумажники ради блинчиков, яиц и картофельных оладий». Что ж, это естественное право автора – делать свой материал необычным и оригинальным.

Неспособность выбрать сенсацию
Чего ждет от СМИ читатель? Сенсации, какого-то бума, абсолютно невероятной новости. Так вот роботы-журналисты, несмотря на их уникальную способность анализировать информацию, не могут выбрать именно сенсационное событие или то, из чего можно её сделать.
Этические нормы
«Био-журналист» может сомневаться, публиковать материал или нет, но алгоритм действует в соответствии с заданными ему параметрами. Сказал ему человек искать материал и писать новости об убийствах – робот делает. Сказал писать о домашних животных – робот делает. Именно потому, что робот не способен сам решать, что этично, а что нет, журналистика не может состоять из одних только алгоритмов: человек должен направлять систему, контролировать.
Авторское право
Алгоритм может использовать любую доступную информацию для написания новости. Однако вряд ли кто-то из пользователей сети Интернет захочет увидеть, как его материалы просто-напросто украдены «простодушным» алгоритмом, который не встретил барьеров на пути поиска информации. И снова мы возвращаемся к тому, что присутствие человека, его «твердая рука родителя» крайне необходимы в работе роботов. Напоминаем, что до сих пор главным редактором все еще остается человек.
Отсутствие обратной связи
Вспоминая печальный опыт с Джиа Джиа: не так много роботов, способных взять интервью у человека. Алгоритмам трудно настроить обратную связь с человеком. Пока нет ни одного качественного интервью, взятого у человека роботом.
Экспертное мнение
Зорин К. А.
Доцент кафедры журналистики и литературоведения СФУ, кандидат философских наук
«...журналистика – это не столько технические навыки (в чем уверены многие люди, далекие от СМИ), сколько умение определенным образом мыслить, определенным образом общаться с другими людьми, знание медийной логики (как доступно и эффектно подать сообщение)…»
«...появление «законов Клишаса» (о неуважении к власти, фейковых новостях, об отделении Рунета). Их принятие вероятнее всего затормозит развитие «роботожурналистики» в России. Для роботизации СМИ нужны инвестиции в разработку соответствующих программных продуктов. Государственным СМИ это не требуется (они и сейчас себя хорошо чувствуют), частные заняты решением более актуальных проблем. Не особенно понятно, зачем вкладывать деньги в подобные разработки иностранным инвесторам, если государство осознанно готовится к блокировке российского интернета в случае угрозы извне, а владеть российскими медиаактивами иностранцам крайне затруднительно уже длительное время. Что касается взаимодействия с обычными пользователями в соцсетях уже существуют чат-боты. Поэтому при сохранении существующих тенденций в сфере СМИ, роботизация журналистики откладывается».
«Вероятнее всего, деловые информагентства [станут пионерами в роботизации журналистики]. Во-первых, РБК уже несколько лет назад стало применять алгоритм для написания биржевых новостей. Во-вторых, именно у деловых СМИ есть и финансовые ресурсы и определенная потребность в цифровизации рутинных журналистских операций. Возможно, экспериментировать начнут и некоторые крупные информагентства, ориентированные на международные рынки. У остальных российских СМИ… У коммерческих медиа для подобных экспериментов не так много лишних средств, у государственных – отсутствует потребность в переменах».
Подведение итогов: основные прогнозы
Итак, что же такое роботы в журналистике и смогут ли они в ближайшее время полностью вытеснить «биологических журналистов» из профессии?

Несомненно, в современной информационной среде, где ставка делается на оперативность и сенсационность, робот-журналист – незаменимый «сотрудник» новостного агентства способный написать материал за то время, за которое человек едва ли мог бы узнать о произошедшем событии. Исходя из этого, сооснователь Narrative Science уверяет, что к 2033 году 90% статей будут создаваться искусственным интеллектом.

Однако стоит помнить, что на данный момент так называемые «роботы» представляют собой набор кодов, позволяющий системе собирать информацию открытых им источников и выстраивать заранее определённые слова в заранее определённой последовательности. Бесспорно, вариаций может быть бесконечное множество, но чувство стиля и языкового вкуса даже самые «умные» нейросети пока не научились вырабатывать. Кроме того, роботы не способны искренне воспроизводить человеческие эмоции, а чтение сухих текстов, основанных на перечислении всевозможных фактов (пусть и собранных из всех открытых источников) не способно долго привлекать внимание аудитории. Здесь-то их непредвзятость и оборачивается против них.

Огромная работа ещё предстоит на законодательном уровне, ведь до сих пор нерешённым остаётся, например, вопрос об авторском праве. Да и не все правительства готовы будут мириться с монополией на рынке СМИ. А ведь она неизбежна ввиду того, что позволить себе разработку или покупку алгоритмов-«текстовиков» смогут лишь крупные издательства, и с региональной прессой нам придётся распрощаться.
Китайский робот Джиа Джиа: первая презентация
Авторы проекта
Диана Асадова
Студентка 206 группы
МГУ им. М.В. Ломоносова
факультет журналистики
Анастасия Полуянова
Студентка 206 группы
МГУ им. М.В. Ломоносова
факультет журналистики
Источники:

Замков А.В., Крашенинникова М.А., Лукина М.М., Цынарёва Н.А. Роботизированная журналистика: от научного дискурса к журналистскому образованию

Иванов А. Д. Роботизированная журналистика и первые алгоритмы на службе редакций международных СМИ // Знак // 2015

Калмыков А.А. Гипертекст мышления и коммуникативное пространство // Человек // РАН, 2007

Калмыков А.А. Семантическая сеть – будущее медиа // Вестник электронных и печатных СМИ // Академия медиаиндустрии, 2014

М.Кастельс, М.Паркс, Б. Ван дер Хаак Будущее журналистики: сетевая журналистика

Плец Т. Быстро и надёжно: как роботы теснят журналистов

Чумаков Н. Китайский робот-журналист за секунду написал первую статью из 300 символов

Arjen van Dalen The algorithms behind the headlines: How machine-written news redefines the core skills of human journalists

Hall S. 7 challenges for AI in journalism

Kuntze E. Future journalism: The rise of the ribots journalists

Narrative Science articles

Radar // Press Association

Watry G. The fourth industrial revolution and robot journalism
Made on
Tilda