Нейросеть обрабатывает текст новости и создает заголовок из фрагментов слов — так она добивается правильных падежей и склонений, получая связное предложение. Разработчики применили технологии, которые используются в машинном переводе и позволяют ограничиться небольшим словарем для генерации заголовков. Как отмечает пресс-служба соцсети, они стали первыми, кто обучил такую модель с помощью русскоязычных новостных материалов.
Чтобы проверить качество работы модели, было проведено отдельное исследование. Добровольцам давали прочесть новость и два заголовка к ней. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинального, а в 15% — даже лучше.
«Исследование с добровольцами показало, что заголовки, созданные нейросетью, пока не всегда получаются такими же качественными, как написанные человеком. Однако мы не перестаем улучшать модель — и непременно добьемся равных результатов», — рассказал разработчик-исследователь Даниил Гаврилов.
Презентация нейросети состоялась в апреле на Европейской конференции по информационному поиску (European Conference On Information Retrieval 2019) в Кельне.