Современные механизмы интернета и социальных сетей помогают отбирать только самое лучшее и полезное для нас: фильмы с самым высоким рейтингом, магазины с самыми выгодными ценами. Более того, многие сайты и сервисы научились показывать пользователям те товары и тот контент, который они с большой долей вероятности хотели бы увидеть.
СМИ тоже не обошел стороной этот тренд. Так появились персонализированные новости. Правда, традиционные медийные бренды пока что осторожно ступают на этот путь, опасаясь того, что аудитория, которая будет видеть только то, что ей интересно, станет «зашоренной». Смелее действуют агрегаторы, которые противопоставляют этому тезису математические алгоритмы. Так, например, популярный российский поисковик и новостной агрегатор Рамблер делает персонализированными не больше 50% отображаемых новостей (см. интервью с главным редактором «Рамблер-Новости» Максимом Токаревым).
В этом материале мы постарались разобраться, какие возможности дает технология персонализации новостей как читателю, так и издателю.
Сэкономьте время, привлеките рекламодателей
Основная задача персонализации – позволить пользователю получать преимущественно ту информацию, в которой он заинтересован ввиду своего образа жизни, интересов или мировоззрения и, соответственно, экономить время. Технологии персонализации весьма востребованы на мировом рынке информационных технологий: Google, Facebook, Microsoft, Яндекс и другие не только активно ведут собственные разработки в этом направлении, но и скупают небольшие стартапы, которые работают на этом направлении.
Нина Григорьева, со-основатель и генеральный директор новостного мобильного приложения News360 (http://news360.com), предлагающего «заточенные» под пользователя новости, считает, что персонализация стала выходом для рекламодателей и СМИ, которые пока не научились эффективно продавать рекламу на мобильных устройствах, ведь персонализированные новости могут привлекать узко таргетированную рекламу. «Представьте, что пользователь, увлеченный выращиванием деревьев бонсай, увидит статью про новый вид бонсай, который будет продаваться на выставке в соседнем городе на следующей неделе. Что он почувствует? Конечно острую благодарность, что его вовремя предупредили. А что почувствует владелец нового сорта, когда к нему на выставке выстроится очередь?» – размышляет Григорьева.
Кроме того, функция персонализация экономит время для нахождения полезной информации, избавляет от информационного шума, но в то же время позволяет пользователю не пропустить ничего нужного. «Эта технология решает проблемы как производителей контента (найти свою аудиторию), так и рекламодателей (найти правильный способ достичь своих потребителей)», – рассказывает Нина.
Они знают о нас всё
Существует огромное количество вариантов «подстроить» новости под конкретного человека. Интернет-СМИ давно действуют по самому простому принципу «предложи читателю больше заметок на ту же тему». Информационные агентства, такие, как «Интерфакс» или Reuters предлагают пользователю самому указать, какие темы ему интересны, и впоследствии показывают контент из соответствующих рубрик в первую очередь. А вот мобильное приложение Flipboard, к примеру, позволяет пользователю самому создать свой новостной агрегатор, который будет включать в себя полюбившиеся юзеру сервисы. LinkedIn Today черпает знания об интересах пользователя из его личного профиля в социальной сети LinkedIn, его друзьях и активности.
Поисковые системы тоже используют персонализированные фильтры. По словам представителя Яндекса Екатерины Карнауховой, у их поисковика есть два алгоритма персонализации: долговременный (основана на постоянных интересах пользователя) и краткосрочный (сроком в одну поисковую сессию). Оба этих алгоритма формируют персональную формулу ранжирования для каждого пользователя, в соответствии с которой каждая страница в документе получает определенную оценку.
Первый алгоритм учитывает языковые предпочтения пользователя, его привычки и близкие ему темы. Второй – пытается угадать то, что важно человеку прямо сейчас. Например, пользователь, который обычно спрашивает про кино и музыку, может неожиданно заинтересоваться компьютерными играми, а потом надолго о них забыть. «Таких интересов, которые быстро возникают и так же быстро сходят на нет, больше половины», – поясняют в Яндексе. Чем больше запросов задает человек, тем лучше поиск его понимает. Например, подсказки и результаты поиска для людей с разной поисковой историей различаются вот так:
Чтобы быть в курсе постоянных интересов, Яндекс анализирует поисковую историю каждого пользователя за последние два месяца и за неделю, а чтобы следить за сиюминутными интересами – обрабатывает данные поисковых сессий в режиме реального времени. Это позволяет понять, что важно человеку прямо сейчас, и подстроиться под его интересы.
Яндекс приводят примеры: «Скажем, если в поисковой сессии любителя литературы вместе с названием произведения встретилось слово «афиша», возможно, что в данный момент человека интересует экранизация», – поясняет Екатерина Карнаухова. Вот как отличаются результаты поиска с учетом и без учета сиюминутных интересов пользователя:
По умолчанию персональный поиск работает для всех пользователей Яндекса, но отключить его можно в любой момент.
Чтобы мгновенно реагировать на изменения в поисковом поведении людей, Яндекс создал систему обработки данных в режиме реального времени. Через нее проходит более 10ТБ данных в сутки, постоянно корректируя свои знания о потребностях пользователей. Благодаря этой системе, запросы и клики, которые человек сделал только что, начинают влиять на результаты поиска уже через несколько секунд.
В «News360», по словам Нины Григорьевой, за персонализацию отвечают семантический процессор и процессор персонализации. Первый умеет понимать, о чем тексты, чем интересуется человек, и строит поток адаптированных для пользователя, правильно ранжированных и объединенных в “истории” статей. Второй модуль подбирает наиболее подходящий контент, фильтруя весь новостной поток через полученный граф интересов.
News360 использует технологии семантического анализа текстов на естественном языке, чтобы понять, о чем они написаны: на какие темы, о каких людях, компаниях, брендах, странах, городах. Компания индексирует весь новостной интернет (более 40 тысяч источников, сайтов, блогов – то есть около 200 000 статей в день) и “раскладывает” каждый текст на более чем 1 миллион словоформ». Более того, процессор учитывает и характер текстов: с юмором он написан или сухо, популярный текст или научный, длинный или короткий, с картинками.
В то же время анализируются и пользователи, в первую очередь их активность в социальных сетях, на основе которой выстраивается соответствующий граф интересов. Ценность имеет и место, в котором находится человек в момент использования приложения. «Понятно, что если человек в данный момент – на работе за компьютером, то ему интереснее профессиональные темы, а если дома на диване с iPad – то больше хобби, развлекательный контент», – объясняет Нина Григорьева
«Мы понимаем, что интересно пользователю, строя на лету его “портрет” или граф его интересов. После чего происходит магия: контент находит своего читателя, а читатель находит свой контент. При этом ничего не ища. Мы называем этот прием “поиском наоборот” – рассказывает гендиректор News360.
Человек из пузыря
Как влияет персонализация на конверсию сайтов? По статистике «News360», пользователи, включив персонализацию, начинают читать в среднем на 20% большей статей в день.
Представитель Яндекса рассказывает, что пользователи делают на 37% больше кликов на персонализированный первый результат, а новый подход позволяет сэкономить около 14% времени, проводимого ими на результатах поиска. «Особенно сильно персонализация увеличивает качество ответа на регулярные, практические вопросы – например, «смотреть видео онлайн». В целом же эта технология позволяет улучшить качество ответов примерно на 75-80% запросов пользователя», – подчеркивает Екатерина Карнаухова.
Но у персонализированной информации есть и обратная сторона медали, которая называется «пузырь фильтров», то есть не всегда явная фильтрация информации, которую получает пользователь. Она активно применяется в социальных сетях, в первую очередь – на Facebook и ВКонтакте. Новостная лента в них со временем адаптируется под каждого конкретного пользователя, и он перестает видеть в новостной ленте те новости, которые его не интересуют, а получает только то, что соответствует его запросам – например, никаких пирогов, только политика и коты. Социальные сети запоминают то, что «лайкают» пользователи, и впоследствии выдают им релевантный, по мнению алгоритмов, контент. Происходит это практически без участия пользователя, и человек со временем оказывается в том самом «пузыре фильтров», выбраться из которого можно только основательно покопавшись в настройках своего профиля.
Можно ли говорить о том, что персонализация лишает пользователя выбора? В Яндексе считают, что нет: «Во-первых, пользователь, как и раньше, получает все результаты поиска. Просто теперь они ранжируются немного иначе – с учётом личных предпочтений. Никто не мешает кликать не на первый, а на третий результат в поисковой выдаче, перейти на следующую страницу результатов поиска или же вообще отключить персонализацию в настройках», – считает Екатерина Карнаухова.
Нина Григорьева отмечает, что чувство опасности пропустить что-то все-таки присутствует у людей: «Человек так или иначе смотрит на мир глазами тех “редакторов”, на которые он подписан, будь то редактор газеты или твой друг в соцсети. Наш редактор – это искусственный интеллект, который независим, не ангажирован, не эмоционален. Иногда автор небольшого блога, который мало кому известен, пишет блестящие статьи на тему, которая интересует некоторых наших пользователей. News360 отыщет их и предложит вниманию пользователей».
При этом в News360 работают и над расширением кругозора пользователя, подбрасывая в его поток что-нибудь новое и наблюдая за его реакцией. Если она положительная – сфера интересов пользователя автоматически расширяется, если нет – агрегатор в следующий раз пробует ввернуть контент на другую тему.