29 июля ГРЧЦ опубликовал на портале госзакупок данные о заключении договора на модификацию Автоматизированной системы мониторинга телерадиовещания РФ (АСМТРВ) «в части разработки программного модуля транскрибирования медиаконтента», обнаружил “Ъ”. Сумма контракта составила 41,7 млн руб. Разработчиком АСМТРВ является компания «Стрим Лабс», указано на сайте ГРЧЦ. В компании “Ъ” подтвердили, что с ней заключен контракт на доработку системы.
АСМТРВ используется с 2015 года для мониторинга всех вещающих в России телеканалов и радиостанций с целью выявления нарушений законодательства. Она выявляет перерывы в вещании, фиксирует выходные данные телерадиоканалов, рекламные врезки, бегущую строку, отсутствие знаков информационной продукции. Кроме того, АСМТРВ хранит и предоставляет Роскомнадзору записи содержимого телерадиоканалов. Ранее модуля с функционалом транскрибирования аудио в текст не было, он разрабатывается с нуля, уточнили в Роскомнадзоре.
Преобразование телерадиоконтента в текст «существенно повысит эффективность дальнейшего автоматического анализа», пояснили в Роскомнадзоре.
Сейчас, опираясь на данные АСМТРВ, Роскомнадзор преимущественно штрафует телеканалы за «формальные нарушения» — несоответствие знака информационной продукции требованиям закона «О защите детей от информации…», отсутствие маркировок о вреде потребления табака и т. д., говорит юрист компании ЭБР Александра Губанкова. Последнее время радиостанции и телеканалы чаще всего штрафуются за неуказание статуса иноагентов при их упоминании, добавляет член комиссии по правовому обеспечению цифровой экономики московского отделения Ассоциации юристов России Александра Орехович. Такие штрафы, по ее словам, не превышают 1 млн руб. «Таким образом, телеканалы и радиостанции привлекаются к ответственности ровно за те же правонарушения, что и остальные СМИ, например печатные»,— заключает госпожа Орехович. Но способы контроля за разными медиа отличаются, и если относительно печатных СМИ процесс может быть более или менее автоматизирован, то в случаях с телепрограммами и радиопередачами контроль производился выборочно, путем просмотра и прослушивания, добавляет она.
Управляющий партнер Коллегии медиаюристов Федор Кравченко предполагает, что одним из последствий модернизации АСМТРВ может стать увеличение штрафов для эфирных СМИ «на порядок».
Кроме того, это позволит органам власти, следящим за «политической благонадежностью СМИ», иметь дополнительный инструмент мониторинга острых тем, считает эксперт.
Транскрибирование — только часть работы, сотрудникам или подрядчикам Роскомнадзора придется вычитывать результаты работы модуля, чтобы найти правонарушения, до внедрения программы, которая сможет обнаруживать их самостоятельно, указывает Александра Губанкова: «Это подразумевает большой объем работы. Поэтому, даже если количество штрафов возрастет, это случится в отдаленной перспективе». Технологии перевода речи в текст устойчивы, но без модерации человеком возникает много опечаток, особенно при дефектах дикции, акценте и редких терминах, добавляет сооснователь цифровой платформы для бизнеса Dipa Татьяна Козуб.
Технология распознавания речи существует более 70 лет, но если раньше все сводилось к распознаванию простых слов, то сейчас точность даже в повседневной жизни вышла на новый уровень и постоянно совершенствуется благодаря машинному обучению, отмечает руководитель группы AI-разработки компании Voximplant Артем Бондарь. «Для качественной работы требуются большие объемы данных, десятки тысяч часов размеченных вручную диалогов, а также долгая и дорогая настройка модели машинного обучения»,— добавил он.
Дмитрий Шестоперов
Kommersant.ru