Как сообщалось, несколько месяцев назад Британская вещательная корпорация BBC вновь запустила очередную языковую службу иновещания — польскую. Было также объявлено, что в подготовке своих материалов польская служба будет активно использовать искусственный интеллект (ИИ) для адаптации англоязычных исходных материалов на польский язык. Также было объявлено, служба иновещания в будущем предполагает запустить и службы на новых иностранных языках, где будет задействоваться ИИ. При этом ИИ уже сейчас активно используется на BBC как в переводе, так и в создании субтитров. Британское Интернет-издание о ТВ Advanced Television опубликовало недавно обзор о том, как на BBC происходит, что называется, тихая революция с созданием переводов и на др. языке и созданиям субтитров. Процититуем указанный обзор в нашем переводе:
«Каждый день Британской вещательная корпорация BBC выпускает 500 часов нового видеоконтента, включая новости, документальные фильмы, спортивные и развлекательные программы
Создание субтитров для такого огромного объёма раньше было медленным и дорогим занятием, но сегодня искусственный интеллект изменил ситуацию. Благодаря новым инструментам ИИ редакторы могут быстро создать субтитры, обеспечивая практически мгновенную готовность программ для мировой аудитории. Вместо того, чтобы тратить дни на транскрибацию и форматирование, команды BBC теперь сосредоточены на журналистской работе.
Как изменился процесс создания субтитров на BBC благодаря ИИ?
Процесс создания субтитров на BBC изменился с ручного и трудоёмкого процесса на работу с использованием искусственного интеллекта. Системы транскрибации на базе искусственного интеллекта теперь практически мгновенно преобразуют устную речь в текст. Текст сегментируется, добавляется временной код и автоматически синхронизируется с видео.
Для прямых трансляций системы искусственного интеллекта генерируют субтитры в режиме реального времени, обеспечивая доступность и быструю обработку для платформ по запросу. Для предварительно записанного контента редакторы загружают видео в систему, которая за считанные минуты создает черновые файлы субтитров с временными метками, тегами говорящих и форматированием. Затем редакторы-люди проверяют и дорабатывают текст, уделяя особое внимание именам, техническим терминам и культурным особенностям.
Наиболее значительные изменения в лучшую сторону в создании субтитров включают в себя:
- Генерация субтитров в реальном времени как для прямого эфира, так и записанных пердач
- Автоматическое кодирование времени, синхронизированное с видео.
- Распознавание говорящего, сокращающее необходимость ручной маркировки.
- Учет контеста при создании субтитров, что обоспечивается обращению к архивам BBC
Благодаря таким изменениям сроки выполнения субтитров сократились с нескольких дней до нескольких часов, что позволило, например, выпускать фильмы с субтитрами в тот же день и для глобальной аудитории
Какие инструменты искусственного интеллекта обеспечивают масштабное производство субтитров BBC?
BBC использует многоуровневую систему автоматизации, где каждый инструмент ИИ выполняет отдельный этап создания субтитров. К моменту начала работы редакторов-людей 80–90% работы уже выполнено.
Системы преобразования речи в текст (Speech-to-Text Engines): Эти системы на основе искусственного интеллекта автоматически преобразуют аудио в текст, распознавая акценты, диалекты и различные стили речи. Эти системы улавливают не только слова, но и паузы, смех и прерывания, что критически важно для прямых трансляций дебатов или спортивных комментариев.
Модули обработки естественного языка ( Natural Language Processing — NLP): системы обработки естественного языка (NLP) очищают транскрипции, исправляют ошибки распознавания и добавляют знаки препинания на основе аудиосигналов. Они также размечают имена, места и бренды, делая субтитры более точными и удобными для поиска. Для узкоспециализированного контента, например, научно-документальных фильмов, они используют специализированные глоссарии-словари для предотвращения ошибок.
Алгоритмы выравнивания по времени (Time Alignment Algorithms): они сопоставляют слова с видеокадрами, обеспечивая достаточную продолжительность субтитров для чтения, но при этом не задерживая эти субтитры на экране слишком долго. Это устраняет распространённую проблему «мигающих» субтитров, раздражающую зрителей.
Модули перевода (Translation Modules): После создания английских субтитров ИИ мгновенно готовит черновики перевода на другие языки. Система адаптирует формулировки перевода для региональных вариантов одного и такоже языка (например, бразильский и европейский португальский) и форматирует субтитры в соответствии с синхронизацией на экране. Затем редакторы-люди корректируют эти черновики, обращая особое внимание на культурный этикет.
Инструменты форматирования (Formatting Tools): Наконец, автоматизация обеспечивает соответствие стандартам вещания, длине строк, ограничениям на количество символов и позиционированию. Кроме того, система подготавливает контент в различных форматах (например, SRT для потокового вещания и STL для телевидения), благодаря чему он мгновенно готов к использованию на различных платформах. Инструмент IEEE Xplore описывает систему генерации субтитров, которая использует передовые модели распознавания речи, такие как Whisper от OpenAI, в сочетании с такими мультимедийными инструментами, как FFmpeg и MoviePy, для автоматизации создания субтитров. Система создает синхронизированные субтитры, поддерживает несколько языков и генерирует стандартные файлы SRT с возможностью прямого встраивания в видео. Благодаря простому графическому интерфейсу и масштабируемой архитектуре, она наглядно демонстрирует, как подходы на основе ИИ могут минимизировать ручной труд и повысить доступность в медиаиндустрии.
Как субтитры на основе искусственного интеллекта обеспечивают глобальный релиз в тот же день?
Субтитры на базе искусственного интеллекта позволяют BBC выпускать контент одновременно на нескольких языках в течение нескольких часов, а не дней или недель. Как только создаются английские субтитры, модули перевода создают черновики версий на других языках. Редакторы по всему миру могут просматривать их параллельно, обеспечивая быструю локализацию.
В случае выпуска новостийного контента, такого как политические интервью или спортивные репортажи, скорость критически важна. Скорость выпуска контента позволяет BBC конкурировать с Интернет-платформами, которые раньше оказывались быстрее. В то же время, согласно прогрнозу, к 2030 году число радиослушателей в Великобритании значительно возрастет во всех сегментах, при этом традиционное радио нарастит аудиторию. Таким образом, можно сказать, что потребление контента традиционных телерадиовещателей не замедляется, а растёт. Субтитры и переводы на основе искусственного интеллекта гарантируют, что по мере роста аудитории радио, подкастов и прямых трансляций стандарты доступности будут обеспечиваться соблюдаться на всех платформах.
Эксплуатационные преимущества ИИ в оперативном создании субтитров включают в себя:
- Более широкий охват аудитории: субтитры в реальном времени делают контент доступным для глухих людей, людей, для которых язык не родной, а также для зрителей, смотрящих передачу без звука.
- Меньше узких мест в производстве: длинные программы, такие как документальные фильмы или спортивные мероприятия, больше не задерживают работу съёмочных групп. ИИ берёт на себя большую часть транскрибации и хронометража.
- Стабильное качество: стандартизированные шаблоны во всех программах гарантируют применение одинаковых правил стиля и читаемости.
- Снижение затрат на сверхурочную работу: автоматизация снижает потребность в дополнительном персонале или длительных сменах, помогая командам работать эффективно и без выгорания.
- Вместо того чтобы замедлять производство, субтитры теперь ускоряют доставку контента и играют центральную роль в стратегии распространения BBC.
Заключение
Способность BBC генерировать субтитры для 500 часов контента ежедневно обусловлена не увеличением штата сотрудников. Речь идёт о переосмыслении рабочих процессов с помощью искусственного интеллекта. Автоматизация обеспечивает транскрибирование, хронометраж, перевод и форматирование, в то время как редакторы фокусируются на точности и нюансах. Результат — более быстрое выполнение, снижение затрат и контент, который достигает мировой аудитории в день выхода в эфир. Эта гибридная модель, сочетающая ИИ для подготовки и человека для финишной обработки, показывает, каково будущее медиапроизводства. В отрасли, где скорость и доступность имеют первостепенное значение, создание субтитров с помощью ИИ стало неотъемлемой, а не дополнительной услугой», говорилось в статье advanced-television.com.
Добавить комментарий