Введение
Каждый, кто посещал мои лекции или семинары, наверняка слышал, как я говорил, что аудиовизуальная индустрия больше всего пострадает от генеративных моделей ИИ. генеративный искусственный интеллект начинает играть значительную роль в процессах создания телевизионного контента. В таких областях, как препродакшн, постпродакшн и дистрибуция, решения специалистов зависят от способности ИИ оптимизировать и внедрять инновации, минимизируя юридические риски, связанные с авторскими правами.
1. Синтетические голоса и дубляж
Голоса, сгенерированные искусственным интеллектом, уже продемонстрировали свою первоначальную эффективность, становясь всё более естественными. Синтетический дубляж набирает популярность в сфере «низкорискованного» контента, например, при локализации новостных или спортивных клипов для таких платформ, как YouTube, или при создании контента для каналов FAST (бесплатное потоковое телевидение с поддержкой рекламы). В этих случаях скорость имеет решающее значение для расширения охвата аудитории контента, который иначе не был бы дублирован.
Однако дубляж премиум-телевизионного контента по-прежнему сталкивается с трудностями. Голоса, сгенерированные ИИ, могут иметь недостатки по сравнению с голосами живых актёров. Хотя некоторые недостатки можно исправить, отрегулировав тон и интонацию, усилия, необходимые для достижения приемлемого качества, могут оказаться невыгодными по сравнению с традиционной записью. На данный момент дубляж с использованием ИИ может быть полезен для расширения охвата и монетизации, особенно на менее ресурсоёмких языках, которые обычно не дублируются.
Помимо дубляжа, стало известно об использовании голосовых клонов для озвучивания, всегда с согласия и за вознаграждение профессиональных дикторов или их наследников. Одним из примеров является голосовой клон Эла Майклза, который использовался для персонализированных репортажей с Олимпийских игр на канале NBC Peacock.
2. Замена лиц и синхронизация губ
Модели глубокого обучения высокоэффективны при сложных и едва заметных изменениях лица. Наиболее перспективными начальными вариантами применения являются синхронизация губ при озвучивании и замена лиц для таких эффектов, как омоложение.
Инструменты искусственного интеллекта для синхронизации губ, такие как те, которые предлагаются Безупречный о ЛипДаб ИИ Технология MARZ позволяет синхронизировать движения губ и лица актёра с озвученной звуковой дорожкой. Крупные голливудские студии тестируют эту технологию, чтобы обеспечить более захватывающий опыт для иностранной аудитории, создавая впечатление, будто контент изначально создавался на их родном языке.
Замена лиц также может использоваться для косметической коррекции или полного изменения внешности актёра, будь то состаривание или омоложение. Эти инструменты также открывают возможности для исключения необходимости в пересъёмках, позволяя актёрам удалённо переписывать реплики диалогов.
3. Генерация видео с помощью ИИ
Видеопроизводство стремительно развивается, и студии и кинопроизводители проявляют интерес к использованию этих моделей в качестве инструментов производства. Однако до сих пор существует неопределённость в отношении того, как профессионально интегрировать их в рабочие процессы и кто должен иметь квалификацию для их работы. Учитывая значительные отличия от традиционного кинопроизводства, визуальных эффектов или анимации, такие вопросы, как фотореализм, согласованность и контроль, являются ключевыми.
Хотя критики утверждают, что генерация текста в видео может быть непредсказуемой, появляются такие методы, как преобразование видео в видео, как это было продемонстрировано на примере недавнего запуска компанией Runway платформы Gen-3 Alpha. Крупные студии изучают возможности тонкой настройки видеомоделей, обучая их на собственном контенте для внутреннего использования. Партнёрство Lionsgate и Runway — яркий пример этой инициативы, которому следуют и другие голливудские студии.
Заключение
Хотя производительность генеративного ИИ продолжает совершенствоваться, чтобы соответствовать стандартам премиум-телевидения, актуальные правовые вопросы по-прежнему создают серьёзные препятствия для его полного внедрения в производство контента. Однако возможности, которые предоставляют эти технологии, свидетельствуют о многообещающей трансформации в телевизионной индустрии, стимулируя креативность и эффективность процессов производства и распространения.












