Die Auswirkungen generativer KI auf die audiovisuelle Industrie: Drei Wege, wie KI die Fernsehproduktion verändert

Einführung

Jeder, der meine Vorträge oder Workshops besucht hat, hat mich sicherlich sagen hören, dass die audiovisuelle Industrie am stärksten von generativen KI-Modellen beeinflusst werden wird. generative künstliche Intelligenz spielt zunehmend eine bedeutende Rolle bei der Erstellung von Fernsehinhalten. In Bereichen wie Vorproduktion, Nachproduktion und Vertrieb werden die Entscheidungen von Fachleuten durch die Fähigkeit der KI beeinflusst, Prozesse zu optimieren und zu erneuern und so rechtliche Risiken im Zusammenhang mit dem Urheberrecht zu minimieren.

1. Synthetische Stimmen und Synchronisation

KI-generierte Stimmen haben sich mit zunehmender Natürlichkeit als nützlich erwiesen. Die Synchronisation synthetischer Stimmen gewinnt bei risikoarmen Inhalten an Bedeutung, beispielsweise bei der Lokalisierung von Nachrichten oder Sportclips für Plattformen wie YouTube oder bei der Programmierung von FAST-Kanälen (Free Ad-Supported Streaming TV). In diesen Fällen ist Geschwindigkeit entscheidend, um die Reichweite von Inhalten zu erhöhen, die sonst nicht synchronisiert würden.

Die Synchronisation von Premium-Fernsehinhalten ist jedoch nach wie vor mit Herausforderungen verbunden. KI-generierte Stimmen können im Vergleich zu menschlichen Synchronsprechern Unvollkommenheiten aufweisen. Zwar lassen sich einige Fehler durch Anpassung von Tonhöhe und Betonung beheben, doch der Aufwand für eine akzeptable Qualität ist im Vergleich zu herkömmlichen Aufnahmen möglicherweise nicht lohnenswert. KI-Synchronisation kann derzeit nützlich sein, um Reichweite und Monetarisierung zu steigern, insbesondere in weniger ressourcenintensiven Sprachen, die normalerweise nicht synchronisiert werden.

Neben der Synchronisation kommen mittlerweile auch Stimmenklone für die Kommentierung zum Einsatz, stets mit Zustimmung und gegen Vergütung des Sprechers oder seines Nachlasses. Ein Beispiel hierfür ist der Stimmenklon von Al Michaels, der für personalisierte Highlights der Olympia-Berichterstattung von NBC auf Peacock verwendet wurde.

2. Gesichtstausch und Lippensynchronisation

Deep-Learning-Modelle sind hocheffektiv bei komplexen oder subtilen Gesichtsmodifikationen. Die vielversprechendsten ersten Anwendungen sind Lippensynchronisation bei der Sprachausgabe und Gesichtstausch für Effekte wie die Verjüngung.

KI-Lippensynchronisationstools, wie sie beispielsweise angeboten werden von Makellos o LipDub AI Die Technologie von MARZ kann die Lippen- und Gesichtsbewegungen eines Schauspielers mit der synchronisierten Tonspur synchronisieren. Große Hollywood-Studios testen diese Technologie, um ausländischen Zuschauern ein intensiveres Erlebnis zu bieten, das den Eindruck erweckt, als sei der Inhalt ursprünglich in ihrer Muttersprache produziert worden.

Gesichtstausch kann auch für kosmetische Korrekturen oder zur kompletten Veränderung des Aussehens eines Schauspielers eingesetzt werden, sei es um ihn älter oder jünger aussehen zu lassen. Diese Tools ermöglichen es auch, Nachdrehs zu vermeiden, da Schauspieler Dialogzeilen aus der Ferne umschreiben können.

3. KI-Videogenerierung

Die Videoproduktion entwickelt sich rasant, und Studios und Filmemacher zeigen Interesse daran, diese Modelle als Produktionswerkzeuge zu integrieren. Es bestehen jedoch noch Unsicherheiten darüber, wie sie professionell in Arbeitsabläufe integriert werden können und wer für ihre Bedienung qualifiziert ist. Angesichts der erheblichen Unterschiede zur traditionellen Filmproduktion, zu visuellen Effekten oder zur Animation sind Aspekte wie Fotorealismus, Konsistenz und Kontrolle zentrale Problembereiche.

Während Kritiker darauf hinweisen, dass die Text-zu-Video-Generierung unvorhersehbar sein kann, entwickeln sich Techniken wie Video-zu-Video, wie Runways kürzliche Einführung von Gen-3 Alpha zeigt. Große Studios erforschen die Feinabstimmung von Videomodellen und trainieren sie mit proprietären Inhalten für den internen Gebrauch. Die Partnerschaft zwischen Lionsgate und Runway ist ein öffentliches Beispiel für diese Initiative, und andere Hollywood-Studios ziehen nach.

Fazit

Während die Leistungsfähigkeit generativer KI stetig verbessert wird, um den Standards des Premiumfernsehens gerecht zu werden, stellen drängende rechtliche Fragen noch immer erhebliche Hindernisse für ihre umfassende Nutzung in der Inhaltsproduktion dar. Die Möglichkeiten dieser Technologien deuten jedoch auf einen vielversprechenden Wandel in der Fernsehbranche hin und steigern Kreativität und Effizienz in den Produktions- und Vertriebsprozessen.

Zurückkehren

Nachricht