Wie viel KI sollte sein, wie viel KI darf sein? Nach einem regelrechten Run auf ChatGPT in den ersten Monaten nach Veröffentlichung der generativen KI ist inzwischen viel Realismus in Medienhäusern eingekehrt. Deutlich wurde im Verlauf der vergangenen Monate auch: Viele arbeiten schon seit Jahren mit Tools der künstlichen Intelligenz und können daher aus der Erfahrung sprechen, wenn sie die einzelnen Anwendungen bewerten.
Leonie Engel von ElevenLabs war Ende Oktober Teil des ersten KI-Gipfels der MEDIENTAGE MÜNCHEN. Ihr Unternehmen, das 2022 gegründet wurde, beschäftigt sich vor allem mit der Synchronisation von Medieninhalten in verschiedene Sprachversionen – eine KI-gestützte Text-to-Speach-Applikation inklusive des synthetischen Klonens von Stimmen.
Ihr Plädoyer für die Chancen, die in solchen KI-Anwendungen stecken, traf den allgemeinen Tenor der #MTM23 zum Thema KI: „Die Überwindung von Sprachbarrieren und eine Unterstützung der kreativen Arbeit der Medienbranche sehe ich als unschätzbaren Benefit dieser Technologie – Wissen kann damit für deutlich mehr Menschen innerhalb kürzester Zeit verfügbar gemacht werden.“
Für viele Medienschaffende ist der Einsatz von künstlicher Intelligenz an sich nichts Neues mehr. Rebecca Ciesielski etwa arbeitet seit 10 Jahren mit generativer KI. Die Reporterin aus dem AI + Automation Lab des Bayerischen Rundfunks zeigte sich bei einem digitalen Event im MedienNetzwerk Bayern nicht wirklich überrascht, dass die „Schnittstelle“ ChatGPT vor einem Jahr veröffentlicht wurde. Nützlich seien diverse Tools schon seit Jahren bei der Suche von bestimmten Inhalten oder beim Aufspüren von Hasskommentaren. „So kann man KI einsetzen, vor allem zur Recherche, und das hat der BR schon lange vor ChatGPT gemacht“, berichtete Rebecca Ciesielski bei dem Webinar.
Inspiriert vom ChatGPT-Hype zeigte sich die BR-Spezialistin schon; dieses Jahr habe ihr Team viel ausprobiert – auch, um Grenzen auszuloten. Ciesielski: „Der Hype um generative KI ist erst jetzt in der Breite angekommen.“ Doch das BR-Team weiß durch seinen Wissensvorsprung: „Journalismus als solches lässt sich nicht von KI automatisieren, nur Teile davon“, so Ciesielski.
Laut Rebecca Ciesielski wird KI beim BR vor allem dort eingesetzt, wo es ums Optimieren oder das bessere Aussteuern von Inhalten und ums Beschleunigen von Arbeitsvorgängen geht. So können etwa kurze Clipvarianten von Beiträgen für Social Posts durch KI-Tools erstellt werden. Bilderkennungsalgorithmen schreiben die Mitarbeitenden beim BR teils selbst. Interessant: In der praktischen Anwendung würden Übersetzungstools beim Bayerischen Rundfunk dazu führen, dass im Team nochmals reflektiert werde, wie gut Übersetzungen sein müssen, so die Journalistin.
Nehmen wir den Bereich Bewegtbild: KI hat für Sender, Streamer, Produzenten und die Werbebranche enorm viel Potenzial bei der Erstellung, Verbesserung und gezielten Aussteuerung von Inhalten.
Für die Produktion, Bearbeitung, Verwaltung oder auch das Ausspielen von Videomaterial bieten sich dank KI viele neue Möglichkeiten. Zumal viele Vorgänge enorm beschleunigt, verbessert und Kosten deutlich reduziert werden können. Doch gerade im Bewegtbildsektor ist die Angst vor Jobverlust sehr hoch; Cutter, Synchronsprecher:innen, Drehbuchautor:innen etc werden zum Teil bereits durch den KI-Einsatz obsolet.
Der Nutzen wiegt einiges auf: Mit KI-Tools hätten kleine Studios heute manchmal Produktionsmöglichkeiten, die bisher nur großen Studios vorbehalten werden, hob etwa Prof. Dr. Sylvia Rothe von der HFF München im Rahmen der #MTM23 hervor.
Wo KI Bewegtbild unterstützt (ausgewählte Beispiele):
Gerade die Audiobranche hat die rasanten Fortschritte im Bereich KI in diesem Jahr sehr anschaulich gezeigt. Dabei hat die Gattung Anwendungen der künstlichen Intelligenz schon vorher eingesetzt, beispielsweise bei der Musikplanung, Transkription und mit künstlichen Stimmen bei Wetter oder Verkehr. Auch verbessert KI bereits den Output, Tools für die Postproduktion werden immer besser und können Hintergrundgeräusche entfernen, die Audio-Qualität aufpolieren oder das eine oder anderen „Ähem“ entfernen.
Vieles hat die Branche in den letzten Monaten durch Ausprobieren gelernt; deutlich wurde unter anderem bei den LOKALRUNDFUNKTAGEN in Nürnberg, dass sich die Anbieter mit KI beschäftigen müssen, um nicht abgehängt zu werden.
Tenor: Es geht jetzt darum, Einsatzfelder zu finden und zu experimentieren, was geht und was nicht geht. Auch wurde der Wert des Menschlichen im KI-Tsunami deutlich; wenn eine KI eine gewöhnliche Sendung machen kann, sollte es Aufgabe der menschlichen Radiomacher sein, das Ungewöhnliche zu finden, den USP von Radio neu zu definieren.
Wo KI Audio unterstützt (ausgewählte Beispiele):
Auch Digital-Publisher setzen KI schon etliche Jahre ein - im Sinne von Machine Learning. Seit OpenAI vor einem Jahr ChatGPT ausgerollt hat, wurde deutlich: Große Sprachmodelle können Redakteur:innen (noch) nicht ersetzen, die Texte stuft das „Digital News Publishing Barometer 2023“ der Digitalagentur Deep Content aktuell als „oft generisch und oberflächlich“ ein; auch ist oft die Frage des Urheberrechts bei der Quellenlage ungeklärt. Das schränkt (noch) die Nutzung ein, etwa für das selbstständige Schreiben von Texten.
Doch der potenzielle Nutzen von LLMs ist in der Verlagsbranche weitgehend unbestritten. Aktuell geht es vor allem darum, sinnvolle Anwendungsszenarien in Redaktionen zu finden und in den Unternehmen abzuwägen, welche Workflows durch KI integriert werden können im Bereich Vertrieb, Sales und Kundenmanagement. Ales in allem hat KI für Publisher enorm viel Potenzial im Datenmanagement. Axel Springer prescht jetzt sogar vor und kündigt eine größere Kooperation mit den Machern von ChatGPT an, um gemeinsam Modelle zu entwickeln.
Wo KI Publisher unterstützt (ausgewählte Beispiele):
Gerade die Startup-Branche forciert die Entwicklung. Das Media Lab Bayern hat in einem Report zur künstlichen Intelligenz bestechende Anwendungen vorgestellt, die die Kommunikationsbranche auf breiter Basis unterstützen können.
Dazu zählen unter anderem:
KI-Gründerin Leonie Engel von ElevenLabs sprach bei den #MTM23 auch über die Grenzen des Möglichen. KI werde in den nächsten Jahren wohl viele Aufgabenfelder erschließen, es gebe aber auch Bereiche, in die KI nicht vordringe, betonte sie. So bleibe etwa eine Schwachstelle von KI, dass sie im Bereich der Sprachgenerierung nur wenig Raum für die Emotionalisierung des Gesagten biete. Vielleicht werde das für lange Zeit der gravierendste Unterschied zur menschlichen Stimme bleiben …
Wie sich das jetzt von der EU angeschobene, weltweit erste Gesetz zur Regulierung von KI auf die weitere Entwicklung auswirken wird, bleibt abzuwarten.
Klar geregelt werden soll, dass der Mensch vor möglichweise missbräuchlichem Gebrauch der künstlichen Intelligenz geschützt wird. KI muss sich an die gängige Gesetzgebung etwa beim Datenschutz halten. Die in der EU eingesetzten KI-Systeme müssten "sicher, transparent, nachvollziehbar, nicht diskriminierend und umweltfreundlich" sein, heißt es in einer Ankündigung des Parlaments. KI-Systeme sollten von Menschen und nicht von der Automatisierung überwacht werden, um schädliche Ergebnisse zu verhindern, so die neue Vorgabe. Das Parlament möchte außerdem eine "technologieneutrale, einheitliche Definition für KI festlegen, die auf zukünftige KI-Systeme angewendet werden könnte".
Wörtlich heißt es weiter: "Generative Foundation-Modelle wie ChatGPT müssten zusätzliche Transparenzanforderungen erfüllen;
Mitarbeit: Lukas Schöne
Die Zusammenfassungen wichtiger Panel-Diskussionen sowie Bildmaterial der 37. MEDIENTAGE MÜNCHEN stehen in der Mediathek der Medientage-Homepage und auch im Blog der Medientage bereit.
Die Medienthemen können auch gehört werden: im Podcast der Medientage München.