Aktuelles

"Die Technologie steht bereit"

"KI und verwandte Technologien sind für Medien wichtige Treiber für Veränderungen", sagt Holger Meinzer. (Foto: Felix Schmitt)

Microsoft-Manager Holger Meinzer ermutigt traditionelle Medien, Technologien wie Sprachassistenten und Künstliche Intelligenz einzusetzen. Gleichzeitig betont er, wie wichtig ein neues Verhältnis zwischen Inhalte­machern und Technologiekonzernen ist. Journalisten sollten Berührungsängste gegenüber Zukunftstechnologien ablegen und deren Chancen erkennen. Interview: Jakob Vicari

02.03.2022

"Bei den erfolgreichen Modellen von morgen geht es um das Zusammenspiel von Inhalten mit Daten und Technologien", sagt Microsoft-Mann Holger Meinzer im journalist-Interview. "Das ist der heilige Gral der Branche: Wie kann ich am besten erkennen, was die Menschen in ihren individuellen Situationen gerade jetzt interessiert?"

journalist: Was unterscheidet moderne Sprachassistenten von "Karl Klammer", der plappernden Büroklammer, die mich jahrelang in Microsoft Word nervte?

Holger Meinzer: Ab 1997 hat Clippy als virtueller Assistent die Arbeit in Microsoft Office unterstützt. Heutige Assistenten basieren auf einer ganz anderen technologischen Basis. Wir arbeiten mit radikal besseren, intelligenten Systemen und haben die Power der Microsoft-Azure-Cloud. Wenn ein Assistent eins tun soll, dann vor allem nicht nerven. Heutige Assistenten sind wirklich intelligent. Und sie sprechen mit den Nutzern.

Sie kennen Medien, kommen vom Rundfunk, haben vor mehr als zwanzig Jahren beim Radio angefangen, bei bigFM und Radio Regenbogen. Heute sind Sie bei Microsoft unter anderem für Künstliche Intelligenz und Sprachassistenten zuständig. Sie verkaufen also das Gegenteil von linearen Medien. Wie hat das Ihren Blick aufs Radio verändert?

Mein ganz persönlicher Blick auf das Radio ist nach wie vor sehr leidenschaftlich. Was ist das für ein tolles Medium, vielfältig, informativ und schnell. Aber die Zeiten des ausschließlich linearen Programms, wie wir es vor 20 Jahren hatten, sind endgültig vorbei. Anbieter wie Spotify haben die Konsumgewohnheiten verändert. Das lineare Programm wird weiter bestehen, aber nicht mehr zwingend dominieren. Die gute Nachricht darin: Im Audio-Markt steckt ein immenses Wachstum. Und die schlechte: Das große Geschäft machen gerade nicht die traditionellen Anbieter.

Wie muss Audio in einer Welt der Sprachassistenten klingen?

Es kann glänzen. Wir sehen, dass Nutzer ganz neue Wege zu den Inhalten nehmen. Wir nennen das neue Content Journeys. Eine wichtige Technologie werden synthetisierte Stimmen sein, die verblüffend menschenähnlich klingen. Sie können den Nutzer dann in Sprachassistenten persönlich abholen.

"Der WDR Innovation Hub hat so zum Beispiel die Stimme von WDR-2-Moderatorin Steffi Neu in einem Prototypen synthetisiert, also digital nachgebildet."

Wenn die Computerstimmen nicht mehr so blechern schepperten, wäre das eine Wohltat. Wie entstehen bessere künstliche Stimmen?

Die synthetischen Stimmen können tatsächlich mit echten Moderatoren im Studio trainiert werden. Man braucht vielleicht drei Stunden Sprachaufnahmen. Und dann werden sie mit Hilfe unserer Text-to-Speech-Technologie auf Basis von Künstlicher Intelligenz nachmodelliert und weiter optimiert. Der WDR-Innovation-Hub hat so zum Beispiel die Stimme von WDR-2-Moderatorin Steffi Neu in einem Prototypen synthetisiert, also digital nachgebildet.

Was kann eine synthetische Stimme besser als eine echte?

Eine synthetische Stimme könnte Sie persönlich begrüßen: "Guten Morgen Jakob. Willst du meinen neuen Podcast hören?" Dann übernimmt das Original. Das passiert noch nicht. Aber hören Sie sich das Beispiel beim WDR mal an! Ich habe die Stimme gehört und war nicht mehr in der Lage zu unterscheiden, ob es sich um die echte oder um die synthetisierte Stimme von Steffi Neu handelt. Oder stellen Sie sich vor, durch synthetische Stimmen werden plötzlich auch Texte automatisch als Audio verfügbar werden.

Aber wofür braucht man dann noch den Morning-Show-Moderator, wenn mein Smartphone mich morgens mit einer KI-Stimme begrüßen kann, die im besten Fall sogar humorvoll und gut getextet ist?

Natürlich braucht man noch Moderatoren und kreative Journalisten. So spontan und schlagfertig wie ein guter Moderator wird keine Künstliche Intelligenz in den nächsten Jahren werden. Und vor allem nicht wirklich kreativ. Aber warum soll mir die Stimme, der ich meinen Morgen anvertraue, nicht auch nachmittags meine Frage nach dem Wetter beantworten? Und wenn man Verkehrsnachrichten auch nachts um vier von einer vertrauten Stimme vorgelesen bekommt, ist das definitiv ein Mehrwert – für die Hörerinnen, aber auch für die Moderatorin, die eben nicht ihr Leben nachts im Sender verbringen muss.

Wenn solche Stimmen in Audios oder Videos Desinformation verbreiten, nennt man das Deepfake. Dann kann alles erzählt werden. Ist das nicht eine große Gefahr für den zur Wahrheit verpflichteten Journalismus?

Jede neue Technik birgt auch Risiken. Microsoft-Präsident Brad Smith hat das in seinem Buch als "Tools and Weapons" bezeichnet. Deshalb übernehmen wir als Unternehmen, das diese Technologien erschafft, auch immer mehr Verantwortung, dass sie ethisch eingesetzt werden. Deswegen bieten wir bereits neue Technologien an, die dabei helfen, gefälschte Inhalte zu identifizieren. Ein Ansatz ist unser Video Authenticator, der Bilder und Videos analysiert und mit einer prozentualen Wahrscheinlichkeit versieht, ob dieses Material bearbeitet wurde. Im Rahmen des Project Origin arbeiten wir mit großen Medienunternehmen wie der BBC, New York Times und CBC/Radio-Canada zusammen, wo es darum geht, Fake-Inhalte, die sich bereits in der Distributionskette befinden, wieder herauszunehmen und ihre weitere Verbreitung einzudämmen.

In Sprachassistenten treffen Künstliche Intelligenz und natürliche Sprache aufeinander. Wenn so ein Ding dann mit mir spricht, ist mir das oft ein wenig unheimlich. Wie funktioniert das unter der Haube?

Im Wesentlichen greifen dabei drei Technologien ineinander. Aber zunächst beginnt alles mit dem natürlichsten Interface der Welt: der Sprache, die durch Speech-to-Text umgewandelt werden muss, damit sie überhaupt analysiert werden kann. Danach wird mittels Language Understanding daraus ein semantisches Verständnis. Es wird also die echte Intention daraus abgeleitet. Im dritten Schritt sind dann Bot-Technologien für die Entscheidungslogik zuständig: also etwa welcher Inhalt dem Nutzer angeboten wird, der dann wiederum durch Text-to-Speech in natürlicher Sprache ausgegeben wird. 

Und das muss schnell gehen.

Entscheidend ist, dass das alles nahezu in Echtzeit erfolgt, denn niemand möchte zu lang auf die Antwort warten. Die darunter liegenden neuronalen Sprachmodelle werden immer besser. Sie können nicht nur in verschiedenen Sprachen sprechen, sondern sogar mit Dialekt oder je nach Situation mal ernst, traurig oder fröhlich erscheinen. Ich freue mich schon auf den ersten Sprachassistenten, der Bayerisch spricht. Oder Hessisch. Beim Verstehen solcher Dialekte sind die Sprachassistenten schon ganz gut.

Also wird mir die FAZ bald auf Hessisch vorgelesen?

Technologisch ginge das. Die FAZ ist da tatsächlich sehr weit. Sie bietet ein personalisiertes Nachrichtenangebot, das man sich vorlesen lassen kann. Die Sprache kommt in dem Fall nicht von uns, wir steuern die Künstliche Intelligenz zur Personalisierung bei. Die Frage ist natürlich, ob die Nutzer die FAZ wirklich auf Hessisch hören wollen. Die BBC als eines der renommiertesten und innovativsten Medienunternehmen der Welt hat mit BBC Beeb einen eigenen Sprachassistenten entwickelt, der auch Dialekte versteht und spricht.

"Die gute Nachricht: Im Audio-Markt steckt ein immenses Wachstum. Und die schlechte: Das große Geschäft machen gerade nicht die traditionellen Anbieter."

Wie unterscheidet sich die Antwort des BBC-Sprachassistenten von einer Alexa?

Durch die Tiefe der Antwort. Fragen Sie einen handelsüblichen Sprachassistenten zum Beispiel "Wie alt ist David Attenborough?", kommt typischerweise – nach einer Wikipedia-Recherche im Hintergrund – als Antwort: "David Attenborough ist 95 Jahre alt." Das ist schon gut, doch die Idee hinter BBC Beeb ist, dass die Antwort lautet: "Attenborough ist 95 Jahre alt. Und er hat gerade einen Podcast über das Leben des Elefanten Jumbo gemacht, einem tierischen Superstar, der als Vorlage für den Disney-Film Dumbo diente. Soll ich dir das in deine Playlist legen?" Das ist nur ein kleines Beispiel, aber es zeigt das erhebliche Potenzial einer Antwort, die in die Tiefe der vorhandenen Inhalte führt. Dahinter steht vor allem ein sehr grundsätzlicher Switch hin zum Nutzer: Die BBC will mit ihrem Publikum auf eine ganz neue Art interagieren. Andy Webb, der das Projekt bei der BBC verantwortet, nennt das "talking with the audience and not just to them".

Das ist dann ja mehr eine neue Arbeitsweise als eine technologische Frage. Genau: Zuhören, was der Nutzer will, und das dann hochgradig personalisiert ausliefern. Die BBC hat erkannt, dass es wichtig ist, den Nutzer abzuholen und eigene Marken statt Drittplattformen zu stärken. Die BBC hat unter Nutzerinnen und Nutzern, die nachweislich BBC-Inhalte über Amazon-Echo-Geräte genutzt haben, eine Umfrage gemacht. Dabei fanden sie heraus, dass sich nur elf Prozent überhaupt bewusst waren, dass es BBC-Inhalte waren, die sie über den Smart Speaker gehört hatten. Und das führt dazu, dass diese hochqualitativen Inhalte gar nicht mehr auf die Marke BBC einzahlen, sondern auf die Marken der Sprachassistenten. Daraus entstehen Abhängigkeiten, welche die BBC-Kollegen ändern wollten. Und diese strategische Motivation finde ich entscheidend: Es geht nicht darum, Technologien um der Technologien willen zu nutzen. Es geht darum, sich in einem Markt, der sich nachhaltig verändert hat, durch völlig neue Formen der Mediennutzung und Nutzerinteraktion auf eigenen Kanälen zu differenzieren. Nur durch eigene Lösungen können Sie die Kontrolle über die Nutzerbeziehung zurückzugewinnen, um wettbewerbsfähig zu bleiben. 

Was kostet eine individuelle Sprachassistenten-Lösung, wenn ich sie bei Microsoft bestelle?

Der initiale Invest in eine individuelle neuronale Stimme, die durch automatisierte Inhalteproduktion schon große Mehrwerte liefert, ist überschaubar. Ein Projekt wie BBC Beeb ist in der Regel nichts von der Stange, sondern eine strategische Innovationspartnerschaft. Die Kerntechnologien mussten aber nicht völlig neu entwickelt werden. Und Medienunternehmen müssen auch keine eigenen Teams für Data und AI aufbauen, um die besten Lösungen aus verschiedenen Quellen zu einer Gesamtlösung zu integrieren. Vielmehr können Medien davon profitieren, dass etwa allein das Bot-Framework und Sprachassistenten von Microsoft schon bei über tausend Kunden eingesetzt werden. Die Vorreiter sind Callcenter, in denen es beispielsweise möglich ist, Supportanfragen bei Mobilfunkbetreibern über Self-Service-Applikationen zu stellen, die aktuelle Datennutzung abzufragen oder Rechnungsinformationen zu erhalten. Hier muss also nichts völlig neu und speziell für die Medienindustrie entwickelt werden, sondern man kann auf vorhandene und erprobte Technologie-Stacks aufsetzen.

Ist die Nachricht dahinter nicht, dass selbst die große BBC in der Welt der Sprachassistenten nicht durchdringt und alle anderen Medien erst recht zu Content-Lieferanten degradiert werden?

Am Ende des Tages ist das natürlich eine sehr strategische Frage, die jedes Medienhaus nur für sich selbst beantworten kann. Ich erlebe in vielen Gesprächen, dass Medienmacher sich die Frage stellen, ob man sich langfristig mit der Rolle als Lieferant von Inhalten für Drittplattformen zufriedengibt und solche De-facto-Abhängigkeiten akzeptieren will. Ich kann diese Bedenken und den einhergehenden Wunsch nach mehr digitaler Souveränität nachvollziehen. Fakt ist, dass noch nie so viele Inhalte konsumiert wurden wie heute, aber der größte Teil dieses Wachstums, auch wirtschaftlich, an wenige Digitalplattformen fließt. Sie bieten den Medien ihre Technologien an und verdienen damit zusätzlich Geld. Und bei der nächsten Versteigerung von Premiumrechten sitzt man sich dann mit unterschiedlich dicken Portemonnaies gegenüber.

"Bei den erfolgreichen Modellen von morgen geht es um das Zusammenspiel von Inhalten mit Daten und Technologien."

Was sagen Sie denen, die Microsoft vorwerfen, Journalismus nur als Contentlieferanten zu benutzen?

Da unterscheiden wir uns auch von anderen Technologieanbietern. Wir geben unseren Kunden neue Technologien an die Hand, mit denen sie erfolgreich sein können, und treten nicht mit ihnen in Wettbewerb. Microsoft ist ein Technologie- und kein Medienunternehmen. Deshalb produzieren wir auch keine eigenen professionellen Inhalte, sind nicht übermächtig im Werbemarkt und es gibt mit uns keine Diskussionen wie jüngst in Australien über die Vergütung von Medieninhalten durch digitale Plattformen. Ganz im Gegenteil: Wir haben uns mit dem VDZ und anderen europäischen Presseverbänden für regulatorische Instrumente stark gemacht, die eine faire Vergütung ermöglichen. Und zwar nach transparenten Regeln, nicht etwa durch Drohungen, ganze Plattformen abzuschalten. Allein für unser Webportal MSN haben wir eine Community von über 4.500 Medienmarken als Partner, und für unsere Suchmaschine Bing haben wir gerade die Inhalte von Spiegel Online lizensiert. Auch bei Künstlicher Intelligenz sind wir offen für gemeinsame Geschäftsmodelle, die auf unseren Grundsätzen von verantwortungsvoller KI basieren.

Abseits von sprechenden Assistenten klingt KI im Journalismus noch sehr abstrakt. In welchen Feldern wird sie noch zum Einsatz kommen?

In fast allen. Das beginnt schon bei der Themenfindung: An welchen Themen arbeiten die anderen Medien gerade, welche sind auf Social Media aktuell? Das ist ein großes Feld, das sich nur schwer überblicken lässt. Darauf lassen sich Systeme trainieren. Wir arbeiten aber auch mit Lösungen, die einen Produktionsschritt weiter gehen, denn jeder Journalist kennt die Situation: Irgendein Spezialthema kocht hoch. Und dann fragt man sich: Wo finde ich ganz schnell die besten Fachexperten im Haus? Wer hat Ahnung davon, auch wenn diese Person vielleicht in der Buchhaltung sitzt? Wie recherchiere ich jetzt gezielt in Archiven und gehe mit frischem Material um? 

Nämlich?

Bei neuen Ereignissen herrscht Zeitdruck, und in brisanten Nachrichtenlagen müssen Inhalte besonders schnell überprüft und produziert werden. Da können Technologien wertvolle Hilfsmittel sein, um den Journalismus besser zu machen. Ich bin überzeugt, dass in ein paar Jahren kein Journalist mehr darauf verzichten möchte, doch es bleiben Hilfsmittel. Die publizistische Hoheit kann und soll eine KI nicht ersetzen.

Nehmen wir an, ich wäre Manager eines mittelgroßen Medienhauses. Womit soll ich anfangen, mit Voice oder mit Künstlicher Intelligenz an der Paywall?

Das Wichtigste ist Entschlossenheit. Es muss mehr sein als "Jugend forscht" oder "wir probieren das mal aus". Bei den erfolgreichen Modellen von morgen geht es um das Zusammenspiel von Inhalten mit Daten und Technologien. Das ist der heilige Gral der Branche: Wie kann ich am besten erkennen, was die Menschen in ihren individuellen Situationen gerade jetzt interessiert? Es ist nicht die schiere Masse an Inhalten entscheidend, sondern ihre personalisierte Ausspielung. Dadurch entsteht Relevanz. Und das ist letztlich auch der Schlüssel bei der Monetarisierung, weil man dadurch die Nutzerbindung erhöhen, Werbung gezielter ausspielen oder die Zahlungsbereitschaft bei Pay-Modellen steigern kann.

Ist das in den Führungsetagen der deutschen Medienlandschaft schon angekommen?

Das Thema ist da und wird nicht mehr weggehen. Der Digital News Report der University of Oxford und des Reuters Institute bestätigt, dass über die Hälfte der Führungskräfte Künstliche Intelligenz als sehr wichtigen Innovationstreiber im Journalismus einschätzt. Das höre ich in allen Gesprächen, und das werden Sie in Ihrem Unternehmen auch hören. Der Wille zum Aufbruch ist da. Die Technologie steht bereit. Jetzt braucht es nur noch Mut und Entschlossenheit, sie einzusetzen. 

Aber diese Technologie wird in Journalistenschulen oder Journalistik-Studiengängen nicht unterrichtet. Und es ist auch nicht so, dass man in der üblichen deutschen Redaktion sagt: "Heute nehme ich mir mal einen Tag Zeit, um mich mit Themenfindung per KI zu beschäftigen." Da ist wenig Personal und viel ökonomischer Druck. Wie gelingt kleineren Medienunternehmen der Einstieg?

Künstliche Intelligenz und Machine Learning sind definitiv nicht nur ein Thema für die großen Häuser. Sie erleichtern auch kleinen Redaktionen das Leben. Nehmen Sie eine Lösung, die wir mit der FAZ entwickelt haben: einen Algorithmus, der schon beim Erstellen von Artikeln eine Empfehlung abgibt, ob dieser Inhalt besser hinter einer Paywall stehen oder frei verfügbar sein sollte. Das ist ein Tool, das eigentlich jede Zeitung braucht. Die neuen Technologien werden den journalistischen Alltag genauso umkrempeln, wie es das Internet vor 25 Jahren tat.

Kostet das am Ende die Jobs von Journalisten?

Die Gespräche, die ich mit Entscheidern in der Medienindustrie führe, drehen sich nicht um den Abbau von Redaktionen, sondern vielmehr darum, wie sie unterstützt und entlastet werden können, vor allem von Routineaufgaben, um ihre Zeit dem Erstellen hochwertiger journalistischer Inhalte widmen zu können. Und es sagt ja auch niemand, dass alles zu 100 Prozent voll automatisiert werden muss. Die publizistische Hoheit soll in den Händen der Redaktionen bleiben. Aber natürlich befinden wir uns in einer Zeit des Umbruchs. Die Zahl der Print-Zeitungsjournalisten ist in den USA seit 2008 um 57 Prozent gesunken, hat Pew Research berechnet. Das liegt aber ja nicht daran, dass alle Texte von einer KI geschrieben würden. Die Ursache ist vielmehr, dass die Mediennutzung immer stärker auf Digitalplattformen von Dritten stattfindet, während die Menschen immer seltener eine Zeitung kaufen oder lineares Fernsehen nutzen. Und die eigenen digitalen Kanäle der Medien wachsen zwar, sie können aber meistens die Rückgänge im Kerngeschäft nicht kompensieren.

Aber wie zahlt sich der Technologie-Einsatz denn nun ökonomisch aus?

Das Publikum kann besser angesprochen werden. Ein gutes Beispiel ist die konsequente Digitalstrategie der FAZ: Dort lohnt sich der Einsatz von KI, weil sich die Loyalität der Abonnenten durch die personalisierte Ausspielung von Inhalten deutlich steigerte. Das erkennt man zum Beispiel daran, dass sie um ein Drittel häufiger das Portal besuchten und dabei auch deutlich mehr Seitenaufrufe pro Leser verzeichnet wurden.

"Künstliche Intelligenz und Machine Learning sind definitiv nicht nur ein Thema für die großen Häuser. Sie erleichtern auch kleinen Redaktionen das Leben."

Wer verfolgt in Deutschland außerdem noch spannende Ansätze?

Ich finde die neue Strategie von RTL im Zuge der Fusion mit Gruner + Jahr extrem spannend – und bemühe mal das Wort multimedial, auch wenn es etwas aus der Mode gekommen ist. Mit RTL Plus will man den Schritt vom Video-on-Demand- zum Media-on-Demand-Angebot machen. Die Botschaft: Wir sind ein Medienhaus mit 1.500 Journalisten, wir haben Bewegtbild-Inhalte, wir haben Audioinhalte, wir haben den größten Buchverlag der Welt, und wir haben die Zeitschriften von Gruner + Jahr. Und all das bringen wir auf eine Plattform. Darin liegt eine Riesenchance, sich im Wettbewerb mit den Digital-Native-Plattformen nachhaltig zu positionieren.

Bisher klingt das für mich vor allem wie ein riesiger Berg Inhalte, ein Sammelsurium, verteilt über ganz verschiedene Plattformen, die ich heute schon kaum bedienen kann. Was hat das mit KI zu tun?

Sammelsurium klingt nach Durcheinander, doch genau das gilt es aufzulösen. KI-Technologien können einerseits helfen, gezieltere Investitionsentscheidungen für die Produktion von Inhalten zu treffen, die mit hoher Wahrscheinlichkeit funktionieren. Doch neben der schieren Bereitstellung von Inhalten wird immer entscheidender, dass das Publikum diese Inhalte auch findet – oder umgekehrt: dass der Inhalt sein Publikum findet. Das geht kaum noch ohne Künstliche Intelligenz. Und genau da setzen wir auch in der Zusammenarbeit mit RTL bei diesem einzigartigen Vorhaben an. 

Personalisierung heißt meist, dass der Assistent mich und meine Vorlieben möglichst umfassend kennt. Oder geht es auch datensparsam?

Die Qualität der Ergebnisse steigt natürlich, je mehr Daten verfügbar sind. Das funktioniert aber auch schon gut mit anonymisierten oder pseudonymisierten Daten, die sich nicht auf die jeweiligen Personen zurückführen lassen. Insgesamt geht es immer darum, die Interessen und Bedürfnisse der Nutzerinnen und Nutzer möglichst treffsicher mit den passenden Inhalten zusammenzubringen.

Was haben die Urheber:innen davon?

"Content is King" galt noch nie so sehr wie heute. Dieses Zitat prägte der Microsoft-Gründer Bill Gates schon vor über 25 Jahren in einem Essay, und ich bin gerade wieder zufällig drüber gestolpert. Gates versprach damals, dass dieses Internet ganz neue Einnahmequellen für die Kreativen erschließen wird. Und so ist das ja auch gekommen. Niemand hat erwartet, dass es einfach wird.

Ich finde, auf funktionierende, technologiegetriebene Geschäftsmodelle warten die Journalist:innen schon zu lange. Was wird das nächste große Ding, auf das wir uns besser heute schon einstellen sollten? 

Statt zu warten, was noch alles kommt, scheint mir das Nutzen der Techniken, die schon vorhanden sind, eine bessere Strategie zu sein. Wir erleben beispielsweise heute schon, dass die Qualität von computergenerierten Inhalten immer besser wird. Das gilt momentan besonders für automatisch erstellte Texte, die immer besser lesbar werden. Je größer die Menge und Qualität der Daten ist, mit denen die Algorithmen trainiert werden, umso besser werden sie. Das aktuell mächtigste KI-Sprachmodell GPT-3 von OpenAI wurde beispielsweise mit 175 Milliarden Datenpunkten trainiert – einem nahezu kompletten Abbild des Internets. Damit lassen sich beeindruckende Texte produzieren, die viele Leser für Werke von Menschen halten. Die Entwicklung wurde von Microsoft signifikant unterstützt, und es wird zukünftig direkt in unseren Technologien eingebaut werden.

Wo soll das alles noch hinführen?

Damit wird ein neues Kapitel aufgeschlagen, und wir kommen zu einem Punkt, der sehr wichtig ist: Wir stehen vor neuen ethischen Fragestellungen. Deshalb haben wir uns bei Microsoft feste Grundsätze für den Einsatz von KI-Systemen gegeben wie Fairness, Transparenz, Sicherheit und Inklusion. Jede neue Entwicklung wird bei uns erst nach diesen Prinzipien überprüft, bevor sie zum Einsatz kommen kann, denn KI-Systeme müssen alle Menschen gleichbehandeln. Die Nutzer müssen zwar nicht die komplette Technologie verstehen, aber die Entscheidungen dieser Systeme sollten für sie verständlich sein. Und es muss erkennbar sein, wie viel Künstliche Intelligenz darin steckt. 

Viele Redaktionen beklagen eine unsichere Zukunft durch die Technologien. Was müssen Medien anders machen?

Ich glaube, für Medienunternehmen ist es wichtig anzuerkennen, dass Künstliche Intelligenz und verwandte Technologien wichtige Treiber für die Veränderungen sind. Und dass jene Unternehmen, die diese Technologien optimal nutzen, damit schon heute erfolgreich sind. Ihre Medienmarken sind vor allem durch ein jahrzehntelang aufgebautes Nutzervertrauen so stark geworden. Wenn sie auf dieses Vertrauen beim Thema KI aufbauen können, werden sie noch stärker werden. 

Zur Person:

Holger Meinzer (45) ist Director Industry Relations Media & Telco bei Microsoft Deutschland. Langer Titel, klarer Job: Er kümmert sich um Microsofts Partnerschaften mit Medien und Telekommunikationsanbietern. Er unterstützt Sender und Verlage dabei, durch die Verknüpfung von Content, Daten und Technologien neue Geschäftsstrategien mit Hilfe von Technologie zu entwickeln.

Autor:

Jakob Vicari ist Gründer des Start-ups tactile.news, ein Innovationslabor für neuen Journalismus.  

Aktuelles Meinung