Automatisiert Texte schreiben: Machine Learning verfasst Artikel

Kleiner blauer Roboter

Ständig ist die Rede davon, dass die fortschreitende Automatisierung eine Vielzahl von menschlichen Tätigkeiten überflüssig machen wird. Dabei kommt auch immer wieder der Journalismus vor: Eine Maschine erstellt die Artikel, die schließlich von Menschen gelesen werden. Kann das klappen? Gibt es dafür bereits Beispiele und wenn ja, wie ist das Vorgehen?

Es liegt nahe für Gebrauchstexte

Denkt man an zahlengetriebene Texte, liegt es in der Tat nahe, derlei automatisiert verfassen zu lassen. Nehmen wir beispielsweise ein Fußballspiel:

Angepfiffen wird im Hamburger Volksparkstadion am Samstag um 13:00 Uhr, es spielen der HSV gegen Greuther Fürth. Simon Terodde schießt in der 17. Minute ein Tor für den HSV. In der 33. Minute erhält Maximilian Bauer von Greuther Fürth eine gelbe Karte. So bleibt es bis zur Halbzeit. Stand HSV – Greuther Fürth 1:0.

Nach Anpfiff erzielt der Hamburger Bakery Jatta das 2:0, aber das Tor wird wegen einer Abseitsstellung nicht gegeben. Fürth stürmt nun stärker auf das Hamburger Tor. HSV-Abwehrspieler Gideon Jung erhält für ein Foul in der 67. Minute die gelbe Karte. Doch der Ansturm der Fürther wird nicht belohnt, denn sie laufen in der 82. Minute in einen Konter hinein und kassieren durch David Kinsombi das 2:0 für den HSV. Frust macht sich breit bei den Gästen aus Franken, und sie lassen die Köpfe hängen. Auch die vergleichsweise lange Nachspielzeit von fünf Minuten ändert das Ergebnis nicht, so dass der HSV mit diesem Sieg die Tabellenspitze zurückerobert und einen wichtigen Konkurrenten um den Aufstieg in die 1. Bundesliga auf Abstand hält.

Zwar spielten am 13. Februar 2021 die beiden Mannschaften tatsächlich gegeneinander, aber der Spielverlauf in meinen Bericht ist frei erfunden.

Sieht man sich den Bericht genauer an, fällt auf, dass er zum größten Teil aus der Wiedergabe von Fakten besteht, die sich sehr einfach als Daten ausdrücken lassen. die Paarung, das Datum samt Uhrzeit, die Zahl der Tore, die Zeitpunkte als sie fielen, die Ein- und Auswechselungen, die Nachspielzeit, die Zahl der gelben und roten Karten, besondere Ereignisse wie etwa nicht gegebene Tore.

Insofern wäre es mit ein wenig Gehirnschmalz durchaus möglich, ein Programm zu schreiben, dass diese Daten entgegennimmt und anschließend einen lesbaren Text erzeugt. Was allerdings zumindest zu Beginn auf der Strecke bleiben wird, sind menschliche Einschätzungen wie beispielsweise die Interpretation der Körperhaltung der Fürther gegen Ende des Spiels oder das Öffnen der eigenen Spielweise und der damit einhergehende Ansturm auf das Hamburger Tor.

Es gibt weitere Inhalte, bei denen es sich anbietet, diese automatisiert in lesbare Form zu verwandeln – ein weiteres Beispiel sind Umsatzzahlen von Unternehmen, denn auch diese sind zahlengetrieben und folgen ebenfalls vergleichsweise streng einer Form.

Automated journalism, algorithmic journalism oder robot journalism

Diese Art von Texten sind in der englischsprachigen Welt als ¡automated journalism“, „algorithmic journalism“ oder „robot journalism“ bekannt. Ein weiteres Schlagwort ist „natural language generation“ (NLG), womit klargestellt ist, dass es im Endeffekt um das Erzeugen von natürlicher Sprache geht.

The Guardian zeigt, wohin die Reise geht

Die britische Zeitung „The Guardian“ hat unter der Überschrift „A robot wrote this entire article. Are you scared yet, human?“ einen Artikel veröffentlicht, der mithilfe von Künstlicher Intelligenz erstellt wurde. Dabei wurde das aktuelle Model „GPT-3“ (Generative Pre-trained Transformer) des neuronalen Netzes für Sprache eingesetzt.

Dabei haben die Guardian-Journalistinnen und Journalisten acht unterschiedliche Texte vom Algorithmus erzeugen lassen und haben anschließend einzelne Teile der verschiedenen Texte zu einem kohärenten neuen Text zusammengestellt.

So scheint dies der Ansatz für den professionellen Einsatz von automatisierter Texterzeugung zu sein: Die Maschine liefert auf Knopfdruck Rohmaterial, das von Menschen in eine Form gebracht wird, die sich veröffentlichen lässt. Ganz so, wie es die Redakteurinnen und Redakteure bereits heute in den Redaktionen tun.