Schon wenige Sekunden nach Abpfiff der Kreisliga-Spiele sind die ersten Spielberichte online. Nicht von Menschenhand geschrieben, so von einem Algorithmus generiert. Möglich macht das unter anderem die Software „rtr textengine“ der Firma Retresco, einem der führenden Softwareanbieter für automatisierten Journalismus in Deutschland. Sebastian Golly ist Leiter der Abteilung Textgenerierung. Im Interview mit Matchplan Sports spricht er über die Stärken und Schwächen des Algorithmen-Journalismus und erklärt, warum Journalisten vor „Kollege Roboter“ keine Angst haben müssen.
Herr Golly, wann wird der Retresco-Algorithmus Sportreporter des Jahres?
Wahrscheinlich nie. Ich glaube, es gibt Qualitäten, die weiterhin der menschliche Journalist am besten erfüllt: Top-Spiele zu betexten, wirklich Geschichten zu erzählen und Hintergründe darzustellen. Das sind Punkte, die einfach in den nächsten Jahren beim menschlichen, klassischen Journalisten gut aufgehoben sind. Was unser Algorithmus kann, ist, Routinetexte zu schreiben – nicht die Glanzstücke.
Ist die Sorge einiger Journalisten begründet, dass Algorithmen sie den Job kosten könnten?
Ich kann sie verstehen. Ich konnte diese Sorge aber bisher jedem Journalisten nehmen, dem ich gezeigt habe, was geht und wo die Grenzen unseres Ansatzes sind. Ich verstehe unsere Systeme als Hilfsmittel für Journalisten. Sie sollen entlasten und Medienhäusern ermöglichen, Zielgruppen zu bedienen, die sie bisher nicht bedienen konnten (Retresco generierte zu Beginn nur automatisierte Texte für Amateurligen, Anm. d. Red.). Ein Stück weit sind wir nun darüber hinausgegangen und decken auch höhere Ligen ab, auch die Profiligen. Doch auch da nicht als Ersatz. Ich finde, wir sollten die Algorithmen wirklich fokussieren auf die Punkte, wo sie besser sind und wo es darum geht, wiederkehrende Aufgaben zu erfüllen. Der Algorithmus ist ein Hilfsmittel, keine Bedrohung.
An welche Grenzen stoßen Sie mit der Software noch?
Wo es keine Daten gibt, können wir keine Text generieren. Und auch wenn wir einen Text generieren können: Die Sachverhalte, die in den Daten nicht abgebildet werden, werden im automatisch generierten Text nicht vorkommen. Selbst wenn sie relevant sind und sie ein menschlicher Autor abbilden würde. Also beispielsweise der Wutausbruch des Trainers am Spielfeldrand – dafür haben wir keine Daten. Was die Textsorten betrifft: Wir können alles ausdrücken, was einer typischen Textstruktur folgt und was sich aus den Daten ableiten lässt. Das heißt, der Algorithmus kann nicht mit vollkommen neuen, nie dagewesenen Ereignissen umgehen, die nicht vorhersehbar sind.
Durch Software, wie sie Retresco anbietet, ist es schon jetzt möglich, Fußball-Spielberichte automatisiert generieren zu lassen. Ist die Zukunft, dass jeder Fan einen eigenen Bericht zu seinen Interessen bekommt?
Absolut, das ist ein Einsatzgebiet. Ich weiß nicht, ob das bei den Spielberichten sinnvoll ist. Aber es gibt Fälle, in denen es sinnvoll ist, dass ich einen Text bekomme, der genau auf mich zugeschnitten ist. Es fängt damit an, dass die Datenlage auf mich zugeschnitten ist. Da spielt Zielgruppenorientierung eine sehr große Rolle. Ich finde es aber aus ethischer Sicht wichtig, aufzupassen, wie viel man personalisiert. Damit wir nicht nur die Texte bekommen, die ohnehin unsere eigene Weltsicht passen und dass die Texte nicht nur so formuliert sind, wie es mir passt. Denn technisch ist das auf jeden Fall möglich.
Stehen bei Ihnen Aufwand und Nutzen in einem guten Verhältnis?
Ja, bei den Fußball-Spielberichten ist es so. Da entwickeln wir das als ein Produkt und es finanziert sich dadurch, dass es eine Vielzahl von Abnehmern gibt, die diese Texte verwenden. Und ein und dasselbe Produkt lässt sich für eine ganze Reihe von Ligen nutzen, die nach dem gleichen Prinzip funktionieren. Zudem können wir die Texte multilingual generieren, was ganz interessant ist, weil es für die Bundesliga großes Interesse in vielen Ländern gibt. Gerade auch in Ländern außerhalb Europas – wie in Asien zum Beispiel. Dort fehlen Texte.
Was sind Retrescos Ziele für die Zukunft?
Momentan ist das große Thema, die Möglichkeiten, die es schon gibt, technisch auszuschöpfen. Wir wollen irgendwann – wenn jemand möchte – alle Amateurligaspiele abdecken, die in Deutschland stattfinden. Dafür brauchen wir keine neue Technik, das ist alles jetzt schon drin. Ansonsten arbeiten wir weiter daran, dass die generierten Texte möglichst nah dran sind, an denen, die ein Mensch schreiben würde. Das bedeutet, dass sie möglichst genauso lesbar sind, glaubwürdig wirken und flüssig sind.