16. Februar 2016

“Herr Roboter, darf ich Sie einlernen?”

Günstig, schnell und in großen Mengen Texte in “Redaktionsqualität” zu produzieren, ist die große Stärke der Automatisierung. Mit der Konfigurationssprache ATML3 (Automated Text Markup Language) soll die Entwicklung nun noch einen Schritt weiter gehen: Können wir bald unseren eigenen Roboterkollegen trainieren?

Die Idee zum “Schreibroboter” kam Saim Alkan, CEO von aexea, nicht mal eben unter der Dusche. Saim Alkan ist Wirtschaftsingenieur und fast von Anfang an im Online und Content-Geschäft dabei. Sein Buch “Texten für das Internet” erschien 2004 und fokussierte schon das Thema: Wie schreibt man einen richtig guten Online-Text? Mit seiner Agentur aexea lieferte Saim Alkan den Unternehmen passenden Content für ihre Websites und beriet sie bei Fragen rund um den Aufbau und die Organisation von Online-Redaktionen.

Die Idee, eine Software zu entwickeln, die automatisiert Texte generiert, ergab sich vielmehr aus vielen Gesprächen mit Kunden und aus Aufträgen sowie Projekten. Saim Alkan konnte dabei – damals wie heute – eine bemerkenswerte Entwicklung beobachten: Die Preise für Online-Texte gingen in den Keller, gleichzeitig benötigten Unternehmen und Medien immer mehr Texte. Die Herausforderung zu meistern günstig, schnell und in großen Mengen Content zu produzieren ist genau die Stärke der Automatisierung. In Zusammenarbeit mit CTO Frank Feulner, Germanist und Journalist,  entstanden die ersten Konzepte zur Textgenerierung, die in der Entwicklung der Software AX Semantics mündeten.

Aus Datensätzen Geschichten generieren

Heute ist AX Semantics eine der führenden NLG-Plattformen. NLG steht für Natural Language Generation, im Deutschen etwa natürlichsprachige Textgenerierung: Aus etwas, das nicht in sprachlicher Form vorliegt, in der Regel strukturierte Daten, wird per Software Sprache erzeugt. Gerade im Fußball gibt es gutes Datenmaterial, wie z.B. Spielberichte, aktuelle Tabellen und andere Datensammlungen, wie etwa den Austragungsort, die Namen der Mannschaften und der Spieler, die wichtigsten Ereignisse wie Fouls, Freistöße oder Tore. Die Daten werden kategorierisiert, in Beziehung gesetzt und mit zusätzlichem Wissen aus anderen Datenquellen ergänzt. Aus dem Vergleich der Daten zieht die Software eigene Schlüsse: Ein 4:0 ist ein klares Ergebnis im Fußball; die letzten Spiele hatte die Heimmannschaft verloren, also wird eine Serie unterbrochen. Das Ergebnis der Auswertung wird dann in eine sprachliche Form gegossen, die den Regeln und Ansprüchen an eine Spielberichterstattung entspricht.

Dein eigenen Textroboter trainieren

Bisher erforderte die Erstellung von automatisierten Texten einen relativ großen Entwicklungsaufwand: Für jede neue Textform und jedes Thema musste im Prinzip eine neue Software geschrieben werden. Mit der Konfigurationssprache ATML3 (Automated Text Markup Language) braucht man weder profunde journalistische Kenntnisse noch muss man programmieren können: Jetzt kann jeder Interessierte in den Editor seine Anforderungen eingeben und die Maschine so für alle gewünschten Einsatzgebiete, Textsorten und Themen ohne großen Aufwand trainieren. Als Ergebnis bekommt er Texte in “Redaktionsqualität”. Der “Sprachroboter” kann von jedem bedient werden, der bereit ist, sich ein wenig einzuarbeiten.

CEO Saim Alkan bei der Vergabe der Auszeichnung "Ausgezeichneter Ort 2015" der Initiative "Deutschland - Land der Ideen". © aexea

CEO Saim Alkan bei der Vergabe der Auszeichnung „Ausgezeichneter Ort 2015“ der Initiative „Deutschland – Land der Ideen“. © aexea

Automaten helfen dem Nutzer – und den Journalisten

Die Debatte rund um den “Roboterjournalismus” erweckt den Anschein, dass die Schreibsoftware die Arbeit im Mediensektor von Grund auf verändern wird. Das betrifft einerseits das Angebot der Online-Magazine: Lokale und personalisierte Angebote sind automatisiert ohne großen Aufwand möglich, sodass auf Leserwünsche viel spezieller eingegangen werden kann. Aber auch in der redaktionellen Arbeit wird “Kollege Roboter” einiges verändern, in dem er die Alltags-und Durchschnittstexte übernimmt oder aus großen, unübersichtlichen Datenmengen die wichtigsten Schlüsse zieht und vorformuliert. Werden Routineaufgaben automatisiert, bleibt Zeit für das Wesentliche.

Roboter werden sich vielfältig nützlich machen

Aber der “Schreibroboter” wird nicht allein in den Redaktionsbüros zu finden sein. Das Einsatzgebiet des “Schreibroboters” ist überall da, wo es strukturierte Daten gibt, die in verständlicher Form präsentiert werden sollen, beispielsweise für Geschäftsberichte oder Börsennachrichten. Auch im Gesundheitsbereich können “Schreibroboter” unterstützen, indem z.B. aus gesammelten Messdaten ein lesbares Attest erstellt wird, das die Patienten verstehen. Die Inhalte eines Textes können wir leicht nachvollziehen und verstehen. Den meisten von uns fällt es allerdings schwer, Zahlen-und Datenkolonnen richtig in Beziehung zu setzen und die richtigen Schlüsse zu ziehen. Sprache ist das wichtigste Kommunikationsmittel für Menschen – und sollte deshalb auch der künstlichen Intelligenz zur Verfügung stehen.