Der Universitätsprofessor Gerhard Budin glaubt nicht, dass die Arbeitsplätze der Dolmetscher in Gefahr sind. - © Privat
Der Universitätsprofessor Gerhard Budin glaubt nicht, dass die Arbeitsplätze der Dolmetscher in Gefahr sind. - © Privat

Wiener Zeitung: Google und viele andere Konzerne investieren Milliardenbeträge in automatisches Übersetzen und versprechen epochale Durchbrüche in den kommenden Jahren. Wie stehen die Chancen, dass neuronale Netze der babylonischen Sprachverwirrung ein Ende machen?

Prof. Gerhard Budin: Wir sehen solche Ankündigungen einerseits mit Skepsis, denn die Idee der maschinellen Übersetzung existiert schon seit den fünfziger Jahren des letzten Jahrhunderts. Obwohl schon sehr viel Geld investiert wurde, sind die Ergebnisse vergleichsweise bescheiden. Man hat sich schon sehr viel früher solche Durchbrüche erwartet, und sie sind nicht gekommen. Andererseits gab es in den letzten Jahren unübersehbar substanzielle Verbesserungen. In gewissen Fachgebieten und für bestimmte Textsorten sind die Ergebnisse der maschinellen Übersetzung schon jetzt sehr gut. Für andere Textsorten und auch für bestimmte Sprachen sind die Ergebnisse nach wie vor unbrauchbar. Da gibt es große Unterschiede, man kann das also nicht pauschal beurteilen.

Für welche Textsorten sind Computer empfänglicher?

Generell bei Texten, die hoch repetitiv sind, in denen viele Ausdrücke immer wieder vorkommen, und deren Satzbau einfach gehalten ist. Das klassische Beispiel sind Bedienungsanleitungen. Bei Texten dieser Art funktioniert das automatische Übersetzen schon sehr gut. Aber selbst für größere Firmen zahlen sich Investitionen auf diesem Gebiet nur dann aus, wenn regelmäßig sehr viele Texte zum Übersetzen anfallen. Es gibt darüber hinaus schon jetzt eine ganze Reihe von Arbeitsweisen, die mit der maschinellen Übersetzung verknüpft sind, wo also Mensch und Maschine zusammenarbeiten. Die computergestützte Übersetzung etwa beruht teils auf so genannten Translation Memories, das sind Datenbanken, die Sätze und ihre Übersetzungen speichern. Wenn im Ausgangstext ein ähnlicher Satz mehrmals vorkommt, weist das System den Übersetzer darauf hin, und der entscheidet dann, ob und wie er die automatische Übersetzung verwenden möchte. Und die Entscheidung fließt wieder ins Translation Memory ein. Diese Systeme werden auch dazu verwendet, um die automatische Übersetzung zu unterstützen und mit möglichst vielen Daten zu versorgen. Wir sprechen in diesem Zusammenhang von Language Big Data. Je mehr Texte wir speichern, desto besser können die Computersysteme trainiert werden.