
Babel. Wenn man sich seriös über die wirtschaftliche Lage in Ägypten informieren möchte, ist die Zeitung الأهرام eine gute Adresse. Sie ist die älteste Zeitung der arabischen Welt. Man kennt sie auch in Europa ganz gut, sie wird manchmal in den Nachrichten als "halbamtlich" bezeichnet.
Auf der الأهرام - Homepage sticht ein Teaser ins Auge, der mit einem Bündel Dollarscheine bebildert ist. Es geht darin offenbar um ökonomische Vorgänge im Land am Nil, was uns die schön geschwungene Titelzeile nicht so ohne weiteres offenbart:
يجب على التجار والصناع أن يكون لديهم حس وطنى ووضع أسعار بهامش ربح معقول
Man steht, wenn man des Arabischen nicht mächtig ist, wie vor einer Mauer, die der Sprachphilosoph Ludwig Wittgenstein mit einem seiner kanonischen Sätze so beschrieb: "Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt." Der Satz wird oft zitiert, wenn es um maschinelles Übersetzen geht.
Seit Menschen, Waren und Ideen permanent Grenzen überschreiten, gilt die babylonische Sprachverwirrung als zu behebendes Ärgernis. Dass "keiner des andern Sprache" versteht, ist eine geläufige biblische Klage. Rasant steigende Rechenleistung und immer schlauere neuronale Netze beflügeln die Utopie, dass es eines Tages doch möglich sein könnte, mit Hilfe automatischer Übersetzer wieder mit "einerlei Zunge und Sprache" zu sprechen.
Technik gegen die Sprachverwirrung
"Google Translate" ist dafür ein gutes Beispiel. Der globale Übersetzungsdienst wurde vor einem Jahr technisch auf ein neuronales Netz umgestellt, das 103 Sprachen zu verstehen vorgibt. 140 Milliarden Wörter laufen täglich durch seine virtuellen Nervenknoten, wie der Google-Entwicklerblog berichtet. Es lernt ständig dazu und macht sogar in Sprachen Fortschritte, von denen Google wenig Trainingsdaten besitzt.
Wittgenstein unterscheidet zwischen sinnvollen, sinnlosen und unsinnigen Sätzen. Für letztere waren Übersetzungsprogramme lange Zeit zuständig. Legendär sind die maschinell verursachten Übersetzungsfehler auf Speisekarten, die manchmal unerwartet modern klingen, wie etwa "Seehecht-Datei", oder furchterregend wie "My family cooked". Von der reinen Lachnummer haben sich die digitalen Übersetzer indes ein Stück weit entfernt. Dementsprechend alt sind die Witze, die im Internet über ihr sprachliches Unvermögen kursieren. "Sala climatizzata" zu übersetzen mit: "Es salzt mit bedingter Luft", davon sind heutige Programme weit entfernt. Im Jahr 2017 spricht Google Translate anstandslos von einem "klimatisierten Saal".

Googles Algorithmen verstehen 103 Sprachen nicht, könnte man aber angesichts so manchen Übersetzungsergebnisses immer noch sagen. Das simulierte Sprachverständnis ist mittlerweile zwar so gut, dass eine Sinnentnahme fast immer möglich scheint. Wenn wir die oben zitierte Titelzeile der ägyptischen Zeitung Al Ahram ins Onlineformular eingeben, erscheint allerdings eine überaus holprige Übersetzung aus dem Arabischen: "Händler und Hersteller müssen ein Gefühl von Patriotismus haben und die Preise angemessenen Gewinnspanne setzen."
Die Rose, ja!
Und weiter steht da: "Trotz eines deutlichen Rückgang des Dollar-Wechselkurse und Zoll Dollar, Rohstoffpreise sind immer noch fest, aber einige von ihnen stieg Rose .. Ja! Und das ist, was wir selbst in eklatanter Missachtung der Marktmechanismen zu sehen, die die Gier der Händler bestätigt."
Offensichtlich geißelt die Zeitung gierige Händler, die weder vom günstigen Dollarkurs noch von festen Rohstoffpreisen auf die Idee gebracht wurden, ihre Waren zu verbilligen. Die "Rose" muss Google Translate irrtümlich in den Text gestreut haben, denn um Botanisches geht es hier offensichtlich nicht. Eine weiterer Absatz des Originaltexts besagt nämlich, dass "Experten Organe der Regierung Aktion müssen die Gier Händler fest anzusprechen und sie verpflichten, die Preise an den Waren angebracht zu verkaufen, und eine Überprüfung des Verbraucherschutzes und des Schutzes der Wettbewerbsgesetze." Wir dürfen vermuten, dass es sich hier um ein leidenschaftliches Plädoyer für eine ordentliche Marktregulierung bei Bedarfsgütern handelt. Sicher wissen wir es nicht.
Auf Grundschulniveau
Das ein wenig stammelnd daher kommende Beispiel ist symptomatisch für den Stand des automatischen Übersetzens. Es wird noch dauern, bis Computer die Perfektion menschlicher Dolmetscher erreichen. Das zeigt nicht zuletzt der direkte Vergleich zwischen Mensch und Maschine. In Seoul forderten kürzlich Algorithmen von Google, des südkoreanischen Suchmaschinen-Portals Naver und der Übersetzungsfirma Systran humane Übersetzer heraus. Das Ergebnis: Die Menschen waren den Maschinen turmhoch überlegen. Laut Veranstaltern übersetzten die Computer nur 10 Prozent aller Sätze richtig. Selbst Kim Yoo-seok, Chef-Stratege bei Systran, sieht seine Algorithmen derzeit noch "auf Grundschulniveau". Er erwartet aber gewaltige Durchbrüche bei der automatischen Übersetzung in den nächsten ein bis zwei Jahren.
Neuronale Netze galten jahrzehntelang als exotisches Randphänomen, als Spielzeug für Nerds. Steigende Rechnerleistungen und intensive Forschung haben diese Form künstliche Intelligenz flexibler und leistungsfähiger gemacht – und auch zugänglicher. Es gibt sie mittlerweile zum Download für den Heimcomputer, und sie sollen bald als Online-Service "on demand" verfügbar sein. Neuronale Netze erkennen Bilder, verarbeiten menschliche Sprache, treten als Online-Kundenberater in Erscheinung und nebenbei übernehmen sie auch noch Malarbeiten, indem sie Selfies im Stile berühmter Maler verfremden. Den Schachsport dominieren sie nach Belieben, und jüngst haben sie auch noch die weltbesten Go-Spieler geschlagen.
Intensivtraining mit Millionen Texten
Das Prinzip ist überall dasselbe: Anstatt zu versuchen, dem Computer Regeln und Ausnahmen beizubringen, lässt man die Maschine selbst dahinter kommen. Auch die "Neural Machine Translation" (NMT) funktioniert im Prinzip ohne Kenntnisse über die zu übersetzenden Sprachen. Das neuronale Netz ist ein sich selbst ständig neu konfigurierendes Stück Software, trainiert mit Millionen von zweisprachigen Texten. Sprachelemente werden dabei zerlegt und in abstrakte Muster verwandelt, Häufigkeiten und Wahrscheinlichkeiten ihres Vorkommens und ihrer Abhängigkeiten analysiert. Daraus entstehen automatisch Übersetzungsregeln, die sich selbstständig verfeinern. Mit Bestimmtheit lässt sich dann gar nicht mehr sagen, was genau im Inneren eines neuronalen Netzes geschieht. Google vermutet von seiner Übersetzer-Intelligenz, die aus drei miteinander verschränkten neuronalen Netzen besteht, dass sie intern eine Universalsprache erlernt.
Babelfisch für 249 Dollar
Nichts scheint mehr unmöglich auf dem Feld der Computerlinguistik: Selbst der berühmte Babelfisch, den der Science-Fiction-Autor Douglas Adams in seiner Satire "Per Anhalter durch die Galaxis" beschrieb, findet ein Echo in der Wirklichkeit. Der Babelfisch ist ein kleiner Symbiont, einem Blutegel ähnlich. Man steckt ihn sich ins Ohr, und augenblicklich versteht man jede beliebige Fremdsprache.
2017 soll nun erstmals tatsächlich ein Babelfisch marktreif werden: Das US-amerikanische Start-up Waverly Labs will im Sommer ein Pilotsystem für nur 249 US-Dollar anbieten. Zwei Menschen, die unterschiedliche Sprachen sprechen, sollen sich damit live verständigen können. Sie müssen sich nur einen in drei Farben erhältlichen High-Tech-Stöpsel ins Ohr stecken, in dem ein Mikro eingebaut ist. Das Gerät verbindet sich über Bluetooth mit dem Handy und das Handy mit einem neuronalen Netz in der Cloud. Gesprochene Sätze sollen damit simultan in die jeweils andere Sprache übersetzt werden. Die Verständnis-Schwierigkeiten, unter denen Apples Sprachassistent Siri bisher litt, lassen erwarten, dass die Waverly-Kunden sehr langsam, deutlich und bemüht miteinander sprechen werden.
Auch Microsoft hat mit "Microsoft Translator" einen Übersetzungs-Dienst entwickelt, der an den Ohren ansetzt. Man verbindet sich über die Translator-App mit dem Smartphone seines Gesprächspartners und telefoniert miteinander in der jeweiligen Muttersprache. Der Dienst soll auch Vorträge und Präsentationen für ein vielsprachiges Publikum in Echtzeit übersetzen können. Er beherrscht offiziell 60 Sprachen. Microsoft räumt aber selbst ein, dass das Programm noch nicht perfekt ist.
Dazu wird es noch lange nicht kommen, sagen Wissenschafter. Das Problem ist einerseits die ausufernde Komplexität der Sprache, andererseits der Mensch: Es fallen ihm plötzlich neue Sätze ein, die so noch nicht gesagt wurden und daher auch nicht gleich verstanden werden.