Zum Hauptinhalt springen

Software weil dolmetsch nicht gut kann

Von Eva Stanzl

Wissen

Forscher wollen Übersetzungsmaschinen wie "Google Translate" mehr Textverständnis beibringen.


Valencia/Wien. Übersetzungsmaschinen können einem das Wort im Mund umdrehen. Aus einem wenig gelungenen Stück Industriedesign in "Meine Tante hat eine tolle Limousine gekauft. Sie ist aber nicht so schön" machen sie glatt mit "My aunt has bought a great sedan. But she is not so beautiful" eine unattraktive Verwandte. Und bei "Kauderwelsch ist Stumpfsinn" zersetzen sie mit "Gibberish is blunt meaningful" die Sprache. Warum ist das so?

Wenn Maschinen Texte übersetzen, gehen sie zumeist blindlings vor. Das heißt Wort für Wort und Satz für Satz, selbst wenn die Schlüsselinformationen erst im nächsten Satz stehen, erklärt der Computerwissenschafter und Linguist Andrei Popescu-Belis im Gespräch mit der "Austria Presse Agentur". Er und sein Team vom Forschungsinstitut Idiap im Schweizer Kanton Wallis wollen Übersetzungsprogrammen mehr Textverständnis beibringen. Erste Ergebnisse eines vom Schweizerischen Nationalfonds geförderten Projekts stellten die Forscher am Montag bei der Konferenz der "Association for Computational Linguistics" in der spanischen Stadt Valencia vor.

Programme wie Google Translate benutzen Statistiken, um die wahrscheinlichste Übersetzung von Wortgruppen in Sätzen zu liefern. Das hat zur Folge, dass die Software aus "es" "sie" macht, wenn sie diesen Artikel zusammen mit "schön" schon öfter mit "she" übersetzt haben als mit "it", erklären die Forscher. Und da die Algorithmen ja nicht über die Satzgrenzen hinaus blicken, haben auch sie Mühe mit Pronomen wie "sie" oder "diese", wenn sich das Fürwort auf eine Information in einem anderen Satz bezieht. Google Translate und Co. irren beim Übersetzen von Pronomen bei diesen Sprachpaaren in etwa der Hälfte der Fälle.

Die Wissenschafter haben den Übersetzungsalgorithmus nach eigenen Aussagen nunmehr gelehrt, auch angrenzende Sätze zu berücksichtigen. "Im Prinzip geben wir dem System an, wie viele der voranstehenden Sätze es in welcher Weise analysieren muss. Dann testen wir es unter realen Bedingungen", so Popescu-Belis.

Menschen erraten, was andere sagen wollen - Computer nicht

Das mit Kollegen der Universitäten Genf, Zürich und Utrecht entwickelte Werkzeug soll die Fehlerrate auf 30 Prozent senken. Laut den Forschern ist die Technik zwar noch nicht reif für den Markt. Jedoch hätten zahlreiche Anbieter von Übersetzungsprogrammen bereits Interesse an den neuen Algorithmen bekundet.

Mit der gleichen Idee wollen die Wissenschafter auch Aspekte wie die korrekte Abfolge der Zeiten oder die zum Kontext passende Terminologie verbessern. Auch mit Idiomen und Redewendungen soll sich der Computer künftig leichter tun. Derzeit verkommt nämlich der Satz "Dieses Programm bringt es nicht" im Computer-Englisch immer noch zu "This program does not bring".

Wie schwierig es für den Computer wäre, Grammatik so zu lernen, dass er sie spielerisch-kreativ einsetzen kann, verdeutlichen neue Erkenntnisse zum Sprachen Lernen bei Kindern. Demnach nutzen Kinder beim Spracherwerb allgemeine kognitive Fähigkeiten wie Gedächtnis, Aufmerksamkeit, mentale Analogiebildung und das Begreifen sozialer Situationen. Insbesondere können sie aber auch erraten, was ihnen andere Menschen mitteilen möchten, berichten Sprachforscher um Paul Ibbotson von der Open University in England. Weiters hänge die Fähigkeit, die Vergangenheitsformen unregelmäßiger Verben zu bilden, - etwa "ich flog" statt "ich fliegte" - mit dem Vermögen zusammen, der spontanen Versuchung zu widerstehen, die naheliegende Antwort anzunehmen - also in diesem Fall "ich fliegte". Ob Computer jemals derart komplexe Leistungen vollbringen können, bleibt abzuwarten.