München. Es sind vermutlich die schwersten Puzzles, die es gibt: Die Arbeit von Forschern wie Enrique Jimenez ist mühsam, zeitaufwendig und fehleranfällig. Mit Lupe und Lampe entziffern Altorientalisten wie er Tonscherben, auf die Menschen vor Jahrtausenden mit Griffeln Schriftzeichen geritzt haben, und setzen die Fragmente zu einem Text zusammen, Puzzeln wie Profis eben. Der Einsatz Künstlicher Intelligenz (KI) soll den Prozess nun vereinfachen.

Es könne schon einmal einen ganzen Tag dauern, um eine einzelne Scherbe zu entziffern und ihren Platz in einem Text zu ermitteln, sagt der 34-jährige Spanier. Bei rund 33.000 größeren und kleineren Tonscherben, die er erforschen will, kämen auf die traditionelle Weise also wohl einige tausend Arbeitstage zusammen. Genau damit soll Schluss sein.

Mit KI will der Wissenschafter von der Ludwig-Maximilians-Universität (LMU) München seine Arbeit erleichtern. Der Professor tüftelt mit zehn Mitarbeitern an einer Datenbank und einem Algorithmus, der das große Puzzle schneller zusammensetzen soll. "Wenn der Algorithmus fertig ist, soll er in der Lage sein, einzelne Textsequenzen mit der Datenbank abzugleichen und Fragmente zu finden, die zusammengehören könnten", erklärt Jimenez.

Texte aus Mesopotamien

Die rund 33.000 Tonscherben stammen aus dem antiken Mesopotamien, dem Zweistromland im heutigen Irak. In der einstigen Stadt Ninive am Ufer des Tigris (heute: Mossul) hatte im 7. Jahrhundert vor Christus ein König eine Bibliothek zusammengetragen. Im 19. Jahrhundert wurde sie entdeckt. Zehntausende Fragmente lagern heute weitgehend unentschlüsselt im British Museum.

Die Schriften in lateinische Zeichen zu übertragen, ist die erste Aufgabe, die Jimenez in seinem Projekt lösen will. Zwei Fotografen in London machen Bilder der Scherben, sein Münchner Team transkribiert die Texte und baut ein digitales Archiv auf, das "Fragmentarium".

Eine der ersten Hürden dabei ist die Keilschrift selbst. Denn: Es gibt keine Rechtschreibregeln. Ein Zeichen könne viele Bedeutungen und ein Wort viele Schreibweisen haben, sagt Jimenez. Diese gilt es, dem Algorithmus beizubringen. "Der Computer kann alle Lesarten und Bedeutungen gleichzeitig in Betracht ziehen. Ihm reichen einzelne Sequenzen, die für sich genommen bedeutungslos erscheinen."

Der Algorithmus soll im zweiten Schritt programmiert werden. Dabei nutzt Jimenez ein erprobtes KI-Werkzeug aus der Biologie: den sogenannten Blast-Algorithmus. Blast steht für "Basic Local Alignment Search Tool" und wird in der Biologie etwa genutzt, um DNA-Daten zu vergleichen. Allein an der LMU wird bereits in mehr als einem Dutzend Bereichen mit KI geforscht.