Proteine sind wahre Arbeitstiere. Sie ziehen unsere Muskeln zusammen, wandeln Nahrung in Energie um, transportieren Sauerstoff im Blut und bekämpfen Eindringlinge. Seit fast 50 Jahren bemühen sich Wissenschafter, die komplexe 3D-Form, in die sich eine Kette von Aminosäuren zum Protein faltet, vorherzusagen. Heuer haben Forscher gezeigt, dass dies mittels Künstlicher Intelligenz möglich ist. Um diese Leistung zu würdigen, hat "Science" die KI-gestützte Proteinvorhersage zum Durchbruch des Jahres 2021 gekürt.

"Dies ist ein Durchbruch an zwei Fronten", schreibt "Science"-Chefredakteur Holden Thorp in einem Leitartikel. "Erstens löst es ein wissenschaftliches Problem, das seit 50 Jahren auf der To-do-Liste steht. Zweitens ist es eine bahnbrechende Technik, die wie Crispr oder Kryo-EM (Kryoelektronenmikroskopie) die wissenschaftliche Entdeckung erheblich beschleunigen wird."

Proteine sind die Bausteine des Lebens, und ihre Funktionen - die für fast alle biologischen Prozesse von zentraler Bedeutung sind - hängen direkt mit ihrer dreidimensionalen Form zusammen. Früher war die Bestimmung der Struktur eines Proteins ein zeit- und kostenaufwendiger Prozess, der komplizierte Laboranalysen erforderte. Und obwohl seit Jahrzehnten versucht wird, Computermodelle zu entwickeln, die das "Proteinfaltungsproblem" lösen können, blieb die genaue Proteinvorhersage Forschern verwehrt, bis zwei bahnbrechende Arbeiten, die gleichzeitig in "Nature" und "Science" veröffentlicht wurden, erschienen.

Vision schon 1972

Die Ansätze, die die Arbeiten AlphaFold beziehungsweise RoseTTAFold hervorbrachten, zeigen, dass sie in der Lage sind, eine Vielzahl komplexer Proteinstrukturen allein auf Basis der darin enthaltenen Aminosäuren schnell und genau vorherzusagen. Darüber hinaus haben die Autoren beider Gruppen ihre Daten den Forschern frei zur Verfügung gestellt, was die Zugänglichkeit von der Strukturen massiv erweitert.

Die Vision dazu hatte der amerikanische Biochemiker Christian Anfinsen bereits im Jahr 1972 in seiner Rede zur Annahme des Nobelpreises formuliert. Darin betonte er, dass es eines Tages möglich sein würde, die 3D-Struktur eines jeden Proteins allein aus der Sequenz der Aminosäurebausteine vorherzusagen.

Mit Künstlicher Intelligenz wurde Anfinsens Traum verwirklicht. Heute können zehntausende Proteine und die Komplexe interagierender Proteine berechnet werden. "Das ist ein Umbruch für die Strukturbiologie", erklärt der Biologe Gaetano Monteluoine vom Rensselaer Polytechnic Institute in Troy, New York.

Trotz ihrer unterschiedlichen Talente haben Proteine die gleiche Grundform. Sie bilden eine lineare Kette aus bis zu 20 verschiedenen Aminosäuren. Nach dem Zusammenbau in zelluläre Fabriken, die Ribosomen, faltet sich allerdings jede Kette zu einer einzigartigen und außerordentlich komplexen 3D-Form. Diese Formen, die bestimmen, wie Proteine mit anderen Molekülen interagieren, definieren ihre Rolle in der Zelle.

Arbeiten von Anfinsen und anderen legen nahe, dass Wechselwirkungen zwischen Aminosäuren die Proteine in ihre endgültige Form bringen. Doch angesichts der großen Anzahl möglicher Wechselwirkungen zwischen jedem Glied könnten selbst Proteine bescheidener Größe eine astronomische Zahl möglicher Formen annehmen. In der Natur faltet sich jedes Protein zuverlässig in nur eine bestimmte Form - meist innerhalb eines Wimpernschlags.

Neue Medikamente

Heuer haben sich die Proteinvorhersagen überschlagen. So hat das KI-Programm RoseTTAFold die Strukturen von hunderten von Proteinen gelöst. Forscher des Google-Unternehmens DeepMind berichteten dasselbe für 350.000 im Menschen vorkommende Proteine. In den nächsten Monaten erwarten sie, dass ihre Datenbank auf 100 Millionen Proteine über alle Spezies hinweg erweitert wird. Der nächste Schritt besteht darin, vorherzusagen, welche dieser Bausteine zusammenarbeiten und wie sie interagieren. Die Technik ermöglicht etwa die Entwicklung neuer Medikamente. Die Fortschritte bieten einen nie da gewesenen Blick auf ein Panorama, das Biologie für immer verändern wird, heißt es in "Science"