Bis zu 10.000 Quadratmeter groß sind Googles Rechnerzentren. - © Foto: epa/Google
Bis zu 10.000 Quadratmeter groß sind Googles Rechnerzentren. - © Foto: epa/Google

Im Jahr 2009 wurde ein neues Grippevirus entdeckt. Diese neue, als H1N1 bezeichnete Variante kombinierte Elemente des Vogelgrippe und Schweinegrippevirus und breitete sich rasch aus. Schon nach wenigen Wochen warnten die Gesundheitsbehörden weltweit vor einer möglichen Pandemie. Einige Stimmen befürchteten eine der Spanischen Grippe von 1918 vergleichbare Seuche; damals hatten sich eine halbe Milliarde Menschen angesteckt, von denen einige Dutzend Millionen gestorben waren. Schlimmer noch war, dass vorerst kein Impfstoff gegen das neue Virus zur Verfügung stand. Die Gesundheitsbehörden konnten nur darauf setzen, die Ausbreitung der Seuche möglichst zu verlangsamen. Dazu musste man allerdings zunächst einmal das Ausmaß der Ausbreitung erfahren.

Die Centers for Disease Control and Prevention (CDC), die amerikanische Seuchenbekämpfungsbehörde, führte eine Meldepflicht der Ärzte für neue Grippefälle ein. Allerdings war das so gewonnene Bild des Fortschreitens der Epidemie immer um eine oder zwei Wochen veraltet, da die meisten Menschen nicht sofort zum Arzt gehen, wenn sie sich krank fühlen. Auch die Übermittlung der Meldungen an die Zentralstellen dauerte ihre Zeit, und die CDC fasste die Zahlen nur einmal wöchentlich zusammen. Bei einer sich rasch ausbreitenden Epidemie sind zwei Wochen Zeitverzug eine Ewigkeit. Diese Verspätung machte die Gesundheitsbehörden im entscheidenden Zeitraum praktisch blind.

Zufällig nur wenige Wochen davor hatten Software-Entwickler des Internetriesen Google in der Fachzeitschrift "Nature" einen interessanten Aufsatz veröffentlicht. Bei Gesundheitsbehörden und Computerexperten sorgte er durchaus für Aufsehen, blieb aber in der Öffentlichkeit ziemlich unbemerkt. Die Autoren erklärten darin, wie die Suchmaschine Google die Ausbreitung der jährlichen Grippeepidemie in den USA "voraussagen" könne, und zwar nicht nur landesweit, sondern auch regional und sogar für die einzelnen Bundesstaaten. Das Unternehmen wertete dazu die Suchanfragen seiner Kunden im Internet aus. Weil die Suchmaschine täglich über drei Milliarden solcher Anfragen erhält und sie alle speichert, stand genug Datenmaterial zur Verfügung.

Google verglich die 50 Millionen am häufigsten von US-Bürgern eingegebenen Suchbegriffe mit den Daten der CDC zur Ausbreitung der jährlichen Grippeepidemien von 2003 bis 2008, um so eine Korrelation zwischen Suchanfragen und befallenen Gebieten zu ermitteln. Das hatten auch andere schon versucht, aber niemand verfügte über so viele Daten, so viel Rechnerleistung und so großes statistisches Können wie Google.

Der "Maschinenraum" des 21. Jahrhunderts: Internetriese Google gewährt selten Einblicke in seine Rechenzentren. Millionen an Daten werden hier sekündlich verarbeitet. - © Foto: epa/Google
Der "Maschinenraum" des 21. Jahrhunderts: Internetriese Google gewährt selten Einblicke in seine Rechenzentren. Millionen an Daten werden hier sekündlich verarbeitet. - © Foto: epa/Google

Die Google-Mitarbeiter vermuteten dabei zwar durchaus, dass es sich bei diesen Suchanfragen um grippespezifische Begriffe handeln könne - etwa "Medikamente gegen Husten und Fieber" -, doch war weder der Inhalt der Begriffe tatsächlich von Bedeutung, noch beruhte das entwickelte System darauf. Das System suchte stattdessen nur nach Korrelationen zwischen der Häufigkeit bestimmter Suchbegriffe und der Ausbreitung der Grippewelle über Zeit und Raum. Insgesamt wurde die enorme Zahl von 450 Millionen unterschiedlicher mathematischer Modelle auf ihre Tauglichkeit geprüft, wobei jeweils die Voraussagen mit den tatsächlichen Grippedaten der CDC von 2007 und 2008 verglichen wurden. Und so fanden die Google-Entwickler tatsächlich das richtige Modell, das bei 45 Suchbegriffen eine starke Korrelation zwischen der darauf basierenden Grippevorhersage und den amtlichen landesweiten Zahlen zur Verbreitung der Epidemie aufwies. Google konnte damit die Ausbreitung der Grippe genauso gut wie die CDC feststellen, aber nicht mit ein oder zwei Wochen Verspätung, sondern praktisch unmittelbar. Während der H1N1-Krise des Jahres 2009 erwies sich das Google-System daher als nützlicherer und schnellerer Indikator als die Regierungsstatistiken mit ihren unvermeidlichen Verzögerungen. Die Gesundheitsbehörden gewannen einen wertvollen Informationsvorsprung im Kampf gegen die Seuche.

Neu ist dabei, dass Google keine Gewebeproben einsammelt oder Berichte von Hausärzten auswertet. Stattdessen beruht die Methode auf "Big Data"- der Fähigkeit, Informationen so zu nutzen, dass neue Erkenntnisse, Güter oder Dienstleistungen von bedeutendem Wert gewonnen werden. Mit dieser Methode verfügt die Menschheit über ein neues Instrument, um im Falle einer Pandemie die Ausbreitung vorauszusagen und damit zu verhindern. Das Gesundheitswesen ist nur ein Bereich, in dem Big Data große Auswirkungen hat. Ganze Geschäftsfelder werden durch Big Data ebenfalls grundlegend verändert.

3 Milliarden Kommentare pro Tag auf Facebook

Die Auswirkungen der Informationsgesellschaft sind nicht zu übersehen, mittlerweile trägt fast jeder ein Mobiltelefon in der Tasche, einen Laptop im Rucksack und im Büro stehen Desktop-Computer. Die Information selbst ist allerdings weniger augenfällig. Und trotzdem: Ein halbes Jahrhundert nach dem Einzug des Computers in die Gesellschaft haben sich so viele Daten angesammelt, dass sich nun etwas Neues und Besonderes anbahnt. Die Welt ist so voll von Information wie nie zuvor und auch die Informationsmenge nimmt immer schneller zu. Diese quantitativen Veränderungen haben zu einer qualitativen Veränderung geführt. In den Naturwissenschaften, etwa der Astronomie oder der Genetik, wo diese Datenexplosion um die Jahrtausendwende zuerst sichtbar wurde, entstand der Begriff "Big Data". Dieses Konzept breitet sich jetzt auf alle menschlichen Tätigkeitsfelder aus.