Es gibt für Big Data keine exakte Definition. Ursprünglich verstand man darunter eine Informationsmenge, die zu groß für den Arbeitsspeicher des verarbeitenden Computers geworden war und von den Entwicklern neue Technologien verlangte. Neue Werkzeuge, die sich noch weiter von den bislang notwendigen strengen Hierarchien und Strukturen verabschieden, sind gerade im Entstehen. Gleichzeitig kristallisierten sich die Internetanbieter als führende Anwender dieser neuen Werkzeuge heraus, weil sie über die größten Datenmengen verfügten und ein brennendes finanzielles Interesse hatten, aus den gesammelten Daten möglichst großen Nutzen zu ziehen. So überrundeten sie traditionelle Firmen, die mitunter schon mehrere Jahrzehnte Erfahrung auf diesem Gebiet besaßen.

Big Data ist das, was man in großem, aber nicht in kleinem Maßstab tun kann, um neue Erkenntnisse zu gewinnen oder neue Werte zu schaffen, sodass sich Märkte, Organisationen, die Beziehungen zwischen Bürger und Staat und vieles mehr verändern. Aber das ist nur der Anfang. Die Ära von Big Data wird sich auch auf unsere Lebensweise und unsere Weltsicht auswirken. Vor allem muss die Gesellschaft sich gewohnter Vorstellungen von Kausalität entledigen und stattdessen vermehrt auf Korrelationen verlassen: Man wird oft nicht mehr wissen warum, sondern nur noch was. Das ist das Ende jahrhundertelang eingeführter Prozesse und verändert tiefgreifend die Art, wie wir Entscheidungen treffen und die Wirklichkeit verstehen.

Den Anfang einer grundlegenden Umwälzung bedeutet Big Data. Genau wie die Erfindung des Fernrohrs das Verständnis des Kosmos und die Erfindung des Mikroskops die Entdeckung der Mikroben ermöglichten, werden uns die neuen Datensammlungs- und Datenanalyse-Werkzeuge in großem Stil dabei helfen, die Welt auf eine Weise neu zu verstehen, die wir erst erahnen können. Die wirkliche Revolution findet nicht in der Technik statt, sondern in den Daten selbst und in der Art ihrer Analyse.

Viktor Mayer-Schönberger ist Professor für Internet Governance and Regulation am Oxford Internet Institute. Der gebürtige Pinzgauer studierte Jus in Salzburg, Cambridge und Harvard. Bereits 1986 gründete er die Firma Ikarus, die mit einer Anti-Viren-Software Österreichs meistverkauftes Softwareprodukt erstellte. Mayer-Schönberger verkaufte Jahre später seine Firma und widmete sich der akademischen Karriere, berät zudem Unternehmen, Regierungen und internationale Organisationen.
Viktor Mayer-Schönberger ist Professor für Internet Governance and Regulation am Oxford Internet Institute. Der gebürtige Pinzgauer studierte Jus in Salzburg, Cambridge und Harvard. Bereits 1986 gründete er die Firma Ikarus, die mit einer Anti-Viren-Software Österreichs meistverkauftes Softwareprodukt erstellte. Mayer-Schönberger verkaufte Jahre später seine Firma und widmete sich der akademischen Karriere, berät zudem Unternehmen, Regierungen und internationale Organisationen.

Unser digitales Universum expandiert ständig. Als 2003 das menschliche Genom entschlüsselt wurde, stand dahinter ein Jahrzehnt intensiver Arbeit, um die drei Milliarden Basenpaare vollständig zu sequenzieren. Heute, ein weiteres Jahrzehnt später, kann ein einziges Labor dieselbe Menge DNA an einem Tag sequenzieren. Auf den amerikanischen Finanzmärkten wechseln jeden Tag etwa sieben Milliarden Aktien den Besitzer, etwa zwei Drittel davon aufgrund von Computeralgorithmen, die auf mathematischen Modellen beruhen und Berge von Daten verarbeiten, um Gewinne vorherzusagen und Verluste zu minimieren.

Internetunternehmen spüren die Datenflut besonders stark. Allein Google sammelt pro Tag 24 Petabyte (diese Zahl entspricht 24.000.000.000.000.000 Byte, Anm.) an Daten, ungefähr tausendmal so viel wie alle gedruckten Werke in der US-Kongressbibliothek zusammen. Facebook, das es vor einem Jahrzehnt noch gar nicht gab, erhält pro Stunde über zehn Millionen neuer Fotos. Facebook-Nutzer geben pro Tag etwa drei Milliarden Kommentare oder "Gefällt mir"-Klicks ab. Die Anzahl der Twitter-Kurznachrichten wächst jährlich um 200 Prozent und lag 2012 bei über 400 Millionen Tweets pro Tag.

Oft wurde versucht, eine konkrete Zahl für die uns umgebende Informationsmenge zu ermitteln und festzustellen, wie schnell sie wirklich wächst. Eine der umfassendsten Studien stammt von Martin Hilbert, der an der University of Southern California lehrt. Hilbert versucht wirklich alles zu erfassen, was erzeugt, gespeichert und übermittelt wird - nicht nur Bücher, Gemälde, E-Mails, Fotografien, Musikstücke und Videos (analoge und digitale), sondern auch Videospiele, Telefonanrufe und sogar Auto-Navigationssysteme und traditionelle Briefe. Ebenfalls inbegriffen sind Radio- und Fernsehsendungen, die je nach Zuhörer- und Zuschauerzahl eingeordnet werden. Hilbert kommt zu dem Ergebnis, dass 2007 über 300 Exabyte gespeicherter Daten existierten. Übertragen auf verständlichere Maßstäbe bedeutet das: Ein Kinofilm in digitaler Form kann zu einer Datei von etwa einem Gigabyte komprimiert werden. Ein Exabyte ist eine Milliarde Gigabyte. Interessanterweise waren 2007 nur mehr etwa sieben Prozent der Daten in analoger Form gespeichert; der Rest digital. Noch im Jahr 2000 war nur ein Viertel der weltweit gespeicherten Informationen digital - die anderen drei Viertel befanden sich auf Papier, Film, Vinyl-LPs, Audiokassetten et cetera. Aber für 2013 wird die Gesamtmenge gespeicherter Informationen auf 1200 Exabyte geschätzt, und weniger als zwei Prozent davon sind nicht digital.

Versuchen wir ein wenig Distanz zu gewinnen, indem wir die gegenwärtige mit einer früheren Informationsrevolution vergleichen, die aus der Erfindung der Druckerpresse durch Gutenberg 1439 folgte. Die Historikerin Elizabeth Eisenstein ermittelte, dass in den 50 Jahren zwischen 1453 und 1503 etwa acht Millionen Bücher gedruckt wurden. Das sind mehr, als die Schreiber in ganz Europa seit der Gründung von Byzanz etwa 1200 Jahre zuvor handschriftlich vervielfältigt hatten. Mit anderen Worten: Damals dauerte es 50 Jahre, bis die Informationsmenge sich in Europa verdoppelt hatte, im Gegensatz dazu braucht es dafür heute nur noch drei Jahre.

Spam-Filter passen sich automatisch an

Obwohl wir uns erst am Anfang des Big-Data-Zeitalters befinden, sind wir doch bereits täglich darauf angewiesen. Spam-Filter zum Beispiel passen sich automatisch an, wenn die Merkmale unerwünschter E-Mails sich verändern. Man könnte die Software gar nicht auf die Erkennung jeder einzelnen Variante verräterischer Begriffe, wie etwa "via6ra", programmieren. Partnerschaftsvermittlungs-Webseiten stellen Paare auf der Basis der Übereinstimmung ihrer angegebenen Eigenschaften mit denen früherer erfolgreicher Vermittlungen zusammen. Die "Autocorrect"-Funktion in Smartphones verfolgt unsere Eingaben und fügt ihrem internen Wörterbuch entsprechend neue Einträge hinzu. Aber diese Anwendungen sind erst der Anfang. Von Autos, die selbsttätig ausweichen oder bremsen, bis hin zum Watson-Computer von IBM, der in der Quizsendung "Jeopardy!" Menschliche Kandidaten schlägt, wird Big Data viele Aspekte unserer Lebenswelt verändern.