ZU|Daily wurde in die Hauptseite in den Newsroom unter https://www.zu.de/newsroom/daily/ integriert. Die neuesten Artikel seit August 2024 werden dort veröffentlicht. Hier finden Sie das vollständige Archiv aller älteren Artikel.
Viktor Mayer-Schönberger, 1966 in Österreich geboren, studierte Jura in Salzburg, Cambridge und Harvard. Während seines Studiums gründete er eine Firma für Datensicherheit und Antivirussoftware, blieb letztlich aber in der Wissenschaft. Unter anderem arbeitete er an der John F. Kennedy School of Government in Harvard und als Director of the Information Policy Research Center an der National University in Singapur. Derzeit ist er Professor für Internet Governance and Regulation am Oxford Internet Institute. Er hat mehrere Bücher geschrieben, zuletzt "Big Data – A Revolution That Will Transform How We Live, Work, and Think", das im Oktober auf Deutsch erschienen ist.
Ein Logistikunternehmen verdient sein Geld damit, Waren zu transportieren – und zwar so schnell wie möglich. Also liegt es nahe, dafür den kürzesten Weg zu wählen. Doch der Paketdienst UPS hat seine Fahrer angewiesen, so oft wie möglich rechts abzubiegen; selbst wenn sie links abbiegen müssten, um ihr Ziel zu erreichen. Was nach ökonomischem Unsinn klingt, spart dem Konzern zehn Millionen US-Dollar pro Jahr.
Der Anweisung der Geschäftsleitung liegt eine Big-Data-Analyse zugrunde. Nach Auswertung von Unfallstatistiken, Benzinverbrauch und Aufzeichnungen vergangener Touren stellte sich heraus, dass die UPS-Transporter seltener in Unfälle verwickelt sind, wenn sie dreimal rechts abbiegen und dann geradeaus die Straße überqueren, von der sie ansonsten links abgebogen wären. Der Umweg kommt in der Summe günstiger als die Folgekosten der Zusammenstöße beim Kreuzen des Gegenverkehrs.
Das ist nur eines von vielen Beispielen, von denen Viktor Mayer-Schönberger an der Zeppelin Universität erzählt. Sein Vortrag heißt genauso wie sein Buch „Big Data: A Revolution That Will Transform How We Live, Work and Think“, im Oktober ist es nun auch auf Deutsch erschienen. Wenn man dem Oxford-Professor zuhört, dann scheint der plakative Titel keineswegs übertrieben. Mayer Schönberger ist überzeugt, dass Big Data tiefgreifende Auswirkungen auf unseren Alltag haben wird – und nach der Veranstaltung dürften die meisten Zuhörer geneigt sein, ihm zu glauben.
Eine eherne Journalistenregel lautet: Verschone dein Publikum vor zu vielen Zahlen. Doch weil auch Mayer-Schönberger sich nicht daran hält, und die von ihm zitierten Statistiken eher veranschaulichen denn verwirren, müssen ein paar trockene Zahlen herhalten, um die Datenflut zu illustrieren. Täglich werden 400 Millionen Tweets verschickt, innerhalb von 60 Minuten 10 Millionen Fotos auf Facebook gepostet, und jede Sekunde sorgen die YouTube-Nutzer für eine Stunde neues Videomaterial. Während im Jahr 2000 noch rund drei Viertel aller Daten in analoger Form vorlagen, sind es heute weniger als ein Prozent. Alleine 2013 wurden bereits über 2 Trilliarden Bytes gespeichert – was auf iPads gespeichert und gestapelt eine 21.000 Kilometer lange Mauer ergäbe. Kurzum: Die Digitalisierung hat Volumen und Geschwindigkeit des weltweiten Datenstroms explodieren lassen.
Diese nie dagewesen Menge an Informationen ist für Mayer-Schönberger eine der drei Charakteristika des Big-Data-Zeitalters. Durch die nahezu lückenlose Datensammlung müssen nicht mehr zwangsläufig Stichproben gezogen werden, man kann einfach die Grundgesamtheit analysieren. Mayer-Schönberger fasst das mit dem Schlagwort „more“ zusammen. Die beiden anderen lauten „messy“ und „correlations“. Dabei ist „messy“ eine unmittelbare Folge von „more“: Wenn Millionen Datensätze ausgewertet werden, fallen Abweichungen weniger stark ins Gewicht; die Exaktheit eines einzelnen Wertes verliert an Bedeutung.
Aus Korrelation folgt nicht zwangsläufig Kausalität. Das wird Mayer-Schönberger nicht müde zu betonen, und darauf will er mit dem Stichwort „correlations“ hinweisen. „Wir Menschen versuchen, der Welt einen Sinn zu geben und sehen ständig und überall Zusammenhänge“, sagt er. Doch die Realität bestehe nicht immer aus Ursache und Wirkung: „Sie gehen abends in ein Restaurant, am nächsten Morgen ist Ihnen schlecht und sie führen das auf das Essen zurück. Dabei ist es viel wahrscheinlicher, dass Sie beim Handschütteln mit einem Kollegen angesteckt oder in der U-Bahn ein paar Viren abbekommen haben. Diese kausalen Denkmuster sind häufig Fehlschlüsse.“ Big-Data-Wissenschaft beschreibe lediglich das Was und das Wie, niemals das Warum. Deshalb warnt Mayer-Schönberger davor, Scheinzusammenhänge zu konstruieren und appelliert an Statistiker und Datenexperten, keine voreiligen Schlüsse aus ihren Ergebnisse zu ziehen.
Doch bereits bloße Korrelation kann Leben retten: Die kanadische Informatikerin Carolyn McGregor entwickelte eine Big-Data-Methode, das den Gesundheitszustand von frühgeborenen Babys vorzeitig erkennt, indem es pro Sekunde rund 1200 unterschiedliche Werte von Körperfunktionen wie Atemfrequenz oder Blutdruck erfasst. So kann McGregor eine drohende Infektion bereits 24 Stunden früher erkennen als mit herkömmlicher Diagnostik. Den Grund für die Infektion kennt das System nicht – es misst lediglich, ob bestimmte Werte gemeinsam auftreten. Kausalität spielt keine Rolle, nur Korrelation ist wichtig.
Big Data kann nicht nur die Überlebenschancen von Frühchen verbessern, sondern auch helfen, Grippewellen vorherzusagen. Zwei amerikanische Wissenschaftler haben einen Algorithmus entwickelt, der Tweets auf Grundlage bestimmter Schlagwörter auswertet und daraus eine Prognose erstellt, wann und wo eine bestimmte Krankheit auftreten wird. Diese Vorhersage ist besser und schneller als die Daten der staatlichen amerikanischen Seuchenbehörde CDC, die ausschließlich auf Informationen von Ärzten und Krankenhäusern beruhen. Google hat mittlerweile sogar eine eigene Webseite gestartet, die das Auftreten von 45 bestimmten Begriffen in Suchanfragen überwacht und so in Echtzeit die Häufigkeit von Grippeerkrankungen angeben kann.
Wo viel Licht ist, da ist auch Schatten – und das nicht zu knapp. Spätestens seitdem Edward Snowden die Datensammelwut der Geheimdienste aufgedeckt hat, stellt sich die Frage nach dem Schutz der Privatsphäre. Zwar ist Viktor Mayer-Schönberger fasziniert vom großen Potential von Big Data, aber er hat auch die dunkle Seite im Blick: „Privatsphäre ist nicht tot, das ist Unsinn. Aber der Weg, wie wir versuchen, Privatsphäre zu schützen, funktioniert nicht mehr.“
Alleine die NSA analysiert und speichert täglich rund 29 Petabyte. Zum Vergleich: Als die Vorratsdatenspeicherung in Deutschland für verfassungswidrig erklärt wurde, gab die Telekom bekannt, dass sie ihre gesamten, bisher aufgezeichneten Vorratsdaten löschen wolle. Größe: 19 Terabyte. Das entspricht rund 0,00066 Prozent der Menge an Daten, die von der NSA pro Tag erfasst werden. „Erstmals in der Geschichte ist es möglich, nahezu alle anfallenden Daten zu sammeln und zu speichern“, sagt Mayer-Schönberger. „Die Nutzungsmöglichkeiten ergeben sich dabei häufig erst im Nachhinein und oft in ganz anderen Zusammenhängen.“ So habe man etwa festgestellt, dass sich aus den Daten von Fico, dem amerikanischen Pendant zur Schufa, ableiten lasse, mit welcher Wahrscheinlichkeit alte Patienten ihre Medikamente einnehmen. Das ermögliche eine Prognose, wie schnell man diese Patienten aus dem Krankenhaus entlassen kann, was eine Senkung der Gesundheitskosten zur Folge habe.
Das klingt gut, doch Mayer-Schönberger warnt davor, die Fähigkeiten der Maschinen zu überschätzen. Durch immer schnellere Computer und immer komplexere Algorithmen können immer präzisere Rückschlüsse aus immer größeren Datenbeständen gezogen werden. Welche Folgen das haben kann, verdeutlicht Mayer-Schönberger an mehreren Beispielen. In einer Kolumne für das Magazin Wired beschreibt er den Fall der amerikanischen Journalistin Michele Catalano. Sie bekam Besuch von sechs Geheimdienstmitarbeitern, nachdem ihr Mann nach den Anschlägen von Boston versucht hatte, sich über mit einer Google-Suche die Methode der Attentäter zu informieren.
Oder die Methoden der kalifornischen Polizei: Dort wird seit einigen Jahren das sogenannte Predictive Policing getestet. Dabei versucht man, mit Hilfe statistischer Hochrechnungen vorherzusagen, wann und wo ein Verbrechen stattfinden wird, um vorher dort zu sein und es verhindern zu können. Genau dieses Szenario entwarf Steven Spielberg in seinem Science-Fiction-Thriller Minority Report. Er drehte den Film 2002 und verlagerte das Geschehen ins Washington D.C. des Jahres 2054. Nun schaut es so aus, als könnte diese Vision weitaus früher Wirklichkeit werden.
Gegenüber dem österreichischen Standard bezeichnete Mayer-Schönberger das als „Kausalfalle der Big-Data-Analyse“. Auf Grundlage von Korrelationen zwischen soziodemografische Bedingungen und der Wahrscheinlichkeit, ein Verbrechen zu begehen, erfolge ein voreiliger Schluss auf kausale Zusammenhänge und damit Schuld. „Das wäre ‚ punishment without proof‘, soweit darf es niemals kommen“, sagt Mayer-Schönberger in der an seinen Vortrag anschließenden Diskussion an der Zeppelin-Universität. „Dabei ignorieren wir die menschliche Natur. Die ist nämlich weitaus komplexer als statistische Prognosen; für so etwas wie den freien Willen ist in diesem Modell gar kein Platz.“
Big Data könne helfen, die Welt besser zu verstehen, ist Mayer-Schönberger überzeugt und mahnt dennoch zur Vorsicht: „Daten sind nicht perfekt, und außerdem sind Menschen mehr als Daten. Ihr Handeln ist nicht vorhersagbar.“ Bisher sei die Diskussion über die Gefahren von Big Data fast ausschließlich in Europa geführt worden, während in den USA hauptsächlich der kommerzielle Nutzen interessiert habe. „So großartig die Möglichkeiten, so groß sind auch die Risiken von Big Data. Insofern müssen wir Edward Snowden wirklich dankbar sein. Möglicherweise nimmt jetzt das kritische Bewusstsein zu. Und das ist auch bitter nötig, denn sonst droht eine Diktatur der Daten.“
Titelbild: Eric Fischer (CC BY 2.0)
Bilder im Text: Myworkforwiki | zyphbear | Jim Forest |