Big Data allein entscheidet keine Wahl – Seite 1

Die Facebook-Likes der US-Bürger haben Donald Trump mit zum Wahlsieg verholfen, das steht im Artikel Ich habe nur gezeigt, dass es die Bombe gibt. Der ist am Wochenende in der Schweizer Zeitschrift Das Magazin erschienen und hat eine Debatte ausgelöst um die Macht von Big Data in Wahlkämpfen: Ist da eine Bombe explodiert, wie die Autoren schreiben? Oder nur ein Knallfrosch?

In dem Artikel geht es weniger um Trump, sondern vielmehr um Michal Kosinski und Alexander Nix. Kosinski hat an der britischen Elite-Universität Cambridge ein Verfahren entwickelt, um anhand von Facebook-Likes und anderen Daten die Persönlichkeit von Menschen zu bestimmen und ihr Verhalten vorherzusagen. Nix ist der CEO der Firma Cambridge Analytica, die das Verfahren kopiert hat, um Wähleranalysen zu erstellen. Zuletzt für Donald Trump.

An sich ist das sogenannte Microtargeting zur gezielten Wähleransprache nicht neu. Schon in Obamas Wahlkämpfen werteten Analysten öffentlich verfügbare und kommerziell gehandelte Daten von US-Bürgern aus, um herauszufinden, wen sie an der Haustür vielleicht noch überzeugen könnten, sich zur Wahl registrieren zu lassen und wirklich wählen zu gehen. Der Ansatz von Kosinski und Nix treibt das allerdings auf die Spitze. Obamas Team hatte 2012 immerhin schon ausgewertet, wer mit wem auf Facebook befreundet ist. Kosinski und Nix analysieren stattdessen die Likes.

Sag mir, was dir gefällt, und ich sage dir, wer du bist

Genauer: erst Persönlichkeitstests im Internet und dann die Likes. Sie gehen auf Facebook um, sehr viele Menschen machen mit, um etwas über ihre vermeintlichen Stärken und Schwächen oder ihren Intelligenzquotienten herauszufinden. Anschließend können sie das Ergebnis direkt auf ihrem Profil teilen. Automatisch betextete Posts wie "Ich habe einen IQ von 120 – wie hoch ist deiner?" sollen Freunde zum Mitmachen animieren. 

Kosinski benutzte sie, um psychologische Profile nach dem sogenannten OCEAN-Modell zu erstellen, das auf einer Gewichtung von fünf Persönlichkeitsdimensionen beruht: Offenheit für Erfahrungen, Gewissenhaftigkeit, Extraversion, Verträglichkeit und Neurotizismus. Dann kombinierte er diese Modelle mit Facebook-Daten: Angaben zur Demografie und wo jemand "Gefällt mir" geklickt hat. Die Kombination erlaubte es ihm, Menschen erstaunlich präzise einzuschätzen, auch in Bereichen, zu denen sie gar keine Angaben gemacht haben, wie etwa Hautfarbe, Religionszugehörigkeit, sexuelle Orientierung, Drogenkonsum und Intelligenz. Hier ist seine zentrale Studie dazu.

Cambridge Analytica macht es so wie darin beschrieben: "Hunderttausende Amerikaner", sagt Nix in diesem Vortrag, hätten den Persönlichkeitstest der Firma im Internet gemacht. Daraus habe Cambridge ein Modell entwickelt, "um die Persönlichkeit jedes einzelnen Erwachsenen in den Vereinigten Staaten vorherzusagen".

Zudem kauft die Firma haufenweise Daten von Händlern wie Acxiom zu Demografie, Konsumverhalten und Interessen der US-Bürger. Und sie benutzt Facebook-Likes. Wo die nicht offen einsehbar sind, holt sich Cambridge die Erlaubnis, darauf zuzugreifen, über Apps für Intelligenz- und Persönlichkeitstests. Wer die Tests machen will, muss den Zugriff auf die Facebook-Daten gewähren. So steht es im Magazin.

Mindestens fragwürdige Datenbeschaffung

Eine ähnliche, noch fragwürdigere Methode der Like-Beschaffung hat der Guardian bereits vor einem Jahr aufgedeckt: Ein ehemaliger Kollege von Michal Kosinski bezahlte Zehntausende Clickworker von Amazons Mikrojob-Vermittlungsplattform Mechanical Turk dafür, dass sie seine Persönlichkeitstests ausfüllten und ihm dabei Zugriff auf ihre Facebook-Profile gewährten – mitsamt aller Informationen über ihre jeweiligen Freunde. Diese wussten wiederum nichts davon, aber auch ihre Likes landeten in einer Datenbank.

Kosinskis Kollege verkaufte den Zugang zu dieser Datenbank an eine andere Firma: Strategic Communications Laboratories, das Mutterunternehmen von Cambridge Analytica. Zusammengenommen haben die Briten dadurch Psychogramme von 220 Millionen US-Bürgern, wie Alexander Nix behauptet. (Allerdings haben weniger als 160 Millionen US-Bürger ein Facebook-Profil.)

Die wurden dann zur gezielten Ansprache genutzt. An der Haustür im persönlichen Gespräch mit den Wahlkampfhelfern oder in Form von Werbung. 175.000 Versionen derselben Botschaft habe Trumps Team an einem Tag auf Facebook verteilt, heißt es im Magazin-Artikel. Unterscheidbar waren sie "meist nur in mikroskopischen Details, um den Empfängern psychologisch optimal zu entsprechen". Auch zur gezielten Demotivierung von Clinton-Anhängern sei die Methode genutzt worden. Trumps Team soll dazu Anzeigen bei Facebook gekauft haben, die nur Nutzer mit bestimmten Merkmalen oder Vorlieben zu sehen bekamen. Ein Beispiel aus dem Artikel: "In Miamis Stadtteil Little Haiti versorgte Cambridge Analytica Einwohner mit Nachrichten über das Versagen der Clinton-Stiftung nach dem Erdbeben in Haiti – um sie davon abzuhalten, Clinton zu wählen."

Microtargeting ist nur eines von vielen Mitteln im modernen Wahlkampf

Wie 175.000 Versionen einer Botschaft erstellt werden, wie viel Aufwand das bedeutet, und von wie vielen US-Bürgern Cambridge Analytica wirklich die Facebook-Likes kennt, bleibt im Magazin unbeantwortet. Doch das sind nur Details.

Von zentraler Bedeutung ist vielmehr die Frage nach der Wirksamkeit der Methode und ihrem Anteil an Trumps erfolgreichem Wahlkampf. Die Frage nach der Sprengkraft der vermeintlichen "Bombe", von der Kosinski gesagt hat, er habe nur gezeigt, "dass es sie gibt". Vermeintlich deshalb, weil es heftige Kritik gibt an dem Magazin-Artikel über den Forscher und die Firma, die seine Idee zur Wählerbeeinflussung benutzt. Denn er erweckt den Eindruck, Cambridge Analytica habe die Wahl entschieden.

Verzerrtes Bild

Die einzigen direkten Quellen sind Kosinski und Nix, also der Erfinder der Methode und derjenige, der damit Geld verdient. Unabhängige Stimmen, die das Microtargeting an sich bewerten und in den gesamten Wahlkampf einordnen, fehlen. Belege für die Wirksamkeit der Methode liefern die Autoren Mikael Krogerus und Hannes Grassegger (der auch für ZEIT ONLINE schreibt) nicht, weil Cambridge Analytica keine herausrücken will. Das zugrunde liegende Persönlichkeitsmodell OCEAN ist wissenschaftlich umstritten und längst nicht auf alle Menschen anwendbar, was im Artikel aber nicht erwähnt wird.

Dass die Firma Cambridge Analytica, wie im Artikel angedeutet wird, schon beim Brexit-Votum und auch beim zwischenzeitlichen Aufstieg des Republikaners Ted Cruz zum ernstzunehmenden Kandidaten der Partei eine zentrale Rolle gespielt hat, zweifeln manche an. Die Cruz-Leute haben die Zusammenarbeit mit der Firma sogar vorzeitig beendet, weil sie so unzufrieden mit den Ergebnissen waren. Auch andere Insider stellen schon länger die Fähigkeiten von Cambridge Analytica in Frage. Viel PR, wenig Substanz – so lassen sich die Vorwürfe zusammenfassen.

Im Magazin-Artikel gibt es durchaus Differenzierungen, aber sie werden überlagert von der Bomben-Metapher und ähnlich dramatisierten Passagen sowie von Textpassagen wie dieser: "Die Statistiker haben die Wahl gewonnen. Aber nur jene mit der neuen Methode. Es ist ein Treppenwitz der Geschichte, dass Trump oft über die Wissenschaft schimpfte, aber wohl dank ihr die Wahl gewonnen hat." Der Artikel zeichnet daher ein verzerrtes Bild davon, wie wichtig Cambridge Analytica im US-Wahlkampf wirklich war. Dabei gab es noch andere Datenanalyse-Firmen, die Trumps und Clintons Lager beschäftigt haben, sowie viele nicht-technische Gründe, die letztlich zum Sieg des republikanischen Kandidaten führten.

Die Demokraten, der FBI-Direktor, das Wahlsystem, die Russen, die Medien, die Liberalen – sie alle wurden schon mitverantwortlich für den Wahlausgang gemacht. Die Liste ließe sich noch lange fortsetzen. Den einen Grund für Trumps Sieg gibt es nicht.

Selbst innerhalb seiner Kampagne waren die Briten nur ein Dienstleister von mehreren. Sasha Issenberg, Autor von The Victory Lab: The Secret Science of Winning Campaigns und Kenner von Cambridge Analytica, schreibt auf Anfrage von ZEIT ONLINE: "Trumps Team hat auf mindestens vier verschiedene Umfrageinstitute zurückgegriffen, die wie Cambridge Analytica die Wähler beobachtet und Empfehlungen abgegeben haben, wo Trump seine Ressourcen einsetzen sollte. Die Republikanische Partei, die für Trump den Großteil der individuellen Kontakte zu Wählern organisiert haben, hatte ihre eigenen Datenanalysten, die oft anderer Meinung waren als Cambridge."

Microtargeting allein gewinnt keine Stimmen

Der Ansatz von Cambridge Analytica mit dem OCEAN-Modell mag speziell sein, im Prinzip aber ist er keinesfalls einzigartig. Issenberg nennt beispielhaft sieben weitere Firmen, "die sich, was Fähigkeiten und Methoden angeht, nicht groß von Cambridge unterscheiden". Sie heißen Civis Analytics, Clarity Campaign Labs, Blue Labs, 0ptimus, TargetPoint, Grassroots Consulting und i360.

"Solche Analysefirmen können einem Wahlkampfteam helfen, ihre begrenzten Mittel zu priorisieren", sagt Issenberg. "Welche Wähler lohnt es sich anzusprechen, sollte man sie versuchen zu mobilisieren oder zu überzeugen, wo sollte der Kandidat noch auftreten? Trump hatte viel weniger Geld als Clinton für den Wahlkampf, da war es besonders wichtig für ihn, solche Empfehlungen zu bekommen. Aber die gewinnen alleine noch keine Stimmen."

Autoren verteidigen sich gegen Kritik

Zudem gehören zu den großen US-Kampagnen nicht nur Datenanalysten, sondern auch Spin-Doktoren, Spendeneintreiber, sogenannte opposition researchers, die nach Schwächen der Kontrahenten suchen, und viele weitere Spezialisten. Im US-Wahlkampf, in dem einzelne Wahlbezirke in Swing States von großer Bedeutung sein können, ist Microtargeting zur Mobilisierung und vielleicht auch zur gezielten Entmutigung der gegnerischen Anhänger nicht mehr wegzudenken. Die anderen Mittel aber auch nicht.

Die Magazin-Autoren verteidigen sich gegen die Kritik. Auf Anfrage schreiben sie: "Unser Ziel war es, Microtargeting zu erklären. Da ist eben nicht so wichtig, warum, wo und ob Ted Cruz die Firma Cambridge Analytica gefeuert hat". Die OCEAN-Methode sei "der Standard in der modernen Psychologie", Kritik daran aus der Wikipedia sei "nicht die beste Quelle". Sie räumen aber ein, nicht deutlich genug gemacht zu haben, dass Cambridge Analytica nur ein Baustein von vielen im Wahlkampf war.

Eines ihrer Ziele aber dürften sie erreicht haben: eine Debatte über die Nutzung von Facebook- und anderen Daten zur Wählerbeeinflussung in Gang zu setzen. Was erlaubt ist, was machbar, was bezahlbar und was sinnvoll, das werden sich auch die deutschen Parteien im Bundestagswahlkampf vermutlich genau ansehen. In einer ersten Reaktion auf den Magazin-Artikel beschreibt Mathias Richel, der den Onlinewahlkampf der SPD 2013 konzeptionell unterstützt hat, die Kampagnenrealität in Deutschland so: "Kein Big Data weit und breit." Zu kompliziert, zu heikel, zu teuer. Nicht jeder Digitalstratege dürfte das so sehen. Erst recht nicht diejenigen, die etwas zu verkaufen haben.

Ergänzung: Mittlerweile hat auch Michal Kosinski auf eine Anfrage von ZEIT ONLINE geantwortet. Der eigentliche Erfinder der von Cambridge Analaytica eingesetzten Methode schreibt: "Der Hauptgrund für Trumps Wahlsieg war die Unfähigkeit der Demokraten, einem großen Teil der Wählerschaft zuzuhören. Psychologisches Targeting könnte der sprichwörtliche Tropfen gewesen sein, der das Fass zum Überlaufen bringt. Aber es gewinnt alleine keine Wahl." Er werde "hoffentlich bald" Ergebnisse einer Studie veröffentlichen, die zeigen, "dass psychologisches Targeting und das entsprechende Zuschneiden einer Botschaft deren Überzeugungskraft stark erhöhen kann".

Auch Viktor Mayer-Schönberger, Big-Data-Forscher und Professor am Oxford Internet Institute, will Trumps Erfolg nicht auf eine einzige Ursache zurückführen, "auch wenn wir Menschen gerne so ein vereinfachendes Narrativ hätten", wie er in einer E-Mail schreibt. Er hält die Methode von Cambridge Analytica aber in einer Hinsicht für einen der derzeit modernsten Ansätze im datenbasierten Wahlkampf: Sie gehört zu "jenen Methoden, die nicht mehr von vordefinierten Wählergruppen ausgehen, sondern bei denen sich Wählergruppen aus den Mustern von Daten ergeben. Damit bleiben die Wählergruppen relevant und aktuell, und 'zwingen' die Wahlkämpfer dazu, mit diesen jeweils relevanten Gruppen zu kommunizieren anstatt vordefinierte Gruppen (Millennials, Rentner etc.) zu bedienen."