Facebook, Deutsche Post und der Wahlkampf

Facebook, Deutsche Post und der Wahlkampf

Was machen Facebook, Post und die Wahlkämpfer mit unseren Daten? Sind wir der gläserne Wähler? Die Debatte um Big Data und Wahlkampf erreichte in der letzten Woche eine neue Erregungsspirale. Trotz aller Aufregung für Deutschland gilt: Wir haben den sichersten Datenschutz der Welt, wenn es um die Nutzung von Daten im Wahlkampf geht. Worin unterscheidet sich das Herangehen in Deutschland und den USA?

1. USA, das Land der Mikrodaten

Die Sorge geht um, dass deutsche Parteien in ähnlicher Art und Weise auf individuelle Daten der Wähler zurückgreifen können wie Donald Trump oder Hillary Clinton. Keep calm. Es gibt einen prinzipiellen Unterschied: die USA ist das Land der Mikrodaten und Deutschland, das Land der Makrodaten. Was heißt das?

In den USA verstehen sich die nationalen Parteien als Datenzentren, deren Informationen sich aus unterschiedlichen Datenquellen speist.Bis zu 4.000 Einzelinformationen über den einzelnen Wähler und das von rund 200 Millionen registrierten Wählern in den USA sind in deren Datenbanken verfügbar. Das sind Daten aus öffentlichen Datenbanken (bspw. des State Motor Vehicle Department), Zensusinformationen, eigenen politischen Veranstaltungen oder durch das „Merging“ (Mischen) gewonnene Daten mit Angaben von sog. Third-Party-Groups (bspw. National Rifle Association, Listen von früheren Kampagnenspendern). Dazu kombinieren amerikanische Parteien Informationen von kommerziellen Datenanbietern, die einzelne Kaufmuster, Mitgliedschaften und Abonnements dokumentierten. Besonders wertvoll sind die Interaktionsdaten wie Telefonnummern, E-Mail-Adressen, Beteiligung als Freiwillige oder Themen, die beim Haustür-Canvassing angesprochen wurden. Die republikanische Partei ergänzte oder updatete über 1,2 Milliarden Wählerinformationen zwischen 2012–2016.

In dem ganzen Datendschungel sind aber zwei Informationen besonders wertvoll: die Parteiaffinität und wahrscheinliche Wahlteilnahme. Auch diese beiden Daten sind käuflich zu erwerben (zumindestens in 32 von 50 Bundesstaaten). Wenn also bekannt ist, mit welcher politischen Richtung man sympathisiert und bei welchen Wahlen man in der Vergangenheit teilgenommen hat, sind das schon ziemlich genaue Anknüpfungspunkte.

Mit prädiktiven Analysen versuchen die Parteien das Wahlverhalten des einzelnen Wählers vorherzusagen, indem sie die Unterstützung für einen republikanischen oder demokratischen Kandidaten, seine Wahlwahrscheinlichkeit und sein Interesse an Themen oder lokalen Initiativen korrelierten. Kombiniert man das mit wesentlichen Informationen aus dem Datenuniversum entsteht ein mustergültiges Wählerprofil. Doch auch für die USA ist es zu kostenintensiv jeden Wähler individuell und genau profiliert anzusprechen. Daher versuchen sie Bürger mit ähnlichen Mustern zu finden. So entstehen dann die berühmten „Soccer Mom Democrats“ oder „Yoga Republicans“. Im Wahlkampf 2016 über 1.800 solcher Wähler-Cluster.  

2. Deutschland, das Land der Makrodaten

Deutsche Parteien sind meilenweit von solchen Datenmodellen entfernt. Und sie werden auch nie dorthin kommen. Drei wesentliche Faktoren sind entscheidend.

  • Parteien dürfen nur eingeschränkt Wählerdaten kaufen

Zwar dürfen für Senioren oder Erstwähler für die Wahlen von den Einwohnermeldeämter Daten erworben werden. Diese sagen aber lediglich „Max Mustermann, Musterstadt“ aus. Unprofilierte Daten ohne jegliche zusätzliche Information. Parteien agieren sehr reserviert damit. Der Kostenaufwand und auch die Ansprache stehen für viele in keinem Verhältnis. Das hat auch mit dem zweiten Faktor zu tun:

  • Parteien dürfen diese Daten nicht behalten oder weiter anreichern

Unmittelbar nach der Wahl müssen die Parteien die erworbenen Wählerdaten wieder vernichten. Während die amerikanischen Parteien seit 1990 kontinuierlich ihre Datenbanken erweitern und die Wählerdaten anreichern, gehen deutsche Parteien nach jeder Wahl immer wieder über Los. Davon ausgeschlossen sind Daten, wo die jeweiligen Bürger ihre doppelte Zustimmung (double opt-in) zur Verwendung gegeben haben. Das macht in Deutschland ein verschwindend geringer Anteil.

  • Schließlich ist das Targeting in Deutschland mit Daten von entsprechenden Anbietern hochgradig unscharf:

Datenschutzrechtlich dürfen die Informationen über die Wähler nur auf der Größe einer sogenannten Mikrozelle erfolgen. Es geht nicht um die einzelne Person oder den einzelnen Haushalt. Vielmehr besteht eine Mikrozelle aus im Schnitt 6,6 Haushalten. Wer sich für einen Moment mal überlegt, welche Personen in den sechs Haushalten in seinem unmittelbaren Umfeld leben, kann sich das Targeting vorstellen.

Die Datenanbieter in Deutschland geben keine personenbezogenen Daten, sondern statistische Wahrscheinlichkeitswerte wider. Zudem vermieten sie die Daten und verkaufen diese nicht.

Das heißt nicht, dass nicht auch in Deutschland Parteien versuchen, Wähler zu erfassen. Aber ihr Herangehen besteht aus historisch-geographischen Wahlanalysen und aus groben sozio-demographischen Einschätzungen („Frauen über 60 Jahre in katholischen Gegenden wählen mit einer Wahrscheinlichkeit von x Prozent CDU“).  Sie setzen auf klassische Zielgruppenana­lysen anhand von Sinus-Milieus, das heißt Typisierung der Menschen nach sozialer Lage und Grundorientierung kombiniert mit erweiterten Wählerpotenzialen.

In a nutshell: Während in den USA vom einzelnen Wähler ausgehend ähnliche Personen geclustert und angesprochen werden, kommt man in Deutschland aus der 10.000 Meter-Perspektive und versucht durch Annährungsverfahren geographische und soziodemographische Schwerpunkte zu erfassen. Aber Lieschen Müller bleibt den Parteien verborgen. Außer wenn man engagierte Ortsvorsitzende hat, die jeden Wähler im Dorf oder der Stadt einzuschätzen wissen. Aber ob das genauer ist?

Aber Facebook und Wahlkampf?

Die Berichte aus dem Guardian und der New York Times sind eine andere Baustelle und hier gilt es auch in Deutschland wachsam zu sein. Die Methodiken von Cambridge Analytica (CA) im Umgang mit Nutzerprofilen und personalisierten Anzeigen, habe ich an anderer Stelle beschrieben. Generell gilt, man sollte aufpassen, nicht dem Marketing von Cambridge Analytica aufzusitzen. Wer behauptet, man könne mit dem Wissen von nur zehn Likes demokratische Wahlen gewinnen, macht nur eines: Er wirbt für das Geschäftsmodell von Facebook und deren laxen Umgang mit Daten. Und die meisten deutschen Parteien waren sehr transparent über ihr Targeting und Werbung auf Facebook. Außer der AfD.

Während des Bundestagswahlkampfes lag der Fokus der AfD klar auf Facebook. Das soziale Netzwerk ist die Tagesschau der AfD. Sie erreichte dort mit einer hohen Häufigkeit der Beiträge, einem (bewegt-) bildhaftem Auftritt und engagierten Fans eine große Reichweite, die fast der Hälfte aller Parteien im Wahlkampf entsprach.

Die AfD griff offensichtlich als einzige Partei auf Microtargeting zurück. Die AfD kreierte aus den 300.000 Fans bei Facebook ein Modell und eine sogenannte „lookalike audiences“, um ähnliche Nutzer gezielt ansprechen zu können. So identifizierten sie sieben Zielgruppen, bspw. Mütter (2,6 Millionen), Unternehmer (1,1 Millionen) und Arbeiter, vor allem Gewerkschafter (6,4 Millionen). Diese bespielten sie gezielt mit bezahlter Werbung besonders von der Anti-Merkel-Webseite „Die Eidbrecherin“ (Silver 2017). Die Webseite war mit einem Facebook-Cookie versehen und so konnten die Besucher gezielt getrackt werden. Die AfD war die einzige Partei, die auf solche datenschutzrechtlich bedenklichen Methoden zurückgriff. Es ist sehr wahrscheinlich, dass sie damit besonders im Engagement punktete.

Genau deswegen stellen sich Fragen nach dem Code of Conduct im Digital Campaigning. Wir brauchen hier mehr Transparenz von Facebook und eine klare Absprache der Parteien und Kampagnen.

Big Data, Trump und Cambridge Analytica

Big Data, Trump und Cambridge Analytica

Die Empörung ist groß: eines der größten Datenlecks in der Geschichte von Facebook und major data breach. Über 50 Mio. Facebook Profile wurden von Cambridge Analytica seit 2014 ohne deren Zustimmung genutzt. Durch verhaltensanalytische Verfahren sollten Persönlichkeitseigenschaften vorhergesagt und dadurch personalisierte Wahlwerbung ausgespielt werden.

Die Aufregung ist richtig, da sie die Aufmerksamkeit auf den laxen Umgang und den Schutz der Nutzerdaten durch Facebook lenkt. Doch übertreibt es die Bedeutung von Cambridge Analytica für den Wahlsieg von Donald Trump.

Wie lief der Trump-Kampagne ab? Folgender Artikel zeigt, was die Trump (und auch die Clinton-Kampagne) wusste und wie sie Wähler „profilierte“. Sie entspringen mehrerer Forschungsinterviews und -reisen. Ausführlicher sind sie hier dargestellt.

Was amerikanische Kampagnen über Wähler wissen?

In den USA sind die Informationen über Wähler vielfältig verfügbar. Sowohl die demokratischen als auch die republikanischen Parteien verstehen sich als Datenanbieter im pulsierenden privaten Markt für Wählerdaten. In 32 Bundesstaaten können politische Kampagnen das Wählerverzeichnis des jeweiligen Bundesstaates kaufen und auf Namen, Adressen, Alter, Geschlecht und Wahlgeschichte zurückgreifen. Die Wählerverzeichnisse sind öffentlich und können je nach Bundesstaat in verschiedenen Behörden und in unterschiedlicher Form (elektronisch oder in Papierform) erworben werden. Um an den jeweiligen Vorwahlen der Demokraten oder Republikaner teilnehmen zu können, enthalten die Wählerverzeichnisse zumeist die Parteineigung und die jeweilige Wahlbeteiligung der einzelnen Person. Dadurch kennen Kampagnen die politische Präferenz und die Wahrscheinlichkeit, ob ein Wähler eher an kommunalen, bundesstaatlichen oder nationalen Wahlen teilnimmt (Hersh 2015).

Die gesammelten Wählerinformationen liefen lange Zeit im nationalen Wählerverzeichnis der Republikaner zusammen – dem Voter Vault. Das Republican National Committee begann Mitte der 1990er Jahre eine nationale Wählerdatenbank aufzubauen (Sosnik/Dowd/Fourier 2006). Auf das webbasierte Datenbankangebot griffen auch bundesstaatliche und kommunale Kandidaten durch Passwortzugang zurück. Später entwickelte sich daraus GOP Data Warehouse und Data Trust – ein Hybrid, ein privates Unternehmen in enger Verflechtung mit der Partei. Zudem griffen die Republikaner bei der Finanzierung der Datenkäufe auf Interessengruppen von außen zurück, wie die Milliardäre Koch oder das Netzwerk American Crossroads (Issenberg 2015).

Waren noch Anfang der 2000er die Daten weitgehend unstrukturiert, erlebt mit dem Wandel analytischer Möglichkeiten auch die Welt der Kampagnendaten eine große Verschiebung. Die Betrachtung der Wähler erfolgt nach immer individuelleren Attributen. Nach der verlorenen Präsidentschaftswahl 2012 investierte das RNC seit 2013 über 175 Mio. Dollar in den Aufbau eines technischen Netzwerks aus Daten und digitaler Technologie, um Republikaner auf allen politischen Ebenen unterstützen zu können. Jede republikanische Kampagne konnte auf die gleichen Daten zugreifen – vom lokalen Sheriffswahlkampf bis zur Präsidentschaftskampagne.

Das GOP Data Warehouse speist sich aus unterschiedlichen Datenquellen und verfügt über bis zu 4.000 Einzelinformationen von mehr als 190 Millionen registrierten Wählern in den USA. Dies sind Daten aus öffentlichen Datenbanken (bspw. des State Motor Vehicle Department), Zensusinformationen, eigenen politischen Veranstaltungen oder durch das „Merging“ (Mischen) gewonnene Daten mit Angaben von sog. Third-Party-Groups (bspw. National Rifle Association, Listen von früheren Kampagnenspendern). Dazu kombinierte das RNC Informationen von kommerziellen Datenanbietern, die einzelne Kaufmuster, Mitgliedschaften und Abonnements dokumentierten. Besonders wertvoll für die Republikaner sind die Interaktionsdaten wie Telefonnummern, E-Mail-Adressen, Beteiligung als Freiwillige oder Themen, die beim Haustür-Canvassing angesprochen wurden. Das RNC ergänzte oder updatete über 1,2 Milliarden Wählerinformationen zwischen 2012–2016 (RNC 2016).

Voter Score und Wählerklassifikation

Mit dem Ende der Vorwahlen baute die Trump-Kampagne auch auf das „gigantische Wählertelefonbuch“ des RNC mit interessenspezifischen und kommerziellen Informationen.

Das RNC begann in den Jahren seit der Wahlniederlage bei den Präsidentschaftswahlen 2012 ein Wählerqualifizierungssystem „Voter Score“ aufzubauen, welches jedem Wähler einen Wert von 0–100 basierend auf statistischen Modellen zuwies. Die Republikaner versuchten mit prädiktiven Analysen das Wahlverhalten des einzelnen Wählers vorherzusagen, indem sie die Unterstützung für einen republikanischen oder demokratischen Kandidaten, seine Wahlwahrscheinlichkeit und sein Interesse an Themen oder lokalen Initiativen korrelierten. Im internen Strategiematerial des RNC heißt es dazu: „By crossing these values, we can predict possible outcomes as well as develop more customized voter contact programs with a true ROI analysis for every dollar spent or contact made“ (RNC 2016).

In den „Voter Score” flossen Informationen aus der RNC Voter File, Umfragen, Konsumentendaten, Rückmeldungen aus früheren Wählerkontaktprogrammen und digitale Verhaltensdaten ein. Das System verfeinerte das RNC kontinuierlich seit Mai 2014. Kontaktdaten aus digitalen Kampagnen, Fundraising-Aktivitäten oder Neuregistrierung wurden berücksichtigt und analysiert. So wurde jedem Wähler ein „Voter Score“ zugeordnet. Allein im Jahr 2016 fanden „683 Voter Score Retrains“ statt, d. h. die Datenbasis wurde komplett modelliert. Beispielsweise fanden in Ohio im Wahljahr 21 „Retrains“ statt, wonach alle 7,7 Millionen Wähler nach über 40 Simulationen bewertet wurden. Dies führte zu über 300 Millionen individuellen Vorhersagen zu Kandidaten, Themen und lokalen Einzelfragen. Insgesamt kam das RNC national auf 115 Milliarden modellierte Vorhersagen, welche dem RNC ein akkurateres Verständnis über alle Wähler gab, als auf Umfragen einzelner Gruppen zu setzen.

Bereits im Sommer 2016 sahen sowohl Matt Oczkowski von Cambridge Analytica als auch Chris Young vom RNC, dass die öffentlichen Umfragen und die Mediendiskussionen sich nicht mit den Folgerungen der Kampagne deckten. In Umfragen stießen die Republikaner auf zwei wesentliche Erkenntnisse. Ein großer Teil der unentschiedenen Bürger standen einer Präsidentschaft Hillary Clintons skeptisch gegenüber. Und die Ausstrahlung Donald Trumps reichte über die klassische Klientel der Republikaner hinaus. „Public polling was wrong. Most analysis is based on vote history, but Donald Trump is not a typical republican“ (Young 2016). Dementsprechend passten die Republikaner die Modelle an. Auf dem „Voter Score“ des RNC baute Cambridge Analytica angepasste analytische Modelle auf, um die „Trump-Wähler“ zu finden.

Targeting der Trump-Kampagne

Das Targeting stellte keine Neuheit des Wahlkampfes 2017 dar. Bereits die Wahlkampagnen von George W. Bush und Barack Obama taten sich in der Segmentierung der Wählerschaft in verschiedene Zielgruppen hervor (Sosnik et al. 2006; Issenberg 2015). Mit dem Ende der Vorwahlen stieß die Datenfirma Cambridge Analytica zur Trump-Kampagne hinzu. Damit erwarb das Team des republikanischen Kandidaten Informationen aus den Umfragen und Datenanalysen, die Cambridge Analytica für Ted Cruz und Ben Carson gemacht hatte. Über den Sommer gab die Trump-Kampagne über 5 Millionen Dollar für die analytischen Dienste von Cambridge Analytica aus. Bis zum Ende der Kampagne beliefen sich die Ausgaben auf etwa 15 Millionen Dollar (Green und Issenberg 2016).

Um die Einsichten zu verdichten, kombinierte die Trump-Kampagne drei existierende Datenbanken. In ihrer neuen Datenbasis „Project Alamo“ konsolidierten sie die ursprünglichen Informationen der Trump-Kampagne seit den Vorwahlen, die Informationen des RNC, welches ihnen jetzt nach dem Ende der Vorwahlen vollständig zur Verfügung stand, und die Datenbasis von Cambridge Analytica, die sich aus Informationen über Demografie, Konsum- und Lebensgewohnheiten und politische Zugehörigkeit speiste. Zudem kauften sie noch Informationen von den Facebook-Marketing-Partnern Experian, Datalogix, Epsilon und Acxiom zu (Winston 2016).

Die Targeting-Anstrengungen der Trump-Kampagne bestanden ab dem Sommer 2016 aus vier Schritten: 1. Umfragen und Analysen, 2. Modellierung und Extrapolation, 3. Audience Segmentation und 4. Ansprache. Die Audience Segmentation und Ansprache über die Kommunikationskanäle (Engagement) fußten auf einer sehr genauen Einschätzung der Wählerschaft durch Umfragen und Modellierung.

Während die nationalen Wählerbefragungen in den Hintergrund traten, konzentrierte sich die Kampagne auf die hart umkämpften Battleground-Staaten. Beständig erhob die Kampagne Daten und 12 Analytiker modellierten jeden Wähler in seiner Neigung zu Trump oder Clinton, seiner Wahlbeteiligungswahrscheinlichkeit und den Top-Themen, die ihn interessierten. Sie befragten jede Woche rund 1500 Wähler in den Battleground-Staaten und rollierten die Ergebnisse. Im gesamten Verlauf der Kampagnen griff sie auf 180.000 Personenbefragungen in 16 Battleground-Staaten online, per Interactive Voice Response (IVR) oder direkte Telefonbefragung zurück (Cambridge Analytica 2017).

Gerade die einzelnen Umfragen in den Battleground-Staaten ermöglichte es der Trump-Kampagne, nuancierte oder lokalisierte Probleme zu filtern und in die Modellierung mit einfließen zu lassen. Die prädiktiven Modellierungen verliefen in zwei Phasen. In der ersten Phase widmeten sich die Republikaner besonders dem Fundraising. Zahlreiche Spendermodelle entstanden und wurden von der Kampagne getestet. Diese Phase reichte von Juni bis Ende Juli 2016. Mit dem offiziellen Abschluss der Vorwahlen durch den Nominierungsparteitag gingen die Fundraisinganstrengungen weitgehend an das RNC über und man teilte sich die Erträge durch ein „joint committee“. Damit begann auch die zweite Phase, wo sich die Trump-Kampagne auf die Modellierung von Wahlwahrscheinlichkeiten und Kandidatenpräferenzen konzentrierte. Zudem errechneten sie in themenbezogenen Modellen die Überzeugungskraft durch politische Inhalte. Diese Phase reichte von August bis zum Wahltag.

Die grundsätzlichen Informationen setzten sich aus drei wesentlichen Bereichen zusammen: wahlspezifischen Daten, demographischen Angaben und themenspezifischen Typologien.

  1. Die Trump-Kampagne war auskunftsfähig über eine Vielzahl von wahlspezifischen Informationen und den Registrierungsstatus des einzelnen Bürgers. Basierend auf den offiziellen Wählerverzeichnissen riefen sie folgende Informationen ab:
  • REGISTERED VOTER
  • REGISTERED REPUBLICAN
  • REGISTERED DEMOCRAT
  • REGISTERED INDEPENDENT
  • NEWLY REGISTERED
(Bürger, die sich in den letzten zwei Jahren im jeweiligen Bundesstaat registrierten)
  • Unregistered/Voter Prospects (Bürger, die älter als 18 Jahre und unregistriert waren)

Zudem griff man auf die Wahlgeschichte der Bürger zurück. Die Kampagne verfügte über folgende Informationen

  • PRIMARY VOTERS
(Teilnehmer an Vorwahlen)
  • GOP PRIMARY VOTERS
(basierend auf Daten der bundesstaatlichen Parteien oder Wahlinformationen der zuständigen bundesstaatlichen Behörden)
  • DEM PRIMARY VOTERS
  • FIRST TIME VOTERS 2012
(Bürger, die 2012 zum ersten Mal an einer Wahl teilnahmen)
  • FIRST TIME VOTERS 2014 (Bürger, die 2014 zum ersten Mal an einer Wahl teilnahmen)
  • LIKELY 2016 VOTERS
(Bürger, die basierend auf einem Wahrscheinlichkeitsscore an den Präsidentschaftswahlen 2016 teilnehmen würden)
  • EARLY ABSENTEE VOTERS
(Bürger, die bisher schon per Brief oder vor dem eigentlichen Wahltag ihre Stimme abgaben)
  • PRESIDENTIAL YEAR ONLY VOTERS
(Bürger, die nur an Präsidentschaftswahlen, aber nicht an kommunalen oder bundesstaatlichen Wahlen teilnahmen)

2. In einem zweiten Bereich verfügte die Kampagne über genaue demographische Angaben und klassifizierte sie wie folgt:

  • AGE 18 TO 29
  • AGE 30 TO 44
  • AGE 45 TO 54
  • AGE 55 TO 64
  • AGE 65 PLUS
  • GENDER FEMALE
  • GENDER MALE
  • HISPANIC (basierend auf direkter Eintragung oder Modellierung)
  • AFRICAN-AMERICAN
(basierend auf direkter Eintragung oder Modellierung)
  • CAUCASIAN/EUROPEAN
(basierend auf direkter Eintragung oder Modellierung)
  • EAST AND SOUTH ASIAN (basierend auf direkter Eintragung oder Modellierung)
  • VETERAN
(basierend auf Umfragen, gekauften Informationen und öffentlich zugänglichen Steuerdaten)
  • HIGH INCOME/WEALTH
(Bürger mit einem jährlichen Haushaltseinkommen über 000 Dollar oder Nettovermögen über 400.000 Dollar)
  • MID INCOME/WEALTH (Bürger mit einem jährlichen Haushaltseinkommen zwischen 60.000 Dollar und 000 Dollar oder einem Nettovermögen zwischen 60.000 und 400.000 Dollar)
  • LOW INCOME/WEALTH
(Bürger mit einem jährlichen Haushaltseinkommen unter 60.000 oder einem Nettovermögen unter 60.000 Dollar)
  • HOME OWNER
  • HAS CHILDREN
(Bürger mit mindestens einem Kind unter 18 Jahre)
  • LIKELY MARRIED
  • LIKELY SINGLE
  • SINGLE PARENT

3. In einem dritten Bereich typologisierte das Trump-Daten-Team unterschiedliche Wählergruppen und -merkmale. Durch Datenanalyse und prädiktive Modellierungstechniken hoben sie verborgene Muster und Verbindungen, die Zielgruppen zu verfeinern und Ansprachethemen zu filtern. Die Modelle wurden jede Woche basierend auf den neusten Umfragen aktualisiert. Es entstanden über 20 spezifische Kandidaten-und-Themenpräferenz-Modelle:

  • TRUMP PRÄFERENZ
  • CLINTON PRÄFERENZ
  • GARY JOHNSON PRÄFERENZ
  • JILL STEIN PRÄFERENZ
  • REPUBLICAN VOTERS
  • DEMOCRAT VOTERS
  • SWING REPUBLICAN VOTERS
  • SWING DEMOCRAT VOTERS
  • HIGH TURNOUT VOTERS
  • MID TURNOUT VOTERS
  • LOW TURNOUT VOTERS
  • MODERATE CONSERVATIVE
  • VERY CONSERVATIVE
  • ESTABLISHMENT CONSERVATIVE
  • LIBERAL
  • LIBERTARIAN
  • TEA PARTY
  • FISCALLY RESPONSIBLE
  • PRO LIFE
  • PRO ENVIRONMENT
  • PRO GUN RIGHTS
  • PRO NATIONAL SECURITY
  • ANTI OBAMACARE
  • ANTI IMMIGRATION
  • CRIME/LAW AND ORDER
  • EDUCATION
  • JOBS AND THE ECONOMY
  • CHILDCARE
  • NATIONAL DEBT
  • TRADE/WAGES

Hatte Cambridge Analytica in den Vorwahlen auf psychografische Analyse und Behavioral Microtargeting zurückgegriffen, die sie für die Cruz-Kampagne anfertigten, verblieb in der Hauptwahlkampfphase nicht die nötige Zeit für die Anpassung. Matt Oczkowski: „We had to walk before we could run in this campaign […] We had five months to scale extremely fast, and doing sexy psychographics profiles requires a much longer run time“ (Google 2016). Cambridge Analytica wies jeden Wähler mit einem Scoring-System zu, dass ihn in 32 abgrenzbare Persönlichkeitstypen einordnete (NYT 2017). Als Grundlage dient das sogenannte OCEAN-Modell (Openness to experience, Conscientiousness, Extraversion, Agreeableness, Neurotizismus). Aus ihren psychografischen Modellen ergaben sich Informationen, welche Art von Person angesprochen wird und wie zu kommunizieren ist. Alexander Nix beschrieb die Logik sehr simpel: „Psychographic data are just one ingredient which is backed into the cake. It allows us to look at people and understand them in terms of how they view the world. (…) The more you know about someone, the better you can engage with them and the more relevant you can make the communications that you send to them, so our job is to use data to understand audiences“, (Brannelly 2016).

Aus den Modellen ergaben sich Segmentierungen nach Audiences und deren Ansprachemöglichkeiten. Es entstanden neue Audiences wie bspw. „disenfranchised new Republicans“, die wesentlich jünger als traditionelle Parteiunterstützer und seltener im städtischen Umfeld lebten. Sie waren für populistische Ansprachen empfänglich und achteten besonders auf drei Themen: Law and Order, Immigration und Gehälter (Green und Issenberg 2016). Oder „soft Democrats“, die zwar Clinton unterstützten, aber einen gravierenden Wechsel von den inhaltlichen Positionen Obamas verlangten und durch Health Care oder Trade angesprochen wurden (RNC 2016).

Battleground Optimizer und Kampagnen-Dashboard

Amerikanische Präsidentschaftswahlen folgen einer doppelten Logik. In der soziodemographischen Logik konzentrieren sich die Kampagnen auf die Ansprache wesentlicher Zielgruppen und einer Anpassung der zentralen Wahlkampfbotschaft. In der geographischen Logik gewichten sie nicht alle Bundesstaaten gleichrangig, denn sie erhalten im Wahlmännerausschuss (Electoral College) Stimmen basierend auf ihrer Einwohnerzahl (Shaw 2006; Voigt 2010). Diese reichen von 3 in Vermont bis zu 55 in Kalifornien. Präsident der Vereinigten Staaten wird der Kandidat, der mindestens 270 Stimmen auf sich vereinen kann. Die Herausforderung ist, dass in einem Großteil der Bundesstaaten der Sieger schon vor dem Wahltag feststeht. Im konservativen Wyoming oder Idaho gewann seit der Goldwater-Wahl 1964 kein Demokrat mehr. Dagegen gibt es sichere Bundesstaaten, die seit Jahrzehnten demokratische Präsidentschaftskandidaten wählen. Vor der Wahl 2016 existierten 18 Bundesstaaten, die seit der Präsidentschaftswahl 1992 für einen demokratischen Kandidaten stimmten. Ihre Wahlmännerstimmen beliefen sich auf 242 Stimmen im Electoral College, oder anders formuliert: nur noch 28 Stimmen fehlten Hillary Clinton zum Sieg. Präsidentschaftskampagnen setzen die Ressourcen nur strategisch in den Staaten ein, wo die Gewinnmarge eng und das Erringen der Wahlmännerstimmen möglich erscheinen. In größeren Bundesstaaten fokussieren sie ihre Bemühungen sogar auf einzelne Teile des Staates oder ausgewählte Medienmärkte. Zudem achten sie auf die Aktivitäten des Gegenkandidaten, um dessen Strategie zu analysieren, und unterstützen Kandidaten der eigenen Partei bei nachrangigen Wahlen (Shaw 1999).

Mit dieser Herausforderung sah sich die Trump-Kampagne konfrontiert. In der klassischen Logik amerikanischer Präsidentschaftskampagnen bedeutet dies, sich in den 10–12 heiß umkämpften Battleground-Staaten zu engagieren und die anderen Bundesstaaten mit Werbung oder Kandidatenauftritten zu ignorieren. Dies würde sie jedoch in eine schwierige strategische Ausgangslage versetzen, da Hillary Clinton nur noch wenige Staaten zum Sieg fehlten. Also nutzten sie Umfragen und genaue Datenanalysen, um über mögliche Erweiterungsszenarien nachzudenken.

Die Trump-Kampagne entwickelte ein Tool, welches tagesaktuell mögliche Gewinnchancen in einer erweiterten Anzahl von Bundesstaaten kalkulierte. Der „Battleground Optimizer Path to Victory“ simulierte basierend auf Umfragen, Wähler- und Mediendaten wahrscheinliche Wege zu einer Mehrheit im Wahlmännerausschuss und kalkulierte die Gewinnkombinationen der Bundesstaaten (Green und Issenberg 2016). Dadurch entstand ein „Priority Score“ von Bundesstaaten, welche die Trump-Kampagne benötigte, um zu gewinnen. Sie richtete ihre Strategie komplett nach dem Battleground Optimizer aus und bestimmte die Kandidatenbesuche, die Allokation der Medienkäufe und die Botschaftsanpassung danach. Das System wurde mit ständig neuen Informationen gespeist. Die Trump-Kampagne fand 13,5 Millionen Wähler in 16 Battleground-Staaten, die sie für potentiell überzeugbare Wechselwähler hielten (Young 2016). Was Trump von seiner Konkurrentin Hillary Clinton unterschied: Er glaubte daran, mit genauer Datenanalytik und digitaler Ansprache die Wählerschaft neu formen zu können, und setzte nicht auf vordefinierte Wählerkoalitionen vergangener Jahre.

Der Priority Score floss in ein Kampagnen-Dashboard ein, das alle wesentlichen Informationen über die Battleground-Staaten, einzelne Wählergruppen und deren thematische Anspracheoptionen zusammenfasste. Es verband durchsuchbar die ineinandergreifenden Datenpunkte und visualisierte auf benutzerfreundliche Art die Wählergruppen in den Bundesstaaten. Dazu zählten real-time-poll-tracking und Heatmaps von überzeugbaren Wählern.

Die Dashboards gaben der Trump-Kampagne einen Überblick über ihre anzusprechenden Zielgruppen. Um die nächsten strategischen Entscheidungen treffen zu können, brach das Daten-Team die Wähler in eine simple Darstellung herunter, indem es die Kandidatenpräferenz und die Wahlbeteiligungswahrscheinlichkeit für den jeweiligen Bundesstaat, County oder Ort miteinander in einer Matrix in Beziehung setzte: „Horizontal axis we look at a candidate score – how likely are they to support the candidate. Vertical axis probability to turn out to vote. (…) Some require issue-related persuasion to bring them around to Trump’s agenda, while others are deemed to just need a ‚nudge‘ to turn out and vote“, beschrieb Eyal Kazin, ein Data Scientist von Cambridge Analytica, das Vorgehen (Brannelly 2016).

Während ein Teil der Wähler als sicher für Trump oder für Clinton eingestuft wurden, gab es eine übergroße Anzahl von überzeugbaren Wechselwählern oder noch zu mobilisierenden potentiellen Unterstützern. Nachdem die ersten Briefwahldaten im Herbst 2016 eingingen, fielen der Kampagne drei Trends auf: Erstens, die Anzahl von afroamerikanischen Wählern war vergleichsweise niedrig, zweitens, die Anzahl der Wähler hispanischer Herkunft nahm nur moderat zu, und drittens, beteiligten sich ältere Wähler aus ländlichen Counties deutlich über dem kampagneninternen Erwartungswert. Dies hatte Auswirkungen in den einzelnen Bundesstaaten. Gerade in Florida oder North Carolina bildeten Wähler afroamerikanischer oder hispanischer Herkunft einen wesentlichen Wählerblock für Hillary Clinton. Hingegen wirkte die stärkere Wahlbeteiligung älterer, weißer Wähler positiv für Trump in den Rust-Belt-Bundesstaaten Michigan, Pennsylvania oder Ohio. Entsprechend passte die Trump-Kampagne ihre Datenmodelle und den Battleground Optimizer an. Danach fiel der Abstand der Kandidaten in den Staaten des Mittleren Westens 1–3 Prozentpunkte enger aus als die öffentliche Debatte widerspiegelte. „In the last week before the election, we undertook a big exercise to reweight all of our polling, because we thought that who [pollsters] were sampling from was the wrong idea of who the electorate was going to turn out to be this cycle“, betonte Matt Oczkowski (Green und Issenberg 2016).

Bereits eine Woche vor dem Wahltag zeigten sich die republikanischen Kampagnenmacher vorsichtig optimistisch. Sie sahen in Ohio und Pennsylvania mögliche Chancen zu gewinnen, da die Trendrichtungen stimmten. „But Florida is critical“, wusste Chris Young, National Field Director der Republikaner eine Woche vor der Wahl zu berichten. Dennoch sahen selbst am Vorabend der Wahl die eigenen Modelle die Siegchancen von Trump bei 30 Prozent (Green und Issenberg 2016). Durch die ständig aktualisierten Simulationen keimte am Wahltag Hoffnung auf zu gewinnen: „At 8.30pm we knew: Florida rural vote put us ahead. Even the traditional counties couldn’t win it for Hillary“, so Chris Young.

Für den Umgang mit Daten in politischen Kampagnen schrieb Andreas Jungherr in unserem Sammelband zum amerikanischen Wahlkampf zu recht:

„Es entsteht schnell der Eindruck, dass eine den Daten innewohnende Magie Kampagnen eine gespenstische Sicherheit in der Auswahl und Ansprache von Wahlberechtigten gibt. Dies ist natürlich Unsinn. Datengestützte Verfahren dienen der Verringerung von Unsicherheit und damit der Senkung von Kosten vergeblicher Kontaktversuche für Kampagnen. Dies ist weit entfernt von tatsächlicher Sicherheit über die zu erwartende Reaktion von angesprochenen Wahlberechtigten. Auch wird allgemein die Qualität der Kampagnen vorliegenden Daten und der darauf entwickelten Modelle überschätzt. Ganz grundsätzlich basiert das Potential datengestützter Verfahren im Wahlkampf auf drei entscheidenden Elementen:

    1. Es müssen verlässliche Informationen über das Verhalten und die Einstellungen von Wahlberechtigten vorliegen, die für Kampagnen interessant sind und die sie beeinflussen wollen;
    2. Es müssen ausreichende personenbezogene Informationen zu Wahlberechtigten vorliegen, die Rückschlüsse auf Verhalten oder Einstellungen erlauben (siehe 1);
    3. Die Beziehungen zwischen Verhalten und Einstellungen von Wahlberechtigten (siehe 1) und den über sie vorliegenden Informationen (siehe 2) müssen über den Zeitverlauf zwischen Modellentwicklung und Wahltag stabil bleiben.

Dies sind anspruchsvolle Bedingungen, die bei weitem nicht für alle diskutierten Nutzungsweisen datengestützter Verfahren gegeben sind. In der Diskussion der Rolle datengestützter Verfahren im Wahlkampf ist also Gelassenheit ratsam und gesunde Skepsis gegenüber den Werbeversprechen reisender Datenhändler und der mit statistischen Modellen bewehrten Zukunftsschauer angebracht.“

Newsletter abonnieren