logo

bild

Die einen sind überzeugt: hinter Big Data steht Big Brother. Die anderen meinen: Big Data ist das Gold der Zukunft. Eine Recherche zwischen Bedrohungsszenario und Goldgräberstimmung (erschienen im Unternehmermagazin a3 ECO 5 / 2017)

 

„In China arbeitet die Regierung an der lückenlosen digitalen Überwachung. Die kommunistische Partei will jeden Chinesen bis 2020 auf Schritt und Klick kontrollieren und die Daten auswerten“, berichtet das ZDF-Magazin Frontal21 Ende März. Demnach sollen alle Bürger einem digitalen Punktesystem unterworfen werden. Anne Cheung von der Universität Hongkong erklärt das System: vor allem soziales und politisches Verhalten werden bewertet, aber auch finanzielle Kriterien werden berücksichtigt. Schon heute werden Chinesen auf staatlichen Internetseiten für jeden einsehbar.an den Pranger gestellt. Wer seine Rechnungen nicht pünktlich zahlt kann zur Bestrafung keine Flug- oder Zugtickets mehr kaufen.

 

ZdrahalErnst BigData 250

Was die Kommunistische Partei für die Chinesen, das ist Facebook für die Amerikaner. Der kleine Unterschied: Mark Zuckerberg bestreitet freundlich lächelnd, dass Facebook auch nur das Geringste mit Politik, konkret mit dem Wahlsieg von Donald Trump zu tun haben könnte. "Wir sind kein Medienunternehmen", wiederholt er immer wieder, "sondern ein Tech-Unternehmen." Die nackten Zahlen sprechen eine andere Sprache: Facebook hat heute weltweit 1,86 Milliarden aktive User. Die Zahl der User wächst jährlich um 17 Prozent. 1,15 Milliarden Menschen nutzen Facebook täglich. Im Minutentakt werden 510.000 Kommentare und 200.000 Fotos gepostet. 67 Prozent der Amerikaner nutzen die Social Media Plattform, im Vergleich dazu nur 41 Prozent der Europäer.

   

Nur drei Tage nach Trumps Wahlsieg widerlegt Cambridge Analytica die blauäugige Aussage Zuckerbergs. „Cambridge Analytica, the data company at the heart of the Trump campaign“ nennt sich das Unternehmen in einer Presseaussendung, in der CEO Alexander Nix betont, dass die Datenanalysen seines Unternehmens wesentlich zum Erfolg von Trumps Werbekampagne beigetragen haben. Schon im Oktober sagte Nix in einem Interview: „Wir haben heute rund fünftausend Datensätze über jeden Amerikaner. ... So modellieren wir das Persönlichkeitsprofil jedes Erwachsenen, rund 230 Millionen Menschen in den USA.“ 230 Millionen – das entspricht exakt den 67 Prozent der Amerikaner, die Facebook nutzen. „Es gibt keine größeren Experten als Cambridge Analytica. Sie waren Trumps digitales Team, das herausgefunden hat, wie man gewinnt“, twittert der Meinungsforscher Frank Luntz anerkennend.

 

Die Mitarbeiter von Cambridge Analytica, die auch die Brexit-Kampagne steuerten, nutzen eine Methode, die der Experte für Psychometrik, Michal Kosinski, auf Basis des aus den 1980er Jahren stammenden Ocean-Fragebogens entwickelt hat. Damit wurde es möglich, jeden Menschen aufgrund von fünf Persönlichkeitsmerkmalen zu charakterisieren: Offenheit, Gewissenhaftigkeit, Geselligkeit, Verträglichkeit, und Verletzlichkeit („Neurotizismus“). War es früher schwierig Daten für die Fragebögen zu kommen, so stellte Kosinksi den Fragebogen für seine Doktorarbeit 2008 auf Facebook und bekam nach kurzer Zeit Millionen von Datensätzen zur Auswertung. 2012 erbringt Kosinski den Nachweis, dass man aus rund 70 Facebook-Likes mit einer Wahrscheinlichkeit von bis zu 95 Prozent richtige Aussagen über die Einstellung und Vorlieben eines Users treffen kann.

 

„Am Tag der dritten Präsidentschaftsdebatte zwischen Trump und Clinton versendet Trumps Team 175.000 verschiedene Variationen seiner Argumente, vor allem via Facebook. Die Botschaften unterscheiden sich meist nur in mikroskopischen Details, um den Empfängern psychologisch optimal zu entsprechen: verschiedene Titel, Farben, Untertitel, mit Foto oder mit Video“, berichtet DasMagazin.ch über die Arbeit der Psychografen. Jeder Facebook-User kann sicher sein: alles was er freiwillig veröffentlicht, kann gegen ihn verwendet werden. Zusätzlich nutzt Cambridge Analytica andere Datenquellen wie Grundbucheinträge, Bonuskarten, Wählerverzeichnisse, Clubmitgliedschaften. Damit hat Trump sein Geld gut angelegt, drei Viertel seines Werbebudgets steckte er in die Onlinekampagne.

 

Nicht alles ist Gold

Trumps Erfolg darf nicht darüber hinwegtäuschen, dass nicht alles Gold ist, was in Big Data steckt. So helfen die großen Datenmengen im Bereich der Terror-Bekämpfung offenbar nur selten Anschläge zu verhindern. Regelmäßig nach einem Anschlag berichten die Medien, dass die Attentäter bereits in Datenbanken von Verdächtigen oder Schläfern registriert waren. Niemand konnte sie aber aufhalten.

 

Auch Unternehmen, die gerne aus dem unendlichen Datenpool punktgenau ihre Kunden herausfiltern würden, sind noch weit davon entfernt. Sogar McKinsey musste kürzlich zu optimistische Prognosen aus dem Jahr 2011 revidieren. So erreichen heute Retail-Unternehmen nur 30 bis 40 Prozent des damals geschätzten Wertzuwachses durch Big Data und Produktionsbetriebe schöpfen nur zu 20 bis 30 Prozent ihres Potenzials aus. Immerhin konnte das Potenzial im Segment der ortsbezogenen Daten zu 50 bis 60 Prozent realisiert werden. Ein Hindernis sei hier laut neuester Studie die zu geringe Durchdringung des Smartphone-Marktes mit GPS-Technologie. McKinsey stellt auch fest, dass sich die Zahlen in den USA und der Europäischen Union kaum unterscheiden.

 

"Viele Unternehmen tun sich damit schwer, datengetriebene Erkenntnisse in die alltäglichen Geschäftsprozesse einzuspeisen. Eine weitere Herausforderung ist das Rekrutieren und Binden der richtigen Talente - nicht nur Data Scientists, sondern auch Business Translators, die einen profunden Umgang mit Daten sowie branchenspezifische und funktionale Expertise kombinieren", so die Autoren der neuesten McKinsey-Studie "The Age of Analytics: Competing in a Data-Driven World". (Quelle: CIO.de)

 

Vielleicht kann die TU Wien hier demnächst Abhilfe schaffen, denn derzeit läuft die Ausschreibung für eine neue Stiftungsprofessur „Data Intelligence“, finanziert von der T-Mobile Austria. Damit will die TU ab Oktober einen Schwerpunkt auf grundlagen- sowie anwendungsorientierter Forschung in den Bereichen Data Analytics und Intelligent Interaction setzen. Schon jetzt hat die TU international anerkannte IT-Experten. Einer von ihnen, Prof. Edurad Gröller, relativiert aber die Erwartungshaltung: „Das Thema Künstliche Intelligenz ist nach dem zweiten Weltkrieg aufgekommen. Alle zehn Jahre wurde ein großer Fortschritt versprochen, aber die Versprechen wurden nie eingelöst.

 

Anhand von zwei Beispielen entzaubert Gröller alle Utopien, dass künstliche Intelligenz in absehbarer Zeit die menschliche Intelligenz ersetzen könnte. 1996 war es eine Weltsensation, dass der Schachcomputer Deep Blue den amtierenden Weltmeister Garri Kasparow geschlagen hat. Der Sieg war nur möglich, weil Deep Blue mit tausenden Meisterpartien gefüttert wurde, und neben einer Bewertung der optimalen Züge auch einen schnellen Datenabgleich mit den Meisterpartien machen konnte. Eduard Gröller: „Ein Schachcomputer ist keine künstliche Intelligenz, sondern rohe Rechenleistung.“

 

Komplexer als ein Schachcomputer ist ein Übersetzungsprogramm. Eine Sprache kann nie linear in eine andere übersetzt werden, jede Sprache hat ihre eigenen Regeln. Syntax und Semantik unterscheiden sich in jeder Sprache. Die neuesten Übersetzungsprogramme funktionieren nicht aufgrund genialer Algorithmen zur Lösung dieses Problems, sondern aufgrund von Texten in unterschiedlichen Sprachen, die in Sekundenbruchteilen miteinander abgeglichen werden. „Die Dokumente, die das EU-Parlament in 15 Sprachen ausfertigt, sind dafür ein großes Reservoir“, so Gröller. „Je mehr Dokumente in mehreren Sprachen verfügbar sind, umso größer wird die Wahrscheinlichkeit, dass die richtige Entsprechung gefunden wird.“ Anders gesagt: ein gutes Übersetzungsprogramm übersetzt nicht, sondern vergleicht bereits vorhandene Texte in unterschiedlichen Sprachen, die in der Cloud aufgefunden werden. Am Ende zählt das Ergebnis, nicht der mehr oder weniger intelligente Weg dahin.

 

So realisiert sich durch Big Data das dialektische Konzept der Umwandlung von Quantität in Qualität: die Qualität von Übersetzungsprogrammen steigt automatisch von Jahr zu Jahr, denn immer noch kann man davon ausgehen, dass sich das Datenvolumen alle zwei bis drei Jahre verdoppelt. Das Geheimnis von Big Data besteht somit lediglich in den Speichermedien, die fast nichts kosten, und den ständig wachsenden Datenmengen. Ergänzend dazu bedeutet Datamining nichts anders als das Zusammenführen und das Abgleichen dieser Daten. „Das hat nichts mit Intelligenz, und schon gar nicht mit Artificial Intelligence zu tun“, meint Gröller. Die Intelligenz der Business Translators besteht folglich darin, die Abweichungen und Ausreißer zu sehen und richtig zu interpretieren.

 

Big Data ist somit eine Goldgrube für all jene Bereiche, die einfach strukturiert sind. Die führerlose Lokomotive ist dafür ein Beispiel. Gröller ist auch überzeugt, dass Lkw bald auf den klar strukturieren Autobahnen autonom unterwegs sein werden. Beim Pkw wird es schwieriger, dafür müssen noch wesentlich mehr Bewegungsdaten und andere Straßeninformationen wie Baustellen und Umleitungen erfasst und verarbeitet werden.

 

Ablaufdatum für Daten

Viele Facebook-User wünschen sich ein Ablaufdatum ihrer Einträge. So wie im richtigen Leben möchte man später nicht an seine Jugendsünden erinnert werden. In einem Jahr tritt die EU Datenschutz-Grundverordnung (DSGVO) in Kraft. Damit wird die aktuelle Richtlinie 95/46/EG, die noch aus dem Jahr 1995, somit aus der Zeit vor Google und Facebook stammt, abgelöst. In der DSGVO ist auch das Recht auf Datenlöschung enthalten.

 

Grundsätzlich sollen mit der Verordnung die Rechtsgrundlagen der Datenverarbeitung, die Rechte der Betroffenen und die Pflichten der Verantwortlichen EU-weit vereinheitlicht werden. Doch viele Unternehmen wissen noch nicht, was auf sie zukommt. Anton Jenzer, Vorsitzender des Dialogmarketing-Verbandes (DMVÖ) kritisiert: „Es gibt rund 60 Öffnungsklauseln, über deren Inhalt noch Unklarheit besteht. Es ist völlig inakzeptabel, dass die verantwortlichen staatlichen Stellen hinter verschlossenen Türen an Regelwerken arbeiten, ohne die österreichische Wirtschaft einzubinden.“

 

Wolfgang Zankl, Leiter des e-center, Zentrum für E-Commerce und Internetrecht, beanstandet einerseits einen „Regelungsexzess (Strafen bis 20 Millionen Euro), auf der anderen Seite Rechtsunsicherheit durch eine Vielzahl unbestimmter Begriffe.“

 

Moralisches Resümee

Aus moralischer Sicht stellt sich die Frage, wie viele der gespeicherten Daten Müll sind und wie man mit Datenmüll umgehen soll. Wenn ich beispielsweise bei einer Ausstellungseröffnung 100 Fotos mache, so brauche ich maximal 10 davon, bearbeite sie und stelle sie ins Internet – auf die eigene Webseite und/oder auf Facebook. Den Rest könnte ich eigentlich gleich löschen. Mache ich aber nicht, aufgrund des leisen Verdachtes, ich könnte das eine oder andere Foto doch noch brauchen. Passiert aber nie. Genau genommen sind 90 Prozent der Fotos schon Müll, während ich sie auf die Festplatte überspiele. Ein automatisches Ablaufdatum für solche Daten, wäre somit sinnvoll.

 

Dieses kleine Beispiel kann man sicher nicht linear hochrechnen auf die große Welt von Big Data, doch bin ich überzeugt, dass auch in den großen Betrieben und der weltweiten Datencloud mindestens 50 Prozent der Daten von den Urhebern nach einem Jahr nicht mehr genutzt werden.

 

Wenn ich das Urheberrecht in den Datenschutz einbringe, so müsste ein Urheber jederzeit das Recht haben zu entscheiden, was mit seinem Content passiert. De facto ist aber jede Publikation im Internet eine Enteignung – denn die Daten verselbstständigen sich im www und können nie wieder total gelöscht werden. Der Jurist Wolfgang Zankl verweist auf Artikel 5 DSGVO, wonach personenbezogene Daten – und dazu würde ich ich alle Einträge in sozialen Medien rechnen - nach „Treu und Glauben“ verarbeitet werden müssen. Es ist leicht vorherzusagen, dass diese schwammige Bestimmung nicht wirklich zum Datenschutz beitragen wird. Bleibt nur ein Ausweg: wer digitale Sicherheit will, muss sich davon befreien, alles zu posten, was ihm gerade durch den Kopf oder auf den A... geht.

 

Ergänzung 12.4.2017: "Rund sechs Milliarden Geräte sind laut Gartner-Erhebungen mit dem Internet verbunden. Schon 2020 sollen es 25 Milliarden sein, fünf Jahre später sogar 50 Milliarden. Mit den Geräten wachsen die Datenberge in den Unternehmen", schreibt Computerwoche.de in einem Artikel über den kalifornischen Datamining-Spezialisten Splunk.

 

Ergänzung 21.8.2107: Die COMPUTERWOCHE entmystifiziert 15 Mythen über die Künstliche Intelligenz

 

 

120 Parallelaktion