Daten im Zeitalter von Big Data

Bild: Pixabay, Lizenz: CC0

Daten sind Informationen und vieles mehr

Seit einiger Zeit sind Daten sehr viel mehr als nur binäre Informationen. Inzwischen werden auch Meinungen wie Likes, Standorte, Online-Wunschzettel und Einkaufslisten, das soziale Umfeld wie Familie und Freunde, der Beziehungsstatus, der in einem Sozialen Netzwerk angegeben wird, Stimmungen oder politische Einschätzungen, die man dort preisgibt, eigene Fotos und Videos und vieles mehr zu auswertbaren Daten. Hinzu kommen Verbindungsdaten des Smartphones samt gespeicherten Kontakten, Web-Protokolle aus einem Browser oder einer App, finanzielle Transaktionen, Sensordaten aus dem Auto, von Kleidungsstücken oder dem „intelligenten“ Kühlschrank und Gesundheitsdaten von Fitness-Apps oder Armbändern, die zum Beispiel den Blutdruck, die Herzfrequenz, die Körpertemperatur etc. überwachen.

 

Wir alle tragen zu einem steten Datenstrom bei, der zum Beispiel von Firmen wie Google oder Facebook, aber auch von Versicherungen, Banken, unserem Lieblingsrestaurant oder dem Lieblings-Online-Shop ausgewertet wird. Die digitalen Datenspuren, die wir hinterlassen, werden so vernetzt, zusammengefasst und ausgewertet, dass ein detailliertes Profil einer Person entsteht, das Einordnung und Bewertung und vor allem Prognosen für künftiges Verhalten erlaubt. Im Zeitalter von Big Data sprechen wir von kaum vorstellbaren Datenmengen, die vielfach in Zettabyte bemessen werden. Fachleute gehen davon aus, dass das weltweite Datenvolumen im Jahr 2020 über 100 Zettabyte erreicht haben wird, was einer Zahl mit 23 Nullen – also 100 000 000 000 000 000 000 000 Bytes – entspricht. [1]

 

Die schiere Menge ist es allerdings nicht alleine, was „Big Data“ ausmacht. Big Data bezeichnet vielmehr die Analyse von sehr großen Datenmengen (Volume), die in ungeheurer Vielfalt uneinheitlich und unstrukturiert vorliegen, das Ganze in rasender Geschwindigkeit (Velocity).  Big Data funktioniert nur mit komplexen Technologien und Methoden (v.a. Algorithmen) und hat – positiv formuliert - zum Ziel alle möglichen Prozesse effektiver und effizienter zu machen und letztlich Verbrauchern, Unternehmen und Behörden bei Entscheidungsfindungen aller Art zu helfen.

 

Kritiker wenden freilich ein, dass damit jeder Einzelne zum vollkommen gläsernen Menschen wird, der von Sensoren und Algorithmen überwacht, kontrolliert und in seinen Entscheidungen manipuliert und im schlimmsten Fall aufgrund von datengestützten Verhaltensanalysen ausgegrenzt und diskriminiert wird.

 

Es ist noch gar nicht so lange her, dass Daten noch analog auf Papier, Karteikarten, Film oder Tonband zusammengetragen wurden. Diese Form der Datenverarbeitung führte etwa zu Datensammlungen wie den heute zugänglichen Regalmetern von Stasi-Akten in der Behörde des Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes der ehemaligen DDR. Es bedurfte vieler Personen, um diese Daten zu sichten, zu ordnen und zu kategorisieren.  Eine Aufgabe, die heute längst Maschinen und Algorithmen übernommen haben.

 

Dem analogen Datensammeln folgte das Zeitalter der elektronischen Datenverarbeitung. Erheben, Speichern und Abgleichen von Daten funktioniert maschinengestützt und automatisiert. Alle Daten sind in Binärcode übersetzt und damit digital. Dass sich diese Epoche grundsätzlich vom ersten Datenzeitalter unterscheidet, macht u.a. die Begründung des Volkszählungsurteils deutlich, die das Recht auf informationelle Selbstbestimmung des Bürgers durch EDV gefährdet sah, „weil bei Entscheidungsprozessen nicht mehr wie früher auf manuell zusammengetragene Karteien oder Akten zurück gegriffen werden muss, [sondern] vielmehr heute mit Hilfe der automatischen Datenverarbeitung Einzelangaben über persönliche und sachliche Verhältnisse einer bestimmten oder bestimmbaren Person (personenbezogene Daten) technisch gesehen unbegrenzt speicherbar und jederzeit ohne Rücksicht auf Entfernungen in Sekundenschnelle abrufbar sind.“ [2] Beispiele für diese Form der elektronischen Datenverarbeitung sind Melde- oder das Verkehrszentralregister des Kraftfahrtbundesamtes, auf die z.B. die Polizei zugreifen kann.

Daten sind Wissensquellen

Das ist immer dann der Fall, wenn die Informationen aus den Daten entsprechend verknüpft, aufbereitet und interpretiert werden. Das kann in den unterschiedlichsten Bereichen und sowohl auf persönlicher als auch auf globaler Ebene geschehen:

 

Im privaten Bereich beobachten z.B. Anhänger der so genannten Quantified-Self-Bewegung ihre Gesundheit über Sensoren wie Blutdruckmesser oder Smartphone-Apps, die Schritte oder Bewegungen im Schlaf wahrnehmen. Damit versuchen sie, ihren Körper mit Hilfe von Daten besser zu verstehen und gesund zu halten. In größerem Maßstab hat die Datenanalyse der Häufigkeit von Google-Suchanfragen nach verschiedenen Symptomen dazu gedient, um eine Grippewelle vorher zu sagen. Die Veröffentlichung dieser Datenanalysen wurde allerdings inzwischen eingestellt. [3]

 

In Unternehmen helfen Daten, Geschäftsprozesse zu optimieren. Automatische Bestellsys-teme wissen, wenn der Warenvorrat zu Neige geht und bestellen nach; Waren werden über RFID-Chips und QR-Codes identifizierbar und lassen sich von der Produktionsstätte bis zum Kunden verfolgen.

 

In der Wissenschaft sammelt und nützt man Daten nicht nur zur Beobachtung von Phänomenen wie dem Klimawandel, sondern erstellt auf ihrer Grundlage komplexe Simulationen, die wiederum zu Handlungsempfehlungen für die Politik werden können.

 

Das wahrscheinlich technisch ausgefeilteste Anwendungsgebiet für Wissen aus Daten ist ihr Einsatz für die Verbrechensbekämpfung. Bilder von Überwachungskameras werden mit biometrischen Passdaten abgeglichen oder verdächtige Kontobewegungen gemeldet. Ein mutmaßlicher Täter, der über Jahre hinweg auf LKWs geschossen haben soll, wurde z.B. identifiziert, indem man systematisch Kfz-Kennzeichen erfasste und mit Standort-Daten seines Handys verknüpfte. [4]

 

Mehr dazu unter Warum Datenschutz?

Daten sind eine Geldquelle

Sie können direkt verkauft werden, wie z.B. die Kopien von Patientenrezepten, die den Apotheken 1,5 Cent pro Stück bringen sollen. [5] Noch lukrativer ist es aber, das aus Daten gewonnene Wissen zu verkaufen. Das wird am Beispiel des US-Unternehmens Google deutlich. Mit seiner Suchmaschine ist es nicht nur für die meisten Internetnutzer das Tor zum Internet. Durch die Nutzung seiner Dienste (v.a. YouTube) wird ein Großteil des weltweiten Datenaufkommens verursacht. Google kann durch die Vielfalt seiner Angebote Unmengen an protokollierten Daten zu Wissen verknüpfen, das sich zu Geld machen lässt. Laut statista.com erwirtschaftete das Unternehmen seinen Nettogewinn von etwa 14,4 Milliarden Euro im Jahr 2014 zum Großteil (90 Prozent) durch den Verkauf von Werbung. [6] Und auch Facebook macht 80 Prozent seines Umsatzes mit Werbung. [7]

 

Das Besondere daran ist, dass die Werbung durch die Daten, die Google oder Facebook von ihren Nutzern besitzen, kontextspezifisch und zielgruppengenau angezeigt werden kann. So werden die Kommunikationsinhalte von über G-Mail verschickten E-Mails nach Schlagwörtern durchsucht, woraufhin dem Nutzer entsprechende Werbung angezeigt wird. Facebook kann die Nutzer nach den in ihren Profilen angegebenen Interessen kategorisieren und sich auf das Freundesnetzwerk beziehen. Kunden- und Nutzerprofile, die aus kombinierten Daten über Surf- und Einkaufsverhalten, Standort oder das verwendete Gerät erstellt werden, sollen in Zukunft Konsumwünsche nicht nur besser vorher sagen können, sie sollen auch den Preis bestimmen, den ein Kunde zu zahlen bereit ist. [8]

 

Auch in deutschen Firmenkreisen erkennt man inzwischen die Möglichkeiten, die Big Data bereithält:

 

„In der digitalen Welt treten Daten als vierter Produktionsfaktor neben Kapital, Arbeitskraft und Rohstoffe“, schreibt etwa der Branchenverband Bitkom in seinem Leitfaden Big Data im Praxiseinsatz und hebt lobend hervor: „Big Data stellt Konzepte, Methoden, Technologien, IT-Architekturen sowie Tools zur Verfügung, um die geradezu exponentiell steigenden Volumina vielfältiger Informationen in besser fundierte und zeitnahe Management-Entscheidungen umzusetzen und so die Onnovations- und Wettbewerbsfähigkeit von Unternehmen zu verbessern.“ [9]

 

Durch Daten lässt sich aber ebenso Geld einsparen: Der EU wird durch den Einsatz von Big Data eine Effizienzsteigerung im Wert von 100 Mrd. Euro prognostiziert. [10]

Daten bedeuten Macht

Mit ihrem Wissen über ihre Nutzer versprechen Google, Facebook und andere Unternehmen, ihre Angebote zu verbessern, indem sie sie immer genauer personalisieren. Gleichzeitig üben sie damit eine Form von Zensur aus, denn ihre Algorithmen bestimmen, welche Informationen die Internetnutzer überhaupt noch erhalten. Webseiten, die Googles Page-Rank nicht auf den vorderen Suchplätzen platziert, werden von den Nuterinnen und Nutzern in der Regel nicht wahrgenommen. Facebooks Edgerank-Algorithmus sortiert auf Grundlage des Kommunikationsverhaltens Posts von Freunden aus, mit denen ein User wenig interagiert. [11] Dadurch reduziert sich zwar die Informationsfülle, aber dem Nutzer wird die Möglichkeit genommen, selbst zu entscheiden, was oder wer für ihn wichtig ist.

 

Dass Daten Diskriminierung oder sogar Vorverurteilung ermöglichen, erleben Personen, die auf der so genannten No Fly List der USA landen, weil sie aufgrund ihres Namen oder Reiseverhaltens (terror-)verdächtig sind. [12] Meist wissen die Leute nicht einmal, warum ihr Name auf der Liste steht. Das Problem: Aus einer rein statistischen Übereinstimmung wird automatisch ein kausaler Zusammenhang abgeleitet, der nicht immer automatisch richtig ist. Daten über die eigene Ernährung oder den Blutdruck können Menschen helfen, gesund zu bleiben; genauso könnten sie von Krankenkassen benutzt werden, um Erfolgschancen teurer Operationen zu bestimmen oder auch, um solch eine Operation einem den reinen Daten nach hoffnungslosen Fall vorzuenthalten.

 

Dazu kommen Gefahren durch Kriminalität: Einmal erhobene Daten können – besonders, wenn sie veröffentlicht sind oder gestohlen werden – zweckentfremdet und missbraucht werden, angefangen von Kontoinformationen bis hin zum Fingerabdruck. Geschieht hier ein „Datenklau“, kann es passieren, dass die persönlichen Daten ein Eigenleben entwickeln, das nur schwer zu durchschauen oder rückgängig zu machen ist.

 

Mehr dazu unter Warum Datenschutz?

Quellen

[1] Bitkom (Hrsg.): Big Data im Praxiseinsatz – Szenarien, Beispiele, Effekte. Berlin 2012, S. 12. [zurück]

[2] Die Bundesbeauftragte für den Datenschutz und die Informationsfreiheit (Hrsg.): Info 1: Bundesdatenschutzgesetz. Text und Erläuterung. Bonn 2014, S. 182. [zurück]

[3] Google Flu Trends. [23.09.2015] [zurück]

[4] Rokahr, Lisa: Wie das BKA den Sniper überführte. Stern. 01.07.2013. [23.09.2015] [zurück]

[5] Google sahnt vor allem bei Online-Werbung ab. Wirtschaftswoche. 23.01.2013. [23.09.2015] [zurück]

[6] Nettogewinn von Google in den Jahren von 2001 bis 2014 (in Millionen US-Dollar). Statista. [23.09.2015] [zurück]

[7] Scherer, Katja: Gezielter Wahnsinn. Facebook will Anzeigen persönlicher machen. Gelingt das auch? Ein Erfahrungsbericht. Zeit Online. 28.11.2013. [23.09.2015] [zurück]

[8] Jüngling, Thomas: Der Gläserne Kunde. In: Die Welt. 07.07.2013. [23.09.2015] [zurück]

[9] Bitkom (Hrsg.): Big Data im Praxiseinsatz – Szenarien, Beispiele, Effekte. Berlin 2012, S. 7. [zurück]

[10] Heuer, Steffan: Digitalkompakt LfM 06 - Kleine Daten, große Wirkung. Big Data einfach auf den Punkt gebracht. Düsseldorf 2013, S. 29. [zurück]

[11] Budde, Lars: Facebook EdgeRank: So funktioniniert der Algorithmus im Detail [Infografik]. t3n. 18.04.2013. [23.09.2015] [zurück]

[12] No Fly List. Wikipedia. [23.09.2014] [zurück]

Links

SESAM-Themenbank Datenschutz und Privatsphäre im Netz
In dieser Themenbank aus dem LMZ-Projekt Medien – aber sicher! gibt es zahlreiche Arbeitsmaterialien und didaktisch-methodische Anregungen.

Pädagogische Praxis

Dienstliche Nutzung von WhatsApp – nicht für Lehrkräfte

Viele Lehrkräfte nutzen WhatsApp als Kommunikations- und Austauschmöglichkeit mit ihren Schülerinnen und Schülern – was laut Kultusministerium verboten ist. Wie die Stuttgarter Zeitung am 8. Januar 2018 berichtet, nehmen die Beschwerden von Eltern, die sich um den Datenschutz ihrer Kinder sorgen,...weiterlesen

Neuerscheinungen der Aktion Jugendschutz

Im Mai neu erschienen: die Arbeitshilfe zur medienpädagogischen Arbeit mit Familien und Band 5 der Schriftenreihe Medienkompetenz „Grundrechte im digitalen Raum – Ein Thema für den Jugendschutz“ der Aktion Jugendschutz.weiterlesen

Unterrichtsmodul: Selbstdarstellung und Datenschutz im Internet

Deutsch/fachunabhängig, Klasse 8, GY/WRS/RS: Jugendliche geben in Sozialen Netzwerken viel von sich preis. Dieses Unterrichtsmodul behandelt die Frage, wie sich Jugendliche präsentieren und zugleich hinreichend schützen können.weiterlesen

Weitere Anregungen für die pädagogische Praxis