Datenschutz Verstehen – Big Data und der Datenschutz
Kurze Einleitung
Heutzutage ist Big Data ein weit verbreiteter Begriff. Doch was bedeutet er eigentlich? Im Bereich von Big Data geht es verallgemeinert um große Datenmengen. Um die Daten entsprechend zu verwerten, werden Data-Analyse-Methoden eingesetzt, welche eine große Herausforderung für den Datenschutz und dessen Einhaltung darstellen. Das Datenvolumen ist in den letzten Jahren kontinuierlich gewachsen und hat immer neue Möglichkeiten eröffnet. Daher wird Big Data immer wichtiger für Unternehmen, um wettbewerbsfähig zu bleiben und auf dem Markt zu agieren. Aufgrund dieser Relevanz möchten wir in diesem Beitrag die Funktionsweise sowie den Umgang mit Big Data näher beleuchten.
Big Data Definition
Der Begriff Big Data definiert sich wie folgt: Gemeint sind Daten, die in großer Vielfalt, Menge und hoher Geschwindigkeit anfallen. Big Data besteht aus den 5V-Begriffen (Variety, Volume, Velocity, Veracity, Value). Big Data umfasst hierbei insbesondere große und komplexe Datensätze, die im Zuge einer normalen Datenverarbeitungssoftware nicht ausgewertet werden können. Für dieses Problem werden allerdings vielfach Lösungen gesucht und auch gefunden, z.B. im Bereich von Internetdaten oder Mobilfunk, der Finanzindustrie sowie Energiewirtschaft und vielen weiteren. Der Bereich rund um Big Data ist sehr schnelllebig und somit häufig von Neuerungen betroffen.
5V von Big Data
Big Data wird oftmals mit Hilfe der 5V Merkmale näher bestimmt. Die 5Vs stammen von dem Autor von Infonomics und Data Juice Douglas Laney. Zunächst galten nur 3 V, welche jedoch Erweiterung fanden.
Volume (Masse)
Das Merkmal Volume beschreibt, dass Big Data aus vielen Quellen stammt. Somit entsteht insgesamt eine große Menge an Daten. Diese große Masse an Daten ist unstrukturiert und weist eine geringe Dichte auf. Auch sind z. B. Daten mit unbekannten Werten ebenfalls enthalten. Insgesamt werden mehrere Terabytes an Daten bis hunderte von Petabytes umfasst.
Velocity (Geschwindigkeit)
Das Merkmal Velocity beschreibt die Schnelligkeitsrate, mit welcher Daten erzeugt oder geändert werden. Diese war früher vergleichsweise gering. Mit den erneuerten Technologien geschieht dies mittlerweile vielfach in Echtzeit oder zumindest fast in Echtzeit.
Variety (Vielfalt)
Mit dem Merkmal Variety werden die verschiedenen Datentypen angesprochen. Es sind unstrukturierte Datentypen in Form von z.B. Text, Audio und Video gemeint. Aufgrund der fehlenden Strukturierung ist eine Vorabverarbeitung für die Auswertung der Daten notwendig.
Veracity (Wahrhaftigkeit)
Beim Merkmal der Veracity geht es um die Herkunft und die Qualität der Daten. Daten, die aus unzuverlässiger Quelle stammen oder deren Qualität unklar ist, können nicht verwendet oder müssen aufbereitet werden. Daher ist die Veracity ein sehr wichtiges Merkmal von Big Data.
Value (Wert)
Das Merkmal Value beschreibt den Mehrwert, den Big Data insbesondere für Unternehmen in Form von Business Value hat. Dieser wird erzeugt durch die erheblichen Datenmengen und das dadurch erreichte Machine Learning.
Big Data Vorteile
Big Data bietet eine Reihe von Vorteilen, welche an dieser Stelle näher erläutert werden. Einerseits können große Datenmengen gesammelt und dementsprechend analysiert werden. Für den E-Commerce ist dies von großem Vorteil. Zum Beispiel werden hierdurch Preisintelligenztools eingesetzt, welche die Preise aufgrund von Marktveränderungen automatisch anpassen. Dies wird von Amazon und Netflix bereits vielfach eingesetzt. Dementsprechend können Marktveränderungen anhand von Analysen auch bereits vor Eintritt antizipiert werden. Außerdem wird ein Echtzeit-Feedback erhalten. Die Unternehmen erhalten schnelles Feedback von umgesetzten Maßnahmen. Zudem ist eine effizientere Lagerbestandsverwaltung bzw. Versand möglich, da analysiert werden kann, was wann am meisten verkauft wird. Darüber hinaus können die schnellsten LKW Routen analysiert werden. Da mehr Informationen über jegliche Art von Abläufen innerhalb und außerhalb des Unternehmens vorhanden sind, kann es zu Produktivitätssteigerungen und somit einer Kosteneinsparung der Unternehmen kommen. Weiterhin kann die Kundenzufriedenheit durch bessere, personalisierte Produkte steigen. Dies sei anhand des Beispiels von Netflix bzw. Amazon-Produkten erläutert. Bei Netflix werden anhand der gesammelten Informationen der Nutzer Filme und Serien vorgeschlagen, die dem User gefallen könnten. Gleiches gilt bei Amazon in Bezug auf Produkte (aus Informationen über vorherige Klicks und Käufe). Hierdurch wird die Conversion Rate erhöht, die Kundenloyalität steigt und es können besser angepasste Marketingkampagnen bei den Nutzern platziert werden. Die Kunden sind gezielter ansprechbar und es ist eine Segmentierung von Kunden bzw. Kundengruppen möglich. Diese und weitere Informationen können auch aus Social Media gewonnen werden. Es können beispielsweise versteckte Muster und Zusammenhänge von Daten erkannt und dadurch Trends vorausgesagt oder erkannt werden. Ein weiterer Vorteil ist die Verbesserung der Transparenz für Kunden von Unternehmen und bei Behörden, da mit der Datenanalyse Korruption aufgedeckt werden kann.
Big Data Nachteile
Ein Nachteil von Big Data ist eindeutig der Eingriff in Privatdaten. Es werden Personendaten analysiert und somit Gewohnheiten und Charakterzüge von Menschen aufgedeckt. Dies birgt besonders im Hinblick auf die vielen vertraulichen Daten ein hohes Risiko für die betroffenen Personen. Durch die Nachvollziehbarkeit von Suchverläufen geht die Anonymität des Internets für die Nutzer verloren. Außerdem gestaltet sich die Umsetzung des Datenschutzes extrem schwierig. Da Daten, wie bereits erwähnt, in der heutigen Zeit aufgrund der vielfältigen Analysemöglichkeiten und weiterer Funktionswerte einen hohen Wert haben, sind sie anfälliger für Hackerangriffe. Zudem birgt die Masse an Daten ein hohes Maß an Unübersichtlichkeit. Aufgrund der vielen Daten besteht die Möglichkeit, falsche Zusammenhänge zu erkennen oder gar keine zu sehen. Darauf folgen falsche Schlussfolgerungen und es werden falsche Maßnahmen getroffen. Ein weiterer Nachteil ist die Verdrängung von kleinen Unternehmen. Diese haben aufgrund mangelnder Ressourcen nicht die Möglichkeit, sich die Daten oder die Software zur Auswertung zu beschaffen und können demnach im Wettbewerb mit großen Unternehmen nicht standhalten. Beim Outsourcing der Datenerfassung und -auswertung ist die Einhaltung des Datenschutzes besonders wichtig, da oftmals Zugriff auf sensible Daten besteht. Es entstehen zudem hohe Stromkosten und Kosten für die Speicherung der Unternehmen. Darüber hinaus erhöht sich der CO2 Ausstoß durch die benötigten Ressourcen zur Speicherung und Auswertung.
Wer nutzt Big Data?
Big Data wird heutzutage vielseitig eingesetzt und ist in den verschiedensten Branchen etabliert. Besonders bei Telekommunikations- und Gesundheitsunternehmen, Finanzdienstleistern und in der Wissenschaft kann von Big Data profitiert werden. Suchmaschinen, wie Google, aber auch Amazon und Netflix nutzen vielfach Big Data.
Big Data und Datenschutz
Besonders wichtig ist im Big Data Bereich, dass der Datenschutz beachtet wird. Bei einer solchen Menge an Daten ist die Einhaltung des Datenschutzes ein essenzieller Bestandteil. Gerade die Verarbeitung einer solchen Masse an Daten ist bedenklich. Hierbei muss stets die Zweckbindung beachtet werden, welche bei einer großen Menge an Daten regelmäßig als kritisch zu betrachten ist. Es muss außerdem eine genaue Dokumentation in Form eines Verarbeitungsverzeichnisses erfolgen. Dadurch, dass personenbezogene Daten ebenfalls enthalten sind, ergeben sich aus den gesammelten Daten Zusammenhänge, welche sonst nicht unbedingt erkannt würden. Es besteht ein sensibler Konflikt zwischen Big Data und den Grundsätzen des Datenschutzes (Datenminimierung, Datensparsamkeit). Das Verbot mit Erlaubnisvorbehalt aus der DSGVO zur Verarbeitung von Daten gilt auch bei großen Datenmengen. Big Data wird zwar nicht explizit erwähnt, allerdings gibt es die Vorgaben für die Verarbeitung großer Datenmengen in automatisierter Form. Das sogenannte “Profiling” ist gem. Art. 4 Nr. 4 DSGVO jede Art der automatisierten Verarbeitung personenbezogener Daten, die darin besteht, dass diese personenbezogenen Daten verwendet werden, um bestimmte persönliche Aspekte, die sich auf eine natürliche Person beziehen, zu bewerten, insbesondere um Aspekte bezüglich Arbeitsleistung, wirtschaftliche Lage, Gesundheit, persönliche Vorlieben, Interessen, Zuverlässigkeit, Verhalten, Aufenthaltsort oder Ortswechsel dieser natürlichen Person zu analysieren oder vorherzusagen. Nach Art. 22 DSGVO hat die betroffene Person das Recht, nicht aufgrund einer automatisierten Entscheidungsfindung unterworfen zu werden, wenn diese Entscheidung ihr gegenüber rechtliche Wirkung entfaltet oder sie auf andere Weise erheblich beeinträchtigt. Gem. Art. 13 Abs. 2 lit. f) und Art. 14 Abs. 2 lit. g) DSGVO besteht über den Einsatz von Profiling außerdem eine Informationspflicht an den Betroffenen für den Verantwortlichen. Im Falle des Einsatzes von Profiling ist gem. Art. 35 Abs. 3 lit. a) DSGVO eine Risikoanalyse (Datenschutzfolgenabschätzung) durchzuführen. Hierzu ist gem. Art. 35 Abs. 2 DSGVO der Rat des Datenschutzbeauftragten einzuholen. Ansonsten sind hohe Strafen für den Verantwortlichen möglich.
Zukunft von Big Data
Auch in Zukunft werden Daten immer wertvoller für Unternehmen, da diese ihnen Wettbewerbsvorteile gegenüber den Mitbewerbern sichern. Durch das Sammeln und Analysieren wird es einfacher, Ziele des Unternehmens zu erfüllen. In Zukunft werden diese Auswirkungen wohl noch wichtiger und größer. Beispiele und Statistiken zu bereits eingesetzter Technologie und Statistiken rund um Big Data finden Sie hier:
https://www.scnsoft.de/blog/big-data-statistiken-und-beispiele
Fazit
Big Data hat für Unternehmen viele Vorteile, birgt aber auch hohe Risiken, besonders im Bereich des Datenschutzes. Der Datenschutz spielt hierbei eine wichtige Rolle, da die Konsumenten vor dem ausufernden und intransparenten Sammeln ihrer Daten und Präferenzen geschützt werden müssen.
Herr Nils Möllers ist Gründer und Geschäftsführer der Keyed GmbH. Als Experte für Datenschutz in Konzernen, Unternehmensgruppen und Franchise-Systemen, ist Herr Möllers ebenfalls als zertifizierter Datenschutzbeauftragter tätig. Ergänzend zur datenschutzrechtlichen Expertise ist Herr Möllers im Bereich der IT-Sicherheit, begleitend zur ISO27001 und TISAX-Assessments, beratend tätig.