Dark Data, die dunkle Seite von Big Data – Warum unser Datenmüll von morgen schon heute zum Problem wird

Dark Data oder auch Datenmüll

Big Data hat eine dunkle Seite namens „Dark Data“. Denn wer im Internet surft, produziert zwangsläufig Daten, die irgendwann zum Datenmüll werden und dennoch irgendwo gespeichert bleiben und somit unnötig Rechenleistung und Strom kosten. Der aktuelle Home-Office-Trend beschleunigt diese Entwicklung und führt zu einem immer größeren Berg an ungenutzten Daten, die sich immer schwieriger verwalten lassen. Die Gefahrenpotenziale von Dark Data – beispielsweise in Sachen Datenschutz und Hegemonie über Tiefseekabel – werden bisher noch massiv unterschätzt. Doch unser weltweiter Datenbedarf steigt unaufhörlich. Unser Datenmüll von morgen wird schon heute zum Problem werden, wenn wir nicht allmählich Innovationen, Kompetenzen und Regelwerke für das weltweite Datenmanagement auf den Weg bringen.

Von Ignoranz, „Datensümpfen“ und deren Konsequenzen

Im 21. Jahrhundert werden Daten gerne als das „neue Öl“ bezeichnet. Die Folge: Behörden, Privatnutzer und Unternehmen speichern und verbreiten massenhaft langfristig unbrauchbare Daten über Datenbänke, E-Mails und Kollaborationstools. Unbrauchbar sind diese grundsätzlich, wenn sie weitestgehend unstrukturiert sind. Laut einschlägigen IT-Foren, die sich unter anderem auf IBM- oder IDC-Angaben berufen, seien etwa 70 bis 90 % sämtlicher weltweit gespeicherten Daten in diesem Sinne unbrauchbar. Doch wird dieser als „Dark Data“ bekannte Datenmüll nicht einfach gelöscht, denn Cloud-Speicher ist relativ billig und viele Tiefseekabel mit Glasfaser-Technik vermögen noch den steigenden Datenfluss zu stemmen. Dies könnte sich jedoch in absehbarer Zukunft ändern. Da derzeit die halbe Welt im Home-Office sitzt, steigt auch der globale Datenaustausch unweigerlich. Laut dem Handelsblatt waren in Deutschland im Jahr 2020 die Stromkosten so hoch wie noch nie – auch wenn der landesweite Energieverbrauch vor allem durch den Industrie-Lockdown zunächst sank. Der Trend geht jedoch dahin, dass immer mehr Datenmüll immer mehr Strom verbrauchen wird, was wiederum zu einem höheren CO2-Ausstoß führt, sollte unser Strombedarf nicht ausreichend von Erneuerbaren Energien gedeckt werden. Doch ist das Problemfeld noch weitaus komplexer.

Big Data: Nahaufnahme Kabelsalat

Um es auf den Punkt zu bringen: Kostbar sind eigentlich nur strukturierte Daten, die beispielsweise per SQL in firmeneigenen „Datenseen“ angelegt werden, während unstrukturierte Daten langfristig unnütze „Datensümpfe“ produzieren. Dennoch verbreitet sich der Großteil der Daten im Internet immer noch ohne Systematik, weswegen Dark Data mittlerweile ein immenses Volumen umfasst und immer schwieriger zu verwalten ist. Ferner birgt dieser Datenmüll auch juristische Probleme in puncto DSGVO sowie geopolitische in Bezug auf Tiefseekabel. Denn die Welt wird immer mehr davon benötigen, um den Datenaustausch zwischen den Kontinenten zu gewährleisten. Das Verlegen solcher Kabel lockt wiederum Großkonzerne wie Facebook, Google oder Microsoft an, die durch den Besitz wichtiger Leitungen zunehmend zu Akteuren der Geopolitik avancieren, so ein aktueller SWR2-Podcast über „Das Geschäft mit Tiefseekabeln“. Die Gefahr: Budgetschwächere Akteure geraten immer mehr in ein Abhängigkeitsverhältnis. Daher wird es nun Zeit für ein neues Problembewusstsein, wozu auch neue Kompetenzen und neue Regelwerke in Sachen Kategorisierung, Speicherung und Löschung von alten Datenbeständen gehören. Doch die Zeit drängt: Laut Statista soll sich das weltweit generierte Datenvolumen bis zum Jahr 2025 auf 175 Zettabyte erhöhen, was – verglichen mit 2018 – mehr als das fünffache wäre.

Mit kompetentem Datenmanagement gegen alte Datenbestände

In den allermeisten digitalen „Daten-Friedhöfen“ lauern keine versteckten Schätze, sondern lediglich kostspieliger Datenmüll. Daher sollten wir uns allmählich von dem Irrglauben verabschieden, dass man unentwegt möglichst viele Daten sammeln müsse. Ansonsten wächst die Kluft zwischen analysierbaren und unbrauchbaren Daten beständig weiter. Die Digitalisierung konfrontiert die Menschheit folglich mit der komplexen Problemstellung, alte Datenbestände im Cyberraum immer wirksamer reduzieren zu müssen. Dies lässt sich wiederum mit digitalen Werkzeugen wie vor allem mithilfe Künstlicher Intelligenz am besten bewerkstelligen. So zum Beispiel lohnt es sich, bereits bei der Datenspeicherung intelligente Archivierungslösungen – wie KI-basierte Automatismen – zu verwenden, die Daten automatisch in Cluster kategorisieren, nachverfolgbar machen und nach einer Speicherfrist löschen. Der Haken: Diese Techniken müssen langfristig von kompetentem Fachpersonal unterstützt werden, welche die Daten noch produktiver analysieren und verwerten können. Gerade in Corona-Zeiten lohnt es sich daher, IT-Fachkräfte nachhaltig ans Unternehmen zu binden. Schließlich brauchen digital agierende Unternehmen starke IT-Verantwortliche, die ihnen helfen, ein konsistentes firmeneigenes Datenmanagement aufzubauen und nachhaltig zu kontrollieren.

Banner Resilienz Online-Seminar und Whitepaper

Um dem Problemfeld Dark Data wirksam Lösungen entgegenzusetzen, sind nicht nur die Wirtschaft, sondern auch die Staaten weltweit darauf angewiesen, ein verlässliches Regelwerk zur Datenspeicherung einzuführen. Ferner müssen Anreize gesetzt werden, um die globale Internetnutzerschaft zu einem nachhaltigeren Umgang mit Daten zu motivieren. Des Weiteren brauchen wir mehr disruptive Innovationen im digitalen Bereich und mehr Investitionen in Cloud-Architekten, um den zwangsläufig wachsenden Berg an Daten besser koordinieren zu können. Die deutsche Wirtschaftswelt ist indessen guter Dinge: Unter der Überschrift „Digital Social Innovation“ setzen sich immer mehr Unternehmen zum Ziel, digitale Lösungen auch für soziale Herausforderungen wie Bildungsgerechtigkeit und soziale Ungleichheit (Social Tech) zu entwickeln – ebenso für Nachhaltigkeitsthemen wie Klimawandel oder Ressourcenknappheit (Green Tech). Das Thema Dark Data wird jedoch im Laufe der Jahre eine steigende globale Relevanz erlangen, die vor allem nach internationalen Lösungsstrategien verlangen wird. Bis auf Weiteres werden es vor allem die Großkonzerne sein, die den Ausbau des weltweiten Tiefseekabelnetzes vorantreiben. Wollen wir hoffen, dass jene Konzerne nicht irgendwann die Spielregeln für unseren Datenaustausch ändern und damit zwangsläufig neue Fragen in Sachen Datenschutz und Netzneutralität aufwerfen.

Wir machen aus Talenten Experten.

Bildnachweise für diesen Beitrag:
218585284 © pickup – stock.adobe.com
255410153 © salita2010 – stock.adobe.com

Schreibe einen Kommentar