Die Herausforderung: wertvolle Daten finden
Die Digitalisierung bewirkt bereits heute eine gigantische Datenflut. Aktuell umfasst die digitale Welt schätzungsweise 4,4 Billionen Gigabyte an Daten - eine Zahl jenseits der Vorstellungskraft und doch nur ein Anfang. Bis 2020 - also innerhalb von nur fünf Jahren - soll sich das Datenvolumen auf 44 Billionen Gigabyte verzehnfachen. Doch längst nicht jede erfasste Information ist wirklich wertvoll. Nur ein kleiner Teil der gesammelten Daten lässt sich nutzbringend verwerten. Und mit der dynamisch wachsenden Datenflut wird der verwertbare Anteil tendenziell immer geringer.
Die Herausforderung besteht daher darin, aus dem gigantischen Datenmaterial die tatsächlich nützlichen Informationen herauszufiltern. Auch hier lässt sich eine Parallele zum Goldrausch früherer Zeiten feststellen. Ähnlich wie es damals darum ging, die in der Regel winzigen Goldpartikel aus der Masse an wertlosem Gestein, Geröll oder Kies herauszutrennen, ist es heute notwendig, die wertvollen Informationen gezielt aus dem riesigen Datenmüll zu identifizieren.
Neue Methoden der Analyse
Dazu sind neue Methoden und Verfahren erforderlich. Denn die wenigsten Daten liegen in strukturierter Form vor. Typische strukturierte Daten sind zum Beispiel Zahlen oder Adressen. Auf sie konzentrierte sich die Analyse in der Vergangenheit. Dabei wurde zwangsläufig ein großes Potential verwertbarer Informationen außer Acht gelassen - oder um es anders auszudrücken: der moderne Goldrausch vernachlässigte unnötigerweise einige ertragreiche Goldadern. Inzwischen ist man wesentlich weiter.
Heute ist es möglich, auch unstrukturierte Daten zu verarbeiten. So können Textdateien, Geopositionsdaten, Fotos oder Videos nutzbar gemacht werden. Diese neue Transparenz gefällt längst nicht jedem, der im Netz unterwegs ist. Spätestens seit Bekanntwerden der NSA-Aktivitäten ist mancher skeptisch geworden. Der gläserne Datenmensch ist ein Szenario, das längst nicht mehr utopisch erscheint. Es eröffnet nicht nur Chancen für eine kommerzielle Nutzung, die Anwendungsmöglichkeiten sind äußerst vielfältig - zum Nutzen und zum Schaden.
Die Bandbreite ist riesengroß. Sie reicht von der Medizin über die Energieversorgung bis zur Verkehrsoptimierung. Versicherungen denken beispielsweise aktuell darüber nach, Krankenversicherungs-Tarife auf der Basis übermittelter Gesundheitsdaten zu gestalten.
Ein unterschätztes Thema
Wer dem Goldrausch keinen Vorschub leisten will, hat dabei durchaus Möglichkeiten, seine Aktivitäten im Netz zu verbergen. Diese Option wird aber vergleichsweise selten genutzt - aus Unwissenheit, Sorglosigkeit oder Gedankenlosigkeit. Der Umgang mit der Datenflut ist ein wichtiges Thema, das vielfach unterschätzt wird.