Zurück

Was in der Daten-Goldmine passiert

Ines Balcik
17.03.2025

Auf dem Smartphone daddeln, in den Social Media abhängen, mal eben ein Video schauen oder das nächste Wochenende planen oder im Homeoffice arbeiten: Wir haben uns daran gewöhnt, das Internet selbstverständlich für alle Bereiche des Lebens zu verwenden. Damit wir die Dienste kostenlos nutzen können, nehmen wir Werbung in Kauf. Und vergessen darüber, dass wir einen hohen Preis dafür zahlen: Unsere Daten werden gesammelt und so aufbereitet, dass sie zur Goldmine werden.

„Oh, cool, beim Preisausschreiben lockt eine Reise in die Metropole, die ich schon immer sehen wollte.“ „Guck mal, da ist ein Psychotest, der dir super Tipps liefert. Abonnier den Newsletter, und wir sagen dir dein Ergebnis.“ „Nimm an der Umfrage teil, und du erfährst sofort, wie du reich, schön, und berühmt wirst.“ Nicht immer ist die Intention auf den ersten Blick zu erkennen. Geschickt werden menschliche Verhaltensweisen genutzt, um Daten zu sammeln.

Dahinter muss nicht zwangsläufig böse Absicht stecken oder kommerzielles Interesse. Daten werden auch für wissenschaftliche Zwecke oder aus sozialer Verantwortung gesammelt, aufbereitet und ausgewertet. Dass dabei der Schutz persönlicher Daten gewahrt sein muss, ist eine grundlegende Voraussetzung. Zumindest sollte das so sein. Aber setzen wir für diesen Blogbeitrag einmal voraus, dass alle Voraussetzungen für Datenschutz und Datensicherheit gegeben sind und alle Bestimmungen dazu eingehalten werden.

Was für Daten sind gefragt?

Daten, das ist zunächst einmal ein sehr abstrakter Begriff. Einige denken dabei vielleicht an das Passwort fürs Onlinebanking, das ausgespäht wird, um das Konto leerzuräumen. Aber Daten ganz unterschiedlicher Art können wertvoll sein, je nach dem Zweck, für den sie gesammelt werden.

Ganz allgemein sind Daten Informationen oder Fakten, die in verschiedenen Arten und Formen vorkommen und praktisch in allen Lebensbereichen zu finden sind. Daten sind also keine Erfindung des 21. Jahrhunderts, und gesammelt wurden sie schon, als Informationen noch hauptsächlich in Form gedruckter Medien weitergegeben wurden. Ein schönes Beispiel sind Telefonbücher: Darin wurden Telefonnummern gesammelt und den Namen ihrer Besitzer zugeordnet, fertig war eine Kontaktliste des vorigen Jahrhunderts.

Daten können also strukturiert sein wie Telefonnummern, E-Mail-Adressen, Namen und Wohnadressen. Während es dabei um Daten von Menschen geht, werden für Produktinformationen u. a. Daten zu Artikelnummer, Preis, Gewicht, Lagerbestand gesammelt. Heute schon auf den Wetterbericht geschaut? Auch dafür werden Daten benötigt: Temperatur, Luftfeuchtigkeit, Windgeschwindigkeit usw. usf. Schon diese wenigen Beispiele deuten an, dass Daten eigentlich überall eine Rolle spielen.

Dazu können weitere Daten aus Medien aller Art kommen, aus Texten, aus Bildern, aus Videos und Audiobeiträgen. Sammeln lassen sich medizinische Werte und Daten, geografische Daten, persönliche Daten. Es gibt wohl keine Daten, die nicht in irgendeinem Kontext eine Bedeutung haben können.

An dieser Stelle geht es nicht darum, wie diese Daten gesammelt werden. Zentraler ist in diesem Beitrag die Frage, warum diese Daten gesammelt werden, wo ihr Nutzen für uns Menschen liegt.

Daten für Menschen verständlich aufbereiten

Allen dürfte klar sein, dass in kurzer Zeit riesige Mengen an Daten gesammelt werden können. Und dann? Mit Zahlen- oder Buchstabenreihen allein ist nichts gewonnen. Damit ich weiß, ob ich zum Treffen im Park am nächsten Tag lieber die Regenjacke oder die Sonnenbrille mitnehmen soll, will ich weder endlose Zahlenfolgen durchforsten noch die Glaskugel befragen.

Es geht also um Datenqualität und darum, die gesammelten Daten so aufzubereiten, dass sie letztlich mir die gewünschte Information bereitstellen.

Datenbereinigung ist der erste Schritt zur Lesbarkeit. Ausreißer müssen identifiziert werden, Strategien werden entwickelt, um auch mit Dopplungen oder fehlenden Werten umgehen zu können.

Im nächsten Schritt geht es darum, Daten so zu vereinheitlichen, dass sie vergleichbar werden. Dazu müssen Zahlen in Standformate überführt werden und Messgrößen in bestimmte Einheiten konvertiert werden (um beim Wetterbeispiel zu bleiben: Ich möchte die Temperatur in Grad Celsius wissen und nicht in Fahrenheit).

Die Daten können dann visualisiert werden, damit Zusammenhänge auf einen Blick deutlich werden. Das kann mithilfe von Diagrammen geschehen, mit Farben, Formen und Beschriftungen. Noch anschaulicher sind interaktive Modelle, die es ermöglichen, die Daten nach eigenen Vorlieben zu filtern und bestimmte Detailinformationen sichtbar zu machen.

Genau diesem interaktiven Ansatz folgt unser Modell zum ÖPNV im Rhein-Main-Gebiet. Testen Sie selbst: https://prohive.balcik.tech/de/zur-plattform

Der interaktive Ansatz ist anschaulicher als ein starres Dokument mit statischen Tabellen.

Auf den Kontext kommt es an

Zahlen allein bieten noch keinen Mehrwert. Die Daten müssen ihre Geschichte erzählen, damit wir Menschen sie sinnvoll in Kontext einbetten und daraus Erkenntnisse ableiten können. Der interaktive Ansatz ermöglicht es, abstrakte Daten in einen verständlichen Zusammenhang zu bringen. Erst wenn wir einen logischen Aufbau erkennen, können wir Schlussfolgerungen erkennen und daraus Handlungsempfehlungen ableiten. Oder und zunächst überhaupt erst einmal eine Meinung bilden, die auf Informationen beruhen, deren Zusammenhänge wir erst durch die Aufbereitung der Daten erkennen können.

Wie die Aufbereitung der Daten im Einzelfall erfolgt, hängt unter anderem von der Zielgruppe ab. Fachleute brauchen andere Informationen als ein allgemeines Publikum, das verlässliche Informationen sucht, die verständlich aufbereitet und möglichst barrierefrei zugänglich sind.

Für die technische Seite der Aufbereitung gibt es zahlreiche komplexe Werkzeuge und Technologien, die die Umsetzung erleichtern. Das fängt bei Programmiersprachen an und reicht über Business Intelligence Tools (BI-Tools) über Spezialsoftware bis hin zu No-Code-Lösungen, die eine schnelle Darstellung ohne tiefgehende Programmierkenntnisse ermöglichen.

Dass wir das tatsächliche Vorgehen hier nur kurz streifen, darf nicht darüber hinwegtäuschen, wie wichtig die Datenaufbereitung ist: Erst durch eine sorgfältige Aufbereitung werden auch komplexe Datensätze für eine Zielgruppe zugänglich und verständlich. Das bildet die Grundlage für fundierte Entscheidungen.

Daten sichern und aktuell halten

Daten sammeln ist eine Sache, sie aktuell zu halten eine andere. Aktualisierungsprozesse müssen von Anfang an mitgedacht und implementiert werden. Back-up-Strategien sorgen für regelmäßige Sicherung und Kontinuität bei verschiedenen Versionen. Datenbankmanagement setzte effizientes Speichern und sinnvolle Zugriffsmethoden voraus. Datenintegrität sorgt für Konsistenz zwischen verschiedenen Systemen. Dokumentation sorgt dafür, dass Metadaten gepflegt und Änderungen nachvollziehbar gemacht werden.

Am anderen Ende der Datensammlungen kommt die Müllabfuhr. Damit Daten aktuell gehaltern werden können, muss auch ein Umgang mit dem Datenmüll gefunden werden. Wie mit veralteten oder nicht mehr relevanten Daten umgegangen wird, muss zunächst ebenso definiert werden wie der Zyklus der Datenerneuerung. Erst dann können die Daten bereinigt und bzw. archiviert werden. Das ist nötig im Sinn der Ressourceneffizienz: Speicher- und Rechenleistung werden optimiert, indem nur die jeweils relevanten Daten verarbeitet werden.

Last but not least: Auch bei Daten muss Nachhaltigkeit berücksichtigt werden. Umweltschutz macht nicht vor Datenauswertungen Halt.

Neueste Beiträge