Dies ist eine alte Version des Dokuments!
Das Modell des Datenlebenszyklus (Data Life Cycle) beschreibt die Phasen, die Daten (zum Beispiel Datensätze, Datenbanken, Bilder, Text etc.) durchlaufen. Er ist als Kreis dargestellt, da Daten optimalerweise wiederverwendet werden können und - wenn gewünscht - dauerhaft erhalten bleiben.
Bei der Planung eines Forschungsvorhabens mit Hilfe eines Datenmanagmentplans werden die weiteren Phasen bereits mit gedacht und beschrieben.
Die eigentliche Studie dient oft der Erfassung und Dokumentation der Daten. An dieser Stelle handelt es sich zumeist um Rohdaten, also Informationen, die aufgenommen, aber noch nicht Auswahl und Analyse unterlaufen sind.
Kern eines durchdachten Datenmanagements ist die Archivierung von Daten. Das kann lokal oder in einem geeigneten Repositorium - einem Online-Datenarchiv mit beschreibenden Metadaten - geschehen. Ein frei zugängliches Repositorium (auch „Repo“) für Daten aller Art ist Zenodo.
In einem Repo gehen Archivierung und Publikation oft einher. Um die angesprochene DOI zu erhalten müssen die Daten frei zugänglich sein. Über die Archivierung hinaus gibt es idealerweise noch eine Langzeit-Archivierung, bei der Daten und Formate an über Jahrzehnte oder gar Jahrhunderte nachnutzbar sind.1)
Der Datenlebenszyklus schließt sich durch eine Daten-Nachnutzung. Diese setzt voraus, dass die Daten auffindbar, qualitativ hochwertig und gut beschrieben sind. Die Daten werden von Nachnutzer:innen oft in Repos gefunden und können dann über ihre DOI zitiert werden. Eine gängige Lizenz dafür ist CC-BY, was bedeutet, dass Daten nachgenutzt aber die Person, welche die Daten ursprünglich erhoben hat, genannt werden muss.
Ein zusätzlicher Schritte im Datenlebenszyklus sind ein phasenübergreifendes Management, zum Beispiel die nachvollziehbare Dokumentation von Änderungen im Datensatz 2). Als wichtiger Akteur wird auch der Mensch selbst gesehen, der idealerweise während das Datenlebenszyklus ein verantwortungsvolles Handeln beisteuert 3). Dazu zählt auch die Wahrung von datenschutzrechtlichen Bestimmungen, die beispielsweise die Anonymisierung von Daten mit einschließt.
Der reibungslose Datenlebenszyklus profitiert von der Einhaltung der FAIR-Prinzipien.