Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende Überarbeitung |
datenlebenszyklus [01.06.2022 10:26] – Jens-Peter Springmann | datenlebenszyklus [12.05.2023 08:03] (aktuell) – Jens-Peter Springmann |
---|
====== Datenlebenszyklus ====== | ====== Datenlebenszyklus ====== |
| |
| Bei Einhaltung der FAIR Prinzipien ergibt sich ein geschlossener Kreislauf der Datennutzung. Eine typische Möglichkeit dies darzustellen ist der Forschungsdatenlebenszyklus. Ausgehend von der Planung des Forschungsvorhabens werden alle wichtigen Schritte abgebildet, die die Daten bis zur Nachnutzung der veröffentlichten Daten durchlaufen. |
| |
{{:wiki:fdm_tuc.png?400|}} | {{:wiki:fdm_tuc.png?600|}} |
| |
| |
| Bei der **Planung** eines Forschungsvorhabens mit Hilfe eines [[Datenmanagementplan|Datenmanagmentplans]] werden die weiteren Phasen bereits mit gedacht und beschrieben. |
| |
| Die eigentliche Studie dient oft der **Erfassung und Dokumentation** der Daten. An dieser Stelle handelt es sich zumeist um Rohdaten, also Informationen, die aufgenommen, aber noch nicht **Auswahl und Analyse** unterlaufen sind. |
| |
| Kern eines durchdachten Datenmanagements ist die **Archivierung** von Daten. Das kann lokal oder in einem geeigneten Repositorium - einem Online-Datenarchiv mit beschreibenden Metadaten - geschehen. Ein frei zugängliches Repositorium (auch "Repo") für Daten aller Art ist [[https://zenodo.org/|Zenodo]]. |
| |
| <note important>Die Datenpublikation in nicht-kuratierten relativ unpspezifischen Repos birgt das Risiko einer weniger guten Auffindbarkeit der Daten. Geo- und Umweltwissenschaftliche Daten können beispielsweise kostenfrei in [[https://pangaea.de/|PANGAEA]] oder dem [[https://maps.bonares.de/mapapps/resources/apps/bonares/index.html?lang=en|BONARES Repositorium]] archiviert werden und erhalten eine spezifische DOI (Digial Object Identifier), welch jede Datenpublikation zweifelsfrei ausweist. Wichtige Schritte aus Sicht einer Datenkuration werden vom DCC (Digital Curation Centre) [[https://www.dcc.ac.uk/guidance/curation-lifecycle-model|hier]] beschrieben und dargestellt.</note> |
| |
| In einem Repo gehen **Archivierung** und **Publikation** oft einher. Um die angesprochene DOI zu erhalten müssen die Daten frei zugänglich sein. Über die Archivierung hinaus gibt es idealerweise noch eine Langzeit-Archivierung, bei der Daten und Formate an über Jahrzehnte oder gar Jahrhunderte nachnutzbar sind.((Markus, K., Parmaksiz, U., Svoboda, N., Schmidt, M.; Meier, K. 2021: Data for Generations - Keeping data reusable for really long periods of time. Workshop Folien, online auf https://zenodo.org/record/5786303, Zugriffsdatum 2022-06-09)) |
| |
| Der Datenlebenszyklus schließt sich durch eine Daten-**Nachnutzung**. Diese setzt voraus, dass die Daten auffindbar, qualitativ hochwertig und gut beschrieben sind. Die Daten werden von Nachnutzer:innen oft in Repos gefunden und können dann über ihre DOI zitiert werden. Eine gängige Lizenz dafür ist [[https://creativecommons.org/about/cclicenses/|CC-BY]], was bedeutet, dass Daten nachgenutzt aber die Person, welche die Daten ursprünglich erhoben hat, genannt werden muss. |
| |
| Ein zusätzlicher Schritt im Datenlebenszyklus ist ein phasenübergreifendes **Management**, zum Beispiel die nachvollziehbare Dokumentation von Änderungen im Datensatz ((Stobierski, Tim 2021: 8 Steps in the Data Life Cycle, online auf https://online.hbs.edu/blog/post/data-life-cycle, Zugriffsdatum 2022-06-09)). Als wichtiger Akteur wird auch **der Mensch** selbst gesehen, der idealerweise während das Datenlebenszyklus ein verantwortungsvolles Handeln beisteuert ((Wing, Jeanette M. 2018: The Data Life Cycle, online auf https://datascience.columbia.edu/news/2018/the-data-life-cycle/, Zugriffsdatum 2022-06-09)). Dazu zählt auch die Wahrung von datenschutzrechtlichen Bestimmungen, die beispielsweise die Anonymisierung von Daten mit einschließt. |
| |
| Der reibungslose Datenlebenszyklus profitiert von der Einhaltung der [[https://www.nist.gov/itl/ssd/information-systems-group/configurable-data-curation-system-cdcs/cdcs-help-and-resources-1|FAIR-Prinzipien]]. |