Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
datenlebenszyklus [09.06.2022 14:07] Marcus Schmidtdatenlebenszyklus [12.05.2023 08:03] (aktuell) Jens-Peter Springmann
Zeile 1: Zeile 1:
 ====== Datenlebenszyklus ====== ====== Datenlebenszyklus ======
  
-Das Modell des **Datenlebenszyklus** (Data Life Cycle) beschreibt die Phasen, die Daten (zum Beispiel Datensätze, Datenbanken, Bilder, Text etc.) durchlaufen. Er ist als Kreis dargestellt, da Daten optimalerweise wiederverwendet werden können und - wenn gewünscht - dauerhaft erhalten bleiben.+Bei Einhaltung der FAIR Prinzipien ergibt sich ein geschlossener Kreislauf der Datennutzung. Eine typische Möglichkeit dies darzustellen ist der Forschungsdatenlebenszyklus. Ausgehend von der Planung des Forschungsvorhabens werden alle wichtigen Schritte abgebildetdie die Daten bis zur Nachnutzung der veröffentlichten Daten durchlaufen.
  
-{{:wiki:fdm_tuc.png?400|}}+{{:wiki:fdm_tuc.png?600|}}
  
  
 Bei der **Planung** eines Forschungsvorhabens mit Hilfe eines [[Datenmanagementplan|Datenmanagmentplans]] werden die weiteren Phasen bereits mit gedacht und beschrieben. Bei der **Planung** eines Forschungsvorhabens mit Hilfe eines [[Datenmanagementplan|Datenmanagmentplans]] werden die weiteren Phasen bereits mit gedacht und beschrieben.
  
-Die eigenltliche Studie dient oft der **Erfassung und Dokumentation** der Daten. An dieser Stelle handelt es sich zumeist um Rohdaten, also Informationen, die aufgenommen, aber noch nicht **Auswahl und Analyse** unterlaufen sind.+Die eigentliche Studie dient oft der **Erfassung und Dokumentation** der Daten. An dieser Stelle handelt es sich zumeist um Rohdaten, also Informationen, die aufgenommen, aber noch nicht **Auswahl und Analyse** unterlaufen sind.
  
 +Kern eines durchdachten Datenmanagements ist die **Archivierung** von Daten. Das kann lokal oder in einem geeigneten Repositorium - einem Online-Datenarchiv mit beschreibenden Metadaten - geschehen. Ein frei zugängliches Repositorium (auch "Repo") für Daten aller Art ist [[https://zenodo.org/|Zenodo]].
  
 +<note important>Die Datenpublikation in nicht-kuratierten relativ unpspezifischen Repos birgt das Risiko einer weniger guten Auffindbarkeit der Daten. Geo- und Umweltwissenschaftliche Daten können beispielsweise kostenfrei in [[https://pangaea.de/|PANGAEA]] oder dem [[https://maps.bonares.de/mapapps/resources/apps/bonares/index.html?lang=en|BONARES Repositorium]] archiviert werden und erhalten eine spezifische DOI (Digial Object Identifier), welch jede Datenpublikation zweifelsfrei ausweist. Wichtige Schritte aus Sicht einer Datenkuration werden vom DCC (Digital Curation Centre) [[https://www.dcc.ac.uk/guidance/curation-lifecycle-model|hier]] beschrieben und dargestellt.</note>
  
 +In einem Repo gehen **Archivierung** und **Publikation** oft einher. Um die angesprochene DOI zu erhalten müssen die Daten frei zugänglich sein. Über die Archivierung hinaus gibt es idealerweise noch eine Langzeit-Archivierung, bei der Daten und Formate an über Jahrzehnte oder gar Jahrhunderte nachnutzbar sind.((Markus, K., Parmaksiz, U., Svoboda, N., Schmidt, M.; Meier, K. 2021: Data for Generations - Keeping data reusable for really long periods of time. Workshop Folien, online auf https://zenodo.org/record/5786303, Zugriffsdatum 2022-06-09))
 +
 +Der Datenlebenszyklus schließt sich durch eine Daten-**Nachnutzung**. Diese setzt voraus, dass die Daten auffindbar, qualitativ hochwertig und gut beschrieben sind. Die Daten werden von Nachnutzer:innen oft in Repos gefunden und können dann über ihre DOI zitiert werden. Eine gängige Lizenz dafür ist [[https://creativecommons.org/about/cclicenses/|CC-BY]], was bedeutet, dass Daten nachgenutzt aber die Person, welche die Daten ursprünglich erhoben hat, genannt werden muss.
 +
 +Ein zusätzlicher Schritt im Datenlebenszyklus ist ein phasenübergreifendes **Management**, zum Beispiel die nachvollziehbare Dokumentation von Änderungen im Datensatz ((Stobierski, Tim 2021: 8 Steps in the Data Life Cycle, online auf https://online.hbs.edu/blog/post/data-life-cycle, Zugriffsdatum 2022-06-09)). Als wichtiger Akteur wird auch **der Mensch** selbst gesehen, der idealerweise während das Datenlebenszyklus ein verantwortungsvolles Handeln beisteuert ((Wing, Jeanette M. 2018: The Data Life Cycle, online auf https://datascience.columbia.edu/news/2018/the-data-life-cycle/, Zugriffsdatum 2022-06-09)). Dazu zählt auch die Wahrung von datenschutzrechtlichen Bestimmungen, die beispielsweise die Anonymisierung von Daten mit einschließt.
  
 Der reibungslose Datenlebenszyklus profitiert von der Einhaltung der [[https://www.nist.gov/itl/ssd/information-systems-group/configurable-data-curation-system-cdcs/cdcs-help-and-resources-1|FAIR-Prinzipien]]. Der reibungslose Datenlebenszyklus profitiert von der Einhaltung der [[https://www.nist.gov/itl/ssd/information-systems-group/configurable-data-curation-system-cdcs/cdcs-help-and-resources-1|FAIR-Prinzipien]].
datenlebenszyklus.1654776470.txt.gz · Zuletzt geändert: 09.06.2022 14:07 von Marcus Schmidt
Valid CSS Driven by DokuWiki Recent changes RSS feed Valid XHTML 1.0