Sichern und Publizieren von Forschungsdaten


Speicherung und Langzeitarchivierung

Um Forschungsdaten zu sichern, müssen sie an einer geeigneten Stelle abgespeichert werden. Zu unterscheiden sind dabei die Sicherung der Daten für den Zeitraum eines Forschungsvorhabens und eine langfristige Archivierung der Daten.

Für die dauerhafte Archivierung gibt es diverse Repositorien. Einige sind dabei mit mit virtuellen Forschungsumgebungen verknüpft, andere existieren unabhängig und speichern extern erzeugte Daten. Für romanistische Forschungsdaten eignen sich unter anderem die nachfolgenden Repositorien:

Die Speicherung spezifisch bildungswissenschaftlicher Forschungsdaten ist über den Verbund Forschungsdaten Bildung möglich.

Ein umfassendes Verzeichnis von Systemen zur Archivierung von Forschungsdaten aus unterschiedlichen Nationen und Disziplinen finden Sie unter re3data.

Bei der Langzeitarchivierung sind verschiedene Ebenen zu unterscheiden. Grundlegende Voraussetzung ist die Bitstream Preservation. Sie gewährleistet auch bei Technologiewechsel die Unveränderlichkeit der Reihenfolge von Bits, den Einsen und Nullen, aus denen die Daten bestehen, und garantiert damit den Erhalt der Daten auch über lange Zeiträume hinweg.

Darüber hinaus muss eine technische Nachnutzbarkeit gegeben sein: Auch wenn die Umgebung veraltet, mit denen die Daten ursprünglich erzeugt und analysiert wurden, müssen die Daten mit neuerer Technologie weiterhin wiedergegeben werden können. Eventuell selbst entwickelte Tools und Oberflächen sollten nach Projektende möglichst zur Verfügung gestellt und gepflegt werden. Deren langfristige Wartung wird von Repositorien allerdings nicht angeboten, sondern muss selbst oder mit der Hilfe eines Datenzentrums geleistet werden. Bei der Entwicklung eigener Forschungsumgebungen oder Tools empfiehlt es sich, bereits frühzeitig die Möglichkeiten einer langfristigen Nutzbarkeit der Instrumente zu bedenken.

Um die Nachvollziehbarkeit der Daten zu gewährleisten, sollte in den Metadaten zudem immer angegeben werden, mit welchen Tools sie erstellt bzw. analysiert wurden. Weitere Informationen für die Voraussetzung der langfristigen Speicherung von Forschungsdaten finden Sie beim Humanities Data Center und auf der Plattform forschungsdaten.info.

Nach oben

Persistene Identifikatoren

Um die Nachweissituation der eigenen Forschungsdaten zu verbessern, ist eine dauerhafte Adressierbarkeit der Daten von zentraler Bedeutung. Herkömmliche Hyperlinks im Internet (URLs) sind für diesen Zweck ungeeignet, da diese nach technischen Anpassungen oder Serverumzügen in der Regel nicht mehr funktionieren. Zur Vermeidung dieses Problems empfiehlt sich die Verwendung von sogenannten Persistenten Identifikatoren.

Persistente Identifikatoren verweisen auf einen von einer nationalen oder internationalen Organisation verwalteten und gepflegten Verzeichnisdienst (einen sogenannten „Resolver“), der Nutzerinnen und Nutzer zum aktuellen Sicherungsort der Daten weiterleitet. Auf diese Weise kann eine dauerhafte Erreichbarkeit und Zitierbarkeit von Forschungsdaten gewährleistet werden, unabhängig von Veränderungen des Standorts des Servers oder von dessen Dateistruktur.

Häufig genutzte Systeme für Persistente Identifikatoren sind:

  • Digital Object Identifier (DOI): Vergabe unter anderem über die Technische Informationsbibliothek Hannover und die Niedersächsische Staats- und Universitätsbibliothek Göttingen
  • Uniform Resource Name (URN): Vergabe über die Deutsche Nationalbibliothek
  • Handle: Vergabe über die „Corporation for National Research Initiatives (CNRI)“

Manche Repositorien, wie z. B. das DARIAH-DE Repository oder Zenodo, vergeben automatisch einen Persistenten Identifikator für gespeicherte Datensätze.

Nach oben

Auswahl der Daten zur Veröffentlichung

Mit der Generierung der Forschungsdaten stellt sich die Frage nach Art und Umfang ihrer Publikation.

Entgegen einer verbreiteten Annahme müssen nicht alle im Forschungsvorhaben entstandenen Daten publiziert werden. Die Auswahl richtet sich nach rechtlichen und pragmatischen Gesichtspunkten. Insbesondere sofern Personendaten involviert sind oder es Grund zur Annahme gibt, dass urheber- bzw. persönlichkeitsrechtliche Ansprüche bestehen, sind Möglichkeiten und Grenzen einer Veröffentlichung der Daten bereits im Vorfeld juristisch zu prüfen. Andererseits beschränkt sich die Auswahl auf diejenigen Daten, welche die wissenschaftliche Transparenz und Nachvollziehbarkeit der Forschungsergebnisse gewährleisten. Sinnvoll ist es, darüber hinaus unter der Einräumung bestimmter Nutzungsrechte Daten zur Verfügung zu stellen, die eine wissenschaftliche Nachnutzung erlauben. Ob die Veröffentlichung von Exzerpten, Bibliographien oder einzelnen Notizen für die Fachcommunity einen Mehrwert darstellt, kann von Fall zu Fall variieren.

Nach oben

Lizenzmodelle zur Regelung der Datennutzung

Die Modalitäten der Nutzung bzw. Nachnutzung von Forschungsdaten können durch den Rückgriff auf anerkannte Lizenzmodelle präzise festgelegt werden.

In den Geisteswissenschaften sind Lizenzen der gemeinnützigen Organisation Creative Commons etabliert, die Nutzerinnen und Nutzern je nach Lizenz unterschiedlich weitreichende Nutzungsrechte einräumen. Auf der Seite von Creative Commons finden Sie eine Übersicht über die Lizenzmodelle. Eine übersichtliche Grafik der TU Darmstadt veranschaulicht die Möglichkeiten der einzelnen Lizenzen:

(Grafik der TU Darmstadt unter der Lizenz CC BY-SA.)

Weitere Informationen zur Lizenzvergabe bietet die Plattform forschungsdaten.info.

Nach oben

Sichtbarmachung der Forschungsleistung

Um die Nachweissituation der eigenen Forschungsdaten und ihre Sichtbarkeit für andere Wissenschaftlerinnen und Wissenschaftler zu verbessern, empfiehlt sich die Meldung der Daten mit Hilfe des vom FID in Kooperation mit romanistik.de entwickelten Meldesystems für Forschungsdaten.

Nach oben