Was sind Forschungsdaten? Eine Definition

Forschungsdaten können prinzipiell all jene Erzeugnisse wissenschaftlichen Arbeitens umfassen, die zwischen der Erhebung von Primärdaten wie Archivquellen und der Publikation von Forschungsergebnissen in Aufsätzen und Monographien entstehen.

Ihre Speicherung dient der Sicherung der eigenen Forschungsergebnisse, verbessert deren Transparenz im Sinne guter wissenschaftlicher Praxis und ermöglicht deren Nachnutzbarkeit. Insbesondere Forschungsvorhaben aus den Digital Humanities können zum Teil nur über die Offenlegung der zu Grunde liegenden Forschungsdaten nachvollzogen und reproduziert werden.

Beispiele sind:

  • Transkripte von Interviews
  • Audio- und Videodateien
  • Textkorpora
  • Datenbanken und Statistiken
  • In Tabellen aufbereitete Inhalte
  • Arbeitsbibliographien
  • Skripte/Programme, Visualisierungen von Netzwerkanalysen, Datenbanken, GIS-Daten, etc

Die Forschungsdatenpyramide veranschaulicht diesen Forschungsdatenbegriff graphisch.


 

Warum Forschungsdaten veröffentlichen?

Unabhängig davon, ob Forschungsdaten im Rahmen eines Forschungsprojekts auch veröffentlicht werden, macht es Sinn, sich mit diesem Thema bei der Planung und Durchführung eines Forschungsvorhabens auseinanderzusetzen. Bei der heutigen wissenschaftlichen Arbeit fallen fast zwangsläufig digitale Daten an, auf deren Grundlage Publikationen mit Forschungsergebnissen entstehen. Der mögliche Verlust von Exzerpten, Literaturlisten oder erstellten Texten zeugt von der Bedeutung einer sicheren Datenspeicherung. Es liegt also im ureigensten Interesse von Forscher*innen, sich mit diesem Thema im Vorfeld einer Arbeit auseinanderzusetzen und sich Gedanken über Dateiablage- und benennung, Backupmöglichkeiten und Speicherorte zu machen. 

Das so genannente Forschungsdatenmanagement möchte Forscher*innen bei diesem Prozess unterstützen und gleichzeitig einen Schritt weiter gehen und die entstehenden Forschungsdaten für eine Veröffentlichung vorbereiten und damit als Grundlage für weitere Forschung bereitstellen.

Konkrete Vorteile für Forscher*innen durch Forschugsdatenmanagement und die Veröffentlichung von Forschungsdaten können sein:

  • Systematische Erhebung, Erfassung, Ablage und spätere Abgabe und Sicherung der Daten als Plus für eigene Forschung, da es diese erleichtert und vor Datenverlust schützt
  • die Sichtbarkeit und Auswirkung der Forschung wird erhöht, das eigene akademische Profil wird akzentuiert
  • die Nachvollziehbarkeit und Transparenz von Forschungsleistungen verbessert sich
  • neue Kollaborationen und Netzwerke können entstehen
  • Fachwissen bleibt erhalten und ermöglicht neue Forschung
  • knappe Ressourcen können angesichts bereits vorhandener Forschungsdaten besser genutzt werden

Wenn im Rahmen des Forschungsdatenmanagements gewisse Grundsätze eingehalten werden, kann der Aufwand für die Publikation von Forschungsdaten minimiert werden. Hinweisen dazu finden Sie im folgenden Abschnitt.

 

Schritte für ein erfolgreiches Forschungsdatenmanagement

Anhand des abgebildeten Forschungsdaten-Lebenszyklus werden die einzelnen Schritte für ein erfolgreiches Forschungsdatenmanagement besprochen.

 

Hypothese/Fragestellung: Am Anfang eines Forschungsvorhabens sollte geklärt werden, ob auf existierende und veröffentlichte Forschungsdaten zurückgegriffen werden kann.

Quellenerhebung und Datenerfassung: Ebenfalls am Anfang eines Forschungsvorhabens sollten sich Forscher*innen Gedanken über die entstehende Menge und Art von Daten machen. Welcher Speicherbedarf ist zu erwarten? Nach welchem System sollen Dateien abgelegt werden, damit der Überblick nicht verloren geht (bspw. Fotografien von Archivdokumenten)? Gibt es in der Community und der Forschungsrichtung bereits etablierte Programme und Tools, deren Nutzung den Austausch mit anderen Forscher*innen erleichtert? Im Hinblick auf die Veröffentlichung der Daten sollten zudem möglichst Dateiformate gewählt werden, welche weit verbreitet, frei, offen und nicht-proprietär sind. Dies stellt sicher, dass die Dateien höchstwahrscheinlich auch in Zukunft les- und verwendbar sein werden. 

Analyse und Interpretation: Für die bei Analyse und Interpretation anfallenden Arbeitsdaten gelten grundsätzlich die gleichen Überlegungen wie beim Schritt der Quellenerhebung und Datenerfassung.

Datenspeicherung: Bei der Wahl eines Repositoriums für die Speicherung, Veröffentlichung und Langzeitarchivierung von Forschungsdaten sollte darauf geachtet werden, dass ein geläufiger Metadatenstandard verwendet wird, Persistente Identifikatoren vergeben werden und dass die Langzeitarchivierung höchsten technischen Anforderungen entspricht (nachgewisen z. B. durch das Data Seal of Approval). Eine Übersicht an Repositorien finden Sie im Registry of Research Data Repositories.

Zugriff und Veröffentlichung: Damit die veröffentlichten Forschungsdaten von der Wissenschaft sinnvoll genutzt werden können, müssen diese mit Metadaten versehen werden. Diese beschreiben die Daten und geben Auskunft über Urheber*in, Veröffentlichungsdatum, datenvorhaltende Institution, Formate, Inhalte usw. Um die Forschungsdaten zudem eindeutig identifizierbar zu machen und den langfristigen Zugriff auf diese zu sichern, sollten diese zudem mit Persistenten Identifikatoren wie DOIs oder URNs versehen werden. Fragen der Lizenzierung, etwa mit Creative Commons Lizenzen, sollten ebenfalls vor der Veröffentlichung geklärt werden. Die Mitarbeiter*innen eines Repositoriums unterstützen Sie gerne bei diesen Aufgaben, etwa bei der Beschreibung mit Metadaten, der Vergabe von Persistenten Identifikatoren oder Lizenzierungsfragen.

Nachnutzung: Wurden die genannten Schritte erfolgreich umgesetzt, können die Forschungsdaten von anderen Forscher*innen nachgenutzt werden. Sie als Datenautor*in können dafür zitiert werden und fördern auch auf diesem Wege die wissenschaftliche Erkenntnis.

 

Wie nutze ich Forschungsdaten?

Bei neuen Forschungsvorhaben macht es Sinn, sich zu Beginn zu informieren, ob bereits Forschungsdaten zu dem Thema vorliegen. Dafür schauen Sie am besten in den einschlägigen, fachspezifischen Forschungsdatenrepositorien  nach. Einen Verzeichnis von Repositorien weltweit finden Sie unter www.re3data.org. Eine generische Suche nach Forschungsdaten können Sie auf https://search.datacite.org/ absetzen. 

Wie Sie die gefundenen Forschungsdaten konkret nutzen, bleibt Ihnen überlassen.

Sie sollten diese aber auf jeden Fall den Regeln guten wissenschaftlichen Arbeitens folgend zitieren und auf diese Weise den/die Ersteller*in der Daten deutlich kennzeichnen. Empfehlungen für das Zitieren von Forschungsdaten finden Sie unter https://www.force11.org/group/joint-declaration-data-citation-principles-final.


Unterstützung

Wenn Sie Fragen zum Forschungsdatenmanagement haben oder Unterstützung benötigen, können Sie sich gerne an unseren Mitarbeiter Arnost Stanzel wenden: arnost.stanzel@bsb-muenchen.de 

Zusätzliche Informationen

Direktlink: Empfohlene Dateiformate
Direktlink: Handreichung zum Thema Forschungsdaten