Forschungsdaten publizieren

Es gibt gute Gründe dafür, Forschungsdaten zu publizieren und langfristig verfügbar zu halten:

Indem Sie Ihre Forschungsdaten publizieren und damit zitierfähig machen, geben Sie Ihren wissenschaftlichen Ergebnissen insgesamt eine höhere Sichtbarkeit. Zudem erwarten auch Geldgeber und Zeitschriften zunehmend, dass publizierten Studien zugrundliegende Daten veröffentlicht werden. Als Angehörige der ETH Zürich können Sie Forschungsdaten in der Research Collection (Link verlässt diese Seite), der Publikationsplattform der ETH Zürich, publizieren.

Für die automatisierte Ablieferung grösserer Mengen steht Ihnen das ETH Data Archive (Link verlässt diese Seite) mit entsprechenden Schnittstellen zur Verfügung. Ihre Daten erhalten in beiden Repositorien automatisch einen DOI (Digital Object Identifier) und werden dadurch dauerhaft zitierfähig.

Gerne beraten wir Sie im Vorfeld bezüglich Formatfragen und rechtlichen Aspekten der Datenpublikation oder auch bei der Erstellung eines Datenmanagementplanes im Rahmen eines Forschungsprojekts.

Die Veröffentlichung von Forschungsdaten ist für Angehörige der ETH Zürich nicht grundsätzlich obligatorisch, sie wird jedoch von diversen Geldgebern empfohlen oder vorausgesetzt. Auch unabhängig davon bietet die Veröffentlichung für Forschende verschiedene Vorteile:

Die Nutzbarkeit von Daten, die in einem Standarddateiformat vorliegen, wird von uns nach Möglichkeit langfristig sichergestellt.

Die Wahl geeigneter Dateiformate (Link verlässt diese Seite) begünstigt diesen Prozess, und es lohnt sich, Überlegungen zu Dateiformaten beim Projektstart in Ihren Datenmanagementplan (Link verlässt diese Seite) einzubeziehen. Es kann auch sinnvoll sein, ein Dateiformat nach der Bearbeitung in ein anderes Format zu konvertieren, das eine längere Lebensdauer erwarten lässt.

Für die Veröffentlichung in den Repositorien der ETH Zürich ein langzeittaugliches Format keine Voraussetzung. Die zukünftige Nutzung kann durch problematische Formate aber massiv erschwert werden.

Alle Mitarbeitenden einer Studie sollten sich schriftlich mit einer Datenpublikation unter einer gewählten Nutzungslizenz einverstanden erklären. Datenpakete dürfen ausschliesslich von den Datenproduzenten oder durch von den Produzenten bevollmächtigte Personen hochgeladen werden.

Falls sich die Studie noch in der Anfangsphase befindet, empfehlen wir Ihnen einen Datenmanagementplan zu erstellen und zu pflegen. Damit wird die Erfassung, Auswertung und Archivierung der Daten für alle Beteiligten transparent geregelt. Einige Förderorganisationen verlangen die Abgabe eines Datenmanagementplans bereits bei der Antragstellung. Bei der Erstellung kann Ihnen unsere Data Management Checklist (Link verlässt diese Seite) weiterhelfen.

Neben der Research Collection (Link verlässt diese Seite) und dem ETH Data Archive (Link verlässt diese Seite) gibt es eine grosse Anzahl fachlich ausgerichteter Repositorien für Forschungsdaten. Eine Übersicht über solche Repositorien (Link verlässt diese Seite) wurde von PLoS zusammengestellt. Für Daten in einem etablierten fachspezifischen Dateiformat empfehlen wir ein Repositorium zu verwenden, welches auf dieses Dateiformat spezialisiert ist. Zahlreiche fachspezifische und institutionelle Repositorien finden Sie auch im Verzeichnis re3data (Link verlässt diese Seite).

Nachfolgend stellen wir Ihnen die Research Collection der ETH Zürich und das ETH Data Archive vor und erläutern Ihnen, welche Plattform für welche Anwendungsfälle geeignet ist.

Einreichung in die Research Collection

Die Research Collection ist die Publikationsplattform der ETH Zürich. Sie dient den Mitarbeitenden als Single Point of Access für die Dokumentation, Publikation und Archivierung ihrer wissenschaftlichen Ergebnisse und vereint damit die Funktionen einer Hochschulbibliographie, eines Open Access Repository und eines Forschungsdaten-Repositoriums unter einer Oberfläche. Sie bündelt und erweitert somit die Funktionen der bisherigen ETH E-Collection sowie von ETH E-Citations.

Alle Daten, die im Rahmen Ihrer Forschungstätigkeit an der ETH Zürich anfallen, können in der Research Collection publiziert und/oder archiviert werden. Als Datenproduzentin oder Datenproduzent bestimmen Sie bei der Einreichung alle entscheidenden Parameter der Veröffentlichung, insbesondere Zugriffsberechtigungen (Link verlässt diese Seite) und Endnutzerlizenz, selbst. Nach einer internen Überprüfung durch die ETH-Bibliothek werden Ihre Daten dann zeitnah publiziert.

Was bietet die Research Collection für Forschungsdatenproduzenten?

  • Flexible Zugriffsrechte von "Open Access" bis "Zugriff auf Anfrage"
  • Registrierung von DOIs und Möglichkeit des DOI-Vorbezugs (Link verlässt diese Seite)
  • Tagesaktuelle Downloadstatistiken und Altmetrics für Ihre publizierten Daten
  • Alle Formate zur Einreichung zugelassen
  • Inhalts-Preview für ZIP- und tar-Container
  • Verknüpfung mit GrantIDs von EU- und SNF-Projekten sowie Export ins EU-Portal OpenAIRE (Link verlässt diese Seite)
  • Langfristige Verfügbarkeit der Daten

Weitere Informationen finden Sie im Research Collection Handbuch (Link verlässt diese Seite).

Einreichung ins ETH Data Archive

Das ETH Data Archive bildet als "Dark Archive" der Research Collection das Rückgrat der Datenarchivierung und ist in Bezug auf die technischen Eigenschaften entsprechend konzipiert.

In erster Linie dient Ihnen daher die Research Collection als primäre Dienstleistung und Ansprechstelle für die Publikation Ihrer Forschungsdaten an der ETH Zürich. In den folgenden Fällen ist ein Daten-Upload über das ETH Data Archive allerdings in Betracht zu ziehen:

Falls Sie wiederkehrend Daten mit bestehenden Metadaten aus einer bestimmten Applikation heraus archivieren möchten (z.B. aus einem LIMS oder ähnlichem), können wir eine Schnittstelle zum ETH Data Archive anbieten oder sie gemeinsam mit Ihnen anpassen.

Wir stellen Ihnen als lokalen Editor das Tool docuteam packer (Link verlässt diese Seite) zur Verfügung.

Der docuteam packer bietet Funktionen, die es Ihnen ermöglichen, Ihre Daten selbstständig für einen Upload ins ETH Data Archive zu strukturieren, zu beschreiben und zu organisieren und diese dann zu einem selbst gewählten Zeitpunkt ins ETH Data Archive zu laden. Des Weiteren können Archivierungspakete auch kollaborativ von verschiedenen Personen derselben Forschungsgruppe erstellt werden, sodass Projekte gemeinsam erfasst werden können.

Bei Interesse kontaktieren Sie uns gerne für ein unverbindliches Beratungsgespräch.

Weitere Angaben zu den Dienstleistungen des ETH Data Archive sind auf der Seite "Unsere Dienstleistungen" ersichtlich.

Weiterführende Informationen

Als Open Research Data bezeichnet man Forschungsdaten in unbearbeiteter oder bearbeiteter Form, die als Ergebnis wissenschaftlicher Forschung entstanden sind und offen zur Nachnutzung für jeden Interessenten im Internet zur Verfügung stehen.

Die Mitarbeitenden der ETH Zürich sind gemäss Open Access Policy der ETH Zürich dazu aufgefordert, Ihre Publikationen frei zugänglich zu veröffentlichen. Geldgeber wie das EU-Programm Horizon 2020 gehen bereits weiter und verlangen explizit auch die Veröffentlichung von Daten oder haben dies angekündigt (Schweizerischer Nationalfonds zur Förderung der wissenschaftlichen Forschung (SNF (Link verlässt diese Seite)).

Damit Forschungsdaten offen zugänglich gemacht werden können, dürfen sie möglichst keinen Beschränkungen durch Datenschutz, Verwertungs- oder Patentrechte unterliegen. Bestehende Urheberrechte bleiben unberührt. Die konkreten Nachnutzungsbedingungen werden über die Verwendung von Open-Content-Lizenzen geregelt.

Sie entscheiden bei der Ablieferung Ihrer Daten darüber, wem Sie Zugriffsrechte gewähren:

Sofern eine Zugriffsbeschränkung gewählt wird, können nicht zugriffsberechtigte Personen den Zugriff auf Ihre Daten über die Funktion "Request Access" anfragen. Das Research Collection Team leitet Zugriffsanfragen an die Rechteinhaber weiter, sofern diese zum Zeitpunkt der Anfrage noch an der ETH Zürich beschäftigt sind.

In allen Fällen sind die beschreibenden Metadaten zu Ihren Forschungsdaten in der Research Collection sichtbar, auffindbar und frei zugänglich.

Auswertung der Nutzung

  • Research Collection: Auf der Übersichtsseite (der sogenannten "Landing Page") Ihres Datenpakets/Datensatzes in der Research Collection sehen Sie jederzeit die tagesaktuellen Zugriffs- und Nutzungszahlen.
  • ETH Data Archive: Auf Nachfrage erhalten Sie Angaben zur Anzahl der Zugriffe auf Ihre Daten.

Die kürzeste Aufbewahrungsdauer für Forschungsdaten in der Research Collection und dem ETH Data Archive beträgt 10 Jahre. Nach Ablauf der gewählten Aufbewahrungsfrist kann das Hochschularchiv der ETH Zürich in Rücksprache mit den Datenproduzenten entscheiden, ob es aus historischen Gründen bestimmte Daten auf Dauer in seine Verantwortung übernimmt. Für eine Nutzung von mehr als 10 Jahren sollten möglichst verbreitete und offene Dateiformate (Link verlässt diese Seite) benutzt werden.

Für kürzere Aufbewahrungsdauern vermitteln wir Sie gern an die Informatikdienste der ETH Zürich (Link verlässt diese Seite) bzw. an den Informatik Support Ihres Departements.

Es wird von den Forschenden erwartet, dass sie einen vertretbaren Aufwand betreiben, um ihre Daten zu bereinigen und Metadaten zu liefern wie Autoren, Titel, Thema usw. (Beispiel Metadaten im ETH Data Archiv). Diese Metadaten erlauben das Auffinden ihrer Daten mit einer Suche in der Research Collection, dem Wissensportal der ETH-Bibliothek sowie anderen Suchmaschinen und werden zudem ihnen selbst und Dritten den Überblick über ihre Daten vereinfachen.

Zu den erweiterten Metadaten gehört auch die Dokumentation des inhaltlichen Kontexts Ihrer Daten, die eine spätere Nachnutzung ermöglichen soll. Auch die Wahl eines geeigneten Dateiformates kann die Nachnutzung und den Erhalt der Daten entscheidend erleichtern. Weiterführende Informationen dazu finden sich im entsprechenden Abschnitt "Wahl eines geeigneten Dateiformates".

Ordnerstrukturen werden zu ZIP- oder tar-Files zusammengefasst (bis 2 GB pro ZIP oder tar, maximale Pfadlänge ca. 200 Zeichen, vermeiden Sie Sonderzeichen in Filenamen (Link verlässt diese Seite).

Die Publikation bzw. Archivierung von Daten bis zu 1 TB pro Forschungsgruppe wird von der ETH-Bibliothek als kostenlose Dienstleistung angeboten. Übersteigt das Datenvolumen 1 TB, so werden Ihrer Gruppe in der Regel die Kosten des darüber hinausgehenden Speicherplatzes in Rechnung gestellt.

Es gelten die Gebühren der Informatikdienste der ETH Zürich (Link verlässt diese Seite), die nach Art des benötigten Speichers variieren.

Alle über die Research Collection (Link verlässt diese Seite) und das ETH Data Archive (Link verlässt diese Seite) publizierten Forschungsdaten und Dokumente erhalten einen Digital Object Identifier (DOI) und können somit dauerhaft adressiert und eigenständig zitiert werden.

Wir empfehlen, dass Sie einen Forschungsdatensatz mit den folgenden Mindestangaben zitieren:

Creator (PublicationYear): Title. Publisher. Identifier

Beispiel:
Swaminathan, R., Ramya, T., Karthik, C.S. (2013): Contortrostatin-Reprolysin Domain Structure. Swiss Institute of Bioinformatics. http://doi.org/10.5452/ma-c12zs (Link verlässt diese Seite).

Weitere Informationen zum korrekten Zitieren von Forschungsdaten bietet die DataCite Website (Link verlässt diese Seite).

Wenn Sie in einer Publikation oder bei der Einreichung eines Manuskripts auf einen erst später zu veröffentlichenden Forschungsdatensatz hinweisen möchten, können Sie in der Research Collection für diesen Zweck einen DOI reservieren (Link verlässt diese Seite).