Webarchiv der ETH Zürich

Das Hochschularchiv der ETH Zürich archiviert in regelmässigen Abständen die wichtigsten Websites der ETH Zürich (Hauptseite, Portale für ETH-Angehörige und Studierende, Fachsites).

Welche Websites werden archiviert?

Im Webarchiv (Link verlässt diese Seite) werden ausgewählte Teile des Webauftrittes der ETH Zürich dauerhaft gesichert und langfristig der Öffentlichkeit zugänglich gemacht. Von allen Unterseiten, die zu einer bestimmten Website gehören, werden digitale Momentaufnahmen erzeugt. Diese Snapshots zeigen den Zustand einer Website zum Archivierungszeitpunkt.

Das Webarchiv enthält derzeit verschiedene Sammlungen von ETH-Websites.

  • Snapshots aus dem Jahr 2016. Sie zeigen den Zustand der wichtigsten ETH-Websites von Professuren, Instituten, Departementen und Abteilungen vor dem Relaunch des ETH-Webauftritts.
  • Snapshots von einzelnen älteren ETH-Websites
  • Snapshots von virtuellen Ausstellungen der ETH-Bibliothek seit 1998

Das Webarchiv des Hochschularchivs bietet den Nutzerinnen und Nutzer eine bewusste Auswahl von Websites, die die Entwicklung des Webauftrittes der ETH Zürich dokumentiert. Um die Vollständigkeit einer Website zu gewährleisten, werden alle Webpages einer Website zum selben Zeitpunkt archiviert. Die technische und visuelle Qualitätskontrolle sorgt für die hohe Qualität der Snapshots. Das Webarchiv garantiert die Stabilität von Verweisen und Zitaten, so dass die archivierten Websites als wissenschaftliche Quellen genutzt werden können.

Der Titel einer Website, das Datum der Archivierung sowie weitere Metadaten können in verschiedenen Portalen durchsucht werden, so in der Archivdatenbank Hochschularchiv online, im Wissensportal der ETH-Bibliothek und in Archives Portal Europe (Link verlässt diese Seite).

Öffnen Sie die Einstiegsseite des Hochschularchivs online (Link verlässt diese Seite) und geben Sie im Suchfeld einen Suchbegriff ein.

Am besten kombinieren Sie Ihre Abfrage mit dem Wort "Website". Hier finden Sie eine Liste aller archivierten Websites (Link verlässt diese Seite). Eine Volltextsuche ist zurzeit nicht möglich.

Klicken Sie in der Trefferliste auf den Eintrag, der Sie interessiert.

Mit einem Klick auf "Link zum digitalen Original" öffnet sich die Einstiegsseite des ETH Data Archive.

Wenn Sie mit den Copyrights Information einverstanden sind, klicken Sie auf "I accept the terms".

Sie sehen eine Übersicht der archivierten Snapshots der gesuchten Website über die letzten Jahre. Klicken Sie nun auf das gewünschte Datum eines Snapshots.

Der Snapshot wird in der Open Wayback Machine angezeigt.

Das Banner ganz oben auf der Seite dient dazu, eine Verwechslung mit dem aktuellen Webauftritt der ETH Zürich zu vermeiden.

Das Webarchiv des Hochschularchivs setzt für die digitale Archivierung die Methode des Remote Harvestings ein. Als Web-Crawler ist Heritrix im Einsatz. Der Crawler sammelt ausgehend von einer Start-URL alle Inhalte ein, die verlinkt sind. Der Crawler erzeugt Dateien im WARC-Format sowie Log-Dateien, die dokumentieren, mit welchen Einstellungen der Crawler gearbeitet hat.

Voraussetzung für die Archivierung im Webarchiv ist die Zugehörigkeit einer Website zur ETH Zürich. Es werden ausschliesslich öffentlich zugängliche Websites archiviert, für deren Zugang kein Login notwendig ist. Auf einer Webpage veröffentlichte Inhalte wie PDFs oder Präsentationsfolien werden in den WARC-Dateien gespeichert. Eingebettete Inhalte aus externen Diensten (z.B. YouTube-Videos oder Google-Karten) werden nicht archiviert. Stattdessen wird ein Platzhalter "Resource not in archive" angezeigt.

Die Anzeige der Websites für Nutzer des Webarchivs erfolgt im Viewer Open Wayback Machine. Dabei kann die Darstellung der archivierten Version leicht von der Originalversion abweichen. Insbesondere bei dynamisch erzeugten Inhalten ist die Archivierung schwierig. Bei der Qualitätskontrolle der archivierten Websites wird primär darauf geachtet, dass die zentralen Inhalte einer Website archiviert werden.

Zitieren von Websites

Jeder Snapshot einer Website zu einem bestimmten Datum besitzt einen Digital Object Identifier (DOI) als persistenten Identifikator.

Bitte zitieren Sie folgendermassen:
Hochschularchiv der ETH Zürich, [Signatur], [Titel der Website], [Datum der Archivierung], [DOI]

Zum Beispiel:
Hochschularchiv der ETH Zürich, EZ-INF1.1/213, Website von: Institut für Bewegungswissenschaften und Sport mit der Original-URL http://www.ibws.ethz.ch, 14.07.2017, DOI: 10.7893/ethz-hsa-web-223

Wie kann ich eine Website der ETH Zürich zur Archivierung vorschlagen?

Wenn Sie eine ETH-Website zur Archivierung vorschlagen möchten, schreiben Sie eine E-Mail an: archiv@library.ethz.ch

Digitale Langzeitarchivierung

Die WARC-Dateien werden gemeinsam mit ausgewählten Log-Dateien jedes Crawls im ETH Data Archive gespeichert und verwaltet. Das ETH Data Archive orientiert sich am OAIS-Modell (Open Archival Information System) und verwendet die international verbreiteten Standards METS und PREMIS.

Am Webarchiv beteiligte Abteilungen der ETH Zürich

Das Webarchiv ist nur möglich dank der Zusammenarbeit verschiedener ETH-Abteilungen. Das Hochschularchiv arbeitet mit der Hochschulkommunikation (Link verlässt diese Seite) zusammen und entscheidet darüber, welche Websites archiviert werden. Die Informatikdienste (Link verlässt diese Seite) konfigurieren den Crawler, führen das Harvesting durch und stellen die Infrastruktur für die Zwischenspeicherung bereit. Das Hochschularchiv der ETH Zürich führt die Qualitätskontrolle durch, crawlt einzelne Websites nochmals und metadatiert alle archivierten Websites. Die Snapshots und Metadaten werden im ETH Data Archive archiviert.

Andere Webarchive von Websites der ETH Zürich

Unter den beiden URLs http://www.archiv.ethz.ch/ (Link verlässt diese Seite) und http://www.webarchiv.ethz.ch/ (Link verlässt diese Seite) werden mehr als 200 ältere ETH-Websites angeboten, die aufmerksam gepflegt werden.

Im Internet Archive (Link verlässt diese Seite) finden sich Crawls verschiedenster ETH-Websites seit 1997. Die ETH Zürich hat jedoch beim Internet Archive keine Kontrolle darüber, wann, wie häufig und welche Teile des ETH-Webauftritts archiviert werden. Oftmals liegen die Snapshots der Unterseiten einer Website zeitlich weit auseinander.

Unternavigation und ergänzende Informationen

Ergänzende Informationen Webarchiv der ETH Zürich

Kontakt

Hochschularchiv der ETH Zürich
+41 44 632 07 04
archiv@library.ethz.ch

Leitung
Christian J. Huber

Christian Huber