Speicherung, Archivierung

Dateiformate, Master- und Nutzungsformate

Digitale Bilder können in verschiedenen Dateiformaten gespeichert werden. Jedes Format verfügt über Eigenschaften, die sich auf die Nutzungsmöglichkeiten (Darstellung im Internet, Langzeitarchivierung usw.) auswirken. Vom gewählten Dateiformat ist ausserdem der erforderliche Speicherplatz abhängig.

Einige Dateiformate verringern die Dateigrössen, indem die Bilder komprimiert werden. Dabei wird zwischen verlustfreier und verlustbehafteter Kompression unterschieden. Normalerweise lässt sich die verlustbehaftete Kompression nicht rückgängig machen – die Originaldatei kann somit nach der Kompression nicht wieder rekonstruiert werden.

Gebräuchliche Dateiformate in der Digitalisierung sind: TIFF, JPEG, JPEG2000, PDF, PDF/A.

Eine detaillierte Beschreibung von Dateiformaten ist bei der Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen (KOST (Link verlässt diese Seite)) zu finden.

Master- und Nutzungsformate

Masterdatei

Als Masterdatei wird das unbearbeitete Scanerzeugnis bzw. die Originaldatei bezeichnet. Masterdateien von Graustufen- und Farbdigitalisaten werden in der Regel als unkomprimierte TIFF-Dateien gespeichert.

JPEG 2000 als Alternative zu TIFF benötigt weniger Speicherplatz, und im Gegensatz zum JPEG-Format unterstützt JPEG 2000 die verlustfreie Farbraumkomprimierung und den progressiven Bildaufbau. Zudem kann es Metadaten aufnehmen. In den DFG-Praxisregeln Digitalisierung (2013, pdf, 880 kB) wird von JPEG 2000 als Speicherformat für Masterdateien jedoch abgeraten. Grund ist unter anderem die (noch) geringe Verbreitung des Dateiformates.

Nutzungsderivate

Derivate sind nutzungsoptimierte Dateierzeugnisse auf Basis der Masterdateien, die besonders für die Anzeige von Digitalisaten im Internet benötigt werden. Zu diesem Zweck werden aus den Masterdateien komprimierte Dateien erstellt, die wenig Speicherplatz brauchen und von Browsern schnell geladen werden können. Für Internetanwendungen eignen sich vor allem die browserfreundlichen Formate JPEG und PNG. Für Downloadfunktionen oder zusätzliche Archivierungszwecke empfiehlt sich die Verwendung von PDF/A.

Praxisbeispiel – Nutzungsderivate E-Periodica

Für die Präsentation im Internet werden zwei Derivate im JPEG-Format benötigt: Eine Version in reduzierter Breite für die Gesamtansicht sowie eine Version in Originalgrösse für die Zoomfunktion. Diese werden automatisiert mit dem Agora Workflow-Client erstellt.

Speicherplatz und Langzeitarchivierung

Eine farbige TIFF-Datei mit einer Auflösung von 300 dpi benötigt durchschnittlich 25 MB Speicherplatz je gescannte Seite. Dies bedeutet, dass auf einem Speichermedium mit Platz für 1 TB in dieser Datenqualität kaum mehr als beispielsweise 180 Bücher untergebracht werden können.

Grundsätzlich lassen sich die Datenmengen über zwei Ansätze reduzieren:

  • Speichern der Dateien (Master und Nutzungsderivate) in komprimierter Form
  • Optimierung der Dateigrösse durch geeignete Scanparameter (Auflösung, Farbtiefe usw.)

Digitale Langzeitarchivierung

Die konzeptionelle Planung für die dauerhafte Aufbewahrung der Original- bzw. Masterdateien ist ein zentraler Bestandteil von Digitalisierungsprojekten. Kooperationslösungen (z.B. mit einer leistungsfähigen IT-Infrastruktur) können helfen, die digitale Langzeitarchivierung effizient und sicher zu konzipieren.

Weitere Informationen zum Thema: Digitaler Datenerhalt an der ETH Zürich

Unternavigation und ergänzende Informationen

Ergänzende Informationen Speicherung, Archivierung

Kontakt

DigiCenter
+41 44 632 69 10
digicenter@library.ethz.ch

Teamleitung
Regina Wanger

Regina Wanger