E-Periodica: Next Level Access

Ziel des Projektes

Basierend auf Named Entity Recognition, Named Entitiy Linking sowie anhand von automatisierter OCR‐Korrektur werden auf der Plattform E‐Periodica erweiterte und  verbesserte Recherchefunktionen implementiert.

Beschreibung des Projektes

Im Projekt Periodica: Next Level Access werden anhand automatisierter Textanreicherung zusätzliche Recherche‐ und Analysemöglichkeiten entwickelt. Aus einem Backend‐System resultieren Funktionen wie zum Beispiel Named Entity Recognition von Personen, Orts‐ und Ländernamen sowie Named Entity Linking (GND) der erkannten Entitäten. Zudem sollen automatisierte OCR‐Korrekturen auf den Gesamtbestand der Zeitschriften angewendet werden. Auf Ebene des  Frontends sollen die Anreicherungen und damit verbundene Features wie Verlinkungen zu weiterführenden  Informationen sicht‐ und nutzbar gemacht werden. 

Synergien und Kontext

  • Vorhandener Datenbestand E-Periodica (Volltexdateien, 7 Mio. Seiten)
  • Pilotprojekt im Bereich Texterkennung, durchgeführt 2017
  • Forschungszusammenarbeit im Bereich Texterkennung

ZeitrahmenAblauf
Bis Ende 2019Umsetzung der ersten Konzeptphase; über die Umsetzung der weiteren Phasen wird anschliessend entschieden.
Bis Ende 2021/2022Entwicklung des Backend-Systems und Implementierung erweiterter Recherchemöglichkeiten im Frontend. 

Unternavigation und ergänzende Informationen

Ergänzende Informationen E-Periodica: Next Level Access

Kontakt

Gruppe DigiCenter
Regina Wanger
Gruppenleitung DigiCenter
+41 44 632 69 10
regina.wanger@library.ethz.ch