Volltextdigitalisierung

Um ein Volltextdokument zu erzeugen, muss das Original entweder manuell abgeschrieben werden oder man verwendet eine OCR-Software. OCR steht für "Optical Character Recognition". OCR erkennt Buchstaben und Zeichen in Bilddateien und macht sie als Text nutzbar.

OCR eignet sich vor allem für jüngere Antiquaschriften. Bei einem Grossteil der historischen Materialien kann OCR hingegen nicht oder nur vereinzelt sinnvoll angewendet werden. Für die Erkennung von Handschriften ist sie generell ungeeignet. Frakturschriften lassen sich teils mit speziellen Softwarelösungen erkennen, wie zum Beispiel ABBYY Finereader XIX (Link verlässt diese Seite).