Jakob Koppermann
Gescannte Artikel aus Mikrofilmen abzuschreiben, ist eine nervige und unnötige Arbeit, dafür gibt es technische Lösungen. Ein Einblick.
Denn: Nach dem Scannen der Artikel lassen sie sich per OCR (Optical Character Recognition) in digitalen Text konvertieren. Das ist zum Beispiel im Uni-Medienzentrum für sehr viele Sprachen machbar, einfacher sind jedoch online-Services wie Online OCR.
Man lädt die Bilddatei hoch, wählt die Sprache des Textes aus und klickt auf konvertieren. Dann kann man eine .doc-Datei herunterladen, speichern und aus ihr den Text herauskopieren. Schriften wie Kyrillisch und Arabisch müssen kurz herausgesucht werden, aber auch dazu wird man im Netz fündig. Zu beachten ist, dass die Software zum Beispiel Kommata und Punkte schlecht auseinanderhalten kann. Manchmal kommen auch andere Buchstaben durcheinander. Aber selbst wenn das Programm ein großes Chaos produziert, so lässt sich das mit wenigen Kniffen in den Griff bekommen: Abschnitte lassen sich per Strg+F suchen und durch Kopieren und Einfügen zusammenstückeln. All das geht am Ende immer noch schneller als alles von vorn bis hinten abzutippen. In jedem Fall aber sollte man den Text noch einmal lesen und korrigieren.