OCR
OCR
Anleitung für OCR
Stand von April 2014
Die eigentliche Engine zum "Entziffern" von Buchstaben heißt tesseract und die gibt es schon sehr lange. Der Aufruf erfolgt über die Kommandozeile:
tesseract Bilddatei Textdateiname -l sprache
Die vorhandenen Sprachdateien befinden sich im Paket traineddata
Tesseract hat inzwischen die Version 3.x und es gibt einer grafische Oberfläche dazu: tesseract-gui.
Gefunden habe ich die Pakete u.a. hier: [1]
Diese Quelle in Yast einbinden diese Pakete installieren:
tesseract tesseract-gui
Und natürlich eine oder mehrere Sprachdatei, z.B.
tersseract-traineddata-german
und die Abhängigen natürlich. Danach existiert im Menüpunkt "Grafik" ein passender Eintrag auf die GUI. Hier wählt man oben die Bilddatei(en), klickt darunter diejenige an, die man jetzt lesen möchte und piekt mit der Maus in das Bildfenster. Der Mauszeiger wird im Bildfenster zu einem kleinen Rechteck, nach dem Klick verschwindet das Rechteck und man kann ein Rechteck um den Bereich ziehen, der bearbeitet werden soll. Weiter unten findet sich ein Dropdown-Menü "language", mit dem man nur beim ersten Start die Sprache einstellt. Zuletzt auf den Button "Ausführen" klicken und wenige Sekunden später steht das Ergebnis in einer Datei mit dem 'basename' von oben und der Extension ".txt" dahinter.