OCR: Unterschied zwischen den Versionen

Aus Linupedia.org
Wechseln zu: Navigation, Suche
K (URL angepasst.)
 
(Eine dazwischenliegende Version von einem anderen Benutzer wird nicht angezeigt)
Zeile 13: Zeile 13:
 
Tesseract hat inzwischen die Version 3.x und es gibt einer grafische Oberfläche dazu: ''tesseract-gui''.  
 
Tesseract hat inzwischen die Version 3.x und es gibt einer grafische Oberfläche dazu: ''tesseract-gui''.  
  
Gefunden habe ich die Pakete u.a. hier:
+
Gefunden habe ich die Pakete u.a. hier: [http://download.opensuse.org/repositories/home:/Lazy_Kent/openSUSE_13.1/ openSUSE 13.1], [http://download.opensuse.org/repositories/home:/Lazy_Kent/openSUSE_12.3/ openSUSE 12.3]
[http://download.opensuse.org/repositories/home:/Lazy_Kent/openSUSE_12.1/]
 
  
Diese Quelle in Yast einbinden diese Pakete installieren:
+
Diese Quelle in [[YaST]] einbinden diese Pakete installieren:
  
 
     tesseract
 
     tesseract
Zeile 26: Zeile 25:
  
 
und die Abhängigen natürlich. Danach existiert im Menüpunkt "Grafik" ein passender Eintrag auf die GUI. Hier wählt man oben die Bilddatei(en), klickt darunter diejenige an, die man jetzt lesen möchte und piekt mit der Maus in das Bildfenster. Der Mauszeiger wird im Bildfenster zu einem kleinen Rechteck, nach dem Klick verschwindet das Rechteck und man kann ein Rechteck um den Bereich ziehen, der bearbeitet werden soll. Weiter unten findet sich ein Dropdown-Menü "language", mit dem man nur beim ersten Start die Sprache einstellt. Zuletzt auf den Button "Ausführen" klicken und wenige Sekunden später steht das Ergebnis in einer Datei mit dem 'basename' von oben und der Extension ".txt" dahinter.
 
und die Abhängigen natürlich. Danach existiert im Menüpunkt "Grafik" ein passender Eintrag auf die GUI. Hier wählt man oben die Bilddatei(en), klickt darunter diejenige an, die man jetzt lesen möchte und piekt mit der Maus in das Bildfenster. Der Mauszeiger wird im Bildfenster zu einem kleinen Rechteck, nach dem Klick verschwindet das Rechteck und man kann ein Rechteck um den Bereich ziehen, der bearbeitet werden soll. Weiter unten findet sich ein Dropdown-Menü "language", mit dem man nur beim ersten Start die Sprache einstellt. Zuletzt auf den Button "Ausführen" klicken und wenige Sekunden später steht das Ergebnis in einer Datei mit dem 'basename' von oben und der Extension ".txt" dahinter.
 +
 +
[[Kategorie:Office]]

Aktuelle Version vom 10. Oktober 2014, 22:15 Uhr

OCR

Anleitung für OCR

Stand von April 2014

Die eigentliche Engine zum "Entziffern" von Buchstaben heißt tesseract und die gibt es schon sehr lange. Der Aufruf erfolgt über die Kommandozeile:

tesseract Bilddatei Textdateiname -l sprache

Die vorhandenen Sprachdateien befinden sich im Paket traineddata

Tesseract hat inzwischen die Version 3.x und es gibt einer grafische Oberfläche dazu: tesseract-gui.

Gefunden habe ich die Pakete u.a. hier: openSUSE 13.1, openSUSE 12.3

Diese Quelle in YaST einbinden diese Pakete installieren:

   tesseract
   tesseract-gui

Und natürlich eine oder mehrere Sprachdatei, z.B.

   tersseract-traineddata-german

und die Abhängigen natürlich. Danach existiert im Menüpunkt "Grafik" ein passender Eintrag auf die GUI. Hier wählt man oben die Bilddatei(en), klickt darunter diejenige an, die man jetzt lesen möchte und piekt mit der Maus in das Bildfenster. Der Mauszeiger wird im Bildfenster zu einem kleinen Rechteck, nach dem Klick verschwindet das Rechteck und man kann ein Rechteck um den Bereich ziehen, der bearbeitet werden soll. Weiter unten findet sich ein Dropdown-Menü "language", mit dem man nur beim ersten Start die Sprache einstellt. Zuletzt auf den Button "Ausführen" klicken und wenige Sekunden später steht das Ergebnis in einer Datei mit dem 'basename' von oben und der Extension ".txt" dahinter.