Skip to the content.

Auf dieser Seite stellen wir Ihnen detaillierte Nutzungs- und Installationshinweise zur freien Texterkennungssoftware Tesseract zur Verfügung. Tesseract wird hauptsächlich für die Erkennung von Textzeichen bzw. -zeilen genutzt, aber auch die Layoutanalyse, also die Zerlegung eines Textes in Textblöcke, kann es übernehmen. Den Sprach- und Schrifterkennungsmodellen können auch Wörterbücher hinzugefügt werden für eine Verbesserung des Ergebnisses. Tesseract eignet sich für Druckschriften. Die Dokumentationen wurden größtenteils im Rahmen des vom Ministerium für Wissenschaft, Forschung und Kunst BW geförderten Projektes OCR-BW erstellt. Über Hinweise und Verbesserungen via Pull-Request sind wir stets dankbar.

Sie finden zu folgenden Themen Anleitungen: