O P T I C A L IIIC H A R A C T E R IIIR E C O G N I T I O N

Automatische Texterkennung und OCR werden im deutschen Sprachraum oft synonym verwendet. In technischer Hinsicht bezieht sich OCR jedoch nur auf den Teilbereich der Mustervergleiche von separierten Bildschnipseln zur Erkennung von Einzelzeichen.

Diesem OCR-Prozess geht eine globale Strukturerkennung voraus, in der zuerst Textblöcke von graphischen Elementen unterschieden, die Zeilenstrukturen erkannt und schließlich Einzelzeichen separiert werden. Diese OCR-Ergebnisse können durch Methoden der Kontextanalyse Intelligent Character Recognition (ICR) präzisiert werden, mit welcher die OCR-Ergebnisse korrigiert werden können. Es wird daher von OCR/ICR-Systemen gesprochen.

Auch Intelligent Word Recognition (IWR) fällt unter diese Kategorie. Dieser Ansatz versucht das Problem bei der Erkennung von Fließhandschriften zu lösen, bei der die Einzelzeichen nicht eindeutig separiert und so nicht über herkömmliche OCR-Methoden erkannt werden können. Je größer die Varianz, desto zufallsabhängiger wird die Genauigkeit.

Da IWR-Methoden nicht für Volltexterkennung geeignet sind, gilt generell, dass Fließhand-schrift maschinell nicht lesbar ist.