Handschrifterkennung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Handschrifterkennung ist eine Form der Mustererkennung, bei der handschriftlich geschriebene Zeichen oder Wörter erkannt werden sollen. Dabei wird zwischen on-line und off-line Handschrifterkennung unterschieden.[1][2] Bei der on-line Handschrifterkennung kann die Information, wie ein Wort geschrieben wurde, also in welcher Reihenfolge die Striche gezogen wurden, zur Erkennung benutzt werden. Bei der off-line Handschrifterkennung liegt dagegen nur das Endprodukt als Bild vor. Daher ist die off-line Handschrifterkennung ein Teilgebiet der Texterkennung, die on-line Handschrifterkennung jedoch nicht.

Allgemeine Funktionsweise[Bearbeiten]

Jeder Handschrifterkenner nutzt verschiedene Schritte zur Schrifterkennung:

  • Vorverarbeitung: Das Entfernen von überflüssigen (zu hohe Auflösung) oder sogar fehlerhaften Informationen (Bildfehler)
  • Segmentierung: Das Zerlegen der Eingabe in kleinere Teile, wie z.B. das Zerlegen von Wörter in Buchstaben oder von Zahlen in Ziffern
  • Feature-Extraktion bzw. Generierung: Aus den vielen kleinen Informationen werden weniger, wichtigere Informationen generiert. So kann in der on-line Handschrifterkennung aus den vielen Informationen, wo zu welchem Zeitpunkt der Stift war die Information generiert werden, welche Krümmung die Schriftkurve in verschiedenen Punkten hat.

In einem weiteren Schritt werden dann mit Techniken des maschinellen Lernens die Zeichen erkannt.

On-line Handschrifterkennung[Bearbeiten]

On-line Handschrifterkennung benötigt bereits beim Schreiben einen Touchbildschirm oder ein anderes digitales Gerät zum Aufzeichnen der Schrift. Dabei können verschiedenste Eingabegeräte wie Smartphones und Tablets mit Fingern bzw Eingabestiften oder auch Grafiktabletts zum Einsatz kommen. Diese Eingabegeräte liefern die Information, wo sich der Eingabestift befindet. Manche Geräte liefern diese Information auch dann, wenn sich der Stift nicht auf dem Touchscreen befindet, sondern nur darüber ist. Je nach verwendeter Technologie wird zusätzlich zu den (x, y) Koordinaten der Eingabe auch noch die Information geliefert, wie viel Druck ausgeübt wurde.

On-line Handschrifterkennung ist momentan noch deutlich weniger verbreitet als off-line Handschrifterkennung.

On-line Handschrifterkennung wird seit den 1950er Jahren wissenschaftlich untersucht.[3] (1958 wurde mit dem „Stylator“ das erste Gerät vorgestellt, mit dem die Aufnahme von on-line Informationen bzgl. der Handschrifterkennung möglich war.[4])

Die Vorverarbeitung in der on-line Handschrifterkennung kann eine Fülle von verschiedenen Schritten beinhalten:

  • Das Finden und Eliminieren "wilder Punkte", also von Punkten die durch Hardwarefehler entstehen.
  • Das Interpolieren der gemessenen Punkte sowie damit verbunden das Neuberechnen von Punkten.
  • Das Skalieren und Verschieben der Eingabe.
  • Das Finden einer Basislinie und gegebenenfalls das Korrigieren der Schrift, sodass sie auf einer geraden Basislinie liegt.
  • Das Finden und gegebenenfalls das Korrigieren der Neigung der Buchstaben.

Off-line Handschrifterkennung[Bearbeiten]

Die Off-line Handschrifterkennung hat zahlreiche Anwendungsgebiete wie Beispielsweise die Schrifterkennung auf Formularen, Überweisungsbelegen und Adressen auf Briefen.

Einzelnachweise[Bearbeiten]

  1.  Brakensiek, A. and Kosmala, A. and Willett, D. and Rigoll, G.: Vergleich verschiedener statistischer Modellierungsverfahren für die On- und Off-Line Handschrifterkennung. Springer Berlin Heidelberg, 1999, ISBN 978-3-540-66381-2, S. 70-77.
  2.  Dr.-Ing. Joachim Schenk, Prof. Dr. Gerhard Rigoll: Mensch-Maschine-Kommunikation. Springer Berlin Heidelberg, 2010, ISBN 978-3-642-05456-3, S. 151-164.
  3.  Tappert, C. C. and Suen, C. Y. and Wakahara, T.: The State of the Art in Online Handwriting Recognition. In: IEEE Trans. Pattern Anal. Mach. Intell.. 12, Nr. 8, 1990, S. 787--808, doi:10.1109/34.57669.
  4.  T. L. Dimond: Devices for Reading Handwritten Characters. In: Papers and Discussions Presented at the December 9-13, 1957, Eastern Joint Computer Conference: Computers with Deadlines to Meet. 1958, S. 232--237, doi:10.1145/1457720.1457765.