next up previous contents
Next: Bildverarbeitung Up: Kognitive Systeme Previous: Assoziative Datenbanken

Handschriftenerkennung

Der bereits in den Vorjahren entwickelte Handschriftenklassifikator ,,COGNITUS`` wurde 1995 zu einem vollständigen System zur Verarbeitung hand- oder maschinengeschriebener Formulare ausgebaut. Die große Zuverlässigkeit und die hohe Verarbeitungsgeschwindigkeit von ca. drei Banküberweisungsformularen pro Sekunde auf einem Pentium-133 PC resultieren aus hochentwickelten Clusterungsverfahren, für deren Entwicklung unser Mitarbeiter Dr. Martin Neschen auf der Jahrestagung der Deutschen Arbeitsgemeinschaft für Mustererkennung 1995 mit dem DAGM-Preis ausgezeichnet wurde.

Die bereits verwendeten hierarchischen Clusterungsverfahren wurden weiter verbessert. So wird jetzt auf den ersten Verarbeitungsstufen das zu klassifizierende Zeichen nicht mehr bestimmten Zeichenklassen zugeordnet, sondern abstrakten Unterräumen zugeteilt. Dies führt, neben einer weiteren Beschleunigung des Verfahrens, zu besseren Resultaten, insbesondere bei mehrdeutigen Zeichen, da die Klassifikation erst auf tieferen Hierarchiestufen erfolgt.

 
figure441

Abbildung: Banküberweisungsformular und dynamische Segmentierung

Zu einer großen Verbesserung der Gesamtleistung hat auch die Einführung einer dynamischen Segmentierung geführt, da selbst auf Banküberweisungsformularen oft einzelne Zeichen überlappen bzw. in mehrere Fragmente zerfallen. Bei einer dynamischen Segmentierung wird der Text nicht starr in einzelne Zeichen zertrennt, sondern es werden an jeder Stelle mehrere Trennvarianten vorgeschlagen. Jedes Zeichen wird dann einzeln klassifiziert, und anschließend wird mittels dynamischer Programmierung die beste Segmentierung ausgewählt. Hier zeigen sich die Vorteile unseres hierarchischen Klassifikators, da dieser schon nach wenigen Vergleichen sehr schnell eine Vorentscheidung treffen kann.



Webmaster <www@zpr.uni-koeln.de>, 7. Apr. 1997