PatentDe  


Dokumentenidentifikation EP0707279 05.04.2001
EP-Veröffentlichungsnummer 0707279
Titel Mustererkennungsverfahren mit Kalibrierung der Lernfähigkeit
Anmelder Siemens AG, 80333 München, DE
Erfinder Oberländer, Matthias, D-89077 Ulm, DE
DE-Aktenzeichen 59509055
Vertragsstaaten BE, DE, FR, GB, IT
Sprache des Dokument DE
EP-Anmeldetag 09.10.1995
EP-Aktenzeichen 951158468
EP-Offenlegungsdatum 17.04.1996
EP date of grant 28.02.2001
Veröffentlichungstag im Patentblatt 05.04.2001
IPC-Hauptklasse G06K 9/62

Beschreibung[de]

Die Erfindung betrifft ein Mustererkennungsverfahren nach dem Oberbegriff des Patentanspruchs 1.

Mustererkennungsverfahren sind insbesondere von Bedeutung in der Automatisierungstechnik und der maschinellen Text-Verarbeitung, beispielsweise in Schriftenlesern der automatischen Briefverteilung oder der Auswertung von Formularen. Dabei wird ausgegangen von einem begrenzten Satz von Kennungen, beispielsweise dem alphanumerischen Zeichensatz in verschiedenen Schreibweisen zuzüglich von Sonderzeichen, und das Ziel des Erkennungsverfahrens ist, mit möglichst hoher Zuverlässigkeit ein zu erkennendes Objekt einer Kennung zuzuordnen.

Hierfür werden nach eingehender Vorverarbeitung der Objektdaten in einer Schätzerstufe eines Klassifikators für das zu erkennende Objekt zu einer oder mehreren in Frage kommenden Kennungen numerische Bewertungen geschätzt, die in einer nachfolgenden Entscheiderstufe als Grundlage für die Entscheidung über die Zuordnung des Objekts zu einer Kennung herangezogen werden.

Die Zuordnungsentscheidungen sind mit Restfehlern behaftet, die sich durch Rückweisungen und durch Akzeptieren von unzutreffenden Kennungen (Substitutionen) ergeben. Der Wunsch nach geringer Rückweisungsquote und gleichzeitig geringer Substitutionsquote bedeutet gegenläufige Anforderungen an den automatisierten Entscheidungsprozeß.

Aus der DE 41 33 590 A1 ist ein Verfahren zur Klassifikation von Amplitudenwerte darstellenden Signalen bekannt, bei welchem Merkmale aus den Signalen extrahiert und daraus Auftrittswahrscheinlichkeiten abgeleitet werden. Aus der Gesamtheit der abgeleiteten Auftrittswahrscheinlichkeiten wird eine Entscheidungsgröße berechnet und mit einem Schwellwert verglichen.

In IEEE Trans. on Electr. Comp., Vol. EC-16, No. 3, June 1967, S. 308-319 ist ein Verfahren zur Gewinnung von Parametern einer Polynom-Funktion für einen Klassifikator bekannt, bei welchem für jede bei der Klassifikation mögliche Kategorie eine Wahrscheinlichkeitsdichtefunktion so geschätzt wird, daß nach einer sogenannten Bayes-Entscheidungsregel klassifiziert werden kann.

In IEEE Trans. on Autom. Control, Vol. AC-11, No. 1, Jan. 1966, S. 6-19 sind lernfähige Systeme für automatische Steuerungen mit Rückkopplungsschleifen zu einem Klassifikator beschrieben. Dabei wird besonders auf Porbleme der Entscheidungstheorie und der stochastischen Approximation eingegangen. Die Vorteile trainierbar adaptiver Schwellwertsetzung werden betont.

Aufgabe der vorliegenden Erfindung ist es, ein Mustererkennungsverfahren anzugeben, welches eine Vereinfachung der Optimierung des Entscheidungsprozesses ermöglicht. Für den Fall mehrerer Bewertungen zu konkurrierenden Kennungen soll die Zuverlässigkeit der Entscheidung verbessert werden.

Die Erfindung ist im Patentanspruch 1 beschrieben. Die Unteransprüche enthalten vorteilhafte Ausgestaltungen und Weiterbildungen der Erfindung.

Für eine gemäß der Erfindung kalibrierte Bewertung der Kennungen ergibt sich vorteilhafterweise die Möglichkeit, unabhängig von der Häufigkeitsverteilung des Auftretens von Objekten zu den einzelnen Kennungen durch Vorgabe von Gewichtfaktoren für Rückweisungen und Substitutionen eine Einstellung der Entscheiderstufe für ein optimales Verhältnis von Rückweisungen und Substitutionen vorzunehmen. Insbesondere kann hierzu in der Entscheiderstufe eine kennungsunabhängige einstellbare Entscheidungsschwelle vorgegeben werden.

Vorzugsweise erfolgt die Kalibrierung kennungsspezifisch und für den Fall der gleichzeitigen Schätzung von Bewertungen zu konkurrierenden Kennungen unter Berücksichtigung von Kombinationen von Kennungen.

Die Erfindung ist besonders vorteilhaft in einem Schriftenleser, beispielsweise einem Anschriftenleser bei der Postautomation oder einem Formularleser im Bankverkehr, einsetzbar.

Die Erfindung ist nachfolgend anhand von Ausführungsbeispielen unter Bezugnahme auf die Abbildungen noch eingehend veranschaulicht.

In FIG. 1 ist ein einfaches Modell eines Erkennungssystems skizziert. Dieses besteht im wesentlichen aus einem Klassifikator und einem Entscheider. Die Signalverarbeitung erfolgt digital. Dem Klassifikator werden Daten eines zu erkennenden Objekts, beispielsweise in Form eines binären Punktrasters zugeführt. Einzelheiten der Signalverarbeitung und einer eventuellen Vorverarbeitung, z.B. Separation aufeinanderfolgender Zeichen bei einem Schriftenleser, sind aus dem Stand der Technik in vielfältiger Form bekannt.

Der Klassifikator prüft die Objektdaten auf Vereinbarkeit mit den verschiedenen Kennungen eines im System vorgesehenen Kennungssatzes und schätzt zu einer oder mehreren in Frage kommenden Kennungen einen numerischen Wert c innerhalb einer Bewertungsskala, beispielsweise 0 < c \ 1 in Schritten von 0,05. Als Kennungen des Kennungssatzes seien als ein einfaches Beispiel alle alphanumerischen Zeichen vorgesehen. Die Bewertungen können als numerisch quantifizierte Schätzungen der Glaubwürdigkeit einer Hypothese, z.B. "Bei dem Objekt handelt es sich um einen Buchstaben A ! ", anschaulich interpretiert werden. Derartige Bewertungsverfahren sind ebenfalls hinreichend aus dem Stand der Technik bekannt.

In einer Trainingsphase werden dem Klassifikator Objektdaten einer Vielzahl bekannter Objekte zugeführt. Die von dem Klassifikator in einer solchen Trainingsphase abgegebenen Bewertungen werden in der Weise erfaßt und durch Vergleich mit den für die bekannten Trainingsobjekte zutreffenden Kennungen ausgewertet, daß für jedes Inkrement der Bewertungsskala (oder zumindest eines relevanten Teils derselben) alle der mit diesem Inkrement bewerteten Ereignisse erfaßt und der relative Anteil R (c) der hiervon zutreffenden Kennungen ermittelt wird.

Die Anzahl von Trainingsobjekten in der Trainingsphase ist so hoch gewählt, daß die verschiedenen Kennungen des Kennungssatzes im Regelfall in allen Inkrementen der Bewertungsskala mehrfach auftreten.

Für jedes Inkrement der Bewertungsskala getrennt wird die Anzahl der in dieses Bewertungsinkrement fallenden Bewertungsvorgänge ermittelt. Ebenfalls separat für jedes Bewertungsinkrement wird aus der Gesamtzahl der darin gezählten Bewertungsvorgänge der Anteil R (c) der richtigen Kennungen, d.h. derjenigen Vorgänge, bei welchen die bewertete Kennung mit der bekannten tatsächlichen Kennung des zu erkennenden Objekts übereinstimmt, bestimmt. Im Idealfall ist dieser Anteil gleich dem Wert c des betreffenden Bewertungsinkrements. Im Realfall wird der für ein Bewertungsinkrement c bestimmte Anteil R (c) der richtigen Kennungen von dem Wert des Bewertungsinkrement mehr oder weniger abweichen, was bedeutet, daß der Klassifikator bei der Schätzung zu optimistisch (R (c) < c) oder zu pesimistisch (R (c) > c) bewertet. In dieser Weise wird in der Trainingsphase für jedes Bewertungsinkrement der Bewertungsskala ein Anteil R (c) richtiger Kennungen innerhalb des jeweiligen Inkrements bestimmt.

Es ergibt sich eine Zuordnung eines Anteils R (c) zu jedem Bewertungsinkrement c, welche als Kalibrierung der durch die Bewertung c geschätzten Glaubwürdigkeit auf eine ermittelte tatsächliche Zuverlässigkeit betrachtet werden kann.

Die in der Trainingsphase bestimmte Zuordnung von R (c) zu c wird als Kalibriervorschrift gespeichert. Im Erkennungsbetrieb werden dann die für unbekannte zu erkennende Objekte vom Klassifikator geschätzten Bewertungen c in einer Kalibrierstufe nach Maßgabe der gespeicherten Zuordnungsvorschrift durch die in der Trainingsphase ermittelten Anteile R (c) als kalibrierte Bewertungen ersetzt. Einer Kennungszuordnung in einer nachfolgenden Entscheiderstufe werden diese kalibrierten Bewertungen zugrunde gelegt.

Sofern nur ein Teil der Bewertungsskala interessant ist, z.B. durch eine Konzentration der bewerteten Kennungen im oberen Bereich der Bewertungsskala aufgrund einer Vorselektion in vorausgegangenen Verarbeitungsschritten, kann dieser Vorgang auf den interessanten Abschnitt der Skala beschränkt werden.

Für die Einstellung der Entscheidungsschwelle einer Entscheiderstufe kann sowohl für eine Zurückweisung als auch für eine Substitution je ein Kostengewichtsfaktor angesetzt werden, welche abhängig vom jeweiligen Einsatzfall sind.

Es zeigt sich, daß die derart kalibrierten Bewertungen bei einer festgelegten Kosten-Gewichtung von Substitutionen und Rückweisungen ohne weitere Kenntnisse, insbesondere ohne Kenntnis der Auftretenshäufigkeit der einzelnen Bewertungen eine kostenoptimale Einstellung der Entscheiderschwelle ermöglicht.

Die erfindungsgemäße Kalibrierung von Bewertungen ist in einer Ausführungsform mit kennungsspezifischer Kalibrierung besonders vorteilhaft zur Verringerung der Fehlerrate eines Erkennungssystems, welches die Möglichkeit einer gleichzeitigen Bewertung konkurrierender Kennungen für ein zu erkennendes Objekt vorsieht. Dabei wird die Erkenntnis genutzt, daß die kennungsspezifischen Zuordnungsvorschriften für verschiedenen Kennungen unterschiedliche Verläufe über der Bewertungsskala aufweisen und eine kennungsspezifische Kalibrierung eine Vertauschung der Rangfolge konkurrierender Kennungen und eine Verringerung der Fehlerrate bewirken kann. Vorzugsweise wird bei der kennungsspezifischen Kalibrierung die Kombination konkurrierender Kennungen berücksichtigt, wobei eine Beschränkung auf statistisch häufige Kombinationen zulässig ist. Ein Beispiel hierfür ist nachfolgend im Detail beschrieben.

Für zwei konkurrierende Kennungen A und B werden in einer Trainingsphase jeweils kennungsspezifische Kalibrierungen durchgeführt, indem in der beschriebenen Weise für jedes Bewertungsinkrement der Bewertungsskala alle Bewertungsvorgänge zu Kennungen A bzw. B sowie die dazu feststellbaren Anteile richtiger Kennungen ermittelt und als zwei Zuordnungsvorschriften RA(c) bzw. RB(c) gespeichert werden. Die gespeicherten Zuordnungsvorschriften sind in FIG. 2 als zwei Funktionskurven in einem R-c-Diagramm skizziert. Die Kurven haben im Regelfall für verschiedene Kennungen verschiedene Verläufe. Punktiert ist die Referenzlinie R(c) = c eingetragen. Im skizzierten Beispiel ist die Klassifikatorschätzung sowohl für A auch für B zu pessimistisch. Für ein konkretes zu erkennendes Objekt im Erkennungsbetrieb seien vom Klassifikator eine Bewertung coA zur Kennung A und eine niedrigere Bewertung coB zur Kennung B abgegeben worden. Aus der gespeicherten Kalibriervorschrift ist bekannt, daß die mit coA bewerteten Kennungen A in der Trainingsphase einen richtigen Anteil RA (coA) und die mit coB bewerteten Kennungen einen richtigen Anteil RB (coB) aufweisen. Erfindungsgemäß werden die vom Klassifikator geschätzten Bewertungen coA und coB durch die aus dem gespeicherten Kalibriervorschriften entnommen Werte für RA (coA) bzw. RB (coB ) als neue kalibrierte Bewertung c'oA bzw. c'oB ersetzt. In dem skizzierten Beispielsfall, in dem von coA > coB ausgegangen wurde, wird durch die Kalibrierung die Bewertungsrangfolge mit c'oA < c'oB umgekehrt.

Für die in FIG. 2 skizzierten Kalibrierkurven kann auch die Kombination konkurrierender Kennungen mit berücksichtigt werden, indem für die Erstellung der Kalibriervorschriften in der Trainingsphase nur die Fälle berücksichtigt werden, in denen die Kennungen A und B gleichzeitig bewertet werden. Diese Kombinationsauswertung kann auf die besonders häufig auftretetenden Kennungskombinationen beschränkt werden.

Für den Fall gleichzeitiger Bewertung von konkurrierenden Kennungen zu demselben Objekt wird vorzugsweise nur die nach der Kalibrierung am höchsten bewertete Kennung in der Entscheiderstufe dem Schwellwertvergleich unterzogen.


Anspruch[de]
  1. Mustererkennungsverfahren, bei welchem für ein zu erkennendes Objekt zu einer oder mehreren Kennungen aus einem vorgegebenen Kennungssatz je eine numerische diskrete Bewertung innerhalb einer Bewertungsskala geschätzt wird, und bei welchem in einer Entscheiderstufe auf der Grundlage dieser Bewertungen eine Entscheidung über die Zuordnung des zu erkennenden Objekts zu einer Kennung getroffen wird, dadurch gekennzeichnet, daß in einer Trainingsphase anhand eines bekannten Objektsatzes eine Kalibrierung der Bewertungen in der Weise stattfindet, daß zu jedem Inkrement c der Bewertungsskala der relative Anteilsfaktor R (c) der zutreffenden Kennungen innerhalb aller in dieses Bewertungsinkrement fallenden Bewertungsvorgänge ermittelt wird und daß im Erkennungsbetrieb jeweils die geschätzte Bewertung c durch den in der Trainingsphase dazu ermittelten Anteilsfaktor R (c) ersetzt wird.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Kalibrierung kennungsspezifisch erfolgt.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß bei der Kalibrierung Kombinationen konkurrierender Kennungen berücksichtigt werden.
  4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß in der Entscheiderstufe eine Entscheidung über eine Zuordnung anhand eines kennungsunabhängigen einstellbaren Schwellwerts getroffen wird.
  5. Verfahren nach einem der Ansprüche 1 bis 4, gekennzeichnet durch die Anwendung in Schriftenlesern.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com