PatentDe  


Dokumentenidentifikation DE10060146A1 20.06.2002
Titel Gesichtserkennungssystem und -verfahren zur Identifizierung von Personen
Anmelder Symtron Technology, Inc., Taipei, Taiwan, TW
Erfinder Yeh, Erliang, Taipei, TW
Vertreter BOEHMERT & BOEHMERT, 28209 Bremen
DE-Anmeldedatum 04.12.2000
DE-Aktenzeichen 10060146
Offenlegungstag 20.06.2002
Veröffentlichungstag im Patentblatt 20.06.2002
IPC-Hauptklasse G06K 9/62
Zusammenfassung Gesichtserkennungssystem (2) zur Identifizierung von Personen mit einem Bildeingabemittel zur Erzeugung von Bildern der Gesichter der Personen, einem Speichermittel zur Speicherung eines Referenzsatzes Bilder von Gesichtern als ein Satz invariante Gesichter in einem invarianten Raum, einem mit dem Bildeingabemittel gekoppelten Gesichtsdetektionsmittel zur Detektierung eines Gesichtsbereiches durch Auswahl eines Teils des erzeugten Bildes des Gesichtes, einem Gesichtsmerkmaldetektionsmittel zur Suche nach mehreren Gesichtsmerkmalen auf dem Gesichtsbereich und Wiedergabe jedes ermittelten Gesichtsmerkmals als ein invarianter Vektor in dem invarianten Raum und einem Gesichtserkennungsmittel zur Berechnung einer Entfernung zwischen den in varianten Vektoren der ermittelten Gesichtsmerkmale und dem Satz invariante Gesichter, die in dem Speichermittel gespeichert sind, und zur Erzeugung einer Zuverlässigkeitspunktzahl gemäß der Entfernung und Gesichtserkennungsverfahren.

Beschreibung[de]

Die vorliegende Erfindung betrifft ein Gesichtserkennungssystem, insbesondere ein Echtzeit- Gesichtserkennungssystem, insbesondere ein für Identifikationssysteme, die Gesichter von Menschen verwenden, nützliches Echtzeit-Gesichtsbild-Erkennungssystem, und ein Gesichtserkennungsverfahren zur Identifizierung von Personen.

Die Musteridentifikation bzw. -erkennung ist auf zahlreichen Gebieten anwendbar, beispielsweise als eine für Sicherheitssysteme verfügbare Gesichtsidentifikation bzw. -erkennung. Im Stand der Technik sind Techniken entwickelt worden, um eine Analyse und Identifizierung von Gesichtern von Menschen zu versuchen. Beispielsweise wurde ein Augenzwinkerverfahren vorgeschlagen, um Personen durch den Ort, die Gestalt und die Entfernung zwischen einem bestimmten Satz von Augen zu erkennen. Die Nase, der Mund und der Umriß des Gesichtes sind auch zur Identifizierung von Gesichtern verwendet worden. Zusätzlich sind eine Farbbildsegmentierung und die Invariant-Hadamard-Transformation in großem Maße zum Extrahieren von Gesichtsmerkmalen verwendet worden.

US-5,331,544, US-5,012,522 und US-4,975,960 offenbaren Verfahren zur Digitalisierung von Daten zur weiteren Verarbeitung. US-5,274,714 offenbart die Verwendung eines Framegrabber zur Digitalisierung von Daten, die nachfolgend von einem neuronalen Netzwerk zu verarbeiten sind. US-5,263,097 und US-5,255,347 beschreiben eine Merkmalsextraktion zur nachfolgenden Verarbeitung mit einem neuronalen Netzwerk.

Diese und andere Techniken teilen mehrere gemeinsame Probleme. Einige der Techniken können mehrere Stufen von komplexen Operationen zum Extrahieren von Merkmalen benötigen. Einige Techniken erfordern intensive Berechnungen, die zu einem Hindernis für die Systemgeschwindigkeit werden. Viele Erkennungstechniken sind nicht positions-, neigungs- und entfernungsinvariant und erfordern, daß die Person ihren Kopf in einer gewissen Position hält, wodurch die Verwendung derartiger Techniken bei Eingangskontrollanwendungen verhindert wird. Viele dieser Techniken erfordern das Speichern von Bildern von Gesichtern mit hoher Auflösung und/oder komplexen Merkmalsvektoren in einer Datenbank. Jeder dieser Nachteile schafft sowohl Geschwindigkeits- als auch Speicherplatzprobleme bei der Verwendung dieser Techniken in großen Datenbankanwendungen.

Andererseits beschreibt die Doktorarbeit von Erliang Yeh, Yale University, New Haven, 1997, mit dem Titel "Vision-Based Place Recognition for Mobile Robot" ein Verfahren zur Platzerkennung für mobile Roboter. Gemäß dieser Doktorarbeit werden die Plätze unter Verwendung eines Satzes Bilder des Platzes, die aus unterschiedlichen Beobachtungspunkten aufgenommen worden sind, modelliert. Sie werden durch Erstellen von Übereinstimmungen von Punkt- und Liniensegmentmerkmalen durch eine erzwungene Suche und geometrische Invarianten erkannt. Die erzwungene Bewegung eines mobilen Roboters verringert die Kombinatorik von Anpaßprozessen, was zu einer schnellen, effektiven Platzerkennung führt. Dieses Verfahren wird ein guter Weg für eine Gesichtserkennung sein.

Der Erfindung liegt somit die Aufgabe zugrunde, ein Gesichtserkennungssystem und ein Gesichtserkennungsverfahren für Echzeit-Anwendungen bereitzustellen.

Erfindungsgemäß wird diese Aufgabe gelöst durch ein Gesichtserkennungssystem zur Identifizierung von Personen mit einem Bildeingabemittel zur Erzeugung von Bildern der Gesichter der Personen, einem Speichermittel zur Speicherung eines Referenzsatzes Bilder von Gesichtern als ein Satz invariante Gesichter in einem invarianten Raum, einem mit dem Bildeingabemittel gekoppelten Gesichtsdetektionsmittel zur Detekierung eines Gesichtsbereiches durch Auswahl eines Teils des erzeugten Bildes des Gesichtes, einem Gesichtsmerkmaldetektionsmittel zur Suche nach mehreren Gesichtsmerkmalen auf dem Gesichtsbereich und Wiedergabe jedes ermittelten Gesichtsmerkmals als ein invarianter Vektor in dem invarianten Raum und einem Gesichtserkennungsmittel zur Berechnung einer Entfernung zwischen den invarianten Vektoren der ermittelten Gesichtsmerkmale und dem Satz invariante Gesichter, die in dem Speichermittel gespeichert sind, und zur Erzeugung einer Zuverlässigkeitspunktzahl gemäß der Entfernung.

Weiterhin wird diese Aufgabe gelöst durch ein Gesichtserkennungsverfahren zur Identifizierung von Personen, das die folgenden Schritte umfaßt: Erzeugen eines Bildes eines Gesichtes von den Personen durch ein Bildeingabemittel, Speichern eines Referenzsatzes Bilder von Gesichtern als ein Satz invariante Gesichter in einem invarianten Raum in einem Speichermittel, Detektieren eines Gesichtsbereiches durch Auswählen eines Teils des erzeugten Bildes des Gesichtes durch ein Gesichtsdetektionsmittel, Suchen nach mehreren Gesichtsmerkmalen auf dem Gesichtsbereich durch ein Gesichtsmerkmalsdetektionsmittel und Wiedergeben jedes ermittelten Gesichtsmerkmals als einen invarianten Vektor in dem invarianten Raum und Berechnen einer Entfernung zwischen den invarianten Vektoren der ermittelten Gesichtsmerkmale und dem Satz invariante Gesichter, die in dem Speichermittel gespeichert sind, durch ein Gesichtserkennungsmittel und Erzeugen einer Zuverlässigkeitspunktzahl gemäß der Entfernung.

Bei dem Gesichtserkennungssystem kann vorgesehen sein, daß das Speichermittel eine Datenbank für invariante Gesichter und eine Datenbank für invariante Gesichtsmerkmale umfaßt.

Günstigerweise umfaßt das Bildeingabemittel eine Videokamera und ein Videosteuergerät zur Aufzeichnung von RGB-Rohdaten des Bildes des Gesichtes.

Gemäß einer weiteren besonderen Ausführungsform der Erfindung kann vorgesehen sein, daß das Gesichtsdetektionsmittel durch ein Eingabemodul initialisierbar ist. Die Initialisierung dient zum Trainieren des Gesichtserkennungssystems.

Zweckermäßigerweise ist das Eingabemodul eine mit dem Gesichtserkennungssystem gekoppelte Mouse.

Außerdem kann vorgesehen sein, daß das Gesichtsdetektionsmittel ferner ein Bewegungsdetektionsmodul zur Detektion des Gesichtsbereiches des erzeugten Bildes des Gesichtes umfaßt.

Gemäß einer weiteren besonderen Ausführungsform der Erfindung umfaßt das Bewegungsdetektionsmodul ein Raum-Zeit-Filtermodul umfaßt, das aus einem Differenzbildungsmodul für rote Farbe, einem Differenzbildungsmodul für grüne Farbe, einem Differenzbildungsmodul für blaue Farbe und einem Differenzbildungsmodul für Hautfarbe besteht, wobei das Differenzbildungsmodul für rote Farbe zur Durchführung einer Differenzbildungsoperation für rote Farbe verwendet wird, das Differenzbildungsmodul für grüne Farbe zur Durchführung einer Differenzbildungsoperation für grüne Farbe verwendet wird, das Differenzbildungsmodul für blaue Farbe zur Durchführung einer Differenzbildungsoperation für blaue Farbe verwendet wird und das Differenzbildungsmodul für Hautfarbe zur Durchführung einer Differenzbildungsoperation für Hautfarbe verwendet wird.

Zweckmäßigerweise wird der Gesichtsbereich zur Anpassung an Kontrast- und Lichtintensitätsvariationen durch Normierchritte weiterverarbeitet.

Außerdem wird der Gesichtsbereich zweckmäßigerweise zur Anpassung an Größen-, Neigungs- und Drehvariationen durch Normierschritte weiterverarbeitet.

Vorteilhafterweise wird die Entfernung zwischen den invarianten Vektoren der ermittelten Gesichtsmerkmale und dem Satz in dem Speichermittel gespeicherte invariante Gesichter mittels eines Invariant-Hadamard-Transform-Algorithmus berechnet.

Bei dem Gesichtserkennungsverfahren kann vorgesehen sein, daß das Speichermittel eine Datenbank für invariante Gesichter und eine Datenbank für invariante Gesichtsmerkmale umfaßt, die durch die folgenden Schritte aufgebaut sind: Erzielen einer Datenbank für Gesichter mit mehreren Bildern von Gesichtern mittels des Bildeingabemittels, manuelles Durchführen eines Isolationsschrittes zur Lokalisierung von Merkmalen der Bilder von den Gesichtern, automatisches Durchführen eines Positionierschrittes zum Lokalisieren der Gesichter und der Merkmale der Bilder der Gesichter, automatisches Durchführen eines Normierschrittes und Erzielen der Datenbank für invariante Gesichter und der Datenbank für invariante Gesichtsmerkmale mittels einer Invariant-principal-component-Analyse.

Günstigerweise umfaßt das Bildeingabemittel eine Videokamera und ein Videosteuergerät zur Aufzeichnung von RGB-Rohdaten des Bildes des Gesichtes.

Zweckmäßigerweise wird das Gesichtsdetektionsmittel von einem Eingabemodul angetrieben.

Vorteilhafterweise ist das Eingabemodul eine mit dem Gesichtserkennungssystem gekoppelte Mouse.

Gemäß einer weiteren besonderen Ausführungsform der Erfindung kann vorgesehen sein, daß das Gesichtsdetektionsmittel ferner ein Bewegungsdetektionsmodul zur Detektion eines Gesichtsbereiches des erzeugten Bildes eines Gesichtes umfaßt, wobei das Bewegungsdetektionsmodul umfaßt: ein mit der Kamera gekoppeltes Raum-Zeit-Filtermodul zur Durchführung der Differenzbildungsoperationen bei wenigstens zwei aufeinanderfolgenden Bildern und ein mit dem Raum-Zeit-Filtermodul gekoppeltes Schwellwertoperationsmodul zur Identifizierung von Stellen eines Bildes, an denen eine Bewegung einen vorab festgelegten Schwellenwert überschreitet.

Eine weitere besondere Ausführungsform des Gesichtserkennungsverfahrens ist dadurch gekennzeichnet, daß das Raum-Zeit-Filtermodul aus einem Differenzbildungsmodul für rote Farbe, einem Differenzbildungsmodul für grüne Farbe, einem Differenzbildungsmodul für blaue Farbe und einem Differenzbildungsmodul für Hautfarbe besteht, wobei das Differenzbildungsmodul für rote Farbe zur Durchführung einer Differenzbildungsoperation für rote Farbe verwendet wird, das Differenzbildungsmodul für grüne Farbe zur Durchführung einer Differenzbildungsoperation für grüne Farbe verwendet wird, das Differenzbildungsmodul für blaue Farbe zur Durchführung einer Differenzbildungsoperation für blaue Farbe verwendet wird und das Differenzbildungsmodul für Hautfarbe zur Durchführung einer Differenzbildungsoperation für Hautfarbe verwendet wird.

Insbesondere kann dabei vorgesehen sein, daß der Gesichtsbereich durch ein Verfahren detektiert wird, das die folgenden Schritte umfaßt: Verwenden des Gesichtsdetektionsmoduls für die Entscheidung, ob sich das von dem Bildeingabemittel erzeugte Bild eines Gesichtes in Bewegung befindet, Verwenden des Gesichtsdetektionmoduls nur zum Aufsuchen eines sich bewegenden Gebietes des Bildes des Gesichtes, wenn sich das von dem Bildeingabemittel erzeugte Bild des Gesichtes in Bewegung befindet, Verwenden des Gesichtsdetektionsmoduls zum Aufsuchen des gesamten Gebietes des Bildes des Gesichtes, wenn sich das von dem Bildeingabemittel erzeugte Bild des Gesichtes nicht in Bewegung befindet, Anwenden von Mehrfachgesichtsschablonen, um eine Größenanpassung des Bildes des Gesichtes vorzunehmen, Projizieren des Bildes des Gesichtes in einen invarianten Raum und Bestimmen eines wahrscheinlichsten Ortes mittels einer Entfernungsmessung.

Zweckmäßigerweise wird die Vielzahl von Gesichtsmerkmalen durch ein Verfahren erzielt, daß die folgenden Schritt umfaßt: Senden des von dem Gesichtsdetektionsmodul detektieren Gesichtsbereiches zum Gesichtsmerkmalsdetektionsmodul, Verwenden des Gesichtsmerkmalsdetektionsmoduls zum Auffinden eines beschränkten Gebietes für jedes Merkmal, Anwenden von mehreren Merkmalsschablonen zur Anpassung der Größe des Merkmals, Projizieren des Merkmals in einen invarianten Raum und Auffinden der Vielzahl von Gesichtsmerkmalen.

Zweckmäßigerweise ist dabei vorgesehen, daß der Gesichtsbereich zur Anpassung an Kontrast- und Lichtintensitätsvariationen durch Normierschritte weiterverarbeitet wird.

Insbesondere kann dabei vorgesehen sein, daß die Normierschritte umfassen: Erzielen eines Mittelwertes und einer Abweichung der Lichtverteilung des Bildes des Gesichtes, Projizieren des Mittelwertes der Lichtverteilung auf ein vorab festgelegtes Niveau und Auseinanderziehen der Lichtverteilung zu einer vorab festgelegten Kurvengestalt.

Wiederum zweckmäßigerweise wird der Gesichtsbereich zur Anpassung an Größen-, Neigungs- und Drehvariationen durch Normierschritte weiterverarbeitet.

Insbesondere kann dabei vorgesehen sein, daß die Normierschritte umfassen: Normieren des Bildes des Gesichtes auf eine vorab festgelegte Größe, Abtrennen von Bildpunkten an vier Ecken des Bildes des Gesichtes und Erzielen eines standardisierten invarianten Vektors des Bildes des Gesichtes.

Schließlich kann bei dem Gesichtserkennungsverfahren vorgesehen sein, daß die Entfernung zwischen den invarianten Vektoren der ermittelten Gesichtsmerkmale und dem Satz in dem Speichermittel gespeicherte invariante Gesichter mittels eines Invariant-Hadamard- Transform-Algorithmus berechnet wird.

Das Gesichtserkennungssystem und das Gesichtserkennungsverfahren gemäß der vorliegenden Erfindung sind für einen Echtzeit-Betrieb geeignet und bieten sich insbesondere zur Bestimmung eines Zutritts zu einem Raum oder zur Überwachung an.

Bei einer besonderen Ausführungsform des Gesichtserkennungsverfahrens sind Initialisieroperationen zur Produktentwicklung des Gesichtserkennungssystems und zum Trainieren desselben vorgesehen. Als erstes wird eine Datenbank für Gesichter mit mehreren Bildern von Gesichtern mittels einer Videokamera erzielt. Danach wird zur Isolierung der wichtigen Eigenschaften der Bilder der Gesichter in der Datenbank für Gesichter ein Isolierschritt manuell durchgeführt, um die Merkmale zu lokalisieren. Zur Positionierung der Merkmale wird ein Positionierschritt automatisch durchgeführt, um die Gesichter und eine Vielzahl von Eigenschaften zu lokalisieren. Nachfolgend wird ein Normierschritt zur Anpassung an Kontrast- und Intensitätsvariationen und zur Anpassung an Größen-, Neigungs- und Drehvariationen automatisch durchgeführt. Schließlich wird mittels der Invariant-principal-component- Analyse und KL-Komprimierung die Verteilung der Vektoren für den Referenzsatz von Gesichtern hinsichtlich der invarianten Gesichter charakterisiert und werden eine Datenbank für invariante Gesichter und eine Datenbank für invariante Gesichtsmerkmale auch erzielt.

Weitere Merkmale und Vorteile der Erfindung ergeben sich aus den Ansprüchen und aus der nachstehenden Beschreibung, in der ein Ausführungsbeispiel anhand der schematischen Zeichnungen im einzelnen erläutert ist. Dabei zeigt:

Fig. 1 ein Funktionsblockdiagramm eines Gesichtserkennungssystems gemäß einer besonderen Ausführungsform der vorliegenden Erfindung; und

Fig. 2 ein Ablaufdiagramm eines Gesichtserkennungsverfahrens gemäß einer besonderen Ausführungsform der Erfindung.

Fig. 1 zeigt ein Gesichtserkennungssystem 2 gemäß einer besonderen Ausführungsform der vorliegenden Erfindung. Das Gesichtserkennungssystem 2 besteht aus einer Videokamera 4 zur Aufnahme eines Gesichtsscans bzw. -bildes einer Person und einem Computer 6 zur Bildverarbeitung und Datenbankverwaltung. Die Videokamera 4 ist im allgemeinen auf oder nahe bei dem Computer 6 zum Erzeugen eines Bildes des Gesichtes des Benutzers aufgestellt.

Der Computer 6 besteht aus einem Videomodul 8, einem Gesichtsdetektionsmodul 10, einem Gesichtsmerkmalsdetektionsmodul 12, einem Gesichtserkennungsmodul 14, einer Referenzdatenbank 16 und einem Eingabe/Ausgabe-Interface 18.

Das Videomodul 8 ist zum Empfangen des Gesichtsbildes des Benutzers, das von der Videokamera 4 erzeugt ist, mit der Videokamera 4 gekoppelt. Das Gesichtsdetektionsmodul 10 ist zur Detektierung des Gesichtsbereiches durch Auswahl eines Teils des erzeugten Gesichtsbildes mit dem Videomodul 8 gekoppelt. Das Gesichtsdetektionsmodul 10 untersucht alle vorgeschlagenen Orte möglicher Gesichtsobjekte und wendet den Invariant-Hadamard-Transform- Algorithmus zur Bestimmung des wahrscheinlichsten Bereiches des Gesichtes an.

Die Referenzdatenbank 16 besteht aus einer Datenbank für invariante Gesichter und einer Datenbank für invariante Gesichtsmerkmale zum Speichern eines Referenzsatzes Bilder von Gesichtern als ein Satz invariante Gesichter in einem invarianten Raum.

Das Gesichtsmerkmalsdetektionsmodul 12 ist zum Aufsuchen mehrerer Gesichtsmerkmale auf dem von dem Gesichtsdetektionsmodul 10 detektierten Gesichtsbereich und Wiedergeben jedes ermittelten Gesichtsmerkmals als ein invarianter Vektor in dem invarianten Raum mit dem Gesichtsdetektionsmodul 10 und der Referenzdatenbank 16 gekoppelt. Das Gesichtsmerkmalsdetektionsmodul 12 sucht nach markanten Gesichtsmerkmalen, wie z. B. die Augen, Nase und Mund.

Das Gesichtserkennungsmodul 14 ist für einen Vergleich mit live aufgezeichneten, extrahierten Gesichtsmerkmalen mit den gespeicherten Gesichtsmerkmalen in der Datenbank für invariante Gesichter und der Datenbank für invariante Gesichtsmerkmale und zum Erzeugen einer Zuverlässigkeitspunktzahl gemäß dem Vergleichsergebnis mit dem Gesichtsmerkmalsdetektionsmodul 12 und der Referenzdatenbank 16 gekoppelt.

Zur Durchführung seiner Erkennungsfunktionen benutzt das Gesichtserkennungsmodul 14 eine mehrdimensionale Wiedergabe, bei der die Bilder der Gesichter durch einen Satz invariante Vektoren oder "invariante Gesichter" charakterisiert sind. Im allgemeinen wird gemäß dieser Technik jedes Bild als ein Vektor in einem hochdimensionalen invarianten Raum wiedergegeben, in dem jedes Merkmal des Bildes durch eine entsprechende Dimension wiedergegeben wird. Die Dimension des invarianten Raumes hängt somit von der Anzahl der wiedergegebenen Merkmale ab und kann für jedes vernünftig dimensionierte Bild sehr groß werden.

Die Bilder der Gesichter werden, wie alle anderen möglichen Bilder, durch Vektoren in diesem invarianten Raum wiedergegeben. Die Verteilung der Gesichter neigt jedoch dazu, innerhalb eines Bereiches des invarianten Raumes gruppiert zu sein. Somit kann die Verteilung der Gesichter des Referenzsatzes durch Verwendung von Invariant-principal-component-Analyse (Invariant-Hadamard-Transformation) charakterisiert werden. Jeder Gesichtsbildort in dem invarianten Raum trägt zu jedem invarianten Vektor bei, so daß jeder invariante Vektor eine Sorte eines Geistergesichtes wiedergibt, das hierin als ein invariantes Gesicht bezeichnet wird.

Das Eingabe/Ausgabe-Interface 18 ist mit einer Vielzahl von Eingabe- und Ausgabegeräten, wie z. B. einer Mouse, einem Bildschirm, einer Tastatur usw. gekoppelt. Über das Eingabe/Ausgabe-Interface 18 kann von dem Benutzer eine Initialisierung vorgenommen werden.

Über das Eingabe/Ausgabe-Interface 18 kann dem Benutzer auch das Erkennungsergebnis angezeigt werden.

Fig. 2 zeigt ein Ablaufdiagramm eines Gesichtserkennungsverfahrens gemäß einer besonderen Ausführungsform der Erfindung. Als erstes wird das Bild eines Gesichtes von der Videokamera 4 aufgezeichnet (Schritt 200). Danach wird von dem Gesichtsdetektionsmodul 10 ein Gesichtsbereich aufgesucht (Schritt 201) und werden mehrere Gesichtsmerkmale von dem Gesichtsmerkmalsdetektionsmodul 12 aufgefunden (Schritt 202). Dann wird von dem Gesichtserkennungsmodul 14 ein Normierschritt zur Anpassung an Kontrast- und Lichtintensitätsvariationen und zur Anpassung an Größen-, Neigungs- und Drehvariationen durchgeführt (Schritt 203). Nachfolgend wird von dem Gesichtserkennungsmodul 14 ein invariantes Gesicht erzielt (Schritt 204). Während des Trainingsvorgangs zur Produktentwicklung wird ein Trainingsvorgang durchgeführt (Schritt 205) und eine Datenbank für invariante Gesichter und eine Datenbank für invariante Gesichtsmerkmale erzielt (Schritt 206). In der Datenbank für invariante Gesichter wird das Bild des Gesichtes in den invarianten Raum projiziert. In der Datenbank für invariante Gesichtsmerkmale werden mehrere Gesichtsmerkmale in den invarianten Raum projiziert und charakterisiert durch (X1, X2, . . . Xn), wobei n die Anzahl der Gesichtsmerkmale ist. Andererseits wird während des Erkennungsprozesses die Gesichtserkennung von dem Gesichtserkennungsmodul 14 durch Verwendung einer Erkennungsfunktion I (X1, X2 . . . Xn) = konstant durchgeführt (Schritt 207).

In der Doktorarbeit von Erliang Yeh, Yale University, New Haven, 1997, mit dem Titel "Vision-Based Place Recognition for Mobile Robot" ist eine Erkennungsfunktion zur Objekterkennung beschrieben. Aus einem Satz von m Merkmalen, der als das Modell M bezeichnet wird, kann eine Kennungsfunktion I(a) mit reellen Werten konstruiert werden, wobei a ein Vektor der Gesichtsbildmessung ist. Die Erkennungsfunktion I (a) nimmt für ein Bild des Modells M von jedem Betrachtungspunkt den Wert null an. Wenn somit ein Bild mit n Merkmalen vorliegt, besteht ein Algorithmus zum Erkennen von M darin, alle (n m) Untergruppen von m Merkmalen zu wählen und I(a) zu berechnen. Die Untergruppe von m Merkmalen, bei der |I(a)| minimal wird, wird als das erkannte Gesicht angesehen. Unter Berücksichtigung des Rauschens des Gesichtsbildes wird die Erkennungsfunktion nicht genau den Wert null annehmen. Daher wird ein Bereich R von Werten verwendet. Wenn I(a)∈ R, dann wird davon ausgegangen, daß a sich anhand eines Beispiels des Modells M ergibt. Zwei ähnliche Gesichter sind wahrscheinlich von vielen Beobachtungspunkten aus nicht unterscheidbar, da deren Bilder ähnlich sind; demzufolge kann I(a) für die Bilder beider Objekte in R liegen. Zur Bestimmung des optimalen R im Bayesschen Sinne ist es notwendig, die Wahrscheinlichkeitsverteilung zu bestimmen, die sich aus der Anwendung der Erkennungsfunktion auf verrauschte Bilddaten über den Satz von Beobachtungspunkten ergibt, für die die Merkmale sichtbar sind.

In einer Ausführungsform der vorliegenden Erfindung umfaßt die Gesichtserkennung Initialisiervorgänge zur Produktentwicklung des Gesichtserkennungssystems, um das Gesichtserkennungssystem zu trainieren. Als erstes wird eine Datenbank für Gesichter mit mehreren Bildern von Gesichtern mittels der Videokamera 4 erzielt. Danach wird zur Isolierung der wichtigen Merkmale der Bilder der Gesichter in der Datenbank für Gesichter ein Isolierschritt manuell durchgeführt, um die Merkmale zu lokalisieren. Zur Positionierung der Merkmale wird ein Positionierschritt automatisch durchgeführt, um die Gesichter und mehrere Merkmale zu lokalisieren. Danach wird zur Anpassung an Kontrast- und Lichtintensitätsvariationen und zur Anpassung an Größen-, Neigungs- und Drehvariationen ein Normierschritt automatisch durchgeführt. Schließlich wird mittels der Invariant-principal-component-Analyse und KL-Komprimierung die Verteilung von Vektoren für den Referenzsatz Gesichter in invarianten Gesichtern charakterisiert und werden auch eine Datenbank für invariante Gesichter und eine Datenbank für invariante Gesichtsmerkmale erzielt.

Gemäß einer Ausführungsform der vorliegenden Erfindung wird die Aufzeichnung eines Gesichtsbildes wie folgt durchgeführt. Das mit der Videokamera 4 gekoppelte Videomodul 8 besteht aus einem Video-Interface und einer Videoverarbeitungs-Software, wie Video for Windows (VFB) von Microsoft, oder irgendeine andere Video-Verarbeitungs-Software. Sobald ein Bild eines Gesichtes von der Videokamera 4 erzeugt wird, wird das Bild des Gesichtes über ein Videosteuergerät in das Videomodul 8 geschickt und von der Video- Verarbeitungs-Software verarbeitet. Als Ergebnis werden die RGB (Rot, Grün und Blau)- Rohdaten oder Grauwertdaten des Bildes des Gesichtes eines Benutzers erhalten. Die Aufzeichnung des Bildes des Gesichtes kann automatisch durchgeführt oder von dem Benutzer mittels des Eingabe/Ausgabe-Interfaces 18 ausgelöst werden.

Gemäß einer Ausführungsform der vorliegenden Erfindung läuft der Initialisierschritt für eine Benutzer wie folgt ab. Wie oben erwähnt, kann der Detektionsvorgang des Gesichtsdetektionsmoduls 10 von dem Benutzer durch eine mit dem Eingabe/Ausgabe-Interface 18 gekoppelte Mouse ausgelöst werden. Nachdem der Mouseklick-Schritt von dem Benutzer durchgeführt worden ist, wird das Gesichtsdetektionsmodul 10 gestartet, um das Gesichtsgebiet durch Auswahl eines Teils des Bildes des Gesichtes zu detektieren. Als Ergebnis werden die Orte des Gesichts und mehrere Merkmale über das Eingabe/Ausgabe-Interface 18 auf dem Bildschirm dargestellt.

Der Initialisierschritt muß nicht notwendigerweise von der Mouse durchgeführt werden. Der Detektionsvorgang des Gesichtsdetektionsmoduls 10 kann von allen anderen Eingabemodulen, die mit dem Eingabe/Ausgabe-Interface 18 gekoppelt sind, wie z. B. eine Tastatur, ein Schallsensor, ein Touch panel usw., ausgelöst werden.

In einer Ausführungsform der vorliegenden Erfindung ist ein Bewegungsdetektionsmodul zum Lokalisieren und Verfolgen der Position des Gesichtes irgendeines Benutzers innerhalb der Szenensicht von der Videokamera 4 durch Implementierung eines Bewegungsdetektions- Algorithmus in dem Gesichtsdetektionsmodul 10 vorgesehen. Es wird eine Abfolge von Bildern von Gesichtern von der Videokamera 4 aufgezeichnet und dann über ein Raum-Zeit- Filtermodul geleitet, das Bildorte betont, die sich mit der Zeit ändern. Das Raum-Zeit- Filtermodul identifiziert die Bewegungsorte durch Durchführung von Differenzbildungsoperationen an wenigstens zwei aufeinanderfolgenden Bildern mittels eines Differenzbildungsmoduls für rote Farbe, eines Differenzbildungsmoduls für grüne Farbe, eines Differenzbildungsmoduls für blaue Farbe und eines Differenzbildungmoduls für Hautfarbe. Das Differenzbildungsmodul für rote Farbe, das Differenzbildungsmodul für grüne Farbe, das Differenzbildungsmodul für blaue Farbe und das Differenzbildungsmodul für Hautfarbe werden zur Durchführung von jeweiligen Differenzbildungsoperationen für rote Farbe, grüne Farbe, blaue Farbe und Hautfarbe verwendet. In der Ausgabe des Raum-Zeit-Filtermoduls leuchtet das sich bewegende Gesicht auf, während die anderen Gebiete des Bildes, die keine Bewegung enthalten, schwarz erscheinen.

Ein Schwellenwertmodul, das mit dem Raum-Zeit-Filtermodul gekoppelt ist, erzeugt ein binäres Bewegungsbild, das die Orte des Bildes identifiziert, bei denen die Bewegung einen vorab festgelegten Schwellenwert überschreitet. Das heißt, es lokalisiert die Gebiete des Bildes, die die meiste Bewegung enthalten. In all diesen Gebieten wird das Vorhandensein einer Person postuliert.

In einer Ausführungsform der vorliegenden Erfindung sieht der Betrieb des Gesichtsdetektionsmoduls im Detail wie folgt aus: Wie oben erwähnt, entscheidet das Bewegungsdetektionsmodul, ob sich das von der Videokamera aufgezeichnete Bild des Gesichtes in Bewegung befindet. Wenn sich das Bild des Gesichtes in Bewegung befindet, kann das Suchgebiet des Gesichtsdetektionsmoduls auf die in Bewegung befindlichen Objekte beschränkt werden. Andernfalls muß das gesamte Bild von dem Gesichtsdetektionsmodul abgesucht werden. Nachfolgend werden Mehrfachgesichtsschablonen zur Anpassung der Größe des Bildes des Gesichtes angewendet. Nachdem es auf ein kanonisches Gesicht normiert worden ist, wird das Bild des Gesichtes in den invarianten Raum projiziert. Schließlich wird der wahrscheinlichste Ort als das Gesicht bestimmt.

In einer Ausführungsform der vorliegenden Erfindung sieht der Betrieb des Gesichtsmerkmalsdetektionsmoduls im Detail wie folgt aus. Als erstes wird der von dem Gesichtsdetektionsmodul detektierte Gesichtsort zum Gesichtsmerkmalsdetektionsmodul geschickt. Für jedes Merkmal auf dem Bild des Gesichtes wird von dem Gesichtsmerkmalsdetektionsmodul ein begrenztes Gebiet erhalten. Nachfolgend werden Mehrfachmerkmalschablonen zur Anpassung der Größe des Merkmals angewandt. Nach Projektion der Gesichtsmerkmale in den invarianten Raum wird eine vorab festgelegte Anzahl (beispielsweise zehn) von Auswahlen jedes Merkmals ermittelt. Schließlich wird die beste Kombination der Gesichtsmerkmale durch Anwenden mehrerer globaler Bedingungen und mehrerer lokaler Bedingungen aufgefunden. Ein Beispiel einer globalen Bedingung ist der Ort des Gesichtes, und einige Beispiele für die lokalen Bedingungen sind die Verhältnisse und relativen Orte der Merkmale. Während des Prozesses können m der n detektierten Gesichtsmerkmale an m Modellmerkmale angepaßt werden, die in der Datenbank für invariante Gesichtsmerkmale gespeichert sind; es wird dann eine Bedingung ausgewertet, um zu bestimmen, ob die Übereinstimmung gültig ist. Wenn sie gültig ist, wird ein weiteres Modellmerkmal ausgewählt; alle n - m verbleibenden Gesichtsmerkmale werden an die Modellmerkmale angepaßt, und diese hypothetischen Übereinstimmungen werden unter Verwendung einer weiteren Bedingung, die eine Funktion der m + 1 Merkmalübereinstimmungen ist, verifiziert. Dieser Suchprozeß kann wie ein Baum strukturiert sein, und der Baum wird typischerweise zuerst der Breite nach abgesucht.

In einer Ausführungsform der vorliegenden Erfindung läuft der Normieralgorithmus zur Anpassung an Kontrast- und Lichtintensitätsvariationen im Detail wie folgt ab. Zur Anpassung an Kontrast- und Lichtintensitätsvariationen werden der Mittelwert und die Abweichung des Lichtes des Bildes des Gesichtes als eine Lichtverteilung erhalten. Danach wird das Lichtniveau des Mittelwertes der Lichtverteilung zur Anpassung der Lichtintensität auf ein vorab festgelegtes Niveau projiziert. Nachfolgend wird die Lichtverteilung des Bildes des Gesichtes zur Anpassung des Kontrastes auf eine vorab festgelegte Kurvengestalt auseinandergezogen.

Der Extraktor des invarianten Merkmals gemäß der vorliegenden Erfindung gehört zu einer Klasse von invarianten Algorithmen, wie z. B. rotationsinvariant, maßstabsinvariant und positionsinvariant. In einer Ausführungsform der vorliegenden Erfindung sieht der Normieralgorithmus zur Anpassung an Größen-, Neigungs- und Drehvariationen im Detail wie folgt aus.

Zur Anpassung an Größen-, Neigungs- und Drehvariationen wird das Bild des Gesichtes auf eine vorab festgelegte Größe, wie z. B. 32 Pixel × 48 Pixel normiert. Danach wird die Drehanpassung gemäß den Merkmalsorten durchgeführt. Nachdem die Normierschritte zur Anpassung an Kontrast- und Lichtintensitätsvariationen durchgeführt worden sind, werden die Bildpunkte an den vier Ecken des Gesichtsbildes abgetrennt, um Haar- oder Kinnvariationen zu beseitigen. Schließlich wird ein standardisierter invarianter Vektor des Bildes des Gesichtes erhalten.

In einer Ausführungsform der vorliegenden Erfindung wird ein Invariant-Hadamard- Transform-Algorithmus zur Bewertung der Ähnlichkeit von zwei Bildern von Gesichtern durchgeführt. Sobald der standardisierte invariante Vektor des Gesichtsbildes in der oben beschriebenen Weise erhalten worden ist, wird ein XYI-Algorithmus zum Analysieren des standardisierten invarianten Vektor durchgeführt. Nachdem der standardisierte invariante Vektor des Gesichtsbildes in den invarianten Raum projiziert worden ist, werden einige Schritte zur statistischen Analyse, wie Multi-Gaussian-Analyse, durchgeführt. Schließlich wird der Grad der Ähnlichkeit zwischen dem standardisierten invarianten Vektor des Gesichtsbildes und den in der Datenbank für invariante Gesichter gespeicherten Gesichtern berechnet und eine Zuverlässigkeitspunktzahl erzeugt.

Die in der vorstehenden Beschreibung, in den Zeichnungen sowie in den Ansprüchen offenbarten Merkmale der Erfindung können sowohl einzeln als auch in beliebigen Kombinationen für die Verwirklichung der Erfindung in ihren verschiedenen Ausführungsformen wesentlich sein.


Anspruch[de]
  1. 1. Gesichtserkennungssytem (2) zur Identifizierung von Personen mit

    einem Bildeingabemittel zur Erzeugung von Bildern der Gesichter der Personen,

    einem Speichermittel zur Speicherung eines Referenzsatzes Bilder von Gesichtern als ein Satz invariante Gesichter in einem invarianten Raum,

    einem mit dem Bildeingabemittel gekoppelten Gesichtsdetektionsmittel zur Detekierung eines Gesichtsbereiches durch Auswahl eines Teils des erzeugten Bildes des Gesichtes,

    einem Gesichtsmerkmaldetektionsmittel zur Suche nach mehreren Gesichtsmerkmalen auf dem Gesichtsbereich und Wiedergabe jedes ermittelten Gesichtsmerkmals als ein invarianter Vektor in dem invarianten Raum und

    einem Gesichtserkennungsmittel zur Berechnung einer Entfernung zwischen den invarianten Vektoren der ermittelten Gesichtsmerkmale und dem Satz invariante Gesichter, die in dem Speichermittel gespeichert sind, und zur Erzeugung einer Zuverlässigkeitspunktzahl gemäß der Entfernung.
  2. 2. Gesichtserkennungssystem nach Anspruch 1, dadurch gekennzeichnet, daß das Speichermittel eine Datenbank für invariante Gesichter und eine Datenbank für invariante Gesichtsmerkmale umfaßt.
  3. 3. Gesichtserkennungssystem nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß das Bildeingabemittel eine Videokamera (4) und ein Videosteuergerät zur Aufzeichnung von RGB-Rohdaten der Bilder von Gesichtern umfaßt.
  4. 4. Gesichtserkennungssystem nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß das Gesichtsdetektionsmittel durch ein Eingabemodul initialisierbar ist.
  5. 5. Gesichtserkennungssystem nach Anspruch 4, dadurch gekennzeichnet, daß das Eingabemodul eine mit dem Gesichtserkennungssystem gekoppelte Maus ist.
  6. 6. Gesichtserkennungssystem nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß das Gesichtsdetektionsmittel ferner ein Bewegungsdetektionsmodul zur Detektion des Gesichtsbereiches des erzeugten Bildes des Gesichtes umfaßt.
  7. 7. Gesichtserkennungssystem nach Anspruch 6, dadurch gekennzeichnet, daß das Bewegungsdetektionsmodul ein Raum-Zeit-Filtermodul umfaßt, das aus einem Differenzbildungsmodul für rote Farbe, einem Differenzbildungsmodul für grüne Farbe, einem Differenzbildungsmodul für blaue Farbe und einem Differenzbildungsmodul für Hautfarbe besteht, wobei das Differenzbildungsmodul für rote Farbe zur Durchführung einer Differenzbildungsoperation für rote Farbe verwendet wird, das Differenzbildungsmodul für grüne Farbe zur Durchführung einer Differenzbildungsoperation für grüne Farbe verwendet wird, das Differenzbildungsmodul für blaue Farbe zur Durchführung einer Differenzbildungsoperation für blaue Farbe verwendet wird und das Differenzbildungsmodul für Hautfarbe zur Durchführung einer Differenzbildungsoperation für Hautfarbe verwendet wird.
  8. 8. Gesichtserkennungssystem nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß der Gesichtsbereich zur Anpassung an Kontrast- und Lichtintensitätsvariationen durch Normierschritte weiterverarbeitet wird.
  9. 9. Gesichtserkennungssystem nach Anspruch 1, dadurch gekennzeichnet, daß der Gesichtsbereich zur Anpassung an Größen-, Neigungs- und Drehvariationen durch Normierschritte weiterverarbeitet wird.
  10. 10. Gesichtserkennungssystem nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß die Entfernung zwischen den invarianten Vektoren der ermittelten Gesichtsmerkmale und dem Satz in dem Speichermittel gespeicherter invarianter Gesichter mittels eines Invariant-Hadamard-Transform-Algorithmus berechnet wird.
  11. 11. Gesichtserkennungsverfahren zur Identifizierung von Personen, das die folgenden Schritte umfaßt:
    1. - Erzeugen eines Bildes eines Gesichtes von den Personen durch ein Bildeingabemittel,
    2. - Speichern eines Referenzsatzes Bilder von Gesichtern als ein Satz invariante Gesichter in einem invarianten Raum in einem Speichermittel,
    3. - Detektieren eines Gesichtsbereiches durch Auswählen eines Teils des erzeugten Bildes des Gesichtes durch ein Gesichtsdetektionsmittel,
    4. - Suchen nach mehreren Gesichtsmerkmalen auf dem Gesichtsbereich durch ein Gesichtsmerkmalsdetektionsmittel und Wiedergeben jedes ermittelten Gesichtsmerkmals als einen invarianten Vektor in dem invarianten Raum und
    5. - Berechnen einer Entfernung zwischen den invarianten Vektoren der ermittelten Gesichtsmerkmale und dem Satz invariante Gesichter, die in dem Speichermittel gespeichert sind, durch ein Gesichtserkennungsmittel und Erzeugen einer Zuverlässigkeitspunktzahl gemäß der Entfernung.
  12. 12. Gesichtserkennungsverfahren nach Anspruch 11, dadurch gekennzeichnet, daß das Speichermittel eine Datenbank für invariante Gesichter und eine Datenbank für invariante Gesichtsmerkmale umfaßt, die durch die folgenden Verfahrensschritte aufgebaut sind:
    1. - Erzielen einer Datenbank für Gesichter mit mehreren Bildern von Gesichtern mittels des Bildeingabemittels,
    2. - manuelles Durchführen eines Isolationsschrittes zur Lokalisierung von Merkmalen der Bilder von den Gesichtern,
    3. - automatisches Durchführen eines Positionierschrittes zum Lokalisieren der Gesichter und der Merkmale der Bilder der Gesichter,
    4. - automatisches Durchführen eines Normierschrittes und
    5. - Erzielen der Datenbank für invariante Gesichter und der Datenbank für invariante Gesichtsmerkmale mittels einer Invariant-principal-component-Analyse.
  13. 13. Gesichtserkennungsverfahren nach Anspruch 11 oder 12, dadurch gekennzeichnet, daß das Bildeingabemittel eine Videokamera und ein Videosteuergerät zur Aufzeichnung von RGB-Rohdaten des Bildes des Gesichtes umfaßt.
  14. 14. Gesichtserkennungsverfahren nach einem der Ansprüche 11 bis 13, dadurch gekennzeichnet, daß das Gesichtsdetektionsmittel von einem Eingabemodul angetrieben wird.
  15. 15. Gesichtserkennungsverfahren nach einem der Ansprüche 11 bis 14, dadurch gekennzeichnet, daß das Eingabemodul eine mit dem Gesichtserkennungssystem gekoppelte Mouse ist.
  16. 16. Gesichtserkennungsverfahren nach einem der Ansprüche 11 bis 15, dadurch gekennzeichnet, daß das Gesichtsdetektionsmittel ferner ein Bewegungsdetektionsmodul zur Detektion eines Gesichtsbereiches des erzeugten Bildes eines Gesichtes umfaßt, wobei das Bewegungsdetektionsmodul umfaßt:
  17. - ein mit der Kamera gekoppeltes Raum-Zeit-Filtermodul zur Durchführung der Differenzbildungsoperationen bei wenigstens zwei aufeinanderfolgenden Bildern und
    1. - ein mit dem Raum-Zeit-Filtermodul gekoppeltes Schwellwertoperationsmodul zur Identifizierung von Stellen eines Bildes, an denen eine Bewegung einen vorab festgelegten Schwellenwert überschreitet.
  18. 17. Gesichtserkennungsverfahren nach einem der Ansprüche 11 bis 16, dadurch gekennzeichnet, daß das Raum-Zeit-Filtermodul aus einem Differenzbildungsmodul für rote Farbe, einem Differenzbildungsmodul für grüne Farbe, einem Differenzbildungsmodul für blaue Farbe und einem Differenzbildungsmodul für Hautfarbe besteht, wobei das Differenzbildungsmodul für rote Farbe zur Durchführung einer Differenzbildungsoperation für rote Farbe verwendet wird, das Differenzbildungsmodul für grüne Farbe zur Durchführung einer Differenzbildungsoperation für grüne Farbe verwendet wird, das Differenzbildungsmodul für blaue Farbe zur Durchführung einer Differenzbildungsoperation für blaue Farbe verwendet wird und das Differenzbildungsmodul für Hautfarbe zur Durchführung einer Differenzbildungsoperation für Hautfarbe verwendet wird.
  19. 18. Gesichtserkennungsverfahren nach Anspruch 17, dadurch gekennzeichnet, daß der Gesichtsbereich durch ein Verfahren detektiert wird, das die folgenden Schritte umfaßt:
    1. - Verwenden des Gesichtsdetektionsmoduls für die Entscheidung, ob sich das von dem Bildeingabemittel erzeugte Bild eines Gesichtes in Bewegung befindet,
    2. - Verwenden des Gesichtsdetektionsmoduls nur zum Aufsuchen eines sich bewegenden Gebietes des Bildes des Gesichtes, wenn sich das von dem Bildeingabemittel erzeugte Bild des Gesichtes in Bewegung befindet,
    3. - Verwenden des Gesichtsdetektionsmoduls zum Aufsuchen des gesamten Gebietes des Bildes des Gesichtes, wenn sich das von dem Bildeingabemittel erzeugte Bild des Gesichtes nicht in Bewegung befindet,
    4. - Anwenden von Mehrfachgesichtsschablonen, um eine Größenanpassung des Bildes
    5. - des Gesichtes vorzunehmen,
    6. - Projizieren des Bildes des Gesichtes in einen invarianten Raum und
    7. - Bestimmen eines wahrscheinlichsten Ortes mittels einer Entfernungsmessung.
  20. 19. Gesichtserkennungsverfahren nach einem der Ansprüche 11 bis 18, dadurch gekennzeichnet, daß die Vielzahl von Gesichtsmerkmalen durch ein Verfahren erhalten wird, das die folgenden Schritte aufweist:
    1. - Senden des von dem Gesichtsdetektionsmodul detektierten Gesichtsbereiches zum Gesichtsmerkmalsdetektionsmodul,
    2. - Verwenden des Gesichtsmerkmalsdetektionsmoduls zum Auffinden eines beschränkten Gebietes für jedes Merkmal,
    3. - Anwenden von mehreren Merkmalsschablonen zur Anpassung der Größe des Merkmals,
    4. - Projizieren des Merkmals in einen invarianten Raum und
    5. - Auffinden der Vielzahl von Gesichtsmerkmalen.
  21. 20. Gesichtserkennungsverfahren nach einem der Ansprüche 11 bis 19, dadurch gekennzeichnet, daß der Gesichtsbereich zur Anpassung an Kontrast- und Lichtintensitätsvariationen durch Normierschritte weiterverarbeitet wird.
  22. 21. Gesichtserkennungsverfahren nach Anspruch 20, dadurch gekennzeichnet, daß die Normierschritte umfassen:
    1. - Erzielen eines Mittelwertes und einer Abweichung der Lichtverteilung des Bildes des Gesichtes, Projizieren des Mittelwertes der Lichtverteilung auf ein vorab festgelegtes Niveau und
    2. - Auseinanderziehen der Lichtverteilung zu einer vorab festgelegten Kurvengestalt.
  23. 22. Gesichtserkennungsverfahren nach einem der Ansprüche 11 bis 20, dadurch gekennzeichnet, daß der Gesichtsbereich zur Anpassung an Größen-, Neigungs- und Drehvariationen durch Normierschritte weiterverarbeitet wird.
  24. 23. Gesichtserkennungsverfahren nach Anspruch 22, dadurch gekennzeichnet, daß die Normierschritte umfassen:
    1. - Normieren des Bildes des Gesichtes auf eine vorab festgelegte Größe,
    2. - Abtrennen von Bildpunkten an vier Ecken des Bildes des Gesichtes und
    3. - Erzielen eines standardisierten invarianten Vektors des Bildes des Gesichtes.
  25. 24. Gesichtserkennungsverfahren nach einem der Ansprüche 11 bis 23, dadurch gekennzeichnet, daß die Entfernung zwischen den invarianten Vektoren der ermittelten Gesichtsmerkmale und dem Satz in dem Speichermittel gespeicherte invariante Gesichter mittels eines Invariant-Hadamard-Transform-Algorithmus berechnet wird.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com