PatentDe  


Dokumentenidentifikation DE69814495T2 18.12.2003
EP-Veröffentlichungsnummer 0863486
Titel Verfahren und Vorrichtung zur automatischen Kantenerkennung eines Dokumentes unter Verwendung eines Scanners
Anmelder Xerox Corp., Rochester, N.Y., US
Erfinder Feng, Xiao-fan, Webster, New York 14580, US;
Handley, John C., Fairport, New York 14450, US
Vertreter Grünecker, Kinkeldey, Stockmair & Schwanhäusser, 80538 München
DE-Aktenzeichen 69814495
Vertragsstaaten DE, FR, GB
Sprache des Dokument EN
EP-Anmeldetag 27.02.1998
EP-Aktenzeichen 983014499
EP-Offenlegungsdatum 09.09.1998
EP date of grant 14.05.2003
Veröffentlichungstag im Patentblatt 18.12.2003
IPC-Hauptklasse H04N 1/04
IPC-Nebenklasse H04N 1/38   

Beschreibung[de]

Die vorliegende Erfindung betrifft ein System und Verfahren zur automatischen Erkennung der Kante einer Dokuments, das mit einem Abtastsystem abgetastet wird. Insbesondere ist die vorliegende Erfindung auf ein Verfahren und System gerichtet, um die Kante und Breite eines Dokuments, das abgetastet wird, unter Verwendung von Werten, die aus einer Funktion zweiter Ordnung berechnet werden, zu ermitteln.

Im Büromaschinenumfeld sind mit einem Kopierer traditionell xerographische Lichtlinsen-Kopierer gemeint, bei denen Papiervorlagen in der Tat fotografiert werden. Die Bilder werden auf einen Bereich eines Fotorezeptors fokussiert, der anschließend mit Toner entwickelt wird. Das entwickelte Bild auf dem Fotorezeptor wird dann auf ein Kopierblatt übertragen, das wiederum verwendet wird, um eine dauerhafte Kopie des Originals anzufertigen.

In letzter Zeit wurden Geräte zur Verfügung gestellt, die als Digitalkopierer bekannt sind in seinen wichtigsten Grundfunktionen führt ein Digitalkopierer dieselben Funktionen wie ein Lichtlinsen-Kopierer aus, außer dass das zu kopierende Originalbild nicht direkt auf einen Fotorezeptor fokussiert wird. Stattdessen wird bei einem Digitalkopierer das Originalbild mit einer Einrichtung abgetastet, die allgemein als Rastereingabe-Scanner (RIS) bekannt ist, der typischerweise die Form einer linearen Anordnung von kleinen Fotosensoren hat.

Die Vorlage wird auf die Fotosensoren indem RIS fokussiert. Der RIS wandelt die verschiedenen hellen und dunklen Bereiche der Vorlage in einen Satz von Digitalsignalen um. Diese Digitalsignale werden vorübergehend in einem Speicher aufbewahrt und dann schließlich benutzt, um eine digitale Druckvorrichtung zu treiben, wenn Kopien der Vorlage gedruckt werden sollen, oder einen Anzeigebildschirm zu treiben, wenn das Bild angezeigt werden soll. Das heißt, das Bild wird gescannt und in elektrische Signale umgewandelt, sodass das Bild für andere Wiedergabezwecke verwendet werden kann. Die Digitalsignale können auch direkt an die Druck- oder Anzeigevorrichtung gesandt werden, ohne in einem Speicher gespeichert zu werden. Die digitale Druckvorrichtung kann jede bekannte Art von Drucksystem sein, das auf Digitalsignale anspricht, z. B. ein modulierender abtastender Laser, der bildbreite Teile eines Fotorezeptors entlädt, oder ein Tintenstrahl-Druckkopf.

Mit dem Einzug der kopierenden und abtastenden Systeme in ein digital basiertes System stehen die Systeme anderen Problemen als die Lichtlinsen- oder Analog-Kopiersysteme gegenüber. Genauer gesagt, in einem digitalen Abtastsystem muss das Abtastsystem die tatsächliche Lage des Dokuments ausfindig machen, sodass jede gewünschte Bildverarbeitungsroutine auf die richtigen Bilddatenpixel angewandt werden kann.

Beim Beschreiben der vorliegenden Erfindung wird der Begriff Pixel gebraucht werden. Dieser Begriff bezieht sich auf ein elektrisches (oder optische, wenn Faseroptik benutzt wird) Signal, das die physikalisch messbaren optischen Eigenschaften in einem physikalisch definierbaren Bereich auf einem empfangenden Medium darstellt. Das empfangende Medium kann ein berührbares Dokument, ein Fotorezeptor oder ein Markierungsmaterial-Transfermedium sein. Des Weiteren kann sich der Begriff Pixel auf ein elektrisches (oder optisches, wenn Faseroptik benutzt wird) Signal beziehen, das die physikalisch messbaren optischen Eigenschaften in einem physikalisch definierbaren Bereich auf einem Anzeigemedium darstellt. Eine Vielzahl von physikalisch definierbaren Bereichen für beide Fälle stellt die physikalisch messbaren optischen Eigenschaften des gesamten physikalischen Bildes dar, das durch entweder eine Material-Markierungseinrichtung, eine elektrische oder magnetische Markierungseinrichtung oder eine optische Anzeigeeinrichtung wiederzugeben ist.

Schließlich kann sich der Begriff Pixel auf ein elektrisches (oder optisches, wenn Faseroptik benutzt wird) Signal beziehen, das physikalische optische Merkmalsdaten darstellt, die von einer einzelnen Fotosensorzelle erzeugt werden, wenn ein physikalisches Bild abgetastet wird, um die physikalischen optischen Merkmale des physikalischen Bildes in eine elektronische oder elektrische Darstellung umzuwandeln. Mit anderen Worten, in dieser Situation ist ein Pixel eine elektrische (oder optische) Darstellung der physikalischen optischen Merkmale einer in einem physikalisch definierbaren Bereich auf einem optischen Sensor gemessenen physikalischen Abbildung.

Bei einem digitalen Abtastsystem ist es erwünscht, die Bildbearbeitungsroutinen nur auf dem Bild des Dokuments und nicht auf den Bilddaten durchzuführen, die die Hinterlegung der Andruckplattenabdeckung in einem Andruckplatten-Abtastsystem oder die Andruckwalze in einem Dokumenten-Zuführungssystem, z. B. einem Transportsystem mit konstanter Geschwindigkeit ("CVT"), darstellen. In dieser Anmeldung wird der Begriff Andruckwalze oder Hinterlegung gebraucht um den von dem digitalen Scanner abgetasteten Bereich zu beschreiben, der nicht das abzutastende Dokument oder gewünschte Bild ist.

In einem digitalen Abtastsystem ist es daher wichtig, die tatsächliche Lage des Dokuments, das gescannt wird, zu bestimmen, d. h., die Kanten und Breite des Dokuments. Diese Lokalisierung des Dokuments ist besonders wichtig bei einem Abtastsystem für technische Dokumente.

Bei einem Abtastsystem für technische Dokumente kann das eingegebene Dokument jede Größe zwischen 5 Zoll und mehr als 36 Zoll haben. Herkömmlich würde bei einem Verfahren zur Bestimmung der Lage des Dokuments ein Benutzer die Dokumentengröße von Hand ermitteln und die Breite über eine Benutzerschnittstelle in das Dokumenten-Abtastsystem eingeben, bevor das Dokument tatsächlich gescannt wird. Bei dieser herkömmlichen Methode muss das Dokument in dem Dokumenten-Abtastsystem zentriert werden, um zu vermeiden, dass das Dokument abgeschnitten wird.

Diese herkömmliche Methode verringert die Produktivität und verursacht verschwendete Kopien, da ein Benutzer nicht immer die richtige Breite oder Mitte des Dokuments in das Dokumenten-Abtastsystem genau eingeben kann. Es wäre daher wünschenswert, ein System zur automatischen Breitenermittlung zu haben, um die Breite und Lage des Dokuments zu bestimmen, wenn das Dokument anfangs zum Abtasten in Szene gesetzt wird.

Es sind verschiedene Schemas zur automatischen Breitenermittlung vorgeschlagen worden, und die Breite und Lage des Dokuments zu bestimmen, wenn das Dokument in Szene gesetzt wird, aber diese Bestimmungsverfahren sind nicht ganz erfolgreich gewesen, weil die in einer technischen Umgebung zu scannenden Dokumente der Hinterlegung sehr ähnlich sein können, was es daher schwer macht, zwischen dem Papier und der Hinterlegung (Andruckwalze oder Andruckplattenabdeckung) zu unterscheiden.

Dieses Problem verstärkt sich, wenn der CCD-Sensorausgang schwankt. Außerdem ist es möglich, dass ein Dokument und Scanner interagieren können, um einen integrierenden Hohlraumeffekt hervorzubringen, der die Kantenlage des Dokuments verbergen wird.

Ein derartiges herkömmliches Verfahren zur automatischen Breitenermittlung ergreift einen Teil der Vorderkante eines in Szene gesetzten Dokuments, wobei der ergiffene Teil der Vorderkante Bilddaten enthält, die sowohl die Hinterlegung als auch das Dokument selbst betreffen. In diesem automatisierten Prozess werden die Breite und Lage eines Dokuments berechnet, indem ermittelt wird, ob jedes CCD-Sensorelement von einer Hinterlegung oder dem Dokument bedeckt wird.

Mit anderen Worten, der Breitenermittlungsprozess wird ein Klassifizierungsprozess. Jedes CCD-Sensorelement wird entweder von der Hinterlegung oder dem Dokument bedeckt. Um diese Feststellung zu treffen, benutzt das herkömmliche automatische Ermittlungsverfahren den Mittelwert jeder Spalte von Pixeln von Bilddaten, um zwischen dem Dokument und der Hinterlegung zu unterscheiden. Beispiele dieser Mittelwertdaten werden in Fig. 3 und 5 der vorliegenden Anmeldung veranschaulicht.

Da aber die Helligkeit des Dokuments von sehr dunkel bis sehr hell variiert und da die meisten Verbundpapier- und Filmdokumente fast dieselbe Helligkeit aufweisen wie die Hinterlegung, ist der herkömmliche Prozess zur automatischen Breitenermittlung oftmals außerstande, die tatsächliche Lage und Breite des Dokuments zu ermitteln. Außerdem beruht das herkömmliche Verfahren einzig auf der Ermittlung der Lage und Breite des Dokuments aus Mittelwertdaten, die einer Funktion erster Ordnung entsprechen. Die Mittelwertdaten sind sehr anfällig für elektrisches Rauschen in den CCD-Sensoren oder Staub und Schmutz innerhalb des eigentlichen Abtastsystems. Mit anderen Worten, jede übermäßige elektrische Rauschen, Staub oder Schmutz könnten den herkömmlichen Prozess zur automatischen Breitenermittlung leicht unwirksam machen.

Neben seiner Empfindlichkeit für elektrisches Rauschen, Staub und Schmutz benötigt der herkömmliche Prozess zur automatischen Breitenermittlung eine sehr empfindliche Filterungsroutine, um den Übergang von der Andruckwalze zu dem Dokument, d. h., den Rand des Dokuments, zu erkennen. Dies ist in Fig. 3 und 5 der vorliegenden Anmeldung zu sehen, worin die Übergänge von der Hinterlegung zu dem Dokument (etwa bei Pixelnummer 510 bzw. 245) durch eine sehr schmale Impulsspitze dargestellt werden. Der herkömmliche Prozess erfordert daher eine sehr empfindliche Filterungsroutine, um diesen Übergang zu erfassen, was wiederum den Erfassungsprozess sehr empfindlich für elektrisches Rauschen, Staub oder Schmutz macht.

Es ist deshalb wünschenswert, eine automatische Erfassungsroutine zu haben, die die Lage und Breite des grade gescannten Dokuments genau erfassen kann, ohne für elektrisches Rauschen, Staub oder Schmutz empfindlich zu sein.

Nach einem ersten Aspekt der vorliegenden Erfindung umfasst ein Verfahren zur automatischen Erkennung einer Kante eines Dokuments in einem Scanning-System die folgenden Schritte:

(a) Scannen eines Teils des Dokuments und einer Hinterlegung;

(b) Erzeugen von Pixeln von Bilddaten, die eine Bilddichte darstellen, und

(c) Berechnen eines Satzes von ersten Werten aus den Bilddaten unter Verwendung einer Mittelwertfunktion, gekennzeichnet durch

(d) Berechnen eines Satzes von zweiten Werten aus den Bilddaten unter Verwendung einer Standardabweichungsfunktion, und

(e) Bestimmen der Lage einer physikalischen Kante des Dokuments aus dem Salz von ersten Werten und dem Satz von zweiten Werten durch Ermitteln der Lage einer Änderung in der Standardabweichung der Bilddichte der Pixel.

Nach einem zweiten Aspekt der vorliegenden Erfindung umfasst ein System zur automatischen Erfassung einer Kante eines Dokuments in einem Scanning-System einen Scanner, der einen Teil des Dokuments und einer Hinterlegung scannt, um Pixeln von Bilddaten, die eine Bilddichte darstellen, zu erzeugen, und

eine erste Einrichtung, die einen Satz von ersten Werten aus den Bilddaten unter Verwendung einer Mittelwertfunktion berechnet, gekennzeichnet durch eine zweite Einrichtung, die einen Satz von zweiten Werten aus den Bilddaten unter Verwendung einer Standardabweichungsfunktion berechnet, und

eine dritte Einrichtung, die die Lage einer physikalischen Kante des Dokuments aus dem Satz von ersten Werten und dem Salz von zweiten Werten durch Ermitteln der Lage einer Änderung in der Standardabweichung der Bilddichte der Pixel bestimmt.

Die vorliegende Erfindung schlägt ein Verfahren und System vor, um eine automatische Erkennung der Kante eines Dokuments bereitzustellen, das im Wesentlichen unempfindlich ist für Staub, Schmutz sowie elektrisches Rauschen, wobei die vorliegende Erfindung Statistik zweiter Ordnung, z. B. eine Standardabweichung, zusätzlich zu der Mittelwertinformation benutzt, um die tatsächliche Kante des Dokuments zu ermitteln. Durch Verwenden von Statistik zweiter Ordnung kann der Übergang zwischen der Hinterlegung und dem Dokument leichter gefunden werden, ahne von empfindlichen Filterungsroutinen Gebrauch zu machen. Die Kantenermittlung kann benutzt werden, um die Breite und Lage des Dokuments zu ermitteln.

Das Folgende ist eine Kurzbeschreibung aller Zeichnungen, die zum Beschreiben der vorliegenden Erfindung benutzt werden und daher nur zum Zweck der Veranschaulichtung präsentiert werden und den Umfang der vorliegenden Erfindung nicht einschränken sollen. Inhalt der Zeichnungen:

Fig. 1 ist eine Skizze eines typischen digitalen Abtastsystems.

Fig. 2 veranschaulicht ein typisches Vorderkantenbild, das während der Vorlageninszenierung erfasst wird.

Fig. 3 ist eine Grafik, die Mittelwertdaten an einer rechten Kante einer Vorlage während der Vorlageninszenierung veranschaulicht.

Fig. 4 ist eine Grafik, die Standardabweichungsdaten an einer rechten Kante einer Vorlage während der Vorlageninszenierung veranschaulicht.

Fig. 5 ist eine Grafik, die Mittelwertdaten an einer linken Kante einer Vorlage während der Vorlageninszenierung veranschaulicht.

Fig. 6 ist eine Grafik, die Standardabweichungsdaten an einer linken Kante einer Vorlage während der Vorlageninszenierung veranschaulicht.

Fig. 7 veranschaulicht die Mitten-Cluster und Streuung verschiedener Vorlagen und Hinterlegungsmessungen nach den Vorstellungen der vorliegenden Erfindung.

Fig. 8 ist eine grafische Darstellung einer Abstandsmessung im Merkmalsraum nach den Vorstellungen der vorliegenden Erfindung.

Fig. 9 ist eine grafische Darstellung eines typischen Histogramms einer Vorlage.

Fig. 10 ist ein Blockschaltbild, das ein System zur automatischen Erkennung einer Breite und Lage einer Vorlage nach den Vorstellungen der vorliegenden Erfindung zeigt.

Fig. 11 und 12 sind Flussdiagramme, die ein Verfahren zur automatischen Erkennung einer Breite und Lage einer Vorlage nach den Vorstellungen der vorliegenden Erfindung veranschaulichen.

Fig. 13 ist eine Grafik, die den Übergang zwischen der Hinterlegung und der Kante einer Vorlage veranschaulicht, nachdem eine Kantenblock nach den Vorstellungen der vorliegenden Erfindung ermittelt wurde.

Das Folgende ist eine ausführliche Beschreibung der vorliegenden Erfindung. In dieser Beschreibung und in den Zeichnungen stellen gleiche Verweiszeichen gleichwertige Schalt kreise und/oder gleichwertige Funktionen dar.

Wie oben bemerkt ist Fig. 1 eine Skizze eines typischen digitalen Abtastsystems. Wie in Fig. 1 veranschaulicht wird eine Vorlage 1 durch einen CCD-Sensor 7 abgetastet. Bei dem in Fig. 1 gezeigten einzelnen System wird die Vorlage 1 unter Verwendung einer Andruckwalze 3 an dem CCD-Sensor 7 vorbeigeführt. Das von der Vorlage 1 und der Andruckwalze 3 reflektierte Licht durchläuft ein Linsensystem 5, das das reflektierte Licht auf den CCD-Sensor 7 fokussiert. Das reflektierte Licht wird in Bezug auf eine optische Mittellinie 13 fokussiert. Das reflektierte Bild der Vorlage 9 und das reflektierte Bild der Andruckwalze 11 werden von dem CCD-Sensor 7 in Pixel von Bilddaten umgewandelt. Der CCD-Sensor 7 erzeugt daher Pixel von Bilddaten, die sowohl das reflektierte Bild der Andruckwalze 11 als auch das reflektierte Bild der Vorlage 9 darstellen.

Fig. 2 veranschaulicht ein typisches Vorderkantenbild, das während der Vorlageninszenierung erfasst wird. Wie in Fig. 2 veranschaulicht, wird die Vorderkante des Bildes erfasst, wobei die Bilddaten sowohl das reflektierte Bild der Hinterlegung als auch der eigentlichen Vorlage darstellen. Bei dem in Fig. 2 veranschaulichten Beispiel tastet der CCD-Sensor eine Breite von 36 Zoll ab.

Wenn die Auflösung des CCD-Sensors 200 Punkte pro Zoll beträgt, wird das digitale Abtastsystem 7200 Bilddatenpixel pro Abtastzeile erzeugen. Jedem Bilddatenpixel wird dann eine Pixelstellennummer von 1 bis 7200 in einer Links-nach-Rechts-Ausrichtung und eine Pixelstellennummer von 1 bis 7200 in einer Rechts-nach-Links-Ausrichtung zugewiesen. Diese Pixelstellennummern bilden dann Spalten von Bilddaten, da während des Vorlageninszenierungsmodus mehr als eine Abtastzeile des Vorderkantenbildes erfasst wird. Wenn z. B. die abgetastete Vorderkante 25 Abtastzeilen ist, würde eine Pixelstellennummer eine Spalte von 25 Pixeln sein, wobei die Bilddaten jedes dieser Pixel durch dieselbe Fotostelle auf dem CCD erzeugt werden worden wären.

Ein Beispiel dieser Spalten von Bilddaten wird durch Verweiszeichen 21 in Fig. 2 veranschaulicht. Genauer, ein Spaltenblock 21 wird veranschaulicht, in dem der Mittelwert und die Standardabweichung jeder Spalte gezeigt werden. Genauer, für die mit Spalte i verbundene Pixelstelle ist z. B. der Mittelwert Xi, und der Standardabweichungswert ist Si, während für die mit Spalte i + 1 verbundene Pixelstelle der Mittelwert Xi+1 und der Standardabweichungewert Si+1 sind. Die mit jeder Spalte verbundenen Mittel- und Standardabweichungswerte werden von der vorliegenden Erfindung bei der Ermittlung der tatsächlichen Kanten und Breite der abzutastenden Vorlage benutzt. Weitere Beispiele dieser spaltenformatierten Daten werden in Fig. 3-6 veranschaulicht. Insbesondere veranschaulicht Fig. 3 die Mittelwerte für die Pixelstellen zwischen Pixel 0 und Pixel 1200, wenn von rechts nach links abgetastet wird (von Hinterlegung nach Vorlage), während Fig. 5 den Mittelwert für jede Pixelstelle von Pixelnummer 0 bis Pixelnummer 400 veranschaulicht, wenn von links nach rechts abgetastet wird. Zum anderen veranschaulicht Fig. 4 den Standardabweichungswert für die Pixelstellen zwischen Pixelnummer 0 und Pixelnummer 1200, wenn von rechts nach links abgetastet wird, während Fig. 6 den Standardabweichungswert für jede Pixelstelle von Pixelnummer 0 bis Pixelnummer 400 veranschaulicht wenn von links nach rechts abgetastet wird. Mit anderen Worten, Fig. 3 und 4 entsprechen der Ablesung der Pixeln von Bilddaten in einer Weise von rechts nach links, während Fig. 5 und 6 die Ablesung von mit Pixelstellen verbundenen Daten in einer Weise von links nach rechts veranschaulichen.

Wie in Fig. 3 und 5 veranschaulicht wird ist es schwer, die linke und rechte Kante einer Vorlage nur unter Verwendung der Mittelwertdaten zu ermitteln, weil viele Quellen zu der in den Daten gesehenen Veränderung wesentlich beitragen können. Genauer, obwohl die Hinterlegung ein gleichbleibendes Reflexionsvermögen aufweist, hat der lineare CCD ein sich änderndes Ansprechverhalten, was auf Schwankungen von Element zu Element (Fotostellen auf einem CCD-Sensor oder Fotosensorchips in einer Vollbreiten-Anordnung), Optik und (elektrisches) Rauschen des Systems zurückzuführen ist. Des Weiteren können Staubteilchen in dem Bild als vertikale dunkle Streifen erscheinen, und die Vorlagen selbst können infolge ihrer Oberflächenbeschaffenheit und ihres Fasergehaltes sehr stark voneinander abweichen. Schließlich besitzen, wie oben angemerkt, einige Arten von Vorlagen, z. B. Film- und Verbundpapier, Reflexionswerte, die der Hinterlegung ähnlich sind.

Andere Schwankungsquellen können dunkle Vorlagen sein, die bewirken, dass sich nahe der Kante der Vorlage ein Reflexionsglanz bildet, was dazu führt dass die Kanten als Rampen erscheinen, während Staubteilchen verschiedene Sprünge verursachen, die ähnlich der Kante eines Film- oder Verbundpapiers erscheinen. Die Schwankung von Element zu Element in dem CCD-Sensor oder der Vollbreiten-Anordnung zusammen mit Systemrauschen kann Reflexionsschwankungen verursachen, die Kanten verbergen können. Mit anderen Worten, diese verschiedenen Schwankungsquellen führen dazu, dass die Erfassung der linken und rechten Vorlagenkante sehr schwierig wird, wenn sie sich nur auf Mittelwertdaten stützt.

Andererseits werden, wie in Fig. 4 und 6 veranschaulicht, Werte zweiter Ordnung, z. B. Standardabweichungswerte, zusätzlich zu den Mittelwerten benutzt. Durch Verwenden dieser zweiten Werte, d. h. Werte, die von einer Funktion zweiter Ordnung erzeugt werden, kann die Empfindlichkeit für die verschiedenen Schwankungsquellen aufgrund der breiten Lücke zwischen der Standardabweichung für die Vorlage und der Standardabweichung für die Hinterlegung wesentlich vermindert werden.

Genauer, für die CCD-Elemente, die von der Hinterlegung bedeckt werden, ist die Standardabweichung das elektronische Sensorrauschen, da die Hinterlegung während des Abtastens stationär ist. Für die Elemente des CCD-Sensors, die von der Vorlage bedeckt werden, besteht jedoch, da sich die Vorlage während des Abtastens beim Inszenieren der Vorlage bewegt, die Standardabweichung aus elektronischem Sensorrauschen und der Helligkeitsänderung der Vorlage. Die Helligkeitsänderung der Vorlage ist typischerweise viel größer als das elektronische Sensorrauschen, und der Standardabweichungswert liefert somit eine saubere und bedeutsame Lücke, wenn es einen Übergang von der Hinterlegung zu der Vorlage selbst gibt.

Des Weiteren ist der Standardabweichungswert robuster gegen Schmutz oder Staub auf der Hinterlegung. Ein Staub- oder Schmutzteilchen auf der Hinterlegung wird den Mittelwert erheblich verringern, aber das Sensorrauschen ist noch dasselbe, weil es während des Abtastens denselben Punkt sieht. Mit anderen Worten, der Mittelwertunterschied zwischen der Hinterlegung und der Vorlage kann durch Sensorrauschen und/oder Staub oder Schmutz auf der Hinterlegung verschleiert werden, während der Standardabweichungsunterschied deutlich sichtbar und gut getrennt ist, da diese Werte für elektronisches Rauschen oder Staub und Schmutz nicht bedeutsam empfindlich sind.

In der bevorzugten Ausführung der vorliegenden Erfindung wird das Signal/Rausch-Verhältnis durch Tiefpassfilterung, die im Scanner erfolgt, weiter erhöht. Das von dem Scanner erhaltene Bild kann z. B. mit 400 spi abgetastet werden und über ein 4-Pixel breites Fenster auf jeder Abtastzeile gemittelt werden, um ein 100-spi Bild zu erzeugen. Die Wirkung ist, das Bild tiefpassmäßig zu filtern. Auf der Andruckwalze, wo das Reflexionsvermögen unabhängig und identisch normal verteilt ist, wird die Varianz des Scannerrauschens um 1/2 reduziert. Aber das Papierrauschen hat ein etwa 1/f² Leistungsspektrum. Tiefpassfilterung (Mittelung) hat wenig Wirkung. Dies erhöht das Signal/Rausch-Verhältnis zwischen der Vorlage und der Andruckwalze.

Im Hinblick auf die Robustheit der Standardabweichungswerte benutzt die vorliegende Erfindung ein Verfahren wie in Fig. 11 und 12 veranschaulicht, um die Kanten der Vorlage zu erkennen, wobei dieses Verfahren die Kanten der Vorlage aus dem Mittelwert, dem Standardabweichungswert und Schwarzpixel-Zählwerten für jede Spalte von Bilddatenpixeln errechnet. Wie in Fig. 11 veranschaulicht, ermittelt Schritt S1 die Hintergrundwerte aus einem Histogramm des Vorderkantenbildes der Vorlage während der Vorlageninszenierung.

Ein typisches Histogramm für ein Bild wird in Fig. 9 veranschaulicht, worin das Histogramm typischerweise zwei getrennte Spitzen 31 und 37 enthält. Die Spitze 31 stellt den Weiß-Spitzenwert oder Vorlagen-Hintergrundwert dar, während die Spitze 37 den Schwarz-Spitzenwert darstellt. Diese Spitzenwerte werden zusammen mit einem Breitenwert 35 der Verteilung des Weiß-Spitzenwerte benutzt, um einen Schwellenwert zu bestimmen, der beim Bestimmen, ob ein Pixel schwarz oder weiß ist und ob die Vorlage die Enden des Scanners bedeckt, benutzt werden wird.

Nach dem Bestimmen der Hintergrundwerte aus dem Histogramm bestimmt Schritt S2 den rechten und linken Kantenabstand. In der bevorzugten Ausführung der vorliegenden Erfindung wird der Abstand der linken Kante mithilfe der folgenden Gleichung berechnet:

DistLft = sqrt([(LOcMean-LeftMean)/MEANTOL]² + [(LocStd-STDTHD)/(Wstd*STDTOL)]²)

worin LocMean der Mittelwert von 8 Spaltenmittelwerten am linken Ende des CCD-Sensors ist, LocStd der Mittelwert von 8 Spalten-Standardabweichungen am linken Ende des CCD- Sensors ist, LeftMean die Scannerantwort auf die Andruckwalze ist MEANTOL, STDTHD und STDTOL voreingestellte Werte sind, und Wstd der Wichtungsfaktor der Standardabweichung ist. Bei der bevorzugten Ausführung ist Wstd = 4 für dunkle Substrate und 2 für andere Vorlagen. Der rechte Kantenabstand (DistRgt) wird mittels einer ähnlichen Gleichung berechnet, wobei alle Werte auf die rechte Seite der Abtasteinrichtung reflektiert werden.

Nach Vollendung von Schritt S2 bestimmt der Prozess den Mittelwert, den Standardabweichungswert und den Schwarzpixel-Zählwert für jede mit einer einzelnen Pixelstelle verbundene Pixelspalte. Genauer, wenn die Vorderkante einer während der Vorlageninszenierung abgetasteten Vorlage 30 Abtastzeilen enthält, würde die Pixelspalte für die Pixelstelle 50 z. B. 30 Pixel von Bilddaten enthalten, wobei jedes Pixel von Bilddaten durch dieselbe Einheit Fotozelle des CCD erzeugt wurde.

Sobald diese Werte berechnet sind, gruppiert Schritt S4 die Werte für benachbarte Spalten zu Blöcken; in der bevorzugten Ausführung der vorliegenden Erfindung enthält der Block 5 Spalten von Mittelwerten, Standardabweichungswerten und Schwarzpixel-Zählwerten. Nach Gruppieren der Spalten von Pixelwerten in Blöcken untersucht Schritt S5 jeden Datenblock und klassifiziert den Block als entweder Hinterlegung oder Vorlage. Wenn in Schritt S6 festgestellt wird, das der Block als Hinterlegung klassifiziert wurde, aktualisiert Schritt S7 den Cluster-Mittenwert und den Streuwert, die Funktionen des Mittelwerts und des Standardabweichungswerts der Blöcke sind, die untersucht wurden. Die eigentlichen Berechnungen für diese Werte werden unten ausführlicher erörtert.

Sobald alle Blöcke als entweder Hinterlegung oder Vorlage klassifiziert sind, berechnet Schritt S9, welcher Block am wahrscheinlichsten eine Kantenstelle enthalten könnte, und ermittelt die Kostenfunktion oder zugehörigen Vertrauensfaktor, der einen Vertrauensgrad angibt, dass der Block die Kante der Vorlage enthält. Die Kantenlage wird unter Verwendung einer adaptiven euklidischen Abstandsformel berechnet

worin

locmean [i] = (a) locmean [i-1] + (1 - (a)) (X [i] - locmean [i-1]);

avgmean [i] = X [1];

stddevmean [i] = (a) stddevmean [i-1] + (1 - (a))(X [i] - locmean [1]);

locstd [i] = (z) locstd [i-1] + (1 - (z)) (S [i] - locstd [[1]);

avgstd [i] = S [i]; und

stdavgstd [i] = (z) stdavgstd [i-1] + (1 - (z)) (S [i] - locstd [i-1]).

Es wird angemerkt, dass die Koeffizienten (a) und (z) gemäß einer geschätzten Vorlagenart festgelegt werden, die unter Verwendung der Histogrammspilzen und der Streuung des Histogramms um die Weißspitze herum, wie in Fig. 9 veranschaulicht, bestimmt wird. Es wird jedoch angemerkt, dass der mittlere Mittelwert (avgmean [i]) und die mittlere Standardabweichung (avgstd [i]) die Clustermitten-Koordinaten für die Hinterlegung sind (Fig. 7). Die Standardabweichung des Mittelwerts (stddevmean [i-1]) und die Standardabweichung der Standardabweichung (stdvevstd [i-1]) liefern ein Maß der Streuung der Hinterlegung. Sowohl die Clustermitte als auch die Streuung hängen von Scanner-Kalibrierung, der Vorlagenhelligkeit (integrierter Hohlraumeffekt) und dem Scannerrauschen ab. Diese Werte müssen deshalb von Abtastung zu Abtastung und vom Rand des Scanners zur Vorlagenkante adaptierbar sein.

Die Berechnung des Blocks mit einer möglichen Kantenstelle und der Kostenfunktion wird eine vorbestimmte Zahl von Malen durchgeführt, wobei jede Wiederholung der Berechnung weniger strenge Kriterien und Kompentenz-Koeffizienten benutzt, um festzustellen, ob eine Kante in einem Block erscheint. Mit anderen Worten, bei jeder Wiederholung der Berechnung für die Kantenblocketelle und Kostenfunktion werden die k_factor-Werte der oben beschriebenen Abstandsformel geändert. In der bevorzugten Ausführung der vorliegenden Erfindung werden die Kantenblockstelle und die zugehörige Kostenfunktion für drei getrennte Wiederholungen unter Verwendung von drei verschiedenen k_factor-Werten berechnet, wobei der erste k_factor-Wert 2.5 ist, der zweite k_factor Wert 3 ist, und der letzte k_factor- Wert 4 ist.

Nachdem die Wiederholungen vollendet sind, werden in Schritt S12 die Kantenblockstellen und zugehörigen Kostenfunktionen für die verschiedenen k-Faktoren untersucht, um die bestmögliche Kantenblockstelle (die Blockstelle mit dem höchsten Vertrauensgrad) zu finden. Unter Verwendung des Blocks mit der bestmöglichen Kantenstelle findet Schritt S13 die physikalische Kante der Vorlage in dem Kantenblock, indem ein Ableitungsverfahren im zweidimensionalen Raum verwendet wird.

Die Bestimmung des bestmöglichen Kantenblocks erwägt, ob irgendwelche der drei Blöcke übereinstimmen und vergleicht ihre zugehörigen Kostenfunktionen. Wenn zwei oder mehr Blockstellen übereinstimmen, wird diese Blockstelle als die bestmögliche Kantenblockstelle ausgewählt, und die zugehörige Kostenfunktion wird vermindert oder der Vertrauensfaktor wird erhöht. Der gewählte bestmögliche Kantenblock wird weiter untersucht, um zu ermitteln, ob es irgendwelche Schwarzpixel in dem gewählten Block gibt. Abhängig davon, ob irgendwelche Schwarzpixel gefunden werden oder ob die zugehörige Kostenfunktion größer als ein vorbestimmter Wert ist, wird der gewählte bestmögliche Kantenblock als der gewählte Kantenblock beibehalten, oder der Prozess zeigt an, dass beim Ermitteln der Kante der Vorlage ein Fehler aufgetreten ist.

Vor Schritt S13 wird die Kantenstelle innerhalb des Blocks 21 von Fig. 2 gefunden. In Schritt S13 wird die tatsächliche Kante unter Verwendung von drei Pixelblöcken bestimmt, der gewählte bestmögliche Kantenblock und die zwei angrenzenden Blöcke. Diese drei Kantenblöcke werden mittels eines Ableitungsverfahrens untersucht, um festzustellen, welche Pixelstelle die eigentliche Lage der physikalischen Kante der Vorlage ist.

Ein Software-Implementierungsbeispiel des oben beschriebenen Verfahrens wird in Tabelle 1 unten dargelegt. Diese Tabelle zeigt ein Beispiel von Softwarecode, der die oben beschriebenen Funktionen ausführt, um die Kanten einer Vorlage mittels Statistik zweiter Ordnung zu finden. Obwohl der Prozess der vorliegenden Erfindung in Software implementiert wurde, kann er auch leicht in Hardware implementiert werden.

Fig. 13 veranschaulicht ein mögliches Beispiel dieser Untersuchung, wobei Block 43 den bestmöglichen Kantenblock darstellt, und die Blöcke 41 und 45 die an den bestmöglichen Kantenblöcke grenzenden Blöcke darstellen. Die Daten in den Blöcken 41, 43 und 45 werden mithilfe eines Ableitungsverfahrens analysiert, bis die Pixelstelle 47 der tatsächlichen Kante der Vorlage ermittelt ist.

Fig. 7 ist eine grafische Darstellung der Berechnung einer Clustermitte oder eines Hinterlegungswerts und der Streuung für eine Hinterlegung sowie der Clustermitte und der Streuungswerte für eine Filmvorlage und eine Verbundpapiervorlage. Es wird angemerkt, dass sich Clustermitten als Reaktion auf das Abtasten quer über das Bild und von Abtastung zu Abtastung bewegen können. Obwohl die in Fig. 7 widergespiegelten Daten grob elliptisch erscheinen, werden diese Daten um den Punkt (locmean, locstd) herum sphärisch, wenn die Daten in Bezug auf die Standardabweichung des Mittelwerts und die Standardabweichung der Standardabweichung normalisiert werden. Ein Beispiel dieser normalisierten Daten wird in Fig. 8 veranschaulicht.

Wie in Fig. 8 veranschaulicht, ist der Mittelpunkt der Sphäre (X0i, S0i), wo X0i der Mittelwert der Mittelwerte der zuvor analysierten Blöcke ist, und S0i der Mittelwert der Standardabweichungen der zuvor analysierten Blöcke ist. Des Weiteren ist die Streuung dieser Daten gleich der Stabdardabweichung der Mittelwerte der zuvor analysierten Blöcke und der Standardabweichung der Standardabweichungen der zuvor analysierten Blöcke. Fig. 8 veranschaulicht auch, wie das Ändern des k Faktors in der Abstandsformel die Auswirkung der Streuung auf die Abstandsberechnung verändert.

Wie oben angemerkt, wird beim Bestimmen, ob ein Block als die Kantenblockstelle ausgewählt wird, der Abstand zwischen der Clustermitte und einem durch die Koordinate (avgmean, avgstd) dargestellten Punkt, der den grade analysierten vorliegenden Block darstellt, berechnet. Je größer der Abstandswert ist, umso wahrscheinlicher ist es, dass der Block eine Vorlage enthält.

Genauer, die Abstand zu Wahrscheinlichkeit-Beziehung ist in Fig. 3-6 klar zu sehen, worin die Übergangspunkte zwischen der Hinterlegung und der Vorlage Sprünge in den Daten verursachen, um so einen bedeutsamen Abstand zwischen dem Mittelwert und der Standardabweichung des grade analysierten Blocks und dem Mittelwert der Mittelwerte der zuvor analysierten Blöcke und dem Mittelwert der Standardabweichungen der zuvor analysierten Blöcken anzuzeigen.

Wenn eine Kante angetroffen wird, werden avgmean und avdstd im Wert noch springen. Die statistischen Werte locmean und locstd eilen dem Rest nach, was di veranlasst, plötzlich zuzunehmen. Es wird jedoch Fehlalarme geben. Diese werden wie folgt behandelt.

Jede Abtastung von X (Mittelwert) und S (Standardabweichung) markiert ein Statusfeld mit 0, 1 oder 2 abhängig davon, ob d kleiner als oder gleich einem k_factor, größer als der k factor oder viel größer als der k_factor ist, wobei der k_factor gleich k oben in der Abstandsgleichung ist. Eine null (0) gibt 'Hinterlegung' an, 1 bedeutet 'vermutlich in der Vorlage', und 2 bedeutet 'definitiv in der Vorlage'. Für die erste Abtastung wird k_factor klein gesetzt, in der bevorzugten Ausführung 2.5, und dann bei jeder Abtastung progressiv vergrößert (3 und 4 in der bevorzugten Ausführung). Nach jeder Abtastung enthält ein Statusfeld 0, 1 oder 2. Das Statusfeld wird mittels der Kosten von Fehlklassifizierung (d. h. Kosten von Typ I oder Typ II Fehlern) aktualisiert, um Kantenkandidaten zu ergeben.

Zum Beispiel, wenn x so wäre, dass Status[x] = 1 oder 2 ist, werden die mit der Entscheidung, dass eine Kante bei x ist, verbundenen Kosten als die Summe von Status[i], i < x, plus der Zahl von 0-en in Status[i], i > x, berechnet. Die Stelle mit kleinsten Kosten ist der Kantenkandidat. Dieser wird zusammen mit seinen Fehlklassifizierungskosten gespeichert.

Bei der bevorzugten Ausführung werden nach drei Abtastungen mit zunehmendem k_factor drei Kantenkanditaten plus ihren Fehlklassifizierungskosten erzeugt. Diese drei Kandidaten werden untersucht um eine einzige Kantenschätzung und Kosten zu erzeugen. Diese Kosten werden in Vertrauenskoeffizienten 0, 1 oder 2 umgewandelt, die dieselbe Bedeutung wie zuvor haben. Dieselbe Prozedur wird benutzt, um die beiden Kanten zu schätzen, wobei lediglich der Abtastprozess in entgegengesetzten Richtungen läuft. Diese Prozedur schätzt bei der bevorzugten Ausführung die Kante bis auf 5 Pixel, da ein Block aus 5 Pixelspalten besteht. Der beste (billigste) Kandidat wird gewählt, um die Kante weiter genau festzulegen.

Um die genaue Kante zu finden, benutzt der Prozess den ausgwählten Block und die zwei links und rechts angrenzenden Blöcke. Diese Daten werden dann rekonfiguriert, in der bevorzugten Ausführung in Blöcke von 3 Pixelspalten, und die Mittelwerte und Standardabweichungen werden spaltenweise berechnet, was Mittelwerte mXi, mSi und Standardabweichungen eXi, sSi, i = 1, ..., BLOCK_SIZE ergibt. Diese Werte werden in einer Abstandsberechnung ähnlich der oben beschriebenen verwendet:

Di = sqr ([(mXi+1 - mXi)/MEANTOL]² + ((sXi+1 - sXi)]/STDTOL]²)

worin MEANTOL und STDTOL voreingestellte Werte sind. Der größte Sprung von Di wird benutzt, um die Kante innerhalb von drei Pixeln zu schätzen. Die Kantenstelle wird schließlich durch Interpolieren benachbarter Werte gefunden. Dieser Schritt wirkt dem Effekt von Kantenschatten entgegen, die durch den integrierenden Hohlraumeffekt hervorgerufen werden.

Fig. 10 veranschaulicht ein Blockschaltbild einer Schaltung, die benutzt wird, um die Kantenlage der abzutastenden Vorlage zu bestimmen. Wie in Fig. 10 gezeigt, erzeugt eine CCD- Sensoranordnung 100 Bilddaten, die in eine Histogrammschaltung 102, eine Mittelwert-Berechnungsschaltung 106, eine Standardabweichunge-Berechnungeschaltung 105 und einen Puffer 107 eingegeben werden. Die Histogrammschaltung 102 bestimmt das Histogramm der Bilddaten und berechnet die oben erörterten Hintergrundwerte. Diese Hintergrundwerte werden dem Speicher 103 zugeführt, um zur weiteren Verarbeitung zwischengespeichert zu werden.

Die Mittelwert Berechnungsschaltung 106 berechnet den Mittelwert für jede Spalten von Pixeln sowie die anderen oben erörterten Mittelwerte und sendet die Mittelwerte an den Speicher 103. Die Standardabweichungs-Berechnungsschaltung 105 empfängt die Bilddaten sowie Mittelwertdaten vom Speicher 103, um die Standardabweichung und die anderen oben erörterten Standardabweichungen der Daten für jede Spalte zu bestimmen, und sendet die Standardabweichungewerte an den Speicher 103. Eine Bildbestimmungsschaltung 104, die die oben beschriebenen genauen Prozesse ausführt, ist mit dem Speicher 103 und dem Puffer 107 verbunden, um die passenden Daten zu empfangen, die zum Berechnen der physikalischen Kante der abzutastenden Vorlage benötigt werden.

Wie oben beschrieben, wird Statistik zweiter Ordnung (Standardabweichung S.) zusätzlich zu dem Mittelwert benutzt, um die Kanten der Vorlage zu ermitteln. Dieser Gebrauch von Statistik zweiter Ordnung liefert einen zuverlässigeren Prozess zur Erkennung der Kanten, der für elektronisches Sensorrauschen, Staub und/oder Schmutz nicht empfindlich ist.

Obwohl die vorliegende Erfindung oben ausführlich beschrieben wurde, können verschiedene Modifikationen implementiert werden, ohne vom Geist der vorliegenden Erfindung abzuweichen. Zum Beispiel ist die bevorzugte Ausführung der vorliegenden Erfindung unter Bezug auf eine CCD-Sensoranordnung beschrieben worden; dieses automatische Breitenermittlungsverfahren ist jedoch leicht mit einem Breitanordnungs-Abtastsystem zu implementieren. Des Weiteren kann das automatische Breitenermittlungsverfahren der vorliegenden Erfindung leicht auf einem ASIC, einem programmierbaren Gate-Array oder in Software implementiert werden, wodurch die Platzierung dieses Prozesses in einem Scanner, einem elektronischen Untersystem, einem Drucker oder einem Anzeigegerät ermöglicht wird.

Schließlich, die vorliegende Erfindung ist unter Bezug auf eine Monochrom- oder Schwarz/Weiß-Umgebung beschrieben worden. Die Vorstellungen der vorliegenden Erfindung sind jedoch ohne weiteres auf eine Farbumgebung anwendbar. Das heißt, der automatische Breitenermittlungsprozess der vorliegenden Erfindung kann auf jeden Farbraumwert, der das Farbpixel darstellt, angewandt werden.

Tabelle 1


Anspruch[de]

1. Verfahren zur automatischen Erfassung einer Kante eines Dokuments (1) in einem Scanning-System, das die folgenden Schritte umfasst:

(a) Scannen eines Teils des Dokuments (1) und einer Hinterlegung;

(b) Erzeugen von Pixeln von Bilddaten (21), die eine Bilddichte darstellen, und

(c) Berechnen eines Satzes von ersten Werten (Xi) aus den Bilddaten unter Verwendung einer Mittelwertfunktion, gekennzeichnet durch

(d) Berechnen eines Satzes von zweiten Werten (Si) aus den Bilddaten unter Verwendung einer Standardabweichungsfunktion, und

(e) Bestimmen der Lage einer physikalischen Kante des Dokuments aus dem Salz von ersten Werten und dem Satz von zweiten Werten durch Ermitteln der Lage einer Änderung in der Standardabweichung der Bilddichte der Pixel.

2. Verfahren nach Anspruch 1, wobei der Schritt (e) die folgenden Unterschritte umfasst

(e1) Klassifizieren von Blöcken von ersten Werten und zweiten Werten;

(e2) Aktualisieren eines Cluster-Mittenwertes, der eine Funktion der Blöcke von ersten Werten ist, und Aktualisieren eines Streuwertes, der eine Funktion der Blöcke von zweiten Werten ist, wenn der Unterschritt (e1) einen Block als Hinterlegung klassifiziert;

(e3) Berechnen eines Blocks mit möglicher Kantenlage, und

(e4) Berechnen eines Vertrauenswertes, dass der Block eine Kantenlage enthält.

3. Verfahren nach Anspruch 2, das weiter die folgenden Unterschritte umfasst

(e5) Wiederholen der Unterschritte (e1)-(e4) eine vorbestimmten Zahl von Malen unter Verwendung eines unterschiedlichen Wichtungsfaktors in dem Unterschritt (e3), und

(e6) Bestimmen des Blocks mit dem höchsten Vertrauenswert der Kantenlage.

4. Verfahren nach Anspruch 3, das weiter den folgenden Unterschritt umfasst:

(e7) Bestimmen der tatsächlichen physikalischen Lage der Dokumentenkante in dem durch den Unterschritt (e6) bestimmten Black.

5. Verfahren nach einem der vorangehenden Ansprüche, wobei die Pixel von Bilddaten gemäß einer Langsam-Scannen-Lokalisierung gruppiert werden,

Schritt (c) einen Mittelwert für jede Gruppe von Pixeln berechnet, und

Schritt (d) eine Standardabweichung für jede Gruppe von Pixeln berechnet.

6. Verfahren nach einem der vorangehenden Ansprüche, das weiter den folgenden Schritt umfasst:

Bestimmen eines Hintergrundwertes und eines Schwarzpixelwertes des Dokuments.

7. Verfahren nach Anspruch 6, wobei der Schritt (e) eine physikalische Kante des Dokuments aus dem Satz von ersten Werten, dem Salz von zweiten Werten und dem Satz von Schwarzpixel-Zählwerten bestimmt.

8. Verfahren nach einem der vorangehenden Ansprüche, das weiter den folgenden Schritt umfasst:

Bestimmen eines rechten Kantenabstandes und eines linken Kantenabstandes für das Dokument.

9. System zur automatischen Erfassung einer Kante eines Dokuments in einem Scanning- System, das umfasst:

einen Scanner (100), der einen Teil des Dokuments und einer Hinterlegung scannt, um Pixeln von Bilddaten, die eine Bilddichte darstellen, zu erzeugen, und

eine erste Einrichtung (106), die einen Satz von ersten Werten aus den Bilddaten unter Verwendung einer Mittelwertfunktion berechnet, gekennzeichnet durch

eine zweite Einrichtung (105), die einen Satz von zweiten Werten aus den Bilddaten unter Verwendung einer Standardabweichungsfunktion berechnet, und

eine dritte Einrichtung (104), die die Lage einer physikalischen Kante des Dokuments aus dem Salz von ersten Werten und dem Satz von zweiten Werten durch Ermitteln der Lage einer Änderung in der Standardabweichung der Bilddichte der Pixel bestimmt.

10. System nach Anspruch 9, das eingerichtet ist, ein Verfahren nach einem der Ansprüche 1 bis 8 durchzuführen.







IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche


Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com