Die vorliegende Erfindung betrifft ein System und Verfahren zur automatischen Erkennung
der Kante einer Dokuments, das mit einem Abtastsystem abgetastet wird. Insbesondere
ist die vorliegende Erfindung auf ein Verfahren und System gerichtet, um die Kante und
Breite eines Dokuments, das abgetastet wird, unter Verwendung von Werten, die aus einer
Funktion zweiter Ordnung berechnet werden, zu ermitteln.
Im Büromaschinenumfeld sind mit einem Kopierer traditionell xerographische
Lichtlinsen-Kopierer gemeint, bei denen Papiervorlagen in der Tat fotografiert werden. Die Bilder werden
auf einen Bereich eines Fotorezeptors fokussiert, der anschließend mit Toner entwickelt
wird. Das entwickelte Bild auf dem Fotorezeptor wird dann auf ein Kopierblatt übertragen,
das wiederum verwendet wird, um eine dauerhafte Kopie des Originals anzufertigen.
In letzter Zeit wurden Geräte zur Verfügung gestellt, die als Digitalkopierer bekannt sind in
seinen wichtigsten Grundfunktionen führt ein Digitalkopierer dieselben Funktionen wie ein
Lichtlinsen-Kopierer aus, außer dass das zu kopierende Originalbild nicht direkt auf einen
Fotorezeptor fokussiert wird. Stattdessen wird bei einem Digitalkopierer das Originalbild mit
einer Einrichtung abgetastet, die allgemein als Rastereingabe-Scanner (RIS) bekannt ist, der
typischerweise die Form einer linearen Anordnung von kleinen Fotosensoren hat.
Die Vorlage wird auf die Fotosensoren indem RIS fokussiert. Der RIS wandelt die
verschiedenen hellen und dunklen Bereiche der Vorlage in einen Satz von Digitalsignalen um. Diese
Digitalsignale werden vorübergehend in einem Speicher aufbewahrt und dann schließlich
benutzt, um eine digitale Druckvorrichtung zu treiben, wenn Kopien der Vorlage gedruckt
werden sollen, oder einen Anzeigebildschirm zu treiben, wenn das Bild angezeigt werden soll.
Das heißt, das Bild wird gescannt und in elektrische Signale umgewandelt, sodass das Bild
für andere Wiedergabezwecke verwendet werden kann. Die Digitalsignale können auch
direkt an die Druck- oder Anzeigevorrichtung gesandt werden, ohne in einem Speicher
gespeichert zu werden. Die digitale Druckvorrichtung kann jede bekannte Art von Drucksystem
sein, das auf Digitalsignale anspricht, z. B. ein modulierender abtastender Laser, der
bildbreite Teile eines Fotorezeptors entlädt, oder ein Tintenstrahl-Druckkopf.
Mit dem Einzug der kopierenden und abtastenden Systeme in ein digital basiertes System
stehen die Systeme anderen Problemen als die Lichtlinsen- oder Analog-Kopiersysteme gegenüber.
Genauer gesagt, in einem digitalen Abtastsystem muss das Abtastsystem die
tatsächliche Lage des Dokuments ausfindig machen, sodass jede gewünschte
Bildverarbeitungsroutine auf die richtigen Bilddatenpixel angewandt werden kann.
Beim Beschreiben der vorliegenden Erfindung wird der Begriff Pixel gebraucht werden.
Dieser Begriff bezieht sich auf ein elektrisches (oder optische, wenn Faseroptik benutzt wird)
Signal, das die physikalisch messbaren optischen Eigenschaften in einem physikalisch
definierbaren Bereich auf einem empfangenden Medium darstellt. Das empfangende Medium
kann ein berührbares Dokument, ein Fotorezeptor oder ein
Markierungsmaterial-Transfermedium sein. Des Weiteren kann sich der Begriff Pixel auf ein elektrisches (oder optisches,
wenn Faseroptik benutzt wird) Signal beziehen, das die physikalisch messbaren optischen
Eigenschaften in einem physikalisch definierbaren Bereich auf einem Anzeigemedium
darstellt. Eine Vielzahl von physikalisch definierbaren Bereichen für beide Fälle stellt die
physikalisch messbaren optischen Eigenschaften des gesamten physikalischen Bildes dar, das
durch entweder eine Material-Markierungseinrichtung, eine elektrische oder magnetische
Markierungseinrichtung oder eine optische Anzeigeeinrichtung wiederzugeben ist.
Schließlich kann sich der Begriff Pixel auf ein elektrisches (oder optisches, wenn Faseroptik
benutzt wird) Signal beziehen, das physikalische optische Merkmalsdaten darstellt, die von
einer einzelnen Fotosensorzelle erzeugt werden, wenn ein physikalisches Bild abgetastet
wird, um die physikalischen optischen Merkmale des physikalischen Bildes in eine
elektronische oder elektrische Darstellung umzuwandeln. Mit anderen Worten, in dieser Situation ist
ein Pixel eine elektrische (oder optische) Darstellung der physikalischen optischen
Merkmale einer in einem physikalisch definierbaren Bereich auf einem optischen Sensor
gemessenen physikalischen Abbildung.
Bei einem digitalen Abtastsystem ist es erwünscht, die Bildbearbeitungsroutinen nur auf dem
Bild des Dokuments und nicht auf den Bilddaten durchzuführen, die die Hinterlegung der
Andruckplattenabdeckung in einem Andruckplatten-Abtastsystem oder die Andruckwalze in
einem Dokumenten-Zuführungssystem, z. B. einem Transportsystem mit konstanter
Geschwindigkeit ("CVT"), darstellen. In dieser Anmeldung wird der Begriff Andruckwalze oder
Hinterlegung gebraucht um den von dem digitalen Scanner abgetasteten Bereich zu beschreiben,
der nicht das abzutastende Dokument oder gewünschte Bild ist.
In einem digitalen Abtastsystem ist es daher wichtig, die tatsächliche Lage des Dokuments,
das gescannt wird, zu bestimmen, d. h., die Kanten und Breite des Dokuments. Diese Lokalisierung
des Dokuments ist besonders wichtig bei einem Abtastsystem für technische
Dokumente.
Bei einem Abtastsystem für technische Dokumente kann das eingegebene Dokument jede
Größe zwischen 5 Zoll und mehr als 36 Zoll haben. Herkömmlich würde bei einem
Verfahren zur Bestimmung der Lage des Dokuments ein Benutzer die Dokumentengröße von Hand
ermitteln und die Breite über eine Benutzerschnittstelle in das Dokumenten-Abtastsystem
eingeben, bevor das Dokument tatsächlich gescannt wird. Bei dieser herkömmlichen
Methode muss das Dokument in dem Dokumenten-Abtastsystem zentriert werden, um zu
vermeiden, dass das Dokument abgeschnitten wird.
Diese herkömmliche Methode verringert die Produktivität und verursacht verschwendete
Kopien, da ein Benutzer nicht immer die richtige Breite oder Mitte des Dokuments in das
Dokumenten-Abtastsystem genau eingeben kann. Es wäre daher wünschenswert, ein System zur
automatischen Breitenermittlung zu haben, um die Breite und Lage des Dokuments zu
bestimmen, wenn das Dokument anfangs zum Abtasten in Szene gesetzt wird.
Es sind verschiedene Schemas zur automatischen Breitenermittlung vorgeschlagen worden,
und die Breite und Lage des Dokuments zu bestimmen, wenn das Dokument in Szene
gesetzt wird, aber diese Bestimmungsverfahren sind nicht ganz erfolgreich gewesen, weil die
in einer technischen Umgebung zu scannenden Dokumente der Hinterlegung sehr ähnlich
sein können, was es daher schwer macht, zwischen dem Papier und der Hinterlegung
(Andruckwalze oder Andruckplattenabdeckung) zu unterscheiden.
Dieses Problem verstärkt sich, wenn der CCD-Sensorausgang schwankt. Außerdem ist es
möglich, dass ein Dokument und Scanner interagieren können, um einen integrierenden
Hohlraumeffekt hervorzubringen, der die Kantenlage des Dokuments verbergen wird.
Ein derartiges herkömmliches Verfahren zur automatischen Breitenermittlung ergreift einen
Teil der Vorderkante eines in Szene gesetzten Dokuments, wobei der ergiffene Teil der
Vorderkante Bilddaten enthält, die sowohl die Hinterlegung als auch das Dokument selbst
betreffen. In diesem automatisierten Prozess werden die Breite und Lage eines Dokuments
berechnet, indem ermittelt wird, ob jedes CCD-Sensorelement von einer Hinterlegung oder
dem Dokument bedeckt wird.
Mit anderen Worten, der Breitenermittlungsprozess wird ein Klassifizierungsprozess. Jedes
CCD-Sensorelement wird entweder von der Hinterlegung oder dem Dokument bedeckt. Um
diese Feststellung zu treffen, benutzt das herkömmliche automatische Ermittlungsverfahren
den Mittelwert jeder Spalte von Pixeln von Bilddaten, um zwischen dem Dokument und der
Hinterlegung zu unterscheiden. Beispiele dieser Mittelwertdaten werden in Fig. 3 und 5 der
vorliegenden Anmeldung veranschaulicht.
Da aber die Helligkeit des Dokuments von sehr dunkel bis sehr hell variiert und da die
meisten Verbundpapier- und Filmdokumente fast dieselbe Helligkeit aufweisen wie die
Hinterlegung, ist der herkömmliche Prozess zur automatischen Breitenermittlung oftmals
außerstande, die tatsächliche Lage und Breite des Dokuments zu ermitteln. Außerdem beruht das
herkömmliche Verfahren einzig auf der Ermittlung der Lage und Breite des Dokuments aus
Mittelwertdaten, die einer Funktion erster Ordnung entsprechen. Die Mittelwertdaten sind sehr
anfällig für elektrisches Rauschen in den CCD-Sensoren oder Staub und Schmutz innerhalb
des eigentlichen Abtastsystems. Mit anderen Worten, jede übermäßige elektrische
Rauschen, Staub oder Schmutz könnten den herkömmlichen Prozess zur automatischen
Breitenermittlung leicht unwirksam machen.
Neben seiner Empfindlichkeit für elektrisches Rauschen, Staub und Schmutz benötigt der
herkömmliche Prozess zur automatischen Breitenermittlung eine sehr empfindliche
Filterungsroutine, um den Übergang von der Andruckwalze zu dem Dokument, d. h., den Rand
des Dokuments, zu erkennen. Dies ist in Fig. 3 und 5 der vorliegenden Anmeldung zu
sehen, worin die Übergänge von der Hinterlegung zu dem Dokument (etwa bei Pixelnummer
510 bzw. 245) durch eine sehr schmale Impulsspitze dargestellt werden. Der
herkömmliche Prozess erfordert daher eine sehr empfindliche Filterungsroutine, um diesen Übergang
zu erfassen, was wiederum den Erfassungsprozess sehr empfindlich für elektrisches
Rauschen, Staub oder Schmutz macht.
Es ist deshalb wünschenswert, eine automatische Erfassungsroutine zu haben, die die Lage
und Breite des grade gescannten Dokuments genau erfassen kann, ohne für elektrisches
Rauschen, Staub oder Schmutz empfindlich zu sein.
Nach einem ersten Aspekt der vorliegenden Erfindung umfasst ein Verfahren zur
automatischen Erkennung einer Kante eines Dokuments in einem Scanning-System die folgenden
Schritte:
(a) Scannen eines Teils des Dokuments und einer Hinterlegung;
(b) Erzeugen von Pixeln von Bilddaten, die eine Bilddichte darstellen, und
(c) Berechnen eines Satzes von ersten Werten aus den Bilddaten unter Verwendung einer
Mittelwertfunktion, gekennzeichnet durch
(d) Berechnen eines Satzes von zweiten Werten aus den Bilddaten unter Verwendung einer
Standardabweichungsfunktion, und
(e) Bestimmen der Lage einer physikalischen Kante des Dokuments aus dem Salz von
ersten Werten und dem Satz von zweiten Werten durch Ermitteln der Lage einer Änderung in
der Standardabweichung der Bilddichte der Pixel.
Nach einem zweiten Aspekt der vorliegenden Erfindung umfasst ein System zur
automatischen Erfassung einer Kante eines Dokuments in einem Scanning-System einen Scanner,
der einen Teil des Dokuments und einer Hinterlegung scannt, um Pixeln von Bilddaten, die
eine Bilddichte darstellen, zu erzeugen, und
eine erste Einrichtung, die einen Satz von ersten Werten aus den Bilddaten unter
Verwendung einer Mittelwertfunktion berechnet, gekennzeichnet durch
eine zweite Einrichtung, die einen Satz von zweiten Werten aus den Bilddaten unter
Verwendung einer Standardabweichungsfunktion berechnet, und
eine dritte Einrichtung, die die Lage einer physikalischen Kante des Dokuments aus dem
Satz von ersten Werten und dem Salz von zweiten Werten durch Ermitteln der Lage einer
Änderung in der Standardabweichung der Bilddichte der Pixel bestimmt.
Die vorliegende Erfindung schlägt ein Verfahren und System vor, um eine automatische
Erkennung der Kante eines Dokuments bereitzustellen, das im Wesentlichen unempfindlich
ist für Staub, Schmutz sowie elektrisches Rauschen, wobei die vorliegende Erfindung
Statistik zweiter Ordnung, z. B. eine Standardabweichung, zusätzlich zu der Mittelwertinformation
benutzt, um die tatsächliche Kante des Dokuments zu ermitteln. Durch Verwenden von
Statistik zweiter Ordnung kann der Übergang zwischen der Hinterlegung und dem Dokument
leichter gefunden werden, ahne von empfindlichen Filterungsroutinen Gebrauch zu machen.
Die Kantenermittlung kann benutzt werden, um die Breite und Lage des Dokuments zu
ermitteln.
Das Folgende ist eine Kurzbeschreibung aller Zeichnungen, die zum Beschreiben der vorliegenden
Erfindung benutzt werden und daher nur zum Zweck der Veranschaulichtung
präsentiert werden und den Umfang der vorliegenden Erfindung nicht einschränken sollen.
Inhalt der Zeichnungen:
Fig. 1 ist eine Skizze eines typischen digitalen Abtastsystems.
Fig. 2 veranschaulicht ein typisches Vorderkantenbild, das während der
Vorlageninszenierung erfasst wird.
Fig. 3 ist eine Grafik, die Mittelwertdaten an einer rechten Kante einer Vorlage während der
Vorlageninszenierung veranschaulicht.
Fig. 4 ist eine Grafik, die Standardabweichungsdaten an einer rechten Kante einer Vorlage
während der Vorlageninszenierung veranschaulicht.
Fig. 5 ist eine Grafik, die Mittelwertdaten an einer linken Kante einer Vorlage während der
Vorlageninszenierung veranschaulicht.
Fig. 6 ist eine Grafik, die Standardabweichungsdaten an einer linken Kante einer Vorlage
während der Vorlageninszenierung veranschaulicht.
Fig. 7 veranschaulicht die Mitten-Cluster und Streuung verschiedener Vorlagen und
Hinterlegungsmessungen nach den Vorstellungen der vorliegenden Erfindung.
Fig. 8 ist eine grafische Darstellung einer Abstandsmessung im Merkmalsraum nach den
Vorstellungen der vorliegenden Erfindung.
Fig. 9 ist eine grafische Darstellung eines typischen Histogramms einer Vorlage.
Fig. 10 ist ein Blockschaltbild, das ein System zur automatischen Erkennung einer Breite
und Lage einer Vorlage nach den Vorstellungen der vorliegenden Erfindung zeigt.
Fig. 11 und 12 sind Flussdiagramme, die ein Verfahren zur automatischen Erkennung einer
Breite und Lage einer Vorlage nach den Vorstellungen der vorliegenden Erfindung
veranschaulichen.
Fig. 13 ist eine Grafik, die den Übergang zwischen der Hinterlegung und der Kante einer
Vorlage veranschaulicht, nachdem eine Kantenblock nach den Vorstellungen der
vorliegenden Erfindung ermittelt wurde.
Das Folgende ist eine ausführliche Beschreibung der vorliegenden Erfindung. In dieser
Beschreibung und in den Zeichnungen stellen gleiche Verweiszeichen gleichwertige Schalt
kreise und/oder gleichwertige Funktionen dar.
Wie oben bemerkt ist Fig. 1 eine Skizze eines typischen digitalen Abtastsystems. Wie in Fig.
1 veranschaulicht wird eine Vorlage 1 durch einen CCD-Sensor 7 abgetastet. Bei dem in
Fig. 1 gezeigten einzelnen System wird die Vorlage 1 unter Verwendung einer Andruckwalze
3 an dem CCD-Sensor 7 vorbeigeführt. Das von der Vorlage 1 und der Andruckwalze 3
reflektierte Licht durchläuft ein Linsensystem 5, das das reflektierte Licht auf den CCD-Sensor
7 fokussiert. Das reflektierte Licht wird in Bezug auf eine optische Mittellinie 13 fokussiert.
Das reflektierte Bild der Vorlage 9 und das reflektierte Bild der Andruckwalze 11 werden von
dem CCD-Sensor 7 in Pixel von Bilddaten umgewandelt. Der CCD-Sensor 7 erzeugt daher
Pixel von Bilddaten, die sowohl das reflektierte Bild der Andruckwalze 11 als auch das
reflektierte Bild der Vorlage 9 darstellen.
Fig. 2 veranschaulicht ein typisches Vorderkantenbild, das während der
Vorlageninszenierung erfasst wird. Wie in Fig. 2 veranschaulicht, wird die Vorderkante des Bildes erfasst,
wobei die Bilddaten sowohl das reflektierte Bild der Hinterlegung als auch der eigentlichen
Vorlage darstellen. Bei dem in Fig. 2 veranschaulichten Beispiel tastet der CCD-Sensor eine
Breite von 36 Zoll ab.
Wenn die Auflösung des CCD-Sensors 200 Punkte pro Zoll beträgt, wird das digitale
Abtastsystem 7200 Bilddatenpixel pro Abtastzeile erzeugen. Jedem Bilddatenpixel wird dann eine
Pixelstellennummer von 1 bis 7200 in einer Links-nach-Rechts-Ausrichtung und eine
Pixelstellennummer von 1 bis 7200 in einer Rechts-nach-Links-Ausrichtung zugewiesen. Diese
Pixelstellennummern bilden dann Spalten von Bilddaten, da während des
Vorlageninszenierungsmodus mehr als eine Abtastzeile des Vorderkantenbildes erfasst wird. Wenn z. B.
die abgetastete Vorderkante 25 Abtastzeilen ist, würde eine Pixelstellennummer eine Spalte
von 25 Pixeln sein, wobei die Bilddaten jedes dieser Pixel durch dieselbe Fotostelle auf dem
CCD erzeugt werden worden wären.
Ein Beispiel dieser Spalten von Bilddaten wird durch Verweiszeichen 21 in Fig. 2
veranschaulicht. Genauer, ein Spaltenblock 21 wird veranschaulicht, in dem der Mittelwert und
die Standardabweichung jeder Spalte gezeigt werden. Genauer, für die mit Spalte i
verbundene Pixelstelle ist z. B. der Mittelwert Xi, und der Standardabweichungswert ist Si, während
für die mit Spalte i + 1 verbundene Pixelstelle der Mittelwert Xi+1 und der Standardabweichungewert
Si+1 sind. Die mit jeder Spalte verbundenen Mittel- und
Standardabweichungswerte werden von der vorliegenden Erfindung bei der Ermittlung der tatsächlichen Kanten
und Breite der abzutastenden Vorlage benutzt. Weitere Beispiele dieser spaltenformatierten
Daten werden in Fig. 3-6 veranschaulicht. Insbesondere veranschaulicht Fig. 3 die
Mittelwerte für die Pixelstellen zwischen Pixel 0 und Pixel 1200, wenn von rechts nach links
abgetastet wird (von Hinterlegung nach Vorlage), während Fig. 5 den Mittelwert für jede Pixelstelle
von Pixelnummer 0 bis Pixelnummer 400 veranschaulicht, wenn von links nach rechts
abgetastet wird. Zum anderen veranschaulicht Fig. 4 den Standardabweichungswert für die
Pixelstellen zwischen Pixelnummer 0 und Pixelnummer 1200, wenn von rechts nach links
abgetastet wird, während Fig. 6 den Standardabweichungswert für jede Pixelstelle von
Pixelnummer 0 bis Pixelnummer 400 veranschaulicht wenn von links nach rechts abgetastet wird. Mit
anderen Worten, Fig. 3 und 4 entsprechen der Ablesung der Pixeln von Bilddaten in einer
Weise von rechts nach links, während Fig. 5 und 6 die Ablesung von mit Pixelstellen
verbundenen Daten in einer Weise von links nach rechts veranschaulichen.
Wie in Fig. 3 und 5 veranschaulicht wird ist es schwer, die linke und rechte Kante einer
Vorlage nur unter Verwendung der Mittelwertdaten zu ermitteln, weil viele Quellen zu der in den
Daten gesehenen Veränderung wesentlich beitragen können. Genauer, obwohl die
Hinterlegung ein gleichbleibendes Reflexionsvermögen aufweist, hat der lineare CCD ein sich
änderndes Ansprechverhalten, was auf Schwankungen von Element zu Element (Fotostellen
auf einem CCD-Sensor oder Fotosensorchips in einer Vollbreiten-Anordnung), Optik und
(elektrisches) Rauschen des Systems zurückzuführen ist. Des Weiteren können
Staubteilchen in dem Bild als vertikale dunkle Streifen erscheinen, und die Vorlagen selbst können
infolge ihrer Oberflächenbeschaffenheit und ihres Fasergehaltes sehr stark voneinander
abweichen. Schließlich besitzen, wie oben angemerkt, einige Arten von Vorlagen, z. B. Film-
und Verbundpapier, Reflexionswerte, die der Hinterlegung ähnlich sind.
Andere Schwankungsquellen können dunkle Vorlagen sein, die bewirken, dass sich nahe
der Kante der Vorlage ein Reflexionsglanz bildet, was dazu führt dass die Kanten als
Rampen erscheinen, während Staubteilchen verschiedene Sprünge verursachen, die ähnlich
der Kante eines Film- oder Verbundpapiers erscheinen. Die Schwankung von Element zu
Element in dem CCD-Sensor oder der Vollbreiten-Anordnung zusammen mit
Systemrauschen kann Reflexionsschwankungen verursachen, die Kanten verbergen können. Mit
anderen Worten, diese verschiedenen Schwankungsquellen führen dazu, dass die Erfassung
der linken und rechten Vorlagenkante sehr schwierig wird, wenn sie sich nur auf
Mittelwertdaten stützt.
Andererseits werden, wie in Fig. 4 und 6 veranschaulicht, Werte zweiter Ordnung, z. B.
Standardabweichungswerte, zusätzlich zu den Mittelwerten benutzt. Durch Verwenden dieser
zweiten Werte, d. h. Werte, die von einer Funktion zweiter Ordnung erzeugt werden, kann die
Empfindlichkeit für die verschiedenen Schwankungsquellen aufgrund der breiten Lücke
zwischen der Standardabweichung für die Vorlage und der Standardabweichung für die
Hinterlegung wesentlich vermindert werden.
Genauer, für die CCD-Elemente, die von der Hinterlegung bedeckt werden, ist die
Standardabweichung das elektronische Sensorrauschen, da die Hinterlegung während des Abtastens
stationär ist. Für die Elemente des CCD-Sensors, die von der Vorlage bedeckt werden,
besteht jedoch, da sich die Vorlage während des Abtastens beim Inszenieren der Vorlage
bewegt, die Standardabweichung aus elektronischem Sensorrauschen und der
Helligkeitsänderung der Vorlage. Die Helligkeitsänderung der Vorlage ist typischerweise viel größer als das
elektronische Sensorrauschen, und der Standardabweichungswert liefert somit eine saubere
und bedeutsame Lücke, wenn es einen Übergang von der Hinterlegung zu der Vorlage
selbst gibt.
Des Weiteren ist der Standardabweichungswert robuster gegen Schmutz oder Staub auf der
Hinterlegung. Ein Staub- oder Schmutzteilchen auf der Hinterlegung wird den Mittelwert
erheblich verringern, aber das Sensorrauschen ist noch dasselbe, weil es während des
Abtastens denselben Punkt sieht. Mit anderen Worten, der Mittelwertunterschied zwischen der
Hinterlegung und der Vorlage kann durch Sensorrauschen und/oder Staub oder Schmutz auf
der Hinterlegung verschleiert werden, während der Standardabweichungsunterschied
deutlich sichtbar und gut getrennt ist, da diese Werte für elektronisches Rauschen oder Staub
und Schmutz nicht bedeutsam empfindlich sind.
In der bevorzugten Ausführung der vorliegenden Erfindung wird das
Signal/Rausch-Verhältnis durch Tiefpassfilterung, die im Scanner erfolgt, weiter erhöht. Das von dem Scanner
erhaltene Bild kann z. B. mit 400 spi abgetastet werden und über ein 4-Pixel breites Fenster
auf jeder Abtastzeile gemittelt werden, um ein 100-spi Bild zu erzeugen. Die Wirkung ist, das
Bild tiefpassmäßig zu filtern. Auf der Andruckwalze, wo das Reflexionsvermögen unabhängig
und identisch normal verteilt ist, wird die Varianz des Scannerrauschens um 1/2 reduziert.
Aber das Papierrauschen hat ein etwa 1/f² Leistungsspektrum. Tiefpassfilterung (Mittelung)
hat wenig Wirkung. Dies erhöht das Signal/Rausch-Verhältnis zwischen der Vorlage und der
Andruckwalze.
Im Hinblick auf die Robustheit der Standardabweichungswerte benutzt die vorliegende
Erfindung ein Verfahren wie in Fig. 11 und 12 veranschaulicht, um die Kanten der Vorlage zu
erkennen, wobei dieses Verfahren die Kanten der Vorlage aus dem Mittelwert, dem
Standardabweichungswert und Schwarzpixel-Zählwerten für jede Spalte von Bilddatenpixeln
errechnet. Wie in Fig. 11 veranschaulicht, ermittelt Schritt S1 die Hintergrundwerte aus einem
Histogramm des Vorderkantenbildes der Vorlage während der Vorlageninszenierung.
Ein typisches Histogramm für ein Bild wird in Fig. 9 veranschaulicht, worin das Histogramm
typischerweise zwei getrennte Spitzen 31 und 37 enthält. Die Spitze 31 stellt den
Weiß-Spitzenwert oder Vorlagen-Hintergrundwert dar, während die Spitze 37 den
Schwarz-Spitzenwert darstellt. Diese Spitzenwerte werden zusammen mit einem Breitenwert 35 der
Verteilung des Weiß-Spitzenwerte benutzt, um einen Schwellenwert zu bestimmen, der beim
Bestimmen, ob ein Pixel schwarz oder weiß ist und ob die Vorlage die Enden des Scanners
bedeckt, benutzt werden wird.
Nach dem Bestimmen der Hintergrundwerte aus dem Histogramm bestimmt Schritt S2 den
rechten und linken Kantenabstand. In der bevorzugten Ausführung der vorliegenden
Erfindung wird der Abstand der linken Kante mithilfe der folgenden Gleichung berechnet:
worin LocMean der Mittelwert von 8 Spaltenmittelwerten am linken Ende des CCD-Sensors
ist, LocStd der Mittelwert von 8 Spalten-Standardabweichungen am linken Ende des CCD-
Sensors ist, LeftMean die Scannerantwort auf die Andruckwalze ist MEANTOL, STDTHD
und STDTOL voreingestellte Werte sind, und Wstd der Wichtungsfaktor der
Standardabweichung ist. Bei der bevorzugten Ausführung ist Wstd = 4 für dunkle Substrate und 2 für
andere Vorlagen. Der rechte Kantenabstand (DistRgt) wird mittels einer ähnlichen Gleichung
berechnet, wobei alle Werte auf die rechte Seite der Abtasteinrichtung reflektiert werden.
Nach Vollendung von Schritt S2 bestimmt der Prozess den Mittelwert, den
Standardabweichungswert und den Schwarzpixel-Zählwert für jede mit einer einzelnen Pixelstelle
verbundene Pixelspalte. Genauer, wenn die Vorderkante einer während der Vorlageninszenierung
abgetasteten Vorlage 30 Abtastzeilen enthält, würde die Pixelspalte für die Pixelstelle 50
z. B. 30 Pixel von Bilddaten enthalten, wobei jedes Pixel von Bilddaten durch dieselbe Einheit
Fotozelle des CCD erzeugt wurde.
Sobald diese Werte berechnet sind, gruppiert Schritt S4 die Werte für benachbarte Spalten
zu Blöcken; in der bevorzugten Ausführung der vorliegenden Erfindung enthält der Block 5
Spalten von Mittelwerten, Standardabweichungswerten und Schwarzpixel-Zählwerten. Nach
Gruppieren der Spalten von Pixelwerten in Blöcken untersucht Schritt S5 jeden Datenblock
und klassifiziert den Block als entweder Hinterlegung oder Vorlage. Wenn in Schritt S6
festgestellt wird, das der Block als Hinterlegung klassifiziert wurde, aktualisiert Schritt S7 den
Cluster-Mittenwert und den Streuwert, die Funktionen des Mittelwerts und des
Standardabweichungswerts der Blöcke sind, die untersucht wurden. Die eigentlichen Berechnungen für
diese Werte werden unten ausführlicher erörtert.
Sobald alle Blöcke als entweder Hinterlegung oder Vorlage klassifiziert sind, berechnet
Schritt S9, welcher Block am wahrscheinlichsten eine Kantenstelle enthalten könnte, und
ermittelt die Kostenfunktion oder zugehörigen Vertrauensfaktor, der einen Vertrauensgrad
angibt, dass der Block die Kante der Vorlage enthält. Die Kantenlage wird unter Verwendung
einer adaptiven euklidischen Abstandsformel berechnet
Es wird angemerkt, dass die Koeffizienten (a) und (z) gemäß einer geschätzten
Vorlagenart festgelegt werden, die unter Verwendung der Histogrammspilzen und der Streuung des
Histogramms um die Weißspitze herum, wie in Fig. 9 veranschaulicht, bestimmt wird. Es
wird jedoch angemerkt, dass der mittlere Mittelwert (avgmean [i]) und die mittlere
Standardabweichung (avgstd [i]) die Clustermitten-Koordinaten für die Hinterlegung sind (Fig. 7). Die
Standardabweichung des Mittelwerts (stddevmean [i-1]) und die Standardabweichung der
Standardabweichung (stdvevstd [i-1]) liefern ein Maß der Streuung der Hinterlegung. Sowohl
die Clustermitte als auch die Streuung hängen von Scanner-Kalibrierung, der
Vorlagenhelligkeit (integrierter Hohlraumeffekt) und dem Scannerrauschen ab. Diese Werte müssen
deshalb von Abtastung zu Abtastung und vom Rand des Scanners zur Vorlagenkante
adaptierbar sein.
Die Berechnung des Blocks mit einer möglichen Kantenstelle und der Kostenfunktion wird
eine vorbestimmte Zahl von Malen durchgeführt, wobei jede Wiederholung der Berechnung
weniger strenge Kriterien und Kompentenz-Koeffizienten benutzt, um festzustellen, ob eine
Kante in einem Block erscheint. Mit anderen Worten, bei jeder Wiederholung der
Berechnung für die Kantenblocketelle und Kostenfunktion werden die k_factor-Werte der oben
beschriebenen Abstandsformel geändert. In der bevorzugten Ausführung der vorliegenden
Erfindung werden die Kantenblockstelle und die zugehörige Kostenfunktion für drei getrennte
Wiederholungen unter Verwendung von drei verschiedenen k_factor-Werten berechnet,
wobei der erste k_factor-Wert 2.5 ist, der zweite k_factor Wert 3 ist, und der letzte k_factor-
Wert 4 ist.
Nachdem die Wiederholungen vollendet sind, werden in Schritt S12 die Kantenblockstellen
und zugehörigen Kostenfunktionen für die verschiedenen k-Faktoren untersucht, um die
bestmögliche Kantenblockstelle (die Blockstelle mit dem höchsten Vertrauensgrad) zu
finden. Unter Verwendung des Blocks mit der bestmöglichen Kantenstelle findet Schritt S13 die
physikalische Kante der Vorlage in dem Kantenblock, indem ein Ableitungsverfahren im
zweidimensionalen Raum verwendet wird.
Die Bestimmung des bestmöglichen Kantenblocks erwägt, ob irgendwelche der drei Blöcke
übereinstimmen und vergleicht ihre zugehörigen Kostenfunktionen. Wenn zwei oder mehr
Blockstellen übereinstimmen, wird diese Blockstelle als die bestmögliche Kantenblockstelle
ausgewählt, und die zugehörige Kostenfunktion wird vermindert oder der Vertrauensfaktor
wird erhöht. Der gewählte bestmögliche Kantenblock wird weiter untersucht, um zu ermitteln,
ob es irgendwelche Schwarzpixel in dem gewählten Block gibt. Abhängig davon, ob
irgendwelche Schwarzpixel gefunden werden oder ob die zugehörige Kostenfunktion größer als
ein vorbestimmter Wert ist, wird der gewählte bestmögliche Kantenblock als der gewählte
Kantenblock beibehalten, oder der Prozess zeigt an, dass beim Ermitteln der Kante der
Vorlage ein Fehler aufgetreten ist.
Vor Schritt S13 wird die Kantenstelle innerhalb des Blocks 21 von Fig. 2 gefunden. In Schritt
S13 wird die tatsächliche Kante unter Verwendung von drei Pixelblöcken bestimmt, der
gewählte bestmögliche Kantenblock und die zwei angrenzenden Blöcke. Diese drei
Kantenblöcke werden mittels eines Ableitungsverfahrens untersucht, um festzustellen, welche
Pixelstelle die eigentliche Lage der physikalischen Kante der Vorlage ist.
Ein Software-Implementierungsbeispiel des oben beschriebenen Verfahrens wird in Tabelle
1 unten dargelegt. Diese Tabelle zeigt ein Beispiel von Softwarecode, der die oben
beschriebenen Funktionen ausführt, um die Kanten einer Vorlage mittels Statistik zweiter Ordnung zu
finden. Obwohl der Prozess der vorliegenden Erfindung in Software implementiert wurde,
kann er auch leicht in Hardware implementiert werden.
Fig. 13 veranschaulicht ein mögliches Beispiel dieser Untersuchung, wobei Block 43 den
bestmöglichen Kantenblock darstellt, und die Blöcke 41 und 45 die an den bestmöglichen
Kantenblöcke grenzenden Blöcke darstellen. Die Daten in den Blöcken 41, 43 und 45
werden mithilfe eines Ableitungsverfahrens analysiert, bis die Pixelstelle 47 der tatsächlichen
Kante der Vorlage ermittelt ist.
Fig. 7 ist eine grafische Darstellung der Berechnung einer Clustermitte oder eines
Hinterlegungswerts und der Streuung für eine Hinterlegung sowie der Clustermitte und der
Streuungswerte für eine Filmvorlage und eine Verbundpapiervorlage. Es wird angemerkt, dass
sich Clustermitten als Reaktion auf das Abtasten quer über das Bild und von Abtastung zu
Abtastung bewegen können. Obwohl die in Fig. 7 widergespiegelten Daten grob elliptisch
erscheinen, werden diese Daten um den Punkt (locmean, locstd) herum sphärisch, wenn die
Daten in Bezug auf die Standardabweichung des Mittelwerts und die Standardabweichung
der Standardabweichung normalisiert werden. Ein Beispiel dieser normalisierten Daten wird
in Fig. 8 veranschaulicht.
Wie in Fig. 8 veranschaulicht, ist der Mittelpunkt der Sphäre (X0i, S0i), wo X0i der Mittelwert
der Mittelwerte der zuvor analysierten Blöcke ist, und S0i der Mittelwert der
Standardabweichungen der zuvor analysierten Blöcke ist. Des Weiteren ist die Streuung dieser Daten gleich
der Stabdardabweichung der Mittelwerte der zuvor analysierten Blöcke und der
Standardabweichung der Standardabweichungen der zuvor analysierten Blöcke. Fig. 8 veranschaulicht
auch, wie das Ändern des k Faktors in der Abstandsformel die Auswirkung der Streuung auf
die Abstandsberechnung verändert.
Wie oben angemerkt, wird beim Bestimmen, ob ein Block als die Kantenblockstelle
ausgewählt wird, der Abstand zwischen der Clustermitte und einem durch die Koordinate
(avgmean, avgstd) dargestellten Punkt, der den grade analysierten vorliegenden Block
darstellt, berechnet. Je größer der Abstandswert ist, umso wahrscheinlicher ist es, dass der
Block eine Vorlage enthält.
Genauer, die Abstand zu Wahrscheinlichkeit-Beziehung ist in Fig. 3-6 klar zu sehen, worin
die Übergangspunkte zwischen der Hinterlegung und der Vorlage Sprünge in den Daten
verursachen, um so einen bedeutsamen Abstand zwischen dem Mittelwert und der
Standardabweichung des grade analysierten Blocks und dem Mittelwert der Mittelwerte der
zuvor analysierten Blöcke und dem Mittelwert der Standardabweichungen der zuvor
analysierten Blöcken anzuzeigen.
Wenn eine Kante angetroffen wird, werden avgmean und avdstd im Wert noch springen.
Die statistischen Werte locmean und locstd eilen dem Rest nach, was di veranlasst,
plötzlich zuzunehmen. Es wird jedoch Fehlalarme geben. Diese werden wie folgt behandelt.
Jede Abtastung von X (Mittelwert) und S (Standardabweichung) markiert ein Statusfeld mit
0, 1 oder 2 abhängig davon, ob d kleiner als oder gleich einem k_factor, größer als der k
factor oder viel größer als der k_factor ist, wobei der k_factor gleich k oben in der
Abstandsgleichung ist. Eine null (0) gibt 'Hinterlegung' an, 1 bedeutet 'vermutlich in der Vorlage', und
2 bedeutet 'definitiv in der Vorlage'. Für die erste Abtastung wird k_factor klein gesetzt, in der
bevorzugten Ausführung 2.5, und dann bei jeder Abtastung progressiv vergrößert (3 und 4
in der bevorzugten Ausführung). Nach jeder Abtastung enthält ein Statusfeld 0, 1 oder 2. Das
Statusfeld wird mittels der Kosten von Fehlklassifizierung (d. h. Kosten von Typ I oder Typ II
Fehlern) aktualisiert, um Kantenkandidaten zu ergeben.
Zum Beispiel, wenn x so wäre, dass Status[x] = 1 oder 2 ist, werden die mit der
Entscheidung, dass eine Kante bei x ist, verbundenen Kosten als die Summe von Status[i], i < x, plus
der Zahl von 0-en in Status[i], i > x, berechnet. Die Stelle mit kleinsten Kosten ist der
Kantenkandidat. Dieser wird zusammen mit seinen Fehlklassifizierungskosten gespeichert.
Bei der bevorzugten Ausführung werden nach drei Abtastungen mit zunehmendem k_factor
drei Kantenkanditaten plus ihren Fehlklassifizierungskosten erzeugt. Diese drei Kandidaten
werden untersucht um eine einzige Kantenschätzung und Kosten zu erzeugen. Diese
Kosten werden in Vertrauenskoeffizienten 0, 1 oder 2 umgewandelt, die dieselbe Bedeutung wie
zuvor haben. Dieselbe Prozedur wird benutzt, um die beiden Kanten zu schätzen, wobei
lediglich der Abtastprozess in entgegengesetzten Richtungen läuft. Diese Prozedur schätzt bei
der bevorzugten Ausführung die Kante bis auf 5 Pixel, da ein Block aus 5 Pixelspalten
besteht. Der beste (billigste) Kandidat wird gewählt, um die Kante weiter genau festzulegen.
Um die genaue Kante zu finden, benutzt der Prozess den ausgwählten Block und die zwei
links und rechts angrenzenden Blöcke. Diese Daten werden dann rekonfiguriert, in der bevorzugten
Ausführung in Blöcke von 3 Pixelspalten, und die Mittelwerte und
Standardabweichungen werden spaltenweise berechnet, was Mittelwerte mXi, mSi und
Standardabweichungen eXi, sSi, i = 1, ..., BLOCK_SIZE ergibt. Diese Werte werden in einer
Abstandsberechnung ähnlich der oben beschriebenen verwendet:
Di = sqr ([(mXi+1 - mXi)/MEANTOL]² + ((sXi+1 - sXi)]/STDTOL]²)
worin MEANTOL und STDTOL voreingestellte Werte sind. Der größte Sprung von Di wird
benutzt, um die Kante innerhalb von drei Pixeln zu schätzen. Die Kantenstelle wird schließlich
durch Interpolieren benachbarter Werte gefunden. Dieser Schritt wirkt dem Effekt von
Kantenschatten entgegen, die durch den integrierenden Hohlraumeffekt hervorgerufen werden.
Fig. 10 veranschaulicht ein Blockschaltbild einer Schaltung, die benutzt wird, um die
Kantenlage der abzutastenden Vorlage zu bestimmen. Wie in Fig. 10 gezeigt, erzeugt eine CCD-
Sensoranordnung 100 Bilddaten, die in eine Histogrammschaltung 102, eine
Mittelwert-Berechnungsschaltung 106, eine Standardabweichunge-Berechnungeschaltung 105 und einen
Puffer 107 eingegeben werden. Die Histogrammschaltung 102 bestimmt das Histogramm
der Bilddaten und berechnet die oben erörterten Hintergrundwerte. Diese Hintergrundwerte
werden dem Speicher 103 zugeführt, um zur weiteren Verarbeitung zwischengespeichert zu
werden.
Die Mittelwert Berechnungsschaltung 106 berechnet den Mittelwert für jede Spalten von
Pixeln sowie die anderen oben erörterten Mittelwerte und sendet die Mittelwerte an den
Speicher 103. Die Standardabweichungs-Berechnungsschaltung 105 empfängt die Bilddaten
sowie Mittelwertdaten vom Speicher 103, um die Standardabweichung und die anderen oben
erörterten Standardabweichungen der Daten für jede Spalte zu bestimmen, und sendet die
Standardabweichungewerte an den Speicher 103. Eine Bildbestimmungsschaltung 104, die
die oben beschriebenen genauen Prozesse ausführt, ist mit dem Speicher 103 und dem
Puffer 107 verbunden, um die passenden Daten zu empfangen, die zum Berechnen der
physikalischen Kante der abzutastenden Vorlage benötigt werden.
Wie oben beschrieben, wird Statistik zweiter Ordnung (Standardabweichung S.) zusätzlich zu
dem Mittelwert benutzt, um die Kanten der Vorlage zu ermitteln. Dieser Gebrauch von
Statistik zweiter Ordnung liefert einen zuverlässigeren Prozess zur Erkennung der Kanten, der
für elektronisches Sensorrauschen, Staub und/oder Schmutz nicht empfindlich ist.
Obwohl die vorliegende Erfindung oben ausführlich beschrieben wurde, können verschiedene
Modifikationen implementiert werden, ohne vom Geist der vorliegenden Erfindung
abzuweichen. Zum Beispiel ist die bevorzugte Ausführung der vorliegenden Erfindung unter
Bezug auf eine CCD-Sensoranordnung beschrieben worden; dieses automatische
Breitenermittlungsverfahren ist jedoch leicht mit einem Breitanordnungs-Abtastsystem zu
implementieren. Des Weiteren kann das automatische Breitenermittlungsverfahren der vorliegenden
Erfindung leicht auf einem ASIC, einem programmierbaren Gate-Array oder in Software
implementiert werden, wodurch die Platzierung dieses Prozesses in einem Scanner, einem
elektronischen Untersystem, einem Drucker oder einem Anzeigegerät ermöglicht wird.
Schließlich, die vorliegende Erfindung ist unter Bezug auf eine Monochrom- oder
Schwarz/Weiß-Umgebung beschrieben worden. Die Vorstellungen der vorliegenden Erfindung sind
jedoch ohne weiteres auf eine Farbumgebung anwendbar. Das heißt, der automatische
Breitenermittlungsprozess der vorliegenden Erfindung kann auf jeden Farbraumwert, der
das Farbpixel darstellt, angewandt werden.
Tabelle 1
Anspruch[de]
1. Verfahren zur automatischen Erfassung einer Kante eines Dokuments (1) in einem
Scanning-System, das die folgenden Schritte umfasst:
(a) Scannen eines Teils des Dokuments (1) und einer Hinterlegung;
(b) Erzeugen von Pixeln von Bilddaten (21), die eine Bilddichte darstellen, und
(c) Berechnen eines Satzes von ersten Werten (Xi) aus den Bilddaten unter Verwendung
einer Mittelwertfunktion, gekennzeichnet durch
(d) Berechnen eines Satzes von zweiten Werten (Si) aus den Bilddaten unter Verwendung
einer Standardabweichungsfunktion, und
(e) Bestimmen der Lage einer physikalischen Kante des Dokuments aus dem Salz von
ersten Werten und dem Satz von zweiten Werten durch Ermitteln der Lage einer Änderung in
der Standardabweichung der Bilddichte der Pixel.
2. Verfahren nach Anspruch 1, wobei der Schritt (e) die folgenden Unterschritte umfasst
(e1) Klassifizieren von Blöcken von ersten Werten und zweiten Werten;
(e2) Aktualisieren eines Cluster-Mittenwertes, der eine Funktion der Blöcke von ersten
Werten ist, und Aktualisieren eines Streuwertes, der eine Funktion der Blöcke von zweiten
Werten ist, wenn der Unterschritt (e1) einen Block als Hinterlegung klassifiziert;
(e3) Berechnen eines Blocks mit möglicher Kantenlage, und
(e4) Berechnen eines Vertrauenswertes, dass der Block eine Kantenlage enthält.
3. Verfahren nach Anspruch 2, das weiter die folgenden Unterschritte umfasst
(e5) Wiederholen der Unterschritte (e1)-(e4) eine vorbestimmten Zahl von Malen unter
Verwendung eines unterschiedlichen Wichtungsfaktors in dem Unterschritt (e3), und
(e6) Bestimmen des Blocks mit dem höchsten Vertrauenswert der Kantenlage.
4. Verfahren nach Anspruch 3, das weiter den folgenden Unterschritt umfasst:
(e7) Bestimmen der tatsächlichen physikalischen Lage der Dokumentenkante in dem durch
den Unterschritt (e6) bestimmten Black.
5. Verfahren nach einem der vorangehenden Ansprüche, wobei die Pixel von Bilddaten
gemäß einer Langsam-Scannen-Lokalisierung gruppiert werden,
Schritt (c) einen Mittelwert für jede Gruppe von Pixeln berechnet, und
Schritt (d) eine Standardabweichung für jede Gruppe von Pixeln berechnet.
6. Verfahren nach einem der vorangehenden Ansprüche, das weiter den folgenden Schritt
umfasst:
Bestimmen eines Hintergrundwertes und eines Schwarzpixelwertes des Dokuments.
7. Verfahren nach Anspruch 6, wobei der Schritt (e) eine physikalische Kante des
Dokuments aus dem Satz von ersten Werten, dem Salz von zweiten Werten und dem Satz von
Schwarzpixel-Zählwerten bestimmt.
8. Verfahren nach einem der vorangehenden Ansprüche, das weiter den folgenden Schritt
umfasst:
Bestimmen eines rechten Kantenabstandes und eines linken Kantenabstandes für das
Dokument.
9. System zur automatischen Erfassung einer Kante eines Dokuments in einem Scanning-
System, das umfasst:
einen Scanner (100), der einen Teil des Dokuments und einer Hinterlegung scannt, um
Pixeln von Bilddaten, die eine Bilddichte darstellen, zu erzeugen, und
eine erste Einrichtung (106), die einen Satz von ersten Werten aus den Bilddaten unter
Verwendung einer Mittelwertfunktion berechnet, gekennzeichnet durch
eine zweite Einrichtung (105), die einen Satz von zweiten Werten aus den Bilddaten unter
Verwendung einer Standardabweichungsfunktion berechnet, und
eine dritte Einrichtung (104), die die Lage einer physikalischen Kante des Dokuments aus
dem Salz von ersten Werten und dem Satz von zweiten Werten durch Ermitteln der Lage
einer Änderung in der Standardabweichung der Bilddichte der Pixel bestimmt.
10. System nach Anspruch 9, das eingerichtet ist, ein Verfahren nach einem der Ansprüche
1 bis 8 durchzuführen.