PatentDe  


Dokumentenidentifikation DE102005029645A1 28.12.2006
Titel Verfahren und Vorrichtung zur Umwandlung und Verarbeitung von gedruckten Bilanz- und Rechnungswesensdokumenten
Anmelder Vogelsberg Consult GmbH, 36304 Alsfeld, DE
Erfinder Weber, Marc, 35037 Marburg, DE
Vertreter Böck Tappe v.d. Steinen Weigand, 35390 Gießen
DE-Anmeldedatum 23.06.2005
DE-Aktenzeichen 102005029645
Offenlegungstag 28.12.2006
Veröffentlichungstag im Patentblatt 28.12.2006
IPC-Hauptklasse G06K 9/62(2006.01)A, F, I, 20051017, B, H, DE
IPC-Nebenklasse G06F 17/22(2006.01)A, L, I, 20051017, B, H, DE   G06Q 20/00(2006.01)A, L, I, 20051017, B, H, DE   
Zusammenfassung Die Erfindung betrifft Verfahren und Vorrichtung zur Umwandlung und elektronischen Weiterverarbeitung von gedruckten Bilanz- und Rechnungswesendokumenten.
Das erfindungsgemäße Verfahren bzw. die erfindungsgemäße Vorrichtung dienen zur automatischen Umwandlung von gedruckten Bilanz- oder Rechnungswesendokumenten in elektronisch weiterverarbeitbare Bilanz- bzw. Rechnungswesendaten bzw. zur automatischen Datenübertragung zwischen miteinander inkompatiblen EDV-Systemen oder zwischen EDV-Systemen, die insbesondere aus Sicherheitsgründen nicht miteinander verbunden werden können.

Beschreibung[de]

Die Erfindung betrifft ein Verfahren zur Umwandlung gedruckter Bilanzbeziehungsweise Rechnungswesensdokumente in elektronisch verarbeitbare Daten, mit den Merkmalen von Patentanspruch 1. Ferner betrifft die Erfindung eine Vorrichtung zur Datenübertragung zwischen einem Quell-Datenverarbeitungssystem und einem Ziel-Datenverarbeitungssystem gemäß Patentanspruch 20.

Bilanzdaten u. dgl. werden im Zeitalter der Digitalisierung zunehmend auf elektronischem Weg verarbeitet. Dies gilt um so mehr, als die anfallenden Datenmengen sowie die Komplexität der zu beachtenden steuerlichen und unternehmensrechtlichen Vorschriften permanent zunehmen. Ein weiterer Schub in Bezug auf zunehmende Datenmengen und steigende Komplexität der bei der Bilanzierung zu berücksichtigenden Vorschriften ist beispielsweise mit der bevorstehenden Ratifizierung und Umsetzung der sog. "Basel II" – Eigenkapitalvorschriften durch die europäischen Bankenaufsichtsbehörden zu erwarten.

Infolge der drei Hauptsäulen von Basel II (Mindestkapitalanforderungen, bankaufsichtlicher Überprüfungsprozess sowie erweiterte Offenlegung) ist mit einer Vervielfachung der beispielsweise von Steuerberatern und Banken zu verarbeitenden und zu überprüfenden Menge an Unternehmens-Bilanzdaten zu rechnen.

Die Verarbeitung von Bilanzdaten oder Daten aus dem Rechnungswesen erfolgt heute bereits in den allermeisten Fällen elektronisch gestützt teil- bzw. vollautomatisch. Dabei existieren jedoch in den Unternehmen, bei den Steuerberatern und bei den Banken eine Vielzahl unterschiedlichster EDV-Systeme, deren jeweils verwendete Datenformate untereinander häufig inkompatibel sind. Hinzu kommt, dass – abgesehen von den inkompatiblen Formaten – ferner auch die Datenübertragungswege noch keineswegs standardisiert sind, oder etwa von einer unternehmensübergreifend einsetzbaren, problemlosen und vor allem sicheren Datenübertragung die Rede sein kann.

Außerdem fordert das Kreditwesengesetz ausdrücklich, dass nur diejenigen Bilanz- und Rechnungswesensdokumente anerkannt werden, die in Papierform sowie unterschrieben bei der Bank vorliegen. Nur die in Papierform vorliegenden Dokumente gelten somit als Auswertungsgrundlage.

Dies führt dazu, dass auch im Zeitalter der weit verbreiteten elektronischen Datenverarbeitung der Datenaustausch zwischen verschiedenen Institutionen zumeist noch in Form traditioneller, gedruckter Papierdokumente erfolgt, da hierbei immer noch die geringsten Schwierigkeiten bezüglich datenformatbezogener Inkompatibilität auftreten, und da die Handhabung, der einigermaßen sichere Datenaustausch, wie auch die Archivierungsmethoden nach wie vor weitestgehend auf Papierdokumente ausgerichtet sind.

Hinzu kommt, dass insbesondere bei den Banken der Gesichtspunkt der Daten- und EDV-Systemsicherheit eine besonders zentrale Rolle spielt. Aus diesem Grund, sowie aufgrund der bei den Banken häufig verwendeten proprietären EDV-Systeme, ist eine unmittelbare elektronische Ankopplung und Datenübertragung aus externen EDV-Systemen, beispielsweise von Unternehmen oder Steuerberatern, besonders problematisch und auf breiter Front praktisch noch nicht umsetzbar.

Dies hat jedoch zur Folge, dass die bereits in elektronischer bzw. digitaler Form vorliegenden Bilanzdaten nach wie vor in den allermeisten Fällen ausgedruckt und in Papierform beim Steuerberater oder bei der Bank vorgelegt werden. Die Weiterverarbeitung dieser Daten erfordert dann jedoch in großem Umfang eine manuelle Sichtung, Zuordnung und erneute händische Dateneingabe ins Zielsystem, was äußerst aufwändig und teuer, dabei jedoch gleichzeitig sehr fehleranfällig ist.

Mit diesem Hintergrund ist es Aufgabe der vorliegenden Erfindung, ein Verfahren zur Umwandlung gedruckter Bilanz- und Rechnungswesensdokumente in elektronisch verarbeitbare Daten, bzw. eine Vorrichtung zur Datenübertragung zwischen einem Quell-Datenverarbeitungssystem und einem Ziel-Datenverarbeitungssystem zu schaffen, womit sich die genannten Nachteile des Standes der Technik überwinden lassen. Insbesondere soll eine möglichst weit automatisierte und dabei gleichzeitig möglichst fehlerfreie Erfassung und Übertragung der gedruckten Bilanzdaten möglich sein.

Diese Aufgabe wird durch ein Verfahren mit den Merkmalen des Patentanspruchs 1 bzw. durch eine Vorrichtung mit den Merkmalen des Patentanspruchs 20 gelöst. Bevorzugte Ausführungsformen sind Gegenstand der Unteransprüche.

Das Verfahren zur Umwandlung gedruckter Bilanz- und Rechnungswesensdokumente in elektronisch verarbeitbare Daten gemäß der vorliegenden Erfindung ist insbesondere anwendbar auf Bilanz- oder Rechnungswesensdokumente, in denen Buchungszeilen mit Kontonummern versehen und gruppiert dergestalt angeordnet sind, dass sowohl die den Kontonummern zugeordneten Beträge, als auch die den Zeilengruppen zugeordneten Gruppierungssummen angegeben sind.

Zur automatischen Umwandlung des gedruckten Dokuments in elektronisch unmittelbar weiterverarbeitbare Bilanzdaten erfolgt dabei in einem ersten Verfahrenschritt a) zunächst eine Umwandlung des Dokuments in eine Bilddatei mittels eines Dokumentenscanners oder mittels einer Kamera. Anschließend kommt in einem weiteren Verfahrensschritt b) eine Einrichtung zur elektronischen Zeichenerkennung zum Einsatz, wobei der enthaltene Text aus der zuvor erstellten Bilddatei extrahiert wird.

Im nächsten Verfahrensschritt c) wird versucht, für jede der erkannten Textzeilen eine Kontonummer und einen zugehörigen Betrag, bzw. gegebenenfalls mehrere in der Textzeile enthaltene Beträge, zu identifizieren bzw. zu extrahieren. Falls dabei in einem weiteren Verfahrensschritt e) keine Kontonummer identifiziert werden kann, wird das Verfahren für die nächste Textzeile wieder mit Verfahrensschritt c) fortgesetzt. Falls jedoch eine Kontonummer und zwei Beträge identifiziert werden, so wird der nachfolgende Verfahrensschritt f) übersprungen, und stattdessen in einem weiteren Verfahrensschritt g) der von links nach rechts gelesen erste Betrag als der Kontonummer zugeordneter Kontobetrag und der zweite Betrag als Gruppierungssumme identifiziert bzw. definiert.

Anschließend erfolgt in einem weiteren Verfahrensschritt h) die Aufnahme der erfassten Daten, also der Kontonummer, des Kontobetrags und gegebenenfalls der erfassten Gruppierungssumme, in eine Datenbank. Der Verfahrensablauf wird so lange wiederholt, bis sämtliche erkannten Textzeilen der Bilddatei durchlaufen sind.

Dank des erfindungsgemäßen Verfahrens kann der Inhalt von gedruckten Bilanz- oder Rechnungswesensdokumenten, die zumeist in der bereits weiter oben angegebenen Form vorliegen, also gruppiert angeordnete Buchungszeilen mit Kontonummern und Kontobeträgen sowie Gruppierungssummen enthalten, vollautomatisch in eine entsprechende Bilanzdatenbank überführt werden.

Auf diese Weise lässt sich somit die Erfassung, Digitalisierung und Weiterverarbeitung von Bilanz- und Rechnungswesensdokumenten fast vollständig automatisieren, wodurch zunächst einmal die für den Menschen eintönige Tätigkeit der manuellen Dateneingabe entfällt.

Ferner geht die erfindungsgemäße, automatisierte Aufnahme des Inhalts der gedruckten Bilanz- und Rechnungswesensdokumente in entsprechende Datenbanken mit erheblichen Zeit- und Kosteneinsparungen einher. Schließlich lässt sich auf diese Weise auch die verhältnismäßig hohe Fehlerrate, die bei der eintönigen manuellen Dateneingabe fast unvermeidlich ist, maßgeblich reduzieren.

Es ist zur Verwirklichung der Erfindung dabei zunächst einmal nicht erheblich, auf welche Weise die Erfassung und Umwandlung des Dokuments in die Bilddatei erfolgt, und welches Bilddateiformat verwendet wird. Gemäß einer bevorzugten Ausführungsform der Erfindung wird das Dokument jedoch seitenweise verarbeitet. Dies hat den Vorteil, dass übliche Dokumentenscanner, Bildverarbeitungsprogramme, Bilddateiformate und Texterkennungsprogramme eingesetzt werden können, wodurch das erfindungsgemäße Verfahren kostengünstig darstellbar ist.

Gemäß einer weiteren, bevorzugten Ausführungsform der Erfindung erfolgt die Extraktion von Kontonummer und Betrag, bzw. von Kontonummer und Beträgen, im Verfahrensschritt c) mit Hilfe sog. "regulärer Ausdrücke".

Die sog. Regulären Ausdrücke sind ein in vielen Programmiersprachen implementiertes mächtiges Instrument für Dateimanipulationen aller Art. Es handelt sich dabei vereinfacht gesagt um Suchmuster, die sich mittels eines EDV-Systems automatisiert auf Buchstaben- bzw. Zeichenfolgen anwenden lassen.

Mit Hilfe der Applikation eines regulären Ausdrucks auf eine Zeichenfolge ist somit eindeutig entscheidbar, ob der reguläre Ausdruck auf die Zeichenfolge passt oder nicht passt. Es lässt sich damit beispielsweise also feststellen, ob die Zeichenkette bestimmten Vorgaben entspricht ("nur aus Zahlen bestehend", "genau zwei Wörter enthaltend", etc.). Somit sind reguläre Ausdrücke mit anderen Worten schematisierte Muster, mit denen man den Aufbau ganzer Klassen von Zeichenketten beschreiben kann.

In den meisten Fällen repräsentieren dabei Zeichen, die in regulären Ausdrücken enthalten sind, sich selbst. Ein a in einem regulärem Ausdruck bildet also ein a in einer zu durchsuchenden Zeichenkette ab, ebenso bildet eine Zeichenfolge abcdefg in einem regulärem Ausdruck ein Vorkommnis der Zeichenkette abcdefg in der zu durchsuchenden Zeichenkette ab.

Bei Zeichen, die in regulären Ausdrücken vorkommen, wobei sich die Zeichen jedoch selbst nicht in einer Zeichenkette repräsentieren, handelt es sich um die Steuerzeichen $, \, |, (, ), [, {, ^, *, ? und +.

Vorliegend ist die Extraktion der gesuchten Text- und Zahlbestandteile aus der Bilddatei, bzw. aus den in der Bilddatei enthaltenen Zeichenketten, mittels regulärer Ausdrücke insofern vorteilhaft, als sich die gesuchten Bestandteile auf diese Weise besonders schnell und effektiv bestimmen lassen, wobei sowohl der Programmieraufwand, als auch die für die Extraktion der gesuchten Zeichenketten aufzuwendende Rechenzeit besonders gering ausfallen.

Nachstehend ein Ausführungsbeispiel zur automatischen Erkennung von Geldbeträgen in digitalisierten Papierbilanzen mittels regulärer Ausdrücke. Vorliegend ist ein regulärer Ausdruck zu erstellen, der möglichst zuverlässig und flexibel alle in den Bilanz- oder Rechnungswesensdokumenten üblicherweise vorkommenden Formate von Geldbeträgen erkennt und somit die korrekten Geldbeträge möglichst fehlerfrei aus den in der Bilddatei enthaltenen Zeichenketten extrahieren kann.

Kern des regulären Ausdrucks ist vorliegend das Erkennen eines Geldbetrages:

  • 1. Der reguläre Ausdruck "[0-9]{1,3}" erkennt eine Zahl mit einer bis drei Stellen, z. B.: "4"
  • 2. Der reguläre Ausdruck "(\.[0-9]{3})" erkennt einen Punkt und genau drei folgende Ziffern, also beispielsweise: ".325"

    Die Kombination der beiden regulären Ausdrücke unter Ziffer 1 und 2 ergibt den
  • 3. regulären Ausdruck "[0-9]{1,3}(\.[0-9]{3})". Dieser findet und erkennt beispielsweise die Zeichenfolge "4.325".

    Damit werden jedoch noch keine Zahlen ohne Tausender-Trennpunkt erkannt. Es wird daher noch folgender regulärer Ausdruck benötigt:
  • 4. Der reguläre Ausdruck "[0-9]+" erkennt jede lediglich Ziffern enthaltende Zahl; es muss mindestens eine Ziffer vorhanden sein z. B.: "4325"

    Eine Kombination der regulären Ausdrücke unter Ziffer 3 und 4 mittels "oder"-Verknüpfung ergibt den regulären Ausdruck
  • 5. "[0-9]+|[0-9]{1,3}(\.[0-9]{3})+". Dieser regulärer Ausdruck findet nunmehr sowohl beispielsweise "4325" ohne Tausender-Trennpunkt, als auch "4.325" mit Tausender-Trennpunkt in einer Zeichenkette.

    Bis hierher werden jedoch noch keine Nachkommastellen berücksichtigt. Daher wird noch ein weiterer regulärer Ausdruck benötigt:
  • 6. Der reguläre Ausdruck "(,[0-9]{1,2})" erkennt eine Kombination aus einem Komma, gefolgt von 1 bis 2 Ziffern, beispielsweise ",56" Üblicherweise können bei Geldbeträgen jedoch die Nachkommastellen "00" auch durch einen oder zwei Trennstriche "–" ersetzt werden. Im folgenden regulären Ausdruck ist dies berücksichtigt:
  • 7. Der reguläre Ausdruck "(,[0-9|-]{1,2})" erkennt beispielsweise ",56" oder ",––".

In Kombination ergibt sich somit der reguläre Ausdruck:

([0-9]+|[0-9]{1,3}(\.[0-9]{3})+)(,[0-9|–]{1,2})

Bei dem vorstehenden regulären Ausdruck wird die Zifferngruppe vor dem Komma in Klammern gefasst. Dies verhindert, dass der Vorkommateil und der Nachkommateil eines Geldbetrags als separate Treffer aufgefasst werden.

  • 8. Der weitere reguläre Ausdruck "[\s]" erkennt ein Whitespace-Zeichen bzw. Leerzeichen.

In Kombination ergibt sich somit der reguläre Ausdruck:

([\s]*[0-9]+|[0-9]{1,3}(\.[0-9]{3})+)(,[0-9|–]{1,2})[\s]?

In diesem Fall kann der Ziffernkombination eine beliebige Anzahl von Leerzeichen vorangestellt sein, und die Ziffernkombination kann dank des Steuerzeichens "?" von keinem oder von genau einem Leerzeichen gefolgt werden.

  • 9. Der reguläre Ausdruck "[SH+–]" erkennt eines der darin angegebenen Zeichen "S", "H", "+" oder "–". Diese können in Bilanz- und Rechnungswesensdokumenten vorkommen und stehen dabei für "Soll" bzw. "Haben".

In Kombination ergibt sich:

([SH+–]?[\s]*[0-9]+|[0-9]{1,3}(\.[0-9]{3})+)(,[0-9|–]{1,2})[\s]?[SH+–]?

Die Kombination erfolgt hier wieder mittels des Steuerzeichens "?". Damit wird die Zeichenkette genau dann identifiziert, wenn das jeweils voranstehende Zeichen (hier "S", "H", "+" oder "–") nicht vorkommt bzw. genau einmal vorkommt.

Der komplette reguläre Ausdruck zur universalen Identifizierung von Geldbeträgen insbesondere in Bilanz- und Rechnungswesensdokumenten lautet damit wie folgt:

([SH+–]?[\s]*[0-9]+|[0-9]{1,3}(\.[0-9]{3})+)(,[0-9|–]{1,2})[\s]?[SH+–]?

Das einfachere und einheitlichere Format einer Kontonummer in Bilanz- und Rechnungswesensdokumenten (im Wesentlichen eine standardisierte, maximal vierstellige Ziffer) führt zu dem entsprechend einfacher aufgebauten regulären Ausdruck zur Erkennung von Kontonummern:

[\s]*[0-9]{1,4}[\s]?

Gemäß einer weiteren, besonders bevorzugten Ausführungsform der Erfindung erfolgt bei der Extraktion der Kontonummern und/oder der Beträge eine automatische Korrektur von Zeichen, die nicht als Ziffern erkannt wurden.

Eine derartige automatische Zeichenkorrektur umfasst insbesondere die folgenden Fälle der Korrektur einer fehlerhaften Zeichenerkennung:

  • – o oder O wird durch 0 ersetzt
  • – / wird durch 7 ersetzt.
  • – S wird durch 5 ersetzt
  • – G wird durch 6 ersetzt
  • – g wird durch 9 ersetzt
  • – I, i oder l wird durch 1 (eins) ersetzt

Eine derartige automatische Zeichenkorrektur ist insofern vorteilhaft, als auf diese Weise unnötige Fehlermeldungen dank der automatischen Umwandlung von Nicht-Ziffern in Ziffern vermieden werden können, was den Umwandlungsprozess nicht unerheblich beschleunigt und dessen Zuverlässigkeit maßgeblich erhöht.

Gemäß einer weiteren, besonders bevorzugten Ausführungsform der Erfindung werden nicht fehlerfrei erkennbare Kontonummern, bzw. nicht fehlerfrei erkennbare Beträge, im Rahmen des automatischen Erkennungsprozesses mit einer Fehlermarkierung versehen. Die Fehlermarkierung dient als Kennzeichnung, dass an dieser Stelle später noch eine – gegebenenfalls automatische – Korrektur, oder aber ein manueller Eingriff erforderlich ist. Beispielsweise lässt sich damit an einem Bildschirmarbeitsplatz mit einem Blick erfassen, an welchen Stellen noch Probleme mit der Erkennung der korrekten Zeichenketten bestehen.

Dabei führen insbesondere folgende Merkmale einer Zeichenkette zu einer Fehleridentifikation und einer entsprechenden Fehlerkennzeichnung:

  • i. Es konnte keine zu dem regulären Ausdruck passende Zahl, bzw. kein passender Betrag gefunden werden;
  • ii. die Zeichenkette enthält einen oder mehrere Buchstaben, bzw. Zeichen, die nicht in der Menge der Zeichen "0-9", "H", "S", "+", "–", "." und "," enthalten sind;
  • iii. das Vorzeichen oder das Soll-Haben Zeichen ist nicht korrekt;
  • iv. eine innerhalb einer Gruppe erkannte Zahl ist größer als die zugehörige Gruppierungssumme;
  • v. eine Zahl ist aufgespaltet, und es befinden sich Leerzeichen zwischen den Ziffern (beispielsweise "236, 17"); oder
  • vi. die Summe der innerhalb einer Gruppe erkannten Teilbeträge stimmt nicht mit der erkannten Gruppierungssumme überein.

Nach einer weiteren, ebenfalls bevorzugten Ausführungsform der Erfindung erfolgt im Verfahrensschritt c) im Rahmen der Extraktion von Kontonummer und Beträgen auch eine Erfassung einer der Kontonummer zugeordneten, in derselben Zeile stehenden Kontenbezeichnung, wobei besonders bevorzugt ein automatischer Abgleich zwischen der Kontonummer und der zugeordneten Kontenbezeichnung erfolgt.

Die Erfassung der der Kontonummer zugeordneten Kontenbezeichnung ist zunächst einmal vorteilhaft insofern, als auf diese Weise eine breitere und vollständigere Datenbasis bei der Erfassung der gedruckten Bilanzen erreicht wird. Wird zusätzlich ein automatischer Abgleich zwischen der erkannten Kontonummer und der zugeordneten Kontenbezeichnung durchgeführt, so kann damit die Erkennungssicherheit bzw. Erkennungsgenauigkeit in Bezug auf die Erkennung der richtigen Kontonummer weiter erhöht werden, bzw. es kann eine weitere Überprüfung und gegebenenfalls Fehlerkorrektur der Kontonummer vorgenommen werden. Alternativ kann über die Erkennung von Kontenbezeichnungen auch der einer Bilanz zugrundeliegende Standardkontenrahmen automatisch identifiziert werden.

Nach einer weiteren, bevorzugten Ausführungsform der Erfindung wird in den Verfahrensschritten c) und g) eine Zwischensumme aus den innerhalb einer Gruppe von Buchungszeilen bisher erkannten Kontobeträgen gebildet, wobei im Verfahrensschritt g) ein Abgleich zwischen der gebildeten Zwischensumme und der erkannten Gruppierungssumme erfolgt. Über den Abgleich zwischen der als Summe der erkannten Kontobeträge errechneten Zwischensumme und der erkannten Gruppierungssumme kann die Erkennungssicherheit weiter erhöht werden. Beispielsweise kann bei Abweichungen zwischen der errechneten Zwischensumme und der erkannten Gruppierungssumme eine Fehlermeldung ausgegeben bzw. eine Fehlermarkierung gesetzt werden.

Eine andere Möglichkeit besteht darin, wie dies auch gemäß einer weiteren bevorzugten Ausführungsform der Erfindung vorgesehen ist, einen einzelnen, zuvor als fehlerhaft erkannt markierten Kontobetrag aus der Differenz zwischen der erkannten Gruppierungssumme und den korrekt erkannten Kontobeträgen nachträglich zu ermitteln bzw. zu korrigieren. Wird der zuvor als fehlerhaft erkannt markierte Kontobetrag auf diese Weise nachträglich korrigiert, so kann die zuvor gesetzte Fehlermarkierung wieder automatisch entfernt werden, was der Beschleunigung des Umwandlungsprozesses zugute kommt.

Gemäß weiterer Ausführungsformen der Erfindung erfolgt im Verfahrensschritt g) bei der Definition von Kontobetrag und Gruppierungssumme zusätzlich eine Prüfung daraufhin, ob der zuletzt erkannte Kontobetrag unterstrichen dargestellt ist und/oder daraufhin, ob nach dem zuletzt erkannten Kontobetrag eine Leerzeile folgt. Eine solche zusätzliche Prüfung auf Unterstreichung (Indiz für bevorstehende Summenbildung) bzw. auf eine Leerzeile (Indiz für letzte Zeile einer Gruppe aus Buchungszeilen) dient einer weiteren Erhöhung der Erkennungssicherheit, insbesondere bei der Entscheidung, ob tatsächlich die letzte Zeile einer Gruppe aus Buchungszeilen vorliegt.

Nach einer weiteren bevorzugten Ausführungsform der Erfindung wird ein am Ende einer Seite erkannter Betrag als Seitenübertrag identifiziert. In einem solchen Fall wird der Gesamtbetrag aus den zuvor auf der Seite ermittelten Gruppierungssummen gebildet, und es erfolgt ein Abgleich zwischen dem gebildeten Gesamtbetrag und dem erkannten Seitenübertrag. Vorzugsweise wird dabei, sofern die Seite noch genau einen mit Fehlermarkierung versehenen Betrag enthält, und sofern der am Ende der Seite mittels Addition der Gruppierungssummen gebildete Gesamtbetrag vom erkannten Seitenübertrag abweicht, der als fehlerhaft markierte Betrag mittels Differenzbildung aus dem Seitenübertrag und aus den auf der Seite korrekt erkannten Beträgen rekonstruiert.

Auf diese Weise kann ein weiterer, zuvor noch als fehlerhaft erkannt markierter Kontobetrag aus der Differenz zwischen dem erkannten Seitenübertrag und den auf der Seite korrekt erkannten Kontobeträgen ermittelt bzw. korrigiert werden. Wird der zuvor als fehlerhaft erkannt markierte Kontobetrag auf diese Weise nachträglich ermittelt, so kann wieder die zuvor gesetzte Fehlermarkierung automatisch entfernt werden, was wieder der Beschleunigung des Umwandlungsprozesses zugute kommt, da so manuelle Eingriffe eingespart werden.

Zur Verwirklichung der Erfindung ist es zunächst einmal beliebig, auf welche Weise die erkannten Bilanzdaten in ein Ziel-Datenverarbeitungssystem übernommen werden. Das bedeutet, dass die Datenübertragung in das Zieldatenverarbeitungssystem beispielsweise über bekannte Datenleitungsverbindungen oder Datenträger erfolgen kann.

Mit dem Hintergrund, dass direkte Datenverbindungen aus technischen Gründen oder aus Gründen der Datensicherheit nicht machbar bzw. unerwünscht sind, ist es gemäß einer weiteren, besonders bevorzugten Ausführungsform der Erfindung jedoch vorgesehen, dass die Übertragung der erkannten Bilanzdaten in ein Ziel-Datenverarbeitungssystem mittels einer mit dem Quell-Datenverarbeitungssystem verbundenen optischen Datenanzeige und einer am Ziel-Datenverarbeitungssystem angeordneten Einrichtung zur optischen Zeichenerkennung erfolgt.

Vorzugsweise findet die quellsystemseitige optische Datenanzeige dabei in Form von Barcodes statt, wobei zielsystemseitig ein Barcodeleser, beispielsweise eine Scanpistole, als Einrichtung zur optischen Zeichenerkennung dient.

Auf diese Weise kann die Aufnahme der mittels des Erkennungsprozesses zuvor ermittelten Bilanzdaten in das Ziel-Datenverarbeitungssystem, beispielsweise in die EDV-Anlage einer Bank, ohne jeden Eingriff, ohne jede direkte Datenverbindung und ohne jede Modifikation an der EDV-Anlage der Bank erfolgen. Zudem lässt sich damit jegliches Risiko der Manipulation, des unerlaubten Eindringens in das System, oder der Einschleusung beispielsweise von Computerviren in das Ziel-Datenverarbeitungssystem vollkommen ausschließen.

Ähnlich wie im Bereich von Elektronik und Elektrotechnik sog. Optokoppler eingesetzt werden, sobald unterschiedliche Bereiche einer elektronische Schaltung, oder unterschiedliche elektronische Geräte aus Sicherheitsgründen ohne jegliche galvanische Verbindung gegenseitig Daten übertragen sollen, so erlaubt auch die Datenübertragung mittels quellsystemseitiger Datenanzeige und zielsystemseitiger optischer Zeichenerkennung einen vollkommen sicheren Datenaustausch selbst mit den besonders sicherheitskritischen Banksystemen.

Gemäß weiterer Ausführungsformen der Erfindung wird als Ausgabegerät für die optische Ankopplung zwischen Quell-Datenverarbeitungssystem und Ziel-Datenverarbeitungssystem ein Bildschirm, oder aber eine separate Anzeigeeinrichtung, beispielsweise ein separates LCD- oder LED-Display verwendet. Die Verwendung eines Bildschirms des Quell-Datenverarbeitungssystems ist insbesondere insofern vorteilhaft, als damit keine weitere Datenausgabehardware notwendig ist. Stattdessen wird zum Beispiel ein ohnehin vorhandener Bildschirm des Quell-Datenverarbeitungssystems zur Datenübertragung in das Ziel-Datenverarbeitungssystem verwendet.

Eine weitere Ausführungsform der Erfindung sieht vor, dass im Bereich der optischen Datenanzeige des Quell-Datenverarbeitungssystems eine Halterung für das Eingabegerät des Ziel-Datenverarbeitungssystems vorgesehen ist. Auf diese Weise wird eine weitgehend automatisierte Datenübertragung ermöglicht, ohne dass die Notwendigkeit besteht, einen hierzu beispielsweise verwendeten Barcodeleser mit der Hand auf die Datenanzeige des Quell-Datenverarbeitungssystems zu richten.

Der Automatisierung der Datenübertragung kommt auch eine weitere Ausführungsform der Erfindung zugute, gemäß der vorgesehen ist, dass bei der Datenübertragung eine automatische Weiterschaltung der optischen Datenanzeige am Quell-Datenverarbeitungssystem erfolgt. Beispielsweise kann dies in der Form geschehen, dass die zur Datenausgabe verwendeten Barcodes automatisch in einem Anzeigefenster gescrollt werden, oder aber dass die Barcodes in einem festen Anzeigebereich nacheinander wechselnd angezeigt werden.

Die Erfindung betrifft ferner eine Vorrichtung zur Übertragung von Daten zwischen einem Quell-Datenverarbeitungssystem und einem Ziel-Datenverarbeitungssystem. Erfindungsgemäß zeichnet sich die Datenübertragungsvorrichtung dadurch aus, dass die Datenübertragung über eine mit dem Quellsystem verbundene optische Datenanzeige sowie über eine mit dem Zielsystem verbundene Einrichtung zur optischen Zeichenerkennung erfolgt. Vorzugsweise erfolgt die optische Datenanzeige am Quellsystem dabei in Form von Barcodes, wobei die optische Zeichenerkennung mittels eines mit dem Zielsystem verbundenen Barcodelesers, beispielsweise mittels einer Scanpistole erfolgt.

Die erfindungsgemäße Datenübertragungsvorrichtung ist vorteilhaft insofern, als auf diese Weise Daten aus einem Quellsystem in ein Zielsystem – beispielsweise in die EDV-Anlage einer Bank – ohne jeden Eingriff, ohne jede direkte Datenverbindung und ohne jede Modifikation am Zielsystem erfolgen können. Jegliches Risiko der Manipulation, des unerlaubten Eindringens in das System oder der Einschleusung schädlicher Software in das Zielsystem kann dank der erfindungsgemäßen Datenübertragungsvorrichtung vollkommen ausgeschlossen werden. Dies ist von großer Bedeutung insbesondere bei den besonders sicherheitskritischen Banksystemen.

Da beispielsweise eine Scanpistole ein handelsübliches Dateneingabegerät darstellt, das sich auf ähnliche Weise wie eine Standardtastatur praktisch mit jedem EDV-System verbinden lässt, kann die erfindungsgemäße Datenübertragungsvorrichtung ohne jegliche Modifikationen am Ziel-Datenverarbeitungssystem eingesetzt werden.

Gemäß einer bevorzugten Ausführungsform ist die optische Datenanzeige der Vorrichtung durch einen Bildschirm des Quellsystems gebildet. Dies ist insbesondere insofern vorteilhaft, als auf diese Weise keine eigene zusätzliche Datenausgabehardware erforderlich ist. Stattdessen wird ein ohnehin vorhandener Bildschirm des Quellsystems zur Datenübertragung an das Zielsystem verwendet.

Alternativ kann, wie dies auch gemäß einer weiteren Ausführungsform der Erfindung vorgesehen ist, die optische Datenanzeige als eigenständige Anzeigeeinrichtung ausgebildet sein. Es kann sich dabei beispielsweise um ein separates kleines LCD- oder LED-Display handeln.

Nach einer weiteren bevorzugten Ausführungsform ist im Bereich der optischen Datenanzeige des Quellsystems eine Halterung für das Eingabegerät des Zielsystems vorgesehen. Dies kommt vorteilhaft der möglichst weitgehenden Automatisierung der Datenübertragung ohne Benutzereingriff zugute.

Im Folgenden wird die Erfindung anhand lediglich Ausführungsbeispiele darstellender Zeichnungen näher erläutert.

Es zeigt:

1: ein Beispiel für eine zweispaltige Bilanz in Form eines gedruckten Bilanzformulars;

2: in einer 1 entsprechenden Form ein Beispiel für eine dreispaltige Bilanz;

3: in schematischer Darstellung den Ablauf eines Ausführungsbeispiels des erfindungsgemäßen Verfahrens; und

4: einen Ausschnitt aus der Bildschirmdarstellung des Quell-Datenverarbeitungssystems bei einem Ausführungsbeispiel einer erfindungsgemäßen Datenübertragungsvorrichtung.

Die 1 und 2 zeigen eine typische zweispaltige Bilanz (1) beziehungsweise dreispaltige Bilanz (2).

Die dargestellten Dokumente weisen insbesondere folgende Charakteristika auf, die bei der automatischen Umwandlung derartiger gedruckter Dokumente in elektronische Bilanzdaten von Bedeutung sind.

  • i. Eventuelle Verschmutzungen 1 oder Beschriftungen 1 des Papiers können die Erkennung von Spalte 1 erschweren.
  • ii. Die Kontonummern 2 stehen links von den Beträgen und sind maximal vierstellig.
  • iii. Erläuternde Texte 3 zwischen Kontonummern 2 und Beträgen 4, 5 beziehen sich auf die Konten 2 und variieren mit den verwendeten Kontenrahmen.
  • iv. Beträge 4, 5 können in mehreren Spalten auftreten, die Zahlenformate in Währungsdarstellung sind sehr variabel, haben aber maximal zwei Stellen nach dem Komma.
  • v. In zweispaltigen Formularen (1) werden Untersummen 5 aus Konten 2 gebildet. Eine unterstrichene Zahl 6 deutet auf das Ende einer Gruppierung 7 hin, die Summe der Gruppierung bzw. Gruppierungssumme 5 steht dann in einer weiteren Spalte 5 rechts vom Kontobetrag 4 des letzten Gruppierungselementes 6.
  • vi. In einer dreispaltigen Bilanz (siehe Beispiel in 2) stehen in der letzten Spalte 8 Vorjahreswerte. Eine solche dreispaltige Bilanz lässt sich mit geringfügigen Modifikationen des erfindungsgemäßen Verfahrens ebenfalls verarbeiten.

3 zeigt einen Ausschnitt aus dem Ablaufschema eines Ausführungsbeispiels des erfindungsgemäßen Umwandlungsverfahrens für Papierbilanzen. Die übergeordneten Verfahrensschritte der Umwandlung des Papierdokuments in eine Bilddatei und der Textextraktion aus der Bilddatei sind der Übersichtlichkeit halber in 3 nicht eigens dargestellt.

3 zeigt somit im Wesentlichen ein Beispiel für die Extraktion der Bilanzdaten aus dem in der Bilddatei enthaltenen Text. Man erkennt zunächst einmal, dass der Erkennungsprozess solange wiederholt wird (c), bis jede in der Bilddatei zuvor erkannte Textzeile durchlaufen ist. Im Rahmen des Erkennungsprozesses wird anfangs für jede erkannte Textzeile versucht, eine Kontonummer 2 sowie etwa vorhandene Beträge 4, 5 zu ermitteln (c).

Falls dabei keine Kontonummer ermittelt werden konnte (d'), wird überprüft, ob das Ende einer Gruppe 7 aus Buchungszeilen erreicht ist, und ob eine etwa ermittelte Gruppierungssumme 5 mit der Summe der innerhalb der Gruppe ermittelten Beträge 4 übereinstimmt (c'). Wenn letzteres nicht der Fall ist, dann kann entweder ein zuvor als fehlerhaft markierter Betrag 4 aus der Differenz der erkannten Gruppierungssumme 5 und der korrekt erkannten Beträge 4 nachträglich ermittelt werden (9), oder es kann eine eventuell vorhandene Fehlermarkierung als nicht zutreffend entfernt werden (10).

Falls jedoch eine Kontonummer 2 sowie ein zugehöriger Betrag 4 ermittelt wurde (f), so wird der Betrag 4 mit der Summe etwa zuvor innerhalb derselben Gruppe 7 aus Buchungszeilen bereits gefundener Beträge 4 aufsummiert, und Kontonummer 2 sowie Betrag 4 werden in die Datenbank aufgenommen (h).

Wird innerhalb einer Zeile nur eine Kontonummer 2 ermittelt, nicht jedoch der zugehörige Betrag 4 erkannt (f'), so wird zunächst versucht, Standardfehler bei der Zeichenerkennung zu korrigieren. Im Fall erfolgreicher Fehlerkorrektur wird der Betrag 4 wieder mit zuvor innerhalb derselben Gruppe 7 etwa ermittelten Beträgen 4 aufsummiert. Falls trotz Fehlerkorrektur kein Betrag 4 ermittelt werden kann, so wird die Zeile, beziehungsweise der fehlerhaft erkannte Betrag 4, mit einer Fehlermarkierung versehen (f').

Sollten hingegen bei der Ermittlung (c) der Kontonummer 2 und der Beträge 4 bzw. 5 zwei Beträge 4, 5 gefunden worden sein (e), so wird der erste Betrag als zum Konto gehöriger Kontobetrag 4 gewertet, während der zweite Betrag als Gruppierungssumme 5 identifiziert und festgehalten wird.

4 schließlich zeigt einen Ausschnitt aus der Bildschirmdarstellung des Quell-Datenverarbeitungssystems bei einem Ausführungsbeispiel einer erfindungsgemäßen Datenübertragungsvorrichtung. Man erkennt, dass in einem Teilbereich 11 der Bildschirmdarstellung des Quellsystems, das beispielsweise für die Umwandlung gedruckter Bilanzen in elektronisch verarbeitbare Daten zuständig ist, eine Anzahl von Barcodes dargestellt wird. Diese Barcodes korrespondieren mit den zuvor ermittelten Bilanzdaten, beispielsweise mit den erkannten Kontonummern und den jeweils zugeordneten Kontobeträgen.

Zur Übertragung der beispielsweise mittels des Quellsystems umgewandelten Papierbilanzen in die Datenbank eines Ziel-Datenverarbeitungssystems – z.B. in die EDV-Anlage einer Bank – wird an das Zielsystem eine handelsübliche Scannerpistole angeschlossen, mit der wiederum die Daten aus der Barcode-Bildschirmdarstellung 11 des Quellsystems in das Zielsystem eingelesen werden. Dabei kann die Scannerpistole mittels einer Halterung vor dem Bildschirm des Quellsystems befestigt werden, und das Ausgabefenster 11 des Quellsystems so eingerichtet sein, dass die Barcodes entweder nacheinander ein- und ausgeblendet werden, oder aber die Barcodes nacheinander durch das Ausgabefenster 11 gescrollt werden.

Auf diese Weise lässt sich eine weitestgehende Automatisierung bei der Übertragung der Bilanzdaten in das Ziel-Datenverarbeitungssystem erzielen, ohne jedoch sicherheitsrelevante Eingriffe oder gar Veränderungen irgendeiner Art im Bereich des nach außen hin u. U komplett abgeschotteten Zielsystems vornehmen zu müssen.

Im Ergebnis wird somit deutlich, dass es dank der Erfindung möglich wird, die bisher aufwändig größtenteils manuell vorzunehmende Datenübertragung zwischen miteinander inkompatiblen EDV-Systemen – bzw. zwischen EDV-Systemen, die aus Sicherheitsgründen nicht miteinander verbunden werden dürfen – weitestgehend zu automatisieren. Ferner können dank der Erfindung die in immer größerem Umfang anfallenden Bilanzdaten, beispielsweise aus Handwerksbetrieben oder Unternehmen, auch dann weitestgehend automatisiert in Datenbanken aufgenommen bzw. elektronisch weiterverarbeitet werden, wenn die Bilanzen lediglich in Papierform vorliegen.

Die Erfindung leistet damit einen fundamentalen Beitrag zur Bereitstellung einer sicheren und kostengünstigen Erfassung, Verarbeitung, Analyse und elektronischen Archivierung insbesondere im Bereich der des Unternehmensratings und des Bankenwesens.


Anspruch[de]
Verfahren zur Umwandlung eines auf Papier gedruckten Bilanz- oder Rechnungswesensdokuments in elektronisch verarbeitbare Bilanzdaten, das Dokument aufweisend gruppiert angeordnete Listen (7) von Buchungszeilen, wobei eine Buchungszeile eine Kontonummer (2) und einen der Kontonummer (2) zugeordneten Kontobetrag (4) umfasst, mit den Verfahrensschritten:

a) Umwandlung des Dokuments in eine Bilddatei mittels Dokumentenscanner oder Kamera;

b) Textextraktion aus der Bilddatei mittels einer Einrichtung zur automatischen Zeichenerkennung;

c) für jede erkannte Textzeile Extraktion von Kontonummer (2) und Betrag (4) bzw. Beträgen (4, 5);

d) Fortsetzung des Verfahrens für die nächste Zeile mit Schritt c), falls keine Kontonummer (2) vorhanden;

e) Fortsetzung des Verfahrens mit Schritt g), falls Kontonummer (2) und zwei Beträge (4, 5) vorhanden;

f) Fortsetzung des Verfahrens mit Schritt h);

g) Definition des von links nach rechts gelesen ersten Betrags als Kontobetrag (4) und des zweiten Betrags als Gruppierungssumme (5);

h) Aufnahme der erfassten Daten (2, 4, 5) in eine Datenbank; und

i) Fortsetzung des Verfahrens für die nächste Zeile mit Schritt c).
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das Dokument seitenweise verarbeitet wird. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Extraktion von Kontonummer (2) und Beträgen (4, 5) im Verfahrensschritt c) mit Hilfe von regulären Ausdrücken erfolgt. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass bei der Extraktion der Kontonummern (2) und/oder der Beträge (4, 5) eine Korrektur von nicht als Ziffern erkannten Zeichen erfolgt. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass nicht erkennbare Kontonummern (2) bzw. nicht erkennbare Beträge (4, 5) mit einer Fehlermarkierung versehen werden. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass im Verfahrensschritt c) ferner eine der Kontonummer (2) zugeordnete Kontenbezeichnung (3) mit erfasst wird. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass ein automatischer Abgleich zwischen der Kontonummer (2) und der zugeordneten Kontenbezeichnung (3) erfolgt. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass in den Verfahrensschritten c) und g) eine Zwischensumme aus den innerhalb einer Gruppe (7) von Buchungszeilen bisher erkannten Kontobeträgen (4) gebildet wird, und dass im Verfahrensschritt g) ein Abgleich zwischen der gebildeten Zwischensumme und der erkannten Gruppierungssumme (5) erfolgt. Verfahren nach einem der Ansprüche 5 bis 8, dadurch gekennzeichnet, dass innerhalb einer Gruppe (7) von Buchungszeilen, die genau einen mit Fehlermarkierung versehenen Betrag (4) enthält und bei der die gebildete Zwischensumme von der erkannten Gruppierungssumme (5) abweicht, der fehlerhaft erkannte Betrag (4) mittels Differenzbildung aus der Gruppierungssumme (5) und den korrekt erkannten Beträgen (4) in rekonstruiert wird. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass im Verfahrensschritt g) zusätzlich eine Prüfung daraufhin erfolgt, ob der zuletzt erkannte Kontobetrag (4) unterstrichen dargestellt ist. Verfahren nach einem der Ansprüche 1 bis 10, dadurch gekennzeichnet, dass im Verfahrensschritt g) zusätzlich eine Prüfung daraufhin erfolgt, ob nach dem zuletzt erkannten Kontobetrag (4) eine Leerzeile folgt. Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, dass ein am Ende einer Seite erkannter Betrag als Seitenübertrag identifiziert wird, wobei ein Gesamtbetrag aus den auf der Seite ermittelten Gruppierungssummen (5) gebildet wird und ein Abgleich zwischen dem gebildeten Gesamtbetrag und dem erkannten Seitenübertrag erfolgt. Verfahren nach einem der Ansprüche 5 bis 12, dadurch gekennzeichnet, dass innerhalb einer Seite, die genau einen mit Fehlermarkierung versehenen Betrag (4) enthält und bei der der am Ende der Seite mittels Addition der Gruppierungssummen (5) gebildete Gesamtbetrag vom erkannten Seitenübertrag abweicht, der fehlerhaft erkannte Betrag (4) mittels Differenzbildung aus dem Seitenübertrag und den korrekt erkannten Beträgen (4) rekonstruiert wird. Verfahren nach einem der Ansprüche 1 bis 13, dadurch gekennzeichnet, dass die Übertragung der erkannten Daten in ein Ziel-Datenverarbeitungssystem über eine optische Datenanzeige (11) und eine Einrichtung zur optischen Zeichenerkennung erfolgt. Verfahren nach Anspruch 14, dadurch gekennzeichnet, dass die optische Datenanzeige (11) zur Datenübertragung in Form von Barcodes erfolgt, wobei als Eingabegerät des Ziel-Datenverarbeitungssystems ein Barcodeleser verwendet wird. Verfahren nach Anspruch 14 oder 15, dadurch gekennzeichnet, dass als Ausgabegerät für die optische Ankopplung ein Bildschirm verwendet wird. Verfahren nach Anspruch 14 oder 15, dadurch gekennzeichnet, dass als Ausgabegerät für die optische Ankopplung eine separate Anzeigeeinrichtung verwendet wird. Verfahren nach einem der Ansprüche 14 bis 17, dadurch gekennzeichnet, dass im Bereich der optischen Datenanzeige (11) eine Halterung für das Eingabegerät des Ziel-Datenverarbeitungssystems vorgesehen ist. Verfahren nach einem der Ansprüche 14 bis 18, dadurch gekennzeichnet, dass bei der Datenübertragung eine automatische Weiterschaltung der optischen Datenanzeige (11) erfolgt. Vorrichtung zur Übertragung von Daten zwischen einem Quell-Datenverarbeitungssystem und einem Ziel-Datenverarbeitungssystem dadurch gekennzeichnet, dass die Datenübertragung über eine mit dem Quellsystem verbundene optische Datenanzeige (11) und über eine mit dem Zielsystem verbundene Einrichtung zur optischen Zeichenerkennung erfolgt. Vorrichtung nach Anspruch 20, dadurch gekennzeichnet, dass die optische Datenanzeige (11) zur Anzeige der Daten in Form von Barcodes eingerichtet ist, wobei das Zielsystem einen Barcodeleser umfasst. Vorrichtung nach Anspruch 20 oder 21, dadurch gekennzeichnet, dass die optische Datenanzeige (11) durch einen Bildschirm des Quellsystems gebildet ist. Vorrichtung nach Anspruch 20 oder 21, dadurch gekennzeichnet, dass die optische Datenanzeige (11) als eigenständige Anzeigeeinrichtung ausgebildet ist. Vorrichtung nach einem der Ansprüche 20 bis 23, dadurch gekennzeichnet, dass im Bereich der optischen Datenanzeige (11) eine Halterung für das Eingabegerät des Ziel-Datenverarbeitungssystems vorgesehen ist.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

  Patente PDF

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com