PatentDe  


Dokumentenidentifikation DE102004026910A1 12.01.2006
Titel Verfahren zur Verbesserung der Textnavigation bei elektronisch erfassten Dokumenten
Anmelder SilverCreations Software AG, 55768 Hoppstädten-Weiersbach, DE
Erfinder Rietzke, Eric, 66649 Oberthal, DE
DE-Anmeldedatum 01.06.2004
DE-Aktenzeichen 102004026910
Offenlegungstag 12.01.2006
Veröffentlichungstag im Patentblatt 12.01.2006
IPC-Hauptklasse G06F 3/00(2006.01)A, F, I, ,  ,  ,   
IPC-Nebenklasse G06F 3/16(2006.01)A, L, I, ,  ,  ,      

Beschreibung[de]
Bisheriger Stand der Technik seit mehr als 30 Jahren

Seit mehr als 30 Jahren haben Bildschirmlesegeräte für sehbehinderte eine prinzipiell unveränderte Funktionsweise: Eine Kamera liefert in Echtzeit Bilder an einen Monitor. Der Anwender kann durch Verschieben des Dokumentes unter der Kamera den angezeigten Ausschnitt auf dem Monitor ändern. Durch optische Methoden (z.B. Linsen) wird das Dokument in verschiedenen Vergrößerungen angezeigt. Zur Verbesserung der Lesbarkeit werden meist eine Kontrasterhöhung und eine Falschfarbendarstellung angeboten.

Aktuellste Entwicklung und neuer Stand der Technik

Mit dem Produkt LiveReader wurde ein System entwickelt, dass es sehbehinderten Menschen erlaubt, ein beliebiges Dokument über eine Digitalkamera zu erfassen und anschließend vorzulesen. Beim Vorlesen wird dabei das digitale Abbild genutzt, um das Dokument in beliebiger Vergrößerung und an beliebiger Position darzustellen. Während des Vorlesens wird das gerade aktuelle Wort hervorgehoben. Dazu wird ein Rechteck um das entsprechende Wort in der grafischen Ansicht des Dokumentes gezeichnet.

Aktuelle Einschränkung

Die Navigation innerhalb des Dokumentes muss dabei immer in der statischen (Nicht-Live-) Darstellung des erfassten Dokumentes erfolgen. Die Live-Ansicht (Echtzeit Darstellung) eines Ausschnittes eines Dokumentes, dass unter einer Videokamera liegt kann auf diesem Wege nicht zur Navigation im erfassten Dokument genutzt werden.

Verbesserung der Ausgangssituation

Um dem Anwender eine einfachere und intuitivere Form der Bedienung zu ermöglichen, sollte das Dokument während der Erfassung durch die Digitalkamera auf einer druckempfindlichen oder berührungsempfindlichen Oberfläche liegen. Das Dokument kann dann mit dem Tisch unter der Kamera verschoben werden. Der Bildschirm zeigt immer nur den aktuell unter der Kamera positionierten Dokumentausschnitt und stellt diesen in der gewünschten Vergrößerung dar. Sobald der Anwender nun ein Wort vorgelesen haben möchte oder die Wortposition für ein flüssiges Vorlesen auf die gerade ersichtliche Stelle setzen möchte, kann er durch Drücken des Wortes mit dem Finger (er sieht beides gerade auf seinem Monitor) dies tun. Die Koordinaten, die der Anwender gedrückt hat, werden über die druckempfindliche Oberfläche ermittelt und an den Computer übertragen. Dieser kann diese Koordinaten mit den bekannten Positionen der einzelnen Wörter vergleichen und das angedrückte Wort selektieren. Die Position des Dokumentes kann beliebig unter der Kamera verändert werden, solange die relative Position zwischen Dokument und Glasplatte unverändert bleibt.

Alternativ kann das Setzen der aktuellen Wortposition auch über ein in den XY-Tisch integriertes Messsystem erreicht werden. Das Messsystem ermittelt die Position unterhalb der Kamera und ein Knopf erlaubt dem Anwender diese Position an den Computer zu übermitteln um die Wortposition neu zu setzen.

Steuerung über Tasten und über die druckempfindliche Oberfläche

Das Erfassen des Dokumentes, das Setzen der Wortposition und das Starten und Stoppen des Vorlesens sind Befehle, die der Benutzer zum Computer sendet, um dadurch das System zu steuern. Alle diese Aktionen können sowohl über separate Tasten als auch als Befehl über die druckempfindliche Oberfläche abgebildet werden. Zum Beispiel:

  • • Doppelklick = Dokument erfassen
  • • Einfacher Klick = Vorlesen starten bzw. stoppen
  • • Langer Klick (t > 1 Sekunde) = aktives Wort (Position) neu setzen

Steuerung über Gestik

Einfache Klick-Verfahren sind bereits erste Formen einer Gestik-Steuerung. Eine anspruchsvollere Steuerung kann über Gestik erfolgen, die unmittelbar auf die druckempfindliche Oberfläche gezeichnet wird. Zum Beispiel könnte ein mit dem Finger gezeichneter Kreis für den Befehl „Ausdrucken" stehen. Auf Fragen könnte der Anwender per Gestik z.B. mit einem Häkchen für „OK" und einem Kreuz für „Abbrechen" oder „Nein" antworten.

Erläuterung des Gesamtsystems

Ein XY-Tisch, im folgenden Tisch genannt, wird in eine bestimmte Position gefahren, sodass sich das Dokument auf einer druckempfindlichen Oberfläche, im folgenden Platte genannt, genau in dem Erfassungsbereich einer Digitalkamera, im folgenden Kamera genannt, befindet. Es spielt dabei keine Rolle, ob sich die Platte (die vorzugsweise aus Glas ist) über oder unter dem Dokument befindet.

Nach der Dokumenterfassung durch die Kamera wird das Dokument als Bild zu einem PC gesendet. Dort findet eine Verarbeitung durch eine optische Zeichenerkennung (OCR) statt. Neben den reinen Textinformationen werden zu jedem Wort auch Positionsinformationen mit Bezug zu dem Bild abgespeichert. Diese Koordinaten dienen zur Navigation für den Anwender.

Wenn der Anwender nun auf ein bestimmtes Wort auf dem Dokument drückt, wird über die Platte die Position ermittelt und an den PC übermittelt. Unter Berücksichtigung eines Kalibriervorgangs zur Korrelation der unterschiedlichen im System vorhandenen Koordinatensysteme (Koordinaten des Digitalbildes und der druckempfindlichen Oberfläche) kann nun das gedrückte Wort mittels der abgespeicherten Koordinaten ermittelt werden. Zu keinem Zeitpunkt muss dazu auf dem Monitor ein PC-Bild angezeigt werden. Es ist ausreichend, wenn das Live-Bild der Kamera zu sehen ist.

Da sich durch das Verschieben des Tisches die Position zwischen Platte und Dokument nicht verändert, kann das Dokument ohne Probleme unter der Kamera beliebig positioniert werden. Auch die Zoomstufe der Live-Kamera hat keinen Einfluss auf die Funktion, wodurch der Anwender sehr intuitiv und auf gewohnte Art und Weise das Gerät bedienen kann.

Das aktive Wort kann bei jedem Setzen durch den Anwender zur Bestätigung vorgelesen werden. Durch das Starten des Vorlesens wird der gesamte Text ab der markierten Stelle automatisch vorgelesen. Die aktive Position wandert dabei mit, solange der Anwender das Vorlesen nicht stoppt. Nach dem Stoppen wird sich die aktuelle Position gemerkt, solange der Anwender nicht ein neues Wort als das aktive Wort wählt.


Anspruch[de]
  1. Verfahren zur Verbesserung der Textnavigation bei elektronisch erfassten Dokumenten (z.B. bei Bildschirmlesegeräten) gekennzeichnet dadurch,

    a. dass die Positionierung des aktiven Wortes durch Drücken des entsprechenden Wortes auf dem originalen Papierdokument erfolgt,

    b. indem über eine druckempfindliche Oberfläche unter oder über dem Papierdokument Koordinaten ermittelt werden,

    c. die mit den zusätzlichen Positionsinformationen, welche durch eine optische Zeichenerkennung ermittelt wurden, in Korrelation gebracht werden.
  2. Verfahren nach Punkt 1, gekennzeichnet dadurch, dass Textabschnitte in Sprachform ausgegeben werden.
  3. Verfahren nach Punkt 1, gekennzeichnet dadurch, dass die Koordinaten nicht über eine druckempfindliche Oberfläche sondern durch ein Koordinaten-Messsystem im Tisch erfolgt und diese Koordinaten zur Referenzzierung des gewünschten Wortes verwendet werden.
  4. Verfahren nach Punkt 1, gekennzeichnet dadurch, dass sowohl eine einfache Steuerung über Klicken als auch eine anspruchsvollere Steuerung über Gestik verwendet wird.
Es folgt ein Blatt Zeichnungen






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

  Patente PDF

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com