PatentDe  


Dokumentenidentifikation DE69735743T2 12.04.2007
EP-Veröffentlichungsnummer 0000838955
Titel Videokodierungs- und Videodekodierungsvorrichtung
Anmelder Fujitsu Ltd., Kawasaki, Kanagawa, JP
Erfinder Nakagawa, Akira, Nakahara-ku, Kawasaki-shi, Kanagawa 211, JP;
Kazui, Kimihiko, Nakahara-ku, Kawasaki-shi, Kanagawa 211, JP;
Morimatsu, Eishi, Nakahara-ku, Kawasaki-shi, Kanagawa 211, JP;
Shimizu, Takahiro,c/o Fujitsu Program Lab. Lt, Yokohama-shi, Kanagawa 222, JP
Vertreter HOFFMANN & EITLE, 81925 München
DE-Aktenzeichen 69735743
Vertragsstaaten DE, FR, GB
Sprache des Dokument EN
EP-Anmeldetag 08.07.1997
EP-Aktenzeichen 971115431
EP-Offenlegungsdatum 29.04.1998
EP date of grant 26.04.2006
Veröffentlichungstag im Patentblatt 12.04.2007
IPC-Hauptklasse H04N 7/50(2006.01)A, F, I, 20051017, B, H, EP
IPC-Nebenklasse H04N 7/26(2006.01)A, L, I, 20051017, B, H, EP   H04N 7/30(2006.01)A, L, I, 20051017, B, H, EP   

Beschreibung[de]
HINTERGRUND DER ERFINDUNG 1. Gebiet der Erfindung

Die vorliegende Erfindung bezieht sich auf eine Videokodierungsvorrichtung und eine Videodekodierungsvorrichtung, und genauer auf eine Videokodierungsvorrichtung, die vorhersagendes Kodieren von digitalen Videosignalen durchführt, und eine Videodekodierungsvorrichtung, die die ursprünglichen Bewegungsbilder aus dem vorhersagend-kodierten Videosignal reproduziert, das durch die Videokodierungsvorrichtung erzeugt wird.

2. Beschreibung des Standes der Technik

Der ITU-T Standard H.261 und die ISO-Standard MPEG-1 und MPEG-2 sind z.B. gut anerkannte internationale Standards für Bewegungsbild-Kodierungstechniken. Jene Standards verwenden hybride Kodierungsalgorithmen, wobei der Kodierungsprozess wie folgt fortfahren wird: (1) ein Quellenbild wird in Blöcke von Pixeln unterteilt, (2) orthogonale Transformation (z.B. diskrete Kosinustransformation) und Bewegungskompensation werden unabhängig auf jeden Block angewendet und (3) quantisierte Videodaten werden durch Entropiekodierung komprimiert.

Wenn eine Bewegung beträchtlicher Größe oder ein vollständiger Szenenübergang in der Mitte einer Sequenz von Videorahmen aufgetreten sind, können die oben beschriebenen hybriden Videokodierungstechniken an einem überwältigenden Umfang kodierter Rahmendaten leiden, die ein gewisses Standardmaß überschreiten, das für jeden Rahmen zulässig ist. In diesem Fall wird der Kodierer zwangsweise den Umfang kodierter Daten in einem Versuch reduzieren, dies auf das Standardmaß zu regeln. Dies wird extreme Verschlechterung in der Bildqualität und grobes Rahmenunterabtasten (oder einen Abfall in Rahmenaktualisierungsraten) verursachen, was somit zu nicht akzeptabel schlechten Bildern führt, wenn in den Empfangsenden rekonstruiert.

Ein Videokodierungssystem, das auf Vermeidung des obigen Problems zielt, wird zum Beispiel in der japanischen Patentanmeldung Nr. 8-75605 (1996) durch den gleichen Anmelder der vorliegenden Erfindung vorgeschlagen. In diesem vorgeschlagenen System reduziert die Videokodierungsvorrichtung die Auflösung von eingegebenen Rahmensignalen, um den Umfang kodierter Rahmendaten zu regeln, wenn ein vollständiger Szenenübergang oder eine massive Bewegung in der Mitte einer Sequenz von Videorahmen aufgetreten ist.

14 ist ein Blockdiagramm dieser Videokodierungsvorrichtung, die in der japanischen Patentanmeldung Nr. 8-75605 vorgeschlagen wird. Die Vorrichtung von 14 unterstützt zwei Arten von Bildauflösungen: das übliche Zwischenformat (CIF (Common Intermediate Format), 352 × 288 Pixel) and Viertel-CIF (QCIF (quarter-CIF), 176 × 144 Pixel). Eine CIF/QCIF-Auswahlsteuervorrichtung 125 bestimmt, welche Bildauflösung verwendet werden sollte, um Quellenbilder zu kodieren, in Anbetracht des Umfangs von kodierten Rahmendaten, die in einer vorhersagenden Kodierung erzeugt werden, Quantisiererschrittgröße und einigen anderen Parametern. Z.B. wählt die CIF/QCIF-Auswahlsteuervorrichtung 125 normalerweise das CIF hoher Auflösung, während sie QCIF geringer Auflösung wählt, wenn ein großer Umfang von Daten als ein Ergebnis der Kodierung erzeugt wurde.

Ein Rahmenspeicher 122 wird verwendet, um rekonstruierte (oder dekodierte) Bilder der vorherigen Rahmen zu speichern. Unter Vergleich des Quellenbildes des aktuellen Rahmens mit einem dekodierten Bild, das aus dem Rahmenspeicher 122 abgerufen wird, als das Bezugsbild berechnet eine Vorhersageparameter-Kalkulationseinheit 112 Bewegungsvektoren des aktuellen Rahmens. Hier wird ein Bild in eine Vielzahl von Blöcken partitioniert und der Vergleich von Rahmendaten wird auf einer Basis Block für Block durchgeführt. Jedes Quellenrahmenbild wird entweder einer Intrarahmenkodierung oder einer Interrahmenkodierung unterzogen. Eine Vorhersageparameter-Kalkulationseinheit 112 bestimmt, welches Kodierungsschema auf das Quellenrahmenbild angewendet werden sollte. Wenn die Interrahmenkodierung aktiviert ist, erzeugt eine Vorhersagebild-Generierungseinheit 113 ein Vorhersagebild des aktuellen Rahmens basierend auf dem dekodierten Bild des vorherigen Rahmens und den Bewegungsvektoren, die durch die Vorhersageparameter-Kalkulationseinheit 112 kalkuliert werden.

Eine Vorhersagefehlersignal-Generierungseinheit 114 erzeugt ein Vorhersagefehlersignal durch Kalkulieren von Differenzen zwischen dem Quellenbild und dem Vorhersagebild auf einer Basis Block für Block. Ein CIF/QCIF-Konverter 131 ändert die Auflösung dieses Vorhersagefehlersignals, was ursprünglich CIF ist, zu dem, was durch die CIF/QCIF-Auswahlsteuervorrichtung 125 ausgewählt wird. Genauer gibt der CIF/QCIF-Konverter 131 das Vorhersagefehlersignal aus wie es ist aus, wenn die CIF-Auflösung durch die CIF/QCIF-Auswahlsteuervorrichtung 125 ausgewählt ist, und er konvertiert wiederum die Auflösung zu QCIF, wenn die QCIF-Auflösung gewählt ist.

Eine Kodierungssteuervorrichtung 124 empfängt Information in Bezug auf den Umfang der resultierenden kodierten Daten von einer Entropiekodierungseinheit 117 (später beschrieben), ebenso wie Erhalten von Information über eine Pufferbelegung aus einem Kodierungsdatenpuffer 118 (später beschrieben). Basierend auf derartiger Information bestimmt die Kodierungssteuervorrichtung 124 die Quantisiererschrittgröße und verteilt sie zu einem Quantisierer 116, einem Dequantisierer 119, der CIF/QCIF-Auswahlsteuervorrichtung 125 und dem Entropiekodierer 117.

Ein DCT-Prozessor 115 wendet eine orthogonale Transformation, oder eine digitale Kosinustransformation (DCT) auf die Ausgabe des CIF/QCIF-Konverters 131 an, und ein Quantisierer 116 quantisiert die erhaltenen DCT-Koeffizienten in Übereinstimmung mit der Quantisiererschrittgröße, die durch die Kodierungssteuervorrichtung 124 spezifiziert wird.

Der Entropiekodierer 117 empfängt die quantisierten DCT-Koeffizienten von dem Quantisierer 116, die Bildauflösung von der CIF/QCIF-Auswahlsteuervorrichtung 125 und die Bewegungsvektoren und Kodierungsschemainformation von der Vorhersageparameter-Kalkulationseinheit 112. Entropiekodierung ist ein Datenkomprimierungsprozess, der kürzere Codeworte häufigen Ereignissen und längere Codeworte weniger häufigen Ereignissen zuweist. Aus einer vordefinierten Codeworttabelle fragt der Entropiekodierer 117 Codeworte ab, die für jede Kombination der oben empfangenen Daten relevant sind, wobei dadurch die kodierten Rahmendaten ausgegeben werden.

Die quantisierten DCT-Koeffizienten, die durch den Quantisierer 116 erzeugt werden, werden auch dem Dequantisierer 119 für eine Umkehrquantisierung (Inversquantisierung), oder Dequantisierung, zugeführt. Die resultierenden Ausgangssignale werden dann einem inversen diskreten Kosinustransformations-(IDCT, inverse discrete cosine transform) Prozess unterzogen, der durch einen IDCT-Prozessor 120 ausgeführt wird, um das ursprüngliche Vorhersagefehlersignal zu reproduzieren. Wenn das reproduzierte Vorhersagefehlersignal das QCIF-Format als ein Ergebnis der Auflösungsverringerung durch den CIF/QCIF-Konverter 131 hat, konvertiert es ein QCIF/CIF-Konverter 132 erneut, um die ursprüngliche CIF-Auflösung wiederherzustellen. Ein Dekodierungsbildgenerator 121 rekonstruiert ein Bild durch Hinzufügen des Vorhersagefehlersignals, das durch den QCIF/CIF-Konverter 132 ausgegeben wird, zu dem Vorhersagebild, das durch den Vorhersagebildgenerator 113 erzeugt wird. Dieses vollständig dekodierte Bild wird dann zu einem Rahmenspeicher 122 für eine Speicherung transferiert.

Wie oben beschrieben, überwacht die vorgeschlagene Videokodierungsvorrichtung den Umfang von kodierten Rahmendaten und dergleichen, und falls irgendeine beträchtliche Erhöhung in dem Umfang von kodierten Rahmendaten erwartet wird, wird die Vorrichtung die Auflösung des Vorhersagefehlersignals von CIF zu QCIF reduzieren.

Der CIF/QCIF-Konverter 131 führt eine derartige Auflösungsverringerung durch einen Herabtastprozess (Downsampling-Prozess) durch, wie in 15 beispielhaft dargestellt. Genauer repräsentieren weiße Punkte in 15 CIF-Pixel und in ihnen platzierte Kleinbuchstaben zeigen ihre jeweiligen Vorhersagefehlersignalwerte an. Schwarze Punkte repräsentieren QCIF-Pixel, und Großbuchstaben neben ihnen bedeuten ihre jeweiligen Vorhersagefehlersignalwerte. Der Herabtastprozess kalkuliert die QCIF-Vorhersagefehlersignalwerte A, B, C und D durch Mittelwertbildung von vier Werten der CIF-Pixel, die jedes von den QCIF-Pixeln umgeben. Z.B. wird der Pixelwert A als A = (a + b + e + f)/4(1) erhalten.

Im Gegensatz dazu führt der QCIF/CIF-Konverter 132 eine QCIF-CIF-Auflösungskonvertierung durch einen Herauftastprozess (Upsampling-Prozess) durch, wie in 16 gezeigt wird. Genauer repräsentieren schwarze Punkte QCIF-Pixel, und Großbuchstaben neben ihnen zeigen ihre jeweiligen Vorhersagefehlersignalwerte an, während weiße Punkte CIF-Pixel repräsentieren und Kleinbuchstaben in ihnen ihre jeweiligen Vorhersagefehlersignalwerte anzeigen. Um die CIF-Vorhersagefehlersignalwerte a, b, c usw. zu erhalten, kalkuliert der Herauftastprozess einen gewichteten Mittelwert von vier QCIF-Pixeln, die jedes CIF-Pixel umgeben. Z.B. wird der Pixelwert f als f = (9A + 3B +3C + D)/16(2) erhalten, wobei vier QCIF-Werte mit Gewichtungskoeffizienten aufsummiert werden, die in Übereinstimmung mit ihren jeweiligen Abständen von dem Pixel 134 von Interesse bestimmt werden.

Es sollte hier vermerkt werden, dass die oben beschriebene konventionelle Videokodierungsvorrichtung unter der Annahme aufgebaut ist, dass alle Blöcke in einem Rahmen durch Verwenden eines konsistenten Kodierungsschemas kodiert sind. Genauer wird angenommen, dass jeder Block in einem gegebenen Rahmen entweder einer Intrarahmenkodierung oder einer Interrahmenkodierung unterzogen wird, aber dieses Kodierungsschema in der Mitte des Rahmens nicht umgeschaltet werden kann.

In der Realität können jedoch manchmal die zwei unterschiedlichen Kodierungsschemata auf unterschiedliche Blöcke in dem gleichen Rahmen angewendet werden. Falls dies der Fall ist, werden einige benachbarte Blöcke innerhalb des gleichen Rahmens auf unterschiedlichen Wegen kodiert sein. Z.B. wird die Pixelabbildung betrachtet, die in 16 veranschaulicht ist. Hier repräsentiert eine gestrichelte Linie 133 eine Blockgrenze, wo sich in das angewendete Kodierungsschema von Interrahmenkodierung zu Intrarahmenkodierung ändert oder umgekehrt. Um einen Vorhersagefehlersignalwert f in einem CIF-Pixel 134 zu kalkulieren, verwendet der QCIF/CIF-Konverter 132 die Gleichung f = (9A + 3B + 3C + D)/16(3) wobei die QCIF-Pixelwerte C und D, die Gegenstand des anderen Kodierungsschemas sind, das Ergebnis f beeinträchtigen werden. Bezug nehmend nun auf 17 werden nachstehend Probleme erörtert, die durch diesen gemischten Pixelverweis verursacht werden.

17 zeigt schematisch einen Prozess der vorhersagenden Kodierung und Dekodierung eines Quellenbildes. 17 besteht aus sechs Grafiken, (a) bis (f), von denen jede darstellt, wie die Pixelwerte variieren werden, wenn über einige unterschiedliche Blöcke hinweg abgetastet wird. Mit anderen Worten zeigen diese Grafiken die Profile von Pixelwerten in der Nachbarschaft einer gewissen Blockgrenze. Genauer ist die linke Hälfte von jedem Profil (mit "Intra" bezeichnet) ein Block, der Gegenstand der Intrarahmenkodierung ist, während die rechte Hälfte (mit "Inter" bezeichnet) ein Block ist, der Gegenstand der Interrahmenkodierung ist, wobei die vertikale gestrichelte Linie die Blockgrenze anzeigt. Die obere linke Grafik (a) zeigt das Profil eines Quellenbildes, in dem die Pixelwerte in beiden Blöcken nur flach sind. Da der linke Block der Intrarahmenkodierung unterzogen wird und somit keinen Bezugsrahmen für Vorhersage hat, werden seine Pixelwerte in dem Vorhersagebildprofil (b) Nullen sein. Entsprechend weist das resultierende Vorhersagefehlersignal (c) große Differenzwerte in dem linken Block auf, während kleine Werte in dem rechten Block gezeigt werden, der Gegenstand der Interrahmenkodierung ist. Übrigens implizieren in 17 (und auch in späteren Figuren) die großen Zeichen "+" bzw. "–" Subtraktion und Addition von Bildern.

In einer derartigen Situation, wo zwei benachbarte Blöcke mit unterschiedlichen Schemata kodiert sind (d.h. Intrarahmen und Interrahmen), werden die Herauftastoperationen, die durch den QCIF/CIF-Konverter 132 ausgeführt werden, wie zuvor erwähnt, eine Mischung von unterschiedlich kodierten Pixelwerten in der Nähe der Blockgrenze einführen. D.h. das reproduzierte Vorhersagefehlersignal wird deformiert, wie in einem Profile (d) von 17 veranschaulicht, als ein Ergebnis der Herauftastoperationen durch den QCIF/CIF-Konverter 132. Dann wird die Summierung dieses reproduzierten Vorhersagefehlersignals (d) und eines Vorhersagebildes (e), das gleich dem Vorhersagebild (b) ist, das von der Vorhersagebild-Generierungseinheit 113 bereitgestellt wird, ein dekodiertes Bild (f) liefern. Wie in 17 veranschaulicht, enthält das resultierende dekodierte Bild (f) einige Verzerrung in der Nähe der Blockgrenze. Treue von dekodierten Bildern zu den ursprünglichen Bildern ist eine der wichtigsten Gestaltungsbetrachtungen in Videodekodierern. Wie im Gegensatz dazu ist das Bild (f), das durch die konventionelle Videokodierungsvorrichtung rekonstruiert wird, verschieden von dem ursprünglichen Quellenbild (a).

Diese Art eines Problems kann nicht nur in der besonderen Situation auftreten, in der zwei unterschiedliche Kodierungsschemata auf benachbarte Blöcke in einem Rahmen angewendet werden, sondern sie kann potenziell für beliebige Videorahmen auftreten, die einige scharfe Kanten enthalten, die eine große Differenz oder Diskontinuität in Pixelwerten in einer gewissen Blockgrenze in einem einzelnen Rahmen aufweisen. Derartige Diskontinuitätsübergänge von Pixelwerten können auch in derartigen Videorahmen beobachtet werden, wo zwei benachbarte Blöcke ziemlich unterschiedliche Bewegungsvektoren haben. Wenn dekodiert, wird das Bild an ähnlichem Rauschen, oder Artefakten, leiden, die in der Nähe der Grenze jener benachbarten Blöcke erzeugt werden.

Ferner wird auf die Herauftastliteraturstellen EP-A-589504 und WO-A-96/17478 verwiesen.

ZUSAMMENFASSUNG DER ERFINDUNG

Unter Betrachtung des obigen besteht ein Ziel der vorliegenden Erfindung darin, eine Videokodierungsvorrichtung und eine Videodekodierungsvorrichtung vorzusehen, die dekodierte Bildern ohne Einführung von unerwünschtem Rauschen reproduzieren können, selbst wenn eine beliebige beträchtliche Differenz in Pixelwerten oder Diskontinuität in einer gewissen Blockgrenze existiert.

Gemäß der vorliegenden Erfindung werden eine Videokodierungsvorrichtung gemäß dem angefügten unabhängigen Anspruch 1, und ein Videokodierungsverfahren gemäß dem angefügten unabhängigen Anspruch 10 vorgesehen. Bevorzugte Ausführungsformen sind in den abhängigen Ansprüchen definiert.

Die obigen und andere Ziele, Merkmale und Vorteile der vorliegenden Erfindung werden aus der folgenden Beschreibung offensichtlich sein, wenn in Verbindung mit den begleitenden Zeichnungen aufgenommen, die bevorzugte Ausführungsformen der vorliegenden Erfindung auf dem Weg eines Beispiels veranschaulichen.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

1 ist eine erste konzeptionelle Ansicht der vorliegenden Erfindung;

2 ist eine zweite konzeptionelle Ansicht der vorliegenden Erfindung;

3 ist ein Blockdiagramm, das einen spezifischen Aufbau einer ersten Ausführungsform der vorliegenden Erfindung zeigt;

4 ist ein Diagramm, um einen Herauftastprozess zu erläutern, der durch eine Herauftasteinheit ausgeführt wird;

5 ist ein Blockdiagramm, das den Aufbau einer zweiten Ausführungsform der vorliegenden Erfindung zeigt;

6 ist ein Blockdiagramm, das den Aufbau einer dritten Ausführungsform der vorliegenden Erfindung zeigt;

7 ist ein Blockdiagramm, das den Aufbau einer vierten Ausführungsform zeigt, die nicht zu der vorliegenden Erfindung gehört;

8 ist ein Blockdiagramm, das den Aufbau einer fünften Ausführungsform der vorliegenden Erfindung zeigt;

9 ist ein Diagramm, um einen Herauftastprozess zu erläutern, der durch eine Herauftasteinheit in der fünften Ausführungsform ausgeführt wird;

10 ist ein Diagramm, um einen Prozess zu erläutern, der durch ein Grenznachbarschaftsfilter durchgeführt wird;

11 ist ein Diagramm, das zeigt, wie ein vorhersagend-kodiertes Quellenbild in einer Videokodierungsvorrichtung der vorliegenden Erfindung dekodiert wird;

12 ist ein Diagramm, um einen Prozess zu erläutern, der durch das Grenznachbarschaftsfilter durchgeführt wird, wenn ein Betriebsbefehlssignal dazu wegen einer kritischen Differenz zwischen zwei benachbarten Blöcken im Sinne der Größe von Bewegungsvektoren gesendet wird;

13 ist ein Blockdiagramm, das den Aufbau einer sechsten Ausführungsform zeigt, die nicht zu der vorliegenden Erfindung gehört;

14 ist ein Blockdiagramm, das eine konventionelle Videokodierungsvorrichtung zeigt;

15 ist ein Diagramm, um einen konventionellen Herabtastprozess zu erläutern;

16 ist ein Diagramm, um einen konventionellen Herauftastprozess zu erläutern; und

17 ist ein Diagramm, das zeigt, wie ein vorhersagend-kodiertes Quellenbild in der konventionellen Videokodierungsvorrichtung dekodiert wird.

BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN

Um das obige Ziel zu erreichen, wird eine Videokodierungsvorrichtung zum Durchführen von vorhersagendem Kodieren von digitalen Videoeingangssignalen vorgesehen. Die Vorrichtung umfasst: (a) Auflösungsbestimmungsmittel zum Auswählen einer Bildauflösung, die in einer Videokodierung eines Quellenbildes eines aktuellen Rahmens zu verwenden ist, wobei die Bildauflösung entweder eine geringe Auflösung oder eine hohe Auflösung ist; (b) Dekodierungsbildspeichermittel (Speichermittel eines dekodierten Bildes) zum Speichern eines vergangenen dekodierten Bildes, das in einem vorherigen Rahmen reproduziert wird; (c) Vorhersageparameter-Kalkulationsmittel, das mit dem Auflösungsbestimmungsmittel gekoppelt ist, zum Bestimmen, welches von zwei Kodierungsschemata verwendet werden sollte, um einzelne Blöcke zu kodieren, durch Vergleichen des Quellenbildes des aktuellen Rahmens mit dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel gespeichert ist, und auch zum Kalkulieren von Bewegungsvektoren der Blöcke in dem Quellenbild, wobei die zwei Kodierungsschemata eine Intrarahmenkodierung und eine Interrahmenkodierung enthalten, und die Blöcke durch Partitionieren eines gegebenen Bildes in Stücke (Teile) gemäß der Bildauflösung definiert sind, die durch das Auflösungsbestimmungsmittel bestimmt ist; (d) Vorhersagebild-Generierungsmittel zum Erzeugen eines Vorhersagebildes durch Kalkulation von Pixelwerten auf einer Basis Block für Block, wobei die Kalkulation der Pixelwerte enthält Zuweisung von Nullen zu Pixelwerten der Blöcke, die Gegenstand der Intrarahmenkodierung sind, und Kalkulation der Pixelwerte der anderen Blöcke, die Gegenstand der Interrahmenkodierung sind, basierend auf dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel gespeichert ist, und den Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel erhalten werden; (e) Vorhersagefehlersignal-Generierungsmittel zum Erzeugen eines Vorhersagefehlersignals für jeden Block durch Kalkulieren von Differenzen zwischen dem Quellenbild und dem Vorhersagebild; (f) erstes Auflösungskonvertierungsmittel zum Herabtasten des Vorhersagefehlersignals, das durch das Vorhersagefehlersignal-Generierungsmittel erzeugt wird, um die geringe Auflösung vorzusehen, abhängig von der Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt wird; (g) Orthogonaltransformations-/Quantisierungsmittel zum Anwenden eines Orthogonaltransformationsprozesses und eines Quantisierungsprozesses auf das Vorhersagefehlersignal, das durch das erste Auflösungskonvertierungsmittel verarbeitet wird; (h) Codezuordnungsmittel zum Ausgeben eines Codewortes, das für eine gegebene Menge von Daten relevant ist, wobei das Codewort aus einer vordefinierten Codeworttabelle abgefragt wird, worin die gegebene Menge von Daten mindestens die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels, die Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt wird, das Kodierungsschema, das durch das Vorhersageparameter-Kalkulationsmittel bestimmt wird, und die Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel kalkuliert werden, enthält, und die vorbestimmte Codeworttabelle eine Vielzahl von Codeworten enthält, die zuvor jeder möglichen Kombination der gegebenen Menge von Daten zugewiesen werden; (i) Dequantisierungs-/Umkehrorthogonaltransformationsmittel zum Anwenden eines Dequantisierungsprozesses und eines Umkehrorthogonaltransformationsprozesses auf die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels, um das Vorhersagefehlersignal zu reproduzieren; (j) zweites Auflösungskonvertierungsmittel zum Anwenden eines Herauftastprozesses auf das reproduzierte Vorhersagefehlersignal, das von dem Dequantisierungs-/Umkehrorthogonaltransformationsmittel gesendet wird, um die hohe Auflösung vorzusehen, falls das reproduzierte Vorhersagefehlersignal die geringe Auflösung hat, was durch das erste Auflösungskonvertierungsmittel verarbeitet wird, wobei der Herauftastprozess, wenn ein Pixelwert in einem Block kalkuliert wird, der Gegenstand von einem der zwei Kodierungsschemata ist, nicht auf beliebige Pixel verweist, die zu einem beliebigen anderen Block benachbart zu dem Block von Interesse gehören, falls der benachbarte Block Gegenstand des anderen Kodierungsschemas ist, sondern mindestens auf die Pixel verweist, die zu dem Block von Interesse gehören; und (k) Dekodierungsbild-Generierungsmittel zum Aufbauen eines dekodierten Bildes durch Hinzufügen des reproduzierten Vorhersagefehlersignals, das durch das zweite Auflösungskonvertierungsmittel verarbeitet wird, zu dem Vorhersagebild, das durch das Vorhersagebild-Generierungsmittel erzeugt wird, und zum Ausgeben des dekodierten Bildes zu dem Dekodierungsbildspeichermittel.

Um das obige Ziel zu erreichen, wird auch eine andere Videokodierungsvorrichtung zum Durchführen einer vorhersagenden Kodierung von digitalen Videoeingangssignalen vorgesehen. Diese Vorrichtung umfasst: (a) Auflösungsbestimmungsmittel zum Auswählen einer Bildauflösung, die in einer Videokodierung eines Quellenbildes eines aktuellen Rahmens zu verwenden ist, wobei die Bildauflösung entweder eine geringe Auflösung oder eine hohe Auflösung ist; (b) Dekodierungsbildspeichermittel zum Speichern eines vergangenen dekodierten Bildes, das in einem vorherigen Rahmen reproduziert wird; (c) Vorhersageparameter-Kalkulationsmittel, das mit dem Auflösungsbestimmungsmittel gekoppelt ist, zum Bestimmen, welches der zwei Kodierungsschemata verwendet werden sollte, um einzelne Blöcke zu kodieren, durch Vergleichen des Quellenbildes des aktuellen Rahmens mit dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel gespeichert ist, und auch zum Kalkulieren von Bewegungsvektoren der Blöcke in dem Quellenbild, wobei die zwei Kodierungsschemata eine Intrarahmenkodierung und eine Interrahmenkodierung enthalten, und die Blöcke durch Partitionieren eines gegebenen Bildes in Stücke gemäß der Bildauflösung definiert sind, die durch das Auf lösungsbestimmungsmittel bestimmt ist; (d) Vorhersagebild-Generierungsmittel zum Erzeugen eines Vorhersagebildes durch Kalkulation von Pixelwerten auf einer Basis Block für Block, wobei die Kalkulation der Pixelwerte enthält Zuweisung von Nullen zu Pixelwerten der Blöcke, die Gegenstand der Intrarahmenkodierung sind, und Kalkulation der Pixelwerte der anderen Blöcke, die Gegenstand der Interrahmenkodierung sind, basierend auf dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel gespeichert ist, und den Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel erhalten werden; (e) Vorhersagefehlersignal-Generierungsmittel zum Erzeugen eines Vorhersagefehlersignals für jeden Block durch Kalkulieren von Differenzen zwischen dem Quellenbild und dem Vorhersagebild; (f) erstes Auflösungskonvertierungsmittel zum Herabtasten des Vorhersagefehlersignals, das durch das Vorhersagefehlersignal-Generierungsmittel erzeugt wird, um die geringe Auflösung vorzusehen, abhängig von der Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt ist; (g) Orthogonaltransformations-/Quantisierungsmittel zum Anwenden eines Orthogonaltransformationsprozesses und eines Quantisierungsprozesses auf das Vorhersagefehlersignal, das durch das erste Auflösungskonvertierungsmittel verarbeitet wird; (h) Codezuordnungsmittel zum Ausgeben eines Codewortes, das für eine gegebene Menge von Daten relevant ist, wobei das Codewort aus einer vordefinierten Codeworttabelle abgefragt wird, worin die gegebene Menge von Daten mindestens die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels, die Bildauflösung, die durch das Bildauflösungsmittel bestimmt ist, das Kodierungsschema, das durch das Vorhersageparameter-Kalkulationsmittel bestimmt ist, und die Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel kalkuliert sind, enthält, und die vorbestimmte Codeworttabelle eine Vielzahl von Codeworten enthält, die jeder möglichen Kombination der gegebenen Menge von Daten zuvor zugewiesen sind; (i) Dequantisierungs-/Umkehrorthogonaltransformationsmittel zum Anwenden eines Dequantisierungsprozesses und eines Umkehrorthogonaltransformationsprozesses auf die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels, um das Vorhersagefehlersignal zu reproduzieren; (j) zweites Auflösungskonvertierungsmittel zum Anwenden eines Herauftastprozesses auf das reproduzierte Vorhersagefehlersignal, das von dem Dequantisierungs-/Umkehrorthogonaltransformationsmittel gesendet wird, um die hohe Auflösung vorzusehen, falls das reproduzierte Vorhersagefehlersignal die geringe Auflösung hat, was durch das erste Auflösungskonvertierungsmittel verarbeitet wird; (k) Vorhersagebild-Modifikationsmittel zum Bestimmen neuer Werte von Pixeln in einem Block, der einer Blockgrenze benachbart ist, mit Bezug auf andere Pixel in einem anderen Block, der dem Block von Interesse benachbart ist, falls das reproduzierte Vorhersagefehlersignal die geringe Auflösung hat, die durch das erste Auflösungskonvertierungsmittel verarbeitet wird; und (1) Dekodierungsbild-Generierungsmittel zum Aufbauen eines dekodierten Bildes durch Hinzufügen des reproduzierten Vorhersagefehlersignals, das durch das zweite Auflösungskonvertierungsmittel verarbeitet wird, zu dem Vorhersagebild, das durch das Vorhersagebild-Modifikationsmittel verarbeitet wird, und zum Ausgeben des dekodierten Bildes zu dem Dekodierungsbildspeichermittel.

Nachstehend werden mehrere bevorzugte Ausführungsformen der vorliegenden Erfindung mit Bezug auf die begleitenden Zeichnungen beschrieben.

Zuerst wird unter Bezug auf 1 das Konzept einer ersten Ausführungsform der vorliegenden Erfindung erläutert. Diese erste Ausführungsform bezieht sich speziell auf eine Videokodierungsvorrichtung.

Die erste Ausführungsform der vorliegenden Erfindung schlägt eine Videokodierungsvorrichtung vor, die die folgenden Elemente umfasst.

  • (a) Auflösungsbestimmungsmittel 1 zum Auswählen einer Bildauflösung, die in einer Videokodierung eines Quellenbildes eines aktuellen Rahmens zu verwenden ist. Hier kann die Bildauflösung entweder eine geringe Auflösung oder eine hohe Auflösung sein.
  • (b) Dekodierungsbildspeichermittel 2 zum Speichern eines vergangenen dekodierten Bildes, das in einem vorherigen Rahmen reproduziert wird.
  • (c) Vorhersageparameter-Kalkulationsmittel 3, das mit dem Auflösungsbestimmungsmittel 1 gekoppelt ist, zum Bestimmen, welches der zwei Kodierungsschemata verwendet werden sollte, um einzelne Blöcke zu kodieren, durch Vergleichen des Quellenbildes des aktuellen Rahmens mit dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel gespeichert ist. Das Vorhersageparameter-Kalkulationsmittel 3 kalkuliert auch Bewegungsvektoren der Blöcke in dem Quellenbild. Es wird vermerkt, dass die zwei Kodierungsschemata eine Intrarahmenkodierung und eine Interrahmenkodierung enthalten, und die Blöcke durch Partitionieren eines gegebenen Bildes in Stücke gemäß der Bildauflösung definiert sind, die durch das Auflösungsbestimmungsmittel 1 bestimmt ist.
  • (d) Vorhersagebild-Generierungsmittel 4 zum Erzeugen eines Vorhersagebildes durch Kalkulation von Pixelwerten auf einer Basis Block für Block. Diese Kalkulation der Pixelwerte enthält Zuweisung von Nullen als die Pixelwerte der Blöcke, die Gegenstand der Intrarahmenkodierung sind, und Kalkulation der Pixelwerte der anderen Blöcke, die Gegenstand der Interrahmenkodierung sind, basierend auf dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel 2 gespeichert ist, und den Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel 3 erhalten werden.
  • (e) Vorhersagefehlersignal-Generierungsmittel 5 zum Erzeugen eines Vorhersagefehlersignals für jeden Block durch Kalkulieren von Differenzen zwischen dem Quellenbild und dem Vorhersagebild.
  • (e) Erstes Auflösungskonvertierungsmittel 6 zum Herabtasten des Vorhersagefehlersignals, das durch das Vorhersagefehlersignal-Generierungsmittel 5 erzeugt wird, um die geringe Auflösung vorzusehen, abhängig von der Bildauflösung, die durch das Auflösungsbestimmungsmittel 1 bestimmt ist.
  • (g) Orthogonaltransformations-/Quantisierungsmittel 7 zum Anwenden eines Orthogonaltransformationsprozesses und eines Quantisierungsprozesses auf das Vorhersagefehlersignal, das durch das erste Auflösungskonvertierungsmittel 6 verarbeitet wird;
  • (h) Codezuordnungsmittel 8 zum Ausgeben eines Codewortes, das für eine gegebene Menge von Daten relevant ist, wobei das Codewort aus einer vordefinierten Codeworttabelle abgefragt wird. Hier enthält die gegebene Menge von Daten mindestens die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels 7, die Bildauflösung, die durch das Auflösungsbestimmungsmittel 1 bestimmt ist, das Kodierungsschema, das durch das Vorhersageparameter-Kalkulationsmittel 3 bestimmt ist, und die Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel 3 kalkuliert sind. Es wird vermerkt, dass die vorbestimmte Codeworttabelle eine Vielzahl von Codeworten enthält, die zuvor jeder möglichen Kombination der gegebenen Menge von Daten zugewiesen sind.
  • (i) Dequantisierungs-/Umkehrorthogonaltransformationsmittel 9 zum Anwenden eines Dequantisierungsprozesses und eines Umkehrorthogonaltransformationsprozesses auf die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels 7, um das Vorhersagefehlersignal zu reproduzieren.
  • (j) Zweites Auflösungskonvertierungsmittel 10 zum Anwenden eines Herauftastprozesses auf das reproduzierte Vorhersagefehlersignal, das von dem Dequantisierungs-/Umkehrorthogonaltransformationsmittel 9 gesendet wird, um die hohe Auflösung vorzusehen, falls das reproduzierte Vorhersagefehlersignal die geringe Auflösung hat, was durch das erste Auflösungskonvertierungsmittel 6 verarbeitet wird. Wenn ein Pixelwert in einem derartigen Block kalkuliert wird, der Gegenstand von einem der zwei Kodierungsschemata ist, verweist der Herauftastprozess nicht auf beliebige Pixel, die zu einem beliebigen anderen Block gehören, der dem Block von Interesse benachbart ist, falls der benachbarte Block Gegenstand des anderen Kodierungsschemas ist. Das zweite Auflösungskonvertierungsmittel 10 verweist jedoch mindestens auf die Pixel, die zu dem Block von Interesse gehören.
  • (k) Dekodierungsbildgenerierungsmittel 11 zum Aufbauen eines dekodierten Bildes durch Hinzufügen des reproduzierten Vorhersagefehlersignals, das durch das zweite Auflösungskonvertierungsmittel 10 verarbeitet wird, zu dem Vorhersagebild, das durch das Vorhersagebild-Generierungsmittel 4 erzeugt wird, und zum Ausgeben des dekodierten Bildes zu dem Dekodierungsbildspeichermittel 2.

In der oben beschriebenen strukturellen Anordnung bestimmt das Auflösungsbestimmungsmittel 1 die Bildauflösung, in der das Quellenbild zu kodieren ist. Genauer wählt das Auflösungsbestimmungsmittel 1 eine hohe Auflösung, wenn die Codezuordnungseinheit 8 eine kleinere Menge von kodierten Daten als ein vorbestimmtes Standardvolumen erzeugt hat. Es wählt wiederum eine geringe Auflösung, wenn die Menge der kodierten Daten größer als das Standardcodevolumen ist.

Für jeden Block, der durch Partitionieren des Quellenbildes gemäß der Bildauflösung definiert ist, die durch das Auflösungsbestimmungsmittel 1 bestimmt ist, führt das Vorhersageparameter-Kalkulationsmittel 3 eine Berechnung eines Bewegungsvektors durch, ebenso wie eine Bestimmung, welches Kodierungsschema (d.h. Intrarahmen oder Interrahmen) auf den Block angewendet werden sollte. Das Vorhersagebild-Generierungsmittel 4 erzeugt ein Vorhersagebild auf einer Basis Block für Block, gemäß der Ausgabe des Vorhersageparameter-Kalkulationsmittels 3. D.h. wenn die Intrarahmenkodierung auf einen gewissen Block angewendet wird, gibt das Vorhersagebild-Generierungsmittel 4 Nullen für die Pixelwerte des Blocks von Interesse als Teil des Vorhersagebildes in Bearbeitung aus. Wenn wiederum die Interrahmenkodierung angewendet wird, erzeugt das Vorhersagebild-Generierungsmittel 4 ein Vorhersagebild des Blocks durch Anwenden des kalkulierten Bewegungsvektors auf die relevanten Daten, die von dem De kodierungsbildspeichermittel 2 abgerufen werden, das die rekonstruierten Bilder in einigen vorherigen Rahmen speichert.

Das Vorhersagefehlersignal-Generierungsmittel 5 erzeugt ein Vorhersagefehlersignal durch Kalkulieren von Differenzen zwischen dem aktuellen Rahmenbild und dem Vorhersagebild auf einer Basis Block für Block. Das erzeugte Vorhersagefehlersignal wird dann dem ersten Auflösungskonvertierungsmittel 6 zur Verringerung der Bildauflösung unterzogen, falls es durch das Auflösungsbestimmungsmittel 1 gefordert wird. Genauer leitet das erste Auflösungskonvertierungsmittel 6 das Vorhersagefehlersignal wie es ist weiter, wenn die hohe Auflösung durch das Auflösungsbestimmungsmittel 1 ausgewählt ist, und es konvertiert die Bildauflösung des Signals herab zu der geringen Auflösung, wenn die geringe Auflösung durch das Auflösungsbestimmungsmittel 1 ausgewählt ist.

Als Nächstes wendet das Orthogonaltransformations-/Quantisierungsmittel 7 eine Orthogonaltransformation und Quantisierungsprozesse auf die Ausgabe des ersten Auflösungskonvertierungsmittels 6 an. Das Codezuordnungsmittel 8 empfängt mindestens das Ausgabesignal des Orthogonaltransformations-/Quantisierungsmittels 7, die Bildauflösung, die durch das Auflösungsbestimmungsmittel 1 bestimmt ist, und das Kodierungsschema und Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel 3 erhalten werden. Es werden einige geeignete Codeworte, um verschiedene Kombinationen jener Arten von Daten darzustellen, in einer Codeworttabelle vorbereitet. Das Codezuordnungsmittel 8 ruft derartige Codeworte ab, die für die empfangenen Daten relevant sind, und überträgt sie zu den empfangenden Enden über einen Übertragungskanal.

Das Dequantisierungs-/Umkehrorthogonaltransformationsmittel 9 dequantisiert das Ausgangssignal des Orthogonaltransformations-/Quantisierungsmittels 7, und es führt ferner eine Umkehrorthogonaltransformation aus, um das Vorhersagefehlersignal wie ursprünglich generiert zu reproduzieren. In dem Fall, dass das erste Auflösungskonvertierungsmittel 6 das ursprüngliche Vorhersagefehlersignal unterabgetastet hat, um seine Auflösung zu reduzieren, wird das reproduzierte Vorhersagefehlersignal natürlich die reduzierte Bildauflösung haben. In diesem Fall versucht das zweite Auflösungskonvertierungsmittel 10, die ursprüngliche Auflösung durch Durchführen eines Herauftastprozesses auf die zuvor beschriebene Weise wiederherzustellen. Es wird daran erinnert, dass dieser Herauftastprozess ein Prozess ist, um die Pixelwerte hoher Auflösung aus den Werten von einigen umgebenden Pixeln geringer Auflösung zu erhalten. In der vorliegenden Erfindung wird jedoch der Herauftastprozess nicht auf die Pixel verweisen, die zu einem beliebigen benachbarten Block gehören, der Gegenstand eines anderen Kodierungsschemas ist, das sich von dem auf den vorliegenden Block angewendeten unterscheidet. Als eine abwechselnde Anordnung kann der Herauftastprozess so implementiert sein, dass er die Pixel in anderen Blöcken vernachlässigen wird, sondern nur auf den vorliegenden Block von Interesse verweisen wird.

Mit einem derartigen Herauftastalgorithmus verhindert die vorliegende Erfindung den Unterschied in Kodierungsschemata aus Beeinflussung des reproduzierten Vorhersagefehlersignals im Gegensatz zu dem konventionellen Herauftastprozess, wo die Blöcke mit unterschiedlichen Kodierungsschemata einiges unerwünschtes Rauschen in dem reproduzierten Signal verursachen, wie in dem Profil (d) von 17 veranschaulicht wird. Als ein Ergebnis wird das reproduzierte Vorhersagefehlersignal, das durch das zweite Auflösungskonvertierungsmittel 10 ausgegeben wird, die ursprüngliche Signalform haben, wie in dem Profil (c) gezeigt wird. Die oben beschriebene Auflösungskonvertierung wird nicht ausgeführt, wenn das erste Auflösungskonvertierungsmittel 6 das ursprüngliche Vorhersagefehlersignal nicht herab getastet hat. In diesem Fall leitet das zweite Auflösungskonvertierungsmittel 10 das reproduzierte Vorhersagefehlersignal weiter wie es ist.

Das Dekodierungsbild-Generierungsmittel 11 rekonstruiert ein Bild durch Hinzufügen des reproduzierten Vorhersagefehlersignals, das von dem zweiten Auflösungskonvertierungsmittel 10 gesendet wird, zu dem Vorhersagebild, das durch das Vorhersagebild-Generierungsmittel 4 generiert wird. Das resultierende Bild, oder dekodierte Bild, wird dann dem Dekodierungsbildspeichermittel 2 bereitgestellt.

Auf die oben beschriebene Weise kann die vorliegende Erfindung die Bewegungsbilder ohne Einführung von unerwünschtem Rauschen reproduzieren, selbst wenn einige gemischte Kodierungsschemata zum Kodieren eines Rahmens verwendet werden, oder mit anderen Worten, selbst wenn zwei benachbarte Blöcke eine große Differenz in Pixelwerten aufweisen.

Die erste Ausführungsform der vorliegenden Erfindung wird nachstehend detaillierter beschrieben.

3 ist ein Blockdiagramm, das einen spezifischen Aufbau der ersten Ausführungsform der vorliegenden Erfindung zeigt. In 3 empfängt eine Auflösungsauswahlsteuervorrichtung 21, die dem Auflösungsbestimmungsmittel 1 in 1 entspricht, die Quantisiererschrittgröße von einer Steuereinheit 33 (später beschrieben). Sie empfängt auch die Menge von kodierten Rahmendaten von einem Entropiekodierer 28, und die Pufferbelegungsinformation von einem Kodierungsdatenpuffer 34. Basierend auf der gesamten empfangenen Information bestimmt die Auflösungsauswahlsteuervorrichtung 21 eine geeignete Bildauflösung für jeden Rahmen, sodass die Videoinformation, die zu den empfangenden Enden abgegeben wird, nicht an unerträglicher Bildqualitätsverschlechterung wegen der groben Unterabtastung der Rahmen leiden wird. In der ersten Ausführungsform wählt die Auflösungsauswahlsteuervorrichtung 21 normalerweise eine hohe Auflösung von 352 × 288 Pixeln, oder die CIF-Auflösung. Wenn eine große Menge von kodierten Daten als ein Ergebnis des Kodierungsprozesses erzeugt wird, wählt sie eine geringe Auflösung von 175 × 144 Pixeln, oder die QCIF-Auflösung. Die Auflösungsauswahlsteuervorrichtung 21 kann als eine alternative Anordnung derart konfiguriert sein, dass sie drei oder mehr Arten von Auflösungen umschalten wird. Bezüglich der anwendbaren Algorithmen zum Bestimmen der Bildauflösung sieht die zuvor erwähnte japanische Patentanmeldung Nr. 8-75605 (1996) z.B. eine detaillierte Beschreibung vor. Eine Benachrichtigung über die bestimmte Auflösung wird zu einem Herabtastschalter 26b, einem Tiefpassfilterschalter 32b, einem Vorhersageparameterkalkulator 23 und einem Herauftastschalter 30b gesendet, wie später beschrieben wird. Sie wird auch einem Entropiekodierer 28 zugeführt, obwohl der Signalfluss in 3 nicht veranschaulicht wird.

Ein Rahmenspeicher 22, der als das Dekodierungsbildspeichermittel 2 in 1 dient, wird verwendet, um Bilddaten von einem oder mehr Rahmen zu speichern, die in den letzten wenigen Kodierungszyklen rekonstruiert sind. Ein Vorhersageparameterkalkulator 23 ist, was in 1 als das Vorhersageparameter-Kalkulationsmittel 3 beschrieben wird. Für jeden Block, der durch Partitionieren des Quellenbildes gemäß der Bildauflösung erhalten wird, die durch die Auflösungsauswahlsteuervorrichtung 21 bestimmt wird, kalkuliert der Vorhersageparameterkalkulator 23 einen Bewegungsvektor, ebenso wie eine Bestimmung des Kodierungsschemas (d.h. Intrarahmen oder Interrahmen), das anzuwenden ist. Die Größe von jedem Block hängt von der Auflösung ab, die durch die Auflösungsauswahlsteuervorrichtung 21 bestimmt wird. Sie ist entweder 16 × 16 Pixel für CIF-Auflösung oder 32 × 32 Pixel für QCIF-Auflösung. Die Information über das bestimmte Kodierungsschema wird zu dem Vorhersagebildschalter 24b und der Herauftasteinheit 30a gesendet, während der kalkulierte Bewegungsvektor von jedem Block dem Tiefpassfilterschalter 32b und dem Entropiekodierer 28 zugeführt wird.

Ein Vorhersagebildgenerator 24a und ein Vorhersagebildschalter 24b dienen als das Vorhersagebild-Generierungsmittel 4, das in 1 gezeigt wird. Der Vorhersagebildgenerator 24a fragt ein relevantes vergangenes dekodiertes Bild von dem Rahmenspeicher 22 ab und wendet dann die Bewegungsvektoren, die von der Vorhersageparameter-Kalkulationseinheit 23 gesendet werden, auf das abgefragte Bild an, um ein Vorhersagebild des aktuellen Rahmens aufzubauen. Der Vorhersagebildschalter 24b ist ein Schalter, um den Inhalt der Vorhersagebilder auf einer Basis Block für Block zu steuern, in Übereinstimmung mit dem Kodierungsschema, das durch den Vorhersageparameterkalkulator 23 spezifiziert ist. Genauer gibt der Vorhersagebildschalter 24b Nullen für die vorhergesagten Pixelwerte aus, wenn der Block der Intrarahmenkodierung unterzogen wird. Er wählt wiederum das Vorhersagebild, das von dem Vorhersagebildgenerator 24a ausgegeben wird, wenn die Interrahmenkodierung spezifiziert ist.

Ein Tiefpassfilter 32a entfernt Hochfrequenzkomponenten, die in jedem vorhergesagten Block enthalten sind. Basierend auf dem Bewegungsvektor von jedem Block, der von dem Vorhersageparameterkalkulator 23 gesendet wird, untersucht ein Tiefpassfilterschalter 32b, wie schnell sich jeder Block bewegt, wobei dadurch die Blöcke in zwei Gruppen klassifiziert werden: eine Gruppe schneller Bewegung und eine Gruppe von weniger Bewegung. Der Tiefpassfilterschalter 32b verwendet ferner die Bildauflösung, die durch die Auflösungsauswahlsteuervorrichtung 21 bereitgestellt wird, um zu bestimmen, ob die Hochfrequenzkomponenten zu aktivieren sind oder nicht. Genauer wählt, wenn die QCIF-Auflösung spezifiziert ist und der Block von Interesse in die Gruppe schneller Bewegung fällt, der Tiefpassfilterschalter 32b die Ausgabe des Tiefpassfilters 32a. Wenn die QCIF-Auflösung spezifiziert ist, aber der Block in die Gruppe von weniger Bewegung fällt, oder wenn die CIF-Auflösung spezifiziert ist, wird der Tiefpassfilterschalter 32b andererseits das Tiefpassfilter 32a umgehen.

Im wesentlichen ist die Frequenzreaktion eines vorhersagenden Kodierungsprozesses Gegenstand der Nyquist-Bandbreitenbegrenzung. D.h. wenn mit dem QCIF-Bildformat gearbeitet wird, ist der Kodierungsprozess nicht in der Lage, die Frequenzkomponenten über die Nyquist-Frequenz (&tgr;1), die durch die QCIF-Auflösung definiert ist, hinaus zu kodieren. Die höheren Frequenzkomponenten über &tgr;1 hinaus, falls sie existieren, könnten einige Kodierungsfehler verursachen, die sich in der Kodierungsschleife akkumulieren, was im Lauf der Zeit zu einer Verschlechterung in der Qualität von Bildern führt. Es ist deshalb notwendig, derartige unerwünschte Komponenten höherer Frequenz aus dem Vorhersagebild zu entfernen um zu verhindern, dass sich der Kodierungsfehler akkumuliert, und deshalb ist das Tiefpassfilter 32a in die Videokodierungsvorrichtung der vorliegenden Erfindung einbezogen.

Andererseits besteht ein Bild allgemein aus Bereichen, die relativ geringe oder keine Bewegungen aufweisen (z.B. ein Hintergrundbild), und Bereichen, die schnelle Bewegungen enthalten (z.B. ein Schauspieler oder eine Schauspielerin). Falls das oben beschriebene Tiefpassfilter auf die Blöcke in weniger aktiven Bereichen angewendet wird, wird die resultierende Hochfrequenzunterdrückung die Schärfe des Bildes in jenen Bereichen verderben. Da es natürlich keine Notwendigkeit gibt, die Bildinformation in derartigen weniger aktiven Bereichen, die bei einem hohen Komprimierungsverhältnis kodiert werden können, weiter zu reduzieren, sollte die Hochfrequenzunterdrückung auf sie nicht angewendet werden.

Aus diesem Grund ist die Videokodierungsvorrichtung von 3 so konfiguriert, dass der Tiefpassfilterschalter 32b das Vorhersagebild, dessen Hochfrequenzkomponenten durch das Tiefpassfilter 32a beseitigt sind, nur auswählen wird, wenn die QCIF-Auflösung spezifiziert ist und der Block in die Gruppe schneller Bewegung fällt.

Eine Vorhersagefehlersignal-Generierungseinheit 25 dient als das Vorhersagefehlersignal-Generierungsmittel 5 in 1. Die Kombination einer Herabtasteinheit 26a und eines Herabtastschalters 26b entspricht dem ersten Auflösungskonvertierungsmittel 6 in 1. Das Vorhersagefehlersignal, das durch die Vorhersagefehlersignal-Generierungseinheit 25 für jeden Block erzeugt wird, wird der Herabtasteinheit 26a zugeführt, um einen Herabtastprozess anzuwenden, wie zuvor mit Bezug auf 15 beschrieben wird. Der Herabtastschalter 26b wird verwendet, um den Herabtastprozess für das Vorhersagefehlersignal zu umgehen, abhängig von der Bildauflösung, die von der Auflösungsauswahlsteuervorrichtung 21 empfangen wird. Für die Blöcke, wo die CIF-Auflösung spezifiziert ist, wählt er die direkte Ausgabe der Vorhersagefehlersignal-Generierungseinheit 25, und für die Blöcke, wo die QCIF-Auflösung spezifiziert ist, wählt er die Ausgabe der Herabtasteinheit 26a.

Das Orthogonaltransformations-/Quantisierungsmittel 7 in 1 ist als eine Kombination eines DCT-Prozessors (8 × 8 DCT) 27a und eines Quantisierers 27b implementiert. Der DCT-Prozessor 27a führt eine diskrete Kosinustransformation für jeden Pixelblock von 8 × 8 durch, wobei dadurch eine Menge von Transformationskoeffizienten geliefert wird. Der Quantisierer 27b quantisiert die Transformationskoeffizienten gemäß der Quantisiererschrittgröße, die von der Kodierungssteuervorrichtung 33 gesendet wird (später beschrieben). Die erhaltenen Werte werden als quantisierte Koeffizienten bezeichnet.

Die Kodierungssteuervorrichtung 33 empfängt Information über die Menge der resultierenden kodierten Daten von einem Entropiekodierer 28 (später beschrieben), ebenso wie sie über die Pufferbelegung durch einen Kodierungsdatenpuffer 34 informiert wird. Basierend auf diesen zwei Arten von Information bestimmt und verteilt die Kodierungssteuervorrichtung 33 die Quantisiererschrittgröße zu dem Quantisierer 27b, Dequantisierer 29a, der Auflösungsauswahlsteuervorrichtung 29a und dem Entropiekodierer 28.

Der Entropiekodierer 28, der als das Codezuordnungsmittel 8 in 1 dient, empfängt die quantisierten Koeffizienten von dem Quantisierer 27b, die Bildauflösung von der Auflösungsauswahlsteuervorrichtung 21 (Signalfluss ist in 3 weggelassen), die Quantisiererschrittgröße von der Kodierungssteuervorrichtung 33 und das Kodierungsschema und Bewegungsvektoren von dem Vorhersageparameterkalkulator 23. Aus einer vorbereiteten Codetabelle heraus fragt der Entropiekodierer 28 Codeworte ab, die für die einzelnen Kombinationen jener empfangenen Daten relevant sind, wobei dadurch die kodierten Rahmendaten ausgegeben werden. Der Kodierungsdatenpuffer 34 dient als ein zeitweiliger Speicher für die kodierten Rahmendaten, die durch den Entropiekodierer 28 erzeugt werden.

Ein Dequantisierer 29a und ein IDCT-Prozessor (8 × 8 IDCT) 29b arbeiten als das Dequantisierungs-/Umkehrorthogonaltransformatiosmittel 9 in 1. Eine Herauftasteinheit 30a und ein Herauftastschalter 30b arbeiten in Kombination als das zweite Auflösungskonvertierungsmittel 10 in 1. Wenn versucht wird, einen Block in einem gewissen Kodierungsschema zu verarbeiten, das durch den Vorhersageparameterkalkulator 23 bestimmt ist, untersucht die Herauftasteinheit 30a zuerst, ob der Block von Interesse zu beliebigen Blöcken, die Gegenstand des anderen Kodierungsschemas sind, benachbart ist oder nicht. Falls ein derartiger benachbarter Block gefunden wird, wird die Herauftasteinheit 30a den Block von Interesse konvertieren, um die Auflösung durch Herauftasten der Pixel zu erhöhen. Der Herauftastalgorithmus, der in diesem Fall verwendet wird, wird später mit Bezug auf 4 beschrieben. Falls der Block keine derartigen benachbarten Blöcke hat, führt die Herauftasteinheit 30a einen konventionellen Herauftastprozess durch, wie in 16 veranschaulicht wird. Der Herauftastschalter 30b erlaubt dem reproduzierten Vorhersagefehlersignal, den Herauftastprozess zu umgehen, abhängig von der Bildauflösung, die von der Auflösungsauswahlsteuervorrichtung 21 empfangen wird. Für die Blöcke, wo die CIF-Auflösung spezifiziert ist, wählt er die genaue Ausgabe des IDCT-Prozessors 29b aus, und für die Blöcke, wo die QCIF-Auflösung spezifiziert ist, wählt er die Ausgabe der Herauftasteinheit 30a aus. Als ein Ergebnis wird das reproduzierte Vorhersagefehlersignal, das der nächsten Stufe zugeführt wird, konsistent die CIF-Auflösung haben.

Eine Dekodierungsbild-Generierungseinheit 31 entspricht dem Dekodierungsbild-Generierungsmittel 11 in 1. Die Dekodierungsbild-Generierungseinheit 31 führt die Summierung des Vorhersagebildes und des reproduzierten Vorhersagefehlersignals durch, um ein vollständig dekodiertes Bild zu erhalten. Es wird vermerkt, dass alle Signale, die in diese Summierung einbezogen sind, eine vereinheitlichte Auflösung haben, d.h. das CIF. Das dekodierte Bild wird in den Rahmenspeicher 22 für einen zukünftigen Abruf gesichert.

4 stellt den obigen Herauftastprozess dar, der durch die Herauftasteinheit 30a durchgeführt wird. Bezug nehmend auf 4 repräsentieren schwarze Punkte QCIF-Pixel, und alphabetische Zeichen in Großbuchstaben sind ihnen beigefügt, um ihre jeweiligen Vorhersagefehlersignalgrade anzuzeigen. Auch repräsentieren weiße Punkte CIF-Pixel, und Kleinbuchstaben zeigen ihre jeweiligen Vorhersagefehlersignalgrade an. Es gibt einen Blockgrenze 36, wie durch eine gestrichelte Linie dargestellt, in der das angewendete Kodierungsschema von Intrarahmen zu Interrahmen oder umgekehrt umgeschaltet wird.

Mit Bezug auf die Vorhersagefehlersignalwerte von inneren CIF-Pixeln, die der Blockgrenze 36 nicht unmittelbar benachbart sind, kalkuliert die Herauftasteinheit 30a einen gewichteten Mittelwert der Werte von vier QCIF-Pixeln, die jedes CIF-Pixel umgeben. Z.B. wird ein CIF-Pixelwert f durch Kalkulieren von f = (9A + 3B + 3C + D)/16(4) erhalten, wobei die vier QCIF-Werte mit geeigneten Gewichtungsfaktoren aufsummiert werden, die durch ihre jeweiligen Abstände von dem CIF-Pixel in Bearbeitung bestimmt sind. Es wird vermerkt, dass dieser Algorithmus der gleiche wie der konventionelle Herauftastalgorithmus ist, der in 16 erläutert wird.

Im Gegensatz zu dem obigen werden die Vorhersagefehlersignalwerte in den Pixeln, die sich unmittelbar benachbart zu der Blockgrenze 36 befinden, durch die Herauftasteinheit 30a kalkuliert, wobei nur zwei benachbarte QCIF-Pixel betrachtet werden, oder ohne Verweis auf die Pixel über die Blockgrenze 36 hinaus, die Gegenstand für das andersartige Kodierungsschema sind. Z.B. wird der Signalwert b als b = (3A + B)/4(5) erhalten. Ein anderer Pixelwert, sagen wir i, wird durch Kalkulieren eines gewichteten Mittelwertes i = (A + 3C)/4(6) erhalten, wobei ähnlich nur auf zwei QCIF-Pixel verwiesen wird. Bezüglich noch eines anderen Pixels, das in einer Ecke der Blockgrenze 36 benannt als a ist, wird sein Wert mit Bezug auf ein einzelnes QCIF-Pixel als a = A(7) kalkuliert.

Dank des oben beschriebenen Herauftastalgorithmus verhindert die vorliegende Erfindung den Unterschied in Kodierungsschemata durch Beeinflussung des reproduzierten Vorhersagefehlersignals im Gegensatz zu dem konventionellen Herauftastprozess, wo die Blöcke mit unterschiedlichen Kodierungsschemata einiges unerwünschtes Rauschen in dem reproduzierten Vorhersagefehlersignal verursachen können, wie in dem Signalprofil (d) von 17 veranschaulicht wird. Als ein Ergebnis wird das reproduzierte Vorhersagefehlersignal, das in dem Ausgang der Herauftasteinheit 30a erscheint, ein nahezu ursprüngliches Signalprofil aufweisen, wie in dem Signalprofil (c) gezeigt wird.

Deshalb kann die vorliegende Erfindung die ursprünglichen Bilder ohne Einführung von Rauschen reproduzieren, selbst wenn einige gemischte Kodierungsschemata zum Komprimieren eines Rahmens verwendet werden, oder selbst wenn ein beträchtlicher Unterschied in Pixelwerten in einer gewissen Blockgrenze existiert.

In der oben beschriebenen ersten Ausführungsform untersucht die vorgeschlagene Herauftasteinheit 30a, ob der Block von Interesse einem beliebigen anderen Block benachbart ist oder nicht, der Gegenstand für das andersartige Kodierungsschema ist, und falls ein derartiger benachbarter Block gefunden wird, wird sie die Pixel unter Verwendung des in 4 erläuterten Algorithmus herauf tasten. Als ein wechselnder Algorithmus ist es jedoch möglich, einfach jeden Block durch Verwenden der Werte seiner inneren Pixel heraufzutasten, ungeachtet dessen, ob der Block der Grenze zwischen unterschiedlichen Kodierungsschemata benachbart ist oder nicht. Während ein kleiner Fehler dadurch vorhanden ist, dass die Schärfe von Quellenbildern in den dekodierten Bildern etwas verloren gehen kann, wird dieses alternative Verfahren wegen seines Vorteils in der Einfachheit der Herauftasteinheit 30a die Hardwarekosten reduzieren und das Leistungsverhalten verbessern.

Als Nächstes wird eine zweite Ausführungsform der vorliegenden Erfindung, die sich auch auf eine Videokodierungsvorrichtung bezieht, nachstehend beschrieben.

5 ist ein Blockdiagramm, das den Aufbau der zweiten Ausführungsform der vorliegenden Erfindung zeigt. Da die zweite Ausführungsform im wesentlichen den gleichen Aufbau wie den der ersten Ausführungsform hat, wird sich die folgende Beschreibung auf die unterschiedlichen Punkte konzentrieren, während gleichen Elementen gleiche Bezugszeichen beigefügt sind.

Im Vergleich zu der ersten Ausführungsform ist die zweite Ausführungsform dadurch unterscheidbar, dass ein 8 × 8 DCT-Prozessor 38, ein 16 × 16 DCT-Prozessor 39, eine Extraktionseinheit 40 und ein Selektor 41 an Stelle der Herabtasteinheit 26a, des Herabtastschalters 26b und des DCT-Prozessors 27a der ersten Ausführungsform eingeführt sind. Die zweite Ausführungsform verwendet effektiv die Ähnlichkeit zwischen einer 16 × 16 Orthogonaltransformation und einer 8 × 8 Orthogonaltransformation in ihren Grundlagen. Genauer wendet der 16 × 16 DCT-Prozessor 39 eine 16 × 16 Orthogonaltransformation auf das Vorhersagefehlersignal mit dem CIF-Format an, und die Extraktionseinheit 40 extrahiert die Niederfrequenzkomponenten aus den erhaltenen Transformationskoeffizienten. Die Komponenten, die derart extrahiert werden, werden eine gute Schätzung der Transformationskoeffizienten sein, die durch eine 8 × 8 Orthogonaltransformation von unterabgetasteten QCIF-Bildern erhalten würden. Andererseits wendet der 8 × 8 DCT-Prozessor 38, der parallel mit dem 16 × 16 DCT-Prozessor 39 und der Extraktionseinheit 40 angeordnet ist, eine 8 × 8 Orthogonaltransformation auf das gleiche Vorhersagefehlersignal an.

Entsprechend wählt der Selektor 41 eine Menge von Transformationskoeffizienten aus, abhängig von der Bildauflösung, die von der Auflösungsauswahlsteuervorrichtung 21 empfangen wird. Für die Blöcke, wo die CIF-Auflösung spezifiziert ist, wählt der Selektor 41 die Ausgabe des 8 × 8 DCT-Prozessors 38, und für die Blöcke, wo die QCIF-Auflösung spezifiziert ist, wählt er wiederum die Ausgabe der Extraktionseinheit 40. Der Quantisierer 27b empfängt dann die Menge von Transformationskoeffizienten, die ausgewählt wurde.

Neben einer Bereitstellung der gleichen Funktionen wie in der ersten Ausführungsform wird die zweite Ausführungsform den Umfang von Berechnungslasten im Vergleich zu der ersten Ausführungsform stark reduzieren.

Als Nächstes wird nachstehend eine dritte Ausführungsform der vorliegenden Erfindung in Bezug auf eine Videokodierungsvorrichtung beschrieben.

6 ist ein Blockdiagramm, das einen spezifischen Aufbau der dritten Ausführungsform der vorliegenden Erfindung zeigt. Da die dritte Ausführungsform im wesentlichen den gleichen Aufbau wie den der ersten Ausführungsform hat, wird sich die folgende Beschreibung auf ihre unterschiedlichen Punkte konzentrieren, während gleichen Elementen gleiche Bezugszeichen beigefügt sind.

Die dritte Ausführungsform ist von der ersten Ausführungsform dadurch unterscheidbar, dass ein 8 × 8 IDCT-Prozessor 42, eine Zuweisungseinheit 43, ein 16 × 16 IDCT-Prozessor 44 und ein Selektor 45 an Stelle der Herauftasteinheit 30a, des Herauftastschalters 30b und eines IDCT-Prozessors 29b der ersten Ausführungsform eingeführt sind. Wie in der zweiten Ausführungsform verwendet die dritte Ausführungsform die Ähnlichkeit zwischen einer 16 × 16 Orthogonaltransformation und einer 8 × 8 Orthogonaltransformation im Sinne der Transformationsbasis. Genauer betrachtet die Koeffizientenzuweisungseinheit 43 die dequantisierten 8 × 8 Transformationskoeffizienten, die von dem Dequantisierer 29a als 8 × 8 Niederfrequenzkomponenten gesendet werden, als Teil eines 16 × 16 Transformationskoeffizientenblocks. Die Koeffizientenzuweisungseinheit 43 weist ferner Nullen den verbleibenden Transformationskoeffizienten zu. Der derart gebildete 16 × 16 Transformationskoeffizientenblock wird dann durch den IDCT-Prozessor 44 einer Umkehrtransformation unterzogen. Das Vorhersagefehlersignal, das durch diesen Prozess reproduziert wird, ist nahezu das gleiche wie das, das aus Transformationskoeffizienten eines CIF-Bildes reproduziert wird. Andererseits wendet der 8 × 8 IDCT-Prozessor 42, der parallel zu der Koeffizientenzuweisungseinheit 43 und dem 16 × 16 IDCT-Prozessor 44 angeordnet ist, eine 8 × 8 Umkehrorthogonaltransformation auf die gleichen dequantisierten 8 × 8 Transformationskoeffizienten an.

Der Selektor 45 wählt eines der Ausgangssignale der zwei IDCT-Prozessoren 42 und 44 aus, abhängig von der Bildauflösung, die von der Auflösungsauswahlsteuervorrichtung 21 empfangen werden. Für die Blöcke, wo die CIF-Auflösung spezifiziert ist, wählt der Selektor 45 die Ausgabe des 8 × 8 DCT-Prozessors 42, und für die Blöcke, wo die QCIF-Auflösung spezifiziert ist, wählt er die Ausgabe des 16 × 16 IDCT-Prozessors 44 aus. Das derart ausgewählte reproduzierte Vorhersagefehlersignal wird dann der Dekodierungsbild-Generierungseinheit 31 bereitgestellt.

Neben dem Angebot der gleichen Funktionen wie in der ersten Ausführungsform wird die dritte Ausführungsform der vorliegenden Erfindung den Umfang von notwendigen Berechnungslasten im Vergleich zu der ersten Ausführungsform stark reduzieren.

Als Nächstes wird nachstehend eine vierte Ausführungsform der vorliegenden Erfindung beschrieben. Anders als die vorherigen drei Ausführungsformen bezieht sich diese vierte Ausführungsform auf eine Videodekodierungsvorrichtung.

7 ist ein Blockdiagramm, das den Aufbau der vierten Ausführungsform zeigt, die nicht zu der vorliegenden Erfindung gehört. Da die vierte Ausführungsform einige Elemente einsetzt, die mit der ersten Ausführungsform gemeinsam sind, wird die folgende Beschreibung die Erläuterung für derartige Elemente nicht wiederholen, während gleichen Elementen gleiche Bezugszeichen beigefügt sind.

Bezug nehmend auf 7 reproduziert ein Entropiedekoder 47 Daten, wie etwa quantisierte Koeffizienten, Bildauflösung, Quantisiererschrittgröße, Kodierungsschema und Bewegungsvektoren, aus den kodierten Rahmendaten heraus, die von einem sendenden Ende empfangen werden. Der Entropiedekoder 47 verteilt jene reproduzierten Daten zu anderen Funktionsblöcken in der Vorrichtung. Genauer werden die quantisierten Koeffizienten und die Quantisiererschrittgröße zu dem Dequantisierer 29a gesendet; die Bildauflösung wird an den Herauftastschalter 30b und den Tiefpassfilterschalter 32b abgegeben; das Kodierungsschema wird dem Vorhersagebildschalter 24b und der Herauftasteinheit 30a zugeführt; die Bewegungsvektoren werden dem Vorhersagebildgenerator 24a und dem Tiefpassfilterschalter 32b bereitgestellt. Operationen jener Funktionsblöcke innerhalb des Bereichs, der durch die wechselnden langen und kurzen Striche angezeigt ist, werden hier nicht beschrieben, da sie auf die gleiche Weise arbeiten, wie in der ersten Ausführungsform beschrieben wird.

Die Ausgabe dieser Videodekodierungsvorrichtung wird von der Dekodierungsbild-Generierungseinheit 31 abgezweigt. Das heißt die dekodierten Bilder, die durch die Dekodierungsbild-Generierungseinheit 31 vollständig rekonstruiert werden, werden zu einem externen Videomonitor oder ähnlichen Einrichtungen ausgegeben, während sie in dem Rahmenspeicher 22 als die Bezugsrahmen für vorhersagende Kodierung gesichert werden.

Auf die oben beschriebene Weise empfängt und dekodiert die Videodekodierungsvorrichtung der vierten Ausführungsform das kodierte Videosignal, das durch eine Videokodierungsvorrichtung erzeugt wird. Dieser Dekodierungsprozess setzt die Herauftasteinheit 30a ein. Wie in der ersten Ausführungsform der vorliegenden Erfindung erlaubt die Herauftasteinheit 30a, dass die Bilder ohne Rauschen oder Artefakte reproduziert werden, selbst wenn einige unterschiedliche Kodierungsschemata zum Komprimieren eines Rahmens verwendet werden, oder selbst wenn mit anderen Worten die Pixelwerte eine große Differenz in einer gewissen Blockgrenze aufweisen.

Als Nächstes wird nachstehend eine fünfte Ausführungsform der vorliegenden Erfindung beschrieben. Diese fünfte Ausführungsform bezieht sich auf eine Videokodierungsvorrichtung.

2 zeigt das Konzept der fünften Ausführungsform. Wegen ihrer Ähnlichkeit zu der ersten Ausführungsform, die in 1 dargestellt wird, sind in 2 gleichen Elementen gleiche Bezugszeichen beigefügt.

Die fünfte Ausführungsform ist von der ersten Ausführungsform dadurch unterscheidbar, dass ein zweites Auflösungskonvertierungsmittel 15 verschieden von dem zweiten Auflösungsmittel funktioniert, das in der ersten Ausführungsform angeführt wird, und auch dadurch, dass die Videokodierungsvorrichtung ferner ein Vorhersagebild-Modifikationsmittel 13 umfasst, das zwischen dem Vorhersagebild-Generierungsmittel 4 und dem Dekodierungsbild-Generierungsmittel 11 angeordnet ist. Ferner umfasst die fünfte Ausführungsform ein Vorhersagebild-Modifikationssteuermittel 14, das mit dem Vorhersagebild-Modifikationsmittel 13 verknüpft ist.

In dem Fall, dass das erste Auflösungskonvertierungsmittel 6 das ursprüngliche Vorhersagefehlersignal herab getastet hat, um seine Bildauflösung zu reduzieren, wird das Vorhersagefehlersignal, das durch das Dequantisierungs-/Umkehrorthogonaltransformationsmittel 9 reproduziert wird, die gleiche reduzierte Bildauflösung haben. In diesem Fall versucht das zweite Auflösungskonvertierungsmittel 12, die ursprüngliche Auflösung durch Durchführen eines Herauftastprozesses wiederherzustellen. In der fünften Ausführungsform kann dieser Herauftastprozess auf die Pixel verweisen, die zu den Blöcken über eine Blockgrenze hinaus gehören, ungeachtet der Größe jener Pixelwerte, wie in den konventionellen Herauftastalgorithmen.

Wenn das erste Auflösungskonvertierungsmittel 6 das ursprüngliche Vorhersagefehlersignal herab getastet hat, um die Bildauflösung zu reduzieren, bestimmt das Vorhersagebild-Modifikationssteuermittel 14, ob die Werte von Pixeln, die sich nahe einer bestimmten Blockgrenze befinden, zu modifizieren sind oder nicht. In dem Fall, dass das erste Auflösungskonvertierungsmittel 6 das ursprüngliche Vorhersagefehlersignal herab getastet hat, um die Bildauflösung zu reduzieren, und falls das Vorhersagebild-Modifikationssteuermittel 14 bestimmt hat, die Pixelwerte in der bestimmten Blockgrenze zu modifizieren, wird das Vorhersagebild-Modifikationsmittel 13 die Werte der Pixel, die sich entlang der bestimmten Blockgrenze befinden, mit Bezug auf andere Pixel über diese Grenze hinaus modifizieren.

Genauer untersucht das Vorhersagebild-Modifikationssteuermittel 14 das Vorhersagebild, das durch das Vorhersagebild-Generierungsmittel 4 erzeugt wird, um die Differenz von Block zu Block im Sinne von Pixelwerten zu evaluieren. Falls irgendeine kritische Differenz, die einen gewissen Schwellenpegel überschreitet, in beliebigen bestimmten Blöcken beobachtet wird, betrachtet das Vorhersagebild-Modifikationssteuermittel 14 die Grenze zwischen derartigen Blöcken als die zuvor erwähnte bestimmte Blockgrenze. Hierin wird diese bestimmte Blockgrenze als eine kritische Blockgrenze bezeichnet, wo eine Modifikation von Pixelwerten erforderlich ist. In der Realität kann jedoch die kritische Blockgrenze nicht durch einen bitweisen Vergleich von Pixeln direkt identifiziert werden, sondern wird durch Beobachtung von Blöcken basierend auf einem der folgenden zwei Kriterien geschätzt.

Das erste Kriterium ist die Differenz in Kodierungsschemata, die auf benachbarte Blöcke angewendet werden. Das Vorhersagebild-Modifikationssteuermittel 14 untersucht die Kodierungsschemata, die durch das Vorhersageparameter-Kalkulationsmittel 3 tatsächlich für jeden Block zugewiesen sind. Falls ein Block von Interesse beliebigen anderen Blöcken benachbart ist, die Gegenstand für ein anderes Kodierungsschema sind, erkennt das Vorhersagebild-Modifikationssteuermittel 14 die Grenze von den zwei benachbarten Blöcken als eine kritische Grenze.

Das zweite Kriterium ist der Unterschied in Bewegungsvektoren. Hier werden die Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel 3 erzeugt werden, auf einer Basis Block für Block evaluiert. Genauer vergleicht das Vorhersagebild-Modifikationssteuermittel 14 den Bewegungsvektor eines Blocks von Interesse mit dem eines beliebigen benachbarten Blocks. Falls die beobachtete Differenz in einer Vektorgröße größer als eine vorbestimmte Schwelle ist, erkennt das Vorhersagebild-Modifikationssteuermittel 14 diese Blockgrenze als eine kritische Grenze.

Kurz gesagt impliziert eine beliebige Differenz von Block zu Block in angewendeten Kodierungsschemata das Vorhandensein beliebiger kritischer Differenzen in Pixelwerten. Alternativ werden diskontinuierliche Variationen, die in der Bewegungsvektordomäne beobachtet werden, die gleiche logische Schlussfolgerung vorsehen. Das Vorhersagebild-Modifikationssteuermittel 14 erfasst derartige kritische Differenzen und bestimmt, die Pixelwerte entlang der kritischen Blockgrenze zu modifizieren. Dann weist das Vorhersagebild-Modifikationssteuermittel 14 das Vorhersagebild-Modifikationsmittel 13 an, eine Glättungsoperation durchzuführen, um die Diskontinuität in den Pixelwerten zu beseitigen.

Siehe z.B. 11, die einige spezifische Profile von Pixelwerten in einigen Punkten in einer Videokodierungsvorrichtung gemäß der vorliegenden Erfindung zeigt. In 11 enthält ein Quellenbild (a) beide Arten von Blöcken, einer Gegenstand für Intrarahmenkodierung und der andere Gegenstand für Interrahmenkodierung. Die Grenze jener unterschiedlichen Arten von Blöcken wird durch eine vertikale gestrichelte Linie angezeigt. Da der Intrarahmenkodierungsblock auf der linken Seite keinen Bezugsrahmen für Rahmenvorhersage hat, werden ihre Pixelwerte in dem Vorhersagebild (b) einfach auf Nullen gesetzt. Entsprechend wird das resultierende Vorhersagefehlersignal (c) große Werte in dem Intrarahmenkodierungsblock aufweisen, während sich kleine Werte für den Interrahmenkodierungsblock zeigen.

In einer derartigen Situation, wo zwei benachbarte Blöcke mit unterschiedlichen Schemata kodiert sind (d.h. Intrarahmen und Interrahmen), wird der Herauftastprozess, der durch das zweite Auflösungskonvertierungsmittel 12 ausgeführt wird, eine Mischung von unterschiedlich kodierten Pixelwerten in der Nähe der Blockgrenze verursachen, was eine gewisse Verzerrung in dem reproduzierten Vorhersagefehlersignal (d) einführt, wie es der Fall in dem zuvor angeführten konventionellen Herauftastprozess ist.

Andererseits wendet gemäß der vorliegenden Erfindung das Vorhersagebild-Modifikationsmittel 13 eine Glättungsoperation auf die Pixel an, die sich entlang der kritischen Blockgrenze in dem Vorhersagebild (b) befinden, wobei dadurch ein geglättetes Vorhersagebild (e) geliefert wird. Durch Hinzufügen des reproduzierten Vorhersagefehlersignals (d) zu dem geglätteten Vorhersagebild (e) erbringt das Dekodierungsbild-Generierungsmittel 11 schließlich das dekodierte Bild (f), das dem ursprünglichen Quellenbild (a) ziemlich ähnlich ist. D.h. die Videokodierungsvorrichtung der fünften Ausführungsform verhindert, dass beliebiges Rauschen in der Nähe von Blockgrenzen in dem dekodierten Bild eingeführt wird, anders als die konventionelle Videokodierungsvorrichtung, die an dieser Art von Rauschen leidet.

Die oben beschriebene Bildglättung wird nicht ausgeführt, wenn das erste Auflösungskonvertierungsmittel 6 den Herabtastprozess auf das ursprüngliche Vorhersagefehlersignal nicht angewendet hat. In diesem Fall leitet das Vorhersagebild-Modifikationsmittel 13 das Vorhersagebild wie es ist zu dem Dekodierungsbild-Generierungsmittel 11 weiter.

Die obige Erörterung, die das Vorhandensein derartiger Blöcke angenommen hat, die mit zwei unterschiedlichen Kodierungsschemata verarbeitet wurden, ist auch auf den Fall anwendbar, dass es einen beträchtlichen Unterschied zwischen zwei benachbarten Blöcken im Sinne einer Größe von Bewegungsvektoren gibt.

Auf die oben beschriebene Weise erlaubt die fünfte Ausführungsform, dass die Bilder ohne unerwünschtes Rauschen reproduziert werden, selbst wenn einige Pixelwerte irgendeine Diskontinuität in einer gewissen Blockgrenze aufweisen.

8 ist ein Blockdiagramm, das einen detaillierten Aufbau der fünften Ausführungsform der vorliegenden Erfindung zeigt. Da die fünfte Ausführungsform im wesentlichen den gleichen Aufbau wie den der ersten Ausführungsform hat, die in 3 dargestellt wird, wird sich die folgende Beschreibung auf ihre unterschiedlichen Punkte konzentrieren, während gleichen Elementen gleiche Bezugszeichen beigefügt sind.

Diese fünfte Ausführungsform ist von der ersten Ausführungsform dadurch unterscheidbar, dass eine Herauftasteinheit 49 anders als die Herauftasteinheit 30a der ersten Ausführungsform arbeitet, und auch dadurch, dass ein Grenznachbarschaftsfilter 50 zwischen den Tiefpassfilterschalter 32b und die Dekodierungsbild-Generierungseinheit 31 der ersten Ausführungsform neu eingefügt ist. Ferner ist die fünfte Ausführungsform dadurch unterscheidbar, dass sie eine Filteroperationssteuervorrichtung 53 umfasst, die mit dem Grenznachbarschaftsfilter 50 gekoppelt ist. Anders als die Herauftasteinheit 30a in der ersten Ausführungsform untersucht die Herauftasteinheit 49 nicht, ob jeder Block beliebigen anderen Blöcken benachbart ist oder nicht, die Gegenstand eines anderen Kodierungsschemas sind. Vielmehr führt sie den konventionellen Herauftastprozess durch, wie in 16 veranschaulicht, wobei auf beliebige relevante Pixel nicht nur innerhalb des Blocks, sondern auch über die Blockgrenze hinaus verwiesen wird.

9 zeigt einen Herauftastprozess, der durch die Herauftasteinheit 49 durchgeführt wird. In 9 repräsentieren schwarze Punkte und Großbuchstaben QCIF-Pixel und ihre jeweiligen Vorhersagefehlersignalwerte, während weiße Punkte und Kleinbuchstaben CIF-Pixel und ihre jeweiligen Vorhersagefehlersignalwerte repräsentieren. Eine gestrichelte Linie 51 zeigt eine Blockgrenze an, wo sich das Kodierungsschema von Interrahmenkodierung zu Intrarahmenkodierung oder umgekehrt ändert. Um die Vorhersagefehlersignalwerte a, b, c usw. der CIF-Pixel benachbart zu der Blockgrenze 51 zu erhalten, kalkuliert die Herauftasteinheit 49 einen gewichteten Mittelwert der Werte von vier QCIF-Pixeln, die jedes CIF-Pixel umgeben, wobei ihre jeweiligen Abstände von dem CIF-Pixel von Interesse betrachtet werden. Z.B. wird der Signalwert a als a = (9A +3B + 3C + D) /16(8) erhalten.

Als solche verweist die Herauftasteinheit 49 nicht nur auf die QCIF-Pixel A und B, sondern auch auf die Pixel C und D, die Gegenstand für das andere Kodierungsschema sind.

Bezug nehmend zurück auf 8 empfängt die Filteroperationssteuervorrichtung 53 die Bildauflösung von der Auflösungsauswahlsteuervorrichtung 21 und das Kodierungsschema für jeden Block von dem Vorhersageparameterkalkulator 23. Wenn die Ausgabe der Herabtasteinheit 26a durch den Herabtastschalter 26b ausgewählt wird (d.h. wenn das Vorhersagefehlersignal herab getastet wird, um die QCIF-Auflösung zu haben), untersucht die Filteroperationssteuervorrichtung 53, ob der Block von Interesse beliebigen anderen Blöcken benachbart ist oder nicht, die Gegenstand für ein anderes Kodierungsschema sind. Falls ein derartiger benachbarter Block gefunden wird, wird die Filteroperationssteuervorrichtung 53 ein Operationsbefehlssignal senden, um das Grenznachbarschaftsfilter 50 zu aktivieren.

Das Grenznachbarschaftsfilter 50 wird über das Kodierungsschema für jeden Rahmen informiert gehalten, das durch den Vorhersageparameterkalkulator 23 bestimmt wird. Bei Empfang des Operationsbefehlssignals von der Filteroperationssteuervorrichtung 53 führt das Grenznachbarschaftsfilter 50 eine Glättungsoperation aus, um die Diskontinuität in den Pixelwerten nahe der Blockgrenze zu eliminieren. Dieses geglättete Vorhersagefehlersignal wird dann der Dekodierungsbild-Generierungseinheit 31 zugeführt.

10 erläutert einen Prozess, der durch das Grenznachbarschaftsfilter 50 ausgeführt wird. Es wird angenommen, dass ein Vorhersagebild, das zwei unterschiedliche Kodierungsschemata einbezieht, dem Grenznachbarschaftsfilter 50 über den Tiefpassfilterschalter 32b zugeführt wird. Weiße Punkte in 10 repräsentieren einige Pixel als Teil des Vorhersagebildes, und Kleinbuchstaben, die ihnen beigefügt sind, zeigen ihre jeweiligen Pixelwerte an. Eine Blockgrenze 52 ist eine Grenze, in der das Kodierungsschema von Interrahmenkodierung zu Intrarahmenkodierung oder umgekehrt umgeschaltet wird. Genauer ist der untere rechte Block unter der Blockgrenze 52 intrarahmen-kodiert, während die anderen Blöcke interrahmen-kodiert sind. In diesem Vorhersagebild sind alle Pixelwerte o, p, q, r, u, v, w und x des intrarahmen-kodierten Blocks natürlich auf Null gesetzt. In einer derartigen Situation wendet das Grenznachbarschaftsfilter 50 einen Glättungsoperator auf die Pixel an, die der Blockgrenze 52 benachbart sind, sodass ihre Werte h, i, j, k, l, n, o, p, q, r, t, und u kontinuierlich sein werden. Genauer kalkuliert das Grenznachbarschaftsfilter 50 einen neuen Pixelwert für jedes Pixel, das zu dem interrahmen-kodierten Block gehört. Es wird z.B. der Pixelwert j genommen. Der neue Wert j* für dieses Pixel wird als j* =(9c + 9d + 9i + 9j + 3e + 3f + 3k + 3l)/64(9) kalkuliert. Für einen anderen Pixelwert q wird sein neuer Pixelwert q* als q* = (c + d + i + j + 3e + 3f + 3k + 3l)/69(10) ausgedrückt.

Wenn die Pixel in dem interrahmen-kodierten Block große Werte haben, wird das Vorhersagebild eine große Variation oder Diskontinuität in seinen Pixelwertprofilen aufweisen, wegen den Nullen, die dem intrarahmen-kodierten Block zugewiesen sind. Das Grenznachbarschaftsfilter 50 glättet eine derartige Variation und beseitigt die Diskontinuität von Pixelwerten, wie ferner nachstehend mit Bezug auf 11 beschrieben wird.

11 ist ein Diagramm, um einen Prozess zum vorhersagenden Kodieren und Dekodieren eines Quellenbild zu erläutern. 11 besteht aus sechs Grafiken (a) bis (f), die die verschiedenen Profile von Pixelwerten in der Nachbarschaft einer gewissen Blockgrenze darstellen, die entlang der Zeitachse eines Kodierungsprozesses angeordnet sind.

Ein Quellenbild (a) enthält die folgenden zwei Arten von Blöcken: einen Block, der Gegenstand für Intrarahmenkodierung ist (links), und einen anderen Block, der Gegenstand für Interrahmenkodierung ist (rechts). Hier wird die Grenze von jenen unterschiedlichen Arten von Blöcken als eine vertikale gestrichelte Linie angezeigt. Mit Bezug auf den intrarahmen-kodierten Block sind seine Pixelwerte in einem Vorhersagebild (b) Nullen. Deshalb weist das resultierende Vorhersagefehlersignal (a)-(b) oder (c) große Werte in dem intrarahmen-kodierten Block und kleine Werte in dem interrahmen-kodierten Block auf.

In einer derartigen Situation, wo zwei benachbarte Blöcke mit unterschiedlichen Schemata kodiert sind (d.h. Intrarahmen und Interrahmen), wird der Herauftastprozess, der durch die Herauftasteinheit 49 der vorliegenden Erfindung ausgeführt wird, eine Mischung von unterschiedlich kodierten Pixelwerten in der Nachbarschaft der Blockgrenze einführen, wie in dem zuvor erwähnten konventionellen Herauftastprozess. Als ein Ergebnis wird das Profil des reproduzierten Vorhersagefehlersignals verzerrt sein, wie in (d) veranschaulicht wird.

In der vorliegenden Erfindung wendet jedoch das Grenznachbarschaftsfilter 50 eine Glättungsoperation auf die Pixel entlang der Blockgrenze in dem ursprünglichen Vorhersagebild (b) an, und entsprechend kann ein geglättetes Vorhersagebild (e) erhalten werden. Das Dekodierungsbild-Generierungsmittel 11 erbringt somit ein vollständig dekodiertes Bild (f) durch Hinzufügen des reproduzierten Vorhersagefehlersignals (d) zu dem geglätteten Vorhersagebild (e). Das heißt die Video kodierungsvorrichtung der fünften Ausführungsform verhindert, dass das Rauschen in der Nachbarschaft einer Blockgrenze in dem dekodierten Bild (f) eingeführt wird, anders als die konventionelle Videokodierungsvorrichtung, die an dieser Art von Rauschen leidet.

Die oben beschriebene fünfte Ausführungsform ist so konfiguriert, dass die Filteroperationssteuervorrichtung 53 das Kodierungsschema von jedem Block von dem Vorhersageparameterkalkulator 23 zusätzlich zu der Bildauflösung von der Auflösungsauswahlsteuervorrichtung 21 empfangen wird. Als eine alternative Anordnung kann sie so konfiguriert sein, dass sie die Bewegungsvektoren an Stelle des Kodierungsschemas von dem gleichen Vorhersageparameterkalkulator 23 empfangen wird. In diesem Fall vergleicht die Filteroperationssteuervorrichtung 53 den Bewegungsvektor eines Blocks von Interesse mit jenen von beliebigen benachbarten Blöcken im Sinne einer Größe von Vektoren, nachdem erfasst wurde, dass das Vorhersagefehlersignal auf die QCIF-Auflösung herab getastet wurde. Falls irgendein Unterschied beobachtet wird, der größer als eine vorbestimmte Schwelle ist, wird die Filteroperationssteuervorrichtung 53 ein Operationsbefehlssignal zu dem Grenznachbarschaftsfilter 50 senden.

Bei Empfang des Operationsbefehlssignals von der Filteroperationssteuervorrichtung 53 führt das Grenznachbarschaftsfilter 50 eine Glättungsoperation aus, um die Diskontinuität in den Pixelwerten entlang der Blockgrenze zu beseitigen. Der hier verwendete Glättungsalgorithmus kann jedoch nicht der gleiche wie der sein, der zuvor beschrieben wird. Dies ist so, da die obige Blockgrenze nicht immer eine Grenze von unterschiedlichen Kodierungsschemata bedeutet. D.h. da die Blöcke auf einer Seite der Grenze nicht immer intrarahmen-kodiert sind, können die Pixel in jenen Blöcken von Null verschiedene Werte haben. Ein vorgeschlagener Glättungsalgorithmus wird nun nachstehend mit Bezug auf 12 beschrieben.

12 ist ein Diagramm, um einen Glättungsprozess zu erläutern, der durch das Grenznachbarschaftsfilter 50 durchgeführt wird, wenn ein Operationsbefehlssignal dorthin gesendet wird. Es wird angenommen, dass der Tiefpassfilterschalter 32b das Grenznachbarschaftsfilter 50 mit einem Vorhersagebild versorgt hat, das einige benachbarte Bewegungsvektoren einbezieht, die eine große Differenz in der Größe aufweisen, die eine vorbestimmte Schwelle überschreitet. Genauer repräsentieren weiße Punkte in 12 als Teil des Vorhersagebildes, und Kleinbuchstaben, die ihnen beigefügt sind, zeigen ihre jeweiligen Pixelwerte an. Die Bewegungsvektoren auf einer Seite einer Blockgrenze 55 sind nicht gleich jenen auf der anderen Seite im Sinne von Vektorgrößen, sondern vielmehr ist die Differenz größer als eine vorbestimmte Schwelle.

In einer derartigen Situation wird das Grenznachbarschaftsfilter 50 zuerst mittlere Pixelwerte A, B, C und D kalkulieren. Wie als schwarze Punkte in 12 dargestellt, werden jene Mittelwerte den Werten von imaginären Pixeln entsprechen, die sich zwischen einer ersten Serie von Pixeln [h, i, j, k, l, n, t], die der Blockgrenze 55 unmittelbar benachbart sind, und einer zweiten Serie von Pixeln [a, b, c, d, e, f, g, m, s], die als Nächstes zu der ersten Serie von Pixeln ausgerichtet sind, befinden. Gleichermaßen kalkuliert das Grenznachbarschaftsfilter 50 ferner mittlere Pixelwerte E und F, die den Werten von imaginären Pixeln aus schwarzen Punkten zwischen einer dritten Serie von Pixeln [o, p, q, r, u], die der Blockgrenze 55 unmittelbar benachbart sind, und einer vierten Serie von Pixeln [v, w, x], die als Nächstes zu der dritten Serie von Pixeln ausgerichtet sind, entsprechen. Z.B. werden die mittleren Pixelwerte A und B als A = (a + b + g + h)/4(11) B = (c + d + i + j)/4(12) kalkuliert.

Danach kalkuliert das Grenznachbarschaftsfilter 50 die Werte der ersten Serie und der dritten Serie von Pixeln, wobei auf die mittleren Pixelwerte A, B, C, D, E, und F verwiesen wird. Z.B. werden neue Pixelwerte h*, j* und q* für die gegenwärtigen Pixelwerte h, j und q wie folgt erhalten: h* = (9A + 3B + 3D + E) /16(13) j* = (9B + 3C + 3E + F) /16(14) q* = (B + 3C + 3E + 9F) /16(15)

Auf diese Weise glättet das Grenznachbarschaftsfilter 50 die Variation in Pixelwerten herab, wenn sie in der Nachbarschaft einer Blockgrenze steil gewesen ist.

Die fünfte Ausführungsform kann die folgende modifizierte Anordnung erlauben. D.h. die Filteroperationssteuervorrichtung 53 wird beseitigt, und das Grenznachbarschaftsfilter 50 wird stattdessen über die Bildauflösung direkt von der Auflösungsauswahlsteuervorrichtung 21 informiert. Wenn das Vorhersagefehlersignal zu der QCIF-Auflösung herab getastet wurde, wird das Grenznachbarschaftsfilter 50 stets die oben beschriebene Glättungsoperation auf die Pixel in der Nachbarschaft jeder Blockgrenze anwenden, ungeachtet dessen, ob irgendeine kritische Differenz in Pixelwerten vorhanden ist oder nicht.

Diese alternative Konfiguration sieht einen Vorteil im Sinne von Einfachheit des Systems vor, wobei somit ermöglicht wird, die Verarbeitungszeit zu reduzieren. Genauer erfordert die Analyse einer Differenz von Block zu Block mit Bezug auf die Pixelwerte in einer Blockgrenze tatsächlich eine feste Zeitdauer, da die Filteroperationssteuervorrichtung 53 die Analyse nicht starten kann, bis die Information über Kodierungsschemata oder Bewegungsvektoren der relevanten Blöcke für eine Untersuchung bereit sein wird. Die obige Alternative wird eine derartige zeitraubende Analyse beseitigen und erlaubt somit, dass die Gesamtverarbeitungszeit reduziert wird.

Als Nächstes wird eine sechste Ausführungsform, die nicht zu der vorliegenden Erfindung gehört, auf dem Weg eines Beispiels beschrieben. Diese sechste Ausführungsform bezieht sich auf eine Videodekodierungsvorrichtung.

13 zeigt einen spezifischen Aufbau der sechsten Ausführungsform. Da die sechste Ausführungsform einige Elemente einsetzt, die mit der fünften Ausführungsform gemeinsam sind, wird die folgende Beschreibung die Erläuterung für derartige Elemente nicht wiederholen, während gleichen Elementen gleiche Bezugszeichen beigefügt sind.

Bezug nehmend auf 13 reproduziert ein Entropiedekoder 54 quantisierte Koeffizienten, Bildauflösung, Quantisiererschrittgröße, Kodierungsschema und Bewegungsvektoren wie ursprünglich erzeugt, durch Verarbeiten der kodierten Rahmendaten, die von einem sendenden Ende empfangen werden. Der Entropiedekoder 54 verteilt jene reproduzierten Signale zu anderen Funktionsblöcken in der Vorrichtung. Genauer werden die quantisierten Koeffizienten und die Quantisiererschrittgröße zu dem Dequantisierer 29a gesendet; die Bildauflösung wird zu dem Herauftastschalter 30b, dem Tiefpassfilterschalter 32b und der Filteroperationssteuervorrichtung 53 abgegeben; das Kodierungsschema wird dem Vorhersagebildschalter 24b, dem Grenznachbarschaftsfilter 50 und der Filteroperationssteuervorrichtung 53 zugeführt; die Bewegungsvektoren werden dem Vorhersagebildgenerator 24a und dem Tiefpassfilterschalter 32b bereitgestellt. Es wird vermerkt, dass es auch möglich ist, dieses System auf eine derartige Weise zu konfigurieren, dass die Filteroperationssteuervorrichtung 53 Bewegungsvektoren an Stelle der Kodierungsschemata empfangen wird. Operationen jener Funktionsblöcke innerhalb des Bereichs, der durch die wechselnden langen und kurzen Striche angezeigt wird, werden hier nicht beschrieben, da sie mit der zuvor beschriebenen fünften Ausführungsform gemeinsam sind.

Das Vorhersagefehlersignal, das durch den Entropiedekoder 54 reproduziert wird, kann in dem sendenden Ende ursprünglich zu der QCIF-Auflösung herab konvertiert sein. Auch kann das reproduzierte Vorhersagebild einige benachbarte Blöcke enthalten, die kritische Differenzen in Pixelwerten aufweisen. Bei Erfassung jener Ereignisse und Bedingungen erteilt die Filteroperationssteuervorrichtung 53 ein Operationsbefehlssignal zu dem Grenznachbarschaftsfilter 50. Derartige kritische Differenzen in Pixelwerten werden durch irgendeine Differenz von Block zu Block in angewendeten Kodierungsschemata, oder alternativ durch beträchtliche diskontinuierliche Variationen, die in der Bewegungsvektordomäne beobachtet werden, impliziert. Bei Empfang des Operationsbefehlssignals von der Filteroperationssteuervorrichtung 53 führt das Grenznachbarschaftsfilter 50 eine Glättungsoperation aus, um die Diskontinuität in Pixelwerten nahe der betroffenen Blockgrenze zu beseitigen.

Die Ausgabe dieser Videodekodierungsvorrichtung wird in der Dekodierungsbild-Generierungseinheit 31 erhalten. Die Videorahmensignale, die durch die Dekodierungsbild-Generierungseinheit 31 vollständig rekonstruiert werden, werden zu einem Videomonitor oder anderen ähnlichen Einrichtungen ausgegeben, während sie in dem Rahmenspeicher 22 als die Bezugsrahmen für vorhersagende Kodierung gesichert werden.

Auf die oben beschriebene Weise empfängt und dekodiert die Videodekodierungsvorrichtung der sechsten Ausführungsform das kodierte Videosignal, das durch eine Videokodierungsvorrichtung erzeugt wird. Der Dekodierungsprozess bezieht Funktionen des Grenznachbarschaftsfilters 50 und der Filteroperationssteuervorrichtung 53 ein, die in der fünften Ausführungsform der vorliegenden Erfindung eingeführt wurden. Jene zwei Elemente erlauben, dass die Bilder ohne Einführung von Rauschen reproduziert werden, selbst wenn die Pixelwerte irgendeine Diskontinuität in einer gewissen Blockgrenze aufweisen.

Die obige Erörterung wird wie folgt zusammengefasst. Gemäß der vorliegenden Erfindung führt das zweite Auflösungskonvertierungsmittel einen Herauftastprozess durch, um die ursprüngliche Auflösung wiederherzustellen. In diesem Prozess kalkuliert das zweite Auflösungskonvertierungsmittel den Wert von jedem Pixel in einem bestimmten Block, ohne Verweis auf Pixel, die zu einem beliebigen benachbarten Block gehören, der Gegenstand für ein anderes Kodierungsschema ist. Als eine wechselnde Anordnung wird der Herauftastprozess die Pixel in anderen Blöcken vollständig vernachlässigen, sondern nur auf den vorliegenden Block verweisen.

Dank derartiger Herauftastalgorithmen verhindert die vorliegende Erfindung, dass die Differenz in Kodierungsschemata das reproduzierte Vorhersagefehlersignal beeinträchtigt, im Gegensatz zu dem konventionellen Herauftastprozess, der einiges unerwünschtes Rauschen in dem reproduzierten Signal verursacht. Als ein Ergebnis wird das reproduzierte Vorhersagefehlersignal ein Signalprofil nahe zu dem ursprünglichen aufweisen. Deshalb kann die vorliegende Erfindung die ursprünglichen Bilder ohne Einführung von unerwünschtem Rauschen reproduzieren, selbst wenn einige gemischte Kodierungsschemata zum Komprimieren eines Rahmens verwendet werden, oder selbst wenn mit anderen Worten die Pixelwerte eine kritische Differenz in einer gewissen Blockgrenze aufweisen.

Ferner wird gemäß der vorliegenden Erfindung das Tiefpassfilter selektiv nur aktiviert, wenn eine Kodierung geringer Auflösung durchgeführt wird und das Vorhersagebild einige Blöcke schneller Bewegung enthält. Diese strukturelle Anordnung wird verhindern, dass die Schärfe von Bildern in weniger aktiven Blöcken (z.B. Hintergrundbilder) als Teil eines Bildes verdorben wird.

Des weiteren wendet die vorliegende Erfindung eine Glättungsoperation auf die Nachbarschaft einer kritischen Blockgrenze an, wo die Pixelwerte eine beträchtliche Variation, oder eine große Diskontinuität, wegen der gemischten Verwendung unterschiedlicher Kodierungsschemata in einigen benachbarten Blöcken oder intensiven Differenzen in der Größe von Bewegungsvektoren in einer Blockgrenze aufweisen. Die Glättungsoperation erlaubt, dass Bilder ohne Rauschen reproduziert werden, selbst wenn die Pixelwerte in einem Rahmen irgendeine Diskontinuität in einer gewissen Blockgrenze aufweisen.

Das Vorangehende wird betrachtet, nur die Prinzipien der vorliegenden Erfindung zu veranschaulichen. Da einem Fachmann zahlreiche Modifikationen und Änderungen leicht einfallen, ist es nicht erwünscht, die Erfindung auf den exakten Aufbau und Anwendungen zu begrenzen, die gezeigt und beschrieben werden, und entsprechend können alle geeigneten Modifikationen und Entsprechungen als in den Bereich der Erfindung in den angefügten Ansprüchen und ihren Entsprechungen zu fallen betrachtet werden.


Anspruch[de]
Videokodierungsvorrichtung zum Durchführen einer vorhersagenden Kodierung von digitalen Videoeingangssignalen, umfassend:

(a) Auflösungsbestimmungsmittel zum Auswählen einer Bildauflösung zum Kodieren eines gegebenen Videoeingangssignals;

(b) Kodierungsmittel zum Erzeugen eines kodierten Videosignals durch Durchführen einer vorhersagenden Kodierung des Videoeingangssignals auf einer Basis von Block zu Block gemäß der Bildauflösung, die durch das Auflösungsbestimmungsmittel ausgewählt ist; und

(c) Dekodierungsmittel zum Dekodieren des kodierten Videosignals, um ein dekodiertes Bild zur Verwendung in der vorhersagenden Kodierung zu erzeugen, während jeder Block geringer Auflösung zurück zu einer hohen Auflösung mit Bezug auf Vorhersagefehlersignale nur von Pixeln innerhalb des jeden Blocks geringer Auflösung konvertiert wird.
Videokodierungsvorrichtung nach Anspruch 1, wobei:

das Kodierungsmittel umfasst:

(b1) Speichermittel eines dekodierten Bildes zum Speichern eines vergangenen dekodierten Bildes, reproduziert durch das Dekodierungsmittel in einem vorherigen Rahmen;

(b2) Vorhersageparameter-Kalkulationsmittel, das mit dem Auflösungsbestimmungsmittel gekoppelt ist, zum Bestimmen, welches von zwei Kodierungsschemata verwendet werden sollte, um einzelne Blöcke zu kodieren, durch Vergleichen eines Quellenbildes eines aktuellen Rahmens mit dem vergangenen dekodierten Bild, das in dem Speichermittel des dekodierten Bildes gespeichert ist, und auch zum Kalkulieren von Bewegungsvektoren der Blöcke in dem Quellenbild, wobei:

die zwei Kodierungsschemata eine Intrarahmen kodierung und eine Interrahmenkodierung enthalten, und

die Blöcke durch Partitionieren eines gegebenen Bildes in Stücke gemäß der Bildauflösung definiert sind, die durch das Auflösungsbestimmungsmittel bestimmt ist;

(b3) Vorhersagebild-Generierungsmittel zum Erzeugen eines Vorhersagebildes durch Kalkulation von Pixelwerten auf einer Basis von Block zu Block, wobei die Kalkulation der Pixelwerte enthält:

Zuweisung von Nullen zu Pixelwerten der Blöcke, die Gegenstand der Intrarahmenkodierung sind, und

Kalkulation der Pixelwerte der anderen Blöcke, die Gegenstand der Interrahmenkodierung sind, basierend auf dem vergangenen dekodierten Bild, das in dem Speichermittel des dekodierten Bildes gespeichert ist, und der Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel erhalten werden;

(b4) Vorhersagefehlersignal-Generierungsmittel zum Erzeugen eines Vorhersagefehlersignals für jeden Block durch Kalkulieren von Differenzen zwischen dem Quellenbild und dem Vorhersagebild;

(b5) ein erstes Auflösungskonvertierungsmittel zum Abwärtsabtasten des Vorhersagefehlersignals, das durch das Vorhersagefehlersignal-Generierungsmittel erzeugt wird, um die niedrige Auflösung vorzusehen, abhängig von der Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt ist;

(b6) Orthogonaltransformations-/Quantisierungsmittel zum Anwenden eines orthogonalen Transformationsprozesses und eines Quantisierungsprozesses auf das Vorhersagefehlersignal, das durch das erste Auflösungskonvertierungsmittel verarbeitet wird; und

(b7) Codezuordnungsmittel zum Ausgeben eines Codewortes, das für eine gegebene Menge von Daten relevant ist, wobei das Codewort aus einer vordefinierten Codeworttabelle abgerufen wird, wobei:

die gegebene Menge von Daten mindestens die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels, die Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt ist, das Kodierungsschema, das durch das Vorhersageparameter-Kalkulationsmittel bestimmt ist, und die Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel kalkuliert sind, enthält, und

die vorbestimmte Codeworttabelle eine Vielzahl von Codeworten enthält, die zuvor jeder möglichen Kombination der gegebenen Menge von Daten zugewiesen sind; und

das Dekodierungsmittel umfasst:

(c1) Dequantisierungs-/Umkehrorthogonaltransformationsmittel zum Anwenden eines Dequantisierungsprozesses und eines Umkehrorthogonaltransformationsprozesses auf die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels, um das Vorhersagefehlersignal zu reproduzieren;

(c2) ein zweites Auflösungskonvertierungsmittel zum Anwenden eines Aufwärtsabtastprozesses auf das reproduzierte Vorhersagefehlersignal, das von dem Dequantisierungs-/Umkehrorthogonaltransformationsmittel gesendet wird, um die hohe Auflösung wiederzuerlangen, falls das reproduzierte Vorhersagefehlersignal abwärts zu der geringen Auflösung durch das erste Auflösungskonvertierungsmittel konvertiert wurde, wobei der Aufwärtsabtastprozess den Wert von jedem Pixel in jedem Block mit Bezug auf Pixel in dem Block kalkuliert, aber ohne Bezug auf Pixel in anderen Blöcken; und

(c3) Generierungsmittel eines dekodierten Bildes zum Aufbauen eines dekodierten Bildes durch Hinzufügen des reproduzierten Vorhersagefehlersignals, das durch das zweite Auflösungskonvertierungsmittel verarbeitet wird, zu dem Vorhersagebild, das durch das Vorhersagebild-Generierungsmittel erzeugt wird, und zum Ausgeben des dekodierten Bildes zu dem Speichermittel des dekodierten Bildes.
Videokodierungsvorrichtung nach Anspruch 2, wobei:

das zweite Auflösungskonvertierungsmittel untersucht, welches Kodierungsschema beim Kodieren von jedem Block benachbart zu dem Block von Interesse verwendet wurde, basierend auf den Kodierungsschemata der einzelnen Blöcke, die durch das Vorhersageparameter-Kalkulationsmittel bestimmt sind;

falls das Kodierungsschema eines benachbarten Blocks das gleiche wie das des Blocks von Interesse ist, das zweite Auflösungskonvertierungsmittel den Aufwärtsabtastprozess für das reproduzierte Vorhersagefehlersignal ausführt, um die hohe Auflösung zu erlangen, unter Bezug auf Werte des reproduzierten Vorhersagefehlersignals von Pixeln, die zu dem benachbarten Blocks gehören, ebenso wie von Pixeln, die zu dem Block von Interesse gehören; und

falls sich das Kodierungsschema eines benachbarten Blocks von dem des Blocks von Interesse unterscheidet, das zweite Auflösungskonvertierungsmittel den Aufwärtsabtastprozess für das reproduzierte Vorhersagefehlersignal ausführt, um die hohe Auflösung zu erlangen, unter Bezug auf das reproduzierte Vorhersagefehlersignal von Pixeln, die nicht zu dem benachbarten Block gehören, der mit dem anderen Kodierungsschema kodiert ist.
Videokodierungsvorrichtung nach Anspruch 2, wobei das zweite Auflösungskonvertierungsmittel den Aufwärtsabtastprozess für das reproduzierte Vorhersagefehlersignal ausführt, um die hohe Auflösung zu erlangen, nur unter Bezug auf das reproduzierte Vorhersagefehlersignal von Pixeln, die zu dem Block von Interesse gehören. Videokodierungsvorrichtung nach Anspruch 2, ferner umfassend Hochfrequenz-Unterdrückungsmittel, das zwischen dem Vorhersagebild-Generierungsmittel und dem Vorhersagefehlersignal-Generierungsmittel aufgestellt ist, zum Unterdrücken eines vorbestimmten Bereichs von Hochfrequenzkomponenten, die in dem Vorhersagebild enthalten sind, das durch das Vorhersagebild-Generierungsmittel erzeugt wird. Videokodierungsvorrichtung nach Anspruch 5, wobei das Hochfrequenz-Unterdrückungsmittel auf die Bewegungsvektoren verweist, die, einer für jeden Block, durch das Vorhersageparameter-Kalkulationsmittel kalkuliert sind, um die Blöcke in eine erste Gruppe von Blöcken, die eine schnelle Bewegung aufweisen, und eine zweite Gruppe von Blöcken, die eine weniger aktive Bewegung aufweisen, zu klassifizieren, und die Hochfrequenzkomponenten nur unterdrückt, wenn der Block von Interesse in die erste Gruppe von Blöcken fällt und das Auflösungsbestimmungsmittel die geringe Auflösung bestimmt hat. Videokodierungsvorrichtung nach Anspruch 1, wobei:

das Kodierungsmittel umfasst:

(b1) Speichermittel eines dekodierten Bildes zum Speichern eines vergangenen dekodierten Bildes, das durch das Dekodierungsmittel in einem vorherigen Rahmen reproduziert ist;

(b2) Vorhersageparameter-Kalkulationsmittel, das mit dem Auflösungsbestimmungsmittel gekoppelt ist, zum Bestimmen, welches von zwei Kodierungsschemata verwendet werden sollte, um einzelne Blöcke zu kodieren, durch Vergleichen des Quellenbildes des aktuellen Rahmens mit dem vergangenen dekodierten Bild, das in dem Speichermittel des dekodierten Bildes gespeichert ist, und auch zum Kalkulieren von Bewegungsvektoren der Blöcke in dem Quellenbild, wobei:

die zwei Kodierungsschemata eine Intrarahmen kodierung und eine Interrahmenkodierung enthalten, und

die Blöcke durch Partitionieren eines gegebenen Bildes in Stücke gemäß der Bildauflösung definiert sind, die durch das Auflösungsbestimmungsmittel bestimmt ist;

(b3) Vorhersagebild-Generierungsmittel zum Erzeugen eines Vorhersagebildes durch Kalkulation von Pixelwerten auf einer Basis von Block zu Block, wobei die Kalkulation der Pixelwerte enthält:

Zuweisung von Nullen zu Pixelwerten der Blöcke, die Gegenstand der Intrarahmenkodierung sind, und

Kalkulation der Pixelwerte der anderen Blöcke, die Gegenstand der Interrahmenkodierung sind basierend auf dem vergangenen dekodierten Bild, das in dem Speichermittel des dekodierten Bildes gespeichert ist, und der Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel erhalten werden:

(b4) Vorhersagefehlersignal-Generierungsmittel zum Erzeugen eines Vorhersagefehlersignals für jeden Block durch Kalkulieren von Differenzen zwischen dem Quellenbild und dem Vorhersagebild;

(b5) Orthogonaltransformationsmittel zum Erhalten von Transformationskoeffizienten durch Anwenden einer orthogonalen Transformation auf das Vorhersagefehlersignal, das durch das Vorhersagefehlersignal-Generierungsmittel erzeugt wird, gemäß der Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt ist, und zum Extrahieren von Niederfrequenzkomponenten der erhaltenen Transformationskoeffizienten;

(b6) Quantisierungsmittel zum Anwenden eines Quantisierungsprozesses auf die Ausgabe des Orthogonaltransformationsmittels; und

(b7) Codezuordnungsmittel zum Ausgeben eines Codewortes, das für eine gegebene Menge von Daten relevant ist, wobei das Codewort aus einer vordefinierten Codeworttabelle abgerufen wird, wobei:

die gegebene Menge von Daten mindestens die Ausgabe des Quantisierungsmittels, die Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt ist, das Kodierungsschema, das durch das Vorhersageparameter-Kalkulationsmittel bestimmt ist, und die Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel kalkuliert sind, enthält, und

die vorbestimmte Codeworttabelle eine Vielzahl von Codeworten enthält, die zuvor jeder möglichen Kombination der gegebenen Menge von Daten zugewiesen sind; und

das Dekodierungsmittel umfasst:

(c1) Dequantisierungs-/Umkehrorthogonaltransformationsmittel zum Anwenden eines Dequantisierungsprozesses und eines Umkehrorthogonaltransformationsprozesses auf die Ausgabe des Quantisierungsmittels, um das Vorhersagefehlersignal zu reproduzieren;

(c2) Hochauflösungskonvertierungsmittel zum Anwenden eines Aufwärtsabtastprozesses auf das reproduzierte Vorhersagefehlersignal, das von dem Dequantisierungs-/Umkehrorthogonaltransformationsmittel gesendet wird, um die hohe Auflösung wiederzuerlangen, falls sich das reproduzierte Vorhersagefehlersignal aus den Niederfrequenzkomponenten der Transformationskoeffizienten ableitet, die durch das Orthogonaltransformationsmittel extrahiert werden, wobei der Aufwärtsabtastprozess den Wert von jedem Pixel in jedem Block mit Bezug auf Pixel in dem vorliegenden Block kalkuliert, aber ohne Bezug auf Pixel in anderen Blöcken; und

(c3) Generierungsmittel eines dekodierten Bildes zum Aufbauen eines dekodierten Bildes durch Hinzufügen des reproduzierten Vorhersagefehlersignals, das durch das Hochauflösungskonvertierungsmittel verarbeitet wird, zu dem Vorhersagebild, das durch das Vorhersagebild-Generierungsmittel erzeugt wird, und zum Ausgeben des dekodierten Bildes zu dem Speichermittel des dekodierten Bildes.
Videokodierungsvorrichtung nach Anspruch 7, ferner umfassend ein Hochfrequenz-Unterdrückungsmittel, das zwischen dem Vorhersagebild-Generierungsmittel und dem Vorhersagefehlersignal-Generierungsmittel aufgestellt ist, zum Unterdrücken eines vorbestimmten Bereichs von Hochfrequenzkomponenten, die in dem Vorhersagebild enthalten sind, das durch das Vorhersagebild-Generierungsmittel erzeugt wird. Videokodierungsvorrichtung nach Anspruch 8, wobei das Hochfrequenz-Unterdrückungsmittel auf die Bewegungsvektoren verweist, die, einer für jeden Block, durch das Vorhersageparameter-Kalkulationsmittel kalkuliert sind, um die Blöcke in eine erste Gruppe von Blöcken, die eine schnelle Bewegung aufweisen, und eine zweite Gruppe von Blöcken, die weniger aktive Bewegung aufweisen, zu klassifizieren, und die Hochfrequenzkomponenten nur unterdrückt, wenn der Block von Interesse in die erste Gruppe von Blöcken fällt und das Auflösungsbestimmungsmittel die geringe Auflösung als die Bildauflösung bestimmt hat. Ein Videokodierungsverfahren, um vorhersagende Kodierung eines digitalen Videoeingangssignals durchzuführen, die Schritte umfassend:

(a) Bestimmen einer Bildauflösung, die in einer Videokodierung eines Quellenbildes zu verwenden ist;

(b) Partitionieren eines Rahmens des digitalen Videoeingangssignals in eine Vielzahl von Blöcken;

(c) Konvertieren einer Auflösung von jedem Block, der in dem Partitionierungsschritt (b) erhalten wird, von einer hohen Auflösung zu einer geringen Auflösung, gemäß der Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt wird; und

(d) vorhersagendes Kodieren von Blöcken geringer Auflösung, die in dem Konvertierungsschritt (c) konvertiert werden, während eines aus einer Vielzahl von Kodierungsschemata auf einer Basis von Block zu Block angewendet wird, wobei jeder Block geringer Auflösung, der in dem Konvertierungsschritt (c) konvertiert wird, zu der hohen Auflösung beim Erzeugen eines dekodierten Bildes zurück konvertiert wird, mit Bezug auf Vorhersagefehlersignale nur von Pixeln innerhalb von jedem Block geringer Auflösung.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com