Erfindungsgebiet
-
Die vorliegende Erfindung betrifft eine Datenstruktur zur Bildübertragung, ein Bild-
Kodierungsverfahren, ein Bild-Dekodierungsverfahren, eine Bild-Kodiervorrichtung, eine Bild-
Dekodiervorrichtung, ein Daten-Speichermedium, das ein Programm zur Umsetzung eines
Bild-Dekodierungsprozesses enthält und ein Daten-Speichermedium, das ein kodiertes
Bildsignal enthält.
-
Insbesondere betrifft die Erfindung eine Datenstruktur zur Bildübermittlung, die
kodierte Bildsignale durch Dekodierungsprozesse dekodierbar macht, die zu einem einzigen
Kodierungsverfahren korrespondieren, dessen kodierte Bildsignale unterschiedliche
Datenstrukturen haben, die sie beim Kodieren der digitalen Bildsignale nach
unterschiedlichen Programmen erhalten. Im Weiteren bezieht sich die vorliegende Erfindung
auf ein Bild-Kodierungsverfahren sowie eine Bild-Kodiervorrichtung zur Erzeugung eines
kodierten Bildsignals, das die oben beschriebene Datenstruktur zur Bildübertragung
aufweist, und ein Bild-Dekodierungsverfahren sowie eine Bild-Dekodiervorrichtung zum
Dekodieren eines kodierten Bildsignals, das die Datenstruktur zur Bildübertragung aufweist.
-
Außerdem betrifft die Erfindung ein Datenspeichermedium, das ein Programm zur
Umsetzung des Dekodierungsprozesses nach dem oben beschriebenen Bild-
Dekodierungsverfahren enthält, und ein Datenspeichermedium, das ein kodiertes Bildsignal
mit der oben beschriebenen Datenstruktur zur Bildübertragung enthält.
Hintergrund der Erfindung
-
Um digitale Bildinformationen mit hoher Effizienz zu speichern oder zu übertragen, ist
eine Kompressionskodierung der digitalen Bildinformationen notwendig. Ein typisches
Verfahren zur Kompressionskodierung digitaler Bildinformationen ist die DCT (Discrete
Cosine Transformation) vertreten durch JPEG (Joint Photographic Experts Group) und
MPEG (Moving Pictures Expert Group). Außerdem gibt es Wellenform-Kodierungsverfahren,
wie z. B. die Subband-Kodierung, die Wavelet-Kodierung und die Fraktal-Kodierung.
-
Im Weiteren wird zum Entfernen redundanter Informationen zwischen Displaybildern,
wie z. B. bei aufeinander folgenden Einzelbildern, eine Inter-Rahmen-Vorhersage unter
Verwendung einer Bewegungskompensation ausgeführt. Das heißt, der Wert eines Pixels in
dem vorliegenden Rahmen wird bestimmt durch eine Differenz zwischen diesem Pixelwert
und einem Pixelwert eines Pixels im vorherigen Rahmen, und dieses Differenzsignal wird in
einer Wellenform-Kodierung bearbeitet.
-
Im Besonderen wird - wie in Fig. 22(a) dargestellt - ein arithmetischer Kodierer 10a
zum Kodieren eines binären Bildsignals S2 verwendet, das ein Binärinformations-Displaybild
repräsentiert und von einem Scanner eines Fax-Apparats oder dergleichen erhalten wurde.
-
Zum Dekodieren eines kodierten Binärsignals E2 wird - wie in Fig. 22(b) dargestellt - ein
arithmetischer Dekoder 10b verwendet. Der arithmetische Kodierer 10a kodiert das binäre
Bildsignal S2 mit Hilfe eines arithmetischen Kodierungsprozess, der bei Übermittlung eines
Fax-Signals verwendet wird, so z. B. mit MMR (Modified Modified Reed) oder JBIG (Joint
Bilevel Image Coding Expert Group), und erzeugt damit ein kodiertes Binärsignal E2. Die
arithmetische Dekodiervorrichtung 10b dekodiert das kodierte Binärsignal E2 mit Hilfe eines
arithmetischen Dekodierungsprozesses, der zum arithmetischen Kodierungsprozess gehört,
und stellt so ein dekodiertes Binärsignal D2 wieder her.
-
Wie in Fig. 22(c) dargestellt ist, umfasst ein zu einem Displaybild gehörendes
kodiertes Binärsignal 600a (E2) ein Synchronsignal 601 am Anfang, einen an das Signal 601
anschließenden Datenkopf 603 und an den Datenkopf 603 anschließende Formdaten 604.
-
Im Weiteren wird eine in Fig. 23(a) dargestellte Bild-Kodiervorrichtung 20 zum
Kodieren des in MPEG2 bearbeiteten digitalen Bildsignal St verwendet, und eine in Fig.
23(b) dargestellte Bild-Dekodiervorrichtung 25 wird zum Dekodieren des kodierten
Bildsignals Et verwendet. Das in MPEG2 bearbeitete digitale Bildsignal St ist ein Rechteck-
Bildsignal, das ein Leuchtdichtesignal und ein Farbdifferenzsignal zur Farbdarstellung
(Gradationsdarstellung) sowie Informationen umfasst, die die horizontale und vertikale
Größe eines Displaybildes (einen Rahmen) anzeigen. Die Bild-Kodiervorrichtung 20 umfasst
eine Informationsquellen-Kodierer 20a, durch den das digitale Bildsignal (Rechteck-
Bildsignal) St einer Informationsquellen-Kodierung unterworfen wird, und einen
Längenvariant-Kodierer 20b, der die Ausgabedaten aus dem Kodierer 20a längenvariant
kodiert, um ein kodiertes Bildsignal (kodiertes Pixelwertsignal Et) zu erzeugen. Die Bild-
Dekodiervorrichtung 25 umfasst einen Längenvariant-Dekoder 25b, der das kodierte
Bildsignal Et längenvariant dekodiert, und einen Informationsquellen-Dekoder 25a, der für
die Ausgabedaten des Dekoders 25b eine Informationsquellen-Dekodierung ausführt, um ein
dekodiertes Bildsignal (dekodiertes Pixelwertsignal) Dt zu erzeugen.
-
Der Informationsquellen-Kodierer 20a umfasst einen DCT-Prozessor 21, der an
jedem von mehreren Blöcken, in die das Displaybild (ein Rahmen) unterteilt ist, eine DCT
(Diskrete Kosinus-Transformation) ausführt, und einen Quantisierer 22, der die
Ausgabedaten vom DCT-Prozessor 21 quantisiert. Der Informationsquellen-Dekoder 25a
umfasst einen Invers-Quantisierer 26, der die Ausgabedaten vom Längenvariant-Dekoder
25b invers quantisiert, und einen IDCT-Prozessor 27, welcher an den Ausgabedaten des
Dekoders 25b eine Umkehr-DCT ausführt. Wie in Fig. 23(c) dargestellt ist, enthält ein zu
einem Displaybild gehörendes kodiertes Bildsignal 700a (Et) am Anfang ein 32-Bit-
Synchronsignal 701; einen auf das Signal 701 folgenden Datenkopf 703 und kodierte
Pixelwert-Bitströme (kodierte Textur-Bitströme) 71C1, 71C2, 71C3, ..., die jeweils zu den
Blöcken C1, C2, C3, ... gehören, in die das Displaybild unterteilt ist. Die kodierten Textur-
Bitströme 71C1, 71C2 und 71C3 enthalten jeweils zugeordnete 5-Bit-Quantisierungsskalen
704, 707 und 710, längenvariante Textur-Bewegungsvektoren (BV) 705, 708 und 711 sowie
längenvariante Textur-DCT-Koeffizienten 706, 709 und 712.
-
In den letzten Jahren wurde ein auf dem individuellen Objekt basierendes Verfahren
zur Kompressionskodierung und zur Übertragung eines Bildsignals in die praktische Nutzung
überführt. Genauer gesagt wird ein Bild, das zu einem Displaybild gehört und aus mehreren
Objekten besteht, in einer objektweisen Form kompressiv kodiert und übermittelt, wodurch
das Daten-Kompressionsverhältnis erhöht und eine separate Dekodierung/Reproduktion der
Objekte ermöglicht wird. In diesem Verfahren werden auf der Reproduktionsseite die
kodierten, zu den jeweiligen Objekten gehörenden Bildsignale dekodiert und reproduziert,
und die reproduzierten Bildsignale werden zusammengesetzt, um ein Bild wiederzugeben,
das zu einem Displaybild korrespondiert. Dieses Objekt-zu-Objekt-Kodieren erlaubt dem
Nutzer, Bilder von darzustellenden Objekten frei zu kombinieren, wodurch die Bearbeitung
eines Films erleichtert wird. Außerdem ist es bei diesem Verfahren in Abhängigkeit von der
Auslastung der Übertragungsstrecke, der Leistungsfähigkeit der Wiedergabevorrichtung und
den Wünschen des Betrachters möglich, einen Film wiederzugeben, ohne die Bilder von
relativ unwichtigen Objekten zu reproduzieren. Mit anderen Worten wird eine Skalierbarkeit
in Objekteinheiten, d. h. ein Wechsel in der Kontraktionsskala bei der Bilddarstellung für
jedes Objekt, erreicht.
-
Da die entsprechenden Objekte unterschiedliche Formen aufweisen, wird beim
Objekt-zu-Objekt-Kompressionskodieren eines Bildsignals so vorgegangen, dass ein
Bildsignal eines Bildes beliebiger Form (im Weiteren als Beliebigform-Bildsignal bezeichnet)
kompressionskodiert wird. Das Beliebigform-Bildsignal umfasst ein Textursignal
(Pixelwertsignal), das zur Farbdarstellung eines Objekts (Gradationsdarstellung) dient und
ein Leuchtdichtesignal sowie ein Farbdifferenzsignal enthält, und ein Signal, das die Form
eines Bildes wiedergibt. Das Formsignal zeigt für jedes Pixel an, ob es als eine Komponente
eines Abbildungsbereiches außerhalb oder innerhalb des Objekts liegt, und es wird durch
eine Binärziffer ausgedrückt.
-
Ferner gibt es den Fall, dass das Beliebigform-Bildsignal zusätzlich zum Textursignal
und zum Formsignal Transparenz-Informationen umfasst, welche die Transparenz eines
Objekts kennzeichnen, wenn das Objekt als Vordergrundbild vor einem Hintergrundbild
angeordnet ist. Die Transparenz-Informationen werden gewöhnlich durch ein mehrwertiges
Transparenzsignal mit mindestens drei Bits ausgedrückt. Eine Kombination des binären
Formsignals (binäres Transparenzsignal) und des mehrwertigen Transparenzsignals wird als
ein Transparenzsignal bezeichnet. Das mehrwertige Transparenzsignal im
Transparenzsignal wird genau gleich wie ein Textursignal im nachfolgenden
Kodierungsprozess behandelt.
-
Wenn ein Beliebigform-Bildsignal, das sowohl ein Textursignal als auch ein binäres
Formsignal umfasst, kodiert wird, dann wird zunächst das Formsignal und danach das
Textursignal kodiert. In MPEG4 werden Kodierung, Übertragung und Dekodierung eines
solchen Beliebigform-Bildsignals standardisiert, und Fig. 24(a) ist ein Blockschema zur
Darstellung einer Bild-Kodiervorrichtung, die einen Kodierungsprozess ausführt, der
gegenwärtig gerade als MPEG4 standardisiert wird.
-
In Fig. 24(a) bezeichnet die Bezugsziffer 200a eine Bild-Kodiervorrichtung, welche
ein Beliebigform-Bildsignal Sp erfasst, das zu je einem von mehreren Objekten gehört, aus
denen ein Displaybild - entsprechend einem Ausgangs-Videosignal Sv einer Kamera oder
eines Bildaufzeichnungs/-wiedergabe-Gerätes (VTR) - besteht, und welche das
Beliebigform-Bildsignal kodiert.
-
Die Bild-Kodiervorrichtung 200a enthält einen Chroma-Key-Prozessor 201, der am
Videosignal Sv einen Chroma-Key-Prozess wie folgt ausführt. Zunächst trennt der Chroma-
Key-Prozessor 201 ein Beliebigform-Bildsignal, das zu jedem Objekt gehört, von einem
Hintergrund-Bildsignal ab und erhält ein Formsignal Spk, das die Form des Objekts als eine
Binärinformation darstellt, und ein Textursignal (Pixelwertsignal) Spt für die Farbdarstellung
des Objekts, das ein Leuchtdichtesignal und ein Farbdifferenzsignal umfasst. Dann gibt der
Chroma-Key-Prozessor 201 die Signale Spk und Spt für jeden aus einer Anzahl von Blöcken
aus, in die ein Darstellungsgebiet entsprechend den zugehörigen Objekten auf dem
Displaybild unterteilt ist. Bei der Ausgabe der Signale Spk und Spt gibt der Chroma-Key-
Prozessor 201 ein Schalttaktsignal Ts aus, das den Zeitpunkt des Umschaltens zwischen
dem Formsignal Spk und dem Textursignal Spt angibt. Außerdem enthält die Bild-
Kodiervorrichtung 200a einen arithmetischen Kodierer 120a, der das Formsignal Spk
blockweise durch arithmetisches Kodieren kodiert (vgl. JBIG); einen Informationsquellen-
Kodierer 130a, der blockweise eine DCT und eine Quantisierung des Texursignals Spt
ausführt; und einen Längenvariant-Kodierer 139, der das längenvariante Kodieren der
Ausgabedaten vom Informationsquellen-Kodierer 130a ausführt.
-
Außerdem enthält die Bild-Kodiervorrichtung 200a einen Schalter 202, der in
Abhängigkeit von einem Schalttaktsignal Ts den Ausgang des Chroma-Key-Prozessors 201
mit dem Eingang des arithmetischen Kodierers 120a oder mit dem Eingang des
Informationsquellen-Kodierers 130a verbindet; und einen Multiplexer 150, der einen vom
arithmetischen Kodierer 120a ausgegebenen kodierten Form-Bitstrom Epk und einen vom
Längenvariant-Kodierer 139 ausgegebenen kodierten Textur-Bitstrom Ept mit anderen
benötigten Signalen multiplext. Wie in Fig. 24(c) dargestellt ist, wird vom Multiplexer 150 ein
kodiertes Beliebigformsignal Ep (500a) ausgegeben, in dem kodierte Form-Bitströme (Epk)
51A1, 51A2 und 51A3, kodierte Textur-Bitströme (Ept) 52A1, 52A2, und 52A3 sowie andere
benötigte Signale in vorgeschriebener Anordnung zusammengestellt sind.
-
Der oben dargestellte arithmetische Kodierungsprozess ist in ein Verfahren zur
Übermittlung eines Fax-Signals, wie z. B. MMR oder JBIG, übernommen worden, und der
oben beschriebene DCT-Prozess wird im MPEG-Standard eingesetzt. Wie in Fig. 24(c)
dargestellt ist, bestehen die kodierten Daten eines jeden Blocks A1, A2 und A3 aus dem
kodierten Form-Bitstrom Epk und dem kodierten Textur-Bitstrom Ept.
-
In der so konstruierten Kodiervorrichtung 200a wird das Videosignal Sv durch den
Chroma-Key-Prozessor 201 bearbeitet, und vom Chroma-Key-Prozessor 201 wird ein zu
einem jeden Objekt gehörendes Beliebigform-Bildsignal Sp ausgegeben. Das in dem
Beliebigform-Bildsignal Sp enthaltene Formsignal Spk wird über den vom Schalttaktsignal Ts
gesteuerten Schalter 202 in den arithmetischen Kodierer 120a eingegeben, durch den
Kodierer 120a kodiert, und als ein kodierter Form-Bitstrom Epk zum Multiplexer 150 hin
ausgegeben. Andererseits wird das im Beliebigform-Bildsignal Sp enthaltene Textursignal
Spt über den vom Schalttaktsignal Ts gesteuerten Schalter 202 in den Informationsquellen-
Kodierer 130a eingegeben, im Kodierer 130a einer DCT und einer Quantisierung
unterworfen und als ein kodierter Textur-Bitstrom Ept zum Multiplexer 150 hin ausgegeben.
Das Kodieren des Formsignals Spk und das Kodieren des Textursignals Spt erfolgen
blockweise.
-
Im Multiplexer 150 werden der kodierte Form-Bitstrom Epk, der kodierte Textur-
Bitstrom Ept und andere erforderliche Signale in der vorgeschriebenen Anordnung
zusammengestellt, und diese Ströme und Signale werden vom Multiplexer 150 als ein
kodiertes Beliebigformsignal Ep ausgegeben.
-
Die in Fig. 24(b) dargestellte Bild-Dekodiervorrichtung 200b wird zur Dekodierung des
Beliebigformsignals Ep verwendet, das von der Bild-Kodiervorrichtung 200a kodiert wurde.
-
Die Bild-Dekodiervorrichtung 200b umfasst: einen Datenanalysator 160, der das
kodierte Beliebigformsignal Ep analysiert und ein Steuersignal Swb ausgibt; einen
arithmetischen Dekoder 170a, der eine blockweise arithmetisches Dekodierung des im
kodierten Beliebigformsignal Ep enthaltenen kodierten Form-Bitstroms Epk ausführt und ein
Abschlusszeitsignal Te erzeugt, wenn die arithmetische Dekodierung eines Block beendet
ist; einen Informationsquellen-Dekoder 180a, welcher an dem kodierten Textur-Bitstrom Ept,
der im kodierten Beliebigformsignal Ep enthalten ist, die Informationsquellen-Dekodierung,
d. h. die Umkehr-DCT und die inverse Quantisierung, ausführt; einen Schalter 101b, der das
vom Datenanalysator 160 ausgegebene kodierte Beliebigformsignal Ep in Abhängigkeit vom
Schaltsteuersignal SWb und dem Abschlusszeitsignal Te entweder an den arithmetischen
Dekoder 170a oder den Informationsquellen-Dekoder 180a ausgibt; und einen Synthesizer
190, der eine Synthese der Ausgabedaten Dpk und Dpt von den Dekodern 170a und 180a
ausführt und das synthetisierte Signal als ein dekodiertes Beliebigformsignal Dp ausgibt.
-
In der so aufgebauten Bild-Dekodiervorrichtung 200b analysiert der Datenanalysator
160 beim Eingang des kodierten Beliebigformsignals Ep die in diesem Signal enthaltenen
Informationen und gibt dann das Steuersignal SWb an den Schalter 101b aus, wenn er das
letzte Bit des Textur-Bitstroms Ept auffindet. In Reaktion auf das Steuersignal SWb leitet der
Schalter 101b die Ausgabedaten des Datenanalysators 160 an den arithmetischen Dekoder
170a weiter. Der arithmetische Dekoder 170a dekodiert den kodierten Form-Bitstrom Epk
und gibt ein Abschlusszeitsignal Te aus, wenn die Dekodierung des zu einem jeden Block
gehörenden kodierten Form-Bitstroms Epk abgeschlossen ist. Bei der Eingabe des
Abschlusszeitsignals Te in den Datenanalysator 160 gibt der Datenanalysator 160 das
Steuersignal SWb an den Schalter 101b aus, und der Schalter 101b verbindet den Ausgang
des Datenanalysators 160 mit dem Informationsquellen-Dekoder 180a. Der
Informationsquellen-Dekoder 180a dekodiert einen Block des im kodierten
Beliebigformsignal Ep enthaltenen kodierten Textursignals Ept. Der Synthesizer 190 führt
eine Synthese der Ausgabedaten des arithmetischen Dekoders 170a mit den Ausgabedaten
des Informationsquellen-Dekoders 180a aus und gibt das dekodierte Beliebigformsignal Dp
als ein reproduziertes Signal aus. Wenn der oben erwähnte Dekodierungsprozess des zu
einem Objekt gehörenden kodierten Beliebigformsignals Ep abgeschlossen und so das zum
Objekt gehörende dekodierte Beliebigformsignals Dp erzeugt ist, dann ist die Bildwiedergabe
des Objekts möglich.
-
Obwohl mit Bezug auf die Fig. 24(a)-24(c) keine Beschreibung der Bearbeitung
eines Beliebigform-Bildsignals gegeben wird, das ein mehrwertiges Transparenzsignals
(Beliebigform-Bildsignal mit Transparenz-Informationen) enthält, erfolgt die Bearbeitung des
mehrwertigen Transparenzsignals in derselben Weise wie die des Textursignals
(Pixelwertsignals), wenn das Beliebigform-Bildsignal ein mehrwertiges Transparenzsignal
enthält.
-
Wie oben dargestellt wurde, wird in dem konventionellen Verfahren zur Kodierung
eines Bildsignals das in JBIG oder ähnlichen Standards verwendete arithmetische
Kodierungsverfahren für die Kodierung eines binären Bildsignals, d. h. eines binären
Formsignals, eingesetzt, während das in MPEG2 oder ähnlichen Standards verwendete
Informationsquellen-Kodierungsverfahren für die Kodierung eines digitalen Bildsignals zur
Farbdarstellung eines Bildes, d. h. eines Textursignals, eingesetzt wird. Ferner wird das
Kodierungsverfahren von MPEG4, d. h. eine Kombination von arithmetischer und
Informationsquellen-Kodierung, zur Kodierung eines Bildsignals verwendet, das ein binäres
Formsignal und ein Textursignal enthält.
-
Es ist selbstverständlich, dass zur Dekodierung von kodierten Signalen, die mit
unterschiedlichen Kodierungsverfahren erhalten wurden, die den jeweils verwendeten
Kodierungsverfahren entsprechenden unterschiedlichen Dekodierungsverfahren eingesetzt
werden sollten. Mit anderen Worten müssen unterschiedliche Datenanalyseverfahren im
Dekodierungsprozess der kodierten Signale verwendet werden, weil im konventionellen
Kodierungsprozess unterschiedliche Kodierungsverfahren zur Kodierung unterschiedlicher
Arten von Bildsignalen eingesetzt werden.
-
Ein Beispiel einer MPEG-4-Kodierung wird in dem Artikel "The MPEG-4 Video
Standard Verification Mode" von T. Sikora, IEEE Transactions on Circuits and Systems for
Video Technology, US, Bd. 7, Nr. 1, 1. Februar 1997, S. 19-31 dargestellt.
-
Die auf MPEG4 aufbauende Bild-Dekodiervorrichtung kann zwar ein beliebiges
kodiertes Signal aus der Gruppe der binären Bildsignale (JBIG), digitalen Bildsignale
(MPEG2) und Beliebigform-Bildsignale (MPEG4) dekodieren, weist aber die folgenden
Mängel auf.
-
In einem durch blockweise Kodierung eines Beliebigform-Bildsignals erhaltenen
kodierten Beliebigformsignal sind die zum jeweiligen Block gehörenden kodierten Form-
Bitströme und die zum jeweiligen Blöcken gehörenden Textur-Bitströme alternierend
angeordnet. Andererseits sind in einem kodierten Binärsignal, das durch blockweise
Kodierung eines binären Bildsignals erhalten wurde, die zu den jeweiligen Blöcken
gehörenden kodierten Form-Bitströme nacheinander angeordnet. Deshalb lässt sich beim
Datenanalyseverfahren (Datenanalysator) gemäß MPEG4 das oben beschriebene
Steuersignal SWb nicht ausgehend von einer Analyse des kodierten binären Bildsignals, das
keinen kodierten Textur-Bitstrom enthält, erzeugen, so dass die kodierten Form-Bitströme zu
den jeweiligen Blöcken im kodierten Binärsignal nicht nacheinander an den arithmetischen
Dekoder 170a übergeben werden können. Genauer gesägt wird in der Bild-
Dekodiervorrichtung 200b nach Abschluss der Bearbeitung eines zu einem der Blöcke
gehörenden kodierten Form-Bitstroms das Abschlusszeitsignal Te vom arithmetischen
Dekoder 170a an den Schalter 101b übertragen, wonach der Schalter 101b den Bitstrom
vom Datenanalysator 160 an den Informationsquellen-Dekoder 180a übergibt. Da jedoch
kein kodierter Textur-Bitstrom im kodierten Binärsignal enthalten ist, kann der
Datenanalysator 160 nicht das Steuersignal Swb erzeugen, um den Schalter 101b so zu
steuern, dass der Bitstrom in den arithmetischen Dekoder 170a eingegeben wird, und es
wird ein kodierter Form-Bitstrom, der zum nächsten Block gehört, in den
Informationsquellen-Dekoder 180a eingegeben.
-
Um eine Kodierung des binären Bildsignals mit dem üblichen Verfahren zu
unterstützen, wird somit ein dem Block zugeordneter Blind-Textur-Bitstrom im Anschluss an
den Form-Bitstrom eines jeden Blocks hinzugefügt, wodurch offensichtlich die Datenstruktur
des kodierten Binärsignals völlig gleich der Datenstruktur des kodierten Beliebigformsignals
wird. In diesem Falle kann das kodierte Binärsignal durch das auf MPEG4 aufbauende
Datenanalyseverfahren analysiert und durch den auf MPEG4 aufbauenden Bild-
Dekodierungsprozess dekodiert werden.
-
Da jedoch bei der Ausgabe des kodierten binären Bildsignals der kodierte Blind-
Textur-Bitstrom zum kodierten Form-Bitstrom hinzugefügt wird, wird beim
Kodierungsprozess die Bitzahl nicht ausgenutzt, was zu einer Abnahme der
Kodierungseffizienz führt.
-
In dem auf MPEG4 aufbauenden Dekodierungsprozess ist ein kodiertes Bildsignal
(kodiertes Pixelwertsignal), das durch Kodierung eines nur ein Textursignal umfassenden
digitalen Bildsignals (Rechteck-Bildsignal) gemäß MPEG2 erhalten wurde, ebenso
dekodierbar wie ein kodiertes Beliebigformsignal, das durch Kodieren eines Beliebigform-
Bildsignals erhalten wurde. Der Grund ist der folgende. Da der Anfangs- und der Endpunkt
des zu jedem Block gehörenden kodierten Textur-Bitstroms detektierbar sind, kann in einem
kodierten Bildsignal, das kodierte Textur-Bitströme enthält, der Schalter 101b durch das
Steuersignal SWb so gesteuert werden, dass immer der kodierte Textur-Bitstrom in den
Informationsquellen-Dekoder 180b eingegeben wird.
-
Ferner könnten bei dem Dekodierungsprozess, der zu dem auf MPEG4 aufbauenden
Kodierungsprozess gehört, die zu je einem Block gehörenden kodierten Form- und Textur-
Bitströme sich nicht beide in einer im Voraus festgelegten Wiedergabezeit dekodieren
lassen, wenn bei der Dekodierung eines kodierten Beliebigformsignals, das durch Kodieren
eines Beliebigform-Bildsignals erhalten wurde, eine Prozessüberlastung auftritt, so dass die
Bildbewegung bei der Wiedergabe nicht ausreichend stetig ist oder abbricht.
Darstellung der Erfindung
-
Es ist eine Aufgabe der vorliegenden Erfindung, ein Bild-Dekodierungsverfahren
bereitzustellen, welches die Dekodierung von kodierten Bildsignalen mit unterschiedlichen
Datenstrukturen, die durch Kodierung digitaler Bildsignale nach unterschiedlichen
Programmen oder dergleichen erhalten wurden, mit Hilfe von zu einem einzigen
Kodierungsverfahren korrespondierenden Dekodierungsprozessen erlaubt, das sind z. B.
solche, mit denen sowohl ein binäres Bildsignal als auch ein Beliebigform-Bildsignal
dekodiert werden kann, ohne die Bitzahl während des Kodierungsprozesses zu erhöhen.
-
Andere Zielstellungen und Vorzüge der Erfindung werden aus der folgenden
ausführlichen Beschreibung ersichtlich. Die ausführliche Beschreibung und die dargestellten
spezifischen Ausführungsformen dienen lediglich zur Veranschaulichung, weil die
verschiedenen Ergänzungen und Modifikationen im Geltungsbereich der Erfindung den
Fachleuten auf diesem Gebiet von der ausführlichen Beschreibung her offensichtlich sind.
-
Gemäß einer Ausführungsform der vorliegenden Erfindung wird ein in den
beigefügten Patentansprüchen definiertes Bild-Dekodierungsverfahren für ein kodiertes
Signal, das durch Kodierung eines digitalen Bildsignals erhalten wurde, bereitgestellt, wobei
das kodierte Bildsignal einen der Datenstruktur des digitalen Bildsignals entsprechenden
Bild-Identifikator aufweist und das kodierte Bildsignal einem der Datenstruktur
entsprechenden Dekodierungsprozess unterzogen wird, wobei:
-
das kodierte Bildsignal mit Bezug auf den Bild-Identifikator analysiert wird, um zu
entscheiden, ob das kodierte Bildsignal ein kodiertes Beliebigformsignal ist, das als
Wiedergabedaten sowohl kodierte Form-Bitströme enthält, die durch Kodieren eines
Formsignals erhalten wurden, welches die Form eines jeden Objekts als einer der
Komponenten eines Displaybildes wiedergibt, als auch kodierte Pixelwert-Bitströme umfasst,
die durch Kodieren eines Pixelwertsignals erhalten wurden, das die Gradation des Objekts
wiedergibt, oder ob es ein kodiertes Binärsignal ist, das als Wiedergabedaten nur kodierte
Form-Bitströme enthält, die durch Kodieren eines Formsignals erhalten wurden, das ein
Binärinformations-Displaybild repräsentiert;
-
wenn das einlaufende kodierte Bildsignal das kodierte Beliebigformsignal ist, dann
werden dessen kodierte Form-Bitströme mit einem ersten Dekodierungsverfahren und
dessen kodierte Pixelwert-Bitströme mit einem zweiten Dekodierungsverfahren entsprechend
der Anordnung dieser Bitströme dekodiert; und
-
wenn das einlaufende kodierte Bildsignal das kodierte Binärsignal ist, dann werden
nur dessen kodierte Form-Bitströme mit dem ersten Dekodierungsverfahren dekodiert.
-
Deshalb können auch dann, wenn die Bildsignale mit unterschiedlichen
Datenstrukturen über unterschiedliche Kodierungsverfahren kodiert wurden, diese kodierten
Bildsignale in Dekodierungsprozessen dekodiert werden, die zu einem einzigen
Kodierungsverfahren korrespondieren. Außerdem nimmt die Bitzahl im Verlauf des
Kodierungsprozesses kaum zu.
-
Nach einer weiteren Ausführungsform der vorliegenden Erfindung enthält der Bild-
Identifikator in dem oben beschriebenen Dekodierungsverfahren einen 2-Bit-Kode. Deshalb
ist es möglich, vier Arten von kodierten Bildsignalen einschließlich eines kodierten
Binärsignals und eines kodierten Beliebigformsignals in Dekodierungsprozessen zu
dekodieren, die zu einem einzigen Kodierungsverfahren korrespondieren.
-
Nach einer weiteren Ausführungsform der vorliegenden Erfindung wird ein
Datenspeichermedium bereitgestellt, das ein Programm zum Ausführen eines
Dekodierungsprozesses eines kodierten Bildsignals durch einen Computer enthält, wobei
das Programm so konstruiert ist, dass ein Dekodierungsprozess nach einem beliebigen der
oben beschriebenen Dekodierungsverfahren durch den Computer ausgeführt wird. Nach
dem Laden des Programms in den Computer kann somit der Dekodierungsprozess gemäß
dem oben beschriebenen Dekodierungsverfahren durch die Software ausgeführt werden.
-
Nach einer weiteren Ausführungsform der vorliegenden Erfindung wird ein
Datenspeichermedium bereitgestellt, das ein durch Kodierung eines digitalen Bildsignals
erhaltenes kodiertes Bildsignal enthält, wobei das kodierte Bildsignal eine beliebige der oben
beschriebenen Datenstrukturen für die Bildübertragung hat. Deshalb können beim Auslesen
der gespeicherten kodierten Bildsignale aus dem Medium und beim Dekodieren diese
kodierten Bildsignale, die unterschiedliche Datenstrukturen haben, identifiziert werden.
Kurze Beschreibung der Zeichnungen
-
Fig. 1(a) und 1(b) sind schematische Darstellungen einer Datenstruktur eines
kodierten Beliebigformsignals bzw. einer Datenstruktur eines kodierten Binärsignals als
erläuternde Beispiele für Datenstrukturen zur Bildübertragung.
-
Fig. 2(a) und 2(b) sind schematische Darstellungen einer Datenstruktur eines
kodierten Beliebigformsignals bzw. einer Datenstruktur eines kodierten Binärsignals, die
nach einer Modifikation des ersten Beispiels Datenstrukturen zur Bildübertragung sind.
-
Fig. 3 ist ein Blockschema zur Darstellung einer Bild-Kodiervorrichtung als ein
weiteres erläuterndes Beispiel.
-
Fig. 4 ist ein Flussdiagramm zur Erläuterung eines Kodierungsprozesses durch die
Bild-Kodiervorrichtung entsprechend dem zweiten Beispiel.
-
Fig. 5 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung
entsprechend einer Ausführungsform der Erfindung.
-
Fig. 6 ist ein Flussdiagramm zur Erläuterung eines Dekodierungsprozesses durch die
Bild-Dekodiervorrichtung entsprechend der Ausführungsform.
-
Fig. 7(a) ist ein Blockschema zur Darstellung einer in der Bild-Kodiervorrichtung
enthaltenen Bild-Eingabeeinheit gemäß der zweiten Ausführungsform, und Fig. 7(b) ist ein
Blockschema zur Darstellung eines Datenanalysators, der in der Bild-Dekodiervorrichtung
entsprechend der Ausführungsform enthalten ist.
-
Fig. 8 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung
entsprechend einer weiteren Ausführungsform, die kein Teil der Erfindung ist.
-
Fig. 9 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung
entsprechend einer weiteren Ausführungsform, die kein Teil der Erfindung ist.
-
Fig. 10(a), 10(b) und 10(c) sind schematische Darstellungen, die Datenstrukturen von
je einem kodierten Beliebigformsignal, kodierten Binärsignal und kodierten Rechtecksignal
zeigen, welche entsprechend einer weiteren Ausführungsform, die kein Teil der Erfindung
ist, Datenstrukturen zur Bildübertragung sind.
-
Fig. 11 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung
entsprechend einer weiteren Ausführungsform, die kein Teil der Erfindung ist.
-
Fig. 12 ist ein Flussdiagramm zur Erläuterung eines Dekodierungsprozesses durch
die Bild-Dekodiervorrichtung entsprechend der weiteren Ausführungsform, die kein Teil der
Erfindung ist.
-
Fig. 13(a) und 13(b) sind schematische Darstellungen, die eine Datenstruktur eines
kodierten Beliebigformsignals bzw. eine Datenstruktur eines kodierten Binärsignals zeigen,
die Datenstrukturen zur Bildübertragung entsprechend einer weiteren Ausführungsform sind,
die kein Teil der Erfindung ist.
-
Fig. 14(a) und 14(b) sind schematische Darstellungen, die eine Datenstruktur eines
kodierten Rechtecksignals bzw. eine Datenstruktur eines kodierten Beliebigformsignals mit
Transparenzinformationen zeigen, die Datenstrukturen zur Bildübertragung entsprechend
einer weiteren Ausführungsform sind, die kein Teil der Erfindung ist.
-
Fig. 15 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung
entsprechend einer weiteren Ausführungsform, die nicht Teil der Erfindung ist.
-
Fig. 16 ist ein Flussdiagramm zur Erläuterung eines Dekodierungsprozesses durch
die Bild-Dekodiervorrichtung entsprechend der weiteren Ausführungsform, die kein Teil der
Erfindung ist.
-
Fig. 17(a), 17(b) und 17(c) sind jeweils Datenstrukturen von einem kodierten
Beliebigformsignal, kodierten Binärsignal und kodierten Rechtecksignal, die Datenstrukturen
zur Bildübertragung entsprechend einer weiteren Ausführungsform sind, die kein Teil der
Erfindung ist.
-
Fig. 18(a) und 18(b) sind schematische Darstellungen, die eine Datenstruktur eines
kodierten Beliebigformsignals mit Transparenzinformationen bzw. eine Datenstruktur eines
kodierten Transparenzsignals zeigen, die Datenstrukturen zur Bildübertragung entsprechend
der weiteren Ausführungsform sind, die kein Teil der Erfindung ist.
-
Fig. 19 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung
entsprechend einer weiteren Ausführungsform, die kein Teil der Erfindung ist.
-
Fig. 20 ist ein Flussdiagramm zur Erläuterung eines Dekodierungsprozesses durch
die Bild-Dekodiervorrichtung entsprechend der weiteren Ausführungsform, die kein Teil der
Erfindung ist.
-
Fig. 21(a)-21(c) sind schematische Darstellungen zur Erläuterung eines
Datenspeichermediums (Fig. 21(a), 21(b)), das ein Programm zur Realisierung einer Bild-
Kodiervorrichtung oder einer Bild-Dekodiervorrichtung nach einer der oben erwähnten
Ausführungsformen enthält, wobei ein Computersystem (Fig. 21(c)) verwendet wird.
-
Fig. 22(a)-22(c) sind schematische Darstellungen zur Erläuterung eines
Kommunikationssystems, in dem ein Datenkompressions-Kodierungsprozess basierend auf
JBIG verwendet wird, und genauer gesagt zeigen die Fig. 22(a) und 22(b) eine im System
enthaltene Bild-Kodiervorrichtung bzw. eine Bild-Dekodiervorrichtung, und die Fig. 22(c)
zeigt eine im System verwendete Datenstruktur eines kodierten Bildsignals.
-
Fig. 23(a)-23(c) sind schematische Darstellungen zur Erläuterung eines
Kommunikationssystems, in dem der Datenkompressions-Kodierungsprozess basierend auf
MPEG2 verwendet wird, und genauer gesagt zeigen die Fig. 23(a) und 23(b) eine im
System enthaltene Bild-Kodiervorrichtung bzw. eine Bild-Dekodiervorrichtung, und die Fig.
23(c) zeigt eine im System verwendete Datenstruktur eines kodierten Bildsignals.
-
Fig. 24(a)-24(c) sind schematische Darstellungen zur Erläuterung eines
Kommunikationssystems, in dem der Datenkompressions-Kodierungsprozess basierend auf
MPEG4 verwendet wird, und genauer gesagt zeigen die Fig. 24(a) und 24(b) eine im
System enthaltene Bild-Kodiervorrichtung bzw. eine Bild-Dekodiervorrichtung, und die Fig.
24(c) zeigt eine im System verwendete Datenstruktur eines kodierten Bildsignals.
Ausführliche Beschreibung der bevorzugten Ausführungsformen
[Ausführungsform 1]
-
Die Fig. 1(a) und 1(b) sind schematische Darstellungen, die Datenstrukturen zur
Bildübertragung entsprechend einer ersten Ausführungsform der vorliegenden Erfindung
zeigen. Fig. 1(a) zeigt eine Datenstruktur eines kodierten Beliebigformsignals, das zu je
einem von mehreren Objekten gehört, aus denen ein Displaybild besteht. Die Datenstruktur
zur Bildübertragung gemäß der ersten Ausführungsform wird in einem Kodierungs- und
Dekodierungssystem verwendet, in dem ein Beliebigform-Bildsignal kompressiv kodiert
sowie übertragen wird und das kodierte Signal schließlich dekodiert und wiedergegeben
wird. Das heißt, dass in diesem System Bild-Kodierungsverfahren und -vorrichtung vor allem
dafür ausgelegt sind, einen Kodierungsprozess für das Beliebigform-Bildsignal auszuführen,
während das Bild-Dekodierungsverfahren und -vorrichtung vor allem dafür ausgelegt sind,
einen Dekodierungsprozess für das kodierte Beliebigformsignal auszuführen.
-
In Fig. 1(a) bezeichnet die Bezugsziffer 500 ein kodiertes Beliebigformsignal, das
durch Kodieren eines Beliebigform-Bildsignals erhalten wurde, welches zu je einem von
mehreren Objekten gehört, aus denen sich ein Bild eines Displaybildes zusammensetzt. Das
kodierte Beliebigformsignal 500 umfasst ein 32-Bit-Synchronsignal 501 am Anfang, einen
auf das Signal 501 folgenden 1-Bit-Forrm-Identifikator (Bild-Identifikator) 502 und einen auf
den Identifikator 502 folgenden zusätzlichen Datenkopf 503. In der Figur wird der Form-
Identifikator 502 durch "SID" gekennzeichnet.
-
Im Weiteren umfasst das kodierte Formsignal 500 kodierte Form-Bitströme 51A, die
durch Kodieren eines Formsignals erhalten wurden, das als ein Bestandteil des
Beliebigform-Bildsignals die Form eines jeden Objekts darstellt, und kodierte Textur-
Bitströme (kodierte Pixelwert-Bitströme) 52A, die durch Kodieren eines Textursignals
(Pixelwertsignals) erhalten wurden, das als ein Bestandteil des Beliebigform-Bildsignals ein
Leuchtdichtesignal und ein Farbdifferenzsignal zur Farbdarstellung eines jeden Objekts
enthält. Im Einzelnen sind im kodierten Beliebigformsignal 500 für jeden der Blöcke, in die
eine Objektregion, welche ein Objekt auf einem Displaybild umfasst, unterteilt ist, ein
kodierter Form-Bitstrom 51a und ein kodierter Textur-Bitstrom 52A in dieser Reihenfolge
angeordnet.
-
Genauer gesagt sind anschließend an den Datenkopf 503 ein kodierter Form-
Bitstrom 51A1 sowie ein kodierter Textur-Bitstrom 52A1, die zu einem Block A1 gehören,
ein kodierter Form-Bitstrom 51A2 sowie ein kodierter Textur-Bitstrom 52A2, die zu einem
Block A2 gehören, und ein kodierter Form-Bitstrom 51A3 sowie ein kodierter Textur-Bitstrom
52A3, die zu einem Block A3 gehören, angeordnet.
-
Im Weiteren umfassen die kodierten Form-Bitströme 51A1, 51A2 und 51A3 jeweils
längenvariant kodierte Daten 504, 509 und 514, die zu Form-Bewegungsvektoren (in Fig.
1(a) "Form-BV") gehören und längenvariant kodierte Daten 505, 510 und 515, die zu binären
Formsignalen gehören, von denen jedes anzeigt, ob Pixel im Block innerhalb des Objekts
oder außerhalb des Objekts liegen (in der Figur "Formdaten").
-
Die kodierten Textur-Bitströme 52A1, 52A2 und 52A3 umfassen jeweils 5-Bit-kodierte
Daten 506, 511 und 516, die zu den Quantisierungsskalen gehören (in Fig. 1(a)
"Quantisierungsskala"), längenvariant kodierte Daten 507, 512 und 517, die zu den Textur-
Bewegungsvektoren gehören (in der Figur "Textur-BV") und längenvariant kodierte Daten
508, 513 und 518, die zu quantisierten Signalen gehören, welche aus dem Textursignal
durch Ausführen von DCT und Quantisierung erhalten wurden (in der Figur "Textur-DCT-
Koeffizienten").
-
Das Synchronsignal 501 ist ein Signal, das den Kopf eines zu einem Objekt
gehörenden kodierten Beliebigformsignals anzeigt, und es ist ein einmalig kodiertes Signal.
-
Der Form-Identifikator (SID) 502 ist ein Signal zur Anzeige, ob sowohl kodierte Form-
Bitströme als auch als auch kodierte Textur-Bitströme im kodierten Bildsignal enthalten sind
oder nicht. Ist der Wert des Form-Identifikators (SID) gleich 0, dann wird angezeigt, dass
sowohl kodierte Form-Bitströme als auch kodierte Textur-Bitströme im kodierten Bildsignal
vorliegen. Bei SID = 1 zeigt der Form-Identifikator an, dass nur die kodierten Form-Bitströme
im kodierten Signal vorliegen. Deshalb ist in der Datenstruktur von Fig. 1(a) der Form-
Identifikator (SID) 502 gleich 0. Der Datenkopf 503 enthält Informationen z. B. über den
Wiedergabezeitpunkt des Bildes eines zugehörigen Objekts, zum Attribut des Bildes und
zum Vorhersagemodus für die Kodierung. Diese Daten haben jedoch keinen Bezug zur
vorliegenden Erfindung und erfordern deshalb keine ausführliche Beschreibung.
-
Der Form-BV besteht aus den kodierten Daten eines Bewegungsvektors, der die
Bewegung eines Bildes in einem Block zwischen dem vorliegenden und dem
vorhergehenden Rahmen darstellt und zur Vorhersage eines Formsignals eines bestimmten
Blocks im vorliegenden Rahmen aus dem Formsignal des entsprechenden Blocks im
vorhergehenden Rahmen verwendet wird. Ferner werden die Formdaten durch
arithmetisches Kodieren eines Formsignals erhalten, und die Quantisierungsskala ist ein
Parameter für das inverse Quantisieren von DCT-Koeffizienten, die aus einem Textursignal
mittels DCT und Quantisierung erhalten werden. Der Textur-BV besteht aus den kodierten
Daten eines Textur-Bewegungsvektors, der die Bewegung eines Bildes in einem Block
zwischen dem vorliegenden und dem vorhergehenden Rahmen darstellt und zur Vorhersage
eines Textursignals im vorliegenden Rahmen aus einem Textursignal im vorhergehenden
Rahmen verwendet wird. Ferner werden die Textur-DCT-Koeffizienten durch längenvariante
Kodierung des quantisierten Textursignals erhalten.
-
Obwohl diese Daten in der Figur nicht dargestellt sind, werden im kodierten
Beliebigformsignal 500 vor den Textur-DCT-Koeffizienten auch viele Nebeninformationen
(Daten) untergebracht, und diese Nebendaten erfordern manchmal eine große Anzahl von
Bits.
-
Fig. 1(b) zeigt eine Datenstruktur eines kodierten Binärsignals, das durch Kodieren
eines binären Bildsignals erhalten wurde. Die Bezugsziffer 600 in Fig. 1(b) kennzeichnet ein
kodiertes Binärsignal, das durch Kodieren eines binären Bildsignals S2 erhalten wurde,
welches die Bildinformation auf einem Displaybild als ein Binärsignal repräsentiert. Das
kodierte Binärsignal 600 enthält am Anfang ein 32-Bit-Synchronsignal 601, einen auf das
Synchronsignal 601 folgenden 1-Bit-Form-Identifikator 602 und einen auf den Form-
Identifikator 602 folgenden zusätzlichen Datenkopf 603. (m Weiteren enthält das kodierte
Binärsignal 600 kodierte Form-Bitströme 61B, die durch Kodieren der Formsignale erhalten
wurden, welche das binäre Bildsignal S2 bilden. In Fig. 1(b) wird der Form-Identifikator durch
SID gekennzeichnet.
-
Im Einzelnen sind - entsprechend den jeweiligen Blöcken, in die das Displaybild
unterteilt ist - die kodierten Form-Bitströme 61B im kodierten binären Formsignal 600
nacheinander angeordnet. Genauer gesagt sind die kodierten Form-Bitströme 61B1, 61B2,
61B3, 61B4, 61B5, ..., die jeweils den Blöcken B1, B2, B3, B4, B5, ... zugeordnet sind, in
dieser Reihenfolge angeordnet.
-
Im Weiteren enthalten die kodierten Form-Bitströme 61B1-61B5 längenvariant
kodierte Daten 604, 606, 608, 610 und 612, die zu den Form-Bewegungsvektoren (in der
Figur "Form-BV") gehören bzw. längenvariant kodierte Daten 605, 607, 609, 611 und 613,
die zu den Formsignalen gehören, welche das Bild im Displaybild durch Binärsignale
repräsentieren (in der Figur "Formdaten").
-
Das Synchronsignal 601, der Form-Identifikator (SID) 602 und der Datenkopf 603
sind jeweils identisch mit dem Synchronsignal 501, dem Form-Identifikator (SID) 502 und
dem Datenkopf 503 im kodierten Beliebigformsignal 500, und die Daten der Blöcke B1-B5
... sind nur die kodierten Form-Bitströme. Da das kodierte Binärsignal 600 keine kodierten
Textur-Bitströme enthält, ist der Form-Identifikator (SID) 602 gleich 1.
-
In dieser ersten Ausführungsform sind der Form-Identifikator (SID) 502 im kodierten
Beliebigformsignal 500 und der Form-Identifikator 602 im kodierten Binärsignal 600 für jeden
Rahmen jeweils in den kodierten Signalen 500 bzw. 600 angeordnet.
-
Wie in den Fig. 1(a) und 1(b) dargestellt, ist die Bitzahl der kodierten Daten von Form-
oder Textursignal variabel, weil die zur Kodierung erforderliche Bitzahl je nach dem Bild, das
im Displaybild oder im Block des Displaybilds enthalten ist, unterschiedlich ist. Deshalb ist es
unmöglich, die Lage der Quantisierungsskala 506, d. h. die Zahl der Bits zwischen dem Kopf
der Formdaten 505 und der Quantisierungsskala 506, vorherzusagen. Ferner kann nicht
ohne den Form-Identifikator 502 entschieden werden, ob der kodierte Textur-Bitstrom 52A
nach dem kodierten Form-Bitstrom 51A angeordnet ist oder nicht. Deshalb ist es bei einer
Kodierung und Übertragung des Formsignals ohne den Form-Identifikator unumgänglich,
einen kodierten Blind-Textur-Bitstrom zwischen die kodierten Form-Bitströme angrenzender
Blöcke einzufügen, aber das Einfügen das kodierten Blind-Textur-Bitstroms erhöht die
Bitzahl bei der Kodierung des Formsignals. Übrigens kann ein Form-Identifikator auch am
Kopf der gesamten Bildsequenz angeordnet werden, statt ihn dem Datenkopf eines jeden
Bildes zuzuordnen, oder er kann einer Anzahl von Bildern zugeordnet werden.
-
In MPEG4 können außer dem Beliebigform-Bildsignal und dem binären Bildsignal
Transparenz-Informationen verarbeitet werden, welche die Transparenz eines jeden Pixels
wiedergeben. Derartige Transparenz-Informationen werden gewöhnlich durch ein Signal von
3 oder mehr Bits ausgedrückt, und dieses kann in ein Binärsignal als Form-Information
(binäres Transparenzsignal) und ein mehrwertiges Transparenzsignal zerlegt werden, das
die Transparenz-Informationen unter Ausschluss der Form-Information wiedergibt. In diesem
Falle kann das mehrwertige Transparenzsignal in der gleichen Weise wie ein Textursignal
behandelt werden.
-
Im Weiteren wird ein Prozess zur Kodierung eines Formsignals und eines
Textursignals beschrieben, wobei die Signale Komponenten eines Beliebigform-Bildsignals
sind.
-
Zu Beginn wird mit Bezug auf ein Formsignal eine Objektregion, die ein Objekt auf
dem Displaybild umfasst, in eine Anzahl von Blöcken (Formblöcke) unterteilt, und das
Formsignal wird blockweise kodiert. In dieser ersten Ausführungsform ist jeder Formblock
ein Abbildungsbereich, der 16 · 16 Muster (Pixel) umfasst, und ein zu jedem Block
gehörendes Formsignal wird durch das in JBIG verwendete arithmetische
Kodierungsverfahren kodiert.
-
Mit Bezug auf ein Textursignal wird - wie oben beschrieben - eine Objektregion, die
ein Objekt auf dem Displaybild enthält, in eine Anzahl von Blöcken (Texturblöcke) unterteilt,
und das Textursignal wird blockweise kompressiv kodiert. In dieser ersten Ausführungsform
ist jeder Texturblock ein Abbildungsbereich, der 16 · 16 Muster (Pixel) umfasst. Im
kompressiven Kodierungsprozess werden DCT und Quantisierung wie folgt ausgeführt. Der
Texturblock wird in vier Abbildungsbereiche (Unterblöcke) unterteilt, von denen jeder 8 · 8
Muster (Pixel) umfasst, und für das Textursignal werden DCT und Quantisierung -
Unterblock auf Unterblock folgend - ausgeführt. Dann werden die vom oben beschriebenen
Prozess gelieferten quantisierten Signale längenvariant kodiert, um kodierte Textur-
Bitströme zu erzeugen.
-
Die so erzeugten kodierten Form- und Textur-Bitströme werden zusammen mit
anderen benötigten Signalen gemultiplext, wodurch ein kodiertes Beliebigformsignal 500
erzeugt wird, das die in Fig. 1(a) dargestellte Datenstruktur hat.
-
Im Weiteren ist ein Prozess zur Kodierung eines Formsignals - als eines Bestandteils
eines binären Bildsignals - in JBIG nahezu identisch mit dem oben beschriebenen
Signalkodierungsverfahren, das für MPEG4 eingesetzt wird.
-
Das heißt, ein Displaybild wird in eine Anzahl von Blöcken (Formblöcke) unterteilt,
und das Formsignal wird blockweise kodiert, wodurch ein kodiertes Binärsignal 600 erzeugt
wird, das eine in Fig. 1(b) dargestellte Datenstruktur aufweist. In dieser ersten
Ausführungsform ist der Formblock ein 16 · 16 Muster (Pixel) umfassender
Abbildungsbereich. Ein zu jeden Formblock zugehöriges Formsignal wird mit dem in JBIG
verwendeten arithmetischen Kodierungsverfahren kodiert.
-
Wie oben beschrieben wurde, enthält in der ersten Ausführungsform der Erfindung
das zu einem binären Bildsignal gehörende kodierte Binärsignal die kodierten Form-
Bitströme 61B, die durch Kodieren des ein Binärinformations-Displaybild repräsentierenden
Formsignals erhalten wurden, und den Form-Identifikator 602 für die Anzeige, dass nur die
kodierten Form-Bitströme als Wiedergabedaten enthalten sind, so dass eine Analyse eines
keine kodierten Textur-Bitströme enthaltenden kodierten Binärsignals durch Bezugnahme
auf den Bild-Identifikator möglich ist, wobei ein Datenanalyseverfahren verwendet wird, das
für ein kodiertes Signal geeignet ist, welches kodierte Textur-Bitströme enthält.
-
Genauer gesagt kann ein kodiertes Signal eines binären Bildsignals (kodiertes
Binärsignal), das nur ein Formsignal als Wiedergabeinformation enthält, unter Verwendung
eines Datenanalyseverfahrens analysiert werden, das für die Analyse von einem kodierten
Signal eines Beliebigform-Bildsignals (kodiertes Beliebigformsignal) vorgesehen ist, das
sowohl ein Formsignal als auch Textursignal (Pixelwertsignal) enthält. Deshalb kann selbst
dann, wenn beim Kodieren des binären Bildsignals nicht jedem kodierten Form-Bitstrom ein
kodierter Blind-Pixelwert-Bitstrom hinzugefügt wird, der kodierte Form-Bitstrom des
Binärsignals mit dem auf MPEG4 basierenden Dekodierungsprozess dekodiert werden. Das
heißt, sowohl das binäre Bildsignal als auch das Beliebigform-Bildsignal können ohne eine
Vergrößerung der Anzahl der Bits im Kodierungsprozess mit Hilfe einer Bild-
Dekodiervorrichtung dekodiert werden, die einem einzigen Kodierungsverfahren angepasst
ist.
-
Wie oben beschrieben wurde, verwendet die erste Ausführungsform der Erfindung
das kodierte Beliebigformsignal 500 und das kodierte Binärsignal 600, die durch eine Inter-
Rahmen-Vorhersagekodierung erhalten wurden, als ein kodiertes Beliebigformsignal bzw.
ein kodiertes Binärsignal. Es braucht nicht betont zu werden, das ein mittels Intra-Rahmen-
Kodierung erzeugtes kodiertes Beliebigformsignal eine Datenstruktur aufweist, bei der die
Form- und Textur-Bewegungsvektoren aus dem kodierten Beliebigformsignal 500
ausgeschlossen sind, während ein mittels Intra-Rahmen-Kodierung erzeugtes kodiertes
Binärsignal eine Datenstruktur hat, bei der die Form-Bewegungsvektoren aus dem kodierten
Binärsignal 600 ausgeschlossen sind.
-
Im Weiteren verwendet die erste Ausführungsform der Erfindung das kodierte
Beliebigformsignal 500, in dem für jeden Block ein kodierter Form-Bitstrom und ein kodierter
Textur-Bitstrom vorhanden sind, und das kodierte Binärsignal 600, in dem für jeden Block
ein kodierter Form-Bitstrom vorhanden ist, als ein kodiertes Beliebigformsignal bzw. ein
kodiertes Binärsignal. Jedoch ist ein kodiertes Signal mit einer Datenstruktur zur
Bildübertragung gemäß der Erfindung nicht auf die in Fig. 1(a) und 1(b) dargestellten
Strukturen beschränkt.
-
Zum Beispiel kann ein kodiertes Beliebigformsignal 500b mit einer in Fig. 2(a)
dargestellten Datenstruktur verwendet werden, wobei die Datenstruktur für jeden Rahmen
ein Synchronsignal 501, einen Form-Identifikator (SID) 502, einen zusätzlichen Datenkopf
503, ein Formdatenteil 51 und ein Texturdatenteil 52 umfasst. Ferner kann ein kodiertes
Binärsignal 600b mit einer in Fig. 2(b) dargestellten Datenstruktur verwendet werden, wobei
die Datenstruktur für jeden Rahmen ein Synchronsignal 601, einen Form-Identifikator (SID)
602, einen zusätzlichen Datenkopf 603 und ein Formdatenteil 61 umfasst.
-
Wie in Fig. 1(a) dargestellt ist, wird der Formdatenteil 51 für einen Rahmen durch
Sammeln der zu den jeweiligen Blöcken im kodierten Beliebigformsignal gehörenden Form-
Bitströme gebildet. Wie in Fig. 1(a) dargestellt ist, wird der Texturdatenteil 52 für einen
Rahmen durch Sammeln der zu den jeweiligen Blöcken im kodierten Beliebigformsignal
gehörenden Textur-Bitströme gebildet. Ferner wird, wie in Fig. 1(b) dargestellt ist, der
Formdatenteil 61 für einen Rahmen durch Sammeln der zu den jeweiligen Blöcken im
kodierten Binärsignal gehörenden Form-Bitströme gebildet.
[Ausführungsform 2]
-
Fig. 3 ist ein Blockschema zur Darstellung einer Bild-Kodiervorrichtung nach einer
zweiten Ausführungsform der vorliegenden Erfindung. Die Bezugsziffer 100a in Fig. 3
bezeichnet eine Bild-Kodiervorrichtung, die ein kodiertes Bildsignal mit einer Datenstruktur
zur Bildübertragung gemäß der ersten Ausführungsform der Erfindung erzeugt. Diese
Vorrichtung 100a ist wie folgt aufgebaut. Wenn die Vorrichtung 100a als ein Eingangs-
Bildsignal Sin ein binäres Bildsignal S2 zur Darstellung eines Binärbildes von einem Scanner
eines Fax-Gerätes empfängt, dann gibt sie ein in Fig. 1(b) dargestelltes kodiertes Binärsignal
(E2) 600 als ein kodiertes Bildsignal Eo aus. Wenn die Vorrichtung 100a aber als ein
Eingangs-Bildsignal Sin ein binäres Bildsignal Sp von einer Videokamera oder einem
Bildreproduktionsgerät empfängt, dann gibt sie ein in Fig. 1(a) dargestelltes kodiertes
Beliebigformsignal (Ep) 500 als ein kodiertes Bildsignal Eo für jedes Objekt aus.
-
Die Bild-Kodiervorrichtung 100a umfasst eine Bild-Eingabeeinheit 110, welche einen
Vorkodierungsprozess am einlaufenden Bildsignal Sin ausführt, um ein binäres Formsignal
und ein Textursignal zu erzeugen, und ein Schaltsteuersignal Swa ausgibt; eine Form-
Kodiereinheit (erste Kodierungshilfsmittel) 120, die für das Formsignal einen arithmetischen
Kodierungsprozess ausführt; eine Textur-Kodiereinheit (zweite Kodierungshilfsmittel) 130,
die für das Textursignal einen Kodierungsprozess einschließlich DCT ausführt; einen
Schalter 101a, der die Ausgabedaten aus der Bild-Eingabeeinheit 110 entsprechend dem
Schaltsteuersignal SWa an eine der Kodiereinheiten 120 und 130 weiterleitet; und einen
Rahmen-Speichermodul 102, der ein Vorhersage-Formsignal und ein Vorhersage-
Textursignal speichert.
-
Die Bild-Eingabeeinheit 110 ist wie folgt aufgebaut. Die Bild-Eingabeeinheit 110
unterscheidet zwischen einem binären Bildsignal von einem Scanner oder dergleichen und
einem digitalen Videosignal von einer Kamera oder einer Bildaufzeichnungs-/-
vviedergabeeinheit (VTR), und das binäre Bildsignal wird einem Schwellwertvergleich
unterzogen, um ein Formsignal zu erzeugen, wohingegen das digitale Videosignal einem
Chroma-Key-Prozess unterzogen wird, um ein Textursignal zu erzeugen. Im Chroma-Key-
Prozess wird ein zu jedem Objekt eines Displaybildes gehörendes Beliebigform-Bildsignal
von einem Bildsignal eines Hintergrundbildes separiert. Das separierte Beliebigform-
Bildsignal wird verarbeitet, um ein die Form des Objekts darstellendes Formsignal und ein
Textursignal für die Gradations-Farbdarstellung des Bildes zu erzeugen, das ein
Leuchtdichte- und ein Farbdifferenzsignal einschließt. Im Weiteren gibt die Bild-
Eingabeeinheit 110 ein Identifikatorsignal (Bild-Identifikator) Sdis aus, das anzeigt, welches
Signal - das binäre Bildsignal oder das Beliebigform-Bildsignal - bearbeitet wird.
-
Im Einzelnen umfasst, wie in Fig. 7(a) dargestellt ist, die Bild-Eingabeeinheit 110 eine
Identifikator-Einheit 111, die entscheidet, ob der digitale Bild-Eingang Sin aus einem binären
Bildsignal oder einem Beliebigform-Bildsignal besteht, und dieses Signal separiert; eine
Schwellwert-Vergleichseinheit 112, die für jeden der Blöcke, in die das Displaybild unterteilt
ist, einen Schwellwertvergleich für das binäre Bildsignal ausführt und somit ein binäres
Formsignal erzeugt; eine Chroma-Key-Einheit 113, die für jede Objektregion, die jedem
Objekt auf dem Displaybild zugeordnet ist, den Chroma-Key-Prozess für das Beliebigform-
Bildsignal ausführt und somit ein binäres Formsignal und ein mehrwertiges Textursignal
erzeugt sowie ein Zeitsignal T ausgibt, wenn die Bearbeitung des Textursignals
abgeschlossen ist; und einen Schaltersteuerungs-Schaltkreis 114, der den Schalter 101a mit
Hilfe des Schaltsteuersignals SWa - basierend auf dem Identifikatorsignal Sdis von der
Identifikator-Einheit 111 und dem Zeitsignal T von der Chroma-Key-Einheit 113 - steuert.
-
Die Form-Kodiereinheit 120 umfasst: einen Form-Bewegungsdetektor 121, der das
zum Binärbild gehörende Formsignal S2k oder das zum Beliebigform-Bild gehörende
Formsignal Spk empfängt und für jeden Block einen Form-Bewegungsvektor Skv mittels
Blockabstimmung oder dergleichen erzeugt, wobei er sich auf das Formsignal eines
Rahmens bezieht, der vor dem gerade bearbeiteten Rahmen liegt; und einen Form-
Bewegungskompensator 123, der den Form-Bewegungsvektor Skv auf eine Adresse des
Rahmen-Speichermoduls 102a hin transformiert und - auf dieser Adresse basierend - ein
Vorhersage-Formsignal Ekm aus dem Form-Speichermodul 102a erhält. Ferner umfasst die
Form-Kodiereinheit 120 einen arithmetischen Kodierer 122, der das Formsignal Sk aus dem
Schalter 101a blockweise mit Hilfe eines arithmetischen Kodierungsprozesses unter
Verwendung des Vorhersage-Formsignals Ekm kodiert, wodurch er zu jedem Block einen
dazugehörigen kodierten Form-Bitstrom Ek erzeugt, und einen arithmetischen Dekoder 124,
der den kodierten Form-Bitstrom Ek mit einem arithmetischen Dekodierungsprozess unter
Verwendung des Vorhersage-Formsignals Ekm dekodiert. Die Ausgabedaten Ekd des
arithmetischen Dekoders 124 werden im Speichermodul 102a gespeichert.
-
Die Textur-Kodiereinheit 130 umfasst: einen Textur-Bewegungsdetektor 131, der das
Textursignal Spt empfängt und durch Blockabstimmung oder dergleichen für jeden Block
einen Textur-Bewegungsvektor Stv erzeugt, wobei er sich auf das Textursignal eines
Rahmens bezieht, der vor dem jeweils gerade bearbeiteten Rahmen liegt; und einen Textur-
Bewegungskompensator 132, der den Textur-Bewegungsvektor Stv auf eine Adresse des
Rahmen-Speichermoduls 102a hin transformiert und basierend auf dieser Adresse ein
Vorhersage-Textursignal Epm aus dem Speichermodul 102a erhält. Im Weiteren umfasst die
Textur-Kodiereinheit 130 einen ersten Addierer 133, der das Textursignal Spt und das
Vorhersage-Textursignal Epm zusammenfügt; einen Kosinus-Transformator 134, der an den
Ausgabedaten Sad1 des Addierers 133 eine blockweise DCT ausführt, wodurch die DCT-
Koeffizienten Edct erzeugt werden; und einen Quantisierer 135 zur blockweisen
Quantisierung der DCT-Koeffizienten Edct.
-
Außerdem enthält die Textur-Kodiereinheit 130 einen Längenvariant-Kodierer 139,
der die Ausgabedaten Eq vom Quantisierer 135 blockweise längenvariant kodiert, wodurch
er zu jedem Block einen zugehörigen kodierten Textur-Bitstrom Ep erzeugt; einen Invers-
Quantisierer 136, der eine inverse Quantisierung der Ausgabedaten Eq vom Quantisierer
135 ausführt; einen Umkehr-Kosinus-Transformator 137, der eine Umkehr-DCT der
Ausgabedaten Eiq des Invers-Quantisierers 136 ausführt; und einen zweiten Addierer 138,
der die Ausgabedaten Eidct des Umkehr-Kosinus-Transformators 137 und das Vorhersage-
Textursignal Epm zusammenfügt. Die Ausgabedaten Sad2 des zweiten Addierers 138
werden im Rahmen-Speichermodul 102a als ein Vorhersage-Textursignal gespeichert.
-
Die Bild-Kodiervorrichtung 100a enthält ferner einen Multiplexer 150, der den Form-
Identifikator Sdis von der Bild-Eingabeeinheit 110, den Form-Bewegungsvektor Skv sowie
den kodierten Form-Bitstrom Ek von der Form-Kodiereinheit 120, und den Textur-
Bewegungsvektor Stv sowie den kodierten Textur-Bitstrom Ept von der Textur-Kodiereinheit
130 zusammen mit anderen benötigten Daten multiplext. Der Multiplexer 150 ist wie folgt
aufgebaut. Bei einer Eingabe eines binären Bildsignals S2 multiplext der Multiplexer 150 den
Form-Identifikator Sdis und den kodierten Form-Bitstrom aus der Form-Kodiereinheit 120
zusammen mit anderen benötigten Daten und gibt das in Fig. 1(b) dargestellte kodierte
Binärsignal (E2) 600 aus. Bei einer Eingabe des Beliebigform-Bildsignals Sp multiplext der
Multiplexer 150 den Form-Identifikator Sdis, den kodierten Form-Bitstrom aus der Form-
Kodiereinheit 120 und den kodierten Textur-Bitsstrom aus der Textur-Kodiereinheit 130
zusammen mit anderen benötigten Daten und gibt das in Fig. 1(a) dargestellte kodierte
Beliebigformsignal (Ep) 500 aus.
-
Eine Beschreibung der Arbeitsweise der Bild-Kodiervorrichtung 100a wird gegeben.
-
Fig. 4 ist ein Flussdiagramm zur Darstellung des Kodierungsprozesses durch die Bild-
Kodiervorrichtung gemäß der zweiten Ausführungsform der Erfindung.
-
Bei der Eingabe eines digitalen Bildsignals Sin in die Bild-Kodiervorrichtung 100a
(Schritt Sa1) entscheidet die Bild-Eingabeeinheit 110, ob die digitale Bildeingabe Sin ein
binäres Bildsignal ist, das nur ein Formsignal enthält und das von einem Scanner
ausgegeben wurde, oder ob es ein digitales Videosignal ist, das sowohl ein Formsignal als
auch ein Textursignal enthält und das von einer Kamera oder einem Bildaufzeichnungs-/-
wiedergabegerät (VTR) stammt (Schritt Sa2).
-
Ist die digitale Bildeingabe Sin ein binäres Bildsignal, dann erzeugt die Bild-
Eingabeeinheit 110 als Bild-Identifikator (SLD) ein 1-Bit-Identifikatorsignal mit einem Wert "1"
(Schritt Sa3) und gewinnt durch Schwellwertvergleich der digitalen Bildeingabeinformation
Sin ein binäres Formsignal Sk2. Zu diesem Zeitpunkt wird der Schalter 101a durch das
Schaltsteuersignal SWa so gesteuert, dass das Formsignal S2k in die Form-Kodiereinheit
120 eingegeben wird und die Form-Kodiereinheit 120 ein arithmetisches Kodieren des
Formsignals S2k ausführt (Schritt Sa4).
-
Das heißt, der Form-Bewegungsdetektor 121 in der Form-Kodiereinheit 120 erzeugt
aus dem Formsignal S2k für jeden Block einen Form-Bewegungsvektor Skv. Genauer
gesagt wird das gerade bearbeitete Formsignal des vorliegenden Rahmens mittels
Blockabstimmung mit dem Formsignal des vorhergehenden Rahmens verglichen, wodurch
eine Bewegung des Bildes zwischen dem vorliegenden und dem vorhergehenden Rahmen
erkannt wird, und die Bewegungsinformation wird als Bewegungsvektor Skv bereitgestellt.
Diese Bewegungsdetektion wird ausführlicher z. B. in USP (US Patent) Nr. 4897720
beschrieben. Bei der Eingabe des Form-Bewegungsvektors Skv in den Form-
Bewegungskompensator 123 transformiert der Kompensator 123 den Form-
Bewegungsvektor Skv auf eine Adresse des Rahmen-Speichermoduls 102a und ruft
entsprechend der Adresse aus dem Rahmen-Speichermodul 102a ein Vorhersage-
Formsignal Ekm ab. Bei der Eingabe des Vorhersage-Formsignals Ekm und des
Formsignals Sk2 aus der Bild-Eingabeeinheit 110 in den arithmetischen Kodierer 122 führt
der arithmetische Kodierer 122 einen arithmetischen Kodierungsprozess am Formsignal S2k
aus, der auf dem Vorhersage-Formsignal Ekm basiert, und gibt Formdaten (kodierter Form-
Bitstrom 61B) E2k aus, die durch Kodieren des Formsignals S2k erhalten wurden. Das
arithmetische Kodierungsverfahren wird ausführlicher in der Beschreibung des JBIG-
Standards dargestellt. Zu dieser Zeit werden im arithmetischen Dekoder 124 in einem
arithmetischen Dekodierungsprozess unter Verwendung des Vorhersage-Formsignals Ekm
die Formdaten E2k als dekodierte Formdaten Ekd reproduziert und die dekodierten
Formdaten Ekd werden im Rahmen-Speichermodul 102a gespeichert.
-
Danach werden der Form-Identifikator Sdis, der Form-Bewegungsvektor Skv und die
Formdaten E2k im Multiplexer 150 gemultiplext und die Multiplex-Daten vom
Ausgabeterminal 150a einer Datenübertragungseinheit übergeben (Schritt Sa5).
-
In der Bild-Kodiervorrichtung 100a entscheidet eine Steuereinheit (nicht dargestellt)
darüber, ob die in den Schritten Sa2-Sa5 verarbeiteten Daten die Daten des letzten Blocks
im letzten Rahmen sind oder nicht (Schritt Sa10), wobei dann, wenn die verarbeiteten Daten
nicht die Daten des letzten Blocks im letzten Rahmen sind, der Prozess durch die Bild-
Kodiervorrichtung 100a zum Schritt Sa2 zurück verwiesen wird. Sind es die Daten des
letzten Blocks im letzten Rahmen, dann ist der Bild Kodierungsprozess beendet.
-
Wird jedoch im Schritt Sa2 entschieden, dass die digitale Bildeingangsinformation Sin
ein Beliebigform-Bildsignal Sp ist, das ein Form- und ein Textursignal enthält, so wird ein 1-
Bit-Identifikatorsignal Sdis mit dem Wert "0" als ein Form-Identifikator (SID) in der Bild-
Eingabeeinheit 110 erzeugt (Schritt Sa6), und außerdem werden durch den Chroma-Key-
Prozess der digitalen Bildeingabeinformation Sin ein Formsignal Spk und ein Textursignal
Spt erzeugt. Zu dieser Zeit wird der Schalter 101a durch das von der Bild-Eingabeeinheit
110 ausgegebene Schaltsteuersignal SWa so gesteuert, dass das Formsignal Spk in die
Form-Kodiereinheit 120 eingegeben wird, während das Textursignal Spt in die Textur-
Kodiereinheit 130 eingegeben wird.
-
Dadurch wird in der Form-Kodiereinheit 120 das Formsignal Spk des Beliebigform-
Bildsignals Sp in der gleichen Weise arithmetisch kodiert, wie es oben für das Formsignal
S2k des binären Bildsignals S2 beschrieben wurde (Schritt Sa7). In der Textur-Kodiereinheit
130 wird die Kodierung des Textursignals Spt ausgeführt (Schritt Sa8).
-
Genauer gesagt extrahiert der Textur-Bewegungsdetektor 131 in der Textur-
Kodiereinheit 130 einen Textur-Bewegungsvektor Stv aus dem Textursignal Spt, und der
Textur-Bewegungskompensator 132 erhält aus dem Rahmen-Speichermodul 102a
entsprechend dem Bewegungsvektor Stv ein Vorhersage-Textursignal Epm. Der erste
Addierer 133 empfängt die Differenzdaten Sad1 zwischen dem Vorhersage-Textursignal
Epm und dem Textursignal Spt des einlaufenden Beliebigform-Bildsignals. Diese
Differenzdaten werden durch den Kosinus-Transformator 134 in einem Frequenzbereich in
DCT-Koeffizienten Edct transformiert, und die DCT-Koeffzienten Edct werden durch den
Quantisierer 135 quantisiert. Im Weiteren werden die quantisierten DCT-Koeffizienten Eq
durch den Längenvariant-Kodierer 139 längenvariant kodiert und dem Multiplexer 150
zugeführt. In den Multiplexer 150 wird auch der Textur-Bewegungsvektor Stv des
entsprechenden Blocks eingegeben.
-
Die quantisierten DCT-Koeffizienten Eq werden vom Invers-Quantisierer 136 invers
quantisiert, und an den Ausgabedaten Eiq des Invers-Quantisierers 136 wird durch den
Umkehr-Kosinus-Transformator 137 eine Umkehr-Kosinus-Transformation ausgeführt,
wonach sie als ein reproduziertes Textursignal Eidct dem zweiten Addierer 138 zugeführt
werden. In dem zweiten Addierer 138 werden das reproduzierte Texturdignal Eidct und das
Vorhersage-Textursignal Epm zusammengefügt, und die Summe Sad2 wird im Rahmen-
Speichermodul 102a gespeichert.
-
Ist die digitale Bildeingabeinformation ein Beliebigform-Bildsignal, dann wird der
Multiplexer 150 gespeist mit dem Form-Identifikator Sdis von der Bild-Eingabeeinheit 110,
dem Form-Bewegungsvektor Skv und den Formdaten Epk von der Form-Kodiereinheit 120,
dem Textur-Bewegungsvektor Stv und den Textur-DCT-Koeffizienten Ept von der Textur-
Kodiereinheit 130 und mit weiteren benötigten Signalen. Diese Daten sind im Multiplexer 150
in einer vorgeschriebenen Reihenfolge angeordnet, und das in Fig. 1(a) dargestellte kodierte
Beliebigformsignal (Ep) 500 wird vom Multiplexer 150 ausgegeben (Schritt Sa9).
-
Wie mit Bezug auf das binäre Bildsignal beschrieben wurde, entscheidet außerdem
eine Steuereinheit (nicht dargestellt) in der Bild-Kodiervorrichtung 100a, ob die in den
Schritten Sa6-Sa9 verarbeiteten die Daten des letzten Blocks im fetzten Rahmen gewesen
sind (Schritt Sa10). Waren die verarbeiteten Daten nicht die des letzten Blocks im letzten
Rahmen, dann werden für ein Form- und ein Textursignal, die zum nächsten Block gehören,
die Schritte Sa6-Sa9 ausgeführt. Waren die verarbeiteten Daten (Form- und Textursignal)
die des letzten Blocks im letzten Rahmen, dann ist der Kodierungsprozess durch die Bild-
Kodiervorrichtung 100a abgeschlossen.
-
Das Ausgabeterminal 150a des Multiplexers 150 ist mit einer Übertragungseinheit zur
Übertragung der kodierten Daten oder mit einer Speichereinheit zur Speicherung der
kodierten Daten verbunden, obwohl diese Einheiten in der Figur nicht dargestellt sind.
Wie oben mit Bezug auf die zweite Ausführungsform der Erfindung beschrieben
wurde, ist die Bild-Kodiervorrichtung 100a zur Kodierung einer digitalen Bildeingabe so
ausgelegt, dass sie entscheidet, ob die digitale Bildeingabe ein binäres Bildsignal oder ein
Beliebigform-Bildsignal ist, und entsprechend dem Ergebnis dieser Entscheidung gibt sie
zusammen mit dem kodierten Bildsignal ein Identifikatorsignal (Form-Identifikator) Sdis aus.
Deshalb wird in einer Dekodiervorrichtung zur Dekodierung eines kodierten Signals - von
einem binären Bildsignal oder einem Beliebigformsignal - durch den oben beschriebenen
Form-Identifikator festgestellt, ob ein einlaufendes kodiertes Signal ein kodiertes Binärsignal
ist, das keine kodierten Textur-Bitströme enthält, und der Dekodierungsprozesses kann in
seiner Form so verändert werden, dass er von einem Prozess ausgehend, der für ein
kodiertes Beliebigformsignal mit sowohl kodierten Form-Bitströmen als auch kodierten
Textur-Bitströmen geeignet ist, zu einem Prozess wird, der für das kodierte Binärsignal
geeignet ist.
-
Deshalb ist es bei der Kodierung eines binären Bildsignals, das nur ein Formsignal
enthält, nicht erforderlich, jedem kodierten Form-Bitstrom einen kodierten Blind-Textur-
Bitstrom hinzuzufügen, wobei der Blindstrom eine Dekodierung des binären Formsignals mit
einem Dekodierungsverfahren erlaubt, das für ein Beliebigformsignal eingesetzt wird. Im
Ergebnis lässt sich ein kodiertes Bildsignal mit einer Datenstruktur erzeugen, die eine
Dekodierung der nach unterschiedlichen Kodierungsverfahren kodierten Signale mit einer
Bild-Dekodiervorrichtung ermöglicht, die nur ein einziges Kodierungsverfahren einsetzt, ohne
den für den Kodierungsprozess erforderlichen Kodeumfang zu erhöhen.
[Ausführungsform 3]
-
Fig. 5 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung nach einer
dritten Ausführungsform der vorliegenden Erfindung. Die Bezugsziffer 100b in Fig. 5
kennzeichnet eine Bild-Dekodiervorrichtung, die eine Dekodierung von kodierten Daten
ausführt, die eine Datenstruktur zur Bildübertragung gemäß der ersten Ausführungsform der
Erfindung aufweisen. Diese Vorrichtung 100b ist wie folgt aufgebaut. Wenn die Vorrichtung
100b als kodierte Daten Eo ein in Fig. 1(b) dargestelltes kodiertes Binärsignal (E2) 600
empfängt, dann gibt sie als dekodierte Binärdaten Dsyn ein dekodiertes Binärsignal D2 aus.
Empfängt die Vorrichtung 100b jedoch als kodierte Daten Eo ein in Fig. 1(a) dargestelltes
kodiertes Beliebigformsignal (Ep) 500, dann gibt sie als dekodierte Bilddaten Dsyn für jedes
Objekt ein dekodiertes Beliebigformsignal Dp aus.
-
Im Einzelnen umfasst die Dekodiervorrichtung 100b einen Datenanalysator 160, der
die in das Eingabeterminal 160a einlaufenden kodierten Daten Eo analysiert und
entsprechend dem Analyseresultat ein Schaltsteuersignal SWb ausgibt; eine Form-
Dekodiereinheit (erste Dekodierhilfsmittel) 170, die einen arithmetischen
Dekodierungsprozess an den Formdaten (an dem durch Kodierung des Formsignals
erhaltenen kodierten Form-Bitstrom) ausführt; eine Textur-Dekodiereinheit (zweite
Dekodierhilfsmittel) 180, die für die Textur-DCT-Koeffizienten Ept einen
Dekodierungsprozess einschließlich einer Umkehr-DCT ausführt; einen Schalter 101b, der
entsprechend dem Schaltsteuersignal das vom Datenanalysator 160 analysierte und
ausgegebene kodierte Signal zu einer der Dekodiereinheiten 170 bzw. 180 weiterleitet; und
einen Rahmen-Speichermodul 102, der ein Vorhersage-Formsignal und ein Vorhersage-
Textursignal speichert.
-
Ist die Dekodierung des zu einem Block gehörenden kodierten Form-Bitstroms
abgeschlossen, dann erkennt die Form-Dekodiereinheit 170 das Ende des zum Block
gehörenden Form-Bitstroms Ek (E2k oder Epk) und gibt ein zum Block gehörendes
Abschlussnachweissignal Te an den Daten-Analysator 160 aus.
-
Außerdem analysiert der Datenanalysator 160 die kodierten Eingabedaten zur
Überprüfung des auf das 32-Bit-Synchronsignal am Kopf folgenden 1-Bit-Form-Identifikators,
wobei dieser der Form-Identifikator 502 im kodierten Beliebigformsignal 500 von Fig. 1(a)
oder der Form-Identifikator 602 im kodierten Binärsignal 600 von Fig. 1(b) ist. Ist der
gesetzte Wert des Form-Identifikators (SID) gleich 0, dann steuert der Datenanalysator 160
den Schalter 101b mit Hilfe des Schaltsteuersignals SWb so, dass der kodierte Form-
Bitstrom im einlaufenden kodierten Signa) in die Form-Dekodiereinheit 170 und der kodierte
Textur-Bitstrom im kodierten Signal in die Textur-Dekodiereinheit (180) eingegeben wird. Ist
der gesetzte Wert des Form-Identifikators (SID) gleich 1, dann steuert der Datenanalysator
160 den Schalter 101b über das Schaltsteuersignal SWb so, dass die einlaufenden
kodierten Daten in die Form-Dekodiereinheit 170 eingegeben werden.
-
Im Einzelnen umfasst der Datenanalysator 160, wie in Fig. 7(b) dargestellt ist, eine
Tabellen-Speichereinheit 162, die eine Dekodier-Referenztabelle enthält; einen Komparator
161, der den Bitstrom des einlaufenden kodierten Signals mit dem Bitstrom der Dekodier-
Referenztabelle vergleicht, wodurch der in den kodierten Daten enthaltene Form-
Identifikator, der kodierte Form-Bitstrom und der kodierte Textur-Bitstrom identifiziert
werden; und ein Schalter-Steuerkreis 163 zur Steuerung des Schalters 101b über ein
Schaltsteuersignal SWb in Abhängigkeit vom Vergleichsergebnis des Komparators 161 und
vom Abschlussnachweissignal Te.
-
Die Form-Dekodiereinheit (erste Dekodierhilfsmittel) 170 enthält einen Form-
Bewegungskompensator 172, der den zum Binärbild gehörenden Form-Bewegungsvektor
oder einen zum Beliebigform-Bild gehörenden Beliebigform-Bewegungsvektor empfängt,
eine Adresse des im Rahmen-Speichermodul 102b gespeicherten Vorhersage-Formsignals
entsprechend dem Bewegungsvektor erzeugt und das Vorhersage-Formsignal Emk aus dem
Rahmen-Speichermodul 102b empfängt; und einen arithmetischen Dekoder 171 zur
Dekodierung der Eingangs-Formdaten Ek mit Bezugnahme auf das Vorhersage-Formsignal
Emk, um ein reproduziertes Formsignal (dekodiertes Formsignal) Dk zu erzeugen. Das
reproduzierte Formsignal Dk wird im Rahmen-Speichermodul 102b gespeichert. Nach
Abschluss der Dekodierung eines zu einem Block gehörenden Form-Bitstroms detektiert der
arithmetische Dekoder 171 das Ende des zum Block gehörenden kodierten Form-Bitstroms
Ek (E2k oder Epk) und gibt ein Abschlussnachweissignal Te aus. Die
Bewegungskompensation wird ausführlicher im USP (US Patent) Nr. 5157742 beschrieben,
und die arithmetische Dekodierung wird in der Beschreibung von JBIG dargestellt.
-
Die Textur-Dekodiereinheit (zweite Dekodierhilfsmittel) 180 enthält einen Textur-
Bewegungskompensator 184, der entsprechend dem Textur-Bewegungsvektor eine Adresse
des Vorhersage-Textursignals erzeugt und unter Verwendung der Adresse das Vorhersage-
Textursignal Emp aus dem Rahmen-Speichermodul 102b empfängt; einen Invers-
Quantisierer 181, der die Quantisierungsskala sowie die DCT-Koeffizienten im kodierten
Textur-Bitstrom empfängt und die DCT-Koeffizienten invers quantisiert; einen Umkehr-
Kosinus-Transformator 182, der für die invers quantisierten DCT-Koeffizienten Diq eine
Umkehr-Kosinus-Transformation ausführt; und einen Addierer 183, der das Vorhersage-
Textursignal Emp und das umkehr-kosinus-transformierte Signal Didct zusammenfügt sowie
ein reproduziertes Textursignal (dekodiertes Textursignal) Dpt ausgibt. Das reproduzierte
Textursignal Dpt aus dem Addierer 183 wird im Rahmen-Speichermodul 102b gespeichert.
-
Die Bild-Dekodiervorrichtung 100b umfasst ferner einen Synthesizer 190, der eine
Synthese des reproduzierten Textursignals Dpt bzw. des entsprechenden reproduzierten
Formsignals Dk mit gewünschten Bilddaten erzeugt und an die Wiedergabeeinheit 104
synthetisierte Bilddaten Dsyn ausgibt, welche das zum kodierten Beliebigformsignal Ep
gehörende reproduzierte Beliebigformsignal Dp enthalten. Im Weiteren gibt der Synthesizer
190 das zum kodierten Binärsignal E2 gehörende reproduzierte Binärsignal D2 aus. Die
Ausgabesignale vom Synthesizer 190 werden zwar in die Wiedergabeeinheit 104
eingegeben, die Signale können aber auch in einen Drucker (nicht dargestellt) eingegeben
werden. Außerdem kann das reproduzierte Binärsignal D2 im Synthesizer 190 mit einem
weiteren Beliebigform-Bildsignal synthetisiert werden.
-
In dieser dritten Ausführungsform werden bei der Dekodierung eines Beliebigform-
Bildsignals für Pixel, für die das reproduzierte Formsignal gleich Null ist, die Pixelwerte im
reproduzierten Textursignal durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das
vorgeschriebene Bild ist ein Bild, das im Voraus an der Empfangsstation hergestellt wurde,
oder es ist ein von einer anderen Bild-Dekodiervorrichtung reproduziertes Bild.
-
Es wird eine Beschreibung der Arbeitsweise der so aufgebauten Bild-
Dekodiervorrichtung gegeben.
-
Fig. 6 ist ein Flussdiagramm des Dekodierungsprozesses durch die Bild-
Dekodiervorrichtung 100b entsprechend der dritten Ausführungsform der Erfindung. Wird ein
kodiertes Bildsignal mit einer in Fig. 1(a) oder 1(b) dargestellten Datenstruktur in die Bild-
Dekodiervorrichtung 100b eingegeben, dann analysiert der Datenanalysator 160 den auf das
32-Bit-Synchronsignal folgenden 1-Bit-Form-Identifikator und entscheidet, ob der Wert des
Form-Identifikators (SID) 1 ist oder nicht (Schritt Sb1).
-
Ist das Ergebnis der Entscheidung SID = 1, dann ist das einlaufende kodierte
Bildsignal Eo ein kodiertes Binärsignal E2, das als Bildinformation nur kodierte Form-
Bitströme enthält. Dann steuert der Datenanalysator 160 den Schalter 101b über das
Schaltsteuersignal SWb so, dass der zu jedem Block des kodierten Binärsignals gehörende
Form-Bitstrom immer in die Form-Dekodiereinheit 170 eingegeben wird. Damit werden in der
Form-Dekodiereinheit 170 die kodierten Form-Bitströme im kodierten Binärsignal dekodiert,
(Schritt Sb2).
-
Genauer gesagt wird der Form-Bewegungsvektor BV in den Form-
Bewegungskompensator 172 und den arithmetischen Dekoder 171 eingegeben. Dann
erzeugt der Form-Bewegungskompensator 172 entsprechend dem Form-Bewegungsvektor
BV eine Adresse des im Rahmen-Speichermodul 102b gespeicherten Vorhersage-
Formsignals und erhält vom Rahmen-Speichermodul 102b das Vorhersage-Formsignal Emk.
Wird das Vorhersage-Formsignal Emk in den arithmetischen Dekoder 171 eingegeben, dann
führt der arithmetische Dekoder 171 eine arithmetische Dekodierung des kodierten Form-
Bitstroms E2k mit Bezugnahme auf das Vorhersage-Formsignal Emk aus, wodurch ein
dekodiertes Binärsignal D2k erzeugt wird. Das dekodierte Binärsignal D2k wird an den
Rahmen-Speichermodul 102b und den Synthesizer 190 ausgegeben und vom Synthesizer
190 an die Wiedergabeeinheit 104 zur Bildwiedergabe weitergeleitet (Schritt Sb6). Die
Wiedergabe des dekodierten Binärsignals kann nach einer Synthese mit einem anderen
Beliebigform-Bildsignal erfolgen.
-
Danach wird entschieden, ob das dekodierte Binärsignal aus den Daten des letzten
Blocks im letzten Rahmen besteht (Schritt Sb7). Besteht das kodierte Binärsignal nicht aus
den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten
Block gehörigen binären Signal die Schritte Sb1, Sb2 und Sb6 ausgeführt. Besteht das
kodierte Binärsignal aus den Daten des letzten Blocks im letzten Rahmen, dann ist die
Dekodierung des kodierten Binärsignals beendet.
-
Andererseits enthält das einlaufende kodierte Eingabe-Bildsignal dann, wenn das
Ergebnis der Entscheidung im Schritt Sb1 SID = 0 ist, als Bildinformation kodierte Form-
Bitströme und kodierte Textur-Bitströme. Deshalb steuert der Datenanalysator 160 den
Schalter 101b über das Schaltsteuersignal SWb so, dass der zu jedem Block des kodierten
Beliebigformsignals gehörende kodierte Form-Bitstrom in die Form-Dekodiereinheit 170
eingegeben wird, während der zu jedem Block gehörende kodierte Textur-Bitstrom in die
Textur-Dekodiereinheit 180 eingegeben wird. Dadurch werden der kodierte Form-Bitstrom
und der kodierte Textur-Bitstrom voneinander separiert (Schritt Sb3), und der kodierte Form-
Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert, während der kodierte Textur-
Bitstrom durch die Textur-Dekodiereinheit 180 dekodiert wird (Schritte Sb4 und Sb5).
-
Genauer gesagt wird der kodierte Form-Bitstrom Epk - ähnlich wie der kodierte Form-
Bitstrom E2k des binären Bildsignals - durch den Form-Dekoder 170 dekodiert. Ist die
Dekodierung des zu einem Block gehörenden kodierten Form-Bitstroms Epk abgeschlossen,
dann stellt der arithmetische Dekoder 171 das Ende des zu einem Block gehörenden
kodierten Form-Bitstroms Epk fest und gibt ein Abschlussnachweissignal Te an den
Datenanalysator 160 aus. Beim Empfang des Abschlussnachweissignals Te steuert der
Datenanalysator 160 den Schalter 101b über das Schaltsteuersignal SWb so, dass das
einlaufende kodierte Bildsignal in die Textur-Dekodiereinheit 180 eingegeben wird.
-
Dadurch wird der kodierte Textur-Bitstrom Ept vom Datenanalysator 160 zur Textur-
Dekodiereinheit 180 übermittelt. In der Dekodiereinheit 180 werden die Quantisierungsskala
und die DCT-Koeffizienten im Bitstrom in den invers-Quantisierer 181 eingegeben, und für
die DCT-Koeffizienten wird eine inverse Quantisierung ausgeführt. Danach wird vom
Umkehr-Kosinus-Transformator 182 für die invers quantisierten Signale Diq eine Umkehr-
Kosinus-Transformation ausgeführt.
-
Unterdessen wird der Textur-Bewegungsvektor BV in den Textur-
Bewegungskompensator 184 eingegeben. Der Kompensator 184 erzeugt eine Adresse zur
Versorgung mit einem dem Textur-Bewegungsvektor BV entsprechenden Vorhersage-
Textursignal, und empfängt das Vorhersage-Textursignal Emp vom Rahmen-Speichermodul
102b unter Verwendung der Adresse.
-
Der Addierer 183 führt eine Addition der Ausgabedaten Didct vom Umkehr-Kosinus-
Transformator 182 und des Vorhersage-Textursignals Emp durch und gibt das dekodierte
Textursignal Dpt aus. Das dekodierte Textursignal Dpt wird in den Rahmen-Speichermodul
102b und den Synthesizer 190 eingegeben. Der Synthesizer 190 führt eine Synthese des
dekodierten und reproduzierten Textursignals Dpt und des dazugehörigen dekodierten und
reproduzierten Formsignals Dk mit einem gewünschten Bild zur Erzeugung synthetisierter
Bilddaten Dsyn aus. Beim Abschluss der Dekodierung des kodierten Textur-Bitstroms stellt
der Datenanalysator 160 das Ende des kodierten Textur-Bitstroms fest und steuert den
Schalter 101b über das Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal
in die Form-Dekodiereinheit 170 eingegeben wird.
-
Außerdem werden die reproduzierten und synthetisierten Daten vom Synthesizer 190
an die Wiedergabeeinheit 104 zur Bildwiedergabe ausgegeben (Schritt Sb6).
-
Danach wird entschieden, ob das dekodierte Beliebigformsignal aus den Daten des
letzten Blocks im letzten Rahmen besteht (Schritt Sb7). Besteht das kodierte
Beliebigformsignal nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden
an einem kodierten Beliebigformsignal des nächsten Blocks die Schritte Sb3-Sb7
ausgeführt. Besteht das kodierte Beliebigformsignal aus den Daten des letzten Blocks im
letzten Rahmen, dann ist die Dekodierung des kodierten Beliebigformsignals beendet.
-
In dieser dritten Ausführungsform werden für Pixel, für die das reproduzierte
Formsignal gleich Null ist, die Pixelwerte in dem dekodierten und reproduzierten Textursignal
durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene Bild ist ein
Bild, das im Voraus an der Empfangsstation hergestellt wurde, oder es ist ein von einer
anderen Bild-Dekodiervorrichtung reproduziertes Bild.
-
Wie oben beschrieben wurde, enthält die Bild-Dekodiervorrichtung 100b gemäß der
dritten Ausführungsform der Erfindung den Datenanalysator 160, der die kodierten
Eingabedaten analysiert. Der Datenanalysator 160 detektiert einen Form-Identifikator, der
anzeigt, ob das einlaufende kodierte Bildsignal ein kodiertes Binärsignal ist, das als
Bildinformation nur kodierte Form-Bitströme enthält, oder ob es ein kodiertes
Beliebigformsignal ist, das sowohl kodierte Form-Bitströme als auch kodierte Textur-
Bitströme umfasst, und in Abhängigkeit vom Wert des Form-Identifikators steuert der
Datenanalysator 160 den Schalter 101b so, dass der Bitstrom des einlaufenden kodierten
Signals in die Form-Dekodiereinheit 170 bzw. die Textur-Dekodiereinheit 180 eingegeben
wird. Selbst dann, wenn bei der Erzeugung eines kodierten Binärsignals nicht zu jedem
kodierten Form-Bitstrom ein kodierter Blind-Textur-Bitstrom hinzugefügt wird, kann so eine
Dekodierung des kodierten Binärsignals durch ein Dekodierungsverfahren erfolgen, das zu
einem kodierten Beliebigformsignal gehört. Wenn sowohl ein binäres Bildsignal als auch ein
Beliebigform-Bildsignal, die unterschiedliche Datenstrukturen haben, durch ein einziges
Kodierungsverfahren kodiert und diese kodierten Signale durch ein einziges
Dekodierungsverfahren dekodiert werden, dann ist es folglich möglich, Kodierung,
Übertragung und Dekodierung des binären Bildsignals effizient mit verminderter Bitzahl
auszuführen.
[Ausführungsform 4]
-
Fig. 8 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung nach einer
vierten Ausführungsform der vorliegenden Erfindung. Die Bezugsziffer 100c in Fig. 8
kennzeichnet eine Bild-Dekodiervorrichtung nach dieser vierten Ausführungsform. Die Bild-
Dekodiervorrichtung 100c enthält einen Controller 105 zusätzlich zu den Bauelementen der
Bild-Dekodiervorrichtung 100b gemäß der dritten Ausführungsform. Der Controller 105
überwacht die Beanspruchung des Dekodierungsprozesses der Textur-Dekodiereinheit 180
entsprechend dem Betriebszustand des Synthesizers 190c und gibt ein
Überlastnachweissignal Lov aus, wenn die Last über einem vorgeschriebenen Wert liegt.
-
Ferner enthält die Bild-Dekodiervorrichtung 100c an Stelle des zur dritten
Ausführungsform gehörenden Datenanalysators 160 einen Datenanalysator 166, der
entsprechend dem Abschlussnachweissignal Te und dem Überlastnachweissignal Lov ein
Schaltsteuersignal SWc erzeugt. Der weitere Aufbau des Datenanalysators 166 entspricht
dem des Datenanalysators 160. Ferner enthält die Dekodiervorrichtung 100c an Stelle des
zur dritten Ausführungsform gehörenden Schalters 101b einen Schalter 101c mit einem
Eingabeterminal Gin, in den ein kodiertes Bildsignal vom Datenanalysator 166 eingegeben
wird, und mit drei Ausgangskontakten Co1, Co2 und Co3, wobei er einen der drei Kontakte
abhängig vom Schaltsteuersignal SWc auswählt. Der Ausgangskontakt Co1 ist mit dem
Eingang des arithmetischen Dekoders 171 verbunden, der Ausgangskontakt Co2 ist
geerdet, und der Ausgangskontakt Co3 ist mit dem Eingang des Invers-Quantisierers 181
und dem Eingang des Bewegungskompensators 184 verbunden.
-
Außerdem verfügt der Controller 105 über eine Anzahl von Funktionen zur Steuerung
der gesamten Dekodiervorrichtung. Eine dieser Funktionen ist die folgende. Wenn das
Zusammenstellen eines zu einem Rahmen gehörenden Bildes innerhalb eines Zeitintervalls
zur Bildwiedergabe eines Rahmens nicht abgeschlossen ist, wobei das Zeitintervall im
Voraus festgelegt wird, dann stellt der Controller 105 fest, dass die Beanspruchung Lde des
Dekodierungsprozesses in der Dekodiereinheit 180 stark ist und gibt das Schaltsteuersignal
SWc aus.
-
Beim Eingang des Überlastnachweissignals Lov steuert der Datenanalysator 166 den
Schalter 101c über das Schaltsteuersignal SWc so, dass das Eingabeterminal Cin zwischen
den ersten Ausgangskontakt Co1 und den zweiten Ausgangskontakt Co2 geschaltet wird.
Genauer gesagt wird der Schalter 101c so gesteuert, dass der kodierte Textur-Bitstrom Ept
des kodierten Beliebigformsignals Ep in den geerdeten Kontakt eingegeben wird,
wohingegen der kodierte Form-Bitstrom Ekt des kodierten Beliebigformsignals Ep in den
arithmetischen Dekoder 171 geleitet wird.
-
Außerdem hat in dieser vierten Ausführungsform der Synthesizer 190c zusätzlich zu
der Funktion des Synthesizers 190 in der dritten Ausführungsform die folgende Funktion. Ist
der Dekodierungsprozess des kodierten Textursignals - wie oben beschrieben wurde - stark
überlastet, dann synthetisiert der Synthesizer 190c das zum vorliegenden, gerade
bearbeiteten Rahmen gehörende dekodierte Formsignal mit dem dekodierten Textursignal
des vorhergehenden Rahmens anstatt mit dem zum vorliegenden Rahmen gehörenden
dekodierten Textursignal.
-
Wird in den Datenanalysator 166 kein Überlastnachweissignal Lov eingegeben, d. h.,
ist der Bild-Dekodierungsprozess nicht stark überlastet, dann steuert der Datenanalysator
166 den Schalter 101c über ein Schaltsteuersignal SWc so, dass das Eingabeterminal Cin
mit dem ersten Ausgangskontakt Co1 bzw. dem dritten Ausgangskontakt Co3 verbunden
wird. Dadurch führt die Bild-Dekodiervorrichtung 100c gemäß der vierten Ausführungsform
Dekodierungsprozesses möglich, eine Bildwiedergabe zu realisieren, in der das
wiedergegebene Bild keine Sprünge aufweist und der Bildfluss stetig ist.
-
In dieser vierten Ausführungsform gilt es als ein Nachweis der Beanspruchung des
Dekodierungsprozesses, wenn das zu jedem Rahmen gehörende dekodierte Bildsignal zu
spät für eine rechtzeitige Wiedergabe des zum Rahmen gehörenden Bildes ist, wonach
entschieden wird, dass der Dekodierungsprozess stark überlastet ist. Das
Belastungsnachweisverfahren ist jedoch nicht darauf beschränkt.
-
Außerdem wird in dieser vierten Ausführungsform bei einer Überlastung des
Dekodierungsprozesses nur der kodierte Form-Bitstrom im kodierten Beliebigformsignal und
nicht der kodierte Textur-Bitstrom im kodierten Beliebigformsignal dekodiert. Es kann jedoch
auch nur der kodierte Textur-Bitstrom ohne eine Dekodierung des kodierten Form-Bitstroms
dekodiert werden.
-
In diesem Falle wird an Stelle des zum vorliegenden, gerade bearbeiteten Rahmen
gehörenden dekodierten Formsignals das zum vorhergehenden Rahmen gehörende
dekodierte Formsignal mit dem zum vorliegenden Rahmen gehörenden dekodierten
Textursignal synthetisiert.
[Ausführungsform 5]
-
Fig. 9 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung nach einer
fünften Ausführungsform der vorliegenden Erfindung. Die Bezugsziffer 100d in Fig. 9
kennzeichnet die Bild-Dekodiervorrichtung gemäß dieser fünften Ausführungsform. Die Bild-
Dekodiervorrichtung 100d enthält an Stelle des Controllers 105, der in der Bild-
Dekodiervorrichtung 100c gemäß der vierten Ausführungsform zum Nachweis der
Beanspruchung des Dekodierungsprozesses vorgesehen ist, ein Eingabeterminal 106, wie
z. B. eine Maus oder eine Fernsteuerung, zur Eingabe eines manuellen Steuersignals Min
von außen in die Bild-Dekodiervorrichtung 100d. An Stelle des Überlastnachweissignals Lov
wird das manuelle Steuersignal Min vom Eingabeterminal 106 in den Datenanalysator 165
eingegeben. Die anderen Teile stimmen mit den in der vierten Ausführungsform
beschriebenen überein.
-
Bei Eingang des manuellen Steuersignals Min steuert der Datenanalysator 165 den
Schalter 101c über das Schaltsteuersignal SWc so, dass das Eingabeterminal Cin mit dem
ersten Ausgangskontakt Co1 bzw. dem zweiten Ausgangskontakt Co2 verbunden wird.
Genauer gesagt wird der Schalter 101c so gesteuert, dass der kodierte Textur-Bitstrom Ept
des kodierten Beliebigformsignals Ep geerdet wird, wohingegen der kodierte Form-Bitstrom
Ekt des kodierten Beliebigformsignals Ep in den arithmetischen Dekoder 171 eingegeben
wird.
-
Wie in der vierten Ausführungsform wird auch in dieser fünften Ausführungsform
dann, wenn das manuelle Steuersignal Min zum Datenanalysator 165 hin ausgegeben wird,
an Stelle des zum vorliegenden, gerade bearbeiteten Rahmen gehörenden dekodierten
Textursignals das zum vorhergehenden Rahmen gehörende dekodierte Textursignal mit
dem zum vorliegenden Rahmen gehörenden dekodierten Formsignal synthetisiert.
-
Empfängt der Datenanalysator 165 kein manuelles Steuersignal Min, dann steuert er
den Sehalter 101c mit Hilfe des Schaltsteuersignals SWc so, dass das Eingangsterminal Cin
mit dem ersten Ausgangskontakt Co1 bzw. dem dritten Ausgangskontakt Co3 verbunden
wird. Dadurch führt die Bild-Dekodiervorrichtung 100d nach der fünften Ausführungsform
einen Bild-Dekodierungsprozess aus, der mit dem Prozess übereinstimmt, der von der Bild-
Dekodiervorrichtung 100b nach der dritten Ausführungsform ausgeführt wird.
-
Wie oben beschrieben wurde, verfügt die Bild-Dekodiervorrichtung 100d gemäß der
fünften Ausführungsform über das Eingabeterminal 106 zur Eingabe des manuellen
Steuersignals Min von außen, wie z. B. eine Maus oder eine Fernsteuerung, und die
Steuerung des Schalters 101c durch den Datenanalysator 165 wird gemäß dem manuellen
Steuersignal Min vom Eingabeterminal 106 her geändert. Deshalb kann - bis der Benutzer
eigengesteuert ein reproduziertes Bild empfängt - lediglich der kodierte Form-Bitstrom
dekodiert werden, ohne den kodierten Textur-Bitstrom zu dekodieren, und das ermöglicht es
dem Benutzer, bei der Reproduktion eines in einem Aufzeichnungsmedium aufgezeichneten
kodierten Signals schnell den Kopf des Objektbilds aufzufinden.
-
In der zweiten bis zur fünften Ausführungsform der Erfindung werden der
Kodierungs- oder der Dekodierungsprozess für das kodierte Beliebigformsignal 500 (Fig.
1(a)) und für das kodierte Binärsignal 600 (Fig. 1(b)) eingesetzt, was dem Inter-Rahmen-
Vorhersage-Kodierungsverfahren entspricht. Jedoch kann das Grundprinzip der
vorliegenden Erfindung, das darin besteht, einen Bild-Identifikator zur Identifizierung von
Bildsignalen mit unterschiedlichen Datenstrukturen, wie z. B. von einem Beliebigform-
Bildsignal und einem binäres Bildsignal, dann hinzuzufügen, wenn diese Bildsignale für die
Übermittlung kodiert werden, und den Bild-Identifikator bei der Dekodierung dieser kodierten
Signale zu detektieren, so dass der Dekodierungsprozess den kodierten Signalen, wie z. B.
einem kodierten Beliebigformsignal und einem kodierten Binärsignal, angepasst ist, auch für
das kodierte Beliebigformsignal 500b mit der in Fig. 2(a) dargestellten Datenstruktur und das
kodierte Binärsignal 600b mit der in Fig. 2(b) dargestellten Datenstruktur verwendet werden.
-
Ferner werden in der ersten bis zur fünften Ausführungsform der Erfindung als Bild-
Identifikatoren zur Identifzierung kodierter Bildsignale mit unterschiedlichen Datenstrukturen
Form-Identifikatoren (SID = 0 oder 1) verwendet, von denen jeder einen 1-Bit-Kode zur
Identifizierung eines kodierten Beliebigformsignals oder eines kodierten Binärsignals
umfasst. Es können jedoch Bild-Identifikatoren mit 2-Bit-Kodes (SID = 00, 01, 10 oder 11)
oder 3-Bit-Kodes verwendet werden. In diesem Falle ist es möglich, mehrere kodierte
Bildsignale durch Bild-Identifikatoren zu identifizieren.
-
Wird eine Anzahl von kodierten Bildsignalen mit den Bild-Identifikatoren identifiziert,
dann kann für ein vorgeschriebenes kodiertes Bildsignal ein Bild-Identifikator verwendet
werden, dessen Bitzahl sich von der Bitzahl der Bild-Identifikatoren der anderen kodierten
Bildsignale unterscheidet. Zum Beispiel kann ein kodiertes Bildsignal mit einem Bild-
Identifikator, der einen 2-Bit-Kode enthält, und ein kodiertes Bildsignal mit einem Bild-
Identifikator, der einen 3-Bit-Kode enthält, mit einem System behandelt werden, das zu
einem einzigen Kodierungsverfahren korrespondiert. In diesem Fall kann die Kode-
Zuordnung zu jedem Bild-Identifikator mit hoher Effizienz ausgeführt werden.
-
Im Folgenden werden eine Datenstruktur zur Bildübertragung und ein Bild-
Dekodierungsverfahren beschrieben, in denen Bild-Identifikatoren mit Kodes von zwei oder
mehr Bits verwendet werden.
[Ausführungsform 6]
-
Fig. 10(a)-10(c) sind schematische Darstellungen zur Erläuterung der
Datenstrukturen für die Bildübertragung gemäß einer sechsten Ausführungsform der
vorliegenden Erfindung. Fig. 10(a) zeigt eine Datenstruktur eines kodierten
Beliebigformsignals, das durch Kodierung eines Beliebigform-Bildsignals erhalten wurde,
welches zu einem von mehreren Objekten gehört, aus denen ein Displaybild besteht. Fig.
10(b) zeigt eine Datenstruktur eines kodierten Binärsignals, das durch Kodierung eines
binären Bildsignals erhalten wurde. Fig. 10(c) zeigt eine Datenstruktur eines kodierten
Rechtecksignals (kodiertes Pixelwertsignal), das durch Kodierung eines Rechteck-
Bildsignals erhalten wurde, das als Wiedergabedaten nur ein Textursignal (Pixelwertsignal)
zur Farbwiedergabe eines Bildes enthält.
-
Diese Datenstrukturen zur Bildübertragung gemäß der sechsten Ausführungsform
werden für ein System eingesetzt, in dem ein Rechteck-Bildsignal, das als Wiedergabedaten
nur ein Textursignal (d. h. Leuchtdichte- und Farbdifferenzsignal) enthält, kompressiv kodiert
und übertragen wird, und in dem außerdem das kodierte Rechteck-Bildsignal dekodiert und
wiedergegeben wird. Das heißt, in diesem System sind Bild-Kodierungsverfahren und -
vorrichtung so ausgelegt, dass sie einen Kodierungsprozess für ein Rechteck-Bildsignal
ausführen, während das Bild-Dekodierungsverfahren und -vorrichtung so ausgelegt sind,
dass sie einen Dekodierungsprozess für ein kodiertes Rechteck-Bildsignal (kodiertes
Pixelwertsignal) ausführen.
-
In Fig. 10(a) bezeichnet die Bezugsziffer 1500 ein kodiertes Beliebigformsignal, das
durch Kodierung eines Beliebigform-Bildsignals erhalten wurde, welches zu einem jeden von
mehreren Objekten gehört, aus denen ein Bild eines Displaybilds besteht. Dieses kodierte
Beliebigformsignal 1500 stimmt mit dem kodierten Beliebigformsignal 500 gemäß der ersten
Ausführungsform überein, außer dass ein Zwei-Bit-Bild-Identifikator 1502 statt des 1-Bit-Bild-
Identifikators 502 verwendet wurde.
-
In Fig. 10(b) bezeichnet die Bezugsziffer 1600 ein kodiertes Binärsignal, das durch
Kodierung eines binären Bildsignals erhalten wurde, das eine Bildinformation auf einem
Displaybild mit einem Binärsignal repräsentiert. Das kodierte Binärsignal 1600 stimmt mit
dem kodierten binären Formsignal 600 gemäß der ersten Ausführungsform überein, außer
dass ein Zwei-Bit-Bild-Identifikator 1602 statt des 1-Bit-Identifikators 602 verwendet wurde.
-
In Fig. 10(c) bezeichnet die Bezugsziffer 1700 ein kodiertes Pixelwertsignal, das ein
kodiertes Rechtecksignal ist, welches durch Kodierung eines Rechtecksignals erhalten
wurde, das Informationen über die vertikale und horizontale Größe eines Displaybilds (eines
Rahmens) enthält. Dieses kodierte Pixelwertsignal (kodiertes Rechtecksignal) 1700 stimmt
mit dem in Fig. 23(c) dargestellten kodierten Pixelwertsignal 700a überein, außer dass ein
Zwei-Bit-Bild-Identifikator 1702 zwischen dem Synchronsignal 701 und dem Datenkopf 703
eingefügt wurde.
-
Die 2-Bit-Bild-Identifikatoren (SID) 1502, 1602 und 1702 haben die entsprechenden
Werte 01, 10 und 00, und die kodierten Signale 1500, 1600 und 1700 werden anhand der
Werte dieser Bild-Identifikatoren identifiziert.
-
Es wird eine Beschreibung der Funktions- und der Wirkungsweise gegeben.
-
In der so aufgebauten sechsten Ausführungsform enthält das zum rechteckigen
Bildsignal gehörende kodierte Pixelwertsignal 1700 kodierte Textur-Bitströme 710, die durch
Kodierung eines Textursignals erhalten wurden, und einen Zwei-Bit-Bild-Identifikator 1702
zur Anzeige, dass das Signal 1700 nur die kodierten Textur-Bitströme als Wiedergabedaten
enthält. Somit kann durch Bezugnahme auf den Bild-Identifikator 1702 zwischen den drei
kodierten Signalen, d. h. dem kodierten Beliebigformsignal 1500, dem kodierten Binärsignal
1600 und dem kodierten Pixelwertsignal 1700, unterschieden werden, und das kodierte
Pixelwertsignal 1700 kann von den anderen Signalen 1500 und 1600 unterschieden werden.
-
Im Einzelnen können in einer Bild-Dekodiervorrichtung, die zu MPEG2 passt und für
die Dekodierung des kodierten Pixelwertsignals 1700 vorgesehen ist, selbst bei Eingabe des
kodierten Beliebigformsignals 1500 oder des kodierten Binärsignals 1600 diese Signale mit
Hilfe des Bild-Identifikators als Signale erkannt werden, die sich vom kodierten
Pixelwertsignal 1700 unterscheiden. Somit kann vermieden werden, dass das kodierte
Beliebigformsignal 1500 oder das kodierte Binärsignal 1600 mit dem an MPEG2
angepassten Dekodierungsprozess bearbeitet werden und der Dekodierungsbetrieb abreißt.
-
Außerdem kann bei einer Eingabe dieser kodierten Signale die Tatsache, dass diese Signale
nicht dekodierbar sind, auf dem Displaybild dargestellt werden.
-
In dieser sechsten Ausführungsform der Erfindung haben das kodierte
Beliebigformsignal 1500, das kodierte Binärsignal 1600 und das kodierte Rechtecksignal
(kodiertes Pixelwertsignal) 1700 die Datenstrukturen, die durch Inter-Rahmen-Vorhersage-
Kodierung von einem zugehörigen Beliebigform-Bildsignal, binären Bildsignal bzw.
Rechteck-Bildsignal erhalten wurden. Diese kodierten Signale können jedoch auch
Datenstrukturen haben, die durch Intra-Rahmen-Kodierung der zugehörigen Bildsignale
erhalten wurden.
-
Außerdem werden bei den in der sechsten Ausführungsform verwendeten
zugehörigen kodierten Signalen einem jeden Block der kodierte Form Bitstrom und der
kodierte Textur-Bitstrom - entweder beide oder einer von beiden - zugeordnet. In jedem
kodierten Signal können auch für jeden Rahmen vorgeschriebene kodierte Bitströme
angeordnet werden.
[Ausführungsform 7]
-
Fig. 11 ist ein Blockschema zur Veranschaulichung einer Bild-Dekodiervorrichtung
nach einer siebenten Ausführungsform der Erfindung. Die Bezugsziffer 100e in Fig. 11
kennzeichnet eine Bild-Dekodiervorrichtung für die Dekodierung kodierter Daten mit
Datenstrukturen zur Bildübertragung gemäß der sechsten Ausführungsform der Erfindung.
Diese Bild-Dekodiervorrichtung 100e ist wie folgt aufgebaut. Wenn die Vorrichtung 100e als
kodierte Daten Eo das in Fig. 10(a) dargestellte kodierte Beliebigformsignal (Ep) 1500 und
das in Fig. 10(b) dargestellte kodierte Binärsignal (E2) 1600 empfängt, dann dekodiert sie
diese kodierten Signale nicht, sondern zeigt an, dass diese gerade einlaufenden kodierten
Daten nicht dekodierbar sind. Empfängt die Vorrichtung 100e andererseits als kodierte
Daten Eo das in Fig. 10(c) dargestellte kodierte Rechtecksignal Et (1700), dann gibt sie ein
dekodiertes Rechtecksignal Dt als dekodierte Bilddaten aus.
-
Genauer gesagt enthält die Bild-Dekodiervorrichtung 100e einen Datenanalysator
160e, welcher die in das Eingabeterminal 160a einlaufenden kodierten Daten Eo analysiert
und entsprechend dem Analyseergebnis ein Schaltsteuersignal SWe ausgibt; eine Textur-
Dekodiereinheit 180e, die an dem kodierten Rechtecksignal (kodiertes Pixelwertsignal) Et
einen Dekodierungsprozess einschließlich Umkehr-DCT ausführt; einen Schalter 101e,
welcher das vom Datenanalysator 160e analysierte und ausgegebene kodierte Signal der
Dekodiereinheit 180e bzw. der Erdleitung zuführt; und einen Rahmen-Speichermodul 102e,
der ein Vorhersage-Textursignal speichert.
-
Der Datenanalysator 160e analysiert die einlaufenden kodierten Daten zur
Überprüfung des auf das 32-Bit-Synchronsignal am Kopf folgenden Zwei-Bit-Bild-
Identifikators, wobei der Bild-Identifikator entweder der in Fig. 10(a) dargestellte Bild-
Identifikator (SID = 01) 1502 im kodierten Beliebigformsignal 1500 oder der in Fig. 10(b)
dargestellte Bild-Identifikator (SID = 10) 1602 im kodierten Binärsignal oder der in Fig. 10(c)
dargestellte Bild-Identifikator (SID = 00) 1702 im kodierten Rechtecksignal ist. Ist der
gesetzte Wert des Bild-Identifikators (SID) gleich 01 oder 10, dann steuert der
Datenanalysator 160e den Schalter 101e über das Schaltsteuersignal SWe so, dass das
einlaufende kodierte Signal auf Erdleitung gelegt wird. Wenn der gesetzte Wert des Bild-
Identifikators (SID) gleich 00 ist, darin steuert der Datenanalysator 160e den Schalter 101e
über das Schaltsteuersignal SWe so, dass die einlaufenden kodierten Daten in die
Dekodiereinheit 180e eingegeben werden.
-
Im Weiteren stimmt die Struktur des Datenanalysators 160e mit der des
Datenanalysators 160 von der in Fig. 7(b) dargestellten dritten Ausführungsform überein,
und die Struktur der Textur-Dekodiereinheit 180e stimmt mit der Struktur der Dekodiereinheit
180 von der dritten Ausführungsform überein.
-
In der Bild-Dekodiervorrichtung 100e wird das dekodierte (reproduzierte)
Textursignal Dt, d. h. die Ausgabe der Dekodiereinheit 180e, unmittelbar in den Rahmen-
Speichermodul 102e und die Wiedergabeeinheit 104 eingegeben. Es kann jedoch ein
Synthesizer, der mit dem in der dritten Ausführungsform verwendeten Synthesizer 190
(siehe Fig. 5) übereinstimmt, vor der Wiedergabeeinheit 104 angeordnet werden, so dass
das dekodierte Textursignal Dt mit einem anderen dekodierten Beliebigformsignal
synthetisiert wird.
-
Es wird eine Beschreibung der Arbeitsweise der Bild-Dekodiervorrichtung 100e
gegeben.
-
Fig. 12 ist ein Flussdiagramm des Dekodierungsprozesses durch die Bild-
Dekodiervorrichtung 100e nach der siebenten Ausführungsform der Erfindung. Wird ein
kodiertes Bildsignal mit einer Datenstruktur, die in einer der Fig. 10(a), 10(b) oder 10(c)
dargestellt ist, in die Bild-Dekodiervorrichtung 100e eingegeben, dann analysiert der
Datenanalysator 160e den auf das 32-Bit-Synchronsignal folgenden 2-Bit-Bild-Idenfifikator
und entscheidet, ob der Wert des Bild-Identifikators (SID) 00 ist oder nicht (Schritt Se1).
-
Ist das Ergebnis der Entscheidung nicht SID = 00, sondern SID = 01 oder SID = 10,
weil das einlaufende kodierte Bildsignal Eo ein kodiertes Beliebigformsignal Ep oder ein
kodiertes Binärsignal E2 ist, dann steuert der Datenanalysators 160e den Schalter 101e über
das Schaltsteuersignal SWe so, dass das kodierte Signal der Erdleitung zugeführt wird.
Dadurch wird das kodierte Beliebigformsignal Ep oder das kodierte Binärsignal E2 gelöscht
(Schritt Se3). Somit wird das kodierte Bildsignal E2 oder Ep, das kodierte Form-Bitströme
enthält, nie durch die Dekodiereinheit 180e bearbeitet.
-
Bei einer Eingabe des kodierten Beliebigformsignals Ep oder des kodierten
Binärsignals E2 in die Vorrichtung 100e zeigt die Vorrichtung 100e eine Nachricht an, dass
das gerade eingegebene kodierte Signal durch diese Dekodiervorrichtung 100e nicht
verarbeitet werden kann (Schritt Se4).
-
Danach wird entschieden, ob das einlaufende kodierte Signal aus den Daten des
letzten Blocks im letzten Rahmen besteht (Schritt Se6). Besteht das einlaufende kodierte
Signal nicht aus den Daten des letzten Blocks im fetzten Rahmen, dann werden an einem
zum nächsten Block gehörenden kodierten Eingangssignal die Schritte Se1, Se3, Se4 und
Se6 ausgeführt. Besteht das Eingangssignal jedoch aus den Daten des letzten Blocks im
letzten Rahmen, dann ist die Dekodierung des Eingangssignals beendet.
-
Ist andererseits im Schritt Se1 das Ergebnis der Entscheidung SID = 00, weil die
einlaufenden kodierten Daten Eo aus einem kodierten Rechtecksignal Et bestehen, dann
steuert der Datenanalysator 160e den Schalter 101e über das Schaltsteuersignal SWe so,
dass das kodierte Signal in die Dekodiereinheit 180e eingegeben wird. Somit dekodiert die
Textur-Dekodiereinheit 180e den im kodierten Rechtecksignal Et enthaltenen kodierten
Textur-Bitstrom (Schritt Se2).
-
Im Einzelnen werden in der Dekodiereinheit 180e die Quantisierungsskala und die
DCT-Koeffizienten, die im Bitstrom enthalten sind, in den Invers-Quantisierer 181
eingegeben, und die DCT-Koeffizienten werden invers quantisiert. Danach wird für das
invers quantisierte Signal Diq durch den Umkehr-Kosinus-Transformator 182 eine Umkehr-
Kosinus-Transformation ausgeführt.
-
Inzwischen wird der Textur-Bewegungsvektor BV in den Textur-
Bewegungskompensator 184 eingegeben. Der Kompensator 184 erzeugt eine Adresse, um
ein dem Textur-Bewegungsvektor BV zugeordnetes Vorhersage-Textursignal zu erhalten,
und empfängt das Vorhersage-Textursignal Emp vom Rahmen-Speichermodul 102e unter
Verwendung der Adresse.
-
Der Addierer 183 fügt die Ausgabedaten Didct des Umkehr-Kosinus-Transformators
182 und das Vorhersage-Textursignal Emp zusammen und gibt das dekodierte Textursignal
Dpt (dekodiertes Rechtecksignal) an die Wiedergabeeinheit 104 aus (Schritt Se5).
Gleichzeitig wird das dekodierte Textursignal Dt in den Rahmen-Speichermodul 102e
eingegeben. Für die Wiedergabe kann nach der Dekodiereinheit ein Synthesizer
vorgesehen werden, um das dekodierte Rechtecksignal mit einem weiteren Beliebigform-
Bildsignal zu synthetisieren.
-
Danach wird entschieden, ob das kodierte Rechtecksignal Et aus Daten des letzten
Blocks im letzten Rahmen besteht (Schritt Se6). Besteht das Signal Et nicht aus den Daten
des letzten Blocks im letzten Rahmen, dann werden die Schritte Se1, Se2, Se5 und Se6 an
einem kodierten Rechtecksignal des nächsten Blocks ausgeführt. Besteht das Signal Et aus
den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten
Rechtecksignals beendet.
-
Wie oben beschrieben wurde, enthält die Bild-Dekodiervorrichtung 100e nach der
sechsten Ausführungsform der Erfindung den Datenanalysator 160e, der die einlaufenden
kodierten Daten analysiert. Der Datenanalysator 160e stellt mit Hilfe des Zwei-Bit-Bild-
Identifikators fest, ob das in die Vorrichtung einlaufende kodierte Bildsignal ein kodiertes
Signal ist, das als Bildinformation kodierte Form-Bitströme (d. h. das kodierte Binärsignal E2
oder das kodierte Beliebigformsignal Ep) enthält, oder ob es ein kodiertes Rechtecksignal Et
ohne kodierte Form-Bitströme ist, und im Ergebnis der Entscheidung steuert der Analysator
160e den Schalter 101e so, dass das einlaufende kodierte Signal in die Erdleitung oder die
Dekodiereinheit 180e eingegeben wird. Deshalb werden selbst dann, wenn das kodierte
Beliebigformsignal Ep oder das kodierte Binärsignal E2 in die Bild Dekodiervorrichtung 100e
eingegeben wird, welche für das kodierte Rechtecksignal Et vorgesehen ist, diese kodierten
Signale nicht dekodiert, wodurch verhindert wird, dass es zu einem Abbruch des
Dekodierungsprozesses kommt.
-
Diese siebente Ausführungsform der Erfindung ist besonders auf die Bild-
Dekodiervorrichtung 100e zugeschnitten, die entsprechend einem Bild-Identifikator ein
kodiertes Signal, das kodierte Form-Bitströme enthält, aus den kodierten Signalen mit
Datenstrukturen gemäß der sechsten Ausführungsform auswählt, d. h. dem kodierten
Beliebigformsignal 1500, dem kodierten Binärsignal 1600 und dem kodierten Rechtecksignal
1700. Wenn jedoch die Bild-Eingabeeinheit 110 in der Bild-Kodiervorrichtung 100a gemäß
der zweiten Ausführungsform (vgl. Fig. 3) so aufgebaut ist, dass sie ein Beliebigform-
Bildsignal, ein binäres Bildsignal und ein Rechteck-Bildsignal identifizieren kann, dann kann
eine Bild-Kodiervorrichtung so aufgebaut werden, dass sie die Kodierung dieser Bildsignale
mit Bild-Identifikatoren zur Identifizierung der zu diesen Bildsignalen gehörenden kodierten
Signale ausführt.
[Ausführungsform 8]
-
Fig. 13(a) und 13(b) sowie Fig. 14(a) und 14(b) sind schematische Darstellungen zur
Erläuterung von Datenstrukturen zur Bildübertragung entsprechend einer achten
Ausführungsform der vorliegenden Erfindung. Im Einzelnen zeigt Fig. 13(a) eine
Datenstruktur eines kodierten Beliebigformsignals (erstes kodiertes Beliebigformsignal)
2500, das durch Kodieren eines Beliebigform-Bildsignals mit sowohl kodierten Form-
Bitströmen als auch kodierten Textur-Bitströmen erhalten wurde, und Fig. 13(b) zeigt eine
Datenstruktur eines kodierten Binärsignals 2600, das durch Kodieren eines binären
Bildsignals erhalten wurde. Fig. 14(b) zeigt die Datenstruktur eines kodierten
Rechtecksignals (kodiertes Pixelwertsignal) 2700, das durch Kodieren eines Rechteck-
Bildsignals erhalten wurde, und Fig. 14(b) zeigt eine Datenstruktur eines kodierten
Beliebigformsignals mit Transparenz-Informationen (zweites kodiertes Beliebigformsignal)
2800, das durch Kodieren eines Beliebigform-Bildsignals erhalten wurde, das Transparenz-
Informationen enthält.
-
Diese Datenstrukturen zur Bildübertragung gemäß der achten Ausführungsform
werden in einem System eingesetzt, in welchem das Transparenz-Informationen enthaltende
Beliebigform-Bildsignal kompressiv kodiert und übertragen wird, und im Weiteren wird das
durch kompressives Kodieren erhaltene zweite kodierte Beliebigformsignal dekodiert und
wiedergegeben. Das heißt, in diesem System sind Bild-Kodierungsverfahren und -
vorrichtung so aufgebaut, dass sie einen Kodierungsprozess für das Transparenz-
Informationen umfassende Beliebigform-Bildsignal ausführen, während Bild-
Dekodierungsverfahren und -vorrichtung für die Ausführung eines Dekodierungsprozesses
für das zweite kodierte Beliebigformsignal ausgelegt sind.
-
Das in Fig. 13(a) dargestellte erste kodierte Beliebigformsignal 2500 stimmt mit dem
in Fig. 10(a) dargestellten kodierten Beliebigformsignal 1500 nach der sechsten
Ausführungsform überein, d. h., es wird erhalten, indem der 1-Bit-Form-Identifikator 502 im
kodierten Beliebigformsignal 500 gemäß der ersten Ausführungsform durch einen Zwei-Bit-
Bild-Identifikator 2502 ersetzt wird.
-
Das in Fig. 13(b) dargestellte kodierte binäre Formsignal 2600 stimmt mit dem in Fig.
10(b) dargestellten kodierten binären Formsignal 1600 nach der sechsten Ausführungsform
überein, d. h., es wird erhalten, indem der 1-Bit-Form-Identifikator 602 im kodierten binären
Formsignal 600 gemäß der ersten Ausführungsform durch einen Zwei-Bit-Bild-Identifikator
2602 ersetzt wird.
-
Das in Fig. 14(a) dargestellte kodierte Pixelwertsignal 2700 stimmt mit dem in Fig.
10(c) dargestellten kodierten Pixelwertsignal 1700 nach der sechsten Ausführungsform
überein, d. h., es wird erhalten, indem ein Zwei-Bit-Bild-Identifikator 2702 zwischen dem
Synchronsignal 701 und dem Datenkopf 703 in das in Fig. 23(c) dargestellte kodierte
Pixelwertsignal 700a eingefügt wird.
-
Das in Fig. 14(b) dargestellte zweite kodierte Beliebigformsignal 2800 enthält am
Anfang ein 32-Bit-Synchronsignal 801, einen auf das Synchronsignal 801 folgenden Zwei-
Bit-Bild-Identifikator (SID) 2802 und einen auf den Bild-Identifikator 2802 folgenden
zusätzlichen Datenkopf 803.
-
Außerdem enthält das zweite kodierte Beliebigformsignal 2800 kodierte Form-
Bitströme 81D, welche durch Kodierung eines Formsignals (binäres Transparenzsignal)
erhalten wurden, das die Form eines jeden Objekts als ein Bestandteil des Beliebigform-
Bildsignals mit Transparenzinformationen darstellt; kodierte Textur-Bitströme (kodierte
Pixelwertströme) 82D, welche durch Kodierung eines Textursignals (Pixelwertsignal)
erhalten wurden, das ein Leuchtdichtesignal und ein Farbdifferenzsignal zur Farbdarstellung
eines jeden Objekts umfasst und das ein Bestandteil des Beliebigform-Bildsignals mit
Transparenz-Informationen ist; und kodierte Transparenz-Bitströme 83D, welche durch
Kodierung eines mehrwertigen Transparenzsignals erhalten wurden, das die Transparenz
eines jeden Objekts als ein Bestandteil des Beliebigform-Bildsignals mit Transparenz-
Informationen wiedergibt.
-
Im Einzelnen sind in dem kodierten Beliebigformsignal 2800 für jeden der Blöcke, in
die eine ein Objekt auf einem Displaybild umfassende Objektregion unterteilt ist, ein
kodierter Form-Bitstrom 81 D, ein kodierter Textur-Bitstrom 82D und ein kodierter
Transparenz-Bitstrom 83D in dieser Reihenfolge angeordnet.
-
Genauer gesagt sind auf den Datenkopf 803 folgend angeordnet: ein kodierter Form-
Bitstrom 81 D1, ein kodierter Textur-Bitstrom 82D1 und ein kodierter Transparenz-Bitstrom
83D1, die zu einem Block D1 gehören; ein kodierter Form-Bitstrom 81D2, ein kodierter
Textur-Bitstrom 82D2 und ein kodierter Transparenz-Bitstrom 83D2, die zu einem Block D2
gehören; und ein kodierter Form-Bitstrom 81 D3, ein kodierter Textur-Bitstrom 82D3 und ein
kodierter Transparenz-Bitstrom 83D3, die zu einem Block D3 gehören.
-
Außerdem enthalten, wie in Fig. 14(b) dargestellt ist, die kodierten Form-Bitströme
81D1, 81D2 und 81D3 jeweils längenvariant kodierte Daten 804, 812 und 820, die Form-
Bewegungsvektoren (in der Figur einfach als Form-BV bezeichnet) entsprechen; und
längenvariant kodierte Daten 805, 813 und 821, die binären Formsignalen (binären
Transparenzsignalen) entsprechen, wobei jedes Signal anzeigt, ob die Pixel im Block
innerhalb oder außerhalb des Objekts liegen (in der Figur: Formdaten).
-
Die kodierten Textur-Bitströme 82D1, 82D2 und 82D3 enthalten jeweils 5-Bit-kodierte
Daten 806, 814 und 822, die Quantisierungsskalen (in der Figur: Quantisierungsskala)
entsprechen; längenvariabal kodierte Daten 807, 815 und 823, die Textur-
Bewegungsvektoren (in der Figur: Textur-BV) entsprechen; und längenvariant kodierte
Daten 808, 816 und 824, die quantisierten Signalen entsprechen, die aus dem Textursignal
durch Ausführen von DCT und Quantisierung erhalten wurden (in der Figur: Textur-DCT-
Koeffizienten).
-
Die kodierten Transparenz-Bitströme 83D1, 83D2 und 83D3 enthalten jeweils
5-Bitkodierte Daten 809, 817 und 825, die Quantisierungsskalen entsprechen (in der Figur:
Quantisierungsskala); längenvariant kodierte Daten 810, 818 und 826, die Transparenz-
Bewegungsvektoren (in der Figur: Transparenz-BV) entsprechen; und längenvariant kodierte
Daten 811, 819 und 827, die quantisierten Signalen entsprechen, die aus dem mehrwertigen
Transparenzsignal durch Ausführen von DCT und Quantisierung erhalten wurden (in der
Figur: Transparenz-DCT-Koeffizienten).
-
Das Synchronsignal 801 ist ein Signal zur Anzeige des Kopfes eines zu einem Objekt
gehörenden kodierten Beliebigformsignals, und es ist ein einmalig kodiertes Signal. Der
Form-Identifikator (SID) 2802 ist ein Signal zur Anzeige, welchen Typ von den oben
beschriebenen vier Typen kodierter Bildsignale das kodierte Bildsignal hat, d. h., es ist ein
Signal zur Feststellung der Art der im kodierten Bildsignal enthaltenen Bitströme. Ist der
Wert des Bild-Identifikators (SID) gleich 01, dann wird angezeigt, dass im kodierten
Bildsignal sowohl kodierte Form = Bitströme als auch kodierte Textur-Bitströme vorkommen.
Bei SID = 10 zeigt der Bild-Identifikator an, dass nur die kodierten Form-Bitströme im
kodierten Signal vorliegen. Bei SID = 00 zeigt der Bild-Identifikator an, dass nur die kodierten
Textur-Bitströme im kodierten Signal vorkommen. Wenn SID gleich 11 ist, dann zeigt der
Bild-Identifikator das Vorhandensein der kodierten Form-Bitströmen, der kodierten Textur-
Bitströmen und der kodierten Transparenz-Bitströmen im kodierten Signal an.
-
Der Datenkopf 803 enthält Informationen z. B. über den Wiedergabezeitpunkt des
Bildes des zugehörigen Objekts, zum Bildattribut und zum Vorhersagemodus für die
Kodierung. Diese Daten haben jedoch keinen Bezug zur vorliegenden Erfindung und
erfordern deshalb keine ausführliche Beschreibung.
-
Der Form-BV ist die kodierte Datenmenge eines Bewegungsvektors, der die
Bewegung eines Bildes innerhalb eines Blocks zwischen dem vorliegenden und dem
vorhergehenden Rahmen aufzeigt, und er wird zur Vorhersage eines Formsignals eines
bestimmten Blocks im vorliegenden Rahmen aus einem Formsignal des entsprechenden
Blocks im vorhergehenden Rahmen verwendet. Ferner werden die Formdaten durch
arithmetische Kodierung eines Formsignals erhalten, und die Quantisierungsskala (im
kodierten Textur-Bitstrom) ist ein Parameter für die inverse Quantisierung der DCT-
Koeffizienten, die erhalten werden, indem an einem Textursignal DCT und Quantisierung
ausgeführt werden. Der Textur-BV ist ein kodiertes Signal eines Textur-Bewegungsvektors,
der die Bewegung eines Bildes innerhalb eines Blocks zwischen dem vorliegenden und dem
vorhergehenden Rahmen aufzeigt, und er wird zur Vorhersage eines Textursignals vom
vorliegenden Rahmen aus einem Textursignal vom vorhergehenden Rahmen verwendet.
Ferner werden die Textur-DCT-Koeffizienten erhalten, indem ein quantisiertes Signal des
Textursignals längenvariant kodiert wird. Ferner ist der Transparenz-BV ein kodiertes Signal
eines Transparenz-Bewegungsvektors, der die Bewegung eines Bildes innerhalb eines
Blocks zwischen dem vorliegenden und dem vorhergehenden Rahme aufzeigt, und er wird
zur Vorhersage eines mehrwertigen Transparenzsignals vom vorliegenden Rahmen aus
einem mehrwertigen Transparenzsignal vom vorhergehenden Rahmen verwendet.
-
Außerdem ist die Quantisierungsskala (im kodierten Transparenz-Bitstrom) ein Parameter
für die inverse Quantisierung der Transparenz-DCT-Koeffizienten, die erhalten werden,
indem an einem mehrwertigen Transparenzsignal DCT und Quantisierung ausgeführt
werden. Die Transparenz-DCT-Koeffizienten werden erhalten, indem ein quantisiertes Signal
des Transparenzsignals längenvariant kodiert wird.
-
Obwohl diese Daten in der Figur nicht dargestellt sind, werden im kodierten
Beliebigformsignal 2800 vor den Textur-DCT-Koeffizienten verschiedene Arten von
Nebeninformationen (Daten) untergebracht, und diese Nebendaten erfordern manchmal eine
große Anzahl von Bits.
-
Es wird eine Beschreibung der Funktions- und Wirkungsweise gegeben.
-
In der so aufgebauten achten Ausführungsform enthalten die vier kodierten
Bildsignale - d. h. das zu einem Beliebigform-Bildsignal gehörende erste kodierte
Beliebigformsignal 2500, das zu einem binären Bildsignal gehörende kodierte Binärsignal
2600, das zu einem Rechteck-Bildsignal gehörende kodierte Pixelwertsignal (kodiertes
Rechtecksignal) 2700 und das zu einem Beliebigform-Bildsignal mit Transparenz-
Informationen gehörende zweite kodierte Beliebigformsignal 2800 - wegen der
unterschiedlichen Datenstrukturen die entsprechenden Zwei-Bit-Bild-Identifikatoren 2502,
2602, 2702 und 2802 zur Identifizierung dieser kodierten Signale. Deshalb können diese vier
kodierten Signale durch Bezugnahme auf die Bild-Identifikatoren auf der Dekodierungsseite
identifiziert werden.
-
Im Einzelnen ermöglichen die Bild-Identifikatoren in einer Bild-Dekodiervorrichtung,
das MPEG4 angepasst und für die Dekodierung des oben erwähnten kodierten
Beliebigformsignals ausgelegt ist, der Vorrichtung eine richtige Dekodierung des kodierten
Binärsignals und des kodierten Rechtecksignals selbst dann, wenn das kodierte Binärsignal
und das kodierte Rechtecksignal zusätzlich zu dem ersten und dem zweiten kodierten
Beliebigformsignal eingegeben werden. Folglich kann vermieden werden, dass das kodierte
Binärsignal und das kodierte Rechtecksignal mit einem Dekodierungsprozess verarbeitet
werden, der an MPEG4 angepasst ist, und dass der Dekodierungsprozess abbricht.
-
In dieser achten Ausführungsform der Erfindung haben das erste und zweite kodierte
Beliebigformsignal, das kodierte Binärsignal sowie das kodierte Rechtecksignal die
Datenstrukturen, die durch Inter-Rahmen-Vorhersage-Kodierung eines zugehörigen
Beliebigform-Bildsignals, Beliebigform-Bildsignals mit Transparenz-Informationen, binären
Bildsignals oder Rechteck-Bildsignals erhalten wurden. Diese kodierten Signale können
jedoch jedoch auch Datenstrukturen haben, die durch Intra-Rahmen-Kodierung der
entsprechenden Bildsignale erzeugt wurden.
-
Außerdem ist in den jeweiligen kodierten Signalen, die in dieser achten
Ausführungsform verwendet werden, einem jeden Block mindestens einer von den kodierten
Form-, Textur- und Transparenz-Bitströmen zugeordnet. In jedem kodierten Signal können
aber auch jedem Rahmen vorgeschriebene kodierte Bitströme zugeordnet werden (vgl. Fig.
2(a) und 2(b)).
-
Außerdem enthält in der Datenstruktur des in Fig. 14(b) dargestellten zweiten
kodierten Beliebigformsignals 2800 (kodiertes Signal des Beliebigform-Bildsignals mit
Transparenzinformationen) jeder der kodierten Transparenz-Bitströme 83D - ähnlich wie die
kodierten Textur-Bitströme 82D - einen Transparenz-BV und eine Quantisierungsskala. Es ist
jedoch nicht immer nötig, dass der kodierte Transparenz-Bitstrom 83D im zweiten kodierten
Beliebigformsignal 2800 den Transparenz-BV und die Quantisierungsskala enthält.
-
Hat das kodierte Signal des Beliebigform-Bildsignals mit Transparenz-Informationen
die Datenstruktur, in der die kodierten Transparenz-Bitströme 83D keine Transparenz-BV
und keine Quantisierungsskalen enthalten, dann wird die Dekodierung der Transparenz-
DCT-Koeffizienten unter Verwendung der Textur-BV und der Quantisierungsskalen von den
kodierten Textur-Bitströmen 82D ausgeführt.
[Ausführungsform 9]
-
Fig. 15 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung gemäß
einer neunten Ausführungsform der vorliegenden Erfindung. Die Bezugsziffer 100f in Fig. 15
kennzeichnet eine Bild-Dekodiervorrichtung, die kodierte Daten mit der Datenstruktur zur
Bildübertragung gemäß der achten Ausführungsform dekodiert. Die Bild-Dekodiervorrichtung
100f ist so aufgebaut, dass sie einen Dekodierungs-Prozess ausführt, welcher der
Datenstruktur eines als kodierte Datenmenge einlaufenden kodierten Signals angepasst ist.
Im Einzelnen ist die Vorrichtung 100f wie folgt aufgebaut. Empfängt die Vorrichtung
100f als kodierte Daten Eo das in Fig. 13(b) dargestellte kodierte Binärsignal (E2) 2600,
dann gibt sie als dekodierte Bilddaten Dsyn ein dekodiertes Binärsignal D2 aus. Empfängt
die Vorrichtung 100f als kodierte Daten Eo das in Fig. 13(a) dargestellte erste kodierte
Beliebigformsignal (Ep) 2500, dann gibt sie für jedes Objekt als dekodierte Bilddaten Dsyn
ein dekodiertes Beliebigformsignal Dp aus. Empfängt die Vorrichtung 100f als kodierte Daten
Eo das in Fig. 14(a) dargestellte kodierte Rechtecksignal (Et) 2700, dann gibt sie als
dekodierte Bilddaten Dsyn ein dekodiertes Rechtecksignal Dt aus. Empfängt die Vorrichtung
100f als kodierte Daten Eo das in Fig. 14(b) dargestellte zweite kodierte Beliebigformsignal
(Ex) 2800, dann gibt sie für jedes Objekt als dekodierte Bilddaten Dsyn ein dekodiertes
Beliebigformsignal Dx mit Transparenz-Informationen aus.
-
Im Weiteren wird die Struktur der Bild-Dekodiervorrichtung 100f ausführlich
beschrieben.
-
Die Vorrichtung 100f enthält einen Datenanalysator 160f, der die in das
Eingabeterminal 160a einlaufenden kodierten Daten Eo analysiert und gemäß dem
Analyseergebnis ein Schaltsteuersignal SWf ausgibt; eine Form-Dekodiereinheit, (erste
Dekodierhilfsmittel) 170, welche für die Formdaten (kodiertes Formsignal) einen
arithmetischen Dekodierungsprozess ausführt; eine Textur-Dekodiereinheit (zweite
Dekodierhilfsmittel) 180f, welche für die Textur-DCT-Koeffizienten Ept und die Transparenz-
DCT-Koeffizienten Egt einen Dekodierungsprozess einschließlich Umkehr-DCT ausführt;
einen Schalter 101f, welcher entsprechend dem Schaltsteuersignal SWf das vom
Datenanalysator 160f analysierte und ausgegebene kodierte Signal einer der beiden
Dekodiereinheiten 170 bzw. 180f zuführt; und einen Rahmen-Speichermodul 142f, der ein
Vorhersage-Formsignal, ein Vorhersage-Textursignal und ein Vorhersage-Transparenzsignal
speichert.
-
Der Datenanalysator 160f analysiert das einlaufende kodierte Signal zur Überprüfung
des auf das 32-Bit-Synchronsignal am Kopf folgenden 2-Bit-Bild-Identifikators (einer der Bild-
Identifikatoren 2502, 2602, 2702 und 2802 in den kodierten Signalen, die jeweils in den Fig.
13(a), 13(b) 14(a) und 14(b) dargestellt sind), und steuert den Schalter 101f entsprechend
dem gesetzten Wert des Bild-Identifikators (SID).
-
Bei SID = 01 wird der Schalter 101f durch das Schaltsteuersignal SWf so gesteuert,
dass die kodierten Form-Bitströme des einlaufenden kodierten Signals in die Form-
Dekodiereinheit 170 und die kodierten Textur-Bitströme des kodierten Signals in die Textur-
Dekodiereinheit 180f eingegeben werden. Bei SID = 10 wird der Schalter 101f durch das
Schaltsteuersignal SWf so gesteuert, dass die einlaufenden kodierten Daten in die Form-
Dekodiereinheit 170 eingegeben werden. Bei SID = 00 wird der Schalter 101f durch das
Schaltsteuersignal SWf so gesteuert, dass die kodierten Textur-Bitströme des einlaufenden
kodierten Signals in die Textur-Dekodierhilfsmittel 180f eingegeben werden. Bei SID = 11
wird der Schalter 101f durch das Schaltsteuersignal SWf so gesteuert, dass die kodierten
Form-Bitströme des einlaufenden kodierten Signals in die Form-Dekodiereinheit 170 und die
kodierten Textur- sowie Transparenz-Bitströme in die Textur-Dekodiereinheit 184f
eingegeben werden.
-
Ähnlich dem Datenanalysator 160 nach der in Fig. 7(b) dargestellten dritten
Ausführungsform enthält der Datenanalysator 160f eine Tabellen-Speichereinheit 162, einen
Komparator 161 und einen Schalter-Steuerkreis 163. In dieser neunten Ausführungsform
vergleicht der Komparator 161 den Bitstrom des einlaufenden kodierten Signals mit dem
Bitstrom der Dekodier-Referenztabelle, die in der Tabellen-Speichereinheit 162 gespeichert
ist, und identifiziert den Bild-Identifikator, den kodierten Form-Bitstrom, den kodierten Textur-
Bitstrom und den kodierten Transparenz-Bitstrom, die in den kodierten Daten enthalten sind.
-
Entsprechend dem Ergebnis der Identifizierung gibt der Komparator 161 ein
Schaltsteuersignal SWf an den Schalter 101f aus.
-
Die Textur-Dekodiereinheit (zweite Dekodierhilfsmittel) 180f enthält einen Textur-
Bewegungskompensator 184f, der entsprechend dem Textur-Bewegungsvektor oder dem
Transparenz-Bewegungsvektor eine Adresse erzeugt, um ein Vorhersage-Textursignal oder
ein Vorhersage-Transparenzsignal zu erhalten, und der unter Verwendung der Adresse ein
Vorhersage-Textursignal Emp oder ein Vorhersage-Transparenzsignal Emg aus dem
Rahmen-Speichermodul 102b empfängt. Außerdem enthält die Textur-Dekodiereinheit 180f
einen Invers-Quantisierer 181f, der die Quantisierungsskala und die DCT-Koeffizienten im
kodierten Textur-Bitstrom oder im kodierten Transparenz-Bitstrom empfängt und die DCT-
Koeffizienten invers quantisiert; und einen Umkehr-Kosinus-Transformator 182f, der an den
invers quantisierten DCT-Koeffizienten Diq eine Umkehr-Kosinus-Transformation ausführt.
Außerdem enthält die Textur-Dekodiereinheit 180f einen Addierer 183, der das Vorhersage-
Textursignal Emp oder das Vorhersage-Transparenzsignal Emg zum
umkehr-kosinustransformierten Signal Didct hinzufügt und ein reproduziertes Textursignal (dekodiertes
Textursignal) Dpt oder ein reproduziertes Transparenzsignal (dekodiertes
Transparenzsignal) Dpg ausgibt. Das reproduzierte Textursignal Dpt oder das reproduzierte
Transparenzsignal Dpg aus dem Addierer 183 wird im Rahmen-Speichermodul 102f
gespeichert.
-
Die Bild-Dekodiervorrichtung 100f enthält im Weiteren einen Synthesizer 190f, der
eine Synthese der Ausgabedaten der Dekodiervorrichtung 180f (entweder das reproduzierte
Textursignal Dpt und das reproduzierte Transparenzsignal Dpg beide zusammen oder nur
das reproduzierte Textursignal Dpt) sowie der Ausgabedaten der Dekodiereinheit 170 (das
reproduzierte Formsignal Dk entsprechend der Ausgabe der Dekodiereinheit 180f) mit
gewünschten Bilddaten ausführt und an die Wiedergabeeinheit 104 synthetisierte Bilddaten
Dsyn ausgibt, die das reproduzierte Beliebigformsignal Dx mit Transparenz-Informationen
oder das reproduzierte Beliebigformsignal Dp enthalten. Obwohl der Synthesizer 190f
gemäß der neunten Ausführungsform das reproduzierte Binärsignal D2 von der
Dekodiereinheit 170 oder das reproduzierte Rechtecksignal Dt von der Dekodiereinheit 180f
unmittelbar zur Wiedergabeeinheit 104 übermittelt, kann das Signal D2 oder Dt im
Synthesizer 190f auch mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
Obwohl das vom Synthesizer 190f ausgegebene Signal in die Wiedergabeeinheit 104
eingegeben wird, kann es auch in ein Informationsausgabegerät, wie z. B. einen Drucker
(nicht dargestellt), eingegeben werden.
-
In dieser neunten Ausführungsform werden für Pixel, in denen das reproduzierte
Formsignal Null ist, die Pixelwerte im reproduzierten Textursignal und im reproduzierten
Transparenzsignal durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das
vorgeschriebene Bild ist ein im Voraus an der Empfangsstation hergestelltes Bild oder ein
Bild, das von einer anderen Bild-Dekodiervorrichtung reproduziert wurde.
-
Es wird eine Beschreibung der Arbeitsweise der Bild-Dekodiervorrichtung 100f
gemäß der neunten Ausführungsform gegeben.
-
Fig. 16 ist ein Flussdiagramm des Dekodierungsprozesses durch die Bild-
Dekodiervorrichtung 100f. Wird in die Bild-Dekodiervorrichtung 100f ein kodiertes Bildsignal
mit einer Datenstruktur, die in einer der Fig. 13(a), 13(b), 14(a), und 14(b) dargestellt ist,
eingegeben, dann analysiert der Datenanalysator 160f den im kodierten Bildsignal auf das
32-Bit-Synchronsignal folgenden 2-Bit-Bild-Identifikator und entscheidet, ob der Wert des
Bild-Identifikators "SID = 00 bzw. SID = 11" oder ein anderer ist (Schritt Sf1).
-
Ist das Ergebnis der Entscheidung SID = 00 oder 11, dann wird entschieden" ob SID
= 00 oder nicht ist (Schritt Sf2). Ist das Ergebnis der Entscheidung in Schritt Sf2 SID = 00,
weil das einlaufende kodierte Bildsignal Eo das kodierte Rechtecksignal Et ist, dann steuert
der Datenanalysator 160f den Schalter 101f über das Schaltsteuersignal SWf so, dass das
kodierte Signal immer in die Textur-Dekodiereinheit 180f eingegeben wird. Somit werden in
der Textur-Dekodiereinheit 180f die kodierten Textur-Bitströme im kodierten Rechtecksignal
dekodiert (Schritt Sf3). Der Dekodierungsprozess in Schritt Sf3 stimmt mit dem
Dekodierungsprozess Se2 gemäß der siebenten Ausführungsform überein. Dann wird das
dekodierte Rechtecksignal durch den Synthesizer 190f der Wiedergabeeinheit 104 zur
Wiedergabe zugeführt (Schritt Sf13). Im Synthesizer 190f kann das dekodierte
Rechtecksignal Dg mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
-
Danach wird entschieden, ob das kodierte Rechtecksignal Et aus den Daten des
letzten Blocks im letzten Rahmen besteht (Schritt Sf14). Besteht das kodierte
Rechtecksignal nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an
einem zum nächsten Block gehörenden kodierten Rechtecksignal die Schritte Sf1-Sf3,
Sf13 und Sf14 ausgeführt. Besteht das kodierte Rechtecksignal jedoch aus den Daten des
letzten Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten Rechtecksignals
beendet.
-
Ist hingegen das Ergebnis der Entscheidung in Schritt Sf2 SID = 11, dann ist das
einlaufende kodierte Bildsignal das zweite kodierte Beliebigformsignal Ex, das als
Bildinformation die kodierten Form-Bitströme, die kodierten Textur-Bitströme und die
kodierten Transparenz-Bitströme umfasst. Der Datenanalysator 160f steuert dann den
Schalter 101f über das Schaltsteuersignal SWf so, dass der zu jedem Block des kodierten
Beliebigformsignals Ex mit Transparenzsignal gehörende kodierte Form-Bitstrom in die
Form-Dekodiereinheit 170 eingegeben wird, während die zum Block gehörenden kodierten
Textur- und Transparenz-Bitströme in die Textur-Dekodiereinheit 180f eingegeben werden.
Somit wird im zweiten kodierten Beliebigformsignal Ex der kodierte Form-Bitstrom vom
kodierten Textur-Bitstrom sowie dem kodierten Transparenz-Bitstrom separiert (Schritt Sf4),
und der separierte Form-Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt
Sf5), während die separierten Textur- und Transparenz-Bitströme durch die Textur-
Dekodiereinheit 180f dekodiert werden (Schritte Sf6 und Sf7).
-
Im Einzelnen wird der kodierte Form-Bitstrom Epk - ähnlich wie der kodierte Form-
Bitstrom E2k des binären Bildsignals - durch den Form-Dekoder 170 dekodiert. Nach
Abschluss der Dekodierung des zu einem Block gehörenden kodierten Form-Bitstroms Epk
stellt der arithmetische Dekoder 171 das Ende des zu diesem Block gehörenden kodierten
Form-Bitstroms Epk fest und gibt ein Abschlusszeitsignal Te an den Datenanalysator 160f
aus. Beim Empfang des Abschlusszeitsignals Te steuert der Datenanalysator 160f den
Schalter 101b über das Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal
in die Textur-Dekodiereinheit 180f eingegeben wird.
-
Somit werden der kodierte Textur-Bitstrom Ept und der kodierte Transparenz-Bitstrom
Epg vom Datenanalysator 160f zur Textur-Dekodiereinheit 180f geleitet. In der
Dekodiereinheit 180f werden die Quantisierungsskala und die DCT-Koeffizienten eines jeden
Bitstroms in den Invers-Quantisierer 181f eingegeben, und die DCT-Koeffizienten werden
invers quantisiert. Danach wird am invers quantisierten Signal Diq durch den Umkehr-
Kosinus-Transformator 182f eine Umkehr-Kosinus-Transformation ausgeführt.
-
Inzwischen werden der Textur-Bewegungsvektor BV und der Transparenz-
Bewegungsvektor BV in den Textur-Bewegungskompensator 184f eingegeben. Der
Kompensator 184f erzeugt Adressen zur Versorgung mit einem Vorhersage-Textursignal
und einem Vorhersage-Transparenzsignal, die diesen Bewegungsvektoren BV zugeordnet
sind, und erhält aus dem Rahmen-Speichermodul 102b unter Verwendung der Adressen ein
Vorhersage-Textursignal Emp sowie ein Vorhersage-Transparenzsignal Emg.
-
Der Addierer 183 führt eine Addition der Ausgabedaten Didct vom Umkehr-Kosinus-
Transformator 182f und des Vorhersage-Textursignals Emp oder des Vorhersage-
Transparenzsignals Emg aus und gibt ein dekodiertes Textursignal Dpt oder ein dekodiertes
Transparenzsignal Dpg aus. Diese dekodierten Signale Dpt und Dpg werden in den
Rahmen-Speichermodul 102f und den Synthesizer 190f eingegeben. Der Synthesizer 190f
führt eine Synthese des reproduzierten Textursignals Dpt, des reproduzierten
Transparenzsignals Dpg und des dazugehörigen reproduzierten Formsignals Dk mit einem
gewünschten Bild zur Erzeugung synthetisierter Bilddaten Dsyn aus. Beim Abschluss der
Dekodierung des kodierten Transparenz-Bitstroms stellt der Datenanalysator 160f das Ende
des kodierten Transparenz-Bitstroms fest und steuert den Schalter 101f über das
Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal in die Form-
Dekodiereinheit 170 eingegeben wird.
-
Außerdem werden die reproduzierten und synthetisierten Daten (dekodiertes
Beliebigformsignal mit Transparenz-Informationen) Dx vom Synthesizer 190f an die
Wiedergabeeinheit 104 zur Bildwiedergabe ausgegeben (Schritt Sf13).
-
Danach wird entschieden, ob das zweite kodierte Beliebigformsignal aus den Daten
des letzten Blocks im letzten Rahmen besteht (Schritt Sf14). Besteht es nicht aus den Daten
des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block
gehörenden zweiten kodierten Beliebigformsignal die Schnitte Sf1, Sf2, Sf4-Sf7, Sf13 und
Sf14 ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen,
dann ist die Dekodierung des zweiten kodierten Beliebigformsignals beendet.
-
Wird im Schritt Sf1 entschieden, dass der Wert des Bild-Identifikators nicht durch
"SID = 00 oder 11" gegeben ist, dann wird in Schritt Sf8 entschieden, ob SID = 10 ist oder
nicht. Ist das Ergebnis der Entscheidung in Schritt Sf8 SID = 10, weil das einlaufende
kodierte Bildsignal Eo das kodierte Binärsignal E2 ist, das nur die kodierten Form-Bitströme
als Bildinformation enthält, dann steuert der Datenanalysator 160f den Schal er 101f über
das Schaltsteuersignal SWf so, dass der zu jedem Block im kodierten Binärsignal gehörende
kodierte Form-Bitstrom immer in die Form-Dekodiereinheit 170 eingegeben wird. Somit
werden in der Form-Dekodiereinheit 170 die kodierten Form-Bitströme im kodierten
Binärsignal dekodiert (Schritt Sf9). Der Dekodierungsprozess Sf9 stimmt mit dem
Dekodierungsprozess in Schritt Sb2 gemäß der dritten Ausführungsform überein. Dann wird
das dekodierte Binärsignal D2 über den Synthesizer 190f zur Wiedergabe an die
Wiedergabeeinheit 104 geleitet (Schritt Sf13). Im Synthesizer 190f kann das dekodierte
Binärsignal D2 mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
-
Danach wird entschieden, ob das kodierte Binärsignal aus den Daten des letzten
Blocks im letzten Rahmen besteht (Schritt Sf14). Besteht es nicht aus den Daten des letzten
Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden
kodierten Binärsignal die Schritte Sf1, Sf8, Sf9, Sf13 und Sf14 ausgeführt. Besteht es jedoch
aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des
kodierten Binärsignals beendet.
-
Ist das Ergebnis der Entscheidung in Schritt Sf8 jedoch SID = 01, dann ist das
einlaufende kodierte Bildsignal das erste kodierte Beliebigformsignal, welches als
Bildinformation die kodierten Form-Bitströme und die kodierten Textur-Bitströme enthält. Der
Datenanalysator 160f steuert dann den Schalter 101f über das Schaltsteuersignal SWf so,
dass der zu jedem Block des kodierten Beliebigformsignals gehörende kodierte Form-
Bitstrom in die Form-Dekodiereinheit 170 eingegeben wird, während der zum Block
gehörende kodierte Textur-Bitstrom in die Textur-Dekodiereinheit 180f eingegeben wird.
Dadurch werden im ersten kodierten Beliebigformsignal der kodierte Form-Bitstrom und der
kodierte Textur-Bitstrom voneinander separiert (Schritt Sf10), und der separierte Form-
Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt Sf11), während der
separierte Textur-Bitstrom durch die Textur-Dekodiereinheit 180f dekodiert wird (Schritt
Sf12). Im Weiteren werden diese Ströme durch die Wiedergabeeinheit 104 dargestellt
(Schritt Sf13). Die Dekodierungsprozesse in den Schritten Sf11 bzw. Sf12 stimmen mit den
Dekodierungsprozessen in den Schritten Sb4 bzw. Sb5 gemäß der dritten Ausführungsform
überein, und die Bildwiedergabe in Schritt Sf13 stimmt mit der Bildwiedergabe in Schritt Sb6
nach der dritten Ausführungsform überein.
-
Danach wird entschieden, ob das erste kodierte Beliebigformsignal Ep aus den Daten
des letzten Blocks im letzten Rahmen besteht (Schritt Sf14). Besteht es nicht aus den Daten
des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block
gehörenden ersten kodierten Beliebigformsignal Ep die Schritte Sf1, Sf8 und Sf10-Sf14
ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist
die Dekodierung des ersten kodierten Beliebigformsignals Ep beendet.
-
In dem zu dieser neunten Ausführungsform gehörenden Dekodierungsprozess
werden bei der Dekodierung des ersten oder des zweiten kodierten Beliebigformsignals für
Pixel, in denen das reproduzierte Formsignal Null ist, die Pixelwerte im reproduzierten
Textursignal und im reproduzierten Transparenzsignal durch Pixelwerte eines
vorgeschriebenen Bildes ersetzt. Das vorgeschriebene Bild ist ein im Voraus an der
Empfangsstation hergestelltes Bild oder ein Bild, das von einer anderen Bild-
Dekodiervorrichtung reproduziert wurde.
-
Wie oben mit Bezug auf die neunte Ausführungsform der Erfindung beschrieben
wurde, enthält die Bild-Dekodiervorrichtung 100f einen Datenanalysator 160f zur Analyse der
einlaufenden kodierten Daten. Der Datenanalysator 160f detektiert einen Bild-Identifikator,
der anzeigt, um welches kodierte Signal - das kodierte Binärsignal E2, das erste kodierte
Beliebigformsignal Ep, das zweite kodierte Beliebigformsignal Ex oder das kodierte
Rechtecksignal Eg - es sich beim einlaufenden kodierten Signal handelt, und in Abhängigkeit
vom Wert des Bild-Identifikators steuert der Analysator 160f den Schalter 101f so, dass die
Bitströme im einlaufenden kodierten Signal passend in die Form-Dekodiereinheit 170 bzw.
die Textur-Dekodiereinheit 180f eingegeben werden. Somit können die oben erwähnten vier
kodierten Bildsignale, die unterschiedliche Datenstrukturen haben, mit
Dekodierungsprozessen dekodiert werden, die zu einem einzigen Kodierungsverfahren
korrespondieren.
-
In dieser neunten Ausführungsform der Erfindung wird der kodierte Form-Bitstrom
durch ein arithmetisches Dekodierungsverfahren (erstes Dekodierungsverfahren) in der
Form-Dekodiereinheit 170 dekodiert, und der kodierte Textur-Bitstrom sowie der dekodierte
Transparenz-Bitstrom werden durch dasselbe Dekodierungsverfahren einschließlich DCT
dekodiert. Mit anderen Worten, das Dekodierungsverfahren für den kodierten Textur-
Bitstrom (zweites Dekodierungsverfahren) stimmt mit dem Dekodierungsverfahren für den
kodierten Transparenz-Bitstrom (drittes Dekodierungsverfahren) überein. Der kodierte
Transparenz-Bitstrom kann jedoch auch durch ein Dekodierungsverfahren dekodiert werden,
das eine Wavelet-Bearbeitung oder dergleichen enthält (drittes Dekodierungsverfahren) und
das sich von dem Dekodierungsverfahren einschließlich DCT (zweites
Dekodierungsverfahren) unterscheidet.
-
Diese neunte Ausführungsform der Erfindung ist besonders auf die Bild-
Dekodiervorrichtung 100f zugeschnitten, welche die kodierten Signale mit der für die achte
Ausführungsform beschriebenen Datenstruktur, d. h. ein erstes und zweites kodiertes
Beliebigformsignal, ein kodiertes Binärsignal und ein kodiertes Rechtecksignal, unter
Verwendung ihrer Bild-Identifikatoren identifiziert und zu den jeweiligen Datenstrukturen
passend die Dekodierungsprozesse ausführt. Wenn jedoch die Bild-Eingabeeinheit 110 in
der Bild-Kodiervorrichtung 100a gemäß der in Fig. 3 dargestellten zweiten Ausführungsform
so aufgebaut ist, dass sie ein Beliebigform-Bildsignal, ein binäres Bildsignal, ein Rechteck-
Bildsignal und ein Beliebigform-Bildsignal mit Transparenz-Informationen identifizieren kann,
dann kann eine Bild-Kodiervorrichtung so aufgebaut werden, dass sie die Kodierung dieser
Bildsignale mit Bild-Identifikatoren zur Identifzierung der zu diesen Bildsignalen gehörenden
kodierten Signale ausführt.
[Ausführungsform 10]
-
Fig. 17(a)-17(c) sowie Fig. 18(a)-18(b) sind schematische Darstellungen zur
Erläuterung von Datenstrukturen zur Bildübertragung entsprechend einer zehnten
Ausführungsform der vorliegenden Erfindung. Im Einzelnen zeigt Fig. 17(a) eine
Datenstruktur eines kodierten Beliebigformsignals (erstes kodiertes Beliebigformsignal)
3500, das durch Kodierung eines Beliebigform-Bildsignals mit sowohl kodierten Form-
Bitströmen als auch kodierten Textur-Bitströmen erhalten wurde, Fig. 17(b) zeigt eine
Datenstruktur eines kodierten Binärsignals 3600, das durch Kodierung eines binären
Bildsignals erhalten wurde, und Fig. 17(c) zeigt eine Datenstruktur eines kodierten
Rechtecksignals (kodiertes Pixelwertsignal) 3700, das durch Kodierung eines Rechteck-
Bildsignals erhalten wurde, welches als Wiedergabedatendaten nur ein Textursignal
(Pixelwertsignal) zur Farbwiedergabe eines Bildes enthält. Ferner zeigt Fig. 18(a) eine
Datenstruktur eines kodierten Beliebigformsignals mit Transparenz-Informationen (zweites
kodiertes Beliebigformsignal) 3800, das durch Kodierung eines Beliebigform-Bildsignals
erhalten wurde, das Transparenz-Informationen enthält, und Fig. 18(b) zeigt eine
Datenstruktur eines kodierten Transparenzsignals 3900, das durch Kodierung eines
Beliebigform-Transparenzsignals erhalten wurde, das sowohl kodierte Form- als auch
kodierte Transparenz-Bitströme enthält.
-
Diese Datenstrukturen zur Bildübertragung gemäß der zehnten Ausführungsform
werden in einem System eingesetzt, in welchem das Transparenz-Informationen enthaltende
Beliebigform-Bildsignal kompressiv kodiert und übertragen wird, und im Weiteren wird das
durch kompressive Kodierung erhaltene zweite kodierte Beliebigformsignal dekodiert und
dargestellt. Das heißt, in diesem System sind Bild-Kodierungsverfahren und -vorrichtung so
aufgebaut, dass sie einen Kodierungsprozess für das Transparenz-Informationen
enthaltende Beliebigform-Bildsignal ausführen, während Bild-Dekodierungsverfahren und -
vorrichtung für die Ausführung eines Dekodierungsprozesses für das zweite kodierte
Beliebigformsignal ausgelegt sind.
-
Das in Fig. 17(a) dargestellte erste kodierte Beliebigformsignal 3500 stimmt mit dem
in Fig. 13(a) dargestellten kodierten Beliebigformsignal 2500 nach der achten
Ausführungsform überein, d. h., es wird erhalten, indem der 1-Bit-Form-Identifikator 502 im
kodierten Beliebigformsignal 500 gemäß der ersten Ausführungsform durch einen Zwei-Bit-
Bild-Identifikator 3502 ersetzt wird.
-
Das in Fig. 17(b) dargestellte kodierte binäre Formsignal 3600 stimmt mit dem in Fig.
13(b) dargestellten kodierten binären Formsignal 2600 nach der achten Ausführungsform
überein, d. h., es wird erhalten, indem der 1-Bit-Form-Identifikator 602 im kodierten binären
Formsignal 600 gemäß der ersten Ausführungsform durch einen Zwei-Bit-Bild-Identifikator
3602 ersetzt wird.
-
Das in Fig. 17(c) dargestellte kodierte Rechtecksignal (kodiertes Pixelwertsignal)
3700 stimmt mit dem in Fig. 14(a) dargestellten kodierten Rechtecksignal 2700 nach der
achten Ausführungsform überein, d. h., es wird erhalten, indem ein Zwei-Bit-Bild-Identifikator
3702 zwischen dem Synchronsignal 701 und dem Datenkopf 703 in das in Fig. 23(c)
dargestellte kodierte Pixelwertsignal 700a eingefügt wird.
-
Das in Fig. 18(a) dargestellte zweite kodierte Beliebigformsignal 3800 stimmt mit dem
in Fig. 14(b) dargestellten zweiten kodierten Beliebigformsignal 2800 nach der achten
Ausführungsform überein und enthält einen Zwei-Bit-Bild-Identifikator 3802.
-
Außerdem enthält das in Fig. 18(b) dargestellte kodierte Transparenzsignal am
Anfang ein 32-Bit-Synchronsignal 901, einen auf das Synchronsignal 901 folgenden 3-Bit-
Bild-Identifikator (SID) 3902 und einen auf den Identifikator 3902 folgenden zusätzlichen
Datenkopf 903.
-
Außerdem enthält das kodierte Transparenzsignal 3900 kodierte Form-Bitströme
91E, die durch Kodierung eines Formsignals (binären Transparenzsignals) erhalten wurden,
welches als ein Bestandteil des Beliebigform-Transparenzsignals die Form eines jeden
Objekts darstellt; und kodierte Form-Bitströme 92E, die durch Kodierung eines mehrwertigen
Transparenzsignals erhalten wurden, welches als ein Bestandteil des Beliebigform-
Bildsignals für die Gradationswiedergabe der Transparenz eines jeden Objekts verwendet
wird. Im Einzelnen sind in dem kodierten Transparenzsignal 3900 für jeden der Blöcke, in die
eine ein Objekt auf einem Displaybild umfassende Objektregion unterteilt ist, ein kodierter
Form-Bitstrom 91 E und ein kodierter Transparenz-Bitstrom 92E in dieser Reihenfolge
angeordnet.
-
Genauer gesagt sind auf den Datenkopf 903 folgend angeordnet: ein kodierter Form-
Bitstrom 91E1 und ein kodierter Transparenz-Bitstrom 92E1, die zu einem Block E1
gehören; ein kodierter Form-Bitstrom 91E2 und ein kodierter Transparenz-Bitstrom 92E2,
die zu einem Block E2 gehören; und ein kodierter Form-Bitstrom 91E3 und ein kodierter
Transparenz-Bitstrom 92E3, die zu einem Block E3 gehören.
-
Außerdem enthalten, wie in Fig. 18(b) dargestellt ist, die kodierten Form-Bitströme
91E1, 91E2 und 91E3 jeweils längenvariant kodierte Daten 904, 909 und 914, die Form-
Bewegungsvektoren (in der Figur einfach als Form-BV bezeichnet) entsprechen; und
längenvariant kodierte Daten 905, 910 und 915, die binären Formsignalen (binären
Transparenzsignalen) entsprechen, wobei jedes Signal anzeigt, ob die Pixel in dem Block
innerhalb oder außerhalb des jeweiligen Objekts liegen (in der Figur: Formdaten).
-
Die kodierten Transparenz-Bitströme 92E1, 92E2 und 92E3 enthalten jeweils
5-Bitkodierte Daten 906, 911 und 916, die Quantisierungsskalen entsprechen (in der Figur:
Quantisierungsskala); längenvariant kodierte Daten 907, 912 und 917, die Transparenz-
Bewegungsvektoren entsprechen (in der Figur: Transparenz-BV); und längenvariant kodierte
Daten 908, 913 und 918, die quantisierten Signalen entsprechen, die aus dem mehrwertigen
Transparenzsignal durch Ausführen von DCT und Quantisierung erhalten werden (in der
Figur: Transparenz-DCT-Koeffizienten).
-
Das Synchronsignal 901 ist ein Signal zur Anzeige des Kopfes eines zu einem Objekt
gehörenden kodierten Transparenzsignals, und es ist ein einmalig kodiertes Signal. Der
Form-Identifikator (SID) 3902 ist ein Signal zur Anzeige, welchen Typ von den oben
beschriebenen fünf Typen kodierter Bildsignale das kodierte Bildsignal hat, d. h., es ist ein
Signal zur Feststellung der Art der im kodierten Bildsignal enthaltenen Bitströme. Ist der
Wert des Bild-Identifikators (SID) gleich 10, dann wird angezeigt, dass im kodierten
Bildsignal als Wiedergabedaten sowohl kodierte Form-Bitströme als auch kodierte Textur-
Bitströme vorkommen. Bei SID = 010 zeigt der Bild-Identifikator an, dass nur die kodierten
Form-Bitströme im kodierten Signal vorliegen. Bei SID = 00 zeigt der Bild-Identifikator an,
dass nur die kodierten Textur-Bitströme im kodierten Signal vorkommen. Wenn SID gleich
11 ist, dann zeigt der Bild-Identifikator das Vorhandensein der kodierten Form-Bitströme, der
kodierten Textur-Bitströme und der kodierten Transparenz-Bitströme im kodierten Signal an.
Gilt aber SID = 011, dann zeigt der Bild-Identifikator an, dass im kodierten Signal die
kodierten Form- und die kodierten Transparenz-Bitströme vorliegen.
-
Der Datenkopf 903 enthält Informationen z. B. über den Wiedergabezeitpunkt des
Bildes des zugehörigen Objekts, zum Bildattribut und zum Vorhersagemodus für die
Kodierung. Diese Daten haben jedoch keinen Bezug zur vorliegenden Erfindung und
erfordern deshalb keine ausführliche Beschreibung.
-
Der Form-BV ist die kodierte Datenmenge eines Bewegungsvektors, der die
Bewegung eines Bildes in einem Block zwischen dem vorliegenden und dem
vorhergehenden Rahmen aufzeigt, und er wird zur Vorhersage eines Formsignals eines
bestimmten Blocks im vorliegenden Rahmen aus einem Formsignal des entsprechenden
Blocks im vorhergehenden Rahmen verwendet. Im Weiteren werden die Formdaten durch
arithmetisches Kodieren eines Formsignals erhalten, und die Quantisierungsskala ist ein
Parameter für die inverse Quantisierung der DCT-Koeffizienten, die erhalten werden, indem
an einem mehrwertigen Transparenzsignal DCT und Quantisierung ausgeführt werden. Der
Transparenz-BV ist ein kodiertes Signal eines Transparenz-Bewegungsvektors, der die
Bewegung eines Bildes zwischen dem vorliegenden und dem vorhergehenden Rahmen
aufzeigt, und er wird zur Vorhersage eines mehrwertigen Transparenzsignals des
vorliegenden Rahmens aus einem mehrwertigen Transparenzsignal des vorhergehenden
Rahmen verwendet. Ferner werden die Transparenz-DCT-Koefffizienten erhalten, indem ein
quantisiertes Signal des mehrwertigen Transparenzsignals längenvariant kodiert wird.
-
Obwohl diese Daten in der Figur nicht dargestellt sind, werden im kodierten
Transparenzsignal 3900 vor den Transparenz-DCT-Koeffizienten auch verschiedene Arten
von Nebeninformationen (Daten) untergebracht, und diese Nebendaten erfordern manchmal
eine große Anzahl von Bits.
-
Es wird eine Beschreibung der Funktions- und Wirkungsweise gegeben.
-
In der so aufgebauten zehnten Ausführungsform enthalten die kodierten Bildsignale -
d. h. das erste kodierte Beliebigformsignal 3500, das kodierte Binärsignal 3600, das kodierte
Rechtecksignal 3700, das zweite kodierte Beliebigformsignal 3800 und das kodierte
Transparenzsignal 3900 - wegen ihrer unterschiedlichen Datenstrukturen die zugehörigen
Zwei-Bit-Bild-Identifikatoren 3502, 3602, 3702, 3802 und 3902 zur Identifizierung dieser
kodierten Signale. Deshalb können diese fünf kodierten Signale durch Bezugnahme auf die
Bild-Identifikatoren auf der Dekodierungsseite identifiziert werden.
-
Im Einzelnen ermöglichen die Bild-Identifikatoren in einer Bild-Dekodiervorrichtung,
die MPEG4 angepasst und für die Dekodierung des oben erwähnten kodierten
Beliebigformsignals ausgelegt ist, der Vorrichtung ein richtiges Dekodieren des kodierten
Binärsignals und des kodierten Rechtecksignals selbst dann, wenn das kodierte Binärsignal
und das kodierte Rechtecksignal gemeinsam mit dem ersten und dem zweiten kodierten
Beliebigformsignal sowie dem Beliebigform-Transparenzsignal eingegeben werden. Folglich
kann vermieden werden, dass das kodierte Binärsignal und das kodierte Rechtecksignal mit
einem an MPEG4 angepassten Dekodierungsprozess verarbeitet werden und dass der
Dekodierungsprozess abbricht.
-
In dieser zehnten Ausführungsform werden die jeweiligen kodierten Signale mit
unterschiedlichen Datenstrukturen zwar durch Inter-Rahmen-Vorhersage-Kodierung
erhalten, diese kodierten Signale können jedoch auch durch Intra-Rahmen-Kodierung
erzeugt werden.
-
Außerdem ist in den zugehörigen kodierten Signalen, die in dieser zehnten
Ausführungsform verwendet werden, einem jeden Block mindestens einer von den kodierten
Form-, Textur- und Transparenz-Bitströmen zugeordnet. In jedem kodierten Signal können
aber auch in jedem Rahmen vorgeschriebene kodierte Bitströme angeordnet werden.
-
Wie in der achten Ausführungsform der Erfindung enthält außerdem jeder der
kodierten Transparenz-Bitströme 83D in der Datenstruktur des in Fig. 18(a) dargestellten
zweiten kodierten Beliebigformsignals 3800 (kodiertes Signal des Beliebigform-Bildsignals
mit Transparenzinformationen) einen Transparenz-BV und eine Quantisierungsskala. Es ist
jedoch nicht immer nötig, dass der kodierte Transparenz-Bitstrom 83D im zweiten kodierten
Beliebigformsignal 3800 den Transparenz-BV und die Quantisierungsskala enthält, und die
Dekodierung der Transparenz-DCT-Koeffizienten kann unter Verwendung von Textur-BV
sowie Quantisierungsskala des kodierten Textur-Bitstroms 82D ausgeführt werden.
[Ausführungsform 11]
-
Fig. 19 ist ein Blockschema zur Darstellung einer Bild-Dekodiervorrichtung gemäß
einer elften Ausführungsform der vorliegenden Erfindung. Die Bezugsziffer 100g in Fig. 11
kennzeichnet eine Bild-Dekodiervorrichtung, die kodierte Daten mit der Datenstruktur zur
Bildübertragung entsprechend der zehnten Ausführungsform dekodiert. Die Bild-
Dekodiervorrichtung 100g ist so aufgebaut, dass sie einen Dekodierungs-Prozess ausführt,
welcher der Datenstruktur eines als kodierte Datenmenge einlaufenden kodierten Signals
angepasst ist.
-
Im Einzelnen ist die Vorrichtung 100g wie folgt aufgebaut. Empfängt die Vorrichtung
100g als kodierte Daten Eo das in Fig. 17(b) dargestellte kodierte Binärsignal (E2) 3600,
dann gibt sie als dekodierte Bilddaten Dsyn ein dekodiertes Binärsignal D2 aus. Empfängt
die Vorrichtung 100g als kodierte Daten Eo das in Fig. 17(a) dargestellte erste kodierte
Beliebigformsignal (Ep) 3500, dann gibt sie für jedes Objekt als dekodierte Bilddaten Dsyn
ein dekodiertes Beliebigformsignal Dp aus. Empfängt die Vorrichtung 100g als kodierte
Daten Eo das in Fig. 17(c) dargestellte kodierte Rechtecksignal (Et) 3700, dann gibt sie als
dekodierte Bilddaten Dsyn ein dekodiertes Rechtecksignal Dt aus. Empfängt die Vorrichtung
100g als kodierte Daten Eo das in Fig. 18(ä) dargestellte zweite kodierte Beliebigformsignal
(Ex) 3800, dann gibt sie für jedes Objekt als dekodierte Bilddaten Dsyn ein dekodiertes
Beliebigformsignal Dx mit Transparenz-Informationen aus. Empfängt die Vorrichtung 100g
das in Fig. 18b dargestellte kodierte Transparenzsignal (Ep) 3900, dann gibt sie als
dekodierte Bilddaten Dsyn ein dekodiertes Transparenzsignal Dg aus.
-
Im Weiteren wird die Struktur der Bild-Dekodiervorrichtung 100g ausführlich
beschrieben.
-
Die Vorrichtung 100g enthält einen Datenanalysator 160g, der die in das
Eingabeterminal 160a einlaufenden kodierten Daten Eo analysiert und gemäß dem
Analyseergebnis ein Schaltsteuersignal SWg ausgibt; eine Form-Dekodiereinheit (erste
Dekodierhilfsmittel) 170, welche für die Formdaten (kodiertes Formsignal) einen
arithmetischen Dekodierungsprozess ausführt; eine Textur-Dekodiereinheit (zweite
Dekodierhilfsmittel) 180f, welche für die Textur-DCT-Koeffizienten Ept und die Transparenz-
DCT-Koeffizienten Egt einen Dekodierungsprozess einschließlich Umkehr-DCT ausführt;
einen Schalter 101g, welcher entsprechend dem Schaltsteuersignal das vom
Datenanalysator 160g analysierte und ausgegebene kodierte Signal einer der beiden
Dekodiereinheiten 170 bzw. 180f zuführt; und einen Rahmen-Speichermodul 102f, der ein
Vorhersage-Formsignal, ein Vorhersage-Textursignal und ein Vorhersage-Transparenzsignal
speichert.
-
Der Datenanalysator 160g analysiert das einlaufende kodierte Signal zur Überprüfung
des auf das 32-Bit-Synchronsignal am Kopf folgenden 2-Bif-Bild-Identifikators (einer der Bild-
Identifikatoren 3502, 3702 und 3802 in den kodierten Signalen, die jeweils in den Fig. 17(a),
17(c) und 18(a) dargestellt sind), und steuert den Schalter 101g entsprechend dem
gesetzten Wert des Bild-Identifikators (SID).
-
Bei SID = 10 wird der Schalter 101g durch das Schaltsteuersignal SWg so gesteuert,
dass die kodierten Form-Bitströme des einlaufenden kodierten Signals in die Form-
Dekodiereinheit 170 und die kodierten Textur-Bitströme des kodierten Signals in die Textur-
Dekodiereinheit 180f eingegeben werden. Bei SID = 010 wird der Schalter 101g durch das
Schaltsteuersignal SWg so gesteuert, dass die einlaufenden kodierten Daten in die Form-
Dekodiereinheit 170 eingegeben werden. Bei SID = 00 wird der Schalter 101g durch das
Schaltsteuersignal SWg so gesteuert, dass die kodierten Textur-Bitströme des einlaufenden
kodierten Signals in die Textur-Dekodierhilfsmittel 180f eingegeben werden. Bei SID = 11
wird der Schalter 101g durch das Schaltsteuersignal SWg so gesteuert, dass die kodierten
Form-Bitströme des einlaufenden kodierten Signals in die Form-Dekodiereinheit 170 und die
kodierten Textur- sowie Transparenz-Bitströme in die Textur-Dekodiereinheit 180f
eingegeben werden. Bei SID = 011 wird der Schalter 101g durch das Schaltsteuersignal
SWg so gesteuert, dass die kodierten Form-Bitströme im einlaufenden kodierten Signal in
die Form-Dekodiereinheit 170, die kodierten Transparenz-Bitströme aber in die Textur-
Dekodiereinheit 180f eingegeben werden.
-
Ähnlich dem Datenanalysator 160 gemäß der in Fig. 7(b) dargestellten dritten
Ausführungsform enthält der Datenanalysator 160g eine Tabellen-Speichereinheit 162,
einen Komparator 161 und einen Schalter-Steuerkreis 163. In dieser elften Ausführungsform
vergleicht der Komparator 161 den Bitstrom des einlaufenden kodierten Signals mit dem
Bitstrom der Dekodier-Referenztabelle, die in der Tabellen-Speichereinheit 162 gespeichert
ist, und identifiziert den Bild-Identifikator, den kodierten Form-Bitstrom, den kodierten Textur-
Bitstrom und den kodierten Transparenz-Bitstrom, die in den kodierten Daten enthalten sind.
Entsprechend dem Ergebnis der Identifizierung steuert der Komparator 161 den Schalter
101g über ein Schaltsteuersignal SWg.
-
Die Bild-Dekodiervorrichtung 100g enthält ferner einen Synthesizer 190g, der eine
Synthese der Ausgabedaten der Dekodiervorrichtung 180f (entweder das reproduzierte
Textursignal Dpt und das reproduzierte Transparenzsignal Dpg beide zusammen oder nur
das reproduzierte Textursignal Dpt bzw. das reproduzierte Transparenzsignal Dgt) sowie der
Ausgabedaten der Dekodiereinheit 170 (das reproduzierte Formsignal Dk entsprechend der
Ausgabe der Dekodiereinheit 180f) mit gewünschten Bilddaten ausführt und an die
Wiedergabeeinheit 104 synthetisierte Bilddaten Dsyn ausgibt, die das reproduzierte
Beliebigformsignal Dx mit Transparenz-Informationen oder das reproduzierte
Beliebigformsignal Dp bzw. das reproduzierte Transparenzsignal Dg enthalten. Obwohl der
Synthesizer 190g gemäß der elften Ausführungsform das reproduzierte Binärsignal D2 von
der Dekodiereinheit 170 oder das reproduzierte Rechtecksignal Dt von der Dekodiereinheit
180f unmittelbar an die Wiedergabeeinheit 104 ausgibt, kann das Signal D2 oder Dt im
Synthesizer 190g auch mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
Obwohl das vom Synthesizer 190g ausgegebene Signal in die Wiedergabeeinheit 104
eingegeben wird, kann es auch in ein Informationsausgabegerät, wie z. B. einen Drucker
(nicht dargestellt), eingegeben werden. Die anderen Bestandteile stimmen mit den bereits
für die neunte Ausführungsform beschriebenen überein.
-
In dieser elften Ausführungsform werden für Pixel, in denen das reproduzierte
Formsignal Null ist, die Pixelwerte im reproduzierten Textursignal durch Pixelwerte eines
vorgeschriebenen Bildes ersetzt. Das vorgeschriebene Bild ist ein im Voraus an der
Empfangsstation hergestelltes Bild oder ein Bild, das von einer anderen Bild-
Dekodiervorrichtung reproduziert wurde.
-
Es wird eine Beschreibung der Arbeitsweise der Bild-Dekodiervorrichtung 100g
gemäß der elften Ausführungsform gegeben.
-
Fig. 20 ist ein Flussdiagramm des Dekodierungsprozesses durch die Bild-
Dekodiervorrichtung 100g. Wird in die Bild-Dekodiervorrichtung 100g ein kodiertes Bildsignal
mit einer Datenstruktur, die in einer der Fig. 17(a), 17(b), 17(c), 18(a) und 18(b) dargestellt
ist, eingegeben, dann analysiert der Datenanalysator 160g den auf das 32-Bit-
Synchronsignal im kodierten Bildsignal folgenden 2-Bit-Kode und entscheidet, ob dieser 2-
Bit-Kode 01 ist oder nicht (Schritt Sg1). Ist der 2-Bit-Kode nicht 01, dann wird weiter
entschieden, ob der den Wert des Bild-Identifikators darstellende 2-Bit-Kode "SID = 00 oder
01" ist oder nicht (Schritt Sg2).
-
Ist das Ergebnis der Entscheidung in Schritt Sg2 SID = 00 oder 11, dann wird
entschieden, ob SID = 00 ist oder nicht (Schritt Sg3). Ist das Ergebnis der Entscheidung in
Schritt Sg3 SID = 00, weil das einlaufende kodierte Bildsignal Eo das kodierte
Rechtecksignal (kodiertes Pixelwertsignal) Et ist, dann steuert der Datenanalysator 160g den
Schalter 101g über das Schaltsteuersignal SWg so, dass das kodierte Signal immer in die
Textur-Dekodiereinheit 180f eingegeben wird. Dadurch werden in der Textur-Dekodiereinheit
180f die kodierten Textur-Bitströme (kodierte Pixelwert-Bitströme) im kodierten
Rechtecksignal dekodiert (Schritt Sg4). Der Dekodierungsprozess in Schritt Sg4 stimmt mit
dem Dekodierungsprozess Se2 gemäß der siebenten Ausführungsform überein. Danach
wird das dekodierte Rechtecksignal Dt über den Synthesizer 190g der Wiedergabeeinheit
104 übermittelt, um als Bild wiedergegeben zu werden (Schritt Sg18). Im Synthesizer 190g
kann das dekodierte Rechtecksignal Dt mit einem anderen Beliebigform-Bildsignal
synthetisiert werden.
-
Danach wird entschieden, ob das kodierte Rechtecksignal Et aus den Daten des
letzten Blocks im letzten Rahmen besteht (Schritt Sg19). Besteht das kodierte
Rechtecksignal nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an
einem zum nächsten Block gehörenden kodierten Rechtecksignal die Schritte Sg1-Sg4,
Sg18 und Sg19 ausgeführt. Besteht das kodierte Rechtecksignal jedoch aus den Daten des
letzten Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten Rechtecksignals
beendet.
-
Ist hingegen das Ergebnis der Entscheidung in Schritt Sg3 SID = 11, dann ist das
einlaufende kodierte Bildsignal das zweite kodierte Beliebigformsignal, das als
Bildinformation die kodierten Form-Bitströme, die kodierten Textur-Bitströme und die
kodierten Transparenz-Bitströme umfasst. Der Datenanalysator 160g steuert dann den
Schalter 101g über das Schaltsteuersignal SWg so, dass der zu jedem Block des zweiten
kodierten Beliebigformsignals gehörende kodierte Form-Bitstrom in die Form-
Dekodiereinheit 170 eingegeben wird, während die zum Block gehörenden kodierten Textur-
und Transparenz-Bitströme in die Textur-Dekodiereinheit 180f eingegeben werden. Somit
werden im zweiten kodierten Beliebigformsignal der kodierte Form-Bitstrom vom kodierten
Textur-Bitstrom sowie dem kodierten Transparenz-Bitstrom separiert (Schritt Sg5), und der
separierte Form-Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt Sg6),
während die separierten Textur- und Transparenz-Bitströme durch die Textur-
Dekodiereinheit 180f dekodiert werden (Schritte Sg7 und Sg8). Die Prozesse in den
Schritten Sg5-Sg8 stimmen mit denen in den Schritten Sf4-Sf7 nach der neunten
Ausführungsform überein. Das dekodierte Formsignal Dxk, das dekodierte Textursignal Dxt
und das dekodierte Transparenzsignal Dgt werden durch den Synthesizer 190g synthetisiert
und als synthetisiertes Signal Dsyn wird das dekodierte Beliebigformsignal Dx zur
Wiedergabe als Bild in die Wiedergabeeinheit 104 eingegeben (Schritt Sg18).
-
Danach wird entschieden, ob das zweite kodierte Beliebigformsignal Ex aus den
Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sg19). Besteht es nicht aus
den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten
Block gehörenden zweiten kodierten Beliebigformsignal Ex die Schritte Sg1-Sg3, Sg5-
Sg8, Sg18 und Sg19 ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im
letzten Rahmen, dann ist die Dekodierung des zweiten kodierten Beliebigformsignals
beendet.
-
Ist das Ergebnis der Entscheidung in Schritt Sg2 SID = 10, dann ist das einlaufende
kodierte Bildsignal Eo das erste kodierte Beliebigformsignal Ep, welches als Bildinformation
die kodierten Form-Bitströme und die kodierten Textur-Bitströme enthält. Der
Datenanalysator 160g steuert dann den Schalter 101g über das Schaltsteuersignal SWg so,
dass der zu jedem Block des kodierten Beliebigformsignals gehörende kodierte Form-
Bitstrom in die Form-Dekodiereinheit 170 eingegeben wird, während der zum Block
gehörende kodierte Textur-Bitstrom in die Textur-Dekodiereinheit 180f eingegeben wird.
Dadurch werden im kodierten Beliebigformsignal der kodierte Form-Bitstrom und der
kodierte Textur-Bitstrom voneinander separiert (Schritt Sg9), und der separierte Form-
Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt Sg10), während der
separierte Textur-Bitstrom durch die Textur-Dekodiereinheit 180f dekodiert wird (Schritt
Sg11). Die Dekodierungsprozesse in den Schritten Sg9-Sf11 stimmen mit den
Dekodierungsprozessen in den Schritten Sf10-Sf12 nach der neunten Ausführungsform
überein.
-
Das dekodierte Formsignal Dpk und das dekodierte Textursignal Dpt werden durch
den Synthesizer 190g synthetisiert und als synthetisiertes Signal Dsyn wird das erste
dekodierte Beliebigformsignal Dp zur Bildwiedergabe in die Wiedergabeeinheit 104
eingegeben (Schritt Sg18).
-
Danach wird entschieden, ob das erste kodierte Beliebigformsignal Ep aus den Daten
des letzten Blocks im letzten Rahmen besteht (Schritt Sg19). Besteht es nicht aus den
Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block
gehörenden ersten kodierten Beliebigformsignal Ep die Schritte Sg1, Sg2 und Sg9-Sg11,
Sg18 und Sg19 ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im letzten
Rahmen, dann ist die Dekodierung des ersten kodierten Beliebigformsignals beendet.
-
Außerdem wird dann, wenn die Entscheidung im Schritt Sg1 ergibt, dass der auf das
Synchronsignal folgende 2-Bit-Kode gleich 01 ist, im Schritt Sg12 entschieden, ob der Wert
des Bild-Identifikators (SLD) gleich 010 ist oder nicht. Ist SID = 010, weil das
einlaufende kodierte Bildsignal Eo das kodierte Binärsignal E2 ist, das nur die kodierten
Form-Bitströme als Bildinformation enthält, dann steuert der Datenanalysator 160g den
Schalter 101g über das Schaltsteuersignal SWg so, dass der zu jedem Block im kodierten
Binärsignal gehörende kodierte Form-Bitstrom immer in die Form-Dekodiereinheit 170
eingegeben wird. Somit werden die kodierten Form-Bitströme im kodierten Binärsignal in der
Form-Dekodiereinheit 170 dekodiert (Schritt Sg13). Der Dekodierungsprozess Sg13 stimmt
mit dem Dekodierungsprozess in Schritt Sb2 gemäß der dritten Ausführungsform überein.
Danach wird das dekodierte Binärsignal D2 über den Synthesizer 190g zur Wiedergabe an
die Wiedergabeeinheit 104 geleitet (Schritt Sg18). Im Synthesizer 190g kann das dekodierte
Binärsignal D2 mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
-
Danach wird entschieden, ob das kodierte Binärsignal aus den Daten des letzten
Blocks im letzten Rahmen besteht (Schritt Sg19). Besteht es nicht aus den Daten des
letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden
kodierten Binärsignal die Schritte Sg1, Sg12, Sg13, Sg18 und Sg19 ausgeführt. Besteht es
jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des
kodierten Binärsignals beendet.
-
Wird jedoch im Schritt Sg12 entschieden, dass SID nicht 010 ist, dann wird in Schritt
Sg14 entschieden, ob SID gleich 011 ist oder nicht. Wenn SID nicht 011 ist, dann kehrt der
Dekodierungsprozess der Bild-Dekodiervorrichtung 100g zum Schritt Sg1 zurück.
-
Ist das Ergebnis der Entscheidung in Schritt Sg14 SID = 011, weil das einlaufende
kodierte Bildsignal Eo als Bildinformation die kodierten Form-Bitströme Egk und die
kodierten Transparenz-Bitströme Egt enthält, dann steuert der Datenanalysator 160g den
Schalter 101g über das Schaltsteuersignal SWg so, dass der zu jedem Block des kodierten
Beliebigformsignals gehörende kodierte Form-Bitstrom Egk in die Form-Dekodiereinheit 170
eingegeben wird, während der zum Block gehörende kodierte Transparenz-Bitstrom Egt in
die Textur-Dekodiereinheit 180f eingegeben wird. Damit werden im kodierten
Transparenzsignal der kodierte Form-Bitstrom Egk und der kodierte Textur-Bitstrom Egt
voneinander separiert (Schritt Sg15), und der separierte Form-Bitstrom Egk wird durch die
Form-Dekodiereinheit 170 dekodiert (Schritt Sg16), während der separierte Transparenz-
Bitstrom Egt durch die Textur-Dekodiereinheit 180f dekodiert wird (Schritt Sg17).
-
Das heißt, der kodierte Form-Bitstrom Egk wird - ähnlich wie der kodierte Form-
Bitstrom E2k des binären Bildsignals - durch die Form-Dekodiereinheit 170 dekodiert. Nach
Abschluss der Dekodierung des zu einem Block gehörenden kodierten Form-Bitstroms Egk
stellt der arithmetische Dekoder 171 das Ende des zu diesem Block gehörenden kodierten
Form-Bitstroms Egk fest und gibt ein Abschlusszeitsignal Te an den Datenanalysator 160g
aus. Beim Empfang des Abschlusszeitsignals Te steuert der Datenanalysator 160g den
Schalter 101g über das Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal
in die Textur-Dekodiereinheit 180f eingegeben wird.
-
Somit wird der kodierte Transparenz-Bitstrom Egt vom Datenanalysator 160f zur
Textur-Dekodiereinheit 180f geleitet. In der Dekodiereinheit 180f werden die
Quantisierungsskala und die DCT-Koeffizienten in jedem Bitstroms in den invers-
Quantisierer 181f eingegeben, und die DCT-Koeffizienten werden invers quantisiert. Danach
wird am invers quantisierten Signal Diq durch den Umkehr-Kosinus-Transformator 182f eine
Umkehr-Kosinus-Transformation ausgeführt.
-
Inzwischen wird der Transparenz-Bewegungsvektor BV in den Textur-
Bewegungskompensator 184f eingegeben. Der Kompensator 184f erzeugt eine Adresse zur
Versorgung mit einem Vorhersage-Transparenzsignal, das dem Transparenz-
Bewegungsvektor BV zugeordnet ist, und erhält aus dem Rahmen-Speichermodul 102f unter
Verwendung der Adresse das Vorhersage-Textursignal Emg.
-
Der Addierer 183 führt eine Addition der Ausgabedaten Didct vom Umkehr-Kosinus-
Transformator 182f und des Vorhersage-Transparenzsignals Emg aus und gibt ein
dekodiertes Transparenzsignal Dgt aus. Das dekodierte Transparenzsignal Dgt wird in den
Rahmen-Speichermodul 102f und den Synthesizer 190g eingegeben. Der Synthesizer 190g
führt eine Synthese des reproduzierten Transparenzsignals Dgt und des dazugehörigen
reproduzierten Formsignals Dgk mit einem gewünschten Bild zur Erzeugung synthetisierter
Bilddaten Dsyn aus. Die synthetisierten Bilddaten Dsyn werden zur Wiedergabe als ein Bild
in die Wiedergabeeinheit 104 eingegeben (Schritt Sg18). Beim Abschluss der Dekodierung
des kodierten Transparenz-Bitstroms stellt der Datenanalysator 160g das Ende des
kodierten Transparenz-Bitstroms fest und steuert den Schalter 101f über das
Schaltsteuersignal SWg so, dass das einlaufende kodierte Bildsignal in die Form-
Dekodiereinheit 170 eingegeben wird.
-
Danach wird entschieden, ob das eingegebene kodierte Signal aus den Daten des
letzten Blocks im letzten Rahmen besteht (Schritt Sg19). Besteht es nicht aus den Daten
des letzten Blocks im letzten Rahmen, dann werden an einlaufenden kodierten Daten, die
zum nächsten Block gehören, die Schritte Sg1, Sg12 und Sg14-Sg19 ausgeführt. Besteht
es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung
des eingegebenen kodierten Signals beendet.
-
In dieser elften Ausführungsform werden für Pixel, in denen das reproduzierte
Formsignal Null ist, die Pixelwerte im reproduzierten ersten und zweiten Beliebigformsignal
und im reproduzierten Transparenzsignal durch Pixelwerte eines vorgeschriebenen Bildes
ersetzt. Das vorgeschriebene Bild ist ein im Voraus an der Empfangsstation hergestelltes
Bild oder ein Bild, das von einer anderen Bild-Dekodiervorrichtung reproduziert wurde.
-
Wie oben mit Bezug auf die elfte Ausführungsform der Erfindung beschrieben wurde,
enthält die Bild-Dekodiervorrichtung 100g einen Datenanalysator 160g zur Analyse der
einlaufenden kodierten Daten. Der Datenanalysator 160g detektiert einen Bild Identifikator,
der anzeigt, um welches kodierte Signal - das kodierte Binärsignal E2, das erste und zweite
kodierte Beliebigformsignal Ep und Ex, das kodierte Rechtecksignal Et oder das kodierte
Transparenzsignal Eg - es sich beim einlaufenden kodierten Signal handelt, und je nach
Wert des Bild-Identifikators steuert der Analysator 160g den Schalter 101g so, dass das
einlaufende kodierte Signal richtig in die Form-Dekodiereinheit 170 bzw. die Textur-
Dekodiereinheit 180f eingegeben wird. Somit können die oben erwähnten fünf kodierten
Bildsignale, die unterschiedliche Datenstrukturen haben, mit Dekodierungsprozessen
dekodiert werden, die zu einem einzigen Kodierungsverfahren korrespondieren.
-
Außerdem werden in dieser elften Ausführungsform der kodierte Textur-Bitstrom und
der kodierte Transparenz-Bitstrom in der Textur-Dekodiereinheit 180f mit demselben
Dekodierungsverfahren dekodiert. Wie in der neunten Ausführungsform beschrieben wurde,
kann der kodierte Transparenz-Bitstrom jedoch auch mit einem Dekodierungsverfahren
dekodiert werden, das sich von dem für den kodierten Textur-Bitstrom verwendeten
unterscheidet.
-
Diese elfte Ausführungsform der Erfindung ist darüber hinaus besonders auf die Bild-
Dekodiervorrichtung 100g ausgerichtet, welche die kodierten Signale mit der für die zehnte
Ausführungsform beschriebenen Datenstruktur, d. h. ein erstes und zweites kodiertes
Beliebigformsignal, ein kodiertes Binärsignal, ein kodiertes Transparenzsignal und ein
kodiertes Rechtecksignal, unter Verwendung ihrer Bild-Identifikatoren identifiziert und zu den
jeweiligen Datenstrukturen passend die Dekodierungsprozesse ausführt. Wenn jedoch die
Bild-Eingabeeinheit 110 in der Bild-Kodiervorrichtung 100a gemäß der in Fig. 3 dargestellten
zweiten Ausführungsform so aufgebaut ist, dass sie ein Beliebigform-Bildsignal, ein binäres
Bildsignal, ein Rechteck-Bildsignal, ein Beliebigform-Transparenzsignal und ein
Beliebigform-Bildsignal mit Transparenz-Informationen identifizieren kann, dann kann eine
Bild-Kodiervorrichtung so aufgebaut werden, dass sie die Kodierung dieser Bildsignale mit
Bild-Identifikatoren zur Identifizierung der zu diesen Bildsignalen gehörenden kodierten
Signale ausführt.
-
Wird ein Kodierungs- oder Dekodierungsprogramm zur Verwirklichung einer der
oben erwähnten Bildkodier- oder -dekodiervorrichtungen bzw. Bildkodierungs- oder -
dekodierungsverfahren in einem. Datenspeichermedium (z. B. einer Diskette) gespeichert,
dann kann die Bildverarbeitung nach einer der oben erwähnten Ausführungsformen einfach
in einem unabhängigen Computersystem ausgeführt werden.
-
Fig. 21(a)-21(c) sind schematische Darstellungen Zur Erläuterung des Bild-
Kodierungsprozesses nach der zweiten Ausführungsform oder des Bild-
Dekodierungsprozesses nach der dritten, vierten, fünften, siebenten, neunten oder elften
Ausführungsform mit einem Computersystem unter Verwendung einer Diskette, die das
Kodierungs- oder Dekodierungsprogramm enthält.
-
Fig. 21(a) zeigt eine Vorderansicht einer Diskette FD, deren Querschnittsansicht und
einen Diskettenkörper D. Fig. 21(b) zeigt ein Beispiel für ein physisches Format des
Diskettenkörpers D.
-
Der Diskettenkörper D steckt in einer Hülle FC, und beide bilden die Diskette FD. Auf
der Oberfläche des Diskettenkörpers D sind konzentrisch vom äußeren Durchmesser der
Diskette zum inneren Durchmesser hin eine Vielzahl von Spuren Tr angebracht. Jede Spur
ist in 16 Winkelsektoren unterteilt. Somit werden in der Diskette FD, die das oben erwähnte
Programm enthält, die Programmdaten in zugewiesenen Sektoren auf dem Diskettenkörper
D gespeichert.
-
Fig. 21(c) zeigt die Struktur zur Speicherung des Programms auf der Diskette FD und
zur Ausführung der Bildverarbeitung unter Verwendung des auf der Diskette FD
gespeicherten Programms.
-
Im Einzelnen werden bei Speicherung des Programms auf der Diskette FD
Programmdaten vom Computersystem Cs über das Disketten-Laufwerk FDD auf die
Diskette FD geschrieben. Wird die oben erwähnte Bild-Kodiervorrichtung oder die Bild-
Dekodiervorrichtung im Computersystem Cs durch das in der Diskette FD gespeicherte
Programm realisiert, dann wird das Programm aus der Diskette FD mit Hilfe des Disketten-
Laufwerks FDD gelesen und dann in das Computersystem Cs geladen.
-
In der obigen Beschreibung wird zwar eine Diskette als Speichermedium verwendet,
es kann aber auch eine Bildplatte verwendet werden. Auch in diesem Fall kann - in
ähnlicher Weise wie bei dem oben erwähnten Einsatz der Diskette - die Bild-Kodierung oder
- Dekodierung mittels Software ausgeführt werden. Das Speichermedium ist nicht auf eine
Diskette oder eine Bildplatte beschränkt, sondern es kann ein beliebiges zur Speicherung
des Programms geeignetes Medium, so z. B. eine Karte mit integriertem Schaltkreis oder ein
Festwertspeicher, verwendet werden.
-
Außerdem gibt es den Fall, dass kodierte Bildsignale mit unterschiedlichen
Datenstrukturen, wie z. B. ein kodiertes Binärsignal, ein kodiertes Rechtecksignal, ein erstes
und ein zweites kodiertes Beliebigformsignal und ein kodiertes Transparenzsignal, in einem
Datenspeichermedium, wie z. B. einer Bildplatte, gespeichert werden.
-
Unter der Annahme, dass die in einem Datenspeichermedium gespeicherten
kodierten Bildsignale mit unterschiedlichen Datenstrukturen solche kodierten Bildsignale
sind, die Datenstrukturen mit Bild-Identifikatoren gemäß der ersten, sechsten, achten oder
zehnten Ausführungsform aufweisen, können - beim Auslesen dieser kodierten Bildsignale
aus dem Medium und bei der Dekodierung - die jeweiligen kodierten Signale mit Hilfe von
Identifikatoren identifiziert und angepasst an die Datenstrukturen der kodierten Signale mit
einem Bild-Dekodierungsverfahren oder einer Bild-Dekodiervorrichtung dekodiert werden,
die zu einem einzigen Kodierungsverfahren korrespondieren. Zum Beispiel können kodierte
Bildsignale mit unterschiedlichen Strukturen, wie z. B. ein kodiertes Binärsignal oder ein
kodiertes Beliebigformsignal, dekodiert werden. In diesem Falle kommt man mit Hinblick auf
das kodierte Binärsignal bei der Erzeugung des Binärsignals ohne ein kodiertes Blind-
Textursignal aus, wodurch die unerwünschte Zunahme der Kode-Bitzahl weitgehend
vermieden wird.
Patentansprüche
-
1. Ein Bild-Dekodierungsverfahren beim Eingang eines kodierten Bildsignals, das durch
Kodieren eines Bildsignals erhalten wurde, welches ein Formsignal enthält, das anzeigt, ob
jedes Pixel außerhalb oder innerhalb eines Objekts liegt, wobei das kodierte Bildsignal
entsprechend der Datenstruktur des kodierten Bildsignals einen Bild-Identifikator enthält,
-
und mit dem Schritt zum Dekodieren von kodierten Formsignal-Daten des
einlaufenden kodierten Bildsignals,
-
und mit dem weiteren Schritt zum Dekodieren von kodierten Pixelwertsignal-Daten
des einlaufenden kodierten Bildsignals,
-
wobei
-
der Identifikator zur Entscheidung dient, ob das kodierte Bildsignal nur die kodierten
Formsignal-Daten oder die kodierten Formsignal-Daten und die kodierten Pixelwertsignal-
Daten enthält,
-
wobei dann, wenn das einlaufende kodierte Bildsignal nur die kodierten Formsignal-Daten
enthält, nur der Schritt zum Dekodieren von dessen kodierten Formsignal-Daten mittels
kontextbezogenem arithmetischen Dekodieren ausgeführt wird,
-
und dann, wenn das einlaufende kodierte Bildsignal die kodierten Formsignal-Daten und die
kodierten Pixelwertsignal-Daten enthält, der Schritt zum Kodieren der kodierten Formsignal-
Daten und der weitere Schritt zum Dekodieren der kodierten Pixelwertsignal-Daten
ausgeführt werden.
-
2. Das Bild-Dekodierungsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass der
Bild-Identifikator einen 2-Bit-Kode enthält.
-
Fig. 1(a)
-
Textur-DCT-Koeffizient
-
Textur BV
-
Quantisierungsskala
-
Formdaten
-
Form-BV
-
zusätzlicher Datenkopf
-
Synchronsignal
-
längenvariant
-
Fig. 1(b)
-
Formdaten
-
Form-BV
-
zusätzlicher Datenkopf
-
Synchronsignal
-
längenvariant
-
Fig. 2(a)
-
Formdatenteil
-
zusätzlicher Datenkopf
-
Synchronsignal
-
Texturdatenteil
-
Formdatenteil
-
Rahmen
-
Fig. 2(6)
-
Formdatenteil
-
zusätzlicher Datenkopf
-
Synchronsignal
-
Rahmen