-
Die Erfindung bezieht sich im allgemeinen auf ein Fernsehsystem, in dem
digitailsierte Fernsehsignale von einer Codierstation zu einer Decodierstation übertragen
werden. Insbesondere bezieht sich die Erfindung auf ein Fernsehsystem, in dem die
Codierstation mit einer Codierschaltung versehen ist, die dazu eingerichtet ist, eine
Transformationscodierung durchzuführen, bei der jeweils eine Gruppe von
Fernsehsignalabtastwerten eines Bildes in eine Gruppe von Koeffizienten umgewandelt
wird, die zu der Decodierstation übertragen werden. Diese Decodierstation hat zur
Rückgewinnung der ursprünglichen Fernsehsignalabtastwerte eine Decodierschaltung,
die dazu eingerichtet ist, jede Gruppe von Koeffizienten einer inversen Transformation
auszusetzen.
-
Ein derartiges System kann einen Teil eines Fernsehrundfunksystems
bilden. In dem Fall ist die Codierstation in den Fernsehsender aufgenommen und ist
jeder Fernsehempfänger mit einer Decodierstation versehen. Zum Übertragen
digitalisierter Fernsehsignale wird in dem Fall ein Fernsehkanal benutzt.
-
Auch kann ein derartiges System einen Teil eines Video-Recorders bilden,
wobei in diesem Fall zum Übertragen der digitalisierten Fernsehsignale von der
Codierstation zu der Decodierstation das Videoband benutzt wird.
A(2) Beschreibung des Standes der Technik
-
Wie allgemein bekannt, hat der Fachmann eine Anzahl grundsätzlicher
Verfahren zur Verfügung, ein digitales Fernsehsignal zu codieren, und zwar:
-
(a) Prädiktive Codierung, abgekürzt PC;
-
(b) Transformationscodierung, abgekürzt TC.
-
Zum Durchführen jedes dieser Verfahren wird das Fernsehsignal zunächst
mit einer Frequenz abgetastet, die meistens zweimal höher ist als die höchste Frequenz
in dem Signal. Diese Abtastfrequenz ist für ein Fernsehsignal, das eine Bandbreite von
etwa 5 MHz hat, gleich etwa 10 MHz. Wird nun jeder auf diese Weise erhaltene
Abtastwert durch Pulscodemodulation in ein 8 Bit PCM-Wort umgewandelt, so ergibt
dies eine Bitrate von etwa 80 M Bit/Sekunde. Es stellt sich in der Praxis heraus, daß
diese Bitrate unakzeptierbar hoch ist. Denn diese Bitrate erfordert einen
Übertragungskanal mit einer Bandbreite von etwa 40 MHz, welche Bandbreite es in
einem Fernseh-Rundfunkkanal nicht gibt und noch weniger auf einem Videoband.
-
Eine wesentliche Verringerung dieser Bitrate läßt sich dadurch erhalten,
daß die PCM-Worte einer prädiktiven Codierung ausgesetzt werden. Wie allgemein
bekannt, siehe beispielsweise das Bezugsmaterial 1, Seiten 378-390, wird dabei von
jedem PCM-Wort ein Prädiktionswort subtrahiert und die auf diese Weise erhaltene
Differenz wird abermals einer Pulscodemodulation ausgesetzt. Da zur Darstellung dieser
Differenzen 4-Bits Codeworte meistens ausreichen, wird eine Halbierung der Bitrate
gegenüber der Pulscodemodulation verwirklicht.
-
Außer dieser prädiktiven Codierung können die PCM-Worte einer
Transformationscodierung ausgesetzt werden, siehe beispielsweise das Bezugsmaterial 1,
Seiten 390-396. Wie allgemein bekannt, wird dabei das Fernsehbild in Teilbildern von
NxN Bildelementen aufgeteilt. Jedes Teilbild wird daraufhin als eine Summe einer
Anzahl zueinander orthogonaler Basisbilder B(i, k) betrachtet;
i, k = 1, 2, ... N, mit je einem eigenen Gewichtungsfaktor y(i, k). Diese
Gewichtungsfaktoren werden üblicherweise als Koeffizienten betrachtet. Sie werden zu
der Decodierstation übertragen.
-
Damit diese Koeffizienten mit möglichst niedriger Bitrate zu der
Decodierstation übertragen werden, werden sie zunächst einer adaptiven Codierung
ausgesetzt (siehe beispielsweise das Bezugsmaterial 2). Dabei werden zur Codierung der
signifikantesten Koeffizienten viele Bits zur Verfügung gestellt, zur Codierung weniger
signifikanter Koeffizienten weniger Bits, während zur Codierung der am wenigsten
signifikanten Koeffizienten überhaupt keine Bits zur Verfügung gestellt werden; mit
anderen Worten diese am wenigsten signifikanten Koeffizienten werden nicht zu der
Decodierstation übertragen.
-
In dem Fall von Schwarz-Weiß-Fernsehen, wobei das Fernsehsignal nur
eine sich in der Zeit ändernde Größe darstellt, nämlich die Leuchtdichte, stellt das
Basisbild B(1, 1) die mittlere Leuchte des Teilbildes dar und y(1, 1) die Amplitude
derselben. Dieser Koeffizient y(1, 1) ist meistens der signifikanteste und muß daher mit
größter Genauigkeit codiert werden. In der Praxis stellt es sich heraus, daß acht oder
neun Bits dazu ausreichen. Die übrigen Koeffizienten brauchen meistens mit nicht mehr
als fünf Bits codiert zu werden.
-
Durch eine geeignete Wahl der Transformation läßt sich eine Bitrate
verwirklichen, die noch niedriger ist als die Bitrate, die mit Hilfe prädiktiver Codierung
erhalten wird. Die in diesem Zusammenhang üblichsten Transformationen sind die
Hotelling-, die Fourier-, die Haar-, und die diskrete Kosinus-Transformation.
-
Ein Teilbild läßt sich derart zusammenstellen, daß es Bildelemente des
geradzahligen sowie des ungeradzahligen Teilbildes eines Fernsehbildes aufweist. Die
Transformation eines derartigen Teilbildes wird als Bildtransformation ("intraframe
transform") bezeichnet. Es ist auch möglich, ein Teilbild aus Bildelementen
zusammenzustellen, die alle entweder zu dem geradzahligen oder zu dem
ungeradzahligen Teilbild eines Fernsehbildes gehören. Die Transformation eines
derartigen Teilbildes wird als Teilbildtransformation ("intrafield transform") bezeichnet.
-
Obschon im allgemeinen der Eindruck herrscht, daß sich mit Hilfe einer
Bildtransformation eine durchaus interessante Bitratenverringerung verwirklichen läßt,
und zwar mit nur einem geringen Verlust an Bildqualität, stellt es sich heraus, daß diese
Verringerung in der Praxis nur signifikant ist, wenn die umzuwandelnden Bilder
Standbilder sind. Für bewegte Bilder stellt es sich heraus, daß eine
Teilbildtransformation wirtschaftlicher ist als eine Bildtaansformation.
B. Aufgabe und Zusammenfassung der Erfindung
-
Die Erfindung hat nun zur Aufgabe, ein Fernsehsystem zu schaffen, bei
dem Transformationscodierung angewandt wird und bei dem im Falle von bewegten
Bildern ebenfalls eine durchaus interessante Bitratenverringerung verwirklichbar ist.
-
Nach der Erfindung weist ein derartiges Fernsehsystem das Kennzeichen
auf, daß die Codierschaltung in der Codierstation mit einer Transformationsschaltung
mit einem Teilbild- und einem Bildtransformationsmodus versehen ist, daß ein
Bewegungsdetektor vorgesehen ist, dem das Fernsehsignal zugeführt wird und der ein
Anzeigesignal liefert, das angibt, ob in der Zeit zwischen den zwei
aufeinanderfolgenden Teilbildern eines Bildes ein Objekt in diesem Bild eine
Verschiebung erfahren hat, die innerhalb des zu transformierenden Teilbildes spürbar
ist, daß Mittel vorgesehen sind zum Selektieren der mittels Teilbildtransformation
erhaltenen Koeffizienten, damit diese zu der Decodierstation übertragen werden, wenn
eine derartige Verschiebung stattgefunden hat und damit die durch Bildtransformation
erhaltenen Koeffizienten selektiert werden zum Übertragen zu der Decodierstation,
wenn eine derartige Verschiebung nicht stattgefunden hat, daß die Decodierstation mit
einer inversen Transformationsschaltung mit einer inversen Teilbild- und einem inversen
Bildtransformationsmodus versehen ist, der die Koeffizienten zugeführt werden, und daß
Mittel vorgesehen sind um das Anzeigesignal zu regenerieren und dadurch die mittels
der inversen Teilbildtransformation erhaltenen Video-Signalabtastwerte bzw. die mittels
der inversen Bildtransformation erhaltenen Video-Signalabtastwerte für Wiedergabe zu
selektieren.
-
Der Erfindung liegt der nachfolgende Gedanke zugrunde. Es wird nun
vorausgesetzt, daß ein Gegenstand in einem Bild durch eine vertikale Linie begrenzt
wird. Wird diese Linie in horizontaler Richtung verschoben, so werden diejenigen Teile
dieser Linie, die in einem bestimmten Teilbild wiedergegeben werden, gegenüber
denjenigen Teilen dieser Linie, die in dem unmittelbar vorhergehenden Teilbild
wiedergegeben wurden, einigermaßen verschoben sein. Wird ein derartiges Bild
ausschließlich einer Bildtransformation ausgesetzt, so werden viel weniger Koeffizienten
höherer Ordnung hinzugezogen werden müssen als wenn keine Bewegung vorhanden
gewesen wäre. Denn die durch diese Bewegung entstandene meanderförmige statt
gerade Linie kann in der Decodierstation nur dann genau wiedergegeben werden, wenn
Koeffizienten viel höherer Ordnung dahin übertragen werden.
-
Weil derartige Bewegungseffekte nicht innerhalb eines Teilbildes spürbar
sind, werden sie auch nicht zum Ausdruck gelangen, wenn in einem derartigen Fall
Teilbildtransformation angewandt wird. In dem Fall brauchen nicht mehr Koeffizienten
höherer Ordnung in Betracht gezogen zu werden als der Fall gewesen wäre, wenn das
Bild ein Standbild und einer Bildtransformation ausgesetzt gewesen wäre. Gegenüber
der Situation, in der nur Bildtransformation angewandt wäre, wird durch Anwendung
der erfindungsgemäßen Maßnahmen eine interessante Bitratenverringerung erzielt.
-
Es sei bemerkt, daß Bildtransformation bei Standbildern zu der niedrigsten
Bitrate führt. Denn bei Bildtransformation wird nicht nur die Beziehung zwischen den
Bildpunkten, die zu demselben Teilbild gehören berücksichtigt (zweidimensionale
Beziehung), sondern es wird auch die Beziehung zwischen Bildpunkten berücksichtigt,
die zu unterschiedlichen Teilbildern gehören (dreidimensionale Beziehung).
-
In dem oben beschriebenen Fernsehsystem wird die Selektion der
Koeffizienten, die zu der Decodierstation übertragen werden müssen durch den
Bewegungsdetektor durchgeführt. Dieser läßt sich derart einstellen, daß er bei der
geringsten Bewegung in dem Bild diejenigen Koeffizienten selektiert, die mittels
Teilbildtransformation erhalten werden. Es stellt sich heraus, daß dies die Anzahl zu
übertragender Koeffizienten und folglich die Bitrate beeinträchtigt. Wird in dem Bild
eine bestimmte Menge an Bewegung erlaubt, bevor die durch Bildtransformation
erhaltenen Koeffizienten selektiert werden, so wird eine geringe Zunahme der Anzahl
Koeffizienten erhalten. Damit nun die Anzahl zu übertragender Koeffizienten weiter
verringert wird, gibt es entsprechend einer weiteren Ausgestaltung des Fernsehsystems
in der Codierschaltung eine Filteranordnung zum Durchführen einer Medianfilterung an
den Fernsehsignalabtastwerten eines Bildes, wobei Ausgangsabtastwerte dieser
Filteranordnung ausschließlich der Bildtransformation ausgesetzt werden.
-
Eine derartige Filteranordnung ist an sich allgemein bekannt. Siehe
beispielsweise das Bezugsmaterial 3, Seiten 330-333. Diese Filteranordnung bildet aus
zwei zusammengehörigen Teilbildern ein Bild, in dem keine Bewegungseffekte
auftreten.
C. Bezugsmaterial
-
1. Picture Coding: A review;
-
A.N. Netravali, J.O. Limb;
-
Proceedings of the IEEE, Heft 68, Nr. 3, März 1980, Seiten 366-406.
-
2. Method of and Arrangement for Digitizing a Time-Discrete Video Signal Using
a Picture Transform Coding
-
U.S. Patent Nr. US-A-4.398.217.
-
3. Digital Image Processing;
-
W.K. Pratt;
-
A Wiley-interscience publication, J. Wiley and Sons, (ISBN 0-471-01888-0).
-
4. Videosignal Processing Circuit for Processing an Interlaced Video Signal;
EP-A-0 192 292.
D. Kurze Beschreibung der Figuren
-
Fig. 1 zeigt auf schematische Weise den allgemeinen Aufbau eines Video-
Recorders mit dem Fernsehsystem mit Transformationscodierung;
-
Fig. 2 zeigt eine Transformationsschaltung zum Gebrauch in dem
Fernsehsystem nach Fig. 1.
-
Fig. 3 zeigt zur Erläuterung ein aus Bildelementen aufgebautes und in
Teilbilder aufgeteiltes Bild.
-
Fig. 4 zeigt eine Produktmatrix sowie ihre Aufteilung in
Teilproduktmatrizen;
-
Fig. 5 zeigt einen Bewegungsdetektor zum Gebrauch in der
Transformationsschaltung nach Fig. 2;
-
Fig. 6 zeigt einige Teilbilder zur Erläuterung der Wirkungsweise des
Bewegungsdetektors nach Fig. 5;
-
Fig. 7 zeigt die Verwendung eines Medianfilters in der
Transformationsschaltung nach Fig. 2;
-
Fig. 8 zeigt einen adaptiven Coder zum Gebrauch in der Codierschaltung
nach Fig. 1.
E. Beschreibung einiger Ausführungsbeispiele
E(1) Allgemeiner Aufbau des Fernsehsystems
-
Fig. 1 zeigt auf schematische Weise einen Video-Recorder, der mit einem
erfindungsgemäßen Fernsehsystem versehen ist. Dieses System umfaßt eine
Codierstation I und eine Decodierstation II. Die Codierstation erhält über einen Eingang
1 ein analoges Bildsignal x(t) das von einer Bildsignalquelle 2 geliefert wird. Die
Codierstation ist weiterhin mittels eines Schreibkopfes 3 mit einem Magnetband 4
gekoppelt. Auch die Decodierstation 2 ist mit dem Magnetband 4 gekoppelt und zwar
mittels eines Lesekopfes 5. Diese Decodierstation liefert an dem Ausgang 6 ein analoges
Bildsignal x'(t), das einem Monitor 7 zugeführt wird.
-
Die Codierstation ist mit einer Codierschaltung 8 versehen, der das
analoge Signal zugeführt wird und die eine Impulsreihe z(j) liefert, die über eine
Modulationsschaltung 9 und den Schreibkopf 3 auf dem Magnetband aufgezeichnet
wird.
-
Auf entsprechende Weise ist die Decodierstation mit einer
Decodierschaltung 10 versehen, der die Impulsreihe z'(j) zugeführt wird, die durch
Demodulation in einem Demodulator 11 von dem Signal, das mit Hilfe des Lesekopfes
5 von dem Magnetband 4 abgelesen wird, erhalten wird.
-
In der Codierschaltung 8 wird das analoge Bildsignal x(t) zunächst in
einer Abtastschaltung 81 mit einer geeignet gewählten Abtastfrequenz von etwa 10 MHz
abgetastet, wodurch eine Reihe von Bildsignalabtastwerten bzw. Bildelementen erhalten
wird. Diese Bildelemente werden in einem Analog-Digitalwandler 82 in 8-Bit-PCM-
Worte x(n) umgewandelt und einer Transformationsschaltung 83 zugeführt, deren
Aufbau untenstehend noch näher erläutert wird. An dieser Stelle sei bereits bemerkt,
daß der Wandler jeweils Blöcke von NxN Bildelementen x(i, k) des Bildes in einen
gleich großen Block von NxN Koeffizienten y(i, k) und ein Anzeigebit MD umwandelt.
Insbesondere wird dabei der Block von Bildelementen x(i, k) einer Teilbild- bzw. einer
Bildtransformation ausgesetzt. Das Anzeigebit MD gibt an, durch welche
Transformation der Block von Koeffizienten erhalten worden ist. Diese Koeffizienten,
sowie das Anzeigebit werden daraufhin einem adaptiven Coder 54 zugeführt, der
überprüft, welchem einer Anzahl von Kriterien der Block von Koeffizienten entspricht.
Danach wird jedem Koeffizienten eine bestimmte Anzahl Bits zugeordnet. Diese Anzahl
ist abhängig von dem Kriterium, dem entsprochen wird. Zum Schluß wird jeder
Koeffizient entsprechend der Anzahl ihm zugeordneter Bits codiert. Die adaptive
Codierschaltung 84 liefert weiterhin noch ein oder mehrere Klassifikationsbits kl,
wodurch angegeben wird, welchem Kriterium die Gruppe von Koeffizienten entspricht.
Von derartigen adaptiven Codierschaltungen sind in der Literatur viele Beispiele
beschrieben worden. Eine besondere Ausführungsform ist in dem Beispiel aus dem
Bezugsmaterial 2 eingehend beschrieben.
-
Die codierten Koeffizienten, die Klassifikationsbits kl und in dem
wiedergegebenen Ausführungsbeispiel auch das Anzeigebit MD können entweder einzeln
oder in einem Zeitmultiplexformat dem Magnetband zugeführt werden. Im letzteren Fall
wird eine Zeitmultiplexschaltung 85 notwendig sein, die jedoch auf übliche Weise
ausgebildet sein kann und die an dem Ausgang die Impulsreihe z(j) liefert.
-
In der Decodierschaltung 10 wird die von dem Demodulator 11 gelieferte
Impulsreihe z'(j) einem Demultiplexer 101 zugeführt, der den Block codierter
Koeffizienten von dem zugeordneten Anzeigebit MD und den Klassifikationsbits kl
trennt. Dieser Block codierter Koeffizienten, das Klassifikationsbit und in diesem
Ausführungsbeispiel auch das Anzeigebit MD werden einer adaptiven Decodierschaltung
102 zugeführt, die für jeden empfangenen Block von Koeffizienten einen Block von
Koeffizienten y(i, k) liefert, der demjenigen Block von Koeffizienten y(i, k) entspricht,
der von der Transformationsschaltung 83 geliefert wurde. Diese Koeffizienten werden
zusammen mit dem zugeordneten Anzeigebit MD einer inversen
Transformationsschaltung 103 zugeführt, die je nach dem Anzeigebit den Block von
Koeffizienten y'(i, k) einer inversen Teilbild- bzw. einer inversen Bildtransformation
aussetzt. Dadurch liefert diese Schaltungsanordnung die Bildsignalabtastwerte x'(n), die
einer Kaskadenschaltung eines Digital-Analog-Wandlers 104 und eines Tiefpaßfilters
105 zugeführt werden, wodurch das analoge Bildsignal x'(t) erhalten wird, das von dem
Monitor 7 wiedergegeben werden kann.
E(2) Die Transformationsschaltung
-
Wie im Abschnitt E(1) erwähnt, ist die Transformationsschaltung 83 dazu
eingerichtet, Blöcke von NxN Bildelementen einer Zwischenfeld- bzw. einer
Bildtransformation auszusetzen. Ein Ausführungsbeispiel einer derartigen
Transformationsschaltung ist in Fig. 2 auf schematische Weise dargestellt.
-
Diesem Ausführungsbeispiel liegt der bekannte Gedanke zugrunde, daß
ein Block von NxN Bildelementen x(i, k) als eine Matrix X betrachtet werden kann und
daß jedes Basisbild der nachfolgenden Beziehung entspricht:
-
B(i,k) = AiATk (1)
-
Darin ist A eine Transformationsmatrix; Ai eine Matrix, in der jede Spalte der i. Spalte
der Transformationsmatrix A entspricht und ATk ist eine Matrix, von der jede Reihe der
k. Reihe der Matrix A entspricht. Werden auch die Koeffizienten y(i, k) geordnet, zu
einer Matrix Y, so gilt, daß
-
y =ATXA. (2)
-
In diesem Ausdruck ist AT die transponierte Matrix von A.
-
Zum Berechnen der Koeffizienten entsprechend dem Ausdruck (2) muß
die ursprüngliche Transformationsmatrix A sowie die transponierte Version AT
verfügbar sein. Der Ausdruck (2) ist jedoch gleichwertig zu:
-
YT=(XA)TA (3)
-
Für diese Matrixmultiplikation braucht nur die Transformationsmatrix A verfügbar zu
sein. Insbesondere kann zunächst die Produktmatrix P=XA berechnet werden.
Daraufhin kann P transponiert und zum Schluß YT=PTA bestimmt werden.
-
Das in Fig. 2 angegebene Ausführungsbeispiel umfaßt einen Eingang
8301, dem die Bildelemente x(n) zugeführt werden und einen Ausgang 8302, an dem
die Koeffizienten y(i, k) auftreten. An den Eingang 8301 sind zwei Bildspeicher 8303(1)
und 8303(2) angeschlossen. Sie sind mit adressierbaren Speicherstellen versehen und
werden durch Schreib/Lesebefehle RW1, RW2 derart gesteuert, daß beispielsweise in
einem derselben die sichtbaren Bildelemente der sichtbaren Zeilen zweier
aufeinanderfolgender Teilbilder eines Bildes geschrieben werden, während gleichzeitig
die Bildelemente der Zeilen der zwei Teilbilder eines vorhergehenden Bildes in einem
anderen Bildspeicher gelesen werden. An welcher Stelle in dem Speicher ein
Bildelement gespeichert wird oder welches Bildelement gelesen wird, wird durch die
Adresse ADD1, ADD2, die dem Adresseneingang des betreffenden Bildspeichers
zugeführt wird, bestimmt.
-
Insbesondere werden empfangene sichtbare Bildelemente der sichtbaren
Bildzeilen eines Bildes zeilenweise in den Bildspeicher eingeschrieben. Zunächst werden
die Bildelemente der ungeradzahligen Zeilen gespeichert und danach die der
geradzahligen Zeilen. Nachdem alle sichtbare Bildelemente der sichtbaren Zeilen eines
Bildes gelesen wurden, enthält der Bildspeicher beispielsweise die in Fig. 3 durch
Punkte angegebenen Bildelemente. In dieser Fig. 3 sind in vertikaler Richtung zugleich
die Reihennummern LN des Bildspeichers angegeben, in denen sichtbare Bildelemente
von Bildzeilen eingeschrieben worden sind und in horizontaler Richtung die
Spaltennummern PN des Bildspeichers, in den sichtbare Bildelemente der jeweiligen
Bildzeilen eingeschrieben wurden. Beim Lesen des Inhaltes des Bildspeichers wird jedes
Bild in Blöcke X von NxN Bildelementen x(i, k) aufgeteilt. Eine derartige Aufteilung ist
für N = 8 auf schematische Weise in Fig. 3 dargestellt.
-
Von einem derartigen Block werden die Bildelemente reihenweise einem
Transformator 8304 zugeführt. Dieser Block X wird darin mit der festen
Transformationsmatrix A, die vorzugsweise die 8x8-Matrix der diskreten Kosinus-
Transformation (abgekürzt:DCT) ist, multipliziert. Dadurch wird die Produktmatrix P
= XA erhalten, die aus den Matrixelementen p(i, k) besteht.
-
An den Ausgang des Transformators 8304 sind zwei Speicher 8305(1) und
8305(2) angeschlossen. Ebenso wie die Bildspeicher 8303(.) sind sie mit adressierbaren
Speicherstellen versehen und werden durch Schreib-Lesebefehle RW3 und RW4 derart
gesteuert, daß in einen der beiden Speicher die Elemente der Produktmatrix P
eingeschrieben werden, während die Matrixelemente der vorhergehenden Produktmatrix
P in dem anderen Speicher gelesen werden. Insbesondere werden die Matrixelemente
p(i, k) reihenweise in einen derartigen Speicher eingeschrieben. Ebenso wie bei den
Bildspeichern 8303(.) wird auch nun die Stelle, an der ein Matrixelement p(i, k)
gespeichert wird, durch die Adresse ADD3, ADD4 bestimmt, die dann dem
Adresseneingang des betreffenden Speichers zugeführt wird. Diese Adresse bestimmt
zugleich in welcher Reihenfolge in dem Speicher gespeicherte Matrixelemente p(i, k)
gelesen werden.
-
Die Ausgänge der Speicher 8305(.) sind an den Eingang einer nur auf
symbolische Weise angegebenen Schalteinrichtung 8306 angeschlossen. Diese führt alle
aus einem Speicher 8305(.) ausgelesenen Matrixelemente der Produktmatrix entweder
einem Transformator 8307 oder einem Transformator 8308 zu. Im ersteren Fall befindet
sich die Transformationsschaltung in dem Bildtransformationsmodus und es wird eine
Bildtransformation durchgeführt, im zweiten Fall befindet sie sich in dem
Teilbildtransformationsmodus und es wird eine Teilbildtransformation durchgeführt. Die
Ausgänge der beiden Transformatoren 8307 und 8308 sind an einzelne Eingänge einer
weiteren nur auf symbolische Weise angegebenen Schalteinrichtung 8309 angeschlossen,
deren Ausgang an den Ausgang 8302 der Transformationsschaltung
83 angeschlossen ist und an der die gewünschten Transformationskoeffizienten y(i, k)
auftreten.
-
Die Schalteinrichtungen 8306 und 8309 werden durch ein Schaltsignal MD
gesteuert, das von einem Bewegungsdetektor 8310 geliefert wird, der in diesem Fall an
den Eingang des Transformators 8304 angeschlossen ist. Dieser Bewegungsdetektor
erkennt, ob ein Gegenstand in dem Bild sich in der Zeit zwischen zwei
aufeinanderfolgenden Teilbildern bewegt hat und ob von dieser Bewegung innerhalb
eines Blockes von 8x8 Bildelementen etwas spürbar gewesen ist. Wenn dies nicht der
Fall gewesen ist, wird MD=0 und die Transformationsschaltung gelangt in den
Bildtransformationsmodus. In diesem Modus werden die reihenweise in einen Speicher
8305(.) eingeschriebenen Produktelemente p(i, k) spaltenweise eingelesen, wodurch die
Produktmatrix P transponiert wird. Die auf diese Weise gelesenen Produktelemente p(i,
k) werden dem Transformator 8307 zugeführt, der auf dieselbe Art und Weise
aufgebaut ist wie der Transformator 8304 und der die von dem Speicher 8305(.)
gelieferten 8x8-Matrix PT wieder mit der Matrix A multipliziert, die wieder die 8x8
DCT-Matrix ist. Dadurch wird die Produktmatrix YT = PTA erhalten, deren
Matrixelemente y(i, k) die gesuchten Koeffizienten darstellen. Es sei bemerkt, daß
dieser Modus ihren Namen Bildtransformationsmodus der Tatsache zu verdanken hat,
daß die 8x8-Matrix von Produktelementen, die dem Transformator 8307 zugeführt wird,
aus Bildelementen der beiden Teilbilder des Bildes entstanden ist.
-
Wenn MD = 1 ist, was bedeutet, daß es innerhalb des Blockes von 8x8
Bildelementen spürbar ist, daß ein Gegenstand sich in der Zeit zwischen zwei
aufeinanderfolgenden Teilbildern verschoben hat, wird die Transformationsschaltung in
den Teilbildtransformationsmodus gebracht. In diesem Modus werden die
Produktelemente p(i, k) in einer völlig anderen Reihenfolge ausgelesen als dies der Fall
ist in dem Bildtransformationsmodus. Wird in dem Block von 8x8 Bildelementen eine
Bewegung detektiert, so wird die Produktmatrix P gleichsam aufgeteilt wie in Fig. 4
dargestellt ist. Insbesondere ist bei I in Fig. 4 angegeben, die Produktmatrix P, wie
diese von dem Transformator 8304 geliefert und in dem Speicher 8305(.) gespeichert
wird. Diese Produktmatrix P wird nun imaginär in eine 4x8-Matrix aufgeteilt, die aus
den Produktelementen der ungeradzahligen Zeilen, wie in Fig. 4 bei II angegeben, und
eine 4x8-Matrix, die aus den Produktelementen der geradzahligen Zeilen, wie in Fig. 4
bei III angegeben, besteht. Diese 4x8-Matrizen werden daraufhin nacheinander und
spaltenweise dem Transformator 8308 zugeführt, womit nun eine 4x4 DCT Matrix A'
zusammenarbeitet. Durch Multiplikation jeder der zwei 4x8-Teilproduktmatrizen mit der
4x4 DCT Matrix A' werden zwei Gruppen zu je 32 Koeffizienten erhalten, die über die
Schalteinrichtung 8309 dem Ausgang 8302 zugeführt werden. Wie aus dem
Obenstehenden hervorgehen dürfte, werden nun die beiden Teilbilder eines Blockes
getrennt einer Transformation ausgesetzt, deswegen die Bezeichnung
Teilbildtransformationsmodus. Die Größen der dadurch erhaltenen Koeffizienten werden
nun nicht durch Bewegungseffekte in dem Bild beeinträchtigt. Dadurch brauchen von
der Gesamtanzahl von 64 Koeffizienten, in die ein Block von 8x8 Bildelementen
transformiert wird, weniger Koeffizienten übertragen zu werden als wenn diese
Produktmatrix P einer Bildtransformation ausgesetzt werden würde.
-
Zur Steuerung der in Fig. 2 dargestellten Transformationsschaltung 83 ist
eine Steuerschaltung 8311 vorgesehen. Diese umfaßt einen Taktimpulsgenerator 8312,
der mit einer Geschwindigkeit fs Taktimpulse S(rT) liefert, die einerseits als
Abtastimpulse der Abtastanordnung 81 zugeführt werden (Fig. 1) und andererseits
einem Bildelementzähler 8313, dessen Zählerstellung von Null bis zu einer Zahl geht,
die der Anzahl Bildelemente entspricht, aus denen ein vollständiges Bild aufgebaut ist.
Dieser Zähler wird am Anfang jedes neuen Bildes durch Bildrückstellimpulse FRS
rückgestellt, die von der Video-Quelle 2 (Fig. 1) geliefert werden. Die Zählerstellungen
dieses Bildelementzählers 8313 werden als Adressen den Adresseneingängen zweier
Speicher 8314(.), die je als ROM ausgebildet sein können, zugeführt. Insbesondere
liefert der ROM 8314(1) die Adressen für die Bildspeicher 8303(.) in der Reihenfolge,
in der Bildelemente gelesen werden müssen, die sogenannten Lese-Adressen, während
der ROM 8314(2) die Adressen liefert für die Bildspeicher 8303(.) in der Reihenfolge,
in der Bildelemente in den Bildspeicher eingeschrieben werden müssen, die sogenannten
Schreib-Adressen.
-
Die von diesen ROMs 8314(.) gelieferten Adressen werden über UND-
Gatterschaltungen 8315(.) und ODER-Gatterschaltungen 8316(.) den Adresseneingängen
der Bildspeicher 8303(.) zugeführt. Um zu erreichen, daß die einem Bildspeicher
8303(.) zugeführten Lese-und Schreib-Adressen einander bei jedem neuen Bild
abwechseln, werden die Bildrückstellimpulse FRS einem T-Flip-Flop 8317 zugeführt.
Der Q-Ausgang desselben liefert den Schreib/Lese-Befehl WR1 und der -Ausgang
liefert den Schreib/Lese-Befehl WR2. Die Schreib/Lese-Befehle werden weiterhin den
UND-Gatterschaltungen 8315(.) zugeführt.
-
Zum Erzeugen der Lese- und Schreib-Adressen für die Speicher 8305(.)
werden die Taktimpulse S(qT) weiterhin einer Zählerschaltung 8318, beispielsweise
einem Modulo-64-Zähler, zugeführt. Die Zählerstellungen dieser Schaltungsanordnung
werden Adresseneingängen von Speichern 8319(.) zugeführt, die ebenfalls als ROM
ausgebildet sein können. Ein weiterer Adresseneingang des ROMs 8319(1) erhält
zugleich das Signal MD, das von dem Bewegungsdetektor 8310 geliefert wird. Der
ROM 8319(1) liefert die Lese-Adressen für die Speicher 8305(.) und der ROM 8319(2)
liefert die Schreib-Adressen. In dem Fall, wo MD=0 ist, (keine Bewegung detektiert),
ist die Reihe von Adressen, die dieser ROM 8319(1) liefert, anders als die Reihe von
Adressen, die er liefert, wenn MD=1 ist (Bewegung detektiert).
-
Diese Lese- und Schreib-Adressen werden über UND-Gatterschaltungen
8320(.) und ODER-Gatterschaltungen 8321(.) Adresseneingängen der Speicher 8305(.)
zugeführt. Um zu erreichen, daß die einem Speicher 8305(.) zugeführten Lese- und
Schreib-Adressen einander abwechseln, jeweils wenn 64 Produktelemente aus dem
Speicher ausgelesen bzw. in den Speicher eingeschrieben worden sind, werden die
Zählerstellungen des Zählers 8318 einem Auscodierungsnetzwerk 8322 zugeführt, das
jeweils wenn die Zählerschaltung die Zählerstellung Null annimmt, einen Impuls liefert.
Diese Impulse werden einem T-Flip-Flop 8323 zugeführt. Der Q-Ausgang desselben
liefert den Schreib/Lese-Befehl WR3 und der -Ausgang den Schreib/Lese-Befehl
WR4.
-
Die Transformatoren 8304, 8307 und 8308 lassen sich auf eine Art und
Weise, wie diese in diesem technischen Bereich bekannt ist, ausgestalten, aber
vorzugsweise auf eine Art und Weise, wie diese in der älteren niederländischen
Patentanmeldung Nr. 8.601.183 (EP-A- 0245903) (PHN 11.745) der Anmelderin
beschrieben worden ist.
-
Ein Ausführungsbeispiel eines Bewegungsdetektors ist
vollständigkeitshalber in Fig. 5 dargestellt und basiert auf einer Frequenzmessung in
vertikaler Richtung. Das dies ein Maß für das Vorhandensein von Bewegung sein kann,
ist in Fig. 6 angegeben. Bei I in Fig. 6 ist das Bild angegeben, das eine Video-Kamera
liefert, wenn diese auf einen vertikal orientierten Gegenstand, beispielsweise einen
Baumstamm, gerichtet ist. Wenn nun die Kamera in horizontaler Richtung wesentlich
bewegt, entsteht ein Bild mit der bei II in Fig. 6 angegebenen Zeilenstruktur. Diese
Struktur wird dadurch verursacht, daß zunächst die ungeradzahligen Zeilen und danach
die geradzahligen Zeilen des Bildes abgetastet werden. Eine derartige Struktur ist auch
spürbar für örtliche Einzelheiten in dem Video-Bild, also auch in Teilbildern von 8x8
Bildelementen.
-
Die durch diese Zeilenstruktur erhaltene hohe Vertikal-Frequenz laßt sich
dadurch messen, daß dieses Teilbild einer Fourier-Transformation ausgesetzt wird. Es
ist jedoch einfacher, daß ein derartiges Teilbild einer Hadamard-Transformation
ausgesetzt wird, in welchem Fall das Vorhandensein der höchsten Vertikal-Frequenz
durch den Wert des Koeffizienten y(1, 8) dargestellt wird, der den Beitrag des
Basisbildes des B(1, 8), das bei III in Fig. 6 angegeben ist, angibt. Wie sich aus dem
Ausdruck (2) und (3) auf einfache Weise ableiten läßt, folgt der Koeffizient y(1, 8) aus
der Beziehung
-
Zum Bestimmen dieses Koeffizienten werden die aus dem Bildspeicher 8303(.)
ausgelesenen Bildelemente unmittelbar oder nach Polaritätsumkehrung in einer
Umkehrstufe 8310. 1 über eine nur auf symbolische Weise angegebene Schalteinrichtung
8310.2 einem Akkumulator 8310.3 zugeführt. Dieser liefert den beabsichtigten
Koeffizienten y(1, 8) und ist auf bekannte Weise aus einem Addierer 8310.4 und einem
Verzögerungselement 8310.5 aufgebaut. Dieser Bewegungsdetektor weist weiterhin ein
Auscodierungsnetzwerk 8310.6 auf, das die Leseadressen aus dem Speicher 8314(1)
(siehe Fig. 2) erhält. Er liefert zwei Signale Sign und Res, die der Schalteinrichtung
8310.2 bzw. dem Verzögerungselement 8310.5 zugeführt werden. Das Signal Res hat
im wesentlichen den Wert Null, mit Ausnahme von dem Fall, daß die empfangene
Adresse derart ist, daß mit der Auslesung der Bildelemente eines neuen Teilbildes
angefangen wird. In dem Fall ist Res=1, wodurch das Verzögerungselement 8310.5
rückgestellt wird. Das Signal Sign nimmt abwechselnd den Wert Null und Eins an.
Wenn Sign=1 ist, werden die in der Polarität invertierten Bildelemente dem
Akkumulator zugeführt. Ist dagegen Sign=0, so werden die Bildelemente unmittelbar
dem Akkumulator zugeführt. Insbesondere ist Sign=0 für die Lese-Adressen der
Bildelemente in den ungeradzahligen Reihen des Teilbildes, während Sign=1 für die
Lese-Adressen der Bildelemente in den geradzahligen Reihen des Teilbildes ist.
-
Der auf diese Weise erhaltene Koeffizient y(1,8), wird weiterhin in einer
Vergleichsschaltung 8310.7 mit einem vorher bestimmten Schwellenwert Thr
verglichen, der von einer Schwelleneinrichtung 8310.8 geliefert wird. Diese
Vergleichsschaltung 8310.7 liefert das Bewegungsdetektionssignal MD, das den Wert
Null hat, wenn der Koeffizient kleiner ist als der Schwellenwert und das den Wert Eins
hat in dem umgekehrten Fall.
-
In der Transformationsschaltung 83, die in Fig. 2 dargestellt ist, zeigt der
Bewegungsdetektor 8310 an, wie ein Block von Bildelementen behandelt werden muß.
Mit anderen Worten ob dieser Block einer Bild- oder einer Teilbildtransformation
ausgesetzt werden muß. Damit Bewegungsdefekte vermieden werden, muß der
Bewegungsdetektor empfindlich eingestellt werden. Das bedeutet, daß beispielsweise bei
dem in Fig. 5 dargestellten Bewegungsdetektor die Schwelle Thr der
Schwellenanordnung 8310.8 niedrig sein muß. Dies führt dazu, daß schneller zu einer
Teilbildtransformation entschieden werden kann als auf Grund von Wirtschaftlichkeit
erwünscht wäre. Um dies zu vermeiden, werden, wie in Fig. 7 angegeben, die
Bildelemente, die aus einem Bildspeicher 8303(.) ausgelesen werden, dem
Transformator zugeführt entweder über ein sogenanntes Medianfilter 8324 und eine
Schalteinrichtung 8325, die in Fig. 7 nur auf symbolische Weise dargestellt ist, oder
über eine Verzögerungsleitung 8326 und die Schalteinrichtung 8325. Die
Verzögerungszeit der Verzögerungsleitung 8326 entspricht der Verzögerungszeit, die
durch das Medianfilter eingeführt wird.
-
Die Schalteinrichtung 8325 wird von dem Ausgangssignal MD des
Bewegungsdetektors 8310 gesteuert und zwar derart, daß wenn es keine oder nur eine
geringfügige Bewegung gibt, das Ausgangssignal des Medianfilters 8324 dem
Transformator 8304 zugeführt wird und wenn es eine Bewegung gibt, das
Ausgangssignal der Verzögerungsleitung 8326 zugeführt wird.
-
Medianfilter sind in diesem technischen Bereich durchaus bekannt. Eine
allgemeine Beschreibung läßt sich finden auf den Seiten 330-333 des Bezugsmaterials 3
und Ausgestaltungen sind in dem Bezugsmaterial 4 eingehend beschrieben.
Vollständigkeitshalber sei an dieser Stelle erwähnt, daß dieses Medianfilter aus
beispielsweise drei in einem Teilbild übereinander liegenden Bildelementen, dasjenige
Bildelement dem Ausgang zuführt, dessen Größe dem Mittelwert dieser drei
Bildelemente am nächsten liegt. In diesem Medianfilter wird auf diese Weise eine
Medianfilterung an zwei aufeinander folgenden Teilbildern eines Bildes durchgeführt.
Es ergibt auf diese Weise ein Bild, das eine Wiedergabe eines Standbildes zu sein
scheint. Die von diesem Filter gelieferten Bildelemente werden deswegen ausschließlich
einer Bildtransformation ausgesetzt.
-
Eine besondere Situation tritt nun auf, wenn die Video-Signalquelle 2 ein
Video-Signal liefert, das durch Abtastung der Bilder eines Films erhalten wird. In dem
Fall ist es von vorn herein bekannt, daß Gruppen zweier aufeinander folgender
Teilbilder keine Bewegungseffekte aufweisen. Dies bedeutet, daß der
Bewegungsdetektor 8310 nur bei jedem zweiten von zwei aufeinander folgenden
Teilbildern Bewegung detektieren wird. In diesem besonderen Fall kann die
Transformationsschaltung von dem Benutzer oder automatisch in dem
Bildtransformationsmodus verriegelt werden.
E(3) Der adaptive Coder
-
Der in Fig. 1 dargestellte adaptive Coder 84 kann verschiedenartig
ausgebildet werden. Eine besonders günstige Ausführungsform ist in dem
Bezugsmaterial 5 eingehend beschrieben, wird aber an dieser Stelle ausschließlich
vollständigkeitshalber an Hand der Fig. 8 beschrieben. Der Coder ist mit einem
Eingang 8401 versehen, der die Koeffizienten y(i, k) von einem Block erhält und von
dem an dieser Stelle vorausgesetzt wird, daß diese Koeffizienten nacheinander auftreten.
Sie werden einem Coder 8402 veränderlicher Wortlänge zugeführt, der jeden
Koeffizienten in ein Codewort einer geeigneten Wortlänge umwandelt. Diese Wortlänge
wird durch ein Bit-Zuordnungselement bj(i,k) bestimmt, das über einen Steuereingang
8403 diesem Coder 8402 zugeführt wird. Der Coder veränderlicher Wortlänge liefert in
der Länge variierende Codeworte an dem Ausgang 8404 der Codierschaltung.
-
Außer diesem Coder 8402 veränderlicher Wortlänge werden die
Koeffizienten y(i,k) einer Vergleichs- und Klassifikationsschaltung 8405 zugeführt. Mit
dieser Schaltung ist eine Anzahl Speicher 8406(.) verbunden. In jedem dieser Speicher
ist eine Klassifikationsgruppe gespeichert. Insbesondere weist der Speicher 8406(j) mit
der Rangnummer j die Klassifikationsgruppe Cj mit der Klassifikationselementen cj(i,k)
auf. Die Speicher sind in zwei Gruppen aufgeteilt. Die erste Gruppe weist die Speicher
8406(1) bis einschließlich 8406(R) und die zweite Gruppe weist die Speicher
8406(R+1) bis einschließlich 8406(R+M) auf. Der Inhalt der Speicher 8406(1) bis
einschließlich 8406(R) kann nur gelesen werden, wenn in dem Teilbild eine Bewegung
detektiert wurde, also wenn MD = 1 ist und der Inhalt der Speicher 8406(R+1) bis
einschließlich 8406(R+M) kann nur gelesen werden, wenn in dem Teilbild keine
Bewegung detektiert wurde, also wenn MD=0 ist. Dieses Anzeigebit MD wird dazu an
einem Eingang 8407 empfangen und unmittelbar den Lese-Freigabe-Eingängen der
Speicher 8406(1) bis einschließlich 8406(R+1) und über einen Inverter 8408 den Lese-
Freigabe-Eingängen der Speicher 8406(R+1) bis einschließlich 8406(R+M) zugeführt.
-
Die Klassifikationsgruppen C1 bis einschließlich CR umfassen je
(NxN)/2=(32) Klassifikationselemente und die Klassifikationsgruppen CR+1 bis
einschließlich CR+M je NxN(=64) Klassifikationselemente. Vorzugsweise gilt
weiterhin, daß ein Klassifikationselement cj(i,k) in einer Klassifikationsgruppe Cj
kleiner ist als das entsprechende Klassifikationselement Cj+1(i,k) in der
Klassifikationsgruppe Cj+1.
-
In der Vergleichs- und Klassifikationsschaltung 8405 wird nun die
Klassifikationsgruppe bestimmt, für die gilt, daß jedes Klassifikationselement cj(i,k)
gerade etwas größer ist als der entsprechende Koeffizient y(i,k) der Gruppe von
Koeffizienten. In diesem Zusammenhang bedeutet "entsprechend", daß die Koordinaten
i,k des Koeffizienten y(i,k) den Koordinaten i,k des Klassifikationselementes cj(i,k) in
der j. Klassifikationsgruppe, mit der der Koeffizient verglichen wird, gleich sind. Die
Schaltungsanordnung 8405 liefert die Rangnummer j der betreffenden
Klassifikationsgruppe als Klassifikationswort kl(j).
-
Dieses Klassifikationswort wird einerseits dem Ausgang 8409 der
Codierschaltung 84 zugeführt, andererseits einer logischen Schaltung 8410. Damit sind
ebenfalls eine Anzahl Speicher 8412(.) verbunden. In jedem dieser Speicher ist eine Bit-
Zuordnungsgruppe gespeichert. Insbesondere weist der Speicher 8412(j) mit der
Rangnummer j die Bit-Zuordnungsgruppe Bj mit den Bit-Zuordnungselementen bj(i,k)
auf. Auch diese Speicher sind in zwei Gruppen aufgeteilt. Die erste Gruppe umfaßt die
Speicher 8412(1) bis einschließlich 8412(R) und die zweite Gruppe umfaßt die Speicher
8412(R+1) bis einschließlich 8412(R+M). Der Inhalt der Speicher 8412(1) bis
einschließlich 8412(R) kann nur gelesen werden, wenn MD = 1 ist und der Inhalt der
Speicher 8412(R+1) bis einschließlich 8412(R+M) kann nur gelesen werden wenn
MD=0 ist.
-
Die Bit-Zuordnungsgruppen B&sub1; bis BR umfassen je (NxN)/2 (=32) Bit-
Zuordnungselemente und die Bit-Zuordnungsgruppen BR+1 bis einschließlich BR+M je
NxN (=64).
-
In der logischen Schaltung 8410 sorgt das derselben zugeführte
Klassifikationswort kl(j) für Selektion der der Klassifikationsgruppe Cj zugeordneten
Bit-Zuordnungsgruppe bj, wonach die Elemente bj(i,k) dieser Gruppe nacheinander dem
Coder 8402 veränderlicher Wortlänge zugeführt werden.
-
Wie aus dem Obenstehenden hervorgeht, gibt das Klassifikationswort kl(j)
implizit an, daß das Schaltsignal MD, das von dem Bewegungsdetektor geliefert wird,
gleich Eins oder Null ist, Deswegen braucht dieses Schaltsignäl an sich nicht unbedingt
zu der Decodierstation übertragen zu werden.
E(4) Die inverse Transformationsschaltung
-
Zum Zurückgewinnen der ursprünglichen Video-Signalabtastwerte ist die
Decodierschaltung 10 (siehe Fig. 1) mit einer inversen Transformationsschaltung mit
einem inversen Teilbild- und einem inversen Bildtransformationsmodus versehen. Diese
Schaltungsanordnung erhält jede von der Codierschaltung 8 gelieferte Gruppe von
Koeffizienten und setzt diese einer inversen Teilbild- und/oder einer inversen
Bildtransformation aus. Je nach dem ebenfalls empfangenen Schaltsignal MD werden
die entsprechend der inversen Teilbildtransformation bzw. die entsprechend der inversen
Bildtransformation erhaltenen Video-Signalabtastwerte zur Wiedergabe selektiert.
-
Eine Ausführungsform einer derartigen inversen Transformationsschaltung
wird dadurch erhalten, daß in der Transformationsschaltung 83, die in Fig. 2 dargestellt
ist, die Signalrichtungen umgekehrt werden, der Bewegungsdetektor 83 fortfällt und für
die jeweiligen Speicher die Lesebefehle durch Schreibbefehle umgetauscht werden.
-
Es sei bemerkt, daß wenn das Schaltsignal MD selbst nicht übertragen
wird, dies in der Decodierstation mittels einer Vergleichsschaltung erzeugt werden
kann, die jeweils ein Signal MD=1 liefert, wenn das Klassifikationswort kl(j) einer der
Klassifikationsgruppen C&sub1; bis einschließlich CR entspricht und ein Signal MD=0
liefert, wenn das Klassifikationswort einer der Klassifikationsgruppen CR+1 bis
einschließlich CR+M entspricht.