-
TECHNISCHES GEBIET
-
Diese
Erfindung betrifft ein Informationscodierungsverfahren und -gerät zur Codierung
von Information wie beispielsweise digitale Eingabedaten durch hocheffiziente
Codierung und ein Informationsdecodierungsverfahren und -gerät zur Decodierung codierter
Information.
-
HINTERGRUNDTECHNIK
-
Es
gibt eine Vielfalt hocheffizienter Codierungstechniken für Audio-
oder Sprachsignale. Beispiele dieser Techniken umfassen eine Transformationscodierung,
bei der ein Rahmen von das Audiosignal bezüglich der Zeitachse darstellenden
digitalen Signalen durch eine orthogonale Transformation in einen
Block von das Audiosignal bezüglich
der Frequenzachse darstellenden spektralen Koeffizienten umgesetzt
wird, und eine Subbandcodierung (sub-band coding (SBC)), bei der
das Frequenzband des Audiosignals vor der Codierung durch eine Filterbank
entlang der Zeitachse in mehrere Subbänder ohne Ausbildung des Signals
in Rahmen geteilt wird. Es ist auch eine Kombination aus Subbandcodierung und
Transformationscodierung bekannt, bei der Signale, die das Audiosignal
bezüglich
der Zeitachse darstellen, durch eine Bandteilung in Bänder geteilt werden
und dann durch eine spektrale Transformation in Signale bezüglich der
Frequenzachse transformiert werden und durch die spektrale Transformation erhaltene
Frequenzkomponenten bei jedem Band codiert werden.
-
Unter
den Filtern zur Teilung eines Frequenzspektrums in mehrere gleich
breite Frequenzbereiche ist das in R. E. Chrochiere, Digital Coding
of Speech in Sub-bands, 55 Bell Syst. Tech. J. Nr. 8 (1976) beschriebe
Quadraturspiegelfilter (Quadrature Mirror Filter (QMF)). Mit dem
QMF-Filter wird das Frequenzspektrum des Signals in zwei gleich
breite Bänder
geteilt. Mit dem QMF wird Aliasing (Signalverfälschung) nicht erzeugt, wenn
die aus der Teilung resultierenden Frequenzbänder danach miteinander kombiniert
werden.
-
In „Polyphase
Quadrature Filters – A
New Subband Coding Technique„,
Joseph H. Rothweiler, ICASSP 83, Boston, ist eine Technik zum Teilen
des Frequenzspektrums des Signals in gleich breite Frequenzbänder gezeigt.
Mit dem gegenwärtigen
Polyphase-QMF (Mehrphasen-OMF) kann das Frequenzspektrum der Signale
zu einer Zeit in mehrere gleich breite Frequenzbänder geteilt werden.
-
Es
ist auch eine Technik zur orthogonalen Transformation bekannt, die
ein Teilen des digitalen Audioeingabesignals in Rahmen einer vorbestimmten
Zeitdauer und ein Verarbeiten der resultierenden Rahmen unter Verwendung
einer diskreten Fourier-Transformation (DFT), diskreten Cosinustransformation
(DCT) und modifizieren DCT zur Umsetzung des Signals von der Zeitachse
in die Frequenzachse aufweist. Beschreibungen bezüglich MDCT können J.
P. Princen and A. B. Bradlex, Subband Transform Coding Using Filter
Bank Based on Time Domain Aliasing Cancellation, ICASSP 1987 entnommen
werden.
-
Durch
Quantisieren der durch die Filter- oder Spektrumumsetzung auf der
Bandbasis geteilten Signale wird es möglich, das einem Quantisierungsrauschen
unterliegende Band zu steuern, und es kann eine effizientere psychoakustische
Codierung durch Benutzung der sogenannten Maskierungseffekte erreicht
werden. Wenn die Signalkomponenten mit dem maximalen Wert der absoluten
Werte der Signalkomponenten von Band zu Band normiert werden, wird
es möglich,
eine effizientere Codierung zu bewirken.
-
Bei
einer Technik zur Quantisierung der aus einer orthogonalen Transformation
resultierenden spektralen Komponenten ist es bekannt, Subbänder zu
benutzen, die Vorteil aus den psychoakustischen Charakteristiken
des menschlichen Gehörsystems ziehen.
Das heißt,
ein Audiosignal bezüglich
der Frequenzachse darstellende spektrale Koeffizienten können in
mehrere kritische Frequenzbänder,
beispielsweise 25 kritische Bänder
geteilt werden. Die Breite der kritischen Bänder nimmt mit zunehmender Frequenz
zu. Bei einem solchen Quantisierungssystem werden zwischen den verschiedenen
kritischen Bändern
Bits adaptiv zugeordnet. Wenn beispielsweise eine adaptive Bitzuordnung
zu den aus einer MDCT resultierenden spektralen Koeffizientendaten angewendet
wird, werden die von der MDCT in jedem der kritischen Bänder erzeugten
spektralen Koeffizientendaten unter Benutzung einer adaptiv zugeordneten
Zahl von Bits quantisiert.
-
Es
sind derzeit die folgenden zwei Bitzuordnungstechniken bekannt.
Beispielsweise wird bei IEEE Transactions of Acoustics, Speech and
Signal Processing, Vol. ASSP-25, Nr. 4, August 1977 in jedem kritischen
Band eine Bitzuordnung auf der Basis der Amplitude des Signals ausgeführt. Diese
Technik erzeugt ein flaches Quantisierungsrauschspektrum und minimiert
die Rauschenenergie, jedoch ist der vom Zuhörer wahrgenommene Rauschpegel
nicht optimal, da die Technik den psychoakustischen Maskierungseffekt
nicht effektiv ausnutzt.
-
Bei
der in M. A. Krassner, The Critical Band Encoder – Digital
Encoding of the Perceptual Requirements of the Acoustic System,
ICASSP 1980 beschriebenen Zuordnungstechnik wird der psychoakustische
Maskierungsmechanismus benutzt, um eine feste Bitzuordnung zu bestimmen,
die das notwendige Signal-zu-Rauschen-Verhältnis für jedes kritische Band erzeugt.
Wenn jedoch das Signal-zu-Rauschen-Verhältnis eines solchen Systems unter
Verwendung einer Sinuswelle gemessen wird, werden wegen der festen
Zuordnung von Bits zwischen den kritischen Bändern nicht optimale Resultate
erhalten.
-
Zur Überwindung
dieser Unvorteilhaftigkeit ist ein hocheffizientes Codierungsgerät vorgeschlagen
worden, bei dem die Gesamtzahl der zur Bitzuordnung verfügbaren Bits
zwischen einem für
jeden kleinen Block voreingestellten festen Bitzuordnungsmuster
und einer von Signalgrößen abhängigen blockbasierten
Bitzuordnung geteilt wird, und das Teilungsverhältnis in Abhängigkeit
von einem für
das Eingabesignal relevanten Signal eingestellt wird, derart, dass,
je glatter das Spektralspektrum, desto höher das Teilungsverhältnis für das feste
Bitzuordnungsmuster wird.
-
Bei
diesem Gerät
wird, wenn die Energie so, wie im Fall einer Sinuswelleneingabe,
in einer besonderen spektralen Komponente konzentriert ist, dem die
spektrale Komponente enthaltenden Block zur signifikanten Verbesserung
der Signal-zu-Rauschen-Verhältnischarakteristiken
als Ganzes eine größere Zahl
von Bits zugeordnet. Da das menschliche Gehörsystem bei einem Signal, das
scharfe bzw. spitze spektrale Komponenten aufweist, hoch sensitiv
ist, kann eine solche Technik zur Verbesserung des Signal-zu-Rauschen-Verhältnisses
zur Verbesserung nicht nur gemessener Werte, sondern auch der Qualität des vom
Ohr wahrgenommenen Tons verwendet werden.
-
Außerdem ist
zu den vorstehenden Techniken eine Vielfalt anderer Techniken vorgeschlagen worden,
und das Modell, welches das menschliche Gehörsystem simuliert, ist derart
verfeinert bzw. vervollkommnet worden, dass, wenn die Codierungseinrichtung
in ihrer Fähigkeit,
insbesondere Leistungsfähigkeit
oder Empfindlichkeit, verbessert wird, die Codierung im Licht des
menschlichen Gehörsystems mit
höherer
Effizienz gemacht werden kann.
-
1 zeigt
eine Grundlegende Beschaffenheit einer konventionellen Codierungsvorrichtung
zur Codierung akustischer Signale als Wellenformsignale bezüglich der
Zeitachse.
-
Nach 1 wird
die einem Anschluss 100 zugeführte akustische Signalwellenform
durch eine Umsetzungsschaltung 101 in Frequenzkomponenten akustischer
Signale umgesetzt, die dann von einer Signalkomponenten-Codierungsschaltung 102 codiert
werden. Die Codes werden von einer Codekette-Erzeugungsschaltung 103 als
eine Codekette angeordnet, die an einem Anschluss 104 ausgegeben wird.
-
2 zeigt
eine illustrative Beschaffenheit einer in 1 gezeigten
Umsetzungsschaltung 101.
-
Bezugnehmend
auf die 2 wird das einem mit dem in 1 gezeigten
Anschluss 100 korrespondierenden Anschluss 200 zugeführtes akustischen
Signal von einer Frequenzspektrum-Teilungsschaltung 201,
die das vorstehend erwähnte
Mehrphasen-Quadraturfilter (Polyphase Quadrature Filter) sein kann,
in vier Bänder
geteilt. Die akustischen Signale der durch das Frequenzspektrum-Teilungsfilter 201 erhaltenen
Bänder
werden durch orthogonale Vorwärts-Umsetzungsschaltungen 211 bis 214 zum Bewirken
einer orthogonalen Transformation durch beispielsweise MDCT-Schaltungen in spektrale Komponenten
umgesetzt. Das heißt,
die in die Spektrum-Vorwärtsumsetzungs-Schaltungen 211 bis 214 eingegebenen
akustischen Signale sind jeweils von einer Bandbreite, die gleich
ein Viertel der Bandbreite des dem Anschluss 200 zugeführten Signals
ist, so dass die über
den Anschluss 200 zugeführten
akustischen Signale mit einer Rate von 1 zu 4 subabgetastet werden.
Ausgangssignale der Spektrum-Vorwärts-Umsetzungsschaltungen 211 bis 214 werden über Anschlüsse 221 bis 224 der
in 1 gezeigten Signalkomponenten-Codierungsschaltung 102 zugeführt.
-
Natürlich kann
die in 1 gezeigte Umsetzungsschaltung 101 in
gewünschter
Weise modifiziert werden. Beispielsweise kann das akustische Eingabesignal
von einer MDCT direkt in spektrale Komponenten umgesetzt werden,
wobei die MDCT durch eine DFT oder DCT ersetzt werden kann.
-
3 zeigt
eine illustrative Beschaffenheit der in 1 gezeigten
Signalkomponenten-Codierungsschaltung 102.
-
Nach 3 wird
von einer Normierungsschaltung 301 ein einem Anschluss 300 zugeführtes Ausgangssignal
der Signalkomponenten-Codierungsschaltung 102 bezüglich der
Bandbasis normiert, bevor es zu einer Quantisierungsschaltung 303 übertragen
wird. Das Eingabesignal am Anschluss 300 wird auch einer
Quantisierungsschritt-Entscheidungsschaltung 302 zugeführt. Die Quantisierungsschaltung 303 quantisiert
die normierten spektralen Komponenten der Normierungsschaltung 301 auf
der Basis der Quantisierungsschritte, wie sie durch die Quantisierungsschritt-Entscheidungsschaltung 303 von
den über
dem Anschluss 300 zugeführten
spektralen Komponenten berechnet werden. Die quantisierten spektralen
Komponenten der Quantisierungsschaltung 303 werden über den Anschluss 304 der
Codekette-Erzeugungsschaltung 103 der 1 zugeführt. Ein über den
Anschluss 304 ausgegebenes Signal enthält zusätzlich zu den quantisierten
spektralen Komponenten der Quantisierungsschaltung 303 die
Normierungskoeffizienteninformation in der Normierungsschaltung 301 und die
Quantisierungsschrittinformation in der Entscheidungsschaltung 302.
-
4 zeigt
eine Grundlegende Beschaffenheit einer Signaldecodierungseinrichtung
zur Decodierung des akustischen Signals der durch die in 1 gezeigte
Codierungseinrichtung erzeugten Codekette und Ausgeben des decodierten
akustischen Signals.
-
Nach 4 werden
die Codes der jeweiligen Signalkomponenten von einer Codekette-Auflösungsschaltung 401 von
der von der in 1 gezeigten Beschaffenheit erzeugten
Codekette extrahiert und über
einen Anschluss 400 zugeführt. Von diesen Codes werden
die Signalkomponenten durch die Signalkomponenten-Decodierungsschaltung 402 wieder
hergestellt. Die decodierten Signalkomponenten werden von einer
inversen Transformationsschaltung 403 mit einer inversen
Transformation, die eine zu der von der Transformationsschaltung 101 der 1 inverse
Operation ist, verarbeitet. Dies erzeugt ein akustisches Wellenformsignal,
das an einem Anschluss 404 ausgegeben wird.
-
5 zeigt
eine illustrative Beschaffenheit einer in 4 gezeigten
inversen Transformationsschaltung 403.
-
5 zeigt
eine illustrative Beschaffenheit einer Gegenstückschaltung zu der in 2 gezeigten
Transformationsschaltung. Die von der Signalkomponenten-Decodierungs schaltung 402 über Anschlüsse 501 bis 504 zugeführten Signale
werden durch inverse Spektrum-Umsetzungsschaltungen 511 bis 514,
die eine das Umgekehrte der in 2 gezeigten
Vorwärts-Spektrumtransformation
seiende inverse Spektrumtransformation ausführt, verarbeitet. Die Signale
der von den inversen orthogonalen Transformationsschaltungen 511 bis 514 erzeugten jeweiligen
Bänder
werden von einem Bandkombinierungsfilter 515, das eine
das Umgekehrte der von dem in 2 gezeigten
Frequenzspektrum-Teilungsfilter 201 ausgeführten Frequenzspektrumteilung
seiende Operation ausführt,
kombiniert. Ein Ausgangssignal des Bandsynthetisierungsfilters 515 wird
an einem mit dem in 4 gezeigten Anschluss 404 korrespondierenden
Anschluss 521 ausgegeben.
-
6 illustriert
ein Beispiel eines herkömmlichen
Codierungsverfahrens. Bei dem in 6 gezeigten
Beispiel sind die spektralen Komponentensignale die von der in 2 gezeigten
Transformationsschaltung erzeugten. In 6 korrespondieren nach
Umsetzung durch MDCT gezeigte Pegel absoluter Werte der spektralen
Signale mit dB Werten.
-
In 6 werden
die Eingabesignale von einem voreingestellten Zeitblock zu einem
anderen in 64 spektrale Signale transformiert. Diese 64 spektralen
Signale werden in fünf
voreingestellten Bändern, die
hier in 6 als Codierungseinheiten b1 bis b5 bezeichnet
sind, gruppiert, um auf der Codierungsgruppenbasis normiert und
quantisiert zu werden. Die Bandbreiten der jeweiligen Codierungseinheiten
b1 bis b5 werden
zum unteren Bereich hin schmaler und zum höheren Bereich hin breiter,
um die Steuerung der Erzeugung des mit den Charakteristiken des menschlichen
Gehörsystems übereinstimmenden Quantisierungsrauschens
zu ermöglichen.
-
Wie
jedoch der 6 zu entnehmen ist, wird, wenn
die Normierung für
jedes der voreingestellten Bänder
bewirkt wird, die Signalnormierung in der tonale Komponenten enthaltenden
Codierungseinheit b3 auf der Basis eines
größeren Normierungskoeffizientenwertes,
wie er durch die tonalen Komponenten bestimmt ist, ausgeführt. Unter Verwendung
dieses Normierungskoeffizientenwertes werden alle in der Codierungseinheit
b3 enthaltenen spektralen Komponenten normiert.
Das im tonalen akustischen Signal enthaltene Rauschen ist dem Ohr
obstruktiv. Wenn außerdem
die tonalen Komponenten nicht mit hoher Genauigkeit quantisiert
werden, wird eine beträchtliche
Anschluss- bzw. Verbindungsverzerrung erzeugt, wenn die tonalen
Komponenten mit den Wellenformsignalen des benachbarten Zeitblocks
synthetisiert werden. Aus diesem Grund müssen die tonalen Komponenten
mit einer ausreichenden Zahl von Bits quantisiert werden. Wenn jedoch
der Quantisierungsschritt auf der Basis von voreingestellten Frequenzbändern bestimmt
wird, ist es notwendig, einer großen Zahl der spektralen Komponenten
in der die tonalen Komponenten enthaltenden Codierungseinheit eine
große
Zahl von Bits zuzuordnen, wodurch die Codierungseffizienz erniedrigt
wird.
-
Mit
dem vorstehend beschriebenen herkömmlichen Verfahren werden die
Frequenzbänder zur
Quantisierung der Frequenzkomponenten mit dem gleichen Quantisierungsschritt
fixiert. Aus diesem Grund ist es, wenn die spektralen Komponenten in
der Nähe
mehrerer spezifizierter Frequenzen konzentriert sind, und wenn diese
spektralen Komponenten mit ausreichend feinen Quantisierungsschritten zu
quantisieren sind, notwendig, einer großen Zahl spektraler Komponenten,
die zum gleichen Band wie das der spektralen Komponenten gehören, eine
große
Zahl von Bits zuzuordnen.
-
Generell
ist das im tonalen akustischen Signal, bei dem die spektrale Energie
bei spezifizierten Frequenzen konzentriert ist, enthaltene Rauschen dem
Ohr offensiver als das in einem akustischen Signal, bei dem die
Energie glatt bzw. gleichmäßig über einen
breiten Frequenzbereich verteilt ist, enthaltene Rauschen. Ein solches
Rauschen ist dem Ohr extrem unangenehm. Wenn andererseits die spektralen Komponenten,
die größere Energien
aufweisen als tonale Komponenten, nicht mit ausreichend feinen Quantisierungsschritten
quantisiert werden, wird eine Block-zu-Block-Verzerrung größer, wenn
die spektralen Komponenten zu den Wellenformsignalen bezüglich der
Zeitachse wiederhergestellt werden, und die resultierenden Wellenformsignale
werden mit zeitlich benachbarten Blöcken synthetisiert. In anderen
Worten wird eine größere Verbindungsverzerrung
erzeugt, wenn die resultierenden Wellenformsignale mit den Wellenformsignalen
der zeitlich benachbarten Blöcke
synthetisiert werden, und dadurch wird dem menschlichen Gehörsystem
wieder ein Hindernis präsentiert.
Infolgedessen ist es bei dem herkömmlichen Verfahren schwierig,
die Codierungseffizienz für
das tonale akustische Signal ohne Verschlechterung der Signalqualität anzuheben.
-
Um
einer solchen Unvorteilhaftigkeit zu begegnen, hat die Rechtsinhaberin
der vorliegenden Anmeldung unter der internationalen Anmeldenummer
PCT/JP94/00880 (internationale Veröffentlichungsnummer WO94/28633,
internationales Veröffentlichungsdatum
8. Dezember 1994) ein Verfahren zur Realisierung einer hohen Codierungseffizienz durch
Separieren des Eingabesignals in tonale Komponenten, bei denen die
Signalenergie bei einer spezifizierten Frequenz konzentriert ist,
und nicht tonale Komponenten, bei denen die Signalenergie über einem
breiten Frequenzbereich glatt bzw. gleichmäßig verteilt ist, vorgeschlagen.
-
Bei
dem bisher vorgeschlagenen Verfahren kann die Codierung effizienter
als bei dem vorstehend erwähnten
Verfahren zur Quantisierung der Frequenzkomponenten auf der Basis
fester Bänder durch
Quantisierung der tonalen Komponenten mit feinen Quantisierungsschritten
innerhalb eines extrem schmalen Bereichs bezüglich der Frequenzachse und
durch Aufzeichnung der resultierenden Daten zusammen mit der Position
bezüglich
der Frequenzachse auf dem Aufzeichnungsmedium erzielt werden. Als
ein illustratives Beispiel der hocheffizienten Codierung wurde ein
Verfahren zur Normierung und Quantisierung einer voreingestellten
Zahl spektraler Signale, die um eine maximale spektrale Energiekomponente
jeder der tonalen Komponenten zentriert sind, und Codierung der
resultierenden spektralen Signale, vorgeschlagen.
-
Das
wie in PCT/JP94/00880 vorgeschlagene Verfahren besteht jedoch in
der richtigen Verteilung der Information betreffend die Quantisierungsschritte zur
Quantisierung der tonalen Komponenten auf jede tonale Komponente
oder Quantisierung aller tonalen Komponenten mit den gleichen Quantisierungsschritten.
Wenn das erstere Verfahren angewendet wird, ist es notwendig, zur
Codierung der Information bezüglich
der gleichen Quantisierungsschritte eine größere Zahl von Bits zu benutzen,
was bei der Realisierung einer hocheffizienten Codierung nicht wünschenswert
ist. Wenn andererseits das letztere Verfahren benutzt wird, können die
Quantisierungsschritte nicht auf optimale Werte für die jeweiligen
tonalen Komponenten eingestellt werden.
-
WO
89 10661 A lehrt, dass der Energieinhalt von Stimmendaten über dem
hörbaren
Frequenzband nicht zufällig
auftritt, und, wenn das Eingabesignal in Frequenzkomponenten transformiert
wird und die Frequenzkomponenten in eine Anzahl von Bändern gruppiert
werden, die richtige spektrale Information nur in wenigen häufig ausgewählten Filterbändern liegt.
Insbesondere offenbart dieses Dokument ein Verfahren zur Übertragung
eines Informationssignals über
einen Kommunikationskanal, in welchem durch einen Subbandcodierer
erzeugte digital verarbeitete Abtastwerte bzw. Samples auf dem Kommunikationskanal
moduliert werden, um Kanalsymbole zu erzeugen, die eine zu einer
Charakteristik eines jeweiligen digital verarbeiteten Sample proportionale Modulationsgröße aufweisen.
-
Aus
EP-A-0 525 809 geht ein Codierungsgerät hervor, bei dem spektrale
Komponenten eines digitalen Eingabesignals in kritische Bänder gruppiert werden
und die Gesamtzahl von zur Quantisierung der spektralen Komponenten
verfügbaren
Bits den kritischen Bändern
zugeordnet wird, wobei fixierte Bits den kritischen Bändern entsprechend
einem aus einer Anzahl vor bestimmter Bitzuordnungsmuster ausgewählten Muster
zugeordnet werden, und variable Bits den kritischen Bändern entsprechend
der Energie in den kritischen Bändern
zugeordnet werden.
-
Es
ist eine Aufgabe der vorliegenden Erfindung, ein Informationscodierungsverfahren
und -gerät
und ein Informationsdecodierungsverfahren und -gerät bereitzustellen,
wodurch die tonalen akustischen Signale vor allem effizient codiert
werden können,
und die Quantisierungsschritte für
die jeweiligen tonalen Komponenten optimal eingestellt werden können.
-
Diese
Aufgabe wird durch ein Codierungsverfahren, ein Codierungsgerät, ein Decodierungsverfahren
und ein Decodierungsgerät
gemäß den beigefügten unabhängigen Ansprüchen gelöst. Vorteilhafte
Merkmale und Eigenschaften der vorliegenden Erfindung sind in den
korrespondierenden Unteransprüchen
definiert.
-
Mit
der vorliegenden Erfindung kann eine hocheffiziente Codierung durch
Klassifizieren eines ersten Signals als die tonalen Komponenten
in partielle Informationsketten entsprechend einer gemeinsamen Information,
nicht Codieren von nutzlosen der partiellen Informationsketten,
und durch gemeinschaftliches Codieren der die codierten partiellen
Informationsketten anzeigenden Information, das heißt durch
Separieren der tonalen Komponenten in Gruppen, nicht Codieren der
die tonalen Komponenten nicht enthaltenden Gruppen, und Codieren
der Zahl der codierten Gruppen erreicht werden.
-
Außerdem kann
durch Übertragen
der durch das Informationscodierungsverfahren und -gerät gemäß der vorliegenden
Erfindung eine effiziente Übertragung
erreicht werden.
-
Mit
den Codierungsverfahren und -gerät
gemäß der vorliegenden
Erfindung wird die Information, welche die codierten partiellen
Informationsketten mit Ausnahme der nicht codierten nutzlosen partiellen
Informationsketten anzeigt, decodiert und wird auf der Basis der
decodierten Resultate eine Decodierung der partiellen Informationsketten,
die aus dem ersten Signal der entsprechend der gemeinsamen Information
klassifizierten tonalen Komponenten bestehen, durchgeführt.
-
KURZE BESCHREIBUNG DER
ZEICHNUNGEN
-
1 ist
ein Blockschaltbild, das eine grundlegende Ausbildung eines herkömmlichen
Codierungsgeräts
zeigt.
-
2 ist
ein Blockdiagramm, das eine illustrative Anordnung einer Transformationsschaltung
eines herkömmlichen
Codierungsgeräts
zeigt.
-
3 ist
ein Blockdiagramm, das eine illustrative Anordnung einer herkömmlichen
Signalkomponenten-Codierungsschaltung zeigt.
-
4 ist
ein Blockdiagramm, das eine grundlegende Ausbildung einer herkömmlichen
Decodierungsschaltung zeigt.
-
5 ist
ein Blockdiagramm, das eine illustrative Ausbildung einer inversen
Transformationsschaltung einer herkömmlichen Decodierungsschaltung
zeigt.
-
6 stellt
ein Codierungsverfahren gemäß einer
herkömmlichen
Technik durch Vergleich mit der vorliegenden Erfindung dar.
-
7 ist
ein Blockdiagramm, das eine Ausbildung eines die vorliegende Erfindung
verkörpernden
Informationscodierungsgeräts
zeigt.
-
8 ist
ein Blockdiagramm, das eine Ausbildung eines die Erfindung verkörpernden
Informationsdecodierungsgeräts
zeigt.
-
9 stellt
in tonalen Komponenten enthaltene spektrale Signale dar.
-
10 stellt
tonale Komponenten ausschließende
spektrale Signale dar.
-
11 ist
ein Flussdiagramm zur Darstellung eines Verarbeitungsflusses zur
Separation tonaler Komponenten.
-
12 ist
ein Flussdiagramm zur Darstellung des Verarbeitungsflusses zur Bestimmung
der Zahl spektraler Signale, welche die registrierten tonalen Komponenten
bilden.
-
13 stellt
eine exemplarische Codekette dar.
-
14 stellt
eine durch das Codierungsverfahren der vorliegenden Erfindung erzeugte
Codekette dar.
-
15 stellt
eine andere exemplarische Codekette dar.
-
16 stellt
eine noch andere exemplarische Codekette dar.
-
17 ist
ein Blockschaltbild, das ein anderes Beispiel einer Wiederherstellungseinheit
gemäß der vorliegenden
Erfindung zeigt.
-
18 ist
ein Flussdiagramm, das den Verarbeitungsfluss während einer Gruppierung der
tonalen Komponenten zeigt.
-
19 ist
ein Flussdiagramm, das den Verarbeitungsfluss des Informationsdecodierungsverfahrens
gemäß der vorliegenden
Erfindung zeigt.
-
BESTE ART UND WEISE DER
AUSFÜHRUNG
DER ERFINDUNG
-
Bezugnehmend
auf die Zeichnungen werden bevorzugte illustrative Ausführungsformen
der vorliegenden Erfindung detailliert erläutert.
-
7 zeigt
eine Ausbildung eines die vorliegende Erfindung verkörpernden
Informationscodierungsgeräts.
-
Nach 7 wird
einem Anschluss 600 ein akustisches Wellenformsignal zugeführt. Das
akustische Wellenformsignal wird von einer Transformationsschaltung 601 in
Signalfrequenzkomponenten transformiert, die dann zu einer Signalkomponenten separierenden
Schaltung 602 geleitet werden. In der Signalkomponenten
separierenden Schaltung 602 werden die von der Transformationsschaltung 601 erzeugten
Signalfrequenzkomponenten, die eine steile spektrale Verteilung
aufweisen, und verbleibende Signalfrequenzkomponenten, das heißt rauschige
bzw. rauschende Komponenten, die eine flache spektrale Verteilung
aufweisen, separiert. Von den resultierenden Frequenzkomponenten
werden die eine steile spektrale Verteilung bereitstellenden tonalen
Komponenten von einer tonale Komponenten codierenden Schaltung 603 codiert,
während
die ver bleibenden Signalfrequenzkomponenten, das heißt die rauschenden
Komponenten, von einer rauschende Komponenten codierenden Schaltung 604 codiert
werden. Ein Ausgangssignal der die tonalen Komponenten codierenden
Schaltung 603 und der die rauschenden Komponenten codierenden
Schaltung 604 werden von einer Codekette erzeugenden Schaltung 605 in
eine Codekette geformt, die zu einem ECC-Codierer 606 ausgegeben
wird.
-
Der
ECC-Codierer 606 fügt
an die von der Codekette erzeugenden Schaltung 605 ausgegebene
Codekette Fehlerkorrekturcodes an. Ein Ausgangssignal des ECC-Codierers 606 wird
von einer EFM-Schaltung 607 moduliert, bevor es zu einem Aufzeichnungskopf 608 übertragen
wird. Der Aufzeichnungskopf 608 zeichnet die ausgegebene
Codekette der EFM-Schaltung 607 auf einer Platte 609 auf.
Die Signalkomponenten separierende Schaltung 602 gibt die
Zahl der tonalen Komponenteninformationsdaten, Positionsinformation
und die Information bezüglich
der Zahl der spektralen Komponenten an die Codekette erzeugende
Schaltung 605 aus.
-
Für die Transformationsschaltung 601 kann eine
Anordnung ähnlich
zu der in 2 gezeigten verwendet werden.
-
Natürlich kann
für die
Transformationsschaltung 601 eine Ausbildung bzw. Beschaffenheit
anders als die in 2 gezeigte verwendet werden. Beispielsweise
kann das Eingabesignal von einer MDCT direkt in spektrale Signale
transformiert werden, oder es kann anstelle der MDCT eine Transformation
in spektrale Signale durch DFT oder DCT verwendet werden. Die tonale
Komponenten codierende Schaltung 603 und die rauschende
Komponenten codierende Schaltung 604 können grundsätzlich durch die gleiche Anordnung
wie die in 3 gezeigte realisiert werden.
-
8 zeigt
eine Beschaffenheit einer Decodierungsschaltung zur Decodierung
der von der in 7 gezeigten Codierungsschaltung
erhaltenen Codekette.
-
Nach 8 wird
die von der Platte 609 durch den Wiedergabekopf 708 wiedergegebene
Codekette zu einer EFM-Schaltung 709 geleitet,
welche die eingegebene Codekette demoduliert. Die demodulierte Codekette
wird zu einem ECC-Decodierer 710 zur
Fehlerkorrektur geleitet. Auf der Basis der Zahl der Informationsdaten
bezüglich
der in der fehlerkorrigierten Codekette enthaltenen tonalen Komponenten
erkennt eine Codekette-Auflösungsschaltung 701,
welcher Teil der Codekette der tonale Komponentencode ist, und separiert
die eingegebene Codekette in die tonalen Komponentencodes und die
rauschenden Komponentencodes. Andererseits separiert die Codekette
separierende Schaltung 701 die tonale Komponentenpositionsinformation
und die spektrale Komponentenzahlinformation von der eingegebenen
Codekette und gibt die separierte Information an eine stromabseitige
Syntheseschaltung 704 aus. Der tonale Komponentencode und
der rauschende Komponentencode werden jeweils zu einer tonale Komponenten
decodierenden Schaltung 702 und einer rauschende Komponenten
decodierenden Schaltung 703 geleitet, wo sie zur Decodierung
invers quantisiert und entnormiert werden. Die decodierten Signale
von den Schaltungen 702 und 703 werden zu einer
Syntheseschaltung 704 geleitet, die eine Synthese, welche
die zur Separation durch die in 7 gezeigte
Signalkomponenten separierende Schaltung 602 umgekehrte
Operation ist, ausführt.
-
Auf
der Basis der Positionsinformation und der spektralen Komponentenzahlinformation,
die von der separierenden Schaltung 701 zugeführt werden, addiert
die Syntheseschaltung 704 das decodierte tonale Komponentensignal
bei einer voreingestellten Position des decodierten rauschenden
Komponentensignals zur Synthetisierung der rauschenden und tonalen
Komponenten bezüglich
der Frequenzachse. Das synthetisierte decodierte Signal wird von
einer inversen Transformationsschaltung 705, die eine inverse
Transformation, welche die umgekehrte Operation der von der in 7 gezeigten
Transformationsschaltung 601 ausgeführten Transformation ist, ausführt, transformiert,
so dass das Signal aus dem Signal bezüglich der Frequenzachse in
ein akustisches Wellenformsignal bezüglich der Zeitachse wiederhergestellt
wird. Ein von der inversen Transformationsschaltung 705 ausgegebenes
Wellenformsignal wird an einen Anschluss 707 gegeben. Die
Operationen der inversen Transformation und Synthese können umgekehrt
sein, in welchem Fall eine in 8 gezeigte
Wiederherstellungsschaltung 711 eine wie in 17 gezeigte
Beschaffenheit aufweist. Dort invers transformiert die inverse Transformationsschaltung 712 das
decodierte rauschende Komponentensignal bezüglich der Frequenzachse von
der Decodierungsschaltung 703 in das rauschende Komponentensignal
bezüglich
der Zeitachse. Die inverse Transformationsschaltung 713 ordnet
das decodierte tonale Komponentensignal aus der tonale Komponenten
decodierenden Schaltung 702 bei der durch die Spektralzahlinformation
und die Positionsinformation der von der Codekette separierenden
Schaltung 701 übertragenen
tonalen Komponente spezifizierten Position bezüglich der Frequenzachse an
und invers transformiert das resultierende Signal zur Erzeugung
des tonalen Komponentensignals bezüglich der Zeitachse. Eine Syntheseschaltung 714 synthetisiert
das rauschende Komponentensignal bezüglich der Zeitachse aus der
inversen Transformationsschaltung 712 und das tonale Komponentensignal bezüglich der
Zeitachse aus der inversen Transformationsschaltung 713 zur
Wiederherstellung des originalen akustischen Wellenformsignals.
-
Der
Hintergrund dafür,
wie das Informationscodierungsverfahren und das Informationsdecodierungsverfahren
bei der in 7 gezeigten Beschaffenheit des
Codierungsgeräts
und des in 8 gezeigten Decodierungsgeräts angewendet
werden, wird nachstehend erläutert.
-
Die
Art und Weise der Separation der tonalen Komponenten von den Frequenzkomponenten
ist in 9 gezeigt, bei der vier tonale Komponenten TCA, TCB, TCC und TCD extrahiert
worden sind. Wie beim Beispiel der 9 gezeigt
sind die tonalen Komponenten auf eine kleinere Zahl spektraler Komponenten
verteilt. Wenn deshalb diese Komponenten mit feineren Quantisierungsschritten
quantisiert werden, wird die Zahl von Quantisierungsbits als Ganzes nicht übermäßig erhöht. Obgleich
die tonalen Komponenten zur Anhebung der Codierungseffizienz normiert
und danach quantisiert werden können,
kann zur Vereinfachung des Geräts
der Normierungs- und Quantisierungsprozess
wegen der kleineren Zahl der die tonalen Komponenten bildenden spektralen
Signale fortgelassen werden. Außerdem
ist bei dem in 9 gezeigten Beispiel die Zahl
der die tonalen Komponenten bildenden spektralen Signale zwischen
3, 5 und 7 derart variabel, dass die tonale Komponente TCA aus drei spektralen Signalen, die tonale
Komponente TCB aus sieben spektralen Signalen
und die tonalen Komponenten TCC und TCD jeweils aus drei spektralen Signalen, die
um das spektrale Maximumwertsignal, das heißt das einen lokalen Maximumwert
aufweisende spektrale Signal, zentriert sind, gebildet sind. In
einem solchen Fall kann die Codierung unter der Annahme ausgeführt werden,
dass die jeweiligen tonalen Komponenten aus drei, fünf oder
sieben spektralen Signalen gebildet sind. Es sei darauf hingewiesen,
dass bei dem dargestellten Beispiel keine aus fünf spektralen Signalen gebildete
tonale Komponente vorhanden ist.
-
10 zeigt
ein Beispiel, bei dem die tonalen Komponenten von den in 9 gezeigten
originalen spektralen Signalen eliminiert sind, um nur die rauschenden
Komponenten zu zeigen. Da in 10 die
tonalen Komponenten von den originalen spektralen Signalen in den
jeweiligen Codierungseinheiten (Bändern) b1 bis
b5 eliminiert worden sind, weisen in jeder
Codierungseinheit b1 bis b5 die
Normierungskoeffizienten kleinere Werte auf, so dass das Quantisierungsrauschen
selbst bei der Benutzung einer kleineren Zahl von Quantisierungsbits
reduziert werden kann.
-
11 zeigt
den Verarbeitungsfluss zur Separation der tonalen Komponenten durch
die Signalkomponenten separierende Schaltung 602.
-
In 11 bezeichnet
I die serielle Zahl der spektralen Signale, N bezeichnet die Gesamtzahl
der spektralen Signale und P, R bezeichnen voreingestellte Koeffizienten.
Was die tonalen Komponenten betrifft, so werden, wenn der absolute
Wert eines spektralen Signals lokal größer als der Wert der verbleibenden
spektralen Signale ist und um mehr als ein voreingestellter Wert
größer als
der Maximumwert der absoluten Werte der spektralen Signale im Zeitblock
für die
spektralen Signale ist, und wenn auch die Summe der Energie der
spektralen Signale und der Energie benachbarter spektraler Signale
wie beispielsweise zweier direkt benachbarter spektraler Signale
um mehr als ein voreingestelltes Verhältnis auf die Gesamtenergie
in einem die spektralen Signale enthaltenden voreingestellten Band
bezogen wird, die spektralen Signale und beispielsweise die zwei
direkt benachbarten Signale als tonale Komponenten angesehen. Das
voreingestellte Band als die Basis des Vergleichs des Energieverteilungsverhältnisses
kann unter Beibehaltung beispielsweise der kritischen Bandbreiten
zum niedrigen und hohen Frequenzbereich hin schmaler und breiter
gewählt
werden, um die psychoakustischen Charakteristiken des menschlichen
Gehörsystems
zu berücksichtigen.
-
Bei
der 11 wird ein maximaler absoluter Wert des spektralen
Signals beim Schritt S1 für
eine Variable A0 substituiert. Beim Schritt
S2 wird die serielle Zahl I des spektralen Signals auf 1 gesetzt.
Beim Schritt S3 wird der absolute Wert eines spektralen Signals
(nachstehend als spektraler absoluter Wert bezeichnet) in einem
Zeitblock für
eine Variable R substituiert.
-
Beim
Schritt S4 wird entschieden, ob der vorstehende absolute Wert des
spektralen Signals lokal größer als
die Werte anderer spektraler Signale ist oder nicht, das heißt, ob er
das den lokal maximalen absoluten Wert aufweisende spektrale Signal
ist oder nicht. Wenn das Resultat NEIN ist, das heißt, wenn der
vorstehende absolute spektrale Wert nicht die den lokal maximalen
absoluten Wert aufweisende spektrale Komponente ist, geht das Programm
zum Schritt S10 über.
Andernfalls geht das Programm zum Schritt S5 über.
-
Beim
Schritt S5 wird die Größe des Verhältnisses
der Variablen A des spektralen Signals, das den lokal maximalen
Wert in dem das den lokal maximalen absoluten Wert aufweisende spektrale
Signal enthaltenden Zeitblock aufweist, zur Variablen A0 des
maximalen absoluten Werts des spektralen Signals mit der des Koeffizienten
P verglichen, was eine voreingestellte Größe darstellt (A/A0 > P). Wenn A/A0 > P
gilt, geht das Programm zum Schritt S6 über, und andernfalls, das heißt, wenn
A/A0 < P
gilt, schaltet das Programm zum Schritt S10.
-
Beim
Schritt S6 wird der Energiewert der zur spektralen Komponente mit
dem lokal maximalen absoluten Wert benachbarten spektralen Komponenten wie
beispielsweise die Summe der Energien beider benachbarten spektralen
Komponenten für
die Variable X substituiert. Beim nächsten Schritt S7 wird der totale
Energiewert innerhalb eines voreingestellten Bandes, das die spektrale
Komponente mit dem lokal maximalen absoluten Wert und benachbarte
spektrale Komponenten enthält,
für eine
Variable Y substituiert.
-
Beim
nächsten
Schritt S8 wird das Verhältnis der
Variablen X für
den Energiewert zur Variablen Y des Energiewertes innerhalb des
voreingestellten Bandes mit dem Koeffizienten R verglichen, was
ein voreingestelltes Verhältnis
anzeigt (X/Y > R).
Wenn das Resultat JA ist, das heißt, wenn X/Y > R gilt, schaltet das
Programm zum Schritt S9. Wenn das Resultat NEIN ist, das heißt, wenn
X/Y < R gilt, schaltet
das Programm zum Schritt S10.
-
Beim
Schritt S9 werden, wenn das Verhältnis der
Energie des spektralen Signals mit dem lokal maximalen absoluten
Wert und der benachbarten spektralen Signale zur Energie in dem
diese spektralen Signale enthaltenden voreingestellten Band nicht kleiner
als ein vorbestimmter Wert ist, das spektrale Signal mit dem lokal
maximalen absoluten Wert und die benachbarten spektralen Signale
als tonale Komponenten angesehen, und ein solcher Effekt wird registriert.
-
Beim
nächsten
Schritt S10 wird entschieden, ob die Zahl I der beim Schritt S9
registrierten spektralen Signale gleich der Gesamtzahl N der spektralen Signale
(I = N) ist oder nicht. Wenn das Resultat JA ist, das heißt, wenn
I = N gilt, ist das Programm beendet. Wenn das Resultat NEIN ist,
das heißt,
wenn I nicht gleich N ist, schaltet das Programm zum Schritt S11,
wo I inkrementiert wird (I = I + 1), das heißt, die Zahl der spektralen
Signale wird für
jeden Schritt um 1 erhöht,
um zum Schritt S3 zur Wiederholung der vorstehenden Prozessschritte
zurückzukehren.
-
12 zeigt
den Prozessfluss zur Bestimmung der Zahl spektraler Bestandteilsignale
der beim Beispiel der 9 als tonale Komponente registrierten
tonalen Komponente.
-
In 12 ist
die maximale Zahl der spektralen Bestandteilsignale der tonalen
Komponente auf 7 gesetzt. Wenn das Verhältnis der Energie der um das spektrale
Signal mit dem lokal maximalen absoluten Wert zentrierten drei oder
fünf spektralen
Signale zur Energie der um das spektrale Signal mit dem lokal maximalen
absoluten Wert zentrierten sieben Signale ein vorbestimmtes Verhältnis überschreitet,
wird die Zahl der spektralen Bestandteilsignale der tonalen Komponente
auf drei bzw. fünf
gesetzt. Wenn beim vorliegenden Beispiel die registrierten tonalen Komponenten
vorab klassifiziert werden, so kann eine solche Klassifizierung
natürlich
zu der gleichen Zeit, zu der die tonalen Komponenten mit der beim Schritt
S9 als die Zahl der registrierten tonalen Komponenten ermittelten
Zahl des den lokal maximalen absoluten Wert aufweisenden spektralen
Signals extrahiert werden, ausgeführt werden.
-
Bei
der 12 wird die Zahl der registrierten tonalen Komponenten
beim Schritt S21 auf eine Variable M gesetzt. Beim Schritt S22 wird
die Zahl I der tonalen Komponente auf 1 gesetzt. Beim Schritt S23 wird
der Energiewert der zur lokal maximalen spektralen Komponente benachbarten
sieben spektralen Signale für
die Variable Y substituiert. Beim Schritt S24 wird der Energiewert
der zur lokal maximalen spektralen Komponente benachbarten drei
spektralen Signale für
die Variable X substituiert.
-
Beim
Schritt S25 wird entschieden, ob das Verhältnis des Energiewertes der
vorstehenden sieben benachbarten spektralen Signale zum Energiewert
der drei spektralen Signale (X/Y) ein voreingestelltes Verhältnis P überschreitet
(X/Y > P) oder nicht.
Wenn das Resultat JA ist, das heißt, wenn das Verhältnis P überschreitet,
schaltet das Programm zum Schritt S26. Wenn das Resultat NEIN ist,
das heißt,
wenn das Verhältnis
P nicht überschreitet, schaltet
das Programm zum Schritt S27.
-
Beim
Schritt S26 wird die Zahl der spektralen Signale der tonalen Komponente
auf drei gesetzt, was als drei spektrale tonale Komponenten registriert wird.
Das Programm schaltet dann zum Schritt S31.
-
Beim
Schritt S27 wird der Energiewert der um das lokal maximale spektrale
Signal zentrierten fünf
benachbarten spektralen Signale für die Variable X substituiert.
Beim nächsten
Schritt S28 wird entschieden, ob das Verhältnis des Energiewertes der sieben
benachbarten spektralen Signale zum Energiewert der fünf spektralen
Signale (X/Y) ein vorbestimmtes Verhältnis P überschreitet (X/Y > P) oder nicht. Wenn
das Resultat JA ist, das heißt,
wenn das Verhältnis
P überschreitet,
schaltet das Programm zum Schritt S29. Wenn das Resultat NEIN ist,
das heißt,
wenn das Verhältnis
P nicht überschreitet, schaltet
das Programm zum Schritt S30.
-
Beim
Schritt S29 wird die Zahl der spektralen Signale der tonalen Komponente
auf fünf
gesetzt, was als fünf
spektrale tonale Komponenten registriert wird. Das Programm schaltet
dann zum Schritt S31.
-
Beim
Schritt S30 wird die Zahl der spektralen Signale der tonalen Komponente
auf sieben gesetzt, was als sieben spektrale tonale Komponenten
registriert wird. Das Programm schaltet dann zum Schritt S31.
-
Beim
Schritt S31 wird bestimmt, ob die beim Schritt S21 gesetzte Zahl
der tonalen Komponenten gleich der Zahl I der tonalen Komponenten
ist (I = M) oder nicht. Wenn das Resultat JA ist, das heißt, wenn I
= M gilt, ist das Programm beendet. Wenn das Resultat NEIN ist,
das heißt,
wenn I nicht gleich M ist, schaltet das Programm zum Schritt S32.
-
Beim
Schritt S32 wird I für
jeden Schritt um 1 inkrementiert (I = I + 1) um zum Schritt S23
zur Wiederholung der vorstehenden Schritte zurückzukehren.
-
13 zeigt
eine Anordnung beziehungsweise ein Array von Informationsdaten,
wenn die wie vorstehend beschrieben in die tonalen und rauschenden
Komponenten separierten Informationsdaten entsprechend dem in der
US-Patentanmeldung SN 08/306 659 (Anmeldedatum 15. September 1994) beschriebenen,
von der Rechtsinhaberin der vorliegenden Anmeldung vorgeschlagenen
Codierungsverfahren zur Aufzeichnung oder Übertragung codiert werden.
Da das Aufzeichnungsmedium als ein Übertragungspfad seiend angenommen
werden kann, bedeutet hier der Ausdruck „Übertragung„, dass er eine Aufzeichnung
der Information auf dem Aufzeichnungsmedium umfasst.
-
Bei
der 13 werden die tonalen Komponenten durch Gruppen,
deren jede aus der gleichen Zahl der spektralen Komponenten besteht, übertragen.
Das heißt,
beim vorliegenden Beispiel werden als die Information, die alle
tonalen Komponenten mit der Zahl der spektralen Bestandteilsignale
gleich drei anzeigt, die Zahl der tonalen Komponenten (als die Zahl
der Informationsdaten für
drei spektrale tonale Komponenten STC3 =
3) und die Inhalte der tonalen Komponenten TCA,
TCC und TCD, das
heißt
die tonalen Komponenteninformationsdaten tcA,
tcC und tcD als
die partielle tonale Komponenteninformationskette LTC1 übertragen.
Die alle tonalen Komponenten mit der Zahl der spektralen Bestandteilkomponenten gleich
fünf anzeigende
Information, und die alle tonalen Komponenten mit der Zahl der spektralen
Bestandteilkomponenten gleich sieben anzeigende Information werden
danach auf ähnliche
Weise als die partiellen tonalen Komponenteninformationskette LTC2 und die partielle tonale Komponenteninformationskette
LTC3 zusammen mit dem Inhalt der tonalen Komponente
TCB, das heißt den tonalen Komponenteninformationsdaten
tcB übertragen.
Wenn die tonalen Komponenten durch Gruppen, deren jede die gleiche
Zahl der spektralen Bestandteilsignale aufweist, übertragen
werden, wird es nicht notwendig, die Information betreffend die
Zahl spektraler Signale, welche die spektralen Bestandteilsignale
bilden, zu übertragen,
so dass in dem Fall, bei dem eine große Zahl tonaler Komponenten
vorhanden ist, eine effiziente Codierung möglich wird.
-
Die
Information der tonalen Komponente tc weist die zentrale Positionsinformation
CP, welche das Zentrum der Spektrumposition der tonalen Komponenten
anzeigt, beispielsweise CP = 31 für die tonale Komponente TCC, die Information bezüglich der Quantisierungsschritte,
welche die Zahl von Quantisierungsbits QP anzeigt (beispielsweise
QP = 6), die Information bezüglich
der Normierungskoeffizienten NP und die Information bezüglich jeweiliger
Signalkomponenten, welche die normierten und quantisierten Werte
der die tonalen Komponenten wie beispielsweise die Information SC1, SC2, ... SC3 bildenden verbleibenden spektralen Signale
auf.
-
Die
Information bezüglich
der rauschenden Komponenten wird in der Sequenz von nc1,
nc2, nc3, nc4 und nc5, die jeweils
den Bändern
b1 bis b5 der 10 zugeordnet
sind, aufgezeichnet oder übertragen.
Die Information bezüglich
der rauschenden Komponente nc enthält die Information bezüglich der Quantisierungsschritte
QP (QP = 3 im Fall der Information nc1),
die Information bezüglich
der Normierungskoeffizienten NP und die Information bezüglich jeweils
normierter und quantisierter Signalkomponenten wie beispielsweise
die Information SC1, SC2, ...
SC3.
-
Jedoch
ist es bei der Codekette des vorliegenden Beispiels trotz der Tatsache,
dass es keine durch fünf
spektrale Signale gebildete tonale Komponente gibt, notwendig, die
Zahl spektraler Signale zu übertragen.
Bei dem dargestellten Beispiel sind nur drei unterschiedliche Zahlen der
die tonalen Komponenten bildenden spektralen Signale zugelassen.
Jedoch ist es bei der Gestaltungsanweisung (design statement) zur
Codierung, bei der die Informationsdaten abhängig von den variablen Kompressionsverhältnissen
und dem geforderten Tonqualitätsniveau mit
dem gleiche Codierungsverfahren codiert werden müssen, notwendig, eine große Zahl
spektraler Signale, welche die tonalen Komponenten in der Gestaltungsanweisung
bilden, zuzulassen, während
es nicht effizient ist, die Zahl der Informationsdaten bezüglich der
tonalen Komponenten für
die nicht benutzte partielle Kette der tonalen Komponentendaten zu übertragen.
-
14 zeigt
ein Beispiel einer Codekettebeschaffenheit in dem Fall, dass das
in 9 gezeigte Signal gemäß dem Übertragungsverfahren der vorliegenden
Erfindung, bei dem der vorstehend erwähnte Punkt berücksichtigt
ist, codiert wird.
-
Bei
der 14 wird, wie darin spezifiziert, zuerst die Zahl
der partiellen Ketten der Information bezüglich der tonalen Komponenten
nLTC (beim Beispiel der 9 und 14 gilt
nLTC = 2) übertragen, gefolgt von der
Zahl partieller Ketten der Information bezüglich der tonalen Komponenten
LTC11 und LTC12.
Beim Beispiel der 14 werden die Zahl N11, welche die Zahl der Informationsdaten
tc für
die tonalen Komponenten in der partiellen Kette LTC11 anzeigt
(beim vorliegenden Beispiel gilt N11 = 3),
die Zahl der die spektralen Komponenten nsp bildenden spektralen
Signale, welche die Zahl der die tonalen Komponenten bildenden spektralen
Signale anzeigt (beim vorliegenden Beispiel gilt nsp =
3) und die tatsächliche
Information bezüglich
der tonalen Komponenten tcA, tcC und
tcD als die partielle Kette LCT11 übertragen.
Da die Zahl irgendwelcher der die tonalen Komponenten bildenden
spektralen Signale beim vorliegenden Beispiel nicht gleich 5 ist,
wird eine solche partielle Informationskette nicht codiert. Als
die partielle Kette LC12 werden die Zahl
N12, welche die Zahl der Informationsdaten
tc für
die tonalen Komponenten in der partiellen Kette LTC12 anzeigt
(beim vorliegenden Beispiel gilt N12 = 3),
die Zahl von die tonale Komponente nsp bildenden
spektralen Signalen, welche die Zahl der die tonale Komponente bildenden
spektralen Signale anzeigt (beim vorliegenden Beispiel gilt nsp = 7) und die aktuelle Information bezüglich der
tonalen Komponenten tcB übertragen. Da es keine Notwendigkeit
für eine Übertragung
der Information bezüglich
der nutzlosen partiellen Informationskette der tonalen Komponente
gibt, kann eine effiziente Codierung erzielt werden, insbesondere wenn
unterschiedliche Arten der partiellen Informationskette aus dem
im vorstehenden diskutierten Grund zulässig sein müssen.
-
Beim
Beispiel der 4 wird die partielle Informationskette
bezüglich
der tonalen Komponenten durch Gruppierung auf der Basis der Zahl
der die tonale Komponente bildenden spektralen Signale erzeugt.
Jedoch kann das Verfahren der vorliegenden Erfindung auf einen solchen
Fall angewendet werden, bei dem die partiellen Informationsketten
für die tonalen
Komponenten durch Gruppierung der Information bezüglich der
tonalen Komponenten auf der Basis anderer Attribute als die Zahl
der die tonale Komponente bildenden spektralen Signale gebildet werden.
-
Insbesondere
kann die Gruppierung auf der Basis der Information bezüglich der
Quantisierungsschritte gemacht werden. Bezugnehmend auf die 9, 15, 17 und 18 wird
ein illustratives Beispiel einer Gruppierung auf der Basis der Information
bezüglich
der Quantisierungsschritte erläutert.
-
Es
sei angenommen, dass die Signalkomponenten separierende Schaltung 602,
wie in 9 gezeigt, tonale Komponenten von Frequenzkomponenten
separiert. Beim vorliegenden Beispiel sind, wie früher erläutert, vier
tonale Komponenten TCA, TCB, TCC und TCD extrahiert
worden. Wenn erlaubt ist, die spektralen Komponenten bei den mit
der Information bezüglich
des Quantisierungsschritts QP = 6 korrespondierenden Quantisierungsschritten
oder bei den mit der Information bezüglich des Quantisierungsschritts
QP = 4 korrespondierenden Quantisierungsschritten zu quantisieren,
bestimmt die Quantisierungsschritt-Entscheidungsschaltung in der
tonale Komponenten codierenden Schaltung 603 den Quantisierungsschritt
der jeweiligen tonalen Komponenten in der folgende Weise.
-
Die 18 zeigt
einen illustrativen Verarbeitungsfluss zur Gruppierung der tonalen
Komponenten abhängig
von Quantisierungsschritten durch die tonale Komponenten codierende
Schaltung 603. In dieser Figur wird eine Gruppierung bezüglich der
vorher extrahierten und durch die Verarbeitung nach 11 registrierten
tonalen Komponenten gemacht. Beim vorliegenden Beispiel werden,
wenn das Verhältnis
des Energiewertes von um das zentrale spektrale Signal der tonalen
Komponente zentrierten fünf spektralen
Signalen zum Energiewert in einem voreingestellten Band den Wert
P überschreitet,
die tonalen Komponenten als die mit der Information bezüglich der
Quantisierungsschritte QP = 6 quantisierten tonalen Komponenten
seiend gruppiert. Andernfalls werden die tonalen Komponenten als
die mit der Information bezüglich
der Quantisierungsschritte QP = 4 quantisierten tonalen Komponenten
seiend gruppiert.
-
Nach 18 wird
beim Schritt S21 die registrierte Zahl der tonalen Komponenten für eine Variable
M substituiert. Beim Schritt S22 wird die Zahl I der tonalen Komponenten
auf 1 gesetzt. Beim nächsten Schritt
S23 wird der Energiewert des voreingestellten Bandes für die Variable
Y substituiert. Beim Schritt S24 wird der Energiewert der benachbarten
fünf spektralen
Signale für
die Variable X substituiert.
-
Beim
Schritt S25 wird entschieden, ob das Verhältnis der Variablen X für den Energiewert
der fünf
benachbarten spektralen Signale zur Variablen Y der Energie des
voreingestellten Bandes größer als der
Wert P ist (X/Y > P)
oder nicht. Wenn das Resultat JA ist, das heißt, wenn X/Y größer als
P ist, schaltet das Programm zum Schritt S26. Wenn das Resultat
NEIN ist, das heißt,
wenn X/Y kleiner als P ist, schaltet das Programm zum Schritt S27.
-
Beim
Schritt S26 werden die tonalen Komponenten als die tonalen Komponenten
mit der Quantisierungsschrittinformation QP = 6 seiend gruppiert oder
registriert. Beim Schritt S27 werden die tonalen Komponenten als
die tonalen Komponenten mit der Quantisierungsschrittinformation
QP = 4 seiend gruppiert oder registriert. Das Programm schaltet
dann zum Schritt S28.
-
Beim
Schritt S28 wird entschieden, ob die Zahl I der tonalen Komponenten
gleich der Variablen M für
die Zahl der registrierten tonalen Komponenten ist oder nicht. Wenn
das Resultat JA ist, kommt die Verarbeitung zu einem Abschluss.
Wenn das Resultat NEIN ist, schaltet das Programm zum Schritt S29, wo
die Zahl I der tonalen Komponenten inkrementiert wird (I = I + 1),
um zum Schritt S23 zur Wiederholung der vorstehenden Prozessschritte
zurückzukehren.
-
Der
Quantisierungsschritt für
jede der tonalen Komponenten wird auf diese Weise durch die tonale
Komponenten codierende Schaltung 603 bestimmt. Beispielsweise
werden TCA, TCC und
TCD mit dem mit der Information bezüglich des
Quantisierungsschritts QP = 6 korrespondierenden Quantisierungsschritt
quantisiert, um tcA, tcC und
tcD zu ergeben. Zusätzlich zur Information bezüglich der
Zahl der spektralen Signale werden die Information bezüglich der
in der vorstehend beschriebenen Weise quantisierten tonalen Komponenten,
die Information bezüglich
des Quantisierungsschritts und die Information bezüglich der
Gruppierung der Codekette erzeugenden Schaltung 605 zugeführt, die
dann eine in 15 gezeigte Codekette auf der
Basis der vorstehenden Daten ausgibt.
-
15 zeigt
ein Beispiel, bei dem die partielle Informationskette auf der Basis
der Information bezüglich
des Quantisierungsschritts gebildet wird. Beim vorliegenden Beispiel
ist angenommen, dass die Zahl der die tonalen Komponenten bildenden spektralen
Signale für
alle tonalen Komponenten die gleiche ist. Natürlich kann die Zahl der die
tonalen Komponenten bildenden spektralen Signale als ein Teil der
Information bezüglich
der jeweiligen tonalen Komponenten seiend codiert werden.
-
Beim
vorliegenden Beispiel der 15 wird zuerst
die Zahl der partiellen Informationsketten der tonalen Komponenten
nLTC (beim Beispiel der 15 gilt
nLTC = 2) übertragen, gefolgt von einer
darin spezifizierten Zahl partieller Informationsketten LTC21 und LTC22. Beim
Beispiel der 15 werden die Zahl N21, welche die Zahl der tonalen Komponenten
tc in der partiellen Informationskette LTC21,
das heißt
die Zahl der mit dem mit der Information bezüglich des Quantisierungsschritts
QP = 6 korrespondierenden Quantisierungsschritt quantisierten tonalen
Komponenten, anzeigt (hier gilt N21 = 3),
die Information bezüglich
der Quantisierungsschritte QP (hier gilt QP = 6) und die Information
bezüglich
tatsächlich
quantisierter tonaler Komponenten tcA, tcC und tcD in dieser Reihenfolge
als die partielle Codekette für
die tonalen Komponenten LTC21 übertragen.
Andererseits werden die Zahl N22, welche
die Zahl der tonalen Komponenten tc in der partiellen Informationskette
LTC22, das heißt die Zahl der mit dem mit
der Information bezüglich
des Quantisierungsschritts QP = 4 korrespondierenden Quantisierungsschritt
quantisierten tonalen Komponenten, anzeigt (hier gilt N = 1), die
Information bezüglich
der Quantisierungsschritte QP (hier gilt QP = 4) und die Information
bezüglich
tatsächlich quantisierter
tonaler Komponenten tcB in dieser Reihenfolge
als die partielle Informationskette für die tonalen Komponenten LTC22 übertragen.
-
Dies
eliminiert die Notwendigkeit einer richtigen Verteilung der Information
bezüglich
der Quantisierungsschritte auf die jeweiligen tonalen Komponenten.
Beispielsweise kann die Information bezüglich der tonalen Komponenten
tcC der 15 nur
aus der zentralen Positionsinformation CP, der Normierungskoeffizienteninformation
NP und der Information bezüglich
der jeweiligen Signalkomponenten SC gebildet sein. Infolgedessen
kann beim Beispiel der 15 die Codierungseffizienz verbessert
werden, insbesondere wenn es eine große Zahl von tonalen Komponenten
gibt.
-
Natürlich kann
die Sequenz einer Übertragung
der jeweiligen Informationsdaten von der vorstehend beschriebenen
geändert
werden. Beispielsweise können
die Information bezüglich
des Quantisierungsschritts OP = 6, die korrespondierende Zahl N21 = 3 der Informationsdaten bezüglich der
tonalen Komponenten, die Information bezüglich des Quantisierungsschritts
OP = 4 und die korrespondierende Zahl N22 =
1 der Informationsdaten bezüglich
der tonalen Komponenten zuerst als eine Gesamtheit übertragen
werden, und die Information bezüglich der
tonalen Komponenten, welche die Inhalte der tonalen Komponenten
tcn anzeigen, kann danach übertragen
werden.
-
19 zeigt
in einem Flussdiagramm den Verarbeitungsfluss bei der Decodierung
der mit der in 15 gezeigten Codekette korrespondierenden Kette
der Information der tonalen Komponenten. Beim Flussdiagramm der 19 werden
die Zahlen der in den jeweiligen Gruppen enthaltenen tonalen Komponenten
und die entsprechend der Information codierten tonalen Komponenten
nacheinander decodiert.
-
Nach 19 wird
beim Schritt S31 die Zahl der Informationsdaten betreffend die tonalen
Komponenten mit der Information bezüglich des Quantisierungsschritts
QP = 6 für
eine Variable M1 substituiert. Beim nächsten Schritt S32 werden die
in der Gruppe enthaltenen tonalen Komponenten zur Bildung von M1
Informationsdaten bezüglich
der tonalen Komponenten decodiert.
-
Beim
Schritt S33 wird die Zahl von Informationsdaten bezüglich der
tonalen Komponenten mit der Information bezüglich des Quantisierungsschritts QP
= 4 für
eine Variable M2 substituiert. Beim nächsten Schritt S34 werden die
in dieser Gruppe enthaltenen tonalen Komponenten zur Bildung von
M2-Informationsdaten bezüglich
der tonalen Komponenten decodiert.
-
Die 16 zeigt
ein anderes Beispiel einer durch Codierung entsprechend dem Verfahren
der vorliegenden Erfindung erzeugten Codekette. Beim vorliegenden
Beispiel wird die Information bezüglich der tonalen Komponenten
auf der Basis der Information bezüglich der Zahl der spektralen
Signale der tonalen Komponenten und der Information bezüglich der
Quantisierungsschritte gruppiert. In einem solchen Fall wird die
Codierungseffizienz erhöht,
da weder die Information bezüglich
der Zahl der die tonalen Komponenten bildenden spektralen Signale
noch die Information bezüglich
des Quantisierungsschritts die Information bezüglich der tonalen Komponenten
ist und es nur ausreicht, die tonalen Komponenten von einer partiellen
Informationskette bezüglich
der tonalen Komponenten zu einer anderen zu codieren. Bei dem in 13 gezeigten
Verfahren muss die partielle Informationskette der tonalen Komponenten
für alle Kombinationen
der Zahlen der spektralen Komponenten und die Information bezüglich des
Quantisierungsschritts codiert werden. Da es bei dem Verfahren der
vorliegenden Erfindung ausreicht, die partiellen Informationsketten
bezüglich
der tonalen Komponenten, die nicht nutzlose Ketten sind, zu codieren, kann
die Codierungseffizienz signifikant verbessert werden.
-
Wenn
bei dem vorstehenden Beispiel die Zahl der partiellen Informationsketten
bezüglich
der tonalen Komponenten codiert wird, so ist es auch möglich, die
Kennzeicheninformation, die anzeigt, ob die partielle Informationskette
bezüglich
der jeweiligen tonalen Komponenten zu codieren ist oder nicht, zu
benutzen. Eine solche Ausbildung kann im Rahmen der vorliegenden
Erfindung enthalten sein. Wie bei den vorstehend beschriebenen Ausführungsformen
gezeigt ist es jedoch effizienter, die Zahl der codierten partiellen
Informationsketten zu codieren.
-
Bei
der vorstehenden Beschreibung wird die zentrale Positionsinformation
CP als die Positionsinformation für die tonalen Komponenten übertragen. Es
ist jedoch möglich,
die niedrigste spektrale Signalposition für jede tonale Komponente wie
beispielsweise 30 für
die tonale Komponente TCC anstelle der zentralen
Positionsinformation zu übertragen.
-
Wenn
es zur Erhöhung
der Codierungseffizienz vorteilhaft ist, spektrale Komponenten,
die in der Nähe
spezifizierter Frequenzen konzentrierte spektrale Energien aufweisen,
als die tonalen Komponenten seiend zu separieren und codieren, muss
die Signalseparation nicht notwendig auf der spektralen Energie
basiert sein, sondern es können
gemäß der vorliegenden
Erfindung die mit der Positionsinformation bezüglich der Frequenzachse codierten
spektralen Komponenten eines spezifizierten Bereichs in den tonalen
Komponenten enthalten sein.
-
Wenn
außerdem
bei der vorstehenden Erläuterung
das Aufzeichnungsmedium die Platte 609 ist, so kann die
Platte auch eine optische Platte, eine magnetooptische Platte oder
eine Phasenübergangsplatte
sein. Das Aufzeichnungsmedium kann auch ein bandförmiges Aufzeichnungsmedium,
das in einer Audiokassette oder einer Videokassette verwendet ist,
ein plattenförmiges
Aufzeichnungsmedium wie beispielsweise eine Festplatte oder eine
Diskette oder ein Halbleiteraufzeichnungsmedium wie beispielsweise
eine IC-Speicherkarte
sein.
-
Die
vorstehende Beschreibung ist hauptsächlich in Verbindung mit akustischen
Signalen gegeben. Jedoch kann die vorliegende Erfindung auch generell
zur Codierung von Wellenformsignalen verwendet werden. Die vorliegende
Erfindung kann jedoch am effizientesten bei akustischen Signalen
angewendet werden, da die Information bezüglich der tonalen Komponenten
eine signifikante Bedeutung in Verbindung mit dem menschlichen Gehörsystem
hat.
-
Wenn
die jeweiligen tonalen Komponenten zur Codierung der tonalen Komponenten
normiert und nachfolgend quantisiert werden, so kann die vorliegende
Erfindung auch bei den ohne Normierung quantisierten tonalen Komponenten
angewendet werden. Jedoch kann die Codierungseffizienz wie bei den
vorstehend beschriebenen Ausführungsformen durch
zuerst Normieren und dann Quantisieren der tonalen Komponenten verbessert
werden.
-
Das
Codierungsverfahren für
die rauschenden Komponenten der vorliegenden Erfindung ist nicht
auf eine Requantisierung, gefolgt von einer Codierung beschränkt, sondern
kann auch bei Normierung, gefolgt von Codierung angewendet werden.
-
Die
vorliegende Erfindung stellt ein illustratives Verfahren zur effizienten
Realisierung des in unserer mitanhängigen PCT/JP 94/00880 und
US-Patentanmeldung SN 08/308659 beschriebenen Verfahrens bereit
und kann in Verbindung mit den in diesen mitanhängigen Anmeldungen vorgeschlagenen verschiedenen
Verfahren angewendet werden.
-
Mit
dem Informationscodierungsverfahren und -gerät gemäß der vorliegenden Erfindung
kann eine hocheffiziente Codierung durch Klassifizieren des ersten
Signals als die tonalen Komponenten in partielle Informationsketten
entsprechend der gemeinsamen Information, nicht Codieren von nutzlosen
der partiellen Informationsketten und gemeinschaftliches Codieren
der die codierten partiellen Informationsketten anzeigenden Information,
das heißt durch
Separieren der tonalen Komponenten in Gruppen, nicht Codieren der
die tonalen Komponenten nicht enthaltenden Gruppen und Codieren
der Zahl der codierten Gruppen erzielt werden.
-
Mit
dem Informationsübertragungsverfahren und
dem Informationsaufzeichnungsmedium gemäß der vorliegenden Erfindung
kann durch Übertragen der
durch das Informationscodierungsverfahren und -gerät gemäß der vorliegenden
Erfindung codierten Information eine effiziente Übertragung erzielt werden.
-
Mit
dem Decodierungsverfahren und -gerät gemäß der vorliegenden Erfindung
wird die Information, welche die codierten partiellen Informationsketten
mit Ausnahme der nicht codierten nutzlosen partiellen Informationsketten
anzeigt, decodiert, und auf der Basis der decodierten Resultate
wird eine Decodierung der partiellen Informationsketten, die im
ersten Signal der entsprechend der gemeinsamen Information klassifizierten
tonalen Komponenten enthalten sind, durchgeführt.
-
Mit
dem Verfahren der vorliegenden Erfindung können tonale Signale effizient
codiert werden, so dass eine hocheffiziente Codierung als Ganzes
erzielt werden kann. Der vorteilhafte Effekt der vorliegenden Erfindung
kann am signifikantesten manifestiert werden, wenn die Codierung
beim Zusammentreffen mit verschiedenen Kompressionsverhältnissen
und Tonqualitätniveaus
entsprechend dem gleichen Standard zu erzielen ist.