DE69533500T2

DE69533500T2 - Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten

Info

Publication number: DE69533500T2
Application number: DE69533500T
Authority: DE
Inventors: Kyoya Tsutsui; Osamu Shimoyoshi; Mito Sonohara
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1994-04-01
Filing date: 1995-03-31
Publication date: 2005-09-08
Anticipated expiration: 2015-04-01
Also published as: KR100352352B1; US5680130A; TW301829B; EP0713295A4; EP0713295A1; EP0713295B1; JP3203657B2; ES2224121T3; CA2163371A1; DE69533500D1; ATE276607T1; CA2163371C; CN1126004A; BR9505863A; MY130167A; CN1103141C; PL311812A1; WO1995027335A1; KR960702963A

Description

TECHNISCHES GEBIET
Diese Erfindung betrifft ein Informationscodierungsverfahren und -gerät zur Codierung von Information wie beispielsweise digitale Eingabedaten durch hocheffiziente Codierung und ein Informationsdecodierungsverfahren und -gerät zur Decodierung codierter Information.
HINTERGRUNDTECHNIK
Es gibt eine Vielfalt hocheffizienter Codierungstechniken für Audio- oder Sprachsignale. Beispiele dieser Techniken umfassen eine Transformationscodierung, bei der ein Rahmen von das Audiosignal bezüglich der Zeitachse darstellenden digitalen Signalen durch eine orthogonale Transformation in einen Block von das Audiosignal bezüglich der Frequenzachse darstellenden spektralen Koeffizienten umgesetzt wird, und eine Subbandcodierung (sub-band coding (SBC)), bei der das Frequenzband des Audiosignals vor der Codierung durch eine Filterbank entlang der Zeitachse in mehrere Subbänder ohne Ausbildung des Signals in Rahmen geteilt wird. Es ist auch eine Kombination aus Subbandcodierung und Transformationscodierung bekannt, bei der Signale, die das Audiosignal bezüglich der Zeitachse darstellen, durch eine Bandteilung in Bänder geteilt werden und dann durch eine spektrale Transformation in Signale bezüglich der Frequenzachse transformiert werden und durch die spektrale Transformation erhaltene Frequenzkomponenten bei jedem Band codiert werden.
Unter den Filtern zur Teilung eines Frequenzspektrums in mehrere gleich breite Frequenzbereiche ist das in R. E. Chrochiere, Digital Coding of Speech in Sub-bands, 55 Bell Syst. Tech. J. Nr. 8 (1976) beschriebe Quadraturspiegelfilter (Quadrature Mirror Filter (QMF)). Mit dem QMF-Filter wird das Frequenzspektrum des Signals in zwei gleich breite Bänder geteilt. Mit dem QMF wird Aliasing (Signalverfälschung) nicht erzeugt, wenn die aus der Teilung resultierenden Frequenzbänder danach miteinander kombiniert werden.
In „Polyphase Quadrature Filters – A New Subband Coding Technique„, Joseph H. Rothweiler, ICASSP 83, Boston, ist eine Technik zum Teilen des Frequenzspektrums des Signals in gleich breite Frequenzbänder gezeigt. Mit dem gegenwärtigen Polyphase-QMF (Mehrphasen-OMF) kann das Frequenzspektrum der Signale zu einer Zeit in mehrere gleich breite Frequenzbänder geteilt werden.
Es ist auch eine Technik zur orthogonalen Transformation bekannt, die ein Teilen des digitalen Audioeingabesignals in Rahmen einer vorbestimmten Zeitdauer und ein Verarbeiten der resultierenden Rahmen unter Verwendung einer diskreten Fourier-Transformation (DFT), diskreten Cosinustransformation (DCT) und modifizieren DCT zur Umsetzung des Signals von der Zeitachse in die Frequenzachse aufweist. Beschreibungen bezüglich MDCT können J. P. Princen and A. B. Bradlex, Subband Transform Coding Using Filter Bank Based on Time Domain Aliasing Cancellation, ICASSP 1987 entnommen werden.
Durch Quantisieren der durch die Filter- oder Spektrumumsetzung auf der Bandbasis geteilten Signale wird es möglich, das einem Quantisierungsrauschen unterliegende Band zu steuern, und es kann eine effizientere psychoakustische Codierung durch Benutzung der sogenannten Maskierungseffekte erreicht werden. Wenn die Signalkomponenten mit dem maximalen Wert der absoluten Werte der Signalkomponenten von Band zu Band normiert werden, wird es möglich, eine effizientere Codierung zu bewirken.
Bei einer Technik zur Quantisierung der aus einer orthogonalen Transformation resultierenden spektralen Komponenten ist es bekannt, Subbänder zu benutzen, die Vorteil aus den psychoakustischen Charakteristiken des menschlichen Gehörsystems ziehen. Das heißt, ein Audiosignal bezüglich der Frequenzachse darstellende spektrale Koeffizienten können in mehrere kritische Frequenzbänder, beispielsweise 25 kritische Bänder geteilt werden. Die Breite der kritischen Bänder nimmt mit zunehmender Frequenz zu. Bei einem solchen Quantisierungssystem werden zwischen den verschiedenen kritischen Bändern Bits adaptiv zugeordnet. Wenn beispielsweise eine adaptive Bitzuordnung zu den aus einer MDCT resultierenden spektralen Koeffizientendaten angewendet wird, werden die von der MDCT in jedem der kritischen Bänder erzeugten spektralen Koeffizientendaten unter Benutzung einer adaptiv zugeordneten Zahl von Bits quantisiert.
Es sind derzeit die folgenden zwei Bitzuordnungstechniken bekannt. Beispielsweise wird bei IEEE Transactions of Acoustics, Speech and Signal Processing, Vol. ASSP-25, Nr. 4, August 1977 in jedem kritischen Band eine Bitzuordnung auf der Basis der Amplitude des Signals ausgeführt. Diese Technik erzeugt ein flaches Quantisierungsrauschspektrum und minimiert die Rauschenenergie, jedoch ist der vom Zuhörer wahrgenommene Rauschpegel nicht optimal, da die Technik den psychoakustischen Maskierungseffekt nicht effektiv ausnutzt.
Bei der in M. A. Krassner, The Critical Band Encoder – Digital Encoding of the Perceptual Requirements of the Acoustic System, ICASSP 1980 beschriebenen Zuordnungstechnik wird der psychoakustische Maskierungsmechanismus benutzt, um eine feste Bitzuordnung zu bestimmen, die das notwendige Signal-zu-Rauschen-Verhältnis für jedes kritische Band erzeugt. Wenn jedoch das Signal-zu-Rauschen-Verhältnis eines solchen Systems unter Verwendung einer Sinuswelle gemessen wird, werden wegen der festen Zuordnung von Bits zwischen den kritischen Bändern nicht optimale Resultate erhalten.
Zur Überwindung dieser Unvorteilhaftigkeit ist ein hocheffizientes Codierungsgerät vorgeschlagen worden, bei dem die Gesamtzahl der zur Bitzuordnung verfügbaren Bits zwischen einem für jeden kleinen Block voreingestellten festen Bitzuordnungsmuster und einer von Signalgrößen abhängigen blockbasierten Bitzuordnung geteilt wird, und das Teilungsverhältnis in Abhängigkeit von einem für das Eingabesignal relevanten Signal eingestellt wird, derart, dass, je glatter das Spektralspektrum, desto höher das Teilungsverhältnis für das feste Bitzuordnungsmuster wird.
Bei diesem Gerät wird, wenn die Energie so, wie im Fall einer Sinuswelleneingabe, in einer besonderen spektralen Komponente konzentriert ist, dem die spektrale Komponente enthaltenden Block zur signifikanten Verbesserung der Signal-zu-Rauschen-Verhältnischarakteristiken als Ganzes eine größere Zahl von Bits zugeordnet. Da das menschliche Gehörsystem bei einem Signal, das scharfe bzw. spitze spektrale Komponenten aufweist, hoch sensitiv ist, kann eine solche Technik zur Verbesserung des Signal-zu-Rauschen-Verhältnisses zur Verbesserung nicht nur gemessener Werte, sondern auch der Qualität des vom Ohr wahrgenommenen Tons verwendet werden.
Außerdem ist zu den vorstehenden Techniken eine Vielfalt anderer Techniken vorgeschlagen worden, und das Modell, welches das menschliche Gehörsystem simuliert, ist derart verfeinert bzw. vervollkommnet worden, dass, wenn die Codierungseinrichtung in ihrer Fähigkeit, insbesondere Leistungsfähigkeit oder Empfindlichkeit, verbessert wird, die Codierung im Licht des menschlichen Gehörsystems mit höherer Effizienz gemacht werden kann.
1 zeigt eine Grundlegende Beschaffenheit einer konventionellen Codierungsvorrichtung zur Codierung akustischer Signale als Wellenformsignale bezüglich der Zeitachse.
Nach 1 wird die einem Anschluss 100 zugeführte akustische Signalwellenform durch eine Umsetzungsschaltung 101 in Frequenzkomponenten akustischer Signale umgesetzt, die dann von einer Signalkomponenten-Codierungsschaltung 102 codiert werden. Die Codes werden von einer Codekette-Erzeugungsschaltung 103 als eine Codekette angeordnet, die an einem Anschluss 104 ausgegeben wird.
2 zeigt eine illustrative Beschaffenheit einer in 1 gezeigten Umsetzungsschaltung 101.
Bezugnehmend auf die 2 wird das einem mit dem in 1 gezeigten Anschluss 100 korrespondierenden Anschluss 200 zugeführtes akustischen Signal von einer Frequenzspektrum-Teilungsschaltung 201, die das vorstehend erwähnte Mehrphasen-Quadraturfilter (Polyphase Quadrature Filter) sein kann, in vier Bänder geteilt. Die akustischen Signale der durch das Frequenzspektrum-Teilungsfilter 201 erhaltenen Bänder werden durch orthogonale Vorwärts-Umsetzungsschaltungen 211 bis 214 zum Bewirken einer orthogonalen Transformation durch beispielsweise MDCT-Schaltungen in spektrale Komponenten umgesetzt. Das heißt, die in die Spektrum-Vorwärtsumsetzungs-Schaltungen 211 bis 214 eingegebenen akustischen Signale sind jeweils von einer Bandbreite, die gleich ein Viertel der Bandbreite des dem Anschluss 200 zugeführten Signals ist, so dass die über den Anschluss 200 zugeführten akustischen Signale mit einer Rate von 1 zu 4 subabgetastet werden. Ausgangssignale der Spektrum-Vorwärts-Umsetzungsschaltungen 211 bis 214 werden über Anschlüsse 221 bis 224 der in 1 gezeigten Signalkomponenten-Codierungsschaltung 102 zugeführt.
Natürlich kann die in 1 gezeigte Umsetzungsschaltung 101 in gewünschter Weise modifiziert werden. Beispielsweise kann das akustische Eingabesignal von einer MDCT direkt in spektrale Komponenten umgesetzt werden, wobei die MDCT durch eine DFT oder DCT ersetzt werden kann.
3 zeigt eine illustrative Beschaffenheit der in 1 gezeigten Signalkomponenten-Codierungsschaltung 102.
Nach 3 wird von einer Normierungsschaltung 301 ein einem Anschluss 300 zugeführtes Ausgangssignal der Signalkomponenten-Codierungsschaltung 102 bezüglich der Bandbasis normiert, bevor es zu einer Quantisierungsschaltung 303 übertragen wird. Das Eingabesignal am Anschluss 300 wird auch einer Quantisierungsschritt-Entscheidungsschaltung 302 zugeführt. Die Quantisierungsschaltung 303 quantisiert die normierten spektralen Komponenten der Normierungsschaltung 301 auf der Basis der Quantisierungsschritte, wie sie durch die Quantisierungsschritt-Entscheidungsschaltung 303 von den über dem Anschluss 300 zugeführten spektralen Komponenten berechnet werden. Die quantisierten spektralen Komponenten der Quantisierungsschaltung 303 werden über den Anschluss 304 der Codekette-Erzeugungsschaltung 103 der 1 zugeführt. Ein über den Anschluss 304 ausgegebenes Signal enthält zusätzlich zu den quantisierten spektralen Komponenten der Quantisierungsschaltung 303 die Normierungskoeffizienteninformation in der Normierungsschaltung 301 und die Quantisierungsschrittinformation in der Entscheidungsschaltung 302.
4 zeigt eine Grundlegende Beschaffenheit einer Signaldecodierungseinrichtung zur Decodierung des akustischen Signals der durch die in 1 gezeigte Codierungseinrichtung erzeugten Codekette und Ausgeben des decodierten akustischen Signals.
Nach 4 werden die Codes der jeweiligen Signalkomponenten von einer Codekette-Auflösungsschaltung 401 von der von der in 1 gezeigten Beschaffenheit erzeugten Codekette extrahiert und über einen Anschluss 400 zugeführt. Von diesen Codes werden die Signalkomponenten durch die Signalkomponenten-Decodierungsschaltung 402 wieder hergestellt. Die decodierten Signalkomponenten werden von einer inversen Transformationsschaltung 403 mit einer inversen Transformation, die eine zu der von der Transformationsschaltung 101 der 1 inverse Operation ist, verarbeitet. Dies erzeugt ein akustisches Wellenformsignal, das an einem Anschluss 404 ausgegeben wird.
5 zeigt eine illustrative Beschaffenheit einer in 4 gezeigten inversen Transformationsschaltung 403.
5 zeigt eine illustrative Beschaffenheit einer Gegenstückschaltung zu der in 2 gezeigten Transformationsschaltung. Die von der Signalkomponenten-Decodierungs schaltung 402 über Anschlüsse 501 bis 504 zugeführten Signale werden durch inverse Spektrum-Umsetzungsschaltungen 511 bis 514, die eine das Umgekehrte der in 2 gezeigten Vorwärts-Spektrumtransformation seiende inverse Spektrumtransformation ausführt, verarbeitet. Die Signale der von den inversen orthogonalen Transformationsschaltungen 511 bis 514 erzeugten jeweiligen Bänder werden von einem Bandkombinierungsfilter 515, das eine das Umgekehrte der von dem in 2 gezeigten Frequenzspektrum-Teilungsfilter 201 ausgeführten Frequenzspektrumteilung seiende Operation ausführt, kombiniert. Ein Ausgangssignal des Bandsynthetisierungsfilters 515 wird an einem mit dem in 4 gezeigten Anschluss 404 korrespondierenden Anschluss 521 ausgegeben.
6 illustriert ein Beispiel eines herkömmlichen Codierungsverfahrens. Bei dem in 6 gezeigten Beispiel sind die spektralen Komponentensignale die von der in 2 gezeigten Transformationsschaltung erzeugten. In 6 korrespondieren nach Umsetzung durch MDCT gezeigte Pegel absoluter Werte der spektralen Signale mit dB Werten.
In 6 werden die Eingabesignale von einem voreingestellten Zeitblock zu einem anderen in 64 spektrale Signale transformiert. Diese 64 spektralen Signale werden in fünf voreingestellten Bändern, die hier in 6 als Codierungseinheiten b₁ bis b₅ bezeichnet sind, gruppiert, um auf der Codierungsgruppenbasis normiert und quantisiert zu werden. Die Bandbreiten der jeweiligen Codierungseinheiten b₁ bis b₅ werden zum unteren Bereich hin schmaler und zum höheren Bereich hin breiter, um die Steuerung der Erzeugung des mit den Charakteristiken des menschlichen Gehörsystems übereinstimmenden Quantisierungsrauschens zu ermöglichen.
Wie jedoch der 6 zu entnehmen ist, wird, wenn die Normierung für jedes der voreingestellten Bänder bewirkt wird, die Signalnormierung in der tonale Komponenten enthaltenden Codierungseinheit b₃ auf der Basis eines größeren Normierungskoeffizientenwertes, wie er durch die tonalen Komponenten bestimmt ist, ausgeführt. Unter Verwendung dieses Normierungskoeffizientenwertes werden alle in der Codierungseinheit b₃ enthaltenen spektralen Komponenten normiert. Das im tonalen akustischen Signal enthaltene Rauschen ist dem Ohr obstruktiv. Wenn außerdem die tonalen Komponenten nicht mit hoher Genauigkeit quantisiert werden, wird eine beträchtliche Anschluss- bzw. Verbindungsverzerrung erzeugt, wenn die tonalen Komponenten mit den Wellenformsignalen des benachbarten Zeitblocks synthetisiert werden. Aus diesem Grund müssen die tonalen Komponenten mit einer ausreichenden Zahl von Bits quantisiert werden. Wenn jedoch der Quantisierungsschritt auf der Basis von voreingestellten Frequenzbändern bestimmt wird, ist es notwendig, einer großen Zahl der spektralen Komponenten in der die tonalen Komponenten enthaltenden Codierungseinheit eine große Zahl von Bits zuzuordnen, wodurch die Codierungseffizienz erniedrigt wird.
Mit dem vorstehend beschriebenen herkömmlichen Verfahren werden die Frequenzbänder zur Quantisierung der Frequenzkomponenten mit dem gleichen Quantisierungsschritt fixiert. Aus diesem Grund ist es, wenn die spektralen Komponenten in der Nähe mehrerer spezifizierter Frequenzen konzentriert sind, und wenn diese spektralen Komponenten mit ausreichend feinen Quantisierungsschritten zu quantisieren sind, notwendig, einer großen Zahl spektraler Komponenten, die zum gleichen Band wie das der spektralen Komponenten gehören, eine große Zahl von Bits zuzuordnen.
Generell ist das im tonalen akustischen Signal, bei dem die spektrale Energie bei spezifizierten Frequenzen konzentriert ist, enthaltene Rauschen dem Ohr offensiver als das in einem akustischen Signal, bei dem die Energie glatt bzw. gleichmäßig über einen breiten Frequenzbereich verteilt ist, enthaltene Rauschen. Ein solches Rauschen ist dem Ohr extrem unangenehm. Wenn andererseits die spektralen Komponenten, die größere Energien aufweisen als tonale Komponenten, nicht mit ausreichend feinen Quantisierungsschritten quantisiert werden, wird eine Block-zu-Block-Verzerrung größer, wenn die spektralen Komponenten zu den Wellenformsignalen bezüglich der Zeitachse wiederhergestellt werden, und die resultierenden Wellenformsignale werden mit zeitlich benachbarten Blöcken synthetisiert. In anderen Worten wird eine größere Verbindungsverzerrung erzeugt, wenn die resultierenden Wellenformsignale mit den Wellenformsignalen der zeitlich benachbarten Blöcke synthetisiert werden, und dadurch wird dem menschlichen Gehörsystem wieder ein Hindernis präsentiert. Infolgedessen ist es bei dem herkömmlichen Verfahren schwierig, die Codierungseffizienz für das tonale akustische Signal ohne Verschlechterung der Signalqualität anzuheben.
Um einer solchen Unvorteilhaftigkeit zu begegnen, hat die Rechtsinhaberin der vorliegenden Anmeldung unter der internationalen Anmeldenummer PCT/JP94/00880 (internationale Veröffentlichungsnummer WO94/28633, internationales Veröffentlichungsdatum 8. Dezember 1994) ein Verfahren zur Realisierung einer hohen Codierungseffizienz durch Separieren des Eingabesignals in tonale Komponenten, bei denen die Signalenergie bei einer spezifizierten Frequenz konzentriert ist, und nicht tonale Komponenten, bei denen die Signalenergie über einem breiten Frequenzbereich glatt bzw. gleichmäßig verteilt ist, vorgeschlagen.
Bei dem bisher vorgeschlagenen Verfahren kann die Codierung effizienter als bei dem vorstehend erwähnten Verfahren zur Quantisierung der Frequenzkomponenten auf der Basis fester Bänder durch Quantisierung der tonalen Komponenten mit feinen Quantisierungsschritten innerhalb eines extrem schmalen Bereichs bezüglich der Frequenzachse und durch Aufzeichnung der resultierenden Daten zusammen mit der Position bezüglich der Frequenzachse auf dem Aufzeichnungsmedium erzielt werden. Als ein illustratives Beispiel der hocheffizienten Codierung wurde ein Verfahren zur Normierung und Quantisierung einer voreingestellten Zahl spektraler Signale, die um eine maximale spektrale Energiekomponente jeder der tonalen Komponenten zentriert sind, und Codierung der resultierenden spektralen Signale, vorgeschlagen.
Das wie in PCT/JP94/00880 vorgeschlagene Verfahren besteht jedoch in der richtigen Verteilung der Information betreffend die Quantisierungsschritte zur Quantisierung der tonalen Komponenten auf jede tonale Komponente oder Quantisierung aller tonalen Komponenten mit den gleichen Quantisierungsschritten. Wenn das erstere Verfahren angewendet wird, ist es notwendig, zur Codierung der Information bezüglich der gleichen Quantisierungsschritte eine größere Zahl von Bits zu benutzen, was bei der Realisierung einer hocheffizienten Codierung nicht wünschenswert ist. Wenn andererseits das letztere Verfahren benutzt wird, können die Quantisierungsschritte nicht auf optimale Werte für die jeweiligen tonalen Komponenten eingestellt werden.
WO 89 10661 A lehrt, dass der Energieinhalt von Stimmendaten über dem hörbaren Frequenzband nicht zufällig auftritt, und, wenn das Eingabesignal in Frequenzkomponenten transformiert wird und die Frequenzkomponenten in eine Anzahl von Bändern gruppiert werden, die richtige spektrale Information nur in wenigen häufig ausgewählten Filterbändern liegt. Insbesondere offenbart dieses Dokument ein Verfahren zur Übertragung eines Informationssignals über einen Kommunikationskanal, in welchem durch einen Subbandcodierer erzeugte digital verarbeitete Abtastwerte bzw. Samples auf dem Kommunikationskanal moduliert werden, um Kanalsymbole zu erzeugen, die eine zu einer Charakteristik eines jeweiligen digital verarbeiteten Sample proportionale Modulationsgröße aufweisen.
Aus EP-A-0 525 809 geht ein Codierungsgerät hervor, bei dem spektrale Komponenten eines digitalen Eingabesignals in kritische Bänder gruppiert werden und die Gesamtzahl von zur Quantisierung der spektralen Komponenten verfügbaren Bits den kritischen Bändern zugeordnet wird, wobei fixierte Bits den kritischen Bändern entsprechend einem aus einer Anzahl vor bestimmter Bitzuordnungsmuster ausgewählten Muster zugeordnet werden, und variable Bits den kritischen Bändern entsprechend der Energie in den kritischen Bändern zugeordnet werden.
Es ist eine Aufgabe der vorliegenden Erfindung, ein Informationscodierungsverfahren und -gerät und ein Informationsdecodierungsverfahren und -gerät bereitzustellen, wodurch die tonalen akustischen Signale vor allem effizient codiert werden können, und die Quantisierungsschritte für die jeweiligen tonalen Komponenten optimal eingestellt werden können.
Diese Aufgabe wird durch ein Codierungsverfahren, ein Codierungsgerät, ein Decodierungsverfahren und ein Decodierungsgerät gemäß den beigefügten unabhängigen Ansprüchen gelöst. Vorteilhafte Merkmale und Eigenschaften der vorliegenden Erfindung sind in den korrespondierenden Unteransprüchen definiert.
Mit der vorliegenden Erfindung kann eine hocheffiziente Codierung durch Klassifizieren eines ersten Signals als die tonalen Komponenten in partielle Informationsketten entsprechend einer gemeinsamen Information, nicht Codieren von nutzlosen der partiellen Informationsketten, und durch gemeinschaftliches Codieren der die codierten partiellen Informationsketten anzeigenden Information, das heißt durch Separieren der tonalen Komponenten in Gruppen, nicht Codieren der die tonalen Komponenten nicht enthaltenden Gruppen, und Codieren der Zahl der codierten Gruppen erreicht werden.
Außerdem kann durch Übertragen der durch das Informationscodierungsverfahren und -gerät gemäß der vorliegenden Erfindung eine effiziente Übertragung erreicht werden.
Mit den Codierungsverfahren und -gerät gemäß der vorliegenden Erfindung wird die Information, welche die codierten partiellen Informationsketten mit Ausnahme der nicht codierten nutzlosen partiellen Informationsketten anzeigt, decodiert und wird auf der Basis der decodierten Resultate eine Decodierung der partiellen Informationsketten, die aus dem ersten Signal der entsprechend der gemeinsamen Information klassifizierten tonalen Komponenten bestehen, durchgeführt.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
1 ist ein Blockschaltbild, das eine grundlegende Ausbildung eines herkömmlichen Codierungsgeräts zeigt.
2 ist ein Blockdiagramm, das eine illustrative Anordnung einer Transformationsschaltung eines herkömmlichen Codierungsgeräts zeigt.
3 ist ein Blockdiagramm, das eine illustrative Anordnung einer herkömmlichen Signalkomponenten-Codierungsschaltung zeigt.
4 ist ein Blockdiagramm, das eine grundlegende Ausbildung einer herkömmlichen Decodierungsschaltung zeigt.
5 ist ein Blockdiagramm, das eine illustrative Ausbildung einer inversen Transformationsschaltung einer herkömmlichen Decodierungsschaltung zeigt.
6 stellt ein Codierungsverfahren gemäß einer herkömmlichen Technik durch Vergleich mit der vorliegenden Erfindung dar.
7 ist ein Blockdiagramm, das eine Ausbildung eines die vorliegende Erfindung verkörpernden Informationscodierungsgeräts zeigt.
8 ist ein Blockdiagramm, das eine Ausbildung eines die Erfindung verkörpernden Informationsdecodierungsgeräts zeigt.
9 stellt in tonalen Komponenten enthaltene spektrale Signale dar.
10 stellt tonale Komponenten ausschließende spektrale Signale dar.
11 ist ein Flussdiagramm zur Darstellung eines Verarbeitungsflusses zur Separation tonaler Komponenten.
12 ist ein Flussdiagramm zur Darstellung des Verarbeitungsflusses zur Bestimmung der Zahl spektraler Signale, welche die registrierten tonalen Komponenten bilden.
13 stellt eine exemplarische Codekette dar.
14 stellt eine durch das Codierungsverfahren der vorliegenden Erfindung erzeugte Codekette dar.
15 stellt eine andere exemplarische Codekette dar.
16 stellt eine noch andere exemplarische Codekette dar.
17 ist ein Blockschaltbild, das ein anderes Beispiel einer Wiederherstellungseinheit gemäß der vorliegenden Erfindung zeigt.
18 ist ein Flussdiagramm, das den Verarbeitungsfluss während einer Gruppierung der tonalen Komponenten zeigt.
19 ist ein Flussdiagramm, das den Verarbeitungsfluss des Informationsdecodierungsverfahrens gemäß der vorliegenden Erfindung zeigt.
BESTE ART UND WEISE DER AUSFÜHRUNG DER ERFINDUNG
Bezugnehmend auf die Zeichnungen werden bevorzugte illustrative Ausführungsformen der vorliegenden Erfindung detailliert erläutert.
7 zeigt eine Ausbildung eines die vorliegende Erfindung verkörpernden Informationscodierungsgeräts.
Nach 7 wird einem Anschluss 600 ein akustisches Wellenformsignal zugeführt. Das akustische Wellenformsignal wird von einer Transformationsschaltung 601 in Signalfrequenzkomponenten transformiert, die dann zu einer Signalkomponenten separierenden Schaltung 602 geleitet werden. In der Signalkomponenten separierenden Schaltung 602 werden die von der Transformationsschaltung 601 erzeugten Signalfrequenzkomponenten, die eine steile spektrale Verteilung aufweisen, und verbleibende Signalfrequenzkomponenten, das heißt rauschige bzw. rauschende Komponenten, die eine flache spektrale Verteilung aufweisen, separiert. Von den resultierenden Frequenzkomponenten werden die eine steile spektrale Verteilung bereitstellenden tonalen Komponenten von einer tonale Komponenten codierenden Schaltung 603 codiert, während die ver bleibenden Signalfrequenzkomponenten, das heißt die rauschenden Komponenten, von einer rauschende Komponenten codierenden Schaltung 604 codiert werden. Ein Ausgangssignal der die tonalen Komponenten codierenden Schaltung 603 und der die rauschenden Komponenten codierenden Schaltung 604 werden von einer Codekette erzeugenden Schaltung 605 in eine Codekette geformt, die zu einem ECC-Codierer 606 ausgegeben wird.
Der ECC-Codierer 606 fügt an die von der Codekette erzeugenden Schaltung 605 ausgegebene Codekette Fehlerkorrekturcodes an. Ein Ausgangssignal des ECC-Codierers 606 wird von einer EFM-Schaltung 607 moduliert, bevor es zu einem Aufzeichnungskopf 608 übertragen wird. Der Aufzeichnungskopf 608 zeichnet die ausgegebene Codekette der EFM-Schaltung 607 auf einer Platte 609 auf. Die Signalkomponenten separierende Schaltung 602 gibt die Zahl der tonalen Komponenteninformationsdaten, Positionsinformation und die Information bezüglich der Zahl der spektralen Komponenten an die Codekette erzeugende Schaltung 605 aus.
Für die Transformationsschaltung 601 kann eine Anordnung ähnlich zu der in 2 gezeigten verwendet werden.
Natürlich kann für die Transformationsschaltung 601 eine Ausbildung bzw. Beschaffenheit anders als die in 2 gezeigte verwendet werden. Beispielsweise kann das Eingabesignal von einer MDCT direkt in spektrale Signale transformiert werden, oder es kann anstelle der MDCT eine Transformation in spektrale Signale durch DFT oder DCT verwendet werden. Die tonale Komponenten codierende Schaltung 603 und die rauschende Komponenten codierende Schaltung 604 können grundsätzlich durch die gleiche Anordnung wie die in 3 gezeigte realisiert werden.
8 zeigt eine Beschaffenheit einer Decodierungsschaltung zur Decodierung der von der in 7 gezeigten Codierungsschaltung erhaltenen Codekette.
Nach 8 wird die von der Platte 609 durch den Wiedergabekopf 708 wiedergegebene Codekette zu einer EFM-Schaltung 709 geleitet, welche die eingegebene Codekette demoduliert. Die demodulierte Codekette wird zu einem ECC-Decodierer 710 zur Fehlerkorrektur geleitet. Auf der Basis der Zahl der Informationsdaten bezüglich der in der fehlerkorrigierten Codekette enthaltenen tonalen Komponenten erkennt eine Codekette-Auflösungsschaltung 701, welcher Teil der Codekette der tonale Komponentencode ist, und separiert die eingegebene Codekette in die tonalen Komponentencodes und die rauschenden Komponentencodes. Andererseits separiert die Codekette separierende Schaltung 701 die tonale Komponentenpositionsinformation und die spektrale Komponentenzahlinformation von der eingegebenen Codekette und gibt die separierte Information an eine stromabseitige Syntheseschaltung 704 aus. Der tonale Komponentencode und der rauschende Komponentencode werden jeweils zu einer tonale Komponenten decodierenden Schaltung 702 und einer rauschende Komponenten decodierenden Schaltung 703 geleitet, wo sie zur Decodierung invers quantisiert und entnormiert werden. Die decodierten Signale von den Schaltungen 702 und 703 werden zu einer Syntheseschaltung 704 geleitet, die eine Synthese, welche die zur Separation durch die in 7 gezeigte Signalkomponenten separierende Schaltung 602 umgekehrte Operation ist, ausführt.
Auf der Basis der Positionsinformation und der spektralen Komponentenzahlinformation, die von der separierenden Schaltung 701 zugeführt werden, addiert die Syntheseschaltung 704 das decodierte tonale Komponentensignal bei einer voreingestellten Position des decodierten rauschenden Komponentensignals zur Synthetisierung der rauschenden und tonalen Komponenten bezüglich der Frequenzachse. Das synthetisierte decodierte Signal wird von einer inversen Transformationsschaltung 705, die eine inverse Transformation, welche die umgekehrte Operation der von der in 7 gezeigten Transformationsschaltung 601 ausgeführten Transformation ist, ausführt, transformiert, so dass das Signal aus dem Signal bezüglich der Frequenzachse in ein akustisches Wellenformsignal bezüglich der Zeitachse wiederhergestellt wird. Ein von der inversen Transformationsschaltung 705 ausgegebenes Wellenformsignal wird an einen Anschluss 707 gegeben. Die Operationen der inversen Transformation und Synthese können umgekehrt sein, in welchem Fall eine in 8 gezeigte Wiederherstellungsschaltung 711 eine wie in 17 gezeigte Beschaffenheit aufweist. Dort invers transformiert die inverse Transformationsschaltung 712 das decodierte rauschende Komponentensignal bezüglich der Frequenzachse von der Decodierungsschaltung 703 in das rauschende Komponentensignal bezüglich der Zeitachse. Die inverse Transformationsschaltung 713 ordnet das decodierte tonale Komponentensignal aus der tonale Komponenten decodierenden Schaltung 702 bei der durch die Spektralzahlinformation und die Positionsinformation der von der Codekette separierenden Schaltung 701 übertragenen tonalen Komponente spezifizierten Position bezüglich der Frequenzachse an und invers transformiert das resultierende Signal zur Erzeugung des tonalen Komponentensignals bezüglich der Zeitachse. Eine Syntheseschaltung 714 synthetisiert das rauschende Komponentensignal bezüglich der Zeitachse aus der inversen Transformationsschaltung 712 und das tonale Komponentensignal bezüglich der Zeitachse aus der inversen Transformationsschaltung 713 zur Wiederherstellung des originalen akustischen Wellenformsignals.
Der Hintergrund dafür, wie das Informationscodierungsverfahren und das Informationsdecodierungsverfahren bei der in 7 gezeigten Beschaffenheit des Codierungsgeräts und des in 8 gezeigten Decodierungsgeräts angewendet werden, wird nachstehend erläutert.
Die Art und Weise der Separation der tonalen Komponenten von den Frequenzkomponenten ist in 9 gezeigt, bei der vier tonale Komponenten TC_A, TC_B, TC_C und TC_D extrahiert worden sind. Wie beim Beispiel der 9 gezeigt sind die tonalen Komponenten auf eine kleinere Zahl spektraler Komponenten verteilt. Wenn deshalb diese Komponenten mit feineren Quantisierungsschritten quantisiert werden, wird die Zahl von Quantisierungsbits als Ganzes nicht übermäßig erhöht. Obgleich die tonalen Komponenten zur Anhebung der Codierungseffizienz normiert und danach quantisiert werden können, kann zur Vereinfachung des Geräts der Normierungs- und Quantisierungsprozess wegen der kleineren Zahl der die tonalen Komponenten bildenden spektralen Signale fortgelassen werden. Außerdem ist bei dem in 9 gezeigten Beispiel die Zahl der die tonalen Komponenten bildenden spektralen Signale zwischen 3, 5 und 7 derart variabel, dass die tonale Komponente TC_A aus drei spektralen Signalen, die tonale Komponente TC_B aus sieben spektralen Signalen und die tonalen Komponenten TC_C und TC_D jeweils aus drei spektralen Signalen, die um das spektrale Maximumwertsignal, das heißt das einen lokalen Maximumwert aufweisende spektrale Signal, zentriert sind, gebildet sind. In einem solchen Fall kann die Codierung unter der Annahme ausgeführt werden, dass die jeweiligen tonalen Komponenten aus drei, fünf oder sieben spektralen Signalen gebildet sind. Es sei darauf hingewiesen, dass bei dem dargestellten Beispiel keine aus fünf spektralen Signalen gebildete tonale Komponente vorhanden ist.
10 zeigt ein Beispiel, bei dem die tonalen Komponenten von den in 9 gezeigten originalen spektralen Signalen eliminiert sind, um nur die rauschenden Komponenten zu zeigen. Da in 10 die tonalen Komponenten von den originalen spektralen Signalen in den jeweiligen Codierungseinheiten (Bändern) b₁ bis b₅ eliminiert worden sind, weisen in jeder Codierungseinheit b₁ bis b₅ die Normierungskoeffizienten kleinere Werte auf, so dass das Quantisierungsrauschen selbst bei der Benutzung einer kleineren Zahl von Quantisierungsbits reduziert werden kann.
11 zeigt den Verarbeitungsfluss zur Separation der tonalen Komponenten durch die Signalkomponenten separierende Schaltung 602.
In 11 bezeichnet I die serielle Zahl der spektralen Signale, N bezeichnet die Gesamtzahl der spektralen Signale und P, R bezeichnen voreingestellte Koeffizienten. Was die tonalen Komponenten betrifft, so werden, wenn der absolute Wert eines spektralen Signals lokal größer als der Wert der verbleibenden spektralen Signale ist und um mehr als ein voreingestellter Wert größer als der Maximumwert der absoluten Werte der spektralen Signale im Zeitblock für die spektralen Signale ist, und wenn auch die Summe der Energie der spektralen Signale und der Energie benachbarter spektraler Signale wie beispielsweise zweier direkt benachbarter spektraler Signale um mehr als ein voreingestelltes Verhältnis auf die Gesamtenergie in einem die spektralen Signale enthaltenden voreingestellten Band bezogen wird, die spektralen Signale und beispielsweise die zwei direkt benachbarten Signale als tonale Komponenten angesehen. Das voreingestellte Band als die Basis des Vergleichs des Energieverteilungsverhältnisses kann unter Beibehaltung beispielsweise der kritischen Bandbreiten zum niedrigen und hohen Frequenzbereich hin schmaler und breiter gewählt werden, um die psychoakustischen Charakteristiken des menschlichen Gehörsystems zu berücksichtigen.
Bei der 11 wird ein maximaler absoluter Wert des spektralen Signals beim Schritt S1 für eine Variable A₀ substituiert. Beim Schritt S2 wird die serielle Zahl I des spektralen Signals auf 1 gesetzt. Beim Schritt S3 wird der absolute Wert eines spektralen Signals (nachstehend als spektraler absoluter Wert bezeichnet) in einem Zeitblock für eine Variable R substituiert.
Beim Schritt S4 wird entschieden, ob der vorstehende absolute Wert des spektralen Signals lokal größer als die Werte anderer spektraler Signale ist oder nicht, das heißt, ob er das den lokal maximalen absoluten Wert aufweisende spektrale Signal ist oder nicht. Wenn das Resultat NEIN ist, das heißt, wenn der vorstehende absolute spektrale Wert nicht die den lokal maximalen absoluten Wert aufweisende spektrale Komponente ist, geht das Programm zum Schritt S10 über. Andernfalls geht das Programm zum Schritt S5 über.
Beim Schritt S5 wird die Größe des Verhältnisses der Variablen A des spektralen Signals, das den lokal maximalen Wert in dem das den lokal maximalen absoluten Wert aufweisende spektrale Signal enthaltenden Zeitblock aufweist, zur Variablen A₀ des maximalen absoluten Werts des spektralen Signals mit der des Koeffizienten P verglichen, was eine voreingestellte Größe darstellt (A/A₀ > P). Wenn A/A₀ > P gilt, geht das Programm zum Schritt S6 über, und andernfalls, das heißt, wenn A/A₀ < P gilt, schaltet das Programm zum Schritt S10.
Beim Schritt S6 wird der Energiewert der zur spektralen Komponente mit dem lokal maximalen absoluten Wert benachbarten spektralen Komponenten wie beispielsweise die Summe der Energien beider benachbarten spektralen Komponenten für die Variable X substituiert. Beim nächsten Schritt S7 wird der totale Energiewert innerhalb eines voreingestellten Bandes, das die spektrale Komponente mit dem lokal maximalen absoluten Wert und benachbarte spektrale Komponenten enthält, für eine Variable Y substituiert.
Beim nächsten Schritt S8 wird das Verhältnis der Variablen X für den Energiewert zur Variablen Y des Energiewertes innerhalb des voreingestellten Bandes mit dem Koeffizienten R verglichen, was ein voreingestelltes Verhältnis anzeigt (X/Y > R). Wenn das Resultat JA ist, das heißt, wenn X/Y > R gilt, schaltet das Programm zum Schritt S9. Wenn das Resultat NEIN ist, das heißt, wenn X/Y < R gilt, schaltet das Programm zum Schritt S10.
Beim Schritt S9 werden, wenn das Verhältnis der Energie des spektralen Signals mit dem lokal maximalen absoluten Wert und der benachbarten spektralen Signale zur Energie in dem diese spektralen Signale enthaltenden voreingestellten Band nicht kleiner als ein vorbestimmter Wert ist, das spektrale Signal mit dem lokal maximalen absoluten Wert und die benachbarten spektralen Signale als tonale Komponenten angesehen, und ein solcher Effekt wird registriert.
Beim nächsten Schritt S10 wird entschieden, ob die Zahl I der beim Schritt S9 registrierten spektralen Signale gleich der Gesamtzahl N der spektralen Signale (I = N) ist oder nicht. Wenn das Resultat JA ist, das heißt, wenn I = N gilt, ist das Programm beendet. Wenn das Resultat NEIN ist, das heißt, wenn I nicht gleich N ist, schaltet das Programm zum Schritt S11, wo I inkrementiert wird (I = I + 1), das heißt, die Zahl der spektralen Signale wird für jeden Schritt um 1 erhöht, um zum Schritt S3 zur Wiederholung der vorstehenden Prozessschritte zurückzukehren.
12 zeigt den Prozessfluss zur Bestimmung der Zahl spektraler Bestandteilsignale der beim Beispiel der 9 als tonale Komponente registrierten tonalen Komponente.
In 12 ist die maximale Zahl der spektralen Bestandteilsignale der tonalen Komponente auf 7 gesetzt. Wenn das Verhältnis der Energie der um das spektrale Signal mit dem lokal maximalen absoluten Wert zentrierten drei oder fünf spektralen Signale zur Energie der um das spektrale Signal mit dem lokal maximalen absoluten Wert zentrierten sieben Signale ein vorbestimmtes Verhältnis überschreitet, wird die Zahl der spektralen Bestandteilsignale der tonalen Komponente auf drei bzw. fünf gesetzt. Wenn beim vorliegenden Beispiel die registrierten tonalen Komponenten vorab klassifiziert werden, so kann eine solche Klassifizierung natürlich zu der gleichen Zeit, zu der die tonalen Komponenten mit der beim Schritt S9 als die Zahl der registrierten tonalen Komponenten ermittelten Zahl des den lokal maximalen absoluten Wert aufweisenden spektralen Signals extrahiert werden, ausgeführt werden.
Bei der 12 wird die Zahl der registrierten tonalen Komponenten beim Schritt S21 auf eine Variable M gesetzt. Beim Schritt S22 wird die Zahl I der tonalen Komponente auf 1 gesetzt. Beim Schritt S23 wird der Energiewert der zur lokal maximalen spektralen Komponente benachbarten sieben spektralen Signale für die Variable Y substituiert. Beim Schritt S24 wird der Energiewert der zur lokal maximalen spektralen Komponente benachbarten drei spektralen Signale für die Variable X substituiert.
Beim Schritt S25 wird entschieden, ob das Verhältnis des Energiewertes der vorstehenden sieben benachbarten spektralen Signale zum Energiewert der drei spektralen Signale (X/Y) ein voreingestelltes Verhältnis P überschreitet (X/Y > P) oder nicht. Wenn das Resultat JA ist, das heißt, wenn das Verhältnis P überschreitet, schaltet das Programm zum Schritt S26. Wenn das Resultat NEIN ist, das heißt, wenn das Verhältnis P nicht überschreitet, schaltet das Programm zum Schritt S27.
Beim Schritt S26 wird die Zahl der spektralen Signale der tonalen Komponente auf drei gesetzt, was als drei spektrale tonale Komponenten registriert wird. Das Programm schaltet dann zum Schritt S31.
Beim Schritt S27 wird der Energiewert der um das lokal maximale spektrale Signal zentrierten fünf benachbarten spektralen Signale für die Variable X substituiert. Beim nächsten Schritt S28 wird entschieden, ob das Verhältnis des Energiewertes der sieben benachbarten spektralen Signale zum Energiewert der fünf spektralen Signale (X/Y) ein vorbestimmtes Verhältnis P überschreitet (X/Y > P) oder nicht. Wenn das Resultat JA ist, das heißt, wenn das Verhältnis P überschreitet, schaltet das Programm zum Schritt S29. Wenn das Resultat NEIN ist, das heißt, wenn das Verhältnis P nicht überschreitet, schaltet das Programm zum Schritt S30.
Beim Schritt S29 wird die Zahl der spektralen Signale der tonalen Komponente auf fünf gesetzt, was als fünf spektrale tonale Komponenten registriert wird. Das Programm schaltet dann zum Schritt S31.
Beim Schritt S30 wird die Zahl der spektralen Signale der tonalen Komponente auf sieben gesetzt, was als sieben spektrale tonale Komponenten registriert wird. Das Programm schaltet dann zum Schritt S31.
Beim Schritt S31 wird bestimmt, ob die beim Schritt S21 gesetzte Zahl der tonalen Komponenten gleich der Zahl I der tonalen Komponenten ist (I = M) oder nicht. Wenn das Resultat JA ist, das heißt, wenn I = M gilt, ist das Programm beendet. Wenn das Resultat NEIN ist, das heißt, wenn I nicht gleich M ist, schaltet das Programm zum Schritt S32.
Beim Schritt S32 wird I für jeden Schritt um 1 inkrementiert (I = I + 1) um zum Schritt S23 zur Wiederholung der vorstehenden Schritte zurückzukehren.
13 zeigt eine Anordnung beziehungsweise ein Array von Informationsdaten, wenn die wie vorstehend beschrieben in die tonalen und rauschenden Komponenten separierten Informationsdaten entsprechend dem in der US-Patentanmeldung SN 08/306 659 (Anmeldedatum 15. September 1994) beschriebenen, von der Rechtsinhaberin der vorliegenden Anmeldung vorgeschlagenen Codierungsverfahren zur Aufzeichnung oder Übertragung codiert werden. Da das Aufzeichnungsmedium als ein Übertragungspfad seiend angenommen werden kann, bedeutet hier der Ausdruck „Übertragung„, dass er eine Aufzeichnung der Information auf dem Aufzeichnungsmedium umfasst.
Bei der 13 werden die tonalen Komponenten durch Gruppen, deren jede aus der gleichen Zahl der spektralen Komponenten besteht, übertragen. Das heißt, beim vorliegenden Beispiel werden als die Information, die alle tonalen Komponenten mit der Zahl der spektralen Bestandteilsignale gleich drei anzeigt, die Zahl der tonalen Komponenten (als die Zahl der Informationsdaten für drei spektrale tonale Komponenten STC₃ = 3) und die Inhalte der tonalen Komponenten TC_A, TC_C und TC_D, das heißt die tonalen Komponenteninformationsdaten tc_A, tc_C und tc_D als die partielle tonale Komponenteninformationskette LTC₁ übertragen. Die alle tonalen Komponenten mit der Zahl der spektralen Bestandteilkomponenten gleich fünf anzeigende Information, und die alle tonalen Komponenten mit der Zahl der spektralen Bestandteilkomponenten gleich sieben anzeigende Information werden danach auf ähnliche Weise als die partiellen tonalen Komponenteninformationskette LTC₂ und die partielle tonale Komponenteninformationskette LTC₃ zusammen mit dem Inhalt der tonalen Komponente TC_B, das heißt den tonalen Komponenteninformationsdaten tc_B übertragen. Wenn die tonalen Komponenten durch Gruppen, deren jede die gleiche Zahl der spektralen Bestandteilsignale aufweist, übertragen werden, wird es nicht notwendig, die Information betreffend die Zahl spektraler Signale, welche die spektralen Bestandteilsignale bilden, zu übertragen, so dass in dem Fall, bei dem eine große Zahl tonaler Komponenten vorhanden ist, eine effiziente Codierung möglich wird.
Die Information der tonalen Komponente tc weist die zentrale Positionsinformation CP, welche das Zentrum der Spektrumposition der tonalen Komponenten anzeigt, beispielsweise CP = 31 für die tonale Komponente TC_C, die Information bezüglich der Quantisierungsschritte, welche die Zahl von Quantisierungsbits QP anzeigt (beispielsweise QP = 6), die Information bezüglich der Normierungskoeffizienten NP und die Information bezüglich jeweiliger Signalkomponenten, welche die normierten und quantisierten Werte der die tonalen Komponenten wie beispielsweise die Information SC₁, SC₂, ... SC₃ bildenden verbleibenden spektralen Signale auf.
Die Information bezüglich der rauschenden Komponenten wird in der Sequenz von nc₁, nc₂, nc₃, nc₄ und nc₅, die jeweils den Bändern b₁ bis b₅ der 10 zugeordnet sind, aufgezeichnet oder übertragen. Die Information bezüglich der rauschenden Komponente nc enthält die Information bezüglich der Quantisierungsschritte QP (QP = 3 im Fall der Information nc₁), die Information bezüglich der Normierungskoeffizienten NP und die Information bezüglich jeweils normierter und quantisierter Signalkomponenten wie beispielsweise die Information SC₁, SC₂, ... SC₃.
Jedoch ist es bei der Codekette des vorliegenden Beispiels trotz der Tatsache, dass es keine durch fünf spektrale Signale gebildete tonale Komponente gibt, notwendig, die Zahl spektraler Signale zu übertragen. Bei dem dargestellten Beispiel sind nur drei unterschiedliche Zahlen der die tonalen Komponenten bildenden spektralen Signale zugelassen. Jedoch ist es bei der Gestaltungsanweisung (design statement) zur Codierung, bei der die Informationsdaten abhängig von den variablen Kompressionsverhältnissen und dem geforderten Tonqualitätsniveau mit dem gleiche Codierungsverfahren codiert werden müssen, notwendig, eine große Zahl spektraler Signale, welche die tonalen Komponenten in der Gestaltungsanweisung bilden, zuzulassen, während es nicht effizient ist, die Zahl der Informationsdaten bezüglich der tonalen Komponenten für die nicht benutzte partielle Kette der tonalen Komponentendaten zu übertragen.
14 zeigt ein Beispiel einer Codekettebeschaffenheit in dem Fall, dass das in 9 gezeigte Signal gemäß dem Übertragungsverfahren der vorliegenden Erfindung, bei dem der vorstehend erwähnte Punkt berücksichtigt ist, codiert wird.
Bei der 14 wird, wie darin spezifiziert, zuerst die Zahl der partiellen Ketten der Information bezüglich der tonalen Komponenten n_LTC (beim Beispiel der 9 und 14 gilt n_LTC = 2) übertragen, gefolgt von der Zahl partieller Ketten der Information bezüglich der tonalen Komponenten LTC₁₁ und LTC₁₂. Beim Beispiel der 14 werden die Zahl N₁₁, welche die Zahl der Informationsdaten tc für die tonalen Komponenten in der partiellen Kette LTC₁₁ anzeigt (beim vorliegenden Beispiel gilt N₁₁ = 3), die Zahl der die spektralen Komponenten n_sp bildenden spektralen Signale, welche die Zahl der die tonalen Komponenten bildenden spektralen Signale anzeigt (beim vorliegenden Beispiel gilt n_sp = 3) und die tatsächliche Information bezüglich der tonalen Komponenten tc_A, tc_C und tc_D als die partielle Kette LCT₁₁ übertragen. Da die Zahl irgendwelcher der die tonalen Komponenten bildenden spektralen Signale beim vorliegenden Beispiel nicht gleich 5 ist, wird eine solche partielle Informationskette nicht codiert. Als die partielle Kette LC₁₂ werden die Zahl N₁₂, welche die Zahl der Informationsdaten tc für die tonalen Komponenten in der partiellen Kette LTC₁₂ anzeigt (beim vorliegenden Beispiel gilt N₁₂ = 3), die Zahl von die tonale Komponente n_sp bildenden spektralen Signalen, welche die Zahl der die tonale Komponente bildenden spektralen Signale anzeigt (beim vorliegenden Beispiel gilt n_sp = 7) und die aktuelle Information bezüglich der tonalen Komponenten tc_B übertragen. Da es keine Notwendigkeit für eine Übertragung der Information bezüglich der nutzlosen partiellen Informationskette der tonalen Komponente gibt, kann eine effiziente Codierung erzielt werden, insbesondere wenn unterschiedliche Arten der partiellen Informationskette aus dem im vorstehenden diskutierten Grund zulässig sein müssen.
Beim Beispiel der 4 wird die partielle Informationskette bezüglich der tonalen Komponenten durch Gruppierung auf der Basis der Zahl der die tonale Komponente bildenden spektralen Signale erzeugt. Jedoch kann das Verfahren der vorliegenden Erfindung auf einen solchen Fall angewendet werden, bei dem die partiellen Informationsketten für die tonalen Komponenten durch Gruppierung der Information bezüglich der tonalen Komponenten auf der Basis anderer Attribute als die Zahl der die tonale Komponente bildenden spektralen Signale gebildet werden.
Insbesondere kann die Gruppierung auf der Basis der Information bezüglich der Quantisierungsschritte gemacht werden. Bezugnehmend auf die 9, 15, 17 und 18 wird ein illustratives Beispiel einer Gruppierung auf der Basis der Information bezüglich der Quantisierungsschritte erläutert.
Es sei angenommen, dass die Signalkomponenten separierende Schaltung 602, wie in 9 gezeigt, tonale Komponenten von Frequenzkomponenten separiert. Beim vorliegenden Beispiel sind, wie früher erläutert, vier tonale Komponenten TC_A, TC_B, TC_C und TC_D extrahiert worden. Wenn erlaubt ist, die spektralen Komponenten bei den mit der Information bezüglich des Quantisierungsschritts QP = 6 korrespondierenden Quantisierungsschritten oder bei den mit der Information bezüglich des Quantisierungsschritts QP = 4 korrespondierenden Quantisierungsschritten zu quantisieren, bestimmt die Quantisierungsschritt-Entscheidungsschaltung in der tonale Komponenten codierenden Schaltung 603 den Quantisierungsschritt der jeweiligen tonalen Komponenten in der folgende Weise.
Die 18 zeigt einen illustrativen Verarbeitungsfluss zur Gruppierung der tonalen Komponenten abhängig von Quantisierungsschritten durch die tonale Komponenten codierende Schaltung 603. In dieser Figur wird eine Gruppierung bezüglich der vorher extrahierten und durch die Verarbeitung nach 11 registrierten tonalen Komponenten gemacht. Beim vorliegenden Beispiel werden, wenn das Verhältnis des Energiewertes von um das zentrale spektrale Signal der tonalen Komponente zentrierten fünf spektralen Signalen zum Energiewert in einem voreingestellten Band den Wert P überschreitet, die tonalen Komponenten als die mit der Information bezüglich der Quantisierungsschritte QP = 6 quantisierten tonalen Komponenten seiend gruppiert. Andernfalls werden die tonalen Komponenten als die mit der Information bezüglich der Quantisierungsschritte QP = 4 quantisierten tonalen Komponenten seiend gruppiert.
Nach 18 wird beim Schritt S21 die registrierte Zahl der tonalen Komponenten für eine Variable M substituiert. Beim Schritt S22 wird die Zahl I der tonalen Komponenten auf 1 gesetzt. Beim nächsten Schritt S23 wird der Energiewert des voreingestellten Bandes für die Variable Y substituiert. Beim Schritt S24 wird der Energiewert der benachbarten fünf spektralen Signale für die Variable X substituiert.
Beim Schritt S25 wird entschieden, ob das Verhältnis der Variablen X für den Energiewert der fünf benachbarten spektralen Signale zur Variablen Y der Energie des voreingestellten Bandes größer als der Wert P ist (X/Y > P) oder nicht. Wenn das Resultat JA ist, das heißt, wenn X/Y größer als P ist, schaltet das Programm zum Schritt S26. Wenn das Resultat NEIN ist, das heißt, wenn X/Y kleiner als P ist, schaltet das Programm zum Schritt S27.
Beim Schritt S26 werden die tonalen Komponenten als die tonalen Komponenten mit der Quantisierungsschrittinformation QP = 6 seiend gruppiert oder registriert. Beim Schritt S27 werden die tonalen Komponenten als die tonalen Komponenten mit der Quantisierungsschrittinformation QP = 4 seiend gruppiert oder registriert. Das Programm schaltet dann zum Schritt S28.
Beim Schritt S28 wird entschieden, ob die Zahl I der tonalen Komponenten gleich der Variablen M für die Zahl der registrierten tonalen Komponenten ist oder nicht. Wenn das Resultat JA ist, kommt die Verarbeitung zu einem Abschluss. Wenn das Resultat NEIN ist, schaltet das Programm zum Schritt S29, wo die Zahl I der tonalen Komponenten inkrementiert wird (I = I + 1), um zum Schritt S23 zur Wiederholung der vorstehenden Prozessschritte zurückzukehren.
Der Quantisierungsschritt für jede der tonalen Komponenten wird auf diese Weise durch die tonale Komponenten codierende Schaltung 603 bestimmt. Beispielsweise werden TC_A, TC_C und TC_D mit dem mit der Information bezüglich des Quantisierungsschritts QP = 6 korrespondierenden Quantisierungsschritt quantisiert, um tc_A, tc_C und tc_D zu ergeben. Zusätzlich zur Information bezüglich der Zahl der spektralen Signale werden die Information bezüglich der in der vorstehend beschriebenen Weise quantisierten tonalen Komponenten, die Information bezüglich des Quantisierungsschritts und die Information bezüglich der Gruppierung der Codekette erzeugenden Schaltung 605 zugeführt, die dann eine in 15 gezeigte Codekette auf der Basis der vorstehenden Daten ausgibt.
15 zeigt ein Beispiel, bei dem die partielle Informationskette auf der Basis der Information bezüglich des Quantisierungsschritts gebildet wird. Beim vorliegenden Beispiel ist angenommen, dass die Zahl der die tonalen Komponenten bildenden spektralen Signale für alle tonalen Komponenten die gleiche ist. Natürlich kann die Zahl der die tonalen Komponenten bildenden spektralen Signale als ein Teil der Information bezüglich der jeweiligen tonalen Komponenten seiend codiert werden.
Beim vorliegenden Beispiel der 15 wird zuerst die Zahl der partiellen Informationsketten der tonalen Komponenten n_LTC (beim Beispiel der 15 gilt n_LTC = 2) übertragen, gefolgt von einer darin spezifizierten Zahl partieller Informationsketten LTC₂₁ und LTC₂₂. Beim Beispiel der 15 werden die Zahl N₂₁, welche die Zahl der tonalen Komponenten tc in der partiellen Informationskette LTC₂₁, das heißt die Zahl der mit dem mit der Information bezüglich des Quantisierungsschritts QP = 6 korrespondierenden Quantisierungsschritt quantisierten tonalen Komponenten, anzeigt (hier gilt N₂₁ = 3), die Information bezüglich der Quantisierungsschritte QP (hier gilt QP = 6) und die Information bezüglich tatsächlich quantisierter tonaler Komponenten tc_A, tc_C und tc_D in dieser Reihenfolge als die partielle Codekette für die tonalen Komponenten LTC₂₁ übertragen. Andererseits werden die Zahl N₂₂, welche die Zahl der tonalen Komponenten tc in der partiellen Informationskette LTC₂₂, das heißt die Zahl der mit dem mit der Information bezüglich des Quantisierungsschritts QP = 4 korrespondierenden Quantisierungsschritt quantisierten tonalen Komponenten, anzeigt (hier gilt N = 1), die Information bezüglich der Quantisierungsschritte QP (hier gilt QP = 4) und die Information bezüglich tatsächlich quantisierter tonaler Komponenten tc_B in dieser Reihenfolge als die partielle Informationskette für die tonalen Komponenten LTC₂₂ übertragen.
Dies eliminiert die Notwendigkeit einer richtigen Verteilung der Information bezüglich der Quantisierungsschritte auf die jeweiligen tonalen Komponenten. Beispielsweise kann die Information bezüglich der tonalen Komponenten tc_C der 15 nur aus der zentralen Positionsinformation CP, der Normierungskoeffizienteninformation NP und der Information bezüglich der jeweiligen Signalkomponenten SC gebildet sein. Infolgedessen kann beim Beispiel der 15 die Codierungseffizienz verbessert werden, insbesondere wenn es eine große Zahl von tonalen Komponenten gibt.
Natürlich kann die Sequenz einer Übertragung der jeweiligen Informationsdaten von der vorstehend beschriebenen geändert werden. Beispielsweise können die Information bezüglich des Quantisierungsschritts OP = 6, die korrespondierende Zahl N₂₁ = 3 der Informationsdaten bezüglich der tonalen Komponenten, die Information bezüglich des Quantisierungsschritts OP = 4 und die korrespondierende Zahl N₂₂ = 1 der Informationsdaten bezüglich der tonalen Komponenten zuerst als eine Gesamtheit übertragen werden, und die Information bezüglich der tonalen Komponenten, welche die Inhalte der tonalen Komponenten tc_n anzeigen, kann danach übertragen werden.
19 zeigt in einem Flussdiagramm den Verarbeitungsfluss bei der Decodierung der mit der in 15 gezeigten Codekette korrespondierenden Kette der Information der tonalen Komponenten. Beim Flussdiagramm der 19 werden die Zahlen der in den jeweiligen Gruppen enthaltenen tonalen Komponenten und die entsprechend der Information codierten tonalen Komponenten nacheinander decodiert.
Nach 19 wird beim Schritt S31 die Zahl der Informationsdaten betreffend die tonalen Komponenten mit der Information bezüglich des Quantisierungsschritts QP = 6 für eine Variable M1 substituiert. Beim nächsten Schritt S32 werden die in der Gruppe enthaltenen tonalen Komponenten zur Bildung von M1 Informationsdaten bezüglich der tonalen Komponenten decodiert.
Beim Schritt S33 wird die Zahl von Informationsdaten bezüglich der tonalen Komponenten mit der Information bezüglich des Quantisierungsschritts QP = 4 für eine Variable M2 substituiert. Beim nächsten Schritt S34 werden die in dieser Gruppe enthaltenen tonalen Komponenten zur Bildung von M2-Informationsdaten bezüglich der tonalen Komponenten decodiert.
Die 16 zeigt ein anderes Beispiel einer durch Codierung entsprechend dem Verfahren der vorliegenden Erfindung erzeugten Codekette. Beim vorliegenden Beispiel wird die Information bezüglich der tonalen Komponenten auf der Basis der Information bezüglich der Zahl der spektralen Signale der tonalen Komponenten und der Information bezüglich der Quantisierungsschritte gruppiert. In einem solchen Fall wird die Codierungseffizienz erhöht, da weder die Information bezüglich der Zahl der die tonalen Komponenten bildenden spektralen Signale noch die Information bezüglich des Quantisierungsschritts die Information bezüglich der tonalen Komponenten ist und es nur ausreicht, die tonalen Komponenten von einer partiellen Informationskette bezüglich der tonalen Komponenten zu einer anderen zu codieren. Bei dem in 13 gezeigten Verfahren muss die partielle Informationskette der tonalen Komponenten für alle Kombinationen der Zahlen der spektralen Komponenten und die Information bezüglich des Quantisierungsschritts codiert werden. Da es bei dem Verfahren der vorliegenden Erfindung ausreicht, die partiellen Informationsketten bezüglich der tonalen Komponenten, die nicht nutzlose Ketten sind, zu codieren, kann die Codierungseffizienz signifikant verbessert werden.
Wenn bei dem vorstehenden Beispiel die Zahl der partiellen Informationsketten bezüglich der tonalen Komponenten codiert wird, so ist es auch möglich, die Kennzeicheninformation, die anzeigt, ob die partielle Informationskette bezüglich der jeweiligen tonalen Komponenten zu codieren ist oder nicht, zu benutzen. Eine solche Ausbildung kann im Rahmen der vorliegenden Erfindung enthalten sein. Wie bei den vorstehend beschriebenen Ausführungsformen gezeigt ist es jedoch effizienter, die Zahl der codierten partiellen Informationsketten zu codieren.
Bei der vorstehenden Beschreibung wird die zentrale Positionsinformation CP als die Positionsinformation für die tonalen Komponenten übertragen. Es ist jedoch möglich, die niedrigste spektrale Signalposition für jede tonale Komponente wie beispielsweise 30 für die tonale Komponente TC_C anstelle der zentralen Positionsinformation zu übertragen.
Wenn es zur Erhöhung der Codierungseffizienz vorteilhaft ist, spektrale Komponenten, die in der Nähe spezifizierter Frequenzen konzentrierte spektrale Energien aufweisen, als die tonalen Komponenten seiend zu separieren und codieren, muss die Signalseparation nicht notwendig auf der spektralen Energie basiert sein, sondern es können gemäß der vorliegenden Erfindung die mit der Positionsinformation bezüglich der Frequenzachse codierten spektralen Komponenten eines spezifizierten Bereichs in den tonalen Komponenten enthalten sein.
Wenn außerdem bei der vorstehenden Erläuterung das Aufzeichnungsmedium die Platte 609 ist, so kann die Platte auch eine optische Platte, eine magnetooptische Platte oder eine Phasenübergangsplatte sein. Das Aufzeichnungsmedium kann auch ein bandförmiges Aufzeichnungsmedium, das in einer Audiokassette oder einer Videokassette verwendet ist, ein plattenförmiges Aufzeichnungsmedium wie beispielsweise eine Festplatte oder eine Diskette oder ein Halbleiteraufzeichnungsmedium wie beispielsweise eine IC-Speicherkarte sein.
Die vorstehende Beschreibung ist hauptsächlich in Verbindung mit akustischen Signalen gegeben. Jedoch kann die vorliegende Erfindung auch generell zur Codierung von Wellenformsignalen verwendet werden. Die vorliegende Erfindung kann jedoch am effizientesten bei akustischen Signalen angewendet werden, da die Information bezüglich der tonalen Komponenten eine signifikante Bedeutung in Verbindung mit dem menschlichen Gehörsystem hat.
Wenn die jeweiligen tonalen Komponenten zur Codierung der tonalen Komponenten normiert und nachfolgend quantisiert werden, so kann die vorliegende Erfindung auch bei den ohne Normierung quantisierten tonalen Komponenten angewendet werden. Jedoch kann die Codierungseffizienz wie bei den vorstehend beschriebenen Ausführungsformen durch zuerst Normieren und dann Quantisieren der tonalen Komponenten verbessert werden.
Das Codierungsverfahren für die rauschenden Komponenten der vorliegenden Erfindung ist nicht auf eine Requantisierung, gefolgt von einer Codierung beschränkt, sondern kann auch bei Normierung, gefolgt von Codierung angewendet werden.
Die vorliegende Erfindung stellt ein illustratives Verfahren zur effizienten Realisierung des in unserer mitanhängigen PCT/JP 94/00880 und US-Patentanmeldung SN 08/308659 beschriebenen Verfahrens bereit und kann in Verbindung mit den in diesen mitanhängigen Anmeldungen vorgeschlagenen verschiedenen Verfahren angewendet werden.
Mit dem Informationscodierungsverfahren und -gerät gemäß der vorliegenden Erfindung kann eine hocheffiziente Codierung durch Klassifizieren des ersten Signals als die tonalen Komponenten in partielle Informationsketten entsprechend der gemeinsamen Information, nicht Codieren von nutzlosen der partiellen Informationsketten und gemeinschaftliches Codieren der die codierten partiellen Informationsketten anzeigenden Information, das heißt durch Separieren der tonalen Komponenten in Gruppen, nicht Codieren der die tonalen Komponenten nicht enthaltenden Gruppen und Codieren der Zahl der codierten Gruppen erzielt werden.
Mit dem Informationsübertragungsverfahren und dem Informationsaufzeichnungsmedium gemäß der vorliegenden Erfindung kann durch Übertragen der durch das Informationscodierungsverfahren und -gerät gemäß der vorliegenden Erfindung codierten Information eine effiziente Übertragung erzielt werden.
Mit dem Decodierungsverfahren und -gerät gemäß der vorliegenden Erfindung wird die Information, welche die codierten partiellen Informationsketten mit Ausnahme der nicht codierten nutzlosen partiellen Informationsketten anzeigt, decodiert, und auf der Basis der decodierten Resultate wird eine Decodierung der partiellen Informationsketten, die im ersten Signal der entsprechend der gemeinsamen Information klassifizierten tonalen Komponenten enthalten sind, durchgeführt.
Mit dem Verfahren der vorliegenden Erfindung können tonale Signale effizient codiert werden, so dass eine hocheffiziente Codierung als Ganzes erzielt werden kann. Der vorteilhafte Effekt der vorliegenden Erfindung kann am signifikantesten manifestiert werden, wenn die Codierung beim Zusammentreffen mit verschiedenen Kompressionsverhältnissen und Tonqualitätniveaus entsprechend dem gleichen Standard zu erzielen ist.

Claims

Verfahren zur Erzeugung eines Eingabesignals, aufweisend die Schritte: Transformieren (601) des Eingabesignals in Frequenzkomponenten, Separieren (602) der Frequenzkomponenten in ein aus tonalen Komponenten (TC_A ... TC_D), die eine steile Energieverteilung aufweisen, zusammengesetztes erstes Signal und ein aus anderen Komponenten zusammengesetztes zweites Signal, Codieren (603) des ersten Signals mittels einer ersten Codierung, Codieren (604) des zweiten Signals mittels einer zweiten Codierung, und Erzeugen (605) einer ersten Codekette zur Übertragung oder Aufzeichnung auf der Basis von durch die erste Codierung erzeugten Signalen, wobei die erste Codekette partielle Ketten (LTC) aus tonalen Komponentendaten enthält, in denen tonale Komponentendaten (tc_A ... tc_D), welche gleiche Werte wenigstens eines von Parametern (n_sp, QP) aufweisen, zur Signalseparation (602) und ersten Codierung (603) gruppiert werden.
Verfahren nach Anspruch 1, wobei die tonalen Komponentendaten (tc_A ... tc_D) in den partiellen Ketten (LTC) entsprechend dem Parameter (n_sp), der die Zahl der spektralen Signale anzeigt, welche die von der Signalseparation (602) separierten tonalen Komponenten (TC_A ... TC_D) bilden, gruppiert werden.
Verfahren nach Anspruch 1 oder 2, wobei der erste Codierungsschritt (603) einen Quantisierungsschritt (303) zum Quantisieren des ersten Signals enthält und die tonalen Komponentendaten (tc_A ... tc_D) in den partiellen Ketten (LTC) ent sprechend dem die Information der Quantisierung (303) anzeigenden Parameter (QP) gruppiert werden.
Verfahren nach Anspruch 3, wobei der Parameter (QP) den Quantisierungsschritt anzeigt.
Verfahren nach einem der Ansprüche 1 bis 4, wobei die erste Codekette Information (STC₃, STC₅, STC₇; nLTC) enthält, welche die Beschaffenheit der partiellen Ketten (LTC) anzeigt.
Verfahren nach Anspruch 5, wobei die Information (nLTC), welche die Beschaffenheit der partiellen Ketten anzeigt, die Zahl der partiellen Ketten (LTC) anzeigt.
Verfahren nach einem der Ansprüche 1 bis 6, außerdem aufweisend die Schritte: Erzeugen (605) einer zweiten Codekette auf der Basis des zweiten Signals, und Übertragen (605) der ersten und zweiten Codekette.
Verfahren nach einem der Ansprüche 1 bis 7, wobei die anderen Komponenten Rauschspektren sind.
Verfahren nach Anspruch 8, wobei die Frequenzkomponenten in Bänder (b1 ... b5) gruppiert werden und die zweite Codekette aus den Bändern (b1 ... b5) zugeordneten rauschigen Komponenten zusammengesetzt wird.
Verfahren zur Decodierung einer aus codierten Signalen zusammengesetzten Codekette, aufweisend die Schritte: Decodieren (701) eines mit einem aus tonalen Komponenten (TC_A ... TC_D), die eine steile Energieverteilung aufweisen, gebildeten ersten Signal korrespondierenden codierten Signals zur Erzeugung erster decodierter Signale mittels einer ersten Decodierung, Decodieren (701) eines mit einem aus anderen Komponenten gebildeten zweiten Signal korrespondierenden codierten Signals zur Erzeugung zweiter decodierter Signale mittels einer zweiten Decodierung, und Synthetisieren (704) des ersten und zweiten decodierten Signals zur Wiederherstellung eines originalen Signals, wobei eine erste Codekette partielle Ketten (LTC) aus tonalen Komponentendaten enthält, in denen tonale Komponentendaten (tc_A ... tc_D), welche gleiche Werte wenigstens eines von Parametern (n_sp, QP) aufweisen, zur Signalseparation (602) und ersten Codierung (603) gruppiert werden, und wobei die erste Decodierung (701) oder die Wiederherstellung den Parameter (n_sp, QP) zur Decodierung oder Wiederherstellung mehrerer codierter Signale verwendet.
Verfahren nach Anspruch 10, wobei die tonalen Komponentendaten (tc_A ... tc_D) in den partiellen Ketten (LTC) entsprechend dem Parameter (n_sp), der die Zahl der spektralen Signale anzeigt, welche die von der Signalseparation (602) separierten tonalen Komponenten (TC_A ... TC_D) bilden, gruppiert werden.
Verfahren nach Anspruch 10, wobei die erste Decodierung (702) eine inverse Quantisierung zum inversen Quantisieren des ersten Signals enthält und die tonalen Komponenten (TC_A ... TC_D) in den partiellen Ketten (LTC) entsprechend dem die Information der Quantisierung anzeigenden Parameter (n_sp) gruppiert werden.
Verfahren nach Anspruch 12, wobei der Parameter (QP) den Quantisierungsschritt anzeigt.
Verfahren nach einem der Ansprüche 10 bis 13, wobei die erste Codekette Information (STC₃, STC₅, STC₇; nLTC) enthält, welche die Beschaffenheit der partiellen Ketten (LTC) anzeigt.
Verfahren nach einem der Ansprüche 10 bis 14, wobei die Information (nLTC), welche die Beschaffenheit der partiellen Ketten anzeigt, die Zahl der partiellen Ketten (LTC) anzeigt.
Verfahren nach einem der Ansprüche 10 bis 15, wobei die anderen Komponenten Rauschspektren sind.
Verfahren nach Anspruch 16, wobei die Frequenzkomponenten in Bänder (b1 ... b5) gruppiert werden, und eine zweite Codekette aus den Bändern (b1 ... b5) zugeordneten rauschigen Komponenten (nc₁ ... nc₅) zusammengesetzt werden.
Gerät zur Codierung eines Eingabesignals, aufweisend: eine Einrichtung (601) zur Transformation des Eingabesignals in Frequenzkomponenten; eine Einrichtung (602) zur Separation der Frequenzkomponenten in ein aus tonalen Komponenten (TC_A ... TC_D), die eine steile Energieverteilung aufweisen, zusammengesetztes erstes Signal und ein aus anderen Komponenten zusammengesetztes zweites Signal, eine Einrichtung (603) zur Codierung des ersten Signals mittels einer ersten Codierung, eine Einrichtung (604) zur Codierung des zweiten Signals mittels einer zweiten Codierung, und eine Einrichtung (605) zur Erzeugung einer ersten Codekette zur Übertragung oder Aufzeichnung auf der Basis von durch die erste Codierung und die zweite Codierung erzeugten codierten Signalen, wobei die erste Codekette partielle Ketten (LTC) tonaler Komponentendaten enthält, in denen tonale Komponentendaten (tc_A ... tc_D), welche gleiche Werte wenigstens eines von Parametern (n_sp, QP) aufweisen, zur Signalseparation (602) und ersten Codierung (603) gruppiert sind.
Gerät nach Anspruch 18, wobei die tonalen Komponentendaten (tc_A ... tc_D) in den partiellen Ketten (LTC) entsprechend dem Parameter (n_sp), der die Zahl der spektralen Signale an zeigt, welche die von der Signalseparation (602) separierten tonalen Komponenten (tc_A ... tc_D) bilden, gruppiert sind.
Gerät nach Anspruch 18, wobei die erste Codierung (603) eine Quantisierung (303) zum Quantisieren des ersten Signals enthält und die tonalen Komponentendaten (tc_A ... tc_D) in den partiellen Ketten (LTC) entsprechend dem die Information der Quantisierung (303) anzeigenden Parameter (QP) gruppiert sind.
Gerät nach Anspruch 20, wobei der Parameter (QP) den Quantisierungsschritt anzeigt.
Gerät nach einem der Ansprüche 18 bis 21, wobei die Codekette Information (STC₃, STC₅, STC₇; nLTC), welche die Beschaffenheit der partiellen Ketten (LTC) anzeigt, enthält.
Gerät nach Anspruch 22, wobei die Information (nLTC), welche die Beschaffenheit der partiellen Ketten anzeigt, die Zahl der partiellen Ketten (LTC) anzeigt.
Gerät nach einem der Ansprüche 18 bis 23, wobei die anderen Komponenten Rauschspektren sind.
Gerät nach Anspruch 24, wobei die Frequenzkomponenten in Bänder (b1 ... b5) gruppiert sind und eine zweite Codekette aus den Bändern (b1 ... b5) zugeordneten rauschigen Komponenten (nc₁ ... nc₅) zusammengesetzt ist.
Gerät zur Decodierung einer aus codierten Signalen zusammengesetzten Codekette, aufweisend: eine erste Decodierungseinrichtung (701) zur Decodierung des mit einem aus tonalen Komponenten, die eine steile Energieverteilung aufweisen, gebildeten ersten Signal korrespondierenden codierten Signals zur Erzeugung erster decodierter Signale mittels einer ersten Decodierung, eine zweite Decodierungseinrichtung (701) zur Decodierung des mit einem aus anderen Komponenten gebildeten zweiten Signal korrespondierenden codierten Signals zur Erzeugung zweiter decodierter Signale mittels einer zweiten Decodierung, und eine Einrichtung (704) zum Synthetisieren des ersten und zweiten decodierten Signals zur Wiederherstellung eines originalen Signals, wobei eine erste Codekette partielle Ketten (LTC) aus tonalen Komponentendaten enthält, in denen tonale Komponentendaten (tc_A ... tc_D), welche gleiche Werte wenigstens eines von Parametern (n_sp, QP) aufweisen, zu einer Signalseparation (602) und ersten Codierung (603) gruppiert sind, und wobei die erste Decodierungseinrichtung (701) oder die Wiederherstellungseinrichtung den Parameter (n_sp, QP) zur Decodierung oder Wiederherstellung der mehreren codierten Signale verwendet.
Gerät nach Anspruch 26, wobei die tonalen Komponentendaten (tc_A ... tc_D) in den partiellen Ketten (LTC) entsprechend dem Parameter (n_sp), der die Zahl der spektralen Signale anzeigt, welche die von der Signalseparation (602) separierten tonalen Komponenten (tc_A ... tc_D) bilden, gruppiert sind.
Gerät nach Anspruch 26, wobei die erste Decodierung (702) eine inverse Quantisierung zum inversen Quantisieren des ersten Signals enthält und die tonalen Komponenten (tc_A ... tc_D) in den partiellen Ketten (LTC) entsprechend dem die Information der Quantisierung anzeigenden Parameter (n_sp) gruppiert sind.
Gerät nach Anspruch 28, wobei der Parameter (QP) den Quantisierungsschritt anzeigt.
Gerät nach einem der Ansprüche 26 bis 29, wobei die Codekette Information (STC₃, STC₅, STC₇; nLTC) enthält, welche die Beschaffenheit der partiellen Ketten (LTC) anzeigt.
Gerät nach Anspruch 30, wobei die Information (nLTC), welche die Beschaffenheit der partiellen Ketten anzeigt, die Zahl der partiellen Ketten (LTC) anzeigt.
Gerät nach einem der Ansprüche 26 bis 29, wobei die anderen Komponenten Rauschspektren sind.
Gerät nach Anspruch 32, wobei die Frequenzkomponenten in Bänder (b1 ... b5) gruppiert sind und eine zweite Codekette aus den Bändern (b1 ... b5) zugeordneten rauschigen Komponenten (nc₁ ... nc₅) zusammengesetzt ist.