DE69533500T2 - Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten - Google Patents

Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten Download PDF

Info

Publication number
DE69533500T2
DE69533500T2 DE69533500T DE69533500T DE69533500T2 DE 69533500 T2 DE69533500 T2 DE 69533500T2 DE 69533500 T DE69533500 T DE 69533500T DE 69533500 T DE69533500 T DE 69533500T DE 69533500 T2 DE69533500 T2 DE 69533500T2
Authority
DE
Germany
Prior art keywords
components
signal
tonal
ltc
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69533500T
Other languages
English (en)
Other versions
DE69533500D1 (de
Inventor
Kyoya Tsutsui
Osamu Shimoyoshi
Mito Sonohara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of DE69533500D1 publication Critical patent/DE69533500D1/de
Application granted granted Critical
Publication of DE69533500T2 publication Critical patent/DE69533500T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • G10L2025/935Mixed voiced class; Transitions

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Dc Digital Transmission (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

  • TECHNISCHES GEBIET
  • Diese Erfindung betrifft ein Informationscodierungsverfahren und -gerät zur Codierung von Information wie beispielsweise digitale Eingabedaten durch hocheffiziente Codierung und ein Informationsdecodierungsverfahren und -gerät zur Decodierung codierter Information.
  • HINTERGRUNDTECHNIK
  • Es gibt eine Vielfalt hocheffizienter Codierungstechniken für Audio- oder Sprachsignale. Beispiele dieser Techniken umfassen eine Transformationscodierung, bei der ein Rahmen von das Audiosignal bezüglich der Zeitachse darstellenden digitalen Signalen durch eine orthogonale Transformation in einen Block von das Audiosignal bezüglich der Frequenzachse darstellenden spektralen Koeffizienten umgesetzt wird, und eine Subbandcodierung (sub-band coding (SBC)), bei der das Frequenzband des Audiosignals vor der Codierung durch eine Filterbank entlang der Zeitachse in mehrere Subbänder ohne Ausbildung des Signals in Rahmen geteilt wird. Es ist auch eine Kombination aus Subbandcodierung und Transformationscodierung bekannt, bei der Signale, die das Audiosignal bezüglich der Zeitachse darstellen, durch eine Bandteilung in Bänder geteilt werden und dann durch eine spektrale Transformation in Signale bezüglich der Frequenzachse transformiert werden und durch die spektrale Transformation erhaltene Frequenzkomponenten bei jedem Band codiert werden.
  • Unter den Filtern zur Teilung eines Frequenzspektrums in mehrere gleich breite Frequenzbereiche ist das in R. E. Chrochiere, Digital Coding of Speech in Sub-bands, 55 Bell Syst. Tech. J. Nr. 8 (1976) beschriebe Quadraturspiegelfilter (Quadrature Mirror Filter (QMF)). Mit dem QMF-Filter wird das Frequenzspektrum des Signals in zwei gleich breite Bänder geteilt. Mit dem QMF wird Aliasing (Signalverfälschung) nicht erzeugt, wenn die aus der Teilung resultierenden Frequenzbänder danach miteinander kombiniert werden.
  • In „Polyphase Quadrature Filters – A New Subband Coding Technique„, Joseph H. Rothweiler, ICASSP 83, Boston, ist eine Technik zum Teilen des Frequenzspektrums des Signals in gleich breite Frequenzbänder gezeigt. Mit dem gegenwärtigen Polyphase-QMF (Mehrphasen-OMF) kann das Frequenzspektrum der Signale zu einer Zeit in mehrere gleich breite Frequenzbänder geteilt werden.
  • Es ist auch eine Technik zur orthogonalen Transformation bekannt, die ein Teilen des digitalen Audioeingabesignals in Rahmen einer vorbestimmten Zeitdauer und ein Verarbeiten der resultierenden Rahmen unter Verwendung einer diskreten Fourier-Transformation (DFT), diskreten Cosinustransformation (DCT) und modifizieren DCT zur Umsetzung des Signals von der Zeitachse in die Frequenzachse aufweist. Beschreibungen bezüglich MDCT können J. P. Princen and A. B. Bradlex, Subband Transform Coding Using Filter Bank Based on Time Domain Aliasing Cancellation, ICASSP 1987 entnommen werden.
  • Durch Quantisieren der durch die Filter- oder Spektrumumsetzung auf der Bandbasis geteilten Signale wird es möglich, das einem Quantisierungsrauschen unterliegende Band zu steuern, und es kann eine effizientere psychoakustische Codierung durch Benutzung der sogenannten Maskierungseffekte erreicht werden. Wenn die Signalkomponenten mit dem maximalen Wert der absoluten Werte der Signalkomponenten von Band zu Band normiert werden, wird es möglich, eine effizientere Codierung zu bewirken.
  • Bei einer Technik zur Quantisierung der aus einer orthogonalen Transformation resultierenden spektralen Komponenten ist es bekannt, Subbänder zu benutzen, die Vorteil aus den psychoakustischen Charakteristiken des menschlichen Gehörsystems ziehen. Das heißt, ein Audiosignal bezüglich der Frequenzachse darstellende spektrale Koeffizienten können in mehrere kritische Frequenzbänder, beispielsweise 25 kritische Bänder geteilt werden. Die Breite der kritischen Bänder nimmt mit zunehmender Frequenz zu. Bei einem solchen Quantisierungssystem werden zwischen den verschiedenen kritischen Bändern Bits adaptiv zugeordnet. Wenn beispielsweise eine adaptive Bitzuordnung zu den aus einer MDCT resultierenden spektralen Koeffizientendaten angewendet wird, werden die von der MDCT in jedem der kritischen Bänder erzeugten spektralen Koeffizientendaten unter Benutzung einer adaptiv zugeordneten Zahl von Bits quantisiert.
  • Es sind derzeit die folgenden zwei Bitzuordnungstechniken bekannt. Beispielsweise wird bei IEEE Transactions of Acoustics, Speech and Signal Processing, Vol. ASSP-25, Nr. 4, August 1977 in jedem kritischen Band eine Bitzuordnung auf der Basis der Amplitude des Signals ausgeführt. Diese Technik erzeugt ein flaches Quantisierungsrauschspektrum und minimiert die Rauschenenergie, jedoch ist der vom Zuhörer wahrgenommene Rauschpegel nicht optimal, da die Technik den psychoakustischen Maskierungseffekt nicht effektiv ausnutzt.
  • Bei der in M. A. Krassner, The Critical Band Encoder – Digital Encoding of the Perceptual Requirements of the Acoustic System, ICASSP 1980 beschriebenen Zuordnungstechnik wird der psychoakustische Maskierungsmechanismus benutzt, um eine feste Bitzuordnung zu bestimmen, die das notwendige Signal-zu-Rauschen-Verhältnis für jedes kritische Band erzeugt. Wenn jedoch das Signal-zu-Rauschen-Verhältnis eines solchen Systems unter Verwendung einer Sinuswelle gemessen wird, werden wegen der festen Zuordnung von Bits zwischen den kritischen Bändern nicht optimale Resultate erhalten.
  • Zur Überwindung dieser Unvorteilhaftigkeit ist ein hocheffizientes Codierungsgerät vorgeschlagen worden, bei dem die Gesamtzahl der zur Bitzuordnung verfügbaren Bits zwischen einem für jeden kleinen Block voreingestellten festen Bitzuordnungsmuster und einer von Signalgrößen abhängigen blockbasierten Bitzuordnung geteilt wird, und das Teilungsverhältnis in Abhängigkeit von einem für das Eingabesignal relevanten Signal eingestellt wird, derart, dass, je glatter das Spektralspektrum, desto höher das Teilungsverhältnis für das feste Bitzuordnungsmuster wird.
  • Bei diesem Gerät wird, wenn die Energie so, wie im Fall einer Sinuswelleneingabe, in einer besonderen spektralen Komponente konzentriert ist, dem die spektrale Komponente enthaltenden Block zur signifikanten Verbesserung der Signal-zu-Rauschen-Verhältnischarakteristiken als Ganzes eine größere Zahl von Bits zugeordnet. Da das menschliche Gehörsystem bei einem Signal, das scharfe bzw. spitze spektrale Komponenten aufweist, hoch sensitiv ist, kann eine solche Technik zur Verbesserung des Signal-zu-Rauschen-Verhältnisses zur Verbesserung nicht nur gemessener Werte, sondern auch der Qualität des vom Ohr wahrgenommenen Tons verwendet werden.
  • Außerdem ist zu den vorstehenden Techniken eine Vielfalt anderer Techniken vorgeschlagen worden, und das Modell, welches das menschliche Gehörsystem simuliert, ist derart verfeinert bzw. vervollkommnet worden, dass, wenn die Codierungseinrichtung in ihrer Fähigkeit, insbesondere Leistungsfähigkeit oder Empfindlichkeit, verbessert wird, die Codierung im Licht des menschlichen Gehörsystems mit höherer Effizienz gemacht werden kann.
  • 1 zeigt eine Grundlegende Beschaffenheit einer konventionellen Codierungsvorrichtung zur Codierung akustischer Signale als Wellenformsignale bezüglich der Zeitachse.
  • Nach 1 wird die einem Anschluss 100 zugeführte akustische Signalwellenform durch eine Umsetzungsschaltung 101 in Frequenzkomponenten akustischer Signale umgesetzt, die dann von einer Signalkomponenten-Codierungsschaltung 102 codiert werden. Die Codes werden von einer Codekette-Erzeugungsschaltung 103 als eine Codekette angeordnet, die an einem Anschluss 104 ausgegeben wird.
  • 2 zeigt eine illustrative Beschaffenheit einer in 1 gezeigten Umsetzungsschaltung 101.
  • Bezugnehmend auf die 2 wird das einem mit dem in 1 gezeigten Anschluss 100 korrespondierenden Anschluss 200 zugeführtes akustischen Signal von einer Frequenzspektrum-Teilungsschaltung 201, die das vorstehend erwähnte Mehrphasen-Quadraturfilter (Polyphase Quadrature Filter) sein kann, in vier Bänder geteilt. Die akustischen Signale der durch das Frequenzspektrum-Teilungsfilter 201 erhaltenen Bänder werden durch orthogonale Vorwärts-Umsetzungsschaltungen 211 bis 214 zum Bewirken einer orthogonalen Transformation durch beispielsweise MDCT-Schaltungen in spektrale Komponenten umgesetzt. Das heißt, die in die Spektrum-Vorwärtsumsetzungs-Schaltungen 211 bis 214 eingegebenen akustischen Signale sind jeweils von einer Bandbreite, die gleich ein Viertel der Bandbreite des dem Anschluss 200 zugeführten Signals ist, so dass die über den Anschluss 200 zugeführten akustischen Signale mit einer Rate von 1 zu 4 subabgetastet werden. Ausgangssignale der Spektrum-Vorwärts-Umsetzungsschaltungen 211 bis 214 werden über Anschlüsse 221 bis 224 der in 1 gezeigten Signalkomponenten-Codierungsschaltung 102 zugeführt.
  • Natürlich kann die in 1 gezeigte Umsetzungsschaltung 101 in gewünschter Weise modifiziert werden. Beispielsweise kann das akustische Eingabesignal von einer MDCT direkt in spektrale Komponenten umgesetzt werden, wobei die MDCT durch eine DFT oder DCT ersetzt werden kann.
  • 3 zeigt eine illustrative Beschaffenheit der in 1 gezeigten Signalkomponenten-Codierungsschaltung 102.
  • Nach 3 wird von einer Normierungsschaltung 301 ein einem Anschluss 300 zugeführtes Ausgangssignal der Signalkomponenten-Codierungsschaltung 102 bezüglich der Bandbasis normiert, bevor es zu einer Quantisierungsschaltung 303 übertragen wird. Das Eingabesignal am Anschluss 300 wird auch einer Quantisierungsschritt-Entscheidungsschaltung 302 zugeführt. Die Quantisierungsschaltung 303 quantisiert die normierten spektralen Komponenten der Normierungsschaltung 301 auf der Basis der Quantisierungsschritte, wie sie durch die Quantisierungsschritt-Entscheidungsschaltung 303 von den über dem Anschluss 300 zugeführten spektralen Komponenten berechnet werden. Die quantisierten spektralen Komponenten der Quantisierungsschaltung 303 werden über den Anschluss 304 der Codekette-Erzeugungsschaltung 103 der 1 zugeführt. Ein über den Anschluss 304 ausgegebenes Signal enthält zusätzlich zu den quantisierten spektralen Komponenten der Quantisierungsschaltung 303 die Normierungskoeffizienteninformation in der Normierungsschaltung 301 und die Quantisierungsschrittinformation in der Entscheidungsschaltung 302.
  • 4 zeigt eine Grundlegende Beschaffenheit einer Signaldecodierungseinrichtung zur Decodierung des akustischen Signals der durch die in 1 gezeigte Codierungseinrichtung erzeugten Codekette und Ausgeben des decodierten akustischen Signals.
  • Nach 4 werden die Codes der jeweiligen Signalkomponenten von einer Codekette-Auflösungsschaltung 401 von der von der in 1 gezeigten Beschaffenheit erzeugten Codekette extrahiert und über einen Anschluss 400 zugeführt. Von diesen Codes werden die Signalkomponenten durch die Signalkomponenten-Decodierungsschaltung 402 wieder hergestellt. Die decodierten Signalkomponenten werden von einer inversen Transformationsschaltung 403 mit einer inversen Transformation, die eine zu der von der Transformationsschaltung 101 der 1 inverse Operation ist, verarbeitet. Dies erzeugt ein akustisches Wellenformsignal, das an einem Anschluss 404 ausgegeben wird.
  • 5 zeigt eine illustrative Beschaffenheit einer in 4 gezeigten inversen Transformationsschaltung 403.
  • 5 zeigt eine illustrative Beschaffenheit einer Gegenstückschaltung zu der in 2 gezeigten Transformationsschaltung. Die von der Signalkomponenten-Decodierungs schaltung 402 über Anschlüsse 501 bis 504 zugeführten Signale werden durch inverse Spektrum-Umsetzungsschaltungen 511 bis 514, die eine das Umgekehrte der in 2 gezeigten Vorwärts-Spektrumtransformation seiende inverse Spektrumtransformation ausführt, verarbeitet. Die Signale der von den inversen orthogonalen Transformationsschaltungen 511 bis 514 erzeugten jeweiligen Bänder werden von einem Bandkombinierungsfilter 515, das eine das Umgekehrte der von dem in 2 gezeigten Frequenzspektrum-Teilungsfilter 201 ausgeführten Frequenzspektrumteilung seiende Operation ausführt, kombiniert. Ein Ausgangssignal des Bandsynthetisierungsfilters 515 wird an einem mit dem in 4 gezeigten Anschluss 404 korrespondierenden Anschluss 521 ausgegeben.
  • 6 illustriert ein Beispiel eines herkömmlichen Codierungsverfahrens. Bei dem in 6 gezeigten Beispiel sind die spektralen Komponentensignale die von der in 2 gezeigten Transformationsschaltung erzeugten. In 6 korrespondieren nach Umsetzung durch MDCT gezeigte Pegel absoluter Werte der spektralen Signale mit dB Werten.
  • In 6 werden die Eingabesignale von einem voreingestellten Zeitblock zu einem anderen in 64 spektrale Signale transformiert. Diese 64 spektralen Signale werden in fünf voreingestellten Bändern, die hier in 6 als Codierungseinheiten b1 bis b5 bezeichnet sind, gruppiert, um auf der Codierungsgruppenbasis normiert und quantisiert zu werden. Die Bandbreiten der jeweiligen Codierungseinheiten b1 bis b5 werden zum unteren Bereich hin schmaler und zum höheren Bereich hin breiter, um die Steuerung der Erzeugung des mit den Charakteristiken des menschlichen Gehörsystems übereinstimmenden Quantisierungsrauschens zu ermöglichen.
  • Wie jedoch der 6 zu entnehmen ist, wird, wenn die Normierung für jedes der voreingestellten Bänder bewirkt wird, die Signalnormierung in der tonale Komponenten enthaltenden Codierungseinheit b3 auf der Basis eines größeren Normierungskoeffizientenwertes, wie er durch die tonalen Komponenten bestimmt ist, ausgeführt. Unter Verwendung dieses Normierungskoeffizientenwertes werden alle in der Codierungseinheit b3 enthaltenen spektralen Komponenten normiert. Das im tonalen akustischen Signal enthaltene Rauschen ist dem Ohr obstruktiv. Wenn außerdem die tonalen Komponenten nicht mit hoher Genauigkeit quantisiert werden, wird eine beträchtliche Anschluss- bzw. Verbindungsverzerrung erzeugt, wenn die tonalen Komponenten mit den Wellenformsignalen des benachbarten Zeitblocks synthetisiert werden. Aus diesem Grund müssen die tonalen Komponenten mit einer ausreichenden Zahl von Bits quantisiert werden. Wenn jedoch der Quantisierungsschritt auf der Basis von voreingestellten Frequenzbändern bestimmt wird, ist es notwendig, einer großen Zahl der spektralen Komponenten in der die tonalen Komponenten enthaltenden Codierungseinheit eine große Zahl von Bits zuzuordnen, wodurch die Codierungseffizienz erniedrigt wird.
  • Mit dem vorstehend beschriebenen herkömmlichen Verfahren werden die Frequenzbänder zur Quantisierung der Frequenzkomponenten mit dem gleichen Quantisierungsschritt fixiert. Aus diesem Grund ist es, wenn die spektralen Komponenten in der Nähe mehrerer spezifizierter Frequenzen konzentriert sind, und wenn diese spektralen Komponenten mit ausreichend feinen Quantisierungsschritten zu quantisieren sind, notwendig, einer großen Zahl spektraler Komponenten, die zum gleichen Band wie das der spektralen Komponenten gehören, eine große Zahl von Bits zuzuordnen.
  • Generell ist das im tonalen akustischen Signal, bei dem die spektrale Energie bei spezifizierten Frequenzen konzentriert ist, enthaltene Rauschen dem Ohr offensiver als das in einem akustischen Signal, bei dem die Energie glatt bzw. gleichmäßig über einen breiten Frequenzbereich verteilt ist, enthaltene Rauschen. Ein solches Rauschen ist dem Ohr extrem unangenehm. Wenn andererseits die spektralen Komponenten, die größere Energien aufweisen als tonale Komponenten, nicht mit ausreichend feinen Quantisierungsschritten quantisiert werden, wird eine Block-zu-Block-Verzerrung größer, wenn die spektralen Komponenten zu den Wellenformsignalen bezüglich der Zeitachse wiederhergestellt werden, und die resultierenden Wellenformsignale werden mit zeitlich benachbarten Blöcken synthetisiert. In anderen Worten wird eine größere Verbindungsverzerrung erzeugt, wenn die resultierenden Wellenformsignale mit den Wellenformsignalen der zeitlich benachbarten Blöcke synthetisiert werden, und dadurch wird dem menschlichen Gehörsystem wieder ein Hindernis präsentiert. Infolgedessen ist es bei dem herkömmlichen Verfahren schwierig, die Codierungseffizienz für das tonale akustische Signal ohne Verschlechterung der Signalqualität anzuheben.
  • Um einer solchen Unvorteilhaftigkeit zu begegnen, hat die Rechtsinhaberin der vorliegenden Anmeldung unter der internationalen Anmeldenummer PCT/JP94/00880 (internationale Veröffentlichungsnummer WO94/28633, internationales Veröffentlichungsdatum 8. Dezember 1994) ein Verfahren zur Realisierung einer hohen Codierungseffizienz durch Separieren des Eingabesignals in tonale Komponenten, bei denen die Signalenergie bei einer spezifizierten Frequenz konzentriert ist, und nicht tonale Komponenten, bei denen die Signalenergie über einem breiten Frequenzbereich glatt bzw. gleichmäßig verteilt ist, vorgeschlagen.
  • Bei dem bisher vorgeschlagenen Verfahren kann die Codierung effizienter als bei dem vorstehend erwähnten Verfahren zur Quantisierung der Frequenzkomponenten auf der Basis fester Bänder durch Quantisierung der tonalen Komponenten mit feinen Quantisierungsschritten innerhalb eines extrem schmalen Bereichs bezüglich der Frequenzachse und durch Aufzeichnung der resultierenden Daten zusammen mit der Position bezüglich der Frequenzachse auf dem Aufzeichnungsmedium erzielt werden. Als ein illustratives Beispiel der hocheffizienten Codierung wurde ein Verfahren zur Normierung und Quantisierung einer voreingestellten Zahl spektraler Signale, die um eine maximale spektrale Energiekomponente jeder der tonalen Komponenten zentriert sind, und Codierung der resultierenden spektralen Signale, vorgeschlagen.
  • Das wie in PCT/JP94/00880 vorgeschlagene Verfahren besteht jedoch in der richtigen Verteilung der Information betreffend die Quantisierungsschritte zur Quantisierung der tonalen Komponenten auf jede tonale Komponente oder Quantisierung aller tonalen Komponenten mit den gleichen Quantisierungsschritten. Wenn das erstere Verfahren angewendet wird, ist es notwendig, zur Codierung der Information bezüglich der gleichen Quantisierungsschritte eine größere Zahl von Bits zu benutzen, was bei der Realisierung einer hocheffizienten Codierung nicht wünschenswert ist. Wenn andererseits das letztere Verfahren benutzt wird, können die Quantisierungsschritte nicht auf optimale Werte für die jeweiligen tonalen Komponenten eingestellt werden.
  • WO 89 10661 A lehrt, dass der Energieinhalt von Stimmendaten über dem hörbaren Frequenzband nicht zufällig auftritt, und, wenn das Eingabesignal in Frequenzkomponenten transformiert wird und die Frequenzkomponenten in eine Anzahl von Bändern gruppiert werden, die richtige spektrale Information nur in wenigen häufig ausgewählten Filterbändern liegt. Insbesondere offenbart dieses Dokument ein Verfahren zur Übertragung eines Informationssignals über einen Kommunikationskanal, in welchem durch einen Subbandcodierer erzeugte digital verarbeitete Abtastwerte bzw. Samples auf dem Kommunikationskanal moduliert werden, um Kanalsymbole zu erzeugen, die eine zu einer Charakteristik eines jeweiligen digital verarbeiteten Sample proportionale Modulationsgröße aufweisen.
  • Aus EP-A-0 525 809 geht ein Codierungsgerät hervor, bei dem spektrale Komponenten eines digitalen Eingabesignals in kritische Bänder gruppiert werden und die Gesamtzahl von zur Quantisierung der spektralen Komponenten verfügbaren Bits den kritischen Bändern zugeordnet wird, wobei fixierte Bits den kritischen Bändern entsprechend einem aus einer Anzahl vor bestimmter Bitzuordnungsmuster ausgewählten Muster zugeordnet werden, und variable Bits den kritischen Bändern entsprechend der Energie in den kritischen Bändern zugeordnet werden.
  • Es ist eine Aufgabe der vorliegenden Erfindung, ein Informationscodierungsverfahren und -gerät und ein Informationsdecodierungsverfahren und -gerät bereitzustellen, wodurch die tonalen akustischen Signale vor allem effizient codiert werden können, und die Quantisierungsschritte für die jeweiligen tonalen Komponenten optimal eingestellt werden können.
  • Diese Aufgabe wird durch ein Codierungsverfahren, ein Codierungsgerät, ein Decodierungsverfahren und ein Decodierungsgerät gemäß den beigefügten unabhängigen Ansprüchen gelöst. Vorteilhafte Merkmale und Eigenschaften der vorliegenden Erfindung sind in den korrespondierenden Unteransprüchen definiert.
  • Mit der vorliegenden Erfindung kann eine hocheffiziente Codierung durch Klassifizieren eines ersten Signals als die tonalen Komponenten in partielle Informationsketten entsprechend einer gemeinsamen Information, nicht Codieren von nutzlosen der partiellen Informationsketten, und durch gemeinschaftliches Codieren der die codierten partiellen Informationsketten anzeigenden Information, das heißt durch Separieren der tonalen Komponenten in Gruppen, nicht Codieren der die tonalen Komponenten nicht enthaltenden Gruppen, und Codieren der Zahl der codierten Gruppen erreicht werden.
  • Außerdem kann durch Übertragen der durch das Informationscodierungsverfahren und -gerät gemäß der vorliegenden Erfindung eine effiziente Übertragung erreicht werden.
  • Mit den Codierungsverfahren und -gerät gemäß der vorliegenden Erfindung wird die Information, welche die codierten partiellen Informationsketten mit Ausnahme der nicht codierten nutzlosen partiellen Informationsketten anzeigt, decodiert und wird auf der Basis der decodierten Resultate eine Decodierung der partiellen Informationsketten, die aus dem ersten Signal der entsprechend der gemeinsamen Information klassifizierten tonalen Komponenten bestehen, durchgeführt.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein Blockschaltbild, das eine grundlegende Ausbildung eines herkömmlichen Codierungsgeräts zeigt.
  • 2 ist ein Blockdiagramm, das eine illustrative Anordnung einer Transformationsschaltung eines herkömmlichen Codierungsgeräts zeigt.
  • 3 ist ein Blockdiagramm, das eine illustrative Anordnung einer herkömmlichen Signalkomponenten-Codierungsschaltung zeigt.
  • 4 ist ein Blockdiagramm, das eine grundlegende Ausbildung einer herkömmlichen Decodierungsschaltung zeigt.
  • 5 ist ein Blockdiagramm, das eine illustrative Ausbildung einer inversen Transformationsschaltung einer herkömmlichen Decodierungsschaltung zeigt.
  • 6 stellt ein Codierungsverfahren gemäß einer herkömmlichen Technik durch Vergleich mit der vorliegenden Erfindung dar.
  • 7 ist ein Blockdiagramm, das eine Ausbildung eines die vorliegende Erfindung verkörpernden Informationscodierungsgeräts zeigt.
  • 8 ist ein Blockdiagramm, das eine Ausbildung eines die Erfindung verkörpernden Informationsdecodierungsgeräts zeigt.
  • 9 stellt in tonalen Komponenten enthaltene spektrale Signale dar.
  • 10 stellt tonale Komponenten ausschließende spektrale Signale dar.
  • 11 ist ein Flussdiagramm zur Darstellung eines Verarbeitungsflusses zur Separation tonaler Komponenten.
  • 12 ist ein Flussdiagramm zur Darstellung des Verarbeitungsflusses zur Bestimmung der Zahl spektraler Signale, welche die registrierten tonalen Komponenten bilden.
  • 13 stellt eine exemplarische Codekette dar.
  • 14 stellt eine durch das Codierungsverfahren der vorliegenden Erfindung erzeugte Codekette dar.
  • 15 stellt eine andere exemplarische Codekette dar.
  • 16 stellt eine noch andere exemplarische Codekette dar.
  • 17 ist ein Blockschaltbild, das ein anderes Beispiel einer Wiederherstellungseinheit gemäß der vorliegenden Erfindung zeigt.
  • 18 ist ein Flussdiagramm, das den Verarbeitungsfluss während einer Gruppierung der tonalen Komponenten zeigt.
  • 19 ist ein Flussdiagramm, das den Verarbeitungsfluss des Informationsdecodierungsverfahrens gemäß der vorliegenden Erfindung zeigt.
  • BESTE ART UND WEISE DER AUSFÜHRUNG DER ERFINDUNG
  • Bezugnehmend auf die Zeichnungen werden bevorzugte illustrative Ausführungsformen der vorliegenden Erfindung detailliert erläutert.
  • 7 zeigt eine Ausbildung eines die vorliegende Erfindung verkörpernden Informationscodierungsgeräts.
  • Nach 7 wird einem Anschluss 600 ein akustisches Wellenformsignal zugeführt. Das akustische Wellenformsignal wird von einer Transformationsschaltung 601 in Signalfrequenzkomponenten transformiert, die dann zu einer Signalkomponenten separierenden Schaltung 602 geleitet werden. In der Signalkomponenten separierenden Schaltung 602 werden die von der Transformationsschaltung 601 erzeugten Signalfrequenzkomponenten, die eine steile spektrale Verteilung aufweisen, und verbleibende Signalfrequenzkomponenten, das heißt rauschige bzw. rauschende Komponenten, die eine flache spektrale Verteilung aufweisen, separiert. Von den resultierenden Frequenzkomponenten werden die eine steile spektrale Verteilung bereitstellenden tonalen Komponenten von einer tonale Komponenten codierenden Schaltung 603 codiert, während die ver bleibenden Signalfrequenzkomponenten, das heißt die rauschenden Komponenten, von einer rauschende Komponenten codierenden Schaltung 604 codiert werden. Ein Ausgangssignal der die tonalen Komponenten codierenden Schaltung 603 und der die rauschenden Komponenten codierenden Schaltung 604 werden von einer Codekette erzeugenden Schaltung 605 in eine Codekette geformt, die zu einem ECC-Codierer 606 ausgegeben wird.
  • Der ECC-Codierer 606 fügt an die von der Codekette erzeugenden Schaltung 605 ausgegebene Codekette Fehlerkorrekturcodes an. Ein Ausgangssignal des ECC-Codierers 606 wird von einer EFM-Schaltung 607 moduliert, bevor es zu einem Aufzeichnungskopf 608 übertragen wird. Der Aufzeichnungskopf 608 zeichnet die ausgegebene Codekette der EFM-Schaltung 607 auf einer Platte 609 auf. Die Signalkomponenten separierende Schaltung 602 gibt die Zahl der tonalen Komponenteninformationsdaten, Positionsinformation und die Information bezüglich der Zahl der spektralen Komponenten an die Codekette erzeugende Schaltung 605 aus.
  • Für die Transformationsschaltung 601 kann eine Anordnung ähnlich zu der in 2 gezeigten verwendet werden.
  • Natürlich kann für die Transformationsschaltung 601 eine Ausbildung bzw. Beschaffenheit anders als die in 2 gezeigte verwendet werden. Beispielsweise kann das Eingabesignal von einer MDCT direkt in spektrale Signale transformiert werden, oder es kann anstelle der MDCT eine Transformation in spektrale Signale durch DFT oder DCT verwendet werden. Die tonale Komponenten codierende Schaltung 603 und die rauschende Komponenten codierende Schaltung 604 können grundsätzlich durch die gleiche Anordnung wie die in 3 gezeigte realisiert werden.
  • 8 zeigt eine Beschaffenheit einer Decodierungsschaltung zur Decodierung der von der in 7 gezeigten Codierungsschaltung erhaltenen Codekette.
  • Nach 8 wird die von der Platte 609 durch den Wiedergabekopf 708 wiedergegebene Codekette zu einer EFM-Schaltung 709 geleitet, welche die eingegebene Codekette demoduliert. Die demodulierte Codekette wird zu einem ECC-Decodierer 710 zur Fehlerkorrektur geleitet. Auf der Basis der Zahl der Informationsdaten bezüglich der in der fehlerkorrigierten Codekette enthaltenen tonalen Komponenten erkennt eine Codekette-Auflösungsschaltung 701, welcher Teil der Codekette der tonale Komponentencode ist, und separiert die eingegebene Codekette in die tonalen Komponentencodes und die rauschenden Komponentencodes. Andererseits separiert die Codekette separierende Schaltung 701 die tonale Komponentenpositionsinformation und die spektrale Komponentenzahlinformation von der eingegebenen Codekette und gibt die separierte Information an eine stromabseitige Syntheseschaltung 704 aus. Der tonale Komponentencode und der rauschende Komponentencode werden jeweils zu einer tonale Komponenten decodierenden Schaltung 702 und einer rauschende Komponenten decodierenden Schaltung 703 geleitet, wo sie zur Decodierung invers quantisiert und entnormiert werden. Die decodierten Signale von den Schaltungen 702 und 703 werden zu einer Syntheseschaltung 704 geleitet, die eine Synthese, welche die zur Separation durch die in 7 gezeigte Signalkomponenten separierende Schaltung 602 umgekehrte Operation ist, ausführt.
  • Auf der Basis der Positionsinformation und der spektralen Komponentenzahlinformation, die von der separierenden Schaltung 701 zugeführt werden, addiert die Syntheseschaltung 704 das decodierte tonale Komponentensignal bei einer voreingestellten Position des decodierten rauschenden Komponentensignals zur Synthetisierung der rauschenden und tonalen Komponenten bezüglich der Frequenzachse. Das synthetisierte decodierte Signal wird von einer inversen Transformationsschaltung 705, die eine inverse Transformation, welche die umgekehrte Operation der von der in 7 gezeigten Transformationsschaltung 601 ausgeführten Transformation ist, ausführt, transformiert, so dass das Signal aus dem Signal bezüglich der Frequenzachse in ein akustisches Wellenformsignal bezüglich der Zeitachse wiederhergestellt wird. Ein von der inversen Transformationsschaltung 705 ausgegebenes Wellenformsignal wird an einen Anschluss 707 gegeben. Die Operationen der inversen Transformation und Synthese können umgekehrt sein, in welchem Fall eine in 8 gezeigte Wiederherstellungsschaltung 711 eine wie in 17 gezeigte Beschaffenheit aufweist. Dort invers transformiert die inverse Transformationsschaltung 712 das decodierte rauschende Komponentensignal bezüglich der Frequenzachse von der Decodierungsschaltung 703 in das rauschende Komponentensignal bezüglich der Zeitachse. Die inverse Transformationsschaltung 713 ordnet das decodierte tonale Komponentensignal aus der tonale Komponenten decodierenden Schaltung 702 bei der durch die Spektralzahlinformation und die Positionsinformation der von der Codekette separierenden Schaltung 701 übertragenen tonalen Komponente spezifizierten Position bezüglich der Frequenzachse an und invers transformiert das resultierende Signal zur Erzeugung des tonalen Komponentensignals bezüglich der Zeitachse. Eine Syntheseschaltung 714 synthetisiert das rauschende Komponentensignal bezüglich der Zeitachse aus der inversen Transformationsschaltung 712 und das tonale Komponentensignal bezüglich der Zeitachse aus der inversen Transformationsschaltung 713 zur Wiederherstellung des originalen akustischen Wellenformsignals.
  • Der Hintergrund dafür, wie das Informationscodierungsverfahren und das Informationsdecodierungsverfahren bei der in 7 gezeigten Beschaffenheit des Codierungsgeräts und des in 8 gezeigten Decodierungsgeräts angewendet werden, wird nachstehend erläutert.
  • Die Art und Weise der Separation der tonalen Komponenten von den Frequenzkomponenten ist in 9 gezeigt, bei der vier tonale Komponenten TCA, TCB, TCC und TCD extrahiert worden sind. Wie beim Beispiel der 9 gezeigt sind die tonalen Komponenten auf eine kleinere Zahl spektraler Komponenten verteilt. Wenn deshalb diese Komponenten mit feineren Quantisierungsschritten quantisiert werden, wird die Zahl von Quantisierungsbits als Ganzes nicht übermäßig erhöht. Obgleich die tonalen Komponenten zur Anhebung der Codierungseffizienz normiert und danach quantisiert werden können, kann zur Vereinfachung des Geräts der Normierungs- und Quantisierungsprozess wegen der kleineren Zahl der die tonalen Komponenten bildenden spektralen Signale fortgelassen werden. Außerdem ist bei dem in 9 gezeigten Beispiel die Zahl der die tonalen Komponenten bildenden spektralen Signale zwischen 3, 5 und 7 derart variabel, dass die tonale Komponente TCA aus drei spektralen Signalen, die tonale Komponente TCB aus sieben spektralen Signalen und die tonalen Komponenten TCC und TCD jeweils aus drei spektralen Signalen, die um das spektrale Maximumwertsignal, das heißt das einen lokalen Maximumwert aufweisende spektrale Signal, zentriert sind, gebildet sind. In einem solchen Fall kann die Codierung unter der Annahme ausgeführt werden, dass die jeweiligen tonalen Komponenten aus drei, fünf oder sieben spektralen Signalen gebildet sind. Es sei darauf hingewiesen, dass bei dem dargestellten Beispiel keine aus fünf spektralen Signalen gebildete tonale Komponente vorhanden ist.
  • 10 zeigt ein Beispiel, bei dem die tonalen Komponenten von den in 9 gezeigten originalen spektralen Signalen eliminiert sind, um nur die rauschenden Komponenten zu zeigen. Da in 10 die tonalen Komponenten von den originalen spektralen Signalen in den jeweiligen Codierungseinheiten (Bändern) b1 bis b5 eliminiert worden sind, weisen in jeder Codierungseinheit b1 bis b5 die Normierungskoeffizienten kleinere Werte auf, so dass das Quantisierungsrauschen selbst bei der Benutzung einer kleineren Zahl von Quantisierungsbits reduziert werden kann.
  • 11 zeigt den Verarbeitungsfluss zur Separation der tonalen Komponenten durch die Signalkomponenten separierende Schaltung 602.
  • In 11 bezeichnet I die serielle Zahl der spektralen Signale, N bezeichnet die Gesamtzahl der spektralen Signale und P, R bezeichnen voreingestellte Koeffizienten. Was die tonalen Komponenten betrifft, so werden, wenn der absolute Wert eines spektralen Signals lokal größer als der Wert der verbleibenden spektralen Signale ist und um mehr als ein voreingestellter Wert größer als der Maximumwert der absoluten Werte der spektralen Signale im Zeitblock für die spektralen Signale ist, und wenn auch die Summe der Energie der spektralen Signale und der Energie benachbarter spektraler Signale wie beispielsweise zweier direkt benachbarter spektraler Signale um mehr als ein voreingestelltes Verhältnis auf die Gesamtenergie in einem die spektralen Signale enthaltenden voreingestellten Band bezogen wird, die spektralen Signale und beispielsweise die zwei direkt benachbarten Signale als tonale Komponenten angesehen. Das voreingestellte Band als die Basis des Vergleichs des Energieverteilungsverhältnisses kann unter Beibehaltung beispielsweise der kritischen Bandbreiten zum niedrigen und hohen Frequenzbereich hin schmaler und breiter gewählt werden, um die psychoakustischen Charakteristiken des menschlichen Gehörsystems zu berücksichtigen.
  • Bei der 11 wird ein maximaler absoluter Wert des spektralen Signals beim Schritt S1 für eine Variable A0 substituiert. Beim Schritt S2 wird die serielle Zahl I des spektralen Signals auf 1 gesetzt. Beim Schritt S3 wird der absolute Wert eines spektralen Signals (nachstehend als spektraler absoluter Wert bezeichnet) in einem Zeitblock für eine Variable R substituiert.
  • Beim Schritt S4 wird entschieden, ob der vorstehende absolute Wert des spektralen Signals lokal größer als die Werte anderer spektraler Signale ist oder nicht, das heißt, ob er das den lokal maximalen absoluten Wert aufweisende spektrale Signal ist oder nicht. Wenn das Resultat NEIN ist, das heißt, wenn der vorstehende absolute spektrale Wert nicht die den lokal maximalen absoluten Wert aufweisende spektrale Komponente ist, geht das Programm zum Schritt S10 über. Andernfalls geht das Programm zum Schritt S5 über.
  • Beim Schritt S5 wird die Größe des Verhältnisses der Variablen A des spektralen Signals, das den lokal maximalen Wert in dem das den lokal maximalen absoluten Wert aufweisende spektrale Signal enthaltenden Zeitblock aufweist, zur Variablen A0 des maximalen absoluten Werts des spektralen Signals mit der des Koeffizienten P verglichen, was eine voreingestellte Größe darstellt (A/A0 > P). Wenn A/A0 > P gilt, geht das Programm zum Schritt S6 über, und andernfalls, das heißt, wenn A/A0 < P gilt, schaltet das Programm zum Schritt S10.
  • Beim Schritt S6 wird der Energiewert der zur spektralen Komponente mit dem lokal maximalen absoluten Wert benachbarten spektralen Komponenten wie beispielsweise die Summe der Energien beider benachbarten spektralen Komponenten für die Variable X substituiert. Beim nächsten Schritt S7 wird der totale Energiewert innerhalb eines voreingestellten Bandes, das die spektrale Komponente mit dem lokal maximalen absoluten Wert und benachbarte spektrale Komponenten enthält, für eine Variable Y substituiert.
  • Beim nächsten Schritt S8 wird das Verhältnis der Variablen X für den Energiewert zur Variablen Y des Energiewertes innerhalb des voreingestellten Bandes mit dem Koeffizienten R verglichen, was ein voreingestelltes Verhältnis anzeigt (X/Y > R). Wenn das Resultat JA ist, das heißt, wenn X/Y > R gilt, schaltet das Programm zum Schritt S9. Wenn das Resultat NEIN ist, das heißt, wenn X/Y < R gilt, schaltet das Programm zum Schritt S10.
  • Beim Schritt S9 werden, wenn das Verhältnis der Energie des spektralen Signals mit dem lokal maximalen absoluten Wert und der benachbarten spektralen Signale zur Energie in dem diese spektralen Signale enthaltenden voreingestellten Band nicht kleiner als ein vorbestimmter Wert ist, das spektrale Signal mit dem lokal maximalen absoluten Wert und die benachbarten spektralen Signale als tonale Komponenten angesehen, und ein solcher Effekt wird registriert.
  • Beim nächsten Schritt S10 wird entschieden, ob die Zahl I der beim Schritt S9 registrierten spektralen Signale gleich der Gesamtzahl N der spektralen Signale (I = N) ist oder nicht. Wenn das Resultat JA ist, das heißt, wenn I = N gilt, ist das Programm beendet. Wenn das Resultat NEIN ist, das heißt, wenn I nicht gleich N ist, schaltet das Programm zum Schritt S11, wo I inkrementiert wird (I = I + 1), das heißt, die Zahl der spektralen Signale wird für jeden Schritt um 1 erhöht, um zum Schritt S3 zur Wiederholung der vorstehenden Prozessschritte zurückzukehren.
  • 12 zeigt den Prozessfluss zur Bestimmung der Zahl spektraler Bestandteilsignale der beim Beispiel der 9 als tonale Komponente registrierten tonalen Komponente.
  • In 12 ist die maximale Zahl der spektralen Bestandteilsignale der tonalen Komponente auf 7 gesetzt. Wenn das Verhältnis der Energie der um das spektrale Signal mit dem lokal maximalen absoluten Wert zentrierten drei oder fünf spektralen Signale zur Energie der um das spektrale Signal mit dem lokal maximalen absoluten Wert zentrierten sieben Signale ein vorbestimmtes Verhältnis überschreitet, wird die Zahl der spektralen Bestandteilsignale der tonalen Komponente auf drei bzw. fünf gesetzt. Wenn beim vorliegenden Beispiel die registrierten tonalen Komponenten vorab klassifiziert werden, so kann eine solche Klassifizierung natürlich zu der gleichen Zeit, zu der die tonalen Komponenten mit der beim Schritt S9 als die Zahl der registrierten tonalen Komponenten ermittelten Zahl des den lokal maximalen absoluten Wert aufweisenden spektralen Signals extrahiert werden, ausgeführt werden.
  • Bei der 12 wird die Zahl der registrierten tonalen Komponenten beim Schritt S21 auf eine Variable M gesetzt. Beim Schritt S22 wird die Zahl I der tonalen Komponente auf 1 gesetzt. Beim Schritt S23 wird der Energiewert der zur lokal maximalen spektralen Komponente benachbarten sieben spektralen Signale für die Variable Y substituiert. Beim Schritt S24 wird der Energiewert der zur lokal maximalen spektralen Komponente benachbarten drei spektralen Signale für die Variable X substituiert.
  • Beim Schritt S25 wird entschieden, ob das Verhältnis des Energiewertes der vorstehenden sieben benachbarten spektralen Signale zum Energiewert der drei spektralen Signale (X/Y) ein voreingestelltes Verhältnis P überschreitet (X/Y > P) oder nicht. Wenn das Resultat JA ist, das heißt, wenn das Verhältnis P überschreitet, schaltet das Programm zum Schritt S26. Wenn das Resultat NEIN ist, das heißt, wenn das Verhältnis P nicht überschreitet, schaltet das Programm zum Schritt S27.
  • Beim Schritt S26 wird die Zahl der spektralen Signale der tonalen Komponente auf drei gesetzt, was als drei spektrale tonale Komponenten registriert wird. Das Programm schaltet dann zum Schritt S31.
  • Beim Schritt S27 wird der Energiewert der um das lokal maximale spektrale Signal zentrierten fünf benachbarten spektralen Signale für die Variable X substituiert. Beim nächsten Schritt S28 wird entschieden, ob das Verhältnis des Energiewertes der sieben benachbarten spektralen Signale zum Energiewert der fünf spektralen Signale (X/Y) ein vorbestimmtes Verhältnis P überschreitet (X/Y > P) oder nicht. Wenn das Resultat JA ist, das heißt, wenn das Verhältnis P überschreitet, schaltet das Programm zum Schritt S29. Wenn das Resultat NEIN ist, das heißt, wenn das Verhältnis P nicht überschreitet, schaltet das Programm zum Schritt S30.
  • Beim Schritt S29 wird die Zahl der spektralen Signale der tonalen Komponente auf fünf gesetzt, was als fünf spektrale tonale Komponenten registriert wird. Das Programm schaltet dann zum Schritt S31.
  • Beim Schritt S30 wird die Zahl der spektralen Signale der tonalen Komponente auf sieben gesetzt, was als sieben spektrale tonale Komponenten registriert wird. Das Programm schaltet dann zum Schritt S31.
  • Beim Schritt S31 wird bestimmt, ob die beim Schritt S21 gesetzte Zahl der tonalen Komponenten gleich der Zahl I der tonalen Komponenten ist (I = M) oder nicht. Wenn das Resultat JA ist, das heißt, wenn I = M gilt, ist das Programm beendet. Wenn das Resultat NEIN ist, das heißt, wenn I nicht gleich M ist, schaltet das Programm zum Schritt S32.
  • Beim Schritt S32 wird I für jeden Schritt um 1 inkrementiert (I = I + 1) um zum Schritt S23 zur Wiederholung der vorstehenden Schritte zurückzukehren.
  • 13 zeigt eine Anordnung beziehungsweise ein Array von Informationsdaten, wenn die wie vorstehend beschrieben in die tonalen und rauschenden Komponenten separierten Informationsdaten entsprechend dem in der US-Patentanmeldung SN 08/306 659 (Anmeldedatum 15. September 1994) beschriebenen, von der Rechtsinhaberin der vorliegenden Anmeldung vorgeschlagenen Codierungsverfahren zur Aufzeichnung oder Übertragung codiert werden. Da das Aufzeichnungsmedium als ein Übertragungspfad seiend angenommen werden kann, bedeutet hier der Ausdruck „Übertragung„, dass er eine Aufzeichnung der Information auf dem Aufzeichnungsmedium umfasst.
  • Bei der 13 werden die tonalen Komponenten durch Gruppen, deren jede aus der gleichen Zahl der spektralen Komponenten besteht, übertragen. Das heißt, beim vorliegenden Beispiel werden als die Information, die alle tonalen Komponenten mit der Zahl der spektralen Bestandteilsignale gleich drei anzeigt, die Zahl der tonalen Komponenten (als die Zahl der Informationsdaten für drei spektrale tonale Komponenten STC3 = 3) und die Inhalte der tonalen Komponenten TCA, TCC und TCD, das heißt die tonalen Komponenteninformationsdaten tcA, tcC und tcD als die partielle tonale Komponenteninformationskette LTC1 übertragen. Die alle tonalen Komponenten mit der Zahl der spektralen Bestandteilkomponenten gleich fünf anzeigende Information, und die alle tonalen Komponenten mit der Zahl der spektralen Bestandteilkomponenten gleich sieben anzeigende Information werden danach auf ähnliche Weise als die partiellen tonalen Komponenteninformationskette LTC2 und die partielle tonale Komponenteninformationskette LTC3 zusammen mit dem Inhalt der tonalen Komponente TCB, das heißt den tonalen Komponenteninformationsdaten tcB übertragen. Wenn die tonalen Komponenten durch Gruppen, deren jede die gleiche Zahl der spektralen Bestandteilsignale aufweist, übertragen werden, wird es nicht notwendig, die Information betreffend die Zahl spektraler Signale, welche die spektralen Bestandteilsignale bilden, zu übertragen, so dass in dem Fall, bei dem eine große Zahl tonaler Komponenten vorhanden ist, eine effiziente Codierung möglich wird.
  • Die Information der tonalen Komponente tc weist die zentrale Positionsinformation CP, welche das Zentrum der Spektrumposition der tonalen Komponenten anzeigt, beispielsweise CP = 31 für die tonale Komponente TCC, die Information bezüglich der Quantisierungsschritte, welche die Zahl von Quantisierungsbits QP anzeigt (beispielsweise QP = 6), die Information bezüglich der Normierungskoeffizienten NP und die Information bezüglich jeweiliger Signalkomponenten, welche die normierten und quantisierten Werte der die tonalen Komponenten wie beispielsweise die Information SC1, SC2, ... SC3 bildenden verbleibenden spektralen Signale auf.
  • Die Information bezüglich der rauschenden Komponenten wird in der Sequenz von nc1, nc2, nc3, nc4 und nc5, die jeweils den Bändern b1 bis b5 der 10 zugeordnet sind, aufgezeichnet oder übertragen. Die Information bezüglich der rauschenden Komponente nc enthält die Information bezüglich der Quantisierungsschritte QP (QP = 3 im Fall der Information nc1), die Information bezüglich der Normierungskoeffizienten NP und die Information bezüglich jeweils normierter und quantisierter Signalkomponenten wie beispielsweise die Information SC1, SC2, ... SC3.
  • Jedoch ist es bei der Codekette des vorliegenden Beispiels trotz der Tatsache, dass es keine durch fünf spektrale Signale gebildete tonale Komponente gibt, notwendig, die Zahl spektraler Signale zu übertragen. Bei dem dargestellten Beispiel sind nur drei unterschiedliche Zahlen der die tonalen Komponenten bildenden spektralen Signale zugelassen. Jedoch ist es bei der Gestaltungsanweisung (design statement) zur Codierung, bei der die Informationsdaten abhängig von den variablen Kompressionsverhältnissen und dem geforderten Tonqualitätsniveau mit dem gleiche Codierungsverfahren codiert werden müssen, notwendig, eine große Zahl spektraler Signale, welche die tonalen Komponenten in der Gestaltungsanweisung bilden, zuzulassen, während es nicht effizient ist, die Zahl der Informationsdaten bezüglich der tonalen Komponenten für die nicht benutzte partielle Kette der tonalen Komponentendaten zu übertragen.
  • 14 zeigt ein Beispiel einer Codekettebeschaffenheit in dem Fall, dass das in 9 gezeigte Signal gemäß dem Übertragungsverfahren der vorliegenden Erfindung, bei dem der vorstehend erwähnte Punkt berücksichtigt ist, codiert wird.
  • Bei der 14 wird, wie darin spezifiziert, zuerst die Zahl der partiellen Ketten der Information bezüglich der tonalen Komponenten nLTC (beim Beispiel der 9 und 14 gilt nLTC = 2) übertragen, gefolgt von der Zahl partieller Ketten der Information bezüglich der tonalen Komponenten LTC11 und LTC12. Beim Beispiel der 14 werden die Zahl N11, welche die Zahl der Informationsdaten tc für die tonalen Komponenten in der partiellen Kette LTC11 anzeigt (beim vorliegenden Beispiel gilt N11 = 3), die Zahl der die spektralen Komponenten nsp bildenden spektralen Signale, welche die Zahl der die tonalen Komponenten bildenden spektralen Signale anzeigt (beim vorliegenden Beispiel gilt nsp = 3) und die tatsächliche Information bezüglich der tonalen Komponenten tcA, tcC und tcD als die partielle Kette LCT11 übertragen. Da die Zahl irgendwelcher der die tonalen Komponenten bildenden spektralen Signale beim vorliegenden Beispiel nicht gleich 5 ist, wird eine solche partielle Informationskette nicht codiert. Als die partielle Kette LC12 werden die Zahl N12, welche die Zahl der Informationsdaten tc für die tonalen Komponenten in der partiellen Kette LTC12 anzeigt (beim vorliegenden Beispiel gilt N12 = 3), die Zahl von die tonale Komponente nsp bildenden spektralen Signalen, welche die Zahl der die tonale Komponente bildenden spektralen Signale anzeigt (beim vorliegenden Beispiel gilt nsp = 7) und die aktuelle Information bezüglich der tonalen Komponenten tcB übertragen. Da es keine Notwendigkeit für eine Übertragung der Information bezüglich der nutzlosen partiellen Informationskette der tonalen Komponente gibt, kann eine effiziente Codierung erzielt werden, insbesondere wenn unterschiedliche Arten der partiellen Informationskette aus dem im vorstehenden diskutierten Grund zulässig sein müssen.
  • Beim Beispiel der 4 wird die partielle Informationskette bezüglich der tonalen Komponenten durch Gruppierung auf der Basis der Zahl der die tonale Komponente bildenden spektralen Signale erzeugt. Jedoch kann das Verfahren der vorliegenden Erfindung auf einen solchen Fall angewendet werden, bei dem die partiellen Informationsketten für die tonalen Komponenten durch Gruppierung der Information bezüglich der tonalen Komponenten auf der Basis anderer Attribute als die Zahl der die tonale Komponente bildenden spektralen Signale gebildet werden.
  • Insbesondere kann die Gruppierung auf der Basis der Information bezüglich der Quantisierungsschritte gemacht werden. Bezugnehmend auf die 9, 15, 17 und 18 wird ein illustratives Beispiel einer Gruppierung auf der Basis der Information bezüglich der Quantisierungsschritte erläutert.
  • Es sei angenommen, dass die Signalkomponenten separierende Schaltung 602, wie in 9 gezeigt, tonale Komponenten von Frequenzkomponenten separiert. Beim vorliegenden Beispiel sind, wie früher erläutert, vier tonale Komponenten TCA, TCB, TCC und TCD extrahiert worden. Wenn erlaubt ist, die spektralen Komponenten bei den mit der Information bezüglich des Quantisierungsschritts QP = 6 korrespondierenden Quantisierungsschritten oder bei den mit der Information bezüglich des Quantisierungsschritts QP = 4 korrespondierenden Quantisierungsschritten zu quantisieren, bestimmt die Quantisierungsschritt-Entscheidungsschaltung in der tonale Komponenten codierenden Schaltung 603 den Quantisierungsschritt der jeweiligen tonalen Komponenten in der folgende Weise.
  • Die 18 zeigt einen illustrativen Verarbeitungsfluss zur Gruppierung der tonalen Komponenten abhängig von Quantisierungsschritten durch die tonale Komponenten codierende Schaltung 603. In dieser Figur wird eine Gruppierung bezüglich der vorher extrahierten und durch die Verarbeitung nach 11 registrierten tonalen Komponenten gemacht. Beim vorliegenden Beispiel werden, wenn das Verhältnis des Energiewertes von um das zentrale spektrale Signal der tonalen Komponente zentrierten fünf spektralen Signalen zum Energiewert in einem voreingestellten Band den Wert P überschreitet, die tonalen Komponenten als die mit der Information bezüglich der Quantisierungsschritte QP = 6 quantisierten tonalen Komponenten seiend gruppiert. Andernfalls werden die tonalen Komponenten als die mit der Information bezüglich der Quantisierungsschritte QP = 4 quantisierten tonalen Komponenten seiend gruppiert.
  • Nach 18 wird beim Schritt S21 die registrierte Zahl der tonalen Komponenten für eine Variable M substituiert. Beim Schritt S22 wird die Zahl I der tonalen Komponenten auf 1 gesetzt. Beim nächsten Schritt S23 wird der Energiewert des voreingestellten Bandes für die Variable Y substituiert. Beim Schritt S24 wird der Energiewert der benachbarten fünf spektralen Signale für die Variable X substituiert.
  • Beim Schritt S25 wird entschieden, ob das Verhältnis der Variablen X für den Energiewert der fünf benachbarten spektralen Signale zur Variablen Y der Energie des voreingestellten Bandes größer als der Wert P ist (X/Y > P) oder nicht. Wenn das Resultat JA ist, das heißt, wenn X/Y größer als P ist, schaltet das Programm zum Schritt S26. Wenn das Resultat NEIN ist, das heißt, wenn X/Y kleiner als P ist, schaltet das Programm zum Schritt S27.
  • Beim Schritt S26 werden die tonalen Komponenten als die tonalen Komponenten mit der Quantisierungsschrittinformation QP = 6 seiend gruppiert oder registriert. Beim Schritt S27 werden die tonalen Komponenten als die tonalen Komponenten mit der Quantisierungsschrittinformation QP = 4 seiend gruppiert oder registriert. Das Programm schaltet dann zum Schritt S28.
  • Beim Schritt S28 wird entschieden, ob die Zahl I der tonalen Komponenten gleich der Variablen M für die Zahl der registrierten tonalen Komponenten ist oder nicht. Wenn das Resultat JA ist, kommt die Verarbeitung zu einem Abschluss. Wenn das Resultat NEIN ist, schaltet das Programm zum Schritt S29, wo die Zahl I der tonalen Komponenten inkrementiert wird (I = I + 1), um zum Schritt S23 zur Wiederholung der vorstehenden Prozessschritte zurückzukehren.
  • Der Quantisierungsschritt für jede der tonalen Komponenten wird auf diese Weise durch die tonale Komponenten codierende Schaltung 603 bestimmt. Beispielsweise werden TCA, TCC und TCD mit dem mit der Information bezüglich des Quantisierungsschritts QP = 6 korrespondierenden Quantisierungsschritt quantisiert, um tcA, tcC und tcD zu ergeben. Zusätzlich zur Information bezüglich der Zahl der spektralen Signale werden die Information bezüglich der in der vorstehend beschriebenen Weise quantisierten tonalen Komponenten, die Information bezüglich des Quantisierungsschritts und die Information bezüglich der Gruppierung der Codekette erzeugenden Schaltung 605 zugeführt, die dann eine in 15 gezeigte Codekette auf der Basis der vorstehenden Daten ausgibt.
  • 15 zeigt ein Beispiel, bei dem die partielle Informationskette auf der Basis der Information bezüglich des Quantisierungsschritts gebildet wird. Beim vorliegenden Beispiel ist angenommen, dass die Zahl der die tonalen Komponenten bildenden spektralen Signale für alle tonalen Komponenten die gleiche ist. Natürlich kann die Zahl der die tonalen Komponenten bildenden spektralen Signale als ein Teil der Information bezüglich der jeweiligen tonalen Komponenten seiend codiert werden.
  • Beim vorliegenden Beispiel der 15 wird zuerst die Zahl der partiellen Informationsketten der tonalen Komponenten nLTC (beim Beispiel der 15 gilt nLTC = 2) übertragen, gefolgt von einer darin spezifizierten Zahl partieller Informationsketten LTC21 und LTC22. Beim Beispiel der 15 werden die Zahl N21, welche die Zahl der tonalen Komponenten tc in der partiellen Informationskette LTC21, das heißt die Zahl der mit dem mit der Information bezüglich des Quantisierungsschritts QP = 6 korrespondierenden Quantisierungsschritt quantisierten tonalen Komponenten, anzeigt (hier gilt N21 = 3), die Information bezüglich der Quantisierungsschritte QP (hier gilt QP = 6) und die Information bezüglich tatsächlich quantisierter tonaler Komponenten tcA, tcC und tcD in dieser Reihenfolge als die partielle Codekette für die tonalen Komponenten LTC21 übertragen. Andererseits werden die Zahl N22, welche die Zahl der tonalen Komponenten tc in der partiellen Informationskette LTC22, das heißt die Zahl der mit dem mit der Information bezüglich des Quantisierungsschritts QP = 4 korrespondierenden Quantisierungsschritt quantisierten tonalen Komponenten, anzeigt (hier gilt N = 1), die Information bezüglich der Quantisierungsschritte QP (hier gilt QP = 4) und die Information bezüglich tatsächlich quantisierter tonaler Komponenten tcB in dieser Reihenfolge als die partielle Informationskette für die tonalen Komponenten LTC22 übertragen.
  • Dies eliminiert die Notwendigkeit einer richtigen Verteilung der Information bezüglich der Quantisierungsschritte auf die jeweiligen tonalen Komponenten. Beispielsweise kann die Information bezüglich der tonalen Komponenten tcC der 15 nur aus der zentralen Positionsinformation CP, der Normierungskoeffizienteninformation NP und der Information bezüglich der jeweiligen Signalkomponenten SC gebildet sein. Infolgedessen kann beim Beispiel der 15 die Codierungseffizienz verbessert werden, insbesondere wenn es eine große Zahl von tonalen Komponenten gibt.
  • Natürlich kann die Sequenz einer Übertragung der jeweiligen Informationsdaten von der vorstehend beschriebenen geändert werden. Beispielsweise können die Information bezüglich des Quantisierungsschritts OP = 6, die korrespondierende Zahl N21 = 3 der Informationsdaten bezüglich der tonalen Komponenten, die Information bezüglich des Quantisierungsschritts OP = 4 und die korrespondierende Zahl N22 = 1 der Informationsdaten bezüglich der tonalen Komponenten zuerst als eine Gesamtheit übertragen werden, und die Information bezüglich der tonalen Komponenten, welche die Inhalte der tonalen Komponenten tcn anzeigen, kann danach übertragen werden.
  • 19 zeigt in einem Flussdiagramm den Verarbeitungsfluss bei der Decodierung der mit der in 15 gezeigten Codekette korrespondierenden Kette der Information der tonalen Komponenten. Beim Flussdiagramm der 19 werden die Zahlen der in den jeweiligen Gruppen enthaltenen tonalen Komponenten und die entsprechend der Information codierten tonalen Komponenten nacheinander decodiert.
  • Nach 19 wird beim Schritt S31 die Zahl der Informationsdaten betreffend die tonalen Komponenten mit der Information bezüglich des Quantisierungsschritts QP = 6 für eine Variable M1 substituiert. Beim nächsten Schritt S32 werden die in der Gruppe enthaltenen tonalen Komponenten zur Bildung von M1 Informationsdaten bezüglich der tonalen Komponenten decodiert.
  • Beim Schritt S33 wird die Zahl von Informationsdaten bezüglich der tonalen Komponenten mit der Information bezüglich des Quantisierungsschritts QP = 4 für eine Variable M2 substituiert. Beim nächsten Schritt S34 werden die in dieser Gruppe enthaltenen tonalen Komponenten zur Bildung von M2-Informationsdaten bezüglich der tonalen Komponenten decodiert.
  • Die 16 zeigt ein anderes Beispiel einer durch Codierung entsprechend dem Verfahren der vorliegenden Erfindung erzeugten Codekette. Beim vorliegenden Beispiel wird die Information bezüglich der tonalen Komponenten auf der Basis der Information bezüglich der Zahl der spektralen Signale der tonalen Komponenten und der Information bezüglich der Quantisierungsschritte gruppiert. In einem solchen Fall wird die Codierungseffizienz erhöht, da weder die Information bezüglich der Zahl der die tonalen Komponenten bildenden spektralen Signale noch die Information bezüglich des Quantisierungsschritts die Information bezüglich der tonalen Komponenten ist und es nur ausreicht, die tonalen Komponenten von einer partiellen Informationskette bezüglich der tonalen Komponenten zu einer anderen zu codieren. Bei dem in 13 gezeigten Verfahren muss die partielle Informationskette der tonalen Komponenten für alle Kombinationen der Zahlen der spektralen Komponenten und die Information bezüglich des Quantisierungsschritts codiert werden. Da es bei dem Verfahren der vorliegenden Erfindung ausreicht, die partiellen Informationsketten bezüglich der tonalen Komponenten, die nicht nutzlose Ketten sind, zu codieren, kann die Codierungseffizienz signifikant verbessert werden.
  • Wenn bei dem vorstehenden Beispiel die Zahl der partiellen Informationsketten bezüglich der tonalen Komponenten codiert wird, so ist es auch möglich, die Kennzeicheninformation, die anzeigt, ob die partielle Informationskette bezüglich der jeweiligen tonalen Komponenten zu codieren ist oder nicht, zu benutzen. Eine solche Ausbildung kann im Rahmen der vorliegenden Erfindung enthalten sein. Wie bei den vorstehend beschriebenen Ausführungsformen gezeigt ist es jedoch effizienter, die Zahl der codierten partiellen Informationsketten zu codieren.
  • Bei der vorstehenden Beschreibung wird die zentrale Positionsinformation CP als die Positionsinformation für die tonalen Komponenten übertragen. Es ist jedoch möglich, die niedrigste spektrale Signalposition für jede tonale Komponente wie beispielsweise 30 für die tonale Komponente TCC anstelle der zentralen Positionsinformation zu übertragen.
  • Wenn es zur Erhöhung der Codierungseffizienz vorteilhaft ist, spektrale Komponenten, die in der Nähe spezifizierter Frequenzen konzentrierte spektrale Energien aufweisen, als die tonalen Komponenten seiend zu separieren und codieren, muss die Signalseparation nicht notwendig auf der spektralen Energie basiert sein, sondern es können gemäß der vorliegenden Erfindung die mit der Positionsinformation bezüglich der Frequenzachse codierten spektralen Komponenten eines spezifizierten Bereichs in den tonalen Komponenten enthalten sein.
  • Wenn außerdem bei der vorstehenden Erläuterung das Aufzeichnungsmedium die Platte 609 ist, so kann die Platte auch eine optische Platte, eine magnetooptische Platte oder eine Phasenübergangsplatte sein. Das Aufzeichnungsmedium kann auch ein bandförmiges Aufzeichnungsmedium, das in einer Audiokassette oder einer Videokassette verwendet ist, ein plattenförmiges Aufzeichnungsmedium wie beispielsweise eine Festplatte oder eine Diskette oder ein Halbleiteraufzeichnungsmedium wie beispielsweise eine IC-Speicherkarte sein.
  • Die vorstehende Beschreibung ist hauptsächlich in Verbindung mit akustischen Signalen gegeben. Jedoch kann die vorliegende Erfindung auch generell zur Codierung von Wellenformsignalen verwendet werden. Die vorliegende Erfindung kann jedoch am effizientesten bei akustischen Signalen angewendet werden, da die Information bezüglich der tonalen Komponenten eine signifikante Bedeutung in Verbindung mit dem menschlichen Gehörsystem hat.
  • Wenn die jeweiligen tonalen Komponenten zur Codierung der tonalen Komponenten normiert und nachfolgend quantisiert werden, so kann die vorliegende Erfindung auch bei den ohne Normierung quantisierten tonalen Komponenten angewendet werden. Jedoch kann die Codierungseffizienz wie bei den vorstehend beschriebenen Ausführungsformen durch zuerst Normieren und dann Quantisieren der tonalen Komponenten verbessert werden.
  • Das Codierungsverfahren für die rauschenden Komponenten der vorliegenden Erfindung ist nicht auf eine Requantisierung, gefolgt von einer Codierung beschränkt, sondern kann auch bei Normierung, gefolgt von Codierung angewendet werden.
  • Die vorliegende Erfindung stellt ein illustratives Verfahren zur effizienten Realisierung des in unserer mitanhängigen PCT/JP 94/00880 und US-Patentanmeldung SN 08/308659 beschriebenen Verfahrens bereit und kann in Verbindung mit den in diesen mitanhängigen Anmeldungen vorgeschlagenen verschiedenen Verfahren angewendet werden.
  • Mit dem Informationscodierungsverfahren und -gerät gemäß der vorliegenden Erfindung kann eine hocheffiziente Codierung durch Klassifizieren des ersten Signals als die tonalen Komponenten in partielle Informationsketten entsprechend der gemeinsamen Information, nicht Codieren von nutzlosen der partiellen Informationsketten und gemeinschaftliches Codieren der die codierten partiellen Informationsketten anzeigenden Information, das heißt durch Separieren der tonalen Komponenten in Gruppen, nicht Codieren der die tonalen Komponenten nicht enthaltenden Gruppen und Codieren der Zahl der codierten Gruppen erzielt werden.
  • Mit dem Informationsübertragungsverfahren und dem Informationsaufzeichnungsmedium gemäß der vorliegenden Erfindung kann durch Übertragen der durch das Informationscodierungsverfahren und -gerät gemäß der vorliegenden Erfindung codierten Information eine effiziente Übertragung erzielt werden.
  • Mit dem Decodierungsverfahren und -gerät gemäß der vorliegenden Erfindung wird die Information, welche die codierten partiellen Informationsketten mit Ausnahme der nicht codierten nutzlosen partiellen Informationsketten anzeigt, decodiert, und auf der Basis der decodierten Resultate wird eine Decodierung der partiellen Informationsketten, die im ersten Signal der entsprechend der gemeinsamen Information klassifizierten tonalen Komponenten enthalten sind, durchgeführt.
  • Mit dem Verfahren der vorliegenden Erfindung können tonale Signale effizient codiert werden, so dass eine hocheffiziente Codierung als Ganzes erzielt werden kann. Der vorteilhafte Effekt der vorliegenden Erfindung kann am signifikantesten manifestiert werden, wenn die Codierung beim Zusammentreffen mit verschiedenen Kompressionsverhältnissen und Tonqualitätniveaus entsprechend dem gleichen Standard zu erzielen ist.

Claims (33)

  1. Verfahren zur Erzeugung eines Eingabesignals, aufweisend die Schritte: Transformieren (601) des Eingabesignals in Frequenzkomponenten, Separieren (602) der Frequenzkomponenten in ein aus tonalen Komponenten (TCA ... TCD), die eine steile Energieverteilung aufweisen, zusammengesetztes erstes Signal und ein aus anderen Komponenten zusammengesetztes zweites Signal, Codieren (603) des ersten Signals mittels einer ersten Codierung, Codieren (604) des zweiten Signals mittels einer zweiten Codierung, und Erzeugen (605) einer ersten Codekette zur Übertragung oder Aufzeichnung auf der Basis von durch die erste Codierung erzeugten Signalen, wobei die erste Codekette partielle Ketten (LTC) aus tonalen Komponentendaten enthält, in denen tonale Komponentendaten (tcA ... tcD), welche gleiche Werte wenigstens eines von Parametern (nsp, QP) aufweisen, zur Signalseparation (602) und ersten Codierung (603) gruppiert werden.
  2. Verfahren nach Anspruch 1, wobei die tonalen Komponentendaten (tcA ... tcD) in den partiellen Ketten (LTC) entsprechend dem Parameter (nsp), der die Zahl der spektralen Signale anzeigt, welche die von der Signalseparation (602) separierten tonalen Komponenten (TCA ... TCD) bilden, gruppiert werden.
  3. Verfahren nach Anspruch 1 oder 2, wobei der erste Codierungsschritt (603) einen Quantisierungsschritt (303) zum Quantisieren des ersten Signals enthält und die tonalen Komponentendaten (tcA ... tcD) in den partiellen Ketten (LTC) ent sprechend dem die Information der Quantisierung (303) anzeigenden Parameter (QP) gruppiert werden.
  4. Verfahren nach Anspruch 3, wobei der Parameter (QP) den Quantisierungsschritt anzeigt.
  5. Verfahren nach einem der Ansprüche 1 bis 4, wobei die erste Codekette Information (STC3, STC5, STC7; nLTC) enthält, welche die Beschaffenheit der partiellen Ketten (LTC) anzeigt.
  6. Verfahren nach Anspruch 5, wobei die Information (nLTC), welche die Beschaffenheit der partiellen Ketten anzeigt, die Zahl der partiellen Ketten (LTC) anzeigt.
  7. Verfahren nach einem der Ansprüche 1 bis 6, außerdem aufweisend die Schritte: Erzeugen (605) einer zweiten Codekette auf der Basis des zweiten Signals, und Übertragen (605) der ersten und zweiten Codekette.
  8. Verfahren nach einem der Ansprüche 1 bis 7, wobei die anderen Komponenten Rauschspektren sind.
  9. Verfahren nach Anspruch 8, wobei die Frequenzkomponenten in Bänder (b1 ... b5) gruppiert werden und die zweite Codekette aus den Bändern (b1 ... b5) zugeordneten rauschigen Komponenten zusammengesetzt wird.
  10. Verfahren zur Decodierung einer aus codierten Signalen zusammengesetzten Codekette, aufweisend die Schritte: Decodieren (701) eines mit einem aus tonalen Komponenten (TCA ... TCD), die eine steile Energieverteilung aufweisen, gebildeten ersten Signal korrespondierenden codierten Signals zur Erzeugung erster decodierter Signale mittels einer ersten Decodierung, Decodieren (701) eines mit einem aus anderen Komponenten gebildeten zweiten Signal korrespondierenden codierten Signals zur Erzeugung zweiter decodierter Signale mittels einer zweiten Decodierung, und Synthetisieren (704) des ersten und zweiten decodierten Signals zur Wiederherstellung eines originalen Signals, wobei eine erste Codekette partielle Ketten (LTC) aus tonalen Komponentendaten enthält, in denen tonale Komponentendaten (tcA ... tcD), welche gleiche Werte wenigstens eines von Parametern (nsp, QP) aufweisen, zur Signalseparation (602) und ersten Codierung (603) gruppiert werden, und wobei die erste Decodierung (701) oder die Wiederherstellung den Parameter (nsp, QP) zur Decodierung oder Wiederherstellung mehrerer codierter Signale verwendet.
  11. Verfahren nach Anspruch 10, wobei die tonalen Komponentendaten (tcA ... tcD) in den partiellen Ketten (LTC) entsprechend dem Parameter (nsp), der die Zahl der spektralen Signale anzeigt, welche die von der Signalseparation (602) separierten tonalen Komponenten (TCA ... TCD) bilden, gruppiert werden.
  12. Verfahren nach Anspruch 10, wobei die erste Decodierung (702) eine inverse Quantisierung zum inversen Quantisieren des ersten Signals enthält und die tonalen Komponenten (TCA ... TCD) in den partiellen Ketten (LTC) entsprechend dem die Information der Quantisierung anzeigenden Parameter (nsp) gruppiert werden.
  13. Verfahren nach Anspruch 12, wobei der Parameter (QP) den Quantisierungsschritt anzeigt.
  14. Verfahren nach einem der Ansprüche 10 bis 13, wobei die erste Codekette Information (STC3, STC5, STC7; nLTC) enthält, welche die Beschaffenheit der partiellen Ketten (LTC) anzeigt.
  15. Verfahren nach einem der Ansprüche 10 bis 14, wobei die Information (nLTC), welche die Beschaffenheit der partiellen Ketten anzeigt, die Zahl der partiellen Ketten (LTC) anzeigt.
  16. Verfahren nach einem der Ansprüche 10 bis 15, wobei die anderen Komponenten Rauschspektren sind.
  17. Verfahren nach Anspruch 16, wobei die Frequenzkomponenten in Bänder (b1 ... b5) gruppiert werden, und eine zweite Codekette aus den Bändern (b1 ... b5) zugeordneten rauschigen Komponenten (nc1 ... nc5) zusammengesetzt werden.
  18. Gerät zur Codierung eines Eingabesignals, aufweisend: eine Einrichtung (601) zur Transformation des Eingabesignals in Frequenzkomponenten; eine Einrichtung (602) zur Separation der Frequenzkomponenten in ein aus tonalen Komponenten (TCA ... TCD), die eine steile Energieverteilung aufweisen, zusammengesetztes erstes Signal und ein aus anderen Komponenten zusammengesetztes zweites Signal, eine Einrichtung (603) zur Codierung des ersten Signals mittels einer ersten Codierung, eine Einrichtung (604) zur Codierung des zweiten Signals mittels einer zweiten Codierung, und eine Einrichtung (605) zur Erzeugung einer ersten Codekette zur Übertragung oder Aufzeichnung auf der Basis von durch die erste Codierung und die zweite Codierung erzeugten codierten Signalen, wobei die erste Codekette partielle Ketten (LTC) tonaler Komponentendaten enthält, in denen tonale Komponentendaten (tcA ... tcD), welche gleiche Werte wenigstens eines von Parametern (nsp, QP) aufweisen, zur Signalseparation (602) und ersten Codierung (603) gruppiert sind.
  19. Gerät nach Anspruch 18, wobei die tonalen Komponentendaten (tcA ... tcD) in den partiellen Ketten (LTC) entsprechend dem Parameter (nsp), der die Zahl der spektralen Signale an zeigt, welche die von der Signalseparation (602) separierten tonalen Komponenten (tcA ... tcD) bilden, gruppiert sind.
  20. Gerät nach Anspruch 18, wobei die erste Codierung (603) eine Quantisierung (303) zum Quantisieren des ersten Signals enthält und die tonalen Komponentendaten (tcA ... tcD) in den partiellen Ketten (LTC) entsprechend dem die Information der Quantisierung (303) anzeigenden Parameter (QP) gruppiert sind.
  21. Gerät nach Anspruch 20, wobei der Parameter (QP) den Quantisierungsschritt anzeigt.
  22. Gerät nach einem der Ansprüche 18 bis 21, wobei die Codekette Information (STC3, STC5, STC7; nLTC), welche die Beschaffenheit der partiellen Ketten (LTC) anzeigt, enthält.
  23. Gerät nach Anspruch 22, wobei die Information (nLTC), welche die Beschaffenheit der partiellen Ketten anzeigt, die Zahl der partiellen Ketten (LTC) anzeigt.
  24. Gerät nach einem der Ansprüche 18 bis 23, wobei die anderen Komponenten Rauschspektren sind.
  25. Gerät nach Anspruch 24, wobei die Frequenzkomponenten in Bänder (b1 ... b5) gruppiert sind und eine zweite Codekette aus den Bändern (b1 ... b5) zugeordneten rauschigen Komponenten (nc1 ... nc5) zusammengesetzt ist.
  26. Gerät zur Decodierung einer aus codierten Signalen zusammengesetzten Codekette, aufweisend: eine erste Decodierungseinrichtung (701) zur Decodierung des mit einem aus tonalen Komponenten, die eine steile Energieverteilung aufweisen, gebildeten ersten Signal korrespondierenden codierten Signals zur Erzeugung erster decodierter Signale mittels einer ersten Decodierung, eine zweite Decodierungseinrichtung (701) zur Decodierung des mit einem aus anderen Komponenten gebildeten zweiten Signal korrespondierenden codierten Signals zur Erzeugung zweiter decodierter Signale mittels einer zweiten Decodierung, und eine Einrichtung (704) zum Synthetisieren des ersten und zweiten decodierten Signals zur Wiederherstellung eines originalen Signals, wobei eine erste Codekette partielle Ketten (LTC) aus tonalen Komponentendaten enthält, in denen tonale Komponentendaten (tcA ... tcD), welche gleiche Werte wenigstens eines von Parametern (nsp, QP) aufweisen, zu einer Signalseparation (602) und ersten Codierung (603) gruppiert sind, und wobei die erste Decodierungseinrichtung (701) oder die Wiederherstellungseinrichtung den Parameter (nsp, QP) zur Decodierung oder Wiederherstellung der mehreren codierten Signale verwendet.
  27. Gerät nach Anspruch 26, wobei die tonalen Komponentendaten (tcA ... tcD) in den partiellen Ketten (LTC) entsprechend dem Parameter (nsp), der die Zahl der spektralen Signale anzeigt, welche die von der Signalseparation (602) separierten tonalen Komponenten (tcA ... tcD) bilden, gruppiert sind.
  28. Gerät nach Anspruch 26, wobei die erste Decodierung (702) eine inverse Quantisierung zum inversen Quantisieren des ersten Signals enthält und die tonalen Komponenten (tcA ... tcD) in den partiellen Ketten (LTC) entsprechend dem die Information der Quantisierung anzeigenden Parameter (nsp) gruppiert sind.
  29. Gerät nach Anspruch 28, wobei der Parameter (QP) den Quantisierungsschritt anzeigt.
  30. Gerät nach einem der Ansprüche 26 bis 29, wobei die Codekette Information (STC3, STC5, STC7; nLTC) enthält, welche die Beschaffenheit der partiellen Ketten (LTC) anzeigt.
  31. Gerät nach Anspruch 30, wobei die Information (nLTC), welche die Beschaffenheit der partiellen Ketten anzeigt, die Zahl der partiellen Ketten (LTC) anzeigt.
  32. Gerät nach einem der Ansprüche 26 bis 29, wobei die anderen Komponenten Rauschspektren sind.
  33. Gerät nach Anspruch 32, wobei die Frequenzkomponenten in Bänder (b1 ... b5) gruppiert sind und eine zweite Codekette aus den Bändern (b1 ... b5) zugeordneten rauschigen Komponenten (nc1 ... nc5) zusammengesetzt ist.
DE69533500T 1994-04-01 1995-03-31 Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten Expired - Lifetime DE69533500T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP6485494 1994-04-01
JP6485494 1994-04-01
JP6485394 1994-04-01
JP6485394 1994-04-01
PCT/JP1995/000635 WO1995027335A1 (fr) 1994-04-01 1995-03-31 Methode et dispositif de codage et de decodage d'informations, methode de transmission d'informations et support d'enregistrement de l'information

Publications (2)

Publication Number Publication Date
DE69533500D1 DE69533500D1 (de) 2004-10-21
DE69533500T2 true DE69533500T2 (de) 2005-09-08

Family

ID=26405956

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69533500T Expired - Lifetime DE69533500T2 (de) 1994-04-01 1995-03-31 Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten

Country Status (14)

Country Link
US (1) US5680130A (de)
EP (1) EP0713295B1 (de)
JP (1) JP3203657B2 (de)
KR (1) KR100352352B1 (de)
CN (1) CN1103141C (de)
AT (1) ATE276607T1 (de)
BR (1) BR9505863A (de)
CA (1) CA2163371C (de)
DE (1) DE69533500T2 (de)
ES (1) ES2224121T3 (de)
MY (1) MY130167A (de)
PL (1) PL311812A1 (de)
TW (1) TW301829B (de)
WO (1) WO1995027335A1 (de)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
TW295747B (de) * 1994-06-13 1997-01-11 Sony Co Ltd
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
JPH09101799A (ja) * 1995-10-04 1997-04-15 Sony Corp 信号符号化方法及び装置
JPH09148937A (ja) * 1995-11-21 1997-06-06 Sony Corp 符号化処理方法、復号化処理方法、符号化処理装置および復号化処理装置
US6324301B1 (en) * 1996-01-24 2001-11-27 Lucent Technologies Inc. Adaptive postfilter for low bitrate visual telephony noise removal
JPH1084284A (ja) * 1996-09-06 1998-03-31 Sony Corp 信号再生方法および装置
TW429700B (en) * 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
TW384434B (en) 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
US7016308B1 (en) * 1999-03-19 2006-03-21 Broadband Royalty Corporation Digital return path for hybrid fiber/coax network
DE60017825T2 (de) * 1999-03-23 2006-01-12 Nippon Telegraph And Telephone Corp. Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür
US6967966B1 (en) 1999-11-03 2005-11-22 Adc Telecommunications, Inc. Digital return path for hybrid fiber/coax network
US7031335B1 (en) 1999-11-03 2006-04-18 Adc Telecommunications, Inc. Digital node for hybrid fiber/coax network
US6519773B1 (en) 2000-02-08 2003-02-11 Sherjil Ahmed Method and apparatus for a digitized CATV network for bundled services
WO2002049218A1 (en) * 2000-12-14 2002-06-20 Sony Corporation Encoder and decoder
JP4622164B2 (ja) * 2001-06-15 2011-02-02 ソニー株式会社 音響信号符号化方法及び装置
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
ATE377339T1 (de) * 2002-07-12 2007-11-15 Koninkl Philips Electronics Nv Audio-kodierung
US6750791B1 (en) * 2003-02-07 2004-06-15 Nokia Corporation Method and device for text data compression
US7022980B2 (en) * 2004-02-02 2006-04-04 Agilent Technologies, Inc. Spectral axis transform
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals
WO2006059288A1 (en) * 2004-12-03 2006-06-08 Koninklijke Philips Electronics N.V. Parametric audio coding comprising balanced quantization scheme
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
US8073395B2 (en) * 2006-03-07 2011-12-06 Samsung Electronics Co., Ltd. Channel sensing based on self-signal suppression
KR101291672B1 (ko) 2007-03-07 2013-08-01 삼성전자주식회사 노이즈 신호 부호화 및 복호화 장치 및 방법
EP2720222A1 (de) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur wirksamen Synthese von Sinosoiden und Sweeps durch Verwendung spektraler Muster
CN105336344B (zh) * 2014-07-10 2019-08-20 华为技术有限公司 杂音检测方法和装置
CN113112993B (zh) * 2020-01-10 2024-04-02 阿里巴巴集团控股有限公司 一种音频信息处理方法、装置、电子设备以及存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4485337A (en) * 1983-05-09 1984-11-27 Control Data Corporation Servo data driven motor speed control
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
JPS62259263A (ja) * 1986-05-06 1987-11-11 Pioneer Electronic Corp スピンドルサ−ボ引込み方法及びその装置
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
IL89672A (en) * 1988-04-29 1994-04-12 Motorola Inc Spectral efficient method of transmitting information signal
JPH06101197B2 (ja) * 1988-10-12 1994-12-12 パイオニア株式会社 Clvディスク駆動用スピンドルサーボループのループゲイン制御方法
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JP2542097B2 (ja) * 1990-01-16 1996-10-09 パイオニア株式会社 クロック生成用pll回路を含む読取線速度可変型ディスク記録情報再生装置
JPH0472909A (ja) * 1990-07-13 1992-03-06 Sony Corp オーディオ信号の量子化誤差低減装置
RU2090973C1 (ru) * 1991-03-29 1997-09-20 Сони Корпорейшн Способ кодирования сигналов
JPH0539442A (ja) * 1991-08-02 1993-02-19 Genji Naemura 導電性発熱流動体
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
US5355430A (en) * 1991-08-12 1994-10-11 Mechatronics Holding Ag Method for encoding and decoding a human speech signal by using a set of parameters
DE4135070C1 (de) * 1991-10-24 1993-05-19 Institut Fuer Rundfunktechnik Gmbh, 8000 Muenchen, De
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
ATE211326T1 (de) * 1993-05-31 2002-01-15 Sony Corp Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
EP0720316B1 (de) * 1994-12-30 1999-12-08 Daewoo Electronics Co., Ltd Adaptive Kodiervorrichtung für Digitaltonsignale und Bitverteilungsverfahren dafür

Also Published As

Publication number Publication date
KR100352352B1 (ko) 2003-01-06
US5680130A (en) 1997-10-21
TW301829B (de) 1997-04-01
EP0713295A4 (de) 2002-04-17
EP0713295A1 (de) 1996-05-22
EP0713295B1 (de) 2004-09-15
JP3203657B2 (ja) 2001-08-27
ES2224121T3 (es) 2005-03-01
CA2163371A1 (en) 1995-10-12
DE69533500D1 (de) 2004-10-21
ATE276607T1 (de) 2004-10-15
CA2163371C (en) 2005-09-20
CN1126004A (zh) 1996-07-03
BR9505863A (pt) 1996-02-21
MY130167A (en) 2007-06-29
CN1103141C (zh) 2003-03-12
PL311812A1 (en) 1996-03-18
WO1995027335A1 (fr) 1995-10-12
KR960702963A (ko) 1996-05-23

Similar Documents

Publication Publication Date Title
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
DE69533577T2 (de) Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
DE60002483T2 (de) Skalierbares kodierungsverfahren für hochqualitätsaudio
DE69534273T2 (de) Verfahren und vorrichtung zum signalkodieren, signalubertragungsverfahren und verfahren und vorrichtung zur signaldekodierung
DE69927505T2 (de) Verfahren zum einfügen von zusatzdaten in einen audiodatenstrom
DE69534140T2 (de) Verfahren und vorrichtung zur signalkodierung und -dekodierung, aufzeichnungsmedium und signalübertragungsverfahren
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE69233094T2 (de) Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden
DE3639753C2 (de)
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
DE602004010885T2 (de) Audio-transkodierung
DE69401512T2 (de) Hybride adaptive bitzuteilung für audiokoder und -dekoder
DE60225276T2 (de) Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren und programm
DE60303689T2 (de) Audiodecodierungsvorrichtung und -verfahren
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
DE60204039T2 (de) Vorrichtung zur kodierung und dekodierung von audiosignalen
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
DE69923555T2 (de) Verfahren und vorrichtung zur entropie-kodierung von quantisierten transformationskoeffizienten eines signals
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
DE69434225T2 (de) Verfahren und Vorrichtung zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten und geeigneter Aufzeichnungsträger
DE69829242T2 (de) Tonsignalkodierverfahren und -gerät

Legal Events

Date Code Title Description
8364 No opposition during term of opposition