DE60310716T2 - System für die audiokodierung mit füllung von spektralen lücken - Google Patents
System für die audiokodierung mit füllung von spektralen lücken Download PDFInfo
- Publication number
- DE60310716T2 DE60310716T2 DE60310716T DE60310716T DE60310716T2 DE 60310716 T2 DE60310716 T2 DE 60310716T2 DE 60310716 T DE60310716 T DE 60310716T DE 60310716 T DE60310716 T DE 60310716T DE 60310716 T2 DE60310716 T2 DE 60310716T2
- Authority
- DE
- Germany
- Prior art keywords
- spectral components
- spectral
- signal
- subband signals
- subband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 290
- 238000000034 method Methods 0.000 claims abstract description 65
- 230000005236 sound signal Effects 0.000 claims abstract description 65
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 23
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 22
- 230000000873 masking effect Effects 0.000 claims description 43
- 238000013139 quantization Methods 0.000 claims description 39
- 230000009466 transformation Effects 0.000 claims description 29
- 230000004044 response Effects 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 20
- 238000004458 analytical method Methods 0.000 claims description 17
- 230000002123 temporal effect Effects 0.000 claims description 17
- 239000006185 dispersion Substances 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 2
- 238000011002 quantification Methods 0.000 claims 1
- 238000001228 spectrum Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 17
- 238000012545 processing Methods 0.000 description 12
- 238000000844 transformation Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Optical Elements Other Than Lenses (AREA)
- Stereophonic System (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Optical Recording Or Reproduction (AREA)
- Adornments (AREA)
- Optical Communication System (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Optical Filters (AREA)
- Stereo-Broadcasting Methods (AREA)
- Spectrometry And Color Measurement (AREA)
Description
- TECHNISCHES GEBIET
- Die vorliegende Erfindung bezieht sich insgesamt auf Audiokodiersysteme und betrifft insbesondere die Verbesserung der wahrgenommenen Qualität der von Audiokodiersystemen erhaltenen Audiosignale.
- EINSCHLÄGIGER STAND DER TECHNIK
- Audiokodiersysteme werden benutzt, um ein Audiosignal zu einem zur Übertragung oder Speicherung geeigneten kodierten Signal zu kodieren und um anschließend das kodierte Signal zu empfangen oder rückzugewinnen und es zu dekodieren, um eine Version des ursprünglichen Audiosignals für die Wiedergabe zu erhalten. Mit perzeptuellen Audiokodiersystemen versucht man, ein Audiosignal zu einem kodierten Signal zu kodieren, welches geringere Erfordernisse hinsichtlich der Informationskapazität hat als das ursprüngliche Audiosignal, und dann anschließend das kodierte Signal zu dekodieren, um als Ausgang ein vom ursprünglichen Audiosignal nicht wahrnehmbar unterscheidbares Signal zu erhalten. Ein Beispiel eines derartigen perzeptuellen Audiokodiersystems ist im Dokument A52 (1994) des Advanced Television Standards Committee (ATSC) beschrieben, auf das als Dolby AC-3 Bezug genommen wird. Ein weiteres Beispiel ist beschrieben von Bosi et al. "ISO/IEC MPEG-2 Advanced Audio Coding." J. AES, Bd. 45 Nr. 10, Oktober 1997, SS. 789-814, auf das als Advanced Audio Coding (AAC) Bezug genommen wird. Diese beiden Kodiersysteme und viele weitere perzeptuelle Kodiersysteme wenden auf ein Audiosignal eine Analysefilterbank an, um in Gruppen von Frequenzbanden angeordnete Spektralkomponenten zu erhalten. Die Bandbreiten sind üblicherweise unterschiedlich und entsprechen den Breiten der sogenannten kritischen Banden des menschlichen Hörsystems.
- Perzeptuelle Kodiersysteme können angewandt werden, um die Informationskapazitätserfordernisse eines Audiosignals zu verringern, aber dabei ein subjektives oder wahrgenommenes Maß an Tonqualität zu erhalten, so daß eine kodierte Wiedergabe des Tonsignals über einen Nachrichtenkanal mit weniger Bandbreite übermittelt oder auf einem Aufzeichnungsträger auf kleinerem Raum aufgezeichnet werden kann. Informationskapazitätserfordernisse werden durch Quantisieren der Spektralkomponenten reduziert. Durch das Quantisieren tritt Rauschen in das quantisierte Signal ein, aber perzeptuelle Audiokodiersysteme arbeiten meistens mit psychoakustischen Modellen im Bemühen darum, die Amplitude des Quantisierungsrauschens so zu steuern, daß es von Spektralkomponenten im Signal maskiert oder unhörbar gemacht wird.
- Die Spektralkomponenten innerhalb einer gegebenen Bande werden häufig auf die gleiche Quantisierungsauflösung quantisiert, und es wird ein psychoakustisches Modell benutzt, um die größte minimale Quantisierungsauflösung oder den kleinsten Rauschabstand (SNR) zu bestimmen, der möglich ist, ohne ein hörbares Niveau an Quantisierungsrauschen einzuführen. Diese Technik funktioniert ganz gut für schmale Banden, aber nicht so gut für breitere Banden, wenn Informationskapazitätserfordernisse das Kodiersystem auf die Verwendung einer relativ groben Quantisierauflösung beschränken. Die größerwertigen Spektralkomponenten in einer breiten Bande werden üblicherweise auf einen Nichtnull-Wert quantisiert, der die gewünschte Auflösung hat, aber kleinerwertige Spektralkomponenten in der Bande werden auf Null quantisiert, wenn ihre Größe unter dem Mindestquantisierniveau liegt. Die Zahl der Spektralkomponenten in einer Bande, die auf Null quantisiert werden, nimmt insgesamt mit zunehmender Bandbreite zu, sie nimmt zu, wenn der Unterschied zwischen den größten und kleinsten Spektralkomponentenwerten innerhalb der Bande zunimmt, und sie nimmt zu, wenn das Mindestquantisierniveau zunimmt.
- Leider kann das Vorhandensein vieler auf Null quantisierter Spektralkomponenten (quantized-to-zero - QTZ) in einem kodierten Signal die wahrgenommene Qualität des Audiosignals verschlechtern, auch wenn das resultierende Quantisierrauschen niedrig genug gehalten wird, um für unhörbar oder als durch Spektralkomponenten im Signal psychoakustisch maskiert gehalten zu werden. Für diese Verschlechterung gibt es drei Ursachen. Erste Ursache ist die Tatsache, daß das Quantisierrauschen möglicherweise deshalb nicht unhörbar ist, weil das Niveau der psychoakustischen Maskierung geringer ist als vom psychoakustischen Modell vorhergesagt, welches für die Bestimmung der Quantisierauflösung benutzt wurde, eine zweite Ursache ist die Tatsache, daß die Schaffung so vieler QTZ-Spektralkomponenten die Energie oder Leistung des dekodierten Audiosignals im Vergleich zur Energie oder Leistung des ursprünglichen Audiosignals hörbar reduzieren kann. Eine dritte Ursache ist für Kodierverfahren relevant, die mit Verzerrungs-Annulier-Filterbänken arbeiten, beispielsweise die Quadrature Mirror Filter (QMF) Transformation oder eine bestimmte modifizierte Discrete Cosine Transform (DCT) und modifizierte Inverse Discrete Cosine Transform (IDCT), die als Time-Domain Aliasing Cancellation (TDAC) Transformation bekannt ist; und die von Princen et al. beschrieben wurden in "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation,"ICASSP 1987 Conf. Proc. Mai 1987, SS. 2161-64.
- Kodiersysteme, in denen Verzerrungs-Annulier-Filterbänke, beispielsweise die QMF- oder TDAC-Transformationen angewandt werden, benutzen eine Analysefilterbank im Kodierprozeß, mit der in das kodierte Signal Verzerrungs- oder Störkomponenten eingeführt werden, aber sie benutzen im Dekodierprozeß eine Synthesefilterbank, die mindestens theoretisch die Verzerrung aufheben kann. In der Praxis kann allerdings die Fähigkeit der Synthesebank, die Verzerrung aufzuheben, signifikant beeinträchtigt sein, wenn die Werte einer oder mehrerer Spektralkomponenten im Kodierprozeß signifikant geändert wurden. Aus diesem Grund können QTZ-Spektralkomponenten die wahrgenommene Qualität eines dekodierten Audiosignals selbst dann beeinträchtigen, wenn das Quantisierungsrauschen unhörbar ist, weil Änderungen in den Werten der Spektralkomponenten die Fähigkeit der Synthesefilterbank zum Annulieren der durch die Analysefilterbank eingeführten Verzerrung beeinträchtigen können.
- Mit in bekannten Kodiersystemen angewandten Techniken sind Teillösungen dieser Probleme gefunden worden. Beispielsweise haben Dolby AC-3 und AAC-Transformationskodiersysteme eine gewisse Fähigkeit, aus einem kodierten Signal ein Ausgangssignal zu erzeugen, welches den Signalpegel des ursprünglichen Audiosignals beibehält, indem für gewisse QTZ-Spektralkomponenten im Dekodierer Rauschen ersetzt wird. Bei diesen beiden Systemen bietet der Kodierer im kodierten Signal einen Leistungshinweis für ein Frequenzband, und der Dekodierer benutzt diesen Leistungshinweis, um die QTZ-Spektralkomponenten im Frequenzband durch einen entsprechenden Pegel an Rauschen zu ersetzen. Ein Dolby AC-3 Kodierer liefert eine grobe Schätzung des kurzfristigen Leistungsspektrums, welches zum Erzeugen eines angemessenen Rauschpegels benutzt werden kann. Wenn alle Spektralkomponenten einer Bande auf Null gesetzt sind, füllt der Dekodierer die Bande mit Rauschen von etwa der gleichen Leistung wie der in der groben Schätzung des kurzfristigen Leistungsspektrums angedeuteten. Beim AAC-Kodiersystem wird eine Technik mit dem Namen perzeptueller Rauschersatz (Perceptual Noise Substitution – PNS) angewandt, mit der die Leistung für eine gegebene Bande ausdrücklich übertragen wird. Ein Beispiel dieser Technik ist im Dokument
DE 1950 9149 offenbart. Der Dekodierer benutzt diese Information, um der Leistung angepaßtes Rauschen hinzuzufügen. Beide Systeme fügen Rauschen nur in denjenigen Banden hinzu, die keine Nichtnull-Spektralkomponenten enthalten. - Leider dienen diese Systeme nicht dazu, Leistungsniveaus in Banden aufrechtzuerhalten, die eine Mischung aus QTZ- und Nichtnull-Spektralkomponenten enthalten. Tabelle 1 zeigt eine hypothetische Bande von Spektralkomponenten für ein ursprüngliches Audiosignal, eine 3-Bit quantisierte Darstellung jeder Spektralkomponente, die zu einem kodierten Signal zusammengefügt ist, und die entsprechenden Spektralkomponenten, die ein Dekodierer aus dem kodierten Signal erhält. Die quantisierte Bande im kodierten Signal enthält eine Kombination aus QTZ- und Nichtnull-Spektralkomponenten.
- Die erste Spalte der Tabelle zeigt einen Satz unsignierter binärer Zahlen, die Spektralkomponenten im ursprünglichen Audiosignal wiedergeben, welche zu einer einzigen Bande gruppiert sind. Die zweite Spalte zeigt eine Darstellung der Spektralkomponenten, die zu drei Bits quantisiert sind. Für dieses Beispiel ist ein Teil jeder Spektralkomponente unterhalb der 3-Bit Auflösung durch Abtrennen entfernt worden. Die quantisierten Spektralkomponenten werden an den Dekodierer übermittelt und anschließend dadurch dequantisiert, daß 0 Bits angehängt werden, um die ursprüngliche Spektralkomponentenlänge wieder herzustellen. Die dequantisierten Spektralkomponenten sind in der dritten Spalte gezeigt. Da eine Mehrheit der Spektralkomponenten auf Null quantisiert wurde, enthält die Bande dequantisierter Spektralkomponenten weniger Energie als die Bande der ursprünglichen Spektralkomponenten, und diese Energie ist in wenigen Nichtnull-Spektralkomponenten konzentriert. Diese Verringerung der Energie kann die wahrgenommene Qualität des dekodierten Signals, wie schon gesagt, verschlechtern.
- OFFENBARUNG DER ERFINDUNG
- Es ist eine Aufgabe der vorliegenden Erfindung, die wahrgenommene Qualität der von Audiokodiersystemen erhaltenen Audiosignale dadurch zu verbessern, daß eine mit nullwertigen quantisierten Spektralkomponenten in Beziehung stehende Verschlechterung vermieden oder verringert wird.
- Gemäß einem, in den unabhängigen Ansprüchen 1, 16 und 31 beschriebenen Aspekt der vorliegenden Erfindung wird Audioinformation durch das Empfangen eines Eingangssignals bereitgestellt, aus dem ein Satz von Teilbandsignalen erhalten wird, die je mehr als eine oder mehrere Spektralkomponenten besitzen, welche den Spektralgehalt eines Audiosignals wiedergeben. Innerhalb des Satzes der Teilbandsignale wird ein bestimmtes Teilbandsignal identifiziert, in dem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein einer Schwelle entsprechendes Mindestquantisierniveau hat, und in dem eine Vielzahl von Spektralkomponenten einen Null-Wert hat. Es werden synthetisierte Spektralkomponenten erzeugt, die jeweiligen nullwertigen Spektralkomponenten in dem betreffenden Teilbandsignal entsprechen und die in Übereinstimmung mit einer Skalierhüllkurve unterhalb oder gleich der Schwelle skaliert werden. Ein modifizierter Satz von Teilbandsignalen wird dadurch erzeugt, daß die synthetisierten Spektralkomponenten anstelle entsprechender nullwertiger Spektralkomponenten in dem betreffenden Teilbandsignal gesetzt werden, und durch Anlegen einer Synthesefilterbank an den modifizierten Satz von Teilbandsignalen wird Audioinformation erzeugt.
- Gemäß einem weiteren, in den unabhängigen Ansprüchen 12, 27 und 42 beschriebenen Aspekt der vorliegenden Erfindung wird ein Ausgangssignal, vorzugsweise ein kodiertes Ausgangssignal bereitgestellt, indem ein Satz von Teilbandsignalen erzeugt wird, die je eine oder mehrere Spektralkomponenten besitzen, welche den Spektralgehalt eines Audiosignals wiedergeben, durch Quantisieren von Information, die durch Anlegen einer Analysefilterbank an Audioinformation erhalten wird. Innerhalb des Satzes der Teilbandsignale wird ein bestimmtes Teilbandsignal identifiziert, in dem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein einer Schwelle entsprechendes Mindestquantisierniveau hat, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert hat. Vom Spektralgehalt des Audiosignals wird Skaliersteuerinformation abgeleitet, wobei die Skaliersteuerinformation das Skalieren synthetisierter Spektralkomponenten steuert, die synthetisiert und an die Stelle der Spektralkomponenten mit einem Null-Wert in einem Empfänger gesetzt werden sollen, der Audioinformation in Abhängigkeit von dem Ausgangssignal erzeugt. Das Ausgangssignal wird erzeugt durch Zusammenfügen der Skaliersteuerinformation und von Information, die den Satz der Teilbandsignale wiedergibt.
- Die verschiedenen Merkmale der vorliegenden Erfindung und ihre bevorzugten Ausführungsbeispiele sind anhand der nachfolgenden Beschreibung und der beigefügten Zeichnungen besser verständlich, wobei in den einzelnen Figuren für gleiche Elemente gleiche Bezugszeichen verwendet sind. Der Inhalt der folgenden Beschreibung und Zeichnungen dient lediglich als Beispiel und sollte nicht als Begrenzung des Umfangs der vorliegenden, in den Ansprüchen beschriebenen Erfindung verstanden werden.
- KURZBESCHREIBUNG DER ZEICHNUNGEN
- Es zeigt:
-
1a ein schematisches Blockschaltbild eines Audiokodierers; -
1b ein schematisches Blockschaltbild eines Audiodekodierers; -
2a -2c graphische Darstellungen von Quantisierfunktionen; -
3 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals; -
4 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals mit einigen auf Null gesetzten Spektralkomponenten. -
5 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetisierten Spektralkomponenten anstelle nullwertiger Spektralkomponenten; -
6 eine graphische schematische Darstellung eines hypothetischen Frequenzganges für einen Filter in einer Analysefilterbank; -
7 eine graphische schematische Darstellung einer Skalierhüllkurve, die an den in6 gezeigten Frequenzgangabfall des Spektralstreufaktors angenähert ist; -
8 eine graphische schematische Darstellung von Skalierhüllkurven, die vom Ausgang eines anpaßbaren Filters abgeleitet sind; -
9 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetischen Spektralkomponenten, die durch eine Skalierhüllkurve gewichtet sind, welche an den in6 gezeigten Frequenzgangabfall des Spektralstreufaktors angenähert ist; -
10 eine graphische schematische Darstellung hypothetischer psychoakustischer Maskierschwellen; -
11 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetischen Spektralkomponenten, die durch eine Skalierhüllkurve gewichtet sind, welche an psychoakustische Maskierschwellen angenähert ist; -
12 eine graphische schematische Darstellung eines hypothetischen Teilbandsignals; -
13 eine graphische schematische Darstellung eines hypothetischen Teilbandsignals mit einigen auf Null gesetzten Spektralkomponenten; -
14 eine graphische schematische Darstellung einer hypothetischen, zeitlichen psychoakustischen Maskierschwelle; -
15 eine graphische schematische Darstellung eines hypothetischen Teilbandsignals mit synthetisierten Spektralkomponenten, die durch eine Skalierhüllkurve gewichtet sind, welche an die zeitlichen psychoakustischen Maskierschwellen angenähert ist; -
16 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals mit durch Spektralduplikation erzeugten synthetisierten Spektralkomponenten; -
17 ein schematisches Blockschaltbild einer Vorrichtung, die zur Verwirklichung verschiedener Aspekte der vorliegenden Erfindung in einem Kodierer oder einem Dekodierer verwendbar ist. - MÖGLICHKEITEN ZUM AUSFÜHREN DER ERFINDUNG
- A. Überblick
- Verschiedene Aspekte der vorliegenden Erfindung können in eine große Vielfalt an Signalverarbeitungsmethoden und Bausteinen, einschließlich der in
1a und1b gezeigten eingebaut werden. Einige Aspekte können durch eine Verarbeitung ausgeführt werden, die nur in einem Dekodierverfahren oder Baustein ausgeführt wird, andere Aspekte erfordern ein zusammenwirkendes Verarbeiten, welches sowohl in Kodier- als auch Dekodierverfahren oder -bausteinen durchgeführt wird. Eine Beschreibung von Prozessen, die zur Verwirklichung dieser verschiedenen Aspekte der vorliegenden Erfindung benutzt werden können, folgt im Anschluß an einen Überblick typischer Bausteine, die für die Durchführung dieser Prozesse verwendbar sind. - 1. Kodierer
-
1a veranschaulicht eine Verwirklichung eines Teilband-Audiokodierers, in dem eine Analysefil terbank12 vom Weg11 Audioinformation empfängt, die ein Audiosignal wiedergibt, und als Reaktion darauf digitale Information bereitstellt, die Frequenzteilbänder des Audiosignals wiedergibt. Die digitale Information in jedem der Frequenzteilbänder wird von einem entsprechenden Quantisierr14 ,15 ,16 quantisiert und dem Kodierer17 zugeleitet. Der Kodierer17 erzeugt eine kodierte Wiedergabe der quantisierten Information, die an den Formatierer18 weitergeleitet wird. Bei der speziellen, in der Figur gezeigten Verwirklichung werden die Quantisierfunktionen in den Quantisierern14 ,15 ,16 in Abhängigkeit von Quantisiersteuerinformation angepaßt, die vom Modell13 empfangen wird, welches die Quantisiersteuerinformation in Abhängigkeit von der vom Weg11 empfangenen Audioinformation erzeugt. Der Formatierer setzt die kodierte Wiedergabe der quantisierten Information und die Quantisiersteuerinformation zu einem Ausgangssignal zusammen, welches zum Übertragen oder Speichern geeignet ist, und gibt das Ausgangssignal längs des Weges19 weiter. - In vielen Audioanwendungen werden lineare Quantisierfunktionen q(x) benutzt, beispielsweise die 3-Bit asymmetrische Mittelstufen-Quantisierfunktion, die in
2a dargestellt ist; aber für die vorliegende Erfindung ist keine bestimmte Form der Quantisierung wichtig. Beispiele von zwei weiteren verwendbaren Funktionen q(x) sind in2b und2c gezeigt. Bei jedem dieser Beispiele bietet die Quantisierfunktion q(x) einen Ausgangswert gleich Null für jeden beliebigen Eingangswert x in dem Intervall vom Wert bei Punkt30 bis zum Wert bei Punkt31 . In vielen Anwendungsfällen sind die beiden Werte an den Punkten30 und31 in der Größe gleich, haben aber entgegengesetztes Vorzeichen; aber, wie2b zeigt, ist dies nicht nötig. Um die Beschreibung zu erleichtern, wird von einem Wert x, der innerhalb des Intervalls von Eingabewerten liegt, die mit einer bestimmten Quantisierfunktion q(x) auf Null (QTZ) quantisiert werden, gesagt, er sei geringer als das Mindestquantisierniveau dieser Quantisierfunktion. - In der vorliegenden Offenbarung sollen Ausdrücke wie "Kodierer" und "Kodieren" keine bestimmte Art von Informationsverarbeitung implizieren. Zum Beispiel wird Kodieren oft benutzt, um Informationskapazitätserfordernisse zu verringern. Aber diese Ausdrücke in der vorliegenden Beschreibung beziehen sich nicht notwendigerweise auf diese Art von Verarbeitung. Der Kodierer
17 kann im wesentlichen jede beliebige gewünschte Art der Verarbeitung durchführen. Bei einer bestimmten Verwirklichung wird quantisierte Information zu Gruppen skalierter Zahlen kodiert, die einen gemeinsamen Skalierfaktor haben. Im Dolby AC-3 Kodiersystem beispielsweise werden quantisierte Spektralkomponenten zu Gruppen oder Banden von Fließpunktzahlen angeordnet, wo die Zahlen in jeder Bande einen Fließpunktexponenten gemeinsam haben. Im AAC-Kodiersystem wird Entropiekodieren, beispielsweise Huffman-Kodieren angewandt. Bei einer anderen Verwirklichung ist der Kodierer17 weggelassen, und die quantisierte Information wird unmittelbar mit dem Ausgangssignal zusammengeführt. Für die vorliegende Erfindung ist keine bestimmte Art des Kodierens wichtig. - Das Modell
13 kann im wesentlichen jede Art einer gewünschten Verarbeitung durchführen. Ein Beispiel ist ein Prozeß, der ein psychoakustisches Modell auf Audioinformation anwendet, um die psychoakustischen Maskiereffekte unterschiedlicher Spektralkomponenten in dem Audiosignal zu schätzen. Es sind viele Veränderungen möglich. So kann das Modell13 zum Beispiel die Quantisiersteuerinformation in Abhängigkeit von der Frequenzteilbandinformation erzeugen, die am Ausgang der Analysefilterbank12 verfügbar ist, anstatt oder zusätzlich zu der Audioinformation, die am Eingang der Filterbank verfügbar ist. Als weiteres Beispiel kann das Modell13 weggelassen sein, und die Quantisierer14 ,15 und16 benutzen Quantisierfunktionen, die nicht angepaßt sind. Für die vorliegende Erfindung ist kein bestimmter Modellierprozeß wichtig. - 2. Dekodierer
-
1b zeigt eine Verwirklichung des Teilband-Audiodekodierers, in dem der Deformatierer22 vom Weg21 ein Eingangssignal empfängt, welches eine kodierte Darstellung quantisierter Digitalinformation übermittelt, die Frequenzteilbänder eines Audiosignals wiedergeben. Der Deformatierer22 erhält die kodierte Darstellung vom Eingangssignal und gibt sie an den Dekodierer23 weiter. Der Dekodierer23 dekodiert die kodierte Darstellung zu Frequenzteilbändern quantisierter Information. Die quantisierte digitale Information in jedem der Frequenzteilbänder wird von einem jeweiligen Dequantisier25 ,26 ,27 dequantisiert und einer Synthesefilterbank28 zugeleitet, die längs des Weges29 Audioinformation erzeugt, die ein Audiosignal wiedergibt. Bei der in der Figur gezeigten Verwirklichung werden die Dequantisierfunktionen in den Dequantisierern25 ,26 ,27 in Abhängigkeit von Quantisiersteuerinformation angepaßt, die vom Modell24 empfangen wird, das die Quantisiersteuerinformation in Abhängigkeit von Steuerinformation erzeugt, die der Deformatierer vom Ausgangssignal erhalten hat. - In dieser Offenbarung soll mit Ausdrücken wie "Dekodierer" und "Dekodieren" keine bestimmte Art von Informationsverarbeitung impliziert werden. Der Dekodierer
23 kann im wesentlichen jede Art von Verarbeitung durchführen, die benötigt oder gewünscht wird. Bei einer Verwirklichung ist dies umgekehrt zu einem vorstehend beschriebenen Kodierprozeß, wobei quantisierte Information in Gruppen von Fließpunktzahlen, die sich in Exponenten teilen, zu individuellen, quantisierten Komponenten dekodiert werden, die sich keine Exponenten teilen. Bei einer anderen Verwirklichung wird Entropiedekodierung, beispielsweise Huffman Dekodierung angewandt. Bei einer anderen Implementierung wird der Dekodierer23 weggelassen, und die quantisierte Information wird unmittelbar vom Deformatierer22 erhalten. Für die vorliegende Erfindung ist keine bestimmte Art des Dekodierens wichtig. - Das Modell
24 kann im wesentlichen jede beliebige, gewünschte Art der Verarbeitung durchführen. Ein Beispiel ist ein Prozeß, der ein psychoakustisches Modell auf Information anwendet, die vom Eingangssignal erhalten wird, um die psychoakustischen Maskiereffekte unterschiedlicher Spektralkomponenten in einem Audiosignal zu schätzen. Als weiteres Beispiel wird das Modell24 weggelassen, und die Dequantisierer25 ,26 ,27 können entweder Quantisierfunktionen benutzen, die nicht angepaßt sind, oder sie können Quantisierfunktionen benutzen, die in Abhängigkeit von Quantisiersteuerinformation angepaßt werden, die der Deformatierer22 direkt vom Eingangssignal erhalten hat. Für die vorliegende Erfindung ist kein bestimmter Prozeß wichtig. - 3. Filterbänke
- Die in den
1a und1b gezeigten Bausteine zeigen Komponenten für drei Frequenzteilbänder. Bei einer typischen Anwendung werden viel mehr Teilbänder benutzt, aber aus Gründen der Klarheit der Darstellung sind hier nur drei gezeigt. Im Prinzip ist für die vorliegende Erfindung keine bestimmte Anzahl wichtig. - Die Analyse- und Synthesefilterbänke können im wesentlichen auf jede beliebige, gewünschte Art und Weise verwirklicht sein, einschließlich eines großen Bereiches an digitalen Filtertechnologien, Blocktransformationen und Wavelet-Transformationen. Bei einem Audiokodiersystem mit einem Kodierer und einem Dekodierer, wie den vorstehend beschriebenen, ist die Analysefilterbank
12 durch die TDAC-modifizierte DCT verwirklicht und die Synthesefilterbank28 durch die TDAC-modifizierte IDCT verwirklicht, die schon erwähnt wurden. Es ist allerdings im Prinzip keine bestimmte Verwirklichung wichtig. - Analysefilterbänke, die durch Blocktransformationen verwirklicht sind, teilen einen Block oder ein Intervall eines Eingangssignals in einen Satz von Transformationskoeffizienten auf, der den Spektralgehalt dieses Intervalls des Signals wiedergibt. Eine Gruppe aus einem oder mehr benachbarten Transformationskoeffizienten gibt den Spektralgehalt innerhalb eines bestimmten Frequenzteilbandes wieder, dessen Bandbreite der Anzahl Koeffizienten in der Gruppe angepaßt ist.
- Analysefilterbänke, die durch irgendeine Art eines digitalen Filters verwirklicht sind, beispielsweise einen Polyphasenfilter statt von einer Blocktransformation, teilen ein Eingangssignal in einen Satz von Teilbandsignalen auf. Jedes Teilbandsignal ist eine zeitbasierte Wiedergabe des Spektralgehalts des Eingangssignals innerhalb eines bestimmten Frequenzteilbandes. Vorzugsweise wird das Teilbandsignal so dezimiert, daß jedes Teilbandsignal eine Bandbreite hat, die an die Anzahl der Abtastwerte im Teilbandsignal für eine Zeitintervalleinheit angepaßt ist.
- Die folgende Beschreibung bezieht sich mehr im einzelnen auf Verwirklichungen, die von Blocktransformationen, beispielsweise der oben genannten TDAC-Transformation Gebrauch machen. In dieser Beschreibung bezieht sich der Ausdruck "Teilbandsignal" auf Gruppen aus einem oder mehr benachbarten Transformationskoeffizienten, und der Ausdruck "Spektralkomponenten" bezieht sich auf die Transformationskoeffizienten. Da Grundsätze der vorliegenden Erfindung auch auf andere Arten der Verwirklichung anwendbar sind, kann der Ausdruck "Teilbandsignal" insgesamt so verstanden werden, daß er sich auch auf ein zeitbasiertes Signal bezieht, welches den Spektralgehalt eines bestimmten Frequenzteilbandes eines Signals wiedergibt, und der Ausdruck "Spektralkomponenten" kann insgesamt so verstanden werden, daß er sich auf Abtastwerte eines zeitbasierten Teilbandsignals bezieht.
- 4. Implementation
- Verschiedene Aspekte der vorliegenden Erfindung können auf verschiedenste Weise verwirklicht werden, einschließlich durch Software in einem Universalrechnersystem oder in irgendeiner anderen Vorrichtung, die stärker spezialisierte Bauelemente enthält, beispielsweise eine digitale Signalverarbeitungsschaltung (DSP), die mit Bauelementen ähnlich denen in einem Universalrechnersystem gekoppelt ist.
17 ist ein Blockschaltbild eines Bausteins70 , der zum Verwirklichen verschiede ner Aspekte der vorliegenden Erfindung in einem Audiokodierer oder Audiodekodierer verwendbar ist. DSP72 stellt Rechenressourcen bereit. RAM73 ist ein Systemdirektzugriffspeicher (RAM), den der DSP72 für die Signalverarbeitung benutzt. ROM74 stellt irgendeine Form dauerhafter Speicherung dar, beispielsweise einen Festwertspeicher (ROM) zum Speichern von Programmen, die zur Betätigung des Bausteins70 nötig sind und zum Ausführen verschiedener Aspekte der vorliegenden Erfindung. Eine I/O Steuerung75 stellt einen Schnittstellenschaltkreis zum Empfangen und Senden von Signalen über Kommunikationskanäle76 ,77 dar. In der I/O Steuerung75 können nach Wunsch Analog/Digital-Umsetzer und Digital/Analog-Umsetzer enthalten sein, um analoge Audiosignale zu empfangen und/oder zu senden. Im gezeigten Ausführungsbeispiel sind alle hauptsächlichen Systembauelemente an einen Bus71 angeschlossen, der mehr als einen physischen Bus darstellen kann. Aber eine Busarchitektur ist nicht erforderlich, um die vorliegende Erfindung zu verwirklichen. - In Ausführungsbeispielen, die in einem Universalrechnersystem verwirklicht sind, können zusätzliche Bauelemente als Schnittstellen zu Bauelementen, wie einer Tastatur oder einer Maus und einem Bildschirm eingeschlossen sein, und zum Steuern einer Speichervorrichtung, die einen Datenträger, beispielsweise ein Magnetband oder eine Magnetplatte oder einen optischen Träger umfaßt. Der Datenträger kann zum Aufzeichnen von Befehlsprogrammen für Betriebssysteme, Dienstprogrammen und Anwendungen benutzt werden und kann Ausführungsbeispiele von Programmen umfassen, die verschiedene Aspekte der vorliegenden Erfindung verwirklichen.
- Die zum Ausführen verschiedener Aspekte der vorliegenden Erfindung erforderlichen Funktionen können von den Bauelementen durchgeführt werden, die auf verschiedenste Weise verwirklicht sind, einschließlich diskreter Logikbausteine, einer oder mehrerer anwendungsspezifischer integrierter Schaltungen und/oder programmgesteuerter Prozessoren. Die Art, in der diese Bauelemente verwirklicht sind, ist für die vorliegende Erfindung nicht wichtig.
- Verwirklichungen der vorliegenden Erfindung in Software können durch eine Vielfalt an maschinenlesbaren Trägern übermittelt werden, beispielsweise als Basisband oder modulierte Nachrichtenübermittlungswege über das ganze Spektrum hinweg, einschließlich von Ultraschall bis zu Ultraviolettfrequenzen oder Datenträgern, einschließlich solcher, die Informationen mittels im wesentlichen jeder beliebigen magnetischen oder optischen Aufzeichnungstechnologie übermitteln, einschließlich Magnetband, Magnetplatte und Bildplatte. Verschiedene Aspekte können auch in verschiedenen Bauelementen des Rechnersystems
70 durch Verarbeitungsschaltkreise, wie anwendungsspezifische integrierte Schaltungen, integrierte Universalschaltungen, Mikroprozessoren, die von in verschiedenen Formen von ROM oder RAM verkörperten Programmen gesteuert werden, und anderen Techniken verwirklicht werden. - B. Dekodierer
- Verschiedene Aspekte der vorliegenden Erfindung können in einem Dekodierer ausgeführt werden, die keine spezielle Verarbeitung oder Information von einem Kodierer erfordern. Diese Aspekte sind in diesem Abschnitt der Offenbarung beschrieben. Andere Aspekte, die keine spezielle Verarbeitung oder Information von einem Kodierer benötigen, sind im folgenden Abschnitt beschrieben.
- 1. Spektrallücken
-
3 ist eine graphische Darstellung des Spektrums eines Intervalls eines hypothetischen Audiosignals, das mittels eines Transformationskodiersystems kodiert werden soll. Das Spektrum41 stellt eine Hüllkurve der Größe von Transformationskoeffizienten oder Spektralkomponenten dar. Während des Kodierprozesses werden alle Spektralkomponenten, deren Größe unterhalb der Schwelle40 liegt, auf Null quantisiert. Wenn eine Quantisierfunktion, wie die in2a gezeigte Funktion q(x) benutzt wird, entspricht die Schwelle40 den Mindestquantisierniveaus30 ,31 . Die Schwelle40 ist über den gesamten Frequenzbereich aus Gründen der zweckmäßigeren Darstellung mit einem gleichmäßigen Wert gezeigt. Dies ist in vielen Kodiersystemen nicht typisch. In perzeptuellen Audiokodiersystemen, welche Spektralkomponenten innerhalb jedes Teilbandsignals quantisieren, ist beispielsweise die Schwelle40 innerhalb jedes Frequenzteilbandes einheitlich, aber sie unterscheidet sich von Teilband zu Teilband. Bei anderen Verwirklichungen kann die Schwelle40 auch innerhalb eines gegebenen Frequenzteilbandes variieren. -
4 ist eine graphische Darstellung des Spektrums des hypothetischen Audiosignals, welches von quantisierten Spektralkomponenten wiedergegeben ist. Das Spektrum42 stellt eine Hüllkurve der Größe von Spektralkomponenten dar, die quantisiert worden sind. Das in dieser Figur und auch in weiteren Figuren dargestellte Spektrum zeigt nicht die Auswirkungen des Quantisierens der Spektralkomponenten, deren Größen oberhalb der Schwelle40 oder gleich dieser sind. Der Unterschied zwischen den QTZ-Spektralkomponenten im quantisierten Signal und den entsprechenden Spektralkomponenten im Ursprungssignal ist schraffiert dargestellt. Diese schraffierten Bereiche stellen "Spektrallücken" in der quantisierten Wiedergabe dar, die mit synthetisierten Spektralkomponenten gefüllt werden sollen. - Bei einer Verwirklichung der vorliegenden Erfindung empfängt ein Dekodierer ein Eingangssignal, das eine kodierte Wiedergabe quantisierter Teilbandsignale übermittelt, wie in
4 gezeigt. Der Dekodierer dekodiert die kodierte Darstellung und identifiziert jene Teilbandsignale, in denen eine oder mehrere Spektralkomponenten Nichtnull-Werte haben, und eine Vielzahl von Spektralkomponenten einen Null-Wert haben. Vorzugsweise sind die Frequenzerstreckungen aller Teilbandsignale entweder a priori dem Dekodierer bekannt, oder sie werden durch Steuerinformation im Eingangssignal definiert. Der Dekodierer erzeugt synthetisierte Spektralkomponenten, die den nullwertigen Spektralkomponenten entsprechen, mit Hilfe eines Prozesses, wie den nachfolgend beschriebenen. Die synthetisierten Komponenten werden entsprechend einer Skalierungshüllkurve skaliert, die unterhalb oder gleich der Schwelle40 ist, und die skalierten, synthetisierten Spektralkomponenten treten an die Stelle der nullwertigen Spektralkomponenten im Teilbandsignal. Der Dekodierer braucht keine Information vom Kodierer, die ausdrücklich das Niveau der Schwelle40 angibt, wenn die Mindestquantisierniveaus30 ,31 der zum Quantisieren der Spektralkomponenten verwendeten Quantisierfunktion q(x) bekannt ist. - 2. Skalierung
- Die Skalierhüllkurve kann auf verschiedene Art und Weise eingerichtet werden, von denen einige nachfolgend beschrieben werden; es können auch mehrere benutzt werden. Zum Beispiel kann eine zusammengesetzte Skalierhüllkurve abgeleitet werden, die dem Maximum aller auf verschiedene Weise erhaltenen Hüllkurven gleicht, oder durch Anwenden verschiedener Möglichkeiten zum Einrichten oberer und/oder unterer Grenzen für die Skalierhüllkurve. Die Einrichtungsmöglichkeiten können entsprechend Merkmalen des kodierten Signals angepaßt oder ausgewählt werden, und sie können als Funktion der Frequenz angepaßt oder ausgewählt werden.
- a) Einheitliche Hüllkurve
- Eine Möglichkeit ist für Dekodierer in Audiotransformations-Kodiersystemen und in Systemen geeignet, in denen andere Verwirklichungen einer Filterbank vorgesehen sind. Auf diese Weise wird eine einheitliche Skalierhüllkurve eingerichtet, wenn sie der Schwelle
40 entsprechend gesetzt wird. Ein Beispiel einer solchen Skalierhüllkurve ist in5 gezeigt, wo schraffierte Bereiche die Spektrallücken veranschaulichen, die mit synthetisierten Spektralkomponenten gefüllt werden. Das Spektrum43 gibt eine Hüllkurve der Spektralkomponenten eines Audiosignals wieder, bei dem die Spektrallücken mit synthetisierten Spektralkomponenten gefüllt sind. Die Obergrenzen der schraffierten Bereiche, die in dieser und späteren Figuren gezeigt sind, geben nicht die tatsächlichen Niveaus der synthetisierten Spektralkomponenten selbst wieder, sondern stellen lediglich eine Skalierhüllkurve für die synthetisierten Komponenten dar. Die zum Füllen von Spektrallücken verwendeten synthetisierten Komponenten haben Spektralniveaus, die nicht über die Skalierhüllkurve hinausgehen. - b) Spektralstreufaktor
- Eine zweite Möglichkeit zum Einrichten einer Skalierhüllkurve ist gut geeignet für Dekodierer in Audiokodiersystemen, die mit Blocktransformationen arbeiten, aber sie basiert auf Grundsätzen, die auch auf andere Verwirklichungen von Filterbanken anwendbar sind. Hierbei wird eine nicht einheitliche Skalierhüllkurve geschaffen, die sich entsprechend Eigenschaften des Spektralstreufaktors des Frequenzganges des Prototypfilters bei einer Blocktransformation ändert.
- Der in
6 gezeigte Frequenzgang50 ist eine graphische Darstellung eines hypothetischen Frequenzganges für einen Transformationsprototypfilter, der einen Spektralstreufaktor zwischen Koeffizienten zeigt. Der Frequenzgang hat eine Hauptkeule, die normalerweise als Paßband des Prototypfilters bezeichnet wird, und eine Anzahl von der Hauptkeule benachbarten Nebenkeulen, deren Niveau für Frequenzen weiter weg von der Mitte des Paßbandes abnimmt. Die Nebenkeulen stellen Spektralenergie dar, die vom Paßband in benachbarte Frequenzbänder streut. Die Rate, mit der das Niveau dieser Nebenkeulen abnimmt, wird als Rate des Frequenzgangabfalls der Spektralstreuung bezeichnet. - Die Spektralstreucharakteristiken eines Filters legen der Spektralisolation zwischen einander benachbarten Frequenzteilbändern Grenzen auf. Wenn ein Filter eine große Menge Spektralstreuung hat, können die Spektralniveaus in einander benachbarten Teilbändern sich nicht so stark unterscheiden, wie das für Filter mit geringerem Ausmaß an Spektralstreuung möglich ist. Die in
7 gezeigte Hüllkurve41 ist des Frequenzgangabfalls der in6 gezeigten Spektralstreuung angenähert. Synthetisierte Spektralkomponenten können auf eine solche Hüllkurve skaliert werden, oder diese Hüllkurve kann alternativ als eine untere Grenze für eine Skalierhüllkurve dienen, die auf andere Weise abgeleitet wird. - Das in
9 gezeigte Spektrum44 ist eine graphische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetisierten Spektralkomponenten, die entsprechend einer Hüllkurve skaliert sind, die sich des Frequenzgangabfalls der Spektralstreuung nähert. Die Skalierhüllkurve für Spektrallücken, die zu beiden Seiten von Spektralenergie begrenzt sind, ist eine Zusammensetzung aus zwei individuellen Hüllkurven, einer für jede Seite. Die Zusammensetzung ist dadurch gebildet, daß die größere der beiden individuellen Hüllkurven genommen wird. - c) Filter
- Eine dritte Möglichkeit zum Einrichten einer Skalierhüllkurve ist gleichfalls gut geeignet für Dekodierer in Audiokodiersystemen, die Blocktransformationen anwenden, beruht aber gleichfalls auf Grundsätzen, die auch auf andere Verwirklichungen der Filterbank anwendbar sind. Mit dieser Einrichtungsmöglichkeit wird eine nicht einheitliche Skalierhüllkurve geschaffen, die vom Ausgang eines Frequenzbereichsfilters abgeleitet ist, der zur Transformation von Koeffizienten im Frequenzbereich angewandt wird. Der Filter kann ein Vorhersagefilter, ein Tiefpaßfilter oder im wesentlichen jede beliebige andere Art von Filter sein, der die gewünschte Skalierhüllkurve bereitstellt. Für diese Art werden normalerweise mehr Rechenressourcen benötigt als für die beiden vorstehend beschriebenen Arten erforderlich sind, aber sie erlaubt Änderungen der Skalierhüllkurve als Funktion der Frequenz.
-
8 ist eine graphische Darstellung von zwei Skalierhüllkurven, die vom Ausgang eines anpaßbaren Frequenzbereichsfilters abgeleitet sind. Die Skalierhüllkurve52 könnte zum Beispiel benutzt werden, um Spektrallücken in Signalen oder Teilen von Signalen zu füllen, die eher als tonartig erachtet werden, und die Skalierhüllkurve53 könnte zum Füllen von Spektrallücken in Signalen oder Teilen von Signalen benutzt werden, die eher als rauschartig erachtet werden. Ton- und Rauscheigenschaften eines Signals können auf verschiedenste Weise bewertet werden, von denen einige nachfolgend beschrieben werden. Als Alternative könnte die Skalierhüllkurve52 zum Füllen von Spektrallücken niedrigerer Frequenzen benutzt werden, wo Audiosignale häufig eher tonartig sind, und die Skalierhüllkurve53 könnte zum Füllen von Spektrallücken bei höheren Frequenzen benutzt werden, wo Audiosignale häufig eher rauschartig sind. - d) Perzeptuelles Maskieren
- Eine vierte Art zum Einrichten einer Skalierhüllkurve ist auf Dekodierer in Audiokodiersystemen anwendbar, die Filterbänke mit Blocktransformationen und andere Arten von Filtern implementieren.
- Mit dieser Möglichkeit wird eine nicht einheitliche Skalierhüllkurve geschaffen, die sich entsprechend geschätzter psychoakustischer Maskiereffekte ändert.
-
10 zeigt zwei hypothetische psychoakustische Maskierschwellen. Die Schwelle61 stellt die psychoakustischen Maskiereffekte einer niederfrequenten Spektralkomponente60 dar, und die Schwelle64 stellt die psychoakustischen Maskiereffekte einer höherfrequenten Spektralkomponente63 dar. Maskierschwellen wie diese können benutzt werden, um die Form der Skalierhüllkurve abzuleiten. - Das in
11 gezeigte Spektrum45 ist eine graphische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetisierten Ersatzspektralkomponenten, die in Übereinstimmung mit Hüllkurven skaliert sind, welche auf psychoakustischer Maskierung beruhen. Im Fall des gezeigten Beispiels ist die Skalierhüllkurve in der Spektrallücke der niedrigsten Frequenz vom unteren Teil der Maskierschwelle61 abgeleitet. Die Skalierhüllkurve in der mittleren Spektrallücke ist eine Zusammensetzung aus dem oberen Teil der Maskierschwelle61 und dem unteren Teil der Maskierschwelle64 . Die Skalierhüllkurve in der Spektrallücke mit der höchsten Frequenz ist vom oberen Teil der Maskierschwelle64 abgeleitet. - e) Tonalität
- Eine fünfte Möglichkeit zum Einrichten einer Skalierhüllkurve beruht auf einer Beurteilung der Tonalität des gesamten Audiosignals oder eines Teils des Signals, beispielsweise für ein oder mehr Teilbandsignale. Tonalität kann auf verschiedene Weise beurteilt werden, einschließlich der Berechnung eines Maßes spektraler Flachheit (SFM), bei dem es sich um einen normierten Quotienten des arithmetischen Mittelwertes von Signalabtastwerten, dividiert durch den geometrischen Mittelwert der Signalabtastwerte handelt. Ein Wert in der Nähe von Eins zeigt an, daß ein Signal sehr rauschartig ist, und ein Wert in der Nähe von Null zeigt ein Signal an, das sehr tonartig ist. SFM kann unmittelbar benutzt werden, um die Skalierhüllkurve anzupassen. Wenn SFM Null ist, werden keine synthetisierten Komponenten benutzt, um eine Spektrallücke zu füllen. Ist SFM hingegen Eins, wird das maximal erlaubte Niveau synthetisierter Komponenten benutzt, die Spektrallücke zu füllen. Insgesamt kann jedoch ein Kodierer ein besseres SFM berechnen, weil er Zugang auf das gesamte ursprüngliche Audiosignal vor dem Kodieren hat. Es ist wahrscheinlich, daß ein Dekodierer kein genaues SFM berechnet, weil QTZ-Spektralkomponenten vorhanden sind.
- Ein Dekodierer kann auch die Tonalität dadurch beurteilen, daß er die Anordnung oder Verteilung der nicht nullwertigen und der nullwertigen Spektralkomponenten analysiert. Bei einer Verwirklichung wird ein Signal eher tonartig als rauschartig erachtet, wenn lange Strecken von nullwertigen Spektralkomponenten zwischen wenigen großen nicht nullwertigen Komponenten verteilt sind, weil diese Anordnung eine Struktur spektraler Spitzen impliziert.
- Bei noch einer weiteren Verwirklichung wendet ein Dekodierer auf ein oder mehr Teilbandsignale einen Vorhersagefilter an und bestimmt die Vorhersageverstärkung. Mit zunehmender Vorhersageverstärkung wird ein Signal für mehr tonartig gehalten.
- f) Zeitliche Skalierung
-
12 ist eine graphische Darstellung eines hypothetischen Teilbandsignals, welches kodiert werden soll. Die Linie46 stellt eine zeitliche Hüllkurve der Größe von Spektralkomponenten dar. Dieses Teilbandsignal kann aus einer gemeinsamen Spektralkomponente oder einem Transformationskoeffizienten in einer Folge von Blöcken zusammengesetzt sein, die von einer Analysefilterbank erhalten werden, welche durch eine Blocktransformation verwirklicht ist, oder es kann sich um ein Teilbandsignal handeln, welches von einer anderen Art von Analysefilterbank erhalten ist, die durch einen anderen digitalen Filter als eine Blocktransformation verwirklicht ist, beispielsweise einen QMF. Während des Kodierprozesses werden alle Spektralkomponenten, deren Größe unterhalb der Schwelle40 liegt, auf Null quantisiert. Die Schwelle40 ist wegen der zweckmäßigeren Darstellung mit einem einheitlichen Wert über das ganze Zeitintervall gezeigt. Dies ist nicht typisch für viele Kodiersysteme mit Filterbänken, die durch Blocktransformationen verwirklicht sind. -
13 ist eine graphische Darstellung des hypothetischen Teilbandsignals, welches von quantisierten Spektralkomponenten wiedergegeben ist. Die Linie47 stellt eine zeitliche Hüllkurve der Größe von Spektralkomponenten dar, die quantisiert wurden. Die in dieser Figur und auch in weiteren Figuren gezeigte Linie zeigt nicht die Auswirkungen des Quantisierens der Spektralkomponenten, deren Größen oberhalb oder gleich der Schwelle40 sind. Der Unterschied zwischen den QTZ-Spektralkomponenten im quantisierten Signal und den entsprechenden Spektralkomponenten im ursprünglichen Signal ist schraffiert gezeigt. Der schraffierte Bereich stellt eine Spektrallücke innerhalb eines Zeitintervalls dar, die mit synthetisierten Spektralkomponenten zu füllen ist. - Bei einer Verwirklichung der vorliegenden Erfindung empfängt ein Dekodierer ein Eingangssignal, welches eine kodierte Darstellung quantisierter Teilbandsignale übermittelt, wie in
13 gezeigt. Der Dekodierer dekodiert die kodierte Wiedergabe und identifiziert jene Teilbandsignale, in denen eine Vielzahl der Spektralkomponenten einen Wert Null haben und denen Spektralkomponenten mit Nichtnull-Werten vorausgehen und/oder folgen. Der Dekodierer erzeugt mit einem Prozeß wie den nachfolgend beschriebenen synthetisierte Spektralkomponenten, die den nullwertigen Spektralkomponenten entsprechen. Die synthetisierten Komponenten werden entsprechend einer Skalierhüllkurve skaliert. Vorzugsweise erklärt die Skalierhüllkurve die zeitlichen Maskiereigenschaften des menschlichen Hörsystems. -
14 zeigt eine hypothetische zeitliche psychoakustische Maskierschwelle. Die Schwelle68 gibt die zeitlichen psychoakustischen Maskiereffekte einer Spektralkomponente wieder. Der Teil der Schwelle links von der Spektralkomponente67 gibt vor-zeitliche Maskiereigenschaften oder das Maskieren wieder, das dem Auftreten der Spektralkomponente vorausgeht. Der Teil der Schwelle rechts von der Spektralkomponente67 stellt nach-zeitliche Maskiereigenschaften oder Maskieren dar, welches auf das Erscheinen der Spektralkomponente folgt. Nachmaskiereffekte haben insgesamt eine Dauer, die viel länger ist als die Dauer von Vormaskiereffekten. Eine zeitliche Maskierschwelle, wie diese hier, kann zum Ableiten einer zeitlichen Gestalt der Skalierhüllkurve benutzt werden. - Die Linie
48 in15 ist eine graphische Darstellung eines hypothetischen Teilbandsignals mit synthetisierten Ersatzspektralkomponenten, die in Übereinstimmung mit Hüllkurven skaliert sind, welche auf zeitlichen psychoakustischen Maskiereffekten beruhen. Im gezeigten Beispiel ist die Skalierhüllkurve eine Zusammensetzung aus zwei individuellen Hüllkurven. Die individuelle Hüllkurve für den niederfrequenten Teil der Spektrallücke ist vom Nachmaskierteil der Schwelle68 abgeleitet. Die individuelle Hüllkurve für den höherfrequenten Teil der Spektrallücke ist vom Vormaskierteil der Schwelle68 abgeleitet. - 3. Erzeugen synthetisierter Komponenten
- Die synthetisierten Spektralkomponenten können auf verschiedene Weise generiert werden, von denen zwei nachfolgend beschrieben werden. Es können viele Wege benutzt werden. Zum Beispiel können unterschiedliche Wege in Abhängigkeit von Eigenschaften des kodierten Signals oder als Funktion der Frequenz gewählt werden.
- Auf einem ersten Weg wird ein rauschartiges Signal erzeugt. Im wesentlichen kann irgendeine einer Vielfalt von Methoden zum Erzeugen von Pseudorauschsignalen angewandt werden.
- Im Fall eines zweiten Weges wird eine Technik angewandt, die als spektrale Translation oder spektrale Duplikation bezeichnet wird, mit der Spektralkomponenten aus einem oder mehr Frequenzteilbändern kopiert werden. Niederfrequente Spektralkomponenten werden üblicherweise kopiert, um Spektrallücken bei höheren Frequenzen zu füllen, denn höherfrequente Komponenten stehen oft in irgendeiner Weise in Beziehung zu niederfrequenten Komponenten. Im Prinzip können jedoch Spektralkomponenten auf höhere oder niedrigere Frequenzen kopiert werden.
- Das in
16 gezeigte Spektrum49 ist eine graphische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetisierten Spektralkomponenten, die durch spektrale Duplikation erzeugt sind. Ein Teil der spektralen Spitze ist in der Frequenz viele Male auf- und abdupliziert, um Spektrallücken bei den niedrigen bzw. mittleren Frequenzen zu füllen. Ein Abschnitt der Spektralkomponenten in der Nähe des hohen Endes des Spektrums wird in der Frequenz nach oben dupliziert, um die Spektrallücke am hohen Ende des Spektrums zu füllen. Im gezeigten Beispiel sind die duplizierten Komponenten mit einer einheitlichen Skalierhüllkurve skaliert. Im wesentlichen kann aber irgendeine Form von Skalierhüllkurve benutzt werden. - C. Kodierer
- Die vorstehend beschriebenen Aspekte der vorliegenden Erfindung können in einem Dekodierer durchgeführt werden, ohne daß an bestehenden Kodierern irgendeine Abwandlung vorgenommen werden muß. Diese Aspekte können gefördert werden, wenn der Kodierer modifiziert wird, um zusätzliche Steuerinformation bereitzustellen, die sonst für den Dekodierer nicht zur Verfügung stünde. Die zusätzliche Steuerinformation kann dazu benutzt werden, die Art und Weise anzupassen, in der im Dekodierer synthetisierte Spektralkomponenten erzeugt und skaliert werden.
- 1. Steuerinformation
- Ein Kodierer kann eine Vielfalt an Skaliersteuerinformation bereitstellen, die ein Dekodierer zum Anpassen der Skalierhüllkurve für synthetisierte Spektralkomponenten benutzen kann. Jedes der nachfolgend beschriebenen Beispiele kann für ein gesamtes Signal und/oder für Frequenzteilbänder des Signals vorgesehen werden.
- Wenn ein Teilband Spektralkomponenten enthält, die deutlich unterhalb des Mindestquantisierniveaus liegen, kann ein Kodierer dem Dekodierer Information zur Verfügung stellen, die diesen Zustand anzeigt. Die Information kann eine Art von Index sein, den ein Dekodierer zum Auswählen unter zwei oder mehr Skalierniveaus benutzen kann, oder die Information kann irgendein Maß des Spektralniveaus übermitteln, beispielsweise Durchschnittsleistung oder Effektivleistung (RMS). Der Dekodierer kann die Skalierhüllkurve in Abhängigkeit von dieser Information anpassen.
- Wie schon gesagt, kann ein Dekodierer die Skalierhüllkurve in Abhängigkeit von psychoakustischen Maskiereffekten anpassen, die anhand des kodierten Signals selbst geschätzt wurden. Es ist aber auch möglich, daß der Kodierer eine bessere Schätzung dieser Maskiereffekte abgibt, wenn der Kodierer Zugang zu Merkmalen des Signals hat, die durch einen Kodierprozeß verloren gehen. Das läßt sich erreichen, wenn man das Modell
13 psychoakustische Information an den Formatierer18 liefern läßt, die ansonsten vom kodierten Signal nicht verfügbar ist. Wenn man diese Art von Information benutzt, kann der Dekodierer die Skalierhüllkurve anpassen, um die synthetisierten Spektralkomponenten in Übereinstimmung mit einem oder mehr psychoakustischen Kriterien zu gestalten. - Die Skalierhüllkurve kann auch in Abhängigkeit von einer Beurteilung der rauschartigen oder tonartigen Qualitäten eines Signals oder Teilbandsignals angepaßt werden. Diese Beurteilung kann auf verschiedene Weise entweder vom Kodierer oder vom Dekodierer durchgeführt werden. Allerdings ist ein Kodierer normalerweise für eine bessere Beurteilung geeignet. Die Ergebnisse dieser Beurteilung können mit dem kodierten Signal zusammengeführt werden. Eine Beurteilung ist das oben beschriebene SFM.
- Eine Angabe des SFM kann auch von einem Dekodierer für seine Auswahl des Prozesses für das Generieren synthetisierter Spektralkomponenten benutzt werden. Bei einem SFM nahe bei Eins kann die Technik zum Erzeugen von Rauschen angewandt werden. Ist das SFM nahe bei Null, kann die Technik der spektralen Duplikation benutzt werden.
- Ein Kodierer kann einen Hinweis auf Leistung für die Nichtnull und die QTZ-Spektralkomponenten, beispielsweise das Verhältnis dieser beiden Leistungen liefern. Der Dekodierer kann die Leistung der Nichtnull-Spektralkomponenten berechnen und dann dieses Verhältnis oder eine sonstige Angabe benutzen, um die Skalierhüllkurve ordnungsgemäß anzupassen.
- 2. Null-Spektralkoeffizienten
- In der vorstehenden Beschreibung wird manchmal auf nullwertige Spektralkomponenten als QTZ (auf Null quantisierte) Komponenten Bezug genommen, weil die Quantisierung eine gemeinsame Quelle für nullwertige Komponenten in einem kodierten Signal ist. Dies ist nicht von essentieller Bedeutung. Der Wert von Spektralkomponenten in einem kodierten Signal kann im wesentlichen durch jedes beliebige Verfahren auf Null gesetzt werden. Zum Beispiel kann ein Kodierer die größte oder zwei Spektralkomponenten in jedem Teilbandsignal oberhalb einer bestimmten Frequenz identifizieren und alle anderen Spektralkomponenten in diesen Teilbandsignalen auf Null setzen. Alternativ kann ein Kodierer alle Spektralkomponenten in gewissen Teilbändern auf Null setzen, die niedriger sind als irgendeine Schwelle. Ein Dekodierer, der, wie beschrieben, verschiedene Aspekte der vorliegenden Erfindung verkörpert, kann Spektrallücken unbeachtlich des Prozesses füllen, der für deren Entstehung verantwortlich ist.
Claims (45)
- Verfahren zum Erzeugen von Audioinformation, aufweisend: Empfangen eines Eingangssignals und Erhalten eines Satzes von Teilbandsignalen von demselben, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben; Identifizieren eines bestimmten Teilbandsignals innerhalb des Satzes der Teilbandsignale, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert hat; Erzeugen synthetisierter Spektralkomponenten, die jeweiligen nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal entsprechen und gemäß einer Skalierhüllkurve skaliert sind, die unterhalb oder gleich der Schwelle ist; Erzeugen eines modifizierten Satzes von Teilbandsignalen durch Einsetzen der synthetisierten Spektralkomponenten anstelle entsprechender nullwertiger Spektralkomponenten in dem bestimmten Teilbandsignal; und Erzeugen der Audioinformation durch Anwenden einer Synthesefilterbank auf den modifizierten Satz von Teilbandsignalen.
- Verfahren nach Anspruch 1, bei dem die Skalierhüllkurve einheitlich ist.
- Verfahren nach Anspruch 1 oder 2, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht wird, die zwischen benachbarten Spektralkomponenten eine Spektralstreuung hat, und die Skalierhüllkurve sich mit einer Rate ändert, die einer Rate des Frequenzgangabfalls der Spektralstreuung der Blocktransformation im wesentlichen gleich ist.
- Verfahren nach einem der Ansprüche 1 bis 3, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht wird und das Verfahren aufweist: Anwenden eines Frequenzbereichsfilters auf eine oder mehrere Spektralkomponenten in dem Satz von Teilbandsignalen; und Ableiten der Skalierhüllkurve von einer Ausgabe des Frequenzbereichsfilters.
- Verfahren nach Anspruch 4, welches das Ändern des Ansprechens des Frequenzbereichsfilters als Funktion der Frequenz aufweist.
- Verfahren nach einem der Ansprüche 1 bis 5, aufweisend: Erhalten eines Maßes der Tonalität des durch den Satz von Teilbandsignalen wiedergege benen Audiosignals; und Anpassen der Skalierhüllkurve als Reaktion auf das Maß der Tonalität.
- Verfahren nach Anspruch 6, mit dem das Maß der Tonalität vom Eingangssignal erhalten wird.
- Verfahren nach Anspruch 6, welches das Maß der Tonalität von der Art ableitet, in der die nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal angeordnet sind.
- Verfahren nach einem der Ansprüche 1 bis 8, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht wird und das Verfahren aufweist: Erhalten einer Folge von Sätzen von Teilbandsignalen aus dem Eingangssignal; Identifizieren eines gemeinsamen Teilbandsignals in der Folge der Sätze von Teilbandsignalen, wo für jeden Satz in der Folge eine oder mehrere Spektralkomponenten einen Nichtnull-Wert und eine Vielzahl von Spektralkomponenten einen Null-Wert haben; Identifizieren einer gemeinsamen Spektralkomponente innerhalb des gemeinsamen Teilbandsignals, welche einen Nullwert in einer Vielzahl benachbarter Sätze in der Folge hat, denen ein Satz mit den gemeinsamen Spektralkomponenten, die einen Nichtnull-Wert haben, entweder vorausgeht oder nachfolgt; Skalieren der synthetisierten Spektralkomponenten, die den nullwertigen gemeinsamen Spektralkomponenten entsprechen, gemäß der Skalierhüllkurve, die sich von Satz zu Satz in der Folge in Übereinstimmung mit zeitlichen Maskiereigenschaften des menschlichen Hörsystems ändert; Erzeugen einer Folge modifizierter Sätze von Teilbandsignalen durch Einsetzen der synthetisierten Spektralkomponenten anstelle der entsprechenden nullwertigen gemeinsamen Spektralkomponenten in den Sätzen; und Erzeugen der Audioinformation durch Anwenden der Synthesefilterbank auf die Folge modifizierter Sätze von Teilbandsignalen.
- Verfahren nach einem der Ansprüche 1 bis 9, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht wird und das Verfahren die synthetisierten Spektralkomponenten durch Spektraltranslation anderer Spektralkomponenten in dem Satz von Teilbandsignalen erzeugt.
- Verfahren nach einem der Ansprüche 1 bis 10, bei dem die Skalierhüllkurve sich entsprechend zeitlicher Maskiereigenschaften des menschlichen Hörsystems ändert.
- Verfahren zum Erzeugen eines Ausgangssignals, aufweisend: Erzeugen eines Satzes von Teilbandsignalen, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben, durch Quantisieren von Information, welche durch Anwenden einer Analysefilterbank auf Audioinformation erhalten wird; Identifizieren eines bestimmten Teilbandsignals innerhalb des Satzes von Teilbandsignalen, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert haben; Ableiten von Skaliersteuerinformation von dem Spektralgehalt des Audiosignals, wobei die Skaliersteuerinformation das Skalieren synthetisierter Spektralkomponenten steuert, die synthetisiert und durch die die Spektralkomponenten, die einen Null-Wert haben, in einem Empfänger ersetzt werden sollen, der Audioinformation in Abhängigkeit von dem Ausgangssignal erzeugt; und Erzeugen des Ausgangssignals durch Zusammenführen der Skaliersteuerinformation und Information, die den Satz der Teilbandsignale wiedergibt.
- Verfahren nach Anspruch 12, aufweisend: Erhalten eines Maßes von Tonalität des Audiosignals, welches durch den Satz von Teilbandsignalen wiedergegeben wird; und Ableiten der Skaliersteuerinformation von dem Maß der Tonalität.
- Verfahren nach Anspruch 12 oder 13, aufweisend: Erhalten einer geschätzten psychoakustischen Maskierschwelle des Audiosignals, welches durch den Satz von Teilbandsignalen wiedergegeben wird; und Ableiten der Skaliersteuerinformation von der geschätzten psychoakustischen Maskierschwelle.
- Verfahren nach einem der Ansprüche 12 bis 14, aufweisend: Erhalten von zwei Spektralniveaumaßen für Teile des Audiosignals, die von den nichtnullwertigen und den nullwertigen Spektralkomponenten wiedergegeben werden; und Ableiten der Skaliersteuerinformation von den beiden Maßen der Spektralniveaus.
- Vorrichtung zum Erzeugen von Audioinformation, aufweisend: einen Deformatierer, der ein Eingangssignal empfängt und von diesem einen Satz von Teilbandsignalen erhält, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben; einen mit dem Deformatierer gekoppelten Dekodierer, der innerhalb des Satzes der Teilbandsignale ein bestimmtes Teilbandsignal identifiziert, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert haben, der synthetisierte Spektralkomponenten erzeugt, die jeweiligen nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal entsprechen und entsprechend einer Skalierhüllkurve skaliert sind, die unterhalb oder gleich der Schwelle ist, und der einen modifizierten Satz von Teilbandsignalen erzeugt, indem er die synthetisierten Spektralkomponenten anstelle entsprechender nullwertiger Spektralkomponenten in das bestimmte Teilbandsignal einsetzt; und eine mit dem Dekodierer gekoppelte Synthesefilterbank, welche die Audioinformation in Abhängigkeit von dem modifizierten Satz von Teilbandsignalen erzeugt.
- Vorrichtung nach Anspruch 16, bei der die Skalierhüllkurve einheitlich ist.
- Vorrichtung nach Anspruch 16 oder 17, bei der die Synthesefilterbank durch eine Blocktransformation verwirklicht ist, die zwischen benachbarten Spektralkomponenten Spektralstreuung hat, und bei der die Skalierhüllkurve sich mit einer Rate ändert, die einer Rate der Frequenzgangsenkung der Spektralstreuung der Blocktransformation im wesentlichen gleich ist.
- Vorrichtung nach einem der Ansprüche 16 bis 18, bei der die Synthesefilterbank durch eine Blocktransformation verwirklicht ist und der Dekodierer einen Frequenzbereichsfilter auf eine oder mehrere Spektralkomponenten in dem Satz von Teilbandsignalen anwendet; und die Skalierhüllkurve von einer Ausgabe des Frequenzbereichsfilters ableitet.
- Vorrichtung nach Anspruch 19, bei der der Dekodierer den Frequenzgang des Frequenzbereichsfilters als Funktion der Frequenz ändert.
- Vorrichtung nach einem der Ansprüche 16 bis 20, bei der der Dekodierer ein Maß der Tonalität des Audiosignals erhält, welches von dem Satz von Teilbandsignalen wiedergegeben wird; und die Skalierhüllkurve in Abhängigkeit von dem Tonalitätsmaß anpaßt.
- Vorrichtung nach Anspruch 21, welche das Tonalitätsmaß vom Eingangssignal erhält.
- Vorrichtung nach Anspruch 21, bei der der Dekodierer das Tonalitätsmaß von der Art ableitet, in der die nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal angeordnet sind.
- Vorrichtung nach einem der Ansprüche 16 bis 23, bei der die Synthesefilterbank durch eine Blocktransformation verwirklicht ist, und der Deformatierer eine Folge von Sätzen von Teilbandsignalen vom Eingangssignal erhält; der Dekodierer ein gemeinsames Teilbandsignal in der Folge der Teilbandsignalsätze identifiziert, wo für jeden Satz in der Folge eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und eine Vielzahl von Spektralkomponenten einen Null-Wert haben, eine gemeinsame Spektralkomponente innerhalb des gemeinsamen Teilbandsignals, welche einen Nullwert hat, in einer Vielzahl benachbarter Sätze in der Folge identifiziert, denen ein Satz mit den gemeinsamen Spektralkomponenten, die einen Nichtnull-Wert haben, entweder vorausgeht oder nachfolgt, die synthetisierten Spektralkomponenten, die den nullwertigen gemeinsamen Spektralkomponenten entsprechen, gemäß der Skalierhüllkurve skaliert, die sich von Satz zu Satz in der Folge gemäß zeitlichen Maskiereigenschaften des menschlichen Hörsystems ändert; und eine Folge modifizierter Sätze von Teilbandsignalen erzeugt, indem er die synthetisierten Spektralkomponenten anstelle der entsprechenden nullwertigen gemeinsamen Spektralkomponenten in den Sätzen einsetzt; und die Synthesefilterbank die Audioinformation in Abhängigkeit von der Folge modifizierter Sätze von Teilbandsignalen erzeugt.
- Vorrichtung nach einem der Ansprüche 16 bis 24, bei der die Synthesefilterbank durch eine Blocktransformation verwirklicht ist und der Dekodierer die synthetisierten Spektralkomponen ten durch Spektraltranslation anderer Spektralkomponenten in dem Satz von Teilbandsignalen erzeugt.
- Vorrichtung nach einem der Ansprüche 16 bis 25, bei der die Skalierhüllkurve sich entsprechend zeitlicher Maskiereigenschaften des menschlichen Hörsystems ändert.
- Vorrichtung zum Erzeugen eines Ausgangssignals, aufweisend: eine Analysefilterbank, die in Abhängigkeit von Audioinformation einen Satz von Teilbandsignalen erzeugt, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben; mit der Analysebank gekoppelte Quantisierer, welche die Spektralkomponenten quantisieren; einen mit den Quantisierern gekoppelten Kodierer, der innerhalb des Satzes von Teilbandsignalen ein bestimmtes Teilbandsignal identifiziert, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert haben, der Skaliersteuerinformation vom Spektralgehalt des Audiosignals ableitet, wobei die Skaliersteuerinformation das Skalieren synthetisierter Spektralkomponenten steuert, die synthetisiert und anstelle der Spektralkomponenten, die einen Null-Wert haben, in einem Empfänger eingesetzt werden sollen, der Audioinformation in Abhängigkeit von dem Ausgangssignal erzeugt; und einen mit dem Kodierer gekoppelten Formatierer, der das Ausgangssignal durch das Zusammenführen der Skaliersteuerinformation und von Information, die den Satz von Teilbandsignalen wiedergibt, erzeugt.
- Vorrichtung nach Anspruch 27, die ein Maß der Tonalität des Audiosignals erhält, welches von dem Satz von Teilbandsignalen wiedergegeben ist; und die Skaliersteuerinformation von dem Tonalitätsmaß ableitet.
- Vorrichtung nach Anspruch 27 oder 28, die eine Modulierkomponente aufweist, welche eine geschätzte psychoakustische Maskierschwelle des von dem Teilbandsignalsatz wiedergegebenen Audiosignals erhält und die Skaliersteuerinformation von der geschätzten psychoakustischen Maskierschwelle ableitet.
- Vorrichtung nach einem der Ansprüche 27 bis 29, die zwei Spektralniveaumaße für Teile des Audiosignals erhält, die von den nichtnullwertigen und den nullwertigen Spektralkomponenten wiedergegeben sind; und die Skaliersteuerinformation von den beiden Maßen der Spektralniveaus ableitet.
- Träger, der ein Befehlsprogramm übermittelt und von einem Gerät zum Ausführen des Befehlsprogramms lesbar ist, um ein Verfahren zum Erzeugen von Audioinformation durchzuführen, wobei das Verfahren folgendes aufweist: Empfangen eines Eingangssignals und Erhalten eines Satzes von Teilbandsignalen von demselben, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben; Identifizieren eines bestimmten Teilbandsignals innerhalb des Satzes der Teilbandsignale, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert hat; Erzeugen synthetisierter Spektralkomponenten, die jeweiligen nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal entsprechen und gemäß einer Skalierhüllkurve skaliert sind, die unterhalb oder gleich der Schwelle ist; Erzeugen eines modifizierten Satzes von Teilbandsignalen durch Einsetzen der synthetisierten Spektralkomponenten anstelle entsprechender nullwertiger Spektralkomponenten in dem bestimmten Teilbandsignal; und Erzeugen der Audioinformation durch Anwenden einer Synthesefilterbank auf den modifizierten Satz von Teilbandsignalen.
- Träger nach Anspruch 31, bei dem die Skalierhüllkurve einheitlich ist.
- Träger nach Anspruch 31 oder 32, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht ist, die zwischen benachbarten Spektralkomponenten Spektralstreuung hat und die Skalierhüllkurve sich mit einer Rate ändert, die einer Rate des Frequenzgangabfalls der Spektralstreuung der Blocktransformation im wesentlichen gleich ist.
- Träger nach einem der Ansprüche 31 bis 33, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht ist und das Verfahren aufweist, einen Frequenzbereichsfilter auf eine oder mehrere Spektralkomponenten in dem Satz von Teilbandsignalen anzuwenden, und die Skalierhüllkurve von einer Ausgabe des Frequenzbereichsfilters abzuleiten.
- Träger nach Anspruch 34, bei dem das Verfahren aufweist, den Frequenzgang des Frequenzbereichsfilters als Funktion der Frequenz zu ändern.
- Träger nach einem der Ansprüche 31 bis 35, bei dem das Verfahren aufweist, ein Maß der Tonalität des Audiosignals zu erhalten, welches von dem Satz von Teilbandsignalen wiedergegeben ist; und die Skalierhüllkurve in Abhängigkeit von dem Tonalitätsmaß anzupassen.
- Träger nach Anspruch 36, bei dem das Verfahren das Tonalitätsmaß vom Eingangssignal erhält.
- Träger nach Anspruch 36, bei dem das Verfahren aufweist, das Maß der Tonalität von der Art abzuleiten, in der die nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal angeordnet sind.
- Träger nach einem der Ansprüche 31 bis 38, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht ist und das Verfahren aufweist: eine Folge von Sätzen von Teilbandsignalen vom Eingangssignal zu erhalten; ein gemeinsames Teilbandsignal in der Folge der Teilbandsätze zu identifizieren, wo für jeden Satz in der Folge eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und eine Vielzahl von Spektralkomponenten einen Null-Wert haben; Identifizieren einer gemeinsamen Spektralkomponente innerhalb des gemeinsamen Teilbandsignals, die in einer Vielzahl einander benachbarter Sätze in der Folge einen Null-Wert hat, denen ein Satz mit den gemeinsamen Spektralkomponenten, die einen Nichtnull-Wert haben, entweder vorausgeht oder nachfolgt; Skalieren der synthetisierten Spektralkomponenten, die den nullwertigen gemeinsamen Spektralkomponenten entsprechen, gemäß der Skalierhüllkurve, die sich von Satz zu Satz in der Folge in Übereinstimmung mit zeitlichen Maskiereigenschaften des menschlichen Hörsystems ändert; Erzeugen einer Folge modifizierter Sätze von Teilbandsignalen durch Einsetzen der synthetisierten Spektralkomponenten anstelle der entsprechenden nullwertigen gemeinsamen Spektralkomponenten in den Sätzen; und Erzeugen der Audioinformation durch Anwenden der Synthesefilterbank auf die Folge modifizierter Sätze von Teilbandsignalen.
- Träger nach einem der Ansprüche 31 bis 39, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht ist und das Verfahren die synthetisierten Spektralkomponenten durch Spektraltranslation anderer Spektralkomponenten in dem Satz von Teilbandsignalen erzeugt.
- Träger nach einem der Ansprüche 31 bis 40, bei dem die Skalierhüllkurve sich in Übereinstimmung mit zeitlichen Maskiereigenschaften des menschlichen Hörsystems ändert.
- Träger, der ein Befehlsprogramm übermittelt und von einem Gerät zum Ausführen des Befehlsprogramms lesbar ist, um ein Verfahren zum Erzeugen eines Ausgangssignals durchzuführen, wobei das Verfahren aufweist: Erzeugen eines Satzes von Teilbandsignalen, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben, durch Quantisieren von Information, welche durch Anwenden einer Analysefilterbank auf Audioinformation erhalten wird; Identifizieren eines bestimmten Teilbandsignals innerhalb des Satzes von Teilbandsignalen, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert haben; Ableiten von Skaliersteuerinformation von dem Spektralgehalt des Audiosignals, wobei die Skaliersteuerinformation das Skalieren synthetisierter Spektralkomponenten steuert, die synthetisiert und durch die die Spektralkomponenten, die einen Null-Wert haben, in einem Empfänger ersetzt werden sollen, der Audioinformation in Abhängigkeit von dem Ausgangssignal erzeugt; und Erzeugen des Ausgangssignals durch Zusammenführen der Skaliersteuerinformation und Information, die den Satz der Teilbandsignale wiedergibt.
- Träger nach Anspruch 42, bei dem das Verfahren aufweist, ein Maß der Tonalität des Audiosignals zu erhalten, welches von dem Satz von Teilbandsignalen wiedergegeben ist; und die Skaliersteuerinformation von dem Tonalitätsmaß abzuleiten.
- Träger nach Anspruch 42 oder 43, bei dem das Verfahren aufweist, eine geschätzte psychoakustische Maskierschwelle des von dem Satz von Teilbandsignalen wiedergegebenen Audiosignals zu erhalten; und die Skaliersteuerinformation von der geschätzten psychoakustischen Maskierschwelle abzuleiten.
- Träger nach einem der Ansprüche 42 bis 44, bei dem das Verfahren aufweist, zwei Spektralniveaumaße für Teile des Audiosignals zu erhalten, die von den nicht nullwertigen und den nullwertigen Spektralkomponenten wiedergegeben sind; und die Skaliersteuerinformation von den beiden Maßen der Spektralniveaus abzuleiten.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US174493 | 1993-12-28 | ||
US10/174,493 US7447631B2 (en) | 2002-06-17 | 2002-06-17 | Audio coding system using spectral hole filling |
PCT/US2003/017078 WO2003107328A1 (en) | 2002-06-17 | 2003-05-30 | Audio coding system using spectral hole filling |
Publications (3)
Publication Number | Publication Date |
---|---|
DE60310716D1 DE60310716D1 (de) | 2007-02-08 |
DE60310716T2 true DE60310716T2 (de) | 2007-10-11 |
DE60310716T8 DE60310716T8 (de) | 2008-01-31 |
Family
ID=29733607
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE60310716T Active DE60310716T8 (de) | 2002-06-17 | 2003-05-30 | System für die audiokodierung mit füllung von spektralen lücken |
DE60333316T Expired - Lifetime DE60333316D1 (de) | 2002-06-17 | 2003-05-30 | Verfahren zur Erzeugung von Toninformationen |
DE60332833T Expired - Lifetime DE60332833D1 (de) | 2002-06-17 | 2003-06-09 | Audiocodierungssystem, das eigenschaften eines decodierten signals zur anpassung synthetisierter spektralkomponenten verwendet |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE60333316T Expired - Lifetime DE60333316D1 (de) | 2002-06-17 | 2003-05-30 | Verfahren zur Erzeugung von Toninformationen |
DE60332833T Expired - Lifetime DE60332833D1 (de) | 2002-06-17 | 2003-06-09 | Audiocodierungssystem, das eigenschaften eines decodierten signals zur anpassung synthetisierter spektralkomponenten verwendet |
Country Status (20)
Country | Link |
---|---|
US (4) | US7447631B2 (de) |
EP (6) | EP1736966B1 (de) |
JP (6) | JP4486496B2 (de) |
KR (5) | KR100991450B1 (de) |
CN (1) | CN100369109C (de) |
AT (7) | ATE536615T1 (de) |
CA (6) | CA2735830C (de) |
DE (3) | DE60310716T8 (de) |
DK (3) | DK1514261T3 (de) |
ES (1) | ES2275098T3 (de) |
HK (6) | HK1070728A1 (de) |
IL (2) | IL165650A (de) |
MX (1) | MXPA04012539A (de) |
MY (2) | MY159022A (de) |
PL (1) | PL208344B1 (de) |
PT (1) | PT2216777E (de) |
SG (3) | SG2014005300A (de) |
SI (2) | SI2209115T1 (de) |
TW (1) | TWI352969B (de) |
WO (1) | WO2003107328A1 (de) |
Families Citing this family (144)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
DE10134471C2 (de) * | 2001-02-28 | 2003-05-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
WO2004006625A1 (en) * | 2002-07-08 | 2004-01-15 | Koninklijke Philips Electronics N.V. | Audio processing |
US7889783B2 (en) * | 2002-12-06 | 2011-02-15 | Broadcom Corporation | Multiple data rate communication system |
ES2290764T3 (es) | 2003-05-28 | 2008-02-16 | Dolby Laboratories Licensing Corporation | Metodo, aparato y programa de ordenador para calcular y ajustar la sonoridad percibida de una señal de audio. |
US7461003B1 (en) * | 2003-10-22 | 2008-12-02 | Tellabs Operations, Inc. | Methods and apparatus for improving the quality of speech signals |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
WO2005093717A1 (en) * | 2004-03-12 | 2005-10-06 | Nokia Corporation | Synthesizing a mono audio signal based on an encoded miltichannel audio signal |
WO2005111568A1 (ja) * | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
EP1939862B1 (de) * | 2004-05-19 | 2016-10-05 | Panasonic Intellectual Property Corporation of America | Kodiervorrichtung, Dekodiervorrichtung und Verfahren dafür |
JP2008510197A (ja) * | 2004-08-17 | 2008-04-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | スケーラブルなオーディオ符号化 |
US20090182563A1 (en) * | 2004-09-23 | 2009-07-16 | Koninklijke Philips Electronics, N.V. | System and a method of processing audio data, a program element and a computer-readable medium |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
WO2006047600A1 (en) | 2004-10-26 | 2006-05-04 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
KR100657916B1 (ko) * | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
KR100707173B1 (ko) * | 2004-12-21 | 2007-04-13 | 삼성전자주식회사 | 저비트율 부호화/복호화방법 및 장치 |
KR100851970B1 (ko) * | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7813573B2 (en) * | 2005-09-08 | 2010-10-12 | Monro Donald M | Data coding and decoding with replicated matching pursuits |
US20070053603A1 (en) * | 2005-09-08 | 2007-03-08 | Monro Donald M | Low complexity bases matching pursuits data coding and decoding |
US8121848B2 (en) * | 2005-09-08 | 2012-02-21 | Pan Pacific Plasma Llc | Bases dictionary for low complexity matching pursuits data coding and decoding |
US7848584B2 (en) * | 2005-09-08 | 2010-12-07 | Monro Donald M | Reduced dimension wavelet matching pursuits coding and decoding |
US8126706B2 (en) * | 2005-12-09 | 2012-02-28 | Acoustic Technologies, Inc. | Music detector for echo cancellation and noise reduction |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
CN101410892B (zh) | 2006-04-04 | 2012-08-08 | 杜比实验室特许公司 | 改进的离散余弦变换域中的音频信号响度测量及修改 |
EP1869669B1 (de) * | 2006-04-24 | 2008-08-20 | Nero AG | Erweiterte vorrichtung zur kodierung digitaler audiodaten |
CN102684628B (zh) | 2006-04-27 | 2014-11-26 | 杜比实验室特许公司 | 修正音频动态处理器的参数的方法以及执行该方法的设备 |
US20070270987A1 (en) * | 2006-05-18 | 2007-11-22 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
KR101137715B1 (ko) | 2006-10-20 | 2012-04-25 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 리셋을 사용하는 오디오 다이내믹스 프로세싱 |
US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
AU2012261547B2 (en) * | 2007-03-09 | 2014-04-17 | Skype | Speech coding system and method |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
US7774205B2 (en) * | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8396574B2 (en) | 2007-07-13 | 2013-03-12 | Dolby Laboratories Licensing Corporation | Audio processing using auditory scene analysis and spectral skewness |
PT2571024E (pt) | 2007-08-27 | 2014-12-23 | Ericsson Telefon Ab L M | Frequência de transição adaptativa entre preenchimento de ruído e extensão da largura de banda |
HUE047607T2 (hu) | 2007-08-27 | 2020-05-28 | Ericsson Telefon Ab L M | Eljárás és eszköz hangjel észlelési spektrális dekódolására, beleértve a spektrális lyukak kitöltését |
US8538763B2 (en) * | 2007-09-12 | 2013-09-17 | Dolby Laboratories Licensing Corporation | Speech enhancement with noise level estimation adjustment |
WO2009035614A1 (en) * | 2007-09-12 | 2009-03-19 | Dolby Laboratories Licensing Corporation | Speech enhancement with voice clarity |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
EP2229676B1 (de) * | 2007-12-31 | 2013-11-06 | LG Electronics Inc. | Verfahren und vorrichtung zur verarbeitung eines tonsignals |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
CN102150201B (zh) * | 2008-07-11 | 2013-04-17 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
AU2009267459B2 (en) * | 2008-07-11 | 2014-01-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
KR101576318B1 (ko) * | 2008-08-08 | 2015-12-09 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 스펙트럼 평활화 장치, 부호화 장치, 복호 장치, 통신 단말 장치, 기지국 장치 및 스펙트럼 평활화 방법 |
WO2010028299A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8532998B2 (en) | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
WO2010031049A1 (en) * | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
WO2010031003A1 (en) | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
US9947340B2 (en) | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
TWI788752B (zh) * | 2009-02-18 | 2023-01-01 | 瑞典商杜比國際公司 | 用於高頻重建或參數立體聲之複指數調變濾波器組 |
TWI597938B (zh) | 2009-02-18 | 2017-09-01 | 杜比國際公司 | 低延遲調變濾波器組 |
KR101078378B1 (ko) * | 2009-03-04 | 2011-10-31 | 주식회사 코아로직 | 오디오 부호화기의 양자화 방법 및 장치 |
KR101320963B1 (ko) * | 2009-03-31 | 2013-10-23 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템 |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CA2778325C (en) * | 2009-10-20 | 2015-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
BR122021008581B1 (pt) | 2010-01-12 | 2022-08-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo |
EP3564954B1 (de) * | 2010-01-19 | 2020-11-11 | Dolby International AB | Verbesserte subbandblockbasierte harmonische transposition |
TWI557723B (zh) | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
US9047876B2 (en) | 2010-03-30 | 2015-06-02 | Panasonic Intellectual Property Managment Co., Ltd. | Audio device |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
WO2011156905A2 (en) * | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
WO2012037515A1 (en) | 2010-09-17 | 2012-03-22 | Xiph. Org. | Methods and systems for adaptive time-frequency resolution in digital data coding |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
WO2012053150A1 (ja) * | 2010-10-18 | 2012-04-26 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
EP3244405B1 (de) * | 2011-03-04 | 2019-06-19 | Telefonaktiebolaget LM Ericsson (publ) | Audiodecodierung mit verstärkungskorrektur nach quantisierung |
WO2012122297A1 (en) * | 2011-03-07 | 2012-09-13 | Xiph. Org. | Methods and systems for avoiding partial collapse in multi-block audio coding |
WO2012122299A1 (en) | 2011-03-07 | 2012-09-13 | Xiph. Org. | Bit allocation and partitioning in gain-shape vector quantization for audio coding |
WO2012122303A1 (en) | 2011-03-07 | 2012-09-13 | Xiph. Org | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
DK3319087T3 (da) | 2011-03-10 | 2019-11-04 | Ericsson Telefon Ab L M | Fyldning af ikke-kodede subvektorer i transformationskodede audiosignaler |
KR101520212B1 (ko) | 2011-04-15 | 2015-05-13 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 낮은 정확성으로 재구성된 신호 영역의 감쇠를 위한 방법 및 디코더 |
EP2707875A4 (de) | 2011-05-13 | 2015-03-25 | Samsung Electronics Co Ltd | Geräuschunterdrückung und audiodekodierung |
WO2012169133A1 (ja) * | 2011-06-09 | 2012-12-13 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
JP2013007944A (ja) | 2011-06-27 | 2013-01-10 | Sony Corp | 信号処理装置、信号処理方法、及び、プログラム |
US20130006644A1 (en) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Method and device for spectral band replication, and method and system for audio decoding |
JP5997592B2 (ja) * | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
WO2013188562A2 (en) * | 2012-06-12 | 2013-12-19 | Audience, Inc. | Bandwidth extension via constrained synthesis |
EP2717263B1 (de) * | 2012-10-05 | 2016-11-02 | Nokia Technologies Oy | Verfahren, Vorrichtung und Computerprogrammprodukt zur kategorischen räumlichen Analyse-Synthese des Spektrums eines Mehrkanal-Audiosignals |
CN105976824B (zh) * | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
PT3451334T (pt) | 2013-01-29 | 2020-06-29 | Fraunhofer Ges Forschung | Conceito de preenchimento de ruído |
ES2613651T3 (es) | 2013-01-29 | 2017-05-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Cuantificación de señales de audio adaptativas por tonalidad de baja complejidad |
BR112015025009B1 (pt) | 2013-04-05 | 2021-12-21 | Dolby International Ab | Unidades de quantização e quantização inversa, codificador e decodificador, métodos para quantizar e dequantizar |
JP6157926B2 (ja) * | 2013-05-24 | 2017-07-05 | 株式会社東芝 | 音声処理装置、方法およびプログラム |
EP2830055A1 (de) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kontextbasierte Entropiecodierung von Probenwerten einer spektralen Hüllkurve |
EP2830065A1 (de) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Decodierung eines codierten Audiosignals unter Verwendung eines Überschneidungsfilters um eine Übergangsfrequenz |
EP2830060A1 (de) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Rauschfüllung bei mehrkanaliger Audiocodierung |
EP3048609A4 (de) | 2013-09-19 | 2017-05-03 | Sony Corporation | Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren sowie programm |
RU2667627C1 (ru) | 2013-12-27 | 2018-09-21 | Сони Корпорейшн | Устройство и способ декодирования и программа |
EP2919232A1 (de) * | 2014-03-14 | 2015-09-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codierer, Decodierer und Verfahren zur Codierung und Decodierung |
JP6035270B2 (ja) | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
RU2572664C2 (ru) * | 2014-06-04 | 2016-01-20 | Российская Федерация, От Имени Которой Выступает Министерство Промышленности И Торговли Российской Федерации | Устройство активного гашения вибрации |
EP2980794A1 (de) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierer und -decodierer mit einem Frequenzdomänenprozessor und Zeitdomänenprozessor |
EP2980795A1 (de) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiokodierung und -decodierung mit Nutzung eines Frequenzdomänenprozessors, eines Zeitdomänenprozessors und eines Kreuzprozessors zur Initialisierung des Zeitdomänenprozessors |
CN106714792A (zh) | 2014-08-08 | 2017-05-24 | R·米利亚乔 | 用于治疗炎症性和过敏性病理学的脂肪酸和十六酰胺乙醇的混合物 |
DE112015004185T5 (de) | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
KR102033603B1 (ko) * | 2014-11-07 | 2019-10-17 | 삼성전자주식회사 | 오디오 신호를 복원하는 방법 및 장치 |
US20160173808A1 (en) * | 2014-12-16 | 2016-06-16 | Psyx Research, Inc. | System and method for level control at a receiver |
US9668048B2 (en) | 2015-01-30 | 2017-05-30 | Knowles Electronics, Llc | Contextual switching of microphones |
TW202242853A (zh) * | 2015-03-13 | 2022-11-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
WO2016162283A1 (en) * | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
US20170024495A1 (en) * | 2015-07-21 | 2017-01-26 | Positive Grid LLC | Method of modeling characteristics of a musical instrument |
JP6718516B2 (ja) * | 2016-03-07 | 2020-07-08 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ハイブリッドコンシールメント方法:オーディオコーデックにおける周波数および時間ドメインパケットロスの組み合わせ |
DE102016104665A1 (de) | 2016-03-14 | 2017-09-14 | Ask Industries Gmbh | Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals |
JP2018092012A (ja) * | 2016-12-05 | 2018-06-14 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP6847221B2 (ja) * | 2016-12-09 | 2021-03-24 | エルジー・ケム・リミテッド | 密封材組成物 |
EP3483879A1 (de) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analyse-/synthese-fensterfunktion für modulierte geläppte transformation |
EP3483878A1 (de) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiodecoder mit auswahlfunktion für unterschiedliche verlustmaskierungswerkzeuge |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483886A1 (de) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Auswahl einer grundfrequenz |
EP3483880A1 (de) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Zeitliche rauschformung |
EP3483884A1 (de) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signalfiltrierung |
EP3483882A1 (de) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Steuerung der bandbreite in codierern und/oder decodierern |
EP3483883A1 (de) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiokodierung und -dekodierung mit selektiver nachfilterung |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
EP3544005B1 (de) | 2018-03-22 | 2021-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung mit geditherten quantisierung |
US11527256B2 (en) | 2018-04-25 | 2022-12-13 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
BR112020021809A2 (pt) | 2018-04-25 | 2021-02-23 | Dolby International Ab | integração de técnicas de reconstrução de alta frequência com atraso de pós-processamento reduzido |
TW202333143A (zh) * | 2021-12-23 | 2023-08-16 | 弗勞恩霍夫爾協會 | 在音訊寫碼中使用濾波用於頻譜時間改善頻譜間隙填充之方法及設備 |
WO2023117145A1 (en) * | 2021-12-23 | 2023-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using different noise filling methods |
WO2023117146A1 (en) * | 2021-12-23 | 2023-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering |
TW202334940A (zh) * | 2021-12-23 | 2023-09-01 | 紐倫堡大學 | 在音訊寫碼中使用不同雜訊填充方法進行頻譜時間上改良之頻譜間隙填充之方法及設備 |
Family Cites Families (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US36478A (en) * | 1862-09-16 | Improved can or tank for coal-oil | ||
US3995115A (en) * | 1967-08-25 | 1976-11-30 | Bell Telephone Laboratories, Incorporated | Speech privacy system |
US3684838A (en) * | 1968-06-26 | 1972-08-15 | Kahn Res Lab | Single channel audio signal transmission system |
JPS6011360B2 (ja) * | 1981-12-15 | 1985-03-25 | ケイディディ株式会社 | 音声符号化方式 |
US4667340A (en) * | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
WO1986003873A1 (en) * | 1984-12-20 | 1986-07-03 | Gte Laboratories Incorporated | Method and apparatus for encoding speech |
US4790016A (en) * | 1985-11-14 | 1988-12-06 | Gte Laboratories Incorporated | Adaptive method and apparatus for coding speech |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4935963A (en) * | 1986-01-24 | 1990-06-19 | Racal Data Communications Inc. | Method and apparatus for processing speech signals |
JPS62234435A (ja) * | 1986-04-04 | 1987-10-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声の復号化方式 |
DE3683767D1 (de) * | 1986-04-30 | 1992-03-12 | Ibm | Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens. |
US4776014A (en) * | 1986-09-02 | 1988-10-04 | General Electric Company | Method for pitch-aligned high-frequency regeneration in RELP vocoders |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5127054A (en) * | 1988-04-29 | 1992-06-30 | Motorola, Inc. | Speech quality improvement for voice coders and synthesizers |
JPH02183630A (ja) * | 1989-01-10 | 1990-07-18 | Fujitsu Ltd | 音声符号化方式 |
US5109417A (en) * | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5054075A (en) * | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
JP3134337B2 (ja) * | 1991-03-30 | 2001-02-13 | ソニー株式会社 | ディジタル信号符号化方法 |
EP0551705A3 (en) * | 1992-01-15 | 1993-08-18 | Ericsson Ge Mobile Communications Inc. | Method for subbandcoding using synthetic filler signals for non transmitted subbands |
JP2563719B2 (ja) | 1992-03-11 | 1996-12-18 | 技術研究組合医療福祉機器研究所 | 音声加工装置と補聴器 |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
JP3508146B2 (ja) * | 1992-09-11 | 2004-03-22 | ソニー株式会社 | ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置 |
JP3127600B2 (ja) * | 1992-09-11 | 2001-01-29 | ソニー株式会社 | ディジタル信号復号化装置及び方法 |
US5402124A (en) * | 1992-11-25 | 1995-03-28 | Dolby Laboratories Licensing Corporation | Encoder and decoder with improved quantizer using reserved quantizer level for small amplitude signals |
US5394466A (en) * | 1993-02-16 | 1995-02-28 | Keptel, Inc. | Combination telephone network interface and cable television apparatus and cable television module |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
JPH07225598A (ja) | 1993-09-22 | 1995-08-22 | Massachusetts Inst Of Technol <Mit> | 動的に決定された臨界帯域を用いる音響コード化の方法および装置 |
JP3186489B2 (ja) * | 1994-02-09 | 2001-07-11 | ソニー株式会社 | ディジタル信号処理方法及び装置 |
JP3277682B2 (ja) * | 1994-04-22 | 2002-04-22 | ソニー株式会社 | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 |
WO1995032499A1 (fr) * | 1994-05-25 | 1995-11-30 | Sony Corporation | Procede de codage, procede de decodage, procede de codage-decodage, codeur, decodeur et codeur-decodeur |
US5748786A (en) * | 1994-09-21 | 1998-05-05 | Ricoh Company, Ltd. | Apparatus for compression using reversible embedded wavelets |
JP3254953B2 (ja) | 1995-02-17 | 2002-02-12 | 日本ビクター株式会社 | 音声高能率符号化装置 |
DE19509149A1 (de) | 1995-03-14 | 1996-09-19 | Donald Dipl Ing Schulz | Codierverfahren |
JPH08328599A (ja) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
DE69620967T2 (de) * | 1995-09-19 | 2002-11-07 | At & T Corp | Synthese von Sprachsignalen in Abwesenheit kodierter Parameter |
US5692102A (en) * | 1995-10-26 | 1997-11-25 | Motorola, Inc. | Method device and system for an efficient noise injection process for low bitrate audio compression |
US6138051A (en) * | 1996-01-23 | 2000-10-24 | Sarnoff Corporation | Method and apparatus for evaluating an audio decoder |
JP3189660B2 (ja) * | 1996-01-30 | 2001-07-16 | ソニー株式会社 | 信号符号化方法 |
JP3519859B2 (ja) * | 1996-03-26 | 2004-04-19 | 三菱電機株式会社 | 符号器及び復号器 |
DE19628293C1 (de) * | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
US6092041A (en) * | 1996-08-22 | 2000-07-18 | Motorola, Inc. | System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder |
JPH1091199A (ja) * | 1996-09-18 | 1998-04-10 | Mitsubishi Electric Corp | 記録再生装置 |
US5924064A (en) * | 1996-10-07 | 1999-07-13 | Picturetel Corporation | Variable length coding using a plurality of region bit allocation patterns |
EP0878790A1 (de) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Sprachkodiersystem und Verfahren |
JP3213582B2 (ja) * | 1997-05-29 | 2001-10-02 | シャープ株式会社 | 画像符号化装置及び画像復号装置 |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
KR20000068538A (ko) * | 1997-07-11 | 2000-11-25 | 이데이 노부유끼 | 정보 복호 방법 및 장치, 정보 부호화 방법 및 장치, 및 제공매체 |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
AU3372199A (en) * | 1998-03-30 | 1999-10-18 | Voxware, Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
US6115689A (en) * | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
JP2000148191A (ja) * | 1998-11-06 | 2000-05-26 | Matsushita Electric Ind Co Ltd | ディジタルオーディオ信号の符号化装置 |
US6300888B1 (en) * | 1998-12-14 | 2001-10-09 | Microsoft Corporation | Entrophy code mode switching for frequency-domain audio coding |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
BRPI0010672B1 (pt) * | 1999-04-16 | 2016-06-07 | Dolby Lab Licensing Corp | uso de quantificação de ganho adaptativo e comprimentos de símbolo não-uniformes para uma codificação de áudio |
FR2807897B1 (fr) * | 2000-04-18 | 2003-07-18 | France Telecom | Methode et dispositif d'enrichissement spectral |
JP2001324996A (ja) * | 2000-05-15 | 2001-11-22 | Japan Music Agency Co Ltd | Mp3音楽データ再生方法及び装置 |
JP3616307B2 (ja) * | 2000-05-22 | 2005-02-02 | 日本電信電話株式会社 | 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体 |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
JP2001343998A (ja) * | 2000-05-31 | 2001-12-14 | Yamaha Corp | ディジタルオーディオデコーダ |
JP3538122B2 (ja) | 2000-06-14 | 2004-06-14 | 株式会社ケンウッド | 周波数補間装置、周波数補間方法及び記録媒体 |
SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
GB0103245D0 (en) * | 2001-02-09 | 2001-03-28 | Radioscape Ltd | Method of inserting additional data into a compressed signal |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
-
2002
- 2002-06-17 US US10/174,493 patent/US7447631B2/en active Active
- 2002-09-06 US US10/238,047 patent/US7337118B2/en not_active Expired - Lifetime
-
2003
- 2003-04-29 TW TW092109991A patent/TWI352969B/zh not_active IP Right Cessation
- 2003-05-30 SG SG2014005300A patent/SG2014005300A/en unknown
- 2003-05-30 SI SI200332091T patent/SI2209115T1/sl unknown
- 2003-05-30 SG SG10201702049SA patent/SG10201702049SA/en unknown
- 2003-05-30 CA CA2735830A patent/CA2735830C/en not_active Expired - Lifetime
- 2003-05-30 KR KR1020107009429A patent/KR100991450B1/ko active IP Right Grant
- 2003-05-30 EP EP06020757A patent/EP1736966B1/de not_active Expired - Lifetime
- 2003-05-30 ES ES03736761T patent/ES2275098T3/es not_active Expired - Lifetime
- 2003-05-30 CA CA2736046A patent/CA2736046A1/en not_active Abandoned
- 2003-05-30 DK DK03736761T patent/DK1514261T3/da active
- 2003-05-30 KR KR1020047020570A patent/KR100991448B1/ko active IP Right Grant
- 2003-05-30 DE DE60310716T patent/DE60310716T8/de active Active
- 2003-05-30 CN CNB038139677A patent/CN100369109C/zh not_active Expired - Lifetime
- 2003-05-30 EP EP10162216A patent/EP2209115B1/de not_active Expired - Lifetime
- 2003-05-30 DK DK06020757.8T patent/DK1736966T3/da active
- 2003-05-30 AT AT10162217T patent/ATE536615T1/de active
- 2003-05-30 AT AT10162216T patent/ATE526661T1/de not_active IP Right Cessation
- 2003-05-30 CA CA2489441A patent/CA2489441C/en not_active Expired - Lifetime
- 2003-05-30 DE DE60333316T patent/DE60333316D1/de not_active Expired - Lifetime
- 2003-05-30 CA CA2736055A patent/CA2736055C/en not_active Expired - Lifetime
- 2003-05-30 EP EP10162217A patent/EP2216777B1/de not_active Expired - Lifetime
- 2003-05-30 SG SG2009049545A patent/SG177013A1/en unknown
- 2003-05-30 AT AT03736761T patent/ATE349754T1/de active
- 2003-05-30 PT PT10162217T patent/PT2216777E/pt unknown
- 2003-05-30 MX MXPA04012539A patent/MXPA04012539A/es active IP Right Grant
- 2003-05-30 AT AT06020757T patent/ATE473503T1/de not_active IP Right Cessation
- 2003-05-30 EP EP03736761A patent/EP1514261B1/de not_active Expired - Lifetime
- 2003-05-30 PL PL372104A patent/PL208344B1/pl unknown
- 2003-05-30 JP JP2004514060A patent/JP4486496B2/ja not_active Expired - Lifetime
- 2003-05-30 WO PCT/US2003/017078 patent/WO2003107328A1/en active IP Right Grant
- 2003-06-09 SI SI200332086T patent/SI2207169T1/sl unknown
- 2003-06-09 AT AT03760242T patent/ATE470220T1/de not_active IP Right Cessation
- 2003-06-09 KR KR1020107013897A patent/KR100986152B1/ko active IP Right Grant
- 2003-06-09 EP EP10159809A patent/EP2207169B1/de not_active Expired - Lifetime
- 2003-06-09 AT AT10159809T patent/ATE529858T1/de not_active IP Right Cessation
- 2003-06-09 KR KR1020047020587A patent/KR100986150B1/ko active IP Right Grant
- 2003-06-09 EP EP10159810A patent/EP2207170B1/de not_active Expired - Lifetime
- 2003-06-09 DE DE60332833T patent/DE60332833D1/de not_active Expired - Lifetime
- 2003-06-09 CA CA2736060A patent/CA2736060C/en not_active Expired - Lifetime
- 2003-06-09 AT AT10159810T patent/ATE529859T1/de not_active IP Right Cessation
- 2003-06-09 CA CA2736065A patent/CA2736065C/en not_active Expired - Lifetime
- 2003-06-09 DK DK10159809.2T patent/DK2207169T3/da active
- 2003-06-09 KR KR1020107013899A patent/KR100986153B1/ko active IP Right Grant
- 2003-06-16 MY MYPI20032238A patent/MY159022A/en unknown
- 2003-06-16 MY MYPI20032237A patent/MY136521A/en unknown
-
2004
- 2004-12-08 IL IL165650A patent/IL165650A/en active IP Right Grant
-
2005
- 2005-04-19 HK HK05103319.3A patent/HK1070728A1/xx not_active IP Right Cessation
- 2005-04-19 HK HK05103320A patent/HK1070729A1/xx not_active IP Right Cessation
-
2009
- 2009-02-04 US US12/365,783 patent/US8050933B2/en not_active Expired - Lifetime
- 2009-02-04 US US12/365,789 patent/US8032387B2/en not_active Expired - Lifetime
-
2010
- 2010-02-15 JP JP2010030139A patent/JP5063717B2/ja not_active Expired - Lifetime
- 2010-08-19 HK HK10107912.8A patent/HK1141623A1/xx not_active IP Right Cessation
- 2010-08-19 HK HK10107913.7A patent/HK1141624A1/xx not_active IP Right Cessation
-
2011
- 2011-01-13 HK HK11100293.1A patent/HK1146146A1/xx not_active IP Right Cessation
- 2011-01-13 HK HK11100292.2A patent/HK1146145A1/xx not_active IP Right Cessation
- 2011-10-31 IL IL216069A patent/IL216069A/en active IP Right Grant
- 2011-12-28 JP JP2011287051A patent/JP5253564B2/ja not_active Expired - Lifetime
- 2011-12-28 JP JP2011287052A patent/JP5253565B2/ja not_active Expired - Lifetime
-
2012
- 2012-07-03 JP JP2012149087A patent/JP5345722B2/ja not_active Expired - Lifetime
-
2013
- 2013-07-12 JP JP2013146451A patent/JP5705273B2/ja not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60310716T2 (de) | System für die audiokodierung mit füllung von spektralen lücken | |
DE60214027T2 (de) | Kodiervorrichtung und dekodiervorrichtung | |
DE69533577T2 (de) | Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals | |
DE69833834T2 (de) | Skalierbares Audiokodier-und Dekodierverfahren und Gerät | |
DE60004814T2 (de) | Quantisierung in perzeptuellen audiokodierern mit kompensation des durch den synthesefilter verschmierten rauschens | |
DE19747132C2 (de) | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms | |
DE69731677T2 (de) | Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung | |
DE60103424T2 (de) | Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden | |
EP0931386B1 (de) | Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals | |
DE602004013031T2 (de) | Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms | |
DE69737489T2 (de) | Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum | |
DE19730130C2 (de) | Verfahren zum Codieren eines Audiosignals | |
EP0290581B1 (de) | Verfahren zum übertragen digitalisierter tonsignale | |
DE60206390T2 (de) | Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate | |
DE69432538T2 (de) | Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger | |
EP1979901B1 (de) | Verfahren und anordnungen zur audiosignalkodierung | |
DE60202881T2 (de) | Wiederherstellung von hochfrequenzkomponenten | |
DE69927505T2 (de) | Verfahren zum einfügen von zusatzdaten in einen audiodatenstrom | |
DE60313332T2 (de) | Audiocodierung mit niedriger bitrate | |
DE602004010885T2 (de) | Audio-transkodierung | |
DE602004010188T2 (de) | Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal | |
DE69533500T2 (de) | Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten | |
DE10217297A1 (de) | Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten | |
DE19811039A1 (de) | Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen | |
DE69932861T2 (de) | Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |