DE69932861T2 - Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung - Google Patents

Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung Download PDF

Info

Publication number
DE69932861T2
DE69932861T2 DE69932861T DE69932861T DE69932861T2 DE 69932861 T2 DE69932861 T2 DE 69932861T2 DE 69932861 T DE69932861 T DE 69932861T DE 69932861 T DE69932861 T DE 69932861T DE 69932861 T2 DE69932861 T2 DE 69932861T2
Authority
DE
Germany
Prior art keywords
masking
signal
function
quality value
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69932861T
Other languages
English (en)
Other versions
DE69932861D1 (de
Inventor
Mohammed Javed Absar
Sapna George
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
STMicroelectronics Asia Pacific Pte Ltd
Original Assignee
STMicroelectronics Asia Pacific Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by STMicroelectronics Asia Pacific Pte Ltd filed Critical STMicroelectronics Asia Pacific Pte Ltd
Publication of DE69932861D1 publication Critical patent/DE69932861D1/de
Application granted granted Critical
Publication of DE69932861T2 publication Critical patent/DE69932861T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Bereich der Erfindung
  • Die vorliegende Erfindung betrifft ein Verfahren zum Codieren eines Audiosignals mit Hilfe eines Qualitätswertes zum Zuordnen von Bits, insbesondere, jedoch nicht ausschließlich, für die Quantisierung eines Audiosignals in einem AC-3-Codierer.
  • Hintergrund der Erfindung
  • Der AC-3 ist ein auf der Transformierung beruhender Audiocodieralgorithmus zum Bereitstellen einer Verminderung der Datengeschwindigkeit bei Breitbandsignalen unter Beibehaltung der hohen Qualität des ursprünglichen Inhalts. In der Haushaltelektronikindustrie ist die AC-3-Tonspur an der neuesten Generation von Laserdiscs zu finden, ist als standardmäßige Audiospur an Digital Versatile Discs (DVDs) zu finden, ist das standardmäßige Audioformat für das hochauflösende Fernsehen (HDTV) und wird für digitale Kabel- und Satellitenübertragungen verwendet.
  • Der AC-3 ermöglicht, dass sich die Übertragungsgeschwindigkeit für Bits mit jedem Rahmen ändert (annähernd 32 ms), da die Bitrateninformationen ein Teil der Nebeninformationsbits in dem AC-3-Rahmen sind. In den meisten Fällen ist eine gleichbleibende Bitrate erwünscht, da die Kompliziertheit von Software und Hardware abnimmt und dadurch ein Codierschema bereitgestellt wird, das für Verbrauchsgüter wie DVD und HDTC geeignet ist.
  • Bei neuen Anwendungszwecken wie den Audiodatenströmen übers Internet und bei Audiosendungen über mobile Ausrüstungen ist eine gleichbleibende Bitrate nicht immer die beste Reaktion.
  • Codiersysteme für gleichbleibende Bitraten können den Nachteil aufweisen, dass sie eine veränderliche Qualität liefern. Wenn ein zu komprimierendes Signal psychoakustisch einfach ist (Einzelton), leistet der Codierer eine schwere Arbeit und kann diese auf eine Größe weit unter der festgelegten Rahmenlänge (gleichwertig der festgelegten Bitrate) komprimieren und trotzdem den Codierfehler unterhalb des hörbaren Bereiches halten. Zur Herstellung eines Rahmens mit der vorbestimmten Größe muss er dann so etwas wie eine Auffüllung mit Nullen vornehmen. Das kann zu Zeiten erfolgen, wo das Netz bitratenhungrig ist. Wenn dagegen diese komprimierten Daten in einem Medium archiviert werden sollen, muss viel Platz beim Speichern dieser Nullen vergeudet werden.
  • Wenn das Audiosignal kompliziert ist (beispielsweise bei Kastagnetten), kann sich die vorbestimmte Bitrate als für den Codierer ungenügend erweisen. Trotzdem würde der Codierer zwecks Einhaltung der Vereinbarung für die gleichbleibende Bitrate die Codierungsqualität so weit abbauen, bis laute oder lästige Geräusche entstehen.
  • Gleichbleibende Bitraten können bei manchen Anwendungszwecken die am meisten erwünschte Eigenschaft sein, jedoch ist bei Anwendungen mit mehr Flexibilität hinsichtlich der Bitrate ein System zur Nutzung dieser Freiheit für eine intelligentere Ausnutzung der Bandbreite vonnöten.
  • In U.S. 5,623,577 ist ein Verfahren zum Codieren eines Audiosignals offenbart, bei dem eine Maskierungsfunktion vorgesehen, ein Qualitätswert festgelegt, die Maskierungsfunktion in Abhängigkeit von dem Qualitätswert eingerichtet wird und Bits zur Quantisierung des codierten Signals auf der Basis der eingerichteten Maskierungsfunktion zugeordnet werden. Mit der vorliegenden Erfindung soll eine ähnliche Methodik angewandt werden, bei der jedoch der Qualitätswert mit einer Variablen gleichgesetzt wird, mit der eine fast gleichbleibende Qualität aufrechterhalten werden kann.
  • Zusammenfassung der Erfindung
  • Gemäß der Erfindung wird ein Verfahren zum Codieren eines Audiosignals geschaffen, mit:
    dem Bereitstellen einer Maskierungsfunktion, welche eine psychoakustische Maskierung darstellt;
    dem Festsetzen eines Qualitätswertes für die Daten des codierten Signals;
    dem Einstellen der Maskierungsfunktion abhängig von dem Qualitätswert; und
    dem Zuordnen von Bits für die Quantisierung des auf der Maskierungsfunktion beruhenden codierten Signals, dadurch gekennzeichnet, dass:
    der Qualitätswert mit θ gleichgesetzt wird, das eine Funktion von snroffst ist, das eine Variable ist, die eine Versetzung eines Signal-Rausch-Abstands kennzeichnet und proportional einem Signal-Masken-Abstand ist.
    Vorzugsweise stellt der Qualitätswert einen gewichteten durchschnittlichen Signal-Masken-Abstand (AWNMR) dar.
    Vorzugsweise
  • Figure 00030001
  • Vorzugsweise werden aus dem Audiosignal Transformierungskoeffizienten zum Codieren abgeleitet und grafisch in einer Leistungsspektrumsdichtefunktion (PSD) dargestellt, und die Bit-Zuordnung wird durch Differenzierung der PSD und der eingestellten Maskierungsfunktion festgelegt.
  • Vorzugsweise umfasst das Codieren des Audiosignals das Teilen des Signals in eine Mehrzahl von Rahmen zum Befördern von Quantisierungs- und anderen Signaldaten und das Vergrößern oder Verkleinern einer oder mehrerer Rahmenlängen, bis der zugeordnete Rahmen die für die Quantisierung zugeordneten Bits untergebracht hat.
  • Kurze Beschreibung der Zeichnungen
  • Die Erfindung ist nur als nicht einschränkendes Beispiel an Hand der anliegenden Zeichnungen beschrieben, in denen:
  • 1 ein Systemschaltbild eines Codierers AC-3 ist;
  • 2 eine grafische Darstellung ist, die eine Erhöhung einer Hörschwelle auf Grund einer Maskierung mit 1kHz darstellt;
  • 3 eine grafische Darstellung eines Geräusch-Masken-Verhältnisses (dB) für Kastagnetten ist; und
  • 4 Bitgeschwindigkeitsbedingungen für Kastagnetten mit einem Geräusch-Masken-Verhältnis darstellt, das auf –7dB festgelegt ist.
  • Ausführliche Beschreibung einer bevorzugten Ausführungsform der Erfindung
  • Die folgende Beschreibung ist in Abschnitte A bis D geteilt. In Abschnitt A werden kurz die verschiedenen Blöcke eines Codierers AC-3 beschrieben. Im Anschluss daran wird in Abschnitt B das psychoakustische Modell, insbesondere in Bezug auf AC-3, mit dem Zweck beschrieben, die Gleichungen für den Qualitätswert in Abschnitt C herzuleiten. Mit Hilfe der Herleitung in Abschnitt C wird in Abschnitt D ein Algorithmus zum Codieren der variablen Geschwindigkeit mit gleichbleibender Qualität hergeleitet.
  • A. System AC-3: Beschreibung auf Blockebene
  • AC-3 ist wie bei der Einkanalcodierungstechnik AC-2, aus der dieser abgeleitet ist, im Grundsatz ein adaptiver, auf Transformation beruhender Codierer, der eine frequenzlineare, kritisch abgetastete Filterbank nutzt, die auf dem Verfahren der Time Domain Aliasing Cancellation (TDAC) von Princen und Bradley beruht, J.P. Princen and A.B. Bradley: "Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation'; IEEE Trans. Acoust., Speech, Signal Processing, Bd. ASSP-34, Nr. 5, S. 1153-1161, Okt. 1986. Das Systemschaltbild von AC-3 ist in 1 gezeigt.
  • A.1 Eingabeformat
  • Der AC-3 ist ein auf Rahmen beruhender Codierer. Jeder Rahmen enthält Informationen, die gleichwertig 256 × 6 PCM (impulscodemodulierten) Abtastungen pro Audiokanal sind. Um das Codieren zu erleichtern, ist der Rahmen in sechs Audioblöcke geteilt, wobei jeder Block deshalb Informationen von 256 Abtastungen pro Kanal enthält.
  • A.2 Kurzzeitige Detektierung
  • Übergangsvorgänge werden in den Vollbandbreitenkanälen detektiert, um festzulegen, wann auf Audioblöcke kurzer Länge zu schalten ist, um die mit dem Übergangsvorgang zusammenhängenden Quantisierungsgeräusche innerhalb eines kleinen Zeitbereiches um den Übergangsvorgang herum einzuschränken. Hochpassgefilterte Versionen der Signale werden auf eine Energiezunahme von einem Nebenblockzeitsegment zum nächsten untersucht. Nebenblöcke werden mit verschiedenen Zeitskalen untersucht. Wenn in der zweiten Hälfte eines Audioblocks in einem Kanal ein Übergangsvorgang detektiert wird, schaltet dieser Kanal auf einen kurzen Block. Bei Vorhandensein eines Übergangsvorgangs wird das Bit "blksw" für den Kanal in dem codierten Strom von Bits in dem speziellen Audioblock gesetzt.
  • A.3 Frequenzumwandlung
  • Das Zeitbereichseingangssignal jedes Kanals wird selektiert und mit einer auf der TDAC beruhenden Analysefilterbank gefiltert, um Frequenzbereichskoeffizienten zu erzeugen. Wenn ein Übergangsvorgang für den Block detektiert wurde, werden zwei kurze Transformierungen mit der Länge von jeweils 256 genommen, wodurch sich die zeitliche Auflösung des Signals vergrößert. Wenn kein Übergangsvorgang detektiert wurde, wird eine einzelne lange Transformation mit der Länge 512 genommen, wodurch für eine hohe Spektralauflösung gesorgt wird.
  • Der Ausgangsfrequenzkoeffizient Xk ist definiert als:
    Figure 00050001
    wobei x[n] die selektierte Eingangsabfolge für einen Kanal ist und N die Länge der Transformation ist.
  • A.4 Kopplung
  • Durch Anwendung eines Verfahrens, das als Kopplung bekannt ist, kann im AC-3 eine hohe Komprimierung zustande gebracht werden. Beim Koppeln wird die Weise ausgenutzt, in welcher das menschliche Ohr die Richtungsfähigkeit für Signale sehr hoher Frequenz feststellt. Bei einer hohen Audiofrequenz (annähernd über 4KHz) ist das Ohr physisch nicht in der Lage, einzelne Zyklen einer Audiowellenform zu erfassen, und spricht statt dessen auf die Hüllkurve der Wellenform an. Folglich kombiniert der Codierer die Hochfrequenzkoeffizienten der einzelnen Kanäle, um einen gemeinsamen Kopplungskanal zu bilden. Die ursprünglichen zur Bildung des Kopplungskanals kombinierten Kanäle werden als gekoppelter Kanal bezeichnet.
  • A.5 Rematrizierung
  • In dem Fall, dass der Codierer nur zwei Kanäle bearbeitet, wird ein zusätzlicher Vorgang, das Rematrizieren, aufgerufen. Summe und Differenz der zwei Signale von jedem Kanal werden auf einem Band auf Bandbasis berechnet, und wenn in einem gegebenen Band die Pegelungleichheit zwischen dem abgeleiteten (matrizierten) Signalpaar größer als der entsprechende Pegel des ursprünglichen Signals ist, wird statt dessen die Matrix gewählt. Zum Anzeigen dieses Zustands sind in dem Bitstrom weitere Bits vorgesehen, und nach Maßgabe dessen führt der Codierer einen komplementären Entmatrizierungsvorgang zur Wiederherstellung der ursprünglichen Signale aus. Wenn mehr als zwei codierte Kanäle vorhanden sind, wird auf die Rematrizierungsbits verzichtet.
  • Der Vorteil dieses Verfahren ist, dass es eine gerichtete Entmaskierung vermeidet, wenn die decodierten Signale anschließend von einem die Matrix umgebenden Prozessor, beispielsweise einem Dolby-Prologic-Decodierer, verarbeitet werden.
  • Im AC-3 erfolgt die Rematrizierung unabhängig in getrennten Frequenzbändern. Es sind vier Bänder mit Grenzpunkten vorhanden, die von den Kopplungsinformationen abhängen. Die Grenzpunkte richten sich nach der Anzahl der Bitkoeffizienten, und die entsprechenden Grenzen der Rematrizierungsbandfrequenz ändern sich mit der Abtastfrequenz.
  • A.6 Umwandlung in Gleitkomma
  • Die Koeffizientenwerte, die einen Rematrizierungs- und Kopplungsvorgang erfahren haben, werden in eine spezielle Gleitkommadarstellung umgewandelt, was zu getrennten Feldern von Exponenten und Mantissen führt. Diese Gleitkommadarstellung wird über den gesamten Rest des Codiervorgangs bis unmittelbar vor der umgekehrten Transformation des Decoders aufrechterhalten und schafft einen dynamischen Bereich von 144dB und ermöglicht auch, dass der AC-3 entweder an Festkomma- oder an Gleitkommahardware angewandt wird.
  • Codierte Audioinformationen bestehen im Wesentlichen aus getrennten Darstellungen der Exponenten- und der Mantisenfelder. Der übrige Codiervorgang konzentriert sich individuell auf die Senkung der Geschwindigkeit der Exponenten- und der Mantissendaten.
  • Die Exponenten werden mit Hilfe von einer der Exponentencodierstrategien codiert. Jede Mantisse ist auf eine feste Anzahl binärer Stellen abgeschnitten. Die Anzahl der zum Codieren jeder Mantisse zu verwendenden Bits kann man aus einem Bitzuordnungsalgorithmus erhalten, der auf der Maskierungseigenschaft des menschlichen Gehörsystems beruht.
  • A.7 Exponentencodierstrategie
  • Die Exponentenwerte im AC-3 dürfen im Bereich von 0 bis –24 liegen. Der Exponent wirkt als Skalenfaktor für jede Mantisse. Exponenten für Koeffizienten, die mehr als 24 vordere Nullen aufweisen, sind auf –24 festgelegt, und die entsprechenden Mantissen dürfen vordere Nullen aufweisen.
  • Der Bitstrom des AC-3 enthält Exponenten für unabhängige, gekoppelte und die Kopplungskanäle. Die Exponenteninformationen können unter Blöcken innerhalb eines Rahmens geteilt werden, so dass die Blöcke 1 bis 5 Exponenten aus vorhergehenden Blöcken wieder nutzen können.
  • Bei der Exponentenübertragung des AC-3 wird ein differenzielles Codierverfahren angewandt, bei welchem die Exponenten für einen Kanal differenziell über die Frequenz codiert werden. Der erste Exponent wird stets als absoluter Wert gesendet. Der Wert gibt die Anzahl der vorderen Nullen des ersten Transformationskoeffizienten an. Darauffolgende Exponenten werden als differenzielle Werte ge sendet, welche dem bisherigen Exponentenwert hinzugefügt werden müssen, um den nächsten aktuellen Exponentenwert zu bilden.
  • Die differenziell codierten Exponenten werden als Nächstes zu Gruppen kombiniert. Das Gruppieren erfolgt mit einer der drei Verfahren: D15, D25 und D45. Diese werden zusammen mit "reuse" als Exponentenstrategien bezeichnet. Die Anzahl der Exponenten in jeder Gruppe richtet sich nur nach der Exponentenstrategie. In der Betriebsart D15 ist jede Gruppe aus drei Exponenten gebildet. In D45 sind vier Exponenten durch einen Differenzialwert dargestellt. Als Nächstes werden drei solche aufeinanderfolgenden repräsentativen Differenzialwerte zur Bildung einer Gruppe miteinander gruppiert. Jede Gruppe umfasst stets 7 Bits. Falls die Strategie für einen Kanal in einem Block "reuse" lautet, dann werden für diesen Kanal keine Exponenten gesendet, und der Decodierer nutzt die zuletzt gesendeten Exponenten für diesen Kanal.
  • Eine Vorverarbeitung von Exponenten vor dem Codieren kann zu besserer Audioqualität führen.
  • Die Wahl der geeigneten Strategie zum Codieren von Exponenten stellt einen entscheidenden Aspekt des AC-3 dar. D15 sorgt für die höchste Genauigkeit, weist jedoch eine niedrige Komprimierung auf. Dagegen kann die Übertragung von nur einem Exponenten, der für einen Kanal in dem Rahmen (in dem ersten Audioblock des Rahmens) festgelegt ist, und der Versuch zur "Wiederverwendung" der gleichen Exponenten für die nächsten fünf Audioblöcke zu einer hohen Komprimierung der Exponenten, manchmal aber auch zu deutlich hörbarer Verzerrung führen.
  • A.8 Zuordnung von Bits zu Mantissen
  • Der Algorithmus zur Bitzuordnung analysiert die Spektralhülle des zu codierenden Audiosignals in Bezug auf die Maskierungswirkungen, um die Anzahl der jeder Transformationskoeffizientenmantisse zuzuordnenden Bits zu bestimmen. Es ist zu empfehlen, die Zuordnung von Bits in dem Codierer global an der Gesamtheit der Kanäle als Ganzes aus einem gemeinsamen Bit-Pool vorzunehmen.
  • Die Bitzuordnungsroutine enthält ein Parametermodell des menschlichen Gehörs zur Einschätzung einer Geräuschpegelschwelle die als Funktion der Frequenz ausgedrückt ist und hörbare von unhörbaren Spektralkomponenten trennt. Abhängig von der Signalcharakteristik kann der Codierer verschiedene Parameter des Hörmodells einstellen.
  • Die Anzahl der zum Packen von Mantissen verfügbaren Bits in einem AC-3-Rahmen hängt erstens natürlich von der Rahmengröße und zweitens von der Anzahl der Bits an, die von anderen Bereichen – Exponenten, Kopplungsparametern usw. – verbraucht werden. Ein sehr großer Teil des Bitzuordnungsvorgangs ist die Optimierung der Bitzuordnung zur Mantisse in der Art, dass die Gesamtsumme aller von den Mantissen verbrauchten Bits unter Berücksichtigung des Maskierens gleich den verfügbaren Bits ist (oder sehr nahe an diesen liegt). Diese Optimierung kann durch einen als Binärkonvergenzalgorithmus bekannten Vorgang erfolgen.
  • B. Psychoakustisches Modell im AC-3
  • Die jüngsten Fortschritte in der Audiocodierung sind in hohem Maße auf ein eingehendes (wenn auch noch unvollständiges) Verständnis des menschlichen Gehörsystems zurückzuführen. Ausgenutzt wird, dass das System unter bestimmten Bedingungen der Gehörmaskierung keine Quantisierungsgeräusche hören kann. Mithin ist die Maskierung die Wahrnehmungseigenschaft des Gehörsystems, welche immer dann eintritt, wenn ein starkes Audiosignal ein schwächeres Signal in seiner zeitlichen oder spektralen Nachbarschaft nicht wahrnehmbar werden lässt. Diese Maskierungserscheinung wird durch eine Vielzahl psychoakustischer Experimente bestätigt. Obwohl das Modell seiner Art nach ziemlich komplex ist, wird es zu Umsetzungszwecken oft stark vereinfacht, was überraschenderweise immer noch bemerkenswerte Ergebnisse erbringt.
  • B.1 Berechnung der PSD – der Leistungsspektraldichte
  • Das Spektralmaskierungsvermögen einer gegebenen Signalkomponente hängt von seiner Frequenzposition und seiner Lautstärke ab, und mithin bestände der erste Schritt zum Aufbau der Maskierungsstufen für einen Block von Audioabtastungen darin, das Signal auf einer geeigneten Frequenzamplitudenskala darzustellen. Die Blöcke der Zeitbereichsabtastungen x[n] werden mit Hilfe der 256 Bänder umfassenden Filterbank von MDCT in Frequenzbereichswerten Xk abgebildet.
  • In dem AC-3 wird die rückwärts gerichtete adaptive Bitzuordnungsphilosophie angewandt, mit welcher Bitzuordnungsinformationen an dem Decodierer aus den decodierten Daten selbst (mit Ausnahme einiger spezieller Parameter: parametrische Bitzuordnung) ohne ausdrückliche Informationen von dem Codierer geschaffen werden. Der Vorteil dieser Vorgehensweise besteht darin, dass keine der verfügbaren Bits in dem Rahmen zum Definieren der Zuordnung zu dem Decodierer verwendet werden.
  • Damit Bitzuordnungsinformationen (unabhängig von der verwendeten PSD), welche die gleichen wie an dem Codierer sind, wieder an Decodierern geschaffen werden können (wobei ein einziger Fehler zur Fehlinterpretation des ganzen Rahmens führen kann), werden die Bitzuordnungsvorgänge gänzlich in Festkommaarithmetik ausgeführt.
  • Transformationskoeffizienten werden unter Verwendung der Relation PSDk = 128·(24 + log2||X||)in einer Leistungsspektraldichtefunktion abgebildet. Da 2–24 < ||Xk|| < 1 (Schwierigkeit des Algorithmus), betragen die abgebildeten Werte 0 ... 3072, wobei höhere Werte höhere Energie darstellen. Die PSD-Werte werden von dem Decodierer neu berechnet, wobei er die übertragenen Exponentenwerte nutzt.
  • B.2 Gruppierung zu kritischen Bändern
  • Empirische Ergebnisse zeigen, dass das menschliche Gehörsystem eine beschränkte frequenzabhängige Auflösung aufweist. Die Rezeptoren für den Schalldruck im menschlichen Ohr sind Haarzellen. Sie liegen im Innenohr oder, genauer gesagt, in der Gehörschnecke. In der Gehörschnecke wird eine Frequenz-Positions-Transformation vorgenommen. Die Lagestelle der maximalen Erregung hängt von der Frequenz des eingehenden Signals ab. Jede Gehörzelle an einer gegebenen Lagestelle an der Gehörschnecke ist für einen Überlappungsbereich auf der Frequenzskala verantwortlich. Der wahrgenommene Eindruck der Tonhöhe wird mit einem konstanten Abstand der Haarzellen korreliert. Verschiedene Experimentatoren haben abhängig von dem angewandten psychoakustischen Experiment unterschiedliche Funktionen der Transformation von der Frequenz zur Tonhöhe festgestellt. Zwicker liefert eine Tabelle, in welcher die Frequenzskala in Hz in sich nicht überlappende Bänder, so genannte kritische Bänder (manchmal auch als Bark-Skala bezeichnet) geteilt ist.
  • Der AC-3 teilt den Frequenzbereich zu Maskierungszwecken in 50 Bänder. Im Folgenden ist eine Abbildungsfunktion gegeben, welche die Frequenz an die Bark-Zahl für den AC-3 annähert, wobei die genauen Werte in dem ATSC-Standard "ATSC Digital Audio Compression (AC-3) Standard", Doc. A/52/10, Nov. 1994, verfügbar sind.
  • Figure 00110001
  • Die feindatigen PSD-Werte innerhalb jedes kritischen Bandes werden (mit logarithmischer Addition, da die Darstellung in einem Exponentialbetreich erfolgt) miteinander integriert, um einen einzigen Leistungswert für jedes Band zu erzeugen.
  • Wenn die Skala der kritischen Bänder gegeben ist, ist die Maskierung der gleichbleibenden Töne und Geräusche innerhalb eines kritischen Bands wohlbekannt. Schroeder stellte in Signal Compression Based on Models of Human Perceptions, Proceedings of the IEEE, Bd. 81, Nr. 10, Oktober 1993, im Laufe der Untersuchung der Maskierungserscheinung außerhalb eines kritischen Bandes das Konzept der Verbreitungsfunktion vor, in dem für gleichbleibende Situationen der Maskierungswirkung eines Signals in einem kritischen Band auf Signale in einem anderen kritischen Band beschrieben ist. Diese Ausbreitung ist, wie man zur Zeit annimmt, ein Nebenprodukt des mechanischen Filtermechanismus der Gehörschnecke.
  • Die Form der Verbreitungsfunktion verändert sich mit dem Pegel, und die Maskierungsfähigkeiten des Signals breiten sich von der Grundfrequenz aus weiter aus, wenn sich der Pegel der Maskiervorrichtung erhöht. Zu 2 beachte man, dass die Maskiervorrichtung eine höhere Frequenz besser als eine niedrige Frequenz maskieren kann: eine als Verbreitung der Maskierung nach oben bezeichnete Erscheinung.
  • Zur Vereinfachung der Berechnungen wird beim AC-3 nur die Maskierung nach oben betrachtet. Es sei angemerkt, dass sich die Maskierung von Geräuschen durch Vorhandensein eines starken Tons und die Maskierung eines Tons auf Grund der starken Geräusche der Art nach etwas unterscheiden. Das ergibt sich dadurch, dass die Maskierung manchmal als
    Tonmaskierungsgeräusch: EN = ET – 7,25 – 0,5B (dB)
    Geräuschmaskierungston: ET = EN – 2,25 (dB)
    zusammengefasst werden kann, wobei ET und EN Ton- und Geräuschenergien sind und B die Nummer des kritischen Bands ist. Wenn die Maskierungskurve als linear angenommen wird, ist die Maskierungsschwelle gleich der Summe der Beiträge, die auf alle anderen Komponenten des Spektrums zurückzuführen sind. Jeder Beitrag wird als ähnlich dem Maskierungsmuster eines Schmalbandsignals (der elementaren Maskierung) angenommen. Mithin ist die vollständige Maskierungskurve Sv gleich der Faltung ν der Leistungsspektraldichte Yv durch Bv, der Ausbreitungsfunktion der Basilarmembran, auf der Bark-Skala. Sv = Sv·Bv
  • B.3 Berechnung der Maskierungsschwelle
  • Im AC-3 wurde ein vereinfachtes Verfahren zum Ausführen des Faltungsschritts für die Verbreitungsfunktion entgegen der gebänderten PSD entwickelt. Die Verbreitungsfunktion wird durch zwei Linien genähert: eine schnell abfallende, nach oben gerichtete Maskierungskurve; und eine langsam abfallende, nach oben gerich tete Maskierungskurve, die im Pegel nach unten versetzt ist (man prüfe die starke Entsprechung zu der experimentellen Maskierungskurve gemäß 2). Anstatt den Maskierungsvorgang als linear anzunehmen und die einzelnen Wirkungen zu summieren, wählt der AC-3 die Maskierungswirkung an einer Stelle, welche das Maximum aller einzelnen Beiträge ist.
  • Die Maskierungskurve wird mit der (in dem Codierer gespeicherten) Hörschwelle verglichen, und der größere der zwei Werte wird beibehalten. Zum Schluss wird die Maskierungskurve von der ursprünglichen PSD abgezogen, um die gewünschte SNR für jeden einzelnen Koeffizienten zu bestimmen. Der Quantisierungsfehler für eine spezielle Frequenzkomponente Xk kann als Geräuschleistung Qk betrachtet werden, die von der Anzahl der zum Codieren verwendeten Bits abhängt. Idealerweise sollte die Bitzuordnung derart sein, dass der Quantisierungsfehler vollständig abgedeckt ist, d.h. Qk < Sv.
  • Im AC-3 steht die Bitzuordnung in direkter Beziehung zu der Maskierungskurve und einer Variablen snroffst, welche die verwendeten Bits steuert und dadurch die verfügbaren Bits auf die verwendeten Bits abstimmt. Sv = Sv – snroffst Bapk = LUT(PSDk – S ~v)
  • Die Variable snroffst stellt eine Versetzung des Signal-Rausch-Verhältnisses dar und ist beispielsweise in "Digital Audio Compression (AC-3) Standard ATSC Standard" von April 1995 definiert.
  • Die Anzahl der zur Quantisierung von Xk zu verwendenden Bits ist in einer Verweistabelle (LUT) zu finden, wobei die Differenz zwischen der PSDk und dem Maskierungswert als Index verwendet wird.
  • C. Messung der wahrgenommenen Audioqualität
  • Ein wichtiger Gesichtspunkt beim Speichern oder Übertragen eines codierten Audios wäre es, ein bestimmtes Qualitätsniveau aufrechtzuerhalten. Zwar lassen sich durch Beschränkung der Bitrate auf niedrige Werte immense Einsparungen er zielen, jedoch kann die Qualität der Komprimierung ebenfalls zu niedrig werden, insbesondere in Zeiträumen einer hohen Komplexität. Man kann großzügig sein und hohe Bitraten zuordnen – das würde zu guter Qualität führen, kann jedoch zur Vergeudung von Kanal- oder Speicherkapazität (ihren, wodurch der Zweck eines guten Komprimierungsalgorithmus zunichte gemacht wird. Um zu jeder Zeit die richtige Kanalgeschwindigkeit oder Speicherfläche zu verlangen, muss das Codierungssystem eine auf der Wahrnehmung beruhende objektive Funktion zur Messung der Hörbarkeit der Quantisierungsgeräusche besitzen.
  • Eine objektive Funktion, mit welcher die Hörbarkeit der Quantisierungsgeräusche gemessen wird, wurde von Bradenburg vorgestellt und als Rausch-Masken-Verhältnis (NMR) bezeichnet. Das NMR beruht auf gut dokumentierten Maskierungswirkungen und eignet sich, wie sich zeigt, äußerst gut zum Audiocodieren und zur Qualitätsbeurteilung. Hier verwenden wir das nicht so übliche gewichtete durchschnittliche NMR, bei welchem die Gewichte wi (auf der dB-Skala) die Empfindlichkeit des Hörers für das NMR über den Frequenzbereich darstellen.
  • Figure 00140001
  • Hierbei ist Qt die Geräuschleistung und S2 v die Maskenleistung bei der speziellen Frequenz, AWNMR wird dabei auf der dB-Skala genommen.
  • Figure 00140002
  • Da jedoch die Summierung innerhalb eines lopgarithmischen Gliedes schwer zu bewerten ist, nehmen wir eine Vereinfachung in der obigen Gleichung vor. Wenn wir feststellen, dass die einzelnen Glieder in dem obigen Ausdruck positive reelle Zahlen sind, und dass das arithmetische Mittel bei positiven reellen Zahlen stets größer als das geometrische Mittel ist, erhalten wir
    Figure 00150001
  • Dabei ist zu beachten, dass Sv = 128·(24 + log2Sv) und wir
    Figure 00150002
    haben.
  • Die Leistung des mittleren quadratischen Fehlers (Geräuschs) hängt von der Anzahl der Bits ab, die zur Quantisierung des Koeffizienten verwendet werden, d.h. Qk ≈ Δ2/12 , wobei
    Figure 00150003
    Deshalb
    Figure 00150004
  • Wenn wir jedoch die angepasste Maskierungskurve S ~2 v nehmen und eine Einstellung für die Transformation in den PSD-Bereich vornehmen, dann
    Figure 00150005
  • Der obige Ausdruck ist eine Vereinfachung, da er nicht zwischen den einzelnen PSDk-Werten differenziert. Trotzdem stellt er ein sehr einfaches Verfahren zum Einbringen eines Qualitätswertes in codierte Ströme bereit.
  • D. Konstante Q VBR mit Hilfe von AWNMR
  • Das Ergebnis der Herleitung in dem vorhergehenden Abschnitt besteht darin, dass der AWNMR als einfache Funktion des Wertes snroffst angenommen werden kann. Wird snroffst als Konstante aufrechterhalten, führt das natürlich zu einer konstanten Codierqualität in Bezug auf die objektive Messfunktion AWNMR.
  • Zwar ist Gleichung (1) am genauesten, ist jedoch auch berechnungsmäßig am aufwändigsten. Durch Vereinfachung in (2) werden die frequenzabhängigen Gewichtungen nutzlos, da sie sich alle auf eine Konstante belaufen. Gleichung (3) ist noch schlechter, weist jedoch den Vorteil auf, überhaupt keine zusätzliche Berechnung zur Einsetzen eines jeweiligen Wertes zur Qualität des Codierens zu benötigen.
  • Experimentelle Ergebnisse bestätigen, dass der AWNMR als Messfunktion geeignet ist, eine fast gleichbleibende Qualität aufrechtzuerhalten, selbst wenn er auf Grund der sich ändernden Komplexität der Signale starke Sprünge der Bitrate erfährt.
  • Ein Teil des Algorithmus für die konstante Qualität bei variabler Bitrate ist im Folgenden in dem Pseudocode gegeben. Die Bitzuordnung wird im Endstadium einer Rahmenverarbeitung in einem Codierer AC-3 aufgerufen. Dabei ist der Wert der verwendeten Bits zum Codieren aller anderen Informationen neben den Mantissen der Frequenzkoeffizienten bekannt. Die Maskierungskurve wird anhängig von dem Wert snroffst aufwärts gezählt/abwärts gezählt. Dadurch wird die Anzahl der zum Codieren der Mantassen benötigten Bits direkt gesteuert. Unter Bedingungen einer konstanten Bitrate werden die Werte snroffst derart manipuliert, dass man zu einer Zuordnung kommt, die in die feste Rahmengröße passt. Hierbei werden der Wert snroffst festgelegt und die Rahmengröße manipuliert. Ein geeigneter Pseudocode für einen Algorithmus gemäß der Erfindung sieht folgendermaßen aus:
    Figure 00170001
  • Es wurden Experimente für einen Zweikanalcodierer AC-3 ausgeführt. Der AWNMR wurde derart auf einen bestimmten Pegel festhelegt, dass die durchschnittliche Bitrate etwa 192 kbps beträgt (d.h. das Codiergeräusch in Gesamtqualität ist fast nicht wahrnehmbar). Dann erhielt man das in 3 gezeigte Geräusch-Masken-Verhältnis für Kastagnetten und die in 4 dargestellten Erfordernisse für die Bitrate.
  • Bei einfachen Abfolgen (Ruhe oder einfache Töne) reicht eine niedrige Bitrate ~64 kbps, um den erforderlichen AWNMR zu erzielen. Bei komplizierter Musik muss die Bitrate (folglich die Rahmengröße) auf ~256 kbps erhöht werden, um den gleichen vordefinierten AWNMR aufrechtzuerhalten. Der Vorteil ist, dass an Stelle der Variierung der Qualität die Bitrate variabel gestaltet wird und die Qualität fast gleichbleibend ist. Die durchschnittliche Bitrate für unterschiedliche NMR/snroffst kann empirisch durch Simulationen mit einem Sortiment von Musiktestvektoren berechnet werden. Zusätzlich dazu können harte Schwellwerte für die maximale Rahmengröße gesetzt werden, um zu große Bitanforderungen zu verhindern.

Claims (5)

  1. Verfahren zum Codieren eines Audiosignals, mit: dem Bereitstellen einer Maskierungsfunktion, welche eine psychoakustische Maskierung darstellt; dem Festsetzen eines Qualitätswertes für die Daten des codierten Signals; dem Einstellen der Maskierungsfunktion abhängig von dem Qualitätswert; und dem Zuordnen von Bits für die Quantisierung des auf der Maskierungsfunktion beruhenden codierten Signals, dadurch gekennzeichnet, dass: der Qualitätswert mit θ gleichgesetzt wird, das eine Funktion von snroffst ist, das eine Variable ist, die eine Versetzung eines Signal-Rausch-Abstands kennzeichnet und proportional einem Signal-Masken-Abstand ist.
  2. Verfahren nach Anspruch 1, wobei der Qualitätswert einen gewichteten durchschnittlichen Signal-Masken-Abstand (AWNMR) darstellt.
  3. Verfahren nach Anspruch 2, wobei
    Figure 00180001
    wobei Sv die Maskierungsfunktion ist, Sv die eingestellte Maskierungsfunktion ist, und Wk eine Gewichtungsfunktion ist.
  4. Verfahren nach einem der vorhergehenden Ansprüche, wobei aus dem Audiosignal Transformierungskoeffizienten zum Codieren abgeleitet werden und in grafisch einer Leistungsspektrumsdichtefunktion (PSD) dargestellt werden, und wobei die Bit-Zuordnung durch Differenzierung der PSD und der eingestellten Maskierungsfunktion festgelegt wird.
  5. Verfahren nach einem der Ansprüche 1 bis 4, wobei das Codieren des Audiosignals das Teilen des Signals in eine Mehrzahl von Rahmen zum Befördern von Quantisierungs- und anderen Signaldaten und das Vergrößern oder Verkleinern einer oder mehrerer Rahmenlängen umfasst, bis der zugeordnete Rahmen die für die Quantisierung zugeordneten Bits untergebracht hat.
DE69932861T 1999-10-30 1999-10-30 Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung Expired - Lifetime DE69932861T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SG1999/000112 WO2001033555A1 (en) 1999-10-30 1999-10-30 Method of encoding an audio signal using a quality value for bit allocation

Publications (2)

Publication Number Publication Date
DE69932861D1 DE69932861D1 (de) 2006-09-28
DE69932861T2 true DE69932861T2 (de) 2007-03-15

Family

ID=20430246

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69932861T Expired - Lifetime DE69932861T2 (de) 1999-10-30 1999-10-30 Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung

Country Status (4)

Country Link
US (1) US7003449B1 (de)
EP (1) EP1228506B1 (de)
DE (1) DE69932861T2 (de)
WO (1) WO2001033555A1 (de)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7457415B2 (en) 1998-08-20 2008-11-25 Akikaze Technologies, Llc Secure information distribution system utilizing information segment scrambling
ATE369600T1 (de) * 2000-03-15 2007-08-15 Koninkl Philips Electronics Nv Laguerre funktion für audiokodierung
US20030046707A1 (en) * 2001-09-06 2003-03-06 Ofir Shalvi Signal compression for fiber node
US7650277B2 (en) * 2003-01-23 2010-01-19 Ittiam Systems (P) Ltd. System, method, and apparatus for fast quantization in perceptual audio coders
SG135920A1 (en) * 2003-03-07 2007-10-29 St Microelectronics Asia Device and process for use in encoding audio data
US7996234B2 (en) * 2003-08-26 2011-08-09 Akikaze Technologies, Llc Method and apparatus for adaptive variable bit rate audio encoding
US7634413B1 (en) * 2005-02-25 2009-12-15 Apple Inc. Bitrate constrained variable bitrate audio encoding
US7451070B2 (en) * 2005-04-08 2008-11-11 International Business Machines Optimal bus operation performance in a logic simulation environment
US7418394B2 (en) * 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
US8972359B2 (en) * 2005-12-19 2015-03-03 Rockstar Consortium Us Lp Compact floating point delta encoding for complex data
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
FI20065474L (fi) * 2006-07-04 2008-01-05 Head Inhimillinen Tekijae Oy Menetelmä ääni-informaation käsittelemiseksi
US8010370B2 (en) * 2006-07-28 2011-08-30 Apple Inc. Bitrate control for perceptual coding
US8032371B2 (en) * 2006-07-28 2011-10-04 Apple Inc. Determining scale factor values in encoding audio data with AAC
US8780717B2 (en) 2006-09-21 2014-07-15 General Instrument Corporation Video quality of service management and constrained fidelity constant bit rate video encoding systems and method
US20090210222A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Multi-Channel Hole-Filling For Audio Compression
US8346547B1 (en) * 2009-05-18 2013-01-01 Marvell International Ltd. Encoder quantization architecture for advanced audio coding
WO2012122397A1 (en) 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
KR101726205B1 (ko) 2012-11-07 2017-04-12 돌비 인터네셔널 에이비 감소된 복잡성 변환기 snr 계산
US9613660B2 (en) * 2013-04-05 2017-04-04 Dts, Inc. Layered audio reconstruction system
US9564136B2 (en) * 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235671A (en) * 1990-10-15 1993-08-10 Gte Laboratories Incorporated Dynamic bit allocation subband excited transform coding method and apparatus
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
JP3446216B2 (ja) * 1992-03-06 2003-09-16 ソニー株式会社 音声信号処理方法
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
KR100518470B1 (ko) * 1993-12-23 2005-12-27 코닌클리케 필립스 일렉트로닉스 엔.브이. 적응성디더감산,숨겨진채널비트삽입및필터링을통한다중비트코드화디지탈음향의엔코딩방법및장치와,이방법과함께사용하기위한엔코딩및디코딩장치
JP2778482B2 (ja) 1994-09-26 1998-07-23 日本電気株式会社 帯域分割符号化装置
JP2776300B2 (ja) * 1995-05-31 1998-07-16 日本電気株式会社 音声信号処理回路
US5706392A (en) * 1995-06-01 1998-01-06 Rutgers, The State University Of New Jersey Perceptual speech coder and method
GB9822930D0 (en) * 1998-10-20 1998-12-16 Canon Kk Speech processing apparatus and method
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility

Also Published As

Publication number Publication date
DE69932861D1 (de) 2006-09-28
EP1228506B1 (de) 2006-08-16
US7003449B1 (en) 2006-02-21
EP1228506A1 (de) 2002-08-07
WO2001033555A1 (en) 2001-05-10

Similar Documents

Publication Publication Date Title
DE69932861T2 (de) Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung
DE69633633T2 (de) Mehrkanaliger prädiktiver subband-kodierer mit adaptiver, psychoakustischer bitzuweisung
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE69924431T2 (de) Vorrichtung und Verfahren zur dynamischen Bitverteilung für Audiokodierung
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
EP2022043B1 (de) Informationssignalcodierung
DE69233094T2 (de) Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE602006000239T2 (de) Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
DE60110679T3 (de) Perzeptuelle Kodierung von Audiosignalen unter Verwendung von getrennter Reduzierung von Irrelevanz und Redundanz
EP1697930B1 (de) Vorrichtung und verfahren zum verarbeiten eines multikanalsignals
DE60015030T2 (de) Auf Block Umschaltung basierender Teilband-Audiokodierer
DE4320990B4 (de) Verfahren zur Redundanzreduktion
DE69923555T2 (de) Verfahren und vorrichtung zur entropie-kodierung von quantisierten transformationskoeffizienten eines signals
DE20321886U1 (de) Inverse Quantisierung für Audio
EP3544003B1 (de) Vorrichtung und verfahren zum ermitteln eines schätzwerts
DE69826529T2 (de) Schnelle datenrahmen-optimierung in einem audio-kodierer
DE19811039A1 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
EP0611516B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle
DE102004043521A1 (de) Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Representative=s name: HEYER, V., DIPL.-PHYS. DR.RER.NAT., PAT.-ANW., 806