DE602004005846T2 - Audiosignalgenerierung - Google Patents

Audiosignalgenerierung Download PDF

Info

Publication number
DE602004005846T2
DE602004005846T2 DE602004005846T DE602004005846T DE602004005846T2 DE 602004005846 T2 DE602004005846 T2 DE 602004005846T2 DE 602004005846 T DE602004005846 T DE 602004005846T DE 602004005846 T DE602004005846 T DE 602004005846T DE 602004005846 T2 DE602004005846 T2 DE 602004005846T2
Authority
DE
Germany
Prior art keywords
input
subband
audio signal
subband signals
delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE602004005846T
Other languages
English (en)
Other versions
DE602004005846D1 (de
Inventor
Erik G. Schuijers
Marc W. Klein Middelink
Leon M. Van De Kerkhof
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=33300980&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE602004005846(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of DE602004005846D1 publication Critical patent/DE602004005846D1/de
Application granted granted Critical
Publication of DE602004005846T2 publication Critical patent/DE602004005846T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf die Erzeugung eines Ausgangs-Audiosignals auf Basis eines Eingangs-Audiosignals, und insbesondere auf eine Anordnung zum Liefern eines Ausgangs-Audiosignals.
  • Erik Schuijers, Werner Oomen, Bert den Brinker und Jeroen Breebaart "Advances in Parametric Coding for High-Quality Audio", Vordruck 5852, "114th AES Convention" Amsterdam, Niederlanden den 22.–25. März 2003 beschreiben ein parametrisches Codierungsschema unter Anwendung einer effizienten parametrischen Darstellung für das Stereobild. Zwei Eingangssignale werden zu einem einzigen Mono-Audiosignal vermischt. Wahrnehmend relevante räumliche Auslösereize werden explizit modelliert. Das vermischte Signal wird unter Verwendung eines mono-parametrischen Codierers codiert. Die Stereo Parameter Interkanal Intensitätsdifferenz (IID), die Interkanal Zeitdifferenz (ITD) und die Interkanal Kreuzkorrelation (ICC) werden quantisiert, codiert und gemultiplext zu einem Bitstrom, zusammen mit dem quantisierten und codierten Mono-Audiosignal. Auf der Decoderseite wird der Bitstrom zu einem codierten Monosignal und den Stereo-Parametern gedemultiplext. Das codierte Mono-Audiosignal wird decodiert zum Erhalten eines decodierten Mono-Audiosignals m' (siehe 1). Aus dem Mono-Zeitdomänensignal wird ein dekorreliertes Signal berechnet, und zwar unter Verwendung eines Filters D 10, was eine optimale wahrnehmbare Dekorrelation ergibt. Das Mono-Zeitdomänensignal m' und das dekorrelierte Signal d werden zu der Frequenzdomäne transformiert. Danach wird das Frequenzdomäne Stereo-Signal mit den IDD-, ITD- und ICC-Parametern verarbeitet, und zwar durch Skalierung, Phasenmodifikationen bzw. Mischung in einer Parameterverarbeitungseinheit 11 zum Erhalten des decodierten Stereopaares l' und r'. Die resultierenden Frequenzdomänendarstellungen wird in die Zeitdomäne zurück transformiert.
  • In dem MPEG-4 (ISO/IEC 14496-3:302) vorgeschlagenen Entwurfsabänderungsvorschlag (PDAM) 2, Abschnitt 5.4.6, wird ein derartiges dekorreliertes Signal durch Faltung/Filterung des Monosignals mit einer vordefinierten Imspulsantwort erhalten.
  • Die nicht vorher veröffentlichte Europäische Patentanmeldung 02077863.5 (Aktenzeichen des Anwalts PHNL020639) beschreibt die Verwendung eines Allpassfilters, beispielsweise eines Kammfilters, mit einer frequenzabhängigen Verzögerungsschaltung zum herleiten eines dekorrelierten Signals. Bei hohen Frequenzen wird eine relativ geringe Verzögerung angewandt, was zu einer groben Frequenzauflösung führt. Bei niedrigen Frequenzen führt eine große Verzögerung zu einem dichten Zwischenraum des Kammfilters. Die Filterung kann mit einem Bandbegrenzungsfilter kombiniert werden, wobei die Dekorrelation auf eines oder mehrere Frequenzbänder angewandt wird.
  • US-A-4039755 beschreibt die Aufteilung eines Eingangssignals in Frequenzbänder, die danach verschiedenen Verzögerungen ausgesetzt werden.
  • Es ist nun u. a. eine Aufgabe der vorliegenden Erfindung, auf vorteilhafte Weise ein Ausgangsaudiosignal zu erzeugen, und zwar auf Basis eines Eingangsaudiosignals. Dazu schafft die vorliegende Erfindung eine Anordnung, ein Verfahren und ein Gerät, wie in den Hauptansprüchen definiert. Vorteilhafte Ausführungsformen sind in den Unteransprüchen definiert.
  • Nach einem ersten Aspekt der vorliegenden Erfindung wird ein Audiosignal erzeugt, und zwar auf Basis eines Eingangsaudiosignals, wobei das Eingangsaudiosignal eine Anzahl Eingangsteilbandsignale aufweist, wobei wenigstens ein Teil der Eingangsteilbandsignale verzögert wird zum Erhalten einer Anzahl verzögerter Teilbandsignale, wobei wenigstens ein einziges Eingangsteilbandsignal mehr als ein anderes Eingangsteilbandsignal einer höheren Frequenz verzögert wird, und wobei das Ausgangsaudiosignal aus einer Kombination des Eingangsaudiosignals und der Anzahl verzögerter Teilbandsignal hergeleitet wird. Dadurch, dass in der Teilbanddomäne eine derartige frequenzabhängige Verzögerung durchgeführt wird, kann auf vorteilhafte Weise parametrisches Stereo implementiert werden, insbesondere in denjenigen Audiodecodern, in denen der Kerndecoder bereits eine Teilbandfilterbank enthält. Filterbanken werden üblicherweise im Kontext von Audiocodierung verwendet, beispielsweise MPEG-1/2 Schicht I, II und III verwenden alle ein 32 Band kritisch abgetastetes Teilbandfilter. Die Anzahl verzögerter Teilbandsignale kann als Teilbanddomäne entsprechend dem dekorrelierten Signal verwendet werden, wie oben beschrieben. Unter idealen Umständen ist die Korrelation zwischen der Anzahl verzögerter Teilbandsignale und dem Eingangsaudiosignal Null. Bei praktischen Ausführungsformen aber kann die Korrelation bis zu 40% für eine akzeptierbare Audioqualität sein, bis zu 10% für eine mittelmäßige bis hohe Audioqualität sein und bis zu 2 oder 3% für eine hohe Audioqualität.
  • Bei einer Ausführungsform der vorliegenden Erfindung umfasst das Ausgangsaudiosignal eine Anzahl Ausgangsteilbandsignale. Eine Kombination der verzögerten Teilbandsignale und der Eingangsteilbandsignale in der Teilbanddomäne zum Erhalten der Anzahl Ausgangsteilbandsignale ist dann relativ einfach implementierbar. Bei praktischen Ausführungsformen wird ein Zeitdomänenausgangsaudiosignal aus der Anzahl Ausgangsteilbandsignale in einer Syntheseteilbandfilterbank synthetisiert.
  • Zum Erhalten einer effizienten Implementierung ist eine Anzahl Verzögerungseinheiten vorgesehen, wobei die Anzahl Verzögerungseinheiten kleiner ist als die Anzahl Eingangsteilbandsignale, und wobei die Eingangsteilbandsignale über die Anzahl Verzögerungsanordnungen in Gruppen aufgeteilt werden.
  • Die beste Audioqualität wird bei Ausführungsformen erhalten, bei denen die Verzögerung in den vielen Verzögerungseinheiten von der hohen Frequenz zur tiefen Frequenz monoton zunimmt.
  • Bei einer bevorzugten Ausführungsform der vorliegenden Erfindung wird eine komplexe Filterbank verwendet, die im Endeffekt um einen Faktor zwei überabgetastet wird, weil für jeden echten Eingangsabtastwert ein komplexer Ausgangsabtastwert erzeugt wird, der im Endeffekt aus zwei Werten besteht: einem echten und einem komplexen Wert. Dies eliminiert die großen Aliasing-Anteile, woran die MPEG-1 und MPEG-2 kritisch abgetastete Filterbank leidet.
  • Bei einer effizienten Ausführungsform der Erzeugung des Ausgangsaudiosignals wird eine Quadraturspiegelfilterbank ("QMF") verwendet. Eine derartige Filterbank ist an sich aus Per Ekstrand "Bandwith extension of audio signals by spectral band replication", "Proc. 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), Seiten 53–58, Löwen, Belgien, 15. November 2002 bekannt. 2 zeigt ein Blockschaltbild einer derartigen komplexen QMF-Analysen- und -Synthesefilterbank. Die Analysenfilterbank 30 verteilt das Signal in N komplex bewertete Teilbänder, die intern um einen Faktor N abwärts abgetastet werden. Ein stilisierter Frequenzbereich ist in 3 dargestellt. Die Synthese-QMF-Filterbank 31 nimmt die N komplexen Teilbandsignale als Eingang und erzeugt ein reell bewertetes PCM Ausgangssignal. Nach einer Erkenntnis der Erfinder kann, wenn eine komplexe QMF-Filterbank verwendet wird, ein korreliertes Signal geschaffen werden, das wahrnehmbar der "idealen" Situation sehr nahe kommt. Für eine derartige komplexe QMF Filterbank gibt es Implementierungen, die effizienter sind als die bei MPEG-4 PDAM 2 Abschnitt 5, 4, 6 angewandte Faltung; eine derartige Faltung ist relativ aufwendig in Bezug auf rechnerische Belastung und Speicheraufwand. Als zusätzlicher Vorteil ermöglicht die Verwendung einer komplexen QMF Filterbank auch eine effiziente Kombination parametrischen Stereos und spektraler Bandreplikation ("SBR"). Der Gedanke hinter SBR ist, dass die höheren Frequenzen aus den niedrigeren Frequenzen rekonstruiert werden können, und zwar mit Hilfe von nur wenig Hilfsinformation. In der Praxis erfolgt diese Rekonstruktion mit Hilfe einer komplexen Quadraturspiegelfilterbank (QMF). Um auf effiziente Art und Weise zu einem dekorrelierten Signal in der Teilbanddomäne zu gelangen, benutzen Ausführungsformen der vorliegenden Erfindung eine frequenz-(oder teilbandindex-)abhängige Verzögerung in der Teilbanddomäne. Weil die komplexe QMF Filterbank nicht kritisch abgetastet wird, brauchen keine zusätzlichen Vorkehrungen getroffen zu werden um den Aliasing-Effekt zu berücksichtigen. Weiterhin ist, da die Verzögerung gering ist, der gesamte RAM-Gebrauch dieser Ausführungsform niedrig. Es sei bemerkt, dass in dem SRB Decoder, wie dieser von Ekstrand beschrieben wird, die Analyse-QMF-Bank aus nur 32 Bändern besteht, während die Synthese-QMF-Bank aus 64 Bändern besteht, da der Kerndecoder im Vergleich zu dem ganzen Audiodecoder mit der halben Abtastfrequenz läuft. In dem entsprechenden Codierer aber wird eine 64 Bänder Analyse-QMF-Bank verwendet um den ganzen Frequenzbereich zu decken.
  • Die Verwendung eines eine ganze Anzahl Teilbandabtastwerte verzögerten Signals als dekorreliertes Signal sorgt für Zeitdomänenverschmierung, d.h. die Signalplatzierung in der Zeit wird nicht aufbewahrt. Dies kann Artefakte um Übergänge herum verursachen, d.h. in denjenigen Fällen, in denen eine Signalstärkenänderung über einer vorbestimmten Schwelle liegt. Signalstärke kann in Amplitude, in Leistung usw. gemessen werden. Bei einer vorteilhaften Ausführungsform der vorliegenden Erfindung werden Artefakte um Übergänge herum durch Herleitung eines dekorrelierten Signals in der Umgebung eines Übergangs durch Verwendung geringfügiger Verzögerungen statt ganzer Verzögerungen gelindert. Eine geringfügige Verzögerung ist eine Verzögerung kleiner als die Zeit zwischen zwei aufeinander folgenden Teilbandabtastwerten und kann durch Verwendung einer Phasendrehung leicht implementiert werden. Ein Übergang von geringfügigen Verzögerungen zu ganzen Verzögerungen und umgekehrt kann zu Unregelmäßigkeiten in dem dekorrelierten Signal führen. Um derartige Unregelmäßigkeiten zu vermeiden schafft eine vorteilhafte Ausführungsform der vorliegenden Erfindung eine Überblendung um von der Verwendung des geringfügig verzögerten dekorrelierten Signal zu dem ganz verzögerten dekorrelierten Signal zurück zu gehen.
  • Ausführungsbeispiele der vorliegenden Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen:
  • 1 ein Blockschaltbild eines parametrischen Stereodecoders,
  • 2 ein Blockschaltbild einer N Bänder komplexen QMF-Analyse-(links) und einer Synthesefilterbank (rechts),
  • 3 einen stilisierten Frequenzgang der N Bänder QMF-Fikterbanken nach 2,
  • 4 ein Spektrogramm einer in MPEG-4 PDAM2 Abschnitt 5.4.6 verwendeten Impulsantwort zum Erzeugen des dekorrelierten Signals, wobei die x-Achse Zeit (Abtastwerte) und die y-Achse die normalisierte Frequenz bezeichnet,
  • 5 ein Blockschaltbild einer Anordnung nach einer Ausführungsform der vorliegenden Erfindung,
  • 6 eine Verzögerung, ausgedrückt in Teilbandabtastwerten als eine Funktion von Teilbandindex nach einer Ausführungsform der vorliegenden Erfindung,
  • 7 einen vorteilhaften Audiodecoder nach einer Ausführungsform der vorliegenden Erfindung, der parametrisches Stereo mit spektraler Bandreplikation kombiniert, und
  • 8 das Auftreten eines Nachechos nach einem Übergang, verursacht durch Mischung mit einem ganzzahlig verzögerten dekorrelierten Signal,
  • 9 ein Beispiel der Mischung von Koeffizienten, wobei ein Wert 1 bedeutet, dass ein ganzzahlig verzögertes dekorreliertes Signal verwendet wird, und ein Wert 0 bedeutet, dass ein gebrochen verzögertes dekorreliertes Signal verwendet wird,
  • 10 ein resultierendes Ausgangssignal, wenn der Mischfaktor nach 9 angewandt wird, und
  • 11 den Audiodecoder nach 7, wobei eine weitere Verzögerungseinheit mit gebrochenen Verzögerungen verwendet wird.
  • Die Zeichnung zeigt nur diejenigen Elemente, die zum Verständnis der vorliegenden Erfindung erforderlich sind.
  • Nachstehend wird eine vorteilhafte Ausführungsform der vorliegenden Erfindung zum Erzeugen eines Stereo-Ausgangsaudiosignals, und zwar auf Basis eines Mono-Eingangsaudiosignals durch Anwendung von parametrischem Stereo beschrieben. Das Eingangsaudiosignal umfasst eine Anzahl Eingangsteilbandsignale. Die vielen Eingangs teilbandsignale werden in einer Anzahl Verzögerungseinheiten verzögert, die für Teilbänder mit einer niedrigeren Frequenz mehr Verzögerung schaffen als für Teilbänder mit einer höheren Frequenz. Die verzögerten Teilbandsignale dienen als eine Teilbanddomänenversion des dekorrelierten Signals, erforderlich bei der Erzeugung des Stereoausgangssignals.
  • Bei MPEG-4 PDAM 2, Abschnitt 5.4.6 wird das dekorrelierte Signal dadurch erhalten, dass zunächst eine Phasencharakteristik φ berechnet wird, die für eine Abtastfrequenz fs von 44,1 kHz der nachfolgenden Gleichung entspricht:
    Figure 00060001
    wobei φ0 einen Wert π/2 hat, wobei K gleich 256 ist und wobei k = 0...256 ist. Aus dieser Phasengangfunktion wird danach eine Filterimpulsantwort berechnet, und zwar unter Anwendung der inversen FFT. Es ist einer linearen Verzögerung ähnlich. Diese Verzögerung kann wie folgt angenähert werden:
    Figure 00060002
    wobei d die Verzögerung in Abtastwerten und f die Frequenz in Radien ist.
  • Vorzugsweise werden die Eingangsteilbandsignale in einer komplexen QMF Analysenfilterbank erhalten, die in einem Ferncodierer vorhanden sein kann, die aber auch in dem Decoder vorhanden sein kann. Wenn die Ausgänge einer komplexen QMF Filterbank um einen Faktor N heruntergemischt werden, ist es nicht möglich, eine gewünschte Zeitdomänenverzögerung auf einer Verzögerung innerhalb jedes Teilbandes abzubilden. Eine wahrnehmbar gute Annäherung kann durch Anwendung gerundeter Versionen der Verzögerungsfunktion (2) anzuwenden, wie oben beschrieben. So ist beispielsweise die Verzögerung innerhalb jedes Teilbandes für N = 64 Teilbänder in 6 dargestellt. Für diese spezielle Implementierung brauchen nur 136 komplexer Werte gespeichert zu werden um das dekorrelierte Signal zu bilden. Es sei bemerkt, dass für die höheren Frequenzen dennoch eine Verzögerung einer einzelnen Teilbandabtastwertes angewandt wird, obschon die oben stehende Verzögerungsfunktion einen Wert 0 zur Hälfte der Abtastfrequenz vor schreibt. Die Verzögerung eines einzigen Teilbandabtastwertes gewährleistet, dass das Signalmaximal dekorreliert wird.
  • 5 zeigt ein Blockschaltbild einer Anordnung 50 nach einer Ausführungsform der vorliegenden Erfindung zum Erzeugen der vielen verzögerten Teilbandsignale. Die Anordnung 50 befindet sich irgendwo zwischen der QMF Analysenfilterbank 30 und der QMF Synthesefilterbank 31 und umfasst eine Anzahl Verzögerungseinheiten 501, 502, 503 und 504. Die Verzögerungseinheit 501 schafft eine Verzögerung von einer Einheit für alle Teilbänder. Eine Gruppe von Teilbändern mit einer höheren Frequenz, beispielsweise die Bänder 40–64, wird ohne weitere Verzögerung zu der Synthese QMF Filterbank 31 geliefert. Die Gruppe von Teilbändern mit einer relativ niedrigen Frequenz, beispielsweise die Bänder 0–40, wird in der Verzögerungseinheit 502 weiter verzögert. Ein Teil dieser Gruppe, beispielsweise die Bänder 0–24, wird in der Verzögerungseinheit 503 und in der Verzögerungseinheit 504 weiter verzögert (wobei die letztere nur für die Teilbänder 0–8 vorgesehen ist). Auf diese Weise wird ein beispielhafter Betrag von 4 Gruppen verschiedener Verzögerungen geschaffen mit einer Verzögerung von 1, 2, 3 bzw. 4 Verzögerungen. Die als eine Funktion des Teilbandindexes in Teilbandabtastwerten ausgedrückte Verzögerung ist in 6 dargestellt. Die QMF Analysenfilterbank 30 ist meistens in einem Audiocodierer vorhanden, obschon für SBR eine kleinere M Bänder Analysen QMF Filterbank auch in dem Decoder verwendet wird.
  • 7 zeigt einen vorteilhaften Audiodecoder 700 nach einer Ausführungsform der vorliegenden Erfindung, der ein parametrisches Stereowerkzeug und SBR kombiniert. Ein Bitstromdemultiplexer 70 empfängt den codierten Audiobitstrom und leitet die SBR Parameter, die Stereo-Parameter und das kerncodierte Audiosignal her. Das kerncodierte Audiosignal wird unter Verwendung eines Kerndecoders 71 decodiert, der beispielsweise ein Standard MPEG-1 Schicht III (mp3) oder ein AAC Decoder sein kann. Typischerweise läuft ein derartiger Decoder mit der halben Ausgangsabtastfrequenz (fs/2). Das resultierende kerndecodierte Audiosignal wird einer M Teilbänder komplexen QMF Filterbank 72 zugeführt. Diese Filterbank 72 liefert M komplexe Abtastwerte je M echte Eingangsabtastwerte und wird auf diese Weise effektiv um einen Faktor 2 überabgetastet, wie oben erläutert. In einem HF-Generator 73 werden Teilbänder N–M mit einer höheren Frequenz, die nicht von dem kerndecodierten Audiosignal gedeckt werden, durch Replikation (bestimmter Teile) der M Teilbänder erzeugt. Der Ausgang des HF-Generators 73 wird mit den niedrigeren M Teilbändern zu N komplexen Teilbandsignalen kombiniert. Daraufhin stellt ein Umhüllende-Einstellelement 74 die replizierten HF-Teilbandsignale auf die gewünschte Umhüllende ein und eine Hinzufügungseinheit 75 fügt zusätzliche sinusförmige und Rauschanteile hinzu, wie durch die SRB Parameter angegeben. Die gesamten N Teilbandsignale werden einer Verzögerungseinheit 76 zugeführt, die der in 5 dargestellten Anordnung 50 entsprechen kann, um die verzögerten Teilbandsignale zu erzeugen. Die N verzögerten Teilbandsignale und die N Eingangsteilbandsignale werden in der Kombiniereinheit 77 in Abhängigkeit von Stereo-Parametern, wie dem ICC Parameter, verarbeitet um N Ausgangsteilbandsignale für einen ersten Ausgangskanal und N Ausgangsteilbandsignale für einen zweiten Ausgangskanal herzuleiten. Die N Ausgangsteilbandsignale für den ersten Ausgangskanal werden über das N Bänder komplexe QMF Synthesefilter 78 geleitet um die ersten PCM Ausgangssignale für links L zu bilden. Die N Ausgangsteilbandsignale für den zweiten Ausgangskanal werden über das N Bänder komplexe QMF Synthesefilter 79 geleitet um die ersten PCM Ausgangssignale für rechts R zu bilden. In praktischen Ausführungsformen, N = 64 und M = 32.
  • Die oben präsentierte Annäherung eignet sich durchaus für stationäre Signale. Für nicht stationäre, d.h. übergangsähnliche Signale aber Treten bei Anwendung dieser Annäherung Probleme auf. Dies ist in 8 dargestellt, die das Ergebnis eines einzigen Kanals eines Kastagnettensignals zeigt, wie dies unter Verwendung des ganzzahlig verzögerten dekorrelierten Signals nach 5 und 6 als Basis zum Herleiten des Ausgangsaudiosignals erhalten worden ist. Typischerweise ist in einem Signal mit starken Übergängen, beispielsweise Kastagnetten, die Korrelation zwischen dem linken und dem rechten Kanal unmittelbar nach einem Übergang relativ niedrig, da das Signal vorwiegend aus Nachhall besteht. Das dekorrelierte Signal wird auf diese Weise ziemlich prominent eingemischt. Dies führt zu einem deutlichen Nachecho nach dem wirklichen Kastagnettenübergang. Obschon durch Nachmaskierung in der Zeitdomäne dies nicht als ein zweiter Übergang empfunden wird, verursacht es dennoch eine unerwünschte Tonkolorierung. In einer vorteilhaften Ausführungsform der vorliegenden Erfindung wird dieser Artefakt dadurch gelindert, dass das dekorrelierte Signal in der Umgebung eines Übergangs geformt wird, und zwar durch Anwendung einer gebrochenen Verzögerung. Die genannte gebrochene Verzögerung kann auf effiziente Art und Weise implementiert werden, und zwar unter Anwendung von Phasendrehung. Bei einer weiteren Ausführungsform wird zur Vermeidung von Unregel mäßigkeiten in dem gesamten dekorrelierten Signal das gebrochen verzögerte dekorrelierte oder phasengedrehte Signal (langsam) über Zeit mit dem ganzzahlig verzögerten dekorrelierten Signal überblendet.
  • Folglich wird vorgeschlagen, eine gebrochen verzögerte oder phasengedrehte Version des ursprünglichen Signals statt der frequenzabhängigen ganzzahligen Verzögerung anzuwenden, ausgehend von der Übergangslage. Wegen der zeitlichen Nachmaskierungseigenschaften des menschlichen Gehörsystems ist es nicht sehr kritisch, wie dieses dekorrelierte Signal berechnet werden muss. An sich kann das dekorrelierte Signal beispielsweise dadurch erhalten werden, dass eine 99 Grad Phasendrehung in jedem Teilband des ursprünglichen Signals angewandt wird.
  • Um Unregelmäßigkeiten in dem dekorrelierten Signal vom Übergang an zu vermeiden wird zwischen dem ganzzahlig verzögerten und dem phasengedrehten Signal vorzugsweise eine Überblendung vorgesehen. Diese Überblendung kann wie folgt durchgeführt werden: dhybrid[n] = m[n]ddelay[n] + (1 – m[n])drotation[n]wobei n ein (Teilband)Abtastwertindex ist, wobei m[n] ein Mischfaktor oder ein Überblendungsfaktor ist, wobei ddelay[n] das dekorrelierte (Teilband) Signal ist, gebildet durch die frequenzabhängige ganzzahlige Verzögerung, wobei drotation[n] das dekorrelierte Teilbandsignal ist, gebildet durch die gebrochene Verzögerung oder Phasendrehung und wobei dhybrid[n] ein resultierendes hybrides dekorreliertes Signal ist. Der Mischfaktor m[n] wird am Anfang des Übergangs Null. Er bleibt danach eine Zeit lang, typischerweise entsprechend etwa 20 ms (etwa 12 ms für die Länge der Verzögerung und 8 ms für die Länge des Übergangs) Null. Die Einblendung von Null zu Eins dauert typischerweise 10–20 ms. Der Mischfaktor m[n] kann linear oder teilweise linear sein, ist dies aber nicht unbedingt. Es sei bemerkt, dass dieser Mischfaktor m[n] auch frequenzabhängig sein kann. Da die Verzögerung für die höheren Frequenzen typischerweise kürzer ist, ist es wahrnehmbar zu bevorzugen kürzere Überblendungen für die höheren Frequenzen als für die niedrigeren Frequenzen zu haben.
  • 11 zeigt den Audiodecoder nach 7, wobei eine gebrochene Verzögerungseinheit 110 mit gebrochenen Verzögerungen verwendet wird zum Herleiten gebro chen verzögerter Teilbandsignale. Die Verzögerungseinheit 76 erzeugt frequenzabhängig verzögerte Teilbandsignale. In der Praxis kann die gebrochene Verzögerungseinheit 110 parallel zu der Verzögerungseinheit 76 funktionieren, obschon es auch möglich ist, die andere Verzögerungseinheit 110 abzuschalten, wenn die Verzögerungseinheit 76 läuft und umgekehrt. Vorzugsweise erfolgt die Umschaltung zwischen den gebrochen verzögerten Teilbandsignalen und den frequenzabhängig verzögerten Teilbandsignalen in einer Umschalteinheit 111. Die Umschalteinheit 111 führt vorzugsweise einen Überblendungsvorgang durch, wie oben erläutert, obschon eine harte Umschaltung auch möglich ist. Der Überblendungsvorgang ist von der Detektion von Übergängen abhängig. Die Detektion von Übergängen erfolgt vorzugsweise in dem Übergangsdetektor 113. Auf alternative Weise ist es möglich, dass in einem Codierer ein Umschaltindikator in den codierten Audiobitstrom eingefügt wird. Danach leitet der Bitstromdemultiplexer 70 den Umschaltindikator aus dem Bitstrom her und liefert diesen Umschaltindikator zu der Umschalteinheit 111, wobei die Umschaltung dann in Abhängigkeit von dem Umschaltindikator durchgeführt wird.
  • Es sei bemerkt, dass die oben genannten Ausführungsformen die vorliegende Erfindung illustrieren statt begrenzen, und dass der Fachmann imstande sein wird, im Rahmen der beiliegenden Patentansprüche viele alternative Ausführungsformen zu entwerfen. In den Patentansprüchen sollen eingeklammerte Bezugszeichen nicht als den Anspruch beschränkend betrachtet werden. Das Wort "enthalten" schließt das Vorhandensein anderer Elemente oder Schritte als diejenigen, die in einem Patentanspruch genannt worden sind, nicht aus. Die vorliegende Erfindung kann mit Hilfe von Hardware mit verschiedenen einzelnen Elementen und mit Hilfe eines auf geeignete Art und Weise programmierten Computers implementiert werden. In einem Anordnungsanspruch, in dem verschiedene Mittel genannt werden, können verschiedene dieser Mittel von ein und demselben Hardware-Item verkörpert werden. Die Tatsache, dass bestimmte Maßnahmen in untereinander verschiedenen Unteransprüchen genannt worden sind, gibt nicht an, dass eine Kombination dieser Maßnahmen nicht mit Vorteil angewandt werden könnte. Der Schutzumfang wird nur durch die Formulierung der beiliegenden Patentansprüche definiert.
  • Text in der Zeichnung
  • 1
    • Parameterverarbeitung
    • Stereo-Parameter
  • 2
    • PCM Eingang
    • N Bänder komplexe QMF Analysenfilterbank
    • N komplex bewertete Teilbandkanäle
    • N komplex bewertete Teilbandkanäle
    • N Bänder komplexe QMF Synthesefilterbank
    • PCM Ausgang
  • 5
    • N Bänder komplexe QMF Analysenfilterbank
    • N Eingangsteilbandsignale
    • N dekorrelierte Teilbandsignale
    • N Bänder komplexe QMF Synthesefilterbank
  • 7
    • Bitstrom
    • Bitstrom-Demultiplexer
    • Kerndecoder
    • M Bänder Analysenfilter
    • HF-Generator
    • Umhüllende-Einstellelement
    • Hinzufügungseinheit
    • N Bänder
    • Dekorrelationsverzögerung
    • Parametrische Stereo-Parameter
    • Matrizierung und Drehung
    • N Bänder Synthese QMF
    • N Bänder Synthese QMF
    • Linkskanal PCM
    • Rechtskanal PCM
  • 8
    • Amplitude
    • Zeit
  • 9
    • Überblendung
    • Zeit
    • Übergangsstart
  • 10
    • Amplitude
    • Zeit
  • 11
    • Bitstrom
    • Bitstrom-Demultiplexer
    • Kerndecoder
    • 32 Bänder Analysen QMF
    • HF-Generator
    • Umhüllende-Einstellelement
    • Hinzufügungseinheit
    • N Bänder
    • Übergangsdetektor
    • Gebrochene Verzögerung
    • Dekorrelationsverzögerung
    • Überblendung
    • Parametrische Stereo-Parameter
    • 64 Bänder Synthese QMF
    • 64 Bänder Synthese QMF
    • Linkskanal PCM L
    • Rechtskanal PCM R

Claims (18)

  1. Anordnung zum Erzeugen eines Ausgangsaudiosignals (L, R) auf Basis eines Eingangsaudiosignals mit einer Anzahl Eingangsteilbandsignale (N), wobei die Anordnung Folgendes umfasst: – eine Anzahl Verzögerungsanordnungen (76; 501...504) zur Verzögerung wenigstens eines Teils der Eingangsteilbandsignale zum Erhalten einer Anzahl verzögerter Teilbandsignale, wobei wenigstens ein Eingangsteilbandsignal mehr als ein anderes Eingangsteilbandsignal einer höheren Frequenz verzögert wird, und – eine Kombiniereinheit (77) zum Herleiten des Ausgangsaudiosignals aus einer Kombination des Eingangsaudiosignals und der Anzahl verzögerter Teilbandsignale, – wobei die Anzahl Verzögerungseinheiten (76; 501...504) dazu vorgesehen ist, wenigstens einen Teil der Eingangsteilbandsignale um eine Verzögerung einer ganzen Anzahl Teilbandabtastwerte zu verzögern und um wenigstens ein Eingangsteilbandsignal mehr als ein anderes Eingangsteilbandsignal einer höheren Frequenz zu verzögern, wobei die Anordnung weiterhin Folgendes umfasst: – eine Teilverzögerungseinheit (110) zum Verzögern wenigstens eines Teils der Eingangsteilbandsignale mit einer Verzögerung, die ein Bruchteil der Zweit zwischen zwei aufeinander folgenden Teilbandabtastwerten ist, wobei diese Teilverzögerung für alle wenigstens eines Teils der Eingangsteilbandsignale konstant ist.
  2. Anordnung nach Anspruch 1, die weiterhin eine Umschalteinheit (111) aufweist zum Umschalten zwischen der Anzahl Verzögerungseinheiten (76; 501...504) und der Teilverzögerungseinheit (110) zum Erhalten der Anzahl verzögerter Teilbandsignale.
  3. Anordnung nach Anspruch 2, wobei die Umschalteinheit (111) durch Kreuzschwund zwischen dem Ausgang der Anzahl Verzögerungseinheiten (76; 501...504) und dem Ausgang der Teilverzögerungseinheit (110) umschaltet.
  4. Anordnung nach Anspruch 2 oder 3, die weiterhin eine Detektionseinheit (113) zum Detektieren einer Signalstärke des Eigangsaudiosignals aufweist, wobei die Umschalteinheit (111) dazu vorgesehen ist, in die Teilverzögerungseinheit (110) umzuschalten, falls die Signalstärke eine vorbestimmte Schwelle übersteigt, und zum Umschalten in die Anzahl Verzögerungseinheiten (76) falls die Signalstärke die vorbestimmte Schwelle unterscheitet.
  5. Anordnung nach Anspruch 2 oder 3, vorgesehen zum Empfangen eines Eingangsaudiosignals mit einem Umschaltindikator, wobei die Umschalteinheit (111) dazu vorgesehen ist, in Abhängigkeit von dem Umschaltindikator umzuschalten.
  6. Anordnung nach einem der vorstehenden Ansprüche, vorgesehen zum Erzeugen eines Ausgangsaudiosignals mit einer Anzahl Ausgangsteilbandsignale.
  7. Anordnung nach Anspruch 6, weiterhin mit einer Teilbandfilterbank (78, 79) zum Synthetisieren eines Zeitdomäne-Ausgangsaudiosignals (L, R) aus der Anzahl Ausgangsteilbandsignale.
  8. Anordnung nach Anspruch 7, wobei die Teilbandfilterbank (78, 79) eine komplexe Teilbandfilterbank ist.
  9. Anordnung nach Anspruch 8, wobei die komplexe Teilbandfilterbank eine komplexe Quadratur-Spiegelfilterbank ist.
  10. Anordnung nach einem der vorstehenden Ansprüche, wobei die Anzahl Verzögerungseinheiten (501...504) kleiner ist als die Anzahl Eingangsteilbandsignale, und wobei die Eingangsteilbandsignale in Gruppen über die Anzahl Verzögerungseinheiten aufgeteilt wird.
  11. Anordnung nach Anspruch 10, wobei die Anzahl Verzögerungseinheiten eine erste Verzögerungseinheit (501) aufweist zum Verzögern einer Gruppe von Teilbän dern mit einer relativ hohen Frequenz um einen einzigen Teilbandabtastwert, und wenigstens eine weitere Verzögerungseinheit (501...504) zum Verzögern einer Gruppe von Teilbändern mit einer relativ niedrigen Frequenz, um wenigstens einen weiteren Teilbandabtastwert.
  12. Anordnung nach einem der vorstehenden Ansprüche, wobei die Verzögerungseinheiten (501...504) Verzögerungen schaffen, die monoton von einer hohen Frequenz zu einer niedrigen Frequenz zunehmen.
  13. Anordnung nach einem der vorstehenden Ansprüche, vorgesehen zum Empfangen eines Mono-Eingangsaudiosignals und zum Erzeugen eines Stereo-Ausgangsaudiosignals.
  14. Anordnung nach einem der vorstehenden Ansprüche, die weiterhin eine Eingangseinheit (70) aufweist, zum Erhalten eines Korrelationsparameters, der indikativ ist für eine gewünschte Korrelation zwischen einem ersten Kanal (L) und einem zweiten Kanal (R) des Ausgangsaudiosignals (L, R), wobei die Kombinationseinheit (77) dazu vorgesehen ist, den ersten Kanal (L) und den zweiten Kanal (R) durch Kombinierung des Eingangsaudiosignals und der Anzahl verzögerter Teilbandsignale in Abhängigkeit von dem Korrelationsparameter.
  15. Anordnung nach Anspruch 14, wobei der erste Kanal (L) und der zweite Kanal (R) je eine Anzahl Ausgangsteilbandsignale aufweisen, und wobei die Anordnung weiterhin zwei Syntheseteilbandfilterbanken (78, 79) aufweist, die mit einem Ausgang der Kombinationseinheit (77) gekoppelt sind zum Erzeugen eines ersten Zeitdomänenkanals (L) bzw. eines zweiten Zeitdomänenkanals (R) auf Basis der Ausgangsteilbandsignale.
  16. Anordnung nach einem der vorstehenden Ansprüche, die weiterhin Folgendes umfasst: – eine Analysenfilterbank (72) von M Teilbändern zum Erzeugen von M gefilterten Teilbandsignalen auf Basis eines Zeitdomänenkernaudiosignals, und – einen HF-Generator (73, 74) zum Erzeugen eines HF-Signalanteils, hergeleitet von den M gefilterten Teilbandsignalen, wobei der HF-Signalanteil N–M Teilbandsignale aufweist, wobei N > M ist, wobei die N–M Teilbandsignale Teilbandsignale mit einer höheren Frequenz aufweisen als eines der Teilbänder in den M Teilbändern, wobei die M gefilterten Teilbänder und die N–M Teilbänder zusammen die Anzahl Eingangsteilbandsignale (N) bilden.
  17. Gerät (700) zum Liefern eines Ausgangsaudiosignals, wobei das Gerät Folgendes umfasst: – eine Eingangseinheit (70) zum Erhalten eines codierten Audiosignals, – einen Decoder (71) zum Decodieren des codierten Audiosignals zum Erhalten eines decodierten Signals mit einer Anzahl Teilbandsignale, – eine Anordnung (76, 77, 110) nach einem der vorstehenden Ansprüche zum Erhalten des Ausgangsaudiosignals auf Basis des decodierten Signals, und – wenigstens eine Ausgangseinheit (78, 79) zum Liefern des Ausgangsaudiosignals.
  18. Verfahren zum Schaffen eines Ausgangsaudiosignals (L, R) auf Basis eines Eingangsaudiosignals, wobei das Eingangsaudiosignal eine Anzahl Eingangsteilbandsignale (N) aufweist, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst: – das Verzögern (501...504) wenigstens eines Teils der Eingangsteilbandsignale zum Erhalten einer Anzahl verzögerter Teilbandsignale, wobei wenigstens ein Eingangsteilbandsignal mehr verzögert wird als ein weiteres Eingangsteilbandsignal mit einer höheren Frequenz, – das Verzögern (110) wenigstens eines Teils der Eingangsteilbandsignale um eine Verzögerung, die ein Bruchteil der Zeit zwischen zwei aufeinander folgenden Teilbandabtastwerten ist, wobei die fraktionierte Verzögerung für alle des wenigstens eines Teils der Eingangsteilbandsignale konstant sein kann, und – das Herleiten (77) das Ausgangsaudiosignals von einer Kombination des Eingangsaudiosignals und der Anzahl verzögerter Teilbandsignale.
DE602004005846T 2003-04-17 2004-04-14 Audiosignalgenerierung Expired - Lifetime DE602004005846T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP03076134 2003-04-17
EP03076134 2003-04-17
EP03076280 2003-04-29
EP03076280 2003-04-29
PCT/IB2004/050432 WO2004093494A1 (en) 2003-04-17 2004-04-14 Audio signal generation

Publications (2)

Publication Number Publication Date
DE602004005846D1 DE602004005846D1 (de) 2007-05-24
DE602004005846T2 true DE602004005846T2 (de) 2007-12-20

Family

ID=33300980

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602004005846T Expired - Lifetime DE602004005846T2 (de) 2003-04-17 2004-04-14 Audiosignalgenerierung

Country Status (11)

Country Link
US (1) US20070038439A1 (de)
EP (1) EP1621047B1 (de)
JP (1) JP4597967B2 (de)
KR (1) KR20050121733A (de)
AT (1) ATE359687T1 (de)
BR (1) BRPI0409327B1 (de)
DE (1) DE602004005846T2 (de)
ES (1) ES2282860T3 (de)
PL (1) PL1621047T3 (de)
RU (1) RU2005135648A (de)
WO (1) WO2004093494A1 (de)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US8090586B2 (en) * 2005-05-26 2012-01-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
US8494667B2 (en) * 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8185403B2 (en) * 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007004186A2 (en) * 2005-07-06 2007-01-11 Koninklijke Philips Electronics N.V. Parametric multi-channel decoding
US7761303B2 (en) * 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
JP5173811B2 (ja) * 2005-08-30 2013-04-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
EP1761110A1 (de) * 2005-09-02 2007-03-07 Ecole Polytechnique Fédérale de Lausanne Methode zur Generation eines Multikanalaudiosignals aus Stereosignalen
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
KR100878828B1 (ko) * 2005-10-05 2009-01-14 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
KR20070038439A (ko) * 2005-10-05 2007-04-10 엘지전자 주식회사 신호 처리 방법 및 장치
US7761289B2 (en) * 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
CN101401455A (zh) * 2006-03-15 2009-04-01 杜比实验室特许公司 使用子带滤波器的立体声呈现技术
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
WO2008063035A1 (en) * 2006-11-24 2008-05-29 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
BRPI0820488A2 (pt) * 2007-11-21 2017-05-23 Lg Electronics Inc método e equipamento para processar um sinal
WO2009078681A1 (en) * 2007-12-18 2009-06-25 Lg Electronics Inc. A method and an apparatus for processing an audio signal
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码***
RU2558004C2 (ru) * 2009-10-21 2015-07-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Ревербератор и способ ревербирования звукового сигнала
KR101712101B1 (ko) * 2010-01-28 2017-03-03 삼성전자 주식회사 신호 처리 방법 및 장치
US9275650B2 (en) 2010-06-14 2016-03-01 Panasonic Corporation Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs
EP2710588B1 (de) 2011-05-19 2015-09-09 Dolby Laboratories Licensing Corporation Forensischer nachweis von parametrischen audiokodierungschemata
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
EP2704142B1 (de) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Wiedergabe eines Audiosignals, Vorrichtung und Verfahren zur Erzeugung eines codierten Audiosignals, Computerprogramm und codiertes Audiosignal
US20160173808A1 (en) * 2014-12-16 2016-06-16 Psyx Research, Inc. System and method for level control at a receiver

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5630878B2 (de) * 1973-08-13 1981-07-17
US4039755A (en) * 1976-07-26 1977-08-02 Teledyne, Inc. Auditorium simulator economizes on delay line bandwidth
US4308424A (en) * 1980-04-14 1981-12-29 Bice Jr Robert G Simulated stereo from a monaural source sound reproduction system
US5235646A (en) * 1990-06-15 1993-08-10 Wilde Martin D Method and apparatus for creating de-correlated audio output signals and audio recordings made thereby
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
JPH09102742A (ja) * 1995-10-05 1997-04-15 Sony Corp 符号化方法および装置、復号化方法および装置、並びに記録媒体
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
DE19632734A1 (de) * 1996-08-14 1998-02-19 Thomson Brandt Gmbh Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal
US6035045A (en) * 1996-10-22 2000-03-07 Kabushiki Kaisha Kawai Gakki Seisakusho Sound image localization method and apparatus, delay amount control apparatus, and sound image control apparatus with using delay amount control apparatus
TW369746B (en) * 1996-11-13 1999-09-11 Sanyo Electric Co Surround circuit
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19900819A1 (de) * 1999-01-12 2000-07-13 Bosch Gmbh Robert Verfahren zum Dekodieren gestörter Funksignale von Mehrkanal-Audiosendungen
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis

Also Published As

Publication number Publication date
ES2282860T3 (es) 2007-10-16
JP4597967B2 (ja) 2010-12-15
US20070038439A1 (en) 2007-02-15
BRPI0409327B1 (pt) 2018-02-14
EP1621047A1 (de) 2006-02-01
EP1621047B1 (de) 2007-04-11
BRPI0409327A (pt) 2006-04-25
KR20050121733A (ko) 2005-12-27
ATE359687T1 (de) 2007-05-15
WO2004093494A1 (en) 2004-10-28
JP2006524002A (ja) 2006-10-19
PL1621047T3 (pl) 2007-09-28
DE602004005846D1 (de) 2007-05-24
RU2005135648A (ru) 2006-03-20

Similar Documents

Publication Publication Date Title
DE602004005846T2 (de) Audiosignalgenerierung
DE102008015702B4 (de) Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE602004002390T2 (de) Audiocodierung
DE602004004818T2 (de) Audiosignalcodierung oder -decodierung
DE602004005020T2 (de) Audiosignalsynthese
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
DE60013785T2 (de) VERBESSERTE SUBJEKTIVE QUALITäT VON SBR (SPECTRAL BAND REPLICATION)UND HFR (HIGH FREQUENCY RECONSTRUCTION) KODIERVERFAHREN DURCH ADDIEREN VON GRUNDRAUSCHEN UND BEGRENZUNG DER RAUSCHSUBSTITUTION
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE60202881T2 (de) Wiederherstellung von hochfrequenzkomponenten
DE602004007945T2 (de) Codierung von audiosignalen
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE60318835T2 (de) Parametrische darstellung von raumklang
DE4320990B4 (de) Verfahren zur Redundanzreduktion
EP1697930B1 (de) Vorrichtung und verfahren zum verarbeiten eines multikanalsignals
DE69821089T2 (de) Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation
DE602004008613T2 (de) Treueoptimierte kodierung mit variabler rahmenlänge
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
DE602004010188T2 (de) Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
EP1145227B1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
EP2036400B1 (de) Erzeugung dekorrelierter signale
EP1016319B1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
DE10236694A1 (de) Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee
8370 Indication related to discontinuation of the patent is to be deleted