DE60311794T2 - Signalsynthese - Google Patents

Signalsynthese Download PDF

Info

Publication number
DE60311794T2
DE60311794T2 DE60311794T DE60311794T DE60311794T2 DE 60311794 T2 DE60311794 T2 DE 60311794T2 DE 60311794 T DE60311794 T DE 60311794T DE 60311794 T DE60311794 T DE 60311794T DE 60311794 T2 DE60311794 T2 DE 60311794T2
Authority
DE
Germany
Prior art keywords
signal
input signal
correlation
output
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60311794T
Other languages
English (en)
Other versions
DE60311794C5 (de
DE60311794D1 (en
Inventor
Dirk J. Breebaart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=29252213&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE60311794(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of DE60311794D1 publication Critical patent/DE60311794D1/de
Publication of DE60311794T2 publication Critical patent/DE60311794T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Burglar Alarm Systems (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Image Processing (AREA)
  • Networks Using Active Elements (AREA)
  • Control Of Motors That Do Not Use Commutators (AREA)
  • Control Of Charge By Means Of Generators (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf die Synthese eines ersten und eines zweiten Ausgangssignals von einem Eingangssignal.
  • Im Bereich der Audiocodierung sind parametrische Audiocodierer immer interessanter geworden, Es hat sich herausgestellt, dass Übertragung (Quantisierung) von Parametern, die Audiosignale beschreiben, nur wenig Übertragungskapazität erfordern und dass sie eine Decodierung an dem empfangenden Ende ermöglichen, was zu einem Audiosignal führt, das wahrnehmbar von dem ursprünglichen Signal nicht wesentlich abweicht. Folglich können Bitrateneinsparungen dadurch erhalten werden, dass nur ein einziger Audiokanal in Kombination mit einem Parameterbitstrom übertragen wird, der die räumlichen Eigenschaften des Stereosignals beschreibt, und, folglich es ermöglicht, dass ein Decoder die räumlichen Eigenschaften des Stereosignals reproduziert.
  • Der Artikel: "Efficient representation of spezial audio using perceptual parametrization" (Faller und Baumgarte, "IEEE Workshop on applications of signal processing to audio and acoustics", 21. Oktober 2001) beschreibt eine Darstellung räumlichen Audios, das ein monaurales Summensignal und die interaurale Pegeldifferenz und die interaurale Zeitdifferenz in jedem kritischen Band aufweist. Zum Synthetisieren des binauralen Signals werden die Pegeldifferenzen und die Zeitdifferenzen auf die Spektralkoeffizienten des monauralen Signals angewandt.
  • Einer der oben genannten räumlichen Parameter, der für die Codierung eines Stereosignals mit einem L-Kanal und einem R-Kanal von Bedeutung ist, ist die Interkanal-Kreuzkorrelation zwischen dem L-Kanal und dem R-Kanal. Folglich ist in vielen Systemen einer der Signalparameter, die von einem Codierer analysiert werden, die Interkanal-Kreuzkorrelation. Die ermittelte Kreuzkorrelation wird danach zusammen mit einem Monosignal von dem Codierer zu einem entsprechenden Decoder übertragen.
  • Beim Decoder werden zwei Ausgangssignale rekonstruiert, welche die gewünschte Kreuzkorrelation haben. Weiterhin ist es erwünscht, dass die Rekonstruktion nur geringe Artefakte gegenüber dem ursprünglichen Stereosignal einführt.
  • An sich sind mehrere Verfahren zum Dekorrelieren von Signalen bekannt. 1 zeigt einen sog. Lauridsen Dekorrelator. Der Lauridsen Dekorrelator umfasst ein Allpassfilter 101, beispielsweise eine Verzögerung, die eine verzögerte Version der Wel lenform des Eingangssignals x erzeugt und möglicherweise verstärkt. Das Ausgangssignal H⨂x des Filters 101 wird daraufhin zu dem Eingangssignal addiert (102), was zu dem Linkskanal L führt, und von dem Eingangssignal subtrahiert (103), was zu dem Rechtskanal R führt.
  • Der oben genannte bekannte Dekorrelator eignet sich durchaus solange die zwei Ausgangssignale einander im Pegel sehr ähnlich sind oder einander sogar im Pegel entsprechen. Parametrische Audiocodierer führen aber auch Pegeldifferenzen den Ausgangssignalen zu, das sog. "Amplituden-Panning". Der oben genannte Dekorrelator bringt das Problem mit sich, dass die wahrnehmbare Qualität der erzeugten Signale abnimmt, wenn die Pegeldifferenzen groß sind.
  • Das oben stehende und andere Probleme werden gelöst durch ein Verfahren zum Synthetisieren eines ersten und eines zweiten Audio-Ausgangssignals von einem Eingangssignal, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst:
    • – das Filtern des Eingangssignals zum Erzeugen eines gefilterten Signals,
    • – das Erhalten eines Korrelationsparameters, der indikativ ist für eine gewünschte Korrelation zwischen dem ersten und dem zweiten Ausgangssignal,
    • – das Erhalten eines Pegelparameters, der indikativ ist für eine gewünschte Pegeldifferenz zwischen dem ersten und dem zweiten Ausgangssignal,
    • – das Transformieren des Eingangssignals und des gefilterten Signals durch einen Matrixvorgang zu dem ersten und zweiten Ausgangssignal, wobei der Matrixvorgang von dem Korrelationsparameter und dem Pegelparameter abhängig ist.
  • Folglich wird durch Durchführung eines Matrixvorgangs, der von der gewünschten Korrelation und der gewünschten Pegeldifferenz abhängig ist, eine wesentliche Zunahme der wahrnehmbaren Qualität der Ausgangssignale eines parametrischen Decoders erreicht.
  • In einer bevorzugten Ausführungsform umfasst der Matrixvorgang eine übliche Rotation um einen vorbestimmten Winkel des ersten und zweiten Ausgangssignals in einem Raum, der von dem Eingangssignal und dem gefilterten Eingangssignal umfasst wird; und wobei der vorbestimmte Winkel von dem Pegelparameter abhängig ist.
  • Folglich kann durch Addierung einer zusätzlichen Rotation zu dem Mischvorgang der relative Pegel der Ausgangssignale gesteuert werden, ohne dass dadurch die Kreuzkorrelation zwischen den Ausgangssignalen beeinflusst wird.
  • Bei einer weiteren bevorzugten Ausführungsform wird der vorbestimmte Winkel derart gewählt, dass er einen gesamten Beitrag des Eingangssignals zu dem ersten und dem zweiten Ausgangssignal maximiert. Es wird verwirklicht, dass die wahrnehmbare Qualität des Signals gesteigert werden kann, wenn der Betrag des gefilterten Signals in den Ausgangssignalen minimiert wird, und folglich der Betrag des ursprünglichen Signals maximiert wird.
  • Wenn das Verfahren weiterhin die Skalierung des ersten sowie des zweiten Ausgangssignals zu der genannten gewünschten Pegeldifferenz zwischen dem ersten und dem zweiten Signal umfasst, wird gewährleistet, dass der relative Pegel der Ausgangssignale dem gewünschten Pegel entsprechend einem durch den Codierer bestimmten Pegelparameter entspricht.
  • Bei einer bevorzugten Ausführungsform umfasst die Filterung des Eingangssignals eine Allpassfilterung des Eingangssignals, beispielsweise ein Kammfilter. Der spektrale Raum eines Kammfilters ist über die Frequenz einheitlich verteilt. Damit man nun imstande ist, einen gewünschten Dichtenraum von Spitzen und Tälern bei niedrigen Frequenzen zu erhalten, soll die Verzögerung des Lauridsen-Dekorrelators sehr groß sein. Dies aber hat den Nachteil, dass bei hohen Frequenzen für Übergangseingangssignale Echos wahrgenommen werden können.
  • Dieses Problem kann gelöst werden, wenn das Allpassfilter eine frequenzabhängige Verzögerung aufweist. Bei hohen Frequenzen wird eine relativ geringe Verzögerung angewandt, was zu einer groben Frequenzauflösung führt. Bei niedrigen Frequenzen führt eine große Verzögerung zu einem Dichtenraum des Kammfilters.
  • Die Filterung kann über die volle Bandbreite des Signals durchgeführt werden. Auf alternative Weise kann die Filterung mit einem Bandbegrenzungsfilter kombiniert werden, wobei die Dekorrelation auf ein oder mehrere selektierte Frequenzbänder angewandt wird.
  • Der Ausdruck Matrixvorgang bezieht sich auf einen Vorgang, der ein Eingangssignal mit mehreren Kanälen in ein Ausgangssignal mit mehreren Kanälen transformiert, wobei die Anteile des Mehrkanal-Ausgangssignals lineare Kombinationen der Anteile des Mehrkanal-Eingangssignals sind.
  • Die vorliegende Erfindung kann verschiedenartig implementiert werden einschließlich des oben und nachfolgend beschriebenen Verfahrens, der Anordnungen zum Codieren und Decodieren, und weiterer Produktmittel, die je einen oder mehrere der Vorteile ergeben, die im Zusammenhang mit dem erstgenannten Verfahren beschrieben worden sind, und die je eine oder mehrere bevorzugte Ausführungsformen haben, die den bevorzugten Ausführungsformen entsprechen, die im Zusammenhang mit dem erstgenannten Verfahren beschrieben und in den Unteransprüchen definiert worden sind.
  • Es sei bemerkt, dass die Merkmale des oben und nachstehend beschriebenen Verfahrens in Software implementiert und in einem Datenverarbeitungssystem oder in anderen Verarbeitungsmitteln durchgeführt werden können, verursacht durch die Durchführung von mit dem Computer durchführbaren Instruktionen. Die Instruktionen können Programmcodemittel sein, die in einem Speicher geladen sind, wie in einem RAM, aus einem Speichermedium oder über ein Computernetzwerk aus einem anderen Computer. Auf alternative Weise können die beschriebenen Merkmale durch Hardware-Schaltungen statt durch Software oder in Kombination mit Software implementiert werden.
  • Die vorliegende Erfindung bezieht sich weiterhin auf eine Anordnung zum Synthetisieren eines ersten und eines zweiten Audio-Ausgangssignals von einem Eingangssignal, wobei diese Anordnung Folgendes umfasst:
    • – Filtermittel zum Filtern des Eingangssignals zum Erzeugen eines gefilterten Signals,
    • – Mittel zum Erhalten eines Korrelationsparameters, der indikativ ist für eine gewünschte Korrelation zwischen dem ersten und dem zweiten Ausgangssignal,
    • – Mittel zum Erhalten eines Pegelparameters, der indikativ ist für eine gewünschte Pegeldifferenz zwischen dem ersten und dem zweiten Ausgangssignal,
    • – Mittel zum Transformieren des Eingangssignals und des gefilterten Signals durch einen Matrixvorgang zu dem ersten und zweiten Ausgangssignal, wobei der Matrixvorgang von dem Korrelationsparameter und dem Pegelparameter abhängig ist.
  • Die vorliegende Erfindung bezieht sich weiterhin auf eine Anordnung zum Liefern eines decodierten Audiosignals, wobei diese Anordnung Folgendes umfasst:
    • – eine Eingangseinheit zum Empfangen eines codierten Audiosignals,
    • – einen Decoder zum Decodieren des codierten Audiosignals, wobei der Decoder eine Anordnung zum Synthetisieren eines ersten und eines zweiten Audiosignals nach Anspruch 7 aufweist; und
    • – eine Ausgangseinheit zum Liefern des decodierten ersten und zweiten Audiosignals.
  • Ausführungsbeispiele der vorliegenden Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen:
  • 1 einen bekannten Lauridsen Dekorrelator,
  • 2 einen Dekorrelator nach einer Ausführungsform der vorliegenden Erfindung,
  • 3a-c die Signalerzeugung entsprechend einer Ausführungsform der vorliegenden Erfindung,
  • 4 eine schematische Darstellung eines Systems zur räumlichen Audiocodierung, und
  • 5 eine schematische Darstellung eines Systems zur Kommunikation von Merkanal-Audiosignalen.
  • 2 zeigt einen Dekorrelator nach einer Ausführungsform der vorliegenden Erfindung. Der Dekorrelator umfasst ein Allpassfilter 201, das ein Eingangssignal x empfängt, beispielsweise von einem parametrischen Audiocodierer, der ein Mono-Audiosignal x und einen Satz mit Parametern P erzeugt, wobei dieser Satz eine Zwischenkanal-Kreuzkorrelation ρ und einen Parameter enthält, der für die Kanaldifferenz c indikativ ist. Vorzugsweise umfasst das Allpassfilter eine frequenzabhängige Verzögerung, die eine relativ kleinere Verzögerung bei hohen Frequenzen als bei niedrigen Frequenzen schafft. Dies kann dadurch erreicht werden, dass eine feste Verzögerung des Allpassfilters durch ein Allpassfilter mit einer Periode eines Schroeder-Phasenkomplexes ersetzt wird (siehe beispielsweise M.R. Schroeder, "Synthesis of low-peak-factor signals and binary sequences with low autocorrelation", IEEE Transact. Inf. Theor., 16:85-89, 1970). Der Dekorrelator umfasst weiterhin eine Analysenschaltung 202, welche die räumlichen Parameter von dem Decoder empfängt und die Zwischenkanal-Kreuzkorrelation ρ und die Kanaldifferenz c extrahiert. Die Schaltungsanordnung 202 ermittelt eine Mischmatrix M(α,β), wie im Zusammenhang mit den 3a-c beschrieben wird. Die Komponenten der Mischmatrix werden in eine Transformationsschaltung 203 eingegeben, die weiterhin das Eingangssignal x und das gefilterte Signal H⨂x empfängt. Die Schaltungsanordnung 203 Führt einen Mischvorgang durch, und zwar entsprechend:
    Figure 00050001
    was zu den Ausgangssignalen L und R führt.
  • 3a-c zeigt die Signalerzeugung nach einer Ausführungsform der vorliegenden Erfindung. In 3a wird das Eingangssignal x durch die horizontale Achse dargestellt, während das gefilterte Signal H⨂x durch die vertikale Achse dargestellt wird. Da die zwei Signale nicht korreliert sind, können sie als orthogonale Vektoren dargestellt werden, die einen zweidimensionalen Raum überspannen.
  • Die Ausgangssignale L und R werden als Vektoren 301 bzw. 302 dargestellt. In dieser Darstellung wird die Korrelation zwischen den Signalen L und R durch den Winkel α zwischen den Vektoren 301 und 302 entsprechend ρ=cos(α) gegeben, d.h. durch den Winkelabstand α zwischen den Vektoren 301 und 302. Folglich hat jedes Vektorenpaar, das den richtigen Winkelabstand aufweist, die betreffende Korrelation.
  • Folglich kann eine Mischmatrix M, welche die Signale x und H⨂x in Signale L und R mit einer vorbestimmten Korrelation ρ transformiert, wie folgt ausgedrückt werden:
    Figure 00060001
  • Auf diese Weise ist der Betrag des alpass-gefilterten Signals von der gewünschten Korrelation abhängig. Weiterhin ist die Energie des Allpass-Signalanteils in den beiden Ausgangskanälen die gleiche (aber mit einer 180° Phasenverschiebung).
  • Es sei bemerkt, dass der Lauridsen-Dekorrelator nach 1 dem Fall entspricht, in dem die Matrix M gegeben wird durch:
    Figure 00060002
    d.h. α = 90° entsprechend nicht korrelierten Ausgangssignalen (ρ=0).
  • Um ein Problem mit der Matrix der Gleichung (3) zu illustrieren wird eine Situation mit einer extremen Amplituden-Panning in Richtung des Linkskanals vorausgesetzt, d.h. ein Fall, in dem ein bestimmtes Signal nur in dem Linkskanal vorhanden ist. Es wird weiterhin vorausgesetzt, dass die gewünschte Korrelation zwischen den Ausgängen Null ist. In diesem Fall ergibt das Ausgangssignal des Linkskanals der Transformation der Gleichung (1) mit der Mischmatrix der Gleichung (3) L = 1/√2(x+H⨂x). Auf diese Weise besteht das Ausgangssignal aus dem ursprünglichen Signal x kombiniert mit der allpassgefilterten Version H⨂x.
  • Dies ist aber eine unerwünschte Situation, da das Allpassfilter meistens die wahrnehmbare Qualität des Signals verschlechtert. Weiterhin führt die Addierung des ursprünglichen Signals zu dem gefilterten Signal zu Kammfiltereffekten, wie wahrnahbare Verfärbung des Ausgangssignals. In diesem vorausgesetzten extremen Fall wäre die beste Lösung, dass das linke Ausgangssignal aus dem Eingangssignal besteht. Auf diese Weise wäre die Korrelation der zwei Ausgangssignale dennoch Null.
  • In Situationen mit mehr gemäßigten Pegeldifferenzen ist die bevorzugte Situation, dass der lautere Ausgangskanal relativ mehr von dem ursprünglichen Signal enthält und der leisere Ausgangskanal relativ mehr von dem gefilterten Signal enthält. Folglich wird im Allgemeinen bevorzugt, den Betrag des ursprünglichen Signals in den zwei Ausgangssignalen zusammen zu maximieren und den Betrag des gefilterten Signals zu minimieren.
  • Nach der vorliegenden Erfindung wird dies dadurch erreicht, dass eine andere Mischmatrix mit einer zusätzlichen gemeinsamen Drehung eingeführt wird:
    Figure 00070001
  • Hier ist β eine zusätzliche Drehung, und C ist eine Skalierungsmatrix, die gewährleistet, dass die relative Pegeldifferenz zwischen den Ausgangssignalen dem Wert c entspricht, d.h.:
    Figure 00070002
  • Das Einfügen der Matrix der Gleichung (4) in die Gleichung (1) ergibt die Ausgangssignale, die durch den Matrixvorgang nach der vorliegenden Erfindung erzeugt worden sind:
    Figure 00070003
  • Diese Situation ist in 3b dargestellt. Die Ausgangssignale L und R haben dennoch eine Winkeldifferenz α, d.h. die Korrelation zwischen dem L-Signal und dem R-Signal wird durch die Skalierung der Signale L und R entsprechend der gewünschten Pegeldifferenz und die zusätzliche Drehung um den Winkel β des L-Signals und des R-Signals nicht beeinflusst.
  • Wie oben erwähnt soll vorzugsweise der Betrag des ursprünglichen Signals x in dem summierten Ausgang von L und R maximiert werden. Diese Bedingung kann angewandt werden um den Winkel β zu ermitteln, und zwar entsprechend:
    Figure 00080001
    was die nachfolgende Bedingung ergibt:
    Figure 00080002
  • Diese Situation ist in 3c dargestellt, wobei die Summe des L- und R-Anteils an die Richtung von x angepasst ist.
  • 4 zeigt schematisch ein System zur räumlichen Audiocodierung. Das System umfasst einen Codierer 401 und einen entsprechenden Decoder 405. Der Codierer 401 beschreibt die räumlichen Attribute eines Mehrkanal-Audiosignals durch Spezifikation einer interauralen Pegeldifferenz, einer interauralen Zeitdifferenz (oder Phasendifferenz), und einer maximalen Korrelation als eine Funktion der Zeit und der Frequenz, wie in WO-A1-03/090208 beschrieben. Der Codierer 401 empfängt den L- und den R-Anteil eines Stereosignals als Eingangssignal. Zunächst werden der R- und der L-Anteil von der Zeit/Frequenz-Slice-Schaltungen 402 bzw. 403 in verschiedene Zeit/Frequenzschlitze aufgeteilt, beispielsweise durch Zeitfensterung mit einer nachfolgenden Transformation.
  • In einer Ausführungsform werden das linke und das rechte eintreffende Signal in mehrere Zeitframes (beispielsweise 2048 Abtastwerte bei einer Abtastrate von 44,1 kHz) aufgeteilt und mit einem Quadratwurzel-Hammingfenster gefenstert. Daraufhin werden FFTen berechnet. Die negativen FFT-Frequenzen werden verworfen und die resultierenden FFTen werden in Gruppen von FFT-Bins (Teilbänder) aufgeteilt. Die Anzahl FFT-Bins, die zu einem Teilband kombiniert werden, ist von der Frequenz abhängig: bei höheren Frequenzen werden mehr Bins kombiniert als bei niedrigeren Frequenzen. So können beispielsweise FFT-Bins, die etwa 1,8 ERBen ("Equivalent Rectangular Bandwidth") entsprechen gruppiert werden, was zu beispielsweise 20 Teilbändern führt um den ganzen hörbaren Frequenzbereich darzustellen.
  • Daraufhin werden in der Analysenschaltung 404 für jeden Zeit/Frequenzschlitz die nachfolgenden Eigenschaften der eintreffenden Signale analysiert:
    Die interaurale Pegeldifferenz, oder ILD, definiert durch die relativen Pegel der entsprechenden bandbegrenzten Signale, herrührend von den zwei Eingängen, Die interaurale Zeitdifferenz (oder Phasendifferenz) (ITD oder IPD), definiert durch die interaurale Verzögerung (oder Phasenverschiebung) entsprechend der Spitze in der interauralen Kreuzkorrelationsfunktion, und
    Die Verschiedenheit/Gleichartigkeit der Wellenformen, die nicht durch ITDen oder ILDen nachgewiesen werden können, die durch den maximalen Wert der Kreuzkorrelationsfunktion parameterisiert werden können (d.h. den Wert der Kreuzkorrelationsfunktion an der Stelle der maximalen Spitze).
  • Die drei oben beschriebenen Parameter variieren in der Zeit; aber da es bekannt ist, dass das binaurale Hörsystem in der Verarbeitung sehr träge ist, ist die Aktualisierungsrate dieser Eigenschaften ziemlich niedrig (typischerweise einige zehn Millisekunden).
  • De Analysenschaltung 404 erzeugt weiterhin ein (dominantes) Summensignal S mit einer Kombination des linken und des rechten Signals. Folglich werden das L- und das R-Signal als das Summensignal S und ein Satz mit Parametern P als eine Funktion der Frequenz und der Zeit codiert, wobei die Parameter P die ILD, die ITD/IPD und den maximalen Wert der Kreuzkorrelationsfunktion enthalten.
  • Es sei bemerkt, dass die Parameter ILD in dieser Ausführungsform zu dem Kanaldifferenzparameter c in der Ausführungsform nach 2 durch ILD=k·log(c) in einem Verhältnis steht, wobei k eine Konstante ist, d.h. ILD ist proportional zu dem Logarithmus von c.
  • In einer Ausführungsform werden für jedes Teilband die entsprechende ILD, ITD und die Korrelation ρ berechnet. Die ITD und die Korrelation werden auf einfache Weise dadurch berechnet, dass alle FFT-Bins, die zu anderen Gruppen gehören, auf Null gesetzt werden, dass die resultierenden (bandbegrenzten) FFTen von dem linken und rechten Kanal multipliziert werden und wonach eine inverse FFT-Transformation folgt. Die resultierende Kreuzkorrelationsfunktion wird für eine Spitze innerhalb einer Zwischenkanalverzögerung zwischen –64 und +63 Abtastwerten abgetastet. Die interne Verzögerung entsprechend der Spitze wird als ITD-Wert verwendet und der Wert der Kreuzkorrelationsfunktion bei dieser Spitze wird als interaurale Korrelation dieses Teilbandes benutzt. Zum Schluss wird die ILD einfach dadurch berechnet, dass das Leistungsgewicht des linken und des rechten Signals für jedes Teilband genommen wird.
  • Das Summensignal S kann dadurch erzeugt werden, dass das linke und das rechte Teilband nach einer Phasenkorrektur (zeitliche Ausrichtung) summiert werden. Diese Phasenkorrektur folgt aus der berechneten ITD für dieses Teilband und besteht aus Verzögerung des Linkskanal-Teilbandes um ITD/2 und des Rechtskanal-Teilbandes um –ITD/2. Die Verzögerung erfolgt in der Frequenzdomäne durch eine geeignete Modifikation der Phasenwinkel jedes FFT-Bins. Daraufhin wird das Summensignal dadurch berechnet, dass die phasenmodifizierten Versionen des linken und des rechten Teilbandsignals addiert werden. Zum Schluss wird zum Kompensieren einer nicht korrelierten oder korrelierten Addierung, jedes Teilband des Summensignals mit sqrt(2/(1+ρ)) multipliziert, wobei ρ die Korrelation des entsprechenden Teilbandes ist. Nötigenfalls kann das Summensignal in die Zeitdomäne umgesetzt werden, und zwar durch (1) Einfügung komplexer Konjugationen bei negativen Frequenzen, (2) inverse FFT, (3) Fensterung, und (4) Überlappungsaddierung.
  • Vorzugsweise werden die räumlichen Parameter quantisiert zum reduzieren der erforderlichen Bitrate zwecks ihrer Übertragung.
  • Das Summensignal S und die Parameter P werden einem Decoder 405 zugeführt. Der Decoder 405 umfasst eine Dekorrelatorschaltung 406, welche die Korrelation zwischen dem linken und dem rechten Signal, wie im Zusammenhang mit 2 beschrieben wurde, modifiziert. Der Decoder umfasst weiterhin Verzögerungsschaltungen 407 und 408, die jedes Teilband des linken Signals um –ITD/2 und jedes Teilband des rechten Signals um ITD/2 verzögern, wobei die (quantisierte) ITD diesem Teilband entsprechend gegeben ist. Der Decoder umfasst ferner die Schaltungsanordnung 409, welche die Teilbänder entsprechend der IID für dieses Teilband skaliert und die Ausgangssignale in die Zeitdomäne umsetzt, beispielsweise dadurch, dass die nachfolgenden Schritte durchgeführt werden: (1) das Einfügen komplexer Konjugationen bei negativen Frequenzen, (2) eine inverse FFT, (3) Fensterung, und (4) Überlappungsaddierung.
  • 5 zeigt eine schematische Darstellung eines Systems zum Übertragen von Stereo-Audiosignalen nach einer Ausführungsform der vorliegenden Erfindung. Das System umfasst eine Codieranordnung 501 zum Erzeugen eines codierten Audiosignals und eine Decodieranordnung 505 zum Decodieren eines empfangenen codierten Signals in ein Stereosignal. Die Codieranordnung 501 und die Decodieranordnung 505 können je jede beliebige elektronische Anlage oder ein teil einer derartigen Anlage sein.
  • Hier umfasst der Ausdruck elektronische Anlage Computer, wie ortsfeste oder tragbare PCs, ortsfeste oder tragbare Funkübertragungsanlagen und andere Handhelds oder tragbare Anordnungen, wie Mobiltelefone, Funkrufgeräte, Audiospieler, Multimediaspieler, Zeichengeber, d.h. elektronische Organizer, smart Telefone, PDAs, Handheld Computer oder dergleichen. Es sei bemerkt, dass die Codieranordnung 501 und die Decodieranordnung zu einer einzigen elektronischen Anordnung kombiniert werden können, wobei Audiosignale auf einem vom Computer auslesbaren Medium zur späteren Wiedergabe gespeichert werden.
  • Die Codieranordnung 501 umfasst eine Eingangseinheit 511 zum Empfangen eines Stereosignals, einen Codierer 502 zum Codieren eines Stereosignals mit einem Linkssignalanteil L und einem Rechtssignalanteil R. Der Codierer 502 empfängt die zwei Signalanteile über die Eingangseinheit 511 und erzeugt ein codiertes Signal T. Das Stereosignal kann von einem Satz von Mikrophonen herrühren, beispielsweise über eine weitere elektronische Anordnung, wie einer Mischanlage, usw. Die Signale können weiterhin als ein Ausgangssignal von einem anderen Audiospieler, durch die Luft als Funksignal, oder mit Hilfe eines anderen beliebigen geeigneten Mittels empfangen werden. Ein Beispiel eines derartigen Codierers wurde im Zusammenhang mit 4 beschrieben.
  • Nach einer Ausführungsform ist der Codierer 502 mit einem Sender 503 verbunden zum Übertragen des codierten Signals T über einen Kommunikationskanal 509 zu der Decodieranordnung 505. Der Sender 503 kann eine Schaltungsanordnung aufweisen, die geeignet ist, die Übertragung von Daten zu ermöglichen, beispielsweise über eine verdrahtete oder eine drahtlose Datenverbindung 509. Beispiele eines derartigen Senders umfassen eine Netzwerkschnittstelle, eine Netzwerkkarte, einen Funksender, einen Sender für andere geeignete elektromagnetische Signale, wie eine LED zum Übertragen von IR-Licht, beispielsweise über einen IR-DA-Port, funkbasierte Übertragungen, beispielsweise über einen Bluetooth-Transceiver, oder dergleichen. Weitere Beispiele geeigneter Sender umfassen ein Kabelmodem, ein Telefonmodem, einen ISDN-Adapter, einen DSL-Adapter, einen Satellitenempfänger, einen Ethernetadapter, oder dergleichen. Auf entsprechende Weise kann der Übertragungskanal 509 eine geeignete verdrahtete oder drahtlose Datenverbindung sein, beispielsweise ein paketbasiertes Übertragungsnetzwerk, wie das Internet, oder ein anderes TCP/Informationspaket-Netzwerk, eine Kurzbereich-Übertragungsverbindung, wie eine IR-Verbindung, eine Bluetooth-Verbindung oder eine andere funkbasierte Verbindung.
  • Weitere Beispiele des Kommunikationskanals umfassen Computernetzwerke und drahtlose Telekommunikationsnetzwerke, wie ein CDPD-Netzwerk, ein GSM-Netzwerk, ein CDMA-Netzwerk, ein TDMA-Netzwerk, ein GPRS-Netzwerk, ein Netzwerk dritter Generation, wie ein UMTS-Netzwerk, oder dergleichen.
  • Auf alternative Weise oder zusätzlich kann die Codieranordnung eine oder mehrere andere Schnittstellen 504 zum Übertragen des codierten Stereosignals T zu der Decodieranordnung 505 umfassen. Beispiele derartiger Schnittstellen umfassen ein Disk-Laufwerk zur Speicherung von Daten auf einem vom Computer auslesbaren Medium 510, beispielsweise einem Diskettenlaufwerk, einem CD-ROM-Laufwerk, einem DVD-Laufwerk usw. Andere Beispiele umfassen einen Speicherkartenschlitz, einen Magnetkartenleser/Schreiber, eine Schnittstelle zum Zugreifen auf eine Chipkarte, usw.
  • Auf entsprechende Weise umfasst die Decodieranordnung 505 einen entsprechenden Empfänger 508 zum Empfangen des von dem Sender übertragenen Signals und/oder eine andere Schnittstelle 506 zum Empfangen des codierten Stereosignals, das über die Schnittstelle 504 und das vom Computer auslesbaren Medium 510 übertragen worden ist. Die Decodieranordnung umfasst weiterhin einen Decoder 507, der das empfangene Signal T empfängt und dieses in entsprechende Anteile L' und R' eines decodierten Stereosignals decodiert. Eine bevorzugte Ausführungsform eines derartigen Decoders nach der vorliegenden Erfindung wurde im Zusammenhang mit 4 oben stehend beschrieben. Die Decodieranordnung umfasst weiterhin eine Ausgangseinheit 512 zum Ausliefern der decodierten Signale, die danach einem Audiospieler zur Wiedergabe über einen Satz mit Lautsprechern oder dergleichen zugeführt werden.
  • Es sei bemerkt, dass die oben genannten Anordnungen als programmierbare Allzweck- oder Spezial-Mikroprozessoren, als digitale Signalprozessoren (DSP), als ASIC-Schaltungen, als PLA-Anordnungen, als FPGA-Anordnungen, als elektronische Spezialschaltungen, usw. oder als eine Kombination davon implementiert werden können.
  • Es sei bemerkt, dass die oben genannten Ausführungsformen die vorliegende Erfindung illustrieren statt begrenzen, und dass der Fachmann imstande sein wird, im Rahmen der beiliegenden Patentansprüche viele alternative Ausführungsformen zu entwerfen.
  • So beschränkt sich beispielsweise die vorliegende Erfindung nicht auf Stereosignal, sondern sie kann auch auf andere Mehrkanal-Eingangssignale mit zwei oder mehr Eingangskanälen angewandt werden. Beispiele derartiger Mehrkanal-Signale umfassen Signale, die von DVD oder von einer Super-Audio-CD usw. empfangen werden.
  • In den Patentansprüchen sollen eingeklammerte Bezugszeichen nicht als den Anspruch begrenzend betrachtet werden. Das Wort "umfassen" schließt das Vorhandensein von Elementen oder Schritten anders als diejenigen, die in dem Anspruch genannt wurden, nicht aus. Das Wort "ein" vor einem Element schließt das Vorhandensein einer Anzahl derartiger Elemente nicht aus.
  • Die vorliegende Erfindung kann mit Hilfe von Hardware mit vielen einzelnen Elementen und mit Hilfe eines auf geeignete Art und Weise programmierten Computers implementiert werden. In dem Anordnungsanspruch, in dem verschiedene Mittel nummeriert sind, können viele dieser Mittel von ein und demselben Hardware-Item verkörpert werden. Die Tatsache dass bestimmte Maßnahmen in untereinander verschiedenen Unteransprüchen erwähnt worden sind, bedeutet nicht, dass eine Kombination dieser Maßnahmen nicht mit Vorteil angewandt werden könnte.

Claims (8)

  1. Verfahren zum Synthetisieren eines ersten und eines zweiten Ausgangssignals (L, R) von einem Eingangssignal (X), wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst: – das Filtern des Eingangssignals (X) zum Erzeugen eines gefilterten Signals, – das Erhalten eines Korrelationsparameters (τ), der indikativ ist für eine gewünschte Korrelation zwischen dem ersten und dem zweiten Ausgangssignal (L, R), – das Erhalten eines Pegelparameters (c), der indikativ ist für eine gewünschte Pegeldifferenz zwischen dem ersten und dem zweiten Ausgangssignal (L, R), – das Transformieren des Eingangssignals (X) und des gefilterten Signals durch einen Matrixvorgang zu dem ersten und zweiten Ausgangssignal (L, R), wobei der Matrixvorgang von dem Korrelationsparameter (τ) und dem Pegelparameter (c) abhängig ist.
  2. Verfahren nach Anspruch 1, wobei der Matrixvorgang eine übliche Rotation um einen vorbestimmten Winkel des ersten und zweiten Ausgangssignals in einem Raum umfasst, der von dem Eingangssignal und dem gefilterten Eingangssignal umfasst wird; und wobei der vorbestimmte Winkel von dem Pegelparameter abhängig ist.
  3. Verfahren nach Anspruch 2, wobei der vorbestimmte Winkel derart gewählt wird, dass er einen gesamten Beitrag des Eingangssignals zu dem ersten und dem zweiten Ausgangssignal maximiert.
  4. Verfahren nach Anspruch 1, das weiterhin die Skalierung des ersten und des zweiten Ausgangssignals zu der genannten gewünschten Pegeldifferenz zwischen dem ersten und dem zweiten Ausgangssignal umfasst.
  5. Verfahren nach Anspruch 1, wobei die Filterung des Eingangssignals eine Allpassfilterung des Eingangssignals umfasst.
  6. Verfahren nach Anspruch 5, wobei das Allpassfilter eine frequenzabhängige Verzögerung umfasst.
  7. Anordnung zum Synthetisieren eines ersten und eines zweiten Audio-Ausgangssignals (L, R) von einem Eingangssignal (X), wobei diese Anordnung Folgendes umfasst: – Filtermittel (201) zum Filtern des Eingangssignals (X) zum Erzeugen eines gefilterten Signals, – Mittel (202) zum Erhalten eines Korrelationsparameters (τ), der indikativ ist für eine gewünschte Korrelation zwischen dem ersten und dem zweiten Ausgangssignal (L, R), – Mittel (202) zum Erhalten eines Pegelparameters (c), der indikativ ist für eine gewünschte Pegeldifferenz zwischen dem ersten und dem zweiten Ausgangssignal (L, R), – Mittel (203) zum Transformieren des Eingangssignals (X) und des gefilterten Signals durch einen Matrixvorgang zu dem ersten und zweiten Ausgangssignal (L, R), wobei der Matrixvorgang von dem Korrelationsparameter (τ) und dem Pegelparameter (c) abhängig ist.
  8. Anordnung zum Liefern eines decodierten Audiosignals, wobei diese Anordnung die nachfolgenden Elemente umfasst: – eine Eingangseinheit zum Empfangen eines codierten Audiosignals, – einen Decoder zum Decodieren des codierten Audiosignals, wobei der Decoder eine Anordnung zum Synthetisieren eines ersten und eines zweiten Audiosignals nach Anspruch 7 aufweist; und – eine Ausgangseinheit zum Liefern des decodierten ersten und zweiten Audiosignals.
DE60311794T 2002-04-22 2003-04-22 Signalsynthese Expired - Lifetime DE60311794T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP02076588 2002-04-22
EP02076588 2002-04-22
EP02077863 2002-07-12
EP02077863 2002-07-12
PCT/IB2003/001586 WO2003090206A1 (en) 2002-04-22 2003-04-22 Signal synthesizing

Publications (2)

Publication Number Publication Date
DE60311794D1 DE60311794D1 (en) 2007-03-29
DE60311794T2 true DE60311794T2 (de) 2007-10-31

Family

ID=29252213

Family Applications (2)

Application Number Title Priority Date Filing Date
DE60311794.5A Expired - Lifetime DE60311794C5 (de) 2002-04-22 2003-04-22 Signalsynthese
DE60311794T Expired - Lifetime DE60311794T2 (de) 2002-04-22 2003-04-22 Signalsynthese

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE60311794.5A Expired - Lifetime DE60311794C5 (de) 2002-04-22 2003-04-22 Signalsynthese

Country Status (11)

Country Link
US (2) US7933415B2 (de)
EP (1) EP1500082B1 (de)
JP (1) JP4401173B2 (de)
KR (1) KR101021076B1 (de)
CN (1) CN1312660C (de)
AT (1) ATE354161T1 (de)
AU (1) AU2003216682A1 (de)
BR (2) BR0304541A (de)
DE (2) DE60311794C5 (de)
ES (1) ES2280736T3 (de)
WO (1) WO2003090206A1 (de)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003216682A1 (en) 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Signal synthesizing
SE527713C2 (sv) 2003-12-19 2006-05-23 Ericsson Telefon Ab L M Kodning av polyfoniska signaler med villkorsbegränsade filter
US7809579B2 (en) 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7725324B2 (en) 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
KR101079066B1 (ko) 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
US7646875B2 (en) * 2004-04-05 2010-01-12 Koninklijke Philips Electronics N.V. Stereo coding and decoding methods and apparatus thereof
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7756713B2 (en) * 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
KR100745688B1 (ko) 2004-07-09 2007-08-03 한국전자통신연구원 다채널 오디오 신호 부호화/복호화 방법 및 장치
WO2006008697A1 (en) 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Audio channel conversion
EP1776844B1 (de) 2004-07-23 2014-06-25 Koninklijke Philips N.V. System für temperaturpriorisierte farbsteuerung einer festkörperbeleuchtungseinheit
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
TWI497485B (zh) 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
ATE442644T1 (de) * 2004-08-26 2009-09-15 Panasonic Corp Mehrkanalige signal-dekodierung
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
US8046217B2 (en) * 2004-08-27 2011-10-25 Panasonic Corporation Geometric calculation of absolute phases for parametric stereo decoding
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
EP1792520A1 (de) 2004-09-06 2007-06-06 Koninklijke Philips Electronics N.V. Audiosignal-verbesserung
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
JPWO2006059567A1 (ja) 2004-11-30 2008-06-05 松下電器産業株式会社 ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
EP1691348A1 (de) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametrische kombinierte Kodierung von Audio-Quellen
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP4809370B2 (ja) 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007010771A1 (ja) * 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. 信号処理装置
JP5113051B2 (ja) 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法
RU2414741C2 (ru) * 2005-07-29 2011-03-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ создания многоканального сигнала
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
KR20070038439A (ko) 2005-10-05 2007-04-10 엘지전자 주식회사 신호 처리 방법 및 장치
KR100878828B1 (ko) * 2005-10-05 2009-01-14 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
TWI469133B (zh) 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
US20090018824A1 (en) * 2006-01-31 2009-01-15 Matsushita Electric Industrial Co., Ltd. Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method
KR20080110920A (ko) 2006-02-07 2008-12-19 엘지전자 주식회사 부호화/복호화 장치 및 방법
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
DE602006007685D1 (de) * 2006-05-10 2009-08-20 Harman Becker Automotive Sys Kompensation von Mehrkanalechos durch Dekorrelation
JP5232791B2 (ja) * 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
KR20100024426A (ko) * 2007-06-27 2010-03-05 닛본 덴끼 가부시끼가이샤 신호 분석 장치와, 신호 제어 장치와, 그 시스템, 방법 및 프로그램
GB2453117B (en) 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
KR101444102B1 (ko) 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
US8811621B2 (en) * 2008-05-23 2014-08-19 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
US8583424B2 (en) 2008-06-26 2013-11-12 France Telecom Spatial synthesis of multichannel audio signals
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
WO2010044158A1 (ja) * 2008-10-16 2010-04-22 パイオニア株式会社 測定用信号生成装置、測定用信号生成方法、及び測定用信号生成プログラム、並びに記録媒体
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
KR20110022252A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
US20120265542A1 (en) * 2009-10-16 2012-10-18 France Telecom Optimized parametric stereo decoding
EP2369861B1 (de) * 2010-03-25 2016-07-27 Nxp B.V. Verarbeitung eines Mehrkanal-Audiosignals
CH703771A2 (de) * 2010-09-10 2012-03-15 Stormingswiss Gmbh Vorrichtung und Verfahren zur zeitlichen Auswertung und Optimierung von stereophonen oder pseudostereophonen Signalen.
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
JP2015521421A (ja) * 2012-06-08 2015-07-27 インテル コーポレイション 長く遅延したエコーのためのエコーキャンセレーションアルゴリズム
CN110047496B (zh) 2013-04-05 2023-08-04 杜比国际公司 立体声音频编码器和解码器
US9659569B2 (en) * 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
PL3028474T3 (pl) 2013-07-30 2019-06-28 Dts, Inc. Dekoder matrycowy z panoramowaniem parami o stałej mocy
US10375476B2 (en) 2013-11-13 2019-08-06 Om Audio, Llc Signature tuning filters
EP3444815B1 (de) 2013-11-27 2020-01-08 DTS, Inc. Multiplet-basierte matrixmischung für mehrkanalaudio mit hoher kanalzahl
CN106104684A (zh) 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
CN106067819B (zh) * 2016-06-23 2021-11-26 广州市迪声音响有限公司 一种基于分量式矩阵算法的信号处理***
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
ES2834083T3 (es) * 2016-11-08 2021-06-16 Fraunhofer Ges Forschung Aparato y método para la mezcla descendente o mezcla ascendente de una señal multicanal usando compensación de fase
CN117854515A (zh) 2017-07-28 2024-04-09 弗劳恩霍夫应用研究促进协会 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5172415A (en) * 1990-06-08 1992-12-15 Fosgate James W Surround processor
JPH06178164A (ja) * 1992-12-11 1994-06-24 Matsushita Electric Ind Co Ltd 適応等化処理における安定性および収束速度の適応制御方法
EP0721264B1 (de) * 1994-06-23 2003-11-26 Ntt Mobile Communications Network Inc. Verfahren und anordnung zum empfangen eines code-division-multiplexsignals
US6895093B1 (en) * 1998-03-03 2005-05-17 Texas Instruments Incorporated Acoustic echo-cancellation system
US6658050B1 (en) * 1998-09-11 2003-12-02 Ericsson Inc. Channel estimates in a CDMA system using power control bits
JP2001109497A (ja) 1999-10-04 2001-04-20 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置およびオーディオ信号符号化方法
JP2001188599A (ja) 1999-10-19 2001-07-10 Matsushita Electric Ind Co Ltd オーディオ信号復号装置
JP2001142493A (ja) 1999-11-16 2001-05-25 Matsushita Electric Ind Co Ltd オーディオ信号高能率符号化装置
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
KR100809310B1 (ko) * 2000-07-19 2008-03-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 서라운드 및/또는 오디오 센터 신호를 구동하기 위한 다중-채널 스테레오 컨버터
DE10041512B4 (de) * 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
EP1275271A2 (de) * 2000-12-22 2003-01-15 Koninklijke Philips Electronics N.V. Mehrkanaltonkonverter
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
AU2003216682A1 (en) 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Signal synthesizing
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
WO2007010771A1 (ja) 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. 信号処理装置
RU2414741C2 (ru) 2005-07-29 2011-03-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ создания многоканального сигнала

Also Published As

Publication number Publication date
US20110166866A1 (en) 2011-07-07
JP2005523624A (ja) 2005-08-04
BR0304541A (pt) 2004-07-20
DE60311794C5 (de) 2022-11-10
KR101021076B1 (ko) 2011-03-11
AU2003216682A1 (en) 2003-11-03
JP4401173B2 (ja) 2010-01-20
US7933415B2 (en) 2011-04-26
US20050254446A1 (en) 2005-11-17
EP1500082B1 (de) 2007-02-14
KR20040101552A (ko) 2004-12-02
DE60311794D1 (en) 2007-03-29
US8798275B2 (en) 2014-08-05
WO2003090206A1 (en) 2003-10-30
ES2280736T3 (es) 2007-09-16
CN1647157A (zh) 2005-07-27
CN1312660C (zh) 2007-04-25
EP1500082A1 (de) 2005-01-26
ATE354161T1 (de) 2007-03-15
BRPI0304541B1 (pt) 2017-07-04

Similar Documents

Publication Publication Date Title
DE60311794T2 (de) Signalsynthese
DE60318835T2 (de) Parametrische darstellung von raumklang
DE60317203T2 (de) Audio-kodierung
DE602004004168T2 (de) Kompatible mehrkanal-codierung/-decodierung
DE602006000239T2 (de) Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter
DE602004002390T2 (de) Audiocodierung
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
DE60306512T2 (de) Parametrische beschreibung von mehrkanal-audio
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
DE602004007945T2 (de) Codierung von audiosignalen
EP2206113B1 (de) Vorrichtung und verfahren zum erzeugen eines multikanalsignals mit einer sprachsignalverarbeitung
DE60303209T2 (de) Parametrische audiocodierung
DE602004004818T2 (de) Audiosignalcodierung oder -decodierung
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE602005006424T2 (de) Stereokompatible mehrkanal-audiokodierung
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
DE102013223201B3 (de) Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
DE602004005846T2 (de) Audiosignalgenerierung
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
EP2062254B1 (de) Steganographie in digitalen signal-codierern
DE102004042819A1 (de) Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
EP2891334B1 (de) Erzeugung von mehrkanalton aus stereo-audiosignalen
EP2005421A1 (de) Vorrichtung und verfahren zum erzeugen eines umgebungssignals
DE112019003358T5 (de) Verfahren und vorrichtung zum codieren und/oder decodieren immersiver audiosignale
EP1697931A1 (de) Vorrichtung und verfahren zum ermitteln eines sch tzwerts

Legal Events

Date Code Title Description
8381 Inventor (new situation)

Inventor name: BREEBAART, DIRK, J., NL-5656 AA EINDHOVEN, NL

8364 No opposition during term of opposition