NO340421B1 - Frekvensbasert koding av audiokanaler i parametrisk multikanal kodesystem - Google Patents

Frekvensbasert koding av audiokanaler i parametrisk multikanal kodesystem Download PDF

Info

Publication number
NO340421B1
NO340421B1 NO20064472A NO20064472A NO340421B1 NO 340421 B1 NO340421 B1 NO 340421B1 NO 20064472 A NO20064472 A NO 20064472A NO 20064472 A NO20064472 A NO 20064472A NO 340421 B1 NO340421 B1 NO 340421B1
Authority
NO
Norway
Prior art keywords
audio
subset
parametric
frequency range
frequency
Prior art date
Application number
NO20064472A
Other languages
English (en)
Other versions
NO20064472L (no
Inventor
Jürgen Herre
Christof Faller
Original Assignee
Fraunhofer Ges Forschung
Agere Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung, Agere Systems Inc filed Critical Fraunhofer Ges Forschung
Publication of NO20064472L publication Critical patent/NO20064472L/no
Publication of NO340421B1 publication Critical patent/NO340421B1/no

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

Fagfelt
Den foreliggende oppfinnelse relateres til kodingen av audiosignaler og den følgende syntese av hørselscener fra de kodede audiodata.
Kryssreferanse til relaterte søknader
Denne oppfinnelse krever fordelen av søkedatoen av U.S foreløpig søknad nr. 60/549,972 innlevert 03/04/04 som fullmaktsresymé nr. Faller 14-2. Innholdet av denne applikasjon er relatert til innholdet av U.S. patentsøknad 09/848,877 innlevert 05/04/2001 som fullmaktsresymé nr. Faller 5 ("'877-søknaden"), U.S. patentsøknad serienummer 10/045,458 innlevert 11/07/2001 som fullmaktsresymé nr. Baumgarte 1-6-8 ('"458-søknaden"), og U.S. patentsøknad serienummer 10/155,437 innlevert 05/04/2002 som fullmaktsresymé nr. Baumgarte 2-10 ('"437-søknaden"), og U.S. patentsøknad 10/815,591 innlevert 04/01/2004 som fullmaktsresymé nr. Baumgarte 7-12 ("'591 -søknaden").
Beskrivelse av den relaterte teknikk
Multikanal surround audiosystemer har vært standard på kinoer i årevis. Ettersom teknologien har utviklet seg, har det blitt rimelig å produsere multikanal surround systemer for hjemmebruk. I dag er slike systemer oftest solgt som "hjemme-kinoanlegg". For å tilpasses en ITU-R anbefaling, gir de fleste av disse systemer fem alminnelige audiokanaler og en lavfrekvent subwoofer-kanal ( woofer: basshøyttaler)
(bemerket de lavfrekvente effekter eller LFE-kanal). Slikt multikanalsystem er betegnet som et 5.1 surround system. Det finnes andre surround systemer, slik som 7.1 (syv vanlige kanaler og en LFE-kanal) og 10.2 (ti vanlige kanaler og to LFE-kanaler).
I C. Faller og F. Baumgarte, "Efficient representation of spatial audio coding using perceptual parametrization;" IEEE Workshop on Appl. of Sig. Proe. to Audio and Acoust., Oktober 2001, og C. Faller og F. Baumgarte, "Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression," Preprint 112th Conv. Aud. Eng. Soc, Mai 2002, (samlet, "BCC-fagartiklene") beskrives en parametrisk multikanal audiokodingsteknikk (referert til som BCC-koding).
Figur 1 viser et blokkdiagram av et audio prosesseringssystem 100 som utfører binaural cue koding (BCC) i henhold til BCC-fagatriklene. BCC-system 100 har en koder 102 som mottar C audio inngangskanaler 108, for eksempel, en fra hver av C ulike mikrofoner 106. BCC-koder 102 har en nedmikser 110 som konverterer de C audio inngangskanaler inn i et mono audio sumsignal 112.
I tillegg har BCC-koder 102 en BCC-analysator 114 som genererer BCC cue kodedatastrøm 116 for de C inngangskanaler. BCC cue kodene (også referert til som hørselsceneparametere) omfatter mellomkanal nivåforskjells- (ICLD) og mellomkanal tidsforskjells- (ICTD) data for hver inngangskanal. BCC-analysatoren 114 utfører båndbasert prosessering for å generere ICLD- og ICTD-data for hver av én eller flere ulike frekvenssubbånd (f. eks., ulike kritiske bånd) for audio inngangskanalene.
BCC-koder 102 sender sumsignal 112 og BCC cue kodedatastrøm 116 (f. eks., som enten innenbånds- eller utenbåndsside informasjon med hensyn til sumsignalet) til en BCC-dekoder 104 av BCC-system 100. BCC-dekoder 104 har en sideinformasjonsprosessor 118 som prosesserer datastrøm 116 for å gjenopprette BCC cue koder 120 (f. eks., ICLD- og ICTD-data). BCC-dekoder 104 har også en BCC-syntetiserer 122 som bruker de gjenopprettede BCC cue koder 120 til å syntetisere C audio utgangskanaler 124 fra sumsignal 112 for å gjengis av C høytalere 126, henholdsvis.
Audioprosesseringssystem 100 kan implementeres i sammenhengen av multikanal audiosignaler, slik som 5.1 surround lyd. Spesielt vil nedmikser 110 av BCC-koder 102 konvertere de seks inngangskanaler av vanlig 5.1 surround lyd (dvs., fem vanlige kanaler + én LFE-kanal) inn i sumsignal 112. I tillegg vil BCC-analysator 114 av koder 102 transformere de seks inngangskanaler til frekvensdomenet for å generere de korresponderende BCC cue koder 116. Analogt vil sideinformasjonsprosessor 118 av BCC-dekoder 104 (1) transformere det mottatte sumsignal 112 til frekvensdomenet, (2) anvende de gjenopprettede BCC cue koder 120 til sumsignalet i frekvensdomenet for å generere seks frekvensdomenesignaler, og (3) transformere disse frekvensdomenesignaler inn i seks tidsdomenekanaler av syntetisert 5.1 surround lyd (dvs., fem syntetiserte vanlige kanaler + én syntetisert LFE-kanal) for å gjengis av høyttalere 126.
Ytterlige tidligere kjent teknikk nevnes i patentsøknadsdokument EP1376538 som fremlegger en 3-trinns fremgangsmåte for koding for 2 eller flere innkommende audiosignaler. Den internasjonale publikasjonen WO03090207 fremlegger en fremgangsmåte for å kode flerkanals audiosignaler til et mono-signal pluss informasjon som gjør det mulig å gjenskape flerkanals signalet fra mono-signalet og informasjonen.
O ppsummering av oppfinnelsen
For surroundlyd-applikasjoner omfatter utførelser av den foreliggende oppfinnelse en BCC-basert parametrisk au(hoko(hngsteknikk hvor båndbasert BCC-koding ikke er anvendt på lavfrekvente) subwoofer (LFE) kanal(er) for frekvens subbånd over en grensefrekvens. For eksempel, for 5.1 surroundlyd er BCC-koding anvendt på alle seks kanaler (dvs., fem vanlige kanaler pluss den ene LFE-kanal) for subbånd under grensefrekvensen. Ved å unngå BCC-koding av LFE-kanalen ved "høye" frekvenser, har disse utførelser av den foreliggende oppfinnelse (1) reduserte prosesseringslaster i både koderen og dekoderen (2) mindre BCC-kode bitstrømmer enn korresponderende BCC-baserte systemer som prosesserer alle seks kanaler ved alle frekvenser.
Mer generelt omfatter den foreliggende oppfinnelse anvendelsen med parametriske au(hoko(hngsteloiikker, slik som BCC-koding, men ikke nødvendigvis begrenset til BCC-koding, hvor to eller flere ulike subsett av inngangskanaler er prosessert for to eller flere ulike frekvensområder. Som brukt i denne spesifikasjon, kan frasen "subsett" referere til settet som inneholder alle inngangskanaler så vel som til de passende subsett som omfatter færre enn alle inngangskanalene. Anvendelsen av den foreliggende oppfinnelse for BCC-koding av 5.1 og andre surround lydsignaler er bare ett spesielt eksempel av den foreliggende oppfinnelse.
For øvrig henvises til patentkravene hvor selvstendige krav 1, 8 og 9 fremlegger oppfinnelsens kodingsaspekter som hhv fremgangsmåte, apparat og koder, mens selvstendige krav 13, 19 og 20 fremlegger syntetiseringsaspekter som hhv fremgangsmåte, apparat og dekoder. De tilhørende uselvstendige krav angir fordelaktige utførelsesformer.
Kort beskrivelse av figurene
Andre aspekter, egenskaper, og fordeler av den foreliggende oppfinnelse vil bli gjort klarere fra de følgende detaljerte beskrivelser, de vedlagte krav, og de medfølgende tegninger hvor
Fig. 1 viser et blokkdiagram av et audio prosesseringssystem som utfører binaural cue
koding (BCC); og
Fig. 2 viser et blokkdiagram av et audio prosesseringssystem som utfører BCC-koding i henhold til en utførelse av den foreliggende oppfinnelse.
Detaljert beskrivelse
Fig. 2 viser et blokkdiagram av et audio prosesseringssystem 200 som utfører binaural cue koding (BCC) for 5.1 surround audio, i henhold til en utførelse av den foreliggende oppfinnelse. BCC-system 200 har en BCC-koder 202 som mottar seks audio inngangskanaler 208 (dvs., fem vanlige kanaler og én LFE-kanal). BCC-koderen 202 har en nedmikser 210 som konverterer (f. eks., beregner gjennomsnittet) audio inngangskanalene (omfattende LFE-kanalen) inn i en eller flere, men færre enn seks, kombinerte kanaler 212.
I tillegg har BCC-koderen 202 en BCC-analysator 214 som genererer BCC cue kodedatastrøm 216 for inngangskanalene. Som indikert i Fig. 2, bruker BCC-analysator 214 alle seks 5.1 surroundlyd inngangskanaler (omfattende LFE-kanalen) for frekvens subbånd ved eller under en spesifisert frekvensgrense fc, når BCC cue kodedata genereres. For alle andre (dvs., høyfrekvens) subbånd, bruker BCC-analysator 214 bare de fem vanlige kanaler (og ikke LFE-kanalen) for å generere BCC cue kodedata. Som et resultat bidrar LFE-kanalen med BCC-koder for bare BCC subbånd ved eller under frekvensgrensen heller enn for det fulle BCC-frekvensområde, derved reduseres den samlede størrelse av sideinformasjonsbitstrømmen.
Grensefrekvensen er fortrinnsvis valgt slik at den effektive audiobåndvidde for LFE-kanalen er mindre enn eller lik fc (det vil si, LFE-kanalen har stort sett null energi eller svakt audio-innhold bakenfor grensefrekvensen). Om ikke frekvens subbåndene er rettet inn med grensefrekvensen, faller grensefrekvensen innenfor et spesielt frekvens subbånd. I det tilfelle vil en del av det subbånd overskride grensefrekvensen. For denne spesifikasjons skyld, er et slikt subbånd referert til som å være "ved" grenseverdien. I de foretrukne utførelser er hele det subbånd for LFE-kanalen BCC-kodet, og det neste høyere frekvens subbånd er det første høyfrekvens subbånd som ikke er BCC-kodet.
I en mulig implementasjon omfatter BCC cue koder mellomkanal nivåforskjells- (ICLD), mellomkanal tidsforskjells- (ICTD), og mellomkanal korrelasjons (ICC) data for inngangskanalene. BCC-analysator 214 utfører fortrinnsvis båndbasert prosessering analog til den beskrevet i '877- og '458-søknadene for å generere ICLD-og ICTD-data for ulike frekvens subbånd av audio inngangskanalene. I tillegg genererer BCC-analysatoren 214 fortrinnsvis koherensmålinger som ICC-dataene for de ulike frekvens subbånd. Disse koherensmålinger er beskrevet i nærmere detalj i '437- og '591-søknadene.
BCC-koderen 202 sender den ene eller flere kombinerte kanaler 212 og BCC cue kodedatastrømmer 216 (f. eks., som enten innenbånds- eller utenbåndsside-informasjon med hensyn til de kombinerte kanaler) til en BCC-dekoder 204 av BCC-system 200. BCC-dekoder 204 har en sideinformasjonsprosessor 218 som prosesserer datastrøm 216 for å gjenopprette BCC cue koder 220 (f. eks., ICLD-, ICTD-, og ICC-data). BCC-dekoder 204 har også en BCC-syntetiserer 222 som bruker de gjenopprettede BCC cue koder 220 til å syntetisere seks audio utgangskanaler 224 fra den ene eller flere kombinerte kanaler 212 for å gjengis av seks surroundlydhøyttalere 226, henholdsvis.
Som indikert i Fig. 2, så utfører BCC-syntetiserer 222 sekskanals BCC-syntetisering for subbånd ved eller under grensefrekvensen fc for å generere frekvensinnhold for alle seks 5.1 surround kanaler (dvs., omfattende LFE-kanalen), mens den ufører femkanals BCC-syntetisering for subbånd over grensefrekvensen for å generere frekvensinnhold for bare de fem vanlige kanaler med 5.1 surroundlyd. I særdeleshet spalter BCC-syntetiserer 222 de(n) mottatte kombinerte kanal(er) 212 inn i et antall av frekvenssubbånd (f. eks., kritiske bånd). I disse subbånd er ulik prosessering anvendt for å oppnå de korresponderende subbånd av utgangsaudiokanaler. Resultatet er at, for LFE-kanalen, kun subbånd med frekvenser ved eller under grensefrekvensen oppnådd. Med andre ord, LFE-kanalen har frekvensinnhold kun for subbånd ved eller under grensefrekvensen. De øvre subbånd av LFE-kanalen (dvs. de over grensefrekvensen) kan bli fylt med null signaler (hvis nødvendig).
Avhengig av den spesifikke implementasjon, kan en BCC-koder bli designet for å generere BCC cue koder for alle frekvenser og simpelthen ikke sende disse koder for spesielle subbånd (f. eks., subbånd over grensefrekvensen og/eller subbånd som har stort sett null energi). Likeledes kan den korresponderende BCC-dekoder bli designet til å utføre konvensjonell BCC-syntetisering for alle frekvenser, hvor BCC-dekoderen anvender passende BCC cue kodeverdier for disse subbånd som har ingen eksplisitte sendte koder.
Selv om den foreliggende oppfinnelse har blitt beskrevet i sammenheng med BCC-dekodere som anvender teknikkene til '877- og '458-søknadene for å syntetisere hørselsscener, kan den foreliggende oppfinnelse også bli implementert i sammenheng med BCC-dekodere som anvender andre teknikker for syntetisering av hørselsscener som ikke nødvendigvis er avhengige av teknikkene til '877- og '458-søknadene. For eksempel, BCC-prosesseringen av den foreliggende oppfinnelse kan bli implementert uten ICTD-, ICLD, og/eller ICC-data, med eller uten andre passende cue koder, slik som, for eksempel, de assosiert med topprelaterte overføringsfunksjoner.
I utførelsen av Fig. 2, er 5.1 surroundlyd kodet ved å anvende seks-kanals BCC-analyse på subbånd ved eller under grensefrekvensen og fem-kanals BCC-analyse på subbånd over grensefrekvensen. I en annen utførelse kan den foreliggende oppfinnelse bli anvendt på 7.1 surroundlyd hvor åtte-kanals BCC-analyse er anvendt på subbånd ved eller under en spesifikk grensefreskvens og syv-kanals BCC-analyse (ekskluderende den separate LFE-kanal) er anvendt på subbånd over grensefrekvensen.
Den foreliggende oppfinnelse kan også bli anvendt på surround audio som har flere enn én LFE-kanal. For eksempel, for 10.2 surroundlyd, kan tolv-kanals BCC-analyse bli anvendt på subbånd ved eller under en spesifisert grensefrekvens, mens ti-kanals BCC-analyse (ekskluderende de to LFE-kanaler) kan bli anvendt på subbånd over grensefrekvensen. Alternativt kan det være to ulike grensefrekvenser spesifisert: en første grensefrekvens for en første LFE-kanal av 10.2 surroundlyden og andre grensefrekvens for den andre LFE-kanal. I dette tilfelle og ved å anta at den første grensefrekvens er lavere enn den andre grensefrekvens, kan tolv-kanals BCC-analyse bli anvendt på subbånd ved eller under den første grensefrekvens, elleve-kanals BCC-analyse (ekskluderende den første LFE-kanal) kan bli anvendt på subbånd som er (1) over den første grensefrekvens og (2) ved eller under den andre grensefrekvens, og ti-kanals BCC-analyse (ekskluderende begge LFE-kanaler) kan bli anvendt på subbånd over den andre grensefrekvens.
Likeledes er noen forbruker multikanalsutstyr med hensikt designet med ulike utgangskanaler som har ulike frekvensområder. For eksempel, noen 5.1 surroundlyd-utstyr har to bakkanaler som er designet for å gjengi kun frekvenser under 7kHz. Den foreliggende oppfinnelse kan bli anvendt på slike systemer ved å spesifisere to grensefrekvenser: én for LFE-kanalen og en høyere en for bakkanalene. I dette tilfelle kan seks-kanals BCC-analyse bli anvendt på subbånd ved eller under LFE- grensefrekvensen, fem-kanals BCC-analyse (ekskluderende LFE-kanalen) kan bli anvendt på subbånd som er (1) over LFE-grensefrekvensen og (2) ved eller under bakkanal- grensefrekvensen, og tre-kanals BCC-analyse (ekskluderende LFE-kanalen og de to bakkanaler) kan bli anvendt på subbånd over bakkanal- grensefrekvensen.
Den foreliggende oppfinnelse kan bli generalisert ytterligere til å anvende parametrisk audio koding på to eller flere subsett av inngangskanaler for to eller flere frekvensområder, hvor den parametriske audio kodingen kan være annen enn BCC-koding og de ulike frekvensområder er valgt slik at frekvensinnholdet av de ulike inngangskanaler er reflektert i disse områder. Avhengig den enkelte anvendelse, kan ulike kanaler bli ekskludert fra ulike frekvensområder i hvilke som helst passende kombi-nasjoner. For eksempel, lavfrekvenskanaler kan bli ekskludert fra høyfrekvensområder og/eller høyfrekvenskanaler kan bli ekskludert fra lavfrekvensområder. Det kan til og med være tilfellet at ingen enkelte frekvensområder omfatter alle inngangskanalene.
Som beskrevet tidligere, selv om inngangskanalene 208 kan bli nedmikset til å danne en enkelt kombinert (f. eks., mono) kanal 212, i alternative implementasjoner, kan multiplet av inngangskanalene bli nedmikset til å danne to eller flere "kombinerte" kanaler, avhengig av den enkelte audio prosesseringsapplikasjon. Mer informasjon om slike teknikker kan bli funnet i U.S. patentsøknad nr. 10/762,100, innlevert 01/20/04.
I noen implementasjoner, når nedmiksing genererer flere kombinerte kanaler, kan de kombinerte kanaldata bli sendt ved å bruke konvensjonelle audio-sendings-teknikker. For eksempel, når to kombinerte kanaler er generert, kan konvensjonelle stereo-senchngsteknikker bli i stand til å anvendes. I dette tilfelle kan en BCC-dekoder ekstrahere og bruke BCC-koder for å syntetisere et multikanalsignal (f. eks., 5.1 surroundlyd) fra de to kombinerte kanaler. Enn videre kan disse gi tiibake-kompatibili-tet, hvor de to BCC-kombinerte kanaler er spilt tilbake ved å bruke konvensjonelle (dvs., ikke-BCC-basert) stereodekodere som ignorerer BCC-kodene. Analogt, tilbake-kompatibilitet kan bli oppnådd for en konvensjonell mono-dekoder når en enkelt BCC-kombinert kanal er generert. Legg merke til at, i teorien, når det er multiple "kombinerte" kanaler, så kan en eller flere av de kombinerte kanaler faktisk være basert på individuelle inngangskanaler.
Selv om BCC-system 200 kan ha det samme antall av audio inngangskanaler som audio utgangskanaler, i alternative utførelser, kan antallet av inngangskanaler være enten større enn eller mindre enn antallet utgangskanaler, avhengig av den enkelte anvendelse. For eksempel, inngangsaudioen kan korrespondere med 7.1 surroundlyd og den syntetiserte utgangsaudio kan korrespondere med 5.1 surroundlyd, eller omvendt.
Generelt kan BCC-kodere av den foreliggende oppfinnelse bli implementert i sammenheng med å konvertere M inngangs-audiokanaler inn i N kombinerte audiokanaler og en eller flere korresponderende sett med BCC-koder, hvor M>N>1. Likeledes kan BCC-dekodere av den foreliggende oppfinnelse implementeres i sammenheng med å generere P utgangs-audiokanaler fra de N kombinerte audiokanaler og de korresponderende sett med BCC-koder, hvor P>N, og P kan være den samme som eller ulik M.
Avhengig av den enkelte implementasjon kan de ulike signaler sendt og generert av både BCC-koder 202 og BCC-dekoder 204 i Fig. 2 være en hvilken som helst passende kombinasjon av analoge og/eller digitale signaler, omfattende alle analoge eller alle digitale. Selv om ikke vist i Fig. 2, vil de som har kunnskaper innen det tekniske område sette pris på at den ene eller flere kombinerte kanaler 212 og BCC cue kodedatastrøm 216 kan bli ytterligere kodet av BCC-koder 202 og følgelig dekodet av BCC-dekoder 204, for eksempel, basert på noen passende kompresjonssystemer (f. eks., ADPCM) for ytterlig å redusere størrelsen av de sendte data.
Oppløsningen på sending av data fra BCC-koder 202 til BCC-dekoder 204 vil avhenge av den enkelte bruk av audio prosesseringssystem 200. For eksempel, i noen anvendelser, slik som live-sendinger av musikkonserter, kan sending omfatte sanntids-sending av dataene for øyeblikkelig avspilling på en fjerntliggende lokasjon. I andre anvendelser kan "sending" omfatte lagring av dataene på CDer eller andre passende lagringsmedier for senere (dvs ikke-sanntids) avspilling. Selvsagt kan også andre anvendelser være mulige.
Avhengig av den enkelte implementasjon, kan sendekanalene være via kabler eller være trådløse og kan bruke tilpassede eller standardiserte protokoller (f. eks., IP). Medier som CD, DVD, digitale lydbåndopptakere, og faststoffsminner kan bli brukt til lagring. I tillegg kan sending og/eller lagring, men trenger ikke, omfatte kanalkoding. Likeledes, selv om den foreliggende oppfinnelse har blitt beskrevet i sammenheng med digitale audio-systemer, vil de som har kunnskaper innenfor fagområdet forstå at den foreliggende oppfinnelse også kan bli implementert i sammenheng med analoge audio-systemer, slik som AM-radio, FM-radio, og audio-delen av analog fjernsynssending, hvor hver støtter inkluderingen av en tilleggs innenbånds lav-bitsrate sendekanal.
Den foreliggende oppfinnelse kan bli implementert for mange ulike anvendelser, slik som musikkreproduksjon, kringkasting, og telefoni. For eksempel kan den foreliggende oppfinnelse bli implementert for digital radio-/TV-/internett- (f. eks., Websending) kringkasting slik som Sirius Satellite Radio eller XM. Andre anvendelser omfatter lyd over IP ( voice over IP), PSTN eller andre stemmenettverk, analoge rachokringkasting, og internettradio.
Avhengig av den enkelte anvendelse kan ulike teknikker bli anvendt for å legge settet med BCC-koder inn i en kombinert kanal for å oppnå et BCC-signal av den foreliggende oppfinnelse. Tilgjengeligheten av en hvilken som helst spesifikk teknikk kan avhenge av, i det minste en del, de(t) enkelte sendings-/lagringsmedie(r) brukt for BCC-signalet. For eksempel støtter vanligvis protokollene for digital rachokringkasting innlemming av tilleggsforsterkende bits (f. eks., i toppdelen av datapakker) som er ignorert av konvensjonelle mottakere. Disse tilleggsbits kan bli brukt til å representere settene av hørselssceneparametere for å gi et BCC-signal. Generelt kan den foreliggende oppfinnelse bli implementert ved å bruke en hvilken som helst passende teknikk for å vannmerke audiosignaler hvor data som korresponderer med settet med hørselssceneparametere er satt inn i audiosignalet for å danne et BCC-signal. For eksempel kan disse teknikker omfatte data som gjemmes under sanse-maskerings-kurver eller data som gjemmes i pseudotilfeldig støy. Pseudotilfeldig støy kan bli opp-fattet som komfortstøy. Datainnlemming kan også bli implementert ved å bruke fremgangsmåter lignende bit-stjeling brukt i TDM- (tidsdelt multipleksing) sending for innenbånds signalering. En annen mulig teknikk er mu-lav (u-low) reversering av minst signifikante bit ("LSB-bit-flipping"), hvor i det minste signifikante bits er brukt til å sende data.
Foreliggende oppfinnelse kan implementeres som krets-baserte prosesser, omfattende mulige implementasjoner på en enkelt integrert krets. Som vil være synlig for en med kunnskaper innen fagområdet, kan ulike funksjoner av kretselementer også bli implementert som prosesserende trinn i et softwareprogram. Slik software kan brukes i, for eksempel, en digital signalprosessor, mikrokontroller, eller generell datamaskin.
Foreliggende oppfinnelse kan utføres i form av fremgangsmåter og apparater for å praktisere disse fremgangsmåter. Oppfinnelse kan også utføres i form av programkode utført i virkelige medier, slik som (floppy-) disketter, CD-ROMer, hard-disker, eller et hvilket som helst maskinlesbart lagringsmedium, hvor, når programkoden er lastet inn i og utført av en maskin, slik som en datamaskin, blir maskinen et apparat for å utføre oppfinnelsen. Den foreliggende oppfinnelse kan også utføres i form av programkode, for eksempel, enten lagret i et lagringsmedium, lastet inn i og/eller utført av en maskin, eller sendt over et eller annet sendemedium eller bærer, slik som over elektriske ledninger eller kabler, gjennom optiske fibere, eller via elektro-magnetisk stråling, hvor, når programkoden er lastet inn i og utført av en maskin, slik som en datamaskin, blir maskinen et apparat for å utføre oppfinnelsen. Når implementert i en universalprosessor, kombineres programkode segmentene med prosessoren for å gi en unik anordning som opererer analogt med spesifikke logiske kretser.
Det vil videre bli forstått at ulike endringer i detaljene, materialer, og opp-stillinger av delene som har blitt beskrevet og illustrert for å forklare egenskapen av denne oppfinnelse kan bli gjort av de med kunnskaper innen fagområdet uten å avvike fra omfanget av oppfinnelsen som uttrykt i de følgende krav.

Claims (22)

1 Fremgangsmåte for å kode et multikanal audiosignal som har flere audio inngangskanaler,karakterisert vedat fremgangsmåten innbefatter: • å anvende en parametrisk audiokodingsteknikk for å generere parametriske audiokoder for et første subsett av audio inngangskanalene for et første frekvensområde; og • å anvende den parametriske au(hokodingsteknikk for å generere parametriske audio koder for et andre subsett av audio inngangskanalene for et andre frekvensområde, hvor o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.
2 Fremgangsmåte i henhold til krav 1,karakterisert vedat den parametriske au(hoko(hngsteloiikk er binaural cue kodings (BCC) koding.
3 Fremgangsmåte i henhold til krav 1,karakterisert vedat: • multikanals audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én lavfrekvens (LFE) kanal; • det første subsett omfatter alle audio inngangskanaler; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.
4 Fremgangsmåte i henhold til krav 3,karakterisert vedat den parametriske au(hoko(hngsteloiikk er BCC-koding.
5 Fremgangsmåte i henhold til krav 3,karakterisert vedat grensefrekvensen er i det minste den effektive audio båndvidde for LFE-kanalen.
6 Fremgangsmåte i henhold til krav 3,karakterisert vedat multikanal audiosignalet er et 5.1 surroundlydsignal.
7 Fremgangsmåte i henhold til krav 1,karakterisert vedat den videre innbefatter å sende de parametriske audiokoder for de første og andre subsett av audio inngangskanaler.
8 Apparat for å kode et multikanal audiosignal som har flere audio inngangskanaler,karakterisert vedat apparatet innbefatter: • midler for å anvende en parametrisk au(hoko(hngsteloiikk for å generere parametriske audiokoder for et første subsett av audio inngangskanalene for et første frekvensområde; og • midler for å anvende en parametrisk au(hoko(hngsteloiikk for å generere parametriske audiokoder for et andre subsett av audio inngangskanalene for et andre frekvensområde, hvor o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.
9 Parametrisk audiokoder,karakterisert vedat den innbefatter: • en nedmikser tilpasset for å generere en eller flere kombinerte kanaler fra flere audio inngangskanaler av et multikanal audiosignal; og • en analysator tilpasset til å generere (1) parametriske audiokoder for et første subsett av audio utgangskanalene i et første frekvensområde; og (2) parametriske audiokoder for et andre subsett av audio utgangskanalene i et andre frekvensområde, hvor o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.
10 Parametrisk audiokoder i henhold til krav 9,karakterisert vedat de parametriske audiokoder er BCC-koder.
11 Parametrisk audiokoder i henhold til krav 9,karakterisert vedat: • multikanal audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én LFE-kanal; • det første subsett omfatter alle audio utgangskanalene; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.
12 Parametrisk audiokoder i henhold til krav 9,karakterisert vedat den parametriske audiokoder er tilpasset til å sende de parametriske audiokoder for de første og andre subsett av audio inngangskanaler.
13 Fremgangsmåte for å syntetisere et multikanal audiosignal som har flere audio utgangskanaler,karakterisert vedat fremgangsmåten innbefatter: • å anvende en parametrisk au(hodeko(hngsteknikk for å generere et første subsett av audio utgangskanalene for et første frekvensområde; og • å anvende den parametrisk au(hodeko(hngsteloiikk for å generere et andre subsett av audio utgangskanalene for et andre frekvensområde, hvor o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.
14 Fremgangsmåte i henhold til krav 13,karakterisert ved at den parametriske auchodekodmgsteknikk er BCC-dekoding.
15 Fremgangsmåte i henhold til krav 13,karakterisert vedat: • multikanal audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én LFE-kanal; • det første subsett omfatter alle audio utgangskanaler; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.
16 Fremgangsmåte i henhold til krav 15,karakterisert vedat den parametriske au(hodeko(hngsteloiikk er BCC-dekoding.
17 Fremgangsmåte i henhold til krav 15,karakterisert vedat grensefrekvensen er i det minste den effektive audio båndvidde for LFE-kanalen.
18 Fremgangsmåte i henhold til krav 15,karakterisert vedat multikanal audiosignalet er et 5.1 surroundlydsignal.
19 Apparat for å syntetisere et multikanal audiosignal som har flere audio utgangskanaler,karakterisert vedat apparatet innbefatter: • midler for å anvende en parametrisk au(hodeko(hngsteknikk for å generere et første subsett av audio utgangskanalene for et første frekvensområde; og • midler for å anvende parametrisk au(hodekodingsteknikk for å generere et andre subsett av audio utgangskanalene for et andre frekvensområde, hvor o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.
20 Parametrisk audiodekoder,karakterisert vedat den innbefatter: • en parametrisk kodeprosessor tilpasset for å generere parametriske koder; og • en syntetisator tilpasset for å anvende de parametriske koder på én eller flere kombinerte kanaler for å generere: (1) et første subsett av audio utgangskanaler av et multikanal audiosignal i et første frekvensområde; og (2) et andre subsett av audio utgangskanaler for multikanal audiosignalet i et andre frekvensområde, hvor: o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.
21 Parametrisk audiodekoder i henhold til krav 20,karakterisert vedat de parametriske koder er BCC-koder.
22 Parametrisk audiodekoder i henhold til krav 20,karakterisert vedat: • multikanal audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én LFE-kanal; • det første subsett omfatter alle audio utgangskanalene; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.
NO20064472A 2004-03-04 2006-10-03 Frekvensbasert koding av audiokanaler i parametrisk multikanal kodesystem NO340421B1 (no)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US54997204P 2004-03-04 2004-03-04
US10/827,900 US7805313B2 (en) 2004-03-04 2004-04-20 Frequency-based coding of channels in parametric multi-channel coding systems
PCT/US2005/005605 WO2005094125A1 (en) 2004-03-04 2005-02-23 Frequency-based coding of audio channels in parametric multi-channel coding systems

Publications (2)

Publication Number Publication Date
NO20064472L NO20064472L (no) 2006-10-03
NO340421B1 true NO340421B1 (no) 2017-04-18

Family

ID=34915657

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20064472A NO340421B1 (no) 2004-03-04 2006-10-03 Frekvensbasert koding av audiokanaler i parametrisk multikanal kodesystem

Country Status (16)

Country Link
US (1) US7805313B2 (no)
EP (1) EP1721489B1 (no)
JP (1) JP4418493B2 (no)
KR (1) KR100717598B1 (no)
AT (1) ATE373402T1 (no)
AU (1) AU2005226536B2 (no)
BR (1) BRPI0508146B1 (no)
CA (1) CA2557993C (no)
DE (1) DE602005002463T2 (no)
ES (1) ES2293556T3 (no)
HK (1) HK1101634A1 (no)
MX (1) MXPA06009931A (no)
NO (1) NO340421B1 (no)
PT (1) PT1721489E (no)
TW (1) TWI376967B (no)
WO (1) WO2005094125A1 (no)

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US20070168183A1 (en) * 2004-02-17 2007-07-19 Koninklijke Philips Electronics, N.V. Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
ES2426917T3 (es) * 2004-04-05 2013-10-25 Koninklijke Philips N.V. Aparato codificador, aparato decodificador, sus métodos y sistema de audio asociado
WO2005098821A2 (en) * 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
JPWO2006004048A1 (ja) * 2004-07-06 2008-04-24 松下電器産業株式会社 オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム
WO2006008697A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Audio channel conversion
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100857106B1 (ko) * 2005-09-14 2008-09-08 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
TWI469133B (zh) * 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
JP5147727B2 (ja) * 2006-01-19 2013-02-20 エルジー エレクトロニクス インコーポレイティド 信号デコーディング方法及び装置
CN102693727B (zh) 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
KR20080110920A (ko) * 2006-02-07 2008-12-19 엘지전자 주식회사 부호화/복호화 장치 및 방법
US20090177479A1 (en) * 2006-02-09 2009-07-09 Lg Electronics Inc. Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof
ATE456261T1 (de) 2006-02-21 2010-02-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
TWI447707B (zh) * 2006-02-23 2014-08-01 Lg Electronics Inc 音頻訊號之處理方法及其裝置
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
FR2899423A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme.
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
EP1999745B1 (en) * 2006-03-30 2016-08-31 LG Electronics Inc. Apparatuses and methods for processing an audio signal
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
KR100763920B1 (ko) * 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
JP5451394B2 (ja) 2006-09-29 2014-03-26 韓國電子通信研究院 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
CN101652810B (zh) * 2006-09-29 2012-04-11 Lg电子株式会社 用于处理混合信号的装置及其方法
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
KR100891670B1 (ko) 2006-10-13 2009-04-02 엘지전자 주식회사 신호 처리 방법 및 장치
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
AU2007312597B2 (en) * 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
US20080269929A1 (en) * 2006-11-15 2008-10-30 Lg Electronics Inc. Method and an Apparatus for Decoding an Audio Signal
WO2008069596A1 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2102855A4 (en) * 2006-12-07 2010-07-28 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL
CN101578656A (zh) * 2007-01-05 2009-11-11 Lg电子株式会社 用于处理音频信号的装置和方法
EP2111618A4 (en) * 2007-02-13 2010-04-21 Lg Electronics Inc METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL
US20100121470A1 (en) * 2007-02-13 2010-05-13 Lg Electronics Inc. Method and an apparatus for processing an audio signal
JP5328637B2 (ja) * 2007-02-20 2013-10-30 パナソニック株式会社 マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8184726B2 (en) * 2007-09-10 2012-05-22 Industrial Technology Research Institute Method and apparatus for multi-rate control in a multi-channel communication system
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US20100324708A1 (en) * 2007-11-27 2010-12-23 Nokia Corporation encoder
WO2009075510A1 (en) * 2007-12-09 2009-06-18 Lg Electronics Inc. A method and an apparatus for processing a signal
KR101441898B1 (ko) * 2008-02-01 2014-09-23 삼성전자주식회사 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치
US9111525B1 (en) * 2008-02-14 2015-08-18 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Apparatuses, methods and systems for audio processing and transmission
JP5668923B2 (ja) * 2008-03-14 2015-02-12 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
JP5773124B2 (ja) * 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
US20100223061A1 (en) * 2009-02-27 2010-09-02 Nokia Corporation Method and Apparatus for Audio Coding
WO2011072729A1 (en) * 2009-12-16 2011-06-23 Nokia Corporation Multi-channel audio processing
CN104050969A (zh) 2013-03-14 2014-09-17 杜比实验室特许公司 空间舒适噪声
US10199044B2 (en) 2013-03-20 2019-02-05 Nokia Technologies Oy Audio signal encoder comprising a multi-channel parameter selector
EP3023984A4 (en) * 2013-07-15 2017-03-08 Electronics and Telecommunications Research Institute Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal
CN106104684A (zh) 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
WO2015147434A1 (ko) * 2014-03-25 2015-10-01 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
CN104064194B (zh) * 2014-06-30 2017-04-26 武汉大学 用于提高三维音频空间感距离感的参数编解码方法及***
CN110992964B (zh) * 2014-07-01 2023-10-13 韩国电子通信研究院 处理多信道音频信号的方法和装置
WO2016003206A1 (ko) * 2014-07-01 2016-01-07 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치
KR20180056032A (ko) * 2016-11-18 2018-05-28 삼성전자주식회사 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
BR112020018466A2 (pt) 2018-11-13 2021-05-18 Dolby Laboratories Licensing Corporation representando áudio espacial por meio de um sinal de áudio e de metadados associados
WO2020232631A1 (zh) * 2019-05-21 2020-11-26 深圳市汇顶科技股份有限公司 一种语音分频传输方法、源端、播放端、源端电路和播放端电路

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003090207A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
EP1376538A1 (en) * 2002-06-24 2004-01-02 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals

Family Cites Families (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4236039A (en) * 1976-07-19 1980-11-25 National Research Development Corporation Signal matrixing for directional reproduction of sound
US4815132A (en) * 1985-08-30 1989-03-21 Kabushiki Kaisha Toshiba Stereophonic voice signal transmission system
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
DE3943880B4 (de) * 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
US5703999A (en) * 1992-05-25 1997-12-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5371799A (en) * 1993-06-01 1994-12-06 Qsound Labs, Inc. Stereo headphone sound source localization system
US5463424A (en) * 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
JP3227942B2 (ja) 1993-10-26 2001-11-12 ソニー株式会社 高能率符号化装置
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3277679B2 (ja) * 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
JPH0969783A (ja) 1995-08-31 1997-03-11 Nippon Steel Corp オーディオデータ符号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5771295A (en) * 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
US7012630B2 (en) * 1996-02-08 2006-03-14 Verizon Services Corp. Spatial sound conference system and apparatus
EP0820664B1 (en) * 1996-02-08 2005-11-09 Koninklijke Philips Electronics N.V. N-channel transmission, compatible with 2-channel transmission and 1-channel transmission
US5825776A (en) * 1996-02-27 1998-10-20 Ericsson Inc. Circuitry and method for transmitting voice and data signals upon a wireless communication channel
US5889843A (en) * 1996-03-04 1999-03-30 Interval Research Corporation Methods and systems for creating a spatial auditory environment in an audio conference system
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
KR0175515B1 (ko) * 1996-04-15 1999-04-01 김광호 테이블 조사 방식의 스테레오 구현 장치와 방법
US6987856B1 (en) * 1996-06-19 2006-01-17 Board Of Trustees Of The University Of Illinois Binaural signal processing techniques
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
JP3707153B2 (ja) 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
SG54383A1 (en) * 1996-10-31 1998-11-16 Sgs Thomson Microelectronics A Method and apparatus for decoding multi-channel audio data
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6111958A (en) * 1997-03-21 2000-08-29 Euphonics, Incorporated Audio spatial enhancement apparatus and methods
US6236731B1 (en) * 1997-04-16 2001-05-22 Dspfactory Ltd. Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids
US5946352A (en) * 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US5860060A (en) * 1997-05-02 1999-01-12 Texas Instruments Incorporated Method for left/right channel self-alignment
US6108584A (en) * 1997-07-09 2000-08-22 Sony Corporation Multichannel digital audio decoding method and apparatus
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6021389A (en) * 1998-03-20 2000-02-01 Scientific Learning Corp. Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds
US6016473A (en) 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
TW444511B (en) 1998-04-14 2001-07-01 Inst Information Industry Multi-channel sound effect simulation equipment and method
JP3657120B2 (ja) * 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP2000152399A (ja) * 1998-11-12 2000-05-30 Yamaha Corp 音場効果制御装置
US6408327B1 (en) * 1998-12-22 2002-06-18 Nortel Networks Limited Synthetic stereo conferencing over LAN/WAN
US6282631B1 (en) * 1998-12-23 2001-08-28 National Semiconductor Corporation Programmable RISC-DSP architecture
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4438127B2 (ja) 1999-06-18 2010-03-24 ソニー株式会社 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
US6823018B1 (en) * 1999-07-28 2004-11-23 At&T Corp. Multiple description coding communication system
US6434191B1 (en) * 1999-09-30 2002-08-13 Telcordia Technologies, Inc. Adaptive layered coding for voice over wireless IP applications
US6614936B1 (en) * 1999-12-03 2003-09-02 Microsoft Corporation System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding
US6498852B2 (en) * 1999-12-07 2002-12-24 Anthony Grimani Automatic LFE audio signal derivation system
US6845163B1 (en) * 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
JP4842483B2 (ja) * 1999-12-24 2011-12-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャネルオーディオ信号処理装置及び方法
US6782366B1 (en) * 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
US6850496B1 (en) * 2000-06-09 2005-02-01 Cisco Technology, Inc. Virtual conference room for voice conferencing
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
US7236838B2 (en) * 2000-08-29 2007-06-26 Matsushita Electric Industrial Co., Ltd. Signal processing apparatus, signal processing method, program and recording medium
JP3426207B2 (ja) 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
TW510144B (en) 2000-12-27 2002-11-11 C Media Electronics Inc Method and structure to output four-channel analog signal using two channel audio hardware
US6885992B2 (en) * 2001-01-26 2005-04-26 Cirrus Logic, Inc. Efficient PCM buffer
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US6934676B2 (en) * 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
US7668317B2 (en) * 2001-05-30 2010-02-23 Sony Corporation Audio post processing in DVD, DTV and other audio visual products
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP4347698B2 (ja) 2002-02-18 2009-10-21 アイピージー エレクトロニクス 503 リミテッド パラメトリックオーディオ符号化
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
WO2003094369A2 (en) 2002-05-03 2003-11-13 Harman International Industries, Incorporated Multi-channel downmixing device
US6940540B2 (en) * 2002-06-27 2005-09-06 Microsoft Corporation Speaker detection and tracking using audiovisual data
DE60317203T2 (de) * 2002-07-12 2008-08-07 Koninklijke Philips Electronics N.V. Audio-kodierung
CN100370517C (zh) * 2002-07-16 2008-02-20 皇家飞利浦电子股份有限公司 一种对编码信号进行解码的方法
CN1669358A (zh) 2002-07-16 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
DE60310449T2 (de) 2002-11-28 2007-10-31 Koninklijke Philips Electronics N.V. Audiosignalkodierung
DE602004002390T2 (de) * 2003-02-11 2007-09-06 Koninklijke Philips Electronics N.V. Audiocodierung
FI118247B (fi) 2003-02-26 2007-08-31 Fraunhofer Ges Forschung Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa
US20060171542A1 (en) 2003-03-24 2006-08-03 Den Brinker Albertus C Coding of main and side signal representing a multichannel signal
US20050069143A1 (en) * 2003-09-30 2005-03-31 Budnikov Dmitry N. Filtering for spatial audio rendering
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7761289B2 (en) * 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003090207A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
EP1376538A1 (en) * 2002-06-24 2004-01-02 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
C. Faller et al., "Binaural Cue Coding applied to stereo and multi-channel audio compression," in Preprint 112th Conv. Aud. Eng. Soc., May 2002., Dated: 01.01.0001 *

Also Published As

Publication number Publication date
EP1721489A1 (en) 2006-11-15
PT1721489E (pt) 2007-12-21
AU2005226536A1 (en) 2005-10-06
ES2293556T3 (es) 2008-03-16
DE602005002463D1 (de) 2007-10-25
JP4418493B2 (ja) 2010-02-17
CA2557993A1 (en) 2005-10-06
NO20064472L (no) 2006-10-03
DE602005002463T2 (de) 2008-06-12
WO2005094125A1 (en) 2005-10-06
US7805313B2 (en) 2010-09-28
JP2007526520A (ja) 2007-09-13
MXPA06009931A (es) 2007-03-21
US20050195981A1 (en) 2005-09-08
BRPI0508146B1 (pt) 2019-04-16
ATE373402T1 (de) 2007-09-15
BRPI0508146A (pt) 2007-07-31
TW200603653A (en) 2006-01-16
AU2005226536B2 (en) 2008-09-04
HK1101634A1 (en) 2007-10-18
KR100717598B1 (ko) 2007-05-15
CA2557993C (en) 2012-11-27
EP1721489B1 (en) 2007-09-12
KR20060131866A (ko) 2006-12-20
TWI376967B (en) 2012-11-11

Similar Documents

Publication Publication Date Title
NO340421B1 (no) Frekvensbasert koding av audiokanaler i parametrisk multikanal kodesystem
KR101158698B1 (ko) 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더
JP4939933B2 (ja) オーディオ信号符号化装置及びオーディオ信号復号化装置
KR101283783B1 (ko) 고품질 다채널 오디오 부호화 및 복호화 장치
RU2323551C1 (ru) Частотно-ориентированное кодирование каналов в параметрических системах многоканального кодирования
US20200013426A1 (en) Synchronizing enhanced audio transports with backward compatible audio transports
JP2008535014A (ja) スケーラブルマルチチャネル音声符号化方法
US20140310010A1 (en) Apparatus for encoding and apparatus for decoding supporting scalable multichannel audio signal, and method for apparatuses performing same
US20050004791A1 (en) Perceptual noise substitution
KR20140093578A (ko) 사운드 바를 위한 오디오 신호 처리 장치 및 방법
US11081116B2 (en) Embedding enhanced audio transports in backward compatible audio bitstreams
TWI501220B (zh) 嵌入與擷取輔助資料
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
KR100891666B1 (ko) 믹스 신호의 처리 방법 및 장치
KR20130093798A (ko) 다채널 신호 부호화 및 복호화 장치 및 방법
US11062713B2 (en) Spatially formatted enhanced audio data for backward compatible audio bitstreams
WO2006011367A1 (ja) オーディオ信号符号化装置および復号化装置