NO340421B1

NO340421B1 - Frekvensbasert koding av audiokanaler i parametrisk multikanal kodesystem

Info

Publication number: NO340421B1
Application number: NO20064472A
Authority: NO
Inventors: Jürgen Herre; Christof Faller
Original assignee: Fraunhofer Ges Forschung; Agere Systems Inc
Priority date: 2004-03-04
Filing date: 2006-10-03
Publication date: 2017-04-18
Also published as: EP1721489A1; PT1721489E; AU2005226536A1; ES2293556T3; DE602005002463D1; JP4418493B2; CA2557993A1; NO20064472L; DE602005002463T2; WO2005094125A1; US7805313B2; JP2007526520A; MXPA06009931A; US20050195981A1; BRPI0508146B1; ATE373402T1; BRPI0508146A; TW200603653A; AU2005226536B2; HK1101634A1

Description

Fagfelt

Den foreliggende oppfinnelse relateres til kodingen av audiosignaler og den følgende syntese av hørselscener fra de kodede audiodata.

Kryssreferanse til relaterte søknader

Denne oppfinnelse krever fordelen av søkedatoen av U.S foreløpig søknad nr. 60/549,972 innlevert 03/04/04 som fullmaktsresymé nr. Faller 14-2. Innholdet av denne applikasjon er relatert til innholdet av U.S. patentsøknad 09/848,877 innlevert 05/04/2001 som fullmaktsresymé nr. Faller 5 ("'877-søknaden"), U.S. patentsøknad serienummer 10/045,458 innlevert 11/07/2001 som fullmaktsresymé nr. Baumgarte 1-6-8 ('"458-søknaden"), og U.S. patentsøknad serienummer 10/155,437 innlevert 05/04/2002 som fullmaktsresymé nr. Baumgarte 2-10 ('"437-søknaden"), og U.S. patentsøknad 10/815,591 innlevert 04/01/2004 som fullmaktsresymé nr. Baumgarte 7-12 ("'591 -søknaden").

Beskrivelse av den relaterte teknikk

Multikanal surround audiosystemer har vært standard på kinoer i årevis. Ettersom teknologien har utviklet seg, har det blitt rimelig å produsere multikanal surround systemer for hjemmebruk. I dag er slike systemer oftest solgt som "hjemme-kinoanlegg". For å tilpasses en ITU-R anbefaling, gir de fleste av disse systemer fem alminnelige audiokanaler og en lavfrekvent subwoofer-kanal ( woofer: basshøyttaler)

(bemerket de lavfrekvente effekter eller LFE-kanal). Slikt multikanalsystem er betegnet som et 5.1 surround system. Det finnes andre surround systemer, slik som 7.1 (syv vanlige kanaler og en LFE-kanal) og 10.2 (ti vanlige kanaler og to LFE-kanaler).

I C. Faller og F. Baumgarte, "Efficient representation of spatial audio coding using perceptual parametrization;" IEEE Workshop on Appl. of Sig. Proe. to Audio and Acoust., Oktober 2001, og C. Faller og F. Baumgarte, "Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression," Preprint 112th Conv. Aud. Eng. Soc, Mai 2002, (samlet, "BCC-fagartiklene") beskrives en parametrisk multikanal audiokodingsteknikk (referert til som BCC-koding).

Figur 1 viser et blokkdiagram av et audio prosesseringssystem 100 som utfører binaural cue koding (BCC) i henhold til BCC-fagatriklene. BCC-system 100 har en koder 102 som mottar C audio inngangskanaler 108, for eksempel, en fra hver av C ulike mikrofoner 106. BCC-koder 102 har en nedmikser 110 som konverterer de C audio inngangskanaler inn i et mono audio sumsignal 112.

I tillegg har BCC-koder 102 en BCC-analysator 114 som genererer BCC cue kodedatastrøm 116 for de C inngangskanaler. BCC cue kodene (også referert til som hørselsceneparametere) omfatter mellomkanal nivåforskjells- (ICLD) og mellomkanal tidsforskjells- (ICTD) data for hver inngangskanal. BCC-analysatoren 114 utfører båndbasert prosessering for å generere ICLD- og ICTD-data for hver av én eller flere ulike frekvenssubbånd (f. eks., ulike kritiske bånd) for audio inngangskanalene.

BCC-koder 102 sender sumsignal 112 og BCC cue kodedatastrøm 116 (f. eks., som enten innenbånds- eller utenbåndsside informasjon med hensyn til sumsignalet) til en BCC-dekoder 104 av BCC-system 100. BCC-dekoder 104 har en sideinformasjonsprosessor 118 som prosesserer datastrøm 116 for å gjenopprette BCC cue koder 120 (f. eks., ICLD- og ICTD-data). BCC-dekoder 104 har også en BCC-syntetiserer 122 som bruker de gjenopprettede BCC cue koder 120 til å syntetisere C audio utgangskanaler 124 fra sumsignal 112 for å gjengis av C høytalere 126, henholdsvis.

Audioprosesseringssystem 100 kan implementeres i sammenhengen av multikanal audiosignaler, slik som 5.1 surround lyd. Spesielt vil nedmikser 110 av BCC-koder 102 konvertere de seks inngangskanaler av vanlig 5.1 surround lyd (dvs., fem vanlige kanaler + én LFE-kanal) inn i sumsignal 112. I tillegg vil BCC-analysator 114 av koder 102 transformere de seks inngangskanaler til frekvensdomenet for å generere de korresponderende BCC cue koder 116. Analogt vil sideinformasjonsprosessor 118 av BCC-dekoder 104 (1) transformere det mottatte sumsignal 112 til frekvensdomenet, (2) anvende de gjenopprettede BCC cue koder 120 til sumsignalet i frekvensdomenet for å generere seks frekvensdomenesignaler, og (3) transformere disse frekvensdomenesignaler inn i seks tidsdomenekanaler av syntetisert 5.1 surround lyd (dvs., fem syntetiserte vanlige kanaler + én syntetisert LFE-kanal) for å gjengis av høyttalere 126.

Ytterlige tidligere kjent teknikk nevnes i patentsøknadsdokument EP1376538 som fremlegger en 3-trinns fremgangsmåte for koding for 2 eller flere innkommende audiosignaler. Den internasjonale publikasjonen WO03090207 fremlegger en fremgangsmåte for å kode flerkanals audiosignaler til et mono-signal pluss informasjon som gjør det mulig å gjenskape flerkanals signalet fra mono-signalet og informasjonen.

O ppsummering av oppfinnelsen

For surroundlyd-applikasjoner omfatter utførelser av den foreliggende oppfinnelse en BCC-basert parametrisk au(hoko(hngsteknikk hvor båndbasert BCC-koding ikke er anvendt på lavfrekvente) subwoofer (LFE) kanal(er) for frekvens subbånd over en grensefrekvens. For eksempel, for 5.1 surroundlyd er BCC-koding anvendt på alle seks kanaler (dvs., fem vanlige kanaler pluss den ene LFE-kanal) for subbånd under grensefrekvensen. Ved å unngå BCC-koding av LFE-kanalen ved "høye" frekvenser, har disse utførelser av den foreliggende oppfinnelse (1) reduserte prosesseringslaster i både koderen og dekoderen (2) mindre BCC-kode bitstrømmer enn korresponderende BCC-baserte systemer som prosesserer alle seks kanaler ved alle frekvenser.

Mer generelt omfatter den foreliggende oppfinnelse anvendelsen med parametriske au(hoko(hngsteloiikker, slik som BCC-koding, men ikke nødvendigvis begrenset til BCC-koding, hvor to eller flere ulike subsett av inngangskanaler er prosessert for to eller flere ulike frekvensområder. Som brukt i denne spesifikasjon, kan frasen "subsett" referere til settet som inneholder alle inngangskanaler så vel som til de passende subsett som omfatter færre enn alle inngangskanalene. Anvendelsen av den foreliggende oppfinnelse for BCC-koding av 5.1 og andre surround lydsignaler er bare ett spesielt eksempel av den foreliggende oppfinnelse.

For øvrig henvises til patentkravene hvor selvstendige krav 1, 8 og 9 fremlegger oppfinnelsens kodingsaspekter som hhv fremgangsmåte, apparat og koder, mens selvstendige krav 13, 19 og 20 fremlegger syntetiseringsaspekter som hhv fremgangsmåte, apparat og dekoder. De tilhørende uselvstendige krav angir fordelaktige utførelsesformer.

Kort beskrivelse av figurene

Andre aspekter, egenskaper, og fordeler av den foreliggende oppfinnelse vil bli gjort klarere fra de følgende detaljerte beskrivelser, de vedlagte krav, og de medfølgende tegninger hvor

Fig. 1 viser et blokkdiagram av et audio prosesseringssystem som utfører binaural cue

koding (BCC); og

Fig. 2 viser et blokkdiagram av et audio prosesseringssystem som utfører BCC-koding i henhold til en utførelse av den foreliggende oppfinnelse.

Detaljert beskrivelse

Fig. 2 viser et blokkdiagram av et audio prosesseringssystem 200 som utfører binaural cue koding (BCC) for 5.1 surround audio, i henhold til en utførelse av den foreliggende oppfinnelse. BCC-system 200 har en BCC-koder 202 som mottar seks audio inngangskanaler 208 (dvs., fem vanlige kanaler og én LFE-kanal). BCC-koderen 202 har en nedmikser 210 som konverterer (f. eks., beregner gjennomsnittet) audio inngangskanalene (omfattende LFE-kanalen) inn i en eller flere, men færre enn seks, kombinerte kanaler 212.

I tillegg har BCC-koderen 202 en BCC-analysator 214 som genererer BCC cue kodedatastrøm 216 for inngangskanalene. Som indikert i Fig. 2, bruker BCC-analysator 214 alle seks 5.1 surroundlyd inngangskanaler (omfattende LFE-kanalen) for frekvens subbånd ved eller under en spesifisert frekvensgrense fc, når BCC cue kodedata genereres. For alle andre (dvs., høyfrekvens) subbånd, bruker BCC-analysator 214 bare de fem vanlige kanaler (og ikke LFE-kanalen) for å generere BCC cue kodedata. Som et resultat bidrar LFE-kanalen med BCC-koder for bare BCC subbånd ved eller under frekvensgrensen heller enn for det fulle BCC-frekvensområde, derved reduseres den samlede størrelse av sideinformasjonsbitstrømmen.

Grensefrekvensen er fortrinnsvis valgt slik at den effektive audiobåndvidde for LFE-kanalen er mindre enn eller lik fc (det vil si, LFE-kanalen har stort sett null energi eller svakt audio-innhold bakenfor grensefrekvensen). Om ikke frekvens subbåndene er rettet inn med grensefrekvensen, faller grensefrekvensen innenfor et spesielt frekvens subbånd. I det tilfelle vil en del av det subbånd overskride grensefrekvensen. For denne spesifikasjons skyld, er et slikt subbånd referert til som å være "ved" grenseverdien. I de foretrukne utførelser er hele det subbånd for LFE-kanalen BCC-kodet, og det neste høyere frekvens subbånd er det første høyfrekvens subbånd som ikke er BCC-kodet.

I en mulig implementasjon omfatter BCC cue koder mellomkanal nivåforskjells- (ICLD), mellomkanal tidsforskjells- (ICTD), og mellomkanal korrelasjons (ICC) data for inngangskanalene. BCC-analysator 214 utfører fortrinnsvis båndbasert prosessering analog til den beskrevet i '877- og '458-søknadene for å generere ICLD-og ICTD-data for ulike frekvens subbånd av audio inngangskanalene. I tillegg genererer BCC-analysatoren 214 fortrinnsvis koherensmålinger som ICC-dataene for de ulike frekvens subbånd. Disse koherensmålinger er beskrevet i nærmere detalj i '437- og '591-søknadene.

BCC-koderen 202 sender den ene eller flere kombinerte kanaler 212 og BCC cue kodedatastrømmer 216 (f. eks., som enten innenbånds- eller utenbåndsside-informasjon med hensyn til de kombinerte kanaler) til en BCC-dekoder 204 av BCC-system 200. BCC-dekoder 204 har en sideinformasjonsprosessor 218 som prosesserer datastrøm 216 for å gjenopprette BCC cue koder 220 (f. eks., ICLD-, ICTD-, og ICC-data). BCC-dekoder 204 har også en BCC-syntetiserer 222 som bruker de gjenopprettede BCC cue koder 220 til å syntetisere seks audio utgangskanaler 224 fra den ene eller flere kombinerte kanaler 212 for å gjengis av seks surroundlydhøyttalere 226, henholdsvis.

Som indikert i Fig. 2, så utfører BCC-syntetiserer 222 sekskanals BCC-syntetisering for subbånd ved eller under grensefrekvensen fc for å generere frekvensinnhold for alle seks 5.1 surround kanaler (dvs., omfattende LFE-kanalen), mens den ufører femkanals BCC-syntetisering for subbånd over grensefrekvensen for å generere frekvensinnhold for bare de fem vanlige kanaler med 5.1 surroundlyd. I særdeleshet spalter BCC-syntetiserer 222 de(n) mottatte kombinerte kanal(er) 212 inn i et antall av frekvenssubbånd (f. eks., kritiske bånd). I disse subbånd er ulik prosessering anvendt for å oppnå de korresponderende subbånd av utgangsaudiokanaler. Resultatet er at, for LFE-kanalen, kun subbånd med frekvenser ved eller under grensefrekvensen oppnådd. Med andre ord, LFE-kanalen har frekvensinnhold kun for subbånd ved eller under grensefrekvensen. De øvre subbånd av LFE-kanalen (dvs. de over grensefrekvensen) kan bli fylt med null signaler (hvis nødvendig).

Avhengig av den spesifikke implementasjon, kan en BCC-koder bli designet for å generere BCC cue koder for alle frekvenser og simpelthen ikke sende disse koder for spesielle subbånd (f. eks., subbånd over grensefrekvensen og/eller subbånd som har stort sett null energi). Likeledes kan den korresponderende BCC-dekoder bli designet til å utføre konvensjonell BCC-syntetisering for alle frekvenser, hvor BCC-dekoderen anvender passende BCC cue kodeverdier for disse subbånd som har ingen eksplisitte sendte koder.

Selv om den foreliggende oppfinnelse har blitt beskrevet i sammenheng med BCC-dekodere som anvender teknikkene til '877- og '458-søknadene for å syntetisere hørselsscener, kan den foreliggende oppfinnelse også bli implementert i sammenheng med BCC-dekodere som anvender andre teknikker for syntetisering av hørselsscener som ikke nødvendigvis er avhengige av teknikkene til '877- og '458-søknadene. For eksempel, BCC-prosesseringen av den foreliggende oppfinnelse kan bli implementert uten ICTD-, ICLD, og/eller ICC-data, med eller uten andre passende cue koder, slik som, for eksempel, de assosiert med topprelaterte overføringsfunksjoner.

I utførelsen av Fig. 2, er 5.1 surroundlyd kodet ved å anvende seks-kanals BCC-analyse på subbånd ved eller under grensefrekvensen og fem-kanals BCC-analyse på subbånd over grensefrekvensen. I en annen utførelse kan den foreliggende oppfinnelse bli anvendt på 7.1 surroundlyd hvor åtte-kanals BCC-analyse er anvendt på subbånd ved eller under en spesifikk grensefreskvens og syv-kanals BCC-analyse (ekskluderende den separate LFE-kanal) er anvendt på subbånd over grensefrekvensen.

Den foreliggende oppfinnelse kan også bli anvendt på surround audio som har flere enn én LFE-kanal. For eksempel, for 10.2 surroundlyd, kan tolv-kanals BCC-analyse bli anvendt på subbånd ved eller under en spesifisert grensefrekvens, mens ti-kanals BCC-analyse (ekskluderende de to LFE-kanaler) kan bli anvendt på subbånd over grensefrekvensen. Alternativt kan det være to ulike grensefrekvenser spesifisert: en første grensefrekvens for en første LFE-kanal av 10.2 surroundlyden og andre grensefrekvens for den andre LFE-kanal. I dette tilfelle og ved å anta at den første grensefrekvens er lavere enn den andre grensefrekvens, kan tolv-kanals BCC-analyse bli anvendt på subbånd ved eller under den første grensefrekvens, elleve-kanals BCC-analyse (ekskluderende den første LFE-kanal) kan bli anvendt på subbånd som er (1) over den første grensefrekvens og (2) ved eller under den andre grensefrekvens, og ti-kanals BCC-analyse (ekskluderende begge LFE-kanaler) kan bli anvendt på subbånd over den andre grensefrekvens.

Likeledes er noen forbruker multikanalsutstyr med hensikt designet med ulike utgangskanaler som har ulike frekvensområder. For eksempel, noen 5.1 surroundlyd-utstyr har to bakkanaler som er designet for å gjengi kun frekvenser under 7kHz. Den foreliggende oppfinnelse kan bli anvendt på slike systemer ved å spesifisere to grensefrekvenser: én for LFE-kanalen og en høyere en for bakkanalene. I dette tilfelle kan seks-kanals BCC-analyse bli anvendt på subbånd ved eller under LFE- grensefrekvensen, fem-kanals BCC-analyse (ekskluderende LFE-kanalen) kan bli anvendt på subbånd som er (1) over LFE-grensefrekvensen og (2) ved eller under bakkanal- grensefrekvensen, og tre-kanals BCC-analyse (ekskluderende LFE-kanalen og de to bakkanaler) kan bli anvendt på subbånd over bakkanal- grensefrekvensen.

Den foreliggende oppfinnelse kan bli generalisert ytterligere til å anvende parametrisk audio koding på to eller flere subsett av inngangskanaler for to eller flere frekvensområder, hvor den parametriske audio kodingen kan være annen enn BCC-koding og de ulike frekvensområder er valgt slik at frekvensinnholdet av de ulike inngangskanaler er reflektert i disse områder. Avhengig den enkelte anvendelse, kan ulike kanaler bli ekskludert fra ulike frekvensområder i hvilke som helst passende kombi-nasjoner. For eksempel, lavfrekvenskanaler kan bli ekskludert fra høyfrekvensområder og/eller høyfrekvenskanaler kan bli ekskludert fra lavfrekvensområder. Det kan til og med være tilfellet at ingen enkelte frekvensområder omfatter alle inngangskanalene.

Som beskrevet tidligere, selv om inngangskanalene 208 kan bli nedmikset til å danne en enkelt kombinert (f. eks., mono) kanal 212, i alternative implementasjoner, kan multiplet av inngangskanalene bli nedmikset til å danne to eller flere "kombinerte" kanaler, avhengig av den enkelte audio prosesseringsapplikasjon. Mer informasjon om slike teknikker kan bli funnet i U.S. patentsøknad nr. 10/762,100, innlevert 01/20/04.

I noen implementasjoner, når nedmiksing genererer flere kombinerte kanaler, kan de kombinerte kanaldata bli sendt ved å bruke konvensjonelle audio-sendings-teknikker. For eksempel, når to kombinerte kanaler er generert, kan konvensjonelle stereo-senchngsteknikker bli i stand til å anvendes. I dette tilfelle kan en BCC-dekoder ekstrahere og bruke BCC-koder for å syntetisere et multikanalsignal (f. eks., 5.1 surroundlyd) fra de to kombinerte kanaler. Enn videre kan disse gi tiibake-kompatibili-tet, hvor de to BCC-kombinerte kanaler er spilt tilbake ved å bruke konvensjonelle (dvs., ikke-BCC-basert) stereodekodere som ignorerer BCC-kodene. Analogt, tilbake-kompatibilitet kan bli oppnådd for en konvensjonell mono-dekoder når en enkelt BCC-kombinert kanal er generert. Legg merke til at, i teorien, når det er multiple "kombinerte" kanaler, så kan en eller flere av de kombinerte kanaler faktisk være basert på individuelle inngangskanaler.

Selv om BCC-system 200 kan ha det samme antall av audio inngangskanaler som audio utgangskanaler, i alternative utførelser, kan antallet av inngangskanaler være enten større enn eller mindre enn antallet utgangskanaler, avhengig av den enkelte anvendelse. For eksempel, inngangsaudioen kan korrespondere med 7.1 surroundlyd og den syntetiserte utgangsaudio kan korrespondere med 5.1 surroundlyd, eller omvendt.

Generelt kan BCC-kodere av den foreliggende oppfinnelse bli implementert i sammenheng med å konvertere M inngangs-audiokanaler inn i N kombinerte audiokanaler og en eller flere korresponderende sett med BCC-koder, hvor M>N>1. Likeledes kan BCC-dekodere av den foreliggende oppfinnelse implementeres i sammenheng med å generere P utgangs-audiokanaler fra de N kombinerte audiokanaler og de korresponderende sett med BCC-koder, hvor P>N, og P kan være den samme som eller ulik M.

Avhengig av den enkelte implementasjon kan de ulike signaler sendt og generert av både BCC-koder 202 og BCC-dekoder 204 i Fig. 2 være en hvilken som helst passende kombinasjon av analoge og/eller digitale signaler, omfattende alle analoge eller alle digitale. Selv om ikke vist i Fig. 2, vil de som har kunnskaper innen det tekniske område sette pris på at den ene eller flere kombinerte kanaler 212 og BCC cue kodedatastrøm 216 kan bli ytterligere kodet av BCC-koder 202 og følgelig dekodet av BCC-dekoder 204, for eksempel, basert på noen passende kompresjonssystemer (f. eks., ADPCM) for ytterlig å redusere størrelsen av de sendte data.

Oppløsningen på sending av data fra BCC-koder 202 til BCC-dekoder 204 vil avhenge av den enkelte bruk av audio prosesseringssystem 200. For eksempel, i noen anvendelser, slik som live-sendinger av musikkonserter, kan sending omfatte sanntids-sending av dataene for øyeblikkelig avspilling på en fjerntliggende lokasjon. I andre anvendelser kan "sending" omfatte lagring av dataene på CDer eller andre passende lagringsmedier for senere (dvs ikke-sanntids) avspilling. Selvsagt kan også andre anvendelser være mulige.

Avhengig av den enkelte implementasjon, kan sendekanalene være via kabler eller være trådløse og kan bruke tilpassede eller standardiserte protokoller (f. eks., IP). Medier som CD, DVD, digitale lydbåndopptakere, og faststoffsminner kan bli brukt til lagring. I tillegg kan sending og/eller lagring, men trenger ikke, omfatte kanalkoding. Likeledes, selv om den foreliggende oppfinnelse har blitt beskrevet i sammenheng med digitale audio-systemer, vil de som har kunnskaper innenfor fagområdet forstå at den foreliggende oppfinnelse også kan bli implementert i sammenheng med analoge audio-systemer, slik som AM-radio, FM-radio, og audio-delen av analog fjernsynssending, hvor hver støtter inkluderingen av en tilleggs innenbånds lav-bitsrate sendekanal.

Den foreliggende oppfinnelse kan bli implementert for mange ulike anvendelser, slik som musikkreproduksjon, kringkasting, og telefoni. For eksempel kan den foreliggende oppfinnelse bli implementert for digital radio-/TV-/internett- (f. eks., Websending) kringkasting slik som Sirius Satellite Radio eller XM. Andre anvendelser omfatter lyd over IP ( voice over IP), PSTN eller andre stemmenettverk, analoge rachokringkasting, og internettradio.

Avhengig av den enkelte anvendelse kan ulike teknikker bli anvendt for å legge settet med BCC-koder inn i en kombinert kanal for å oppnå et BCC-signal av den foreliggende oppfinnelse. Tilgjengeligheten av en hvilken som helst spesifikk teknikk kan avhenge av, i det minste en del, de(t) enkelte sendings-/lagringsmedie(r) brukt for BCC-signalet. For eksempel støtter vanligvis protokollene for digital rachokringkasting innlemming av tilleggsforsterkende bits (f. eks., i toppdelen av datapakker) som er ignorert av konvensjonelle mottakere. Disse tilleggsbits kan bli brukt til å representere settene av hørselssceneparametere for å gi et BCC-signal. Generelt kan den foreliggende oppfinnelse bli implementert ved å bruke en hvilken som helst passende teknikk for å vannmerke audiosignaler hvor data som korresponderer med settet med hørselssceneparametere er satt inn i audiosignalet for å danne et BCC-signal. For eksempel kan disse teknikker omfatte data som gjemmes under sanse-maskerings-kurver eller data som gjemmes i pseudotilfeldig støy. Pseudotilfeldig støy kan bli opp-fattet som komfortstøy. Datainnlemming kan også bli implementert ved å bruke fremgangsmåter lignende bit-stjeling brukt i TDM- (tidsdelt multipleksing) sending for innenbånds signalering. En annen mulig teknikk er mu-lav (u-low) reversering av minst signifikante bit ("LSB-bit-flipping"), hvor i det minste signifikante bits er brukt til å sende data.

Foreliggende oppfinnelse kan implementeres som krets-baserte prosesser, omfattende mulige implementasjoner på en enkelt integrert krets. Som vil være synlig for en med kunnskaper innen fagområdet, kan ulike funksjoner av kretselementer også bli implementert som prosesserende trinn i et softwareprogram. Slik software kan brukes i, for eksempel, en digital signalprosessor, mikrokontroller, eller generell datamaskin.

Foreliggende oppfinnelse kan utføres i form av fremgangsmåter og apparater for å praktisere disse fremgangsmåter. Oppfinnelse kan også utføres i form av programkode utført i virkelige medier, slik som (floppy-) disketter, CD-ROMer, hard-disker, eller et hvilket som helst maskinlesbart lagringsmedium, hvor, når programkoden er lastet inn i og utført av en maskin, slik som en datamaskin, blir maskinen et apparat for å utføre oppfinnelsen. Den foreliggende oppfinnelse kan også utføres i form av programkode, for eksempel, enten lagret i et lagringsmedium, lastet inn i og/eller utført av en maskin, eller sendt over et eller annet sendemedium eller bærer, slik som over elektriske ledninger eller kabler, gjennom optiske fibere, eller via elektro-magnetisk stråling, hvor, når programkoden er lastet inn i og utført av en maskin, slik som en datamaskin, blir maskinen et apparat for å utføre oppfinnelsen. Når implementert i en universalprosessor, kombineres programkode segmentene med prosessoren for å gi en unik anordning som opererer analogt med spesifikke logiske kretser.

Det vil videre bli forstått at ulike endringer i detaljene, materialer, og opp-stillinger av delene som har blitt beskrevet og illustrert for å forklare egenskapen av denne oppfinnelse kan bli gjort av de med kunnskaper innen fagområdet uten å avvike fra omfanget av oppfinnelsen som uttrykt i de følgende krav.

Claims

1 Fremgangsmåte for å kode et multikanal audiosignal som har flere audio inngangskanaler,karakterisert vedat fremgangsmåten innbefatter: • å anvende en parametrisk audiokodingsteknikk for å generere parametriske audiokoder for et første subsett av audio inngangskanalene for et første frekvensområde; og • å anvende den parametriske au(hokodingsteknikk for å generere parametriske audio koder for et andre subsett av audio inngangskanalene for et andre frekvensområde, hvor o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.

2 Fremgangsmåte i henhold til krav 1,karakterisert vedat den parametriske au(hoko(hngsteloiikk er binaural cue kodings (BCC) koding.

3 Fremgangsmåte i henhold til krav 1,karakterisert vedat: • multikanals audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én lavfrekvens (LFE) kanal; • det første subsett omfatter alle audio inngangskanaler; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.

4 Fremgangsmåte i henhold til krav 3,karakterisert vedat den parametriske au(hoko(hngsteloiikk er BCC-koding.

5 Fremgangsmåte i henhold til krav 3,karakterisert vedat grensefrekvensen er i det minste den effektive audio båndvidde for LFE-kanalen.

6 Fremgangsmåte i henhold til krav 3,karakterisert vedat multikanal audiosignalet er et 5.1 surroundlydsignal.

7 Fremgangsmåte i henhold til krav 1,karakterisert vedat den videre innbefatter å sende de parametriske audiokoder for de første og andre subsett av audio inngangskanaler.

8 Apparat for å kode et multikanal audiosignal som har flere audio inngangskanaler,karakterisert vedat apparatet innbefatter: • midler for å anvende en parametrisk au(hoko(hngsteloiikk for å generere parametriske audiokoder for et første subsett av audio inngangskanalene for et første frekvensområde; og • midler for å anvende en parametrisk au(hoko(hngsteloiikk for å generere parametriske audiokoder for et andre subsett av audio inngangskanalene for et andre frekvensområde, hvor o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.

9 Parametrisk audiokoder,karakterisert vedat den innbefatter: • en nedmikser tilpasset for å generere en eller flere kombinerte kanaler fra flere audio inngangskanaler av et multikanal audiosignal; og • en analysator tilpasset til å generere (1) parametriske audiokoder for et første subsett av audio utgangskanalene i et første frekvensområde; og (2) parametriske audiokoder for et andre subsett av audio utgangskanalene i et andre frekvensområde, hvor o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.

10 Parametrisk audiokoder i henhold til krav 9,karakterisert vedat de parametriske audiokoder er BCC-koder.

11 Parametrisk audiokoder i henhold til krav 9,karakterisert vedat: • multikanal audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én LFE-kanal; • det første subsett omfatter alle audio utgangskanalene; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.

12 Parametrisk audiokoder i henhold til krav 9,karakterisert vedat den parametriske audiokoder er tilpasset til å sende de parametriske audiokoder for de første og andre subsett av audio inngangskanaler.

13 Fremgangsmåte for å syntetisere et multikanal audiosignal som har flere audio utgangskanaler,karakterisert vedat fremgangsmåten innbefatter: • å anvende en parametrisk au(hodeko(hngsteknikk for å generere et første subsett av audio utgangskanalene for et første frekvensområde; og • å anvende den parametrisk au(hodeko(hngsteloiikk for å generere et andre subsett av audio utgangskanalene for et andre frekvensområde, hvor o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.

14 Fremgangsmåte i henhold til krav 13,karakterisert ved at den parametriske auchodekodmgsteknikk er BCC-dekoding.

15 Fremgangsmåte i henhold til krav 13,karakterisert vedat: • multikanal audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én LFE-kanal; • det første subsett omfatter alle audio utgangskanaler; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.

16 Fremgangsmåte i henhold til krav 15,karakterisert vedat den parametriske au(hodeko(hngsteloiikk er BCC-dekoding.

17 Fremgangsmåte i henhold til krav 15,karakterisert vedat grensefrekvensen er i det minste den effektive audio båndvidde for LFE-kanalen.

18 Fremgangsmåte i henhold til krav 15,karakterisert vedat multikanal audiosignalet er et 5.1 surroundlydsignal.

19 Apparat for å syntetisere et multikanal audiosignal som har flere audio utgangskanaler,karakterisert vedat apparatet innbefatter: • midler for å anvende en parametrisk au(hodeko(hngsteknikk for å generere et første subsett av audio utgangskanalene for et første frekvensområde; og • midler for å anvende parametrisk au(hodekodingsteknikk for å generere et andre subsett av audio utgangskanalene for et andre frekvensområde, hvor o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.

20 Parametrisk audiodekoder,karakterisert vedat den innbefatter: • en parametrisk kodeprosessor tilpasset for å generere parametriske koder; og • en syntetisator tilpasset for å anvende de parametriske koder på én eller flere kombinerte kanaler for å generere: (1) et første subsett av audio utgangskanaler av et multikanal audiosignal i et første frekvensområde; og (2) et andre subsett av audio utgangskanaler for multikanal audiosignalet i et andre frekvensområde, hvor: o det andre frekvensområde er forskjellig fra det første frekvensområde; og o det andre subsett er forskjellig fra det første subsett.

21 Parametrisk audiodekoder i henhold til krav 20,karakterisert vedat de parametriske koder er BCC-koder.

22 Parametrisk audiodekoder i henhold til krav 20,karakterisert vedat: • multikanal audiosignalet er et surroundlydsignal som har flere vanlige kanaler og i det minste én LFE-kanal; • det første subsett omfatter alle audio utgangskanalene; • det første frekvensområde korresponderer med subbånd ved eller under en spesifisert grensefrekvens; • det andre subsett ekskluderer LFE-kanalen; og • det andre frekvensområde korresponderer med subbånd over grensefrekvensen.