NO338928B1 - Generering av et kodet flerkanalsignal og dekoding av et kodet flerkanalsignal - Google Patents

Generering av et kodet flerkanalsignal og dekoding av et kodet flerkanalsignal Download PDF

Info

Publication number
NO338928B1
NO338928B1 NO20070903A NO20070903A NO338928B1 NO 338928 B1 NO338928 B1 NO 338928B1 NO 20070903 A NO20070903 A NO 20070903A NO 20070903 A NO20070903 A NO 20070903A NO 338928 B1 NO338928 B1 NO 338928B1
Authority
NO
Norway
Prior art keywords
parameter set
data stream
parameter
channels
information
Prior art date
Application number
NO20070903A
Other languages
English (en)
Other versions
NO20070903L (no
Inventor
Harald Popp
Jürgen Herre
Johannes Hilpert
Ralph Sperschneider
Kristofer Linzmeier
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of NO20070903L publication Critical patent/NO20070903L/no
Publication of NO338928B1 publication Critical patent/NO338928B1/no

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Error Detection And Correction (AREA)

Description

Bakgrunn
Oppfinnelsen angår parametriske audioflerkanalsbehandlingsteknikker og især en effektiv anordning av parametrisk sideinformasjon når det fins flere forskjellige parameterinnstillinger tilgjengelig for rekonstruksjon.
Bakgrunn
I tillegg til de to stereokanaler omfatter en anbefalt flerkanals "surround"-representasjon en midtkanal C og to surround-kanaler, dvs. den venstre surroundkanal Ls og den høyre surroundkanal Rs og i tillegg, eventuelt en "subwoofer"-kanal som også kalles en LFE-kanal (LFE = lavfrekvensforbedring). Dette referanselydformat kalles også 3/2 (pluss LFE)-stereo og eventuelt også 5.1 flerkanal som innebærer at det fins tre frontkanaler, to surroundkanaler og en LFE-kanal. Generelt kreves fem eller seks overføringskanaler for denne anbefalte flerkanals surroundgjengivelse. I et reproduksjonsmiljø kreves minst fem høyttalere i de respektive fem forskjellige posisjoner for å oppnå et optimalt såkalt "sweet spot" (beste lyttested) i en bestemt avstand fra de fem riktig plasserte høyttalere. Når det gjelder posisjonering kan imidlertid subwooferen brukes relativt fritt.
Det fins flere teknikker for å redusere mengden av data som kreves for å overføre et flerkanals audiosignal. Slike teknikker kalles også felles stereoteknikker. For dette formål henvises det til fig. 5. Fig. 5 viser en felles stereoinnretning 60. Innretningen kan være en innretning som f.eks. implementerer intensitetsstereoteknikk (IS-teknikk) eller tokanalskoding (BCC). Slik innretning mottar minst to kanaler (CH1, CH2,... CHn) som inngangssignal og avgir minst en enkelt bærerkanal (nedblandet) og parametriske data, dvs. et eller flere parametersett. De parametriske data blir definert slik at en approksimering av hver opprinnelige kanal (CH1, CH2, ... CHn) kan beregnes i en dekoder.
Normalt vil bærerkanalen omfatte delbåndsampler, spektralkoeffisienter eller tidsdomenesampler osv. som gir en relativt fin gjengivelse av det underliggende signal mens de parametriske data og/eller parametersettene ikke omfatter slike sampler eller spektralkoeffisienter. I stedet omfatter de parametriske data styreparametere for å styre en bestemt rekonstruksjonsalgoritme, f.eks. vekting ved multiplikasjon, tidsfor-skyvning, frekvensforskyvning osv. De parametriske data omfatter således bare en relativt grov gjengivelse av signalet eller den tilhørende kanal. Uttrykt i tall, blir mengden av data som kreves av en bærerkanal i størrelsesorden 60-70 kbit/s mens mengden av data som kreves av den parametriske sideinformasjon er i størrelsesorden fra 1,5 kbit/s for en kanal. Et eksempel på parametriske data er de kjente skalerings-faktorer, intensitetsstereoinformasjon eller tokanalsparametere, som beskrevet nedenfor.
Intensitetsstereokodingsteknikken er beskrevet i AES dokumentet 3799 med tittel "Intensity stereo coding" J. Herre, K. H. Brandenburg, D. Lederer, februar 1994, Amsterdam. Generelt er konseptet med intensitetsstereo basert på en hovedakse-transformering som brukes i forbindelse med data av de to stereofoniske audiokanaler. Hvis de fleste datapunktene plasseres rundt den første hovedakse, kan en kodegevinst oppnås ved å dreie begge signalene i en bestemt vinkel før koding. Imidlertid gjelder ikke dette alltid riktige stereofoniske gjengivelsesteknikker. De rekonstruerte signaler for venstre og høyre kanal består av forskjellige vektede eller skalerte versjoner av det samme sendte signal. Uansett skiller de rekonstruerte signalene seg i amplitude men er identisk når det gjelder faseinformasjon. Energitidsenvelopene av begge de opprinnelige audiokanalene blir imidlertid opprettholdt ved hjelp av en selektiv skalering som typisk virker i det frekvensselektive området. Dette tilsvarer det menneskelige ørets lydoppfatning ved høyfrekvenser hvor de dominerende spatiallyder bestemmes av energienvelopene.
I tillegg blir det overførte signal i praksis, dvs. bærerkanalen formet av sumsignalet av venstre og høyre kanal i stedet for å dreie begge komponenter. Videre blir denne behandling, dvs. generering av intensitetsstereoparametrene for å utføre skaleringen utført på en frekvensselektiv måte, dvs. uavhengig av hverandre for hvert skaleringsfaktorbånd, dvs. for hver koderfrekvenspartisjon. Fortrinnsvis blir begge kanaler kombinert til å danne en kombinert eller "bærer"-kanal. I tillegg til den kombinerte kanal blir mtensitetsstereoinformasjonen avgjort avhengig av energien av den første og andre kanal og energien av den kombinerte eller sumkanalen.
BCC-teknikken er beskrevet i AES-dokumentet 5574 med tittel "Binaural cue coding applied to stereo and multi-channel audio compression", C. Faller, F. Baumgarten, mai 2002, Munchen. I BCC-koding blir et antall audioinngangskanaler konvertert til en spektral gjengivelse ved å bruke DFT-baser transformering med overlappende vinduer. Det resulterende spektrum blir delt i ikke-overlappende partisjoner. Hver partisjon har en båndbredde som er proporsjonal med en tilsvarende høyre vinklet båndbredde (ERB). Såkalte interkanalnivåforskjeller (ICLD) samt såkalte interkanaltidsforskjeller (ICTD) blir beregnet for hver partisjon, dvs. for hvert bånd og for hver datablokk k, dvs. en blokk av tidssampler. ICLD- og ICDT-parametrene blir kvantisert og kodet for å oppnå en BCC-bitstrøm. Interkanalforskjellene og interkanaltidsforskj ellene blir gitt for hver kanal i forhold til en referansekanal. Især blir parametrene beregnet ifølge bestemte formler avhengig av den bestemte deling av signalet som skal behandles.
På dekodersiden mottar dekoderen et monosignal og BCC-bitstrømmen, dvs. et første parametersett for interkanaltidsforskj ellene og et andre parametersett for interkanalnivåforskjellene. Monosignalet blir omdannet til frekvensdomenet og sendt til en synteseblokk som også mottar dekodede ICLD- og ICDT-verdier. I synteseblokken eller rekonstruksjonsblokken, blir BCC-parametre (ICLD og ICDT) brukt for å utføre en vektingsoperasjon av monosignalet for å rekonstruere flerkanalsignalet som deretter, etter en frekvens/tidskonvergering, gjengir en rekonstruksjon av det opprinnelige flerkanal audiosignalet.
Når det gjelder BCC, sender stereomodulen 60 kanalsideoperasjon, slik at parameterkanaldata blir kvantisert og kodet til ICLD og ICTD hvor en av de opprinnelige kanaler kan brukes som referansekanal for kodesignalsideinformasjonen. Normalt formes bærerkanalen av summen av de aktuelle, opprinnelige kanaler.
Naturligvis tilveiebringer ovennevnte teknikk bare en monogjengivelse for dekoderen som bare kan dekode bærekanalen men som ikke kan generere parameter-data for å generere en eller flere approksimeringer av mer enn en inngangskanal.
Audiokodeteknikken som kalles BCC-teknikk, er videre beskrevet i US patentskrift US 2003/0219130 Al, 2003/0026441 Al og 2003/0035553 Al. I tillegg henvises det til "Binaural Cue Coding. Part. II: Schemes and Applications", C. Faller og F. Baumgarte, IEEE: Transactions on Audio and Speech Proe, Vol. 11, No. 6, november 1993. Se også videre C. Faller and F. Baumgarten "Binaural Cue Coding applied to Stereo and Multi-Channel Audio compression", Preprint, 112* Convention of the Audio Engineering Society (AES), mai 2002, og J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, C. Spenger, "MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio", 116* AES Convention, Berlin, 2004, Preprint 6049. I det følgende vil det gjengis typisk, generelt BCC-arrangement for en flerkanals audiokoding i detalj under henvisning til fig. 6-8. Fig. 6 viser et generelt BCC-kodearrangement for koding/overføring av flerkanalaudiosignaler. Flerkanalsaudio-inngangssignalet blir sendt til en inngang 110 av en BCC-koder 112 og blir "blandet ned" i en såkalt nedblandeblokk 114, dvs. konvertert til en enkelt sumkanal. I eksempelet er inngangssignalet 110 et 5-kanals surroundsignal med en front venstre-kanal og en front høyrekanal, en venstre surroundkanal og en høyre surroundkanal og en senterkanal. Typisk genererer nedblandeblokken et sumsignal ved ganske enkelt å legge til disse fem kanalene til et monosignal. Andre nedblandearrangement er kjent og fører alle til generering av et flerkanals inngangssignal, et nedblandesignal med en enkelt kanal eller et antall nedblandekanaler som i alle tilfelle er mindre enn antallet opprinnelige inngangskanaler. I eksempelet vil nedblandeoperasjonen allerede oppnås hvis fire bærerkanaler blir generert fra de fem inngangskanalene. Den ene utgangssignal og/eller antallet utgangskanaler blir sendt på en sumsignallinje 115.
Sideinformasjonen fra en BCC-analyseblokk 116 blir sendt på en sideinformasjonslinje 117. I BCC-analyseblokken kan parametersett for ICLD, ICTD eller interkanalkorreleringsverdier (ICC-verdier), beregnes. Således fins det opp til tre forskjellige parametersett (ICLD, ICTD og ICC) for rekonstruksjonen i BCC-synteseblokken 122.
Sumsignalet og sideinformasjonen med parametersettene blir typisk overført til en BCC-dekoder 120 i et kvantisert og kodet format. BCC dekoderen splitter det overførte sumsignal til et antall delbind og utfører skaleringer, forsinkelser, og videre behandling for å generere delbindene av de flere kanalene som skal rekonstrueres. Denne behandling utføres slik at ICLD, ICTD og ICC-parametere (cues) av et rekonstruert flerkanalsignal ved utgangen 121 blir lik de respektive parametere for det opprinnelige flerkanalsignal ved inngangen 110 til BCC-koderen 112. For dette formål omfatter BCC-dekoderen 120 en BCC-synteseblokk 122 og en sideinformasjons-behandlingsblokk 123.
Beskrivelsen nedenfor vil vise den innvendige oppbygning av BCC-synteseblokken 122 under henvisning til fig. 7. Sumsignalet på linjen 115 blir sendt til en tids/frekvenskonverteringsblokk typisk omfattet som filterbank FBI25. Ved utgangen av blokken 125 fins det et antall N av delbåndsignaler eller i et ekstremt tilfelle, en blokk av spektralkoeffisenter hvis audiofilterbanken 125 utfører en transformering som genererer N-spektralkoeffisienter fra N tidsdomenesampler.
BCC-synteseblokken 122 omfatter videre et forsinkelsestrinn 126, et mvåmodifiseringstrinn 127, et korreleringsbehandlingstrinn 128 og et trinn IFB 129 som representerer en omvendt filterbank. Ved utgangen av trinn 129, kan det rekonstruerte flerkanals audiosignal med feks. fem kanaler i et 5-kanals surround-system sendes til et sett høyttalere 124 som vist på fig. 6.
Fig. 7 viser videre at inngangssignalet s(n) blir konvertert til frekvensdomenet eller filterbankdomenet av elementet 125. Signalet fra elementet 125 blir multiplisert, slik at flere versjoner av samme signal oppnås som vist av noden 130. Antallet versjoner av det opprinnelige signal er likt antallet utgangssignaler i utgangssignalet som skal rekonstrueres. Hvis versjonen av det opprinnelige signal utsettes for en bestemt forsinkelse di, d2, ... di, dN ved noden 130, blir resultatet situasjonen ved utgangen av blokkene 126 som omfatter versjoner av det samme signal men med forskjellig forsinkelse. Forsinkelsesparametrene blir beregnet av sideinformasjonsbehandlingsblokken 123 på fig. 6 og avledet fra interkanaltidsforskj ellene som bestemt av BCC-analyseblokken 116.
Det samme gjelder for multiplikasjonsparametrene ai, a2... a;, au som også beregnes av sideinformasjonsbehandlingsblokken 123 basert på interkanalsnivåforskj ellene bestemt av BCC-analyseblokken 116. ICC-parametrene blir beregnet av BCC-analyseblokken 116 og brukt for å styre funksjonaliteten av blokkene 128, slik at bestemte korreleringsverdier mellom forsinkede og nivåmanipulerte signaler oppnås ved utgangen av blokken 128. Det skal bemerkes at rekkefølgen av trinnene 126, 127, 128 kan være forskjellig fra det som er vist på fig. 7.
Det skal videre bemerkes at BCC-analysen, i en blokkvis behandling av audiosignalet, også utføres blokkvist. Videre utføres BCC-analysen også frekvensvis, dvs. på en frekvensselektiv måte. Dette innebærer at det fins en ICLD-parameter, en ICTD-parameter og en ICC-parameter for hvert spektralbånd. ICTD-parametrene for minst en kanal over alle båndene representerer således ICTD-parametersettet. Det samme gjelder for ICLD-parametersettet som representerer alle ICLD-parametrene for alle frekvensbånd for rekonstruksjon av minst en utgangskanal. Det samme gjelder i sin tur for ICC-parameter settet som igjen omfatter flere individuelle ICC-parametere for forskjellige bånd for rekonstruksjon av minst et utgangssignal på basis av inngangskanalen eller sumkanalen.
I det følgende henvises det til fig. 8 som viser en situasjon hvor bestemmelsen av BCC-parametrene kan ses. Normalt kan ICLD-, ICTD- og ICC-parametere defineres mellom kanalparene. Typisk blir imidlertid en bestemmelse av ICLD- og ICTD-parametrene utført mellom en referansekanal og hver andre inngangskanal, slik at det blir et bestemt parametersett for hver av inngangskanalene. Dette er også vist på fig. 8B.
Imidlertid kan ICC-parametrene defineres forskjellig. Generelt kan ICC-parametrene genereres i koderen mellom kanalparene som også vist skjematisk på fig. 8B. I dette tilfellet vil en dekoder utføre en ICC-syntese, slik at omtrent samme resultat oppnås som om det var til stede i det opprinnelige signal mellom kanalparene. Imidlertid har det blitt foreslått å beregne bare ICC-parametre mellom de to sterkeste kanaler på et tidspunkt, dvs. for hver tidspulje. Dette arrangement er vist på fig. 8C som viser et eksempel hvor en ICC-parameter på et tidspunkt mellom kanalene 1 og 2 blir beregnet og sendt og hvor en ICC-parameter på et annet tidspunkt mellom kanalene 1 og 5 blir beregnet. Dekoderen synteserer deretter interkanalkorreleringer mellom de to sterkeste kanaler i dekoderen og utfører ytterligere typisk auristiske regler for syntesering av interkanalsammenhengen for de resterende kanalpar.
Når det gjelder beregningen av feks. multiplikasjonsparametrene ai, ... au basert på sendte ICLD-parametere, henvises det til det nevnte AES-dokument 5574.
ICLD-parametrene representerer en energifordeling i et opprinnelig flerkanals signal. Uten å miste generaliteten, viser fig. 8A at det fins fire ICLD-parametere som representerer energiforskjell mellom alle andre kanaler og den fremre, venstre kanal. I sideinformasjonsbehandlingsblokken 123, blir multiplikasjonsparametrene ai, ... au avledet fra ICLD-parametrene, slik at den totale energi av alle rekonstruerte utgangssignaler blir den samme energi som finnes for det overførte sumsignal eller som minst er proporsjonal med dens energi. En måte å bestemme disse parametrene på er ved en totrinnsprosess hvor multiplikasjonsfaktoren for den venstre frontkanal blir satt til 1 i et første trinn mens multiplikasjonsf aktorene for de andre kanaler på fig. 8C blir satt til de overførte ICLD-verdier. Deretter blir energien av alle fem kanaler beregnet og sammenlignet med energien av det overførte sumsignal i et andre trinn. Deretter blir alle kanaler nedskalert ved å bruke en skaleringsfaktor som er lik for alle kanaler, idet skaleringsfaktoren velges slik at den totale energi av alle rekonstruerte utgangssignaler etter skaleringen blir lik den totale energi av det overførte sumsignal og/eller de over-førte sumsignaler.
Når det gjelder interkanalssammenhengsmålet ICC overført fra BCC-koderen til BCC-dekoderen som ytterligere parametersett, skal det bemerkes at en sammen-hengsmanipulering kan utføres ved å modifisere multiplikasjonsfaktorene, feks. ved å multiplisere vektingsfaktorene av alle delbånd med vilkårlige tall som har verdier mellom 20 loglO"<6>og 20 log IO6. Den kvasivilkårlige sekvens velges typisk slik at variansen for alle kritiske bånd blir omtrent lik og gjennomsnittsverdien i hvert kritisk bånd blir null. Samme sekvens brukes for spektralkoeffisientene av hver forskjellig pulje eller blokk. Således blir bredden av audioscenen styrt av modifikasjoner av variansen av den kvasivilkårlige sekvens. En større varians genererer en større lyttebredde. Variansmodifikasjon kan utføres i enkelte bånd som har en bredde tilsvarende et kritisk bånd. Dette gjør det mulig å oppnå et samtidig nærvær av flere objekter i en lyttescene hvor hvert objekt har en forskjellig lyttebredde. En passende amplitudefordeling for den kvasivilkårlige sekvens er en ensartet fordeling på en logaritmeskala, slik som vist i US patentskrift 2002/0219130 Al.
For å kunne overføre de fem kanalene på en kompatibel måte, f.eks. i et bitstrømsformat som også egner seg for en normal stereodekoder, kan det brukes den såkalte matriseteknikk som beskrevet i "MUSICAM Surround: A universal multi-channel coding system compatible with ISO/IEC 11172-3", G. Theile and G. Stoll, AES Preprint, October 1922, San Fransisco.
Se videre flerkanalskodeteknikker som beskrevet i publikasjonen: "Improved MPEG 2 Audio multi-channel encoding", B. Grill, J. Herre, K. H. Brandenburg, I. Eberlein, J. Koller, J. Miller, AES Preprint 3865, February 1994, Amsterdam, hvor en kompatibilitetsmatrise blir brukt for å oppnå nedblandekanaler fra de opprinnelige inngangskanaler.
I sum kan det sies at BCC-teknikken tillater en effektiv og også bakover-kompatibel koding av flerkanalsaudiomaterialet som også beskrevet f.eks. i spesialistpublikasjonen av E. Schuijer, J. Breebaarth, H. Purnhagen, J. Engdegård entitled "Low-Complexity Parametric Stereo Coding", 119* AES Convention, Berlin, 2004, Preprint 6073. I denne sammenheng skal det også bemerkes at det også kan brukes MPEG-4-standarden og især ekspansjonen for parametriske audioteknikker hvor denne standard del også er kjent under betegnelsen ISO/IEC 14496-3: 2001/FDAM 2 (parametrisk audio). I denne henseende skal det især nevnes syntaksen i tabell 8.9 i MPEG-4-standarden benevnt "syntax of the ps.data()". I dette eksempel skal det nevnes syntakselementene "enable_icc" og "enable_ipdopd" hvor disse syntakselementene blir brukt for å slå av og på en overføring av en ICC-parameter og en fase tilsvarende interkanals tidsforskjellene. Det skal videre nevnes syntakselementene "icc_data()<M>"ipd_data()<M>og "opd_data()<M>.
I svam skal det bemerkes at det generelt brukes slike parametriske flerkanals-teknikker som har flere overførte bærerkanaler hvor M overførte kanaler blir formet av N opprinnelige kanaler for å rekonstruere N-utgangskanalene eller et antall K av utgangskanalene igjen, idet K er lik eller mindre enn antallet opprinnelige kanaler N.
Det som er problematisk ved alle de beskrevne teknikker inntil nå, er spørsmålet om hvordan formatkompatibiliteten kan frembringes mellom forskjellige typer dekodere for flerkanalsdekoding, f.eks. for BCC-dekodere og for forskjellige versjoner av parametrisk sideinformasjon. Især vil det oppstå to problemer i forbindelse med forskjellige flerkanalsdekodere på markedet mens sideinformasjonen samtidig har forskjellige parametersett generert av forskjellige flerkanalsdekodere og således bare er tilgjengelig for brukere som har en enkelt dekoder.
For det første er det ønskelig å ha dekodere med høy beregningskapasitet som tilveiebringer den optimale flerkanals lydkvalitet ved dekoding. Samtidig vil det også være dekodere som brukes under ressursbegrensede forhold, f.eks. dekodere i mobile innretninger, f.eks. mobiltelefoner. Naturligvis kan slike dekodere gi et flerkanalsignal med en kvalitet som fremdeles er så god som mulig men som også bare har en begrenset beregningsevne. Dette fører til spørsmålet om det kan være bitstrømformater med parametersett for spatial rekonstruering som støtter denne type skaleringsmulighet, dvs. tillater både dekoding med høy kompleksitet og således optimal kvalitet og dekoding med redusert kompleksitet men også med tilsvarende redusert kvalitet.
Et annet aspekt som vurderes ved innføring av nye generasjoner/versjoner av BCC-kodere og således av BCC-bitstrømmer er spørsmålet om hvordan en kompatibi-litet mellom forskjellige versjoner av BCC-bitstrømmene og BCC-dekoderne kan opp-rettholdes. Med andre ord er det ønskelig at nye BCC-parametersett og også opp-daterte, gamle parametersett blir bakoverkompatible. Det er derfor naturligvis ønskelig å tilveiebringe en oppgraderingsbane for BCC-brukere for å kunne innføre nye forbedrede flerkanalsarrangementer når de blir tilgjengelige etter hvert som teknikken fremskrider. På den annen side vil nye BCC-bitstrømsformater normalt føre til inkom-pabiliteter mellom disse bitstrømmene og forskjellige eldre BCC-dekoderversjoner.
Især skal det bemerkes at flerkanalskodere/dekodere blir brukt på et økende antall områder hvor det ikke nødvendigvis finnes maksimale behandlingskapasiteter men som ikke alltid nødvendigvis krever maksimal lydkvalitet heller.
Sammendrag
Det er et formål med oppfinnelsen å tilveiebringe et konsept som er effektivt og fleksibelt, dvs. som f.eks. tillater å integrere nye parametersett eller å oppdatere gamle parametersett og som samtidig kan brukes fleksibelt og på forskjellige områder.
Dette formål oppnås ved en innretning for å generere et kodet flerkanalsignal ifølge krav 1, en innretning for å dekode et kodet flerkanalsignal ifølge krav 15, en fremgangsmåte for å generere et kodet flerkanals signal ifølge krav 21, en fremgangsmåte for å dekode et flerkanalsignal ifølge krav 22 eller et dataprogram ifølge krav 23.
Oppfinnelsen er basert på konstateringen at en effektiv og bakover kompatibel dekoding av kodede flerkanals signaler oppnås når det kodede flerkanals signal blir skrevet som en datastrøm som i tillegg til minst en overføringskanal eller bærerkanal, omfatter minst to forskjellige parametersett, idet de to parametersettene blir skrevet inn i datastrømmen, slik at en rekonstruering av utgangssignalene kan utføres med mindre enn minst to parametersett. Ifølge oppfinnelsen blir datastrømmen skrevet slik at en dekoder kan identifisere hvilket av parametersettene som kreves for rekonstruksjonen og hvilket parametersett som eventuelt er nødvendig for denne. I dette tilfellet kan en dekoder bare bruke det parametersettet som er uunngåelig (dvs. nødvendig) for rekonstruksjonen og ganske enkelt ignorere de valgfrie parametersett hvis omstendighetene muliggjør dette. Dette resulterer at i dekoderen blir rask og klarer med en datakapasitet bare å bruke det nødvendige parametersett for rekonstruksjonen og samtidig kan en annen dekoder utføre en høykvalitets, flerkanals rekonstruksjon basert på den samme datastrøm som representerer det kodede flerkanalsignal som imidlertid også krever mer tid og/eller behandlingskapasitet og/eller mer generelt, flere dekoderressurser.
I en foretrukket utførelse av oppfinnelsen blir det nødvendige parametersett det som omfatter interkanalnivåforskjellene. Som det har blitt funnet ifølge oppfinnelsen, er disse interkanalnivåforskjellene ytterst viktig for å definere den grunnleggende flerkanals lydfordeling mellom utgangssignalene for alle typer gjengivelsessituasjoner. Interkanalstidsforskjellene kan klassifiseres som valgfrie parametersett siden de hoved-sakelig er relevant når det skal foretas en gjengivelse via hodetelefoner, dvs. to utgangssignaler fra en overført kanal eller når en flerkanals lydgjengivelse oppstår i en såkalt relativt "tørr" akustisk situasjon, dvs. en akustisk situasjon med lite ekko. Interkanaltidsforskj ellen kan således allerede klassifiseres som et valgfritt parametersett.
Interkanalskorreleringsverdiene er viktig for å oppnå bredden av lydkildene og ytterligere generere inntrykket for en lytter at vedkommende befinner seg i et miljø med kompliserte lydkilder, f.eks. et klassisk orkester som omfatter mange ikke-korrelerte lydkomponenter. ICC-parametersettet kan således også klassifiseres som et valgfritt parametersett siden det tydelig har en betydelig påvirkning på kvaliteten, men som ved gjengivelse også fører til en relativt stor behandling som f.eks. ikke er så vesentlig i det nødvendige parametersett av interkanalsnivåforskj ellene siden det vesentlig kreves bare en vektingsoperasjon, dvs. en multiplikasjon som kan utføres effektivt når det gjelder behandlingen.
Når det gjelder problemet med bakoverkompatibilitet av kodede flerkanal-signaler med parametersettene i datastrømmer, blir parametersett med f.eks. et høyere versjonsnummer skrevet inn i datastrømmen, slik at en rekonstruksjon av en dekoder kan utføres uten parametersettet med det resultat at en dekoder vil bare bruke det første parametersett for rekonstruksjonen og hoppe over et andre parametersett når det fastlegges at den ikke kan behandle dette andre parametersett.
På dekodersiden innebærer dette at dekoderen må lese inn et parametersett fullstendig og behandle det når den har identifisert dette parametersettet som et påkrevd parametersett, idet dekoderen ganske enkelt vil hoppe over bitene i bitstrømmen som tilhører et parametersett når den møter et parametersett som ikke er nødvendig for rekonstruksjonen, dvs. som er merket som valgfritt. Dekoderen behøver således ikke å ha kunnskap om syntaksen av det andre parametersett for å kunne behandle det kodede flerkanalsignal men kan ganske enkelt hoppe over det og ganske enkelt fortsette med de etterfølgende deler av det kodede flerkanalsignal som fremdeles kan være nødvendig for rekonstruksjonen.
Fortrinnsvis blir lengdeinformasjonen således satt inn i datastrømmen for parametersettene merket som valgfrie og som gjør det mulig for dekoderen ganske enkelt å hoppe over bitene tilknyttet dette parametersett på en rask og effektiv måte og ikke bare ta parametersettene som er merket som obligatorisk for dekoding. Når det gjelder bakoverkompatibiliteten er det videre foretrukket at versjonsnummeret er tilknyttet minst hvert valgfritt parametersett som angir av hvilken koderversjon parametersettet ble generert fra. Således vil f.eks. parametersettet for interkanalnivåforskjellene av den laveste versjon blir merket som obligatorisk i en datastrøm mens et parametersett for interkanalnivåforskjellene av en senere koderversjon får et annet versjonsnummer, slik at dekoder ganske enkelt vil bruke det tilsvarende parametersett med lavere versjonsnummer for rekonstruksjonen når den fastslår at den ikke kan behandle parametersettet med det høyere versjonsnummeret.
Endelig skal det bemerkes at datastrømmen som representerer flerkanalsignalet ikke nødvendigvis også må inneholde overføringskanalene. I stedet kan de ha blitt generert og sendt separat, f.eks. i tilfellet hvor BCC-parametrene blir skrevet til en CD i en tilsvarende kanal etterpå hvor CD allerede inneholder M (= lik eller større enn 1) overføringskanaler.
Kort omtale av figurene
Oppfinnelsen skal beskrives nærmere i det følgende, der:
Fig. la er en oversikt over et kodet flerkanalsignal med en bestemt datastrøm- syntaks ifølge en utførelse av oppfinnelsen; Fig. lb er et detaljert riss av styreblokken på fig. la ifølge en utførelse av opp finnelsen; Fig. 2a er et blokkskjema av en koder ifølge oppfinnelsen; Fig. 2b er et blokkskjema av en dekoder ifølge en utførelse av oppfinnelsen; Fig. 3a-3b viser en foretrukket implementering for parametersettkonfigurasjon ifølge oppfinnelsen; Fig. 4a-4c viser en foretrukket implementering av parametersettdataene ifølge oppfinnelsen; Fig. 5 viser et generelt riss av en flerkanalskoder; Fig. 6 er et skjematisk blokkskjema av en BCC-koder/BCC-dekoder-bane;
Fig. 7 er et blokkskjema av BCC-synteseblokken på fig. 6; og
Fig. 8A-8C viser et riss av typiske tilfeller for beregning av parametersettene ICLD,
ICTD og ICC.
Detaljert beskrivelse av utførelsesformer
Fig. 2a viser en foretrukket implementering av en innretning for å generere et kodet flerkanalsignal som representerer et ikke-kodet flerkanalsignal som omfatter N opprinnelige kanaler som ble matet til en inngang 20 i anordningen 22 for å tilveiebringe både M-overføringskanaler og parameterinformasjon med minst to parametersett. Især er antallet M av overføringskanalsignaler ved en utgang 23 av innretningen 22 mindre enn antallet N av opprinnelige audiokanaler. De enkelte parametersett som kan representere parameterinformasjonen for rekonstruering av K utgangssignaler blir tilført utgangene 24a, 24b, 24c av innretningen 22 for levering. M-overføringskanaler hvor M er lik eller større enn 1 og mindre enn N blir tilført innretningen 25 for å skrive en datastrøm på utgangssiden som blir levert til utgangen 26 akkurat som parametersettene ved utgangene 24a, 24b, 24c.
Som nevnt ovenfor kan nedblandeinformasjonen (M overføringskanaler) også overføres/lagres separat fra parameterinformasjonen.
Innretningen 25 for å skrive datastrømmen representerer det kodede flerkanalsignal som er konstruert for å skrive M overføringskanaler til datastrømmen og videre skrive første, andre og tredje parametersett til datastrømmen, slik at en rekonstruksjon av K-utgangskanaler kan utføres uten å bruke en av de tre parametersettene og fortrinnsvis også bruke minst to av de tre parametersettene. I denne henseende er parametersettene ved utgangene 24a-24c av innretningen 22 for å levere merket slik at et parametersett, f.eks. det første, absolutt er nødvendig for rekonstruksjon mens de to andre, dvs. det andre og det tredje parametersett defineres slik at de bare eventuelt kreves for rekonstruksjonen.
Innretningen 25 for skriving vil deretter skrive det første parametersett som det nødvendige parametersett tillater strømmen og vil skrive det andre parametersett og det tredje parametersett bare som eventuell parametersett tillater strømmen som nevnt i det følgende.
Datastrømmen ved utgangen 26 på fig. 2a blir matet til en datastrøms inngang 27 av en flerkanals dekoder vist på fig. 2b. Dataene av datastrømmen blir tilført innretningen 28 for å lese datastrømmen mens innretningen 28 for å lese data-strømmen, akkurat som koderen vist på fig. 2a, igjen omfatter en logikkutgang 29 for M overføringskanaler trukket ut fra datastrømmen og videre logikkutgangene 30a, 30b for parametersettene i datastrømmen. I en foretrukket utførelse av oppfinnelsen, hvor det første parametersett er merket som obligatorisk eller absolutt nødvendig for rekonstruksjonen, vil innretningen 28 for lesning levere dette første parametersett til innretningen 31 for rekonstruksjon via logikkutgangen 30a. Hvis innretningen 28 for lesning f.eks. er fastsatt bare til å lese de obligatoriske parametersett og leverer dem til innretningen 31 for rekonstruksjon, vil innretningen 28 ganske enkelt hoppe over det andre parametersett i datastrømmen ved inngangen 27 som symbolsk er vist av den avbrutte logikkutgang 30b på fig. 2b.
Kontrollen om bare obligatoriske parametersett eller i tillegg også eventuelle parametersett blir hentet ut fra datastrømmen og tilført irmretningen 31 kan også leveres til innretningen 28 via en styreinngang 32, hvor ressurstilgjengelighet, informasjon og/eller styreinformasjon avledet derfra vil ankomme via styreinngangen 32.
Ressurstilgjengelighetsinformasjon kan f.eks. bestå ved at en batteridrevet dekoder fastlegger at det fremdeles fins batterikraft tilgjengelig, slik at innretningen 28 for lesning av datastrømmen får instruks om ikke bare å hente ut nødvendige parametersett men også de valgfrie parametersett og leverer dem til innretningen 31 for rekonstruksjon via tilsvarende logikkutganger, slik at innretningen i sin tur leverer K utgangssignaler ved en utgang 33, idet K er lik eller mindre enn det opprinnelige antall N av opprinnelige inngangskanaler ved inngangen 20 på fig. 2a. Det skal bemerkes at antallet K fortrinnsvis er lik antallet N siden en dekoder eventuelt vil forsøke å generere alle utgangskanaler kodet i datastrømmen.
Datastrømlesnmgsinnretningen 28 for å avlese datastrømmen kan også lese inn minst det første parametersett og hoppe over minst et parametersett, f.eks. det andre parametersett, når skaleringsmuligheten i datastrømmen f.eks. brukes når et parametersett i datastrømmen ikke blir brukt for rekonstruksjon. Rekonstruksjonsinnretningen 31 kan rekonstruere K utgangssignaler ved å bruke M overføringskanaler og det første parametersett men ikke bruke det andre parametersett.
I en utførelse av oppfinnelsen er anordningen 22 for levering en BCC-koder som mottar N opprinnelige kanaler og på utgangssiden leverer så M overføringskanaler og de individuelle parametersettene. Alternativt kan innretningen 22 for levering også være en såkalt bitstrømstranskoder som på inngangssiden mottar informasjon som allerede er skrevet i et ikke-skalerbart format (bare parametersett eller parametersett sammen med overføringskanaler) etter hvert som de genereres av elementene 114 og 116 på fig. 7 og som instruerer innretningen 25 for skriving tilsvarende for å omskrive bitstrømmen til således å skrive parametersettene til datastrømmen i skalerbar form. Dette innebærer at, for å kunne forstå datastrømmen, at en dekoder ikke må lese inn og parsere alle data av datastrømmen men kan hoppe over data tilhørende et valgfritt parametersett under detektering av et valgfritt parametersett.
Således fins det forskjellige muligheter for den faktiske skriving av data-strømmen med de skalerbare parametersett. I en utførelse kan begynnelsen av dataene for et parametersett legges ned ifølge et fast datastrømsraster. I et slikt tilfelle er overføringen av lengdeinformasjonen tilhørende et valgfritt parametersett ikke nødvendig. Dette faste raster kan imidlertid føre til en kunstig ekspandering av datamengden av datastrømmen ved tilføyde biter. Således er det foretrukket å knytte lengdeinformasjonen til hvert valgfritt parametersett slik at når det har informasjonen, vil en dekoder hoppe over et valgfritt parametersett, dvs. ganske enkelt hoppe over et bestemt antall biter i den foretrukne seriedatastrøm basert på lengdeinformasjonen for deretter å gjenoppta lesning i og analysere ved det riktige sted i datastrømmen, dvs. når data for et nytt parametersett og/eller for ny informasjon starter.
En alternativ mulighet for å signalisere begynnelsen av et nytt parametersett består f.eks. i å få et synkroniseringsmønster til å ligge foran de faktiske data som har et bestemt bitmønster, dvs. som kan identifiseres uten faktisk å analysere dataene bare basert på et hvitmønstersøk for å signalisere til en dekoder at dataene for et parametersett begynner her og avsluttes ved det etterfølgende synkroniseringsmønster. I et slikt tilfelle, og når et parametersett har blitt identifisert som et valgfritt parametersett, vil en dekoder se etter et synkroniseringsmønster tilknyttet begynnelsen av det valgfrie parametersett for deretter å utføre et mønstersøk med bitene etter synkroniseringsmønsteret uten å parse, inntil det møter det neste synkroniseringsmønster. Bitene mellom de to synkroniseringsmønstre vil da ikke bli brukt for en rekonstruksjon men vil ganske enkelt bli ignorert mens dataene ved det etterfølgende synkroniseringsmønster som signaliserer slutten av det valgfrie parametersett kan brukes som foreskrevet ifølge bitstrømssyntaksen hvis disse dataene ikke tilhører et ytterligere andre valgfritt parametersett.
I en foretrukket utførelse av oppfinnelsen blir de minst to parametersett som kreves for rekonstruksjonen av flere kanaler klassifisert i forhold til deres oppfatnings-betydning. Parameter settes som mest har betydning for oppfatningen, dvs. for kvaliteten av det rekonstruerte flerkanalsignal blir merket som obligatorisk parametersett i datastrømmen mens de andre parametersett blir bare merket som valgfrie parametersett. Ytterligere gradering i obligatoriske, valgfrie og f.eks. nødvendige parametersett for en studiorekonstruksjon kan også utføres for f.eks. å omfatte tre skaleringstrinn i stedet for bare to skaleringstrinn. Det skal bemerkes at det er tilstrekkelig å merke enten det obligatoriske eller fortrinnsvis det valgfrie parametersett på grunn av at typen av det respektive ikke-merkede parametersett automatisk fører til utelatelse av en merking. Fig. la viser et skjematisk riss av datastrømmen som på fig. la omfatter først en styreblokk 10, en blokk hvor det fins data for M overføringskanaler som er benevnt 11 og en blokk 12a, 12b ... 12c for hvert parametersett. I den foretrukne utførelse av oppfinnelsen omfatter styreblokken 10 forskjellige individuelle informasj onsbiter som skjematisk vist på fig. 1. Således signaliserer inndata 100 i styreblokken 10 antallet obligatoriske parametersett ved et felt med tittelen "numBccDataMand". Videre signaliserer et felt 101 signaler når det fins valgfrie parametersett. Et felt merket "OptBccDataPresent" blir brukt for dette formål. Et annet felt av styreblokken 10 signaliserer ytterligere et antall valgfrie parametersett med variabelen "numBccDataOpt". Videre signaliserer blokkene 103, 104, 105 type og/eller versjonsnummer av et parametersett i for hvert parametersett. Feltet med navnet "BccDatald" blir brukt for dette. En ytterligere valgfri sekvens av felt 106, 107, 108 gir valgfri lengdeinformasjon benevnt "Lengminfo" til hvert parametersett merket som valgfritt, dvs. som er omfattet i antallet valgfrie parametersett. Denne lengdeinformasjon oppgir lengden i biter av tilhørende tilknyttede, f.eks. i* parametersett. Som nevnt nedenfor kan "Lengthinfo" også omfatte informasjon om antallet biter som kreves for å signalisere lengden eller alternativt også den faktiske lengdespesifikasjon. Fig. 3a-3b viser en foretrukket form av parametersettkonfigurasjonen. Parametersettkonfigurasjonen kan utføres for hver blokk men kan også f.eks. gjøres bare en gang for en gruppe blokker, f.eks. i begynnelsen av en fil som inneholder mange blokker. Således gir fig. 3a en definisjon av nærværet og antallet valgfrie parametersett i kvasikode, hvor "uimsbf' står for "usignert integer mest betydelig bit først", dvs. for en integer som ikke omfatter et tegn og hvis mest betydelige bit er først i datastrømmen. Således blir den variable numBccData som angir antallet BCC-data vist først, f.eks. i feltet 100 i styreblokken 10.
Videre brukes feltet 101 for å fastlegge om det fins valgfrie parametersett i det hele tatt (optBccDataPresent). Deretter blir antallet (numBccDataOpt) av valgfrie parametersett lest inn for ytterligere å oppnå informasjon om de valgfrie parametersettene eller såkalte "stykker" (OptChunklnfo) hvor dette har blitt utført. Den variable numBccDataOptMl inneholder suffikset "Ml" som står for "minus 1". Dette balanseres igjen ved tillegget av "+1" på fig. 3d.
Fig. 3b viser en oversikt over verdien som i en utførelse kan ha parameter-settdata i feltene 103-105. Således kan den variable "BccDatald" først omfatte navnet, dvs. type parameter, dvs. ICLD, ICTD og ICC og samtidig et versjonsnummer VI eller V2. Således vil det fremgå av fig. 3b at en datastrøm faktisk kan inneholde integer-kanalnivåforskjeller av en første versjon VI og en senere, andre versjon V2 samtidig, idet en tilsvarende passende dekoder for den første versjon ganske enkelt kan lese inn ICLD Vl som obligatorisk parametersett og kan ignorere ICLD V2 mens en dekoder med et høyere versjonsnummer ganske enkelt kan lese inn ICLD_V2, nemlig som et obligatorisk parametersett for imidlertid å ignorere ICLD_V1 som parametersettet som bare valgfritt er nødvendig i dette tilfellet. Alternativt kan datasettet skrives slik at de obligatoriske datasettene alltid er til stede i en versjon i datastrømmen.
Fig. 3c viser identifikasjonen av valgfrie parametersett. I informasjonen om eventuelle parametersett leses parametersettidentifikatoren 103-105 på fig. lb inn for hvert parametersett for å oppnå informasjon om hvert parametersett som er valgfritt. Videre blir lengden av parametersettet lest inn for hvert valgfritt parametersett hvis det blir overført i bitstrømmen, som vist av kommandoen "OptChunkLen()<M>på fig. 3c.
Når det gjelder bestemmelse av lengdeinformasjonen for valgfrie parametersett på fig. 3d som viser hvordan, i en foretrukket utførelse av oppfinnelsen, blir lengden i biter lest inn for hvert parametersett fra dataene tilknyttet hvert valgfritt parametersett.
Parametersettavlesningssløyfen utføres av en dekoder og er skjematisk vist på fig. 4a. Således blir de faktiske parametersettdataene som befinner seg i blokkene 12a-12c av fig. 1, lest inn med BccData().
Avlesningen av lengdeinformasjonen er vist på fig. 4b. F.eks. beskriver BccDataLenBits antallet biter som er nødvendig for å signalisere den faktiske bitlengde av en blokk. BccDataLen gir deretter lengden i biter som befinner seg i en blokk. Dette totrinnssystem er fleksibelt på den ene side og sparer data på den annen side siden den især er effektiv når blokkene har en tungt varierende lengde i biter som særlig gjelder for parametersett av svært forskjellig type og således lengde. Dette vil muliggjøre fremtidig definisjon av andre blokker av nesten enhver lengde. Fig. 4c viser til slutt parametersettsvitsjen hvor parametersettidentifikatoren som vist på fig. 3b blir evaluert, slik at parametersettene blir tilknyttet de tilsvarende rekonstruksjonsalgorirmer, slik at tilfellet ikke oppstår f.eks. at interkanalnivåforskj ellene blir tatt for interkanalbitsforskj ellene og omvendt. Fig. 4c viser videre at, når parametersett har blitt identifisert som valgfritt og dekodingen som bruker det valgfrie parametersett ikke er ønsket, blir antallet biter av dette parametersett hoppet over ("hopp over og fortsett") for å starte signaleringen uten å vurdere andre, valgfrie parametersett når alle obligatoriske parametersett har blitt lest inn (eller hvor det fins data som er ukjent for dekoderen, f.eks. parametersett) ("stopp parsing, start signalering"). En slik dekoder vil således starte signaleringen når den allerede har lest inn minst en obligatorisk blokk og den kan ikke parse ytterligere informasjon i datastrømmen. Således blir ikke dekoderen kommandert til å fullføre feil avbrudd av datastrøminnhold den ikke forstår. Dette frembringer en svært robust dekoder.
I det følgende vil funksjonaliteten av oppfinnelsen bli beskrevet i detalj basert på foretrukne utførelser. F.eks. blir parameterinformasjon om forskjellige typer, f.eks. ICLD, ICTD, ICC og annen parametersettinformasjon som kan defineres i fremtiden, opptatt i forskjellige og separate datadeler, dvs. i forskjellige skaleringslag. For dette formål henvises det igjen til fig. 4a-4c. Parametersettene blir differensiert til obligatoriske parametersett, f.eks. interkanalnivåforskjeller og valgfrie parametersett, f.eks. interkanaltidsforskj eller og interkanalkorreleringsverdiparametersett.
Informasjon om antallet obligatoriske parametersett (numBccDataMand) og nærværet (OptBccDataPresent) og antallet valgfrie parametersett (numBccDataOpt) blir tilveiebrakt. Normalt avhenger informasjonen om antallet obligatoriske parametersett (numBccDataMand) av systemspesifikasjonen og behøver ikke nødvendigvis å bli overført eksplisitt men kan være fast nedlagt mellom koderen og dekoderen. På den annen side er det foretrukket å eksplisitt overføre antallet valgfrie parametersett (numBccDataOpt). Når nærværsparameteret indikerer nærværet av valgfrie parametersett som vist på fig. 3a, blir en tilsvarende evaluering av informasjonen om det valgfrie parametersett, påbegynt.
I den foretrukne utførelse av oppfinnelsen er det videre tilveiebrakt en identifikator (BccDatald) for hvert parametersett. Denne identifikator leverer informasjon om parametersettype, f.eks. ICLD, ICTD eller ICC og/eller syntaksversjonen av et bestemt parametersett, som også vist på fig. 3b. Normalt blir identifikatoren for obligatoriske parametersett signalert implisitt mens identifikatoren for valgfrie parametere blir signalert eksplisitt. I dette tilfellet må det imidlertid legges ned mellom koderen og dekoderen at det første parametersett f.eks. er det obligatoriske parametersett som i det faste tilfellet med nedlegging f.eks. omfatter interkanalnivåforskj eller. Alternativt kan parametersettypeinformasjonen også defineres implisitt ved å foreskrive rekkefølgen av parametersettyper.
Parametersettene vil fortrinnsvis omfatte parametersettlengdeinformasjon. Ved å tilveiebringe slik informasjon om parametersettlengden blir det mulig for dekoderen å ignorere dette parametersett ved ganske enkelt å hoppe over de tilhørende biter uten at dekoderen vet nøyaktig bitstrømssyntaksen av parametersettet. For dette formål henvises det til fig. 4b.
I den foretrukne utførelse av oppfinnelsen, omfatter obligatoriske parametersett således ikke parametersettlengdeinformasjon siden dekoderen må parse og behandle dataene på det obligatoriske parametersett i alle tilfelle i stedet for å ganske enkelt å forkaste dem. Således bør en dekoder kunne bli implementert til å forutsette når den finner et parametersett og dette ikke inneholder tilhørende ytterligere informasjon, at parametersettet, f.eks. ICLD, fins blant de bestemte, tilgjengelige parametersett og at, på grunn av at det ikke omfatter tilsvarende informasjon, at dette parametersettet er et obligatorisk parametersett.
For valgfrie parametersett kan parametersettlengdeinformasjonen overføres eller ikke avhengig av omstendighetene. En enkelt regel kan være at alle valgfrie parametersett, for å forbedre samvirloiingen mellom koderen og dekoderen, omfatter parametersettlengdeinformasjon. For å spare biter, behøver imidlertid lengdeinfor masjonen ikke å bli overført for det siste parametersett siden det ikke er behov for å hoppe over disse dataene og aksessere et etterfølgende parametersett siden parametersettet er det siste parametersett likevel. Denne fremgangsmåte er især anvendelig når en datablokk som vist på fig. la faktisk avsluttes av i-parametersettet 12c og når deretter det f.eks. ikke fins styreinformasjon osv. for blokken av sumsignalet og/eller av M-overføringskanaler som akkurat har blitt behandlet.
En eksplisitt signalering kan være at overføringen av parameterlengdeinforma-sjon, f.eks. ifølge ressurstilgjengelig informasjon 32 (fig. 2b) kan signaleres dynamisk av koderen ved hjelp av et bistrømselement som informerer en dekoder om nærværet/ lengden av parametersettlengdeinformasjonen, som allerede vist under fig. 3d.
I det følgende vil det bli beskrevet en foretrukket utførelse for en dekoding av en dekoder vist på fig. 2b. Den foretrukne dekoder sjekker først tilgjengeligheten av et obligatorisk parametersett som fortrinnsvis vil være interkanalnivåforskj eller. Når videre syntaks versjonsnummeret av ILD-parametersettet blir høyere enn versjonsnummeret som selve dekoderen kan dekode, idet dekoderen f.eks. støtter syntaksversjoner fra 1 til n, kan ingen rekonstruksjon utføres av innretningen 31 for rekonstruering av fig. 2b. I alle andre tilfeller kan en bestemt form for en valideringsdekodingsprosess utføres ved dekoding av obligatorisk parametersett og utføre, når ingen valgfrie parametersett blir brukt, en flerkanalstese bare ved å bruke det obligatoriske parametersett.
Når en dekoder detekterer et valgt fritt parametersett, kan den imidlertid bruke det eller forkaste innholdet. Hvilken av de to mulighetene som velges, avhenger av f.eks. scenariet nevnt nedenfor.
Hvis syntaksversjonsnummeret av det valgfrie parametersett er høyere enn den installerte syntaksversjonsevne til selve dekoderen for denne parametersettype, kan ikke denne parametersettypen bli behandlet av dekoderen og vil bli forkastet. I dette tilfellet vil det imidlertid fremdeles oppnås en gyldig dekoding uten å utføre den forbedrede flerkanals rekonstruksjon ved å bruke den valgfrie parametersettype. Hvis innholdet av det valgfrie parametersett imidlertid tas i betraktning, avhengig av dekoderens muligheter, vil det skje en rekonstruksjon av høyere kvalitet.
F.eks. skal det bemerkes at syntesen som bruker interkanalsammen-hengsverdier kan oppta en betydelig mengde beregningsressurser. Således kan en dekoder med lav kompleksitet f.eks. ignorere dette parametersett avhengig av ressurs-kontrollinformasjonen mens en dekoder som kan levere en høyere utgangskvalitet vil hente ut og bruke alle parametersettene, dvs. både de obligatoriske og valgfrie parametersett for rekonstruksjonen. I en foretrukket utførelse blir en beslutning om å bruke/ forkaste et parametersett foretatt basert på tilgjengeligheten av beregningsressurser på et tilsvarende tidspunkt, dvs. dynamisk.
Det nye konseptet gir muligheten til kompatibelt å oppdatere bitstrømsformatet for ikke-obligatoriske, dvs. valgfrie parametersettyper uten å forstyrre dekodingsevnen til eksisterende dekodere, dvs. bakoverkompatibiliteten. Videre sikrer oppfinnelse i alle tilfeller at eldre dekodere vil generere et ugyldig signal som i det verste tilfellet kan føre til at høyttalerne ødelegges når en oppdatering av syntaksen utføres ved å øke syntaksversjonsnummeret av et obligatorisk parametersett, dvs. ILD-informasjon eller eventuelt som vist f.eks. av feltet "BccDatald" nr. 4 på fig. 3b.
Det nye konsept skiller seg således fra en klassisk bitstrømssyntaks ved at en dekoder må vite hele syntaksen for hvert parametersett som kan brukes i en bitstrøm for å kunne først lese inn alle parametersettene i det første sted for deretter å kunne drive de tilsvarende prosesser og elementer, som f.eks. vist på fig. 7 med tilsvarende parametere. En ny dekoder vil hoppe over blokkene 126 og 128 når bare interkanalnivåforskj eller har blitt hentet ut som obligatoriske parametersett for å utføre en flerkanals rekonstruksjon, selv om den er av lavere kvalitet.
I sum vil det bli vist enda en gang de vesentlige trekk ved koderen som fortrinnsvis blir brukt av dekoderen for å oppnå en effektiv og høykvalitetsdekoding med en datastrøm av lav datarate.
Hvis et parametersett er mindre viktig enn et annet parametersett ved rekonstruksjon av K utgangssignaler i forhold til kvaliteten av et rekonstruert flerkanalsignal, blir innretningen 25 for skriving utformet for å skrive datasettet, slik at en rekonstruksjon blir mulig uten å bruke det mindre viktige datasett.
Fortrinnsvis er anordningen 25 for skriving videre konstruert for å tilveiebringe et parametersett med en tilhørende identifikator 100-105, hvor en identifikator for et parametersett indikerer at parametersettet absolutt må brukes for en rekonstruksjon eller hvor en identifikator for et annet parametersett indikerer at parametersettet bare kan brukes valgfritt for en rekonstruksjon.
Fortrinnsvis er innretningen 25 for skriving videre konstruert for å skrive M overføringskanaler til en overføringskanaldel 11 av datasettet av datastrømmen for å skrive et første parametersett til en første parametersettdel 12a og skrive et andre parametersett til en andre parametersettdel 12b, slik at en dekoder kan rekonstruere K utgangssignaler uten å avlese og fortolke den andre parametersettdel (12b).
Hvis parametersettene blir valgt fra den følgende gruppe som omfatter interkanalnivåforskjeller, interkanaltidsforskj eller, interkanalfaseforskj eller eller mterkanalsammenhengsinformasjon, blir innretningen 25 for skriving konstruert for å merke interkanalnivåforskjellenes parametersett som obligatorisk for dekoding og merke minst et annet parametersett av gruppen som valgfritt for dekoding.
Fortrinnsvis er innretningen 25 for skriving utformet for å forsyne det andre parametersett med lengdeinformasjon 106-108 som indikerer at datamengden i datasettet tilhører det andre parametersett, slik at dekoderen kan hoppe over datamengden som er basert på lengdeinformasjon hvor lengdeinformasjonen fortrinnsvis omfatter et første sett for å signalisere en lengde i biter av et lengdefelt og hvor lengdefeltet omfatter lengden i biter som en mengde av biter av det andre parametersett blir gitt for.
Fortrinnsvis er innretningen 25 for skriving videre utformet for å skrive en antallinformasjon 102 til datastrømmen som indikerer et antall av valgfrie parametersett uten hvilke, en rekonstruksjon av K utgangssignaler kan utføres av dekoderen.
Fortrinnsvis er innretningen 25 for skriving videre utformet for å knytte syntaksversjonsinformasjon 103-105 til parametersettene, slik at en dekoder vil utføre en rekonstruksjon ved å bruke bare tilsvarende parametersett når syntaksversjonsinformasjonen har en bestemt status.
Fortrinnsvis er det videre bare syntaksversjonsinformasjon for det andre parametersett og ytterligere, valgfrie parametersett.
Videre kan et siste, valgfritt parametersett i en sekvens av parametersettene i datastrømmen ikke omfatte tilhørende lengdeinformasjon.
Videre kan innretningen 25 for skriving være utformet for å signalisere nærvær og lengde av parametersettlengdeinformasjonen dynamisk i datastrømmen.
Innretningen 22 for levering kan være utformet for å levere en sekvens av datablokker for M overføringskanaler som er basert på en sekvens av blokker av tidssampler for minst en opprinnelig kanal.
Avhengig av omstendighetene, kan den nye fremgangsmåte for å generere og/ eller dekode implementeres i maskinvare eller i programvare. Implementeringen kan utføres på et digitalt lagringsmedium, især en floppydisk eller CD med styre signaler som kan leses elektronisk og som samvirker et programmerbart datasystem, slik at fremgangsmåten kan utføres. Generelt består oppfinnelsen således i et dataprogram med en programkode lagret på en maskinlesbar bærer for å utføre fremgangsmåten når dataprogrammet kjøres på en datamaskin. Med andre ord kan oppfinnelsen således realiseres som et dataprogram med en programkode for å utføre fremgangsmåten når dette kjøres på en datamaskin.

Claims (17)

1. Anordning for å generere et kodet flerkanalsignal som representerer et ikke-kodet flerkanalsignal som omfatter N opprinnelige kanaler, idet N er lik eller større enn 2, som omfatter: • midler (22) for å tilveiebringe parameterinformasjon (24a, 24b, 24c) for å gjenskape K ut-kanaler fra M transmisjonskanaler (23), hvor M er lik eller større enn 1 og lik eller mindre enn N, hvor k er større enn M og lik eller mindre enn N, hvor parameterinformasjonen omfatter minst ett første parametersett og et ulik andre parametersett for å gjenskape én og den samme ut-kanalen, idet det andre parametersett omfatter tilknyttet syntaksversjon-informasjon (103 til 105); og • midler (25) for å skrive en datastrøm (26), hvor midlene (25) for å skrive er utformet for å skrive det første og det andre parametersett inn i datastrømmen slik at en gjenskaping av minst én av de K ut-kanalene kan utføres i en dekoder ved å bruke det første parametersett, uten å bruke det andre parametersett og å bruke minst én av de M transmisjonskanaler (23), • hvor midlene (25) for å skrive er utformet for å skrive lengdeinformasjon som angir en datamengde av det tilhørende andre parametersett inn i datastrømmen.
2. Anordning for dekoding av et kodet flerkanalsignal som representerer et ikke-kodet flerkanalsignal som omfatter N opprinnelige kanaler, idet den kodete flerkanalsignal er representert gjennom en datastrøm som omfatter parameterinformasjon for å gjenskape K ut-kanaler fra M transmisjonskanaler, hvor M er lik eller større enn 1 og lik eller mindre enn N, hvor K er større enn M og lik eller mindre enn N, hvor parameterinformasjonen omfatter minst to ulike parametersett for å gjenskape én og samme ut-kanal, og hvor det første og det andre parametersett skrives inn i datastrømmen slik at en gjenskaping av de K ut-kanalene kan utføres i en dekoder ved å bruke det første parametersett og uten å bruke det andre parametersett, idet det andre parametersett omfatter tilknyttet syntaksversjon-informasjon (103 til 105), som omfatter: midler for å lese en data strøm (28) for å lese datastrømmen for å lese inn det første parametersett (30a) og for å hoppe over det andre parametersett (30b) når syntaksversjonsinformasjonen tilknyttet det andre parametersett ikke er kompatibel med gitt syntaksversjon-informasjon av dekodmgsanordningen, og for å lese inn det andre parametersett når syntaksversjonsinformasjonen er kompatibel med den gitte syntaksversjonsinformasjonen, idet det andre parametersett omfatter lengdeinformasjon som angir en datamengde av det tilhørende andre parametersett, og hvor lesemidlene (28) er utformet for å hoppe over en datamengde i datasettet angitt av lengdeinformasjonen basert på lengdeinformasjonen uten å parse dataene til det andre parametersett.
3. Anordning ifølge krav 2, som videre omfatter: gjenskapingsmidler (32) for å gjenskape de K ut-kanalene ved å bruke de M transmisjonskanalene og det første parametersett, men uten å bruke det andre parametersett.
4. Anordning ifølge krav 2 eller 3, hvor det første parametersett omfatter tilknyttet syntaksversjonsinformasjon (103 til 105), og hvor lesemidlene (28) er utformet for å lese den tilhørende syntaksversjonsinformasjonen og å drive gjenskapingsmidlene (31) slik at en gjenskaping utføres av gjenskapingsmidlene kun når den leste syntaksversjonsinformasjonen er kompatibel med gitt syntaksversjonsinformasjon av dekodingsanordningen.
5. Anordning ifølge ett av kravene 2 til 4, hvor lesemidlene (28) er styrbare (32) for å skaffe tilveie ressurstngjengelighetsinformasjon, og hvor lesemidlene (28) er videre utformet for å lese inn det andre parametersett når ressurstilgjengelighetsinformasjonen indikerer tilstrekkelig med ressurser, og for å hoppe over det andre parametersett når ressurstilgjengelighetsinformasjonen angir utilstrekkelig med ressurser.
6. Anordning ifølge ett av kravene 2 til 5, hvor ett parametersett er mindre viktig enn et annet parametersett under gjenskapingen av de K ut-kanaler med hensyn til en kvalitet av et gjenskapt flerkanalsignal, og hvor lesemidlene for en datastrøm (28) er utformet for å hoppe over det mindre viktige datasett.
7. Anordning ifølge ett av kravene 2 til 6, hvor datastrømmen omfatter et parametersett med en tilhørende identifikator (100 til 105), hvor en identifikator for et parametersett angir at parametersettet absolutt må benyttes for en gjenskaping, eller hvor en identifikator for et annet parametersett angir at parametersettet kun må brukes valgfritt for en gjenskaping, hvor lesemidlene for en datastrøm (28) er utformet for å detektere identifikatoren og for å lese det obligatoriske parametersett og for å hoppe over et valgfritt parametersett basert på den detekterte identifikatoren.
8. Anordning ifølge ett av kravene 2 til 7, hvor datastrømmen omfatter et første parametersett i en første parametersett-del (12a) og et andre parametersett i en annen parametersett-del (12b), hvor lesemidlene for en datastrøm er utformet for å tolke data-strømmen med tanke på parametersett-delene og for å lese inn den første parametersett-delen og for å hoppe over den andre parametersett-delen.
9. Anordning ifølge ett av kravene 2 til 8, hvor parametersett velges fra følgende gruppe som omfatter nivåforskjeller mellom kanalene, tidsforskjeller mellom kanalene, faseforskjeller mellom kanalene eller koherensinformasjon om kanalene, hvor det, i datastrømmen, parametersettet vedrørende nivåforskjeller mellom kanalene avmerkes som absolutt nødvendig til dekodingen, og hvor minst ett annet parametersett av gruppen avmerkes som valgfritt for dekodingen, og hvor lesemidlene for en datastrøm (28) er utformet for å lese inn parametersettet vedrørende nivåforskjeller mellom kanalene og for å hoppe over et annet parametersett fra gruppen.
10. Anordning ifølge ett av kravene 2 til 9, hvor datastrømmen omfatter tall-informasjon (102) som angir et antall valgfrie parametersett uten hvilke en gjenskaping av de K ut-kanalene kan gjøres av dekoderen, hvor lesemidlene for en datastrøm er utformet for å lese inn minst ett valgfritt parametersett basert på tallinformasjonen.
11. Anordning ifølge krav 2, hvor det finnes tilknyttet syntaksversjonsinformasjon i datastrømmen for det andre parametersett og ytterlige valgfrie parametersett, dersom aktuelt, hvor det finnes ingen syntaksversjonsinformasjon for det første parametersett.
12. Anordning ifølge ett av de forutgående krav, hvor et siste valgfritt parametersett i en sekvens med parametersett i datastrømmen ikke omfatter noe tilknyttet lengdeinformasjon, hvor lesemidlene for en datastrøm (28) er utformet ikke å lese og tolke noe lengdeinformasjon forut for å lese inn det siste valgfrie parametersett.
13. Anordning ifølge ett av kravene 2 til 12, hvor tilstedeværelse og lengde av parametersett-lengdeinformasjon signaliseres dynamisk i datastrømmen, og hvor lesemidlene for en datastrøm (28) er utformet for å detektere den første tilstedeværelsen av parametersett-lengdeinformasjon i datastrømmen for så å trekke ut lengden av parametersett-lengdeinformasjonen fra datastrømmen basert på en detektert tilstedeværelse.
14. Anordning ifølge ett av kravene 3 til 13, hvor de M transmisjonskanalene er BCC-nedmiksingskanaler og parametersettene omfatter BCC-parametere, og hvor gjenskapingsmidlene (32) er utformet for å utføre en BCC-syntese.
15. Fremgangsmåte for å generere et kodet flerkanalsignal som representerer et ikke-kodet flerkanalsignal som omfatter N opprinnelige kanaler, idet N er lik eller større enn 2, som omfatter: å tilveiebringe (22) parameterinformasjon (24a, 24b, 24c) for å gjenskape K ut- kanaler fra M transmisjonskanaler (23), hvor M er lik eller større enn 1 og lik eller mindre enn N, hvor K er større enn M og lik eller mindre enn N, hvor parameterinformasjonen omfatter minst to volike parametersett for å gjenskape én og samme ut-kanalen; og å skrive (25) en datastrøm (26) ved å skrive det første og det andre parametersett inn i datastrømmen slik at en gjenskaping av minst én av de K ut-kanalene kan gjøres ved å bruke det første parametersett, uten å bruke det andre parametersett og å bruke minst én av de M transmisjonskanaler (23), idet det andre parametersett omfatter tilknyttet syntaksversjonsinformasjon (103 til 105), hvor under skrivingen (25) lengdeinformasjon som angir en datamengde av det tilhørende andre parametersett skrives inn i datastrømmen.
16. Fremgangsmåte for dekoding av et kodet flerkanalsignal som representerer et ikke-kodet flerkanalsignal som omfatter N opprinnelige kanaler, idet den kodete flerkanalsignal er representert gjennom en datastrøm som omfatter parameterinformasjon for å gjenskape K ut-kanaler fra M transmisjonskanaler, hvor M er lik eller større enn 1 og lik eller mindre enn N, hvor K er større enn M og lik eller mindre enn N, hvor parameterinformasjonen omfatter minst to ulike parametersett for å gjenskape én og samme ut-kanalen, og hvor det første og det andre parametersett skrives inn i datastrømmen slik at en gjenskaping av de K ut-kanalene kan utføres i en dekoder ved å bruke det første parametersett og uten å bruke det andre parametersett, idet det andre parametersett omfatter tilknyttet syntaksversjonsinformasjon (103 til 105), som omfatter: å lese (28) datastrømmen for å lese inn det første parametersett (30a) og for å hoppe over det andre parametersett (30b) når syntaksversjonsinformasjonen tilknyttet det andre parametersett ikke er kompatibel med gitt syntaksversjonsinformasjon av dekodingsanordningen, og for å lese inn det andre parametersett når syntaksversjons- informasjonen er kompatibel med den gitte syntaksversjonsinformasjonen, idet det andre parametersett omfatter lengdeinformasjon som angir en datamengde av det tilhørende andre parametersett, og hvor lesemidlene (28) er utformet for å hoppe over en datamengde i datasettet angitt av lengdeinformasjonen basert på lengdeinformasjonen uten å parse dataene til det andre parametersett.
17. Datamaskinprogram som har en programkode for å utføre fremgangsmåten ifølge krav 15 eller 16, når datamaskinprogrammet kjører på en datamaskin.
NO20070903A 2004-09-03 2007-02-16 Generering av et kodet flerkanalsignal og dekoding av et kodet flerkanalsignal NO338928B1 (no)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004042819A DE102004042819A1 (de) 2004-09-03 2004-09-03 Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
PCT/EP2005/009293 WO2006027138A1 (de) 2004-09-03 2005-08-29 Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals

Publications (2)

Publication Number Publication Date
NO20070903L NO20070903L (no) 2007-04-03
NO338928B1 true NO338928B1 (no) 2016-10-31

Family

ID=35094601

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20070903A NO338928B1 (no) 2004-09-03 2007-02-16 Generering av et kodet flerkanalsignal og dekoding av et kodet flerkanalsignal

Country Status (17)

Country Link
US (1) US8145498B2 (no)
EP (1) EP1763870B1 (no)
JP (1) JP4856641B2 (no)
KR (1) KR100908081B1 (no)
CN (1) CN101044550B (no)
AU (1) AU2005281937B2 (no)
BR (1) BRPI0515623B1 (no)
CA (1) CA2578190C (no)
DE (1) DE102004042819A1 (no)
ES (1) ES2454670T3 (no)
HK (1) HK1107174A1 (no)
IL (1) IL181469A (no)
MX (1) MX2007002569A (no)
NO (1) NO338928B1 (no)
PL (1) PL1763870T3 (no)
RU (1) RU2379768C2 (no)
WO (1) WO2006027138A1 (no)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP2008542816A (ja) 2005-05-26 2008-11-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化及び復号化方法
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US8126152B2 (en) * 2006-03-28 2012-02-28 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for a decoder for multi-channel surround sound
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
CN101529898B (zh) 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
DE102007007830A1 (de) * 2007-02-16 2008-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
EP2083584B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR100998913B1 (ko) * 2008-01-23 2010-12-08 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR20100137159A (ko) * 2009-06-22 2010-12-30 삼성전자주식회사 방송 수신기 및 그의 채널 전환 방법
KR101751559B1 (ko) * 2009-10-30 2017-06-27 선 페이턴트 트러스트 복호방법, 복호장치, 부호화 방법 및 부호화 장치
EP2544465A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator
US9451252B2 (en) 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
WO2013149670A1 (en) * 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder
CA2870067C (en) * 2012-04-16 2017-01-17 Nokia Corporation Video coding and decoding using multiple parameter sets which are identified in video unit headers
US9602827B2 (en) 2012-07-02 2017-03-21 Qualcomm Incorporated Video parameter set including an offset syntax element
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2717261A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
US20150340043A1 (en) * 2013-01-14 2015-11-26 Koninklijke Philips N.V. Multichannel encoder and decoder with efficient transmission of position information
JP6250071B2 (ja) 2013-02-21 2017-12-20 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
KR20230020553A (ko) 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
US9565437B2 (en) 2013-04-08 2017-02-07 Qualcomm Incorporated Parameter set designs for video coding extensions
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
WO2016171002A1 (ja) * 2015-04-24 2016-10-27 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
US10356800B2 (en) * 2016-05-09 2019-07-16 Qualcomm Incorporated Scalable numerology with symbol boundary alignment for uniform and non-uniform symbol duration in wireless communication
WO2019088863A1 (ru) * 2017-10-30 2019-05-09 Общество С Ограниченной Ответственностью "Теквел Разработка" Способ и компьютерное устройство для автоматического определения топологии связей
CN108039175B (zh) 2018-01-29 2021-03-26 北京百度网讯科技有限公司 语音识别方法、装置及服务器
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
US11528574B2 (en) 2019-08-30 2022-12-13 Sonos, Inc. Sum-difference arrays for audio playback devices

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1376538A1 (en) * 2002-06-24 2004-01-02 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JP2000151413A (ja) * 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
US6266782B1 (en) * 1998-11-30 2001-07-24 Siemens Information And Communication Networks, Inc. Apparatus and methods for inband protocol correction in distributed object networking
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4244492B2 (ja) * 2000-03-24 2009-03-25 ソニー株式会社 情報処理装置、情報配信システム、情報処理方法、及び記録媒体
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6718507B1 (en) * 2000-09-12 2004-04-06 At&T Corp. System and method for representing compressed information
JP2002175097A (ja) 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
DE60207731T2 (de) * 2001-08-03 2006-08-10 Koninklijke Philips Electronics N.V. Datenschutzsystem und -verfahren für audio-video übertragung
US8498422B2 (en) 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
KR101049751B1 (ko) 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US6903669B1 (en) * 2003-10-03 2005-06-07 Cirrus Logic, Inc. Systems and methods for decoding compressed data
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1376538A1 (en) * 2002-06-24 2004-01-02 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
FALLER C., BAUMGARTE F.: "Binaural Cue Coding -Part II: Schemes and Applications", IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING., IEEE SERVICE CENTER, NEW YORK, NY., US, vol. 11, no. 6, 6 October 2003 (2003-10-06), US, pages 520 - 531, XP002338415, ISSN: 1063-6676, DOI: 10.1109/TSA.2003.818108 *
HERRE J, ET AL: "MP3 Surround: Efficient and Compatible Coding of Multi Channel Audio", AUDIO ENGINEERING SOCIETY CONVENTION PAPER, NEW YORK, NY, US, 8 May 2004 (2004-05-08) - 11 May 2004 (2004-05-11), US, pages 1 - 14, XP002350798 *
HERRE J, ET AL: "Spatial audio coding - an enabling technology for bitrate-efficient and compatible multichannel audio broadcasting", IBC CONFERENCE PAPERS, XX, XX, 9 September 2004 (2004-09-09), XX, pages 1 - 12, XP002350799 *
ISO/IEC JTC1/SC29/WG11: "Text of ISO/IEC 14496-3:2001/PDAM 1", ISO/IEC JTC1/SC29/WG11 MPEG2002/N4764, XX, XX, 1 May 2002 (2002-05-01), XX, pages 6 - 18, XP002350800 *
SCHUIJERS E G P, ET AL.: "ADVANCES IN PARAMETRIC CODING FOR HIGH-QUALITY AUDIO", IEEE BENELUX WORKSHOP ON MODEL BASED PROCESSING AND CODING OFAUDIO, XX, XX, 15 November 2002 (2002-11-15), XX, pages 73 - 79, XP001156065 *

Also Published As

Publication number Publication date
CA2578190A1 (en) 2006-03-16
RU2007112113A (ru) 2008-10-20
US8145498B2 (en) 2012-03-27
IL181469A0 (en) 2007-07-04
MX2007002569A (es) 2007-07-05
HK1107174A1 (en) 2008-03-28
WO2006027138A1 (de) 2006-03-16
EP1763870B1 (de) 2014-03-05
PL1763870T3 (pl) 2014-08-29
EP1763870A1 (de) 2007-03-21
KR100908081B1 (ko) 2009-07-15
US20070219808A1 (en) 2007-09-20
NO20070903L (no) 2007-04-03
DE102004042819A1 (de) 2006-03-23
JP4856641B2 (ja) 2012-01-18
AU2005281937A1 (en) 2006-03-16
BRPI0515623A8 (pt) 2018-07-31
JP2008511848A (ja) 2008-04-17
ES2454670T3 (es) 2014-04-11
CN101044550B (zh) 2011-05-11
CA2578190C (en) 2012-09-11
RU2379768C2 (ru) 2010-01-20
IL181469A (en) 2011-09-27
BRPI0515623B1 (pt) 2019-05-21
AU2005281937B2 (en) 2008-10-09
KR20070051875A (ko) 2007-05-18
BRPI0515623A (pt) 2008-07-29
CN101044550A (zh) 2007-09-26

Similar Documents

Publication Publication Date Title
NO338928B1 (no) Generering av et kodet flerkanalsignal og dekoding av et kodet flerkanalsignal
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP5255702B2 (ja) 多チャネルオーディオ信号のバイノーラル・レンダリング
NO20200106A1 (no) Kompatibel flerkanal-koding/dekoding
CA2603027C (en) Device and method for generating a data stream and for generating a multi-channel representation
KR101251426B1 (ko) 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
JP2008536184A (ja) 適応残差オーディオ符号化
US20070168183A1 (en) Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore