NO180030B - Polyfonisk koding - Google Patents

Polyfonisk koding Download PDF

Info

Publication number
NO180030B
NO180030B NO914947A NO914947A NO180030B NO 180030 B NO180030 B NO 180030B NO 914947 A NO914947 A NO 914947A NO 914947 A NO914947 A NO 914947A NO 180030 B NO180030 B NO 180030B
Authority
NO
Norway
Prior art keywords
filter
signal
channel
sum
difference
Prior art date
Application number
NO914947A
Other languages
English (en)
Other versions
NO914947D0 (no
NO180030C (no
NO914947L (no
Inventor
Christopher Ellis Holt
Edward Munday
Barry Michael George Cheetham
Original Assignee
British Telecomm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=10658483&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=NO180030(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by British Telecomm filed Critical British Telecomm
Publication of NO914947D0 publication Critical patent/NO914947D0/no
Publication of NO914947L publication Critical patent/NO914947L/no
Publication of NO180030B publication Critical patent/NO180030B/no
Publication of NO180030C publication Critical patent/NO180030C/no

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Macromolecular Compounds Obtained By Forming Nitrogen-Containing Linkages In General (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Treatments For Attaching Organic Compounds To Fibrous Goods (AREA)
  • Polymers With Sulfur, Phosphorus Or Metals In The Main Chain (AREA)
  • Separation Using Semi-Permeable Membranes (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Stereophonic System (AREA)

Description

Foreliggende oppfinnelse vedrører polyfoniske kodings-teknikker, spesielt, men ikke utelukkende for koding av talesignaler.
Det er velkjent at polyfonisk, spesielt stereofonisk lyd er mer perseptuelt tiltalende enn monofonisk lyd. Når flere lydkilder f.eks. i et konferanserom, skal overføres til et annet rom, muliggjør polyfonisk lyd en rommessig rekonstruksjon av det opprinnelige lydfeltet med et bilde av hver lydkilde oppfattet ved et identifiserbart punkt som svarer til dens posisjon i det opprinnelige konferanserommet. Dette kan eliminere forvirring og misforståelser under audiokonferanse-diskusjoner siden hver deltager kan identifiseres både ved hjelp av lyden av hans stemme og ved hjelp av hans oppfattede posisjon i konferanserommet.
Det er uunngåelig at polyfoniske overføringer krever en økning i overføringskapasitet sammenlignet med monofoniske overføringer. Den konvensjonelle løsning med å overføre to uavhengige kanaler som derved dobler den nødvendige over-føringskapasiteten, påfører uakseptabelt høye omkostninger ved mange anvendelser og er ikke mulig i visse tilfeller på grunn av nødvendigheten av å bruke eksisterende kanaler med faste overføringskapasiteter.
I stereofoniske systemer (dvs. polyfoniske tokanal-systemer) blir to mikrofoner (heretter referert til som venstre og høyre mikrofoner) ved forskjellige posisjoner brukt til å ta opp lyd som genereres i et rom (f.eks. av en person eller personer som snakker). Signalene som tas opp av mikrofonene er vanligvis forskjellige. Hvert mikrofonsignal (heretter referert som xL(t) med Laplace-transformasjonen xL(s) og xR(t) med Laplace-transformasjonen XR(s), respektive) kan betraktes som overlagringen av kildesignaler behandlet ved hjelp av respektive akustiske transfer-funksjoner. Disse transferfunksjonene blir sterkt påvirket av avstanden mellom lydkildene og hver mikrofon, og også av rommets akustiske egenskaper. I tilfellet med en enkel kilde, f.eks. en enkelt person som taler ved et fast punkt i rommet, gir avstandene mellom kilden og den venstre og den høyre mikrofonen opphav til forskjellige forsinkelser, og det vil også være forskjellige grader av demping. I de fleste praktiske omgivelser slik som konferanserom, kan det signalet som når hver mikrofon ha forplantet seg via mange reflekterte baner (f.eks. fra vegger eller tak) samt direkte, noe som frembringer tidsspredning, frekvensavhengig farving på grunn av resonnanser og antiresonnanser, og kanskje enkelte ekko.
Fra det foregående kan signalet fra en mikrofon teore-tisk relateres formelt til det fra den andre ved å konstrue-re en interkanal-transferfunksjon H f.eks.; dvs. XL(s) = H(s) XR(s) hvor s er kompleks frekvensparameter. Dette utsagnet er basert på en antagelse av linearitet og tidsin-varians for virkningen av romakustikk på et lydsignal når det forplanter seg fra sin kilde til en mikrofon. Når man imidlertid mangler kjennskap til beskaffenheten av H, postu-lerer dette utsagnet bare en korrelasjon mellom de to signalene. En slik postulering synes imidlertid iboende fornuf-tig, i det minste i det spesielle tilfellet med en enkelt lydkilde, og derfor bør en måte til reduksjon av den bit-hastigheten som er nødvendig for å representere stereo-signaler, være å redusere redundansen til en i forhold til den andre (å redusere denne korrelasjonen) før overføring og gjeninnføre den etter mottagelse.
Vanligvis er H(s) ikke entydig og kan være signal- og tids-avhengig. Når imidlertid kildesignalene er hvite og ukorrelerte, dvs. når deres autokorrelasjonsfunksjoner er null bortsett fra ved t=0 og deres krysskorrelasjons-funksjoner er null for alle t, vil H(s) avhenge av faktorer som ikke er utsatt for rask forandring, slik som romakustikk og posisjonene til mikrofonene og lydkildene, i stedenfor beskaffenheten til kildesignalene som kan endre seg hurtig.
For å realisere et slikt system i fysisk form må de fundamentale problemer med kausalitet og stabilitet over-vinnes. Betrakt for et øyeblikk et enkelt kildesignal som er forsinket med dL sekunder før det når den venstre mikrofonen og med dR sekunder før det når den høyre mikrofonen
(selv om poenget som skal fastslås, har mer generelle impli-kasjoner) . Hvis kilden er nær f.eks. den venstre mikrofonen, så vil dL være mindre enn dR. Interkanal-transferfunksjonen H(s) må forsinke xL(t) med differansen mellom de
to forsinkelsene, dR - dL for å frembringe den høyre kanalen xR(t). Siden dR - dL er positiv, vil H(s) være kausal. Hvis signalkilden nå flyttes nærmere den høyre mikrofonen enn den venstre, blir dR - dL negativ og H(s) blir ikke-kausal; med andre ord er der ikke noe kausalt forhold mellom den høyre kanal og den venstre kanal, men heller omvendt slik at den høyre kanal ikke lenger kan forutsies fra den venstre kanal, siden en gitt hendelse først inntreffer i den høyre kanal. Man vil derfor innse at i et enkelt system hvor en fast kanal alltid overføres og den andre blir rekonstruert fra denne, er umulig å realisere direkte.
Fra US patent nr. 4,815,132 er kjent et stereofonisk kodingssystem som mottar en høyre og en venstre kanal. Systemet overfører den høyre kanalen, men for venstre kanal benytter det et flerordens adaptivt filter til å generere filterkoeffisienter (eller et filter-restsignal) som sendes i stedet. Mottakeren benytter denne informasjonen til å styre et filter som filtrerer den høyre kanalen for å generere en rekonstruert venstre kanal. Det viser seg imidlertid at denne type teknikk i praksis kan bli beheftet med en feil i form av en "viskeeffekt", antagelig fordi det adaptive filteret i tillegg til å modellere romakustikkens overf©ringsfunksjon, også forsøker å utføre en LPC-analyse av talen.
Foreliggende oppfinnelse tar sikte på å avhjelpe dette problemet, og oppfinnelsen defineres gjennom tre aspekter, nemlig gjennom et apparat for polyfonisk signalkoding, et apparat for tilsvarende dekoding, samt en fremgangsmåte for koding av polyfoniske inngangssignaler.
Ifølge et første aspekt ved oppfinnelsen er det til-veiebrakt et apparat for polyfonisk signalkoding, omfattende : - anordninger for å motta en første og minst en andre kanal; - en anordning for å generere rekonstrukjonsdata som muliggjør dannelse, fra den første kanalen, av et estimat av den andre kanalen idet genereringsanordningen kan bevirkes til periodisk generering av et antall filterkoeffisienter, som hvis de tilføres et flerordens-prediksjonsfilter, vil muliggjøre prediksjon av den annen kanal fra den første kanal som er filtrert på denne måten; og - en anordning for utmating av data som representer den første kanal og de nevnte rekonstruksjonsdata.
Apparatet kjennetegnes ved at det omfatter en anordning for filtrering av den første og annen kanal i samsvar med et filter som tilnærmer det spektralt inverse av den første kanal for å frembringe respektive filtrerte kanaler, idet den første filtrerte kanal derved blir betydelig spektralt hvittet eller bleket; og ved at genereringsanordningen 4 er koblet for å motta de filtrerte kanaler.
I en første utførelsesform er data for rekonstruksjonen av differansesignalet filterkoeffisienter. I en annen utførelsesform blir det restsignalet som representerer differansen mellom differansesignalet og sumsignalet når det er filtrert på denne måten, dannet ved senderen, og dette blir overført som data for rekonstruksjon av differansesignalet. I denne utførelsesformen kan prediksjons-restsignalet effektivt kodes for å muliggjøre bruk av en omvendt tilpasningsteknikk ved dekoderen for å utlede prediksjonsfilter-koeffisientene. Resten blir også brukt som et feil-signal som adderes til prediksjonsfilterets utgang ved dekoderen for å korrigere for unøyaktigheter i prediksjonen av differansekanalen fra sumkanalen. Denne "bare rest"-utførelsesformen er også nyttig når f.eks. den venstre kanalen blir predikert fra den høyre kanalen (uten å danne sum-og differanse-signaler) - forutsatt at det tas passende forholdsregler for å sikre kausalitet - for å gi polyfonisk reproduksjon med høy kvalitet. I en tredje utførelsesform blir begge overført.
Anordningen for generering av filterkoeffisientene er fortrinnsvis et adaptivt filter, særlig et brofilter. Denne filtertypen har også fordeler i polyfoniske ikke-sum- og differanse-systemer.
I foretrukne utførelsesformer blir variable forsinkelsesanordninger anordnet i minst en av inngangssignal-banene og styrt for å tidsutligne de to signalene før dannelse av sum- og differanse-signalene slik at kausale prediksjons-filtere av rimelig orden kan benyttes.
Dette aspektet ved oppfinnelsen har flere viktige fordeler: (i) "Sumsignalet" er fullt ut kompatibelt med monofonisk koding og er upåvirket av den polyfoniske koding unn-tatt når det gjelder innføring av en umerkelig forsinkelse. I tilfellet med tap av stereo, er monofonisk
reserve således tilgjengelig.
(ii) Sumsignalet kan overføres ved konvensjonelle kodings-teknikker med lav bithastighet (f.eks. LPC) uten
modifikasjon.
(iii) Kodingsteknikken for differansesignalene kan varieres for å passe til anvendelsen og den tilgjengelige over-føringskapasitet mellom de ovennevnte tre utførelses-former. Typen restsignal og prediksjonskoeffesienter kan også velges på flere forskjellige måter, mens like-vel det grunnleggende kodingsprinsippet beholdes. (iv) Totalt koder apparatet polyfoniske signaler med bare en moderat økning av behovet for bithastighet sammenlignet
med monofonisk overføring.
(v) Kodingen er digital og dermed vil apparatets ytelse være forutsigbar, ikke utsatt for aldringseffekter eller komponentdrift og det kan lett masseproduseres.
Ifølge et annet aspekt ved oppfinnelsen er det tilveiebragt et apparat for polyfonisk signaldekoding som omfatter: - anordninger for å motta data som representerer et sumsignal og rekonstruksjonsdata; og anordninger som reak-sjon på disse rekonstruksjonsdata kan bevirkes til å modifisere sumsignalet for å frembringe minst to utgangssinaler, hvor modifiseringsanordningene omfatter: - et variabelt flerordens prediktorfilter for å motta de nevnte signalrekonstruksjonsdata og modifisere sine koeffisienter i samsvar med dette, idet filteret er koblet for å motta sumsignalet og fra dette rekonstruere et utgangs-differansesignal; og - en anordning for å addere det rekonstruerte differansesignal til sumsignalet, og for å subtrahere det rekonstruerte differansesignalet fra sumsignalet, for å frembringe minst to utgangssignaler.
Signaldekodings-apparatet kjennetegnes ved at det omfatter et adaptivt hovedfilter innrettet for å filtrere sumsignalet i samsvar med omtrent det spektralt inverse av sumsignalet for å frembringe et hvittet utgangssignal, og et slavefilter innrettet for å filtrere differansesignalet, hvor slavefilteret er utformet for å ha en respons ekvivalent med det adaptive hovedfilteret.
Dette aspektet ved oppfinnelsen tilveiebringer som nevnt ovenfor, fordelen med et digitalt system som er kompatibelt med eksisterende teknikker og forenkler prosessen med modellering (ved koderen) av den nødvendige interkanal-transferfunksj on.
Stort sett tilsvarende dekodingsapparater er også tilveiebragt i henhold til oppfinnelsen, i likhet med systemer som omfatter slike kodings- og dekodings-apparater, spesielt i en anvendelse ved audiokonferanser, men også i en anvendelse med polyfonisk registrering. Andre sider ved oppfinnelsen fremgår av kravene og blir beskrevet nedenfor.
I et tredje aspekt omfatter oppfinnelsen en fremgangsmåte for koding av polyfoniske inngangssignaler, som omfatter: - frembringelse fra disse av et sumsignal som representerer summen av slike signaler; og rekonstruksjonsdata for å muliggjøre dannelse, fra sumsignalet, av et ytterligere av inngangssignalene; - frembringelse fra inngangssignalene av minst ett differansesignal som representerer en differanse mellom disse; - analysering av sum- og differanse-signalene og generering fra disse av et antall koeffisienter som, hvis de tilføres et flertrinns prediksjonsfilter, vil muliggjøre prediksjon av differansesignalet fra sumsignalet som er filtrert på denne måten; - idet det kodede utgangssignal omfatter sumsignalet og data som muliggjør rekonstruksjon av differansesignalet fra disse.
Fremgangsmåten ifølge oppfinnelsen kjennetegnes ved at at sumsignalet og differansesignalet før den nevnte analyse filtreres i samsvar med et filter som tilnærmer det spektralt inverse av sumsignalet, idet sumsignalet derved hovedsakelig hvittes spektralt.
Ordene "prediksjon" og "prediktor" i denne beskrivel-sen, innbefatter ikke bare prediksjon av fremtidige data ut fra tidligere data, men også estimering av foreliggende data på en kanal fra tidligere og foreliggende data på en annen kanal.
Oppfinnelsen vil nå bli illustrert ved hjelp av et eksempel under henvisning til de vedføyde tegninger, hvor: Fig. 1 generelt illustrerer en koder i henhold til et første aspekt ved oppfinnelsen;
fig. 2 generelt illustrerer en tilsvarende dekoder;
fig. 3a illustrerer en koder i henhold til en foretrukket utførelsesform av oppfinnelsen;
fig. 3b illustrerer en tilsvarende dekoder;
fig. 4a og 4b viser henholdsvis en tilsvarende koder og dekoder i henhold til en annen utførelsesform av oppfinnelsen;
fig. 5a og 5b illustrerer en koder og en dekoder ifølge en annen utførelsesform av oppfinnelsen; og
fig. 6 illustrerer en del av en koder ifølge en ytterligere utførelsesform av oppfinnelsen.
De illustrerte utførelsesformene er begrenset til to kanaler (stereo) for å lette fremstillingen, men oppfinnelsen kan generaliseres til ethvert antall kanaler.
En mulig metode til fjerning av redundansen mellom to inngangssignaler (eller prediksjon av en fra den annen) ville være å forbinde et adaptivt prediktorfilter mellom de to kanalene, hvis langsomt varierende parametere blir bereg-net ved hjelp av standard teknikker (slik som f.eks. blokk-krysskorrelasjonsanalyse eller sekvensiell gitteradapsjon). Ved audiokonferanser vil de to signalene stamme fra lydkilder innenfor et rom, og den akustiske transferfunksjonen mellom hver kilde og hver mikrofon vil vanligvis være kjen-netegnet ved svake poler (fra romresonnanser) og sterke nuller (som skyldes absorpsjon og destruktiv interferens). Et alle-null-filter kunne derfor frembringe en rimelig tilnærmelse til den akustiske transferfunksjonen mellom en kilde og en mikrofon, og et slikt filter kunne også brukes til å prediktere f.eks. det venstre mikrofonsignal xL(t) fra xR(t) når kilden er nær den høyre mikrofonen. Hvis imidlertid kilden nå ble flyttet vekk fra den høyre mikrofonen og anbragt nær den venstre, ville beskaffenheten av det nødven-dige filteret bli effektivt invertert selv når forsinkelser blir innført for å garantere kausalitet. Filteret må nå modulere en transferfunksjon med svake nuller og sterke poler, en vanskelig oppgave for et alle-null-filter. Andre filtertyper er vanligvis ikke iboende stabile. Nettovirk-ningen av dette er å forårsake ulik ødeleggelse i den rekonstruerte kanalen når kilden skifter fra en mikrofon til den andre. Dette gjør det vanskelig å realisere den enkle prediksjon med en kanal (f.eks. den venstre) fra den andre (f.eks. den høyre).
I et system ifølge den første utførelsesform av oppfinnelsen er det blitt oppnådd bedre resultater ved å danne et "sum-signal" xs(t) = xL(t) + *R(t) og prediktere eller forut-si enten et dif f eransesignal xD(t) = xL(t) - xR(t) eller ganske enkelt xL(t) eller xR(t) ved å bruke et adaptivt, digitalt alle-null-filter.
I praksis vil xR(t) og xL(t) (eller xs(t) og xD(t) ) bli behandlet i samplet dataform som digitale signaler xR[n] og xi,[n] (eller xs[n] og xD[n]), og det vil derfor være meir hensiktsmessig å bruke "Z-transformasjons"-transferfunksjonen H(z) istedenfor H(s).
Det vises til fig. 1 hvor oppfinnelsen i sin grunnleggende form omfatter et par innganger la, lb for mottagelse av et par talesignaler,'f.eks. fra venstre og høyre mikrofoner. Signalene ved inngangene, xR(t) og xL(t) kan være i digital form. Det kan være hensiktsmessig på dette punkt å forbehandle signalene, f.eks. ved båndbegrensning. Hvert signal blir så levert til en adderer 2 og en subtraktor 3, idet utgangen fra adderen er sumsignalet xs(t) = xR(t) + xL(t), og utgangen fra subtraktoren 3 er differansesignalet xD(fc) = xR(t) ' xL(t)' dvs- XD(t) = H(s> Xs(s). Sum- og differanse-signalene blir så levert til et filterutlednings-trinn 4 som utleder koeffisientene til et flertrinns prediksjonsfilter som når det drives med sumsignalet, vil tilnærme differansesignalet. Differansen mellom det tilnærmede differansesignal og det virkelige differansesignal, predik-sjonsrestsignalet, vil vanligvis også bli frembragt (selvom dette ikke er helt nødvendig). Sumsignalet blir så kodet (fortrinnsvis ved bruk av LPC- eller delbånd-koding), for overføring eller lagring sammen med ytterligere data som muliggjør rekonstruksjon av differansesignalet. Filterkoeffisientene kan sendes eller alternativt (som diskutert nærmere nedenfor), kan restsignalet overføres, idet differansekanalen blir rekonstruert ved utledning av filterparameterne ved mottageren ved å bruke en omvendt adaptiv prosess som er kjent på området, eller begge kan overføres.
Selvom det ville være mulig å beregne filterparametere direkte (ved å bruke LPC-analyseteknikker), er det en enkel og effektiv metode for tilveiebringelse av utledningstrinnet 4, å benytte et adaptivt filter (f.eks. et adaptivt transversalfilter) som, som inngang mottar sumkanalen og modellering av differansekanalen for å redusere prediksjonsresten. Slike generelle teknikker for filteradopsjon er velkjente på området.
Våre innledende eksperimenter med denne konstruksjonen har benyttet et transversalt FIR-filter med koeffisient-oppdatering med en algoritme for å minimalisere den midlere kvadratverdi av resten, noe som er enkelt å realisere. Filterkoeffisientene endres bare langsomt fordi romakustikken (og dermed interkanal-transferfunksjonen) er forholdsvis stabil.
Det vises til fig. 2 hvor sumsignalet xs(t) blir mottatt i en tilsvarende mottager sammen med enten filterparameterne eller restsignalet, eller begge, for differansekanalen, og et adaptivt filter 5 som svarer til det som parameterne ble utledet ved ved koderen, mottar som inngang sumsignalet og frembringer som utgang det rekonstruerte differansesignalet konfigurert med enten de mottatte parametere eller med parametere utledet ved omvendt adapsjon fra det mottatte restsignal. Sum- og differanse-signaler blir så begge matet til en adderer 6 og en subtraherer 7, som som utganger frembringer henholdsvis de rekonstruerte venstre og høyre kanaler som utgangsnoder 8a og 8b.
Siden det blir sendt et sumsignal med høy kvalitet, er koderen fullstendig mono-kompatibel. I tilfelle av tap av stereoinformasjon, er monofonisk reserve således tilgjengelig.
Som diskutert ovenfor er en komponent i transferfunksjonene HL og HR en forsinkelseskomponent som vedrører den direkte avstanden mellom signalkilden og hver av mikrofonene, og der er en tilsvarende forsinkelsesdifferanse d. Det er således en sterk krysskorrelasjon mellom en kanal og den andre når forsinkelsen er d.
Denne metoden krever imidlertid betydelig behandlings-kapasitet.
En alternativ fremgangsmåte til estimering av forsinkelse som finnes i artikler om sonarforskning, er å benytte et adaptivt filter. Den venstre kanalinngangen blir forsinket med halve filterlengden, og koeffisientene blir oppda-tert ved å bruke LMS-algoritmen til å minimalisere den midlere kvadratfeilen eller utgangen. Transversalfilter-koef fisientene vil i teorien bli de nødvendige krysskorrela-sjonskoeffisienter. Dette kan synes som unødvendig repeti-sjon av filterkoeffisient-utledning hvis det ikke var for den egenskap ved denne forsinkelsesestimatoren som muliggjør at maksimalverdien av krysskorrelasjonskoeffisienten (ved posisjonen til den maksimale filterkoeffisient) oppnås en viss tid før filteret har konvergert. Denne metoden kan forbedres ytterligere fordi rommessig informasjon også er tilgjengelig fra de relative amplitudene til inngangskanalene: dette kunne brukes til å tilføre en veiefunksjon til filterkoeffisientene for å påskynde konvergens.
Det vises til fig. 3a hvor kompleksiteten og lengden av filteret som skal beregnes, i en foretrukket utførelsesform av oppfinnelsen derfor blir redusert ved beregning av den nødvendige verdi av d i et forsinkelses-beregningstrinn 9 (som fortrinnsvis anvender en av de ovennevnte fremgangsmå-ter) , og så bringer kanalene i tidsinnretting ved å forsinke den ene eller den andre med d ved f.eks. å bruke et par variable forsinkelsesledd 10a, 10b (selv om et fast og et variabelt forsinkelsesledd kan brukes) styrt av forsinkelses-beregningskretsen 9. Med hoveddelen av taleinforma-sjonen i kanalene tidsinnrettet, blir så sum- og differanse-signalene dannet.
Det vises så til fig. 3b hvor forsinkelseslengden d fortrinnsvis blir overført til dekoderen, slik at etter rekonstruksjon av differansekanalen og deretter venstre og høyre kanal, kan tilsvarende variable forsinkelseslengde-trinn lia, 11b i den ene eller den andre av kanalene gjen-opprette forsinkelsen mellom kanalene.
I den illustrerte konstruksjonen er således "sum"-signalet ikke lenger helt den virkelige sum av xL(t) + xR(t), på grunn av forsinkelsen d er den xL(t) + xR(t-d) . Det kan derfor foretrekkes å lokalisere forsinkelsene 10a, 10b (og muligens forsinkelses-beregningskretsen) nedstrøms for addereren og subtrahereren 2 og 3. Dette gir for praktiske formål de samme fordeler ved reduksjon av den nødvendige f ilterlengde.
I praksis er forsinkelsen vanligvis umerkelig, typisk opp til 1,6 ms. Alternativt kan en fast forsinkelse til-strekkelig lang til å garantere kausalitet, benyttes for således å fjerne behovet for å kode forsinkelsesparameteren.
I den første utførelsesform av oppfinnelsen blir som nevnt ovenfor, bare filterparameterne overført som differansesignal-data. Med 16 biter pr. koeffisient betyr dette at en overføringskapasitet på 5120 biter/sekund er nødvendig for differansekanalen (pluss 8 biter for forsinkelsesparameteren) . Dette er godt innenfor kapasiteten til et vanlig 64 kbiter/sekund overføringssystem som brukes og som avsetter 48 kbiter/sekund til sumkanalen (effektivt overført ved en eksisterende monofonisk kodingsteknikk) og gir 16 kbiter/sekund for andre administrasjonsdata. Denne utførel-sesformen gir et godt signal/støy-forhold, og stereobildet er tilstede selv om det er meget avhengig av nøyaktigheten til algoritmen som brukes for å tilpasse prediksjonsfilteret. Unøyaktigheter tenderer til å få stereobildet til å vandre i løpet av en konferanse, spesielt når konversasjo-nen går over fra en talende person til en annen i en viss avstand fra den første.
Det vises til fig. 4a hvor bare restsignalet i en annen utførelsesform av oppfinnelsen blir overført som differansesignal-data. Sumsignalet blir kodet (12a) under bruk av f.eks. delbånd-koding. Det blir også dekodet lokalt (13a) for å frembringe et signal ekvivalent med det ved dekodesren, for innføring til et adaptivt filter 4. Restdifferanse-kanalen blir også kodet (eventuelt innbefattet båndbegrensning) ved hjelp av en restkoder 12b, og en tilsvarende lokal dekoder 13b frembringer det signalet som minimaliseres for å tilpasse filteret 4. Fordelen med dette er at unøyaktig-heter ved generering av parameterne gir en økning i det dynamiske området til restkanalen, og en tilsvarende minskning i signal/støy-forholdet, men uten tap i stereobildet.
Det vises til fig. 4b hvor analyse-filterparameterne ved dekoderen blir gjenvunnet fra den overførte rest ved å bruke en omvendt adaptiv filterkopi 5 av det adaptive filteret 4 ved koderen. Dekodere 13c, 13d er identiske med de lokale dekodere 13a, 13b, og dermed mottar filteret 5 de samme innganger og dermed frembringes de samme parametere som ved koderfilteret 4.
I en ytterligere utførelsesform som ikke er vist, blir både filterparameteret og restsignal overført som sideinfor-masjon for å overvinne mange av problemene med "bare rest"-utførelsesformen fordi den viktige stereoinformasjonen i de første 2 kHz blir bevart intakt og den relative amplitude-informasjon ved høyere frekvenser stort sett blir beholdt ved hjelp av filterparameterne.
Både den ovennevnte "bare rest"- og hybrid (dvs. rest pluss parametere)-utførelsesformene blir fortrinnsvis benyttet som beskrevet for å prediktere differansekanalen fra sumkanalen. Imidlertid har det vist seg at de samme fordeler med å beholde stereobildet (dog med en minskning i signal/støy-forholdet) er tilstede når inngangskanalene er venstre og høyre istedenfor sum og differanse, forutsatt at kausalitetsproblemet blir overvunnet på en eller annen måte (f.eks. ved innføring av en forholdsvis lang, fast forsinkelse i den ene eller annen bane). Formålet med oppfinnelsen omfatter dermed også dette.
Utførelsesformen med overføring av bare parametere som er beskrevet ovenfor, benytter fortrinnsvis et enkelt adaptivt filter 4 til å fjerne redundans mellom sum- og differanse-kanalene. En virkning som ble oppdaget under prøving, var en merkelig "viskeeffekt" hvis koeffisientene ikke ble sendt ved en viss hastighet, som var langt over hva som skulle ha vært nødvendig for å beskrive endringer i det akustiske miljøet. Dette var fordi det adaptive filteret i tillegg til å modellere romakustikkens transferfunksjon, også prøvde å utføre en LPC-analyse av talen.
Dette er, som det sentrale trekk i herværende oppfinnelse, løst i den annen utførelsesform av oppfinnelsen ved å hvitte eller bleke spektrene til inngangssignalene til det adaptive filteret som vist på fig. 5, for å redusere den hurtig varierende talekomponent og hovedsakelig etterlate bare romakustikk-komponenten.
Ifølge oppfinnelsen kan det adaptive filteret 4 som modellerer de akustiske transfer-funksjonene, være det seimme som før (f.eks. et brofilter av orden 10). Sumkanalen blir ført gjennom et hvittingsfilter 14a (som kan være et brofilter eller et enkelt transversalfilter).
Hvittingsfilteret 14a mottar sumkanalen og tilpasses for å utlede et tilnærmet inverst spektralfilter til sumsignalet (eller i det minste talekomponentene i dette) ved å minimalisere sin egen utgang. Utgangen fra filteret 14a er derfor hovedsakelig hvit. Parameterne som utledes ved hjelp av hovedfilteret 14a, blir levert til slave-hvittingsfilteret 14b, som er forbundet for å motta og filtrere differansesignalet. Utgangen fra slavefilteret 14b er derfor differansesignalet filtrert med det inverse av sumsignalet, noe som hovedsakelig fjerner felles signal-komponenter for å redusere korrrelasjonen mellom de to og slik at utgangen fra 14b hovedsakelig består av rommets akustiske respons. Det reduserer følgelig det dynamiske området til resten betydelig.
Virkningen er å hvitte eller bleke sumkanalen og å delvis hvitte dif f eransekanalen uten å påvirke spektral--forskjellen mellom dem som et resultat av romakustikken,, slik at de utledede koeffisienter for det adaptive filteret 4 er modellparametere for romakustikken.
I en annen utførelsesform blir bare koeffisientene overført, og dekoderen er ganske enkelt den på fig. 2 (ingen ytterligere filtere behøves). I denne utførelsen blir selvsagt restkoderen 12b og dekoderen 13b utelatt.
Et adaptivt filter vil vanligvis ikke være langt nok til å filtrere ut langvarig informasjon, slik som tonehøyde i tale, så sumsignalet vil ikke være helt "hvitt". Hvis imidlertid en langtids-prediktor (kjent ved LPC-koding) anvendes i tillegg i filterne 14a og 14b, så kan filteret 4 i prinsippet kobles for å filtrere differansekanalen alene og dermed for å modellere det inverse av romakustikken.
Siden denne andre utførelsesformen av oppfinnelsen reduserer restens dynamiske område, er det spesielt fordel-aktig å anvende denne hvittingsmetoden med "bare rest"-overføring som beskrevet ovenfor. Før omvendt adapsjon ved dekoderen er det i dette tilfellet nødvendig å filtrere resten ved å bruke det inverse av hvittingsfilteret, eller å filtrere sumkanalen under bruk av hvittingsfilteret. Hvert filter kan utledes fra sumkanal-informasjonen som overføres.
Det vises til fig. 5b hvor et adaptivt hvittingfilter 24a (identisk med 14a ved koderen) ved "bare rest"-overfø-ring mottar (den dekodede) sumkanalen og tilpasses for å hvitfarge sin utgang. Et slavefilter 24b (identisk med 14b ved koderen) mottar koeffisientene fra 24a. Ved å bruke den hvittede sumkanalen som sin inngang og ved adapsjon fra (den kodede) resten ved omvendt adapsjon, regenerere det adaptive filteret et filtrert signal som blir addert til den dekodede resten, og summen blir filtrert ved hjelp av slavefilteret
24b for å gi differansekanalen. Sum- og differanse-kanalene blir så behandlet (6, 7 ikke vist) for å gi de opprinnelige venstre og høyre kanaler.
I en ytterligere utførelsesform (ikke vist) blir både rest og koeffisienter overført.
Det sentrale trekket ved oppfinnelsen som angår "forhvitting", er ovenfor beskrevet i forbindelse med den utførelsesform av oppfinnelsen som benytter sum- og differanse-kanaler, med trekket kan også anvendes hvor de to kanalene er venstre og høyre kanaler.
For en typisk anvendelse ved audiokonferanser vil resten ha en båndbredde på 8 kHz og må kvantiseres og over-føres ved å bruke reservekanal-kapasitet på omkring 16 kbit/sekund. Den hvittede resten vil i prinsippet være liten i midlere kvadratverdi, den vil ikke være optimalt hvittet siden forhvittings-kopifilteret 14b som resten passerer gjennom, har koeffisienter utledet for å hvitte sumkanalen og ikke nødvendigvis differansekanalen. Det dynamiske området til det filtrerte signalet blir typisk redusert med 12dB i forhold til den ufiltrerte differansekanalen. En løsning på dette rest-kvantiseringsproblemet er å redusere båndbredden til restsignalet. Dette muliggjør nedsampling til en lavere hastighet, med en følgelig økning i biter pr. sampel. Det er velkjent at mesteparten av rominformasjonen i et stereosignal befinner seg innen båndet 0-2 kHz, og reduksjon av rest-båndbredden fra 8 kHz til en verdi i overkant av 2 kHz påvirker derfor ikke det oppfattede stereobildet i særlig grad. Resultater har vist at reduksjon av restbåndbredden til 4 kHz (og når det øvre 4 kHz-båndet antas å være identisk med det i sumkanalen), frembringer stereofonisk tale med god kvalitet når resten med redusert båndbredde blir delbånd-kodet ved bruk av en standardteknikk.
Eksperimenter med forskjellige adaptive filtere for filtere 4 (og om mulig 12) viste at et vanlig transversalt FIR-filter var langsomt til å konvergere. En hurtigere ytelse kan oppnås ved å bruke en brostruktur med koeffisient-oppdatering under bruk av en gradient-algoritme basert på Burg's metode, som vist på fig. 7.
Konstruksjonen benytter et brofilter 14a til å forhvitte eller forbleke spekteret til primærinngangen. De dekorrelerte, omvendte restutgangene blir så brukt som innganger til en enkel lineær kombinasjonskrets som forsøker å modellere inngangsspekteret til sekundærinngangen. Selv om modelleringsprosessen er den samme som med det enkle transversale FIR-filteret, er virkningen av brofilteret å dirigere feilvektoren i retning av den optimale LMS-rest-løsningen. Dette påskynder konvergensen betydelig. Et brofilter av orden 20 har vist seg effektivt i praksis. Brofilter-konstruksjonen er særlig nyttig som beskrevet ovenfor, men kan også benyttes i et system hvor det ist€:det for å bli dannet sum- og differanse-signaler, blir prediktert en venstre kanal (som er passende forsinket) fra den høyre kanalen.
Selvom de beskrevne utførelsesformer viser et stereofonisk system, vil man forstå at med f.eks. kvadrofoniske systemer, blir oppfinnelsen implementert ved å danne et sumsignal og tre differansesignaler, og ved å prediktere hver fra sumsignalet som ovenfor.
Selvom oppfinnelsen er beskrevet i forbindelse med et overføringssystem med lav bithastighet, f.eks. for en tele-konferanse, er det også nyttig f.eks. for digital lagring av musikk på velkjente digitale registreringsbærere, slik som kompaktplater, ved å tilveiebringe en formateringsanordning for å arrangering av dataene i et format som er egnet for slike registreringsbærere.
Fortrinnsvis kan meget av eller all signalbehandlingen som er nødvendig, realiseres i en enkelt passende program-mert digital signalbehandlings-brikke; brikker for to kanaler er også kommersielt tilgjengelige. Programvare for implementering av adaptive filtere, LPC-analyse og kryss-korrelasjoner er velkjent.

Claims (12)

1. Apparat for polyfonisk signalkoding, omfattende: - anordninger for å motta en første (xs) og minst en andre kanal (xD) ; - en anordning (4) for å generere rekonstrukjonsdata som muliggjør dannelse, fra den første kanalen (xs), av et estimat av den andre kanalen (xD) idet genereringsanordningen (4) kan bevirkes til periodisk generering av et antall filterkoeffisienter, som hvis de tilføres et flerordens-prediksjonsfilter, vil muliggjøre prediksjon av den annen kanal fra den første kanal som er filtrert på denne måten; og - en anordning for utmating av data som representer den første kanal (xs) og de nevnte rekonstruksjonsdata, karakterisert ved at apparatet videre omfatter en anordning for filtrering av den første og annen kanal i samsvar med et filter (14a, 14b) som tilnærmer det spektralt inverse av den første kanal for å frembringe respektive filtrerte kanaler, idet den første filtrerte kanal derved blir betydelig spektralt hvittet eller bleket; og ved at genereringsanordningen (4) er koblet for å motta de filtrerte kanaler.
2. Apparat ifølge krav 1, karakterisert ved at genereringsanordningen omfatter et adaptivt filter (4) koblet for å motta den første kanal og frembringe en prediktert andre kanal fra denne; og en anordning for å frembringe et restsignal som representerer differansen mellom den predikterte annen kanal og den virkelige annen kanal, og hvor de nevnte rekonstruksjonsdata omfatter data som representerer restsignalet.
3. Apparat ifølge krav 1 eller 2, karakterisert ved at de nevnte rekonstruksjonsdata omfatter filterkoeffisientene (hi).
4. Apparat ifølge krav 2, karakterisert ved at det adaptive filteret (4) blir styrt bare ved hjelp av restsignalet og ved at rekonstruksjonsdataene består av restsignalet.
5. Apparat ifølge et av de foregående krav, karakterisert ved at filtrerings-anordningen omfatter et adaptivt hovedfilter (14a) innrettet for å filtrere den første kanal for å frembringe en hvittet utgang, og et slavefilter (14b) innrettet for å filtrere den annen kanal, idet slavefilteret er utformet for å ha en respons ekvivalent med det adaptive filteret til filtre-ringsanordningen.
6. Apparat ifølge et av de foregående krav, karakterisert ved en inngangsanordning for å motta inngangssignaler; og anordninger (2, 3) for å frembringe de nevnte kanaler fra disse, idet den første kanal er en sumkanal som representerer summen av disse inngangssignalene og den andre eller de ytterligere kanaler representerer differansene mellom disse.
7. Apparat ifølge et av de foregående krav, karakterisert ved variable forsinkelsesanordninger (10a, 10b) for å forsinke minst en av kanalene, og en anordning (9) for å styre den differensielle forsinkelse som påføres kanalene for å øke korrelasjonen oppstrøms for genereringsanordningene, idet utgangsanordningen er innrettet for å mate ut også data som representerer den differensielle forsinkelse.
8. Apparat ifølge krav 6, karakterisert ved at inngangsanordningene omfatter variable forsinkelsesanordninger for å forsinke i det minste en av inngangskanalene, og en anordning for å styre den differensielle forsinkelse som påføres signalene for å øke korrelasjonen oppstrøms for genereringsanordningene, idet utgangsanordningen er innrettet for å mate ut også data som representerer den differensielle forsinkelse.
9. Apparat for polyfonisk signaldekoding, omfattende: - anordninger for å motta data som representerer et sumsignal og rekonstruksjonsdata; og anordninger som reak-sjon på disse rekonstruksjonsdata kan bevirkes til å modifisere sumsignalet for å frembringe minst to utgangssinaler, hvor modifiseringsanordningene omfatter: - et variabelt flerordens prediktorfilter (5) for å motta de nevnte signalrekonstruksjonsdata og modifisere sine koeffisienter i samsvar med dette, idet filteret er koblet for å motta sumsignalet og fra dette rekonstruere et utgangs-differansesignal; og - en anordning (6) for å addere det rekonstruerte differansesignal til sumsignalet, og for å subtrahere det rekonstruerte differansesignalet fra sumsignalet, for å frembringe minst to utgangssignaler, karakterisert ved et adaptivt hovedfilter (24a) innrettet for å filtrere sumsignalet i samsvar med omtrent det spektralt inverse av sumsignalet for å frembringe et hvittet utgangssignal, og et slavefilter (24b) innrettet for å filtrere differansesignalet, hvor slavefilteret er utformet for å ha en respons ekvivalent med det adaptive hovedf ilteret.
10. Apparat ifølge krav 9, karakterisert ved at rekonstruksjonsdataene for differansesignalet omfatter restsignal-data, og ved at apparatet omfatter anordninger for å addere restsignal-dataene til filterets utgangssignal for å danne det rekonstruerte differansesignal.
11. Apparat ifølge krav 10, karakterisert ved at prediksjonsfilteret (5) er koblet for å motta restsignal-dataene og modifisere sine koeffisienter i samsvar med disse.
12. Fremgangsmåte for koding av polyfoniske inngangssignaler, omfattende: - frembringelse fra disse av et sumsignal som representerer summen av slike signaler; og rekonstruksjonsdata for å muliggjøre dannelse, fra sumsignalet, av et ytterligere av inngangssignalene; - frembringelse fra inngangssignalene av minst ett differansesignal som representerer en differanse mellom disse; - analysering av sum- og differanse-signalene og generering fra disse av et antall koeffisienter som, hvis de tilføres et flertrinns prediksjonsfilter, vil muliggjøre prediksjon av differansesignalet fra sumsignalet som er filtrert på denne måten; - idet det kodede utgangssignal omfatter sumsignalet og data som muliggjør rekonstruksjon av differansesignalet fra disse, karakterisert ved at sumsignalet og differansesignalet før den nevnte analyse filtreres i samsvar med et filter som tilnærmer det spektralt inverse av sumsignalet, idet sumsignalet derved hovedsakelig hvittes spektralt.
NO914947A 1989-06-15 1991-12-13 Polyfonisk koding NO180030C (no)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB898913758A GB8913758D0 (en) 1989-06-15 1989-06-15 Polyphonic coding
PCT/GB1990/000928 WO1990016136A1 (en) 1989-06-15 1990-06-15 Polyphonic coding

Publications (4)

Publication Number Publication Date
NO914947D0 NO914947D0 (no) 1991-12-13
NO914947L NO914947L (no) 1992-02-13
NO180030B true NO180030B (no) 1996-10-21
NO180030C NO180030C (no) 1997-01-29

Family

ID=10658483

Family Applications (1)

Application Number Title Priority Date Filing Date
NO914947A NO180030C (no) 1989-06-15 1991-12-13 Polyfonisk koding

Country Status (13)

Country Link
EP (1) EP0478615B2 (no)
JP (1) JP2703405B2 (no)
AT (1) ATE121900T1 (no)
AU (1) AU640667B2 (no)
CA (1) CA2058984C (no)
DE (1) DE69018989T3 (no)
DK (1) DK0478615T3 (no)
ES (1) ES2071823T3 (no)
FI (1) FI915873A0 (no)
GB (1) GB8913758D0 (no)
HK (1) HK137196A (no)
NO (1) NO180030C (no)
WO (1) WO1990016136A1 (no)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5274740A (en) * 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
DE4136825C1 (no) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5278909A (en) * 1992-06-08 1994-01-11 International Business Machines Corporation System and method for stereo digital audio compression with co-channel steering
EP0608937B1 (en) * 1993-01-27 2000-04-12 Koninklijke Philips Electronics N.V. Audio signal processing arrangement for deriving a centre channel signal and also an audio visual reproduction system comprising such a processing arrangement
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
DE19526366A1 (de) 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
GB2303516A (en) * 1995-07-20 1997-02-19 Plessey Telecomm Teleconferencing
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
DE19829284C2 (de) * 1998-05-15 2000-03-16 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten eines zeitlichen Stereosignals und Verfahren und Vorrichtung zum Decodieren eines unter Verwendung einer Prädiktion über der Frequenz codierten Audiobitstroms
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
SE519976C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
FR2821475B1 (fr) * 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP2119306A4 (en) * 2007-03-01 2012-04-25 Jerry Mahabub SOUND SPECIALIZATION AND ENVIRONMENT SIMULATION
CN101981616A (zh) * 2008-04-04 2011-02-23 松下电器产业株式会社 立体声信号变换装置、立体声信号逆变换装置及其方法
BR122020009727B1 (pt) 2008-05-23 2021-04-06 Koninklijke Philips N.V. Método
RU2559899C2 (ru) 2010-04-09 2015-08-20 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
BR112012026324B1 (pt) 2010-04-13 2021-08-17 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
US9380387B2 (en) 2014-08-01 2016-06-28 Klipsch Group, Inc. Phase independent surround speaker

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU546069B2 (en) * 1981-09-07 1985-08-15 Kahn, Leonard Richard Am stereo distortion correction
JPH0761043B2 (ja) * 1986-04-10 1995-06-28 株式会社東芝 ステレオ音声伝送蓄積方式
GB8628046D0 (en) * 1986-11-24 1986-12-31 British Telecomm Transmission system

Also Published As

Publication number Publication date
ATE121900T1 (de) 1995-05-15
EP0478615B1 (en) 1995-04-26
DE69018989T3 (de) 1998-11-19
HK137196A (en) 1996-08-02
AU5837990A (en) 1991-01-08
DE69018989D1 (de) 1995-06-01
DE69018989T2 (de) 1995-09-07
NO914947D0 (no) 1991-12-13
NO180030C (no) 1997-01-29
FI915873A0 (fi) 1991-12-13
CA2058984A1 (en) 1990-12-16
NO914947L (no) 1992-02-13
AU640667B2 (en) 1993-09-02
CA2058984C (en) 1998-12-01
EP0478615B2 (en) 1998-04-15
JP2703405B2 (ja) 1998-01-26
WO1990016136A1 (en) 1990-12-27
JPH04506141A (ja) 1992-10-22
DK0478615T3 (da) 1995-07-17
ES2071823T3 (es) 1995-07-01
GB8913758D0 (en) 1989-08-02
EP0478615A1 (en) 1992-04-08

Similar Documents

Publication Publication Date Title
NO180030B (no) Polyfonisk koding
US5434948A (en) Polyphonic coding
US8873764B2 (en) Acoustic echo suppression unit and conferencing front-end
KR101178114B1 (ko) 복수의 입력 데이터 스트림을 믹싱하기 위한 장치
JP4504414B2 (ja) 冗長性低減方法
JP4950040B2 (ja) マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置
RU2407226C2 (ru) Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов
KR100928311B1 (ko) 오디오 피스 또는 오디오 데이터스트림의 인코딩된스테레오 신호를 생성하는 장치 및 방법
JP5090436B2 (ja) 変換ドメイン内で効率的なバイノーラルサウンド空間化を行う方法およびデバイス
AU1192100A (en) Multi-channel signal encoding and decoding
EP1952391A1 (en) Method for encoding and decoding multi-channel audio signal and apparatus thereof
KR20190085563A (ko) 예측 모드 또는 비예측 모드에서 동작 가능한 오디오 업믹서
JPS61112433A (ja) 周波数領域音声符号化方法および装置
US7725324B2 (en) Constrained filter encoding of polyphonic signals
US7024008B2 (en) Acoustic quality enhancement via feedback and equalization for mobile multimedia systems
EP1944761A1 (en) Disturbance reduction in digital signal processing
Romoli et al. An interactive optimization procedure for stereophonic acoustic echo cancellation systems
WO2000051014A2 (en) Modulated complex lapped transform for integrated signal enhancement and coding
KR20240046634A (ko) 예측 코딩에서 저비용 에러 복구를 위한 방법 및 장치
Selten Stereo coding by two-channel linear prediction and rotation
Schuler Audio Coding
JPH0319417A (ja) ステレオ音声符号化装置
JPH0451300A (ja) 線形予測符号化器及び復号化器