NO342161B1 - Audiodynamisk prosessering ved bruk av en tilbakestilling - Google Patents
Audiodynamisk prosessering ved bruk av en tilbakestilling Download PDFInfo
- Publication number
- NO342161B1 NO342161B1 NO20091518A NO20091518A NO342161B1 NO 342161 B1 NO342161 B1 NO 342161B1 NO 20091518 A NO20091518 A NO 20091518A NO 20091518 A NO20091518 A NO 20091518A NO 342161 B1 NO342161 B1 NO 342161B1
- Authority
- NO
- Norway
- Prior art keywords
- reset
- signal
- level
- dynamics
- audio
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims description 27
- 230000005236 sound signal Effects 0.000 claims abstract description 102
- 238000000034 method Methods 0.000 claims abstract description 92
- 230000008569 process Effects 0.000 claims abstract description 69
- 230000008859 change Effects 0.000 claims abstract description 37
- 230000007246 mechanism Effects 0.000 claims abstract description 13
- 230000006870 function Effects 0.000 claims description 29
- 238000009499 grossing Methods 0.000 claims description 28
- 230000004048 modification Effects 0.000 claims description 25
- 238000012986 modification Methods 0.000 claims description 25
- 238000001514 detection method Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 13
- 238000011161 development Methods 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims description 8
- 230000009471 action Effects 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 7
- 230000009467 reduction Effects 0.000 claims description 7
- 230000001276 controlling effect Effects 0.000 claims description 2
- 230000001960 triggered effect Effects 0.000 abstract description 15
- 238000003672 processing method Methods 0.000 abstract description 2
- 230000006978 adaptation Effects 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 210000000721 basilar membrane Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000004886 process control Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/005—Control by a pilot signal
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H40/00—Arrangements specially adapted for receiving broadcast information
- H04H40/18—Arrangements characterised by circuits or components specially adapted for receiving
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/09—Arrangements for device control with a direct linkage to broadcast information or to broadcast space-time; Arrangements for control of broadcast-related services
- H04H60/11—Arrangements for counter-measures when a portion of broadcast information is unavailable
- H04H60/12—Arrangements for counter-measures when a portion of broadcast information is unavailable wherein another information is substituted for the portion of broadcast information
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Control Of Amplification And Gain Control (AREA)
- Circuits Of Receivers In General (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
En audiodynamisk prosessor eller prosesseringsmetode som anvender en nullstillingsmekanisme eller -prosess for raskt å tilpasse seg til innholdsendringer i lydsignalet. Et nullstillingssignal kan genereres ved å analysere selve lydsignalet, eller nullstillingen kan bli trigget fra en ekstern hendelse, så som en kanalendring på en fjernsynsmottaker eller en endring av inngangsvalg på en audio/video-mottaker. Dersom en ekstern trigger anvendes, kan én eller flere indikatorer for tilstanden til dynamikkprosessoren for en gjeldende lydkilde bli lagret og knyttet til denne lydkilden før det skiftes til en ny lydkilde. Dersom systemet senere skifter tilbake til den første lydkilden kan dynamikkprosessoren bli nullstilt til tilstanden lagret tidligere eller en tilnærming til denne. 1
Description
Teknisk område
Oppfinnelsen vedrører behandling av lydsignaler. Spesielt vedrører oppfinnelsen en audiodynamisk prosessor eller prosesseringsmetode som anvender en tilbakestillingsmekanisme eller -prosess for raskt å tilpasse seg til innholdsendringer i lydsignalet. Et tilbakestillingssignal kan bli generert ved å analysere selve lydsignalet, eller tilbakestillingen kan bli trigget fra en ekstern forekomst, så som en kanalendring på en fjernsynsmottaker eller en endring av inngangsvalg på en audio/video-mottaker. Dersom en ekstern trigger anvendes, kan én eller flere indikatorer for tilstanden til dynamikkprosessoren for en gjeldende lydkilde bli lagret og knyttet til denne lydkilden før det skiftes til en ny lydkilde. Hvis systemet senere skifter tilbake til den første lydkilden kan dynamikkprosessoren bli nullstilt til den tidligere lagrede tilstanden eller en tilnærming til denne. Oppfinnelsen vedrører også dataprogrammer for å utføre slike fremgangsmåter eller styre slike anordninger.
Bakgrunn
Et mål med audiodynamisk prosessering er å endre nivået eller dynamikken til et lydsignal til å falle innenfor ønskede grenser. Dette gjøres i alminnelighet ved å danne et tidsvarierende mål for nivået til et lydsignal (for eksempel rms-nivå eller maksnivå) og så beregne og anvende en tidsvarierende signalendring (for eksempel en forsterkningsendring) som er en funksjon av nivåestimatet.
Dynamikkprosessorer som har en slik virkemåte omfatter automatiske forsterkningsregulatorer (AGC – Automatic Gain Controls), dynamiske spektrumkontrollere (DRC – Dynamic Range Controllers), ekspandere, begrensere, støyporter, etc. Forskjellige former for dynamisk signalbehandling er omtalt i den internasjonale patentsøknaden PCT/US 2005/038579 til Alan Jeffrey Seefeldt, publisert som WO 2006/047600 den 4. mai 2006.
JP 2003152483 A beskriver en automatisk nivåkontroll (ALC) krets som kan forkorte en returtid når et høyt signalnivå er påtrykket inngangen, samtidig som forvrengningsytelsen opprettholdes. ALC-kretsen 30 er anordnet med en variabel demper 1, en forsterker 3 for å forsterke et lavfrekvenssignal Vs som har passert gjennom demperen 1, to detektorer 4a, 4b for å detektere et lavfrekvenssignal V1 som er blitt forsterket, en korttidskonstant krets 14 som er ladet med en lavfrekvenssignalspenning V2 som er blitt detektert og en langtidskonstant krets 15 som har en ladningsakselerasjonsbryter 19, en nivåkomparator 17 for å sammenligne ladningsspenningen V2 på kretsen 14 ́s side med en spenning V4 på kretsen 15 ́s side og en tidkretskrets 18 som tillater bryteren 19 å utlade raskt de elektriske ladningene på en kondensator C3.
Kretsen 30 har en tilbakekoblingsstruktur hvor spenningen V3 på kretsen 15 ́s side innmates som et styresignal S for demperen 1.
Figur 1 viser et høynivå blokkdiagram av en generisk audiodynamisk prosessor. Prosessoren kan anses å ha to baner, en øvre “signalbane” 2 og en nedre “styrebane” 4. På den nedre banen måler en dynamikkstyrende prosess eller styreenhet (“dynamikkstyring”) 6 nivået til lydsignalet og genererer én eller flere tidsvarierende modifiseringsparametre som funksjon av det målte nivået. Som vist blir modifiseringsparametrene avledet fra det inngående lydsignalet. Alternativt kan modifiseringsparametrene bli avledet fra den behandlede (utgående) lyden eller fra en kombinasjon av de inngående og utgående lydsignalene. På den øvre audiobanen 2 blir modifiseringsparametrene generert av dynamikkstyringen 6 anvendt på lyden for å generere behandlet lyd.
Anvendelsen av modifiseringsparametrene på et lydsignal kan skje på mange kjente måter, og er vist generisk ved multiplikatorsymbolet 8. For eksempel, for en enkel automatisk forsterkningsreguleringsanordning eller -prosess, kan det være én enkelt bredbånd forsterkningsmodifiseringsparameter som styrer forsterkningen til en anordning eller prosess med variabel forsterkning/tap i hovedbanen. I praksis kan lyden også bli forsinket før anvendelse av modifiseringsparametrene for å kompensere for eventuelle forsinkelser i forbindelse med beregningen av modifiseringsparametrene i dynamikkstyringsprosessen. For å lette presentasjonen er ikke en forsinkelse vist i figur 1 eller andre figurer her.
I en dynamikkstyringsprosess er det vanlig at både signalnivåmålet og de resulterende modifiseringsparametrene blir beregnet kontinuerlig over tid. Videre blir én eller begge av signalnivåmålene og modifiseringsparametrene normalt glattet over tid for å minimere introduksjonen av merkbare artefakter i den behandlede lyden. Glattingen blir som oftest utført med bruk av “rask attack” og “langsom release”, hvilket innebærer at modifiseringsparametrene endrer seg forholdsvis raskt som reaksjon på en økning i signalnivået og reagerer langsommere når signalnivået avtar. Slik glatting er i overensstemmelse med dynamikken til naturlige lyder og hvordan mennesker oppfatter endringer i lydstyrke over tid. Følgelig er slik tidsglatting veldig utbredt i audiodynamiske prosessorer.
I noen anvendelser av dynamikkprosessering kan tidskonstantene for slik glatting være forholdsvis store; i størrelsesorden ett eller flere sekunder. En AGC kan for eksempel beregne et estimat av det langsiktige gjennomsnittsnivået til et signal med bruk av store tidskonstanter og så anvende det resulterende estimatet for å generere langsomtvarierende modifiseringsparametere som flytter lydens gjennomsnittsnivå nærmere et ønsket målnivå. I dette tilfellet kan store tidskonstanter være ønskelig for å bevare den kortsiktige dynamikken i lydsignalet. Anta at en slik AGC jobber på lyden til en fjernsynsmottaker i den hensikt å opprettholde et konsekvent gjennomsnittsnivå på tvers av programinnhold og på tvers av forskjellige kanaler. I et slikt tilfelle kan innholdet i lydsignalet som behandles av AGC’en endre seg brått eller ha en diskontinuitet, for eksempel ved skifte av kanal, og gjennomsnittsnivået til lydsignalet kan derfor også endre seg brått eller ha en diskontinuitet. Med sine store tidskonstanter bruker imidlertid AGC’en betydelig tid på å konvergere til et nytt nivå og bringe det modifiserte nivået til den behandlede lyden til det ønskede målnivået. Under denne tilpasningsperioden kan en som ser på fjernsynet oppleve lydnivået som for høyt eller for lavt. Som følge av dette kan fjernsynsseeren raskt gripe etter fjernkontrollen for å justere volumet – bare for å sloss mot AGC’en mens den konvergerer.
En vanlig løsning i kjent teknikk på problemet beskrevet over omfatter bruk av tidskonstanter som tilpasser seg basert på dynamikken i signalet. Dersom for eksempel det kortsiktige nivået til signalet er betydelig høyere eller lavere enn det glattede nivået som definert av gitte terskelgrenser rundt det glattede nivået, skifter glattingsoperasjonen henholdsvis til raskere attack- og/eller releasetidskonstanter inntil det kortsiktige nivået igjen faller innenfor terskelgrensene rundt det glattede nivået. Senere skifter systemet tilbake til de opprinnelige, langsommere tidskonstantene. Et slikt system kan redusere AGC’ens tilpasningstid, men tersklene og de kortere tidskonstantene må velges med omhu. For alle rimelige terskler kan det generelt eksistere signaler der den opprinnelige, ønskede signaldynamikken fluktuerer utenfor terskelgrensene rundt gjennomsnittsnivået, og således gjør at glattingsprosessen feilaktig skifter til rask attack- eller releasemodus. Som følge av den potensielt hyppige forekomsten av slik feilaktig skifting må ikke tidskonstantene for rask attack- og releasemodus velges for korte, slik at en unngår å gjøre AGC’en ustabil ved normalt programinnhold. Som følge av dette kan konvergensen til AGC’en ved brå overganger eller diskontinuiteter i lydinnholdet fortsatt ikke være så rask som ønsket.
Det er derfor et mål med foreliggende oppfinnelse å tilveiebringe en bedre løsning på problemet med dynamikkprosesseringens tilpasningstid når lydinnhold endrer seg.
Beskrivelse av oppfinnelsen
Ifølge et aspekt ved oppfinnelsen omfatter en fremgangsmåte for behandling av et lydsignal (eller en anordning som utfører fremgangsmåten) det å endre dynamikken i lydsignalet i henhold til en dynamikkstyringsprosess, detektere en endring av innholdet i lydsignalet og tilbakestilling av dynamikkstyringsprosessen som reaksjon på at en slik endring detekteres. Det å detektere en endring av innholdet i lydsignalet kan omfatte én eller begge av å (1) detektere en forekomst i tidsutviklingen av lydsignalet der lydsignalets nivå holder seg under en terskel, Lsilence, over et tidsintervall som ikke er kortere enn en første tidsterskel, tsilence, og (2) detektere en forekomst i tidsutviklingen av lydsignalet der lydsignalets nivå avtar med en mengde som er større enn en differanseterskel, Ldrop, innenfor et tidsintervall som ikke er større enn en andre tidsterskel, tdrop.
Ifølge et annet aspekt ved oppfinnelsen omfatter en fremgangsmåte for behandling av et lydsignal (eller en anordning som utfører fremgangsmåten) det å endre dynamikken i lydsignalet i henhold til en dynamikkstyringsprosess, motta et eksternt forsynt tilbakestilling-triggersignal som angir en endring i lydsignalet, og tilbakestilling av dynamikkstyringsprosessen som reaksjon på tilbakestillingtriggersignalet. Tilbakestilling-triggersignalet kan angi én eller flere av (1) at en bruker endrer kanal, (2) at en bruker endrer inngangskilder, (3) at en bruker velger en avspillings-, tilbake- eller fremoverspolingsfunksjon, (4) skifte fra én fil til en annen, (5) en programendring, (6) skifte fra ett lydkodingsformat til et annet, og (7) en endring i kodingsparametre.
I henhold til begge de ovennevnte aspekter kan tilbakestilling av dynamikkstyringsprosessen øke hastigheten med hvilken dynamikkprosesseringen tilpasser seg til endringer i inngangssignalet.
Tilbakestillingen av dynamikkstyringsprosessen kan sette verdien til én eller flere prosess-styrende parametre, eller et signal som én eller flere av disse prosessstyrende parametere er en funksjon av, til en lagret verdi eller en forhåndsbestemt verdi. Tilbakestilling av dynamikkstyringsprosessen kan redusere verdien til én eller flere tidskonstanter som anvendes ved bestemmelse av én eller flere prosess-styrende parametere eller et signal som disse én eller flere prosessstyrende parametrene er en funksjon av.
Selv om tilnærmingen med adaptive tidskonstanter beskrevet over til en viss grad kan være nytting for å redusere tilpasningstiden til en audiodynamisk prosessor eller prosess og kan anvendes sammen med aspekter ved foreliggende oppfinnelse, kan en slik prosessor eller prosess forbedres betydelig ved at den utvides med en eksplisitt tilbakestillingsmekanisme eller -prosess som blir aktivert ved forekomst av bestemte brå endringer eller diskontinuiteter i innholdet i lydsignalet som behandles. Figur 2 viser foreliggende oppfinnelse i en generell form der en ytterligere styrebane, en tilbakestilling-styrebane 10, er lagt til den generiske dynamikkprosessoren i figur 1. En tilbakestillingsstyremekanisme eller -prosess (“Tilbakestillingskontroll”) 12 kan reagere på den ene eller begge av lydsignalene selv (det inngående lydsignalet eller en kombinasjon av det inngående og det utgående lydsignalet) og et eksternt triggersignal. Følgelig er det tre mulige utførelser: (1) lydsignalet selv (som igjen kan omfatte det inngående lydsignalet eller en kombinasjon av det inngående og det utgående lydsignalet), (2) et eksternt triggersignal og (3) både lydsignalet selv og et eksternt triggersignal. Dersom en beslutning om tilbakestilling tas av tilbakestillingskontrollen 12, sender tilbakestillingsstyremekanismen eller -prosessen en tilbakestillingsmelding til dynamikkstyringen 6, som instruerer den til tilbakestilling av bestemte aspekter ved sin dynamikkstyringstilstand på en måte som gjør at den audiodynamiske prosesseringen raskt kan tilpasse seg til det nye nivået til det innkommende lydsignalet. Tilbakestillingen av bestemte aspekter ved dynamikkstyringstilstanden kan for eksempel (1) sette én eller flere tidskonstanter til en kortere verdi for en kort tidsperiode (og med det øke lydbehandlingens tilpasningshastighet) og/eller (2) sette et glattet mål for lydsignalnivået eller én eller flere modifiseringsparametere til en lagret verdi eller til en gjennomsnitts- eller forhåndsbestemt verdi.
Analyse av lydsignalet for å bestemme forekomst av en brå endring eller diskontinuitet i signalinnhold
En tilbakestillingsbeslutning kan bli tatt av tilbakestillingskontrollen 12 på en rekke forskjellige måter, for eksempel ved å analysere det innkommende lydsignalet eller ved å motta et eksternt tilbakestilling-triggersignal. Ved analyse av lydsignalet søker tilbakestillingskontrollen 12 å detektere forhold i signalet som tyder på en brå endring eller diskontinuitet i innholdet. Når den oppdager et slikt forhold med en gitt grad av sikkerhet, tar tilbakestillingskontrollen 12 en tilbakestillingsbeslutning og instruerer deretter dynamikkstyringen 6 til tilbakestilling av ett eller flere aspekter ved sin dynamikkstyringstilstand. Selv om andre metoder kan anvendes for å detektere brå endringer eller diskontinuiteter i signalinnhold, er to praktiske og virkningsfulle eksempler for å gjøre dette beskrevet nedenfor.
Bruk av en ekstern trigger for å fastslå forekomst av en brå endring eller diskontinuitet i signalinnhold
I mange anvendelser kan meget pålitelig ekstern informasjon være tilgjengelig for å trigge en tilbakestilling. For eksempel, i en fjernsynsmottaker eller ”kabeldekoder”, kan det at en bruker endrer kanal tjene som en ekstern tilbakestillingstrigger. I en fjernsynsmottaker eller audio/video-mottaker kan videre det at en bruker endrer inngangskilde, for eksempel fra “Video 1” til “Video 2”, tjene til å trigge en tilbakestilling. Andre eksempler omfatter en filbasert mediaspiller, for eksempel en bærbar lydanordning eller en digital videoopptaker. I slike tilfeller kan en tilbakestilling bli trigget eksternt når systemet avslutter avspilling av én fil og skifter til en annen. En tilbakestilling kan også bli trigget når en bruker selv eksplisitt endrer filer, trykker på ”avspill” eller spoler forover eller bakover til et nytt sted i et gitt innhold. Dersom lyden som behandles er dekodet fra en komprimert strøm av digitale data, for eksempel Dolby Digital audio, kan det finnes andre kilder for et eksternt tilbakestilling-triggersignal. “Dolby” og “Dolby Digital” er varemerker eiet av Dolby Laboratories Licensing Corporation. For eksempel er kodingssystemet Dolby Digital audio det obligatoriske lydformatet for High Definition Television i USA. På en gitt programkanal blir lyden sendt kontinuerlig, men Dolby Digital-formatet kan endre seg ved programgrenser. For eksempel kan hovedprogrammet være innkodet i kanalformatet 5.1, men et reklameinnslag kan være innkodet i stereoformat. En Dolby Digital-dekoder vil nødvendigvis detektere slike endringer og kan videresende informasjonen til den audiodynamiske prosessoren ifølge foreliggende oppfinnelse som en tilbakestillingstrigger. Andre endringer i kodingsparametere kan også anvendes, for eksempel endringer i Dolby Digitals dialognormaliseringsparameter, “DIALNORM”, som i alminnelighet holdes konstant for et gitt innhold. En tilsvarende ekstern tilbakestillingstrigger kan også bli generert fra andre lydkodingsformater, så som MP3 og AAC. I tillegg til de ovenfor angitte kildene for eksterne tilbakestillingstriggere er andre mulige, og oppfinnelsen er ikke ment begrenset til de som er nevnt.
Dersom oppfinnelsen blir anvendt i en anordning der lyden kan komme fra et sett av kjente kilder, kan oppfinnelsen forbedres ytterligere som vist i figur 3. Langs bunnen av figuren er det vist N lydkilder (“Lydkilde 1” til “Lydkilde N”) 14-1 til 14-N, der det er forutsatt at én av de N lydkildene er valgt for avspilling gjennom dynamikkprosesseringssystemet ved hjelp av en kildevalganordning eller -prosess (“Kildevelger”) 16. Disse lydkildene kan representere, men er ikke begrenset til forskjellige kanaler på et fjernsyn eller en dekoderboks, de forskjellige inngangene på en audio/video-mottaker eller forskjellige filer på en bærbar mediaspiller. Med hver lydkilde er det lagret indikatorer for tilstanden til ett eller flere aspekter ved dynamikkstyringsprosessen som den var forrige gang den aktuelle lydkilden ble spilt av. Slike aspekter ved tilstanden til dynamikkstyringen kan for eksempel omfatte én eller flere av (1) det glattede målet for lydsignalnivået, (2) én eller flere modifiseringsparametere fremkommet fra det glattede målet for lydsignalnivået og (3) én eller flere av tidskonstantene anvendt for å frembringe et glattet mål for lydsignalnivået. I et utførelseseksempel beskrevet nedenfor anvendes det glattede målet for lydsignalnivået, som indirekte påvirker forsterkningsmodifiseringsparameteren (i eksempelet er forsterkning en funksjon av det glattede lydsignalnivået). Når en annen lydkilde blir valgt gjennom kildevalgprosessen, før det faktisk skiftes til den nye lydkilden, sender kildevelgeren 16 en ekstern tilbakestillingstrigger til tilbakestillingskontrollen 12’. Dette gjør i sin tur at tilbakestillingskontrollen 12’ fanger opp indikatorer for den gjeldende tilstanden til dynamikkstyringsprosessen for lydkilden som spilles av. Tilbakestillingskontrollen 12’ lagrer da indikatorer for dynamikkstyringstilstanden i de N dynamikkstyringstilstand-lagringsstedene for det gjeldende lydvalget (Dynamikkstyringstilstand-lagrene 1 til N) 18-1 til 18-N. Deretter skifter kildevalget 16 til den nye lydkilden og sender de tilhørende lagrede indikatorene for dynamikkstyringstilstanden til tilbakestilling-styreprosessen, som i sin tur tilbakestiller dynamikkstyringsprosessen ved hjelp av de lagrede tilstandsindikatorene.
Ved å anvende aspekter ved den siste dynamikkstyringstilstanden til en lydkilde for tilbakestilling av dynamikkstyringsprosessen når det skiftes til denne kilden kan en oppnå en bedre ytelse enn uten bruk av en slik initialtilstand. Uten denne informasjonen er dynamikkstyringsprosessen avhengig av det innkommende lydsignalet etter tilbakestillingen når det tilpasser seg til den nye lydkilden. På kort sikt kan lydens nivå fluktuere raskt, og følgelig kan også modifiseringsparametrene fluktuere raskt mens dynamikkstyringsprosessen forsøker å tilpasse seg raskt til den nye lyden. Ved at en anvender aspekter ved den siste tilstanden til dynamikkprosessoren for lydkilden til tilbakestilling av dynamikkprosessoren er det sannsynlig at dynamikkprosessoren vil begynne i en tilstand som er nærmere den tilstanden den til slutt vil konvergere mot for denne lydkilden. Som følge av dette trenger ikke de raske tilpasningstidskonstantene etter tilbakestilling å reduseres like mye som ellers vil kunne være nødvendig, slik at en oppnår bedre stabilitet uten å øke den totale tilpasningstiden. Som et eksempel, betrakt et skifte mellom to fjernsynsstasjoner, den første med lyd med et gjennomsnittlig nivå på –15 dB i forhold til fullskala digital og den andre med lyd med et gjennomsnittlig nivå på –30 dB, begge med et variasjonsområde på pluss/minus 5 dB rundt sine respektive gjennomsnittsnivåer. Anta at gjennomsnittsnivået til den første stasjonen umiddelbart før skifte til den andre stasjonen er –13 dB. Anta videre at gjennomsnittsnivået til den andre stasjonen er –33 dB etter skiftet. Dette er en forskjell på –20 dB. Dersom en for eksempel ønsker at det dynamiske prosesseringssystemet skal tilpasse seg på et halvt sekund, er en tilpasningshastighet på –40 dB per sekund nødvendig ved fravær av annen informasjon. En slik hastighet er nokså høy og vil kunne introdusere ustabiliteter i den behandlede lyden. Anta på den annen side at den siste dynamikkprosesseringstilstanden lagret med den andre stasjonen svarer til et nivå på –28 dB. Etter tilbakestilling kan dynamikkstyringsprosessen bli nullstilt med denne tilstanden, og det er da en differanse på bare –33 dB – (-28 dB) = -5 dB. Følgelig er en tilpasningshastighet på kun –10 dB per sekund (noe som krever mindre reduksjon av tidskonstanten) nødvendig for å konvergere til det ønskede nivået i løpet av et halvt sekund. Dette eksempelet illustrerer fordelene med å lagre den siste tilstanden til dynamikkstyringsprosessen med lydkilden som resulterte i denne tilstanden.
Virkningen etter at tilbakestilling blir trigget
Trigging av en tilbakestilling øker tilpasningshastigheten i den audiodynamiske prosesseringen (hastigheten med hvilken dynamikkprosesseringen tilpasser seg til endringer i inngangssignalet). For eksempel, når en tilbakestilling blir trigget, kan én eller flere tidskonstanter knyttet til tilpasningshastigheten raskt skifte til betydelig lavere verdier og så på en glatt måte returnere til sine opprinnelig store verdier over en forutbestemt tidsperiode. Alternativt kan den ene eller de flere tidskonstantene skifte til betydelig lavere verdier og beholde disse verdiene for en forutbestemt tidsperiode. I en AGC-anordning kan et tidskonstant-styresignal c[t] forbigående redusere tidskonstantene som anvendes ved beregning av det glattede gjennomsnittsnivået. For eksempel kan glattingstidskonstantene bli redusert over en varighet på omtrent ett sekund etter en tilbakestilling. I ett utførelseseksempel kan tidskonstant-styresignalet c[t] begynne med verdien “1” (som angir en maksimal endringseffekt på én eller flere tidskonstanter) ved forekomst av en tilbakestillingstrigger; når dette signalet er lik “1”, blir attack- og releasekoeffisientene satt til verdier som er betydelig lavere enn deres nominelle verdier. Etter hvert som c[t] avtar til null over en kort tidsperiode, for eksempel ett sekund (varigheten av tidsperioden er ikke avgjørende), blir koeffisientene interpolert tilbake til deres nominelle, normale (ikke nullstilte) verdier. Alternativt eller i tillegg, ved forekomst av en tilbakestillingstrigger, kan verdien til et glattet gjennomsnittsnivå beregnet av dynamikkstyringsprosessen bli nullstilt til en tilstand lagret med en gitt lydkilde, eller til en forhåndsbestemt verdi.
Foreliggende oppfinnelse er særlig egnet til å tilveiebringe en fremgangsmåte for behandling av et lydsignal, omfattende:
å styre dynamikken til lydsignalet ved hjelp av en dynamikkstyringsprosess eller kontroller, hvor nevnte dynamikkstyringsprosess eller kontroller utjevner signalnivået til lydsignalet og / eller en dynamikk-forsterknings modifikasjonsparameter med et utjevningsfilter som anvender en adaptiv tidskonstant β, å detektere en første type forekomst i en tidsmessige utviklingen av lydsignalet hvor lydsignalets nivå reduseres med en mengde som er større enn en forskjells terskel Ldrop, innenfor et tidsintervall som ikke er større enn en andre tidsterskel, tdrop, hvor nevnte deteksjon detekterer reduksjonen i nivået av lydsignalet i en flerhet av frekvensbånd, å detektere en andre type forekomst i den tidsmessige utviklingen av lydsignalet hvor lydsignalnivået forblir under en terskel Lsilence, gjennom et tidsintervall som ikke er kortere enn en første tidsterskel, tsilence og å tilbakestille, ved hjelp av en eksplisitt tilbakestillings-mekanisme eller -prosess, styringen av dynamikkstyringsprosessen av lydsignalet som svar på deteksjon av enten den første type forekomst eller den andre type forekomst, hvor tilbake-stillingen av styringen av dynamikkstyringsprosessen inkluderer å sette utjevnings- filtertidskonstanten til en forutbestemt verdi βfast, å interpolere tidskonstanten β tilbake til en verdi βslow over en forutbestemt tidsperiode etter tilbakestillingen, βfast, som er en raskere tidskonstant enn βslow.
Videre er foreliggende oppfinnelse egnet til å tilveiebringe et apparat for behandling av et lydsignal, omfattende:
en innretning for å styre dynamikken til lydsignalet ved hjelp av en dynamikkstyringsprosess eller kontroller, hvor nevnte dynamikkstyringsprosess eller kontroller utjevner signalnivået til lydsignalet og / eller en dynamikk forsterknings-endringsparameter med et utjevningsfilter som anvender en adaptiv tidskonstant β, innretning for å detektere en første type forekomst i den tidsmessige utviklingen av lydsignalet hvor lydsignalets nivå reduseres med en mengde som er større enn en differensgrense, Ldrop, innenfor et tidsintervall som ikke er større enn en andre tidsterskel, tdrop, hvor nevnte innretning for deteksjon detekterer reduksjonen i nivået av lydsignalet i en flerhet frekvensbånd, deteksjon av en andre type forekomst i den tidsmessige utviklingen av lydsignalet hvor lydsignalnivået forblir under en terskel, Lsilence, gjennom et tidsintervall som ikke er kortere enn en første tidsterskel, tsilence og innretning for tilbake-stilling ved hjelp av en eksplisitt tilbake-stillings-mekanisme eller -prosess, styring av dynamikkstyringsprosessen som svar på deteksjon av enten den første typen forekomst eller den andre type forekomst, hvor nevnte innretning for tilbake-stilling av styringen av dynamikkstyringsprosessen innbefatter innretning for å sette utjevningsfiltertidskonstanten til en forutbestemt verdi βfast, innretning for interpolering av tidskonstanten β tilbake til en verdi βslow over en forutbestemt tidsperiode etter tilbake-stillingen, βfast, som er en raskere tidskonstant enn βslow.
Beskrivelse av figurene
Figur 1 er et skjematisk funksjonsblokkdiagram som viser, på et høyt nivå, en generisk audiodynamisk prosessor.
Figur 2 er et skjematisk funksjonsblokkdiagram som viser, i henhold til aspekter ved foreliggende oppfinnelse, et eksempel på en utførelse av foreliggende oppfinnelse der, i en generell form, en ytterligere styrebane, en tilbakestillingskontrollbane, er lagt til i den generiske dynamiske prosessoren i figur 1.
Figur 3 er et skjematisk funksjonsblokkdiagram som viser, i henhold til aspekter ved foreliggende oppfinnelse, et eksempel på en utførelse av foreliggende oppfinnelse der en audiodynamisk prosessor er forbedret ytterligere.
Figur 4 viser et eksempel på inn/ut-funksjon for en vanlig automatisk forsterkningsregulator (AGC).
Figur 5 viser et sett av båndpass-frekvensresponser valgt slik at de likner den kritiske båndfiltreringen som observeres langs basilarmembranen i menneskeøret.
Figur 6 er et skjematisk funksjonsblokkdiagram som viser, i henhold til aspekter ved foreliggende oppfinnelse, et eksempel på en AGC-basert utførelsesform av foreliggende oppfinnelse.
Beste måte å realisere oppfinnelsen
Den beskrevne oppfinnelsen kan anvendes i en rekke forskjellige dynamikkprosesseringsapplikasjoner, så som dynamisk spektrumkontroll, kompressorer, begrensere, ekspandere, etc. Den er imidlertid spesielt nyttig når den anvendes med en AGC, der typisk store tidskonstanter resulterer i langsom tilpasning når foreliggende oppfinnelse ikke anvendes. Følgelig beskriver den foretrukne utførelsesformen, som et eksempel, anvendelse av oppfinnelsen med en AGC.
Grunnleggende AGC-basert utførelse
En grunnleggende utførelse av en AGC beregner et tidsvarierende estimat av et signals gjennomsnittsnivå og beregner et ønsket modifisert utgangsnivå som er en funksjon av inngangsnivået og et ønsket målnivå. En tidsvarierende signalmodifikasjon kan så bli beregnet som funksjon av differansen mellom inngangsnivået og det ønskede utgangsnivået. Funksjonen som avbilder inngangen til utgangen er innrettet for å bringe nivået til den modifiserte lyden nærmere det ønskede målnivået, og figur 4 viser én slik inn/ut-funksjon. For en inngang som er høyere enn målnivået, beordrer AGC’en signaldempning, og for en inngang som er lavere enn målnivået, beordrer AGC’en signaløkning. Graden av dempning eller økning kan styres ved å variere stigningen til linjen i figur 4.
Ideelt sett bør målet som anvendes for å beregne lydens gjennomsnittsnivå samsvare med menneskets oppfatning av lydstyrke. Dette kan oppnås på mange måter; for eksempel av et vektet middelkvadratmål eller et psykoakustisk lydstyrkemål. Et enkelt, ikke-vektet middelkvadratmål er noe mindre nøyaktig enn de to metodene nevnt over, men gir likevel en høy grad av samsvar med menneskets lydstyrkeoppfatning for de fleste fysisk relevante lydsignaler. Som følge av dens beregningsmessige enkelhet anvendes et ikke-vektet middelkvadratmål i en foretrukket utførelsesform, men dette skal ikke forstås som en begrensning av oppfinnelsen.
Selv om, i prinsippet, aspekter ved oppfinnelsen kan realiseres i det analoge og/eller digitale domenet, vil utførelser trolig i praksis bli realisert i det digitale domenet der hvert av lydsignalene er representert av enkeltstående sampler eller sampler innenfor datablokker. Estimatet av inngangsnivået og det tilhørende ønskede utgangsnivået og signalmodifiseringsparametrene kan bli beregnet kontinuerlig for et analogt lydsignal eller for hvert sample av et digitalt signal, men i dette utførelseseksempelet er det i stedet ønskelig å beregne disse størrelsene for etterfølgende, overlappende blokker av sampler av et digitalt lydsignal. Dette er hovedsaklig som følge av det faktum at behandling av digitale blokker er nyttig for å detektere tilbakestillingsbetingelser fra selve signalet, som beskrevet nedenfor. Med det digitale lydsignalet representert ved x[n] kan de overlappende blokkene i lydsignalet beregnes som:
der N er blokklengden, N/2 er graden av overlapp mellom etterfølgende blokker, t er blokkindeksen og w[n] er en vindusfunksjon, for eksempel et sinusvindu. For signaler samplet med en frekvens på 44100 Hz, fungerer valg av N=512 eller N=1024 greit. Ytterligere detaljer ved en digital lydbehandlingsanordning som anvender overlappende blokker av sampler er gitt i U.S.-patentet 5,899,969 til Fielder m.fl. (“Frame-based audio with gain-control words”), som med dette inntas som referanse i sin helhet. Som beskrevet nedenfor beregner AGC’en en tidsvarierende forsterkning G[t ] som så blir multiplisert med hver blokk av signalet. Hver av disse modifiserte blokkene blir så overlapp-addert for å generere det endelige modifiserte lydsignalet y[n� tN /2 ] :
Som et første trinn i beregningen av forsterkningen G[t ] blir det tidsvarierende øyeblikksnivået til signalet L[t] beregnet som middelkvadratet av hver blokk x[n, t ] . I desibel blir nivået beregnet som:
(3)
der 0 dB svarer til nivået til en fullskala digital kvadratbølge.
Deretter kan øyeblikksnivået i glattet med en rask attakk og en langsom release for å generere et glattet gjennomsnittsnivå for lydsignalet, L[t ] :
der
og
(4c)
Glattingskoeffisientene α attack og α release velges slik en å oppnår de ønskede attack- og releasetidene. Én måte å spesifisere dette er glattingsfilterets halveringstid, dvs. tiden det tar før tidsglattingsfilterets impulsrespons er redusert til halvparten av sin opprinnelige verdi. Selv om valg av α attack svarende til en halveringstid på 1 sekund og α release svarende til en halveringstid på 4 sekunder fungerer godt for en AGC, er ikke disse verdiene kritiske. Verdien L min i likning 4a representerer et minimumsnivå som signalets øyeblikksnivå L[t ] må overstige for at det glattede nivået skal bli oppdatert. Dette hindrer at det glattede gjennomsnittsnivået faller for lavt, og at den tilhørende forsterkningen blir for høy når signalet faller inn i relativ stillhet. Antatt at 0 dB representerer nivået til en fullskala digital kvadratbølge, er dB et rimelig valg, selv om nivået ikke er avgjørende.
Fra det glattede gjennomsnittsnivået L[t ] og AGC’ens inn/ut-funksjon F AGC , som vist i figur 4, beregnes det ønskede utgangsnivået
Endelig blir forsterkningen G[t ] beregnet fra differansen mellom utgangsnivået Lout[t ] og inngangsnivået L[t ] :
[ ]
(6)
Når Lout[t ] >L[t ] , er forsterkningen større enn én, hvilket betyr at signalet økes, og når Lout[t ] <L[t ] er forsterkningen mindre enn én, hvilket betyr at signalet dempes.
AGC med tilbakestilling
Som nevnt over kan tilbakestillingsmekanismen eller -funksjonen forårsake én eller begge av to handlinger: (1) at én eller flere tidskonstanter settes til en kortere varig verdi for en kort tidsperiode (og dermed øke tilpasningshastigheten i lydbehandlingen) og (2) at et glattet mål for lydsignalnivået eller én eller flere modifiseringsparametere settes til en lagret verdi eller til en gjennomsnitts- eller forhåndsbestemt verdi, som kan være uttrykt som L init (se ligning 8a nedenfor og beskrivelsen før og etter denne likningen). Først vil tilbakestilling av én eller flere tidskonstanter bli beskrevet.
Siden modifiseringsparameteren, forsterkningenG[t ] , er en funksjon av det glattede gjennomsnittsnivået L[t ] er hastigheten med hvilken den beskrevne AGC’en tilpasser seg til lyden styrt av attack- og releasetidene anvendt ved beregning av L[t ] . Som angitt over blir disse glattingstidskonstantene valgt forholdsvis store, i størrelsesorden flere sekunder, slik at AGC’en ikke endrer lydens nivå for raskt under tidsutviklingen av normalt lydinnhold. Dersom imidlertid lydinnholdet endrer seg brått eller har en diskontinuitet, kan AGC’en bruke for lang tid på å tilpasse seg, spesielt dersom det nye innholdet har et nivå som avviker betydelig fra det tidligere innholdet. For å gjøre tilpasningen raskere kan tilbakestillingssignalet beskrevet over anvendes for å trigge en modifikasjon av én eller flere av tidskonstantene knyttet til nivåglattingen. I så fall, når en tilbakestilling trigges, skifter tidskonstantene raskt til betydelig lavere verdier, og returnerer så gradvis kontinuerlig til sine opprinnelige store verdier (eller tilnærminger til disse) over en forutbestemt tidsperiode. Andre metoder for å øke tilpasningshastigheten etter at en tilbakestilling er trigget er mulig. For eksempel, i stedet for at de gradvis kontinuerlig returnerer til sine opprinnelige verdier eller tilnærminger til disse, kan tidskonstantene bli holdt ved sine lavere verdier over en forutbestemt tidsperiode og så bli tilbakeført direkte til sine opprinnelige verdier eller tilnærminger til disse. En annen mulighet er å sørge for en stegvis tilbakeføring av tidskonstantene over en forutbestemt tidsperiode. Oppfinnelsen er ikke begrenset med hensyn til hvordan tidskonstantene tilbakeføres til sine opprinnelige verdier eller en tilnærming til disse.
For å trigge en tilbakestilling kan det forefinnes et binært tilbakestillingssignal R[t ] , for eksempel R[t ] =0 under normal operasjon og R[t ] =1 når tilbakestilling er ønsket ved tidsblokk t. Tilbakestillingen kan trigges ved å analysere lydsignalet eller av en ekstern kilde, som beskrevet over. Detaljer ved eksempler på trigging av en tilbakestilling gjennom signalanalyse er beskrevet nedenfor. Dersom en ekstern trigger anvendes, kan det eksistere en lagret tilstand som dynamikkprosessen kan bli nullstilt til, som vist i figur 3. For den beskrevne foretrukne utførelsesformen kan en slik lagret tilstand bestå av verdien til det glattede gjennomsnittsnivået L[t ] ved den siste tidsblokken hvor en gitt lydkilde ble behandlet. Den initielle tilstanden, hentet frem fra et lager under en eksternt trigget tilbakestilling (eller alternativt kan en initiell tilstand være en forhåndsbestemt verdi uansett om en eksternt trigget tilbakestilling anvendes), kan være representert ved verdien L init .
Fra det binære tilbakestillingssignalet R[t ] kan et tidskonstant styresignal bli generert og deretter anvendt for midlertidig å redusere tidskonstantene som anvendes for å beregne det glattede gjennomsnittsnivået L[t ] , og med det øke tilpasningshastigheten i behandlingen. Et tidskonstant styresignal c[t ] kan bli beregnet slik at det er lik “1” idet en tilbakestilling inntreffer (R[t ] =1) og så avtar eksponentielt til “0” med en rate styrt av en reduksjonskoeffisient λ < 1 :
ellers
Reduksjonskoeffisienten λ kan for eksempel velges slik at en får en halveringstid på ett sekund, hvilket innebærer at glattingstidskonstantene blir redusert over en varighet på omtrent ett sekund etter en tilbakestilling. Merk også at styresignalet vil kunne bli oppdatert bare dersom signalnivået L[t ] ≥ L min for å hindre at rask tilpasning skjer under relativ stillhet.
Heller enn å anvende faste attack- og releasekoeffisienter for å glatte signalnivået, som vist i likning 4b, kan koeffisientene nå variere over tid som funksjon av det tidskonstante styresignalet c[t ] . Når c[t ] =1, hvilket betyr at en tilbakestilling akkurat har funnet sted, kan attack- og releasekoeffisientene bli satt lik verdier som er betydelig lavere enn verdiene α attack og α release fra likning 4b (for eksempel omtrent ti prosent av de opprinnelige verdiene eller lavere). Etter hvert som c[t ] så avtar til ”0” kan koeffisientene bli interpolert tilbake til sine nominelle verdier α attack og α release . Eventuelt vil i tillegg de lave koeffisientverdiene som anvendes umiddelbart etter en tilbakestilling også kunne variere avhengig av hvorvidt det eksisterer en initiell tilstandsverdi L init . Dersom det ikke finnes noen lagret initialtilstand kan en anvende veldig lave koeffisientverdier, og dersom det eksisterer en lagret initialtilstand kan en anvende litt høyere koeffisientverdier. I sistnevnte tilfelle er det forutsatt at initialiseringen av L[t ] med L init begynner L[t ] med en verdi som nærmere den verdien som den til slutt vil konvergere til. En kan derfor anvende en litt langsommere tilpasningstid, svarende til større koeffisienter, sammenliknet med tilfellet der ingen initialtilstand er tilgjengelig. Den adaptive glattingsprosessen kan uttrykkes som:
ellers
der
og
Verdiene β afast og β rfast representerer de initielle attack- og releaseglattingskoeffisientene umiddelbart etter en tilbakestilling når ingen initialtilstand, L init , er tilveiebragt. Verdier svarende til halveringstider på henholdsvis 50 millisekunder og 200 millisekunder er funnet anvendelige. De konkrete verdiene er ikke avgjørende. Verdiene β aslow og β rslow representerer de høyere initielle attackog release-glattingskoeffisientene umiddelbart etter en tilbakestilling når initialtilstand, L init , er tilveiebragt. I dette tilfellet er verdier svarende til halveringstider lik to ganger de til deres raske motparter; henholdsvis 100 millisekunder og 400 millisekunder, funnet å være anvendelige. Heller ikke i dette tilfellet er de konkrete verdiene avgjørende.
Tilbakestillingsdeteksjon gjennom signalanalyse Den mest pålitelige måten å trigge en tilbakestilling i den beskrevne oppfinnelsen er å motta en trigger eksternt fra en mekanisme eller prosess som en vet er direkte knyttet til endring i lydinnhold. Flere slike mekanismer er omtalt tidligere; for eksempel en kanalendring på en fjernsynsmottaker eller en endring av inngangsvalg på en audio/video-mottaker. I mange tilfeller er imidlertid ingen slike eksterne mekanismer tilgjengelig, og derfor må systemet anvende analyse av selve lydsignalet for å avgjøre om en tilbakestilling skal trigges. Anta for eksempel at den beskrevne oppfinnelsen er realisert i en fjernsynsmottaker som en bruker har koblet en ekstern kabeldekoderboks til. Kabeldekoderboksen har ansvar for avstemning til og endring av kanaler, og den dekodede lyden blir bare videresendt til fjernsynet som en kontinuerlig lydstrøm. Fjernsynet mottar derfor ingen eksplisitt informasjon om når en ny kanal er valgt. Den eneste informasjonen tilgjengelig er den som kan avledes fra lydstrømmen det mottar.
En forholdsvis enkel, men effektiv måte å trigge en tilbakestilling gjennom signalanalyse er å detektere en forekomst i tidsutviklingen av lydsignalet der nivået til lydsignalet holder seg under en terskel, Lsilence, over en minimumsperiode (et tidsintervall som ikke er kortere enn en tidsterskel tsilence). Med andre ord detektere et tidsrom med relativ stillhet av en varighet som i hvert fall er like lang som et forutbestemt terskeltidsintervall. En slik forekomst indikerer trolig en brå endring eller diskontinuitet i lydens innhold. Mange anordninger, spesielt kabeldekoderbokser, demper lydsignalet for en kort tidsperiode når lydkilden endres. Denne dempningen reduserer lydsignalet til et nivå som er langt lavere enn det en i alminnelighet ser i normalt lydinnhold. For digital lyd, for eksempel, kan den redusere samplene av signalet til null. Slike forhold i signalets tidsutvikling kan oppdages gjennom analyse av det kortsiktige nivået L[t ] omtalt over. Dersom L[t ] holder seg lavere enn en terskel L silence over et tidsintervall av en varighet på i hvert fall t silence , kan en tilbakestilling bli trigget. Denne tilnærmingen kan uttrykkes som:
der et stillhetstellersignal s[t ] blir oppdatert i henhold til:
Antatt at 0 dB svarer til nivået til en fullskala digital kvadratbølge, fungerer for eksempel innstillingen L silence lik -90 dB godt i praksis, selv om nivået ikke er avgjørende. Å sette t silence til en tidsperiode på 0,25 sekunder, for eksempel, er et rimelig valg for mange anvendelser, selv om tidsperioden ikke er avgjørende.
I noen tilfeller blir det ikke innledet en pause med relativ stillhet når lydinnholdet endrer seg brått eller har en diskontinuitet, og derfor vil ikke metoden over nødvendigvis trigge en tilbakestilling. En alternativ tilbakestillingstriggende forekomst for å håndtere ytterligere tilfeller er derfor ønskelig. I enhver situasjon der lydinnholdet endrer seg brått eller har en diskontinuitet vil nivået til den nye lyden enten være høyere enn, lik eller lavere enn nivået til det foregående lydinnholdet. Siden de fleste dynamikkprosessorer anvender en attakk-koeffisient som er betydelig raskere enn release-koeffisienten, er tilfellet der nivået til det nye lydinnholdet er høyere enn eller lik det gamle mindre problematisk enn når det nye lydinnholdet er betydelig lavere enn det gamle. I sistnevnte tilfelle kan den langsomme release-tiden føre til en urimelig lang tilpasningstid. Å trigge en tilbakestilling når det nye lydinnholdet er betydelig lavere enn det gamle kan derfor anses som spesielt ønskelig. For å gjøre dette kan en utnytte et trekk som er felles for de fleste lydsignaler som er sammensatt av naturlige lyder. Naturlige lyder kan utvise brå nivåøkninger, men de utviser i alminnelighet en mer gradvis reduksjon. Lyder som kuttes brått er ikke veldig vanlig i de fleste lydopptak. Dersom imidlertid lydinnhold skifter brått, for eksempel som følge av en endring i inngangsvalg, og nivået til den nye lydinngangen er betydelig lavere enn den gamle, vil den resulterende lydstrømmen utvise et drastisk, unaturlig brått fall i nivået. Et slikt nivåfall kan detekteres fra det kortsiktige nivået L[t ] og anvendes for å trigge en tilbakestilling.
Følgelig er en annen virkningsfull måte å trigge en tilbakestilling gjennom signalanalyse å detektere en forekomst i tidsutviklingen av lydsignalet der lydsignalets nivå avtar med en mengde som er større enn en differanseterskel Ldropinnenfor et tidsintervall som ikke er større enn en tidsterskel tdrop. Nærmere bestemt blir en tilbakestilling trigget dersom forskjellen mellom L[t ] og L[t�1 ] overstiger en forutbestemt terskel L drop innenfor et tidsintervall tdrop:
En passende tidsdifferanse tdroper tiden for én digital behandlingsblokk. Med en blokkoverlapp på en halv, svarer for eksempel én blokktid til N/2 sampler. Dersom N=512 og samplingsraten er 48000 Hz, er tdropomtrent 5 millisekunder. Dersom N=1024, er tdropomtrent 10 millisekunder. En nivåforskjell Ldroppå omtrent -10 til -20 dB er funnet passende, selv om den eksakte nivåforskjellen ikke er avgjørende.
Metoden over vil trigge en tilbakestilling når nivået til nytt lydinnhold er betydelig lavere enn det gamle, men den kan noen ganger feilaktig trigge en tilbakestilling under normalt lydinnhold. Den beskrevne metoden ser etter et fall i signalets totale nivå, og noen ganger kan en dominerende andel av lydsignalet, for eksempel en ”kick-drum”, utvise en slik oppførsel, mens resten av signalet ikke gjør det. Den dominerende signalkomponenten bidrar imidlertid mest til det totale nivået, og kan derfor gjøre at en tilbakestilling blir trigget. For å håndtere slik utilsiktet trigging kan deteksjonsmetoden forbedres ved at den detekterer en tilbakestilling når signalets nivå utviser et betydelig nivåfall samtidig over flere frekvensbånd (for eksempel alle frekvensbånd) innenfor terskelperioden. På denne måten vil alle slike frekvensbånd bidra likt til tilbakestillingsdeteksjonsprosessen, uavhengig av absoluttnivået i et gitt bånd. For å gjennomføre en slik metode blir først øyeblikksnivået innenfor flere frekvensbånd beregnet. Dette nivået blir representert som L[b, t ] , der b angir båndindeksen. Det kan genereres effektivt ved å beregne den diskrete fouriertransformasjonene (DFT) til hver lydblokk x[n, t ] og multiplisere den diskrete fouriertransformasjonen med en båndpass-frekvensrespons Cb[k ] for hvert bånd b:
derX[k, t ] , den diskrete fouriertransformasjonen av x[n, t ] , beregnes som:
Settet av båndpass-frekvensresponser Cb[k ] kan tjenlig velges slik at det likner den kritiske båndfiltreringen som observeres langs basilarmembranen i menneskets øre. Som foreslått av Moore og Glasberg ( “A Model for the Prediction of Thresholds, Loudness, and Partial Loudness”, Brian Moore, Brian Glasberg og Thomas Baer, J. Audio Eng. Soc., Vol.45, nr.4, april 1997) har slike filtre en tilnærmet avrundet eksponentiell form og en jevn innbyrdes avstand på ERB-(Equivalent Rectangular Bandwidth)-skalaen. Figur 5 viser et passende sett av filtre med en innbyrdes avstand lik 1 ERB, som resulterer i totalt 40 bånd.
Fra øyeblikksnivået til hvert bånd, L[b, t ] , kan en beregne differansen mellom suksessive tidsblokker, midlet over alle bånd:
For fysisk relevante lydsignaler er D[t ] ekstremt liten bare dersom nivået til signalet faller betydelig i flesteparten av båndene b. Dersom differansen er mindre enn en terskel, D drop , detekteres en tilbakestilling:
I praksis fungerer valg av D drop mellom -10 og -20 dB godt, selv om denne innstillingen ikke er avgjørende. Den resulterende multibåndmetoden er mindre utsatt for feilaktig trigging av tilbakestilling enn den enklere metoden som kun betrakter forskjellen i totalt signalnivå.
Figur 6 viser et blokkdiagram av en AGC som innlemmer aspekter ved foreliggende oppfinnelse. Et digitalt audio-inngangssignal x[n,t] (se ligning 1) blir anvendt på to baner i en AGC-anordning eller -prosess. I styrebanen beregner en “nivåberegning”-anordning eller -prosess 20 et mål for lyden, som kan være et tidsvarierende øyeblikksnivå for signalet L[t], beregnet som middelkvadratet til hver blokk av inngangssignalet x[n,t] (se ligning.3). Deretter blir øyeblikksnivået L[t] tidsglattet i en “nivåglatting”-anordning eller -prosess 22 for å generere et glattet middelnivå for lydsignalet L[t ] (se likn.4a). Uten tilbakestilling kan tidsglattingen ha en rask attakk og langsom release. Nivåglattingen 22 kan være styrt av en “tidskonstant styresignal c[t]”-inngang og/eller en “initialiser L[t ] ”-inngang. Tidskonstant styresignal-inngangen c[t] kan gjøre at én eller flere av tidskonstantene anvendt i nivåglattingen 22 endres ved en tilbakestilling, som beskrevet over. Initialiser L[t ] -inngangen kan gjøre at utgangen fra nivåglattingen 22 antar en lagret verdi eller forhåndsbestemt verdi L init ved forekomst av en tilbakestilling, som beskrevet over. Utgangen fra nivåglattingen 22, L[t ] , blir anvendt på en “Bruk inn/ut-funksjon F AGC ”-anordning eller -funksjon 24 og på en “forsterkningsberegning”-anordning eller -funksjon 26. Anordningen eller funksjonen 24 anvender funksjonen beskrevet i forbindelse med figur 4 for å frembringe et ønsket utgangsnivå Lout[t ] (se likn.5). Forsterkningsberegningen 26 beregner forsterkningen G[t ] fra forskjellen mellom utgangsnivået Lout[t ] og inngangsnivået L[t ] (se likn.6). Når Lout[t ] >L[t ] , er forsterkningen større enn én, hvilket betyr at signalet økes, og når Lout[t ] <L[t ] er forsterkningen mindre enn én, hvilket betyr at signalet dempes. Den tidsvarierende forsterkningen G[t ] , en modifiseringsparameter, blir så anvendt ”multipliser”-anordningen eller -prosessen 28 der den blir multiplisert med hver blokk av signalet x[n,t] for å generere et modifisert lydsignal y[n tN/2] (se likn.2). Selv om som beskrevet forsterkningsmodifiseringsparameteren G[t ] er frekvensuavhengig, kan en frekvensavhengig forsterkningsmodifiseringsparameter G[b, t ] bli beregnet, der b er en båndindeks. I så fall kan nivåberegningen 20 beregne et frekvensavhengig momentant signalnivå L[b, t ] , Nivåglattingen 22 kan frembringe en frekvensavhengig utgang L[b, t ] (dens styring mater inn det tidskonstante styresignalet c[t], og initialiseringen av L[t ] kan også være frekvensavhengig), Bruk funksjonen F AGC kan anvende en frekvensavhengig funksjon, og forsterkningsberegningen 26 tilveiebringer en frekvensavhengig, tidsvarierende forsterkning G[b, t ] .
Realisering
Oppfinnelsen kan realiseres i maskinvare eller programvare, eller en kombinasjon av begge (f.eks. programmerbare logikkmatriser). Dersom ikke annet er angitt er ikke algoritmene omfattet som del av oppfinnelsen naturlig bundet til noen konkret datamaskin eller annen anordning. Spesielt kan forskjellige universelle maskiner anvendes med programmer skrevet i henhold til det som er vist her, eller det kan være mer hensiktsmessig å konstruere mer spesialiserte anordninger (f.eks. integrerte kretser) for å utføre de nødvendige fremgangsmåtetrinnene. Følgelig kan oppfinnelsen realiseres i ett eller flere dataprogrammer som kjører på ett eller flere programmerbare datasystemer som hvert innbefatter minst én prosessor, minst ett datalagringssystem (omfattende volatile og ikke-volatile minne- og/eller lagringselementer), minst én innmatingsanordning eller -port og minst én utmatingsanordning eller -port.
Programkode blir anvendt på inndata for å utføre funksjonene beskrevet her og generere utdata. Utdataene blir anvendt på én eller flere utmatingsanordninger, på kjent måte.
Hvert slikt program kan implementeres i et hvilken som helst ønsket datamaskinspråk (omfattende maskinkode, assemblerkode eller høynivå prosedyreorienterte, logiske eller objektorienterte programmeringsspråk) for å kommunisere med et datasystem. Språket kan være et kompilert eller interpretert språk.
Hvert slikt dataprogram blir fortrinnsvis lagret på eller lastet ned til et lagringsmedium eller en lagringsanordning (f.eks. halvlederminne eller -medier eller magnetiske eller optiske medier) som kan leses av en generell eller spesialisert programmerbar datamaskin, for å konfigurere og styre datamaskinen når lagringsmediet eller -anordningen leses av datasystemet for å utføre prosedyrene beskrevet her. Systemet ifølge oppfinnelsen kan også vurderes realisert som et datamaskinlesbart lagringsmedium, utstyrt med et dataprogram, der lagringsmediet utstyrt på denne måten bevirker et datasystem til å kjøre på en spesifikk og forhåndsdefinert måte for å utføre funksjonene beskrevet her.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US85312706P | 2006-10-20 | 2006-10-20 | |
PCT/US2007/020747 WO2008051347A2 (en) | 2006-10-20 | 2007-09-25 | Audio dynamics processing using a reset |
Publications (2)
Publication Number | Publication Date |
---|---|
NO20091518L NO20091518L (no) | 2009-05-18 |
NO342161B1 true NO342161B1 (no) | 2018-04-09 |
Family
ID=38961076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO20091518A NO342161B1 (no) | 2006-10-20 | 2009-04-17 | Audiodynamisk prosessering ved bruk av en tilbakestilling |
Country Status (16)
Country | Link |
---|---|
US (1) | US8849433B2 (no) |
EP (1) | EP2082480B1 (no) |
JP (1) | JP4940308B2 (no) |
KR (1) | KR101137715B1 (no) |
CN (1) | CN101529721B (no) |
AU (1) | AU2007309691B2 (no) |
BR (1) | BRPI0717484B1 (no) |
CA (1) | CA2665153C (no) |
IL (1) | IL197856A (no) |
MX (1) | MX2009004175A (no) |
MY (1) | MY144271A (no) |
NO (1) | NO342161B1 (no) |
RU (1) | RU2413357C2 (no) |
TW (1) | TWI415481B (no) |
UA (1) | UA94968C2 (no) |
WO (1) | WO2008051347A2 (no) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2005299410B2 (en) | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
ES2359799T3 (es) | 2006-04-27 | 2011-05-27 | Dolby Laboratories Licensing Corporation | Control de ganancia de audio usando detección de eventos auditivos basada en la sonoridad específica. |
CA2665153C (en) | 2006-10-20 | 2015-05-19 | Dolby Laboratories Licensing Corporation | Audio dynamics processing using a reset |
US9009032B2 (en) * | 2006-11-09 | 2015-04-14 | Broadcom Corporation | Method and system for performing sample rate conversion |
ATE535906T1 (de) | 2007-07-13 | 2011-12-15 | Dolby Lab Licensing Corp | Tonverarbeitung mittels auditorischer szenenanalyse und spektraler asymmetrie |
WO2009086174A1 (en) * | 2007-12-21 | 2009-07-09 | Srs Labs, Inc. | System for adjusting perceived loudness of audio signals |
CN101608947B (zh) * | 2008-06-19 | 2012-05-16 | 鸿富锦精密工业(深圳)有限公司 | 声音测试方法 |
US20090323985A1 (en) * | 2008-06-30 | 2009-12-31 | Qualcomm Incorporated | System and method of controlling power consumption in response to volume control |
US8761415B2 (en) | 2009-04-30 | 2014-06-24 | Dolby Laboratories Corporation | Controlling the loudness of an audio signal in response to spectral localization |
WO2010126709A1 (en) | 2009-04-30 | 2010-11-04 | Dolby Laboratories Licensing Corporation | Low complexity auditory event boundary detection |
TWI503816B (zh) | 2009-05-06 | 2015-10-11 | Dolby Lab Licensing Corp | 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術 |
CN102422349A (zh) * | 2009-05-14 | 2012-04-18 | 夏普株式会社 | 增益控制装置和增益控制方法、声音输出装置 |
US8406431B2 (en) | 2009-07-23 | 2013-03-26 | Sling Media Pvt. Ltd. | Adaptive gain control for digital audio samples in a media stream |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
GB0919673D0 (en) * | 2009-11-10 | 2009-12-23 | Skype Ltd | Gain control for an audio signal |
GB0919672D0 (en) * | 2009-11-10 | 2009-12-23 | Skype Ltd | Noise suppression |
KR20110065095A (ko) * | 2009-12-09 | 2011-06-15 | 삼성전자주식회사 | 디바이스를 제어하는 방법 및 그 장치 |
CN102098606A (zh) * | 2009-12-10 | 2011-06-15 | 腾讯科技(深圳)有限公司 | 一种音量动态调节的方法及装置 |
CN103003877B (zh) * | 2010-08-23 | 2014-12-31 | 松下电器产业株式会社 | 声音信号处理装置及声音信号处理方法 |
JP5707219B2 (ja) * | 2011-05-13 | 2015-04-22 | 富士通テン株式会社 | 音響制御装置 |
JP5702666B2 (ja) * | 2011-05-16 | 2015-04-15 | 富士通テン株式会社 | 音響装置および音量補正方法 |
US20120294457A1 (en) * | 2011-05-17 | 2012-11-22 | Fender Musical Instruments Corporation | Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals and Control Signal Processing Function |
US20120294459A1 (en) * | 2011-05-17 | 2012-11-22 | Fender Musical Instruments Corporation | Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals in Consumer Audio and Control Signal Processing Function |
US9232321B2 (en) * | 2011-05-26 | 2016-01-05 | Advanced Bionics Ag | Systems and methods for improving representation by an auditory prosthesis system of audio signals having intermediate sound levels |
FR2976748B1 (fr) * | 2011-06-17 | 2013-12-27 | Arkamys | Procede de normalisation de la puissance d'un signal sonore et dispositif de traitement associe. |
EP2624449B1 (en) * | 2012-02-01 | 2016-12-07 | Harman Becker Automotive Systems GmbH | Peak detection when adapting a signal gain based on signal loudness |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
US10027303B2 (en) * | 2012-11-13 | 2018-07-17 | Snell Advanced Media Limited | Management of broadcast audio loudness |
TWI528777B (zh) | 2012-12-28 | 2016-04-01 | 鴻海精密工業股份有限公司 | 音量調節方法與系統 |
US9570093B2 (en) * | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
CN103745734B (zh) * | 2014-01-02 | 2017-01-11 | 青岛海信电器股份有限公司 | 一种设置声音曲线的设备及方法 |
WO2018231185A1 (ru) * | 2017-06-16 | 2018-12-20 | Василий Васильевич ДУМА | Способ синхронизации звуковых сигналов |
CN113037428B (zh) * | 2019-12-09 | 2022-01-25 | 大唐移动通信设备有限公司 | 一种对数据流程的处理方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003152483A (ja) * | 2001-11-16 | 2003-05-23 | Victor Co Of Japan Ltd | オートマチックレベルコントロール回路 |
Family Cites Families (145)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2808475A (en) | 1954-10-05 | 1957-10-01 | Bell Telephone Labor Inc | Loudness indicator |
US4281218A (en) | 1979-10-26 | 1981-07-28 | Bell Telephone Laboratories, Incorporated | Speech-nonspeech detector-classifier |
DE3314570A1 (de) | 1983-04-22 | 1984-10-25 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und anordnung zur einstellung der verstaerkung |
US4739514A (en) | 1986-12-22 | 1988-04-19 | Bose Corporation | Automatic dynamic equalizing |
US4887299A (en) | 1987-11-12 | 1989-12-12 | Nicolet Instrument Corporation | Adaptive, programmable signal processing hearing aid |
GB2215927A (en) | 1988-03-16 | 1989-09-27 | British Broadcasting Corp | Improvements to RDS radio receivers |
US4953112A (en) | 1988-05-10 | 1990-08-28 | Minnesota Mining And Manufacturing Company | Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model |
US5027410A (en) | 1988-11-10 | 1991-06-25 | Wisconsin Alumni Research Foundation | Adaptive, programmable signal processing and filtering for hearing aids |
JPH02118322U (no) | 1989-03-08 | 1990-09-21 | ||
US5097510A (en) | 1989-11-07 | 1992-03-17 | Gs Systems, Inc. | Artificial intelligence pattern-recognition-based noise reduction system for speech processing |
US5369711A (en) * | 1990-08-31 | 1994-11-29 | Bellsouth Corporation | Automatic gain control for a headset |
US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
AU653582B2 (en) | 1991-01-08 | 1994-10-06 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
DE69214882T2 (de) | 1991-06-06 | 1997-03-20 | Matsushita Electric Ind Co Ltd | Gerät zur Unterscheidung von Musik und Sprache |
US5278912A (en) | 1991-06-28 | 1994-01-11 | Resound Corporation | Multiband programmable compression system |
JPH0590857A (ja) * | 1991-09-28 | 1993-04-09 | Victor Co Of Japan Ltd | 音響効果装置 |
US5363147A (en) | 1992-06-01 | 1994-11-08 | North American Philips Corporation | Automatic volume leveler |
JPH065212U (ja) * | 1992-06-15 | 1994-01-21 | 国際電気株式会社 | Am・fm用受信機のagc回路 |
JP2727883B2 (ja) * | 1992-08-20 | 1998-03-18 | ヤマハ株式会社 | 楽音合成装置 |
GB2272615A (en) | 1992-11-17 | 1994-05-18 | Rudolf Bisping | Controlling signal-to-noise ratio in noisy recordings |
DE4335739A1 (de) | 1992-11-17 | 1994-05-19 | Rudolf Prof Dr Bisping | Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen |
US5548638A (en) | 1992-12-21 | 1996-08-20 | Iwatsu Electric Co., Ltd. | Audio teleconferencing apparatus |
US5457769A (en) | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
US5706352A (en) | 1993-04-07 | 1998-01-06 | K/S Himpp | Adaptive gain and filtering circuit for a sound reproduction system |
US5434922A (en) | 1993-04-08 | 1995-07-18 | Miller; Thomas E. | Method and apparatus for dynamic sound optimization |
BE1007355A3 (nl) | 1993-07-26 | 1995-05-23 | Philips Electronics Nv | Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling. |
IN184794B (no) | 1993-09-14 | 2000-09-30 | British Telecomm | |
JP2986345B2 (ja) | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声記録指標化装置及び方法 |
ZA95605B (en) | 1994-04-28 | 1995-12-20 | Qualcomm Inc | Method and apparatus for automatic gain control and dc offset cancellation in quadrature receiver |
US5530760A (en) | 1994-04-29 | 1996-06-25 | Audio Products International Corp. | Apparatus and method for adjusting levels between channels of a sound system |
JPH07307058A (ja) * | 1994-05-10 | 1995-11-21 | Sony Corp | レベルコントロール回路及び録音装置 |
US5422602A (en) | 1994-06-20 | 1995-06-06 | Aphex Systems, Ltd. | Frequency discriminate leveler |
US5500902A (en) | 1994-07-08 | 1996-03-19 | Stockham, Jr.; Thomas G. | Hearing aid device incorporating signal processing techniques |
GB9419388D0 (en) | 1994-09-26 | 1994-11-09 | Canon Kk | Speech analysis |
US5682463A (en) | 1995-02-06 | 1997-10-28 | Lucent Technologies Inc. | Perceptual audio compression based on loudness uncertainty |
CA2167748A1 (en) | 1995-02-09 | 1996-08-10 | Yoav Freund | Apparatus and methods for machine learning hypotheses |
ATE229729T1 (de) | 1995-03-13 | 2002-12-15 | Phonak Ag | Verfahren zur anpassung eines hörgerätes, vorrichtung hierzu und hörgerät |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
US6041295A (en) | 1995-04-10 | 2000-03-21 | Corporate Computer Systems | Comparing CODEC input/output to adjust psycho-acoustic parameters |
US6301555B2 (en) | 1995-04-10 | 2001-10-09 | Corporate Computer Systems | Adjustable psycho-acoustic parameters |
US5601617A (en) | 1995-04-26 | 1997-02-11 | Advanced Bionics Corporation | Multichannel cochlear prosthesis with flexible control of stimulus waveforms |
JPH08328599A (ja) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
US5663727A (en) | 1995-06-23 | 1997-09-02 | Hearing Innovations Incorporated | Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same |
US5712954A (en) | 1995-08-23 | 1998-01-27 | Rockwell International Corp. | System and method for monitoring audio power level of agent speech in a telephonic switch |
US6002776A (en) | 1995-09-18 | 1999-12-14 | Interval Research Corporation | Directional acoustic signal processor and method therefor |
US5907622A (en) | 1995-09-21 | 1999-05-25 | Dougherty; A. Michael | Automatic noise compensation system for audio reproduction equipment |
US5642075A (en) * | 1995-12-21 | 1997-06-24 | Itt Corporation | Sampled data automatic gain control |
US6327366B1 (en) | 1996-05-01 | 2001-12-04 | Phonak Ag | Method for the adjustment of a hearing device, apparatus to do it and a hearing device |
US6108431A (en) | 1996-05-01 | 2000-08-22 | Phonak Ag | Loudness limiter |
US6430533B1 (en) | 1996-05-03 | 2002-08-06 | Lsi Logic Corporation | Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation |
JPH09312540A (ja) | 1996-05-23 | 1997-12-02 | Pioneer Electron Corp | ラウドネスボリュームコントロール装置 |
JP3765622B2 (ja) | 1996-07-09 | 2006-04-12 | ユナイテッド・モジュール・コーポレーション | オーディオ符号化復号化システム |
EP0820212B1 (de) | 1996-07-19 | 2010-04-21 | Bernafon AG | Lautheitsgesteuerte Verarbeitung akustischer Signale |
US5832444A (en) * | 1996-09-10 | 1998-11-03 | Schmidt; Jon C. | Apparatus for dynamic range compression of an audio signal |
JP2953397B2 (ja) | 1996-09-13 | 1999-09-27 | 日本電気株式会社 | ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器 |
US5903655A (en) | 1996-10-23 | 1999-05-11 | Telex Communications, Inc. | Compression systems for hearing aids |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
US5923710A (en) | 1997-02-05 | 1999-07-13 | Tektronix, Inc. | Synchronous switching of digital audio while maintaining block alignment |
US5862228A (en) | 1997-02-21 | 1999-01-19 | Dolby Laboratories Licensing Corporation | Audio matrix encoding |
US6535846B1 (en) * | 1997-03-19 | 2003-03-18 | K.S. Waves Ltd. | Dynamic range compressor-limiter and low-level expander with look-ahead for maximizing and stabilizing voice level in telecommunication applications |
DE19713862A1 (de) | 1997-04-04 | 1998-10-08 | Bosch Gmbh Robert | Verfahren zur automatischen Lautstärkesteuerung in einer Audiosignal-Wiedergabevorrichtung und Anordnung dazu |
US6792119B1 (en) * | 1997-05-05 | 2004-09-14 | Koninklijke Philips Electronics N.V. | Audio system |
US6125343A (en) | 1997-05-29 | 2000-09-26 | 3Com Corporation | System and method for selecting a loudest speaker by comparing average frame gains |
US6272360B1 (en) | 1997-07-03 | 2001-08-07 | Pan Communications, Inc. | Remotely installed transmitter and a hands-free two-way voice terminal device using same |
US6185309B1 (en) | 1997-07-11 | 2001-02-06 | The Regents Of The University Of California | Method and apparatus for blind separation of mixed and convolved sources |
KR100261904B1 (ko) | 1997-08-29 | 2000-07-15 | 윤종용 | 헤드폰 사운드 출력장치 |
US6088461A (en) | 1997-09-26 | 2000-07-11 | Crystal Semiconductor Corporation | Dynamic volume control system |
US6233554B1 (en) | 1997-12-12 | 2001-05-15 | Qualcomm Incorporated | Audio CODEC with AGC controlled by a VOCODER |
US6298139B1 (en) | 1997-12-31 | 2001-10-02 | Transcrypt International, Inc. | Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control |
US6182033B1 (en) | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US6353671B1 (en) | 1998-02-05 | 2002-03-05 | Bioinstco Corp. | Signal processing circuit and method for increasing speech intelligibility |
US6311155B1 (en) | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
US6498855B1 (en) | 1998-04-17 | 2002-12-24 | International Business Machines Corporation | Method and system for selectively and variably attenuating audio data |
JP2002518912A (ja) | 1998-06-08 | 2002-06-25 | コックレア リミティド | 聴覚装置 |
EP0980064A1 (de) | 1998-06-26 | 2000-02-16 | Ascom AG | Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen |
GB2340351B (en) | 1998-07-29 | 2004-06-09 | British Broadcasting Corp | Data transmission |
US6351731B1 (en) * | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6823303B1 (en) | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
US6411927B1 (en) | 1998-09-04 | 2002-06-25 | Matsushita Electric Corporation Of America | Robust preprocessing signal equalization system and method for normalizing to a target environment |
FI113935B (fi) | 1998-09-25 | 2004-06-30 | Nokia Corp | Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä |
DE19848491A1 (de) | 1998-10-21 | 2000-04-27 | Bosch Gmbh Robert | Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger |
US6314396B1 (en) | 1998-11-06 | 2001-11-06 | International Business Machines Corporation | Automatic gain control in a speech recognition system |
EP1089242B1 (en) | 1999-04-09 | 2006-11-08 | Texas Instruments Incorporated | Supply of digital audio and video products |
CA2372017A1 (en) | 1999-04-26 | 2000-11-02 | Dspfactory Ltd. | Loudness normalization control for a digital hearing aid |
US6263371B1 (en) | 1999-06-10 | 2001-07-17 | Cacheflow, Inc. | Method and apparatus for seaming of streaming content |
US6442278B1 (en) | 1999-06-15 | 2002-08-27 | Hearing Enhancement Company, Llc | Voice-to-remaining audio (VRA) interactive center channel downmix |
US6985594B1 (en) | 1999-06-15 | 2006-01-10 | Hearing Enhancement Co., Llc. | Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment |
US20020172376A1 (en) | 1999-11-29 | 2002-11-21 | Bizjak Karl M. | Output processing system and method |
FR2802329B1 (fr) | 1999-12-08 | 2003-03-28 | France Telecom | Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames |
US6351733B1 (en) | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
DE10018666A1 (de) | 2000-04-14 | 2001-10-18 | Harman Audio Electronic Sys | Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals |
US6889186B1 (en) | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
AUPQ952700A0 (en) | 2000-08-21 | 2000-09-14 | University Of Melbourne, The | Sound-processing strategy for cochlear implants |
JP3448586B2 (ja) | 2000-08-29 | 2003-09-22 | 独立行政法人産業技術総合研究所 | 聴覚障害を考慮した音の測定方法およびシステム |
US6625433B1 (en) | 2000-09-29 | 2003-09-23 | Agere Systems Inc. | Constant compression automatic gain control circuit |
US6807525B1 (en) | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
DE60029453T2 (de) | 2000-11-09 | 2007-04-12 | Koninklijke Kpn N.V. | Messen der Übertragungsqualität einer Telefonverbindung in einem Fernmeldenetz |
US7457422B2 (en) | 2000-11-29 | 2008-11-25 | Ford Global Technologies, Llc | Method and implementation for detecting and characterizing audible transients in noise |
FR2820573B1 (fr) | 2001-02-02 | 2003-03-28 | France Telecom | Methode et dispositif de traitement d'une pluralite de flux binaires audio |
WO2004019656A2 (en) | 2001-02-07 | 2004-03-04 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
DE10107385A1 (de) | 2001-02-16 | 2002-09-05 | Harman Audio Electronic Sys | Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken |
US6915264B2 (en) | 2001-02-22 | 2005-07-05 | Lucent Technologies Inc. | Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding |
DE50102419D1 (de) | 2001-04-10 | 2004-07-01 | Phonak Ag | Verfahren zur anpassung eines hörgerätes an ein individuum |
US7283954B2 (en) | 2001-04-13 | 2007-10-16 | Dolby Laboratories Licensing Corporation | Comparing audio using characterizations based on auditory events |
US7610205B2 (en) | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7711123B2 (en) | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US7461002B2 (en) | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
US7181034B2 (en) | 2001-04-18 | 2007-02-20 | Gennum Corporation | Inter-channel communication in a multi-channel digital hearing instrument |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US7242784B2 (en) * | 2001-09-04 | 2007-07-10 | Motorola Inc. | Dynamic gain control of audio in a communication device |
US7177803B2 (en) | 2001-10-22 | 2007-02-13 | Motorola, Inc. | Method and apparatus for enhancing loudness of an audio signal |
US20040037421A1 (en) | 2001-12-17 | 2004-02-26 | Truman Michael Mead | Parital encryption of assembled bitstreams |
US7068723B2 (en) | 2002-02-28 | 2006-06-27 | Fuji Xerox Co., Ltd. | Method for automatically producing optimal summaries of linear media |
US8340302B2 (en) | 2002-04-22 | 2012-12-25 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
US7155385B2 (en) | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
JP4257079B2 (ja) | 2002-07-19 | 2009-04-22 | パイオニア株式会社 | 周波数特性調整装置および周波数特性調整方法 |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7454331B2 (en) | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
JP2004133051A (ja) * | 2002-10-08 | 2004-04-30 | Wave Come:Kk | 音声入力装置 |
CN1739141A (zh) | 2003-02-06 | 2006-02-22 | 杜比实验室特许公司 | 连续的备份音频 |
DE10308483A1 (de) | 2003-02-26 | 2004-09-09 | Siemens Audiologische Technik Gmbh | Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät |
US7590251B2 (en) * | 2003-03-21 | 2009-09-15 | D2Audio Corporation | Clip detection in PWM amplifier |
US7551745B2 (en) | 2003-04-24 | 2009-06-23 | Dolby Laboratories Licensing Corporation | Volume and compression control in movie theaters |
AU2004248544B2 (en) | 2003-05-28 | 2010-02-18 | Dolby Laboratories Licensing Corporation | Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal |
EP1914722B1 (en) | 2004-03-01 | 2009-04-29 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
GB2413906A (en) * | 2004-04-21 | 2005-11-09 | Imagination Tech Ltd | Radio volume control system |
US7617109B2 (en) | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7508947B2 (en) | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
AU2005299410B2 (en) | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US8265295B2 (en) | 2005-03-11 | 2012-09-11 | Rane Corporation | Method and apparatus for identifying feedback in a circuit |
US7844059B2 (en) * | 2005-03-16 | 2010-11-30 | Microsoft Corporation | Dereverberation of multi-channel audio streams |
WO2006102892A1 (en) * | 2005-03-29 | 2006-10-05 | Gn Resound A/S | Hearing aid with adaptive compressor time constants |
TWI397903B (zh) | 2005-04-13 | 2013-06-01 | Dolby Lab Licensing Corp | 編碼音訊之節約音量測量技術 |
WO2007120452A1 (en) | 2006-04-04 | 2007-10-25 | Dolby Laboratories Licensing Corporation | Audio signal loudness measurement and modification in the mdct domain |
CN101421781A (zh) | 2006-04-04 | 2009-04-29 | 杜比实验室特许公司 | 音频信号的感知响度和/或感知频谱平衡的计算和调整 |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
ES2359799T3 (es) | 2006-04-27 | 2011-05-27 | Dolby Laboratories Licensing Corporation | Control de ganancia de audio usando detección de eventos auditivos basada en la sonoridad específica. |
US7813825B2 (en) * | 2006-07-10 | 2010-10-12 | Apple Inc. | Multiband dynamic range control graphical interface |
CA2665153C (en) | 2006-10-20 | 2015-05-19 | Dolby Laboratories Licensing Corporation | Audio dynamics processing using a reset |
US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
KR101106031B1 (ko) | 2007-01-03 | 2012-01-17 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 하이브리드 디지털/아날로그 음향 세기―보상 볼륨 제어 장치 및 그 제어 방법 |
EP2130019B1 (en) | 2007-03-19 | 2013-01-02 | Dolby Laboratories Licensing Corporation | Speech enhancement employing a perceptual model |
BRPI0808965B1 (pt) | 2007-06-19 | 2020-03-03 | Dolby Laboratories Licensing Corporation | Método e aparelho para medir a intensidade sonora percebida de um sinal de áudio e meio legível por computador |
EP2009786B1 (en) * | 2007-06-25 | 2015-02-25 | Harman Becker Automotive Systems GmbH | Feedback limiter with adaptive control of time constants |
-
2007
- 2007-09-25 CA CA2665153A patent/CA2665153C/en active Active
- 2007-09-25 JP JP2009533304A patent/JP4940308B2/ja active Active
- 2007-09-25 CN CN2007800385943A patent/CN101529721B/zh active Active
- 2007-09-25 MY MYPI20091346A patent/MY144271A/en unknown
- 2007-09-25 US US12/442,359 patent/US8849433B2/en active Active
- 2007-09-25 KR KR1020097010325A patent/KR101137715B1/ko active IP Right Grant
- 2007-09-25 BR BRPI0717484-5A patent/BRPI0717484B1/pt active IP Right Grant
- 2007-09-25 RU RU2009118955/09A patent/RU2413357C2/ru active
- 2007-09-25 EP EP07838861.8A patent/EP2082480B1/en active Active
- 2007-09-25 MX MX2009004175A patent/MX2009004175A/es active IP Right Grant
- 2007-09-25 AU AU2007309691A patent/AU2007309691B2/en active Active
- 2007-09-25 WO PCT/US2007/020747 patent/WO2008051347A2/en active Application Filing
- 2007-09-25 UA UAA200904964A patent/UA94968C2/ru unknown
- 2007-09-29 TW TW096136545A patent/TWI415481B/zh active
-
2009
- 2009-03-26 IL IL197856A patent/IL197856A/en active IP Right Grant
- 2009-04-17 NO NO20091518A patent/NO342161B1/no unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003152483A (ja) * | 2001-11-16 | 2003-05-23 | Victor Co Of Japan Ltd | オートマチックレベルコントロール回路 |
Also Published As
Publication number | Publication date |
---|---|
JP4940308B2 (ja) | 2012-05-30 |
TW200830890A (en) | 2008-07-16 |
US8849433B2 (en) | 2014-09-30 |
NO20091518L (no) | 2009-05-18 |
RU2413357C2 (ru) | 2011-02-27 |
CA2665153A1 (en) | 2008-05-02 |
WO2008051347A3 (en) | 2008-07-17 |
CN101529721B (zh) | 2012-05-23 |
UA94968C2 (ru) | 2011-06-25 |
BRPI0717484B1 (pt) | 2019-05-21 |
AU2007309691B2 (en) | 2011-03-10 |
JP2010507330A (ja) | 2010-03-04 |
BRPI0717484A2 (pt) | 2013-10-15 |
KR101137715B1 (ko) | 2012-04-25 |
TWI415481B (zh) | 2013-11-11 |
IL197856A (en) | 2014-03-31 |
CN101529721A (zh) | 2009-09-09 |
AU2007309691A1 (en) | 2008-05-02 |
US20100198377A1 (en) | 2010-08-05 |
EP2082480A2 (en) | 2009-07-29 |
WO2008051347A2 (en) | 2008-05-02 |
MY144271A (en) | 2011-08-29 |
MX2009004175A (es) | 2009-04-30 |
KR20090078834A (ko) | 2009-07-20 |
IL197856A0 (en) | 2009-12-24 |
EP2082480B1 (en) | 2019-07-24 |
CA2665153C (en) | 2015-05-19 |
RU2009118955A (ru) | 2010-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
NO342161B1 (no) | Audiodynamisk prosessering ved bruk av en tilbakestilling | |
KR101735416B1 (ko) | 오디오 라우드니스 제어 시스템 | |
US8787595B2 (en) | Audio signal adjustment device and audio signal adjustment method having long and short term gain adjustment | |
EP2219371B1 (en) | Volume correction device, volume correction method, volume correction program, and electronic equipment | |
US11109095B2 (en) | Automatic activation of closed captioning for low volume periods | |
US10594284B2 (en) | System and method for controlling volume | |
TW201347404A (zh) | 即時調整音訊訊號之響度的系統與方法 | |
EP3379847B1 (en) | Audio device, speaker device, and audio signal processing method | |
JP4661422B2 (ja) | ミューティング装置、デジタルオーディオ装置 | |
US11792487B2 (en) | Audio device with learning and adaptive quiet mode capabilities | |
JP2002165152A (ja) | 音量調整装置 | |
CN114902560A (zh) | 具有环境噪音补偿的用于自动音量控制的设备和方法 | |
KR20070022116A (ko) | 오디오 신호의 크기를 자동적으로 조정하는 방법 및 시스템 | |
GB2559858A (en) | Audio processing apparatus and method of controlling same | |
JPH05347794A (ja) | ビデオカメラ用収音装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
CHAD | Change of the owner's name or address (par. 44 patent law, par. patentforskriften) |
Owner name: DOLBY LABORATORIES LICENSING CORPORATION, US |