TWI455481B - 利用聽覺事件之聽覺場景分析與特定響度式檢測來控制音訊動態增益參數之非暫時性電腦可讀取儲存媒體、方法及裝置 - Google Patents

利用聽覺事件之聽覺場景分析與特定響度式檢測來控制音訊動態增益參數之非暫時性電腦可讀取儲存媒體、方法及裝置 Download PDF

Info

Publication number
TWI455481B
TWI455481B TW096111338A TW96111338A TWI455481B TW I455481 B TWI455481 B TW I455481B TW 096111338 A TW096111338 A TW 096111338A TW 96111338 A TW96111338 A TW 96111338A TW I455481 B TWI455481 B TW I455481B
Authority
TW
Taiwan
Prior art keywords
audio
time
auditory
signal
event
Prior art date
Application number
TW096111338A
Other languages
English (en)
Other versions
TW200803161A (en
Inventor
Brett Graham Crockett
Alan Jeffrey Seefeldt
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of TW200803161A publication Critical patent/TW200803161A/zh
Application granted granted Critical
Publication of TWI455481B publication Critical patent/TWI455481B/zh

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G1/00Details of arrangements for controlling amplification
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Circuits Of Receivers In General (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Document Processing Apparatus (AREA)

Description

利用聽覺事件之聽覺場景分析與特定響度式檢測來控制音訊動態增益參數之非暫 時性電腦可讀取儲存媒體、方法及裝置 發明領域
本發明係論及音訊動態範圍控制之方法和裝置,其中,一個音訊處理裝置,可分析一個音訊信號,並且可改變該音訊之位準、增益、或動態範圍,以及上述音訊增益和動態處理之所有或某些參數在產生上,係為一個聽覺事件函數。本發明亦論及一些用以實現該等方法或用以控制該等裝置之電腦程式。
本發明亦論及一些用以使用聽覺事件之特定響度式檢測的方法和裝置。本發明亦論及一些用以實現該等方法或用以控制該等裝置之電腦程式。
發明背景 音訊之動態處理
自動增益控制(AGC)和動態範圍控制(DRC)之技術係屬習見,以及係許多音訊信號路徑之常見元件。在抽象之意義中,以上兩種技術係使用某種方法,來測量一個音訊信號之位準,以及接著修飾該信號之增益,而達一個屬上述測得位準之函數的數量。在一種線性1:1動態處理系統中,該輸入音訊並不會被處理,以及其輸出音訊信號,理想上係與該輸入音訊信號相匹配。此外,若在此有一種音訊動態處理系統,可自動測量上述輸入信號之特徵,以及可使用該測量值來控制輸出信號,且若該輸入信號之位準昇高6分貝,以及其輸出信號係經過處理,使其位準僅昇高3分貝,則該輸出信號係相對於該輸入信號壓縮2:1之比率。國際出版品編號WO 2006/047600 A1(“Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal”(Alan Jeffrey Seefeldt所著之“計算及調整一個音訊信號之感知響度和/或感知頻譜平衡”),提供了五種基本類型之音訊動態處理的詳細總結:壓縮、限定、自動增益控制(AGC)、擴展、和閘控。
聽覺事件和聽覺事件檢測
將聲音分割成一些可清楚分開被感知之單元或節段,有時係被稱為“聽覺事件分析”或“聽覺場景分析”(“ASA”),以及該等節段有時係被稱為“聽覺事件”或“音訊事件”。“聽覺場景分析”之詳盡討論,係由Albert S.Bregman闡明在其著作Auditory Scene Analysis--The Perceptual Organization of Sound(聽覺場景分析-音訊感知組織),麻省理工學院,1991年,第四版,2001年,第二MIT出版社平裝版。此外,1999年十二月14日頒給Bhadkamkar,et al之美國專利申請序列號碼第6,002,776號,引述回溯自1976年名為“prior art work related to sound separation by auditory scene analysis.”(與藉由聽覺場景分析之聲音分離有關的先存技藝式工作”)。然而,該Bhadkamkar,et al專利,阻礙了聽覺場景分析之實際使用,其結論是“一些涉及聽覺場景分析之技術,雖然就科學之觀點而言,屬一個關注人類聽覺處理之模型的課題,目前係過度仰仗電腦計算之技能,以及在專業上係被視為有關聲音分離之實用技術,直至基礎進步被完成為止”。
一種用以識別聽覺事件之有用方法,係由Crockett和Crocket et al闡明在下文條列於“Incorporation by Reference.”(引置條款)標題下之各種專利申請案和論文中。依據此等文獻,一個音訊信號,係藉由檢測頻譜複合組成(一個頻率函數之幅度)中相對於時間之變化,使分割成一些各朝向被感知為清楚分開的聽覺事件。此在完成上舉例而言,可能係藉由計算上述音訊信號之連續時間區段的頻譜內容中之差異,以及藉由在該等連續時間區段間之頻譜內容中的差異,超過一個臨界值時,識別一個聽覺事件邊界,而作為該等連續時間區段間之邊界。替代選擇的是,其可能代替或加上頻譜複合組成中相對於時間之變化,而計算上述相對於時間之幅度中的變化。
在其仰仗電腦計算技能為最少之實現體中,程序係將音訊分割成時間節段,其係藉由分析整個頻帶(全頻寬音訊)或大體上之整個頻帶(在實際之實現體中,常被採用的是在頻譜之端部處的頻帶極限濾波運作),以及將最大之權量給最大響度之音訊信號成分。此種解決方案係利用一種心理聲學現象,其中,在較小之時間標度(20毫秒(ms)和更小)下,人耳在一個給定之時間下,可能傾向於集中注意在一個單一聽覺事件上面。此係意味雖然可能會有多重事件在同一時刻下發生,一個成分傾向於在知覺上最為顯著,以及可能被個別處理,而當作其為唯一發生之事件。利用此一效應,亦可容許該聽覺事件檢測,按被處理之音訊的複雜性來衡量。舉例而言,若上述被處理之輸入音訊信號,係一種獨奏樂器,該等被識別之音訊事件,將有可能是正在演奏之個別音符。同樣,就一個輸入聲音信號而言,語音之個別成分,舉例而言,母音和子音,將有可能被識別為個別之音訊元素。隨著上述音訊之複雜性的增加,諸如一個鼓聲或多重樂器和聲音之音樂,該聽覺事件檢測,可識別任一給定時刻下之“最顯著”(亦即,響度最大)的音訊元素。
在較大之電腦計算複雜性的代價下,其程序亦可能係考慮離散副頻帶(固定或動態判定式或固定或動態兩者之判定式副頻帶)而非全頻寬內之頻譜複合組成中相對於時間的變化。此替代選擇方案,係考慮不同副頻帶內超過一個之音訊串流,而非假定在一個特定之時間下,僅有一個單一串流可被感知。
聽覺事件檢測在實現上,可能係藉由使用一個濾波器排組或時間-頻率變換運作,諸如FFT,將一個時域音訊波形,分割成一些時間間隔或區段,以及接著將每個區段內之資料,轉換成上述之頻域。每個區段之頻譜內容的幅度可能被常態化,藉以消除或降低幅度變化之效應。每個成就之頻域表示值,提供了上述特定之區段內的音訊之頻譜內容的指示值。彼等連續區段之頻譜內容係使相比較,以及一些大於一個臨界值之變化,可能被視為指示一個聽覺事件之瞬時開始或瞬時結束。
較佳的是,該頻域資料係如下文之討論使常態化。上述頻域資料需要被常態化之程度,可產生一種幅度指示值。因此,若此程度中之變化,超過一個預定的臨界值,其一亦可能被視為指示一個事件邊界。頻譜變化和幅度變化所造成之件起始和結束點,可能一起進行邏輯或處理,而使任一類型之變化所造成的事件邊界可被識別。
雖然Crockett和Crockett at al之專利申請案和論文中所說明的技術,配合本發明之屬性係特別有用,其他用以識別聽覺事件和事件邊界之技術,可能被採用在本發明之屬性中。
發明概要
音訊之傳統先存技藝式動態處理,係涉及使該音訊乘以時變性控制信號,後者可調整上述音訊之增益,而產生一個所希望之結果。“增益”係一個用以定標該音訊幅度之標度因數。該控制信號可能係以連續之方式來產生,或者係產生自音訊資料區段,但其通常係自上述被處理之音訊的某種測量形式導得,以及其變化率係由一些平滑濾波器來決定,後者有時係具有固定之特徵,有時係具有隨音訊動態而變化之特徵。舉例而言,彼等響應時間可能依據上述音訊之幅度或功率中的變化而做調整。一些類似自動增益控制(AGC)和動態範圍壓縮(DRC)等先存技藝式方法,並不會以任何心理聲學方式評估,增益變化可能在其間被感知為有缺損且當彼等可被施加而不會衍生聽覺之假象的時間間隔。所以,傳統式音訊動態程序,時常會導入一些聽覺假象,亦即,上述動態處理之效應,會在音訊中導入一些不當之可察覺的變化。
聽覺場景分析,可識別彼等在知覺上離散之聽覺事件,每個事件係發生在兩個連續的聽覺事件邊界之間。一個增益變化所造成之聽覺上的缺損,可藉由確保增益在一個聽覺事件內更接近常數,以及藉由使大部份之變化限制在一個事件邊界附近,而使大幅降低。在壓縮器或擴展器之背景環境中,對音訊位準中之增加的響應(常被稱為著手處理(attack)),可能很快速且係與聽覺事件之最小期間相當或較短,但對一個降低(釋放或恢復)的響應可能較慢,以致一些本應呈現不變及逐漸衰減之聲音,可能在音訊上會呈現失真。在此種環境之下,使該增益恢復延遲,直至達次一邊界為止,或者在一個事件期間,使增益之變化率減緩,係屬非常有利。就自動增益控制施加而言,其中,上述音訊之中期至長期位準或響度係使常態化,以及著手處理和釋放時間兩者,因而比起一個聽覺事件之最小期間可能會很長,在事件期間使變化延遲或使增益中之變化率減緩,直至增加及降低增益兩者有關之次一事件邊界為止,係屬有利。
依據本發明之一個屬性,一個音訊處理系統,可接收一個音訊信號,以及可分析並變更上述音訊之增益和/或動態範圍的特徵。上述音訊之動態範圍修飾,經常係受控於一個動態處理系統之參數(著手處理和釋放時間、壓縮比、等等),後者針對上述動態處理所導入之知覺假象,係具有顯著之效應。上述音訊信號中相對於時間之信號特徵中的變化會被檢測,以及被識別為聽覺事件邊界,而使連續邊界間之一個音訊節段,構成上述音訊信號中之一個聽覺事件。該等被關注之聽覺事件的特徵,可能包括該等事件類似知覺強度或期間等之特徵。某些該等一個或多個動態處理參數在產生上,至少係部份響應聽覺事件和/或一些與該等聽覺事件邊界相關聯之信號特徵中的變化程度。
典型地,一個聽覺事件,係傾向於被感知為清楚分開之音訊節段。信號特徵的一個有用之度量,係包括該音訊之頻譜內容的度量,舉例而言,正如上述被引用之Crockett和Crockett et al文件中所說明者。所有或某些該等一個或多個音訊動態處理參數在產生上,可能至少部份響應一個或多個聽覺事件之存在與否和特徵。一個聽覺事件邊界,可能被識別為信號特徵中相對於超過一個臨界值之時間變化。或者,所有或某些該等一個或多個參數在產生上,可能至少部份響應一些與該等聽覺事件邊界相關聯之信號特徵中的變化程度之連續性度量。雖然本發明之屬性,原則上可能在類比域和/或數位域中被實現,實際之實現體,有可能是在數位域中被實現,其中,每個音訊信號,係由個別之樣本或資料區段內之樣本來表示。在此一情況中,該等信號特徵可能是一個區段內之音訊的頻譜內容,彼等信號特徵中相對於時間之變化的檢測,可能是逐區段之音訊的頻譜內容中之變化的檢測,以及彼等聽覺事件時間起始和停止邊界,各係與資料之區段的邊界相重合。理應注意到的是,就以逐樣本為基礎來執行動態增益改變之更傳統的情形而言,上述所說明之聽覺場景分析,可能以逐區段為基礎來執行,以及所成就之聽覺事件資訊,係被用來執行逐樣本所施加之動態增益改變。
藉由使用聽覺場景分析之結果來控制關鍵性音訊動態處理參數,便可能達成動態處理所導入之聽覺的假象之顯著降低。
本發明提出了兩種用以執行聽覺場景分析之方法。第一種方法可執行頻譜分析,以及可藉由識別頻譜內容中之變化,來識別一些被用來控制該等動態增益參數之可察覺的音訊事件之位置。第二種方法可將該音訊變換成一個知覺響度域(其可能比第一種方法提供更多之心理聲學相關資訊),以及可識別一些隨繼被用來控制該等動態增益參數之聽覺事件的位置。理應注意到的是,第二種方法需要的是,上述之音訊處理,應知道絕對的聽覺再現位準,彼等在某些實現體中,可能係屬不可能。提出兩種聽覺場景分析之方法,可容許使用一些為考慮絕對再現位準而可能或可能不被校準之程序或裝置,來實現ASA-控制式動態增益修飾。
本發明之屬性在本說明書中,係在一個包括其他發明之屬性的音訊動態處理環境中做說明。此類其他發明係說明在本專利申請案之業主,Dolby Laboratories Licensing Corporation(杜比實驗室授權公司),的各個待審之美國和國際專利申請案中,該等專利申請案係指明在本說明書中。
圖式簡單說明
第1圖係一個可顯示用以執行聽覺場景分析之處理步驟的範例之流程圖;第2圖係顯示一個在執行上述聽覺場景分析時針對音訊進行區段處理、窗取樣、及執行該DFT之範例;第3圖係在一個流程圖或功能方塊圖之性質中顯示平行處理,其中,音訊係被用來識別聽覺事件並識別該等聽覺事件之特徵,而使該等事件和彼等之特徵,被用來修飾該等動態處理參數;第4圖係在一個流程圖或功能方塊圖之性質中顯示處理,其中,音訊係僅被用來識別聽覺事件,以及該等事件之特徵,係導自該音訊事件檢測,而使該等事件和彼等之特徵,被用來修飾該等動態處理參數;第5圖係在一個流程圖或功能方塊圖之性質中顯示處理,其中,音訊係僅被用來識別聽覺事件,以及該等事件之特徵,係導自該音訊事件檢測,而僅使該等聽覺事件之特徵,被用來修飾該等動態處理參數;第6圖係顯示一組可近似化基於ERB標度之臨界頻帶的理想化之聽覺濾波器特徵響應。其水平標度為赫茲(Hz)下之頻率,以及其垂直標度為分貝(dB)下之位準;第7圖係顯示ISO 226之等響度曲線圖,其水平標度為赫茲(Hz)(基底10之對數標度)下之頻率,以及其垂直標度為分貝(dB)下之聲壓位準;第8a-c圖係顯示一個音訊動態範圍壓縮器之理想化的輸入/輸出特徵和輸入增益特性;第9a-f圖係顯示一個使用聽覺事件來控制一個傳統式動態範圍控制器(DRC)之數位實現體中的釋放時間之聽覺事件的範例,其中,該增益控制係導自該信號之均方根(RMS)功率;第10a-f圖係顯示一個使用聽覺事件來控制一個傳統式動態範圍控制器(DRC)之數位實現體中的釋放時間之聽覺事件的範例,其中,該增益控制係導自一個不同於第9圖中所使用之替代信號的信號之均方根(RMS)功率;而第11圖則係描述在一個響度域動態處理系統中施加AGC緊跟DRC有關之理想化的AGC和DRC曲線之適當集合。此種組合之目標,係使所有處理之音訊,具有大約相同之感知響度,同時仍能維持至少某些原始音訊動態。
較佳實施例之詳細說明 聽覺場景分析(原形非響度域方法)
依據本發明之一個屬性的實施例中,聽覺場景分析,可能係由第1圖之一部分所顯示的四個一般性處理步驟所組成。第一步驟1-1(“執行頻譜分析”),可取得時域聲頻信號,可將其分割成一些區段,以及可計算每個區段有關之頻譜廓線或頻譜內容。頻譜分析可將該音訊信號變換成短期頻域。此在執行上亦可能使用任何濾波器組,彼等或基於變壓器,或基於帶通濾波器組,以及係在線性或翹曲性頻率空間(諸如巴克量度或臨界頻帶,彼等更接近人耳之特性)。以任何一個濾波器組,在時間與頻率之間,存在著一種折衷選擇。較大之時間解析度,和因而較短之時間間隔,將導致較低之頻率解析度。較大之頻率解析度,和因而較窄之子頻帶,將導致較長之時間間隔。
第1圖中以概念例示之第一步驟,可計算上述音訊信號之連續時間節段的頻譜內容。在一個實際之實施例中,上述ASA區段之尺度,可能來自上述輸入音訊信號之任何樣本數目,不過,512個樣本可提供時間和頻率解析度之良好折衷選擇。在第二步驟1-2中,逐區段之頻譜內容中的差異會被決定(“執行頻譜廓線差異測量”)。因此,該第二步驟可計算上述音訊信號的連續時間節段之間的頻譜內容中之差異。誠如上文所討論,一個被感知之聽覺事件的開始和結束之強效指示符,係被認為屬頻譜內容中之一個改變。在第三步驟1-3(“識別聽覺事件邊界之位置”)中,當一個頻譜廓線區段與次一區段之間的頻譜差異,大於一個臨界值時,該區段邊界係被採用為一個聽覺事件邊界。彼等連續邊界之間的音訊節段,構成了一個聽覺事件。因此,該第三步驟,可在該等連續邊界之間的頻譜廓線內容中之差異,超過一個臨界值時,設定連續時間節段之間的聽覺事件邊界,因而界定出聽覺事件。在此一實施例中,彼等聽覺事件邊界,可界定出一些聽覺事件,使彼等具有之長度,為一個頻譜廓線區段之整數倍數,其最小之長度為一個頻譜廓線區段(此範例中為512個樣本)。大體而言,事件邊界並不必受到如此之限制。就本說明書所討論之實際實施例的替代方案而言,上述輸入區段之尺度可能有變化,舉例而言,而使基本上為一個聽覺事件之尺度。
緊接該等事件邊界之識別,如步驟1-4中所示,該聽覺事件之關鍵特徵會被識別出。上述音訊之交疊或非交疊節段,可能被窗取樣,以及被用來計算上述輸入音訊之頻譜廓線。交疊可對聽覺事件之位置,造成較細緻之解析度,以及亦可使其較不可能錯過一個事件,諸如一個短期暫態。然而,交疊亦會增加電腦計算之複雜性。因此,交疊可能會被省略。第2圖係顯示被窗取樣並以離散傅立葉變換使(DFT)轉換成頻域之非交疊的N個樣本區段之概念表示。每個區段可能被窗取樣,以及使轉換成頻域,諸如藉由使用該DFT,較佳的是,考為速率而使實現為一個快速傅立葉變換(FFT)。
以下諸變數可能被用來計算上述輸入區段之頻譜廓線:M=一個被用來計算頻譜廓線之區段中的窗取樣之樣本的數目P=頻譜計算交疊之樣本數目
通常,以上變數可能使用任何之整數。然而,若M被設定使等於一個2之冪方,而使標準FFT可能被用於該頻譜廓線計算,則其實現體將更有效率。在上述聽覺場景分析程序之實際實施例中,該等列舉之參數可能被設定為:M=512個樣本(或44.1仟赫下之11.6 ms)P=0個樣本(非交疊)
以上列舉之值係以實驗來決定,以及通常被發現可以足夠之準確度,來識別聽覺事件之位置和期間。然而,設定P之值為256個樣本(50%交疊)而非零個樣本(非交疊),已被發現用以識別某些難以發現之事件係屬有用。雖然許多不同類型之取樣窗,可能被用來極小化取樣窗所致之頻譜假象,該等頻譜廓線計算中所使用之窗取樣,M-點Hanning(漢寧窗)、Kaiser-Bessel(凱塞-貝塞爾窗)、或其他適當且較佳之非方形窗。上文所指明之值和漢寧窗類型,係在大量之實驗分析已顯示可橫跨寬廣範圍之音訊素材提供優異的結果之後被選定。處理一些具有絕大多數之低頻內容的音訊信號,較佳的是非方形取樣窗。方形取樣窗會產生一些可能造成事件之不正確的檢測之頻譜假象。不同於某些編碼器/解碼器(codec)施加,其中,總體交疊/相加程序勢必要提供一個固定之位準,此種限制條件並不適用,以及該取樣窗可能就一些類似其之時間/頻率解析度和止帶抑制(stop-band rejection)等特性,來加以選擇。
在步驟1-1(第1圖)中,每個M-取樣區段之頻譜在計算上,可能藉由以一個M-點Hanning(漢寧窗)、Kaiser-Bessel(凱塞-貝塞爾窗)、或其他適當之取樣窗,來窗取樣該資料,使用一個M-點快速傅立葉變換,使轉換成頻域,以及計算該等複數FFT係數之幅度。此成就之資料係使常態化,而使其最大之幅度被設定為“一”,以及該等M個數目之常態化陣列,係被轉換至對數域。該資料亦可能以其他度量使常態化,諸如該資料之平均幅度值或平均功率值。該陣列並不需要被轉換至對數域,但該項轉換可簡化步驟1-2之差異計量。此外,該對數域更密切符合人類聽覺系統之性質。上述成就之對數域值,係具有負無限大至零之範圍。在一個實際之實施例中,該等值之範圍,可能賦有一個下限;該極限可能係使固定,舉例而言-60 dB,或是係屬頻率相依性,藉以反映低頻和極高頻下之靜音的較低可聞度。(理應注意到的是,該陣列之尺度有可能被約減至M/2,而使FFT表示負頻率和正頻率)。
步驟1-2可計算相鄰區段之頻譜間的差異之計量。就每個區段而言,每個來自步驟1-1之M(對數)頻譜係數,係使自前一區段有關之對應係數減除,以及計算此差異之幅度(忽略正負號)。此等M個差異接著係使加總成一個數字。此差異計量亦可能藉由使此差異除以該加總中所用之頻譜係數的數目(在此情況中為M個係數),而表示為每頻譜係數之平均差異。
步驟1-3可藉由施加一個臨界值至上述來自步驟1-2而具有一個臨界值之差異計量的陣列,來識別彼等聽覺事件邊界之位置。當一個差異計量超過一個臨界值時。頻譜中之變化,被認為係足以傳訊一個新事件,以及該變化之區段數目,係被記錄為一個事件邊界。就上文所列之M和P的值,以及就以單位dB表示之對數值(步驟1-1中)而言,若被比較的是全幅度FFT(包括鏡射之部分),該臨界值可被設定使等於2500,以及若被比較的是一半FFT(如上文所表明),該臨界值便被設定為1250。就FFT之幅度而言,該FFT代表著負頻率和正頻率,一個是另一個的鏡像)此值係由實驗來選擇,以及其提供了良好之聽覺事件邊界檢測。此參數值可能被改變來降低(增加該臨界值)或增加(降低該臨界值)彼等事件之檢測值。
第1圖之程序可能更一般性地以第3、4、和5圖之等效安排來表示。在第3圖中,一個音訊信號係平行施加至一個“識別聽覺事件”功能或步驟3-1,其可將該音訊信號,分割成一些各傾向於被感知為清楚分開的聽覺事件,以及施加至一個選用之“識別聽覺事件之特徵”功能或步驟3-2。第1圖之程序,可能被採用來將該音訊信號分割成一些被識別之聽覺事件和彼等之特徵,或者可能採用某些其他之適當程序。上述可能由功能或步驟3-1所決定之聽覺事件邊界的身份之聽覺事件資訊,接著係依需要被用來以“修飾動態參數”功能或步驟3-3,修飾該等音訊動態處理參數(諸如著手處理、釋放、比率、等等)。該選用性“識別特徵”功能或步驟3-3,亦可接收該聽覺事件資訊。該“識別特徵”功能或步驟3-3,可能藉由一個或多個特徵,來特性化某些或所有之聽覺事件。此種特徵正如配合第1圖之程序所說明的,可能包括上述聽覺事件之支配性子頻帶的身份。該等特徵亦可能包括一個或多個音訊特徵,其中舉例而言包括:該聽覺事件之功率的計量、該聽覺事件之幅度的計量、該聽覺事件之頻譜平坦度的計量、和該聽覺事件是否大體上無聲、或其他有助於修飾動態參數之特徵,以便降低或移除上述處理之無用的聽覺假象。該等特徵亦可能包括其他類似該聽覺事件是否包含有暫態等之特徵。
第3圖之安排的替代方案,係顯示在第4和5圖中。在第4圖中,該音訊輸入信號,係無法直接施加至“識別特徵”功能或步驟4-3,但其確可接收來自“識別聽覺事件”功能或步驟4-1之資訊。第1圖之安排係此種安排之一個特定範例。在第5圖中,該等功能或步驟5-1、5-2、和5-3,係按順序排列。
此實際實施例之細節並不重要。有其他之方法,可能被採用來計算上述音訊信號之連續時間節段的頻譜內容,計算該等連續時間節段之間的差異,以及在此等連續時間分段之間的頻譜廓線內容中之差異,超過一個臨界值時,設定彼等連續時間節段之間的對應邊界處之聽覺事件邊界。
聽覺場景分析(新的響度域方法)
2005年十月25日提出申請之專利合作條約編號PCT/US2005/038579下的國際申請案,國際公開號WO 2006/047600 A1,Alan Jeffrey Seefeldt取名為“Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal”(計算及調整一個音訊信號之感知響度和/或感知頻譜平衡),且姑不論其他,揭示了一種基於一個心理聲學模型之感知響度的客觀計量。該申請案係藉由參照其全文使合併進本說明書內。誠如該申請案中所說明,自一個音訊信號,x[n],有一個激勵信號E [b ,t ]計算出,其可近似化時間區段t期間在臨界頻帶b下沿內耳之基底膜的能量分佈。該激勵信號可自上述音訊信號之短時離散傅立葉變換(STDFT)計算如下:
其中,X [k ,t ]係表示時間區段t和集器k下之x [n ]的STDFT。理應注意到的是,在方程式1中,t係表示變換區段之離散單位中的時間,而與類似秒等之連續計量形成對比。T [k ]係表示一個模擬透過外耳和中耳之音訊的傳輸之濾波器的頻率響應,以及C b [k ]係表示一個對應於臨界頻帶b之位置的基底膜之頻率響應。第6圖係描述一個適當組之臨界頻帶濾波器響應,其中,有40個頻帶,如Moore和Glasberg所界定,係沿等效矩形頻寬(ERB)標度均勻相間。每個濾波器形狀,係藉由圓通化指數函數來說明,以及該等頻帶係使用1ERB之間隔來分配。最後,方程式1中之平滑時間常數λ b ,可能有利的是在選擇上使正比於頻帶b內之人耳響度感知積分時間。
使用等響度廓線,諸如第7圖中所描繪者,每個頻帶處之激勵信號,係被轉換成一個將會產生1 kHz下之同一感知響度的激勵位準。接著自上述轉換過之激勵信號,E 1 kHz [b ,t ],透過一個壓縮式非線性化,計算出一種橫跨頻率和時間而分佈之感知響度的計量之比響度。一個此種用以計算比響度N [b ,t ]之適當的函數係定為:
其中,TQ 1 kHz 係1 kHz下之安靜中的臨界值,以及常數βα 係選擇使與收聽實驗所收集到之響度資料的成長相匹配。理論上來說,此種自激勵信號至比響度之變換,可能以Ψ{}來表示,而使:N [b ,t ]=Ψ{E [b ,t ]}
最後,以單位宋(sone)表示之總響度,L [t ],係藉由橫跨頻帶使比響度加總來加以計算:
該比響度N [b ,t ]係一個意在模擬人耳感知音訊為頻率和時間的一個函數之方式的頻譜表示式。其可捕捉靈敏度對不同頻率之變動、靈敏度對位準之變動、和頻率解析度中之變動。就此而論,其係一個與聽覺事件十分匹配之頻譜表示式。雖然在電腦計算上更複雜,橫跨頻帶比較N [b ,t ]在連續時間區段之間的差異,在許多情況中,與上文所說明直接使用連續之FFT頻譜相比較,在感知上將可能造成聽覺事件之更準確的檢測。
在該專利申請案中,有幾種用以基於此心理聲學響度模型來修飾音訊之施加例揭示出。其中有幾種動態處理運算法,諸如AGC和DRC。此等揭示之運算法,可能得利於使用聽覺事件來控制各種相關聯之參數。由於比響度已被計算出,其立即可供該等事件之檢測用。一個較佳實施例之細節,係在下文中加以討論。
有關以聽覺事件來控制音訊動態處理參數
茲提出本發明之實施例的兩個範例。其第一個說明了使用聽覺事件來控制一個動態範圍控制器(DRC)的數位實現體中之釋放時間,其中,增益控制係導自信號之均方根(RMS)功率。第二個實施例,說明了使用聽覺事件來控制上文所說明之心理聲學響度模型的背景環境中之AGC和DRC實現體的更複雜之組合的某一定之屬性。此兩種實施例係僅意在充作本發明之一個範例,以及理應瞭解的是,使用聽覺事件來控制一個動態處理運算法的參數,並非受限於下文所說明之特定細節。
動態範圍控制
一個DRC之被說明的數位實現體,可將一個音訊信號x [n ],分段成一些窗分半交疊之區段,以及可就每個區段,基於該信號之局部功率的計量和一個被選定之壓縮曲線,計算出一個修飾增益。此增益係橫跨諸區段使平滑化,以及接著以每個區段相乘。此等修飾過之區段,最後係使交疊相加,藉以產生修飾之音訊信號y [n ]。
理應注意到的是,雖然本說明書所說明之聽覺場景分析和DRC之數位實現體,係將時域音訊信號,分割成一些區段,藉以執行分析和處理,該DRC處理在執行上,並不需要使用區段分割。舉例而言,該聽覺場景分析在執行上,可能使用如上文所說明之區段分割和頻譜分析,以及所成就之聽覺事件位置和特徵,可被用來提供控制資訊,給一個在運作上以逐一取樣之基礎的傳統式DRC實現體之數位實現體。然而,在此,聽覺場景分析所使用之同一節段結構,係供DRC採用來簡化彼等組合之說明。
繼續進行一個區段式DRC實現體之說明,上述音訊信號之交疊區段可使表示為:x [n ,t ]=w [n ]x [ntM /2]就0<n<M -1而言 (4)
其中,M為區段長度,以及其跳距為M/2,w [n ]為其開窗,n為區段內之取樣指數,以及t為區段指數(理應注意到的是,在此,t在使用上係與方程式1中之STDFT的方式相同;其舉例而言,係以區段之離散單位而非秒來表示時間)。理想上,該開窗w [n ]係逐漸變小至兩端處的零,以及當與其本身成半交疊時係加總成一;舉例而言,其常用之正弦開窗,係符合此等準則。
就每個區段而言,該RMS功率接著可被計算,藉以產生一種以dB/每區段為單位之功率計量P [t ]:
誠如先前所提及,此功率計量,可在被一個壓縮曲線處理之前,以快速著手處理和緩慢釋放使平滑化,但就一個替代方案而言,處理的是瞬間功率P [t ],以及所成就之增益係使平滑化。此替代解決方案具有之優點是,可能使用一個有銳形拐點之簡單的壓縮曲線,但所成就之增益在功率行經該拐點時仍呈平滑形。將一個如第8c圖中所顯示之壓縮曲線,表示為一個可產生一個增益之信號位準函數F,該區段增益G [t ]係定為:G [t ]=F {P [t ]} (6)
假定隨著信號位準之增加,該壓縮曲線係施加較大之衰減,該增益於信號處於“著手處理模態”中時將會降低,以及在“釋放模態”中時將會逐漸。所以,一個平滑化之增益,在計算上可能係依據:
其中, 以及α release >>α attach (7c)
最後,上述以dB為單位之平滑化增益,係施加至上述信號之每個區段,以及此被修飾之區段係使交疊相加,藉以產生經修飾之音訊:就0<n <M /2而言 (8)
理應注意到的是,由於該等區段如方程式4中所示,已與一個錐形窗分(windowed)相乘,上文所示之交疊相加合成技術,可橫跨上述處理之信號y [n ]的取樣,有效地使該等增益平滑化。因此,該增益控制信號,可接收除方程式7a中所顯示者外之平滑化。在一個逐樣本而非逐區段之方式運作的DRC之較傳統的實現體中,可能有必要的,是比方程式7a中所顯示之簡單的單極濾波器更複雜之平滑化的增益,藉以避免上述處理之信號的可見聞之失真。而且,使用區段式處理,可將M/2個樣本之固有延遲導入該系統中,以及只要與α attack 相關聯之衰減時間,接近上述之延遲,該信號x [n ]在為避免過沖而施加該等增益之前,並不需要進一步被延遲。
第9a至9c圖係描述對一個音訊信號施加上述說明之DRC處理的結果。就此特定之實現體而言,在一個44.1 kHz之取樣率下,係使用一個M=512之區段長度。所使用的是一個與第8b圖中所示者相類似之壓縮曲線:在相對於全標度數位超過-20 dB以上,信號係以5:1之比率衰減,以及在低於-30 dB以下,信號係以5:1之比率提昇。該增益係以一個對應於10 ms之半衰減時間的著手處理係數α attack 和一個對應於500 ms之半衰減時間的釋放係數α release 使平滑化。第9a圖中所描繪之原始音訊信號,係由六根連續鋼琴和弦所組成,其位於樣本1.75×105 附近之最後和弦,係衰減至無聲。檢查第9b圖中之增益[t]的曲線圖,理應注意到的是,當該等六根和弦被演奏時,該增益係保持接近0 dB。此係由於該信號能量就大部份而言,係保持在-30 dB與-20 dB之間,該DRC曲線在此區域內並不需要修飾。然而,在打擊最後一根和弦之後,該信號能量係跌至低於-30 dB以下,以及隨著該和弦之衰減,該增益將會開始升高,最終超過15 dB。第9c圖描述上述成就之修飾的音訊信號,以及上述最後和弦之尾部,可見係明顯被提昇。在音訊上,上述和弦之自然低位準衰減聲音的提昇,將會建立一個極不自然之結果。本發明之目標,旨在避免與一個傳統式動態處理器相關聯之此類問題。
第10a至10c圖描述施加確實相同之DRC系統至不同的音訊信號之結果。在此一情況中,上述信號之第一半部,係包含有一個高位準下之快速樂曲,以及接著在大約10×104 之取樣下,該信號係使交換至一個第二快速樂曲,但係處於一個明顯較低之強度。檢查第6b圖中之增益,該信號在第一半部期間,可見係衰減大約10 dB,以及接著在該較柔和之樂曲演奏時的第二半部期間,該增益將會昇高返回至0 dB。在此一情況中,該增益係依需要而變化。該第二樂曲可能想要相對於第一樂曲而使提昇,以及該增益在變遷至第二樂曲之後應使迅速增加,使在聽覺上不引人注意。人們見到了一種與有關第一信號所討論者相類似之增益行為,但該行為在此係為所想要的。所以,人們想要的是固定第一種情況而不會影響到第二種情況。使用聽覺事件來控制此種DRC系統之釋放時間,提供了此種解決方案。
在第9圖中所檢查之第一信號中,上述最後和弦之衰減的提昇似乎是不自然,因為該和弦和其衰減,係被感知為一個單一聽覺事件,其完整性係期望要被維持。然而,在第二種情況中,當該增益增加之際,有許多聽覺事件發生,此意謂就任何一個個別之事件,係給予很小的變化。所以,其總體增益變化並不會引發不快。人們因而可能辯解一個增益改變,應僅容許在一個聽覺事件邊界之近瞬時附近。該增益在著手處理或釋放模態中時,係可施加此一原理,但就一個DRC之大多數實際的實現體而言,該增益與事件感知之人耳瞬時清晰度相較,在著手處理模態中係移動如此迅速,以致不再需要控制。所以,該DRC增益唯有在釋放模態中時,方可能使用事件來控制其之平滑化。
茲將說明上述釋放控制之適當行為。就定性術語而言,若有一個事件被檢測到,該增益係以上文在方程式7a中所明訂之釋放時間常數使平滑化。當時間推進通過上述檢測到之事件時,以及若無後繼之事件被檢測到時,該釋放時間常數將會繼續增加,而使上述被平滑化之增益,最終被“凍結”定位。若有另一個事件被檢測到,則上述之平滑化時間常數,便會被重置至其原始之值,以及該程序將會一再重複。為調整該釋放時間,依據該等檢測到之事件邊界,便可能首先產生出一個控制信號。
誠如前文所討論,事件邊界可能藉由尋找上述音訊信號之連續頻譜中的變化,來加以檢測。在此一特定之實現體中,每個交疊之區段x [n ,t ]的DFT,可能被計算來產生上述音訊信號x [n ]之STDFT:
其次,上述連續區段的常態化對數幅度之間的差異,在計算上可能依據:
其中,
在此,橫跨集器k之|X [k ,t ]|的最大值,係供該常態化運作使用,不過,其他之常態化因數或許可能被採用;舉例而言,橫跨集器k之|X [k ,t ]|的平均值。若該差異D [t ]超過一個臨界值D min ,則一個事件便被視為已經發生。此外,與一個最大臨界值D max 相比較,依據D [t ]之幅度,對此一事件可能分配一個位於零與一之間的強度。此成就之聽覺事件強度信號A [t ],可能被計算為:
藉由分配一個正比於上述與該事件相關聯之頻譜變化的數量之強度給該聽覺事件,可對該動態處理達成比起一個二元事件判定更大之控制。吾等發明人業已發現到,在較強之事件期間,較大之增益變化係可被接收,以及方程式11中之信號,可容許此種變數控制。
該信號A [t ]係具有一個發生在一個事件邊界之位置處的脈沖之脈沖式信號。為控制該釋放時間,該信號A [t ]可能進一步被平滑化,以使其在檢測到一個事件邊界之後平滑地衰減至零。上述平滑化之事件控制信號,可能自A [t ]被計算出,而使依據:
在此,α event 控制著上述事件控制信號之衰減的時間。第9d和10d圖係描述兩個對應之音訊信號有關的事件控制信號,而使該平滑器之半衰減時間設定至250 ms。在第一種情況中,一個事件邊界可見係就每一六根鋼琴和弦加以檢測,以及該事件控制信號,可在每個事件之後平滑地朝向零衰減。就該第二信號而言,許多事件在檢測上係彼此在時間上十分接近,以及該事件控制信號因而絕不會完全衰減至零。
該事件控制信號,如今可能被使用來改變上述用來使增益平滑化之釋放時間常數。當該控制信號等於一時,來自方程式7a之平滑化係數α [t ],如前文所述係等於α release ,以及當該控制信號等於零時,該係數係等於一,而使上述被平滑化之增益免於變化。上述之平滑化係數,係使用該控制信號,使內插在該兩極值之間,其係依據:
藉由依據上述事件控制信號之一個函數連續地內插該平滑化係數,該釋放時間係被重置至一個正比於一個事件開始時之事件強度的值,以及接著在一個事件發生後,係使平滑地增加至無限大。此增加之速率係受到被用來產生上述被平滑化之事件控制信號的係數之支配。
第9e和10e圖係顯示對照於來自方程式13之非事件受控式係數而以來自方程式7b之事件受控式係數使增益平滑化之效應。在第一種情況中,該事件控制信號,在最後鋼琴和弦之後係跌至零,藉以避免增益向上移動。結果,第9f圖中之對應修飾的音訊,並不會蒙受上述和弦之衰減的不自然提昇。在第二種情況中,該事件控制信號,絕不會趨至零,以及因而上述平滑化之增益信號,透過上述事件控制之施加,幾乎不會被抑制。上述被平滑化之增益的軌線,係幾乎與第10b圖中之非事件受控式增益相同。此確實是所需要之效應。
基於響度之AGC和DRC
就傳統式動態處理技術之替代方案而言,其中,信號修飾係一些類似峰值或RMS功率等簡單之信號測量的一個直接函數,國際專利申請案序號第PCT/US2005/038579號,揭示了使用較早被說明為一種在其中執行動態處理之架構的心理聲學式響度模型。有幾項優點被引證。首先,測量和修飾係以宋為單位來指明,其係一種比類似峰值或RMS功率等較基本之計量更精確的響度知覺之計量。第二,該音訊可能被修飾,當該總響度改變時,上述原始音訊之被感知的頻譜平衡將可被維持。在此種方式下,對總響度之改變,比起一個所舉為例利用寬帶增益來修飾音訊之動態處理器,在知覺上係變得較不明顯。最後,該心理聲學模型本質上係屬多頻帶,以及因而該系統可輕易被配置來執行多頻帶動態處理,藉以緩解一個寬帶動態處理器相關聯之習見的交叉頻譜抽運(pumping)問題。
雖然在此種響度域中執行動態處理,已擁有幾項超越一些較傳統之動態處理的優點,該項技術可能透過使用聽覺事件控制各種參數而進一步加以改善。考慮上述包含第10a圖中所描繪之鋼琴和弦和第10b和10c圖中所顯示之相關聯的DRC的音訊節段。一個相似之DRC係可在響度域中被執行,以及在此情況中,當最後一個鋼琴和弦之衰減的響度被提昇時,此項提昇或將會較不明顯,因為上述衰減之音符的頻譜平衡,將會在施加該項提昇時被維持住。然而,一種較佳之解決方案,是全然不提昇該衰減,以及因而上述與先前就傳統式DRC所說明在響度域中使用聽覺事件來控制著手處理和釋放時間之相同原理,係可有利地被施加。
此時所說明之響度域動態處理系統,係由AGC緊接DRC來組成。此種組合之目標,係為使所有被處理之音訊,具有大致相同之感知響度,同時仍能維持至少某些原始音訊之動態。第11圖係描繪此種施加有關之AGC和DRC曲線的適當集合。理應注意到的是,兩者曲線之輸入和輸出,在表示上係以宋為單位,因為處理之執行係在響度域中。該等AGC曲線係致力於引領該輸出音訊,使更接近某些目標位準,以及如前文所提及,係以相當緩慢之時間常數來完成此一動作。該AGC可能被視為使上述音訊之長期響度達成該目標,但在短期之基礎上,該響度可能在該目標附近變動顯著。所以,動作更快之DRC,係可能被採用來使此等變動,被限制至上述特定施加認為屬可被接收之某些範圍。第11圖係顯示此種DRC曲線,其中,該AGC目標係落於上述DRC之“零頻帶”的範圍內,該曲線之此一部分並不需要修飾。以此種曲線組合,該AGC可將上述音訊之長期響度,置於上述DRC曲線之零頻帶的範圍內,以使需要施加的是極小之快速動作的DRC。若該短期響度仍在該零頻帶外變動,該DRC則會動作而使上述音訊之響度,朝向該零頻帶移動。就一個最後一般性音符而言,上述緩慢動作之DRC,可能被施加而使上述響度模型之所有頻帶,接收相同量之響度修飾,藉以維持上述感知之頻譜平衡,以及該快速動作之DRC施加的方式,可能容許該響度修飾橫跨頻帶而變化,藉以緩解快速動作頻帶獨立性響度修飾否則或許可能造成之交叉頻譜抽運。
聽覺事件可能被利用來控制AGC和DRC兩者之著手處理和釋放。在AGC之情況中,著手處理和釋放兩者時間,比起事件知覺之瞬時清晰度係很大,以及因而事件控制可能有利地被採用在兩者情況中。藉由該DRC,上述之著手處理係相當短,以及因而事件控制,唯有上文所說明之傳統式DRC有關的釋放方有需要。
誠如前文所討論,基於事件檢測之目的,上述被採用之響度模型相關聯的比響度頻譜,係可能被使用。一個與方程式10a和10b中者相類似之差異信號D [t ],可能係計算自方程式2中所界定之比響度N [b ,t ],其方式如下:
其中,
在此,橫跨頻帶b之|N [b ,t ]|的最大值,係供常態化使用,不過,其他之常態化因數係可能被採用;舉例而言,橫跨頻帶之|N [b ,t ]|的平均值。若該項差異D [t ]超過一個臨界值D min ,則會有一個事件被視為業已發生。該差異信號接著可能在與方程式11和12中所顯示相同之方式中被處理,藉以產生一個被用來控制該等著手處理和釋放時間之平滑事件控制信號
第11圖中所描述之AGC曲線,可能被表示為一個函數,其可採用一個響度之計量作為其輸入,以及可產生一個所希望之輸出響度:L o F AGC {L i } (15a)
該DRC曲線可能同樣被表示為:L o F DRC {L i } (15b)
就該AGC而言,該輸入響度係上述音訊之長期響度的一種計量。計算此種計量,可能藉由使用相當長之時間常數(數秒之數量級),而使方程式3中所界定之瞬間響度平滑化。已顯示出的是,在判斷一個音訊節段之長期響度中,人們對較大聲之部分比對較低聲之部分,提供更大之權量,以及在該平滑化運作中,可能使用一個比釋放更快速之著手處理來模擬該效應。為著手處理和釋放兩者合併事件控制,決定上述AGC修飾所使用之長期響度,因而在計算上可能依照:L AGC [t ]=α AGC [t ]L AGC [t -1]+(1-α AGC [t ])L [t ] (16a)
其中,
此外,一個相關聯之長期比響度頻譜可能被計算出,其在稍後可供該多頻帶DRC使用:N AGC [b ,t ]=α AGC [t ]N AGC [b ,t -1]+(1-α AGC [t ])N [b ,t ] (16C)
在實行中,該等平滑化係數可能被選擇,而使該著手處理時間,大致為該釋放時間的一半。給定該長期響度計量,接著便可能計算上述與AGC相關聯之響度修飾標度,而作為輸出響度對輸入響度之比率:
該DRC修飾如今可能在施加該AGC標度之後自該響度計算出。與其在施加該DRC曲線之前使響度之計量平滑化,替代方案是施加該DRC曲線至瞬間響度,以及接著隨繼使此成就之修飾平滑化。此係與先前就平滑化傳統式DRC之增益所說明的技術相類似。此外,該DRC可能施加在一種多頻帶方式中,此意謂該DRC修飾,係每個頻帶b中之比響度N [b ,t ]而非總響度L [t ]的一個函數。然而,為維持上述原始音訊之平均頻譜平衡,對每個頻帶可能施加DRC,而使其所成就之修飾,具有相同之平均效應,正如施加DRC至總響度時所產生者。此在達成上可能藉由以長期總響度(在施加該AGC標度之後)對長期比響度之比率來標定每個頻帶,以及使用此值作為上述DRC函數之引數。此結果接著以上述比率之倒數重新標定,藉以產生上述之輸出比響度。因此。每個頻帶中之DRC標定,在計算上可能依據:
該等AGC和DRC修飾,可能接著使相結合,藉以形成每頻帶一個總響度標度:S TOT [b ,t ]=S AGC [t ]S DRC [b ,t ] (19)
此總標度接著可能以快速著手處理和緩慢釋放且僅對釋放施加事件控制,獨立於每個頻帶使橫跨時間而平滑化。理想之平滑化在執行上,與上述傳統式DRC之增益相類似,係以上述標慶之對數為基礎,在彼等之分貝表示式中加以平滑化,不過此非屬必要。為確使上述平滑化之總標度,與每個頻帶中之比響度同步移動,該等著手處理和釋放模態,可能透過比響度本身之同時平滑化,來加以決定:
其中,
最後,一個目標比響度,可能基於上述施加至原始之比響度的平滑化標度,來加以計算。
以及接著求增益G [b ,t ]之解,以及在施加至上述原始之激勵值時,可使一個比響度與上述之目標相等:
該等增益可能施加至上述被用來計算該激勵值之濾波器組的每個頻帶,以及接著可能藉由使該濾波器組反轉,來產生一個被修飾之時間域音訊信號,而使產生上述被修飾之音訊。
額外之參數控制
雖然上文之討論,已集中在經由上述被處理之音訊的聽覺場景分析來控制該等AGC和DRC著手處理和釋放參數,其他重要參數,亦可能得利於受到經由ASA結果之控制。舉例而言,上述來自方程式12之事件控制信號,可能被用來改變上述用以動態調整音訊之增益的DRC比率參數之值。該比率參數,與該等著手處理和釋放時間參數相類似,可能顯著地促成動態增益調整所導入之知覺假象。
實現體
本發明可能在硬體或軟體或兩者之組合(例如,可程式化邏輯陣列)中加以實現。除非另有指明,該等納為本發明之一部分的運算法,並非本質上與任何特定之電腦或其他之裝置相關聯。特言之,各種通用型機器均可能被使用,而使寫成之程式依據本說明書之授義內容,或者更方便的是構造更專屬性之裝置(例如,積體電路),藉以執行所需要之方法步驟。所以,本發明可能在一個或多個電腦程式中被實現,彼等可在一個或多個可程式規劃式電腦系統上面執行,後者各係包含有:至少一個處理器、至少一個資料儲存系統(包括揮發性和非揮發性記憶和/或儲存元件)、至少一個輸入裝置或接口、和至少一個輸出裝置或接口。程式碼係施加至輸入資料,藉以執行本說明書所說明之功能,以及產生輸出資訊。此輸出資訊係在已知之方式中,施加至一個或多個輸出裝置。
每個此種程式可能在任何希望之電腦語言(包括機器語言、組合語言、或高階程序語言、邏輯語言、或物件導向程式規劃語言)被實現,藉以與一個電腦系統相通訊。在任一情況下,該語言可能為一種編譯或解譯語言。
每個此種電腦程式,最好是使儲存在或下載至儲存媒體或裝置(例如,固態記憶體或媒體、或磁性或光學媒體)上面,後者可被一個通用型或專屬性可程式規劃式電腦讀取,以便在該儲存媒體或裝置,被該電腦系統讀取時,配置及操作該電腦,藉以執行本說明書所說明之程序。此種原創性系統,可能亦被視為實現為一個電腦可讀取式儲存媒體,其可以一個電腦程式來配置。其中,上述如此配置之儲存媒體,可使一個電腦系統,在一種特定且預定之方式中運作,藉以執行本說明書所說明之功能。
已說明的為本發明之許多實施例。然而,理應瞭解的是,有各種修飾體可能被完成,而不違離本發明之精神與界定範圍。舉例而言,本說明書所說明之某些步驟,可能係呈順序獨立性,以及因而可能在不同於所說明之順序中被執行。
理應瞭解的是,本發明之其他變更形式和修飾體的實現體和其之各種屬性,將可為本技藝之專業人員所明瞭,以及本發明並非受限於此等所說明之特定實施例。所以,本發明被預期係涵蓋任何和所有落在本說明書所揭示且主張之基本原理的真實精神和界定範圍內之修飾體、變更形式、或等價體。
藉由參照合併
以下之專利權、專利申請案、和刊物,係藉由參照彼等各自之全文而使納入。
音訊動態處理
音訊工程師參考書,Michael Talbot-Smith所編輯,第二版,限制器和壓縮器,Alan Tutton,2-1492-165。Focal印刷廠,教育和專業出版公司,1999年。
檢測及使用聽覺事件
美國專利權申請編號10/474,387,Brett Graham Crockett之“High Quality Time-Scaling and Pitch-Scaling of Audio Signals”(音訊信號之高品質時間標定和音調標定),2004年六月24日出版,美國公告專利資料庫編號US 2004/0122662 A1。
美國專利權申請編號10/478,398,Brett G.Crockett et al之“Method for Time Aligning Audio Signals Using Characterizations Based on Auditory Events”(使用基於聽覺事件之特徵使音訊信號在時間上校準的方法),2004年七月29日出版,美國公告專利資料庫編號US 2004/0148159 A1。
美國專利權申請編號10/478,538,Brett G.Crockett之“Segmenting Audio Signals Into Auditory Events”(使音訊信號分段成聽覺事件),2004年八月26日出版,美國公告專利資料庫編號2004/0165730 A1。本發明之屬性,提供了一種除Crockett之上述申請案中所揭示者外的檢測聽覺事件之方法。
美國專利權申請編號10/478,397,Brett G.Crockett et al之“Comparing Audio Using Characterizations Based on Auditory Events”(使用基於聽覺事件之特徵來比較音訊),2004年九月2日出版,美國公告專利資料庫編號US 2004/0172240 A1。
國際專利合作條約公開專利資料庫編號PCT/US 05/24630,2005年七月13日提交,Michael John Smithers之標題“Method for Combining Audio Signals Using Auditory Scene Analysis”(使用聽覺場景分析結合音訊信號之方法),2006年三月9日出版為WO 2006/026161。
國際專利合作條約公開專利資料庫編號PCT/US 2004/016964,2004年五月27日提交,Alan Jeffrey Seefeldt et al之標題“Method,Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal”(計算及調整一個音訊信號之感知響度的方法、裝置、和電腦程式),2004年十二月23日出版為WO 2004/111994 A2。
國際專利合作條約公開專利資料庫編號PCT/US 2005/038579,2005年十月25日提交,Alan Jeffrey Seefeldt 之標題“Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal”(計算及調整一個音訊信號之感知響度和感知頻譜平衡),以及出版為國際出版品編號WO 2006/047600。
Brett Crockett和Michael Smithers之“A Method for Characterizing and Identifying Audio Based on Auditory Scene Analysis,”(依據聽覺場景分析來特徵化及識別音訊之方法),2005年五月28-31日在巴賽隆納之第118屆大會,Audio Engineering Society Convention Paper 6416(音訊工程協會大會用論文6416)。
Brett Crockett之“High Quality Multichannel Time Scaling and Pitch-Shifting using Auditory Scene Analysis,”(使用聽覺場景分析之高品質多通道時間標定和音調偏移),2003年十月在紐約之音訊工程協會大會用論文5948。
Alan Seefeldt et al之.“A New Objective Measure of Perceived Loudness”(感知響度之新的客觀計量),2004年十月28日在舊金山之音訊工程協會大會用論文6236。
Handbook for Sound Engineers,The New Audio Cyclopedia,(聲音工程師手冊,新音訊百科全書),由Glen M.Ballou編輯,第二版,動態學,850-851。Focal印刷廠,Butterworth-Heinemann標記,1998年。
Audio Engineer's Reference Book(音訊工程師參考書),由Michael Talbot-Smith編輯,第二版,第2.9節(Alan Tutton之“Limiters and Compressors”(限制器和壓縮器)),第2.149-2.165頁,Focal印刷廠,教育和專業出版公司,1999年。
第1圖係一個可顯示用以執行聽覺場景分析之處理步驟的範例之流程圖;第2圖係顯示一個在執行上述聽覺場景分析時針對音訊進行區段處理、窗取樣、及執行該DFT之範例;第3圖係在一個流程圖或功能方塊圖之性質中顯示平行處理,其中,音訊係被用來識別聽覺事件並識別該等聽覺事件之特徵,而使該等事件和彼等之特徵,被用來修飾該等動態處理參數;第4圖係在一個流程圖或功能方塊圖之性質中顯示處理,其中,音訊係僅被用來識別聽覺事件,以及該等事件之特徵,係導自該音訊事件檢測,而使該等事件和彼等之特徵,被用來修飾該等動態處理參數;第5圖係在一個流程圖或功能方塊圖之性質中顯示處理,其中,音訊係僅被用來識別聽覺事件,以及該等事件之特徵,係導自該音訊事件檢測,而僅使該等聽覺事件之特徵,被用來修飾該等動態處理參數;第6圖係顯示一組可近似化基於ERB標度之臨界頻帶的理想化之聽覺濾波器特徵響應。其水平標度為赫茲(Hz)下之頻率,以及其垂直標度為分貝(dB)下之位準;第7圖係顯示ISO 226之等響度曲線圖,其水平標度為赫茲(Hz)(基底10之對數標度)下之頻率,以及其垂直標度為分貝(dB)下之聲壓位準;第8a-c圖係顯示一個音訊動態範圍壓縮器之理想化的輸入/輸出特徵和輸入增益特性;第9a-f圖係顯示一個使用聽覺事件來控制一個傳統式動態範圍控制器(DRC)之數位實現體中的釋放時間之聽覺事件的範例,其中,該增益控制係導自該信號之均方根(RMS)功率;第10a-f圖係顯示一個使用聽覺事件來控制一個傳統式動態範圍控制器(DRC)之數位實現體中的釋放時間之聽覺事件的範例,其中,該增益控制係導自一個不同於第9圖中所使用之替代信號的信號之均方根(RMS)功率;而第11圖則係描述在一個響度域動態處理系統中施加AGC緊跟DRC有關之理想化的AGC和DRC曲線之適當集合。此種組合之目標,係使所有處理之音訊,具有大約相同之感知響度,同時仍能維持至少某些原始音訊動態。

Claims (15)

  1. 一種用以修正一音訊動態處理器之一參數的方法,其包含:檢測一音訊信號中相對於時間之頻譜特性中的變化,將該音訊信號中相對於時間之頻譜特性中大於一臨界值的變化,辨識為聽覺事件邊界,其中連續邊界間之音訊節段構成一聽覺事件,基於該等經辨識的事件邊界產生一參數修正動態變化的控制信號,以及將該音訊動態處理器之該參數作為該控制信號的一函數予以修正。
  2. 如申請專利範圍第1項之方法,其中該參數係始動時間、釋放時間及比率中之其中一者。
  3. 如申請專利範圍第1項之方法,其中該經修正的參數係一增益平滑化時間常數。
  4. 如申請專利範圍第3項之方法,其中該增益平滑化時間常數係一增益平滑化始動時間常數。
  5. 如申請專利範圍第3項之方法,其中該增益平滑化時間常數係一增益平滑化釋放時間常數。
  6. 如申請專利範圍第1項之方法,其中該參數修正控制信號係基於該等經辨識的事件邊界之位置及與各該聽覺事件邊界關聯的頻譜特性中之變化的程度。
  7. 如申請專利範圍第6項之方法,其中產生一參數修正控制信號之步驟包含: 在每個聽覺事件邊界提供一脈衝,每個該脈衝具有一與頻譜特性中之該等變化的程度成比例之振幅,以及將各該脈衝時間平滑化使得其振幅平滑地衰減趨於零。
  8. 如申請專利範圍第1項之方法,其中相對於時間之頻譜特性中的變化藉由比較比響度上的差異而被檢測到。
  9. 如申請專利範圍第8項之方法,其中,該音訊信號係由一個離散時間序列x [n ]來表示,其係已在一個取樣頻率f s 下取樣自一個音訊源,以及相對於時間之頻譜特性中的該等變化,係藉由比較橫跨連續時間區段t間之頻帶b的比響度N [b ,t ]中之差異來計算。
  10. 如申請專利範圍第9項之方法,其中,上述音訊信號之連續時間區段間的頻譜內容中之差異,在計算上係依據: 其中
  11. 如申請專利範圍第9項之方法,其中,上述音訊信號之連續時間區段間的頻譜內容中之差異,在計算上係依據: 其中
  12. 一種編碼有電腦程式之非暫時性電腦可讀儲存媒體,該電腦程式係用以致使一電腦執行如申請專利範圍第1項所述之方法。
  13. 一種用以修正一音訊動態處理器之一參數的方法,其包含:檢測一音訊信號中相對於時間之信號特性中的變化,將該音訊信號中相對於時間之信號特性中大於一臨界值的變化,辨識為聽覺事件邊界,其中連續邊界間之一音訊節段構成一聽覺事件,基於該聽覺事件產生一參數修正動態變化的控制信號,以及將該音訊動態處理器之該參數作為該控制信號的一函數予以修正。
  14. 一種音訊處理方法,其中,一個處理器,可接收一個輸入通道,以及可產生一個輸出通道,後者係藉由施加動態增益修正至該輸入通道來產生,此種方法包含之步驟有:檢測該音訊輸入通道中相對於時間之信號特性中的變化;將該輸入通道中相對於時間之信號特性中的變化,辨識為聽覺事件邊界,其中,連續邊界間之音訊節段,構成了該通道中之一個聽覺事件;以及響應聽覺事件和/或一些與該等聽覺事件邊界相關聯之信號特性中的變化之程度,來產生此種音訊動態增 益修正方法之所有或某些一個或多個動態變化參數。
  15. 一種用以修正一音訊動態處理器之一參數的裝置,其包含:用以檢測一音訊信號中相對於時間之頻譜特性中的變化之構件,用以將該音訊信號中相對於時間之頻譜特性中大於一臨界值的變化辨識為聽覺事件邊界之構件,其中連續邊界間之音訊節段構成一聽覺事件,用以基於該等經辨識的事件邊界產生一參數修正動態變化的控制信號之構件,以及用以將該音訊動態處理器之該參數作為該控制信號的一函數予以修正之構件。
TW096111338A 2006-04-27 2007-03-30 利用聽覺事件之聽覺場景分析與特定響度式檢測來控制音訊動態增益參數之非暫時性電腦可讀取儲存媒體、方法及裝置 TWI455481B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US79580806P 2006-04-27 2006-04-27

Publications (2)

Publication Number Publication Date
TW200803161A TW200803161A (en) 2008-01-01
TWI455481B true TWI455481B (zh) 2014-10-01

Family

ID=38445597

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096111338A TWI455481B (zh) 2006-04-27 2007-03-30 利用聽覺事件之聽覺場景分析與特定響度式檢測來控制音訊動態增益參數之非暫時性電腦可讀取儲存媒體、方法及裝置

Country Status (22)

Country Link
US (23) US8144881B2 (zh)
EP (1) EP2011234B1 (zh)
JP (2) JP5129806B2 (zh)
KR (2) KR101200615B1 (zh)
CN (2) CN101432965B (zh)
AT (1) ATE493794T1 (zh)
AU (2) AU2007243586B2 (zh)
BR (1) BRPI0711063B1 (zh)
CA (1) CA2648237C (zh)
DE (1) DE602007011594D1 (zh)
DK (1) DK2011234T3 (zh)
ES (1) ES2359799T3 (zh)
HK (2) HK1126902A1 (zh)
IL (1) IL194430A (zh)
MX (1) MX2008013753A (zh)
MY (1) MY141426A (zh)
NO (13) NO345590B1 (zh)
PL (1) PL2011234T3 (zh)
RU (1) RU2417514C2 (zh)
TW (1) TWI455481B (zh)
UA (1) UA93243C2 (zh)
WO (1) WO2007127023A1 (zh)

Families Citing this family (108)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
AU2004248544B2 (en) 2003-05-28 2010-02-18 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
MX2007015118A (es) 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
WO2007120452A1 (en) 2006-04-04 2007-10-25 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
ES2359799T3 (es) 2006-04-27 2011-05-27 Dolby Laboratories Licensing Corporation Control de ganancia de audio usando detección de eventos auditivos basada en la sonoridad específica.
CA2665153C (en) 2006-10-20 2015-05-19 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
ES2358786T3 (es) 2007-06-08 2011-05-13 Dolby Laboratories Licensing Corporation Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial.
ATE535906T1 (de) 2007-07-13 2011-12-15 Dolby Lab Licensing Corp Tonverarbeitung mittels auditorischer szenenanalyse und spektraler asymmetrie
WO2009086174A1 (en) 2007-12-21 2009-07-09 Srs Labs, Inc. System for adjusting perceived loudness of audio signals
MX2010009932A (es) 2008-03-10 2010-11-30 Fraunhofer Ges Forschung Metodo y dispositivo para manipular una señal de audio que tiene un evento transitorio.
MY159890A (en) * 2008-04-18 2017-02-15 Dolby Laboratories Licensing Corp Method and apparatus for maintaining speech audibiliy in multi-channel audio with minimal impact on surround experience
US9253560B2 (en) * 2008-09-16 2016-02-02 Personics Holdings, Llc Sound library and method
WO2010033384A1 (en) 2008-09-19 2010-03-25 Dolby Laboratories Licensing Corporation Upstream quality enhancement signal processing for resource constrained client devices
EP2347556B1 (en) 2008-09-19 2012-04-04 Dolby Laboratories Licensing Corporation Upstream signal processing for client devices in a small-cell wireless network
JP5236006B2 (ja) * 2008-10-17 2013-07-17 シャープ株式会社 音声信号調整装置及び音声信号調整方法
US8315411B2 (en) * 2008-11-14 2012-11-20 That Corporation Dynamic volume control and multi-spatial processing protection
CN102265513B (zh) 2008-12-24 2014-12-31 杜比实验室特许公司 频域中的音频信号响度确定和修改
WO2010099237A2 (en) * 2009-02-25 2010-09-02 Conexant Systems, Inc. Speaker distortion reduction system and method
US8422699B2 (en) * 2009-04-17 2013-04-16 Linear Acoustic, Inc. Loudness consistency at program boundaries
WO2010126709A1 (en) 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
US8761415B2 (en) 2009-04-30 2014-06-24 Dolby Laboratories Corporation Controlling the loudness of an audio signal in response to spectral localization
TWI503816B (zh) 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
US8249275B1 (en) * 2009-06-26 2012-08-21 Cirrus Logic, Inc. Modulated gain audio control and zipper noise suppression techniques using modulated gain
US8554348B2 (en) * 2009-07-20 2013-10-08 Apple Inc. Transient detection using a digital audio workstation
CN102498514B (zh) * 2009-08-04 2014-06-18 诺基亚公司 用于音频信号分类的方法和装置
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
WO2011043020A1 (ja) * 2009-10-07 2011-04-14 日本電気株式会社 マルチバンドコンプレッサ、その調整方法
EP2367286B1 (en) 2010-03-12 2013-02-20 Harman Becker Automotive Systems GmbH Automatic correction of loudness level in audio signals
KR101425772B1 (ko) 2010-11-23 2014-08-06 엘지전자 주식회사 영상 부호화 및 복호화 방법과 이를 이용한 장치
US8855322B2 (en) * 2011-01-12 2014-10-07 Qualcomm Incorporated Loudness maximization with constrained loudspeaker excursion
JP5707219B2 (ja) * 2011-05-13 2015-04-22 富士通テン株式会社 音響制御装置
US9232321B2 (en) * 2011-05-26 2016-01-05 Advanced Bionics Ag Systems and methods for improving representation by an auditory prosthesis system of audio signals having intermediate sound levels
DE102011085036A1 (de) * 2011-10-21 2013-04-25 Siemens Medical Instruments Pte. Ltd. Verfahren zum Ermitteln einer Kompressionskennlinie
TWI575962B (zh) * 2012-02-24 2017-03-21 杜比國際公司 部份複數處理之重疊濾波器組中的低延遲實數至複數轉換
EP2837094B1 (en) * 2012-04-12 2016-03-30 Dolby Laboratories Licensing Corporation System and method for leveling loudness variation in an audio signal
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
JP5527827B2 (ja) * 2012-04-17 2014-06-25 Necエンジニアリング株式会社 ラウドネス調整装置、ラウドネス調整方法、及びプログラム
US9685921B2 (en) 2012-07-12 2017-06-20 Dts, Inc. Loudness control with noise detection and loudness drop detection
US9733644B2 (en) 2012-07-17 2017-08-15 Elwha Llc Unmanned device interaction methods and systems
US10019000B2 (en) 2012-07-17 2018-07-10 Elwha Llc Unmanned device utilization methods and systems
US9991861B2 (en) * 2012-08-10 2018-06-05 Bellevue Investments Gmbh & Co. Kgaa System and method for controlled dynamics adaptation for musical content
WO2014046941A1 (en) * 2012-09-19 2014-03-27 Dolby Laboratories Licensing Corporation Method and system for object-dependent adjustment of levels of audio objects
KR102071860B1 (ko) 2013-01-21 2020-01-31 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
US9979829B2 (en) 2013-03-15 2018-05-22 Dolby Laboratories Licensing Corporation Normalization of soundfield orientations based on auditory scene analysis
CN104079247B (zh) 2013-03-26 2018-02-09 杜比实验室特许公司 均衡器控制器和控制方法以及音频再现设备
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
CN104078050A (zh) * 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
JP6216553B2 (ja) * 2013-06-27 2017-10-18 クラリオン株式会社 伝搬遅延補正装置及び伝搬遅延補正方法
WO2015038475A1 (en) * 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
US9521501B2 (en) * 2013-09-12 2016-12-13 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
US9608588B2 (en) * 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
US10063207B2 (en) * 2014-02-27 2018-08-28 Dts, Inc. Object-based audio loudness management
JP6224850B2 (ja) 2014-02-28 2017-11-01 ドルビー ラボラトリーズ ライセンシング コーポレイション 会議における変化盲を使った知覚的連続性
CN105142067B (zh) 2014-05-26 2020-01-07 杜比实验室特许公司 音频信号响度控制
WO2016007947A1 (en) * 2014-07-11 2016-01-14 Arizona Board Of Regents On Behalf Of Arizona State University Fast computation of excitation pattern, auditory pattern and loudness
US9712934B2 (en) 2014-07-16 2017-07-18 Eariq, Inc. System and method for calibration and reproduction of audio signals based on auditory feedback
CN113257273A (zh) 2014-10-01 2021-08-13 杜比国际公司 高效drc配置文件传输
EP4372746A2 (en) * 2014-10-10 2024-05-22 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
JP6228100B2 (ja) * 2014-11-17 2017-11-08 Necプラットフォームズ株式会社 ラウドネス調整装置、ラウドネス調整方法及びラウドネス調整用プログラム
US9691408B2 (en) * 2014-12-16 2017-06-27 Psyx Research, Inc. System and method for dynamic equalization of audio data
EP3275208B1 (en) * 2015-03-25 2019-12-25 Dolby Laboratories Licensing Corporation Sub-band mixing of multiple microphones
WO2016172363A1 (en) * 2015-04-24 2016-10-27 Cyber Resonance Corporation Methods and systems for performing signal analysis to identify content types
US10109288B2 (en) * 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
GB2539875B (en) * 2015-06-22 2017-09-20 Time Machine Capital Ltd Music Context System, Audio Track Structure and method of Real-Time Synchronization of Musical Content
US9837086B2 (en) * 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
CA2994446C (en) 2015-08-28 2021-01-12 The Procter & Gamble Company Catalysts for the dehydration of hydroxypropionic acid and its derivatives
US9590580B1 (en) 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
US10341770B2 (en) * 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC
CN105404654A (zh) * 2015-10-30 2016-03-16 魅族科技(中国)有限公司 一种音频文件播放方法及装置
WO2017079334A1 (en) 2015-11-03 2017-05-11 Dolby Laboratories Licensing Corporation Content-adaptive surround sound virtualization
US9756281B2 (en) 2016-02-05 2017-09-05 Gopro, Inc. Apparatus and method for audio based video synchronization
WO2017142916A1 (en) * 2016-02-19 2017-08-24 Dolby Laboratories Licensing Corporation Diffusivity based sound processing method and apparatus
US10923132B2 (en) 2016-02-19 2021-02-16 Dolby Laboratories Licensing Corporation Diffusivity based sound processing method and apparatus
CN105845151B (zh) * 2016-05-30 2019-05-31 百度在线网络技术(北京)有限公司 应用于语音识别前端的音频增益调整方法和装置
US20170366897A1 (en) * 2016-06-15 2017-12-21 Robert Azarewicz Microphone board for far field automatic speech recognition
US9697849B1 (en) 2016-07-25 2017-07-04 Gopro, Inc. Systems and methods for audio based synchronization using energy vectors
US9640159B1 (en) * 2016-08-25 2017-05-02 Gopro, Inc. Systems and methods for audio based synchronization using sound harmonics
US9653095B1 (en) 2016-08-30 2017-05-16 Gopro, Inc. Systems and methods for determining a repeatogram in a music composition using audio features
GB201615538D0 (en) * 2016-09-13 2016-10-26 Nokia Technologies Oy A method , apparatus and computer program for processing audio signals
US9916822B1 (en) 2016-10-07 2018-03-13 Gopro, Inc. Systems and methods for audio remixing using repeated segments
TWI590239B (zh) * 2016-12-09 2017-07-01 宏碁股份有限公司 語音信號處理裝置及語音信號處理方法
CN108281148B (zh) * 2016-12-30 2020-12-22 宏碁股份有限公司 语音信号处理装置及语音信号处理方法
US10374564B2 (en) 2017-04-20 2019-08-06 Dts, Inc. Loudness control with noise detection and loudness drop detection
US10491179B2 (en) 2017-09-25 2019-11-26 Nuvoton Technology Corporation Asymmetric multi-channel audio dynamic range processing
US11450339B2 (en) * 2017-10-06 2022-09-20 Sony Europe B.V. Audio file envelope based on RMS power in sequences of sub-windows
US11011180B2 (en) * 2018-06-29 2021-05-18 Guoguang Electric Company Limited Audio signal dynamic range compression
US11894006B2 (en) 2018-07-25 2024-02-06 Dolby Laboratories Licensing Corporation Compressor target curve to avoid boosting noise
CN113614684A (zh) * 2018-09-07 2021-11-05 格雷斯诺特有限公司 经由音频分类进行动态音量调节的方法和装置
US11775250B2 (en) 2018-09-07 2023-10-03 Gracenote, Inc. Methods and apparatus for dynamic volume adjustment via audio classification
JP7031543B2 (ja) * 2018-09-21 2022-03-08 株式会社Jvcケンウッド 処理装置、処理方法、再生方法、及びプログラム
EP3662468B1 (en) * 2018-09-28 2020-11-04 Dolby Laboratories Licensing Corporation Distortion reducing multi-band compressor with dynamic thresholds based on scene switch analyzer guided distortion audibility model
US10998872B2 (en) * 2018-10-24 2021-05-04 Gracenote, Inc. Methods and apparatus for audio equalization
US11347470B2 (en) 2018-11-16 2022-05-31 Roku, Inc. Detection of media playback loudness level and corresponding adjustment to audio during media replacement event
CN109889170B (zh) * 2019-02-25 2021-06-04 珠海格力电器股份有限公司 音频信号的控制方法和装置
JP7275711B2 (ja) * 2019-03-20 2023-05-18 ヤマハ株式会社 オーディオ信号の処理方法
US11133787B2 (en) * 2019-06-25 2021-09-28 The Nielsen Company (Us), Llc Methods and apparatus to determine automated gain control parameters for an automated gain control protocol
US11019301B2 (en) 2019-06-25 2021-05-25 The Nielsen Company (Us), Llc Methods and apparatus to perform an automated gain control protocol with an amplifier based on historical data corresponding to contextual data
US20230113561A1 (en) * 2020-03-13 2023-04-13 Immersion Networks, Inc. Loudness equalization system
EP3961624A1 (de) * 2020-08-28 2022-03-02 Sivantos Pte. Ltd. Verfahren zum betrieb einer hörvorrichtung in abhängigkeit eines sprachsignals
US20220165289A1 (en) * 2020-11-23 2022-05-26 Cyber Resonance Corporation Methods and systems for processing recorded audio content to enhance speech

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW318926B (zh) * 1996-01-26 1997-11-01 Motorola Inc
US20020051546A1 (en) * 1999-11-29 2002-05-02 Bizjak Karl M. Variable attack & release system and method
TW563094B (en) * 2000-10-17 2003-11-21 Qualcomm Inc Method and apparatus for high performance low bit-rate coding of unvoiced speech
US20040013272A1 (en) * 2001-09-07 2004-01-22 Reams Robert W System and method for processing audio data
JP2004356894A (ja) * 2003-05-28 2004-12-16 Mitsubishi Electric Corp 音質調整装置

Family Cites Families (163)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
DE1736966U (de) 1956-09-28 1956-12-27 Heinz Schulze Luftschraube fuer spiel- und modell-flugzeuge.
SU720691A1 (ru) 1978-04-27 1980-03-05 Предприятие П/Я Р-6609 Устройство дл автоматического регулировани усилени
US4281218A (en) 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
US4624009A (en) 1980-05-02 1986-11-18 Figgie International, Inc. Signal pattern encoder and classifier
DE3314570A1 (de) 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4739514A (en) 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US4882762A (en) * 1988-02-23 1989-11-21 Resound Corporation Multi-band programmable compression system
KR940003351B1 (ko) 1988-03-31 1994-04-20 주식회사 금성사 조도에 따른 자동이득 제어증폭기 이득 제어회로
US4953112A (en) 1988-05-10 1990-08-28 Minnesota Mining And Manufacturing Company Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JPH02118322U (zh) 1989-03-08 1990-09-21
US5097510A (en) 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
AU653582B2 (en) 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
DE69214882T2 (de) 1991-06-06 1997-03-20 Matsushita Electric Ind Co Ltd Gerät zur Unterscheidung von Musik und Sprache
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
US5175769A (en) 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
KR940003351Y1 (ko) 1991-10-17 1994-05-23 삼성전관 주식회사 편광판 부착장치
US5363147A (en) 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
KR940003351A (ko) 1992-07-15 1994-02-21 강진구 온 스크린 그래픽 표시 제어 장치 및 방법
GB2272615A (en) 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
US5457769A (en) 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (zh) 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5530760A (en) 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
US5463695A (en) * 1994-06-20 1995-10-31 Aphex Systems, Ltd. Peak accelerated compressor
US5500902A (en) 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5548538A (en) 1994-12-07 1996-08-20 Wiltron Company Internal automatic calibrator for vector network analyzers
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
ATE229729T1 (de) 1995-03-13 2002-12-15 Phonak Ag Verfahren zur anpassung eines hörgerätes, vorrichtung hierzu und hörgerät
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
US6041295A (en) 1995-04-10 2000-03-21 Corporate Computer Systems Comparing CODEC input/output to adjust psycho-acoustic parameters
US5601617A (en) 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5907622A (en) 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US6108431A (en) 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6430533B1 (en) 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09312540A (ja) 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
EP0820212B1 (de) 1996-07-19 2010-04-21 Bernafon AG Lautheitsgesteuerte Verarbeitung akustischer Signale
JPH1074097A (ja) 1996-07-26 1998-03-17 Ind Technol Res Inst オーディオ信号のパラメータを変更する方法及び装置
JP2953397B2 (ja) 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
US6049766A (en) 1996-11-07 2000-04-11 Creative Technology Ltd. Time-domain time/pitch scaling of speech or audio signals with transient handling
JP2991982B2 (ja) 1996-11-29 1999-12-20 日本イーライリリー株式会社 注射練習器具
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6125343A (en) 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6330672B1 (en) 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
US6233554B1 (en) 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
JP2002518912A (ja) 1998-06-08 2002-06-25 コックレア リミティド 聴覚装置
EP0980064A1 (de) 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
GB9824776D0 (en) 1998-11-11 1999-01-06 Kemp Michael J Audio dynamic control effects synthesiser
EP1172020B1 (en) 1999-02-05 2006-09-06 Hearworks Pty Ltd. Adaptive dynamic range optimisation sound processor
EP1089242B1 (en) 1999-04-09 2006-11-08 Texas Instruments Incorporated Supply of digital audio and video products
CA2372017A1 (en) 1999-04-26 2000-11-02 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US6263371B1 (en) 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
US6985594B1 (en) 1999-06-15 2006-01-10 Hearing Enhancement Co., Llc. Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6651040B1 (en) 2000-05-31 2003-11-18 International Business Machines Corporation Method for dynamic adjustment of audio input gain in a speech system
US6889186B1 (en) 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
WO2002015587A2 (en) 2000-08-16 2002-02-21 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
AUPQ952700A0 (en) 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
DE60029453T2 (de) 2000-11-09 2007-04-12 Koninklijke Kpn N.V. Messen der Übertragungsqualität einer Telefonverbindung in einem Fernmeldenetz
US7457422B2 (en) 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
WO2002056558A2 (en) 2001-01-10 2002-07-18 Univ Columbia Active filter circuit with dynamically modifiable internal gain
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
EP1233509A1 (en) * 2001-02-14 2002-08-21 Thomson Licensing S.A. Digital audio processor
DE10107385A1 (de) 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
DE50102419D1 (de) 2001-04-10 2004-07-01 Phonak Ag Verfahren zur anpassung eines hörgerätes an ein individuum
MXPA03009357A (es) 2001-04-13 2004-02-18 Dolby Lab Licensing Corp Escalamiento en el tiempo y escalamiento en el tono de alta calidad de senales de audio.
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7181034B2 (en) 2001-04-18 2007-02-20 Gennum Corporation Inter-channel communication in a multi-channel digital hearing instrument
US20020173864A1 (en) * 2001-05-17 2002-11-21 Crystal Voice Communications, Inc Automatic volume control for voice over internet
CA2447911C (en) * 2001-05-25 2011-07-05 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
MXPA03010751A (es) * 2001-05-25 2005-03-07 Dolby Lab Licensing Corp Segmentacion de senales de audio en eventos auditivos.
US7177803B2 (en) 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
US20040037421A1 (en) 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
US8340302B2 (en) 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US20030223597A1 (en) 2002-05-29 2003-12-04 Sunil Puria Adapative noise compensation for dynamic signal enhancement
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
CN1739141A (zh) 2003-02-06 2006-02-22 杜比实验室特许公司 连续的备份音频
DE10308483A1 (de) 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7551745B2 (en) 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
AU2004248544B2 (en) 2003-05-28 2010-02-18 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
JP4226395B2 (ja) 2003-06-16 2009-02-18 アルパイン株式会社 音声補正装置
US8918316B2 (en) 2003-07-29 2014-12-23 Alcatel Lucent Content identification system
WO2005069679A2 (en) 2004-01-13 2005-07-28 Koninklijke Philips Electronics N.V. Audio signal enhancement
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
GB2413906A (en) 2004-04-21 2005-11-09 Imagination Tech Ltd Radio volume control system
US7574010B2 (en) 2004-05-28 2009-08-11 Research In Motion Limited System and method for adjusting an audio signal
JP4168976B2 (ja) 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
EP1601171B1 (en) 2004-05-28 2008-04-30 Research In Motion Limited System And Method For Adjusting An Audio Signal
EP1763923A1 (en) * 2004-06-30 2007-03-21 Koninklijke Philips Electronics N.V. Method of and system for automatically adjusting the loudness of an audio signal
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
WO2006058361A1 (en) 2004-12-04 2006-06-08 Dynamic Hearing Pty Ltd Method and apparatus for adaptive sound processing parameters
US20060126865A1 (en) 2004-12-13 2006-06-15 Blamey Peter J Method and apparatus for adaptive sound processing parameters
US8265295B2 (en) 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
TW200638335A (en) 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
WO2007120452A1 (en) 2006-04-04 2007-10-25 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
CN101421781A (zh) 2006-04-04 2009-04-29 杜比实验室特许公司 音频信号的感知响度和/或感知频谱平衡的计算和调整
ES2359799T3 (es) * 2006-04-27 2011-05-27 Dolby Laboratories Licensing Corporation Control de ganancia de audio usando detección de eventos auditivos basada en la sonoridad específica.
US8750538B2 (en) 2006-05-05 2014-06-10 Creative Technology Ltd Method for enhancing audio signals
CA2665153C (en) 2006-10-20 2015-05-19 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
KR101106031B1 (ko) 2007-01-03 2012-01-17 돌비 레버러토리즈 라이쎈싱 코오포레이션 하이브리드 디지털/아날로그 음향 세기―보상 볼륨 제어 장치 및 그 제어 방법
KR101649378B1 (ko) 2007-03-15 2016-08-19 인터디지탈 테크날러지 코포레이션 진화된 고속 패킷 액세스 시스템에서 데이터를 재정렬하기 위한 방법 및 장치
EP2130019B1 (en) 2007-03-19 2013-01-02 Dolby Laboratories Licensing Corporation Speech enhancement employing a perceptual model
BRPI0808965B1 (pt) 2007-06-19 2020-03-03 Dolby Laboratories Licensing Corporation Método e aparelho para medir a intensidade sonora percebida de um sinal de áudio e meio legível por computador
US8054948B1 (en) 2007-06-28 2011-11-08 Sprint Communications Company L.P. Audio experience for a communications device user
WO2009086174A1 (en) 2007-12-21 2009-07-09 Srs Labs, Inc. System for adjusting perceived loudness of audio signals
JP4823352B2 (ja) 2009-12-24 2011-11-24 株式会社東芝 情報処理装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW318926B (zh) * 1996-01-26 1997-11-01 Motorola Inc
US20020051546A1 (en) * 1999-11-29 2002-05-02 Bizjak Karl M. Variable attack & release system and method
TW563094B (en) * 2000-10-17 2003-11-21 Qualcomm Inc Method and apparatus for high performance low bit-rate coding of unvoiced speech
US20040013272A1 (en) * 2001-09-07 2004-01-22 Reams Robert W System and method for processing audio data
JP2004356894A (ja) * 2003-05-28 2004-12-16 Mitsubishi Electric Corp 音質調整装置

Also Published As

Publication number Publication date
BRPI0711063B1 (pt) 2023-09-26
US20120155659A1 (en) 2012-06-21
TW200803161A (en) 2008-01-01
MX2008013753A (es) 2009-03-06
US8144881B2 (en) 2012-03-27
US10523169B2 (en) 2019-12-31
US9742372B2 (en) 2017-08-22
DK2011234T3 (da) 2011-03-14
NO20190022A1 (no) 2008-11-17
US20170179906A1 (en) 2017-06-22
US20190222186A1 (en) 2019-07-18
CN101432965A (zh) 2009-05-13
RU2008146747A (ru) 2010-06-10
NO20190018A1 (no) 2008-11-17
NO20161295A1 (no) 2008-11-17
US8428270B2 (en) 2013-04-23
PL2011234T3 (pl) 2011-05-31
IL194430A0 (en) 2009-08-03
JP2009535897A (ja) 2009-10-01
AU2007243586A1 (en) 2007-11-08
US9787269B2 (en) 2017-10-10
US9774309B2 (en) 2017-09-26
BRPI0711063A2 (pt) 2011-08-23
US9685924B2 (en) 2017-06-20
NO344655B1 (no) 2020-02-24
NO345590B1 (no) 2021-05-03
US11362631B2 (en) 2022-06-14
US20170179907A1 (en) 2017-06-22
CN102684628B (zh) 2014-11-26
NO20180272A1 (no) 2008-11-17
US9768750B2 (en) 2017-09-19
NO339346B1 (no) 2016-11-28
KR101200615B1 (ko) 2012-11-12
RU2417514C2 (ru) 2011-04-27
US20160359465A1 (en) 2016-12-08
WO2007127023A1 (en) 2007-11-08
ES2359799T3 (es) 2011-05-27
NO344362B1 (no) 2019-11-18
US10833644B2 (en) 2020-11-10
US20240186972A1 (en) 2024-06-06
US20170179904A1 (en) 2017-06-22
US9136810B2 (en) 2015-09-15
US20210126606A1 (en) 2021-04-29
US20170179908A1 (en) 2017-06-22
NO20161439A1 (no) 2008-11-17
JP2011151811A (ja) 2011-08-04
HK1126902A1 (en) 2009-09-11
CA2648237A1 (en) 2007-11-08
AU2011201348A1 (en) 2011-04-14
KR20110022058A (ko) 2011-03-04
HK1176177A1 (zh) 2013-07-19
US20180069517A1 (en) 2018-03-08
US9698744B1 (en) 2017-07-04
US20230318555A1 (en) 2023-10-05
CN101432965B (zh) 2012-07-04
US11711060B2 (en) 2023-07-25
EP2011234A1 (en) 2009-01-07
UA93243C2 (ru) 2011-01-25
US9762196B2 (en) 2017-09-12
NO20161296A1 (no) 2008-11-17
CA2648237C (en) 2013-02-05
US20170179900A1 (en) 2017-06-22
NO344013B1 (no) 2019-08-12
US10284159B2 (en) 2019-05-07
US20170179909A1 (en) 2017-06-22
DE602007011594D1 (de) 2011-02-10
NO20180271A1 (no) 2008-11-17
US20120321096A1 (en) 2012-12-20
NO20180266A1 (no) 2008-11-17
AU2007243586B2 (en) 2010-12-23
NO20190025A1 (no) 2008-11-17
US20200144979A1 (en) 2020-05-07
US10103700B2 (en) 2018-10-16
ATE493794T1 (de) 2011-01-15
EP2011234B1 (en) 2010-12-29
NO20191310A1 (no) 2008-11-17
NO20190002A1 (no) 2008-11-17
NO344361B1 (no) 2019-11-18
NO20190024A1 (no) 2008-11-17
US9780751B2 (en) 2017-10-03
US20170179905A1 (en) 2017-06-22
NO342160B1 (no) 2018-04-09
KR101041665B1 (ko) 2011-06-15
NO20084336L (no) 2008-11-17
US20220394380A1 (en) 2022-12-08
US9450551B2 (en) 2016-09-20
US20130243222A1 (en) 2013-09-19
US20170179901A1 (en) 2017-06-22
MY141426A (en) 2010-04-30
NO344364B1 (no) 2019-11-18
US11962279B2 (en) 2024-04-16
US20190013786A1 (en) 2019-01-10
NO343877B1 (no) 2019-06-24
US20090220109A1 (en) 2009-09-03
US20170179903A1 (en) 2017-06-22
US9787268B2 (en) 2017-10-10
CN102684628A (zh) 2012-09-19
NO342164B1 (no) 2018-04-09
JP5255663B2 (ja) 2013-08-07
NO344658B1 (no) 2020-03-02
KR20090005225A (ko) 2009-01-12
IL194430A (en) 2013-05-30
US9768749B2 (en) 2017-09-19
US20170179902A1 (en) 2017-06-22
US9866191B2 (en) 2018-01-09
JP5129806B2 (ja) 2013-01-30
AU2011201348B2 (en) 2013-04-18
NO342157B1 (no) 2018-04-09
NO344363B1 (no) 2019-11-18

Similar Documents

Publication Publication Date Title
TWI455481B (zh) 利用聽覺事件之聽覺場景分析與特定響度式檢測來控制音訊動態增益參數之非暫時性電腦可讀取儲存媒體、方法及裝置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees