TWI417872B - 修改型離散餘弦轉換領域之音訊信號響度測量及修改技術 - Google Patents

修改型離散餘弦轉換領域之音訊信號響度測量及修改技術 Download PDF

Info

Publication number
TWI417872B
TWI417872B TW096111833A TW96111833A TWI417872B TW I417872 B TWI417872 B TW I417872B TW 096111833 A TW096111833 A TW 096111833A TW 96111833 A TW96111833 A TW 96111833A TW I417872 B TWI417872 B TW I417872B
Authority
TW
Taiwan
Prior art keywords
loudness
mdct
audio signal
frequency
signal
Prior art date
Application number
TW096111833A
Other languages
English (en)
Other versions
TW200746050A (en
Inventor
Alan Jeffrey Seefeldt
Brett Graham Crockett
Michael John Smithers
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of TW200746050A publication Critical patent/TW200746050A/zh
Application granted granted Critical
Publication of TWI417872B publication Critical patent/TWI417872B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Optical Radar Systems And Details Thereof (AREA)

Description

修改型離散餘弦轉換領域之音訊信號響度測量及修改技術 發明領域
本發明係有關於音頻信號處理。特別地說,本發明係有關於音頻信號之響度的測量及有關於修改MDCT領域中之音頻信號的響度。本發明不僅包括方法亦包括對應之電腦程式與裝置。
此處所指之Dolby Digital(Dolby與Dolby Digital為Dolby實驗室發照公司的註冊商標),亦被習知為AC-3,其在包括於www.atsc.org網際網路可取得之先進電視系統委員會在2001年8月20日之Doc.A/52A的“Digital Audio Compression Standard(AC-3)”之各種公告中被描述。
在較佳地了解本發明之層面為有用的某些用於測量及修改被感知之心理聲音的某些技術在2004年12月23日公告之國際專利申請案WO 2004/111994 A2號的Alan Jeffrey Seefeldt等人“Method,Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal”與2004年10月28日於舊金山之Audio Engineering Society Convention Paper 6236的Alan Seefeldt 等人之“A New Objective Measure of Perceived Loudness”中被描述。該WO 2004/11194 A2申請案與該論文以其整體被納入此處作為參考。
在較佳地了解本發明之層面為有用的某些用於測量及修改被感知之心理聲音的某些技術在2005年10月25日申請之Patent Cooperation Treaty第S.N.PCT/US2005/038579號的國際申請案而被公告為國際申請案號WO 2006/047600號的Alan Jeffrey Seefeldt之“Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal”中被描述。該申請案以其整體被納入此處作為參考。
發明背景
很多方法存在用於客觀地測量音頻信號之被感知的響度。方法之例子包括A、B與C加權式功率測量以及如“Acoustics--Method for calculating loudness level,”ISO 532(1975)之響度的心理聲音式模型。加權式功率採用輸入音頻信號、施用在解除強調感知較不敏感之頻率時強調較敏感之頻率的習知之濾波器、及然後對預設長度之時間將被濾波的信號之功率平均。心理聲音方法典型上為較複雜的且目標在於將人耳之工作較佳地模型化。他們將信號細分為頻帶,其模擬人耳之頻率響應與敏感度,及然後考慮如頻率與時間遮蔽之心理聲音現象以及具有變化之信號強度的響度之非線性的感覺。所有方法之目標為要導出緊密地媒配音頻信號之主觀印象的數值測量。
很多響度測量方法,尤其是心理聲音方法執行音頻信號之頻譜分析。此即,音頻信號由時間域呈現被變換為頻率域呈現。此使用離散傅立葉轉換(DFT)普遍地且最有效率地被執行而通常被施作成為快速傅立葉轉換(FFT),其性質、用途與限制完善地被了解。離散傅立葉轉換之逆轉被稱為逆傅立葉轉換(IDFT)、通常被施作成為逆快速傅立葉轉換(IFFT)。
類似傅立葉轉換之另一時間對頻率轉換為離散餘弦轉換(DCT),通常被施作成為修改式離散餘弦轉換(MDCT)。此轉換提供信號之較緊緻的頻譜呈現,且在如Dolby Digital與MPEG2-AAC之低位元率音頻編碼或壓縮系統以及如MPEG2音頻與JPEG之影像壓縮系統中廣泛地被使用。在音頻壓縮運算法則中,音頻信號被分離成為相疊之時間段落,且每一個段落的MDCT轉換在編碼之際被量化及被封包成為位元串流。在解碼之際,該等段落之每一個解除封包,且透過逆MDCT(IMDCT)轉換被傳送以重新創立時間域信號。類似地,在影像壓縮運算法則中,影像被分離為空間段落,即針對每一個段落被量化之DCT被封包成為位元串流。
MDCT(及類似地DCT)之性質在使用此轉換於執行頻譜分析與修改時會導致困難。首先,不像DFT包含正弦與餘弦正交成份二者地,MDCT只包含餘弦成份。當連續且相疊之MDCT被使用以分析實質地穩定狀態的信號時,連續之MDCT會波動且因而不精確地呈現信號之穩定狀態性質。其次,若連續之MDCT頻譜值實質地被修改時,MDCT包含未完全被消除之時間上的鋸齒。更多之細節在下列段落中被提供。
由於直接處理MDCT領域信號之困難,MDCT信號典型地被變換回到時間域,此處之處理可使用FFT或IFFT或用直接時間域方法被執行。在頻率域處理之情形中,額外之前進與逆FFT在計算複雜度加上重大的提高,且以這些計算施行及直接處理MDCT頻譜會是有益的,例如,在將如Dolby Digital之MDCT式音頻信號解碼時,執行響度測量與頻譜修改以在逆MDCT前且不須FFT與IFFT地直接對MDCT頻譜值調整響度會為有益的。
響度之很多有用的客觀測量可由信號之功率頻譜被計算,其由DFT容易地被估計。其將被證明功率頻譜之合適的估計亦可由MDCT被計算。由MDCT被產生之估計為被運用的平滑時間常數之函數,且其將被證明平滑時間常數之使用與產生針對大多數響度測量應用為充分精確的之估計的人類響度感知之積分時間相稱的。除了測量外,吾人會希望藉由施用MDCT領域中濾波器來修改音頻信號之響度。一般而言,此濾波對被處理之音頻引進人工物,但其被證明若濾波對頻率平滑地變化,則人工物在感知上變得可忽略的。與被提議之響度修改相關聯的濾波型式被限制為對頻率為平滑的且因而可在MDCT領域中被施用。
MDCT 之性質
在長度為N之複數信號x 的離散時間傅立葉轉換(DTFT)以下是被給予:ω 的徑度頻率 在實務上,DTFT在0與2πN 個均勻地相隔之頻率被抽樣。此被抽樣之轉換被習知為離散傅立葉轉換(DFT),且其使用因快速傅立葉轉換(FFT)之快速運算法則對其計算之存在而為廣泛的。更明確地說,在櫃k 之DFT在下式被給予:
DTFT亦可用一半之櫃的偏置被抽樣以得到移位式離散傅立葉轉換(SDFT): 逆DFT(IDFT)在下式被給予: 及逆SDFT(ISDFT)在下式被給予:
DFT與SDFT較佳地為可逆的,使得:x [n ]=x IDFT [n ]=x ISDFT [n ]。
真實信號xN 點修改式離散餘弦轉換(MDCT)在下式被給予:,其中(6)
N 點MDCT實際上為冗餘的而只有N /2個獨一點。其可被證明:X MDCT [k ]=-X MDCT [Nk -1] (7)
逆MDCT(IMDCT)在下式被給予:
不像DFT與SDFT地,MDCT並非完全可逆的:x IMDCT [n ]≠x [n ]。代之的是,x IMDCT [n ]為x [n ]之時間鋸齒式的版本:
在第6式之操作後,真實信號x 之MDCT與SDFT間的關係可被列為:
換言之,MDCT可被表示為SDFT之量用為SDFT之角的函數之餘弦被調變。
在很多音頻處理應用中,計算音頻信號x 之連續的疊窗式區塊之DFT為有用的。吾人稱此相疊之轉換為短時間離散傅立葉(STDFT)。假設信號x 比轉換長度N 長很多,在櫃k 與區塊t 之STDFT以下是被給予:
此處w A [n ]為長度N 之分析窗及M 為區塊跳頻規模。短時間移位式離散傅立葉轉換(STSDFT)與短時間修改式離散餘弦轉換(STMDCT)可類比餘STDFT地被定義。吾人分別稱這些轉換為X SDFT [k ,t ]與X MDCT [k ,t ]。由於DFT與SDFT二者均為完全可逆的,STDFT與STSDFT在假設窗與跳頻規模適當地被選用下便可藉由將每一個區塊逆轉,然後相疊與相加而完全地被逆轉。就算MDCT不為可逆的,STMDCT可用MN /2與如正弦窗之適合的窗選用而被做成完全地可逆轉的。在此類狀況下,連續的被逆轉之區塊間的第9式中被給予之鋸齒在該等被逆轉之區塊被相疊相加時確實地被消除。此性質以及N 點MDCT包含N/2個獨一點之事實,使得STMDCT為以相疊之關鍵性被抽樣的濾波器排組成為完美之重建。比較之下,STDFT與STSDFT二者均針對相同之跳頻規模用2之因子被過度抽樣。結果為STMDCT變成針對感知音頻編碼最普遍被使用之轉換。
依據本發明之一實施例,係特地提出一種用於處理時間抽樣之真實信號的修改型離散餘弦轉換(MDCT)所呈現之一音頻信號的方法,包含:測量該被轉換之音頻信號的響度,以及在至少部分地響應該測量下修改該被轉換之音頻信號的響度。
圖式簡單說明
第1圖顯示關鍵頻帶濾波器C b [k ]之響應的描點圖,其中40個頻率響應沿著等值長方形帶寬(ERB)尺度均勻地相隔。
第2a圖顯示使用各種T值之移動平均所計算的介於間以dB為單位之平均絕對誤差。
第2b圖顯示使用其中各種T值之一極平滑器所計算的介於間以dB為單位之平均絕對誤差。
第3a圖顯示一濾波器響應H[k ,t ]與一理想之磚牆低通濾波器。
第3b圖顯示理想之脈衝響應h IDFT [n ,t ]。
第4a圖為對應於第3a圖之濾波器響應H [k ,t ]的對應之灰階影像。在此處之此與其他灰階影像中,xy 軸分別代表矩陣之行與列,及其灰階強度代表矩陣在特定列/行位置依照顯示於影像右邊之尺度的值。
第4b圖為對應於第3a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第5a圖為對應於第3a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第5b圖為對應於第3a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第6a圖顯示作為一平滑後低通濾波器之濾波器響應H [k ,t ]。
第6b圖顯示時間緊緻後之脈衝響應h IDFT [n ,t ]。
第7a圖與第4a圖的比較係顯示對應於第6a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第7b圖與第4a圖的比較係顯示對應於第6a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第8a圖顯示對應於第6a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第8b圖顯示對應於第6a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第9圖顯示依據本發明的基本層面之響度測量方法的方塊圖。
第10a圖為加權後功率之測量裝置或處理的示意性功能方塊圖。
第10b圖為一心理聲音式測量裝置或處理的示意性功能方塊圖。
第11圖顯示數個不同標準加權濾波器響應。
第12a圖為依據本發明之層面的加權後功率之測量裝置或處理的示意性功能方塊圖。
第12b圖為依據本發明之層面的心理聲音式測量裝置或處理的示意性功能方塊圖。
第13圖為一示意性功能方塊圖,顯示用於測量例如低位元率編碼音頻之在MDCT領域中被編碼的音頻之響度的本發明之一層面。
第14圖為一示意性功能方塊圖,顯示在第13圖之配置中為有用的解碼處理例子。
第15圖為一示意性功能方塊圖,顯示其中由低位元率音頻編碼器中之部份解碼所獲得的STMDCT係數在響度測量中被使用的本發明之一層面。
第16圖為一示意性功能方塊圖,顯示由低位元率音頻編碼器中之部份解碼所獲得的STMDCT係數在響度測量中被使用的例子。
第17圖為一示意性功能方塊圖,顯示其中該音頻之響度藉由變更其STMDCT呈現根據由同一呈現所獲得的響度之測量被修改的本發明之一層面。
第18a圖顯示對應於特定響度之固定尺度的濾波器響應H [k ,t ]。
第18b圖顯示對應於其中第18a圖所顯示之響應的濾波器之矩陣的灰階影像。
第19a圖顯示對應於被施用至特定響度之DRC的濾波器響應H [k ,t ]。
第19b圖顯示對應於其中第18a圖中被顯示之響應的濾波器之矩陣的灰階影像。
較佳實施例之詳細說明 功率頻譜估計
STDFT與STSDFT之一普遍用途為針對很多區塊tX DFT [k ,t ]或X SDFT [k ,t ]之平方量平均來估計一信號的功率頻譜。長度為T個區塊之移動平均可如下列地被計算以產生功率頻譜的時間上變化之估計:
這些功率頻譜針對如下面被討論地計算信號之各種客觀響度量測特別有用。現在其將被證明在某些假設下P SDFT [k ,t ]可由X MDCT [k ,t ]被近似。首先,定義: 使用第10式之關係,吾人可得: 若吾人假設|X SDFT [k ,t ]|與∠X SDFT [k ,t ]在所有區塊t 相對獨立地共變(此為對大多數音頻信號會成立之假設),吾人可寫出: 若吾人假設∠X SDFT [k ,t ]對T 個區塊以總和在0與2π 間均勻地分佈(一般對音頻會成立之另一假設),且T若為相當大,則吾人可寫出: 原因為以均勻分佈之相位角的餘弦平方之期望值為一半。因而,吾人可看出由STMDCT被估計之功率頻譜等於由STSDFT被估計者的近似一半。
在非使用移動平均估計功率頻譜中,吾人可如下列替選地運用單極平滑濾波器:P DFT [k ,t ]=λP DFT [k ,t -1]+(1-λ )|X DFT [k ,t ]|2 (14a)P SDFT [k ,t ]=λP SDFT [k ,t -1]+(1-λ )|X SDFT [k ,t ]|2 (14b)P MDCT [k ,t ]=λP MDCT [k ,t -1]+(1-λ )|X MDCT [k ,t ]|2 (14c)其中以轉換區塊為單位被測量之平滑濾波器的一半衰變時間由下式被給予: 在此情形中,若T 相當大,其可類似地被證明P MDCT [k ,t ](1/2)P SDFT [k ,t ]。
就實務應用而言,吾人可決定在移動平均或單極情形中T應為多大以獲得來自MDCT之功率頻譜的充份精確的估計。為如此做,吾人可就T之某一給予值注意P SDFT [k ,t ]與2P MDCT [k ,t ]間的誤差。就如響度之涉及感知式測量與修改而言,在每一個各別之轉換櫃k檢查此誤差並非特別有用的。取代的是檢查關鍵頻帶內之誤差是較有意義的,此係模擬耳朵之頭蓋骨底部薄膜在特定位置的響應。為如此做,吾人可藉由將具有關鍵頻帶濾波器之功率頻譜相乘然後對頻率積分: 此處C b [k ]代表針對在對應於變換櫃k之頻率被抽樣的關鍵頻帶b 之濾波器的響應。第1圖顯示關鍵頻帶濾波器C b [k ]之響應的描點圖,其中40個頻率響應沿著等值長方形帶寬(ERB)尺度均勻地相隔,此乃如Moore與Glasberg所定義之關鍵頻帶比率尺度(B.C.Moore,B.Glasberg與T.Baer在1997年4月The Audio Engineering Society期刋第45卷第4期,第224-240頁之“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness.”)。每一個濾波器形狀如Moore與Glasberg所建議地係用捨進後之指數函數被描述,且其頻帶使用ERB之間隔被分佈。
現在吾人可針對計算功率頻譜之移動平均與單極技術二者就T之某一給予值檢查P SDFT [k ,t ]與2P MDCT [k ,t ]間的誤差。第2a圖針對移動平均情形顯示此誤差。明確地說,針對40個關鍵頻帶就10秒之音樂段落而言,以dB表示的平均絕對誤差(AAE)就各種平均窗長度T被顯示。音頻以44100 Hz之比率被抽樣,且轉換規模被設定為1024樣本、及跳頻規模被設定為512樣本。該描點圖顯示T範圍為由1秒低到15微秒之值。吾人注意到,針對每一個頻帶,誤差隨著T增加而減少,此為被期待的:MDCT功率頻譜之精確度依T為相當大而定。同樣地,針對每一個T值,誤差隨著頻帶數目增加而減少。此可歸因於關鍵頻帶以中心頻率提高而變得較寬之事實。結果為較多之櫃k被分組在一起以估計頻帶中之功率,而將來自各別櫃之誤差平均掉。作為一參考點,吾人注意到小於0.5dB之AAE可用長度為250ms之差大略等於人類低於此將不能可靠地判別位準差異的臨界值。
第2b圖顯示相同之描點圖,但為針對使用單極平滑器被計算之。與移動平均情形之AAE的相同趨勢被看到,但其誤差均勻地較小。此乃因與單極平滑器相關聯之平均窗為具有指數衰變之無限的。吾人注意到在每一個頻帶中之小於0.5dB的AAE以60ms以上之衰變時間T被獲得。
針對涉及響度測量與修改之應用,為計算功率頻譜估計所運用的時間常數不須比響度感知之人類的積分時間較快。Watson與Gengel實施實驗證明此積分層面隨著頻率提高而減小,其在低頻率(125-200 Hz或4-6 ERB)為150-175ms、在高頻率(3000-4000 Hz或25-27 ERB)為40-60ms之範圍內(the Acoustical Society of America 期刊1969年第4期(第二部)第989-997頁)的“Signal Duration and Signal Frequency in Relation to Auditory Sensitivity”)。吾人因此可有利地計算功率頻譜估計,其中平滑時間常數因之隨頻率而變化。第2b圖之激發指出此頻率變化時間常數可被運用以由在每一個關鍵頻帶內展現小的平均誤差(小於0.25dB)之MDCT產生功率頻譜估計。
濾波
STDFT之另一普遍的用途為有效率地執行音頻信號之時間上變化的濾波。此藉由將每一個區塊之STDFT乘以所欲的濾波器之頻率響應以得到濾波後的STDFT:Y DFT [k ,t ]=H [k ,t ]X DFT [k ,t ] (16)
每一個區塊之Y DFT [k ,t ]的被做成窗後之IDFT等於信號xH [k ,t ]的IDFT被圓圈式迴旋後且被乘以合成窗w S [n ]之對應的被做成窗後之段落: 其中運算子((*)) N 表示求N 之模數。被濾波後之一時間域信號y 便透過y IDFT [n ,t ]的重疊相加合成被產生。若在第15式中之h IDFT [n ,t ]就n >P為0(此處P <N )且w A [n ]就n >NP 為0,則在第17式中之圓圈迴旋和等於一般迴旋,且被濾波之音頻信號y聽起來為無人工物的。然而就算填0要求未被滿足,被圓圈迴旋造成之時間域鋸齒在充分地減弱的分析與合成窗若被運用時通常為聽不見的。例如,用於分析與合成二者之正弦窗一般為適當的。
類比之濾波作業可使用STMDCT被執行:Y MDCT [k ,t ]=H [k ,t ]X MDCT [k ,t ] (18)
然而在此情形中,頻率域中之乘法不等值於在時間域中之圓圈迴旋且可聽見的人工物已被引進。為了解這些人工物之起源,將矩陣乘法列式為向前轉換運算、以濾波器響應相乘、逆轉換、及針對STDFT與STMDCT二者重疊相加為有用的。將y IDFT [n ,t ],n =0...N -1表示為N x1向量x [nMt ],n =0...N -1表示為Nx1向量x t 下,吾人可寫出: 其中:W A =在對角線有w A [n ]而其他處為0之N xN 矩陣A DFT N xN DFT矩陣H t =在對角線有H [k ,t ]而其他處為0之N xN 矩陣W S =在對角線有w S [n ]而其他處為0之N xN 矩陣=包容整個轉換之N xN 矩陣
以跳頻規模被設定為MN /2下,連續區塊之第一半部與第二半部被相加以產生N /2點的最終信號。此可透過矩陣乘法被表示為: 其中I =(N /2xN /2)單位矩陣0 =(N /2xN /2)0矩陣=組合轉換與重疊相加之(N /2)x(3N /2)矩陣
在MDCT領域中之濾波器乘法的類比矩陣列式可被表示為: 其中A SDFT N xN SDFT矩陣IN xN 單位矩陣D =對應第9式中之時間鋸齒的N xN 時間鋸齒矩陣=包容整個轉換之N xN 矩陣
注意此列式運用可透過下列關係之MDCT與SDFT間的額外關係:A MACT A SDFT (ID ) (22)其中為在對角線外之左上角具有-1及在對角線外之左下角具有1之N xN 矩陣。此矩陣考慮到第9式中之時間鋸齒。納入重疊相加之矩陣便類比於地被定義為:
現在吾人可就特定之濾波器H [k ,t ]檢查矩陣,,,與以了解由MDCT領域中之濾波發生的人工物。以N =512考慮對區塊t為固定之濾波器H [k ,t ],其採用如第3a圖中被顯示之磚牆低通濾波器。對應之脈衝響應h IDFT [n ,t ]在第1b圖中被顯示。
在以分析與合成窗被設定為正弦窗下,第4a與4b圖顯示對應於第1a圖中被顯示之H [k ,t ]的矩陣之灰階影像。在這些影像中,xy 軸分別代表矩陣之行與列,及其灰階強度代表矩陣在特定列/行位置依照顯示於影像右邊之尺度的值。矩陣藉由將矩陣之上半部與下半部重疊相加而被形成。矩陣之每一列可被視為一脈衝響應,其用信號x 被迴旋以產生被濾波之信號y 的單一樣本。理想上,每一列應近似地等於被移位h IDFT [n ,t ],使得其以矩陣對角線為中心。第4b圖之視覺上的檢查指出此之情形。
第5a與5b圖針對同一濾波器H [k ,t ]顯示矩陣之灰階影像。吾人在中看到脈衝響應h IDFT [n ,t ]沿著對應第19式中之鋸齒矩陣中的主對角線以及上、下對角線外被複製。結果為干擾型態由在主對角線以及在鋸齒對角線之響應的添加而形成。當之上與下半部被添加以產生時,來自鋸齒對角線之波瓣被消除,但干擾型態會餘留。後果為不會呈現沿著矩陣對角線被複製之相同的脈衝響應。代之地,脈衝響應以由樣本至樣本之迅速的時間變化方式變化而對被濾波之信號y 施加可聽到的人工物。
現在考慮第6a圖中被顯示之濾波器H [k ,t ]。此為與來自第1a圖之低通濾波器相同,但以轉移頻帶被被大量地加寬。該對應之脈衝響應h IDFT [n ,t ]在第6b圖中被顯示,且吾人注意到其比第3b圖中之響應為可觀地較緊緻。此反映了在頻率更平滑地變化之頻率響應將具有在時間上較緊緻的脈衝響應之一般法則。
第7a與7b圖顯示對應於較平滑之頻率響應的矩陣。這些矩陣展現與在第4a與4b圖者相同之性質。
第8a與8b圖顯示相同平滑頻率響應之矩陣。矩陣因脈衝響應h IDFT [n ,t ]在時間上如此地緊緻而未展現任何干擾型態。顯著地大於0之部分的h IDFT [n ,t ]不會在距離主對角線或鋸齒對角線之位置發生。矩陣除了鋸齒對角線之完全消除是比較少外近乎與相同,且結果為被濾波之信號y 係免於任何顯著地可聽到的人工物。
其已被證明在MDCT領域中之濾波一般會引進感知之人工物。然而若濾波器響應對頻率平滑地變化,該等人工物變得可忽略的。很多音頻應用需要對頻率突然改變之濾波器。然而典型上這些為針對非感知之修改的目的改變信號,例如樣本率變換會需要磚牆低通濾波器。針對做成所欲之感知改變的目的之濾波作業一般不要求濾波器具有對頻率突然改變之響應。結果為,此類濾波作業可不致於引進討壓的感知人工物地在MDCT領域中被施用。特別是,針對響度修改被運用之頻率響應型式如將在下面被證明地被限制為對頻率為平滑的,且因而可有利地在MDCT領域中被施用。
用於實施本發明之最佳模式
本發明之層面提供對已被轉換為MDCT領域的音頻信號之被感知的響度之測量。本發明之進一步層面提供存在於MDCT領域的音頻信號之被感知的響度之調整。
MDCT領域中的響度測量
如上面被顯示地,STMDCT之性質使得響度測量為可能的且直接使用音頻信號之STMDCT呈現。首先,由STMDCT被估計之功率頻譜等於由STDFT被估計之功率頻譜的近似一半。其次,STMDCT音頻信號之濾波在濾波器的脈衝響應假設若為在時間緊緻的時可被執行。
所以,使用STSDFT與STDFT之被用以測量音頻的響度之技術亦可在STMDCT式的音頻信號中被使用。進一步言之,由於很多STMDCT方法為等值於時間域之頻率域方法,其遵循很多時間域方法係具有頻率域STMDCT等值方法。
第9圖顯示依據本發明之基本層面的響度測量器或測量處理之方塊圖。由代表時間樣本之重疊區塊的連續STMDCT頻譜(901)之一音頻信號被傳送至響度測量裝置或處理(「測量響度」)902。其輸出為響度值903。
測量響度902
測量響度902可由代表任何數目的響度測量之一,如加權式功率測量與心理聲音式測量。下列之段落描述加權式功率測量。
第10a與10b圖顯示用於客觀地測量音頻信號之響度的二種一般之技術。這些代表在第9圖中被顯示之測量響度902的功能之變形。
第10a圖列出在響度測量裝置中普遍地被使用之加權式功率測量技術。音頻信號1001透過被設計來在解除強度感知較不敏感之頻率時強調感知較敏感之頻率。被濾波之信號1003的功率被計算(用功率1004)及對被界定之時期被平均(用平均1006)以創立單一響度值。數個不同之標準加權濾波器存在且在第11圖中被顯示。在實務上,此處理之被修改的版本經常被使用,例如防止靜默時期被納入平均數中。
心理聲音式技術經常被使用以測量響度。第10b圖顯示此類技術之一般化方塊圖。音頻信號1001用呈現外耳與中耳之變化的量響應之傳輸濾波器1012被濾波。然後被濾波之信號1013被分離為頻帶(用聽覺濾波器排組1014),其與聽覺關鍵頻帶等值或比其窄。然後頻帶(被激發1016)變換為代表在頻帶內被人耳所經驗的刺激或激發量之激發信號1017。針對每一個頻帶被感知之響度或特定響度便由激發被計算(用特定響度1018)且對所有頻帶之特定響度被加總(用加總1020)以創立響度1007之單一量測。該加總處理可考慮例如頻率遮蔽之各種感知效果。在這些感知方法之實物施作中,重大之計算資源針對傳輸與聽覺濾波器排組被需要。
依照本發明之層面,此類一般方法被修改以測量已在STMDCT領域中之信號的響度。
依照本發明之層面,第12a圖顯示第10a圖之測量響度裝置或處理的被修改之版本例。在此例中,加權濾波器可藉由提高或降低每一個頻帶中之STMDCT而被施用。然後被加權之頻率功率在1204中被計算,所考慮之事實為STMDCT信號之功率近似於STMDCT信號之等值時間領域或STMDCT信號的一半。功率信號1205便可對時間被平均,且其輸出可被採用作為目標特定響度903。
依照本發明之層面,第12b圖顯示第10b圖之測量響度裝置或處理的被修改之版本例。在此例中,修改式傳輸濾波器1212在頻率域中藉由提高或降低每一個頻帶中之STMDCT而被直接施用。修改式聽覺濾波器排組接受線性頻帶相隔之STMDCT頻譜作為輸入且分割或組合這些頻帶成為關鍵頻帶分隔之濾波器排組輸出1015。修改式聽覺濾波器排組亦考慮STMDCT信號之功率近似於STMDCT信號之等值時間領域或STMDCT信號的一半的事實。然後頻帶(被激發1016)變換為代表在頻帶內被人耳所經驗的刺激或激發量之激發信號1017。針對每一個頻帶被感知之響度或特定響度便由激發被計算(用特定響度1018)且對所有頻帶之特定響度被加總(用加總1020)以創立響度903之單一量測。
針對加權功率響度修改之施用細節
如先前被描述地,代表STMDCT之X MDCT [k ,t ]為一音頻信號x ,其中k為櫃指標及t 為區塊指標。為計算加權功率量測,STMDCT值先使用如第11圖中被顯示之適合的加權曲線(A,B,C)被調整增益或加權。使用A加權作為例子,離散A加權頻率值AW [k]藉由針對離散頻率f discrete 計算A加權增益值,其中 其中 及其中Fs 為每秒樣本數之抽樣頻率。
每一個STMDCT區塊t之加權功率被計算為對頻率櫃k的加權值平方乘以與STMDCT功率頻譜估計(在第13a或14c式中被給予)之和:
加權功率便如下列地被變換為dB之單位:L A [t ]=10.log10 (P A [t ]) (26)
類似地,B與C加權及未加權計算可被執行。在未加權之情形中,其加權值被設定為1.0。
用於心理聲音響度測量之施用細節
心理聲音響度測量亦可被用以測量一STMDCT音頻信號之響度。
Seefeldt等人之該WO 2004/111994 A2申請案在其他事項中揭露根據心理聲音模型之被感知的響度之客觀的測量。由STMDCT係數901使用第13a或14c式被導出之功率頻譜值P SDFT [k ,t ]以及其他類似的心理聲音量測而非原始PCM音頻可作為所揭之裝置或處理的輸入。此種系統在第10b圖之例中被顯示。
由該PCT申請案借用術語與記號,在關鍵頻帶b於時間區塊t 之際近似於沿著內耳頭蓋骨底部薄膜的能量分佈之激發信號E [b ,t ]可由STMDCT功率頻譜如下列地被近似: 其中T [k ]代表傳輸濾波器之頻率響應及C b [k ]代表在對應於關鍵頻帶b 之位置的頭蓋骨底部之頻率響應,此二響應均在對應於轉換櫃k 之頻率被抽樣。濾波器C b [k ]可採用第1圖中被顯示之形式。
使用相等響度等高線,在每一個頻帶之激發被轉換為在1kHz產生相同響度之激發位準。然後對頻率與時間被分佈之感知響度的量測透過下列壓縮非線性由已轉換之激發E 1kHz [b ,t ]被計算: 其中TQ 1 kHz 為在1kHz之靜音中的臨界值及Gα 被選用以媒配由描述響度之成長的心理聲音實驗被產生之資料。最後,以sone為單位被呈現之總響度L 利用對頻帶將特定響度加總而被計算:
為了調整音頻信號之目的,吾人會希望計算媒配之增益G Match [t ],其在音頻信號被相乘時使得被調整的音頻等於如用所描述之心理聲音技術被測量的一些基準響度L REF 。由於心理聲音測量涉及特定響度之計算中的非線性,針對G Match [t ]之封閉形式的解不存在。代之的是,在該PCT應用中所描述之迴覆式技術可被運用,其中媒配增益的平方用總激發E [b ,t ]被調整及被相乘,直至對應之總響度L 為在基準響度L REF 的一些容差內。然後以dB被表示之音頻的響度針對該基準為:
STMDCT式響度測量之應用
本發明的主要性質之一在於允許以低位元率被編碼之音頻(在MDCT領域中被呈現)的響度不須將音頻完全解碼為PCM的測量與修改。該解碼處理包括位元分派與逆轉換等之昂貴的處理步驟。藉由避免一些解碼步驟,該處理要求之計算的間接費用被降低。此做法在響度測量為所欲的且被解碼之音頻為不需的時為有益的。其應用包括在2006年1月5日被公告之Smithers等人的美國專利申請案第2006/0002572 A1號之“Method for correcting metadata affecting the playback loudness and dynamic range of audio information”中被列出者之響度驗證與修改工具,此處響度測量與校正經常在對被解碼的音頻之存取為不需要的播放儲存器或傳輸鏈中被執行。本發明所提供之處理節省亦有助於使對即時被傳輸的大量低位元率壓縮後之音頻信號執行響度測量與元資料校正(例如對較正值改變Dolby Digital DIALNORM元資料參數)成為可能的。很多低位元率編碼後之音頻信號經常在MPEG運送串流中被多工及被運送。有效率之響度測量技術的存在與將被壓縮之音頻信號完全地解碼為PCM以執行響度量測的要求被比較下允許對大量低位元率壓縮後之音頻信號的響度測量。
第13圖顯示不須運用本發明之層面的測量響度方法。音頻之完全解碼(為PCM)被執行且因頻之響度使用習知的技術被測量。更明確地說,低位元率編碼後之音頻資料或資訊1301首先用解碼裝置或處理(「解碼」)1302被解碼成為未壓縮的音頻信號1303。然後此信號被傳送至響度測量裝置或處理(「響度測量」)1304及結果所得之響度值被輸出(1305)。
第14圖顯示用於低位元率編碼後之音頻信號的解碼處理。明確地說,其顯示對Dolby Digital解碼器與Dolby E解碼器二者為共同之構造。被編碼之音頻資料的訊框用裝置或處理1402被解除封包成為指數資料1403、假數(mantissa)資料1404與其他各類位元分派資訊1407。指數資料1403用裝置或處理1405被變換成為對數功率頻譜1406,及此對數功率頻譜被位元分派裝置或處理1408使用以計算信號1409,其為每一個量化假數以位元表示之長度。然後假數1411在裝置或處理1410中被解除封包或解除量化且與指數1409被組合及用逆濾波器排組裝置或處理1412被變換回至時間域。逆濾波器排組亦將目前逆濾波器排組結果與先前逆濾波器排組結果(在時間上)相疊及加總以創立被解碼之音頻信號1303。在實務解碼器施作中,重大之計算資源被要求以執行位元分派、解除量化假數與逆濾波器排組處理。對解碼處理之更多細節可在上面被引述的A/52A文件中被找到。
第15圖顯示本發明之層面的簡單方塊圖。在此例中,被編碼之音頻信號1301在裝置或處理1502部分地被解碼以擷取MDCT係數及響度使用部分地被解碼資訊在裝置或處理902中被測量。依部分解碼如何被執行地,結果之響度測量903會非常類似由完全解碼之音頻信號1303被計算的響度測量1305,但非確實相同。然而,此測量可為足夠接近以提供音頻信號之響度的有用之估計。
第16圖顯示實施本發明之層面且如第15圖之例所顯示的部分裝置或處理之例。在此例中,無逆STMDCT被執行且STMDCT信號1303被輸出以便在測量響度裝置或處理中被使用。
依照本發明之層面,在STMDCT領域中的部分解碼因解碼不需要濾波器排組處理而形成重大計算節省之結果。
感知編碼器經常被設計以配合音頻信號之某些特徵地變更相疊時間段的長度,亦被稱為區塊大小。例如Dolby Digital使用二種區塊大小:針對靜止音頻信號為凌越地512個樣本之較長的區塊及針對較過渡性之音頻信號得256樣本之較短區塊。其結果為頻帶數目與STMDCT值之對應的數目逐一區塊地變化。當區塊大小為512樣本時有256個頻帶,及當區塊大小為256樣本時有128個頻帶。
第13與14圖之例能處置變化區塊大小的方法有很多,且每一個方法導致類似結果之響度測量。例如,解除量化假數處理1410可被修改以藉由將多個較小區塊組合或平均成為較大區塊且由較小數目之頻帶散佈功率至較大數目之頻帶而永遠以固定的區塊率來輸出固定數目之頻帶。替選地,測量響度方法可接受變化之區塊大小且因之例如藉由調整時間常數而調整濾波、激發、特定響度平均與加總處理。
本發明用於測量Dolby Digital與Dolby E串流之響度的替選版本可能較為有效率但稍微較不精準的。依據此替選做法,位元分派與解除量化假數未被執行,且只有STMDCT指數資料1403被用以重新創立MDCT值。該等指數可由位元串流被讀取與結果之頻譜可被傳送至響度測量裝置或處理。此避免位元分派、假數解除量化與逆轉換之計算成本,但與使用完整STMDCT值比較時具有稍微較不精準之響度測量的不利。
使用標準響度音頻測試材料被執行之實驗已證明只使用部分被解碼之STMDCT資料被計算的心理聲音響度非常接近使用與原始PCM音頻資料相同之心理聲音頻率被計算的值非常接近。就32件音頻測試之測試集合而言,使用PCM被計算之L dB 與被量化之Dolby Digital指數間的平均絕對差以0.54dB之最大絕對差下只有0.093dB。這些值在實務響度測量精確度範圍內為良好的。
其他感知音頻編碼解碼
使用MPEG2-AAC被編碼之音頻信號亦可部分地被解碼為STMDCT係數且其結果被傳送至客觀的響度測量裝置或處理。MPEG2-AAC被編碼之音頻信號基本上由尺度因子與量化轉換係數組成。尺度因子首先被解除封包且被用以將量化轉換係數解除封包。由於既非尺度因子亦非量化轉換係數本身包含足夠之資訊來推論音頻信號之粗略的呈現,二者必須被解除封包及被組合且結果之頻譜被傳送至響度測量裝置或處理。類似Dolby Digital與Dolby E地,此節省逆濾波器排組的計算成本。
基本上針對部分被解碼之資訊可產生音頻信號的STMDCT或對STMDCT之近似,第15圖顯示之本發明的層面可導致重大的計算節省。
在MDCT領域中之響度修改
本發明之進一步層面為藉由根據由STMDCT呈現所獲得的響度之量測變更同一呈現來修改音頻的響度。第17圖顯示一修改裝置或處理之一例。如在第9圖之例地,由連續之STMDCT區塊(901)所組成的一音頻信號被傳送至測量響度裝置或處理902,而響度值903係由此被產生。此響度值與STMDCT信號被輸入至一修改響度裝置或處理1704,其可運用響度值來改變信號之響度。其中響度被修改之方式可用由於系統之操作員的外部來源被輸入之響度修改參數1705替選地或額外地被控制。修改響度裝置或處理之輸出為包含所欲之響度修改的被修改之STMDCT信號1706。最後,該被修改之STMDCT信號可進一步被逆MDCT裝置或功能1707處理,其藉由對該被修改之STMDCT信號的每一個區塊執行MDCT及將連續區塊相疊相加而將時間域後之信號1708合成。
第17圖之例的一特定實施例為如A加權之加權式功率測量所驅動的自動增益控制(AGC)。在此情形中,響度值903可被計算為在第25式被給予之A加權式功率測量。代表音頻信號之所欲的響度之一基準功率測量可透過響度修改參數1705被提供。吾人由時間上變化之功率測量P A [t ]與基準功率可計算一修改增益: 其與STMDCT信號X MDCT [k ,t ]被相乘以產生被修改之STMDCT信號
在此情形中,該被修改之STMDCT信號對應於一音頻信號,其平均響度近似地等於所欲的基準。由於增益G [t ]由區塊至區塊地變化,如第9式所定之MDCT轉換的時間域鋸齒在時間域信號1708由第33式的該被修改之STMDCT信號對應被合成時不會完全地消除。然而,用於由STMDCT計算功率頻譜估計所使用之平滑時間常數够大,增益G [t ]將够慢地變化,使得鋸齒消除誤差為小的且聽不到的。注意在此情形中,該修改增益G [t ]對所有頻率櫃k 為常數,所以稍早所描述之有關MDCT領域中之濾波的問題並非一課題。
除了AGC外,其他之響度修改技術可使用加權功率測量以類似的方式被施作。例如,動態範圍控制(DRC)可藉由計算增益G [t ]為P A [t ]之函數而被施作,使得音頻信號之響度在P A [t ]為小的時被提高及在P A [t ]為大的時被降低而減小音頻之動態範圍。就此種DRC應用而言,為計算功率頻譜估計所使用之時間常數典型上會被選用比在AGC應用較小,使得增益G [t ]對灰階影像音頻信號中之響度的較短期變化反應。
吾人可稱如在第32式中之修改增益G [t ]為寬帶增益,原因為其對所有頻率櫃k 為固定的。寬帶增益之使用以變更音頻信號的響度會引進數個感知上討厭的人工物。最被了解為頻譜交叉泵動,此處在頻譜之一部分的響度變化比該頻譜之其他不相關的部分在聽覺上為調和的。例如,一古典音樂段落可能包含持續之弦音凌越的高頻率,而低頻率包含大聲轟隆作響之定音鼓。在上述之DRC情形中,每當定音鼓打擊時,整體之響度提高,且DRC系統對整個頻譜施用衰減。結果為弦音聽起來以響度與定音鼓上下“泵動”。典型之解決方案為對頻譜之不同部分施用不同增益,且此種解決方案被適應於此處被揭露之STMDCT修改系統。例如,一組加權式功率量測可被計算,其每一個來自功率頻譜之不同區域(在此情形中為頻率櫃之部分集合),且每一個功率量測便可被用以計算響度修改增益,其隨後被乘以頻譜之對應的部分。此類「多頻帶」處理器典型上運用4或5個頻帶。在此情形中,增益確對頻率變化,但要小心地在乘以STMDCT前對櫃k 將增益平滑以避免如稍早被描述之人工物的引進。
針對動態地變更音頻信號之響度使用寬帶增益相關聯之較不被了解的問題為在增益改變時於被感知之頻譜平衡或音質中的移位結果。音質中被感知之移位是人類對頻率之響度感知中的變化之副產品。特別是,相等響度等高線向吾人證明人類對較高與較低頻率比起中間範圍之頻率為較不敏感的,且響度感知變化隨著信號位準變化;一般而言,被感知之響度對頻率的變化針對固定信號位準隨著信號位準降低變得更顯著。所以,當寬帶增益被用以變更音頻信號之響度時,頻率間之相對響度改變,且此音質中之移位會被感知為不自然的或惱人的,尤其是在增益顯著地改變時為甚。
在國際專利申請案第WO 2006/047600號中,稍早被描述之感知響度模型被用以測量及修改音頻信號的響度。針對如AGC與DRC之應用,其動態地修改音頻之響度成為其被測量的響度之函數,前述的音質移位問題藉由在響度被改變時保留音頻之被感知的頻譜平衡而被解決。此藉由如第28式外顯地測量與修改被感知的頻譜或特定響度被完成。此外,該系統先天上為多頻帶且因而容易地被組配來對付與寬帶增益修改相關聯之頻譜交叉泵動的人工物。該系統可被組配以執行AGC與DRC以及如響度補償式音量控制、動態等化與雜訊補償之其他響度修改應用,其細節可在該國際專利申請案中被找到。
如在國際專利申請案第WO 2006/047600號中被揭露地,其中被描述之本發明的各種層面可有利地運用STDFT來測量與修改音頻信號之響度。該應用亦證明與此系統相關聯之感知響度測量亦可使用STMDCT被施作,現在其被證明同一STMDCT可被用以施用相關聯之響度修改。第28式顯示其中特定響度N [b ,t ]可由激發E [b ,t ]被計算之一方法。吾人可將此函數屬類地稱為Ψ{.},使得:N [b ,t ]=Ψ{E [b ,t ]} (33)
該特定響度N [b ,t ]作用成為第17圖中之響度值903且被饋入修改響度處理1704。根據對所欲之響度修改應用為合適的響度修改參數,所欲之目標特定響度被計算成為特定響度N [b ,t ]之函數F {.}:
接著,針對增益G [b ,t ]之系統解而言,其在被施用至目標特定響度時形成特定響度等於所欲之目標的結果。換言之,增益被發現滿足下列之關係:
數種技術在該專利申請案中針對求得這些增益被描述。最後,增益G [b ,t ]被用以修改STMDCT,使得由此被修改之STMDCT被測量的特定響度與所欲之目標間的差被減小。理想上,該差之絕對值被減小為0。此可藉由如下列般地計算被修改之STMDCT而被達成: 其中S b [k ]為與頻帶b 相關聯之合成濾波器響應且可被設定為等於第27式中之頭蓋骨底部薄膜濾波器C b [k ]。第36式可被解釋為將原始STMDCT乘以時間上變化之濾波器響應H [k ,t ],其中 其稍早被證明人工物在施用一般之濾波器H [k ,t ]至以與STDFT相反的之STMDCT時被引進。然而,若濾波器H [k ,t ]對頻率平滑地變化時,這些人工物在感知上變成可忽略的。在以合成濾波器S b [k ]被選用等於頭蓋骨底部薄膜濾波器C b [k ]且頻帶b 間之間隔够細下,此平滑性限制可被確保。回到參照第1圖,其顯示在採納40個頻帶之較佳實施例被使用的合成濾波器響應之描點圖,吾人注意到每一個濾波器之形狀對頻率平滑地變化且在相鄰濾波器間有高程度的相疊。結果為所有合成濾波器S b [k ]之線性和(即濾波器響應H [k ,t ])被限制以對頻率平滑地變化。此外,由最實務之響度修改應用被產生的增益G [b ,t ]不會由頻帶至頻帶地劇烈變化而提供H [k ,t ]之平滑性的甚至更強的保證。
第18a圖顯示對應其中目標特定響度係簡單地藉由將原始特定響度N [b ,t ]用0.33之常數因子比例調整而被計算的響度修改之濾波器響應H [k ,t ]。吾人注意到響應對頻率平滑地變化。第18b圖顯示對應於此濾波器之矩陣的灰階影像。注意,被顯示於影像右邊之灰階影像圖已被隨機化以強調矩陣中的元素間任何之小差異。該矩陣接近地近似沿著主對角線被複製的單一頻率響應之所欲的結構。
第19a圖顯示對應其中目標特定響度係藉由對原始特定響度N [b ,t ]施用多頻帶DRC而被計算的響度修改之濾波器響應H [k ,t ]。再次地說,響應對頻率平滑地變化。第19b圖顯示對應於此濾波器之矩陣而再次具有隨機化之灰階影像圖。該矩陣展現鋸齒對角線之稍微不完全的消除之所欲的例外之對角線結構。然而,此誤差不為可感知的。
施作
本發明可用硬體或軟體或二者之組合(如可程式邏輯陣列)被施作。除非特別指出,被納入成為部分之本發明的法則並非先天上與任何特定之電腦或其他裝置相關。特別是,各種通用目的之機器可用依照此處之教習被寫成的程式被使用,或構建更專用之裝置(如積體電路)以執行所須的方法步驟對其可能是更方便的。因而,本發明可在每一個包含至少一處理器、至少一資料儲存系統(包括依電性與非依電性及/或儲存元件)、至少一輸入裝置或埠、與至少一輸出裝置或埠之一個或多個可程式的電腦系統上執行之一個或多個電腦程式中被施作。程式碼被施用至輸入資料以執行此處被描述之功能及產生輸出資訊。該輸出資訊以習知的方式被施用至一個或多個裝置。
每一個此程式可用任何所欲之電腦語言(包括機器語言、組合語言、或高階之程序、邏輯或物件導向程式語言)被施作以與電腦系統溝通。在任何情形中,該語言可為被編譯或被解譯之語言。
每一個此電腦語言可被儲存或被下載至以通用或特殊目的之可程式的電腦可讀取之儲存媒體或裝置(如固態記憶體或媒體、或磁性或光學媒體),用於在該儲存媒體或裝置被電腦系統讀取時組配及操作系統以執行此處被描述之程序。該發明性之系統亦可被考慮被施作成為電腦可讀取之以電腦程式被組配的儲存媒體,此處如此被組配之儲存媒體造成電腦系統以特定及預先定義的方式作業而執行此處被描述之功能。
本發明之數個實施例已被描述。不過,其將被了解各種修改可不偏離本發明之精神與領域地被做成。例如,此處被描述之步驟為在順序上獨立的,因而可以與被描述者不同之順序被執行。
900...響度測量器
901...STMDCT信號
902...響度測量裝置或處理
903...響度值
1000...加權式功率測量
1001...音頻信號
1002...加權濾波器
1003...被濾波之信號
1004...功率
1005...功率
1006...平均
1007...響度值
1010...加權式功率測量
1012...傳輸濾波器
1013...被濾波之信號
1014...聽覺濾波器排組
1015...濾波器排組輸出
1016...激發
1017...激發信號
1018...特定響度
1019...特定響度
1020...加總
1200...修改型測量響度
1202...加權濾波器
1203...功率
1204...計算
1205...功率信號
1206...平均
1210...修改型信號響度
1212...修改式傳輸濾波器
1214...修改式聽覺濾波器
1300...響度測量方法
1301...音頻資料或資訊
1302...解碼
1303‧‧‧音頻信號
1304‧‧‧響度測量
1305‧‧‧輸出
1400‧‧‧解碼處理
1402‧‧‧解碼處理
1403‧‧‧指數資料
1404‧‧‧假數資料
1405‧‧‧裝置或處理
1406‧‧‧對數功率頻譜
1407‧‧‧位元分派資訊
1408‧‧‧裝置或處理
1409‧‧‧信號
1410‧‧‧裝置或處理
1412‧‧‧逆濾波器
1700‧‧‧修改裝置或處理
1704‧‧‧修改響度裝置或處理
1705‧‧‧響度修改參數
1706‧‧‧被修改之STMDCT信號
1707‧‧‧逆MDCT裝置或功能
1708‧‧‧時間域修改後之信號
第1圖顯示關鍵頻帶濾波器C b [k ]之響應的描點圖,其中40個頻率響應沿著等值長方形帶寬(ERB)尺度均勻地相隔。
第2a圖顯示使用各種T值之移動平均所計算的介於間以dB為單位之平均絕對誤差。
第2b圖顯示使用其中各種T值之一極平滑器所計算的介於間以dB為單位之平均絕對誤差。
第3a圖顯示一濾波器響應H [k ,t ]與一理想之磚牆低通濾波器。
第3b圖顯示理想之脈衝響應h IDFT [n ,t ]。
第4a圖為對應於第3a圖之濾波器響應H [k ,t ]的對應之灰階影像。在此處之此與其他灰階影像中,xy 軸分別代表矩陣之行與列,及其灰階強度代表矩陣在特定列/行位置依照顯示於影像右邊之尺度的值。
第4b圖為對應於第3a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第5a圖為對應於第3a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第5b圖為對應於第3a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第6a圖顯示作為一平滑後低通濾波器之濾波器響應H [k ,t ]。
第6b圖顯示時間緊緻後之脈衝響應h IDFT [n ,t ]。
第7a圖與第4a圖的比較係顯示對應於第6a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第7b圖與第4a圖的比較係顯示對應於第6a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第8a圖顯示對應於第6a圖之濾波器響應H [k ,t]的矩陣之灰階影像。
第8b圖顯示對應於第6a圖之濾波器響應H [k ,t ]的矩陣之灰階影像。
第9圖顯示依據本發明的基本層面之響度測量方法的方塊圖。
第10a圖為加權後功率之測量裝置或處理的示意性功能方塊圖。
第10b圖為一心理聲音式測量裝置或處理的示意性功能方塊圖。
第11圖顯示數個不同標準加權濾波器響應。
第12a圖為依據本發明之層面的加權後功率之測量裝置或處理的示意性功能方塊圖。
第12b圖為依據本發明之層面的心理聲音式測量裝置或處理的示意性功能方塊圖。
第13圖為一示意性功能方塊圖,顯示用於測量例如低位元率編碼音頻之在MDCT領域中被編碼的音頻之響度的本發明之一層面。
第14圖為一示意性功能方塊圖,顯示在第13圖之配置中為有用的解碼處理例子。
第15圖為一示意性功能方塊圖,顯示其中由低位元率音頻編碼器中之部份解碼所獲得的STMDCT係數在響度測量中被使用的本發明之一層面。
第16圖為一示意性功能方塊圖,顯示由低位元率音頻編碼器中之部份解碼所獲得的STMDCT係數在響度測量中被使用的例子。
第17圖為一示意性功能方塊圖,顯示其中該音頻之響度藉由變更其STMDCT呈現根據由同一呈現所獲得的響度之測量被修改的本發明之一層面。
第18a圖顯示對應於特定響度之固定尺度的濾波器響應H [k ,t ]。
第18b圖顯示對應於其中第18a圖所顯示之響應的濾波器之矩陣的灰階影像。
第19a圖顯示對應於被施用至特定響度之DRC的濾波器響應H [k ,t ]。
第19b圖顯示對應於其中第18a圖中被顯示之響應的濾波器之矩陣的灰階影像。
900...響度測量器
901...STMDCT信號
902...響度測量裝置或處理
903...響度值

Claims (7)

  1. 一種用於處理時間抽樣之真實信號的修改型離散餘弦轉換(MDCT)所呈現之一音頻信號的方法,其包含下列步驟:在該MDCT域中測量該MDCT轉換音頻信號的感知響度,其中該測量之步驟包括計算該MDCT轉換音頻信號之功率頻譜之估計值,其中計算該估計值運用加權來補償MDCT只呈現該轉換音頻信號的正交成分、以及平滑化時間常數使其與人類響度感知之整合時間相稱或更慢,以及在至少部分地響應該測量下在該MDCT域中修改該MDCT轉換音頻信號的感知響度,其中該修改包括增益修改該MDCT轉換音頻信號之頻帶,跨過被一平滑化功能限制之頻率的增益改變率限制混疊失真的程度。
  2. 如申請專利範圍第1項之方法,其中該增益修改該MDCT轉換音頻信號之頻帶之步驟在感知響度被修改時保留該音頻信號之感知頻譜平衡。
  3. 如申請專利範圍第1或2項中任一項之方法,其中該增益修改包含過濾該被轉換的音頻信號之一個或多個頻帶。
  4. 如申請專利範圍第3項之方法,其中由頻帶至頻帶之增益的變化以將關鍵頻帶濾波器的響應加以平滑的意義被平滑。
  5. 如申請專利範圍第1或2項中任一項之方法,其中該增益修改亦為一基準功率的函數。
  6. 一種包含有適應於執行第1或2項之任一項之方法之全部步驟之裝置的設備。
  7. 一種儲存於電腦可讀取式非暫時性媒體上用於造成一電腦執行第1或2項之任一項之方法之全部步驟的電腦程式。
TW096111833A 2006-04-04 2007-04-03 修改型離散餘弦轉換領域之音訊信號響度測量及修改技術 TWI417872B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US78952606P 2006-04-04 2006-04-04

Publications (2)

Publication Number Publication Date
TW200746050A TW200746050A (en) 2007-12-16
TWI417872B true TWI417872B (zh) 2013-12-01

Family

ID=38293415

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096111833A TWI417872B (zh) 2006-04-04 2007-04-03 修改型離散餘弦轉換領域之音訊信號響度測量及修改技術

Country Status (8)

Country Link
US (1) US8504181B2 (zh)
EP (1) EP2002426B1 (zh)
JP (1) JP5185254B2 (zh)
CN (1) CN101410892B (zh)
AT (1) ATE441920T1 (zh)
DE (1) DE602007002291D1 (zh)
TW (1) TWI417872B (zh)
WO (1) WO2007120452A1 (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2004248544B2 (en) 2003-05-28 2010-02-18 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
WO2007120452A1 (en) 2006-04-04 2007-10-25 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
ES2359799T3 (es) 2006-04-27 2011-05-27 Dolby Laboratories Licensing Corporation Control de ganancia de audio usando detección de eventos auditivos basada en la sonoridad específica.
CA2665153C (en) 2006-10-20 2015-05-19 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
ATE535906T1 (de) 2007-07-13 2011-12-15 Dolby Lab Licensing Corp Tonverarbeitung mittels auditorischer szenenanalyse und spektraler asymmetrie
TWI350653B (en) * 2007-10-19 2011-10-11 Realtek Semiconductor Corp Automatic gain control device and method
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
WO2009086174A1 (en) 2007-12-21 2009-07-09 Srs Labs, Inc. System for adjusting perceived loudness of audio signals
US9159325B2 (en) * 2007-12-31 2015-10-13 Adobe Systems Incorporated Pitch shifting frequencies
EP2347556B1 (en) 2008-09-19 2012-04-04 Dolby Laboratories Licensing Corporation Upstream signal processing for client devices in a small-cell wireless network
WO2010033384A1 (en) 2008-09-19 2010-03-25 Dolby Laboratories Licensing Corporation Upstream quality enhancement signal processing for resource constrained client devices
CN102265513B (zh) 2008-12-24 2014-12-31 杜比实验室特许公司 频域中的音频信号响度确定和修改
TWI503816B (zh) * 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US8731216B1 (en) * 2010-10-15 2014-05-20 AARIS Enterprises, Inc. Audio normalization for digital video broadcasts
CN103229235B (zh) * 2010-11-24 2015-12-09 Lg电子株式会社 语音信号编码方法和语音信号解码方法
JP5304860B2 (ja) * 2010-12-03 2013-10-02 ヤマハ株式会社 コンテンツ再生装置およびコンテンツ処理方法
US9620131B2 (en) 2011-04-08 2017-04-11 Evertz Microsystems Ltd. Systems and methods for adjusting audio levels in a plurality of audio signals
WO2012146757A1 (en) * 2011-04-28 2012-11-01 Dolby International Ab Efficient content classification and loudness estimation
JP5702666B2 (ja) * 2011-05-16 2015-04-15 富士通テン株式会社 音響装置および音量補正方法
US9312829B2 (en) * 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US9401152B2 (en) * 2012-05-18 2016-07-26 Dolby Laboratories Licensing Corporation System for maintaining reversible dynamic range control information associated with parametric audio coders
EP2787746A1 (en) * 2013-04-05 2014-10-08 Koninklijke Philips N.V. Apparatus and method for improving the audibility of specific sounds to a user
CN105556600B (zh) 2013-08-23 2019-11-26 弗劳恩霍夫应用研究促进协会 用于混迭误差信号来处理音频信号的装置及方法
CN104681034A (zh) * 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US9503803B2 (en) 2014-03-26 2016-11-22 Bose Corporation Collaboratively processing audio between headset and source to mask distracting noise
US9661435B2 (en) * 2014-08-29 2017-05-23 MUSIC Group IP Ltd. Loudness meter and loudness metering method
EP4372746A2 (en) * 2014-10-10 2024-05-22 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
US9647624B2 (en) * 2014-12-31 2017-05-09 Stmicroelectronics Asia Pacific Pte Ltd. Adaptive loudness levelling method for digital audio signals in frequency domain
EP3089364B1 (en) 2015-05-01 2019-01-16 Nxp B.V. A gain function controller
EP3171614B1 (en) 2015-11-23 2020-11-04 Goodix Technology (HK) Company Limited A controller for an audio system
US10375131B2 (en) 2017-05-19 2019-08-06 Cisco Technology, Inc. Selectively transforming audio streams based on audio energy estimate
US11468144B2 (en) * 2017-06-15 2022-10-11 Regents Of The University Of Minnesota Digital signal processing using sliding windowed infinite fourier transform
WO2020167966A1 (en) 2019-02-13 2020-08-20 Dolby Laboratories Licensing Corporation Adaptive loudness normalization for audio object clustering
EP3840222A1 (en) * 2019-12-18 2021-06-23 Mimi Hearing Technologies GmbH Method to process an audio signal with a dynamic compressive system
CN113192528B (zh) * 2021-04-28 2023-05-26 云知声智能科技股份有限公司 单通道增强语音的处理方法、装置及可读存储介质
CN113178204B (zh) * 2021-04-28 2023-05-30 云知声智能科技股份有限公司 一种单通道降噪的低功耗方法、装置及存储介质
CN113449255B (zh) * 2021-06-15 2022-11-11 电子科技大学 一种改进的稀疏约束下环境分量相位角估计方法、设备及存储介质
CN114302301B (zh) * 2021-12-10 2023-08-04 腾讯科技(深圳)有限公司 频响校正方法及相关产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010027393A1 (en) * 1999-12-08 2001-10-04 Touimi Abdellatif Benjelloun Method of and apparatus for processing at least one coded binary audio flux organized into frames
WO2004111994A2 (en) * 2003-05-28 2004-12-23 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal

Family Cites Families (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) * 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) * 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
DE3314570A1 (de) * 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4739514A (en) * 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US4953112A (en) 1988-05-10 1990-08-28 Minnesota Mining And Manufacturing Company Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model
US5027410A (en) * 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JPH02118322U (zh) 1989-03-08 1990-09-21
US5097510A (en) * 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) * 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5081687A (en) 1990-11-30 1992-01-14 Photon Dynamics, Inc. Method and apparatus for testing LCD panel array prior to shorting bar removal
AU653582B2 (en) 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
DE69214882T2 (de) 1991-06-06 1997-03-20 Matsushita Electric Ind Co Ltd Gerät zur Unterscheidung von Musik und Sprache
US5278912A (en) * 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
US5363147A (en) * 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
GB2272615A (en) 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
US5548638A (en) 1992-12-21 1996-08-20 Iwatsu Electric Co., Ltd. Audio teleconferencing apparatus
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) * 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) * 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) * 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (zh) * 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) * 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5530760A (en) * 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
US5500902A (en) 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) * 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5548538A (en) * 1994-12-07 1996-08-20 Wiltron Company Internal automatic calibrator for vector network analyzers
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) * 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
ATE229729T1 (de) 1995-03-13 2002-12-15 Phonak Ag Verfahren zur anpassung eines hörgerätes, vorrichtung hierzu und hörgerät
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US6301555B2 (en) * 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
US6041295A (en) * 1995-04-10 2000-03-21 Corporate Computer Systems Comparing CODEC input/output to adjust psycho-acoustic parameters
US5601617A (en) 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) * 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) * 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5907622A (en) * 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US5872852A (en) * 1995-09-21 1999-02-16 Dougherty; A. Michael Noise estimating system for use with audio reproduction equipment
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6108431A (en) * 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6430533B1 (en) * 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09312540A (ja) * 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) * 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
EP0820212B1 (de) * 1996-07-19 2010-04-21 Bernafon AG Lautheitsgesteuerte Verarbeitung akustischer Signale
US5999012A (en) 1996-08-15 1999-12-07 Listwan; Andrew Method and apparatus for testing an electrically conductive substrate
JP2953397B2 (ja) * 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
US6570991B1 (en) * 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
JP3328532B2 (ja) * 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
US5862228A (en) * 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6125343A (en) * 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) * 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) * 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) * 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) * 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
JP3765171B2 (ja) * 1997-10-07 2006-04-12 ヤマハ株式会社 音声符号化復号方式
KR100281058B1 (ko) 1997-11-05 2001-02-01 구본준, 론 위라하디락사 액정표시장치
US6233554B1 (en) * 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) * 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) * 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) * 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
JP2002518912A (ja) * 1998-06-08 2002-06-25 コックレア リミティド 聴覚装置
EP0980064A1 (de) * 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) * 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) * 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) * 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) * 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) * 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
EP1089242B1 (en) * 1999-04-09 2006-11-08 Texas Instruments Incorporated Supply of digital audio and video products
CA2372017A1 (en) * 1999-04-26 2000-11-02 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
JP2000347697A (ja) * 1999-06-02 2000-12-15 Nippon Columbia Co Ltd 音声記録再生装置および記録媒体
US6263371B1 (en) * 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
US6442278B1 (en) * 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
US6985594B1 (en) * 1999-06-15 2006-01-10 Hearing Enhancement Co., Llc. Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment
US20020172376A1 (en) * 1999-11-29 2002-11-21 Bizjak Karl M. Output processing system and method
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) * 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) * 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
JP3630082B2 (ja) * 2000-07-06 2005-03-16 日本ビクター株式会社 オーディオ信号符号化方法及びその装置
AUPQ952700A0 (en) * 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) * 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) * 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
DE60029453T2 (de) * 2000-11-09 2007-04-12 Koninklijke Kpn N.V. Messen der Übertragungsqualität einer Telefonverbindung in einem Fernmeldenetz
US7457422B2 (en) * 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
DE10107385A1 (de) * 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) * 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
DE50102419D1 (de) * 2001-04-10 2004-07-01 Phonak Ag Verfahren zur anpassung eines hörgerätes an ein individuum
US7283954B2 (en) * 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7181034B2 (en) 2001-04-18 2007-02-20 Gennum Corporation Inter-channel communication in a multi-channel digital hearing instrument
AUPR604201A0 (en) * 2001-06-29 2001-07-26 Hearworks Pty Ltd Telephony interface apparatus
US7177803B2 (en) * 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
US20040037421A1 (en) * 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) * 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
JP3784734B2 (ja) 2002-03-07 2006-06-14 松下電器産業株式会社 音響処理装置、音響処理方法およびプログラム
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
EP1543307B1 (en) * 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
JP2004233570A (ja) * 2003-01-29 2004-08-19 Sharp Corp デジタルデータの符号化装置
DE10308483A1 (de) * 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
JP2004361573A (ja) * 2003-06-03 2004-12-24 Mitsubishi Electric Corp 音響信号処理装置
JP4583781B2 (ja) 2003-06-12 2010-11-17 アルパイン株式会社 音声補正装置
US7912226B1 (en) * 2003-09-12 2011-03-22 The Directv Group, Inc. Automatic measurement of audio presence and level by direct processing of an MPEG data stream
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
AU2005299410B2 (en) * 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8265295B2 (en) * 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
WO2007120452A1 (en) 2006-04-04 2007-10-25 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
CN101421781A (zh) 2006-04-04 2009-04-29 杜比实验室特许公司 音频信号的感知响度和/或感知频谱平衡的计算和调整
ES2359799T3 (es) 2006-04-27 2011-05-27 Dolby Laboratories Licensing Corporation Control de ganancia de audio usando detección de eventos auditivos basada en la sonoridad específica.
KR101106031B1 (ko) 2007-01-03 2012-01-17 돌비 레버러토리즈 라이쎈싱 코오포레이션 하이브리드 디지털/아날로그 음향 세기―보상 볼륨 제어 장치 및 그 제어 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010027393A1 (en) * 1999-12-08 2001-10-04 Touimi Abdellatif Benjelloun Method of and apparatus for processing at least one coded binary audio flux organized into frames
WO2004111994A2 (en) * 2003-05-28 2004-12-23 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal

Also Published As

Publication number Publication date
EP2002426A1 (en) 2008-12-17
JP5185254B2 (ja) 2013-04-17
ATE441920T1 (de) 2009-09-15
JP2009532738A (ja) 2009-09-10
US20090304190A1 (en) 2009-12-10
WO2007120452A1 (en) 2007-10-25
EP2002426B1 (en) 2009-09-02
CN101410892B (zh) 2012-08-08
TW200746050A (en) 2007-12-16
US8504181B2 (en) 2013-08-06
CN101410892A (zh) 2009-04-15
DE602007002291D1 (de) 2009-10-15

Similar Documents

Publication Publication Date Title
TWI417872B (zh) 修改型離散餘弦轉換領域之音訊信號響度測量及修改技術
US10643626B2 (en) Methods for parametric multi-channel encoding
KR101265669B1 (ko) 코딩된 오디오의 경제적인 소리세기 측정
TWI317933B (en) Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
US8050933B2 (en) Audio coding system using temporal shape of a decoded signal to adapt synthesized spectral components
EP2614586B1 (en) Dynamic compensation of audio signals for improved perceived spectral imbalances
RU2600527C1 (ru) Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
KR100978018B1 (ko) 공간 오디오의 파라메터적 표현
CA2555182C (en) Synthesizing a mono audio signal based on an encoded multichannel audio signal
TWI324335B (en) Methods of signal processing and apparatus for wideband speech coding
JP5270006B2 (ja) 周波数領域におけるオーディオ信号ラウドネス決定と修正
US11935549B2 (en) Apparatus and method for encoding an audio signal using an output interface for outputting a parameter calculated from a compensation value
CA2489443C (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
TWI536369B (zh) 用以基於線性預測編碼之於頻域中編碼的低頻率增強技術
JP7073491B2 (ja) スケールパラメータのダウンサンプリングまたは補間を使用してオーディオ信号をエンコードおよびデコードするための装置および方法
US20090180531A1 (en) codec with plc capabilities
KR20180002907A (ko) 오디오 신호 디코더에서의 개선된 주파수 대역 확장
JP5491193B2 (ja) 音声コード化の方法および装置
RU2801156C2 (ru) Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
Chen et al. Fast time-frequency transform algorithms and their applications to real-time software implementation of AC-3 audio codec
JPH1078797A (ja) 音響信号処理方法

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees