TWI556654B - 用以推衍方向性資訊之裝置與方法和系統 - Google Patents

用以推衍方向性資訊之裝置與方法和系統 Download PDF

Info

Publication number
TWI556654B
TWI556654B TW100137945A TW100137945A TWI556654B TW I556654 B TWI556654 B TW I556654B TW 100137945 A TW100137945 A TW 100137945A TW 100137945 A TW100137945 A TW 100137945A TW I556654 B TWI556654 B TW I556654B
Authority
TW
Taiwan
Prior art keywords
microphone
effective
microphone signal
viewing
signal
Prior art date
Application number
TW100137945A
Other languages
English (en)
Other versions
TW201230822A (en
Inventor
法比恩 庫奇
紀凡尼 戴加多
奧利薇 錫蓋特
維爾 普爾奇
朱卡 阿河南
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW201230822A publication Critical patent/TW201230822A/zh
Application granted granted Critical
Publication of TWI556654B publication Critical patent/TWI556654B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/05Application of the precedence or Haas effect, i.e. the effect of first wavefront, in order to improve sound-source localisation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

用以推衍方向性資訊之裝置與方法和系統 1.發明領域
本發明之實施例係有關於用以從多個麥克風信號或從麥克風信號的多個成分推衍方向性資訊之裝置。額外實施例係有關於包含此種裝置之系統。又更實施例係有關於用以從多個麥克風信號推衍方向性資訊之方法。
2.發明背景
空間聲音記錄的目標係針對以多個麥克風捕集聲場,使得在重製端,聆聽者知覺該聲像彷彿係出席在該記錄位置般。空間聲音記錄的標準辦法係使用習知立體聲麥克風或更複雜的方向性麥克風的組合,例如用在雙聲的B格式麥克風(M.A. Gerzon,周圍聲學,寬-高聲音重製,J. Audio Eng. Soc.,21(1):2-10,1973)。常見將此等方法大半稱作為疊合麥克風技術。
另外,可應用基於聲場之參數表示型態之方法,該等方法係稱作為參數空間音訊編碼器。此等方法決定一或多個降混音訊信號連同相對應空間端資訊,該等資訊係與空間聲音的知覺有關。實例為方向性音訊編碼(DirAC),如討論於V. Pulkki,使用方向性音訊編碼之空間聲音重製,J. Audio Eng. Soc.,55(6):503-516,2007年6月;或所論的空間音訊麥克風(SAM)辦法提示於C. Faller,用於空間音訊編碼器之麥克風前端。於第125屆AES會議專論7508,舊金山2008年10月。空間線索資訊係於頻率子帶決定,且基本上係由聲音的到達方向(DOA),及偶爾由聲場的漫射性或其它統計測量值組成。於合成階段,期望用於重製的揚聲器信號係基於降混信號及參數端資訊決定。
除了空間音訊記錄之外,聲場表示型態之參數辦法曾經用在下列用途,諸如方向性濾波(M. Kallinger,H. Ochsenfeld,G. Del Galdo,F. Kuech,D. Mahne,R. Schultz-Amling,及O. Thiergart,用於方向性音訊編碼之空間濾波瓣法,於第126屆AES會議,專論7653,德國墨尼黑2009年5月)或來源定位(O. Thiergart,R. Schultz-Amling,G. Del Galdo,D. Mahne,及F. Kuech,於混響環境中基於方向性音訊編碼參數之音源定位,於第128屆AES會議,專論7853,美國紐約州紐約市2009年10月)。此等技術也係基於方向性參數,諸如聲音之到達方向(DOA)或聲場漫射性。
一種估算來自聲場的方向性資訊亦即聲音的到達方向的辦法係使用麥克風陣列測量聲場的不同點。參考文獻曾經提示數種辦法,J. Chen,J. Benesty,及Y. Huang,於室內聲音環境中的時間延遲估計:綜論,於EURASIP應用信號處理期刊,文章ID 26503,2006使用麥克風信號間的相對時間延遲估值。但此等辦法使用麥克風信號的相位資訊,結果無可避免地導致空間頻疊。實際上,當分析較高頻時,波長變較短。於某個頻率,稱作為混疊頻率,波長係使得相同相位讀數相對應於二或多個方向,因此不可能產生不含混的估計(至少沒有額外先前資訊時如此)。
有大量多種方法來使用麥克風陣列估計聲音的到達方向(DOA)。常用辦法之綜論係摘述於J. Chen、J. Benesty及Y. Huang,於室內聲音環境中的時間延遲估計:綜論,於EURASIP應用信號處理期刊,文章ID 26503,2006。此等辦法的共通點在於其探勘麥克風信號的相位關係來估計聲音的到達方向。經常首先決定不同感測器間的時間差,及然後用探索陣列幾何形狀知識來計算相對應的到達方向。其它辦法評估在頻率子帶中不同麥克風信號間的相關性來估計聲音的到達方向(C. Faller,用於空間音訊編碼器之麥克風前端。於第125屆AES會議專論7508,舊金山2008年10月;及J. Chen、J. Benesty及Y. Huang,於室內聲音環境中的時間延遲估計:綜論,於EURASIP應用信號處理期刊,文章ID 26503,2006)。
於方向性音訊編碼(DirAC)中,基於在觀察得之聲場裡測得的作用聲音強度向量而決定各個頻帶之DOA估值。後文中,簡短摘述於方向性音訊編碼(DirAC)的方向性參數之估計。許P(k,n)表示於頻率指數k及時間指數n的聲壓及U(k,n)表示粒子速度向量。然後,作用聲音強度向量獲得為
上標*表示軛合複數及Re{}表示複合數的實數部分。ρ0表示平均空氣密度。最後,Ia(k,n)之反向係指向聲音的到達方向:
此外,聲場的漫射性例如可依據下式決定
實際上,粒子速度向量係從密閉空間全向性麥克風艙,俗稱差示麥克風陣列的壓力梯度計算。考慮第2圖,粒子速度向量之x成分例如可使用一對麥克風依據下式計算
U x (k,n)=K(k)[P 1(k,n)-P 2(k,n)], (4)
此處K(k)表示頻率相依性標準化因數。其數值係取決於麥克風組態,例如麥克風距離及/或其方向型樣。U(kn)的其餘成分Uy(k,n)(及Uz(k,n))可藉組合適當成對麥克風而以類似方式決定。
如M. Kallinger,F. Kuech,R. Schultz-Amling,G. De. Galdo,J. Ahonen,及V. Pjulkki,平面麥克風陣列用在方向性音訊編碼應用之分析與調整,於第124屆AES會議,專論7374,荷蘭阿姆斯特丹2008年5月所示,空間頻疊影響粒子速度向量的相位資訊,阻止在高頻使用壓力梯度用於作用聲音強度估計。此種空間頻疊導致DOA估值的含混。如所示,於該處基於作用聲音強度可獲得不含混的DOA估值的最大頻率fmax係藉麥克風成對距離決定。此外,也影響方向性參數諸如聲場漫射性的估計。於具有距離d之全向麥克風之情況下,此種最大頻率係藉下式給定
於該處c表示聲音傳播速度。
典型地,探索聲場的方向性資訊之應用用途要求的頻率範圍係大於針對實際麥克風組態所預期的空間頻疊極限fmax。注意縮小麥克風間隔d,增加空間頻疊極限fmax,並非大部分用途的可行之道,原因在於實際上於低頻,太小的d顯著地減低估計可信度。如此,需要有新穎方法來克服目前方向性參數估計技術於高頻的限制。
3.發明概要
本發明之實施例的一個目的係產生一項構思允許更佳地決定高於空間頻疊極限頻率的方向性資訊。
此項目的係藉如申請專利範圍第1項之裝置、如申請專利範圍第15及16項之系統、如申請專利範圍第18項之方法及如申請專利範圍第19項之電腦程式而予解決。
實施例提出一種用以從多個麥克風信號或從麥克風信號的多個成分推衍方向性資訊之裝置,其中不同的有效麥克風觀看方向係與該等麥克風信號或成分聯結,該裝置包含組合器係經組配來從麥克風信號或該麥克風信號之成分獲得幅值。該組合器又更係經組配來組合(例如線性地組合)描述該等有效麥克風觀看方向的方向資訊項,使得描述給定的有效麥克風觀看方向之方向資訊項係依據該麥克風信號或該麥克風信號之該成分的該幅值,聯結該給定的有效麥克風觀看方向加權而推衍該方向性資訊。
業已發現麥克風信號內部相位資訊的含混導致方向性參數估計的空間頻疊問題。本發明之實施例的構思係藉基於麥克風信號之幅值推衍方向性資訊而克服此項問題。業已發現藉由基於麥克風信號或麥克風信號之成分的幅值來推衍該方向性資訊,不會出現如同使用相位資訊來決定方向性資訊的傳統系統所發生的含混問題。因此,即便高於空間頻疊極限,實施例允許決定方向性資訊,高於該極限時使用相位資訊不可能(或只有伴以錯誤)決定方向性資訊。
換言之,使用麥克風信號或麥克風信號之成分的幅值在預期空間頻疊或其它相位失真的該等頻率區域內部特別有利,原因在於此等相位失真對幅值不具影響,因此不會導致方向性資訊決定上的混淆。
依據若干實施例,聯結麥克風信號的有效麥克風觀看方向描述方向,其中推衍麥克風信號的麥克風具有其最大響應(或其最高敏感度)。舉個實例,麥克風可以是具有非各向同性拾波型樣的方向性麥克風,及有效麥克風觀看方向可定義為於該處麥克風的拾波型樣具有其最大值的方向。如此,用於方向性麥克風,有效麥克風觀看方向可等於麥克風觀看方向(描述方向性麥克風具有其最大敏感度的方向),例如當無任何修改方向性麥克風的拾波型樣之物件係放置接近該麥克風時。若該方向性麥克風係放置靠近具有修改方向性麥克風的拾波型樣效應之物件,則有效麥克風觀看方向可與方向性麥克風的麥克風觀看方向不同。於此種情況下,有效麥克風觀看方向可描述於該處方向性麥克風具有其最大響應的方向。
於全向麥克風之情況下,全向麥克風的有效響應型樣例如可使用成蔭物件(具有修改麥克風的拾波型樣效應的影響)整形,使得該整形有效響應型樣具有有效麥克風觀看方向,該方向為具有該整形有效響應型樣之全向麥克風的最大響應方向。
依據額外實施例,方向性資訊可以是指向聲場傳播(例如以某個頻率及時間指數)方向的聲場之方向性資訊。多個麥克風信號可描述聲場。依據若干實施例,描述給定的有效麥克風觀看方向之方向資訊項可以是指向該給定的有效麥克風觀看方向之向量。依據額外實施例,方向資訊項可以是單位向量,使得聯結不同的有效麥克風觀看方向之方向資訊項具有相等常模(但不同方向)。因此,藉該組合器所線性組合的加權向量之常模係由該麥克風信號或麥克風信號之成分的幅值聯結該加權向量之方向資訊項決定。
依據額外實施例,組合器可經組配來獲得幅值,使得該幅值描述表示該麥克風信號或麥克風信號之成分之頻譜子區域的頻譜係數(作為麥克風信號之成分)之幅值。換言之,實施例可從用以推衍該等麥克風信號的麥克風頻譜幅值中提取出聲場之實際資訊(例如於時頻域分析)。
依據其它實施例,只有麥克風信號(或麥克風頻譜)之幅值(或幅度資訊)係用於推衍該方向性資訊的估算處理,原因在於相位項係被空間頻疊效應所訛誤。
換言之,實施例形成只使用麥克風信號或麥克風信號之成分的幅值資訊及頻譜分別地用於方向性參數估計之裝置及方法。
依據其它實施例,基於幅值的方向性參數估計(方向性資訊)輸出可組合其它也考慮相位資訊之技術。
依據額外實施例,幅值可描述麥克風信號或麥克風信號之成分的幅值。
4.圖式簡單說明
將於後文運用附圖描述本發明之實施例,附圖中:第1圖顯示依據本發明之一實施例一種裝置之方塊示意圖;第2圖顯示使用四個全向艙之麥克風組態之說明例;提供聲壓信號Pi(k,n),i=1、...、4;第3圖顯示使用具有類心形拾波型樣的四個方向性麥克風之麥克風組態之說明例;第4圖顯示麥克風組態之說明例,採用剛性圓柱體來造成散射及成蔭效應;第5圖顯示類似第4圖之麥克風組態之說明例,但採用不同的麥克風配置;第6圖顯示麥克風組態之說明例,採用剛性半球體來造成散射及成蔭效應;第7圖顯示3D麥克風組態之說明例,採用剛性球體來造成成蔭效應;第8圖顯示依據一實施例一種方法之流程圖;第9圖顯示依據一實施例一種系統之方塊示意圖;第10圖顯示依據本發明之又一實施例一種系統之方塊示意圖;第11圖顯示四個全向麥克風陣列之說明例,相對麥克風間具有間隔d;第12圖顯示四個全向麥克風陣列之說明例,麥克風係安裝在圓柱體末端上;第13圖顯示方向性指數DI(以分貝表示)呈ka之函數之略圖,表示全向麥克風之隔膜周長除以波長;第14圖顯示使用G.R.A.S.麥克風之對數方向性型樣;第15圖顯示使用AKG麥克風之對數方向性型樣;及第16圖顯示以均方根誤差(RMSE)表示之方向分析結果之略圖。
在使用附圖圖式以進一步細邊描述本發明之實施例前,須指示相同的或功能上相等的元件被提供以相同的元件符號,而刪除有相同元件符號之該等元件之重複說明。如此,針對有相同元件符號之該等元件所提供之描述可以彼此交換。
5.較佳實施例之詳細說明 5.1 依據第1圖之裝置
第1圖顯示依據本發明之一實施例之裝置100。用以從多個麥克風信號1031至103N(也標示為P1至PN)或從麥克風信號的多個成分推衍方向性資訊101(也標示為d(k,n))之裝置1001包含組合器105。組合器105係經組配來從麥克風信號或該麥克風信號之成分獲得幅值,及線性地組合描述聯結該等麥克風信號1031至103N或成分的該等有效麥克風觀看方向的方向資訊項,使得描述給定的有效麥克風觀看方向之方向資訊項係依據該麥克風信號或該麥克風信號之該成分的該幅值,聯結該給定的有效麥克風觀看方向加權而推衍該方向性資訊101。
第i個麥克風信號Pi之成分可標示為Pi(k,n)。麥克風信號Pi之成分Pi(k,n)可以是麥克風信號Pi在頻率指數k及時間指數n之值。麥克風信號Pi可從第i個麥克風推衍出,且可以包含針對不同頻率指數k及時間指數n的多個成分Pi(k,n)之時頻表示型態為組合器105所可利用。舉個實例,麥克風信號P1至PN可以是聲壓信號,原因在於其可從B-格式麥克風推衍出。
因此,各個成分Pi(k,n)可相對應於一個時頻拼貼塊(k,n)。組合器105可經組配來獲得該幅值,使得該幅值描述表示麥克風信號Pi之頻譜子區域的頻譜係數之幅值。此種頻譜係數可以是麥克風信號Pi之成分Pi(k,n)。頻譜子區域事由成分Pi(k,n)的頻率指數k定義。又復,組合器105可經組配來基於麥克風信號之時頻表示型態而推衍方向性資訊101,舉例言之,其中麥克風信號Pi係藉多個成分Pi(k,n)表示,各個成分係聯結一個時頻拼貼塊(k,n)。
如於本案引言部分描述,藉由基於麥克風信號P1至PN或麥克風信號之成分的幅值獲得方向性資訊d(k,n),可達成方向性資訊d(k,n)的決定,即便針對麥克風信號P1至PN有較高頻率亦如此,例如針對具有頻率指數高於空間混疊頻率fmax的頻率指數的成分Pi(k,n)至PN(k,n)亦復如此,原因在於不會發生空間頻疊或其它相位失真故。
後文中將給定本發明之實施例之細節實例,該實例係基於麥克風信號幅值的組合(方向性幅值組合),及如何可藉依據第1圖之裝置100執行。方向性資訊d(k,n)也標示為DOA估值,係藉將各個麥克風信號(或麥克風信號之成分)的幅值解譯為在二維(2D)或三維(3D)空間的相對應向量。
設dt(k,n)為真的或期望的向量,指向從其中聲場係分別地於頻率及時間指數k及n傳播的方向。換言之,聲音之DOA係相對應於dt(k,n)方向。估計dt(k,n)使得從其中可提取得自聲場的方向性資訊為本發明之實施例的目標。進一步假設b1、b2、...、bN為指向N個方向性麥克風的觀看方向之向量(例如單位常模向量)。方向性麥克風的觀看方向係定義為於該處拾波型樣具有其最大值的方向。同理,於散射/成蔭物件含括於麥克風組態之情況下,向量b1、b2、...、bN指向相對應麥克風的最大響應方向。
向量b1、b2、...、bN可標示為描述第一至第N個麥克風之有效麥克風觀看方向的方向資訊項。於本實例中,方向資訊項為指向相對應的有效麥克風觀看方向之向量。依據額外實施例,方向資訊項可以定標,例如描述相對應麥克風之觀看方向的角度。
此外,於本實例中,方向資訊項可以是單位常模向量,使得聯結不同的有效麥克風觀看方向之向量具有相等常模。
也須注意若相對應於麥克風的有效麥克風觀看方向向量bi之和係等於零(例如在公差範圍以內),則所提示之方法可發揮最佳效果,亦即
於若干實施例中,公差範圍可以是用來導出(具最大常模之方向資訊項、具最小常模之方向資訊項、或具有常模最接近用來導出該和數的該等方向項之全部常模的均值的方向資訊項之)該和數的方向資訊項中之一者的±30%、±20%、±10%、±5%。
於若干實施例中,就座標系而言,有效麥克風觀看方向可能非均等分布。舉例言之,假設一個系統其中第一麥克風之第一有效麥克風觀看方向為東(例如二維座標系之零度),第二麥克風之第二有效麥克風觀看方向為東北(例如二維座標系之45度),第三麥克風之第三有效麥克風觀看方向為北(例如二維座標系之90度),及第四麥克風之第四有效麥克風觀看方向為西南(例如二維座標系之-135度),具有方向資訊項乃單位常模向量將導致:b1=[1 0]T針對該第一有效麥克風觀看方向;b2=[1/ 1/]T針對該第二有效麥克風觀看方向;b3=[0 1]T針對該第三有效麥克風觀看方向;及b4=[-1/-1/]T針對該第四有效麥克風觀看方向。
如此將導致下示向量之非零和:
bsum=b1+b2+b3+b4=[1 1]T.
由於於若干實施例中,期望具有向量和為零,作為指向有效麥克風觀看方向之向量的方向資訊項可經定標。於本實例中,方向資訊項b4可經定標,諸如:
b4=[-(1+1/)-(1+1/]T
結果導致向量和bsum係等於零:
bsum=b1+b2+b3+b4=[0 0]T.
換言之,依據若干實施例,作為指向不同有效麥克風觀看方向之向量的不同方向資訊項可具有不同常模,可經選擇使得方向資訊項之和係等於零。
真正向量方向性資訊dt(k,n)的估值d及因而欲決定的方向性資訊可定義為
於該處Pi(k,n)表示聯結頻率拼貼塊(k,n)的第i個麥克風信號(或第i個麥克風之麥克風信號Pi的成分之信號)。
方程式(7)形成第一麥克風至第N麥克風之方向資訊項b1至bN的線性組合,該方向資訊項係藉從第一至第N麥克風推衍的麥克風信號P1至PN之成分P1(k,n)至PN(k,n)的幅值加權。因此,組合器105可計算方程式(7)來推衍方向性資訊101(d(k,n))。
如從方程式(7)可知,組合器105可經組配來線性組合取決於聯結給定時頻拼貼塊(k,n)之幅值而加權的方向資訊項b1至bN來針對該時頻拼貼塊(k,n)而推衍方向性資訊d(k,n)。
依據其它實施例,組合器105可經組配來線性組合只取決於聯結給定時頻拼貼塊(k,n)之幅值而加權的方向資訊項b1至bN
又復,從方程式(7)可知,組合器105可經組配來針對多個不同時頻拼貼塊,線性組合描述不同的有效麥克風觀看方向之相同方向資訊項b1至bN(因此等與時頻拼貼塊獨立無關),但該等方向資訊項可取決於聯結不同的時頻拼貼塊之幅值而差異地加權。
因方向資訊項b1至bN可以是單位向量,故藉方向資訊項bi與幅值乘法所形成的加權向量之常模可以是該幅值。針對相同有效麥克風觀看方向但不同的時頻拼貼塊之加權向量,由於針對不同的時頻拼貼塊之不同幅值,故可具有相同方向但但不同常模。
依據若干實施例,加權值可以是標度值。
方程式(7)所示因數κ可自由選擇。於κ=2及相對麥克風(從其中導出麥克風信號P1至PN)為等距之情況下,方向性資訊d(k,n)係與在陣列中心(例如在二麥克風集合中)的能梯度成正比。
換言之,組合器105可經組配來基於該幅值獲得一平方幅值,該平方幅值描述麥克風信號Pi之該成分Pi(k,n)之一功率。此外,該組合器105係經組配來組合該等方向資訊項b1至bN,使得一方向資訊項bi係依據麥克風信號Pi之該成分Pi(k,n)的該平方幅值聯結相對應的觀看方向(第i個麥克風)加權。
從d(k,n),考慮下列容易獲得以方位角φ及仰角υ表示的方向性資訊
於若干應用中,當只需2D分析時,可採用例如排列如第3圖的四個方向性麥克風。於此種情況下,方向資訊項可選擇為
b 1 =[1 0 0]T (9)
b 2 =[-1 0 0]T (10)
b 3 =[0 1 0]T (11)
b 4 =[0 -1 0]T (12)
故(7)變成
dx=|P1(k,n)| k -|P 2(k,n)| k  (13)
d y =|P 3(k,n)| k -|P 4(k,n)| k  (14)
此一辦法可類似地應用在剛性物件置於麥克風組態的情況。舉個實例,第4及5圖例示說明圓柱形物件置於四個麥克風陣列中央的情況。另一個實例顯示於第6圖,於該處散射物件具有半球體形狀。
3D組態的一個實例係顯示於第7圖,於該處六具麥克風係分布在剛性球體上方。於此種情況下,向量d(k,n)的z成分可以類似(9)至(14)之方式獲得:
b 5=[0 0 1]T (15)
b 6=[0 0 -1]T (16)
獲得
d z =|P 5(k,n)| k -|P 6(k,n)| k . (17)
眾所周知適合應用於本發明之實施例的方向性麥克風3D組態乃所謂A-格式麥克風,描述於P.G. Craven及M.A. Gerzon,US4042779(A),1977。
為了遵照所提示的方向性幅值組合辦法,需滿足某些假設。若採用方向性麥克風,則針對各個麥克風,拾波型樣相對於麥克風的方向性或觀看方向須為約略對稱。若使用散射/成蔭辦法,則散射/成蔭效應相對於最大響應方向須為約略對稱。當陣列係如第3至7圖所示實例而組成時容易符合此等假設。
應用於DirAC
前文討論只考慮方向性資訊(DOA)的估計。於方向性編碼脈絡中,可能額外要求有關聲場漫射性之資訊。經由單純讓估計得之向量d(k,n)或測定的方向性資訊等於作用聲音強度向量Ia(k,n)之反向,獲得直捷辦法:
I a(k,n)=- d (k,n). (18)
此點為可能原因在於d(k,n)含有有關能量梯度之資訊。然後漫射性可依據(3)求出。
5.2. 依據第8圖之方法
又復本發明之實施例產生一種從多個麥克風信號或從一麥克風信號的多個成分推衍一方向性資訊之方法,其中不同的有效麥克風觀看方向係與該等麥克風信號或成分聯結。
此種方法800係顯示於第8圖之流程圖。方法800包含從麥克風信號或麥克風信號之成分獲得幅值之步驟801。
此外,方法800包含下述步驟803,組合(例如線性地組合)描述該等有效麥克風觀看方向的方向資訊項,使得描述一給定的有效麥克風觀看方向之一方向資訊項係依據該麥克風信號或該麥克風信號之該成分的該幅值,聯結該給定的有效麥克風觀看方向加權而推衍該方向性資訊。
方法800可藉裝置100進行(例如藉裝置100之組合器105)。
後文中,將使用第9及10圖,可描述用以獲得麥克風信號及從此等麥克風信號推衍方向性資訊之依據實施例的兩個系統。
5.3 依據第9圖及第10圖之系統
如一般已知,當運用全向麥克風時使用聲壓幅值來提取方向性資訊不合實際。實際上,由於聲音行進到達麥克風距離的不同所導致的幅度差異通常太小而無法量測,因此大部分已知之演算法主要係仰賴相位資訊。實施例克服於方向性參數估算上的空間頻疊問題。後文描述之系統利用充分設計的麥克風陣列,使得麥克風信號存在有可測量幅度差,係取決於到達方向。然後(只有)此項麥克風頻譜之幅值資訊係用在估計處理,原因在於相位項係被空間頻疊效應所訛誤。
實施例包含從只有二或多個麥克風或只有一個麥克風接續放置在二或多個位置,例如使得一個麥克風環繞一軸線旋轉的幅值提取於時頻域中分析的聲場之方向性資訊(諸如DOA或漫射性)。當取決於到達方向幅值係以可預測方式足夠強力改變時,此點為可能。可以兩種方式達成,亦即
1. 採用方向性麥克風(亦即具有非各向同性拾波型樣,諸如類心形麥克風),於該處各個麥克風係指向不同方向,或藉
2. 針對各個麥克風或麥克風位置實現獨特散射及/或成蔭效應。此點例如可藉在麥克風組態中央採用實體物件達成。適當物件利用散射及/或成蔭效應而以已知方式修改麥克風信號之幅值。
使用第一方法之系統之一實例係顯示於第9圖。
5.3.1 使用依據第9圖之方向性麥克風之系統
第9圖顯示系統900之方塊示意圖,該系統包括裝置,例如依據第1圖之裝置100。此外,系統900包含第一方向性麥克風9011具有第一有效麥克風觀看方向9031用以推衍裝置100之多個麥克風信號的第一麥克風信號1031。第一麥克風信號1031係聯結第一觀看方向9031。此外,系統900包含第二方向性麥克風9012具有第二有效麥克風觀看方向9032用以推衍裝置100之多個麥克風信號的第二麥克風信號1032。第二麥克風信號1032係聯結第二觀看方向9032。此外,第一觀看方向9031係與第二觀看方向9032不同。舉例言之,觀看方向9031、9032可能相反。額外延伸至此一構思係顯示於第3圖,於該處四個類心形麥克風(方向性麥克風)係指向笛卡兒座標系的反向。麥克風位置係以黑電路標記。
藉應用方向性麥克風,可達成第一方向性麥克風9011、9012間之幅值差夠大來決定方向性資訊101。
使用第二方法來針對全向麥克風達成不同麥克風信號幅值間的強力變異的系統實例係顯示於第10圖。
5.3.2 使用依據第10圖之全向麥克風之系統
第10圖顯示包含裝置之系統1000,該裝置諸如依據第1圖之裝置100係用以從多個麥克風信號或麥克風信號之成分推衍方向性資訊101。又復,系統1000包含第一全向麥克風10011用以推衍裝置100之多個麥克風信號中之第一麥克風信號1031。又復,系統1000包含第二全向麥克風10012用以推衍裝置100之多個麥克風信號中之第二麥克風信號1032。此外,系統1000包含成蔭物件1005(也標示為散射物件1005)設置於第一全向麥克風10011與第二全向麥克風10012間用以整形第一全向麥克風10011與第二全向麥克風10012的有效響應型樣,使得第一全向麥克風10011之已整形有效響應型樣包含第一有效麥克風觀看方向10031,而第二全向麥克風10012之已整形有效響應型樣包含第二有效麥克風觀看方向10032。換言之,藉由使用介於全向麥克風10011、10012間的成蔭物件1005,可達成全向麥克風10011、10012的方向性表現,使得可達成全向麥克風10011、10012間的可量測幅值差,即使兩個全向麥克風10011、10012間的距離小亦復如此。
系統1000的進一步選擇性延伸係給定於第4圖至第6圖,其中不同幾何形狀物件頻譜係數置於習知四個(全向)麥克風陣列的中央。
第4圖顯示採用物件1005來造成散射及成蔭效應的麥克風組態之說明圖。於本實例中,於第4圖中,物件為剛性圓柱體。四個(全向)麥克風10011至10014之麥克風位置係以黑電路標示。
第5圖顯示類似第4圖之麥克風組態之說明圖,但採用不同的麥克風配置(在剛性圓柱體之剛性表面上)。四個(全向)麥克風10011至10014之麥克風位置係以黑電路標示。於第5圖所示實例中,成蔭物件1005包含該剛性圓柱體及剛性表面。
第6圖顯示採用又一物件1005來造成散射及成蔭效應的麥克風組態之說明圖。於本實例中,物件1005為剛性半球體(具有剛性表面)。四個(全向)麥克風10011至10014之麥克風位置係以黑電路標示。
此外,第7圖顯示使用六個(全向)麥克風10011至10016分布在剛性球體上方之三維DOA估計實例(三維方向性資訊導算)。換言之,第6圖顯示採用物件1005來造成成蔭效應之3D麥克風組態之說明圖。於本實例中,物件為剛性球體。(全向)麥克風10011至10016之麥克風位置係以黑電路標示。
從由第2至7圖及第9至10圖所示不同麥克風所產生的不同麥克風信號間之幅值差,實施例遵照結合依據第1圖之裝置100解說的辦法計算方向性資訊。
依據其它實施例,第一方向性麥克風9011或第一全向麥克風10011及第二方向性麥克風9012或第二全向麥克風10012可經排列成作為指向第一有效麥克風觀看方向9031、10031之向量的第一方向資訊項與作為指向第二有效麥克風觀看方向9032、10032之向量的第二方向資訊項之和等於0,係在第一方向資訊項或第二方向資訊項之±5%、±10%、±20%、或±30%公差範圍以內。
換言之,方程式(6)可應用至系統900、1000的麥克風,其中bi為第i個麥克風的方向資訊項亦即指向第i個麥克風的有效麥克風觀看方向之單位向量。
後文中,將描述使用麥克風信號之幅值資訊用於方向性參數估計的替代解決辦法。
5.4 替代解決辦法 5.4.1 基於相關性之辦法
本章節提示只探索麥克風信號之幅值資訊用於方向性參數估計的替***法。該辦法係基於麥克風信號之幅值頻譜與相對應得自模型或測量值之先前測定的幅值頻譜間之相關性。
設Si(k,n)=|Pi(k,n)|κ表示第i個麥克風信號之幅值頻譜或功率頻譜。然後,發明人定義N個麥克風測得的幅值振陣列響應S(k,n)為
S(k,n)=[S 1(k,n),S 2(k,n),...,S N (k,n)] T . (19)
相對應麥克風陣列之幅值陣列流形(manifold)係標示為SM(φ,k,n)。若使用在該陣列內部有不同觀看方向的方向性麥克風或散射/成蔭物件,則幅值陣列流形顯然取決於聲音φ的DOA。聲音DOA對陣列流形的影響係取決於實際陣列組態,係受含括於麥克風組態中的麥克風及/或散射物件的方向性型樣的影響。陣列流形可從陣列的測量值決定,於該處聲音係從不同方向回放。另外,可適用物理模型。圓柱體散射器對其表面上聲壓分布的影響例如係描述於H. Teutsh及W. Kellermann,基於使用圓形麥克風陣列之波場分所的音源檢測與定位,J.Acoust. Soc. Am.,5(120),2006。
為了測定期望的聲音DOA估值,將幅值陣列響應與幅值陣列流形交互聯結。估計的DOA依據下式而相對應於標準化相關性的最大值
雖然發明人於此處只呈示DOA估計的2D情況,但顯然包括方位角及仰角的3D DOA估計可以類似方式執行。
5.4.2 基於雜訊子空間之辦法
本章節提示只探索麥克風信號之幅值資訊用於方向性參數估計的替***法。該辦法係基於眾所周知的根MUSIC演算法(R. Schmit,多射體定位及信號參數估計,IEEE天線與傳播會議,34(3):276-280,1986),但例外為顯示實例只處理幅值資訊。
如(19)定義,設S(k,n)為測量得的麥克風陣列響應。後文中與k及n的相依性被刪除,原因在於針對各個時頻倉(bin)全部步驟係分開進行。相關性矩陣R可以下式計算
R=E{SS H}, (21)
於該處(‧)H表示共軛移項及E{‧}為預期運算元。預期通常係在實際應用於藉時間上及/或頻譜上平均處理求取近似值。R的特徵值分解可寫成
於該處λ1...N為特徵值及N為麥克風或測量位置數目。現在,當強平面波到達麥克風陣列時,獲得相當大的特徵值λ,而全部其它特徵值皆係接近零。相對應於後述特徵值的特徵向量形成所謂的雜訊子空間Qn。此一矩陣係正交於所謂的信號子空間Qs,其含有相對應於最大的特徵值的特徵向量。所謂MUSIC頻譜可計算為
於該處針對所研究的操縱方向φ之操縱向量s(φ)係取自前一章節介紹的陣列流形SM。當操縱方向φ匹配真正聲音DOA時,MUSIC頻譜P(φ)變成最大值。如此,聲音DOAφDOA可針對P(φ)變成最大值時取φ決定,亦即,
後文中,將描述利用得自最佳化麥克風陣列的組合壓力及能量梯度之用於寬帶方向估計方法/裝置之本發明之實施例的細節實例。
5.5 利用組合壓力及能量梯度之方向估計實例 5.5.1 引言
聲音到達方向之分析係用在若干音訊重製技術來提供來自多頻道音訊檔案或來自多麥克風信號的參數表示型態(F. Baumgarte及C. Faller,「雙耳線索-第I部分:心理聲學基礎與設計原理」,IEEE語音音訊處理會議,第11期第509-519頁2003年11月;M. Goodwin及J-M. Jot,「通用空間音訊編碼之分析與合成」,於AES第121屆會議議事錄,美國加州舊金山2006年;V. Pulkki,「以方向性音訊編碼之空間聲音重製」,J. Audio Eng. Soc,第55期第503-516頁2007年6月;及C. Faller,「用於空間音訊編碼器之麥克風前端」,於AES第125屆會議,美國加州舊金山2008年)。除了空間聲音重製外,分析方向也可利用於諸如來源定位及成束等應用(M. Kallinger,G. Del Galdo,F. Kuech,D. Mahne及R. Schultz-Amling,「使用方向性音訊編碼參數之空間濾波」,於IEEE聲學、語音及信號處理國際會議議事錄,IEEE電腦學會第217-220頁2009年;及O. Thiergart,R. Schultz-Amling,G. Del Galdo,D. Mahne及F. Kuech,「於混響環境中基於方向性音訊編碼參數之音源定位」,於第127屆AES會議,美國紐約州紐約2009年)。於本實例中,方向分析係就處理技術方向性音訊編碼(DirAC)用在各項應用中記錄與重新空間聲音的觀點討論(V. Pulkki,「以方向性音訊編碼之空間聲音重製」,J. Audio Eng. Soc,第55期第503-516頁2007年6月)。
一般而言,於DirAC的方向分析係基於3D聲音強度向量之測量,要求有關於聲場單點的聲壓及粒子速度資訊。如此,DirAC以沿笛卡兒座標定向的全向信號及三個偶極信號形式而用於B-格式信號。B-格式信號可從間隔緊密或重合的麥克風陣列導出(J. Merimaa,「3-D麥克風陣列之應用」,於AES第112屆會議議事錄,德國墨尼黑2002年;及M.A. Gerzon,「用於立體聲及環繞聲之精準重疊麥克風陣列設計」,於AES第50屆會議議事錄,1975年)。此處使用四個全向麥克風置於方形陣列的客戶位準解決辦法。不幸,從此等陣列以壓力梯度推衍的偶極信號在高頻時有空間混頻。結果,高於空間混疊頻率的方向係錯誤估計,可從陣列間隔推衍出。
於本實例中,以實際全向麥克風呈示高於空間混疊頻率延伸可靠方向估計之方法。該方法利用下述事實,麥克風本身遮蔭以高頻以相對短波長到達的聲音。此種成蔭取決於到達方向,針對放置於陣列的麥克風,產生可量測的麥克風間位準差異。如此使得其可能藉由計算麥克風信號間的能量梯度而估算聲音強度向量,及此外,基於此而估計到達方向。此外,麥克風大小決定頻率極限,高於該頻率極限,位準差係足夠可行性地使用能量梯度。成蔭在較低頻具較大尺寸發揮效果。實例也討論,取決於麥克風的隔膜大小,如何最佳化陣列裡的間隔來匹配使用壓力及能量二梯度的估算方法。
實例係如下組織。章節5.5.2綜論使用具B-格式信號的能量分析之方向估計,其以全向麥克風立方形陣列的產生係說明於章節5.5.3。於章節5.5.4中,使用能量梯度來估計方向之方法係以方形陣列中相對大尺寸麥克風呈示。章節5.5.5提示最佳化陣列中的麥克風間隔之方法。方法之評估係呈現於章節5.5.6。最後,結論呈示於章節5.5.7。
5.5.2 於能量分析之方向估計
使用能量分析之方向估計係基於聲音強度向量,表示聲音能量淨流之方向及幅值。用於分析,聲壓p及粒子速度u可使用全向信號W及B-格式的偶極信號(X、Y及Z用於笛卡兒方向)於聲場的一點估計。為了調諧聲場,時頻分析呈具有20毫秒時間窗的短時間富利葉變換(STFT),施加至此處呈示的在DirAC體現之B-格式信號。隨後,瞬間作用聲音強度
係針對偶極係表示為X(t,f)=[X(t,f)Y(t,f)Z(t,f)]T從STFT變換之B-格式信號在各個時頻拼貼塊計算。此處,t及f分別為時間及頻率,及Z0為空間的聲學阻抗。此外,Z00c,此處ρ0乃空氣之平均密度,及c為聲音速度。呈方位角θ及仰角Φ的聲音到達方向係定義為聲音強度向量方向之反向。
5.5.3 於水平面推衍B-格式信號的麥克風陣列
第11圖顯示在相對麥克風間有間隔d的四個全向麥克風陣列。
由四個緊密間隔全向麥克風所組成的且顯示於第11圖之陣列已經用來估計於DirAC中的方向之方位角θ的水平B-格式信號(W、X及Y)(M. Kallinger,G. Del Galdo,F. Kuech,D. Mahne及R. Schultz-Amling,「使用方向性音訊編碼參數之空間濾波」,於IEEE聲學、語音及信號處理國際會議議事錄,IEEE電腦學會第217-220頁2009年;及O. Thiergart,R. Schultz-Amling,G. Del Galdo,D. Mahne及F. Kuech,「於混響環境中基於方向性音訊編碼參數之音源定位」,於第127屆AES會議,美國紐約州紐約2009年)。相對小尺寸麥克風典型地係定位間隔彼此數厘米(例如2厘米)。使用此種陣列,全向信號W可產生為麥克風信號的平均值,及偶極信號X及Y可藉從彼此扣除相對麥克風的信號而推衍為壓力梯度如
X(t,f)=A(f)‧[P 1(t,f)-P 2(t,f)]
Y(t,f)=A(f)‧[P 3(t,f)-P 4(t,f)]. (26)
此處,P1、P2、P3、及P4為STFT變換麥克風信號,及A(f)為頻率相依性等化常數。此外,A(f)=-j(cN)/(2πfdfs),於該處j為虛數單位,N為STFT的頻率倉或拼貼塊數目,d為相對麥克風間距,及fs為取樣率。
如前文已述,當到達聲音的半波長係小於相對麥克風間距時,空間頻疊影響壓力梯度且開始扭曲偶極信號。如此界定有效偶極信號的頻率上限之理論空間混疊頻率fsa計算為
高於該上限的方向係錯誤估計。
5.5.4 使用能量梯度之方向估計
因空間頻疊及藉成蔭的麥克風方向性阻止壓力梯度用在高頻,期望有延伸頻率範圍用於可靠的方向估計之方法。此處,四個全向麥克風陣列排列成其軸線上方向係指向外及相反方向,該麥克風陣列係採用於所提示之方法用於寬帶方向估計。第12圖顯示此種陣列,其中來自平面波的不同聲音能量係以不同麥克風捕集。
第12圖所示陣列的四個全向麥克風10011至10014係安裝置圓柱體末端。麥克風的軸線上方向10031至10034係從陣列中心指向外。此種陣列係用來使用能量梯度估計聲波的到達方向。
能差在此處假設可能使得當其x-及y-軸成分係藉扣除相對麥克風的功率頻率估算時,估計2D強度向量為
(t,f)=|P 1(t,f)|2-|P 2(t,f)|2
(t,f)=|P 3(t,f)|2-|P 4(t,f)|2 (28)
到達平面波的方位角θ進一步得自強度近似值。為了讓前述計算為可行,期望麥克風間位準差夠大而可以可接受的信號對雜訊比測量。如此,陣列中採用有相對大型隔膜的麥克風。
於某些情況下,能量梯度無法用來估計於較低頻率的方向,於該處麥克風不會遮蔭具相對長波長的到達聲音。如此,於高頻的聲音方向資訊可組合以壓力梯度獲得的於低頻之方向資訊。各技術間的交越頻率顯然為依據方程式(27)的空間混疊頻率fsa
5.5.5 麥克風陣列之間隔最佳化
如前述,隔膜大小決定藉麥克風成蔭可有效地計算能量梯度之頻率。為了匹配空間混疊頻率fsa與用以使用能量梯度的頻率極限flim,麥克風須設置在陣列中彼此有適當距離。因此,本章節討論界定具有某個隔膜尺寸的麥克風間之間隔。
全向麥克風之頻率相依性方向性指數可以分貝測量為
DI(f)=10log10L(f)), (29)
於該處ΔL為軸線上拾波能相對於全部方向積分的總拾波能之比(J. Eagle,「麥克風篇章」,焦點出版社,美國波士頓2001年)。此外,於各個頻率之方向性指數係取決於隔膜周長與波長間之比值。
此處,r為隔膜半徑及λ為波長。此外,λ=c/flim。方向性指數DI呈比值ka之函數的相依性已經於J. Eagle,「麥克風篇章」,焦點出版社,美國波士頓2001年藉模擬而顯示為單調上升函數,如第13圖所示。
第13圖顯示以分貝表示的方向性指數DI係從J. Eagle,「麥克風篇章」,焦點出版社,美國波士頓2001年調整。理論指數係作圖為ka之函數,表示全向麥克風之隔膜周長除以波長。
此種相依性於此處係用來界定期望方向性指數DI的比值ka。於本實例中,產生ka值為1的DI係定義為2.8分貝。當空間混疊頻率fsa等於頻率極限flim時,具給定方向性指數的最佳化麥克風間隔現在可採用方程式(27)及方程式(30)定義。如此最佳化間隔係計算為
5.5.6 方向估計之評估
本實例討論的方向估計方法現在係在DirAC分析以無回聲測量與模擬而評估。替代同時測量方形裡的四個麥克風,脈衝響應係從多個方向測量,單一全向麥克風具有相當大型隔膜。測量得的響應隨後用來估計置放於方形的四個全向麥克風的脈衝響應,如第12圖所示。結果,能量梯度主要係取決於麥克風的隔膜大小,如此,間隔最佳化可如章節5.5.5所述研究。顯然,陣列裡的四個麥克風將針對到達的聲波提供有效地更多陰影,方向估計比較單一麥克風情況略有改良。前述評估係以有不同隔膜大小的兩個不同麥克風應用於此處。
脈衝響應係於無回聲室以1.6米距離,使用活動式揚聲器(吉臬雷(Genelec) 8030A)以5度間隔測量。於不同角度的測量係於20-20000 Hz及長度1秒使用掃掠正弦值進行。A-加權聲壓位準為75分貝。測量係使用分別具有1.27厘米(0.5吋)及2.1厘米(0.8吋)直徑隔膜的G.R.A.S.型號40AI及AKG CK 62-ULS全向麥克風進行。
於模擬中,方向性指數DI係定義為2.8分貝,相對應於第13圖中具數值1的比值ka。依據方程式(31)中的最佳化麥克風間隔,相對麥克風係在彼此間隔2厘米及3.3厘米使用G.R.A.S.及AKG麥克風模擬。此種間隔結果導致8575 Hz及5797 Hz的空間混疊頻率。
第14圖及第15圖顯示使用G.R.A.S.及AKG麥克風的方向性型樣:14a)單一麥克風之能,14b)二麥克風間之壓力梯度,及14c)二麥克風間之能量梯度。
第14圖顯示基於G.R.A.S.麥克風之對數方向性型樣。型樣係經標準化且以第三個八音度頻帶作圖,中心頻率在8 kHz(具元件符號1401之曲線)、10 kHz(具元件符號1403之曲線)、12.5 kHz(具元件符號1405之曲線)、及16 kHz(具元件符號1407之曲線)。於14b)及14c)具±1分貝偏差的理想偶極之型樣係標示以區1409。
第15圖顯示基於AKG麥克風之對數方向性型樣。型樣係經標準化且以第三個八音度頻帶作圖,中心頻率在5 kHz(具元件符號1501之曲線)、8 kHz(具元件符號1503之曲線)、12.5 kHz(具元件符號1505之曲線)、及16 kHz(具元件符號1507之曲線)。於15b)及15d)具±1分貝偏差的理想偶極之型樣係標示以區1509。
標準化型樣係於第三個八音度頻帶作圖,中心頻率始於靠近理論空間混疊頻率8575 Hz(G.R.A.S.)及5197 Hz(AKG)。須注意不同中心頻率係用在G.R.A.S.及AKG麥克風。此外,壓力及能量梯度作圖中,具±1分貝偏差的理想偶極之型樣係標示以區1409、1509。因成蔭故第14a)及15a)圖形型樣洩示個別全向麥克風於高頻具有顯著方向性。使用G.R.A.S.麥克風及陣列中的2厘米間隔,推衍為壓力梯度的偶極展頻為於第14b)圖的頻率之函數。能量梯度產生偶極型樣,但比於第14c)圖於12.5 kHz及16 kHz之理想型樣略窄。使用於陣列中的AKG麥克風及3.3厘米間隔,壓力梯度之方向性型樣係於8 kHz、12.5 kHz及16 kHz展頻及失真,而使用能量梯度,偶極型樣隨頻率之函數變化而減低,但類似理想偶極。
第16圖顯示當G.R.A.S.及AKG麥克風之測量響應分別地用來模擬於16a)及16b)的麥克風陣列時,以均方根誤差(RMSE)連同頻率表示的方向分析結果。
第16圖中,方向係使用四個全向麥克風陣列估計,使用測得的真正麥克風的脈衝響應模型化。
方向分析係如下述進行,與白雜訊樣本交替地於0、5、10、15、20、25、30、35、40、及45度迴旋麥克風的脈衝響應,及估計於DirAC分析中在20毫秒STFT窗內部之方向。結果的視覺檢驗顯示於16a)至多至10 kHz頻率及於16b)至多至6.5 kHz頻率利用壓力梯度,而高於此等頻率則利用能量梯度,可準確地估計方向。但前述頻率略高於具最佳化麥克風間隔2厘米及3.3厘米的8575 Hz及5797 Hz的理論空間混疊頻率。此外,用於有效方向估計的頻率範圍,壓力梯度及能量梯度二者於16a)使用G.R.A.S.麥克風存在於8 kHz至10 kHz及於16b)使用AKG麥克風存在於3 kHz至6.5 kHz。於此等情況下具給定值的麥克風間隔最佳化似乎提供良好估計。
5.5.7 結論
此一實例呈現一種方法/裝置,當全向麥克風間的壓力及能量梯度分別於低頻及高頻計算時及用來估計聲音強度向量時,分析於寬廣音頻範圍聲音之到達方向。該方法/裝置採用具有相對大型隔膜大小彼此相對的四個全向麥克風陣列,提供可量測的麥克風間位準差用以計算於高頻之能量梯度。
顯示所呈示之方法/裝置提供於寬廣音頻範圍可靠的方向估計,而於聲場能量分析中只採用壓力梯度的習知方法/裝置有空間疊頻問題,如此於高頻產生高度錯誤的方向估計。
摘要言之,實例顯示方法/裝置藉從緊密間隔全向麥克風的頻率相依性壓力及能量梯度計算聲音強度而估計聲音方向。換言之,實施例提供一種裝置及/或方法其係經組配來從緊密間隔全向麥克風的頻率相依性壓力及能量梯度計算聲音強度而估計方向性資訊。具相對大隔膜且造成聲波陰影的麥克風係用在此處提供夠大的麥克風間位準差用以於高頻計算能量梯度為可行。實例係於空間聲音處理技術方向性音訊編碼(DirAC)之方向分析評估。顯示該方法/裝置提供於整個音頻範圍可靠的方向估計資訊,而傳統方法只採用壓力梯度,壓力梯度在高頻產生高度錯誤估計。
由此實例可知,於另一實施例中,依據此一實施例之裝置的組合器係經組配來基於幅值推衍方向性資訊,而與於第一頻率範圍(例如高於空間頻疊極限)的麥克風信號相位或麥克風信號成分獨立無關。此外,組合器可經組配來取決於於第二頻率範圍(例如低於空間頻疊極限)的麥克風信號相位或麥克風信號成分而推衍方向性資訊。換言之,本發明之實施例可經組配來頻率選擇性地推衍方向性資訊,使得於第一頻率範圍,方向性資訊只基於麥克風信號幅值或麥克風信號成分,而於第二頻率範圍,方向性資訊額外基於麥克風信號相位或麥克風信號成分。
6. 摘要
摘要言之,本發明之實施例藉(只)考慮麥克風頻譜幅值而估計聲場之方向性參數。實際上此點特別可用於麥克風信號的麥克風相位資訊含混不清時,亦即出現空間頻疊效應時。為了可提取期望的方向性資訊,本發明之實施例(例如系統900)使用方向性麥克風之適當組態,具有不同觀看方向。另外(例如於系統1000),物件可含括於麥克風組態,造成方向相依性散射及成蔭效應。於若干市售麥克風(例如大隔膜麥克風),麥克風艙安裝於相當大的機殼內。結果導致的成蔭/散射效應已經足夠採用本發明之構思。依據額外實施例,藉本發明之實施例執行的以幅值為基礎之參數估計也可組合也考慮麥克風信號之相位資訊的傳統估計方法施用。
摘要而言,實施例提出一種透過方向性幅值變化之空間參數估計。
雖然已經於裝置脈絡描述若干構面,但顯然此等構面也表示相對應方法之描述,於該處方塊或裝置係相對應於方法步驟或方法步驟之特徵結構。同理,於方法步驟脈絡描述的構面也表示相對應裝置之相對應區塊或項或特徵結構之描述。部分或全部方法步驟可藉(或使用)硬體裝置例如,微處理器、可規劃電腦或電子電路執行。於若干實施例中,最重要方法步驟中之某一者或多者可藉此種裝置執行。
取決於某些體現要求,本發明之實施例可於硬體或於軟體體現。體現可使用數位儲存媒體執行,例如軟碟、DVD、藍光、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,具有可電子讀取控制信號儲存於其上,該等信號與(或可與)可規劃電腦系統協作,因而執行個別方法。因此,數位儲存媒體可以電腦讀取。
依據本發明之若干實施例包含具有可電子讀取控制信號的資料載體,該等信號可與可規劃電腦系統協作,因而執行此處所述方法中之一者。
大致言之,本發明之實施例可體現為具有程式代碼的電腦程式產品,該程式代碼係當電腦程式產品在電腦上跑時可執行該等方法中之一者。程式代碼例如可儲存在機器可讀取載體上。
其它實施例包含儲存在機器可讀取載體上用以執行此處所述方法中之一者的電腦程式。
換言之,因此,本發明之實施例為一種具有一程式代碼之電腦程式,該程式代碼係當該電腦程式於一電腦上跑時用以執行此處所述方法中之一者。
因此,本發明方法之又一實施例為資料載體(或數位儲存媒體或電腦可讀取媒體)包含用以執行此處所述方法中之一者的電腦程式記錄於其上。資料載體或數位儲存媒體或記錄媒體典型地為具體有形及/或非暫態。
因此,本發明方法之又一實施例為表示用以執行此處所述方法中之一者的電腦程式的資料串流或信號序列。資料串流或信號序列例如可經組配來透過資料通訊連結,例如透過網際網路轉移。
又一實施例包含處理構件例如電腦或可規劃邏輯裝置,其係經組配來或適用於執行此處所述方法中之一者。
又一實施例包含電腦其上安裝有用以執行此處所述方法中之一者的電腦程式。
依據本發明之又一實施例包含一種裝置或系統經組配來轉移(例如電子式或光學式)用以執行此處所述方法中之一者的電腦程式給一接收器。該接收器例如可以是電腦、行動裝置、記憶體裝置等。該裝置或系統例如包含用以轉移電腦程式給接收器之檔案伺服器。
於若干實施例中,可規劃邏輯裝置(例如可現場規劃閘陣列)可用來執行此處描述之方法的部分或全部功能。於若干實施例中,可現場規劃閘陣列可與微處理器協作來執行此處所述方法中之一者。大致上該等方法較佳係藉任何硬體裝置執行。
前述實施例僅供舉例說明本發明原理。須瞭解此處所述配置及細節之修改及變化將為熟諳技藝人士顯然易知。因此,意圖僅受審查中之專利申請範圍所限而非受用以描述及解說此處實施例所呈示之特定細節所限。
100...裝置
101...方向性資訊d(k,n)
1031-N...麥克風信號、P1-PN
105...組合器
800...方法
801、803...步驟
900、1000...系統
9011-2...方向性麥克風
9031-2、10031-2...有效麥克風觀看方向
10011-4...全向性麥克風
1005...成蔭物件、散射物件
1401-1407、1501-1507...曲線
1409、1509...區
第1圖顯示依據本發明之一實施例一種裝置之方塊示意圖;
第2圖顯示使用四個全向艙之麥克風組態之說明例;提供聲壓信號Pi(k,n),i=1、...、4;
第3圖顯示使用具有類心形拾波型樣的四個方向性麥克風之麥克風組態之說明例;
第4圖顯示麥克風組態之說明例,採用剛性圓柱體來造成散射及成蔭效應;
第5圖顯示類似第4圖之麥克風組態之說明例,但採用不同的麥克風配置;
第6圖顯示麥克風組態之說明例,採用剛性半球體來造成散射及成蔭效應;
第7圖顯示3D麥克風組態之說明例,採用剛性球體來造成成蔭效應;
第8圖顯示依據一實施例一種方法之流程圖;
第9圖顯示依據一實施例一種系統之方塊示意圖;
第10圖顯示依據本發明之又一實施例一種系統之方塊示意圖;
第11圖顯示四個全向麥克風陣列之說明例,相對麥克風間具有間隔d;
第12圖顯示四個全向麥克風陣列之說明例,麥克風係安裝在圓柱體末端上;
第13圖顯示方向性指數DI(以分貝表示)呈ka之函數之略圖,表示全向麥克風之隔膜周長除以波長;
第14圖顯示使用G.R.A.S.麥克風之對數方向性型樣;
第15圖顯示使用AKG麥克風之對數方向性型樣;及
第16圖顯示以均方根誤差(RMSE)表示之方向分析結果之略圖。
100...裝置
101...方向性資訊d(k,n)
1031-N...麥克風信號、P1至PN
105...組合器

Claims (25)

  1. 一種用以從多個麥克風信號或從一麥克風信號的多個成分推衍方向性資訊之裝置,其中不同的有效麥克風觀看方向係與該等麥克風信號或成分相關聯,該裝置包含:一組合器,其組配來從一麥克風信號或該麥克風信號之一成分獲得一幅值,及組合描述該等有效麥克風觀看方向的方向資訊項,使得描述一給定的有效麥克風觀看方向之一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯之該麥克風信號或該麥克風信號之該成分的該幅值來加權,以推衍該方向性資訊;其中描述該給定的有效麥克風觀看方向之該方向資訊項為指向該給定的有效麥克風觀看方向之一向量。
  2. 如申請專利範圍第1項之裝置,其中與一麥克風信號關聯之一有效麥克風觀看方向描述該方向,於該方向處從其中推衍該麥克風信號之一麥克風具有其最大響應。
  3. 如申請專利範圍第1項之裝置,其中該組合器係組配來獲得該幅值,使得該幅值描述表示該麥克風信號之一頻譜子區之一頻譜係數之一大小。
  4. 如申請專利範圍第1項之裝置,其中該組合器係組配來基於該等麥克風信號或該等成分之一時頻表示型態而推衍該方向性資訊。
  5. 如申請專利範圍第1項之裝置,其中該組合器係組配來組合依據關聯於一給定的時頻拼貼塊之幅值而加權的該等方向資訊項,以便針對該給定的時頻拼貼塊推衍該方向性資訊。
  6. 如申請專利範圍第1項之裝置,其中該組合器係組配來針對多個不同的時頻拼貼塊,組合該等相同方向資訊項,該等方向資訊項係依據與不同的時頻拼貼塊相關聯的幅值而有差異地加權。
  7. 如申請專利範圍第1項之裝置,其中一第一有效麥克風觀看方向係與該等多個麥克風信號之一第一麥克風信號相關聯;其中一第二有效麥克風觀看方向係與多個麥克風信號之一第二麥克風信號相關聯;其中該第一有效麥克風觀看方向係與該第二有效麥克風觀看方向不同;及其中該組合器係組配來從該第一麥克風信號或該第一麥克風信號之一成分獲得一第一幅值,從該第二麥克風信號或該第二麥克風信號之一成分獲得一第二幅值,及組合描述該第一有效麥克風觀看方向之一第一方向資訊項與描述該第二有效麥克風觀看方向之一第二方向資訊項,使得該第一方向資訊項係以該第一幅值加權及該第二方向資訊項係以該第二幅值加權,而推衍該方向性資訊。
  8. 如申請專利範圍第1項之裝置, 其中該組合器係組配來基於該幅值獲得一平方幅值,該平方幅值描述該麥克風信號或該麥克風信號之該成分之一功率,及其中該組合器係組配來組合該等方向資訊項,使得一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯的該麥克風信號或該麥克風信號之該成分的該平方幅值加權。
  9. 如申請專利範圍第1項之裝置,其中該組合器係組配來依據如下方程式推衍該方向性資訊: 其中d(k,n)表示針對一給定的時頻拼貼塊(k,n)之該方向性資訊,Pi(k,n)表示針對該給定的時頻拼貼塊(k,n)之一第i個麥克風之該麥克風信號(Pi)之一成分,κ表示一指數值,及bi表示描述該第i個麥克風之該有效麥克風觀看方向之一方向資訊項。
  10. 如申請專利範圍第9項之裝置,其中κ>0。
  11. 如申請專利範圍第1項之裝置,其中該組合器係組配來基於該等幅值、而與於一第一頻率範圍中之該等麥克風信號或該麥克風信號之該等成分的相位獨立無關,而推衍該方向性資訊;及其中該組合器係另組配來依據於一第二頻率範圍中之該等麥克風信號或該麥克風信號之該等成分的相位,而推衍該方向性資訊。
  12. 如申請專利範圍第1項之裝置,其中該組合器係組配來使得該方向資訊項係單獨依據該幅值加權。
  13. 如申請專利範圍第1項之裝置,其中該組合器係組配來線性地組合該等方向資訊項。
  14. 一種用以推衍方向性資訊之系統,其係包含:如申請專利範圍第1至13項中任一項之裝置,一第一方向性麥克風,其具有一第一有效麥克風觀看方向,用以推衍該等多個麥克風信號中之一第一麥克風信號,該第一麥克風信號與一第一有效麥克風觀看方向相關聯;及一第二方向性麥克風,其具有一第二有效麥克風觀看方向,用以推衍該等多個麥克風信號中之一第二麥克風信號,該第二麥克風信號與該第二有效麥克風觀看方向相關聯;及其中該第一觀看方向係與該第二觀看方向不同。
  15. 一種用以推衍方向性資訊之系統,其係包含:用以從多個麥克風信號或從一麥克風信號的多個成分推衍一方向性資訊之一裝置,其中不同的有效麥克風觀看方向係與該等麥克風信號或成分相關聯,該裝置包含:一組合器,其組配來從一麥克風信號或該麥克風信號之一成分獲得一幅值,及組合描述該等有效麥克風觀看方向的方向資訊項,使得描述一給定的有效麥克風觀 看方向之一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯之該麥克風信號或該麥克風信號之該成分的該幅值而加權,以推衍該方向性資訊;一第一全向麥克風,用以推衍該等多個麥克風信號中之一第一麥克風信號;一第二全向麥克風,用以推衍一第二麥克風信號;及置於該第一全向麥克風與該第二全向麥克風間之一成蔭物件,用以形塑該第一全向麥克風及該第二全向麥克風的有效響應型樣,使得該第一全向麥克風之一形塑有效響應型樣包含一第一有效麥克風觀看方向,及該第二全向麥克風之一形塑有效響應型樣包含與該第一有效麥克風觀看方向不同之一第二有效麥克風觀看方向。
  16. 如申請專利範圍第14或15項之系統,其中該等方向性麥克風或該等全向麥克風係配置成使得作為指向該等有效麥克風觀看方向之向量的方向資訊項之和值,在該等方向資訊項中之一者的常模之±30%公差範圍內,係等於零。
  17. 一種用以從多個麥克風信號或從一麥克風信號的多個成分推衍方向性資訊之方法,其中不同的有效麥克風觀看方向係與該等麥克風信號或該等成分相關聯,該方法包含:從該麥克風信號或該麥克風信號之一成分獲得一 幅值;及組合描述該等有效麥克風觀看方向的方向資訊項,使得描述一給定的有效麥克風觀看方向之一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯的該麥克風信號或該麥克風信號之該成分的該幅值加權,以推衍該方向性資訊;其中描述該給定的有效麥克風觀看方向之該方向資訊項為指向該給定的有效麥克風觀看方向之一向量。
  18. 一種具有程式碼之電腦程式,該程式碼在執行於一電腦上時,用以執行如申請專利範圍第17項之方法。
  19. 一種用以從多個麥克風信號或從一麥克風信號的多個成分推衍方向性資訊之裝置,其中不同的有效麥克風觀看方向係與該等麥克風信號或成分相關聯,該裝置包含:一組合器,其組配來從一麥克風信號或該麥克風信號之一成分獲得一幅值,及組合描述該等有效麥克風觀看方向的方向資訊項,使得描述一給定的有效麥克風觀看方向之一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯之該麥克風信號或該麥克風信號之該成分的該幅值來加權,以推衍該方向性資訊;其中該組合器係組配來基於該幅值獲得一平方幅值,該平方幅值描述該麥克風信號或該麥克風信號之該成分之一功率,且其中該組合器係組配來組合該等方向資訊項,使得一方向資訊項係依據與該給定的有效麥克 風觀看方向相關聯的該麥克風信號或該麥克風信號之該成分的該平方幅值加權。
  20. 一種用以從多個麥克風信號或從一麥克風信號的多個成分推衍方向性資訊之裝置,其中不同的有效麥克風觀看方向係與該等麥克風信號或成分相關聯,該裝置包含:一組合器,其組配來從一麥克風信號或該麥克風信號之一成分獲得一幅值,及組合描述該等有效麥克風觀看方向的方向資訊項,使得描述一給定的有效麥克風觀看方向之一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯之該麥克風信號或該麥克風信號之該成分的該幅值來加權,以推衍該方向性資訊;其中該組合器係組配來依據如下方程式推衍該方向性資訊: 其中d(k,n)表示針對一給定的時頻拼貼塊(k,n)之方向性資訊,Pi(k,n)表示針對該給定的時頻拼貼塊(k,n)之第i個麥克風之該麥克風信號(Pi)之一成分,κ表示一指數值,及bi表示描述該第i個麥克風之該有效麥克風觀看方向之一方向資訊項。
  21. 一種用以從多個麥克風信號或從一麥克風信號的多個成分推衍方向性資訊之裝置,其中不同的有效麥克風觀看方向係與該等麥克風信號或成分相關聯,該裝置包 含:一組合器,其組配來從一麥克風信號或該麥克風信號之一成分獲得一幅值,及組合描述該等有效麥克風觀看方向的方向資訊項,使得描述一給定的有效麥克風觀看方向之一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯之該麥克風信號或該麥克風信號之該成分的該幅值來加權,以推衍該方向性資訊;其中該組合器係組配來基於該等幅值、而與於一第一頻率範圍中之該等麥克風信號或該麥克風信號之該等成分的相位無關地,推衍該方向性資訊;及其中該組合器係另組配來依據於一第二頻率範圍中之該等麥克風信號或該麥克風信號之該等成分的相位,推衍該方向性資訊。
  22. 一種用以從多個麥克風信號或從一麥克風信號的多個成分推衍方向性資訊之方法,其中不同的有效麥克風觀看方向係與該等麥克風信號或該等成分相關聯,該方法包含:從該麥克風信號或該麥克風信號之一成分獲得一幅值;及組合描述該等有效麥克風觀看方向的方向資訊項,使得描述一給定的有效麥克風觀看方向之一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯的該麥克風信號或該麥克風信號之該成分的該幅值加權,以推衍該方向性資訊; 其中該方法包含基於該幅值獲得一平方幅值,該平方幅值描述該麥克風信號或該麥克風信號之該成分之一功率,及其中該方法包含組合該等方向資訊項,使得一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯的該麥克風信號或該麥克風信號之該成分的該平方幅值加權。
  23. 一種用以從多個麥克風信號或從一麥克風信號的多個成分推衍方向性資訊之方法,其中不同的有效麥克風觀看方向係與該等麥克風信號或該等成分相關聯,該方法包含:從該麥克風信號或該麥克風信號之一成分獲得一幅值;及組合描述該等有效麥克風觀看方向的方向資訊項,使得描述一給定的有效麥克風觀看方向之一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯的該麥克風信號或該麥克風信號之該成分的該幅值加權,以推衍該方向性資訊;其中該方法包含依據如下方程式推衍該方向性資訊: 其中d(k,n)表示針對一給定的時頻拼貼塊(k,n)之方向性資訊,Pi(k,n)表示針對該給定的時頻拼貼塊(k,n)之第i個麥克風之該麥克風信號(Pi)之一成分,κ表示一指數 值,及bi表示描述該第i個麥克風之該有效麥克風觀看方向之一方向資訊項。
  24. 一種用以從多個麥克風信號或從一麥克風信號的多個成分推衍方向性資訊之方法,其中不同的有效麥克風觀看方向係與該等麥克風信號或該等成分相關聯,該方法包含:從該麥克風信號或該麥克風信號之一成分獲得一幅值;及組合描述該等有效麥克風觀看方向的方向資訊項,使得描述一給定的有效麥克風觀看方向之一方向資訊項係依據與該給定的有效麥克風觀看方向相關聯的該麥克風信號或該麥克風信號之該成分的該幅值加權,以推衍該方向性資訊;其中該方法包含基於該等幅值、而與於一第一頻率範圍中之該等麥克風信號或該麥克風信號之該等成分的相位無關地,推衍該方向性資訊;及其中該方法包含依據於一第二頻率範圍中之該等麥克風信號或該麥克風信號之該等成分的相位,推衍該方向性資訊。
  25. 一種具有程式碼之電腦程式,該程式碼在運行於一電腦上時用以執行如請求項22、23或24之方法。
TW100137945A 2010-10-28 2011-10-19 用以推衍方向性資訊之裝置與方法和系統 TWI556654B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US40757410P 2010-10-28 2010-10-28
EP11166916A EP2448289A1 (en) 2010-10-28 2011-05-20 Apparatus and method for deriving a directional information and computer program product

Publications (2)

Publication Number Publication Date
TW201230822A TW201230822A (en) 2012-07-16
TWI556654B true TWI556654B (zh) 2016-11-01

Family

ID=45492308

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100137945A TWI556654B (zh) 2010-10-28 2011-10-19 用以推衍方向性資訊之裝置與方法和系統

Country Status (16)

Country Link
US (1) US9462378B2 (zh)
EP (2) EP2448289A1 (zh)
JP (1) JP5657127B2 (zh)
KR (1) KR101510576B1 (zh)
CN (1) CN103329567B (zh)
AR (1) AR085199A1 (zh)
AU (1) AU2011322560B2 (zh)
BR (1) BR112013010258B1 (zh)
CA (1) CA2815738C (zh)
ES (1) ES2526785T3 (zh)
HK (1) HK1188063A1 (zh)
MX (1) MX2013004686A (zh)
PL (1) PL2628316T3 (zh)
RU (1) RU2555188C2 (zh)
TW (1) TWI556654B (zh)
WO (1) WO2012055940A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11368790B2 (en) 2017-10-04 2022-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9264524B2 (en) * 2012-08-03 2016-02-16 The Penn State Research Foundation Microphone array transducer for acoustic musical instrument
CN103124386A (zh) * 2012-12-26 2013-05-29 山东共达电声股份有限公司 一种远讲用降噪、消回波、锐指向传声器
TWI584657B (zh) * 2014-08-20 2017-05-21 國立清華大學 一種立體聲場錄音以及重建的方法
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
GB2540175A (en) * 2015-07-08 2017-01-11 Nokia Technologies Oy Spatial audio processing apparatus
US10397711B2 (en) * 2015-09-24 2019-08-27 Gn Hearing A/S Method of determining objective perceptual quantities of noisy speech signals
JP6649787B2 (ja) * 2016-02-05 2020-02-19 日本放送協会 集音装置
JP6569945B2 (ja) * 2016-02-10 2019-09-04 日本電信電話株式会社 バイノーラル音生成装置、マイクロホンアレイ、バイノーラル音生成方法、プログラム
CN112218211B (zh) * 2016-03-15 2022-06-07 弗劳恩霍夫应用研究促进协会 用于生成声场描述的装置、方法或计算机程序
CN106842111B (zh) * 2016-12-28 2019-03-29 西北工业大学 基于传声器镜像的室内声源定位方法
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
FR3069693B1 (fr) 2017-07-28 2019-08-30 Arkamys Procede et systeme de traitement d'un signal audio incluant un encodage au format ambisonique
US11004457B2 (en) 2017-10-18 2021-05-11 Htc Corporation Sound reproducing method, apparatus and non-transitory computer readable storage medium thereof
WO2019231630A1 (en) 2018-05-31 2019-12-05 Shure Acquisition Holdings, Inc. Augmented reality microphone pick-up pattern visualization
CN112335261B (zh) 2018-06-01 2023-07-18 舒尔获得控股公司 图案形成麦克风阵列
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
CN112385245B (zh) * 2018-07-16 2022-02-25 西北工业大学 灵活地理分布的差分麦克风阵列和相关波束形成器
US11310596B2 (en) 2018-09-20 2022-04-19 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
JP7204545B2 (ja) 2019-03-15 2023-01-16 本田技研工業株式会社 音響信号処理装置、音響信号処理方法、およびプログラム
JP7266433B2 (ja) 2019-03-15 2023-04-28 本田技研工業株式会社 音源定位装置、音源定位方法、およびプログラム
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
JP2022526761A (ja) 2019-03-21 2022-05-26 シュアー アクイジッション ホールディングス インコーポレイテッド 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置
WO2020191354A1 (en) 2019-03-21 2020-09-24 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
CN114051738A (zh) 2019-05-23 2022-02-15 舒尔获得控股公司 可操纵扬声器阵列、***及其方法
TW202105369A (zh) 2019-05-31 2021-02-01 美商舒爾獲得控股公司 整合語音及雜訊活動偵測之低延時自動混波器
US11297426B2 (en) 2019-08-23 2022-04-05 Shure Acquisition Holdings, Inc. One-dimensional array microphone with improved directivity
WO2021044551A1 (ja) * 2019-09-04 2021-03-11 日本電信電話株式会社 到来方向推定装置、モデル学習装置、到来方向推定方法、モデル学習方法、プログラム
GB2587335A (en) 2019-09-17 2021-03-31 Nokia Technologies Oy Direction estimation enhancement for parametric spatial audio capture using broadband estimates
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
CN116918351A (zh) 2021-01-28 2023-10-20 舒尔获得控股公司 混合音频波束成形***

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002084590A (ja) * 2000-09-06 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体
US20040175006A1 (en) * 2003-03-06 2004-09-09 Samsung Electronics Co., Ltd. Microphone array, method and apparatus for forming constant directivity beams using the same, and method and apparatus for estimating acoustic source direction using the same
JP2004279390A (ja) * 2003-03-17 2004-10-07 Nittobo Acoustic Engineering Co Ltd 不定項を用いたマイクロホンによるビームフォーミング
US20050201204A1 (en) * 2004-03-11 2005-09-15 Stephane Dedieu High precision beamsteerer based on fixed beamforming approach beampatterns
US20080170716A1 (en) * 2007-01-11 2008-07-17 Fortemedia, Inc. Small array microphone apparatus and beam forming method thereof
US20080240463A1 (en) * 2007-03-29 2008-10-02 Microsoft Corporation Enhanced Beamforming for Arrays of Directional Microphones
JP2009089315A (ja) * 2007-10-03 2009-04-23 Nippon Telegr & Teleph Corp <Ntt> 音響信号推定装置、音響信号合成装置、音響信号推定合成装置、音響信号推定方法、音響信号合成方法、音響信号推定合成方法、これらの方法を用いたプログラム、及び記録媒体
WO2009077152A1 (en) * 2007-12-17 2009-06-25 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung_E.V. Signal pickup with a variable directivity characteristic
US20090175466A1 (en) * 2002-02-05 2009-07-09 Mh Acoustics, Llc Noise-reducing directional microphone array
US20100109951A1 (en) * 2005-08-26 2010-05-06 Dolby Laboratories, Inc. Beam former using phase difference enhancement

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1512514A (en) 1974-07-12 1978-06-01 Nat Res Dev Microphone assemblies
CA1236607A (en) * 1985-09-23 1988-05-10 Northern Telecom Limited Microphone arrangement
RU2048678C1 (ru) * 1993-12-29 1995-11-20 Научно-исследовательский институт специального машиностроения МГТУ им.Н.Э.Баумана Пеленгатор источников акустических излучений
US5581620A (en) * 1994-04-21 1996-12-03 Brown University Research Foundation Methods and apparatus for adaptive beamforming
US8204247B2 (en) * 2003-01-10 2012-06-19 Mh Acoustics, Llc Position-independent microphone system
DE10313331B4 (de) * 2003-03-25 2005-06-16 Siemens Audiologische Technik Gmbh Verfahren zur Bestimmung einer Einfallsrichtung eines Signals einer akustischen Signalquelle und Vorrichtung zur Durchführung des Verfahrens
CA2621916C (en) * 2004-09-07 2015-07-21 Sensear Pty Ltd. Apparatus and method for sound enhancement
AU2007323521B2 (en) * 2006-11-24 2011-02-03 Sonova Ag Signal processing using spatial filter
US8553903B2 (en) * 2007-06-27 2013-10-08 Alcatel Lucent Sound-direction detector having a miniature sensor
JP5156934B2 (ja) * 2008-03-07 2013-03-06 学校法人日本大学 音響測定装置
DE102008029352A1 (de) * 2008-06-20 2009-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zum Lokalisieren einer Schallquelle

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002084590A (ja) * 2000-09-06 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体
US20090175466A1 (en) * 2002-02-05 2009-07-09 Mh Acoustics, Llc Noise-reducing directional microphone array
US20040175006A1 (en) * 2003-03-06 2004-09-09 Samsung Electronics Co., Ltd. Microphone array, method and apparatus for forming constant directivity beams using the same, and method and apparatus for estimating acoustic source direction using the same
JP2004279390A (ja) * 2003-03-17 2004-10-07 Nittobo Acoustic Engineering Co Ltd 不定項を用いたマイクロホンによるビームフォーミング
US20050201204A1 (en) * 2004-03-11 2005-09-15 Stephane Dedieu High precision beamsteerer based on fixed beamforming approach beampatterns
US20100109951A1 (en) * 2005-08-26 2010-05-06 Dolby Laboratories, Inc. Beam former using phase difference enhancement
US20080170716A1 (en) * 2007-01-11 2008-07-17 Fortemedia, Inc. Small array microphone apparatus and beam forming method thereof
US20080240463A1 (en) * 2007-03-29 2008-10-02 Microsoft Corporation Enhanced Beamforming for Arrays of Directional Microphones
TW200904226A (en) * 2007-03-29 2009-01-16 Microsoft Corp Enhanced beamforming for arrays of directional microphones
JP2009089315A (ja) * 2007-10-03 2009-04-23 Nippon Telegr & Teleph Corp <Ntt> 音響信号推定装置、音響信号合成装置、音響信号推定合成装置、音響信号推定方法、音響信号合成方法、音響信号推定合成方法、これらの方法を用いたプログラム、及び記録媒体
WO2009077152A1 (en) * 2007-12-17 2009-06-25 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung_E.V. Signal pickup with a variable directivity characteristic

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11368790B2 (en) 2017-10-04 2022-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding
US11729554B2 (en) 2017-10-04 2023-08-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding
TWI834760B (zh) * 2017-10-04 2024-03-11 弗勞恩霍夫爾協會 用於編碼、解碼、場景處理及與以指向性音訊編碼為基礎之空間音訊編碼有關的其他程序之裝置、方法及電腦程式

Also Published As

Publication number Publication date
PL2628316T3 (pl) 2015-05-29
KR20130127987A (ko) 2013-11-25
EP2628316A1 (en) 2013-08-21
KR101510576B1 (ko) 2015-04-15
US9462378B2 (en) 2016-10-04
RU2555188C2 (ru) 2015-07-10
TW201230822A (en) 2012-07-16
BR112013010258A2 (pt) 2016-09-13
HK1188063A1 (zh) 2014-04-17
CA2815738C (en) 2016-06-21
MX2013004686A (es) 2013-05-20
CN103329567B (zh) 2016-09-07
AR085199A1 (es) 2013-09-18
ES2526785T3 (es) 2015-01-15
RU2013124400A (ru) 2014-12-10
JP2013545382A (ja) 2013-12-19
JP5657127B2 (ja) 2015-01-21
CN103329567A (zh) 2013-09-25
BR112013010258B1 (pt) 2020-12-29
AU2011322560A1 (en) 2013-05-30
EP2448289A1 (en) 2012-05-02
CA2815738A1 (en) 2012-05-03
AU2011322560B2 (en) 2015-01-22
EP2628316B1 (en) 2014-11-05
WO2012055940A1 (en) 2012-05-03
US20130230187A1 (en) 2013-09-05

Similar Documents

Publication Publication Date Title
TWI556654B (zh) 用以推衍方向性資訊之裝置與方法和系統
TWI530201B (zh) 經由自抵達方向估值提取幾何資訊之聲音擷取技術
JP5814476B2 (ja) 空間パワー密度に基づくマイクロフォン位置決め装置および方法
Farina et al. 3D sound characterisation in theatres employing microphone arrays
WO2009050487A1 (en) Acoustic source separation
Del Galdo et al. Generating virtual microphone signals using geometrical information gathered by distributed arrays
Ding et al. DOA estimation of multiple speech sources by selecting reliable local sound intensity estimates
Vryzas et al. Embedding sound localization and spatial audio interaction through coincident microphones arrays
Ahonen et al. Broadband direction estimation method utilizing combined pressure and energy gradients from optimized microphone array
Trinkle et al. Histogram based DoA estimation for speaker localisation in reverberant environments