JPWO2007026827A1 - マイクロホンアレイ用ポストフィルタ - Google Patents

マイクロホンアレイ用ポストフィルタ Download PDF

Info

Publication number
JPWO2007026827A1
JPWO2007026827A1 JP2007533331A JP2007533331A JPWO2007026827A1 JP WO2007026827 A1 JPWO2007026827 A1 JP WO2007026827A1 JP 2007533331 A JP2007533331 A JP 2007533331A JP 2007533331 A JP2007533331 A JP 2007533331A JP WO2007026827 A1 JPWO2007026827 A1 JP WO2007026827A1
Authority
JP
Japan
Prior art keywords
filter
noise
post
post filter
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007533331A
Other languages
English (en)
Other versions
JP4671303B2 (ja
Inventor
正人 赤木
正人 赤木
軍鋒 李
軍鋒 李
上地 正昭
正昭 上地
佐々木 和也
和也 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Advanced Institute of Science and Technology
Toyota Motor Corp
Original Assignee
Japan Advanced Institute of Science and Technology
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Advanced Institute of Science and Technology, Toyota Motor Corp filed Critical Japan Advanced Institute of Science and Technology
Publication of JPWO2007026827A1 publication Critical patent/JPWO2007026827A1/ja
Application granted granted Critical
Publication of JP4671303B2 publication Critical patent/JP4671303B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

音声信号を入力する少なくとも2つのマイクロホンからなるマイクロホンアレイ(10)と、前記マイクロホンアレイから入力された音声信号の成形を行うビーム成形器(13)と、前記マイクロホンアレイから入力された雑音を含む目的音を所定の周波数で少なくとも2つの周波数帯域に分割する分割器(14)と、前記マイクロホン間で雑音が無相関である場合のフィルタゲインを推定する第1のフィルタ(20)と、前記マイクロホンアレイ中の1本のマイクロホンあるいはマイクロホンアレイの平均信号のフィルタゲインを推定する第2のフィルタ(30)と、前記第1のフィルタと前記第2のフィルタからの出力を加算する加算器(40)と、前記加算器と前記ビーム成形器からの出力に基づいて雑音を低減する手段(41)とを備えた。

Description

本発明は、マイクロホンアレイ用ポストフィルタに関する。
利便性と柔軟性故に、携帯電話や自動音声認識システムのような多くのアプリケーションに対してハンズフリー技術が望ましい。この技術おける重要な問題の1つとして、遠方のマイクロホンで受信された信号の信頼性が様々な種類の雑音で著しく低下するという問題がある。この問題の解決法として、所定の方向以外の方向から届く雑音信号を抑圧するためにマイクロホンアレイを用いた空間フィルタリングを使用することが考えられる。マイクロホンアレイは、高品質な音声をもたらし、雑音の減少にかなりの優位性を持つ。
最近、下記のような提案がなされている(文献1:J. Bitzer, K.U. Simmer and K.-D. Kammeyer, "Multi-Microphone Noise Reduction Techniques as Front-end Devices for Speech Recognition," Speech Communication, vol. 34, pp. 3-12, 2001. 参照)。この提案では、所望の音声信号と雑音信号の間の相関を無相関と仮定したとき、マルチチャンネル・ウィナーフィルタは,広帯域の入力に対して出力の二乗誤差を最小とする最適解となることが示されている。そして、マルチチャンネル・ウィナーフィルタは、更に、最小変位無歪応答(MVDR:Minimum Variance Distortionless Response)ビーム成形器とそれに続くウィナー・ポストフィルタに分解することができることが示されている。一般に、マルチチャンネル・ウィナーフィルタは、MVDRビーム成形器のみを用いた場合よりも高いSN比で出力を生成する。したがって、実用的な雑音環境においては,付加的なポストフィルタリングが、マイクロホンアレイの性能を向上させるのに必要となる。
上記のポストフィルタリングに関して、さまざまなポストフィルタリング技術が提案されている(文献2:R. Zelinski, "A microphone array with adaptive post-filtering for noise reduction in reverberant rooms," in Proc. IEEE Int. Conf. on Acoustic, Speech, Signal Processsing, vol. 5, pp. 25782581, 1988.、文献3:I. A. McCowan and H. Bourlard, "Microphone Array Post-filter Based on Noise Field Coherence," IEEE Trans. on Speech and Audio Processing, vol. 11, no. 6, pp. 709-716, 2003.、文献4:I. Cohen and B. Berdugo, "Microphone Array Post-filtering for Non-Stationary Noise Suppression," in Proc. IEEE Int. Conf. Acoustic Speech Signal Processing, pp. 901-904, May 2002.、及び文献5:I. Cohen, "Multi-Channel Post-filtering in Non-Stationary Noise Environments," IEEE Trans. Signal Processing, Vol. 52, No. 5, pp. 1149-1160, 2004.参照)。広く使用されている1つのマルチチャンネル・ポストフィルタが、最初に、ゼリンスキーによって提案されている。このポストフィルタ(以下、「ゼリンスキー・ポストフィルタ」と称する)は、異なるマイクロホン間における雑音が完全に無相関であるような雑音場を仮定している。しかし、この仮定は実際の環境では、特にマイクロホンが近接している場合や雑音間の相関が高い低周波数域では、めったに満たされることがない。
高い相関を示す雑音を抑制するために、一般化されたサイドローブ除去器(GSC)をゼリンスキー・ポストフィルタに結合することも提案されている(文献6:S. Fischer, K. D. Kammeyer, and K. U. Simmer, "Adaptive Microphone Arrays for Speech Enhancement in Coherent and Incoherent Noise Fields," in Proc 3rd joint meeting of the Acoustical Society of America and the Acoustical Society of Japan, Honolulu, Hawaii, 1996.参照)。しかしながら、GSCとゼリンスキー・ポストフィルタのいずれも低周波数領域での振る舞いが良くないと指摘されている。このため、高周波での低相関雑音成分を低減するためにゼリンスキー・ポストフィルタを適用し、低周波数での高相関雑音成分を低減するのにスペクトル減算を行うことが提案されている(文献7:J. Meyer and K. U. Simmer, "Multi-channel speech enhancement in a car environment using Wiener filtering and spectral subtraction," in Proc. IEEE Int. Conf. on Acoustic, Speech, Signal Processsing, Munich, Germany, pp. 21-24, 1997.参照)。しかしながら、この提案は、マルチチャンネル・ウィナー・ポストフィルタの基本的な構成に矛盾すると共に、スペクトル減算を実行するのに音声アクティビティ検出器(VAD)が必要になる。
以下、マルチチャンネル・ウィナー・ポストフィルタについて説明し、解決すべき課題について説明する。その後、ゼリンスキー・ポストフィルタとまた、その比較に使用するマックコウワン・ポストフィルタについて説明する。
雑音下の環境でM個のセンサを有するマイクロホンアレイの場合、m番目の観測信号Xm(t)は2つの成分からなっている。1番目の信号は、所望の音源とm番目のセンサ間のインパルス応答で変換された所望の信号である。2番目の信号は、付加的な雑音nm(t)である。これから、受信信号は、(1)式で与えられる。
m(t) = s(t) * am(t) + nm(t) … (1)
ここで、m=1、2、・・・、M、であり、*は畳み込み演算子である。短時間フーリエ変換(STFT)を適用すると、以下のように、時間−周波数領域の観測された信号を表すことができる。
X(k,l) = S(k,l)A(k) + N(k,l) … (2)
ここで、kが周波数インデックスであり、lがフレームインデックスである。
T(k,l) = [X1(k,l), X2(k,l), …, XM(k,l)] … (3)
T(k,l) = [A1(k,l), A2(k,l), …, AM(k,l)] … (4)
T(k,l) = [N1(k,l), N2(k,l), …, NM(k,l)] … (5)
ここでの目的は,観測された雑音を含む信号から所望の信号を推定することである。行列表現を使用すれば、推定出力信号T(k,l)は、下記の式で与えられる。
T(k,l) = WH(k,l)X(k,l) ... (6)
ここで、W(k,l)が重み係数であり、上付き文字Hが複素共役転置である。
所望の信号とその推定の間の平均自乗誤差を最小にすることを要請すると、最適な重み係数が得られ、マルチチャンネル・ウィナーフィルタが得られることになる。所望の信号と雑音信号が互いに無相関であると仮定すれば、さらにマルチチャンネル・ウィナーフィルタをMVDRビーム成形器とウィナー・ポストフィルタとに分解することができる。
Figure 2007026827
(7)式において、第1項がMVDRビーム成形器の項で、第2項がウィナー・ポストフィルタの項である。MVDRビーム成形器は、所定の方向に対して所望の信号の無歪MMSE推定を行う。ウィナー・ポストフィルタでさらに残りの雑音を低減することにより、雑音低減能力を改良して、高SN比を生成することができる。
MVDRビーム成形器としては、フロストのビーム成形器(文献8:O. L. Frost, "An algorithm for linearly constrained adaptive array processing," in Proc. IEEE, vol. 60, pp. 926-935, 1972.参照)や一般化されたサイドローブキャンセラ(GSC)などのいくつかの適応型アルゴリズム、および拡散雑音場の仮定のもとで超指向型ビーム成形器などのいくつかの非適応型アルゴリズムが提案されている。
以下の議論では、一般性を失わない範囲で、マイクロホンアレイが所望の信号方向に向かって事前に配置されており、各マイクロホンの上の同じ所望の音声信号を処理するためにマルチチャンネル入力がスケーリングされていると仮定する。このとき、時間遅れ補償出力は次のようになる。
Xm(k,l) =S(k,l) + Nm(k,l) (m = 1, 2, …, M) … (8)
以下、ゼリンスキー・ポストフィルタとマックコウワン・ポストフィルタと呼ばれる2個のポストフィルタに対して、簡単に説明する。
ゼリンスキー・ポストフィルタは、推定された自己相関及び相互相関スペクトル密度を用いて,雑音が完全に無相関である雑音場においてウィナー・フィルタの解決策を提供している。所望の信号と雑音信号が無相関であり、雑音は同一のパワー密度を持つが異なるマイクロホン間で無相関であれば、マルチチャンネル入力の自己及び相互相関スペクトル密度φxixi(k,l)とφxixj(k,l))を単純化することができる。
φxixi (k,l) =φss(k,l) +φnn(k,l) … (9)
φxixj (k,l) =φss(k,l) … (10)
自己及び相互相関スペクトル密度の簡易的な表現(式(9)および(10))に基づいて、ゼリンスキー・ポストフィルタを定式化することができる。
Figure 2007026827
ここで、実数R{}と(すべてのセンサ対にわたっての)平均演算は、推定誤りに対してこのポストフィルタの頑健性を向上させるのに寄与する。自己及び相互相関スペクトル密度はスケーリングされたマイクロホン信号で推定される。
しかし、実際には、各マイクロホンにおける雑音が無相関であるというゼリンスキー・ポストフィルタの基本的な仮定は実用的な環境ではめったに満たされていない。この事実を考慮して、マックコウワンは、各マイクロホンにおける雑音が無相関であるという仮定を緩和し,各マイクロホンにおける雑音は同じパワースペクトル密度を持つとともにお互い関係しており,相関の大きさはコヒーレンス関数で与えられるという仮定を設けた.
そして、所望のスピーチ信号と雑音信号間は無相関であるという仮定と,緩和された雑音間の相関の仮定の下で,マルチチャンネルの自己及び相互相関スペクトル密度は後述する式によって与えられる。ここで、Γninj(k,l)は、複素コヒーレンス関数(式(17)に後述)である。
φxixi (k,l)、φxjxj(k,l)、およびφxixj (k,l)は下記のように簡素化することができる。
φxixi (k,l) =φss(k,l) + φnn(k,l) … (12)
φxjxj (k,l) =φss(k,l) + φnn(k,l) … (13)
φxixj (k,l) =φss(k,l) + Γninj(k,l)φnn(k,l) … (14)
そして、これらの表現に基づいて、ウィナー・ポストフィルタの分子項であるスピーチパワーのスペクトル密度φss_(k,l)を表すことができる。
Figure 2007026827
マックコウワン・ポストフィルタは、
Figure 2007026827
で表すことができる。マックコウワン・ポストフィルタはオフィスでのマルチチャンネル録音を使用することを前提としており,この環境においてゼリンスキー・ポストフィルタと比べて、改良された性能を達成するために提案されているが、予め想定されたコヒーレンス関数と実際のコヒーレンス関数との間に差が存在していると、性能は下がることが予想される。
本発明は、拡散雑音場におけるハイブリッド構造を有する新規のポストフィルタを提供することを目的とする。
反響している部屋や車室内環境などのように、拡散雑音場が多くの実用的な雑音環境に対する合理的なモデルとして提案されている。拡散雑音場では、低周波雑音は高相関であり、高周波雑音は低相関である。これらの特性を考慮して、本発明では、高周波(低相関である)雑音用のマルチチャンネル・ウィナー・ポストフィルタと低周波数(高相関である)雑音用のシングルチャンネル・ウィナー・ポストフィルタを適用する。高周波では、異なるマイクロホン対で雑音の間の相関関係を十分に考慮・利用する修正ゼリンスキー・ポストフィルタを採用する。低周波数では、判定指向型SN比推定メカニズムによる、「ミュージカル雑音」をより低減させるシングルチャンネル・ウィナー・ポストフィルタを採用する。本発明に係るポストフィルタは、理論上、マルチチャンネル・ウィナー・フィルタの基本的な構成に従っており、拡散雑音場における高相関雑音及び低相関雑音を効果的に減少することができる。
本発明の局面に係るポストフィルタは、音声信号を入力する少なくとも2つのマイクロホンからなるマイクロホンアレイと、前記マイクロホンアレイから入力された音声信号の成形を行うビーム成形器と、前記マイクロホンアレイから入力された雑音を含む目的音を所定の周波数で少なくとも2つの周波数帯域に分割する分割器と、前記マイクロホン間で雑音が無相関である場合のフィルタゲインを推定する第1のフィルタと、前記マイクロホンアレイ中の1本のマイクロホンあるいはマイクロホンアレイの平均信号のフィルタゲインを推定する第2のフィルタと、前記第1のフィルタと前記第2のフィルタからの出力を加算する加算器と、前記加算器と前記ビーム成形器からの出力に基づいて雑音を低減する手段とを具備する。
周波数に対する完全な拡散雑音場のMSC関数を示す図である。 本発明に係るポストフィルタのブロック図である。 修正ゼリンスキー・ポストフィルタの概略構成を示すブロック図である。 シングルチャンネル・ウィナー・ポストフィルタの概略構成を示すブロック図である。 指向係数と周波数との関係を示す図である。 様々なSNRレベルにおける2つの雑音状態で計算された平均したSEGSNRの実験結果を示す図である。 様々なSNRレベルにおける2つの雑音状態で計算された平均したSEGSNRの実験結果を示す図である。 様々なSNRレベルにおける2つの雑音状態で計算された平均したNRの実験結果を示す図である。 様々なSNRレベルにおける2つの雑音状態で計算された平均したNRの実験結果を示す図である。 様々なSNRレベルにおける2つの雑音状態で計算された平均したLSDの実験結果を示す図である。 様々なSNRレベルにおける2つの雑音状態で計算された平均したLSDの実験結果を示す図である。 100km/hのスピード下における車の環境における音声スペクトログラムの典型的な「どうぞよろしく」という日本文に対応する測定例を示す図である。 100km/hのスピード下における車の環境における音声スペクトログラムの典型的な「どうぞよろしく」という日本文に対応する測定例を示す図である。 100km/hのスピード下における車の環境における音声スペクトログラムの典型的な「どうぞよろしく」という日本文に対応する測定例を示す図である。 100km/hのスピード下における車の環境における音声スペクトログラムの典型的な「どうぞよろしく」という日本文に対応する測定例を示す図である。 100km/hのスピード下における車の環境における音声スペクトログラムの典型的な「どうぞよろしく」という日本文に対応する測定例を示す図である。 100km/hのスピード下における車の環境における音声スペクトログラムの典型的な「どうぞよろしく」という日本文に対応する測定例を示す図である。 100km/hのスピード下における車の環境における音声スペクトログラムの典型的な「どうぞよろしく」という日本文に対応する測定例を示す図である。 100km/hのスピード下における車の環境における音声スペクトログラムの典型的な「どうぞよろしく」という日本文に対応する測定例を示す図である。
図面を参照して本発明の実施の形態を説明する。下記の説明において、まず、モデル雑音場におけるコヒーレンス関数とその適用について説明する。そして、拡散雑音場におけるハイブリッドポストフィルタを説明し、最終的に、本発明に係るポストフィルタの利点を説明する。
雑音場を特徴付けるために、以下の式で定義された複素コヒーレンス関数が広く使用されている。
Figure 2007026827
ここで、φxixj (k,l)が2つの信号xi(t)とxj(t)の間の相互相関スペクトル密度、φxixi (k,l)とφxjxj (k,l)は、それぞれxi(t)とxj(t)の自己相関スペクトル密度である。別の重要な手段である振幅自乗相関(MSC:magnitude-squared coherence)関数は、雑音場を分析するのに本明細書で使用されるMSC(k,l)=|Γxixj (k,l)|によって与えられる複素コヒーレンス関数の振幅の自乗として定義される。
本明細書の基本的な仮定の1つである拡散雑音場は、多くの実際の雑音環境に対する合理的なモデルとして示されている。拡散雑音場は以下のMSC関数によって特徴付けられる。
Figure 2007026827
ここで、dは隣接したマイクロホンの距離であり、cは音速である。周波数に対する完全な拡散雑音場のMSC関数を図1に示す。図1から、下記のような拡散雑音場のいくつかの特性を容易に求めることができる。
1.MSC関数は、周波数に依存し、時間に依存しない関数である。
2.異なるマイクロホンにおける雑音は低周波数で高相関であり、高周波数で低相関である。
スペクトルを低相関部と高相関部に分割するために、2つの領域を分ける遷移周波数ftはft=c/(2d)で与えられる第1の最小値として選ばれている。明らかに、音速cが定数であるとみなされるので、遷移周波数は単に2個のマイクロホンの間の距離dによって決定される。
本発明に係るポストフィルタを定式化するために、下記のような仮定を行うものとする。
(1)所望の音声信号と雑音信号は各マイクロホンで無相関である。
(2)雑音のパワースペクトル密度は各マイクロホンで同じである。
(3)異なるマイクロホンにおける雑音は拡散雑音である。
実際は、仮定(1)は通常音声信号処理で使われ、そして、仮定(2)と(3)は、多くの実際の雑音環境で実現することが確かめられている。
以下の説明では、ポストフィルタの雑音低減性能を高めるためのハイブリッドポストフィルタについて説明する。ポストフィルタとして、高周波領域の修正ゼリンスキー・ポストフィルタと低周波数領域のシングルチャンネル・ウィナー・ポストフィルタを適用する。図2は、本発明に係るポストフィルタのブロック図である。また、図3は、修正ゼリンスキー・ポストフィルタの概略構成を示すブロック図であり、図4は、シングルチャンネル・ウィナー・ポストフィルタの概略構成を示すブロック図である。
図2に示すように、本発明に係るポストフィルタは、マイクロホンアレイ10(以下、単に「マイクロホン」とも称する)と、高速フーリエ変換器11と、時間整合器12と、ビーム成形器13と、周波数帯分割器14と、修正ゼリンスキーフィルタゲイン推定器20(修正ゼリンスキー・ポストフィルタ)と、シングルチャンネル・フィルタゲイン推定器30と、加算器40と、フィルタ41と、遅延器42と、逆高速フーリエ変換器50とを備えている。
図3に示すように、修正ゼリンスキーフィルタゲイン推定器20は、相互相関スペクトル密度演算器21と、平均化器22と、自己相関スペクトル密度演算器23と、平均化器24と、除算器25とを備えている。また、図4に示すように、シングルチャンネル・フィルタゲイン推定器30は、平均化器31と、雑音変位更新器32と、ポステリオリSNR演算器33と、遅延器34と、プリオリSNR演算器35と、SAP演算器36と、シングルチャンネル・ウィナーフィルタ・ゲイン推定器37(シングルチャンネル・ウィナー・ポストフィルタ)とを備えている。
上記のような構成において、各マイクロホン10における雑音が互いに無相関であるという仮定に基づき、無相関の雑音場での音声とその推定の間の平均自乗誤差を最小にすることが必要である。上記のように、マルチチャンネル入力の自己及び相互相関スペクトル密度には、相関雑音成分が含まれる。従って、マルチチャンネル入力の自己及び相互相関スペクトル密度を推定するのに使用される雑音相関が小さければ、性能低下が抑えられると考えられる。
図1に示すように、拡散雑音場において、異なるマイクロホンの互いに無相関雑音成分は、遷移周波数ft以上の周波数にのみ存在する。マイクロホンの間の距離に応じて遷移周波数が決定しているので、異なった相互素子間隔を有するマイクロホンは異なった遷移周波数によって特徴付けられる。すなわち、異なった相互素子間隔を有する異なるマイクロホンでは、無相関雑音は異なった周波数領域で見られる。更に、ある周波数に対して、雑音は、限られたマイクロホンのみについて互いに無相関であり、一般にすべてのマイクロホンではそうではない。これにより、当該マイクロホン対上のマルチチャンネル入力の自己及び相互相関スペクトル密度を計算することによって修正ゼリンスキー・ポストフィルタを得ることができる。具体的には、以下の通りである。
マイクロホンアレイのマイクロホン配置に従って、予め遷移周波数を決定しておく。具体的には、距離dijで離間されたセンサiとj(i、j≦M)との間に相互素子間隔を有するMセンサアレイを考慮すると、M(M−1)/2の遷移周波数を決定するM(M−1)/2のマイクロホン対を有している。このとき、遷移周波数は、それぞれft,ij=c/(2dij)で計算することができる。なお、この場合において、いくつかのマイクロホン対について相互素子間隔が同じであるので、遷移周波数も同じである。例えば、M本のマイクロホンが直線上に等間隔で並んでいる場合には、M(M−1)/2個のマイクロホンの中では、(M−1)の異なった相互素子間隔を持っているので、ft 1、ft 2、・・・、ft M-1によって示される(M−1)個の異なる遷移周波数が決定できる。なお、一般性を失うことがなければ、遷移周波数間の関係が、ft 1<ft 2<・・・<ft M-1であるものとさらに仮定しても良い。なお、M本のマイクロホンを等間隔に並べない、あるいは直線上に並べないのならば、M(M−1)/2個のマイクロホン対すべてを異なる間隔で並べることも可能であり、この場合には、遷移周波数はM(M−1)/2個選べることになる。
マイクロホン10から入力した例えば音声は、高速フーリエ変換器11でフーリエ変換される。フーリエ変換後の信号は、時間整合器12で、各マイクロホン10間の同一音声に対する入力信号の時間のずれが補正される。なお、この場合において、高速フーリエ変換器11と時間整合器12による処理は順序が逆であっても良い。
次に、時間的整合が施された音声信号は周波数帯分割器14に入力し、周波数帯分割器14は、(M−1)個の異なった遷移周波数ft 1、ft 2、・・・、ft M-1で全周波数帯をB、B、・・・BM−1のM個のサブバンドに分割する。M個のサブバンドのうちB、・・・BM−1の(M−1)個のサブバンドは、修正ゼリンスキーフィルタゲイン推定器20に入力する。また、時間的整合が施された音声信号は、ビーム成形器13にも入力し、ビーム成形されてフィルタ41に入力する。
修正ゼリンスキーフィルタゲイン推定器20に入力した(M−1)個のサブバンドについて、相互相関スペクトル密度を相互相関スペクトル密度演算器21で演算して、平均化器22でその平均値を求める。なお、平均化器22で平均化する場合、すべての入力に対してではなく、その帯域で雑音が無相関であるマイクロホン対での自己相関(相互相関)スペクトル密度を選んで平均化する。また、自己相関スペクトル密度を自己相関スペクトル密度演算器23で演算して、平均化器24でその平均値を求める。なお、相互相関スペクトル密度演算器21と自己スペクトル密度演算器23における雑音信号のスペクトル密度は次のように求められる。
サブバンドB(1≦m≦M−1)の各周波数に対して、組Ωmのマイクロホン対における雑音が、非相関であると仮定する。この場合において、
φxixi (k,l)=φss(k,l)+φnn(k,l) … (19)
φxixj (k,l)=φss(k,l) … (20)
により、マルチチャンネル入力の自己及び相互相関スペクトル密度が与えられ、これらのスペクトル密度から、所望のスピーチと雑音信号のスペクトル密度が推定できる。
そして、平均化器22と24で平均化された自動及び重なりスペクトル密度が、除算器25で除算演算されて高周波数帯におけるフィルタゲイン(利得関数)が出力される。ここにおいて、ゼリンスキー・ポストフィルタでは、すべてのマイクロホン対での自己相関(相互相関)スペクトル密度を平均してフィルタのゲインを求めているため、雑音の相関が高い(仮定からはずれている)ところのデータも含まれてしまう。このため,結果としてフィルタゲインの推定が頑健ではなくなる。一方、修正ゼリンスキー・ポストフィルタでは、雑音の相関が低い(仮定からはずれていない)データのみを選んで組Ωmとして,その中で平均を行っているので。頑健性が高くなっている。ここで、修正ゼリンスキー・ポストフィルタの利得関数は下記のように与えられる。
Figure 2007026827
なお、上記の説明において、遷移周波数の決定は、マイクロホンアレイの配置のみに依存し、入力信号には依存しない。また、自己及び相互相関スペクトル密度の推定手順に含まれるマイクロホン対の選択が、修正ゼリンスキー・ポストフィルタの計算コストの減少に寄与する。
一方、各マイクロホン10からのサブバンドBは、シングルチャンネル・フィルタゲイン推定器30に入力する。すべてのマイクロホン対における雑音が高相関であれば、修正ゼリンスキー・ポストフィルタを用いたとしても,マルチチャンネル入力の自己および相互相関スペクトル密度から所望の音声信号の自己相関スペクトル密度を推定することができない。従って、低周波数では、ウィナー・ポストフィルタを推定するためにシングル・チャンネルの技術を採用することになる。
まず、シングルチャンネル・フィルタゲイン推定器30に入力したサブバンドBは、平均化器31で、チャンネル間で平均化される。平均化されたサブバンドBは、雑音変位更新器32とポステリオリSNR演算器33とに入力する。雑音変位更新器32は、平均化器31とSAP演算器36からの信号に基づいて更新処理を行って、ポステリオリSNR演算器33と遅延器34とに推定雑音スペクトルを出力する。ポステリオリSNR演算器33からプリオリSNR演算器35は、詳細は後述する各種演算を実行する。シングルチャンネル・ウィナーフィルタ・ゲイン推定器37は、プリオリSNR演算器35からの信号に基づいて、低周波数帯におけるフィルタゲイン(利得関数)を出力する。
上記のような構成において、ウィナー・ポストフィルタの利得関数は以下のように書き換えることができる。
Figure 2007026827
アプリオリSNR演算器35で演算されるアプリオリSNR(SNRpriori(k,l))の推定は、下記のような、判定指向性推定メカニズで更新される。
Figure 2007026827
(23)式において、α(0<α<1)は忘却係数であり、SNRpost(k,l)は、ポステリオリSNR演算器33で演算されるアポステリオリSNRであり、SNRpost(k,l) = |X(k,l)|2 / E[|N(k,l)|2]で表される。これにより、上記のような判定指向性推定メカニズムは、「ミュージカル雑音」をかなり減少させる。
ここで、シングルチャンネル・ウィナー・ポストフィルタの性能を向上させるために、きわめて重要な点は、雑音のパワーのスペクトル密度E[|N(k,l)|2]を高精度で推定することである。この雑音のパワーのスペクトル密度は、下記のような柔決定ベースアプローチで実行される。
E[|N(k,l)|2] =βE[|N(k,l)|2] + (1-β)E[|N(k,l)|2|X(k,l)] … (24)
(24)式において、β(0<β<1)は、雑音推定の更新率を制御する忘却係数である。
音声の存在が不確定である状況では、(24)式の右辺における第2項は式(25)を用いて観測された信号のスペクトル密度として推定される.
E[|N(k,l)|2|X(k,l)] = q(k,l)|X_(k,l)|2 + (1-q(k,l))E[|N(k,l-1)|2] … (25)
(25)式において、q(k,l)がスピーチ不存在確率、|X_(k,l)|2は、各センサにおける個々の雑音のスペクトル密度の平均である。なお、
Figure 2007026827
である。このように、各センサにおける個々の雑音のスペクトル密度の平均を計算する理由は、1個のセンサだけを考えると、推定誤りに起因する偏った測定を生じる可能性があるからである。複素ガウス統計値モデルを仮定し、ベイズの定理と、確率総和の定理を適用すると、下記の式によりスピーチ不存在確率が与えられる。
Figure 2007026827
(26)式において、q'(k,l)は、アプリオリなスピーチ不存在確率であり,実験により適当な値を選択する。
上記のようにして求められた高周波数帯及び低周波数帯におけるフィルタゲイン(利得関数)を加算器40で加算して、加算結果をフィルタ41に出力する、フィルタ41は、ビーム成形器13と加算器40の出力から高周波数帯及び低周波数帯における雑音を低減した信号を遅延器42と逆高速フーリエ変換器50に出力する。逆高速フーリエ変換器50は、入力信号を逆フーリエ変換して、後段の例えば、音声認識装置などに出力する。また、遅延器42に出力された信号は、シングルチャンネル・フィルタゲイン推定器30における利得関数の算出に使用される。
本発明に係るポストフィルタは、理論上、マルチチャンネル・ウィナー・ポストフィルタの枠組みに従っており、まさにウィナー・ポストフィルタといえる。低周波数領域において、(22)式で与えられたポストフィルタは、明らかにウィナーフィルタである。高周波領域では、修正ゼリンスキー・ポストフィルタで推定されるのに使用される雑音が、無相関であるので、マルチチャンネル入力の相互相関スペクトル密度が、より正確なスピーチの自己スペクトル密度推定を提供する。従って、高周波領域に採用された修正ゼリンスキー・ポストフィルタはウィナー・ポストフィルタとみなせる。
上記のように構成された本発明に係るポストフィルタが、最適なマイクロホンアレイ用ポストフィルタとして、より一般的な表現を提供していることは注目すべきである。完全に無相関の雑音場では、本発明に係るポストフィルタが、遷移周波数をゼロに設定するだけで、ゼリンスキー・ポストフィルタになる。そして、完全に全雑音が相関を持つ雑音場では、本発明に係るポストフィルタの遷移周波数を最も高い周波数に設定するだけで、シングルチャンネル・ウィナー・ポストフィルタになる。
拡散雑音場における本発明に係るポストフィルタの有効性を確認するために、様々な車の雑音環境で、ゼリンスキー・ポストフィルタ、マックコウワン・ポストフィルタ、および単一のシングルチャンネル・ウィナー・ポストフィルタを含む他の従来のポストフィルタと比較した。ビーム成形器は、最初に、マルチチャンネル雑音信号に適用される。そして、ビーム成形器出力は本発明に係るポストフィルタによってさらに機能アップされる。性能は客観的および主観的な手段で評価される。
実験の構成は以下のとおりである。
本発明に係るポストフィルタの性能を実際の車の環境で推定するために、10cmの相互素子間隔を有する3個のマイクロホンからなる等しい間隔をおいたリニアアレイを、車のサンバイザ上に取り付けた。アレイが約50cmドライバーから離れ、ドライバーの正面になるようにした。
マルチチャンネル雑音録音は、車が50km/hと100km/hの速度で高速道路を走行中に全てのチャンネルで同時に行った。雑音は、主にエンジン雑音や、空調雑音や、タイヤと道路の間の摩擦からの雑音からなっている。50個の日本文から成るクリアな音声信号をATRデータベースから取り出した。音声と雑音信号の両方を、最初に、16ビットの精度で12kHzに再抽出した。クリアな音声信号と実際のマルチチャンネル車内雑音とを異なるグローバルSNRレベル(−5、20)dBで人工的に混合させることによりマルチチャンネル雑音信号を生成した。この生成手順には、以下の利点がある。
(1)理想的な時間遅れ補償が行われたことと見なせる。
(2)混入条件が明確に測定されるので、容易に客観的な手段を使用する性能推定を行うことができる。
図1に示された理論sinc関数と実際の雑音録音から計算された測定MSC関数とを比較することによって、拡散雑音場の有効性を調査した。図1から、瞬時的な変化は存在するが、その一方で、測定MSC関数が理論sinc関数の傾向に追随していることがわかる。この値は、本発明に係るポストフィルタで使用される拡散雑音場の仮定を充たす。
ビーム成形フィルタは、拡散雑音場におけるMVDRビーム成形器の解決策である超指向性ビーム成形器で実現される。周波数kに関する関数である超指向性ビーム成形器の利得関数は、
Figure 2007026827
であり、拡散雑音源に対してアレイの雑音低減能力を示す指向係数(DI)は、
Figure 2007026827
で表され、この指向係数と周波数との関係を図5に示す。図5から明らかに、超指向性ビーム成形器は低周波数雑音成分を抑制するのに効果がないことがわかる。
本発明に係るポストフィルタを客観的に推定するために、セグメントSNR(SEGSNR)、雑音低減比(NR)、およびログスペクトル距離(LSD)の下記の3つの客観的な音声品質測定を使用した。
セグメントSNR(SEGSNR)は、雑音低減と音声強調アルゴリズムのために広く使用されている客観的な推定手段である。SEGSNRは、クリアな音声のパワーと,雑音を含む音声に含まれる雑音信号または提案するアルゴリズムによって雑音を低減した信号に含まれる雑音信号の比率として定義され、以下のように与えられる。
Figure 2007026827
ここで、s()、s_()は、テストされたアルゴリズムで処理された参照音声信号と雑音信号を抑圧した信号である。また、LとKは信号のフレームの数とフレーム(STFTの長さと等しい)あたりのサンプルの数を表す。
雑音低減比(NR)は、提案したアルゴリズムの雑音低減性能を推定するのに使用されている。音声がないとき、NRは雑音を含む入力のパワーと強調された信号のパワーの比率と定義され、以下の式で表される。
Figure 2007026827
ここで、Φは、音声がないフレームのセットを表し、|Φ|は濃度である。X(k,l)とs_(k,l)は、それぞれ雑音信号と強調されたた音声信号(enhanced signal)である。
ログスペクトル距離(LSD)は、所望の音声信号のひずみを推定するのにしばしば使用される。LSDは、クリアな音声の対数スペクトルと雑音信号のそれ又は提案したアルゴリズムによって強調された信号の対数スペクトルとの距離として定義され、以下のように与えられる。
Figure 2007026827
ここで、Ψは音声が存在するフレームの組を示しており、|Ψ|はその基数である。S(k,l)とS_(k,l)はそれぞれ参照クリア信号と強調された音声信号のスペクトルである。
2つの雑音状態(50 km/hと100 km/h)において様々なSNRレベルで計算された平均SEGSNRとNRの結果を、それぞれ図6Aから図7Bに示す。また、LSDの結果を図8に示す。実験結果の値はそれぞれの雑音状態のすべてのセンテンスにわたって平均された。性能はマイクロホン録音、ビーム成形器出力、および本発明に係るポストフィルタの出力のときに推定された。なお、図6A、図7A、及び図8Aが50km/hでの走行時、図6B、図7B、及び図8Bが100km/hでの走行時である。また、図中の記号は、四角がビーム成形器の出力、ひし形がゼリンスキー・ポストフィルタの出力、プラスがマックコウワン・ポストフィルタの出力、三角がシングルチャンネル・ウィナー・ポストフィルタの出力、丸が本発明に係るポストフィルタの出力を示し、図8における×印が何も処理を加えていない録音されたままの信号の平均対数スペクトル距離(LSD)である。
図6Aから図7Bに示すように、ビーム成形器単独かつゼリンスキー・ポストフィルタは、低周波雑音成分を抑制する際に十分な性能を示さず、SEGSNR改良と雑音低減結果を提供しない。これは前述した説明を確認する結果を示している。雑音場の適切なコヒーレンス関数をパラメータとしたマックコウワン・ポストフィルタはSEGSNRをかなり改良する。しかし、すべての雑音状態において,ゼリンスキーおよびマックコウワン・ポストフィルタと比べて、シングルチャンネル・ウィナー・ポストフィルタはより高いSEGSNRとNRの改善を示している。そして、本発明に係るポストフィルタは、すべてのテスト条件において,シングルチャンネルポストフィルタと同等のSEGSNRとNRを与え、最も高い性能を示している。
図8A及び図8BのLSDの結果に関して、ビーム成形器のみおよびゼリンスキー・ポストフィルタは,フィルタを使わない場合に比べてすべてのSN比にわたってLSDを減少させている.シングルチャネルウィナーポストフィルタは,低SNRにおいて音声の歪みを低減しているが,高SNRでは逆に歪みを増大させている.提案法とマックコウワン・ポストフィルタは,SN比レベルの大部分で最も低いLSDを示している。
本発明に係るポストフィルタの主観的性能評価は、音声スペクトログラムを使用すること,および,非公式の試聴テストによって有効に行われた。100km/hのスピード下における車内環境での「どうぞよろしく」という日本文に対応する音声スペクトログラムの典型的な測定例を図9Aから図9Hに示す。図9Aから図9Cはそれぞれ第1のマイクロホンでのオリジナル・クリーン音声信号と、第1のマイクロホンでの雑音信号と、第1のマイクロホンでの雑音信号(SNR=10dB)を示している。図9Dは、ビーム成形器の出力である.図5に示すように低周波数において雑音抑圧に弱点があるため,大きな低周波雑音が存在する。また、図9Eに示すゼリンスキー・ポストフィルタの出力は,低周波数領域における雑音の高相関特性のために低周波数において非常に限られた性能を提供することを示している。図9Fは、マックコウワン・ポストフィルタが低周波数領域においても雑音を抑圧するのを示している。しかし、想定したコヒーレンス関数と実際のコヒーレンス関数間の違により残存雑音が存在する。シングルチャンネル・ウィナー・ポストフィルタは図9Gに示されるように音声ひずみをもたらす。図9Hは、本発明に係るポストフィルタであって、音声ひずみを付加することなしに拡散性雑音を抑圧することができることを示す。非公式の聴取テストでは,他のものと比べて本発明に係るポストフィルタの優越を立証した。
上記のように、実用的な環境における本発明に係るポストフィルタの基本仮定(拡散雑音場)がゼリンスキー・ポストフィルタ(無相関の雑音場)のものより合理的であるので、本発明に係るポストフィルタはゼリンスキー・ポストフィルタより優れている。さらに、本発明に係るポストフィルタは低周波数の高相関雑音成分を減少させるのに成功している。
マックコウワン・ポストフィルタは雑音場のコヒーレンス関数に基づいて決定される。したがって、性能は仮定されたコヒーレンス関数の精度に大いに依存している。仮定と実際のコヒーレンス関数との違いは性能劣化をもたらす。しかしながら、本発明に係るハイブリッドポストフィルタは、相関及び無相関雑音を区別するために遷移周波数のみを利用しており,コヒーレンス関数の実際の瞬時値にかかわらず、コヒーレンス関数の間の誤りに起因する効果を軽減している。
本発明に係るハイブリッドポストフィルタは全周波数帯で使用されるシングルチャンネル・ウィナー・ポストフィルタより優れている。雑音の特性の測定値に基づくシングルチャンネル・ウィナー・ポストフィルタは,柔決定機構が採用されても非定常雑音源にほとんど対応できない。しかしながら、自己及び相互相関スペクトル密度の推定に基づいたマルチチャンネルの技術は、非定常雑音に対しても理論的に望ましい性能を提供する。本発明に係る修正ゼリンスキー・ポストフィルタは、高周波領域のそれぞれの分割周波数領域でこの性能を完全に提供する。
上記のように、本発明では、拡散雑音場を仮定してマイクロホンアレイに対するポストフィルタを提案した。本発明に係るポストフィルタは高周波領域の修正ゼリンスキー・ポストフィルタと低周波数領域のシングルチャンネル・ウィナー・ポストフィルタを結合して構成されている。
本発明に係るポストフィルタには、他のアルゴリズムと比べて、以下の利点がある。
(1)理論上、本発明に係るポストフィルタは、ウィナー・ポストフィルタであるので、マルチチャンネル・ウィナー・ポストフィルタの枠組みに従う。
(2)実際に、本発明に係るポストフィルタは雑音を減少させて、様々な車の雑音環境において他のアルゴリズムと比べて、所望のスピーチを推定する際に有効であった。
本発明によれば、拡散雑音場における高相関雑音及び低相関雑音を効果的に減少することができる。
本発明は、上記各実施の形態に限ることなく、その他、実施段階ではその要旨を逸脱しない範囲で種々の変形を実施し得ることが可能である。さらに、上記各実施形態には、種々の段階の発明が含まれており、開示される複数の構成要件における適宜な対合せにより種々の発明が抽出され得る。
また、例えば各実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
本発明によれば、拡散雑音場における高相関雑音及び低相関雑音を効果的に減少することができる。

Claims (5)

  1. 音声信号を入力する少なくとも2つのマイクロホンからなるマイクロホンアレイと、
    前記マイクロホンアレイから入力された音声信号の成形を行うビーム成形器と、
    前記マイクロホンアレイから入力された雑音を含む目的音を所定の周波数で少なくとも2つの周波数帯域に分割する分割器と、
    前記マイクロホン間で雑音が無相関である場合のフィルタゲインを推定する第1のフィルタと、
    前記マイクロホンアレイ中の1本のマイクロホンあるいはマイクロホンアレイの平均信号のフィルタゲインを推定する第2のフィルタと、
    前記第1のフィルタと前記第2のフィルタからの出力を加算する加算器と、
    前記加算器と前記ビーム成形器からの出力に基づいて雑音を低減する手段とを具備するポストフィルタ。
  2. 請求項1に記載のポストフィルタにおいて、前記第1のフィルタは、修正ゼリンスキー・ポストフィルタであり、前記第2のフィルタはシングルチャンネル・ウィナー・ポストフィルタである。
  3. 請求項1又は請求項2に記載のポストフィルタにおいて、
    前記第1のフィルタは、相互相関スペクトル密度と自己相関スペクトル密度との比を求めることによりフィルタゲインを推定し、
    前記第2のフィルタは、ポストフィルタの出力信号とアポステリオリSNRとに基づいてアプリオリSNRを演算し、アプリオリSNRに基づいてフィルタゲインを推定する。
  4. 請求項1から請求項3のいずれか1項に記載のポストフィルタにおいて、前記分割器で分割する目的音の周波数は、前記マイクロホン間の距離に従って決定される。
  5. 請求項4に記載のポストフィルタにおいて、前記第1のフィルタは、分割された後の複数の周波数帯域において各周波数帯域で雑音が無相関となるマイクロホンペアを選択してフィルタゲインを推定する。
JP2007533331A 2005-09-02 2006-08-31 マイクロホンアレイ用ポストフィルタ Expired - Fee Related JP4671303B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005255103 2005-09-02
JP2005255103 2005-09-02
PCT/JP2006/317229 WO2007026827A1 (ja) 2005-09-02 2006-08-31 マイクロホンアレイ用ポストフィルタ

Publications (2)

Publication Number Publication Date
JPWO2007026827A1 true JPWO2007026827A1 (ja) 2009-03-12
JP4671303B2 JP4671303B2 (ja) 2011-04-13

Family

ID=37808910

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007533331A Expired - Fee Related JP4671303B2 (ja) 2005-09-02 2006-08-31 マイクロホンアレイ用ポストフィルタ

Country Status (5)

Country Link
US (1) US20080159559A1 (ja)
EP (1) EP1931169A4 (ja)
JP (1) JP4671303B2 (ja)
CN (1) CN101263734B (ja)
WO (1) WO2007026827A1 (ja)

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7876906B2 (en) 2006-05-30 2011-01-25 Sonitus Medical, Inc. Methods and apparatus for processing audio signals
US8352257B2 (en) * 2007-01-04 2013-01-08 Qnx Software Systems Limited Spectro-temporal varying approach for speech enhancement
ES2533626T3 (es) * 2007-03-02 2015-04-13 Telefonaktiebolaget L M Ericsson (Publ) Métodos y adaptaciones en una red de telecomunicaciones
DE102007020878B4 (de) * 2007-05-04 2020-06-18 Dr. Ing. H.C. F. Porsche Aktiengesellschaft Verfahren zur Prüfung von Umströmungsgeräuschen
KR100905586B1 (ko) * 2007-05-28 2009-07-02 삼성전자주식회사 로봇에서의 원거리 음성 인식을 위한 마이크의 성능 평가시스템 및 방법
ATE448649T1 (de) * 2007-08-13 2009-11-15 Harman Becker Automotive Sys Rauschverringerung mittels kombination aus strahlformung und nachfilterung
US8150054B2 (en) * 2007-12-11 2012-04-03 Andrea Electronics Corporation Adaptive filter in a sensor array system
US9392360B2 (en) 2007-12-11 2016-07-12 Andrea Electronics Corporation Steerable sensor array system with video input
WO2009076523A1 (en) * 2007-12-11 2009-06-18 Andrea Electronics Corporation Adaptive filtering in a sensor array system
US8295506B2 (en) * 2008-07-17 2012-10-23 Sonitus Medical, Inc. Systems and methods for intra-oral based communications
WO2010091339A1 (en) * 2009-02-06 2010-08-12 University Of Ottawa Method and system for noise reduction for speech enhancement in hearing aid
US8979771B2 (en) * 2009-04-13 2015-03-17 Articulate Labs, Inc. Acoustic myography system and methods
EP2249333B1 (en) * 2009-05-06 2014-08-27 Nuance Communications, Inc. Method and apparatus for estimating a fundamental frequency of a speech signal
US8208656B2 (en) * 2009-06-23 2012-06-26 Fortemedia, Inc. Array microphone system including omni-directional microphones to receive sound in cone-shaped beam
AU2010301027B2 (en) 2009-10-02 2014-11-06 Soundmed, Llc Intraoral appliance for sound transmission via bone conduction
JP5299233B2 (ja) 2009-11-20 2013-09-25 ソニー株式会社 信号処理装置、および信号処理方法、並びにプログラム
KR101060183B1 (ko) * 2009-12-11 2011-08-30 한국과학기술연구원 임베디드 청각 시스템 및 음성 신호 처리 방법
CN101740036B (zh) * 2009-12-14 2012-07-04 华为终端有限公司 通话音量自动调节方法及装置
FR2956743B1 (fr) * 2010-02-25 2012-10-05 Inst Francais Du Petrole Procede non intrusif de determination de l'impedance electrique d'une batterie
DK2395506T3 (da) * 2010-06-09 2012-09-10 Siemens Medical Instr Pte Ltd Fremgangsmåde og system til behandling af akustisk signal til undertrykkelse af interferens og støj i binaurale mikrofonkonfigurationer
US8768406B2 (en) * 2010-08-11 2014-07-01 Bone Tone Communications Ltd. Background sound removal for privacy and personalization use
KR101782050B1 (ko) * 2010-09-17 2017-09-28 삼성전자주식회사 비등간격으로 배치된 마이크로폰을 이용한 음질 향상 장치 및 방법
CN202534346U (zh) * 2010-11-25 2012-11-14 歌尔声学股份有限公司 语音增强装置及头戴式降噪通信耳机
WO2012109384A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation Combined suppression of noise and out - of - location signals
US8929564B2 (en) 2011-03-03 2015-01-06 Microsoft Corporation Noise adaptive beamforming for microphone arrays
JP5817366B2 (ja) * 2011-09-12 2015-11-18 沖電気工業株式会社 音声信号処理装置、方法及びプログラム
EP2592845A1 (en) * 2011-11-11 2013-05-15 Thomson Licensing Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
US10021508B2 (en) 2011-11-11 2018-07-10 Dolby Laboratories Licensing Corporation Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field
EP2592846A1 (en) * 2011-11-11 2013-05-15 Thomson Licensing Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9026451B1 (en) * 2012-05-09 2015-05-05 Google Inc. Pitch post-filter
EP2701145B1 (en) * 2012-08-24 2016-10-12 Retune DSP ApS Noise estimation for use with noise reduction and echo cancellation in personal communication
WO2014064689A1 (en) 2012-10-22 2014-05-01 Tomer Goshen A system and methods thereof for capturing a predetermined sound beam
JP2014085609A (ja) * 2012-10-26 2014-05-12 Sony Corp 信号処理装置および方法、並びに、プログラム
WO2014085978A1 (en) * 2012-12-04 2014-06-12 Northwestern Polytechnical University Low noise differential microphone arrays
CN103856866B (zh) * 2012-12-04 2019-11-05 西北工业大学 低噪微分麦克风阵列
US9516418B2 (en) 2013-01-29 2016-12-06 2236008 Ontario Inc. Sound field spatial stabilizer
US9106196B2 (en) * 2013-06-20 2015-08-11 2236008 Ontario Inc. Sound field spatial stabilizer with echo spectral coherence compensation
US9099973B2 (en) * 2013-06-20 2015-08-04 2236008 Ontario Inc. Sound field spatial stabilizer with structured noise compensation
US9271100B2 (en) 2013-06-20 2016-02-23 2236008 Ontario Inc. Sound field spatial stabilizer with spectral coherence compensation
JP5791685B2 (ja) * 2013-10-23 2015-10-07 日本電信電話株式会社 マイクロホン配置決定装置、マイクロホン配置決定方法及びプログラム
CN104751853B (zh) * 2013-12-31 2019-01-04 辰芯科技有限公司 双麦克风噪声抑制方法及***
WO2015114674A1 (ja) * 2014-01-28 2015-08-06 三菱電機株式会社 集音装置、集音装置の入力信号補正方法および移動機器情報システム
JP6361156B2 (ja) * 2014-02-10 2018-07-25 沖電気工業株式会社 雑音推定装置、方法及びプログラム
US10475466B2 (en) * 2014-07-17 2019-11-12 Ford Global Technologies, Llc Adaptive vehicle state-based hands-free phone noise reduction with learning capability
EP3007170A1 (en) * 2014-10-08 2016-04-13 GN Netcom A/S Robust noise cancellation using uncalibrated microphones
CN106717023A (zh) * 2015-02-16 2017-05-24 松下知识产权经营株式会社 车载用音响处理装置
US9601131B2 (en) 2015-06-25 2017-03-21 Htc Corporation Sound processing device and method
CN106328160B (zh) * 2015-06-25 2021-03-02 深圳市潮流网络技术有限公司 一种基于双麦克的降噪方法
CN105280195B (zh) * 2015-11-04 2018-12-28 腾讯科技(深圳)有限公司 语音信号的处理方法及装置
CN105869651B (zh) * 2016-03-23 2019-05-31 北京大学深圳研究生院 基于噪声混合相干性的双通道波束形成语音增强方法
PT3696813T (pt) * 2016-04-12 2022-12-23 Fraunhofer Ges Forschung Codificador de áudio para codificar um sinal de áudio, método para codificar um sinal de áudio e programa de computador sob consideração de uma região espectral de pico detetada numa banda de frequência superior
CN106024001A (zh) * 2016-05-03 2016-10-12 电子科技大学 一种提高麦克风阵列语音增强性能的方法
EP3249955B1 (en) * 2016-05-23 2019-08-28 Oticon A/s A configurable hearing aid comprising a beamformer filtering unit and a gain unit
WO2018068846A1 (en) * 2016-10-12 2018-04-19 Huawei Technologies Co., Ltd. Apparatus and method for generating noise estimates
JP6173649B1 (ja) * 2016-11-22 2017-08-02 三菱電機株式会社 劣化個所推定装置、劣化個所推定システム及び劣化個所推定方法
KR102359913B1 (ko) * 2016-12-13 2022-02-07 현대자동차 주식회사 마이크로폰
WO2018121972A1 (en) * 2016-12-30 2018-07-05 Harman Becker Automotive Systems Gmbh Acoustic echo canceling
CN108694956B (zh) * 2017-03-29 2023-08-22 大北欧听力公司 具有自适应子频带波束成形的听力设备及相关方法
JP6918602B2 (ja) * 2017-06-27 2021-08-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 集音装置
US10616682B2 (en) * 2018-01-12 2020-04-07 Sorama Calibration of microphone arrays with an uncalibrated source
CN108257607B (zh) * 2018-01-24 2021-05-18 成都创信特电子技术有限公司 一种多通道语音信号处理方法
US10418048B1 (en) * 2018-04-30 2019-09-17 Cirrus Logic, Inc. Noise reference estimation for noise reduction
CN110649912B (zh) * 2018-06-27 2024-05-28 深圳光启尖端技术有限责任公司 空间滤波器的建模方法
GB2591066A (en) 2018-08-24 2021-07-21 Nokia Technologies Oy Spatial audio processing
CN112216298B (zh) * 2019-07-12 2024-04-26 大众问问(北京)信息科技有限公司 双麦克风阵列声源定向方法、装置及设备
TWI731391B (zh) * 2019-08-15 2021-06-21 緯創資通股份有限公司 麥克風裝置、電子裝置及其音訊信號處理方法
JP7270140B2 (ja) * 2019-09-30 2023-05-10 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理装置
CN110739004B (zh) * 2019-10-25 2021-12-03 大连理工大学 一种用于wasn的分布式语音噪声消除***
TWI745845B (zh) * 2020-01-31 2021-11-11 美律實業股份有限公司 耳機及耳機組
CN115942108A (zh) * 2021-08-12 2023-04-07 北京荣耀终端有限公司 一种视频处理方法及电子设备
CN114157951B (zh) * 2021-11-26 2024-06-04 歌尔科技有限公司 有源降噪电路及装置
CN116013239B (zh) * 2022-12-07 2023-11-17 广州声博士声学技术有限公司 风道主动降噪算法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004289762A (ja) * 2003-01-29 2004-10-14 Toshiba Corp 音声信号処理方法と装置及びプログラム
JP2005195955A (ja) * 2004-01-08 2005-07-21 Toshiba Corp 雑音抑圧装置及び雑音抑圧方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6717991B1 (en) * 1998-05-27 2004-04-06 Telefonaktiebolaget Lm Ericsson (Publ) System and method for dual microphone signal noise reduction using spectral subtraction
CA2354858A1 (en) * 2001-08-08 2003-02-08 Dspfactory Ltd. Subband directional audio signal processing using an oversampled filterbank
WO2003015458A2 (en) * 2001-08-10 2003-02-20 Rasmussen Digital Aps Sound processing system including forward filter that exhibits arbitrary directivity and gradient response in multiple wave sound environment
EP1538867B1 (en) * 2003-06-30 2012-07-18 Nuance Communications, Inc. Handsfree system for use in a vehicle

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004289762A (ja) * 2003-01-29 2004-10-14 Toshiba Corp 音声信号処理方法と装置及びプログラム
JP2005195955A (ja) * 2004-01-08 2005-07-21 Toshiba Corp 雑音抑圧装置及び雑音抑圧方法

Also Published As

Publication number Publication date
JP4671303B2 (ja) 2011-04-13
CN101263734A (zh) 2008-09-10
US20080159559A1 (en) 2008-07-03
CN101263734B (zh) 2012-01-25
EP1931169A4 (en) 2009-12-16
WO2007026827A1 (ja) 2007-03-08
EP1931169A1 (en) 2008-06-11

Similar Documents

Publication Publication Date Title
JP4671303B2 (ja) マイクロホンアレイ用ポストフィルタ
EP2026597B1 (en) Noise reduction by combined beamforming and post-filtering
Marro et al. Analysis of noise reduction and dereverberation techniques based on microphone arrays with postfiltering
US20170221502A1 (en) Globally optimized least-squares post-filtering for speech enhancement
JP4096104B2 (ja) 雑音低減システム及び雑音低減方法
US20040230428A1 (en) Method and apparatus for blind source separation using two sensors
JP7041156B2 (ja) ビームフォーミングを使用するオーディオキャプチャのための方法及び装置
Cohen Analysis of two-channel generalized sidelobe canceller (GSC) with post-filtering
CN112216295A (zh) 一种声源定位方法、装置及设备
Li et al. A noise reduction system based on hybrid noise estimation technique and post-filtering in arbitrary noise environments
Li et al. A hybrid microphone array post-filter in a diffuse noise field
Hong et al. Dual-microphone noise reduction in car environments with determinant analysis of input correlation matrix
JP2005514668A (ja) スペクトル出力比依存のプロセッサを有する音声向上システム
Pfeifenberger et al. Blind source extraction based on a direction-dependent a-priori SNR.
Gonzalez-Rodriguez et al. Speech dereverberation and noise reduction with a combined microphone array approach
Jeong et al. A real-time kepstrum approach to speech enhancement and noise cancellation
Potamitis et al. Speech activity detection and enhancement of a moving speaker based on the wideband generalized likelihood ratio and microphone arrays
Martın-Donas et al. A postfiltering approach for dual-microphone smartphones
Fraś et al. Reverberant Source Separation Using NTF With Delayed Subsources and Spatial Priors
KR101537653B1 (ko) 주파수 또는 시간적 상관관계를 반영한 잡음 제거 방법 및 시스템
Li et al. A noise reduction system in arbitrary noise environments and its applications to speech enhancement and speech recognition
Xiong et al. A study on joint beamforming and spectral enhancement for robust speech recognition in reverberant environments
Kung et al. Estimation of the noise and reverberation covariance matrices with application in speech enhancement using the multichannel wiener filter
CN114724574B (zh) 一种期望声源方向可调的双麦克风降噪方法
Kim Interference suppression using principal subspace modification in multichannel Wiener filter and its application to speech recognition

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110113

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140128

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees