JP4724054B2 - 特定方向収音装置、特定方向収音プログラム、記録媒体 - Google Patents

特定方向収音装置、特定方向収音プログラム、記録媒体 Download PDF

Info

Publication number
JP4724054B2
JP4724054B2 JP2006165492A JP2006165492A JP4724054B2 JP 4724054 B2 JP4724054 B2 JP 4724054B2 JP 2006165492 A JP2006165492 A JP 2006165492A JP 2006165492 A JP2006165492 A JP 2006165492A JP 4724054 B2 JP4724054 B2 JP 4724054B2
Authority
JP
Japan
Prior art keywords
signal
specific direction
unit
signal amount
gain coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006165492A
Other languages
English (en)
Other versions
JP2007336232A (ja
Inventor
裕輔 日岡
和則 小林
章俊 片岡
賢一 古家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006165492A priority Critical patent/JP4724054B2/ja
Publication of JP2007336232A publication Critical patent/JP2007336232A/ja
Application granted granted Critical
Publication of JP4724054B2 publication Critical patent/JP4724054B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

本発明は音声通話や機器の操作などハンズフリー方式で音声を取得する収音装置に関するものであり、特に収音装置から見て特定の方向に存在する音源からの音だけを強調して収音したい場合に適用して好適な特定方向収音装置に関する。
従来技術では、図18に示すようにx−y平面状のM個の異なる位置(p,q)〜(p,q)に配置されたマイクロホンmic.1〜mic.Mを用いて、任意の角度θの方向にある音源から発生される音を信号とし、それ以外の方向で発せられる音を雑音とした場合に、信号のみを強調して高いSNR(信号雑音比)で収音する。図19は従来の強調収音法の構成を示すブロック図である。位置(x,y)に配置されたマイクロホンmで受音した信号x(n)(m=1…M)に対し、式(1)のように遅延Dを付加することにより信号y(n)を得る。
(n)=x(n−D) (1)
このとき遅延量Dは、あらかじめ与えられた所望音源の方向θから、それぞれ式(2)により導出することができる。
=(d/c)sinθ (2)
ここでcは音速であり、dは図18においてθ方向から到来した音波から見たときの、マイクmと基準点oの間の距離で、式(3)により表される。
=psinθ+qcosθ (3)
次にいま得られたy(n)を式(4)のように加算することで、所望位置から発せられる音を強調した信号z(n)が求められる。
Figure 0004724054
以上が従来の強調収音法(非特許文献1)である。この従来技術で形成される指向特性には図20に示すように、主ビームBMに近接して比較的大きい利得を持つサイドローブSBとよばれる領域が生じるため、雑音を十分に抑圧することができない。またこのサイドローブSBの利得を極力小さく抑えるためには、マイクロホン数を増やし、またマイクロホンアレーを大型にする必要がある(非特許文献1)。
大賀寿郎、山崎芳男、金田豊共著、音響システムとディジタル処理、電子情報通信学会 P.181〜P.186 7.1.2.
従来技術を用いて収音装置の指向特性をある特定の方向に向け、その方向で発せられる音を強調し、それ以外の方向で発せられる音を抑圧して収音する場合に、従来技術により形成される指向特性はサイドローブを持つことから、本来抑圧したい方向から発せられる音が十分に抑圧されずに収音されてしまう問題があった。
このため強調したい音源の方向以外に非常に大きな音を発する雑音源が存在する場合に、従来技術の収音装置は所望音源に対する十分な強調効果が得られなかった。
また従来技術において、サイドローブを低減するには、マイクロホン数を増やし、またマイクロホンアレーを大型にしなければならず、実用する際には設置、運搬が困難であった。さらに従来技術による収音装置の指向特性は周波数によって変化するため、所望音や雑音のもつ周波数構造によっては、十分な強調効果が得られない問題があった。
本発明は以上の課題を解決されるためになされたもので、マイクロホンアレーの規模を拡大することなく、従来技術よりも高いSNRで所望音源からの音を強調して収音する装置を実現することにある。
本発明では図3に示すように、収音する領域を複数の方向の角度領域Θ〜Θに分割し、マイクロホンアレーの指向性をそれぞれの方向の角度領域に向けるように制御して受音した信号を用いる。このときマイクロホンアレーによって処理された信号は、その処理前と比較して音源の存在する方向に応じてパワーが変化する。本発明ではこのパワーの変化量を利用して、それぞれの方向領域から到来する信号のパワーを推定する。そして推定されたパワーから、事前に与えられた方向の角度領域から到来する信号を強調するための利得係数を算出し、その利得係数を特定方向から到来した信号に乗算した信号を最終的な出力信号として得る。
本発明による特定方向収音装置の具体的な構成としては複数のマイクロホンを搭載して構成されるマイクロホンアレーの出力信号を利用してそれぞれが異なる方向の角度領域から到来する音を強調して収音する複数のビームフォーマー部と、複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する周波数領域変換部と、各周波数領域変換部が出力する周波数領域信号の中の所望方向の角度領域の角度領域信号に所属する特定方向周波数領域信号を選択する特定方向選択部と、各角度領域に含まれる信号の総和をその角度領域の信号量とし、複数のビームフォーマー部の各角度領域に対する指向特性から求められるパラメータを要素とするゲイン行列の逆行列に対し、各周波数領域変換部が出力する周波数領域信号の信号量を乗じ、各角度領域の信号量を推定する信号量推定部と、所望方向の角度領域における信号量と、全ての角度領域における信号量の総和との比により、周波数帯域毎の利得係数を算出する利得係数算出部と、利得係数算出部が算出した利得係数を特定方向周波数領域信号の各対応する周波数帯域の信号量に乗算する乗算部とを備えることを特徴とする。
本発明による特定方向集音装置は更に複数のマイクロホンを搭載して構成されているマイクロホンアレーの出力信号を利用してそれぞれが異なる方向の角度領域から到来する音を強調して収音する複数のビームフォーマー部と、複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する周波数領域変換部と、周波数領域変換部が出力する周波数領域信号を周波数帯域成分に分割する帯域分割部と、帯域分割部が出力する帯域成分を同一帯域成分毎に収集する同一帯域成分収集部と、同一帯域成分収集部の出力側に設けられ、各同一帯域成分収集部から出力される帯域成分を合成する帯域合成部とを備え、同一帯域成分収集部は、ビームフォーマー部の何れかが収音する所望方向の角度領域信号に所属する特定方向帯域成分を選択する特定方向選択部と、各角度領域に含まれる信号の総和をその角度領域の信号量とし、複数のビームフォーマー部の各角度領域及び周波数帯域に対する指向特性から求められるパラメータを要素とするゲイン行列の逆行列に対し、各帯域分割部が出力する周波数帯域成分の信号量を乗じ、各角度領域の信号量を推定する信号量推定部と、所望方向の角度領域における信号量と、全ての角度領域における信号量の総和との比により、利得係数を算出する利得係数算出部と、利得係数算出部が算出した利得係数を前記特定方向帯域成分に乗算する乗算部とを備えることを特徴とする。
更に本発明による特定方向収音装置は前記した特定方向収音装置において、周波数領域信号の信号量は、信号のパワー値である、または、前記周波数帯域成分の信号量は、信号のパワー値であることを特徴とする。
更に、本発明による特定方向収音装置の特徴とする点は、前記した特定方向収音装置において、周波数領域信号の信号量は、信号の絶対値である、または、周波数帯域成分の信号量は、信号の絶対値であることを特徴とする。
更に、本発明による特定方向収音装置の特徴とする点は、前記した特定方向収音装置において、利得係数算出部の利得係数算出特性は所望方向の角度領域における信号量に対して、その他の角度領域における信号量が無視できる程度に微少値である場合、利得係数の値は所定の最大値で与えられ、所望方向の角度領域における信号量がその他の角度領域における信号量に対して、特定領域信号の量が無視できる程度に微少値である場合は利得係数の値はほぼ0に近い値となる特性で算出することを特徴とする。
更に、本発明による特定方向収音装置の特徴とする点は、前記した特定方向収音装置において、利得係数算出部の利得係数算出特性は、所望方向の角度領域における信号量に対してその他の角度領域の信号量が小さい帯域では利得係数の値を最大値乃至は最大値に近い値に維持させ、所望方向の角度領域における信号量に対し、その他の角度領域の信号量が大きい領域では利得係数の値をほぼ0乃至0に近い値に維持させる特性で算出することを特徴とする。
本発明による特定方向収音装置によれば、所望方向の音源が発する音を強調して収音する際の強調効果を改善するために、マイクロホンアレーによって受音した信号を用いて複数のビームフォーマー部処理の結果から各音源が発する音信号のパワーを推定し、SN比に対応する利得係数を計算して所望音信号を強調する。このため従来技術で同様の効果を得るためにはマイクロホンの本数の増大やマイクロホンアレーの大型化を図る必要が有ったが、本発明によればこれらの必要が無く、実用において設置や運搬が容易な小規模システムのまま強調効果を改善する効果がある。
また本発明による特定方向収音装置では、マイクロホンアレーによって受音された信号のパワー値又は絶対値を周波数成分ごとに推定して強調処理を行うため、所望音や雑音の持つ周波数構造によらず高い強調効果を得ることができる。
本発明による特定方向収音装置を実施する場合、全てをハードウェアによって構成することも可能であるが、最も簡素に実施するにはコンピュータに、本発明による特定方向収音プログラムをインストールし、コンピュータに特定方向収音装置として機能させる実施形態が最良の形態である。
コンピュータに本発明による特定方向収音装置として機能させるには、コンピュータにインストールした特定方向収音プログラムによりコンピュータ内にマイクロホンアレーの出力信号を利用してそれぞれが異なる方向の角度領域から到来する音を強調して収音する複数のビームフォーマー部と、複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する周波数領域変換部と、各周波数領域変換部が出力する周波数領域信号の中の所望方向の角度領域の角度領域信号に所属する特定方向周波数領域信号を選択する特定方向選択部と、特定方向周波数領域信号の信号量と、他の方向の角度領域信号から周波数領域信号に変換された周波数領域信号の総和の量を推定する信号量推定部と、特定方向周波数領域信号の信号量と、他の方向の角度領域信号から周波数領域信号に変換された周波数領域信号の総和量を推定する信号量推定部と、特定方向周波数領域信号の信号量と、この特定方向周波数領域信号の信号量を含む他の周波数領域信号の総和量との比により周波数領域毎の利得係数を算出する利得係数算出部と、利得係数算出部が算出した利得係数を特定方向領域信号の各対応する周波数帯域の信号量に乗算する乗算部とを構築し、特定方向収音装置として機能させる。
はじめに本発明の全体の概要を説明する。図1は本発明の特定方向収音装置の全体構成を示している。M(≧2)個のマイクロホンから構成されるマイクロホンアレー11によって受音された信号x(n)(m=1,2,…,M)は、第1ビームフォーマー部12−1から第Qビームフォーマー部12−QまでのQ個のビームフォーマー部12−1〜12−Qに入力される。ここでnは離散時間信号のサンプル番号を表す。
ビームフォーマー部12−1〜12−Qでは、例えば図2に示すような指向性のビームBMを、図3であらかじめ与えられたQ個の方向領域Θ〜Θのいずれかに向け、該当する方向領域で発せられる音を強調して収音する処理を行い、結果を出力する。各ビームフォーマー部12−1〜12−Qの出力信号y(n)、y(n)、…、y(n)はそれぞれ周波数領域変換部13−1〜13−Qに入力され、周波数領域変換部13−1〜13−Qの出力信号Y(ω,l)、Y(ω,l)、…Y(ω,l)は信号量推定部14と特定方向選択部15にそれぞれ入力される。
信号量推定部14は、入力されたビームフォーマー部12−1〜12−Qの出力信号パワーから各方向領域Θ〜Θにおける音源から発せられる音信号の総和のパワー成分を求め、これを1つのベクトルにまとめた信号パワーベクトルXest※(ω,l)(以下文中で※が付された英文字はベクトルを表わす。また数式中肉太文字はベクトルを表わす)を出力する。
特定方向選択部15は、強調したい方向領域に指向性のビームを向けたビームフォーマー部の出力を選択しY(ω,l)として出力する。
利得係数算出部16は、入力された信号パワーベクトルXest※(ω,l)から利得係数R(ω,l)を算出し、出力する。利得係数R(ω,l)は乗算部17に入力される。乗算部17は入力された利得係数R(ω,l)と特定方向選択部15の出力Y(ω,l)を同じ周波数の成分ごとに掛け算した結果を出力する。乗算部17の出力信号YSR(ω,l)は逆周波数領域変換部18に入力され、逆離散フーリエ変換を行って時間信号に復元された信号y(n)が出力される。この信号y(n)が本発明の装置によって所望音が強調されて収音された信号である。
ビームフォーマー部12−1〜12−Q、信号量推定部14,利得係数算出部16,特定方向選択部15の詳細は別の図を用いて以下に順に説明する。
(ビームフォーマー部)
図4はビームフォーマー部12−1〜12−Qの中の一つの例えばビームフォーマー部12−qの構成を示している。同様の処理がすべてのビームフォーマー部において行われる。入力された信号x(n)(m=1,2,…,M)はフィルタ処理部FC1〜FCMに入力される。フィルタ処理部FC1〜FCMではあらかじめ与えられた(決定方法は後述する)フィルタ係数Wqm(n)を、式(5)に示す畳み込み演算に代入して得られる信号x’qm(n)を出力する。
Figure 0004724054
各フィルタ処理部FC1〜FCMの出力信号は加算部ADDに入力される。加算部ADDでは入力信号を式(6)のように加算し、ビームフォーマー部の出力信号y(n)(q=1…Q)を得る。
Figure 0004724054
ここでフィルタ係数Wqm(n)は、それぞれのビームフォーマー部12−1〜12−Qの指向特性D(ω,θ)が、図3に示すあらかじめ与えられた第Q方向領域Θで発せられる音を強調して受音し、それ以外の方向で発せられる音を抑圧するように構成される。
(信号量推定部)
図5は信号量推定部14の構成を示している。信号量推定部14に入力される周波数成分Y(ω,l)、Y(ω,l)、…、Y(ω,l)はそれぞれパワー演算部PW−1〜PW−Qに入力され、信号のパワー値|Y(ω,l)|、|Y(ω,l)|、…、|Y(ω,l)|が出力され、ベクトル化部14Aに入力される。ベクトル化部14Aでは、入力されたパワー値を式(7)のようにベクトル形式でまとめた、ビームフォーマー部出力パワーベクトルY※(ω,l)を出力する。
Figure 0004724054
ビームフォーマー部出力パワーベクトルY※(ω,l)は乗算部14Bに入力される。乗算部14Bのもう一方の入力であるパワー推定行列T−1※は、逆行列演算部14Cの出力信号である。逆行列演算部14Cには式(8)により定義されるゲイン行列T※が入力され、その逆行列T−1※を出力する。
Figure 0004724054
ゲイン行列T※の各要素は、図6に示すように各ビームフォーマー部12−1〜12−Qの各方向領域に対する指向特性から求められるパラメータであり、例えば式(9)に示すような指向特性の周波数および方向に関する平均値を用いる。なお指向特性は、例えば前述の非特許文献1に記載されている周知の技術を用いてフィルタ係数W(n)より求めることができる。
Figure 0004724054
αpqは第pビームフォーマー部の第q方向領域に対する指向特性の平均値である。乗算部14Bは式(16)に示すように入力されたビームフォーマー部出力パワーベクトルとパワー推定行列の乗算を周波数成分ごとに行い、推定信号パワーベクトルXest※(ω,l)を出力する。
Figure 0004724054
(特定方向選択部)
図7は特定方向選択部15の構成を示している。特定方向選択部15では各ビームフォーマー部12−1〜12−Qより周波数領域変換部13−1〜13−Qを経て入力された周波数成分Y(ω,l)からY(ω,l)のうち、強調したい第qs方向領域に対応するものを選択してY(ω,l)として出力する。
(ω,l)=Yqs(ω,l) (11)
(利得係数算出部)
図8は利得係数算出部16における処理の流れを示している。信号量推定部14より入力された推定信号パワーベクトルXest※(ω,l)はベクトル要素抽出部16Aに入力される。ベクトル要素抽出部16Aでは式(12)に示すように、入力された推定信号パワーベクトルの第1成分を第1方向領域信号推定パワー|S(ω,l)|、第2成分を第2方向領域信号推定パワー、|S(ω,l)|のように第q成分を第q方向領域からの信号推定パワーとしてそれぞれ出力し、それらはSN比推定部16Bに入力される。
Figure 0004724054
SN比推定部16Bでは式(13)を用いて所望方向領域の信号を強調する利得係数R(ω,l)を計算し出力する。
Figure 0004724054
利得係数R(ω,l)は図9に示すように、特定方向信号|Sqs(ω,l)|と角度領域の信号の総和Σ|S(ω,l)|の関係が|Sqs(ω,l)|≒Σ|S(ω,l)|であった場合は利得係数R(ω,l)は最大値である例えば「1」が与えられ、|Sqs(ω,l)|<<Σ|S(ω,l)|であった場合は利得係数R(ω,l)は≒0を与える。
図9に示した利得係数の特性によれば特定方向信号成分Sqs(ω,l)が、他の角度領域の信号成分S(ω,l)より大きい程利得係数R(ω,l)は「1」に近づき、その周波数帯域の信号は減衰されることなく、そのまま出力される。特定方向信号成分Sqs(ω,l)が、他の角度領域信号成分S(ω,l)より小さい程、利得係数R(ω,l)は「0」に近い値となり、この場合は信号成分は利得係数R(ω,l)の乗算によって減衰される。この結果、利得係数R(ω,l)を特定方向選択部15で取り出した特定方向信号に乗算することにより特定方向信号成分が強調されて出力される。
ここで本発明により所望音を選択強調した収音が可能になる原理について説明する。ビームフォーマー部出力パワーベクトルY※(ω,l)の各要素である、各ビームフォーマー部の出力パワーは、式(14)に示すように、マイクロホンアレーが受音した信号Xθ※(ω,l)のパワーにその信号の音源方向および周波数に基づく指向特性が乗算された形で近似することができる。ただしここでは各音源の発する音は互いに無相関とし、すべてのマイクロホンにおいて音は同レベルで受音されると仮定している。
Figure 0004724054
いま信号XΘq※(ω,l)は図3で示したいずれかの方向領域Θに含まれる信号の総和を表すとする。このときビームフォーマー部の指向特性は方向領域内で一様であると仮定すると、Y※(ω,l)は式(15)により表される。本実施例では各領域に対する指向特性の代表値として式(9)により求めた指向特性の平均値を用いている。
Figure 0004724054
以上の関係より、あらかじめ与えられている行列T※の逆行列を左側からビームフォーマー部出力ベクトルY※(ω,l)にかけることで、X^※(ω,l)の推定値である推定信号パワーベクトルXest※(ω,l)が求められる。
Figure 0004724054
第2の実施例は、実施例1の利得係数算出部16における手順に変更を加えたものである。図10は第2の実施例において用いられる利得係数算出部16の処理手順を示したものである。実施例1における利得係数算出部16との相違点は非線形処理部16Cが追加された点である。非線形処理部16CではSN比推定部16Bから出力される図9に示した特性の元利得係数をR’(ω,l)と表記することとし、この元利得係数R’(ω,l)に0から1の間で変動する非線形関数を乗算した計算結果である利得係数R(ω,l)を出力する。ここでは非線形関数はあらかじめ与えられているもので、元利得係数R’(ω,l)が大きい領域つまりΣ|S(ω,l)|≒|Sqs(ω,l)|の領域では1または1に近い値を維持し、元利得係数R’(ω,l)が小さい領域つまりΣ|S(ω,l)|>>|Sqs(ω,l)|の領域では0または0に近い値を維持する関数で、たとえば式(17)に示すハイポブリックタンジェント(例えばZ1:R(ω,l)=1/2+1/2tanh(ρR’(ω,l)−ν))や式(18)に示す対数関数(例えばZ2:R(ω,l)=1/2+1/2tanh(ρ(10 log10)R’(ω,l)−ν))と組み合わせたものなどが用いられる。図11に非線形関数の一例を示す。
Figure 0004724054
ここでρ、νは非線形関数の特定を変化させるパラメータで任意に設定される。これ以外の部分に関しては実施例1と同様であるので説明を省略する。図11に示した非線形特性によれば、所望音声が優勢な周波数領域ではその周波数成分を強調し、背景雑音が優勢な周波数領域ではその周波数成分を抑圧することができ、本発明による特定方向強調量を向上させる効果がある。
第3の実施例は、実施例1の信号量推定部14と、利得係数算出部16と、乗算部17における処理手順に変更を加えたものである。図12は第3の実施例における本発明の全体構成を示している。実施例1との相違点は周波数領域変換部13−1〜13−Qの各後段に帯域分割部19−1〜19−Qを設けた点と、この帯域分割部19−1〜19−Qで帯域分割した各帯域成分を同一周波数帯域毎に収集する同一帯域成分収集部20−1〜20−Ωとを設けた構成とした点である。
各同一帯域成分収集部20−1〜20−Ωにはそれぞれに信号量推定部14と、特定方向選択部15と、利得係数算出部16と、乗算部17とを設ける。従って、この実施例3での特徴は信号量推定部14と、特定方向選択部15と、利得係数算出部16,乗算部17の各処理がΩ個の異なる同一帯域成分収集部20−1、20−2、…20−Ωにおいて別々に行われ、同一帯域成分収集部20−1〜20−Ωに設けた乗算部17の出力が帯域合成部21により合成されている点を特徴とする。
図13と図14はそれぞれ帯域分割部19−1〜19−Qと帯域合成部21の処理手順を示している。帯域分割部19−1〜19−Ωでは入力された周波数成分Y(ω、l)〜Y(ω、l)がΩからΩΩまでの帯域に分割され、それぞれ出力される。一方帯域合成部21では、入力されたΩからΩΩまでの帯域の周波数成分をまとめてひとつの信号Y(ω、l)として出力する。また本実施例においては、パワー推定部において用いられるゲイン行列T※の各要素は、例えば式(19)および式(20)に示すように与えられた帯域内での平均値を用いる。
Figure 0004724054
以上の部分以外については実施例1と同様であるので説明を省略する。一般にビームフォーマー部の指向特性は周波数に応じて変化するが、実施例1ではすべての周波数においてゲインは均一であると仮定し、ゲイン行列の要素を代入する値を決定していた。本実施例ではゲイン行列を周波数帯域ごとに用意して処理を行うことができるため、信号量推定部14においてより正しい指向特性に近い処理を行うことができ、推定信号パワーベクトルの推定精度を向上させる効果がある。
第4の実施例は、実施例1の信号量推定部14と、利得係数算出部16における手順に変更を加えたものである。第4の実施例に用いられる信号量推定部14の構成を図15に、利得係数算出部16の構成を図16に示す。信号量推定部14に入力される周波数成分Y(ω,l)〜Y(ω,l)はそれぞれ絶対値演算部14D−1〜14D−Qに入力され、信号の絶対値|Y(ω,l)|、|Y(ω,l)|、|Y(ω,l)|、…|Y(ω,l)|を出力し、ベクトル化部14Aに入力される。ベクトル化部14Aでは入力された信号を式(21)に示す絶対値ベクトルY※(ω,l)を出力する。
Figure 0004724054
絶対値ベクトルは乗算部14Bに入力される。乗算部14Bのもう一方の入力である絶対値推定行列T−1※は、逆行列演算部14Cの出力信号である。逆行列演算部14Cは入力されたゲイン行列T※の逆行列T−1※を出力する。
ゲイン行列T※の各要素は式(8)と同様にビームフォーマー部の各方向領域に対する指向特性が求められるパラメータであり、フィルタ係数から計算される指向特性のゲイン量から式(22)により定義され、事前に与えられる。
Figure 0004724054
乗算部14Bに入力されたビームフォーマー部出力パワーベクトルとパワー推定行列の乗算を周波数成分ごとに行い、推定信号絶対値ベクトルXest※(ω,l)を出力する。
次に図16に示す利得係数算出部16ではベクトル要素抽出部16Aは式(23)に示すように入力された推定信号絶対値ベクトルの第1成分を|S(ω,l)|、第2成分を|S(ω,l)|、第3成分を|S(ω,l)|、…としてそれぞれ出力し、それらはSN比推定部16Bに入力される。
Figure 0004724054
これら以外の部分に関しては第1の実施例と同じであるのでこれ以上の説明を省略する。この第4の実施例によれば実施例1に比べて2乗計算をする必要がないことから演算量を削減することができる。
なおこの実施例4は実施例2の信号量推定部14と利得係数算出部16に対しても適用することができる。図17は実施例2に本実施例4の変更を加えた場合の利得係数算出部16の構成を示す。
以上説明した本発明による収音装置は全てをハードウェアによって構成することも可能であるが、最も簡素に実現するには上述した各手順をコンピュータが解読可能なプログラム言語によって記述した本発明による収音プログラムを作成し、この収音プログラムをコンピュータにインストールし、コンピュータに収音プログラムを実行させ、コンピュータに収音装置として機能させる実施例が最良である。本発明による収音プログラムはコンピュータが読み取り可能な例えば磁気媒体、CD−ROM、半導体メモリ等の記録媒体に記録され、これらの記録媒体から、或いは通信回線を通じてコンピュータにインストールされる。インストールされた収音プログラムはコンピュータに備えられたCPUにより解読され、コンピュータを収音装置として機能させる。
本発明による収音装置は例えば電話会議システム等のハンズフリー通話装置の分野で活用される。
本発明の第1の実施例を説明するためのブロック図。 本発明に用いるビームフォーマー部の指向特性を説明するための図。 本発明に用いるビームフォーマー部に設定する指向方向領域の分割例を説明するための図。 本発明に用いるビームフォーマー部の構成の一例を説明するためのブロック図。 本発明に用いる信号量推定部の構成の一例を説明するためのブロック図。 本発明に用いるビームフォーマー部の指向特性の一例を説明するための図。 本発明に用いる特定方向選択部の構成の一例を説明するためのブロック図。 本発明に用いる利得係数算出部の構成の一例を説明するためのブロック図。 本発明に用いる利得係数の特性の一例を説明するためのグラフ。 本発明の第2の実施例を説明するためのブロック図。 図10に示した利得係数算出部が算出する利得係数の特性を説明するためのグラフ。 本発明の第3の実施例を説明するためのブロック図。 本発明の第3の実施例に用いた帯域分割部の構成の一例を説明するためのブロック図。 本発明の第3の実施例に用いた帯域合成部の構成を説明するためのブロック図。 本発明の第4の実施例を説明するためのブロック図。 本発明の第4の実施例に用いる利得係数算出部の構成を説明するためのブロック図。 本発明の第4の実施例に用いる利得係数算出部の他の構成を説明するためのブロック図。 従来技術によるマイクロホンアレーの収音方法を説明するための図。 従来の特定方向収音装置を説明するためのブロック図。 従来の特定方向収音装置の収音特性を説明するための図。
符号の説明
11 マイクロホンアレー 16 利得係数算出部
12−1〜12−Q ビームフォーマー部 17 乗算部
13−1〜13−Q 周波数領域変換部 18 逆周波数領域変換部
14 信号量推定部 19−1〜19−Q 帯域分割部
15 特定方向選択部 20−1〜20−Ω 同一帯域成分収集部
21 帯域合成部

Claims (10)

  1. 複数のマイクロホンを搭載して構成されるマイクロホンアレーの出力信号を利用してそれぞれが異なる方向の角度領域から到来する音を強調して収音する複数のビームフォーマー部と、
    前記複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する周波数領域変換部と、
    各周波数領域変換部が出力する周波数領域信号の中の所望方向の角度領域の角度領域信号に所属する特定方向周波数領域信号を選択する特定方向選択部と、
    各角度領域に含まれる信号の総和をその角度領域の信号量とし、前記複数のビームフォーマー部の各角度領域に対する指向特性から求められるパラメータを要素とするゲイン行列の逆行列に対し、各周波数領域変換部が出力する周波数領域信号の信号量を乗じ、各角度領域の信号量を推定する信号量推定部と、
    所望方向の角度領域における信号量と、全ての角度領域における信号量の総和との比により、周波数帯域毎の利得係数を算出する利得係数算出部と、
    前記利得係数算出部が算出した利得係数を前記特定方向周波数領域信号の各対応する周波数帯域の信号量に乗算する乗算部と、
    を備えることを特徴とする特定方向収音装置。
  2. 複数のマイクロホンを搭載して構成されているマイクロホンアレーの出力信号を利用してそれぞれが異なる方向の角度領域から到来する音を強調して収音する複数のビームフォーマー部と、
    前記複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する周波数領域変換部と、
    前記周波数領域変換部が出力する周波数領域信号を周波数帯域成分に分割する帯域分割部と、
    前記帯域分割部が出力する帯域成分を同一帯域成分毎に収集する同一帯域成分収集部と、
    前記同一帯域成分収集部の出力側に設けられ、各同一帯域成分収集部から出力される帯域成分を合成する帯域合成部と、
    を備え、
    前記同一帯域成分収集部は、
    前記ビームフォーマー部の何れかが収音する所望方向の角度領域信号に所属する特定方向帯域成分を選択する特定方向選択部と、
    各角度領域に含まれる信号の総和をその角度領域の信号量とし、前記複数のビームフォーマー部の各角度領域及び周波数帯域に対する指向特性から求められるパラメータを要素とするゲイン行列の逆行列に対し、各帯域分割部が出力する周波数帯域成分の信号量を乗じ、各角度領域の信号量を推定する信号量推定部と、
    所望方向の角度領域における信号量と、全ての角度領域における信号量の総和との比により、利得係数を算出する利得係数算出部と、
    前記利得係数算出部が算出した利得係数を前記特定方向帯域成分に乗算する乗算部と、
    を備えることを特徴とする特定方向収音装置。
  3. 請求項1に記載の特定方向収音装置において、前記周波数領域信号の信号量は、信号のパワー値であることを特徴とする特定方向収音装置。
  4. 請求項1に記載の特定方向収音装置において、前記周波数領域信号の信号量は、信号の絶対値であることを特徴とする特定方向収音装置。
  5. 請求項2に記載の特定方向収音装置において、前記周波数帯域成分の信号量は、信号のパワー値であることを特徴とする特定方向収音装置。
  6. 請求項2に記載の特定方向収音装置において、前記周波数帯域成分の信号量は、信号の絶対値であることを特徴とする特定方向収音装置。
  7. 請求項1乃至の何れかに記載の特定方向収音装置において、前記利得係数算出部の利得係数算出特性は前記所望方向の角度領域における信号量に対して、その他の角度領域における号量が無視できる程度に微少値である場合、前記利得係数の値は所定の最大値で与えられ、前記所望方向の角度領域における信号量その他の角度領域における信号量に対して無視できる程度に微少値である場合は前記利得係数の値はほぼ0に近い値となる特性で算出することを特徴とする特定方向収音装置。
  8. 請求項1乃至の何れかに記載の特定方向収音装置において、前記利得係数算出部の利得係数算出特性は、前記所望方向の角度領域における信号量に対してその他の角度領域号量が小さい帯域では前記利得係数の値を最大値乃至は最大値に近い値に維持させ、前記所望方向の角度領域における信号量に対し、その他の角度領域号量が大きい領域では前記利得係数の値をほぼ0乃至0に近い値に維持させる特性で算出することを特徴とする特定方向収音装置。
  9. コンピュータが解読可能なプログラム言語によって記述され、コンピュータに請求項1乃至の何れかに記載の特定方向収音装置として機能させる特定方向収音プログラム。
  10. コンピュータが読み取り可能な記録媒体によって構成され、この記録媒体に請求項記載の特定方向収音プログラムを記録した記録媒体。
JP2006165492A 2006-06-15 2006-06-15 特定方向収音装置、特定方向収音プログラム、記録媒体 Active JP4724054B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006165492A JP4724054B2 (ja) 2006-06-15 2006-06-15 特定方向収音装置、特定方向収音プログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006165492A JP4724054B2 (ja) 2006-06-15 2006-06-15 特定方向収音装置、特定方向収音プログラム、記録媒体

Publications (2)

Publication Number Publication Date
JP2007336232A JP2007336232A (ja) 2007-12-27
JP4724054B2 true JP4724054B2 (ja) 2011-07-13

Family

ID=38935281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006165492A Active JP4724054B2 (ja) 2006-06-15 2006-06-15 特定方向収音装置、特定方向収音プログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP4724054B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10373628B2 (en) 2016-08-31 2019-08-06 Kabushiki Kaisha Toshiba Signal processing system, signal processing method, and computer program product

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4787727B2 (ja) * 2006-12-04 2011-10-05 日本電信電話株式会社 音声収音装置、その方法、そのプログラム、およびその記録媒体
JP4928376B2 (ja) * 2007-07-18 2012-05-09 日本電信電話株式会社 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体
JP4928382B2 (ja) * 2007-08-10 2012-05-09 日本電信電話株式会社 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体
JP5175262B2 (ja) * 2009-12-02 2013-04-03 日本電信電話株式会社 音声取得装置
JP5549299B2 (ja) * 2010-03-23 2014-07-16 ヤマハ株式会社 ヘッドフォン
US9838782B2 (en) * 2015-03-30 2017-12-05 Bose Corporation Adaptive mixing of sub-band signals
JP6517124B2 (ja) * 2015-10-26 2019-05-22 日本電信電話株式会社 雑音抑圧装置、雑音抑圧方法、およびプログラム
EP3764660B1 (en) * 2019-07-10 2023-08-30 Analog Devices International Unlimited Company Signal processing methods and systems for adaptive beam forming
CN113031901B (zh) 2021-02-19 2023-01-17 北京百度网讯科技有限公司 语音处理方法、装置、电子设备以及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003271191A (ja) * 2002-03-15 2003-09-25 Toshiba Corp 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム
JP2005195955A (ja) * 2004-01-08 2005-07-21 Toshiba Corp 雑音抑圧装置及び雑音抑圧方法
JP2006066988A (ja) * 2004-08-24 2006-03-09 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4423300B2 (ja) * 2004-10-28 2010-03-03 富士通株式会社 雑音抑圧装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003271191A (ja) * 2002-03-15 2003-09-25 Toshiba Corp 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム
JP2005195955A (ja) * 2004-01-08 2005-07-21 Toshiba Corp 雑音抑圧装置及び雑音抑圧方法
JP2006066988A (ja) * 2004-08-24 2006-03-09 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10373628B2 (en) 2016-08-31 2019-08-06 Kabushiki Kaisha Toshiba Signal processing system, signal processing method, and computer program product

Also Published As

Publication number Publication date
JP2007336232A (ja) 2007-12-27

Similar Documents

Publication Publication Date Title
JP4724054B2 (ja) 特定方向収音装置、特定方向収音プログラム、記録媒体
KR101597752B1 (ko) 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치
JP4986248B2 (ja) 音源分離装置、方法及びプログラム
JP3940662B2 (ja) 音響信号処理方法及び音響信号処理装置及び音声認識装置
JP6547003B2 (ja) サブバンド信号の適応混合
JP4928382B2 (ja) 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体
JP2017503388A5 (ja)
JP2002062348A (ja) 信号処理装置及び信号処理方法
JP6987075B2 (ja) オーディオ源分離
JP5785674B2 (ja) デュアルマイクに基づく音声残響低減方法及びその装置
EP3275208B1 (en) Sub-band mixing of multiple microphones
JP5060465B2 (ja) 収音装置、収音方法、収音プログラム、記録媒体
JP5175262B2 (ja) 音声取得装置
JP4473829B2 (ja) 収音装置、プログラム及びこれを記録した記録媒体
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP6517124B2 (ja) 雑音抑圧装置、雑音抑圧方法、およびプログラム
CN111755021B (zh) 基于二元麦克风阵列的语音增强方法和装置
JP4928376B2 (ja) 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体
JP4886616B2 (ja) 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体
JP2018056902A (ja) 収音装置、プログラム及び方法
JP2005062096A (ja) 話者位置検出方法、装置、プログラム、および記録媒体
JP2012049715A (ja) 音源分離装置、音源分離方法、及び、プログラム
JP5713933B2 (ja) 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JP4920270B2 (ja) 信号到来方向推定装置及び方法、並びに信号分離装置及び方法、コンピュータプログラム
JP6263890B2 (ja) 音声信号処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080804

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140415

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4724054

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350