JP2011072043A - 集音装置 - Google Patents

集音装置 Download PDF

Info

Publication number
JP2011072043A
JP2011072043A JP2011003075A JP2011003075A JP2011072043A JP 2011072043 A JP2011072043 A JP 2011072043A JP 2011003075 A JP2011003075 A JP 2011003075A JP 2011003075 A JP2011003075 A JP 2011003075A JP 2011072043 A JP2011072043 A JP 2011072043A
Authority
JP
Japan
Prior art keywords
sound
signal
sound source
sound collection
collected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011003075A
Other languages
English (en)
Other versions
JP5273162B2 (ja
Inventor
Makoto Tanaka
田中  良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2011003075A priority Critical patent/JP5273162B2/ja
Publication of JP2011072043A publication Critical patent/JP2011072043A/ja
Application granted granted Critical
Publication of JP5273162B2 publication Critical patent/JP5273162B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音源方向を検出してこの音源方向に対する集音指向性を任意に実現し、音源が移動した場合に追尾しながら集音することができる集音装置を提供する。
【解決手段】音声信号処理部2は、ディジタルフィルタ21A〜21Mから出力される時間遅延処理信号を用いて、各部分領域に対応する集音ビームXc1〜Xc4を形成する。音声信号処理部2は、これら集音ビームXc1〜Xc4から最も信号強度の強い集音ビームを選択して、音源が存在する部分領域を検出する。そして、音源の移動に伴い選択される集音ビームが切り替えられる際、移動前の集音ビームを形成する合成音声信号に対してフェードアウト処理を行うとともに、移動後の集音ビームを形成する合成音声信号に対してフェードイン処理を行う。
【選択図】 図1

Description

この発明は、マイクロホンアレイを備えた集音装置、特に、受信した音声信号から音源方向を検出し、音源方向の受信指向性を高める集音装置に関するものである。
従来、複数のマイクを用いて、話者等の音源からの音声を、他のノイズ等と区別して集音する装置やシステムが各種開示されている。
特許文献1には、音声作動スイッチング装置として、複数の指向性マイクロホンから最も強い音声信号を受信しているマイクロホンを判定して、このマイクロホンで受信した音声信号に対して、他のマイクロホンで受信した音声信号よりも強い重み付け処理をして出力する装置が開示されている。
特許文献2には、直交円形マイクアレイシステムおよびこれを用いた音源の3次元方向検出方法として、経度方向に配列されたアレイマイクと、緯度方向に配列されたアレイマイクとで受信した音声信号から音源方向を検出し、これらとは別の超指向性マイクを検出した音源方向に機械的に向けるシステムおよび方法が開示されている。
特開平8−70494号公報 特開2003−304589公報
しかしながら、特許文献1に記載の装置では、指向性マイクロホンを用いることで特定方向からの音声しか集音できず、任意方向への集音指向性を実現することができなかった。このため、音源が移動した場合の音源方向追尾を行うことができなかった。また、特許文献2に記載の装置では、任意方向への集音指向性を実現するために、超指向性のマイクロホンを目的とする方向へ向けるように機械的に回転させなければならなかった。さらに、特許文献2に記載の装置は、目的とする方向を検出するために、3次元配置されたマイクロホンからなるアレイマイクを使用し、複雑な音声信号処理を行わなければならなかった。
したがって、本発明の目的は、比較的簡素な構造および音声信号処理を用いて、音源方向を検出してこの音源方向に対する集音指向性を任意に実現し、音源が移動した場合に追尾しながら集音することができる集音装置を提供することにある。
この発明の集音装置は、複数のマイクロホンを所定パターンに配列して構成されるマイクロホンアレイと、前記複数のマイクロホンが集音した音声信号をそれぞれ所定の遅延時間で遅延して合成することにより、特定方向に強い指向性の集音ビームを形成するビーム形成部であって、並列にそれぞれ独立した遅延時間を設定することで同時に複数方向に集音ビームを形成するビーム形成部と、該ビーム形成部が形成した複数の集音ビームのうち、信号レベルが最も高い集音ビームが集音する音声信号を選択して後段に出力する信号選択部と、を備え、前記ビーム形成部は、所定タイミング毎に集音ビームを形成し、前記信号選択部は、前後するタイミングで異なる集音ビームを用いて、集音する音声信号を選択する場合に、前のタイミングで集音された音声信号による合成音声信号と、後のタイミングで集音された音声信号による合成音声信号とをクロスフェード処理して出力する、ことを特徴とする。
この構成では、マイクロホンアレイの正面側の領域における或る位置に話者等の音源が存在して、この音源から音声が発せられると、マイクロホンアレイを構成する各マイクが集音する。この際、音声は各マイクと音源との距離に応じた伝搬時間で伝搬されて、各マイクでは同じ音声の集音タイミングに差が生じる。
図9(A)は音源とマイクロホンとの位置関係と、音源から発生した音が各マイクロホンで集音される際のディレイとの関係を示した図であり、図9(B),(C)は集音された音声信号のディレイに基づくディレイ補正量の形成概念を示す図である。なお、この説明では、マイクロホンの所定配列パターンとして、マイクロホンが直線状に配列されたマイクロホンアレイについて説明する。
具体的には、音源100Aが、図9(A)に示す位置に存在する場合、音源100Aで発生した音は、最も近いマイクロホン10Aで最初に集音される。そして、音源100Aと各マイクロホン10B〜10Iとの距離に応じて順に、各マイクロホン10B〜10Iで集音され、最も遠いマイクロホン10Jで最後に集音される。一方、音源100Bが、図9(A)に示す位置に存在する場合、音源100Bで発生した音は、最も近いマイクロホン10Jで最初に集音される。そして、音源100Bと各マイクロホン10I〜10Bとの距離に応じて順に、各マイクロホン10I〜10Bで集音され、最も遠いマイクロホン10Aで最後に集音される。このように、音源で発生した音は音源とマイクロホンとの距離に応じた遅延時間(ディレイ)で、マイクロホンに集音される。
この関係を用いることで、ビーム形成部は集音ビームを形成する。例えば、音源100Aに対しては、図9(B)に示すように、各マイクロホン10A〜10Jで集音される音声信号を遅延処理する。すなわち、図9(A)に示すディレイを補正するように、前記遅延時間に対応するディレイ補正量を設定する。また、音源100Bに対しては、図9(C)に示すように、各マイクロホン10A〜10Jで集音される音声信号を遅延処理する。すなわち、図9(A)に示すディレイを補正するように、ディレイ補正量を設定する。
このように遅延処理された音声信号を合成することで、図9(B)に示すような補正を行えば、音源100A方向に強い指向性を有する集音ビームが形成され、図9(C)に示すような補正を行えば、音源100B方向に強い指向性を有する集音ビームが形成される。
ビーム形成部は、このように各マイクロホンで集音される音声信号の遅延処理した信号をそれぞれに異なる組み合わせで合成することにより、複数方向の集音ビームを形成する。
信号選択部は、ビーム形成部が形成した複数の集音ビームの信号強度を比較して、信号レベルが最も高い集音ビームが集音する音声信号を選択する。または、信号選択部は、ビーム形成部が形成した複数の集音ビームの信号強度を比較して、信号レベルが最も高い集音ビームと該レベルが最も高い集音ビームに隣接する集音ビームとが集音する音声信号を選択する。ここで、信号レベルが最も高い集音ビームの指向性が向く方向は音源方向に相当する。これにより、音源方向が検出されて、該音源方向への強い集音指向性が実現される。
また、この構成では、ビーム形成部は予め設定されたタイミング毎に前述の各集音ビームの形成を行い、信号選択部は、このタイミング毎に信号強度の比較を行い、集音ビームの選択すなわち音声信号の選択を切り替える。これにより、タイミング毎に最適な集音指向性が実現される。
また、この構成では、音源の移動に伴い選択される集音ビームが切り替えられるが、この際、移動前の集音ビームを形成する合成音声信号に対してフェードアウト処理を行うとともに、移動後の集音ビームを形成する合成音声信号に対してフェードイン処理を行う。これにより、音源の移動に伴って集音指向性の切り替わり、出力される合成音声信号の切り替えが平滑化される。すなわち、出力される音声を聞くユーザにとって、出力音声の切り替わりが滑らかになる。
この発明によれば、マイクロホンアレイを用いて集音される音声信号に対して時間遅延処理および組み合わせ処理をするという、簡単な構造および簡単な信号処理だけで、音源方向を検出でき、さらに、この音源方向に対して強い集音指向性を与えることができる。これにより、音源からの音声を除くノイズを抑圧し、音源からの音声を鮮明に集音し出力することができる。
また、この発明によれば、音源が移動しても、簡素な構造および簡素な処理で音源方向を追尾することができる。これにより、移動する音源に対しても、音声を鮮明に集音し続けて出力することができる。
本発明の実施形態に係る集音装置の主要部の構成を示すブロック図 音声信号処理部2の概略構成を示すブロック図(前半部) 音声信号処理部2の概略構成を示すブロック図(後半部) 複数の集音ビームを選択する場合の音声信号処理部3の部分構成を示すブロック図 音源方向検知方法(部分領域の検出)の概念図 音源方向検知方法(局所領域の検出)の概念図 音声信号処理部2の処理フローを示すフロー図 円状にマイクロホンを配置したマイクホロンアレイの構成図 音源とマイクロホンとの位置関係と、音源から発生した音が各マイクロホンで集音される際のディレイとの関係を示した図、および、集音された音声信号のディレイに基づくディレイ補正量の形成概念を示す図
本発明の実施形態に係る集音装置について図1〜図8を参照して説明する。
以下の説明では、音源検知領域全体を4つの部分領域、および各部分領域をさらに分割する4つの局所領域で音源100の検知を行うための構成について説明するが、領域の分割数は装置仕様や所望とする音源検知方向の分解能に基づいて、適宜設定すればよい。また、マイクロホンアレイ1は、マイクロホン10A〜10Mを直線状に配列したものを用いて説明する。
図1は本実施形態の集音装置の主要部の構成を示すブロック図である。
また、図2、図3は本実施形態の音声信号処理部2の構成を示すブロック図であり、図2が集音ビームの形成、選択を行う部分を示し、図3は目的とする局所領域に対する集音ビームの選択、出力を行う部分を示す。なお、図2では、ディジタルフィルタ21A〜21Mの内のディジタルフィルタ21Aについてのみ詳細なブロック図を図示し、詳細な説明を行うが、他のディジタルフィルタ21B〜21Mについても同様の構造である。
図4は音声信号処理部2の他の構成(図3に対応する部分)を示す部分ブロック図である。
図5、図6は音源方向検知方法の概念図である。図5は、図2に示すディジタルフィルタ21A〜21Mからレベル判定部27までの部分による検出概念を示す。図6は図2に示すディジタルフィルタ21A〜21Mから、図3に示すBPF28、レベル判定部29までの部分による検出概念を示す。
図7は音声信号処理部2の処理フローを示すフロー図である。
本実施形態の集音装置は、所定方向に直線状に配列された複数のマイクロホン10A〜10Mを有するマイクロホンアレイ1を備える。各マイクロホン10A〜10Mは、特に特定方向に指向性を有する指向性マイクではなく、全てが同じ無指向性マイクにより構成されている。そして、各マイクロホン10A〜10Mは、集音領域方向を正面として配置されている。また、マイクロホンアレイ1のマイクロホン配列個数および配置間隔は、集音領域の広さや、後述する音源方向の検出精度(方位分解能)、集音する音声の周波数帯域等により、適宜設定されている。
マイクロホンアレイ1の各マイクロホン10A〜10Mは、それぞれ、図示しないA/D変換器を介して、音声信号処理部2のディジタルフィルタ21A〜21Mに接続されている。
音源から音声が発生すると、マイクロホン10A〜10Mはこれを集音して電気的な音声信号に変換して出力する。マイクロホン10A〜10Mから出力された音声信号は、A/D変換器にて所定のサンプリング周期でサンプリングされる。このサンプリングにより得られるディジタル音声信号x1(n),x2(n)〜xm(n)が、ディジタルフィルタ21A,21B〜21Mにそれぞれ入力される(S1)。
ディジタルフィルタ21Aは、予め設定されたサンプリング周期に応じた所定段のディレイバッファメモリ22Aを備える。ディレイバッファメモリ22Aの各段の遅延量に相当するサンプリング周期は、マイクロホンアレイ1におけるマイクロホン10A〜10Mの配置、および、音源検知を行う領域からマイクロホンアレイ1までの距離から設定される。ディレイバッファメモリ22Aには8段の出力が備えられており、これらの出力がFIRフィルタ231A〜238Aにそれぞれ入力される。
ディレイバッファメモリ22Aは、サンプリング周期に準じて、入力音声信号x1(n)に対してそれぞれに異なる遅延処理を施した音声信号を各段に記憶し、まずFIRフィルタ231A〜234Aに対して記憶された各遅延処理信号を出力する(S2)。さらに、ディレイバッファメモリ22Aは、レベル判定部27の検知結果に基づいてFIRフィルタ235A〜238Aに対して記憶された各遅延処理信号を出力する。このようなディレイバッファメモリ22Aは、例えばシフトレジスタ等で構成することができる。
ここで、ディレイバッファメモリ22Aにおける、FIRフィルタ231A〜234Aに入力される出力は、予め設定されている。具体的には、FIRフィルタ231Aに出力される信号は部分領域101に対応する集音ビームXc1を構成するための遅延処理信号であり、FIRフィルタ232Aに出力される信号は部分領域102に対応する集音ビームXc2を構成するための遅延処理信号である。また、FIRフィルタ233Aに出力される信号は部分領域103に対応する集音ビームXc3を構成するための遅延処理信号であり、FIRフィルタ234Aに出力される信号は部分領域104に対応する集音ビームXc4を構成するための遅延処理信号である。
また、FIRフィルタ235Aに出力される信号は、後述するレベル判定部27で検出された部分領域104(図5,図6の場合)を再分割する局所領域141に対応する集音ビームXc5を構成するための遅延処理信号であり、FIRフィルタ236Aに出力される信号は局所領域142に対応する集音ビームXc6を構成するための遅延処理信号である。また、FIRフィルタ237Aに出力される信号は局所領域143に対応する集音ビームXc7を構成するための遅延処理信号であり、FIRフィルタ238Aに出力される信号は局所領域144に対応する集音ビームXc8を構成するための遅延処理信号である。ここで、局所領域141〜144は部分領域101〜104のうちで音源100方向が含まれる部分領域を再分割した局所領域であり、レベル判定部27の検知結果に応じて変わる。そして、これらの局所領域に応じて各集音ビームXc5〜Xc8を構成するための遅延処理信号が、検知結果に基づいて更新されながら設定される。
そして、これらの遅延処理信号は、図9に示すような集音ビームと遅延処理との関係により設定される。
FIRフィルタ231A〜238Aは全て同じ構成からなり、それぞれに入力された遅延処理信号をFIR処理して、遅延処理信号X1S1〜X1S8を出力する。このように、FIRフィルタ231A〜238AでFIR処理を行うことにより、ディレイバッファメモリ22Aでは実現できない、サンプリング周期間の詳細な遅延を実現することができる。すなわち、FIRフィルタのフィルタ内サンプリング周期とタップ数とを所望値に設定することにより、ディレイバッファメモリ22Aでのサンプリング周期を遅延時間の整数部分とする場合に、この遅延時間の小数点部分を実現することができる。これにより、ディジタルフィルタ21Aは、入力音声信号x1(n)に対して、サンプリング周期に単に準じた遅延処理よりも、さらに詳細な遅延処理を行い、遅延処理信号X1S1〜X1S8を生成することができる。
各FIRフィルタ231A〜238Aから出力された遅延処理信号X1S1〜X1S8は、それぞれアンプ241A〜248Aで増幅されて、それぞれ加算器25A〜25Hに入力される。
他のディジタルフィルタ21B〜21Mも、ディジタルフィルタ21Aと同じ構造であり、それぞれに予め設定された遅延処理信号の選択条件にしたがって、入力された音声信号X2(n)〜Xm(n)から集音ビームXc1〜Xc8を形成するための遅延処理信号X2S1〜X2S8,・・・,XMS1〜XMS8を各加算器25A〜25Hに出力する。
加算器25Aは、各ディジタルフィルタ21A〜21Mから入力される遅延処理信号X1S1,X2S1,・・・,XMS1を合成して集音ビームXc1を生成し、加算器25BはX1S2,X2S2,・・・,XMS2を合成して集音ビームXc2を生成する。加算器25Cは、各ディジタルフィルタ21A〜21Mから入力される遅延処理信号X1S3,X2S3,・・・,XMS3を合成して集音ビームXc3を生成し、加算器25DはX1S4,X2S4,・・・,XMS4を合成して集音ビームXc4を生成する(S3)。
バンドパスフィルタBPF26は、入力された集音ビームXc1〜Xc4のフィルタリングを行って、レベル判定部27に出力する。ここで、BPF26は、マイクロホンアレイ1の幅(配列方向の長さ)、および、マイクロホン10A〜10Mの設置間隔に応じてビーム化される周波数帯域が異なることを利用し、各集音ビームXc1〜Xc4で集音したい音声に対応する周波数帯域を通過帯域に設定している。
レベル判定部27は、集音ビームXc1〜Xc4の信号強度を比較し、最も信号強度が強い集音ビームを選択する(S4)。ところで、集音ビームの信号強度が最も強いということは、この集音ビームにより集音される領域に音源が存在することを意味する。これにより、音源探知領域全体を4つの部分領域に区分した場合における、音源が存在する部分領域を検出することができる。例えば、図5の例では、部分領域104に対応する集音ビームXc4の信号強度が他の集音ビームXc1〜Xc3の信号強度よりも強いので、レベル検出部27は集音ビームXc4を選択し、部分領域104に音源100が存在することを検知する。
レベル判定部27は、検出した部分領域をさらに再分割した局所領域に対応する選択信号を生成し、ディジタルフィルタ21A〜21Mに出力する。より具体的に、例えば、図5,図6の例であれば、レベル判定部27は、部分領域104をさらに方位方向に4分割する局所領域141〜144に対する集音ビームXc5〜Xc8を形成するための各ディジタルフィルタ21A〜21Mから出力される遅延処理信号を選択する。そして、この選択内容が含まれる選択信号を各ディジタルフィルタ21A〜21Mに出力する。
各ディジタルフィルタ21A〜21Mはこの選択信号にしたがい、それぞれのディレイバッファメモリから加算器25E〜25Hに出力する遅延処理信号を選択設定する。例えば、ディジタルフィルタ21Aは、レベル判定部27から入力された選択信号にしたがい、ディレイバッファメモリ22AからFIRフィルタ235A〜238Aにそれぞれ選択された遅延処理信号を出力する。FIRフィルタ235A〜238Aは、それぞれ入力された遅延処理信号をFIR処理してアンプ245A〜248Aを介して、加算器25E〜25Hに出力する(S5)。
加算器25Eは、各ディジタルフィルタ21A〜21Mから入力される遅延処理信号X1S5,X2S5,・・・,XMS5を合成して集音ビームXc5を生成し、加算器25FはX1S6,X2S6,・・・,XMS6を合成して集音ビームXc6を生成する。加算器25Gは、各ディジタルフィルタ21A〜21Mから入力される遅延処理信号X1S7,X2S7,・・・,XMS7を合成して集音ビームXc7を生成し、加算器25HはX1S8,X2S8,・・・,XMS8を合成して集音ビームXc8を生成する(S6)。
加算器25E〜25Hのそれぞれから出力された集音ビームXc5〜Xc8は、2系統に分配され、一方はバンドパスフィルタBPF28に入力され、他方はセレクタ30に入力される。
バンドパスフィルタBPF28は、入力された集音ビームXc5〜Xc8のフィルタリングを行って、レベル判定部29に出力する。ここで、BPF28は、マイクロホンアレイ1の幅(配列方向の長さ)、および、マイクロホン10A〜10Mの設置間隔に応じてビーム化される周波数帯域が異なることを利用し、各集音ビームXc5〜Xc8で集音したい音声に対応する周波数帯域を通過帯域に設定している。
レベル判定部29は、集音ビームXc5〜Xc8の信号強度を比較し、最も信号強度が強い集音ビームを選択する(S7)。ところで、集音ビームの信号強度が最も強いということは、この集音ビームにより集音される領域に音源が存在することを意味する。これにより、部分領域全体を4つの局所領域に区分した場合における、音源が存在する局所領域を検出することができる。例えば、図6の例では、部分領域104における局所領域141に対応する集音ビームXc5の信号強度が他の集音ビームXc6〜Xc8の信号強度よりも強いので、レベル検出部29は集音ビームXc5を選択し、局所領域141に音源100が存在することを検知する。
レベル判定部29は、検出した局所領域に対応する選択信号を生成し、セレクタ30に出力する。セレクタ30は、入力された選択信号にしたがい、検出された局所領域に対応する集音ビームを選択して出力する。例えば、図6の例であれば、局所領域141に対応する集音ビームXc5を選択して、この集音ビームXc5により形成される音声信号を出力する(S8)。
このような構成および処理を用いることにより、音源方向からの音声のみを集音して出力することができる。これにより、話者等の音源からの音声とは異なるノイズを抑圧して、音源からの音声のみを集音することができる。このように出力された合成信号はスピーカ5により音声として外部に放音される。
以上のように、本実施形態の構成および処理を用いることにより、音源方向を検出して、検出した音源方向に対する集音指向性を高めることができ、ノイズを抑圧して音源方向からの音声のみを集音することができる。この際、マイクロホンアレイを用いて、機械的にマイク方向を移動させることがないので、従来よりも簡単な構造で且つ簡素な処理で音源方向の検出と、音源方向に強い指向性を有する集音を行うことができる。
また、音源検知を2段階に分けて徐々に詳細に行うことで、一度に詳細な音源領域検知を行うよりも処理量を低減することができる。例えば、図5、図6に示したような局所領域分割を一度に処理する場合、16分割の局所領域となり、16方向の集音ビームを形成しなければならない。しかしながら、本実施形態の構成および処理方法を用いることにより、8方向の集音ビーム形成で、音源領域の検知を行うことができる。
なお、前述の説明では、局所領域に関するレベル判定部29で選択する集音ビームが1つの場合について説明した。しかしながら、複数の集音ビームを選択して処理してもよい。
図4は、複数の集音ビームを選択する場合の音声信号処理部2の部分構成を示すブロック図である。なお、この音声信号処理部2は、ディジタルフィルタ21A〜21Mから加算器25E〜25Hまでの図2に示した構成は同じであるので図示説明は省略し、異なる部分(図3に対応)のみを図示したものである。
レベル判定部29は、集音ビームXc5〜Xc8の信号強度を比較し、最も信号強度が強い集音ビームと、次に信号強度が強い集音ビームとの2つの集音ビームを選択する選択信号Sをセレクタ30に出力する。これと同時に、レベル判定部29は、これら2つの集音ビームの信号強度を重み付け設定部31に出力する。
セレクタ30は、入力された選択信号にしたがい、検出された2つの局所領域にそれぞれ対応する2つの集音ビームXca,Xcbを選択する。そして、セレクタ30は、集音ビームXcaを信号合成部32の可変アンプ321に出力し、集音ビームXcbを信号合成部32の可変アンプ322に出力する。
重み付け設定部31、2つの集音ビームの信号強度から重み付け係数をw1,w2を設定する。ここで、重み付け設定部31は、より信号強度が強い集音ビームが強調されるような重み付けを行う。例えば、2つの集音ビームの信号強度の比が7:3であれば、合成信号の振幅が正規化されるように、各集音ビームに対する重み付け係数をそれぞれ0.7と0.3とに設定する。
信号合成部32は、可変アンプ321,322と加算器323とを備える。可変アンプ321は与えられた重み付け係数w1で集音ビームXcaの合成信号を増幅し、可変アンプ322は与えられた重み付け係数w2で集音ビームXcbの合成信号を増幅する。加算器323は可変増幅器321,322からの出力信号を合成し、合成信号をスピーカ5に出力する。
これらの処理を、図6を例に説明すると、レベル判定部29は、信号強度から集音ビームXc5,Xc6を選択する。すなわち、局所領域141,142からなる領域に音源100が存在すると検知する。セレクタ30は、入力される集音ビームXc5〜Xc8から集音ビームXc5,Xc6の2つを選択して、集音ビームXc5の合成信号を可変アンプ321に出力し、集音ビームXc6の合成信号を可変アンプ322に出力する。重み付け設定部31は、集音ビームXc5,Xc6の振幅強度の比から、集音ビームXc5に対する重み付け係数w1と、集音ビームXc6に対する重み付け係数w2を設定して、重み付け係数w1を可変アンプ321に与え、重み付け係数w2を可変アンプ322に与える。可変アンプ321は重み付け係数w1で集音ビームXc5の合成信号を増幅し、可変アンプ322は重み付け係数w2で集音ビームXc6の合成信号を増幅する。加算器323は重み付け係数w1の集音ビームXc5からなる合成信号と、重み付け係数w2の集音ビームXc6からなる合成信号とをさらに合成してスピーカ5に出力する。
このような構成および処理を用いることにより、音源方向を含む領域とこれに隣接する領域とからなる所定範囲からの音声を集音して出力することができる。これにより、音源が前述のように設定される局所領域の境界付近に存在しても、話者等の音源からの音声を強調し、それ以外のノイズを抑圧することができる。
ところで、前述の説明は音源が移動していない状態を示したが、前述の音源方向の検出処理および合成処理を、予め設定した所定タイミング周期で行うことで、音源の追尾を行うことができる。すなわち、音源が移動すれば、この移動に応じてそれぞれのタイミングで検出される音源方向も変化(移動)する。そして、この検出される音源方向の変化に応じて、集音指向性を変化させることで、実質的に集音しながら音源の追尾を行うことができる。この処理は機械的動作を含まないものであるので、装置の構成を単純化することができる。
この際、音声信号処理部2は、前記タイミング周期の隣り合うタイミングで検出音源方向が異なれば、先に出力した音声信号と、後に出力する音声信号とをクロスフェード処理してもよい。すなわち、先に出力している音声信号の信号強度を出力段で徐々に抑圧していくとともに、後に出力する音声信号の信号強度を出力段で徐々に増幅していく処理を行い、これらを合成して出力する。このような処理を行うことで、音源の移動に伴う音声の移動が、聴覚上滑らかに行われ、出力される音声を聞く者に違和感を与えない。ここで、音源が部分領域間を完全に移動するのではなく、部分領域の境界で音源が停止した場合には、前述のように、完全に出力信号が切り替わる処理を行う必要はない。この場合、クロスフェードを開始してから、徐々に集音ビームの比を変化させていき、最終的に互いの集音ビームの比が0.5:0.5になる合成処理を行ってもよい。
なお、前述の説明では、音源が存在する全体領域を4つの部分領域に分割し、さらに音源が存在する部分領域を4つの局所領域に分割して、音源検知を行ったが、これら分割数は、装置の仕様や、装置の適用環境(音源検知領域の広さ等)に応じて、任意に設定することができる。
また、前述の説明では、2段で音源検知を行ったが、1段で行っても、3段以上の複数段でおこなってもよい。また、前述の各処理は、物理的な回路素子の組み合わせで実現しても、DSP等の集積回路を用いてソフトウエア処理で実現してもよい。
また、前述の説明ではマイクロホンを直線状に配列したマイクロホンアレイを例に示したが、マトリクス状であってもよく、さらに、図8に示すようなマイクロホンの配置からなるマイクロホンアレイでもあってよい。
図8(A)は1次元の円状にマイクロホンを配置したマイクホロンアレイの構成を示し、(B)は複数次元の円状にマイクロホンを配置したマイクロホンアレイの構成を示す。なお、図8では、代表するマイクロホンにのみ記号を付し、他のマイクロホンへの記号は省略する。
図8(A)に示すマイクロホンアレイ1は、各マイクロホン10が所定間隔で1つ(1次元)の円周上に配置されたものである。図8(B)に示すマイクロホンアレイ1は、各マイクロホン10が複数(複数次元)の円周上に配置されたものである。
このようにマイクロホン10が配列されたマイクロホンアレイ1に対しても、前述の構成および処理を適用することができ、音源方向の検知と、この検知音源方向からの集音を実現することができる。
さらに、ここに示したマイクロホンアレイのマイクロホンの配置は一部の例にすぎず、マイクロホンが所定の配置パターンで配置されたマイクロホンアレイであれば、前述の構成および処理を実現することができ、前述の効果を奏することができる。
1−マイクロホンアレイ、10A〜10M−マイクロホン、2−音声信号処理部、21A〜21M−ディジタルフィルタ、22A−ディレイバッファメモリ、231A〜238A−FIRフィルタ、241A〜248A−アンプ、25A〜25H−加算器、26,28−BPF、27,29−レベル判定部、30−セレクタ、31−重み付け設定部、32−信号合成部、321,322−可変アンプ、323−加算器、5−スピーカ、100−音源、101〜104−部分領域、141〜144−局所領域

Claims (1)

  1. 複数のマイクロホンを所定パターンに配列して構成されるマイクロホンアレイと、
    前記複数のマイクロホンが集音した音声信号をそれぞれ所定の遅延時間で遅延して合成することにより、特定方向に強い指向性の集音ビームを形成するビーム形成部であって、並列にそれぞれ独立した遅延時間を設定することで同時に複数方向に集音ビームを形成するビーム形成部と、
    該ビーム形成部が形成した複数の集音ビームのうち、信号レベルが最も高い集音ビームが集音する音声信号を選択して後段に出力する信号選択部と、
    を備え、
    前記ビーム形成部は、所定タイミング毎に集音ビームを形成し、
    前記信号選択部は、前後するタイミングで異なる集音ビームを用いて、集音する音声信号を選択する場合に、前のタイミングで集音された音声信号による合成音声信号と、後のタイミングで集音された音声信号による合成音声信号とをクロスフェード処理して出力する、
    ことを特徴とする集音装置。
JP2011003075A 2011-01-11 2011-01-11 集音装置 Active JP5273162B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011003075A JP5273162B2 (ja) 2011-01-11 2011-01-11 集音装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011003075A JP5273162B2 (ja) 2011-01-11 2011-01-11 集音装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2005189809A Division JP4760160B2 (ja) 2005-06-29 2005-06-29 集音装置

Publications (2)

Publication Number Publication Date
JP2011072043A true JP2011072043A (ja) 2011-04-07
JP5273162B2 JP5273162B2 (ja) 2013-08-28

Family

ID=44016773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011003075A Active JP5273162B2 (ja) 2011-01-11 2011-01-11 集音装置

Country Status (1)

Country Link
JP (1) JP5273162B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015115952A (ja) * 2013-12-06 2015-06-22 華為技術有限公司Huawei Technologies Co.,Ltd. オーディオ情報処理の方法及び装置
CN107785026A (zh) * 2017-10-18 2018-03-09 会听声学科技(北京)有限公司 一种用于机顶盒室内回声消除的时延估计方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261792A (ja) * 1996-03-19 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> 受音方法及びその装置
JPH1141687A (ja) * 1997-07-18 1999-02-12 Toshiba Corp 信号処理装置および信号処理方法
JP2001245382A (ja) * 2000-01-13 2001-09-07 Nokia Mobile Phones Ltd スピーカをトラッキングする方法およびシステム
JP2005065217A (ja) * 2003-07-31 2005-03-10 Sony Corp 通話装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261792A (ja) * 1996-03-19 1997-10-03 Nippon Telegr & Teleph Corp <Ntt> 受音方法及びその装置
JPH1141687A (ja) * 1997-07-18 1999-02-12 Toshiba Corp 信号処理装置および信号処理方法
JP2001245382A (ja) * 2000-01-13 2001-09-07 Nokia Mobile Phones Ltd スピーカをトラッキングする方法およびシステム
JP2005065217A (ja) * 2003-07-31 2005-03-10 Sony Corp 通話装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015115952A (ja) * 2013-12-06 2015-06-22 華為技術有限公司Huawei Technologies Co.,Ltd. オーディオ情報処理の方法及び装置
CN107785026A (zh) * 2017-10-18 2018-03-09 会听声学科技(北京)有限公司 一种用于机顶盒室内回声消除的时延估计方法
CN107785026B (zh) * 2017-10-18 2020-10-20 会听声学科技(北京)有限公司 一种用于机顶盒室内回声消除的时延估计方法

Also Published As

Publication number Publication date
JP5273162B2 (ja) 2013-08-28

Similar Documents

Publication Publication Date Title
JP4760160B2 (ja) 集音装置
JP4816221B2 (ja) 収音装置および音声会議装置
EP3384684B1 (en) Conference system with a microphone array system and a method of speech acquisition in a conference system
JP4177413B2 (ja) 音響再生装置および音響再生システム
JP4167286B2 (ja) 残響調整装置、残響補正方法、および、音響再生システム
JP4984683B2 (ja) 放収音装置
WO2011068901A1 (en) Audio zoom
JP5259622B2 (ja) 収音装置、収音方法、収音プログラム、および集積回路
JP2005197896A (ja) スピーカアレイ用のオーディオ信号供給装置
JP6051505B2 (ja) 音声処理装置および音声処理方法、記録媒体、並びにプログラム
JP2007121439A (ja) 音響信号再生装置
JP4435232B2 (ja) オーディオシステム
US9355632B2 (en) Apparatus, method and electroacoustic system for reverberation time extension
JP5644382B2 (ja) 音声処理装置
JP2008252625A (ja) 指向性スピーカシステム
JP2012169895A (ja) 多重極スピーカ群とその配置方法と、音響信号出力装置とその方法と、その方法を用いたアクティブノイズコントロール装置と音場再生装置と、それらの方法とプログラム
JP5273162B2 (ja) 集音装置
JP6226885B2 (ja) 音源分離方法、装置、及びプログラム
JP5240026B2 (ja) マイクロホンアレイにおけるマイクロホンの感度を補正する装置、この装置を含んだマイクロホンアレイシステム、およびプログラム
WO2019208285A1 (ja) 音像再現装置、音像再現方法及び音像再現プログラム
JP2016134769A (ja) オーディオ信号処理装置
JP2008245203A (ja) 拡声装置、拡声装置の遅延時間決定方法および拡声装置のフィルタ係数決定方法
JP2024505068A (ja) ハイブリッドオーディオビーム形成システム
JP2015008395A (ja) 空間音響生成装置およびそのプログラム
JP6242262B2 (ja) 音響再生装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130429

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5273162

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150