JP6206003B2 - 音源分離装置、音源分離プログラム、収音装置及び収音プログラム - Google Patents

音源分離装置、音源分離プログラム、収音装置及び収音プログラム Download PDF

Info

Publication number
JP6206003B2
JP6206003B2 JP2013179886A JP2013179886A JP6206003B2 JP 6206003 B2 JP6206003 B2 JP 6206003B2 JP 2013179886 A JP2013179886 A JP 2013179886A JP 2013179886 A JP2013179886 A JP 2013179886A JP 6206003 B2 JP6206003 B2 JP 6206003B2
Authority
JP
Japan
Prior art keywords
target
sound
microphones
microphone
directivity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013179886A
Other languages
English (en)
Other versions
JP2015050558A (ja
Inventor
一浩 片桐
一浩 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2013179886A priority Critical patent/JP6206003B2/ja
Priority to US14/309,048 priority patent/US9445194B2/en
Publication of JP2015050558A publication Critical patent/JP2015050558A/ja
Priority to US15/236,375 priority patent/US9549255B2/en
Application granted granted Critical
Publication of JP6206003B2 publication Critical patent/JP6206003B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2203/00Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/23Direction finding using a sum-delay beam-former

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明は、音源分離装置、音源分離プログラム、収音装置及び収音プログラムに関し、例えば複数の音源が存在する環境下において、特定の方向の音源のみ分離し収音する音源分離装置、音源分離プログラム、収音装置及び収音プログラムに適用し得るものである。
複数の音源が存在する環境下において、ある特定の方向の音響(以下では、例えば音声、音響を含むものを音響と表現して説明する)のみを分離し収音する技術として、マイクロホンアレイを用いたビームフォーマ(以下、BFともいう。)がある。ビームフォーマとは、各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である(非特許文献1参照)。ビームフォーマは加算型と減算型の大きく2つの種類に分けられる。特に減算型BFは、加算型BFに比べ、少ないマイクロホン数で指向性を形成できるという利点がある。
図2は、マイクロホン数が2個の場合の減算型BFに係る構成を示すブロック図である。減算型BFは、まず目的とする方向に存在する音(以下、目的音と呼ぶ。)が各マイクロホン1及び2に到来し、遅延器91がマイクロホン1及び2に到来した信号の時間差を算出し、いずれかのマイクロホンからの信号に遅延を加えることにより目的音の位相を合わせる。
時間差は下記(1)式により算出される。ここで、dはマイクロホン間の距離、cは音速、τは遅延量である。またθは、各マイクロホン1及び2を結んだ直線に対する垂直方向から目的方向への角度である。
τ=(dsinθ)/c (1)
ここで、死角方向がマイクロホン1と2の中心に対し、マイクロホン1の方向に存在する場合、マイクロホン1の入力信号x(t)に対し遅延処理を行う。その後、(2)式に従い減算器92により処理を行う。
α(t)=x(t)−x(t−τ) (2)
減算処理は周波数領域でも同様に行うことができ、その場合(2)式は以下のように変更される。
A(ω)=X(ω)−e−jωτL(ω) (3)
ここでθ=±π/2の場合、形成される指向性は図3(A)に示すように、カージオイド型の単一指向性となり、θ=0、πの場合は、図3(B)のような8の字型の双指向性となる。ここでは、入力信号から単一指向性を形成するフィルタを単一指向性フィルタ、双指向性を形成するフィルタを双指向性フィルタと呼称する。
また、スペクトル減算法(Spectral Subtraction;以下SSと呼ぶ。)を用いることで、双指向性の死角方向に強い指向性を形成することもできる。SSによる指向性の形成は、下記(4)式に従う。
|Y(ω)|=|X(ω)|−β|A(ω)| (4)
(4)式では、マイクロホン1の入力信号Xを用いているが、マイクロホン2の入力信号Xでも同様の効果を得ることができる。ここで、βはSSの強度を調節するための係数である。減算時に値がマイナスなった場合は、0または元の値を小さくした値に置き換えるフロアリング処理を行う。この方式は、双指向性フィルタにより目的方向以外に存在する音(以下、非目的音)を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。
特開2006−197552号公報
浅野太著,"音響テクノロジーシリーズ16 音のアレイ信号処理−音源の定位・追跡と分離−",日本音響学会編,コロナ社,2011年2月25日発行
しかしながら、実際に音源分離装置を通話や音声認識などに利用するためには、一方向にのみ指向性を形成し、かつ強い指向性を有することが求められる。単一指向性フィルタは図3(A)のように、目的方向の反対側に死角を作ることができるが、目的方向の指向性は弱くなってしまうという問題が生じ得る。また、スペクトル減算法(SS)を用いたビームフォーマでは、目的方向に強い指向性を得ることはできるが、図3(B)のように、目的方向の反対側にも同様に指向性を形成してしまう問題が存在する。そこで、特許文献1では、マイクロホンの数を増やすことで、様々な方向に単一指向性と双指向性を形成し、それら複数の指向性フィルタの出力を利用して目的方向にのみ強い指向性を作る手法を提案している。
しかし、特許文献1に記載の手法は、目的音を含む各指向性フィルタの出力を周波数毎に比較し、目的音成分か否かを判定することにより音を分離しているため、目的音成分の判定を間違うと分離後の目的音の音質が劣化してしまう可能性がある。さらに、分離時に目的音でないと判定した成分を0とするマスキングを行なっているため、非目的音が増えると急激に分離性能が悪化してしまうという問題が残っている。
また、ある特定のエリア内に存在する音(以下、目的エリア音)だけを収音したい場合、減算型BFを用いるだけでは、そのエリアの周囲に存在する音源(以下、非目的エリア音)も収音してしまう可能性がある。そこで、本願発明者は、参考文献(特願2012−217315)において、複数のマイクロホンアレイを用い、それぞれ別々の方向から目的エリアへ指向性を向け、指向性を目的エリアで交差させることで目的エリア音を収音する手法を提案している。
しかし、残響が強い環境下、特に一時反射が大きい場合、収音性能が劣化する可能性がある。参考文献の手法は、各マイクロホンアレイの指向性に共通に含まれる成分は目的エリア音のみであり、非目的エリア音成分は異なっていることを前提としている。そのため、室内の隅や壁際に位置するエリアを収音する場合、非目的エリア音の一部が壁に反射して各マイクロホンアレイの指向性に同時に侵入してしまうと、非目的エリア音成分が目的エリア音成分とみなされ、抑圧されずに抽出されてしまうこととなる。
そのため、目的方向にのみ鋭い指向性を形成することができ、音質劣化の少ない目的音を抽出することができる音源分離装置及びプログラムが求められている。また、目的エリアに対して前方にのみ指向性を形成し、エリア収音を行うことで、残響の影響を抑え、かつSN比を向上させることができる収音装置及びプログラムが求められている。
かかる課題を解決するために、第1の本発明は、(1)直角二等辺三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、(2)3個のマイクロホンのうち、目的方向と同じ方向に位置している2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける単一指向性を形成する単一指向性形成手段と、(3)目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、双指向性形成手段及び単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段とを備えることを特徴とする音源分離装置である。
第2の本発明は、(1)正三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、(2)3個のマイクロホンのうち、目的方向に対して、それぞれ±60度の角度に位置している2個のマイクロホンの組み合わせにより収音された音響信号を用いて、それぞれ目的方向に対して±60度に死角を向ける2個の単一指向性を形成する単一指向性形成手段と、(3)目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個のマイクロホンにより収音された音響信号を平均した信号から、双指向性形成手段及び単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段とを備えることを特徴とする音源分離装置である。
第3の本発明は、(1)正三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、(2)3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を平均した信号と、残りのマイクロホンにより収音された音響信号とを用い、目的方向に死角を向ける単一指向性を形成する単一指向性形成手段と、(3)目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個のマイクロホンにより収音された音響信号を平均した信号から、双指向性形成手段及び単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段とを備えることを特徴とする音源分離装置である。
第4の本発明は、コンピュータを、(1)直角二等辺三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、(2)3個のマイクロホンのうち、目的方向と同じ方向に位置している2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける単一指向性を形成する単一指向性形成手段と、(3)目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個のマイクロホンにより収音された音響信号を平均した信号から、双指向性形成手段及び単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段として機能させることを特徴とする音源分離プログラムである。
第5の本発明は、コンピュータを、(1)正三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、(2)3個のマイクロホンのうち、目的方向に対して、それぞれ±60度の角度に位置している2個のマイクロホンの組み合わせにより収音された音響信号を用いて、それぞれ目的方向に対して±60度に死角を向ける2個の単一指向性を形成する単一指向性形成手段と、(3)目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個のマイクロホンにより収音された音響信号を平均した信号から、双指向性形成手段及び単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段として機能させることを特徴とする音源分離プログラムである。
第6の本発明は、コンピュータを、(1)正三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、(2)3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を平均した信号と、残りのマイクロホンにより収音された音響信号とを用い、目的方向に死角を向ける単一指向性を形成する単一指向性形成手段と、(3)目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個のマイクロホンにより収音された音響信号を平均した信号から、双指向性形成手段及び単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段として機能させることを特徴とする音源分離プログラムである。
第7の本発明は、(1)直角二等辺三角形又は正三角形の頂点に配置した3個のマイクロホンを有する複数のマイクロホンアレイと、(2)各マイクロホンアレイの出力のそれぞれに対し、ビームフォーマにより、目的エリアに対して各マイクロホンアレイの前方にのみ指向性をマイクロホンアレイ毎に形成するものであって、第1〜第3の本発明のいずれかに記載の音源分離装置に相当する指向性形成手段と、(3)指向性形成手段からのマイクロホンアレイ毎の出力間で、ビームフォーマ出力の振幅スペクトルの比率を周波数毎に算出し、算出された振幅スペクトルの比率の最頻値又は中央値を、マイクロホンアレイ毎のビームフォーマ出力のパワーを補正する補正係数とするパワー補正係数算出手段と、(4)パワー補正係数算出手段で算出した補正係数を用い、指向性形成手段からの各マイクロホンアレイのビームフォーマ出力を補正し、補正後の各マイクロホンアレイのビームフォーマ出力をスペクトル減算して各マイクロホンアレイからみた目的エリア方向に存在する非目的エリア音を抽出し、抽出した非目的エリア音を指向性形成手段からの各マイクロホンアレイのビームフォーマ出力からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段とを備えることを特徴とする収音装置である。
第8の本発明は、直角二等辺三角形又は正三角形の頂点に配置した3個のマイクロホンを備える複数のマイクロホンアレイを有するコンピュータを、(1)各マイクロホンアレイの出力のそれぞれに対し、ビームフォーマにより、目的エリアに対して各マイクロホンアレイの前方にのみ指向性を形成するものであって、第4〜第6の本発明の音源分離プログラムの機能に相当する指向性形成手段と、(2)指向性形成手段からのマイクロホンアレイ毎の出力間で、ビームフォーマ出力の振幅スペクトルの比率を周波数毎に算出し、算出された振幅スペクトルの比率の最頻値又は中央値を、マイクロホンアレイ毎のビームフォーマ出力のパワーを補正する補正係数とするパワー補正係数算出手段と、(3)パワー補正係数算出手段で算出した補正係数を用い、指向性形成手段からの各マイクロホンアレイのビームフォーマ出力を補正し、補正後の各マイクロホンアレイのビームフォーマ出力をスペクトル減算して各マイクロホンアレイからみた目的エリア方向に存在する非目的エリア音を抽出し、抽出した非目的エリア音を指向性形成手段からの各マイクロホンアレイのビームフォーマ出力からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段として機能することを特徴とする収音プログラムである。
本発明によれば、目的方向にのみ鋭い指向性を形成することができ、音質劣化の少ない目的音を抽出することができる。また、目的エリアに対して前方にのみ指向性を形成し、エリア収音を行うことで、残響の影響を抑え、かつSN比を向上させることができる。
第1の実施形態に係る音源分離装置の構成を示すブロック図である。 マイクロホン数が2個の場合の減算型ビームフォーマに係る構成を示すブロック図である。 2個のマイクロホンを用いて減算型ビームフォーマにより形成される指向特性を示す図である。 本発明に係る各指向性フィルタにより形成される指向特性の一例を説明する説明図である。 第2の実施形態に係る音源分離装置の構成を示すブロック図である。 第2の実施形態に係る各指向性フィルタにより形成される指向特性を説明する説明図である。 第3の実施形態に係る音源分離装置の構成を示すブロック図である。 第4の実施形態に係る収音装置の構成を示すブロック図である。 第4の実施形態に係る収音装置の指向性形成部の構成を示すブロック図である。 第4の実施形態に係る収音装置によるエリア収音のイメージを示すイメージ図である。 第4の実施形態に係る収音装置によるエリア収音の別のイメージを示すイメージ図である。 第5の実施形態に係る収音装置の構成を示すブロック図である。 第5の実施形態に係る3個のマイクロホンから構成されるマイクロホンアレイを2個用いて、2個のエリアを切り替えて収音する状況のイメージ例を示すイメージ図である。
(A)本発明の技術的思想の説明
以下では、まず、本発明の音源分離装置及びプログラムの技術的思想を説明する。
本発明は、3個の全指向性のマイクロホンを用いて双指向性と単一指向性とを形成し、入力信号から各指向性フィルタの出力をまとめてスペクトル減算(SS)を行うことにより、目的方向にのみ鋭い指向性を形成する。
図4は、本発明に係る各指向性フィルタにより形成される指向特性の一例を説明する説明図である。
ここでは、例えば、マイクロホンは目的方向に対して水平に2個配置し、これらを第1のマイクロホンM1、第2のマイクロホンM2とする。さらに、第1のマイクロホンM1と第2のマイクロホンM2と結んだ直線と直交し、かつ、第1のマイクロホンM1若しくは第2のマイクロホンM2のいずれかのマイクロホン(ここでは、第2のマイクロホンM2)を通る直線上に第3のマイクロホンM3を配置する。この際、第3のマイクロホンM3と第2のマイクロホンM2との距離は、第1のマイクロホンM1と第2のマイクロホンM2との距離と同じとする。すなわち、3個のマイクロホンM1、M2、M3は、直角二等辺三角形の頂点となるようにする。
まず、第1のマイクロホンM1及び第2のマイクロホンM2からの信号を双指向性フィルタに入力する。また、第2のマイクロホンM2及び第3のマイクロホンM3からの信号を目的方向に死角を向ける単一指向性フィルタに入力する。
そうすると、図4に示す通り、2個の指向性はどちらも目的方向に死角を向けていることが分かる。この双指向性フィルタの出力は目的方向に対して左右方向に存在する非目的音となり、また単一指向性フィルタの出力は目的方向に対して後方に存在する非目的音となる。これら2つの指向性フィルタを用いることで、目的方向以外に存在する全ての非目的音を抽出することができる。最後に各指向性フィルタの出力を全て入力信号からSSし、目的音を抽出する。ここで、対象となる入力信号は、第1のマイクロホンM1若しくは第2のマイクロホンM2の入力信号、又は、第1のマイクロホンM1と第2のマイクロホンM2との入力信号を平均したものである。
上記方式では、SSを双指向性フィルタの出力信号と単一指向性フィルタの出力信号の2個を用いて行なっている。図4の斜線部分が示すように双指向性と単一指向性とは一部重なっており、そのままSSを行うと重複部分は2回減算することとなる。SSは、個々の音成分が周波数領域で重なる確率が低いスパース性という性質を利用して目的音を抽出する手法である。
しかし、ある音成分が単独で特定の周波数に存在するか否かは、音源の数と周波数の分解能に依存する。そのため、複数の音成分が同じ周波数に存在する状況が考えられる。そのような状況下でSSを複数回行うと、減算の度に目的音成分が削られて音質が劣化してしまう可能性がある。
そこで、本発明は、SSを行う前に予め双指向性と単一指向性の重なっている部分を消去する。双指向性フィルタで抽出した非目的音の振幅スペクトルから単一指向性フィルタで抽出した非目的音の振幅スペクトルを減算すると、双指向性フィルタで抽出した非目的音成分の内、単一指向性フィルタで抽出した非目的音成分と共通に含まれる成分が消去される。その後、単一指向性フィルタで抽出した非目的音成分と、重複成分を消去した双指向性フィルタで抽出した非目的音を入力信号からSSする。これにより、目的音成分の引き過ぎが起こらず、目的音の音質の劣化を防ぐことができる。
(B)第1の実施形態
以下、本発明に係る音源分離装置及びプログラムの第1の実施形態を、図面を参照にしながら詳細に説明する。
(B−1)第1の実施形態の構成
図1は、第1の実施形態に係る音源分離装置10Aの構成を示すブロック図である。マイクロホンを除く図1に示す部分は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAM等を有する汎用的な装置若しくはユニットが所定のプログラムを実行することで該当する機能を実現するように構築されても良く、いずれの構築方法を採用した場合であっても機能的には、図1で表すことができる。
図1において、第1の実施形態の音源分離装置10Aは、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3、信号入力部1−1、1−2、1−3、信号加算部2、双指向性形成部3、単一指向性形成部4、重複指向性消去部5、目的信号抽出部6を備える。
第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3は、全指向性マイクロホンである。
第1のマイクロホンM1と第2のマイクロホンM2は、目的方向に対して水平に配置する。第3のマクロホンM3は、第1のマイクロホンM1及び第2のマイクロホンM2と同一平面上に存在し、第1のマイクロホンM1と第2のマイクロホンM2とを結んだ直線に直交し、かつ、第2のマイクロホンM2を通る直線上に配置する。
このとき、第3のマイクロホンM3と第2のマイクロホンM2との距離は、第1のマイクロホンM1と第2のマイクロホンM3との距離と同じとなるようにする。これにより、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3は、直角二等辺三角形の頂点となるようにする。
なお、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3は、空間における同一平面上で直角二等辺三角形の頂点に配置されていればよい。
信号入力部1−1は、信号加算部2及び双指向性形成部3と接続しており、第1のマイクロホンM1が収音したアナログ信号の音響信号(音声信号、音響信号を含むもの)をデジタル信号に変換して入力し、信号加算部2及び双指向性形成部3に出力するものである。
信号入力部1−2は、信号加算部2、双指向性形成部3及び単一指向性形成部4と接続しており、第2のマイクロホンM2が収音したアナログ信号の音響信号をデジタル信号に変換して入力し、信号加算部2、双指向性形成部3及び単一指向性形成部4に出力するものである。
信号入力部1−3は、単一指向性形成部4と接続しており、第3のマイクロホンM3が収音したアナログ信号の音響信号(音声信号、音響信号)をデジタル信号に変換して入力し、単一指向性形成部4に出力するものである。
図1において、信号入力部1−1、1−2、1−3は、入力信号を時間領域から周波数領域に変換するために、例えば高速フーリエ変換等を行う。
信号加算部2は、信号入力部1−1及び信号入力部1−2から出力される信号を加算し、その加算した信号のパワーを1/2倍して目的信号抽出部6に出力する。信号加算部2の出力信号は、目的信号抽出部6におけるスペクトル減算法(SS)を行う際の入力信号となる。第1の実施形態では、信号加算部2が第1のマイクロホンM1及び第2のマイクロホンM2からの音響信号を平均した信号を目的信号抽出部6に出力する場合を例示するが、第1のマイクロホンM1又は第2のマイクロホンM2のいずれかの信号を目的信号抽出部6に出力するようにしても良い。
双指向性形成部3は、信号入力部1−1及び信号入力部1−2からの出力(デジタル信号)に対するビームフォーマ(BF)により、目的方向に死角を向ける双指向性を形成する双指向性フィルタであり、形成した双指向性を重複指向性消去部5に出力する。
単一指向性形成部4は、信号入力部1−2及び信号入力部1−3からの出力(デジタル信号)に対するビームフォーマにより、目的方向に死角を向ける単一指向性を形成する単一指向性フィルタであり、形成した単一指向性を重複指向性消去部5に出力する。
重複指向性消去部5は、目的信号抽出部6においてスペクトル減算法(SS)を行う前に、双指向性と単一指向性との指向性重複部分を消去するため、双指向性形成部3の出力信号と単一指向性形成部4の出力信号とに共通に含まれる信号成分を消去するものである。
目的信号抽出部6は、信号加算部2と重複指向性消去部5と接続しており、信号加算部2からの信号を入力信号として、この入力信号から重複指向性消去部5の出力信号をスペクトル減算することにより、目的音を抽出するものである。
目的音を抽出するための処理では、全ての出力が周波数領域で表現されていることを要する。従って、上述したように、信号入力部1−1、1−2、1−3は、時間領域の信号を周波数領域の信号に変換する変換部を有している。
(B−2)第1の実施形態の動作
次に、第1の実施形態に係る音源分離装置10Aにおける動作を説明する。
第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3は、それぞれ直角二等辺三角形の頂点になるように配置される。例えば、第1のマイクロホンM1及び第2のマイクロホンM2の間隔と、第2のマイクロホンM2及び第3のマイクロホンM3の間隔とが例えば3cmとなるように配置したものとする。
目的とする音源が発した音(音声や音響)が第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3により収音(捕捉)される。
第1のマイクロホンM1が捕捉して得た音響信号(アナログ信号)は、信号入力部1−1によりデジタル変換され、更に信号入力部1−1により、例えば高速フーリエ変換を用いて時間領域から周波数領域に変換されて信号加算部2及び双指向性形成部3に与えられる。
また、第2のマイクロホンM2が捕捉して得た音響信号(アナログ信号)は、信号入力部1−2によりデジタル変換され、更に信号入力部1−2により、例えば高速フーリエ変換を用いて時間領域から周波数領域に変換されて信号加算部2、双指向性形成部3及び単一指向性形成部4に与えられる。
さらに、第3のマイクロホンM3が捕捉して得た音響信号(アナログ信号)は、信号入力部1−3によりデジタル変換され、更に信号入力部1−3により、例えば高速フーリエ変換を用いて時間領域から周波数領域に変換されて単一指向性形成部4に与えられる。
信号加算部2において、時間軸が揃えられた信号入力部1−1からの出力信号と信号入力部1−2からの出力信号とが加算され、この加算された信号のパワーが1/2倍されて、目的音成分が強調される。
双指向性形成部3では、(1)式に従い、θ=0として、第1のマイクロホンM1と第2のマイクロホンM2との間の距離d(例えば3cm)に基づいて、第1のマイクロホンM1に到来した信号と第2のマイクロホンM2に到来した信号との時間差が算出される。更に、双指向性形成部3では、(3)式に従って、信号入力部1−1からの周波数領域の出力信号と、信号入力部1−2からの周波数領域の出力信号とに基づいて、目的方向に死角を向ける双指向性が形成される。
つまり、双指向性形成部3により形成される双指向性は、図4に示す通り、目的方向に対して、第1のマイクロホンM1及び第2のマイクロホンM2を結んだ直線方向(図4における左右方向)に存在する非目的音となる。
単一性形成部4では、(1)式に従い、θ=−π/2とし、第2のマイクロホンM2と第3のマイクロホンM3との間の距離d(例えば3cm)に基づいて、第2のマイクロホンM2に到来した信号と第3のマイクロホンM3に到来した信号との時間差が算出される。更に、単一指向性形成部4では、(3)式に従って、信号入力部1−2からの周波数領域の出力信号と、信号入力部1−3からの周波数領域の出力信号とに基づいて、目的方向に死角を向ける単一指向性が形成される。
つまり、単一指向性形成部4により形成される単一指向性は、図4に示す通り、目的方向に対して後方(すなわち、目的方向の反対側)に存在する非目的音となる。
重複指向性消去部5では、双指向性形成部3の出力の振幅スペクトルNBDと単一指向性形成部4の出力の振幅スペクトルNUDに共通に含まれる信号成分が消去される。
ここで、重複指向性消去部5による重複する信号成分の消去方法は、(5)式に従って行なわれる。
Figure 0006206003
ここで、NUD1はNUDとNBDの重複成分を消去した出力信号の振幅スペクトルである。
重複指向性消去部5による重複信号成分の減算の結果、NUD1がマイナスの値になった場合、重複指向性消去部5はフロアリング処理を行う。また、この例では、重複指向性消去部5がNUDからNBDを減算しているが、逆にNBDからNUDを減算し、重複成分を消去した出力信号の振幅スペクトルNBD1としても良い。なお、BFによる指向性は、マイクロホン間隔により周波数毎のゲインが違ってくるが、NBDとNUDはともにゲイン補正を行なっているものとする。
ビームフォーマ(BF)により指向性は、マイクロホンの間隔により周波数毎のゲインが違ってくるが、双指向性形成部3の出力の振幅スペクトルNBDと単一指向性形成部4の出力の振幅スペクトルNUDとは共にゲイン補正を行っているものとする。例えば、重複指向性消去部5が、時間軸が揃えられた双指向性形成部3の出力の振幅スペクトルNBDと単一指向性形成部4の出力の振幅スペクトルNUDとに基づいて、周波数毎の振幅スペクトルの比率を求め、出力パワーを揃えるための補正係数を用いてゲイン補正するようにしても良い。
目的信号抽出部6には、信号加算部2から目的音としての出力の振幅スペクトルXDSと、重複指向性消去部5から非目的音としての出力の振幅スペクトルNBD及び重複部分減算後の出力の振幅スペクトルNUD1とが与えられる。
そして、目的信号抽出部6では、信号加算部2の出力の振幅スペクトルXDSから、重複指向性消去部5の出力の振幅スペクトルNBD及び重複部分減算後の出力の振幅スペクトルNUD1を減算して、強調した目的音が抽出される。
目的信号抽出部6による目的音の抽出は、(6)式に従って行なわれる。
Y=XDS−βBD−βUD1 (6)
ここで、βとβはスペクトル減算による強度を調節するための係数である。
(B−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、3個の全指向性マイクロホンにより収音された音響信号を用いて、単一指向性フィルタと双指向性フィルタにより非目的音を抽出し、抽出した非目的音を入力信号からSSすることにより、目的方向にのみ鋭い指向性を形成することができる。
また、第1の実施形態によれば、目的方向の指向性の形成にSSしか使用していないため、雑音が増えたとしても音源分離性能が急激に悪化することはない。さらに、第1の実施形態によれば、双指向性と単一指向性の重複する指向性重複部分を予め消去してからSSを行うことで、重複部分の複数回の減算による目的音の音質の劣化を防ぐことができる。
(C)第2の実施形態
次に、本発明に係る音源分離装置及びプログラムの第2の実施形態を、図面を参照しながら詳細に説明する。
第1の実施形態では、3個のマイクロホンを直角二等辺三角形の頂点に配置する場合を例示したが、第2の実施形態では、正三角形の頂点に3個のマイクロホンを配置する場合を例示する。
(C−1)第2の実施形態の構成
図5は、第2の実施形態に係る音源分離装置10Bの構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一符号を付して示している。
図5において、第2の実施形態に係る音源分離装置10Bは、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3、信号入力部1−1〜1−3、信号加算部2、双指向性形成部3、単一指向性形成部4−1及び4−2、重複指向性消去部5、目的信号抽出部6を備える。
第1のマイクロホンM1と第2のマイクロホンM2は、目的方向に対して水平に配置する。第3のマクロホンM3は、第1のマイクロホンM1及び第2のマイクロホンM2と同一平面上であって、目的方向の反対側に位置するようにして、第1のマイクロホンM1、第2のマイクロホンM2及び第3のマイクロホンM3が正三角形の頂点になるように配置される。
信号入力部1−1は、信号加算部2、双指向性形成部3及び単位値指向性形成部4−1と接続しており、出力信号を信号加算部2、双指向性形成部3及び単位値指向性形成部4−1に与える。
信号入力部1−2は、信号加算部2及び単一指向性形成部4−2と接続しており、出力信号を信号加算部2及び単一指向性形成部4−2に与える。
信号入力部1−3は、単一指向性形成部4−1及び4−2に接続しており、出力信号を単一指向性形成部4−1及び4−2に与える。
単一指向性形成部4−1は、信号入力部1−1及び信号入力部1−3からの出力(デジタル信号)に対するビームフォーマにより、目的方向に対し+60°の角度に死角を向ける単一指向性を形成する単一指向性フィルタであり、形成した単一指向性を重複指向性消去部5に出力する。
単一指向性形成部4−2は、信号入力部1−2及び信号入力部1−3からの出力(デジタル信号)に対するビームフォーマにより、目的方向に対し−60°の角度に死角を向ける単一指向性を形成する単一指向性フィルタであり、形成した単一指向性を重複指向性消去部5に出力する。
重複指向性消去部5は、双指向性形成部3と単一指向性形成部4−1及び4−2とのそれぞれの出力に共通に含まれる信号成分を消去するものである。
(C−2)第2の実施形態の動作
第2の実施形態の音源分離装置10Bにおける動作は、単一指向性形成部4−1及び4−2、重複指向性消去部5、目的信号抽出部6の動作が異なっているため、以下ではこれらの構成要素の動作を説明する。
上述したように、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3はそれぞれ、正三角形の頂点になるように配置される。
第2の実施形態では、第1のマイクロホンM1及び第3のマイクロホンM3の音響信号に基づいて単一指向性を形成し、第2のマイクロホンM2及び第3のマイクロホンM3の音響信号に基づいて単一指向性を形成する。
単一性形成部4−1では、(1)式に従い、θ=−π/2とし、第1のマイクロホンM1と第3のマイクロホンM3との間の距離d(例えば3cm)に基づいて、第1のマイクロホンM1に到来した信号と第3のマイクロホンM3に到来した信号との時間差が算出される。更に、単一指向性形成部4−1では、(3)式に従って、信号入力部1−1からの周波数領域の出力信号と、信号入力部1−3からの周波数領域の出力信号とに基づいて、目的方向に対し+60°に死角を向ける単一指向性が形成される。
単一性形成部4−2では、(1)式に従い、θ=−π/2とし、第2のマイクロホンM2と第3のマイクロホンM3との間の距離d(例えば3cm)に基づいて、第2のマイクロホンM2に到来した信号と第3のマイクロホンM3に到来した信号との時間差が算出される。更に、単一指向性形成部4−2では、(3)式に従って、信号入力部1−2からの周波数領域の出力信号と、信号入力部1−3からの周波数領域の出力信号とに基づいて、目的方向に対し−60°に死角を向ける単一指向性が形成される。
重複指向性消去部5では、双指向性形成部3の出力と単一指向性形成部4−1及び4−2の出力とのそれぞれに共通に含まれる成分を消去する。
図6は、第2の実施形態に係る各指向性フィルタにより形成される指向特性を説明する説明図である。
図6に示すように、指向性の重複部分は、双指向性形成部3からの双指向性と単一指向性形成部4−1からの単一指向性との間、双指向性形成部3からの双指向性と単一指向性形成部4−2からの単一指向性との間に存在すると共に、単一指向性形成部4−1及び4−2からの単一指向性の間にも存在している。
そこで、重複指向性消去部5による重複部分の消去方法は、(5)式を拡張した(7)式〜(9)式を使用する。
Figure 0006206003
ここで、NBDは双指向性形成部3の出力の振幅スペクトル、NUDLは単一指向性形成部4−1の出力の振幅スペクトル、NUDRは単一指向性形成部4−2の出力の振幅スペクトルである。
重複指向性消去部5では、双指向性形成部3の出力の振幅スペクトルNBDと単一指向性形成部4−1の出力の振幅スペクトルNUDLに共通に含まれる信号成分が消去される。つまり、重複指向性消去部5では、(7)式に従って、単一指向性形成部4−1の出力の振幅スペクトルNUDLから双指向性形成部3の出力の振幅スペクトルNBDを減算して、重複部分減算後の出力の振幅スペクトルNUDL1が求められる。
また、重複指向性消去部5では、双指向性形成部3の出力の振幅スペクトルNBDと単一指向性形成部4−2の出力の振幅スペクトルNUDRに共通に含まれる信号成分が消去される。つまり、重複指向性消去部5では、(8)式に従って、単一指向性形成部4−2の出力の振幅スペクトルNUDRから双指向性形成部3の出力の振幅スペクトルNBDを減算して、重複部分減算後の出力の振幅スペクトルNUDR1が求められる。
さらに、重複指向性消去部5では、NBDとの重複成分を消去した出力の振幅スペクトルNUDL1と、NBDとの重複成分を消去した出力の振幅スペクトルNUDR1とに共通に含まれる信号成分が消去される。つまり、重複指向性消去部5では、(9)式に従って、NBDとの重複成分を消去した出力の振幅スペクトルNUDR1から、NBDとの重複成分を消去した出力の振幅スペクトルNUDL1を減算して、重複部分減算後の出力の振幅スペクトルNUDR2が求められる。
また、(7)式〜(9)式において、重複成分を消去する順番は、変更することができる。つまり、各振幅スペクトルを入れ替えて、NUDL2=NUDL1−NUDR1や、NBD1=NBD−NUDLとして処理を進めても良い。
なお、(7)式〜(9)式において、重複部分の減算後の出力の振幅スペクトルNUDL1、NUDR1、NUDR2の値がマイナスになった場合には、重複部分減算後の出力の振幅スペクトルNUDL1、NUDR1、NUDR2の値を0に置き換えるフロアリング処理がなされる。なお、フロアリング処理は、重複部分の減算後の出力の振幅スペクトルの元の値(直前の値)を小さくした値に置き換えるようにしても良い。
また、第1の実施形態と同様に、ビームフォーマ(BF)により指向性は、マイクロホンの間隔により周波数毎のゲインが違ってくるため、出力の振幅スペクトルについて、周波数毎のゲイン補正を行うようにしても良い。
目的信号抽出部6には、信号加算部2から目的音としての出力の振幅スペクトルXDSと、重複指向性消去部5から非目的音としての重複部分減算後の出力の振幅スペクトルNUDL1及び重複部分減算後の出力の振幅スペクトルNUDR2とが与えられる。
そして、目的信号抽出部6では、(10)式に従って、信号加算部2の出力の振幅スペクトルXDSから、重複部分減算後の出力の振幅スペクトルNUDL1及びNUDR2を減算して、強調した目的音が抽出される。ここで、βとβ、βはそれぞれSSの強度を調節するための係数である。
Y=XDS−βBD−βUDL1−βUDR2 (10)
(C−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、正三角形の頂点に3個の全指向性マイクロホンを配置した場合でも、第1の実施形態と同様の効果が得られる。
(D)第3の実施形態
次に、本発明に係る音源分離装置及びプログラムの第3の実施形態を、図面を参照しながら詳細に説明する。
上述した第2の実施形態では、第1のマイクロホンM1と第3のマイクロホンM3、第2のマイクロホンM2と第3のマイクロホンM3の2つの組合せでそれぞれ単一指向性を形成した。
ここで、目的方向に存在する音源は、第1のマイクロホンM1と第2のマイクロホンM2に同時に到達するため、信号加算部2の出力を第1のマイクロホンM1と第2のマイクロホンM2の中間に位置するマイクロホンで収音した音響信号と擬似的にみなすことができる。
そこで、第3の実施形態では、信号加算部2の出力と信号入力部1−3の出力とを用いて、目的方向に死角を向ける単一指向性を形成する場合を説明する。
(D−1)第3の実施形態の構成
図7は、第3の実施形態に係る音源分離装置10Cの構成を示すブロック図であり、第1及び第2の実施形態に係る図1及び図5との同一、対応部分には同一符号を付して示している。
図7において、第3の実施形態に係る音源分離装置10Cは、第1のマイクロホンM1、第2のマイクロホンM2、第3のマイクロホンM3、信号入力部1−1〜1−3、信号加算部2、双指向性形成部3、単一指向性形成部4、重複指向性消去部5、目的信号抽出部6を備える。
信号入力部1−1は、第1の実施形態と同様に、信号加算部2及び双指向性形成部3と接続しており、出力信号を信号加算部2及び双指向性形成部3に与える。
信号入力部1−2は、信号加算部2及び双指向性形成部3と接続しており、出力信号を信号加算部2及び双指向性形成部3に与える。
信号入力部1−3は、単一指向性形成部4に接続しており、出力信号を単一指向性形成部4に与える。
信号加算部2は、第1の実施形態と同様に、信号入力部1−1及び信号入力部1−2から出力される信号を加算し、その加算した信号のパワーを1/2倍して目的信号抽出部6及び単一指向性形成部4に出力する。
単一指向性形成部4は、信号入力部1−3からの出力及び信号加算部2からの出力に対するビームフォーマにより、目的方向に死角を向ける単一指向性を形成する単一指向性フィルタであり、形成した単一指向性を重複指向性消去部5に出力する。
双指向性形成部3、重複指向性消去部5及び目的信号抽出部6は、第1の実施形態と同様の構成である。
(D−2)第3の実施形態の動作
第3の実施形態の音源分離装置10Cにおける動作は、単一指向性形成部4の動作が異なっているため、以下では単一指向性形成部4の動作を説明する。
信号加算部2において、信号入力部1−1及び信号入力部1−2から出力される信号を加算し、その加算した信号のパワーを1/2倍した信号が、単一指向性形成部4に出力される。
この信号加算部2からの出力は、目的方向に対して水平に配置された信号入力部1−1及び1−2からの出力を平均しているため、第1のマイクロホンM1と第2のマイクロホンM2の中間に位置するマイクロホン(疑似的なマイクロホン)で収音した音響信号とみなすことができる。
単一性形成部4では、(1)式に従い、θ=−π/2とし、第3のマイクロホンM3の出力と、信号加算部2の出力との時間差を算出する。更に、単一指向性形成部4では、(3)式に従って、信号入力部1−3からの周波数領域の出力信号と、信号加算部2からの周波数領域の出力信号とに基づいて、目的方向に死角を向ける単一指向性が形成される。
双指向性形成部3、重複指向性消去部5及び目的信号抽出部6の動作は、第1の実施形態と同様であり、目的信号抽出部6により強調された目的音が抽出される。
(D−3)第3の実施形態の効果
以上のように、第3の実施形態によれば、正三角形の頂点に3個の全指向性マイクロホンを配置した場合でも、第1のマイクロホンM1と第2のマイクロホンM2に同時に到達するため、信号加算部2の出力を、第1のマイクロホンM1と第2のマイクロホンM2の中間に位置するマイクロホンで収音した音響信号とみなすことにより、第1及び第2の実施形態と同様の効果が得られる。
(E)第4の実施形態
次に、本発明に係る音源分離装置、音源分離プログラム、収音装置及び収音プログラムの第4の実施形態を、図面を参照しながら詳細に説明する。
第4の実施形態は、第1の実施形態で説明した3個の全指向性マイクロホンからなるマイクロホンアレイを用いて、ある特定のエリア内に存在する目的エリア音を収音する収音装置に本発明を適用する場合を例示する。
(E−1)第4の実施形態の構成
図8は、第4の実施形態に係る収音装置20Aの構成を示すブロック図である。図8において、第1の実施形態に係る図1との同一、対応部分には同一符号を付して示している。
マイクロホンを除く図8に示す部分は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAM等を有する汎用的な装置若しくはユニットが所定のプログラムを実行することで該当する機能を実現するように構築されても良く、いずれの構築方法を採用した場合であっても機能的には、図8で表すことができる。
図8において、第4の実施形態に係る収音装置20Aは、第1のマイクロホンアレイMA1、第2のマイクロホンアレイMA2、データ入力部1、指向性形成部21、遅延補正部22、空間座標データ保持部23、目的エリア音パワー補正係数算出部24、目的エリア音抽出部25を備える。
第1のマイクロホンアレイMA1は、目的エリア(以下、TARとも呼ぶ、図10参照。)が存在する空間の、目的エリアTARを指向できる場所に配置される。
第1のマイクロホンアレイMA1は、図8に示すように、3個のマイクロホンM1、M2及びM3から構成されており、3個のマイクロホンM1、M2及びM3が直角二等辺三角形の頂点に配置されている。各マイクロホンM1、M2及びM3が収音(捕捉)して得た音響信号は当該収音装置20Aの本体に入力される。
第2のマイクロホンアレイMA2は、第1のマイクロホンアレイMA1と同様に、3個のマイクロホンM1、M2及びM3が直角二等辺三角形の頂点に配置された構成であり、各マイクロホンM1、M2及びM3が収音(捕捉)して得た音響信号は当該収音装置20Aの本体に入力される。
また、第2のマイクロホンアレイMA2は、第1のマイクロホンアレイMA1とは異なる、目的エリアTARを指向できる場所に配置されている。つまり、目的エリアTARに対する第1及び第2のマイクロホンアレイMA1及びMA2の位置は、各マイクロホンアレイMA1及びMA2の指向性が目的エリアTARでのみ重なっていればよく、例えば目的エリアTARを挟んで対向する位置にそれぞれが配置するようにしても良い。
なお、マクロホンアレイの数は2個に限定されるものではなく、目的エリアTARが複数存在する場合、全ての目的エリアTARをカバーできる数のマイクロホンアレイを配置するようにしても良い。
また、第1及び第2のマイクロホンアレイMA1及びMA2を構成するマイクロホンM1、M2及びM3は、直角二等辺三角形の頂点に配置されるものであっても良いし、正三角形の頂点に配置されるものであっても良い。
データ入力部1は、第1及び第2のマイクロホンアレイMA1、MA2で収音した音響信号をアナログ信号からデジタル信号に変換するものである。データ入力部1は、例えば高速フーリエ変換等を用いて、時間領域から周波数領域に変換して、指向性形成部21に出力する。
指向性形成部22は、各マイクロホンアレイMA1、MA2からの出力(デジタル信号)に対するビームフォーマにより、目的エリア方向に対して各マイクロホンアレイMA1、MA2の前方に指向性を向けた指向性ビームを形成し、各マイクロホンアレイMA1、MA2についてのビームフォーマ出力を得るものである。ビームフォーマ法は、加算型の遅延和法、減算型のスペクトル減算法など各種手法を使うことができる。また、ターゲットとする目的エリアTARの範囲に応じて指向性の強度を変更するようにしても良い。
空間座標データ保持部23は、目的エリアTAR(の中心)の位置情報や、各マイクロホンアレイMA1、MA2の位置情報を保持しているものである。
遅延補正部22は、目的アリアTARと各マイクロホンアレイMA1、MA2の距離の違いにより発生する遅延(伝搬遅延時間)の差を算出し、その差を吸収するように、各マイクロホンアレイMA1、MA2についてのビームフォーマ出力の少なくとも1つを補正するものである。具体的な手順例は、まず、空間座標データ保持部23から、目的エリアTARの位置と各マイクロホンアレイの位置を取得し、各マイクロホンアレイへの目的エリア音の到達時間(伝搬遅延時間)の差を算出する。目的エリアTARから最も遠い位置に配置されたマイクロホンアレイに目的エリア音が到達するタイミングを基準とし、全てのマイクロホンアレイに目的エリア音が同時に到達するように、基準のマイクロホンアレイ以外の他の全てのマイクロホンアレイのビームフォーマ出力に遅延を加える。
なお、目的エリアTARが変更されることなく、かつ、その目的エリアTARと各マイクロホンアレイMA1、MA2との距離が等しい場合には、遅延補正部22及び空間座標データ保持部23を省略することができる。
目的エリア音パワー補正係数算出部24は、各ビームフォーマ出力における目的エリア音のパワーを揃えるための補正係数を算出するものである。
ここで、目的エリア音パワー補正係数算出部24による補正係数の算出手法の一例として、各マイクロホンアレイのBF出力に含まれる目的エリア音のパワーの比率を推定し、それを補正係数とする方法を使用できる。
目的エリア音抽出部25は、遅延補正部22から出力された各ビームフォーマ出力と、目的エリア音パワー補正係数算出部24から出力された補正係数とに基づいて、目的エリア音を抽出するものである。
図9は、第4の実施形態に係る指向性形成部21の内部構成を示すブロック図である。
指向性形成部21は、第1の実施形態で説明した音源分離装置10Aと同一、対応する構成を、マイクロホンアレイMA1、MA2毎に備えており、対応する構成要素には、第1の実施形態の図1と同一符号を付している。
つまり、指向性形成部21は、マイクロホンアレイMA1、MA2毎に、目的方向に対してマイクロホンアレイの前方を指向性方向とする指向性を形成するため、指向性形成部21は、マイクロホンアレイMA1又はMA2毎に、図9に示す内部構成を有する。
図9において、第4の実施形態の指向性形成部21は、信号加算部2、双指向性形成部3、単一指向性形成部4、重複指向性消去部5、目的信号抽出部6を備える。
(E−2)第4の実施形態の動作
次に、第4の実施形態に係る収音装置20Aの動作を説明する。
目的エリアTARに位置している全ての音源が放音した音は、目的エリアTARを処理対象としている、全てのマイクロホンアレイMA1、MA2のマイクロホンM1、M2及びM3によって捕捉される。なお、マイクロホンアレイMA1及びMA2のマイクロホンM1、M2及びM3は目的エリアTAR以外のエリアに存在する音源からの音も捕捉する。
第1のマイクロホンアレイMA1の全てのマイクロホンM1、M2及びM3が、収音(捕捉)して得た音響信号(アナログ信号)は、データ入力部1によってデジタル信号に変換されて指向性形成部21に与えられる。同様に、第2のマイクロホンアレイMA2の全てのマイクロホンM1、M2及びM3が、収音(捕捉)して得た音響信号(アナログ信号)は、データ入力部1によってデジタル信号に変換されて指向性形成部21に与えられる。
第1のマイクロホンアレイMA1からのデジタル信号に変換された全ての音響信号に対し、指向性形成部21によって、目的エリアTARの方向に対してマイクロホンアレイMA1の前方を指向性方向とするビームフォーマ処理が施されて、ビームフォーマ出力が遅延補正部22に与えられる。また、第2のマイクロホンアレイMA2からのデジタル信号に変換された全ての音響信号に対し、指向性形成部21によって、目的エリアTARの方向に対してマイクロホンアレイMA1の前方を指向性方向とするビームフォーマ処理が施されて、ビームフォーマ出力が遅延補正部22に与えられる。
ここで、指向性形成部21における詳細な動作を、図9を用いて説明する。
第1のマイクロホンアレイMA1の、目的方向に対して水平に位置するマイクロホンM1からの入力信号x11とマイクロホンM2からの入力信号x12が信号加算部2に与えられる。信号加算部2では、入力信号x11と入力信号x12を加算した後、加算した信号のパワーを1/2倍して、目的音成分を強調する。
また、第1のマイクロホンアレイMA1のマイクロホンM1及びM2の入力信号x11及びx12が、双指向性形成部3に与えられる。双指向性形成部3では、入力信号x11と入力信号x12を用い、目的方向に死角を向ける双指向性フィルタを形成する。双指向性の形成は、第1の実施形態と同様にして、(1)と(3)式に従い、θ=0として求められる。
さらに、第1のマイクロホンアレイMA1の、目的方向と同じ方向に位置するするマイクロホンM2及びM3の入力信号x12及び入力信号x13が単一指向性形成部4に与えられる。単一指向性形成部4では、目的方向と同じ方向に位置するするマイクロホンM2及びM3の入力である入力信号x12及び入力信号x13を用い、目的方向に死角を向ける単一指向性フィルタを形成する。双指向性の形成は、第1の実施形態と同様に、(1)と(3)式に従い、θ=−π/2として求められる。
重複指向性消去部5では、双指向性形成部3の出力の振幅スペクトルNBDと単一指向性形成部4の出力の振幅スペクトルNUDに共通に含まれる信号成分が消去される。つまり、重複指向性消去部5では、(5)式に従って、単一指向性形成部4の出力の振幅スペクトルNUDから双指向性形成部3の出力の振幅スペクトルNBDを減算して、重複部分減算後の出力の振幅スペクトルNUD1が求められる。
ここで、重複部分減算後の出力の振幅スペクトルNUD1を求める際、重複部分減算後の出力の振幅スペクトルNUD1の値がマイナスになった場合には、重複部分減算後の出力の振幅スペクトルNUD1の値を0又は元の値を小さくした値に置き換えるフロアリング処理がなされる。なお、フロアリング処理は、重複部分減算後の出力の振幅スペクトルNUD1の元の値(直前の値)を小さくした値に置き換えるようにしても良い。
ビームフォーマ(BF)により指向性は、マイクロホンの間隔により周波数毎のゲインが違ってくるが、双指向性形成部3の出力の振幅スペクトルNBDと単一指向性形成部4の出力の振幅スペクトルNUDとは共にゲイン補正を行っているものとする。例えば、重複指向性消去部5が、時間軸が揃えられた双指向性形成部3の出力の振幅スペクトルNBDと単一指向性形成部4の出力の振幅スペクトルNUDとに基づいて、周波数毎の振幅スペクトルの比率を求め、出力パワーを揃えるための補正係数を用いてゲイン補正するようにしても良い。
目的信号抽出部6には、信号加算部2から目的音としての出力の振幅スペクトルXDSと、重複指向性消去部5から非目的音としての出力の振幅スペクトルNBD及び重複部分減算後の出力の振幅スペクトルNUD1とが与えられる。そして、目的信号抽出部6では、(6)式に従って、信号加算部2の出力の振幅スペクトルXDSから、重複指向性消去部5の出力の振幅スペクトルNBD及び重複部分減算後の出力の振幅スペクトルNUD1を減算して、強調した目的音が抽出される。
第2のマイクロホンアレイMA2についても、マイクロホンM1、M2及びM3からの入力信号x21、x22及びx23は指向性形成部21に与えられ、第1のマイクロホンアレイMA1の場合と同様にして、目的方向に対して第2のマイクロホンアレイMA2の前方にのみ強調された目的音が抽出される。
遅延補正部3では、空間座標データ保持部23の保持データに基づいて、目的エリアTARと各マイクロホンアレイMA1、MA2の距離の違いにより発生する目的エリアTARから第1のマイクロホンアレイMA1への伝搬遅延時間と、目的エリアTARから第1のマイクロホンアレイMA2への伝搬遅延時間との差が算出され、その時間差を吸収するように各マイクロホンアレイMA1、MA2についてのビームフォーマ出力Xma1(t)及びXma2(t−τ)の少なくとも1つの時間軸が補正される。
以上のようにして時間軸が揃えられたビームフォーマ出力Xma1(t)及びXma2(t−τ)が目的エリア音抽出部25及び目的エリア音パワー補正係数算出部24に与えられる。
また、目的エリア音パワー補正係数算出部24では、時間軸が揃えられたビームフォーマ出力Xma1(t)及びXma2(t−τ)に基づいて、これらビームフォーマ出力Xma1(t)及びXma2(t−τ)における目的エリア音のパワーを揃えるための補正係数が算出される。
例えば2個のマイクロホンアレイMA1、MA2を使用する場合、目的エリア音パワーの補正係数は、(11)式、(12)式、又は(13)式、(14)式により算出される。
Figure 0006206003
ここで、X1k(n)、X2k(n)はマイクロホンアレイMA1、MA2のビームフォーマ出力の振幅スペクトル、Nは周波数ビンの総数、kは周波数、α(n)、α(n)は各ビームフォーマ出力に対するパワー補正係数である。またmodeは最頻値、medianは中央値を表している。
目的エリア音抽出部25は、目的エリア音パワー補正係数算出部24からの補正係数α(n)、α(n)により補正した各ビームフォーマ出力データを、(15)式、(16)式に従ってスペクトル減算を行い、目的エリア方向に存在する雑音を抽出する。つまり、補正係数α(n)、α(n)により各ビームフォーマ出力を補正し、スペクトル減算を行うことで、目的エリア方向に存在する非目的エリア音を抽出する。
(n)=X(n)−α(n)X(n) (15)
(n)=X(n)−α(n)X(n) (16)
マイクロホンアレイMA1からみた目的エリア方向に存在する非目的エリア音N(n)を抽出するには、(15)式に示すように、マイクロホンアレイMA1のビームフォーマ出力X(n)からマイクロホンアレイMA2のビームフォーマ出力X(n)にパワー補正係数αを掛けたものをスペクトル減算する。同様に、(16)式に従い、マイクロホンアレイMA2からみた目的エリア方向に存在する非目的エリア音N(n)を抽出する。
さらに、目的エリア音抽出部25は、抽出した雑音を各ビームフォーマ出力から(17)式、(18)式に従ってスペクトル減算することにより、目的エリア音を抽出する。ここで、γ(n)、γ(n)はスペクトル減算時の強度を変更するための係数である。
(n)=X(n)−γ(n)N(n) (17)
(n)=X(n)−γ(n)N(n) (18)
図10は、第4の実施形態に係る収音装置20Aによるエリア収音のイメージを示すイメージ図である。図10の点線は、特願2012−217315で提案した従来の双指向性による減算型BFの指向性を示しており、塗りつぶしてある部分が第4の実施形態の手法の指向性を示している。
図10に示すように、各マイクロホンアレイMA1、MA2において、マイクロホンM1及びM2は目的方向に対して水平に配置し、さらにマイクロホンM1及びM2を結んだ直線と直交し、かつ、いずれかのマイクロホン(ここでは、マイクロホンM2)を通る直線上にマイクロホンM3を配置する。
各マイクロホンアレイMA1、MA2の指向性は前方にのみ形成されるため、後方から回りこむ残響の影響を抑えることができる。また、図10の点線で示す各マイクロホンアレイMA1、MA2の後方に位置する非目的エリア音1、2を予め抑圧することで、エリア収音のSN比を改善することができる。
従来のエリア収音手法は、各マイクロホンアレイMA1、MA2の指向性が目的エリアでのみ重なる必要がある。そのため、従来の双指向性による減算型BFは目的方向に鋭い指向性を形成できるが、図10に示したように目的方向に対してマイクロホンアレイMA1、MA2の前方だけでなく、後方にも直線的に指向性を形成する。そのため、2個のマイクロホンアレイMA1、MA2に挟まれたエリアを収音しようとしても、各マイクロホンアレイMA1、MA2の指向性が全て重なり、2個のマイクロホンアレイMA1、MA2を結ぶ直線上に存在する全てのエリアを収音してしまうことになる。
しかし、第4の実施形態の場合、マイクロホンアレイMA1、MA2の指向性が目的エリアTARに対して前方にのみ形成されているため、2個のマイクロホンアレイMA1、MA2に挟まれたエリアを収音することが可能である。
図11は、第4の実施形態に係る収音装置20Aによるエリア収音の別のイメージを示すイメージ図である。図11では、目的エリアTARを挟んで対向する位置に、2個のマイクロホンアレイMA1、MA2を配置している。
この場合、2個のマイクロホンアレイMA1、MA2のそれぞれ指向性を形成すると、マイクロホンアレイMA1の指向性には目的エリア音と非目的エリア音2が含まれることになる。
また、マイクロホンアレイMA2の指向性には目的エリア音と非目的エリア音1が含まれることになる。
各指向性に含まれる非目的エリア音成分は違うため、共通に含まれる目的エリア音のみ抽出することができる。このようなマイクロホンアレイMA1、MA2の配置でエリア収音を行うと、残響の影響を更に抑えることができる。
つまり、2個のマイクロホンアレイMA1、MA2を用いてエリア収音する場合、特願2012−217315で提案した従来のエリア収音手法では、各マイクロホンアレイMA1、MA2の指向性の織りなす角度は90度であるのに対し、第4の実施形態の手法によれば180度となる。このため、反射した非目的エリア音が、各マイクロホンアレイMA1、MA2の指向性に同時に侵入する確率は低くなり、エリア収音性能の劣化が起こり難くなる。
(E−3)第4の実施形態の効果
以上のように、第4の実施形態によれば、3個の全指向性マイクロホンからなるマイクロホンアレイを用いることで、目的エリアに対して前方にのみ指向性を形成し、エリア収音を行うことで、残響の影響を抑え、かつSN比を向上させることができる。
(F)第5の実施形態
次に、本発明に係る音源分離装置、音源分離プログラム、収音装置及び収音プログラムの第5の実施形態を、図面を参照しながら詳細に説明する。
3個のマイクロホンから構成されるマイクロホンアレイを用いる場合、双指向性や単一指向性を形成するマイクロホンの組み合わせを変えることで、指向性を形成する方向を変えることができる。
そこで、第5の実施形態では、各マイクロホンアレイの指向性の方向を変えることで、マイクロホンアレイ自体を動かさずに別のエリアを収音することが可能となる実施形態を例示する。
(F−1)第5の実施形態の構成
図12は、第5の実施形態に係る収音装置20Bの構成を示すブロック図であり、第4の実施形態に係る図1との同一、対応部分には同一符号を付して示している。
図12において、第5の実施形態に係る収音装置20Bは、第1のマイクロホンアレイMA1、第2のマイクロホンアレイMA2、データ入力部1、指向性形成部21、遅延補正部22、空間座標データ保持部23、目的エリア音パワー補正係数算出部24、目的エリア音抽出部25に加えて、エリア選択部26、エリア切替部27を備える。
エリア選択部26は、例えばGUIなどを介してユーザが選択した目的エリアTARの情報を受け取り、エリア切替部8に与えるものである。目的エリアTARの数は、1個だけでなく、同時に複数選択することもできる。
エリア切替部27は、エリア選択部7から与えられた目的エリアTARの情報に基づいて、空間座標データ保持部23から目的エリアTARと各マイクロホンアレイMA1、MA2と各マイクロホンアレイMA1、MA2を構成するマイクロホンM1、M2及びM3の位置情報を取得し、目的エリアTARに向けて指向性を形成するために必要なマイクロホンアレイとマイクロホンとの組み合わせを決定し、指向性形成部21へ入力される信号を制御するものである。
(F−2)第5の実施形態の動作
第5の実施形態に係る収音装置20Bの動作は、エリア選択部26及びエリア切替部27の動作が第4の実施形態の収音装置20Aと異なるため、エリア選択部26及びエリア切替部27の動作を詳細に説明する。
エリア選択部26は、例えばGUIなどを介してユーザが選択した1又は複数の目的エリアTARの情報を受け取り、エリア切替部27に送信する。
エリア切替部27では、エリア選択部26から送信された目的エリアの情報をもとに、空間座標データ保持部23から選択された目的エリアTARの位置情報と、各マイクロホンアレイMA1、MA2の位置情報と、各マイクロホンアレイを構成するマイクロホンM1、M2及びM3の位置情報を取得する。また、エリア切替部27は、目的エリア向けて指向性を形成するために必要なマイクロホンアレイとマイクロホンの組み合わせを決定し、指向性形成部21へ入力される信号を制御する。
図13は、第5の実施形態に係る3個のマイクロホンから構成されるマイクロホンアレイMA1、MA2を2個用いて、2個のエリアを切り替えて収音する状況のイメージ例を示すイメージ図である。
マイクロホンアレイMA1は、マイクロホンM11、MA12及びMA13から構成されており、マイクロホンアレイMA2は、マイクロホンM21、MA22及びMA23から構成されているものとする。
例えば、ユーザにより目的エリアAが選択されると、エリア選択部26から目的エリアAの選択情報がエリア切替部27に与えられる。エリア切替部27は、選択された目的エリアAの位置情報を空間座標データ保持部23から取得する。
このとき、エリア選択部26から目的エリアAに指向性を形成できるマイクロホンアレイMA1及びMA2を選択し、マイクロホンアレイMA1及びMA2の位置情報と、マイクロホンアレイMA1のマイクロホンM11、MA12及びMA13及びマイクロホンアレイMA2のマイクロホンM21、MA22及びMA23の位置情報を空間座標データ保持部23から取得する。マイクロホンアレイMA1及びMA2の選択方法としては、例えば、複数のマイクロホンアレイが配置されている場合に、任意の2個のマイクロホンアレイMA1及びMA2を選択するようにしても良いし、予め目的エリア毎に指向性を形成できるマイクロホンアレイMA1及びMA2を決めておくようにしても良い。
次に、エリア切替部27は、マイクロホンアレイMA1のマイクロホンM12及びM13と、マイクロホンアレイMA2のマイクロホンM22及びM23の組み合わせで双指向性を形成し、またマイクロホンアレイMA1のマイクロホンM11及びM12、マイクロホンアレイMA2のマイクロホンM21及びM22の組み合わせで単一指向性を形成するように指向性形成部21への入力信号を制御する。
指向性形成部21は、エリア切替部27からの指示に従って、データ入力部1からの入力信号を双指向性形成部3及び単一指向性形成部4に入力するようにして、双指向性及び単一指向性を形成する。
一方、目的エリアBが選択された場合は、マイクロホンアレイMA1のマイクロホンM11及びM12、マイクロホンアレイMA2のマイクロホンM21及びM22の組み合わせで双指向性を形成し、またマイクロホンアレイMA1のマイクロホンM12及びM13、マイクロホンアレイMA2のマイクロホンM12及びM23の組み合わせで単一指向性を形成するように指向性形成部21への入力信号を制御することで収音エリアを切り替える。この場合も、指向性形成部21は、エリア切替部27からの指示に従って、データ入力部1からの入力信号を双指向性形成部3及び単一指向性形成部4に入力するようにして、双指向性及び単一指向性を形成する。
また、目的エリアが目的エリアAと目的エリアBとが同時に選択された場合は、エリア切替部27は、選択された目的エリア毎に、並列してマイクロホンアレイのマイクロホンの組み合わせを選択して指示する。こえにより、それぞれの選択された目的エリア毎の双指向性及び単一指向性を形成することができる。
(F−3)第5の実施形態の効果
以上のように、第5の実施形態によれば、第4の実施形態の効果に加えて、各マイクロホンアレイの指向性の方向を変えることで、マイクロホンアレイ自体を動かさずに別のエリアを収音することが可能となる。
(G)他の実施形態
上述した実施形態においても種々の変形実施形態を言及したが、さらに、以下に示すような変形実施形態を挙げることができる。
上述した各実施形態において、信号加算部2を備えるものとして説明したが、目的信号抽出部6に与える入力信号を、マイクロホンM1又はM2が捕捉して得た信号とする場合には、信号加算部2を省略するようにしても良い。
第4及び第5の実施形態では、3個のマイクロホンが直角二等辺三角形の頂点に配置されたマイクロホンアレイを用いる場合を例示したが、正三角形の頂点に配置されたマイクロホンアレイを使用するようにしても良い。この場合、指向性形成部21は、第2又は第3の実施形態で説明した信号加算部2、双指向性形成部3、単一指向性形成部4(4−1、4−2)、重複指向性消去部5、目的信号抽出部6を備え、第2又は第3の実施形態で説明した動作により目的信号を抽出するようにしても良い。
第4及び第5の実施形態では、マイクロホンアレイが2個のものを示したが、マイクロホンアレイが3つの以上であっても良い。例えば、マイクロホンアレイが3つの場合において、第1及び第2のマイクロホンアレイからの出力から、上述した第4及び第5の実施形態の方法によって得た目的エリア音、第2及び第3のマイクロホンアレイからの出力から上記各実施形態の方法によって得た目的エリア音の計3個の目的エリア音から出力する目的エリア音を定めるようにしても良い。
上記各実施形態では、マイクロホンが捕捉して得た音響信号をリアルタイムに処理するものを示したが、マイクロホンが捕捉して得た音響信号を記憶媒体に記憶し、その後、記憶媒体から読み出して処理して目的音、目的エリア音の強調信号を得るようにしても良い。このように記憶媒体を利用する場合には、マイクロホンが設定されている場所と、目的音や目的エリア音の抽出処理する場所とが離れていても良い。同様に、リアルタイム処理をする場合でも、マイクロホンが設定されている場所と、目的音や目的エリア音の抽出処理する場所とが離れていても良く、通信により信号を遠隔地に供給するようにしても良い。
以上のような記憶媒体や通信を利用したりする場合も、本発明の収音装置の概念に含まれる。
10A、10B、10C…音源分離装置、M1、M2、M3…マイクロホン、1−1、1−2、1−3…信号入力部、2…信号加算部、3…双指向性形成部、4、4−1、4−2…単一指向性形成部、5…重複指向性消去部、6…目的信号抽出部、
20A、20B…収音装置、MA1、MA2…マイクロホンアレイ、21…指向性形成部、22…遅延補正部、23…空間座標データ保持部、24…目的エリア音パワー補正係数算出部、25…目的エリア音抽出部、26…エリア選択部、27…エリア切替部。

Claims (11)

  1. 直角二等辺三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、
    上記3個のマイクロホンのうち、目的方向と同じ方向に位置している2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける単一指向性を形成する単一指向性形成手段と、
    上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記双指向性形成手段及び上記単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段と
    を備えることを特徴とする音源分離装置。
  2. 正三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、
    上記3個のマイクロホンのうち、目的方向に対して、それぞれ±60度の角度に位置している2個のマイクロホンの組み合わせにより収音された音響信号を用いて、それぞれ目的方向に対して±60度に死角を向ける2個の単一指向性を形成する単一指向性形成手段と、
    上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記双指向性形成手段及び上記単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段と
    を備えることを特徴とする音源分離装置。
  3. 正三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、
    上記3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を平均した信号と、残りのマイクロホンにより収音された音響信号とを用い、目的方向に死角を向ける単一指向性を形成する単一指向性形成手段と、
    上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記双指向性形成手段及び上記単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段と
    を備えることを特徴とする音源分離装置。
  4. 上記双指向性形成手段の出力から上記単一指向性形成手段の出力をスペクトル減算することにより、又は、上記単一指向性形成手段の出力から上記双指向性形成手段の出力をスペクトル減算することにより、上記双指向性形成手段の出力と上記単一指向性形成手段の出力との間に重複している信号成分を消去する重複指向性消去手段を備え、
    上記目的音抽出手段が、上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記重複指向性消去手段の出力をスペクトル減算して、目的音を抽出するものである
    ことを特徴とする請求項1〜3のいずれかに記載の音源分離装置。
  5. コンピュータを、
    直角二等辺三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、
    上記3個のマイクロホンのうち、目的方向と同じ方向に位置している2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける単一指向性を形成する単一指向性形成手段と、
    上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記双指向性形成手段及び上記単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段と
    して機能させることを特徴とする音源分離プログラム。
  6. コンピュータを、
    正三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、
    上記3個のマイクロホンのうち、目的方向に対して、それぞれ±60度の角度に位置している2個のマイクロホンの組み合わせにより収音された音響信号を用いて、それぞれ目的方向に対して±60度に死角を向ける2個の単一指向性を形成する単一指向性形成手段と、
    上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記双指向性形成手段及び上記単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段と
    して機能させることを特徴とする音源分離プログラム。
  7. コンピュータを、
    正三角形の頂点に配置した3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を用いて、目的方向に死角を向ける双指向性を形成する双指向性形成手段と、
    上記3個のマイクロホンのうち、目的方向に対して水平に位置する2個のマイクロホンにより収音された音響信号を平均した信号と、残りのマイクロホンにより収音された音響信号とを用い、目的方向に死角を向ける単一指向性を形成する単一指向性形成手段と、
    上記目的方向に対して水平に位置する2個の上記マイクロホンにより収音された音響信号のいずれか一方の信号、又は、当該2個の上記マイクロホンにより収音された音響信号を平均した信号から、上記双指向性形成手段及び上記単一指向性形成手段からの全ての出力をスペクトル減算して、目的音を抽出する目的音抽出手段と
    して機能させることを特徴とする音源分離プログラム。
  8. 直角二等辺三角形又は正三角形の頂点に配置した3個のマイクロホンを有する複数のマイクロホンアレイと、
    上記各マイクロホンアレイの出力のそれぞれに対し、ビームフォーマにより、目的エリアに対して上記各マイクロホンアレイの前方にのみ指向性を上記マイクロホンアレイ毎に形成するものであって、請求項1〜4のいずれかに記載の音源分離装置に相当する指向性形成手段と、
    上記指向性形成手段からの上記マイクロホンアレイ毎の出力間で、ビームフォーマ出力の振幅スペクトルの比率を周波数毎に算出し、算出された振幅スペクトルの比率の最頻値又は中央値を、上記マイクロホンアレイ毎のビームフォーマ出力のパワーを補正する補正係数とするパワー補正係数算出手段と、
    上記パワー補正係数算出手段で算出した補正係数を用い、上記指向性形成手段からの上記各マイクロホンアレイのビームフォーマ出力を補正し、補正後の上記各マイクロホンアレイのビームフォーマ出力をスペクトル減算して上記各マイクロホンアレイからみた目的エリア方向に存在する非目的エリア音を抽出し、抽出した非目的エリア音を上記指向性形成手段からの上記各マイクロホンアレイのビームフォーマ出力からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と
    を備えることを特徴とする収音装置。
  9. 目的エリアと上記各マイクロホンアレイと上記各マイクロホンアレイを構成する上記マイクロホンの位置情報を保持する空間座標データ保持手段と、
    選択された1又は複数の目的エリアに関する情報を取得するエリア取得手段と、
    上記エリア取得手段からの上記1又は複数の目的エリアに関する情報に基づいて、上記各目的エリアと上記各マイクロホンアレイと上記各マイクロホンアレイを構成する上記マイクロホンの位置情報を上記空間座標データ保持手段から取得し、上記選択された1又は複数の目的エリアに向けて指向性を形成するために必要な上記マイクロホンアレイの組み合わせと、上記マイクロホンアレイにおける双指向性及び単一指向性を形成する上記マイクロホンの組み合わせを決定し、上記指向性形成手段へ入力される信号を制御するエリア切替手段と
    を備えることを特徴とする請求項8に記載の収音装置。
  10. 上記指向性形成手段からの上記マイクロホンアレイ毎の出力間で、目的エリア音の上記各マイクロホンアレイへの伝搬遅延時間の差を吸収する補正処理を行う遅延補正手段を備えることを特徴とする請求項8又は9に記載の収音装置。
  11. 直角二等辺三角形又は正三角形の頂点に配置した3個のマイクロホンを備える複数のマイクロホンアレイを有するコンピュータを、
    上記各マイクロホンアレイの出力のそれぞれに対し、ビームフォーマにより、目的エリアに対して上記各マイクロホンアレイの前方にのみ指向性を形成するものであって、請求項5〜7のいずれかに記載の音源分離プログラムの機能に相当する指向性形成手段と、
    上記指向性形成手段からの上記マイクロホンアレイ毎の出力間で、ビームフォーマ出力の振幅スペクトルの比率を周波数毎に算出し、算出された振幅スペクトルの比率の最頻値又は中央値を、上記マイクロホンアレイ毎のビームフォーマ出力のパワーを補正する補正係数とするパワー補正係数算出手段と、
    上記パワー補正係数算出手段で算出した補正係数を用い、上記指向性形成手段からの上記各マイクロホンアレイのビームフォーマ出力を補正し、補正後の上記各マイクロホンアレイのビームフォーマ出力をスペクトル減算して上記各マイクロホンアレイからみた目的エリア方向に存在する非目的エリア音を抽出し、抽出した非目的エリア音を上記指向性形成手段からの上記各マイクロホンアレイのビームフォーマ出力からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と
    して機能することを特徴とする収音プログラム。
JP2013179886A 2013-08-30 2013-08-30 音源分離装置、音源分離プログラム、収音装置及び収音プログラム Active JP6206003B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013179886A JP6206003B2 (ja) 2013-08-30 2013-08-30 音源分離装置、音源分離プログラム、収音装置及び収音プログラム
US14/309,048 US9445194B2 (en) 2013-08-30 2014-06-19 Sound source separating apparatus, sound source separating program, sound pickup apparatus, and sound pickup program
US15/236,375 US9549255B2 (en) 2013-08-30 2016-08-12 Sound pickup apparatus and method for picking up sound

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013179886A JP6206003B2 (ja) 2013-08-30 2013-08-30 音源分離装置、音源分離プログラム、収音装置及び収音プログラム

Publications (2)

Publication Number Publication Date
JP2015050558A JP2015050558A (ja) 2015-03-16
JP6206003B2 true JP6206003B2 (ja) 2017-10-04

Family

ID=52583311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013179886A Active JP6206003B2 (ja) 2013-08-30 2013-08-30 音源分離装置、音源分離プログラム、収音装置及び収音プログラム

Country Status (2)

Country Link
US (2) US9445194B2 (ja)
JP (1) JP6206003B2 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6206003B2 (ja) * 2013-08-30 2017-10-04 沖電気工業株式会社 音源分離装置、音源分離プログラム、収音装置及び収音プログラム
US9781508B2 (en) * 2015-01-05 2017-10-03 Oki Electric Industry Co., Ltd. Sound pickup device, program recorded medium, and method
JP6131989B2 (ja) * 2015-07-07 2017-05-24 沖電気工業株式会社 収音装置、プログラム及び方法
US9706300B2 (en) * 2015-09-18 2017-07-11 Qualcomm Incorporated Collaborative audio processing
WO2017056288A1 (ja) * 2015-10-01 2017-04-06 三菱電機株式会社 音響信号処理装置、音響処理方法、監視装置および監視方法
GB2549922A (en) * 2016-01-27 2017-11-08 Nokia Technologies Oy Apparatus, methods and computer computer programs for encoding and decoding audio signals
JP6187626B1 (ja) * 2016-03-29 2017-08-30 沖電気工業株式会社 収音装置及びプログラム
JP6274244B2 (ja) * 2016-03-31 2018-02-07 沖電気工業株式会社 収音再生装置、収音再生プログラム、収音装置及び再生装置
JP6732564B2 (ja) * 2016-06-29 2020-07-29 キヤノン株式会社 信号処理装置および信号処理方法
CN107889022B (zh) * 2016-09-30 2021-03-23 松下电器产业株式会社 噪音抑制装置以及噪音抑制方法
US10085087B2 (en) * 2017-02-17 2018-09-25 Oki Electric Industry Co., Ltd. Sound pick-up device, program, and method
US11102569B2 (en) * 2018-01-23 2021-08-24 Semiconductor Components Industries, Llc Methods and apparatus for a microphone system
CN110352600B (zh) * 2018-02-06 2020-12-25 雅马哈株式会社 音响装置
US10433086B1 (en) 2018-06-25 2019-10-01 Biamp Systems, LLC Microphone array with automated adaptive beam tracking
US10210882B1 (en) * 2018-06-25 2019-02-19 Biamp Systems, LLC Microphone array with automated adaptive beam tracking
US10694285B2 (en) 2018-06-25 2020-06-23 Biamp Systems, LLC Microphone array with automated adaptive beam tracking
JP7176291B2 (ja) * 2018-08-16 2022-11-22 沖電気工業株式会社 収音装置、プログラム及び方法
JP7176316B2 (ja) * 2018-09-18 2022-11-22 沖電気工業株式会社 収音装置、プログラム及び方法
CN109754803B (zh) * 2019-01-23 2021-06-22 上海华镇电子科技有限公司 车载多音区语音交互***及方法
JP6822505B2 (ja) * 2019-03-20 2021-01-27 沖電気工業株式会社 収音装置、収音プログラム及び収音方法
US11115765B2 (en) 2019-04-16 2021-09-07 Biamp Systems, LLC Centrally controlling communication at a venue
JP7207159B2 (ja) * 2019-05-21 2023-01-18 沖電気工業株式会社 収音装置、収音プログラム、収音方法、及び収音システム
CN110691299B (zh) * 2019-08-29 2020-12-11 科大讯飞(苏州)科技有限公司 音频处理***、方法、装置、设备及存储介质
CN112261528B (zh) * 2020-10-23 2022-08-26 汪洲华 一种多路定向拾音的音频输出方法及***

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5793875A (en) * 1996-04-22 1998-08-11 Cardinal Sound Labs, Inc. Directional hearing system
US6931138B2 (en) * 2000-10-25 2005-08-16 Matsushita Electric Industrial Co., Ltd Zoom microphone device
JP4286637B2 (ja) * 2002-11-18 2009-07-01 パナソニック株式会社 マイクロホン装置および再生装置
JP4873913B2 (ja) 2004-12-17 2012-02-08 学校法人早稲田大学 音源分離システムおよび音源分離方法、並びに音響信号取得装置
US8068619B2 (en) * 2006-05-09 2011-11-29 Fortemedia, Inc. Method and apparatus for noise suppression in a small array microphone system
JP4367484B2 (ja) * 2006-12-25 2009-11-18 ソニー株式会社 音声信号処理装置、音声信号処理方法及び撮像装置
JP4986248B2 (ja) * 2009-12-11 2012-07-25 沖電気工業株式会社 音源分離装置、方法及びプログラム
US20110200205A1 (en) * 2010-02-17 2011-08-18 Panasonic Corporation Sound pickup apparatus, portable communication apparatus, and image pickup apparatus
US8897455B2 (en) * 2010-02-18 2014-11-25 Qualcomm Incorporated Microphone array subset selection for robust noise reduction
JP6206003B2 (ja) * 2013-08-30 2017-10-04 沖電気工業株式会社 音源分離装置、音源分離プログラム、収音装置及び収音プログラム

Also Published As

Publication number Publication date
JP2015050558A (ja) 2015-03-16
US9549255B2 (en) 2017-01-17
US20160353203A1 (en) 2016-12-01
US9445194B2 (en) 2016-09-13
US20150063590A1 (en) 2015-03-05

Similar Documents

Publication Publication Date Title
JP6206003B2 (ja) 音源分離装置、音源分離プログラム、収音装置及び収音プログラム
JP5482854B2 (ja) 収音装置及びプログラム
JP6149818B2 (ja) 収音再生システム、収音再生装置、収音再生方法、収音再生プログラム、収音システム及び再生システム
JP4816221B2 (ja) 収音装置および音声会議装置
JP6131989B2 (ja) 収音装置、プログラム及び方法
JP6065028B2 (ja) 収音装置、プログラム及び方法
JP6065030B2 (ja) 収音装置、プログラム及び方法
JP6187626B1 (ja) 収音装置及びプログラム
CN107534725A (zh) 一种语音信号处理方法及装置
JP5737342B2 (ja) 収音装置及びプログラム
JP5648760B1 (ja) 収音装置及びプログラム
JP5772151B2 (ja) 音源分離装置、プログラム及び方法
JP6763332B2 (ja) 収音装置、プログラム及び方法
JP2018132737A (ja) 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法
KR101678305B1 (ko) 텔레프레즌스를 위한 하이브리드형 3d 마이크로폰 어레이 시스템 및 동작 방법
WO2019176153A1 (ja) 収音装置、記憶媒体及び方法
JP6943120B2 (ja) 収音装置、プログラム及び方法
JP6436180B2 (ja) 収音装置、プログラム及び方法
JP2016163135A (ja) 収音装置、プログラム及び方法
JP6241520B1 (ja) 収音装置、プログラム及び方法
JP6260666B1 (ja) 収音装置、プログラム及び方法
JP6065029B2 (ja) 収音装置、プログラム及び方法
JP6725014B1 (ja) 収音装置、収音プログラム及び収音方法
JP6863004B2 (ja) 収音装置、プログラム及び方法
JP6973224B2 (ja) 収音装置、プログラム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170821

R150 Certificate of patent or registration of utility model

Ref document number: 6206003

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150