JP3599653B2 - 収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体 - Google Patents

収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP3599653B2
JP3599653B2 JP2000270043A JP2000270043A JP3599653B2 JP 3599653 B2 JP3599653 B2 JP 3599653B2 JP 2000270043 A JP2000270043 A JP 2000270043A JP 2000270043 A JP2000270043 A JP 2000270043A JP 3599653 B2 JP3599653 B2 JP 3599653B2
Authority
JP
Japan
Prior art keywords
sound source
sound
band
signal
level difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000270043A
Other languages
English (en)
Other versions
JP2002084590A (ja
Inventor
真理子 青木
賢一 古家
和彦 山森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000270043A priority Critical patent/JP3599653B2/ja
Publication of JP2002084590A publication Critical patent/JP2002084590A/ja
Application granted granted Critical
Publication of JP3599653B2 publication Critical patent/JP3599653B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、空間に複数の音源が異なる位置に配置されている場合に、3本以上のマイクロホンを用いて、空間を複数のゾーンに分割し、各ゾーンにある音源からの音を他ゾーンの音源とは独立に収音する収音装置、収音・音源分離装置及び収音、収音・音源分離方法並びにこの方法を実行するプログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
従来のゾーン分離収音技術には、例えば、音が持つ次のような特徴を利用したものがある。音はいくつかの周波数成分の和として表現されることが知られている。そこで、複数の音が同時に鳴っている場合、各チャネルのマイクロホンに入力される音源信号を各音源からの周波数成分が周波数軸上で重ならない程度の帯域に分割し、チャネル間の各周波数成分の到達時間差や到達レベル差を基に、各周波数成分それぞれがどのゾーンからのものであるか判定し、同一ゾーンからの成分を集めて合成することにより、各ゾーン毎の音を個別に収音する方法が用いられていた。(参考文献:特開平10−313497号公報(特願平09−252312号)「音源分離方法、装置および記録媒体」)。
【0003】
【発明が解決しようとする課題】
ところが、この従来の技術では、各音源信号が各チャネルに到達する時間差およびレベル差を用いているため、マイクロホンの指向特性によりゾーンが固定されていた。よって、複数の音源が同一ゾーン内に入る場合、マイクロホンの向きを物理的に変えることなく、この音源をそれぞれ分離抽出することは不可能であった。(課題1)
また、ゾーンを切り替えるためには音源の方向を検出する必要があるが、上記入力系の構成、すなわち、2本の両指向性マイクロホンと1本の全指向性マイクロホンを同軸上に配置した構成で音源の方向を推定することは困難であった。従来、音源方向を推定するためには、2本以上の全指向性マイクロホンを互いに離して設置し、音源から各マイクロホンへの到達時間の差を検出する方法が知られているが、この構成は、マイクロホンの本数及び規模が大きくなるという欠点があった。(課題2)
【0004】
【課題を解決するための手段】
本発明は、3本の収音手段で収音された信号の線形和を算出することで入力手段が持つ指向特性を電気的に可変にし、従来、同一ゾーンに含まれるため分離が不可能であった音源に対しても、マイクロホンを物理的に動かすことなくゾーンを切り替え、個々の音源を分離抽出することを特徴とする(課題1の解決)。
さらに、2本の両指向性収音手段と1本の全指向性収音手段を用いて音源方向を推定することで、マイクロホンの本数および規模を変えることなく、音源方向推定を可能とする(課題2の解決)。さらに、推定された音源方向に応じてゾーンを分割するのに適した指向性を選択することで、音源の位置に依らず自律的にゾーン毎の音を分離抽出することを特徴とする。
【0005】
ここで、音源方向推定の基本的な考え方を説明する。
図1の音源方向推定の説明図を参照して音源1,2が図のように配置された場合を例に挙げて説明する。この場合、主軸方向が90°の単一指向性の指向性可変手段4−1と270°の単一指向性の指向性可変手段4−3の出力信号のレベル差ΔLを測定すると、音源1,2が二つとも0°〜180°の間にあるため、レベル差ΔLは、単一指向性の元々持つ感度差(20dB〜30dB)とほぼ同じ値となる。一方、指向性を回転させ、主軸方向が180°の単一指向性の指向性可変手段4−1と、0°の単一指向性の指向性可変手段4−3のレベル差を測定すると、レベル差ΔLはほぼ0dBとなる。よって、ΔLを観測することで、音源2つの内一つ(音源1)は0°〜90°の範囲に、もう一つ(音源2)は90°〜180°の範囲にあることがわかる。そこで、主軸方向を少しづつ回転させ、すべての方向に対してΔLを観測すれば、どの方向に音源があるのかがわかる。本発明はこの方法を用いる。
各手段の具体的な方法については次の発明の実施の形態において説明する。
【0006】
【発明の実施の形態】
図2に本発明の実施例である収音・音源分離装置の概要構成を示す。
収音手段1は両指向性マイクロホン1、収音手段2は両指向性マイクロホン1と主軸が直交するように配置された両指向性マイクロホン2、収音手段3は全指向性マイクロホン3で構成される。また、収音手段1〜3は同軸上に配置される。
【0007】
4の指向性可変手段はそれぞれ、上記3本の収音手段の出力信号の線形和を算出して出力する。取り得る線形和とは具体的には、式(1)で表される。ここでS1(t),S2(t),S3(t)は収音手段1,2,3の出力信号、Ai,Bj,Ckは重み付け係数、i,j,kは各収音手段を特定するインデックス、Pは1つの指向性パタンを特定するインデックス、M,N,Qはそれぞれ任意の正の整数、nは指向性可変手段の数とする。
【0008】
【数1】
Figure 0003599653
【0009】
次に、6の指向性選択手段について説明する。
指向性選択手段6は、音源方向情報φ,・・・,φを用い、その方向の音を高いS/Nで収音できる指向性(指向性可変手段)を選択する。
一つの例として、音源方向に対し、死角を向けるような指向性を選択する方法がある。例えば、音源が2個ある場合、それぞれの音源方向に死角を向けた指向性を二つ選択する。ここで、説明のために、音源1の方向に死角を向けた指向性を指向性1、音源2の方向に死角を向けた指向性を指向性2とする。指向性1を有する指向性可変手段の出力信号は、音源1の音が抑圧され、音源2の音が高いS/Nで収音されていると期待できる。同様に、指向性2を有する指向性選択手段の出力信号は、音源2の音が抑圧され、音源1の音が高いS/Nで収音されていると期待できる。さらに、これら出力信号を従来の音源分離装置の入力信号とすることで、より精度の高い音源分離が実現できる。
【0010】
また、音源方向に指向性の主軸を向ける指向性選択も例として挙げられる。
さらに、隣り合う音源の方向を結ぶ線分の方向に主軸を向けるよう指向性を選択する方法も例として挙げられる。例えば、部屋を2つのゾーンに分割することを考える場合、2本の単一指向性を互いに主軸方向が逆に向くようにして実現する方法が考えられる。この場合、指向性可変手段二つを使って、式(2)、(3)に示す指向性を形成し、それを入力信号として、従来の音源分離装置に供給すればよい。このとき、角度θは0<θ<360°であり、主軸の回転角度τは音源方向情報φ,・・・,φで設定でき、なおかつ、マイクロホンを物理的に回転させること無くゾーン別収音を実現できる。
【0011】
【数2】
Figure 0003599653
【0012】
回転角度τを生じさせる方法を以下に説明する。
互いに主軸方向が直交するように配置された両指向性マイクロホン1,2の出力(電圧Eとする)はそれぞれ式(4),(5)で与えられる。
=cosθ (4)
=sinθ (5)
ここで、両指向性マイクロホン1,2のゲインa,bを与え、両出力を加算することで、主軸方向を任意に回転可能な両指向性マイクロホンの出力を合成できる。この原理を式(6),(7)に示す。
【0013】
【数3】
Figure 0003599653
【0014】
上記方法で両指向性マイクロホンと全指向性マイクロホンの出力を加算することで、主軸方向を回転させた単一指向性を合成することができる。
指向性選択手段6で選ばれる指向性は、指向性可変手段の説明で述べたとおり、3本のマイクロホン出力の線形和で表される特性すべてであるが、具体例として単一指向性、MSステレオ型指向性、などが挙げられる。
【0015】
指向性選択手段6で選択した指向性可変手段4の出力は音源分離装置5に入力され各音源信号が分離される。
音源分離装置5の構成を図10に示す。
この音源分離装置は特開平10−313497号公報に記載の音源分離装置と同様な構成を備え、上記公報に記載のものは、帯域分割部にR,Lチャネルのマイクロホンの出力信号を入力するのに対し、本発明の音源分離装置は指向性選択手段6で選択された指向性可変手段4の2つの出力信号、チャネル1,2信号(2つの異なる指向性を有する指向性可変手段の出力)を入力する点で相違している。
【0016】
チャネル1,2信号は帯域分割部51とチャネル間時間差/レベル差検出部52に入力され、帯域分割部51ではそれぞれに1つの音源信号成分のみ存在する複数の周波数帯域信号(ch1(f),・・・,ch1(f)、ch2(f),・・・,ch2(f))に分割されて帯域別チャネル間時間差/レベル差検出部53と音源判定信号判別部54に入力される。音源判定信号選別部54において、各検出部52,53のチャネル間時間差/レベル差検出出力に基づいて音源信号判定部55でその帯域の帯域分割された各出力チャネル信号(ch1(f),・・・,ch1(f)、ch2(f),・・・,ch2(f))の何れがどの音源から入力された信号であるかが判定され、この判定結果により帯域分割された各出力チャネル信号から、同一音源から入力された信号を少なくとも一つ選択し、選択された帯域毎の成分信号は音源信号合成部56A,56Bで合成され出力することで複数の音源信号が分離される。
【0017】
なお、上記の説明では音源分離装置に指向性可変手段の2つの出力信号を入力しているが、2つ以上の出力信号を入力しても同様に複数の音源信号が分離できる。
次に、音源方向推定について説明する。
図3に本発明の音源方向推定手段を備えた収音・音源分離装置のブロック図を示す。
【0018】
両指向性マイクロホン1,2、全指向性マイクロホン3、指向性可変手段4,音源方向推定手段7,及び指向性選択手段6から収音装置が構成され、収音装置と音源分離装置5から収音・音源分離装置が構成される。
指向性可変手段を複数個有し、その出力信号を基に音源方向検出手段7において音源方向を推定する。音源方向の推定方法については音源方向推定手段の説明で詳述する。指向性選択手段6では、7の音源方向推定手段において推定された方向の音を高いS/Nで収音できる指向性を選択する。指向性選択手段6は、図1と例と同じである。音源方向推定手段を備えた構成により、音源の方向が未知の場合でも、それを推定し、自動的に各ゾーンの音を収音できる。
【0019】
次に、音源方向推定手段の構成例1について説明する。
図4に音源方向推定手段の構成例1のブロック図を示す。
指向性可変手段4においては、例えば、主軸方向をΔτ度毎に変えた単一指向性を(360/Δτ)個形成し、音源方向推定手段7へ供給する。
次に、音源方向推定手段7について説明する。
まず、指向性可変手段4の出力信号が供給された組み合わせ決定手段8においては、上記合成された指向性を二つずつの組(2つの異なる指向性を対応付けた指向性可変手段の組)にする。この組をPnで表す。例えば、主軸方向が反対向きになる単一指向性同士を組にする。
【0020】
9のレベル差算出手段においては、上記組み合わせ決定手段8で組み合わされたペアの出力レベル差(組み合わされた指向性可変手段の出力の差分)を算出する。このレベル差をΔLnとする。
次に、10のレベル差方向対応付け手段においては、上記組み合わせ手段で組み合わされた各ペア(Pn)に対し、上記レベル差算出手段で算出された各ΔLnと、ある角度θnを対応付ける。この対応を、(Pn、ΔLn、θn)で表す。例えば、図5に示すように、回転角度がnΔτ度の単一指向性を有する指向性可変手段4−1と、主軸方向がそれと逆向きの単一指向性を有する指向性可変手段4−3とのペアに対しては、レベル差ΔLnと、回転角度nΔτ度と直交する方向(nΔτ+90)度を対応付ける。
【0021】
11のレベル差変動幅検出手段においては、上記レベル差方向対応付け手段10で対応付けた方向の、降順または昇順にΔLnを並べなおし、隣接するΔLn+1との差分(ΔLn,n+1)を算出する。この差分をレベル差変動幅と表す。
図6に示した方向に音源がある場合を例に説明する。
ここでは例として、角度θnと対応付けられるレベル差ΔLn、指向性可変手段はθnと直交する方向に主軸を持つ、互いに主軸が逆向きの指向性可変手段の組を対応付ける。図6には、昇順に並べなおされた方向θnの代表例、およびθ1と対応付けられた指向性可変手段4−1、および4−3を図示してある。ΔLnは、指向性可変手段4−1のレベルから指向性可変手段4−3のレベルを引いたものと定義する。この場合に、ΔLnとθnの関係をグラフに示したのが図7である。ちょうど、音源方向を境に、ΔLnの値が大きく変動していることがわかる。すなわち、レベル差変動幅はΔLn,n+1のときに最大になることがわかる。
【0022】
レベル差変動幅Δnの値が大きく変動するとは、言い換えれば指向性の方向が音源をまたぐ時に生じるレベル差の有意な正負の変化を意味する。図7では、レベル差ΔLnを、指向性可変手段4−1の出力から指向性可変手段4−3の出力を減算したものとする。この場合、θ1〜θnまでは、音源は指向性可変手段4−1の出力が、指向性可変手段4−3の出力に比べ大きい側にあるため、レベル差ΔLnは正値を取る。しかし、θnを越えると、今度は音源は、指向性可変手段4−3の出力が、指向性可変手段4−1の出力に比べて大きい側にあることになり、レベル差ΔLnは負の値を取ることになる。
【0023】
12のレベル差変動方向対応付け手段では、例えば、ΔLn,n+1のときにはθnを対応させる。ここで、対応付けのほかの例として、{(θn+(θn+1)}/2を対応付けてもよい。
13のレベル差変動ピーク検出手段においては、レベル差変動幅が最大になる(ΔLn,n+1,θn)を検出する。ここで、検出されるピークの個数は一つである必要は無く、変動が大きいところから順に複数個とってもよい。例えば、ある閾値kを越える変動幅はすべて検出する、という方法を採れば、複数音源が同時に鳴っている場合でも複数音源の方向を検出できる。
【0024】
14の方向検出手段においては、上記レベル差変動ピーク検出手段で検出されたΔLn,n+1に対応する方向θnを検出する。ここでも、上記に述べたように、θnは複数個検出してもよい。上記のように検出された音源方向の情報は、指向性選択手段に送られる。
次に、音源方向推定手段の構成例2について説明する。
図8に音源方向推定手段の構成例2のブロック図を示す。
【0025】
これは、音源方向の推定を、図4の音源方向推定手段に比べて精度良く行うためのものである。図4の音源方向推定手段では、指向性可変手段で合成した指向性により生じるレベル差を算出する。しかし、部屋の反射等が無視できない環境においては、電気的に合成した指向性は鈍くなる。例えば、無響室においては死角と主軸方向とのレベル差が30dB以上つくような単一指向性であっても、反射がある通常の部屋では、10dBから15dB程度の差しか生じなくなる。その結果、レベル差変動ピーク検出手段において誤差が生じる可能性が高まる。
【0026】
そこで、方向によるレベル差をより大きく生じさせ、レベル差変動ピーク検出手段における推定精度を上げるために、以下の処理を行う。
ここで、指向性可変手段および組み合わせ決定手段は、図4の場合と同様とする。すなわち、指向性可変手段においては、主軸方向をΔτ度毎に変えた単一指向性を360/Δτ個形成し、音源方向検出手段へ供給する。信号を供給された組み合わせ決定手段においては、上記合成された指向性を二つずつの組にする。ここでは、主軸方向が反対向きになる指向性同士を組にする。
【0027】
次に、15の帯域分割手段において、組み合わせ決定手段8でペアにされた指向性可変手段からの出力信号を、それぞれ、複数の周波数帯域に分割する。帯域分割の際、一つの周波数帯域に含まれる成分が単独音源からの周波数のみで生成されていると近似できる程度に細かく分割する。この帯域分割の方法には、例えば、フーリエ変換が用いられる。帯域分割された信号は16の帯域別差分算出手段へ供給される。
【0028】
16の帯域別差分算出手段は、各周波数帯域において、組み合わせ決定手段でペアにされた指向性可変手段からの出力信号レベル差を算出する。これを帯域別レベル差と呼ぶ。ここでは、指向性可変手段4−1のレベルから指向性可変手段4−3のレベルを引いた値を帯域別レベル差と定義する。
17の信号判定手段においては、あらかじめ決められた基準に基づき、帯域別レベル差の値に応じて周波数帯域をグルーピングする。例えば、帯域別レベル差が正の値をとる周波数帯域と、負の値をとる周波数帯域を分けてグルーピングする。
【0029】
9のレベル差算出手段では、指向性可変手段4の出力信号のうち、帯域別レベル差が正の値をとる周波数帯域を合わせた信号のレベルを、あらためて、指向性可変手段4−1のレベルとする。同様に、指向性可変手段4−3の出力信号のうち、帯域別レベル差が負の値をとる周波数帯域を合わせた信号のレベルを、あらためて、指向性可変手段4−3のレベルとする。そして、この新たに決められた指向性可変手段4−1のレベルと指向性可変手段4−3のレベルの差分ΔLnを算出する。
【0030】
上記組み合わせ手段で組み合わされた各ペアに対し、上記レベル差算出手段で算出された各ΔLnとある角度θnを対応付ける。例えば、回転角度がnΔτ度の単一指向性と、主軸方向がそれに直交する単一指向性との組においては、レベル差ΔLnと、回転角度nΔτと直交する方向(nΔτ+90)度を対応付ける。
その他の手段については、図4の場合と同じである。
次に音源方向推定手段の構成例3について説明する。
【0031】
図9に音源方向推定手段の構成例3のブロック図を示す。
指向性可変手段4において、死角方向がΔτ°毎に異なる指向性を合成する。例えば、単一指向性の死角がΔτ°毎に異なるように合成する。
音源方向推定手段7においては、まず18のレベル算出手段で、上記指向性可変手段4それぞれの出力信号レベルを算出する。
19のレベル順位付け手段においては、上記レベル算出手段で算出されたレベルを降順または昇順に並べ替える。
【0032】
20のレベル小方向検出手段においては、上記レベル順位付け手段において順位付けられたレベルのうち、小さいものから少なくとも一つ選び、そのレベルに対応する指向性可変手段の死角方向を音源方向として検出する。ここで、検出するレベル(及びそれに対応する死角方向)は複数でもよい。ある閾値を設定し、その閾値以下となるレベルを持つ死角方向を検出することで、音源が複数であっても、それらの方向を検出することができる。
【0033】
なお、本発明の収音装置及び収音・音源分離装置をCPUやメモリ等を有するコンピュータとアクセス主体となるユーザが利用するユーザ端末と記録媒体から構成することができる。
記録媒体はCD−ROM、磁気ディスク装置、半導体メモリ等のコンピュータ読み取り可能な記録媒体であり、ここに記録された収音方法あるいは収音・音源分離方法を実行させるプログラムはコンピュータに読み取られコンピュータの動作を制御しコンピュータ上に前述した実施の形態における各構成要素を実現する。
【0034】
【発明の効果】
本発明は、3本のマイクロホンで収音された信号の線形和を算出することで入力手段が持つ指向特性を電気的に可変し、従来、同一ゾーンに含まれるため分離が不可能であった音源に対しても、マイクロホンを物理的に動かすことなくゾーンを切り替え、個々の音源を分離抽出することを可能とする。(課題1に対する効果)。
【0035】
さらに、2本の両指向性マイクロホンと1本の全指向性マイクロホンを用いて音源方向を推定することで、マイクロホンの本数および規模を替えることなく、音源方向推定を可能とする(課題2に対する効果)。
さらに、指向性選択手段により、推定された音源方向に応じてゾーンを分割するのに適した指向性を選択することで、音源の位置に拠らず自律的にゾーン毎の音を分離抽出することができる。
【図面の簡単な説明】
【図1】音源方向推定の説明図。
【図2】本発明の収音・音源分離装置の概略構成図。
【図3】本発明の音源方向推定手段を備えた収音・音源分離装置のブロック図。
【図4】本発明の音源方向推定手段の構成例1のブロック図。
【図5】指向性可変手段の組と方向θnの対応付けの例を説明する図。
【図6】音源方向θ1と対応付けられた指向特性可変手段の例を説明する図。
【図7】レベル差方向対応付け手段で対応付けられたレベル差を方向の昇順に並べなおした例を示す図。
【図8】本発明の音源方向推定手段の構成例2のブロック図。
【図9】本発明の音源方向推定手段の構成例3のブロック図。
【図10】本発明の音源分離装置のブロック図。
【符号の説明】
1,2 両指向性マイクロホン
3 全指向性マイクロホン
4 指向性可変手段
5 音源分離装置
6 指向性選択手段
7 音源方向推定手段
8 組み合せ決定手段
9 レベル差算出手段
10 レベル差方向対応付け手段
11 レベル差変動幅検出手段
12 レベル差変動方向対応付け手段
13 レベル差変動ピーク検出手段
14 方向検出手段
15 帯域分割手段
16 帯域別差分算出手段
17 信号判定手段
18 レベル算出手段
19 レベル順位付け手段
20 レベル小方向検出手段
51 帯域分割部
52 チャネル間時間差/レベル差検出部
53 帯域別チャネル間時間差/レベル差検出部
54 音源判定信号選別部
55 音源信号判定部
56 音源信号合成部

Claims (15)

  1. 互いに指向性が異なる方向の複数の指向性収音手段と少なくとも1個の全指向性収音手段と、
    各収音手段からの収音信号を入力し、指向性の方向が互いに異なる組み合わせが設定された重み付け加算係数により重み付け加算された信号を生成する指向性可変手段と、
    生成された重み付け加算係数により重み付け加算された信号に基づいて音源方向を推定する音源方向推定手段と、
    推定された音源方向に基づき、重み付け加算係数で重み付けられた信号を選択する指向性選択手段を備えたこと
    を特徴とする収音装置。
  2. 請求項1に記載の収音装置において、
    音源方向推定手段は、
    複数の指向性可変手段を2つの異なる組み合わせとして類別する組み合せ決定手段と、組み合わせ決定手段で類別された2つの指向性可変手段からの重み付け加算係数で重み付けされた信号レベルを比較するレベル差算出手段と、レベル差算出手段で算出したレベル差と、組み合わせ決定手段で組み合わされた組と、方向の3つを対応付けるレベル差方向対応付け手段と、レベル差方向対応付け手段において方向と対応付けられたレベル差について隣接する方向に対応するレベル差との差分を算出するレベル差変動幅検出手段と、レベル差変動幅検出手段で算出されたレベル差の差分と方向とを対応付けるレベル差変動方向対応付け手段と、レベル差変動幅検出手段で算出された差分のうち、最大値から順に少なくとも一つを選ぶレベル差変動ピーク検出手段と、レベル差変動ピーク検出手段で選ばれた少なくとも一つのレベル差の差分に対し、レベル差変動方向対応付け手段で対応付けられた方向を音源方向として検出する方向検出手段とを備え、音源方向を推定すること
    を特徴とする収音装置。
  3. 請求項2に記載の収音装置において、
    音源方向推定手段は、
    組み合わせ決定手段で組み合わされた指向性可変手段からの重み付け加算係数で重み付けられた信号それぞれを周波数帯域に分割する帯域分割手段と、帯域分割された信号に対し、組み合わせ手段で組み合わされた2組の重み付け加算係数で重み付けられた信号の帯域毎のレベル差を算出する帯域別差分算出手段と、各帯域のレベル差に基づき帯域成分を類別する信号判定手段とを備え、
    レベル差算出手段は、信号判定手段で類別された帯域成分の、類別毎の全帯域レベルを算出し、算出した全帯域レベルの類間の差分を算出し、前記レベル差とすること
    を特徴とする収音装置。
  4. 請求項1に記載の収音装置において、
    指向性可変手段は、死角方向又は指向性の主軸方向がΔτ度(τは任意の角度)毎に異なる指向性を合成し、
    音源方向推定手段は、
    それぞれの指向性可変手段からの重み付け加算係数で重み付けられた信号のレベルを算出するレベル算出手段と、レベル算出手段で算出されたレベルを降順又は昇順に並べ替えるレベル順位付け手段と、レベル順位付け手段で順位付けられたレベルのうち、小さいものから少なくとも一つを選び、そのレベルに対応する指向性可変手段の死角方向又は指向性の主軸方向を音源方向として算出するレベル小方向検出手段を備え、音源方向を推定すること
    を特徴とする収音装置。
  5. 請求項1乃至4に記載のいずれか1項に記載の収音装置を備え、収音装置の指向性選択手段で選ばれた指向性可変手段からの少なくとも二つの重み付け加算係数で重み付けられた信号を入力し、
    各重み付けられた加算係数で重み付けられた信号を1つの音源の音響信号の成分のみが含まれる程度に複数の周波数帯域に分割する帯域分割部と、
    これら分割された各信号の各同一帯域ごとに音源の位置に起因して変化する音響信号のパラメータの値の差を帯域別チャネル間パラメータ値差として検出する帯域別チャネル間パラメータ差検出手段と、
    各帯域の帯域別チャネル間パラメータ値差に基づき、その帯域の帯域分割された各信号の何れがいずれの音源から入力された信号であるかを判定する音源信号判定手段と、
    音源信号判定手段の出力に基づき帯域分割された各信号から、同一音源から入力された信号を少なくとも一つ選択する音源判定信号選別手段と、
    音源判定信号選別手段で同一音源からの信号として選択された、複数の帯域信号を音源信号として合成する音源信号合成手段を備えたこと
    を特徴とする収音・音源分離装置。
  6. 互いに指向性が異なる方向の複数の指向性収音信号と少なくとも1個の全指向性収音信号を生成し、
    生成した各収音信号に基づいて指向性の方向が互いに異なる組み合わせが設定された重み付け加算係数により重み付け加算された信号を生成し、
    重み付け加算係数により重み付けられた信号に基づいて音源方向を推定し、
    推定された音源方向に基づき、前記重み付け加算係数で重み付けられた信号を選択すること
    を特徴とする収音方法。
  7. 請求項6に記載の収音方法において、
    音源方向の推定は、
    複数の重み付け加算係数で重み付けられた信号を2つの異なる組み合わせとして類別し、類別された2つの重み付け加算係数で重み付けられた信号レベルを比較し、算出されたレベル差と、組み合わされた組と、方向の3つを対応付け、方向と対応付けられたレベル差について隣接する方向に対応するレベル差との差分を算出し、 算出したレベル差の差分と方向を対応付け、算出したレベル差のうち、最大値から順に少なくとも一つを選び、選ばれた少なくとも一つのレベル差の差分に対し、対応付けられた方向を音源方向として推定すること
    を特徴とする収音方法。
  8. 請求項7に記載の収音方法において、
    音源方向の推定は、
    組み合わされた重み付け加算係数で重み付けられた信号それぞれを周波数帯域に分割し、帯域分割された信号に対し、組み合わされた2組の重み付け加算係数で重み付けられた信号の帯域毎のレベル差を算出し、各帯域毎のレベル差に基づき帯域成分を類別し、類別された帯域成分の、類別毎の全帯域レベルを算出し、算出した全帯域レベルの類間の差分を算出し、前記レベル差とすること
    を特徴とする収音方法。
  9. 請求項6に記載の収音方法において、
    指向性の方向が互いに異なる組み合わせの設定は、死角方向又は指向性の主軸方向がΔτ度(τは任意の角度)毎に異なる指向性を合成することにより設定し、
    音源方向の推定は、それぞれの重み付け加算係数で重み付けられた信号のレベルを算出し、算出されたレベルを降順又は昇順に並べ替えて順位付けし、順位付けられたレベルのうち、小さいものから少なくとも一つを選び、そのレベルに対応する可変指向性の死角方向又は指向性の主軸方向を音源方向として算出して音源方向を推定すること
    を特徴とする収音方法。
  10. 請求項6乃至9のいずれか1項に記載の収音方法により選択された少なくとも二つの重み付け加算係数で重み付けられた信号を1つの音源の音響信号の成分のみが含まれる程度に複数の周波数帯域に分割し、
    これら分割された各信号の各同一帯域ごとに音源の位置に起因して変化する音響信号のパラメータの値の差を帯域別チャネル間パラメータ値差として検出し、
    各帯域の帯域別チャネル間パラメータ値差に基づき、その帯域の帯域分割された各信号の何れがいずれの音源から入力された信号であるかを判定し、
    この判定に基づき帯域分割された各信号から、同一音源から入力された信号を少なくとも一つ選択し、
    同一音源からの信号として選択された、複数の帯域信号を音源信号として合成すること
    を特徴とする収音・音源分離方法。
  11. 互いに指向性が異なる方向の複数の指向性収音手段と少なくとも1個の全指向性収音手段により収音された各収音信号に基づいて指向性の方向が互いに異なる組み合わせが設定された重み付け加算係数により重み付け加算された信号を生成する指向性可変処理と、
    指向性可変処理により生成された重み付け加算係数により重み付け加算された信号に基づいて音源方向を推定する音源方向推定処理と、
    推定された音源方向に基づき、重み付け加算係数で重み付けられた信号を選択する指向性選択処理をコンピュータに実行させる収音プログラムを記録した機械読み取り可能な記録媒体。
  12. 請求項11に記載の収音プログラムを記録した機械読み取り可能な記録媒体において、
    音源方向推定処理は、
    複数の重み付け加算係数で重み付けられた信号を2つの異なる組み合わせとして類別する組み合わせ決定処理と、組み合わせ決定処理で類別された2つの重み付け係数で重み付けられた信号のレベルを比較するレベル差算出処理と、レベル差算出処理で算出されたレベル差と、組み合わせ決定処理で組み合わされた組と、音源方向の3つを対応付けるレベル差方向対応付け処理と、レベル差方向対応付け処理において方向と対応付けられたレベル差について隣接する方向に対応するレベル差との差分を算出するレベル差変動幅検出処理と、レベル差変動幅検出処理で算出されたレベル差の差分と方向とを対応付けるレベル差変動方向対応付け処理と、レベル差変動幅検出処理で算出されたレベル差のうち、最大値から順に少なくとも一つを選ぶレベル差変動ピーク検出処理と、レベル差変動ピーク検出処理で選ばれた少なくとも一つのレベル差の差分に対し、レベル差変動方向対応付け処理で対応付けられた方向を音源方向として推定する方向検出処理を有し、各処理をコンピュータに実行させる収音プログラムを記録した機械読み取り可能な記録媒体。
  13. 請求項12に記載の収音プログラムを記録した機械読み取り可能な記録媒体において、
    音源方向推定処理は、
    組み合わせ決定処理で組み合わされた重み付け加算係数で重み付けされた信号それぞれを周波数帯域に分割する帯域分割処理と、帯域分割された信号に対し、組み合わせ決定処理で組み合わされた2組の重み付け加算係数で重み付けされた信号の帯域毎のレベル差を算出する帯域別差分算出処理と、各帯域のレベル差に基づき帯域成分を類別する信号判定処理と、
    レベル差算出処理は、信号判定処理で類別された帯域成分の、類別毎の全帯域レベルを算出し、算出した全帯域レベルの類間の差分を算出する処理により前記レベル差を算出し、各処理をコンピュータに実行させる収音プログラムを記録した機械読み取り可能な記録媒体。
  14. 請求項11に記載の収音プログラムを記録した機械読み取り可能な記録媒体において、
    指向性可変処理は、死角方向又は指向性の主軸方向がΔτ度(τは任意の角度)毎に異なる指向性を合成する処理を有し、
    音源方向推定処理は、それぞれの指向性可変処理からの重み付け加算係数で重み付けられた信号のレベルを算出するレベル算出処理と、レベル算出処理で算出されたレベルを降順又は昇順に並べ替えるレベル順位付け処理と、レベル順位付け処理で順位付けられたレベルのうち、小さいものから少なくとも一つを選び、そのレベルに対応する可変指向性の死角方向又は指向性の主軸方向を音源方向として算出するレベル小方向検出処理により音源方向を推定し、各処理をコンピュータに実行させる収音プログラムを記録した機械読み取り可能な記録媒体。
  15. 請求項11乃至14に記載のいずれか1項に記載の収音プログラムを記録した機械読み取り可能な記録媒体に記録した収音プログラムを有し、指向性選択処理で選ばれた少なくとも二つの重み付け加算係数で重み付けされた信号を1つの音源の音響信号の成分のみが含まれる程度に複数の周波数帯域に分割する帯域分割処理と、
    これら分割された各信号の各同一帯域ごとに音源の位置に起因して変化する音響信号のパラメータの値の差を帯域別チャネル間パラメータ値差として検出する帯域別チャネル間パラメータ差検出処理と、
    各帯域の帯域別チャネル間パラメータ値差に基づき、その帯域の帯域分割された各信号の何れがいずれの音源から入力された信号であるかを判定する音源信号判定処理と、
    音源信号判定処理の出力に基づき帯域分割された各信号から、同一音源から入力された信号を少なくとも一つ選択する音源判定信号選別処理と、
    音源判定信号選別処理で同一音源からの信号として選択された、複数の帯域信号を音源信号として合成する音源合成処理をコンピュータに実行させる収音・音源分離プログラムを記録した機械読み取り可能な記録媒体。
JP2000270043A 2000-09-06 2000-09-06 収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体 Expired - Fee Related JP3599653B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000270043A JP3599653B2 (ja) 2000-09-06 2000-09-06 収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000270043A JP3599653B2 (ja) 2000-09-06 2000-09-06 収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2002084590A JP2002084590A (ja) 2002-03-22
JP3599653B2 true JP3599653B2 (ja) 2004-12-08

Family

ID=18756555

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000270043A Expired - Fee Related JP3599653B2 (ja) 2000-09-06 2000-09-06 収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3599653B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI118247B (fi) 2003-02-26 2007-08-31 Fraunhofer Ges Forschung Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa
JP4780497B2 (ja) * 2003-11-17 2011-09-28 学校法人日本大学 信号受信装置及び方法
US8189806B2 (en) 2005-11-01 2012-05-29 Panasonic Corporation Sound collection apparatus
JP4670682B2 (ja) * 2006-02-28 2011-04-13 日本ビクター株式会社 オーディオ装置及び指向音生成方法
JP5088950B2 (ja) * 2006-11-22 2012-12-05 株式会社船井電機新応用技術研究所 集積回路装置及び音声入力装置、並びに、情報処理システム
EP2364036A3 (en) 2006-11-22 2011-09-28 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, its manufacturing method and information processing system
US8638955B2 (en) 2006-11-22 2014-01-28 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, method of producing the same, and information processing system
JP5070960B2 (ja) * 2007-07-06 2012-11-14 ヤマハ株式会社 収音装置
JP4958172B2 (ja) * 2007-10-31 2012-06-20 国立大学法人 名古屋工業大学 音源定位装置
US8724829B2 (en) * 2008-10-24 2014-05-13 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coherence detection
US8620672B2 (en) 2009-06-09 2013-12-31 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
EP2448289A1 (en) * 2010-10-28 2012-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for deriving a directional information and computer program product
CN111935593B (zh) * 2020-08-09 2022-04-29 天津讯飞极智科技有限公司 录音笔及录音控制方法
CN114765031A (zh) * 2021-01-13 2022-07-19 漳州立达信光电子科技有限公司 一种收音装置、收音方法、终端和计算机可读存储介质
CN113075614A (zh) * 2021-03-17 2021-07-06 武汉创现科技有限公司 一种用于巡航器的声源测向装置、巡航器及智能垃圾桶

Also Published As

Publication number Publication date
JP2002084590A (ja) 2002-03-22

Similar Documents

Publication Publication Date Title
JP3599653B2 (ja) 収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体
EP3320692B1 (en) Spatial audio processing apparatus
US8842869B2 (en) Method and apparatus for sound source localization using microphones
JP5657127B2 (ja) 方向情報を取得する装置および方法、ならびにシステムおよびコンピュータプログラム
Moreau et al. 3d sound field recording with higher order ambisonics–objective measurements and validation of a 4th order spherical microphone
JP6289936B2 (ja) 音源方向推定装置、音源方向推定方法およびプログラム
TWI458364B (zh) 藉由導出具高階角度項之信號而用於多聲道音訊播放系統之音場改良空間解析度技術
JP4051408B2 (ja) 収音・再生方法および装置
US9998822B2 (en) Signal processing apparatus and method
JP3548706B2 (ja) ゾーン別収音装置
Tho et al. Robust DOA estimation of multiple speech sources
JP3716918B2 (ja) 収音装置、方法及びプログラム、記録媒体
JPH07240990A (ja) マイクロホン装置
JPH09284899A (ja) 信号処理装置
CN113189544B (zh) 一种利用活动强度矢量加权移除野点的多声源定位方法
JPH0591588A (ja) 指向方向可変指向性収音装置
Yairi et al. Binaural reproduction capability for multiple off-axis listeners based on the 3-channel optimal source distribution principle
Moon et al. Multi-channel audio source separation using azimuth-frequency analysis and convolutional neural network
JP7014682B2 (ja) 音源分離の評価装置および音源分離装置
JP3379083B2 (ja) 音源ゾーン検出方法、その装置、およびそのプログラム記録媒体
JPH0933628A (ja) 測角装置
JP2020167471A5 (ja)
Zhao et al. Doa estimation for multiple speech sources based on flexible single-source zones and concentration weighting
WO2021059983A1 (ja) ヘッドホン、頭外定位フィルタ決定装置、頭外定位フィルタ決定システム、頭外定位フィルタ決定方法、及びプログラム
JP7302203B2 (ja) パッシブソーナー装置、検出方法、及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040914

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100924

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100924

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110924

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120924

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130924

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees