WO2006131959A1

WO2006131959A1 - 信号分離装置

Info

Publication number: WO2006131959A1
Application number: PCT/JP2005/010341
Authority: WO
Inventors: Kenbu Teramoto; Kosuke Tsuruta
Original assignee: Saga University
Priority date: 2005-06-06
Filing date: 2005-06-06
Publication date: 2006-12-14
Also published as: JPWO2006132249A1; WO2006132249A1

Abstract

【課題】　二次元平面又は三次元空間の異なる位置から出力される出力信号を簡易な処理工程及び装置構成で迅速かつ確実に分離できるできる信号分離装置を提供する。【解決手段】異なる位置の出力源２０１、２０２から出力される各出力信号が重畳された重畳信号を各出力信号に関する時間勾配の瞬時混合和として検出し、この時間勾配の瞬時混合和に基づいて前記各出力信号を分離するようにしているので、この検出された信号をスカラー量（音圧）でなく、ベクトル量（音圧勾配）として検出できることとなり、各出力源の方向と共に、各出力信号の分離を簡易な処理工程及び装置構成で迅速且つ確実に分離できる。

Description

明細書

信号分離装置

技術分野

[0001] 本発明は、二次元平面または三次元空間の異なる位置から出力される音声信号又は電波信号等の各出力信号が重畳された重畳信号から重畳前の各出力信号を分離する信号分離装置に関する。

背景技術

[0002] 人間は多くの人が話している中で、特定の人の声を選択して聞き取ることができる。

この人間の聴覚的な能力をカクテルパーティ効果と呼ぶ。し力し多数の音源が混在する中、通常のマイクロホンを用いて録音を行ったとしても、音源までの距離、音源の到来方向、音の強弱などの影響によって必要な音だけを効率よく収音することは非常に困難である。

[0003] 複数の信号が重畳した信号から元の信号を復元する手法の一つにブラインド信号分離がある。ブラインド信号分離は、源信号が統計的に独立であり、観測信号が源信号によって線形的に混合されるという仮定に基づき、源信号を推定する手法である。

[0004] ブラインド信号分離は様々な手法が提案されているが、特に実環境中での音声の観測を考慮したコンボリューシヨン型のものが研究されてきた。近年その中でも信号を狭帯域信号に分割し、帯域ごとに瞬時混合型のブラインド信号分離を行う分離手法が盛んに研究されている。

[0005] これらの分離手法に関する音源信号回路及びこれを用いたマイクロホン装置が特開 2000— 181499号公報に開示されている。

また、音源分離集音マイクロホン装置及びその方法が特開 2003— 98003号公報に開示されている。さらに音源分離方法、装置及び記録媒体が特開平 10— 31349

7号公報に開示されている。

特許文献 1 :特開 2000— 181499号公報

特許文献 2：特開 2003 - 98003号公報

特許文献 3 :特開平 10— 313497号公報発明の開示

発明が解決しょうとする課題

[0006] 前記従来技術における特許文献 1は、互!、に線形独立な複数の音 (音源信号)が線形加算された複数の混合信号 X (t

1 )、x (t)をフレーム分割し、フレーム毎に分割 2

された複数の信号 y (t)、y (t)相互間のラグタイムゼロの相関を最小にする混合行

1 2

列の逆行列を乗算するようにして複数の音源力も音 (音源信号)を分離して、ることから、分離処理の前提として複数の混合信号をフレーム毎に分割しなければならず、処理工程及び回路構成が複雑化すると共に、分離処理時間を遅延させるという課題を有する。

[0007] また、特許文献 2にも前記特許文献 1と同様に混合信号をフレーム毎に分割した後に音源信号ごとに分離していることから、同様の課題を有する。

さらに、特許文献 3は、複数のマイクロホン力の各チャンネル信号を、主な成分が 1つの音源信号の成分のみ力なる程度に複数の帯域に分割し、これらから、各同一帯域について、レベル、到達時間を検出し、これらから、各帯域毎にいずれの音源信号かを判定分離することにより、各音源信号を分離するようにしていることから、 1つの音源信号の成分のみ力なる程度に複数の帯域に分割する前処理を経なければ分割処理が実行できず、処理工程及び回路構成が複雑化すると共に、分離処理時間を遅延させるという課題を有する。

[0008] 本発明は、前記課題を解消するためになされたもので、二次元平面又は三次元空間の異なる位置から出力される出力信号を簡易な処理工程及び装置構成で迅速かつ確実に分離できるできる信号分離装置を提供することを目的とする。

課題を解決するための手段

[0009] 本発明に係る信号分離装置は、二次元平面又は三次元空間の異なる位置の出力源力出力される各出力信号が重畳された重畳信号を分離する信号分離装置において、前記重畳信号を各出力信号に関する時間勾配の瞬時混合和として検出する空間勾配検出手段と、前記時間勾配の瞬時混合和に基づいて前記各出力信号を分離する信号分離手段とを備えるものである。

[0010] このように本発明によれば、異なる位置の出力源から出力される各出力信号が重畳された重畳信号を各出力信号に関する時間勾配の瞬時混合和として検出し、この時間勾配の瞬時混合和に基づ!/、て前記各出力信号を分離するようにして!/、るので、この検出された信号をスカラー量 (音圧)でなく、ベクトル量 (音圧勾配)として検出できることとなり、各出力源の方向と共に、各出力信号の分離を簡易な処理工程及び装置構成で迅速且つ確実に分離できる効果を奏する。

[0011] また、本発明に係る信号分離装置は必要に応じて、前記空間勾配検出手段が、各出力信号を各音声信号として検出するマイクロホンアレイとして構成され、当該マイク口ホンアレイが前記音声信号の音圧勾配として検出するものである。

本発明によれば、各出力信号に関する時間勾配の検出をマイクロホンアレイが各出力信号を各音声信号として検出し、このマイクロホンアレイが前記音声信号の音圧勾配として検出するようにしているので、各音源の方向と共に、各音声信号の分離を簡易な処理工程及び装置構成で迅速且つ確実に分離できる効果を有する。

[0012] また、本発明に係る信号分離装置は必要に応じて、前記マイクロホンアレイが検出する音圧勾配を粒子速度の時間微分により求めるものである。本発明によれば、マイクロホンアレイが検出する音圧勾配を粒子速度の時間微分により求めることから、各出力信号の時間微分でなぐ各出力信号そのものを推定するようにしているので、微分、積分の各処理が不用となり、より簡易な処理工程及び装置構成で高速'確実な分離が可能となる効果を有する。

[0013] また、本発明に係る信号分離装置は必要に応じて、前記マイクロホンアレイが、各音声信号が出力される異なる位置に対する観測点における少なくとも X軸方向又は y 軸方向の音圧差分を計測する双指向性のマイクロホンで構成されるものである。本発明よれば、マイクロホンアレイが、各音声信号が出力される異なる位置に対する観測点における少なくとも X軸方向又は y軸方向の音圧差分を計測する双指向性のマイクロホンで構成されるので、各音源の方向と共に、各音声信号の分離を簡易な処理工程及び装置構成で迅速且つ確実に分離できる効果を有する。

[0014] さらに、本発明に係る信号分離装置は必要に応じて、前記信号分離手段が、重畳信号を各出力信号に分離すると共に、当該各出力信号の各出力源における方向及び Z又は標準偏着を出力するものである。本発明によれば、信号分離手段が、重畳信号を各出力信号に分離すると共に、この各出力信号の各出力源における方向及び Z又は標準偏着を出力するので、各音源の方向と共に、各音声信号の分離を簡易な処理工程及び装置構成で迅速且つ確実に分離できる効果を有する。

図面の簡単な説明

[図 1]本発明の第 1の実施形態に係る信号分離装置における全体回路構成図である

[図 2]図 1に記載の双指向性マイクロホンの配置構成図である。

[図 3]図 1に記載の信号分離装置の動作フローチャートである。

[図 4]本発明の第 2の実施形態に係る信号分離装置における全体回路構成図である

[図 5]図 1に記載の信号分離装置の動作フローチャートである。

[図 6]本発明の第 3の実施形態に係る信号分離装置における全体回路構成図である

[図 7]図 6に記載する粒子速度マイクロホンの配置構成図である。

[図 8]図 6に記載の信号分離装置の動作フローチャートである。

[図 9]本発明の各実施形態の演算論理を説明するための混同過程'分離過程のプロック図である。

[図 10]本発明の各実施形態における数値実験'音響実験に使用する音声波形図である。

[図 11]本発明の各実施形態の 2つの源信号のパワースペクトルである。

[図 12]本発明の各実施形態の源信号の時間勾配特性図である。

[図 13]本発明の各実施形態における観測信号の空間勾配図である。

[図 14]本発明の各実施形態における分離信号の特性図である。

[図 15]本発明の各実施形態における分離信号の特性図である。

[図 16]本発明の各実施形態における分離信号の特性図である。

[図 17]本発明の音響実験に用いる空間積分マイクロホンのブロック図である。

[図 18]本発明の音響実験の実験概略図である。 [図 19]本発明の音響実験における観測信号の空間勾配特性図である。

[図 20]本発明の音響実験における観測信号の空間勾配特性図である。

[図 21]本発明の音響実験における分離信号の波形図である。

[図 22]本発明の音響実験における到来方向の特性図である。

符号の説明

[0016] 1 双方向性マイクロホン

10 粒子速度マイクロホン

11 X軸方向双方向性マイクロホン

12 y軸方向双方向性マイクロホン

l la、 12a 指向性

2 空間微分器

21 X軸方向空間微分器

22 y軸方向空間微分器

3、 30 行列演算回路

4 分離行列要素算出回路

5 方向，標準偏差算出回路

6、 7 積分器

61 X軸時間積分器

62 y軸時間積分器

100 観測点

201、 202 音源

P (t)、 P (t) 源信号

1 2

fx(t)、fy(t) 音圧勾配信号

発明を実施するための最良の形態

[0017] (本発明の第 1の実施形態）

以下、本発明の第 1の実施形態に係る信号分離装置を、図 1ないし図 3に基づいて説明する。この図 1は本実施形態に係る信号分離装置の全体回路構成図、図 2は図 1に記載する双指向性マイクロホンの配置構成図、図 3は図 1に記載する信号分離装置の動作フローチャートを示す。

[0018] 前記各図において本実施形態に係る信号分離装置は、均質な三次元空間中の異なる位置に存在する音源 201、 202からの源信号 P (t)、 P (t)を集音する双方向性マ

1 2

イク口ホン 1と、この双方向性マイクロホン 1で集音した源信号 P (t)、 P (t)に関する音

1 2

圧の勾配を求める空間微分器 2と、この求められた音圧勾配信号 fx(t)、 fy(t)のべタトル量 (音圧勾配)に混合行列の逆行列を乗算する行列演算回路 3と、この行列演算値をブラインド信号分離で分離行列要素 a'ijを推定して推定分離信号 Pti(t) ;i= l, 2 を推定算出する分離行列要素算出回路 4と、前記分離行列要素 a'ijに基づいて音源 201、 202の到来方向 0 、 0 (X軸正方向とのなす角度)及び音源 201、 202の時

1 2

間勾配の標準偏着 σ ti、 σ tjを算出する方向，標準偏差算出回路 5と、前記推定分離信号 Pti(t)を時間積分として分離信号 P (t)、 P (t)を演算する積分器 6とを備える構成

1 2

である。

[0019] 前記双方向性マイクロホン 1は、観測点 100近傍力も X軸方向の音圧差分を計測する X軸方向双方向性マイクロホン 11と、観測点 100近傍から y軸方向の音圧差分を計測する y軸方向双方向性マイクロホン 12とを備える構成である。この X軸方向双方向性マイクロホン 11は、図 2 (A)、（B)に示すように観測点 100における X軸方向の空間微分に用いられる指向性 11aを有する。また、前記 y軸方向双方向性マイクロホン 12は X軸方向双方向性マイクロホン 11と同様に y軸方向の空間微分用に用いられる指向性 12aを有する。前記空間微分器 2は、 X軸方向の空間勾配 (f - f

xl x2 )ΖΔχを求める x軸方向空間微分器 21と、 y軸方向の空間勾配 (f f )ΖΔχを求める y軸 yi 2

方向空間微分器 22とを備える構成である。

[0020] 次に、前記構成に基づく本実施形態に係る信号分離装置の分離処理動作について説明する。まず、均質な三次元空間中に配設された音源 201、 202からの源信号 P (t)、 P (t)を観測点 100近傍の X軸方向双方向性マイクロホン 11及び y軸方向双方

1 2

向性マイクロホン 12で収音する (ステップ 1)。この収音された源信号 P (t)、 P (t)を X

1 2 軸方向空間微分器 21、 y軸方向空間微分器 22により X軸、 y軸各方向の空間微分による空間勾配 fx、 fyを演算し、この空間勾配 fx、 fyに基づいて行列演算回路 3が空間勾配信号 fx(t)、 fy(t)のべ外ル量 (音圧勾配）に混合行列の逆行列を乗算する (ステツプ 2)。

[0021] 前記行列演算回路 3は、前段の入力機器である双方向性マイクロホン 1、空間微分器 2及び行列演算回路 3から信号の入力が有る力否かを判断し (ステップ 3)、この信号の入力が有ると判断した場合にはブラインド信号分離で分離行列要素 a'ijを推定し (ステップ 4)、この推定した推定分離信号 P (t)、P (t)を算出する (ステップ 5)。

tl t2

[0022] この分離行列要素 a'ijに基づくを推定分離信号 P (t)、 P (t)を x軸時間積分器 61及

tl t2

び y軸時間積分器 62が各々時間積分し、分離信号 P (t)、 P (t)を演算し (ステップ 6)

1 2

、この演算された分離信号 P (t)、 P (t)を図示を省略する表示装置等へ出力する (ス

1 2

テツプ 7)。

[0023] 他方、前記ステップ 4で推定算出された分離行列要素 a'ijに基づいて方向'標準偏差算出回路 5が源信号 Pl(t)、 P2(t)の到来方向 θ 、 Θ 及び音源 201、 202の時間

1 2

勾配における標準偏着 σ ΐί、 a tjを推定算出する (ステップ 8)。この方向'標準偏差算出回路 5で推定算出された観測点 100における源信号 P (t)、 P (t)の到来方向 Θ

1 2 1

、 Θ 及び音源 201、 202の標準編差 σ 、 σ を前記表示装置等へ出力する (ステツ

2 1 2

プ 9)。

[0024] このようにして本実施形態に係る信号分離装置は、時空間勾配解析に基づき、均質な空間中では、任意の観測点 100における空間勾配が、音源 201、 202における時間勾配の線形混合で表現されるという事実を利用する。即ち、本実施形態の特徴は次のように集約される。ただ一つの観測点 100及びその近傍における空間勾配を計測することにより、源信号 P (t)、 P (t)の時間勾配の瞬時混合和を取得することがで

1 2

きる。そのため最も簡単な瞬時混合型ブラインド信号分離問題に帰着することができる。さらに、観測量力 Sスカラー量 (音圧)ではなぐベクトル量 (音圧の空間勾配)なので音源の到来方向を含めた源信号 P (t)、 P (t)の分離が可能である。本時空間勾配解

1 2

析手法を採用することにより、観測点 100間に生じる信号の到達時間差を考慮する必要がなぐ観測信号の空間勾配を瞬時線形混合信号とみなすことができるため，最も簡単な瞬時線形混合に対する処理で分離信号 P (t)、 P (t)を推定することが可

1 2

能となる。

[0025] (本発明の第 2の実施形態）以下、本発明の第 2の実施形態に係る信号分離装置を、図 4及び図 5に基づいて説明する。この図 3は本実施形態に係る信号分離装置の全体回路構成図、図 5は図 4に記載する信号分離装置の動作フローチャートを示す。

前記各図において本実施形態に係る信号分離装置は、前記第 1の実施形態と同様に双方向性マイクロホン 1、空間微分器 2、行列演算回路 3、分離行列要素算出回路 4及び方向'標準偏差算出回路 5を共通して備え、この空間微分器 2から出力される音圧勾配信号 fx(t)、 fy(t)を時間積分し、積分された音圧勾配信号 fx(t)、 fy(t)を行列演算回路 3へ出力する積分器 7 (第 1の実施形態における積分器 6に相当）を備える構成である。

[0026] 次に、前記構成に基づく本実施形態に係る信号分離装置の分離処理動作は、前記第 1の実施形態とほぼ同様に処理されるものであるが、 X軸方向空間微分器 21、 y 軸方向空間微分器 22により X軸、 y軸各方向の空間微分による空間勾配 fx、 fyが演算 (ステップ 11)された後に、この空間勾配 fx、 fyを積分器 7により空間積分する (ステツプ 12)。

[0027] この空間積分された空間勾配 fx、 fyの各空間勾配信号 fx(t)、 fy(t)が行列演算回路 3により混合行列の逆行列を乗算される。以下、前記第 1の実施形態と同様ステツプ 13ないしステップ 18により分離信号 P (t)、 P (t)を出力すると共に観測点 100にお

1 2

ける源信号 P (t)、 P (t)の到来方向 θ 、 Θ 及び音源 201、 202の標準編差 σ 、 σ

1 2 1 2 1 2 を前記表示装置等へ出力する

[0028] (本発明の第 3の実施形態）

本発明の第 3の実施形態に係る信号分離装置を、図 6ないし図 8に基づいて説明する。この図 6は本実施形態に係る信号分離装置の全体回路構成図、図 7は図 6〖こ記載する粒子速度マイクロホンの配置構成図、図 8は図 6に記載する信号分離装置の動作フローチャートを示す。

前記各図において本実施形態に係る信号分離装置は、前記第 1の実施形態と同様に行列演算回路 30 (第 1の実施形態における行列演算回路 3に相当）、分離行列要素算出回路 4及び方向 '標準偏差算出回路 5を共通して備え、音源 201、 202からの源信号 P (t)、 P (t)を粒子速度 Vx、 Vyとして計測する粒子速度マイクロホン 10を備え、この粒子速度マイクロホン 10で計測された粒子速度信号 Vx(t)、 Vy(t)を前記行列演算回路 30へ出力する構成である。

[0029] 次に^、 2.前記構成に基づく本実施形態に係る信号分離装置分離処理動作はまず、音源 201、 202からの源信号 P (t)、 P (t)が粒子速度マイクロホン 10により粒子速

1 2

度 Vx、 Vyとして計測される（ステップ 20)。この粒子速度マイクロホン 10からなる入力機器からの粒子速度 Vx、 Vyに基づく粒子速度信号 Vx(t)、 Vy(t)が出力されたカゝ否かを判断する (ステップ 21)。

[0030] このステップ 21にお、て粒子速度信号 Vx(t)、 Vy(t)が出力されて、ると判断された場合には、以降の粒子速度信号 Vx(t)、 Vy(t)が行列演算回路 30により混合行列の逆行列を乗算される。以下、前記第 2の実施形態と同様にステップ 22ないしステップ 26により分離信号 P (t)、 P (t)を出力すると共に、観測点 100における源信号 P (t)、

1 2 1

P (t)の到来方向 0 、 Θ 及び音源 201、 202の標準編差 σ 、 σ を前記表示装置等

2 1 2 1 2

へ出力する。

[0031] (本発明の各実施形態の演算倫理）

以下、前記各実施形態の演算倫理を図 9に基づき前記第 1の実施形態の図 2を参照して説明する。

前記図 2及び図 9において本発明の各実施形態に係る信号分離装置は、波動方程式により、観測点 100における空間勾配が源信号の時間勾配の線形結合で表現される。この波動場の時空間勾配法においては、音源 201、音源 202を含んでいない遠方場で、音圧は次の波動方程式を満たす。

[0032] [数 1]

P(x, y、 z、 t ) c ²P(x, y, z, t) 二 0. (1 )

[0033] ここで cは位相速度ベクトルである。式 (1)は逆向きに進行する 2つの波面の存在を示して、る。ここでは片方の波面に着目し次の移流方程式に注目する。

[0034] [数 2] — (; , y, z, t) = -c VP{x, y, z, t). (2 ) [0035] この方程式は、観測点 100における音圧の時間勾配と空間勾配の線形関係を示している。均質な空間を仮定すると、ある観測点での音圧の時間勾配は、各音源 201、 202における伝播遅延時間過去の音圧の時間勾配の総和で表される。本発明は式 ( 2)で示される移流型の方程式を満たす波動場にお、て、時間勾配と空間勾配の線形関係を利用する時空間勾配法をブラインド信号分離問題に適用させる。

次に、波面の重畳と瞬時混合については、簡単のため同一平面上を進行する 2つの独立な平面波を仮定する。任意の点における音圧は次式で与えられる。

[0036] [数 3]

2

₍₁ , 、 _π , X cos θt- + sin 0； . ,、、 ( y、 t、二 P人 t + —— - )·

(3)

[0037] ここで cは音速、 θ 、 Θ は各波面の到来方向を示す。関数 P (t)、 P (t)は帯域幅 ω

1 2 1 2

の信号の音圧であり、次式で定義する。

[0038] [数 4]

'ゾ—ω_ί 任意の点で得られる情報は観測信号 f (x, y, t)のみであり、元の信号や音源の到来方向は未知である。このような観測信号から源信号 P (t)、 P (t)を推定するために、

1 2

時空間勾配法を適用し、観測信号の空間勾配を源信号 P (t)、 P (t)の時間勾配の線

1 2

形混合信号として表現する。原点 0 (観測点 100)における時間勾配は次式で得られる。

[0039] [数 5] ' X ' —v—0

：で P (t)、 P (t)の時間勾配である。

[0040] [数 6]

式（5)を用いると、 f(x, y, t)の空間勾配は次のように導出される。

[数 7]

2

(t) = --f(x,y,t) = - ^ P _ 1 (t) cos 、

― ;=1

[0042] [数 8]

fyit)

すなわち f(x, y, t)の空間勾配 P (t)、P (t)を源信号とした場合の瞬時線形混合信号として表される。

[数 9]

ここで行列 Aを混合行列として次式で定義する。

[0044] [数 10]

[0045] また、信号の分離と音源方向の推定につ!ヽては、瞬時線形混合型ブラインド信号分離問題の概略を図 9 (A)、（Β)に示す。（Α)は混合過程を示し、（Β)は分離過程を示す。（Β)に示されるように、分離過程は観測された 2信号を Wで無相関化する白色化過程と R( r? )で独立した成分に分離する回転過程から構成される。白色化後、分離行列を求めるため、分離信号 P (t)、 P (t)と観測信号の空間勾配は次の関係式を

tl t2

満たす。

[0046] [数 11]

ここで分離行列を

[0047] [数 12]

A^f 二 R( ))W

[0048] とおく。 R( r? )と Wは後述するブラインド信号分離のアルゴリズムによって決定される

1S 混合行列の逆行列 A^_1を用いて次式でも表わすことができる。 [0049] [数 13]

[0050] ここで σ とびはそれぞれ観測点 P (t)、P (t)におけるの標準偏差である。式（13)

tl t2 tl t2

においての要素と A一¹の各要素を比較することで、式（14)、（15)の推定式を得る。

[0051] [数 14]

0

[0052] [数 15]

び ti 二 c

[0053] このとき分離信号と各パラメータ P (t)、 θ 、 σ 、i=l、 2は次の 2通りのどちらかで

tl il ti

推定される。

[0054] [数 16]

(i) θ! = Θい <7_ti = a_ti, P_tl(t) = P_tt(t),

[0055] [数 17] (ii) e_i = 0_J,au = a_tJ,P_t,(t) = P_t3(t),

[0056] すなわち分離信号を推定するのと同時に、個々の音源の到来方向、標準偏差も推定することができる。

さらに、瞬時混合に対するブラインド信号分離については、観測信号の空間勾配は行列 Wによって白色化され、行列 R( r? )によって出力信号が互いに独立になるように回転変換させることにより、分離信号を推定する。白色化については、次式で求めることができる。

[0057] [数 18]

[0058] [数 19] =く〉， 8 7

[0059] 回転変換については、次式で求めることができる。

[数 20]

ここでは 7?を推定するために次式の評価関数を導入する

[0060] [数 21] 0(//) = く ))〉 + H(P.- -→ max .

(21 )

[0061] ここで r?は分離パラメータであり、単位は度 (° )である。最適な r?を推定するために次式の評価関数を導入する。

[0062] ここで関数 H ( は 4次の Hermite多項式である。

4

[数 22]

H₄ (Z) = Z⁴- - 6Z² + 3. (22)

[0063] 勾配法を適用した 7?を逐次的に推定する式は次式となる。

[数 23]

ήけ + 1 ) = ] ( t ) + ( 23 )

ここで μは適当な定数である。

[0064] (本発明における数値実験）

本発明における数値実験により、ブラインド信号分離を用いた音源方向の推定をする。図 10に示す音声波形は数値実験、音響実験で使用する源信号である。源信号 P (t)、 P (t)として 10秒間の異なる 2人の女性の音声信号を用いる。表 1には源信号

1 2

の各規格を示す。これら 2つの源信号のパワースペクトルを示した図 11をみると、それぞれが同様の帯域 (200 [Trial mode] 350Hz付近)に主に成分を持っていることがわかる。本発明ではフーリエ級数展開に基づいて作成した源信号の時間勾配により構成される観測信号の空間勾配に対してブラインド信号分離を適用する。本発明で用いたブラインド信号分離では白色化過程で用いられるモーメントを安定させるため、分離行列の推定はモーメント算出開始から 1秒後に開始する。また推定した分離信号を時間積分して源信号を求めるため、次式を採用する。 [0065] [数 24]

.V

Pi(N t) = ^ P_fl((N - n) t) t,

[0066] [表 1] n i I:

[0067] 表 2に数値実験の設定値を示す。これは以降に示す音響実験と同様の設定にしている。源信号の時間勾配を図 12に、観測信号の空間勾配 fx(t)、 fy(t)を図 13に、分離信号 P (t)、 P (t)とそれらの時間積分、逐次的に推定したを図 14、図 15、図 16に tl t2

それぞれ示す。数値実験の初期値として分離パラメータの初期値数 r? (to)=0° t

0

= lsec、収束係数 =0.001を与えている。図 14より、推定開始直後は波形が乱れているが、 t = 2secには元の波形はほぼ復元されている。このとき推定した分離行列 R (r?) Wを次式に示す。

[0068] [数 25] τ i -0-030 0.0丄 7 _ι

Β(ή)\Υ = (25)

1 0.029 -0.01G ¹ 、 '

[0069] 音源の到来方向を推定した図 16 (Α)では、 t=secには 0

1、 Θ は徐々に安定し始 2

め、 t=sec以降は収束している。その後源信号 P 、 P の振幅が同時に急激な変化 tl t2

をしているため、 t = 7sec付近に多少乱れが生じている力再び真値付近に収束している。また最終的に推定された音源の到来方向は 0 =60.8°

1 、 Θ =120. 1°

2 であった。標準偏差は _σ =11835. 2、 σ =11535. 9であり、表 1の真値とほぼ一致

1 2

する。次に分離パラメータの初期値 r? (to) =270° を与えた場合、分離行列 R( 7? ) Wは次式となった。

[0070] [数 26]

[0071] 図 16(B)には推定した音源の方向を示す。このとき最終的に推定された音源の方向は 0 =120. 1° 、 Θ =60.8° 標準偏差は σ =11835. 2、 Θ =11535. 9

1 2 1 2 であった。初期値 r? (to) =0の場合、分離信号は式（16)のように推定されるが、初期値 r? (to) =270° をとると、ブラインド信号分離で得られる分離行列の成分が変化し、全ての推定値が式 (17)のように逆に推定された。このように本手法ではブラインド信号分離によって分離行列がどのように推定されたとしても、出力される分離信号と推定されたそれらの音源 201、 202の到来方向、標準偏差を適宜に推定できることが確認された。

[0072] 相互情報量にっ、ては、混合前後または分離処理前後の信号間の統計的独立性を確かめるために、相互情報量

[数 27] I(Z_L. Z₂) = log- p(Z_L)p(Z₂)

[0073] を算出する。相互情報量は常に正であり， Zと Zが互いに独立のとき 0になる。ここで

1 2

p(Z ), (pZ ),

1 2 は結合確率密度関数を表わす。各信号の振幅値を +側と側それぞれ 64諧調ずつと 0を含む 129諧調に量子化したものから確率密度関数を求め、相互情報量を算出した。相互情報量は分離信号が安定して得られている t=2〜： LOsecの区間のものをそれぞれ求めている。各信号間の相互情報量を示した表 3をみると、源信号間の相互情報 g[(P(t)、 P (t)9)は 0.048bitであり、分離によってこの値を下 t 2

回ることはない限界の値を意味する。表 3より、相互情報量における観測信号の空間勾配からのそれぞれの距離の比：

[0074] [数 28]

(り

を比較すると d〜一 99.0%となり、得られた分離信号は分離処理によってほぼ統計的独立になったと考えられる。

[0075] [表 3] ：3 J¾iii ¾i.:i ;

lul 3 ixiut lictl 111 ί'リ r ui at. luii t^r liiiiii I'IC I f.xpfjri- lllUllt

[0076] (本発明における音響実験) 本発明における音響実験にぉ、て、本発明における空間微分マイクロホンを用いて観測信号の空間微分を実現するために、観測点 100を中心として X軸、 y軸各方向に所定間隔離反させて 2対を配設させて形成されるマイクロホンを導入する。空間微分マイクロホン本体中央の点（0, 0)で得られる観測信号を f(0, 0, t)とすると、その前後左右に位置するマイクロホンで得られる fl (x、 y、 t) =ίΔ (x、 y、 t)はそれぞれ次のように表わされる。

[0077] [数 29] fi( - y- t) = f( /2.0. t). (29)

[0078] [数 30] ( . y. t) = (Ο.Δ/2_;ί). (30)

[0079] [数 31] h( - y- t) 二 (-Δ/2.0.ί). (31)

[0080] [数 32]

Mx.y.t) 二 (0. -A/ .f). (32) これらの関係式より差分法を用いた観測信号の χ, y方向の空間微分は、 [数 33]

[数 34]

[0083] で表される。ここで△はマイクロホン間の距離であり、対象の信号の波長はこの距離よりも十分に長いものとする。制作した図 17のマイクロホンにおいて、△は 18mmである。

時間積分によるノイズの低減にっヽては、実環境中で観測された信号は反射の影響により、精度の良い分離処理や音源の到来方向、標準偏差の推定を行うことができな、。そこで分離信号に対して行って、た時間積分を観測信号の空間勾配に対して行う。すなわち次式の処理で分離信号を得る。

[0084] [数 35]

(35) ここで忘却係数は α =e^_At/l〜― O. 9991であり、時定数 γは 25msに設定している。このときの分離過程を図 17 (B)に示す。

[0085] 実環境中での信号分離と音源方向の推定については、 2つのスピーカーと空間微分マイクロホンを用いて信号分離の実験を行った。実験の概略図を図 18に示す。右側のスピーカーから音声信号 P (t)、左側のスピーカーからは P (t)を同時に再生し、

1 2

空間微分マイクロホンを用いて録音を行った。ただし本システムでは 4音声を同時録音できないので、マイク fl〜f4の位置でそれぞれ録音し、同時刻に記録された音声信号に対して分離処理を行っている。観測信号の音圧勾配 fx(t)、 fy(t)とそれらの時間積分値を図 19、図 20に、分離信号 P (t)、P (t)を図 21に推定した θ 、 Θ を図 22 にそれぞれ示す。実験の初期値として分離パラメータの初期値 r? (to) = 270° 、to = lsec、収束係数 =0. 0001を与えている。このときブラインド信号分離で推定した分離行列を次式に示す。

[0086] [数 36] R(fj)W

[0087] 推定した音源の到来方向 0 、 Θ はともに t=l. 5secには安定し、 t = 3せ c以降に

1 2

はほぼ真値付近に収束しており、精度良く推定されている。このとき最終的に推定された音源の到来方向は 0 63. 4° 、 Θ =126. 4° であった。標準偏差は σ =3

1= 2 tl

459. 2、 σ =3483. 3であり、 σ ： σ はほぼ 1： 1でとなるので、表 1の真値の比

t2 tl t2は

と一致する。また分離信号を音声に変換して聞いてみると、多少相手側の音声が重畳しているが、所望の信号は強調されていた。表 3, 4より、この実験の相互情報量も式 (28)を用いると、 d〜一 85. 3%とすることができた。

[0088] [表 4]

■i山 -: 4 Mntiifil ίηΐυΐ liifi i n t r ;M: 11 K'iil (j f.i ι- 11 .iit

Claims

請求の範囲

[1] 二次元平面又は三次元空間の異なる位置の出力源力出力される各出力信号が重畳された重畳信号を分離する信号分離装置にお!、て、

前記重畳信号を各出力信号に関する時間勾配の瞬時混合和として検出する空間勾配検出手段と、

前記時間勾配の瞬時混合和に基づいて前記各出力信号を分離する信号分離手段とを備えることを

特徴とする信号分離装置。

[2] 前記請求項 1に記載の信号分離装置にお!、て、

前記空間勾配検出手段が、各出力信号を各音声信号として検出するマイクロホンアレイとして構成され、当該マイクロホンアレイが前記音声信号の音圧勾配として検出することを

特徴とする信号分離装置。

[3] 前記請求項 2に記載の信号分離装置において、

前記マイクロホンアレイが検出する音圧勾配を粒子速度の時間微分により求めることを

特徴とする信号分離装置。

[4] 前記請求項 2又は 3に記載の信号分離装置において、

前記マイクロホンアレイが、各音声信号が出力される異なる位置に対する観測点における少なくとも X軸方向又は y軸方向の音圧差分を計測する双指向性のマイクロホンで構成されることを

特徴とする信号分離装置。

[5] 前記請求項 1な!、し 4の、ずれかに記載の信号分離装置にお!、て、

前記信号分離手段が、重畳信号を各出力信号に分離すると共に、当該各出力信号の各出力源における方向及び Z又は標準偏差を出力することをことを

特徴とする信号分離装置。