JPH0944186A - 雑音抑制装置 - Google Patents

雑音抑制装置

Info

Publication number
JPH0944186A
JPH0944186A JP7194580A JP19458095A JPH0944186A JP H0944186 A JPH0944186 A JP H0944186A JP 7194580 A JP7194580 A JP 7194580A JP 19458095 A JP19458095 A JP 19458095A JP H0944186 A JPH0944186 A JP H0944186A
Authority
JP
Japan
Prior art keywords
pitch
onset
time
offset
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7194580A
Other languages
English (en)
Inventor
Ikuyo Masuda
郁代 増田
Yoshiyuki Yoshizumi
嘉之 吉住
Yoshinori Yamada
義則 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7194580A priority Critical patent/JPH0944186A/ja
Publication of JPH0944186A publication Critical patent/JPH0944186A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Noise Elimination (AREA)

Abstract

(57)【要約】 【目的】 雑音が混在した音響信号から雑音を抑制する
雑音抑制装置を提供する。 【構成】 信号の時間分割手段100は入力信号を短時
間セグメントに分割しピッチ抽出手段200は入力信号
のピッチを抽出する。周波数帯域分割手段400は短時
間信号を周波数分割しエネルギーまたは実効値の算出手
段600は周波数分割手段の出力のエネルギーまたは実
効値を算出する。特徴量の算出手段800は特徴量を計
算し重み値の算出手段900は信号の重み値を算出す
る。乗算手段910は入力信号の周波数と重み値を乗算
し総和手段930は乗算手段910の出力を時間と周波
数にわたり総和する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声などの音響信号の
周波数成分を人間の聴覚特性をもちいて重み付けするこ
とにより、雑音が混在した音響信号から目的音を抽出装
置に関する。
【0002】
【従来の技術】複数の信号が混合した音響信号や雑音が
混在する音響信号からひとつの音響信号だけを取り出す
技術は数種にわたる。例えば、複数のマイクロフォンを
配列しマイクロフォンに到達する信号の時間差や位相
差、レベル差を利用して信号を分離するものもある。特
開平1-118900はその一例である。図1はこの従来の雑音
抑圧装置の構成図を示すものであり、1は音声信号入力
用の接話マイク、2は雑音成分信号入力用のセンサマイ
ク、3及び4はローパスフィルタ、5はバンドパスフィ
ルタバンク、10iから10Nは雑音除去回路、11i
から11Nは位相差検出補正回路、12iから12Nは
レベル差検出補正回路である。バンドパスフィルタバン
クにより分析された時間信号とそれを整流平滑したスペ
クトル信号を用いて雑音の除去を行うものである。しか
し、この手法ではモノーラルの信号に複数の音響信号が
混在する時には信号の分離ができない。また、雑音の性
質や信号の性質が既知の場合櫛形フィルタや自己相関を
用いた信号分離も試みられている。しかし、混在信号が
既知でない時この手法では信号の分離ができない。
【0003】ところで、最近音の知覚的な側面に注目し
て音響信号の分離が試みられている。このような手法は
モノーラル信号に複数の信号が混在しているときでも有
効で信号の性質も未知でよく音声が楽器音といった調波
構造をもつ信号の分離に有効な手段である。知覚的な音
の統合のための音響信号の物理的な特徴はBregma
nらによって心理学的に調べられている。人間が音を群
化する際周波数成分の高調波関係の有無、周波数成分の
振幅変化の共通性のずれ、音の時間的な連続性などの特
徴が重要なてがかりになっていることがわかっている
(A.S.Bregman Auditory Scene Analysis,Mit Press(19
90))。
【0004】Brownらは、この特徴を利用して、信
号分離を試みている(G.J.Brown M.P.Cooke (1992) A
Computational model of auditory scene analysis, P
roceedings of International Conference on Spoken L
anguage Processing(ICSLP))。システムは、まず人間
の聴覚的特性を模擬したモデルによって周波数解析に相
当する処理を行う。次に周波数成分を抽出し、それらの
立ち上がり時刻のずれ、および高調波という特徴に基づ
いて、ヒューリスティクスを用いて主要な領域をグルー
プ化し、これを目的音声とみなして音響信号を再合成す
る仕組みになっている。しかし、この手法では抽出する
目的信号と除去する信号が周波数上で重なるとき信号が
欠落するため不明瞭な音声信号しか抽出できなかった。
また、その信号の欠落を補償するためDPを用いた信号
の補間(M.P.Cooke(1993) Computational auditory sc
ene analysis: Exploiting principles of perceived c
ontinuity Speech Communication 13 391-399)やHM
Mをもちいた補間(M.P.Cooke(1994) Learning to rec
ognise speech in noisy environments, Proceedings o
f ATR Workshop on A Biological Framework for Speec
h Perception and Producton)が試みられているが、一
度落ちた情報を再現するためには膨大な計算が必要にも
かかわらず効果は小さい。
【0005】
【発明が解決しようとする課題】しかしながら、上記の
従来の構成では、 (1)抽出すべき信号の性質が既知でなければならな
い。 (2)複数のマイクロフォンが必要である。 (3)S/Nが改善されても、音声の認識にとって重要
な音響信号も欠落する。 (4)信号の特徴がロバストに抽出されなければならな
いので、計算量が膨大になる。という問題点を有してい
た。
【0006】本発明は上記従来の課題を解決するもので
パラメータの抽出が不確かであっても抽出すべき信号が
含まれている見込みの大きさに従って入力信号の重みづ
けをすることで完全に抽出すべき信号を欠落されること
がなく音声の明瞭さを損なわず雑音の低減を実現するこ
とを目的としている。
【0007】
【課題を解決するための手段】この目的を達成するため
に本発明の雑音抑制装置は、音響信号を時間分割する信
号の時間分割手段と、前記信号の時間分割手段による短
時間セグメントの信号のピッチを抽出するピッチ抽出手
段と、前記ピッチ抽出手段によって求められたピッチを
格納する第1の記憶手段と、前記信号の時間分割手段の
出力信号を複数の周波数帯域に分割する周波数帯域分割
手段と、前記周波数帯域分割手段の出力を格納する第2
の記憶手段と、前記第1の記憶手段の出力のエネルギー
を算出するエネルギー算出手段と、前記エネルギー算出
手段の出力を格納する第3の記憶手段と、前記第3の記
憶手段と前記第1の記憶手段の出力から特徴量の算出を
行う特徴量の算出手段と、ある時間区間のある周波数帯
域の信号の重み値の算出を行う重み値の算出手段と、前
記第3の記憶手段の出力と前記重み値の算出手段の積を
算出する乗算手段と、前記乗算手段の出力を格納する第
4の記憶手段と、前記第4の記憶手段の出力の総和を算
出する総和手段を有している。
【0008】
【作用】本発明は前記構成により、人間の聴覚が聴感上
の雑音抑制のために利用している音の物理的な特徴を用
いて入力信号の周波数の重みづけを行うことにより雑音
が混在した音響信号から雑音を抑制することにより目的
の音響信号を抽出することができる。
【0009】
【実施例】まず本発明の実施例に共通の構成図を図2に
示す。
【0010】図2において、100は入力信号を短時間
セグメントに分割する時間分割手段、200は入力信号
のピッチを抽出するしピッチ抽出手段、400は短時間
信号を周波数分割する周波数帯域分割手段、600はエ
ネルギーまたは実効値の算出手段、800は特徴量を計
算する特徴量算出手段、900は重み値算出手段、91
0は入力信号の周波数と重み値を乗算する乗算手段、9
30は乗算手段910の出力を時間と周波数にわたり総
和する総和手段である。
【0011】以下それぞれの具体的な実施例について説
明する。 (実施例1)図3は本発明の第1の実施例における雑音
抑制装置の構成を示す構成図である。
【0012】図3において、1000は信号の時間切り
出しを行う信号の時間分割手段、1001はピッチ抽出
手段、1002は第1の記憶手段、1003は周波数帯
域分割フィルタ、1004は第2の記憶手段、1005
はエネルギーの算出手段、1006は第3の記憶手段、
1007は特徴量の算出手段、1008は重み値の算出
手段、1009は乗算手段、1010は第4の記憶手
段、1011は総和手段である。
【0013】以上のように構成された雑音抑制装置の動
作について説明する。信号の時間分割手段1000は音
響信号を時間T毎にδtの時間セグメントに分割する。
入力信号が音声信号であるので、δtは13ms、Tは
26msとする。前記信号の時間分割手段1000の形
状をハニング窓とすると前記信号の時間分割手段W(t
+kT)は(数1)で表すことができる。
【0014】
【数1】
【0015】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とするとSi
g(t+kT)は(数2)で表される。
【0016】
【数2】
【0017】ピッチ抽出手段1001はSig(t+k
T)のピッチを抽出する。ピッチは、ケプストラム法、
自己相関法などを用いて抽出される。抽出されたピッチ
をf p(kT)とする。第1の記憶手段1002は前記
ピッチ抽出手段1001で求められたfp(kT)を格
納する。また、周波数帯域分割フィルタ1003はSi
g(t+kT)を20Hzの周波数帯域にN分割する。
前記周波数帯域分割フィルタ1003の出力をSig
(t+kT,fm)と記述する(m=1,2,・・・・
N)。fmは帯域の中心周波数である。N個の狭帯域信
号Sig(t+kT,fm)は第2の記憶手段1004
に格納される。エネルギーの算出手段1005では各S
ig(t+kT,fm)のエネルギーを算出する。前記
エネルギーの算出手段1005のN個の出力をEne
(kT,fm)と記述する。Ene(kT,fm)は(数
3)で算出される。
【0018】
【数3】
【0019】N個のEne(kT,fm)は第3の記憶
手段1006に格納される。特徴量の算出手段1007
はSig(t+kT,fm)の特徴量を算出する。本実
施例では特徴量として、ピッチ、オンセット、オンセッ
トの同期性、オフセット、オフセットの同期性、連続
性、調波性を算出する。このうちピッチを除く特徴量に
ついて前記特徴量の算出手段1007で算出する。
【0020】図4は本実施例における特徴量の算出手段
1007の詳細図である。1101はオンセットの算出
手段、1102はオフセットの算出手段、1103は連
続性の算出手段、1104は調波性の算出手段、110
5はオンセットの同期性の算出手段、1106はオフセ
ットの同期性の算出手段である。
【0021】オンセットの算出手段1101では前記第
3の記憶手段1006の出力の時間的な変化に基づきオ
ンセットを定める。つまり、現時刻のエネルギーが前記
時刻のエネルギーに対しある閾値以上に増加したときオ
ンセットであると判断する。
【0022】オフセットの算出手段1102では前記第
3の記憶手段の出力の時間的な変化に基づきオフセット
を定める。つまり、現時刻のエネルギーが前記時刻のエ
ネルギーに対しある閾値以上に減少したときオフセット
であると判断する。
【0023】連続性の算出手段1103では前記第3の
記憶手段1006の出力の時間的な変化に基づき前時刻
の信号と現時刻の信号が連続であるかどうかを決定す
る。つまり、現時刻のエネルギーが前記時刻のエネルギ
ーに対しある閾値以下で増減したとき連続であると判断
する。
【0024】調波性の算出手段1104ではSig(t
+kT,fm)がピッチfp(kT)に対して調波関係で
あるとき調波的であるとする。つまりピッチの整数倍の
周波数に相当するfmがピッチに対し調波的であると判
断される。オンセットの同期性の算出手段1105では
Sig(t+kT,fm)でのオンセットがピッチf
p(kT)のオンセット時刻を基準に同時であるとき同
期的であるとする。オフセットの同期性の算出手段11
06ではSig(t+kT,fm)でのオフセットがピ
ッチfp(kT)のオフセット時刻を基準に同時である
とき同期的であるとする。
【0025】図3の重み値の算出手段1008では、各
特徴量(ピッチ、オンセット、オフセット、オンセット
の同期性、オフセットの同期性、調波性、連続性)を組
み合わせてSig(t+kT,fm)での重み値w(k
T,fm)を算出する。各特徴量のうち継時的特徴に関す
るものと周波数的特徴に関するものに分類しそれぞれの
統合を行う。前記オンセット、前記オンセットの同期
性、前記オフセット、前記オフセットの同期性、前記連
続性を統合して前記継時的特徴とする。また、前記ピッ
チ、前記調波性を統合して前記周波数的特徴とする。
【0026】以下にSig(t+kT,fm)における
各特徴量の統合方法の一例を示す。前記周波数的特徴及
び前記継時的特徴は論理式(数4)(数5)によって表
現できる。
【0027】
【数4】
【0028】
【数5】
【0029】このとき、S(t+kT,fm)の重み値
w(kT,fm)は(数6)となる。
【0030】
【数6】
【0031】論理値を(表1)のように割り当てる。
【0032】
【表1】
【0033】あるS(t+kT,fm)に対し、(表
2)のような論理値が割り当てられたとき、重み値w
(kT,fm)は(数7)となる。
【0034】
【表2】
【0035】
【数7】
【0036】図3の乗算手段1009はSig(t+k
T,fm)と重み値w(kT,fm)を乗算する。前記乗
算手段1009の出力は第4の記憶手段1010に格納
される。総和手段1011は全てのk,mについて、w
(kT,fm)×Sig(t+kT,fm)を総和する。
前記総和手段1011の出力は雑音が抑制された音響信
号となっている。
【0037】なお、各特徴量のうち調波性かまたは連続
性が含まれていれば全ての特徴量を用いる必要はない。
また、前記特徴量(ピッチ、オンセット、オフセット、
オンセットの同期性、オフセットの同期性、調波性、連
続性)以外の特徴量を新たに組み合わせてもよい。ま
た、前記信号の時間分割手段1000の時間幅δtや分
割の時間周期Tは前記δt=13ms、T=26msに
限ったものではなく、形状もハニング窓に限ったもので
はない。また、前記ピッチ抽出手段1001は、ケプス
トラム法、自己相関法に限ったものではない。また、前
記周波数帯域分割フィルタ1003の周波数帯域は20
Hzに限ったものではない。また、前記調波性の算出手
段1104において、調波的と判断するものはピッチの
整数倍に限ったものでなく、偶数倍や奇数倍でもよく、
また、それらの周波数を中心に幅をもたせてもよい。ま
た、前記オンセットの同期性の算出手段1105におい
て、同期的と判断する時間のずれは0でなくてもよい。
つまり、ピッチ帯域でオンセットが検出された時刻の前
後でも同期的であると判断してもよい。また、前記オフ
セットの同期性の算出手段1106において、同期的と
判断する時間のずれは0でなくてもよい。つまり、ピッ
チ帯域でオフセットが検出された時刻の前後でも同期的
であると判断してもよい。また、前記重み値の算出手段
1008において、各特徴量を論理値(0,1)以外で
表現してもよく、また、特徴量の統合による重み値の算
出方法も論理積や論理和に限ったものではない。また、
オンセットやオフセットや連続性の判断に使うエネルギ
ーの差の算出は隣あう時間セグメントの比較に限らず時
間が離れていたり複数の時間セグメントの比較を行って
もよい。
【0038】なお、後述する実施例9のように、前記周
波数帯域分割フィルタ1003はフーリエ変換をもちい
てもよく、また、エネルギーの算出手段1006は実効
値算出手段をもちいてもよい。
【0039】(実施例2)以下本発明の信号分離装置に
おける一実施例について図面を参照しながら説明する。
【0040】本実施例の主たる構成図は、第1の実施例
と同様、図3である。以上のように構成された雑音抑制
装置の動作について説明する。
【0041】信号の時間分割手段1000は音響信号を
時間T毎にδtの時間セグメントに分割する。入力信号
が音声信号であるので、δtは13ms、Tは26ms
とする。前記信号の時間分割手段の形状をハニング窓と
すると前記信号の時間分割手段W(t+kT)は(数
1)で表すことができる。
【0042】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とするとSi
g(t+kT)は(数2)で表される。
【0043】ピッチ抽出手段1001は複数の抽出方法
を用いてSig(t+kT)のピッチを抽出する。図5
は本実施例における前記ピッチ抽出手段1001の詳細
図である。図5において、1200は第1のピッチ抽出
手段、1201は第2のピッチ抽出手段、1202は第
nのピッチ抽出手段(n=2,3,・・・・・)、12
03はピッチの推定値の算出手段である。第1のピッチ
抽出手段1200によってピッチfp1(kT)が、第2
のピッチ抽出手段1201によってピッチfp2(kT)
が、第nのピッチ抽出手段1202によってピッチfpn
(kT)が計算されたとする。このときピッチの推定値
の算出手段1203によってピッチの推定値fp(k
T)は(数8)で求められる。
【0044】
【数8】
【0045】図3において、第1の記憶手段1002
は、前記ピッチ抽出手段1001で求められたピッチf
p(kT)を格納する。
【0046】また、周波数帯域分割フィルタ1003は
Sig(t+kT)を20Hzの周波数帯域にN分割す
る。前記周波数帯域分割フィルタ1003の出力をSi
g(t+kT,fm)と記述する(m=1,2,・・・
・N)。fmは帯域の中心周波数である。N個の狭帯域
信号Sig(t+kT,fm)は第2の記憶手段100
4に格納される。エネルギーの算出手段1005では各
Sig(t+kT,fm)のエネルギーを算出する。前
記エネルギーの算出手段1005のN個の出力をEne
(kT,fm)と記述する。Ene(kT,fm)は(数
3)で算出される。
【0047】N個のEne(kT,fm)は第3の記憶
手段1006に格納される。特徴量の算出手段1007
はSig(t+kT,fm)の特徴量を算出する。本実
施例では特徴量として、ピッチ、オンセット、オンセッ
トの同期性、オフセット、オフセットの同期性、連続
性、調波性を算出する。このうちピッチを除く特徴量に
ついて前記特徴量の算出手段1007で算出する。
【0048】図4は、前記特徴量の算出手段1007の
詳細図である。1101はオンセットの算出手段、11
02はオフセットの算出手段、1103は連続性の算出
手段、1104は調波性の算出手段、1105はオンセ
ットの同期性の算出手段、1106はオフセットの同期
性の算出手段である。
【0049】オンセットの算出手段1101では前記第
3の記憶手段1006の出力の時間的な変化に基づきオ
ンセットを定める。つまり、現時刻のエネルギーが前記
時刻のエネルギーに対しある閾値以上に増加したときオ
ンセットであると判断する。
【0050】オフセットの算出手段1102では前記第
3の記憶手段の出力の時間的な変化に基づきオフセット
を定める。つまり、現時刻のエネルギーが前記時刻のエ
ネルギーに対しある閾値以上に減少したときオフセット
であると判断する。
【0051】連続性の算出手段1103では前記第3の
記憶手段1006の出力の時間的な変化に基づき前時刻
の信号と現時刻の信号が連続であるかどうかを決定す
る。つまり、現時刻のエネルギーが前記時刻のエネルギ
ーに対しある閾値以下で増減したとき連続であると判断
する。
【0052】調波性の算出手段1104ではSig(t
+kT,fm)がピッチfp(kT)に対して調波関係で
あるとき調波的であるとする。つまり、ピッチの整数倍
の周波数に相当するfmがピッチに対し調波的であると
判断される。
【0053】オンセットの同期性の算出手段1105で
はSig(t+kT,fm)でのオンセットがピッチfp
(kT)のオンセット時刻を基準に同時であるとき同期
的であるとする。
【0054】オフセットの同期性の算出手段1106で
はSig(t+kT,fm)でのオフセットがピッチfp
(kT)のオフセット時刻を基準に同時であるとき同期
的であるとする。
【0055】図3の重み値の算出手段1008では、各
特徴量(ピッチ、オンセット、オフセット、オンセット
の同期性、オフセットの同期性、調波性、連続性)を組
み合わせてSig(t+kT,fm)での重み値w(t
+kT,fm)を算出する。各特徴量のうち継時的特徴に
関するものと周波数的特徴に関するものに分類しそれぞ
れの統合を行う。前記オンセット、前記オンセットの同
期性、前記オフセット、前記オフセットの同期性、前記
連続性を統合して前記継時的特徴とする。また、前記ピ
ッチ、前記調波性を統合して前記周波数的特徴とする。
【0056】以下にSig(t+kT,fm)における
前記各特徴量の統合方法の一例を示す。
【0057】前記周波数的特徴及び前記継時的特徴は論
理式(数4)(数5)によって表現できる。
【0058】このとき、Sig(t+kT,fm)の重
み値w(kT,fm)は(数6)となる。
【0059】論理値を(表1)のように割り当てる。あ
るSig(t+kT,fm)に対し、(表2)のような
論理値が割り当てられたとき、重み値w(kT,fm
は(数7)となる。
【0060】図3の乗算手段1009はSig(t+k
T,fm)と重み値w(kT,fm)を乗算する。前記乗
算手段1009の出力は第4の記憶手段1010に格納
される。総和手段1011は全てのk,mについて、w
(kT,fm)×Sig(t+kT,fm)を総和する。
前記総和手段1011の出力は雑音が抑制された音響信
号となっている。
【0061】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量(ピッチ、オンセット、
オフセット、オンセットの同期性、オフセットの同期
性、調波性、連続性)以外の特徴量を新たに組み合わせ
てもよい。また、前記信号の時間分割手段1000の時
間幅δtや分割の時間周期Tは前記δt=13ms、T
=26msに限ったものではなく形状もハニング窓に限
ったものではない。また、前記ピッチ抽出手段1001
は、ケプストラム法、自己相関法に限ったものではな
い。また、前記周波数帯域分割フィルタ1003の周波
数帯域は20Hzに限ったものではない。また、前記調
波性の算出手段1104において調波的と判断するもの
はピッチの整数倍に限ったものでなく、ピッチの偶数倍
や奇数倍でもよく、また、それらの周波数を中心に幅を
もたせてもよい。また、前記オンセットの同期性の算出
手段1105において同期的と判断する時間のずれは0
でなくてもよい。つまり、ピッチ帯域でオンセットが検
出された時刻の前後でも同期的であると判断してもよ
い。また、前記オフセットの同期性の算出手段1106
において同期的と判断する時間のずれは0でなくてもよ
い。つまり、ピッチ帯域でオフセットが検出された時刻
の前後でも同期的であると判断してもよい。また、前記
重み値の算出手段1008において各特徴量を論理値
(0,1)以外で表現してもよく、また、前記特徴量の
統合による重み値の算出方法も論理積や論理和に限った
ものではない。
【0062】また、オンセットやオフセットや連続性の
判断に使うエネルギーの差の算出は隣あう時間セグメン
トの比較に限らず時間が離れていたり複数の時間セグメ
ントの比較を行ってもよい。
【0063】なお、後述する実施例9のように、前記周
波数帯域分割フィルタ1003はフーリエ変換をもちい
てもよく、また前記エネルギーの算出手段1005は実
効値算出手段をもちいてもよい。
【0064】(実施例3)以下本発明の信号分離装置に
おける一実施例について図面を参照しながら説明する。
【0065】本実施例においても主の構成図は図3であ
る。以下、本実施例の動作について説明する。
【0066】信号の時間分割手段1000は音響信号を
時間T毎にδtの時間セグメントに分割する。入力信号
が音声信号であるのでδtは13ms、Tは26msと
する。前記信号の時間分割手段1000の形状はハニン
グ窓とすると信号の時間分割手段W(t+kT)は(数
1)で表すことができる。
【0067】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とすると、S
ig(t+kT)は(数2)で表される。
【0068】ピッチ抽出手段1001はSig(t+k
T)のピッチを抽出する。ピッチはケプストラム法、自
己相関法などを用いて抽出される。第1の記憶手段10
02は前記ピッチ抽出手段1001で求められたピッチ
p(kT)を格納する。また、周波数帯域分割フィル
タ1003はSig(t+kT)を20Hzの周波数帯
域にN分割する。前記周波数帯域分割フィルタ1003
の出力をSig(t+kT,fm)と記述する(m=
1,2,・・・・N)。fmは帯域の中心周波数であ
る。N個の狭帯域信号Sig(t+kT,fm)は第2
の記憶手段1004に格納される。エネルギーの算出手
段1005では各Sig(t+kT,fm)のエネルギ
ーを算出する。前記エネルギーの算出手段1005のN
個の出力をEne(kT,fm)と記述する。Ene
(kT,fm)は(数3)で算出される。
【0069】N個のEne(kT,fm)は第3の記憶
手段1006に格納される。特徴量の算出手段1007
はSig(t+kT,fm)の特徴量を算出する。本実
施例では特徴量として、ピッチ、オンセット、オンセッ
トの同期性、オフセット、オフセットの同期性、連続
性、調波性を算出する。
【0070】図6は本実施例における特徴量の算出手段
1007の詳細図である。図6において、1301はピ
ッチの評価測度の算出手段、1302はオンセットの評
価測度の算出手段、1303はオフセットの評価測度の
算出手段、1304は連続性の評価測度の算出手段、1
305は調波性の評価測度の算出手段、1306はオン
セットの同期性の評価測度の算出手段、1307はオフ
セットの同期性の評価測度の算出手段である。また、評
価測度としてSig(t+kT,fm)で各特徴量が存
在する確からしさを用いる。
【0071】以下で各特徴量の評価測度の算出手段につ
いて詳細に説明する。ピッチの評価測度の算出手段13
01において、fp(kT)に対しピッチが存在しうる
範囲を確率的に定義しSig(kT,fm)にピッチが
存在する確からしさを算出する。図7はピッチが存在し
うる周波数の確率分布の一例である。fp(kT)に対
してピッチが存在する確からしさがガウス分布をすると
するとSig(kT,fm)にピッチが存在する確から
しさRel_pitch(kT,fm)は分布の分散をσとす
ると(数9)によって与えられる。
【0072】
【数9】
【0073】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。
【0074】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。オンセットの評価測度の算出手段1302ではこ
の変化が一つの音の時間変化ではなく図9(b)のよう
に異なるもう一つの信号が加わったために起こったもの
であるという確からしさを人間の知覚に基づき定めこれ
をオンセットの確からしさとする。オンセットの確から
しさは前記第3の記憶手段1006の出力によって算出
される。以下に算出方法の一つの例を挙げる。心理学的
に連続にこえるか新たに音が加わったかという判断基準
が丁度変化する音の大きさが調べられている(1994年日
本音響学会秋期研究発表会稿論集2-7-18)。前記エネル
ギーの算出手段1005の出力を用いて現観測時刻のエ
ネルギーとそれより前の時刻までのエネルギーの平均か
ら前記オンセットの確からしさを定める。図10はオン
セットの確からしさの算出方法のための説明図である。
前記前時刻までのエネルギーの平均は現観測周波数とそ
の周波数に近接する2つの周波数帯域における約200
ms区間(16個のセグメント)のセグメントの平均と
する。Sig(kT,fm)の前記オンセットの確から
しさRel_on(EDif)は(数10)で算出される。
【0075】
【数10】
【0076】図11は(数10)を図式化したものであ
る。前記オンセットの確からしさはピッチ帯域でオンセ
ットが検出されるまではピッチ帯域でのみ計算される。
図10及び図11は図8の信号に対する前記オンセット
の確からしさを説明する説明図である。図12において
時刻k=2でピッチ帯域の前記オンセットの確からしさ
が1.0となり閾値0.8を越えたので時刻k=2から
全周波数帯域で前記オンセットの確からしさの計算を始
める。次に、(k,m)=(2,1)と(2,3)で前
記オンセットの確からしさ1.0が算出できたとする。
この時図13のように(k,m)=(2,1)と(2,
3)に前記オンセットの確からしさ1.0を割り当て
る。
【0077】オフセットの評価測度の算出手段1303
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記エネルギーの算出手段1005の出
力を用いてオフセットを定める。前記オフセットの確か
らしさRel_off(EDif)は前記オンセットの確から
しさの算出方法と同様に(数11)で与えられる。
【0078】
【数11】
【0079】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図14及び図1
5は図8の信号に対する前記オフセットの確からしさを
説明する説明図である。図14において時刻k=6でピ
ッチ帯域の前記オフセットの確からしさが1.0となり
ある閾値0.9を越えたので時刻k=6において前記オ
フセットの確からしさを全周波数帯域について算出す
る。(k,m)=(6,1)と(6,3)で前記オフセ
ットの確からしさ1.0を算出できたとすると図15の
ように前記オフセットの確からしさを割り当てる。
【0080】連続性の評価測度の算出手段1304では
音の大きさが時間的に変化したときそれが一つの信号の
時間変化である確からしさを指標とする。連続性の確か
らしさは前記第3の記憶手段1006の出力によって算
出される。図16は前記連続性の確からしさの算出方法
のための説明図である。図16において、現観測時刻を
含む現観測時刻以前約200ms区間(16個のセグメ
ント)の現観測セグメントのエネルギーの平均と現観測
周波数とその周波数に隣接する2つの周波数帯域におけ
る現観測時刻を含まない現観測時刻より前の約200m
s区間(16個のセグメント)のエネルギーの平均から
前記連続性の確からしさを決定する。前記連続性の確か
らしさRel_con(EDif)は(数12)で定義する。
【0081】
【数12】
【0082】図17は(数12)を図式化したものであ
る。前記連続性の確からしさはオンセットが検出された
後オフセットが検出されるまで計算される。図18は図
8の信号に対する前記連続性の確からしさを説明する説
明図である。時刻k=2でオンセットが時刻k=6でオ
フセットが検出されたとき、時刻k=3から5までの間
前記連続性の確からしさが計算され各(k,m)での連
続性の確からしさが図18のように算出される。
【0083】調波性の評価測度の算出手段1305では
Sig(t+kT,fm)がfp(kT)に対して知覚上
調波関係である確からしさをもって調波性の確からしさ
とする。ピッチの整数倍の周波数区間を中心に主観的に
調波性を感じる周波数分布を人間の心理測定関数から定
める。心理測定関数は電子情報通信学会論文誌'94/5Vo
l.J77-ANo.5 731-740に掲載のデータを参考に決める。
周波数帯域の中心周波数fmでの前記ピッチfp(kT)
のp倍(pは整数)の周波数からのずれuが(数13)
で求められる。
【0084】
【数13】
【0085】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。
【0086】
【数14】
【0087】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。
【0088】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5 731-740に掲載のデ
ータを参考に定義する。Sig(t+kT,fm)でオ
ンセットが検出されたときそれと最も近いピッチのオン
セット時刻の差をv(ms)とすると、前記オンセット
の同期性の確からしさRel_sync(kT,fm)は(数
15)で記述できる。
【0089】
【数15】
【0090】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。
【0091】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。
【0092】図3の重み値の算出手段1008では評価
関数に前記各特徴(ピッチ、オンセット、オフセット、
オンセットの同期性、オフセットの同期性、調波性、連
続性)についての確からしさを入力し、Sig(t+k
T,fm)での重み値w(t+kT,fm)を算出する。
【0093】各特徴量のうち継時的確からしさに関する
ものと周波数的確からしさに関するものに分類しそれぞ
れの確からしさの統合を行う。前記オンセットの確から
しさ、前記オンセットの同期性の確からしさ、前記オフ
セットの確からしさ、前記オフセットの同期性の確から
しさ、前記連続性の確からしさを統合して前記継時的確
からしさとする。また、前記ピッチの確からしさ、前記
調波性の確からしさを統合して前記周波数的確からしさ
とする。
【0094】図3において乗算手段1009はSig
(t+kT,fm)と重み値w(kT,fm)を乗算す
る。前記乗算手段1009の出力は第4の記憶手段10
10に格納される。総和手段1011は全てのk,mに
ついて、w(kT,fm)×Sig(t+kT,fm)を
総和する。前記総和手段1011の出力は雑音が抑制さ
れた音響信号となっている。
【0095】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量以外の特徴量を新たに組
み合わせてもよい。また、前記信号の時間分割手段10
00の時間幅δtや分割の時間周期Tは前記δt=13
ms、T=26msに限ったものではなく形状もハニン
グ窓に限ったものではない。また、前記ピッチ抽出手段
1001はケプストラム法、自己相関法に限ったもので
はない。また、前記周波数帯域分割フィルタ1003の
周波数帯域は20Hzに限ったものではない。また、ピ
ッチが存在する確からしさの算出においてガウス分布以
外の分布で定義してもよい。また、オンセット時刻の判
断に用いる閾値は0.8以外でもよい。また、オフセッ
ト時刻の判断に用いる閾値は0.9以外でもよい。ま
た、前記オンセットの確からしさの算出方法は(数1
0)に限らない。また、前記オフセットの確からしさの
算出方法は(数11)に限らない。また、前記連続性の
確からしさの算出方法は(数12)に限らない。また、
前記調波性の確からしさの算出方法は(数13)および
(数14)に限らない。また、オンセットの同期性の確
からしさの算出方法やオフセットの同期性の確からしさ
の算出方法は(数15)に限らない。
【0096】なお、後述する実施例9のように、前記周
波数帯域分割フィルタ1003はフーリエ変換をもちい
てもよく、またエネルギーの算出手段1006は実効値
算出手段をもちいてもよい。
【0097】(実施例4)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。
【0098】本実施例も主なる構成図は図3である。本
実施例の動作に付いて説明する。
【0099】信号の時間分割手段1000は音響信号を
時間T毎にδtの時間セグメントに分割する。入力信号
が音声信号であるのでδtは13ms、Tは26msと
する。前記信号の時間分割手段1000の形状をハニン
グ窓とすると前記信号の時間分割手段W(t+kT)は
(数1)で表すことができる。
【0100】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とすると、S
ig(t+kT)は(数2)で表される。
【0101】ピッチ抽出手段1001は複数の抽出方法
を用いてSig(t+kT)のピッチを抽出する。図2
4は前記ピッチ抽出手段1001の詳細図である。図2
4において、3810は第1のピッチ抽出手段、382
0は第2のピッチ抽出手段、3830はピッチの推定値
の算出手段である。第1のピッチ抽出手段3810によ
ってピッチfp1(kT)が、第2のピッチ抽出手段38
20によってピッチf p2(kT)が計算されたとする。
このとき、ピッチの推定値の算出手段3830によって
ピッチの推定値fp(kT)は(数16)で求められ
る。
【0102】
【数16】
【0103】図3において、第1の記憶手段1002は
前記ピッチ抽出手段1001で求められたfp1(kT)
とfp2(kT)とfp(kT)を格納する。
【0104】また、周波数帯域分割フィルタ1003は
Sig(t+kT)を20Hzの周波数帯域にN分割す
る。前記周波数帯域分割フィルタ1003の出力をSi
g(t+kT,fm)と記述する(m=1,2,・・・
・N)。fmは帯域の中心周波数である。N個の狭帯域
信号Sig(t+kT,fm)は第2の記憶手段100
4に格納される。エネルギーの算出手段1005では各
Sig(t+kT,fm)のエネルギーを算出する。前
記エネルギーの算出手段1005のN個の出力をEne
(kT,fm)と記述する。Ene(kT,fm)は(数
3)で算出される。
【0105】前記N個のEne(kT,fm)は第3の
記憶手段1006に格納される。特徴量の算出手段10
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では特徴量として、ピッチ、オンセット、オン
セットの同期性、オフセット、オフセットの同期性、連
続性、調波性を算出する。
【0106】図6は本実施例における特徴量の算出手段
1007の詳細図である。図6において、1301はピ
ッチの評価測度の算出手段、1302はオンセットの評
価測度の算出手段、1303はオフセットの評価測度の
算出手段、1304は連続性の評価測度の算出手段、1
305は調波性の評価測度の算出手段、1306はオン
セットの同期性の評価測度の算出手段、1307はオフ
セットの同期性の評価測度の算出手段である。また、評
価測度としてSig(t+kT,fm)で各特徴量が存
在する確からしさを用いる。
【0107】以下で前記特徴量の評価測度の算出手段に
ついて詳細に説明する。ピッチの評価測度の算出手段1
301は、前記ピッチ抽出手段1001で計算されたf
p1(kT)とfp2(kT)の差からピッチfp(kT)
の確からしさを決定する。fp1(kT)とfp2(kT)
の差が0の時ピッチは正確に抽出されたとしピッチfp
(kT)の確からしさは1とする。fp1(kT)とfp2
(kT)の差が大きくなると確からしさは減少する。ピ
ッチの確からしさが図3900のようにfp1(kT)−
p2(kT)の値によってガウス分布するとするとピッ
チの確からしさRel(fp1(kT)−fp2(kT))
が(数17)で決定される。
【0108】
【数17】
【0109】同時に、図26のように得られたピッチの
推定値fp(kT)に対しあるピッチが存在しうる範囲
を確率的に定義しSig(kT,fm)にピッチが存在
する確からしさを算出する。ピッチの推定値fp(k
T)に対してピッチが存在する確からしさがガウス分布
をするとすると、Sig(kT,fm)にピッチが存在
する確からしさRel_pitch(kT,fm)は分散をσ
とすると(数9)によって与えられる。
【0110】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。
【0111】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。オンセットの評価測度の算出手段1302ではこ
の変化が一つの音の時間変化ではなく図9(b)のよう
に異なるもう一つの信号が加わったために起こったもの
であるという確からしさを人間の知覚に基づき定めこれ
をオンセットの確からしさとする。前記オンセットの確
からしさは前記第3の記憶手段1006の出力によって
算出される。以下に算出方法の一つの例を挙げる。心理
学的に連続にきこえるか新たに音が加わったかという判
断基準が丁度変化する音の大きさが調べられている(19
94年日本音響学会秋期研究発表会稿論集2-7-18)。前記
エネルギーの算出手段1005の出力を用いて現観測時
刻のエネルギーとそれより前の時刻までのエネルギーの
平均から前記オンセットの確からしさを定める。図10
はオンセットの確からしさの算出方法のための説明図で
ある。前記前時刻までのエネルギーの平均は現観測周波
数とその周波数に近接する2つの周波数帯域における約
200ms区間(16個のセグメント)のセグメントの
平均とする。Sig(kT,fm)の前記オンセットの
確からしさRel_on(EDif)は(数10)で算出され
る。
【0112】図11は(数10)を図式化したものであ
る。オンセットの確からしさはピッチ帯域でオンセット
が検出されるまではピッチ帯域でのみ計算される。図1
2及び図13は図8の信号に対する前記オンセットの確
からしさを説明する説明図である。図12において時刻
k=2でピッチ帯域の前記オンセットの確からしさが
1.0となり閾値0.8を越えたので時刻k=2から全
周波数帯域で前記オンセットの確からしさの計算を始め
る。(k,m)=(2,1)と(2,3)で前記オンセ
ットの確からしさ1.0が算出できたとする。この時図
2700のように(k,m)=(2,1)と(2,3)
に前記オンセットの確からしさ1.0を割り当てる。
【0113】オフセットの評価測度の算出手段1303
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記エネルギーの算出手段1005の出
力を用いてオフセットを定める。前記オフセットの確か
らしさRel_off(EDif)は前記オンセットの確から
しさの算出方法と同様に(数11)で与えられる。
【0114】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図14及び図1
5は図8の信号に対する前記オフセットの確からしさを
説明する説明図である。図14において時刻k=6でピ
ッチ帯域の前記オフセットの確からしさが1.0となり
ある閾値0.9を越えたので時刻k=6において前記オ
フセットの確からしさを全周波数帯域について算出す
る。(k,m)=(6,1)と(6,3)で前記オフセ
ットの確からしさ1.0を算出できたとすると図15の
ように前記オフセットの確からしさを割り当てる。
【0115】連続性の評価測度の算出手段1304で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段1006の出力に
よって算出される。図16はオンセットの確からしさの
算出方法のための説明図である。図16において、現観
測時刻を含む現観測時刻以前約200ms区間(16個
のセグメント)の現観測セグメントのエネルギーの平均
と現観測周波数とその周波数に隣接する2つの周波数帯
域における現観測時刻を含まない現観測時刻より前の約
200ms区間(16個のセグメント)のエネルギーの
平均から前記連続性の確からしさを決定する。前記連続
性の確からしさRel_con(EDif)は(数12)で定
義する。
【0116】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき、時刻k=3から5までの
間前記連続性の確からしさが計算され、各(k,m)で
の連続性の確からしさが図18のように算出される。
【0117】調波性の評価測度の算出手段1305で
は、前記Sig(t+kT,fm)が前記fp(kT)に
対して知覚上調波関係である確からしさをもって調波性
の確からしさとする。ピッチの整数倍の周波数区間を中
心に主観的に調波性を感じる周波数分布を人間の心理測
定関数から定める。心理測定関数は電子情報通信学会論
文誌'94/5Vol.J77-ANo.5 731-740に掲載のデータを参
考に決める。周波数帯域の中心周波数fmでの前記ピッ
チfp(kT)のp倍(pは整数)の周波数からのずれ
uが(数13)で求められる。
【0118】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。
【0119】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。
【0120】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5 731-740に掲載のデ
ータを参考に定義する。Sig(t+kT,fm)でオ
ンセットが検出されたときそれと最も近いピッチのオン
セット時刻の差をv(ms)とすると、前記オンセット
の同期性の確からしさRel_sync(kT,fm)は、
(数15)で記述できる。
【0121】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。
【0122】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。
【0123】図3の重み値の算出手段1008では、評
価関数に各特徴(ピッチ、オンセット、オフセット、オ
ンセットの同期性、オフセットの同期性、調波性、連続
性)についての確からしさを入力しSig(t+kT,
m)での重み値w(t+kT,fm)を算出する。
【0124】各特徴量のうち継時的確からしさに関する
ものと周波数的確からしさに関するものに分類しそれぞ
れの確からしさの統合を行う。前記オンセットの確から
しさ、前記オンセットの同期性の確からしさ、前記オフ
セットの確からしさ、前記オフセットの同期性の確から
しさ、前記連続性の確からしさを統合して前記継時的確
からしさとする。また、前記ピッチの確からしさ、前記
ピッチの変動の範囲の確からしさ、前記調波性の確から
しさを統合して前記周波数的確からしさとする。
【0125】図3において、乗算手段1009はSig
(t+kT,fm)と重み値w(kT,fm)を乗算す
る。前記乗算手段1009の出力は第4の記憶手段10
10に格納される。総和手段1011は全てのk,mに
ついて、w(kT,fm)×Sig(t+kT,fm)を
総和する。前記総和手段1011の出力は雑音が抑制さ
れた音響信号となっている。
【0126】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また前記特徴量以外の特徴量を新たに組み
合わせてもよい。また、前記信号の時間分割手段100
0の時間幅δtや分割の時間周期Tは前記δt=13m
s、T=26msに限ったものではなく形状もハニング
窓に限ったものではない。また、前記ピッチ抽出手段1
001はケプストラム法、自己相関法に限ったものでは
ない。また、前記周波数帯域分割フィルタ1003の周
波数帯域は20Hzに限ったものではない。また、ピッ
チが存在する確からしさの算出においてガウス分布以外
の分布で定義してもよい。また、オンセット時刻の判断
に用いる閾値は0.8以外でもよい。また、オフセット
時刻の判断に用いる閾値は0.9以外でもよい。また、
前記オンセットの確からしさの算出方法は(数10)に
限らない。また、前記オフセットの確からしさの算出方
法は(数11)に限らない。また、前記連続性の確から
しさの算出方法は(数12)に限らない。また、前記調
波性の確からしさの算出方法は(数13)および(数1
4)に限らない。また、オンセットの同期性の確からし
さの算出方法やオフセットの同期性の確からしさの算出
方法は(数15)に限らない。
【0127】なお、実施例9のように、前記周波数帯域
分割フィルタ1003はフーリエ変換を用いてもよく、
またエネルギーの算出手段1006は実効値算出手段を
用いてもよい。
【0128】(実施例5)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。
【0129】本発明の第5の実施例における主な構成図
は図3である。以上のように構成された雑音抑制装置の
動作について説明する。
【0130】信号の時間分割手段1000は音響信号を
時間T毎にδtの時間セグメントに分割する。入力信号
が音声信号であるのでδtは13ms、Tは26msと
する。前記信号の時間分割手段1000の形状はハニン
グ窓とすると前記信号の時間分割手段W(t+kT)は
(数1)で表すことができる。
【0131】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とするとSi
g(t+kT)は(数2)で表される。
【0132】ピッチ抽出手段1001は複数の抽出方法
を用いてSig(t+kT)のピッチを抽出する。図5
は本実施例における前記ピッチ抽出手段1001の詳細
図である。図5において、1200は第1のピッチ抽出
手段、1201は第2のピッチ抽出手段、1202は第
nのピッチ抽出手段、1203はピッチの推定値f
p(t)の算出手段である。第1のピッチ抽出手段12
00によってピッチfp1(kT)が、第2のピッチ抽出
手段1201によってピッチfp2(kT)が、第nのピ
ッチ抽出手段1202によってピッチfpn(kT)が計
算されたとする。このとき、ピッチの推定値fp(t)
の算出手段1203によってピッチの推定値fp(k
T)は(数8)で求められる。
【0133】また、fp1(kT)からfpn(kT)の分
散Vpitch(kT)を(数18)で求める。
【0134】
【数18】
【0135】図3において、第1の記憶手段1002は
前記ピッチ抽出手段1001で求められたfp(kT)
と分散Vpitch(kT)を格納する。
【0136】また、周波数帯域分割フィルタ1003は
Sig(t+kT)を20Hzの周波数帯域にN分割す
る。前記周波数帯域分割フィルタ1003の出力をSi
g(t+kT,fm)と記述する(m=1,2,・・・
・N)。fmは帯域の中心周波数である。N個の狭帯域
信号Sig(t+kT,fm)は第2の記憶手段100
4に格納される。エネルギー算出手段1005では各S
ig(t+kT,fm)のエネルギーを算出する。前記
エネルギー算出手段1005のN個の出力をEne(k
T,fm)と記述する。Ene(kT,fm)は(数3)
で算出される。
【0137】前記N個のEne(kT,fm)は第3の
記憶手段1006に格納される。特徴量の算出手段10
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では、特徴量として、ピッチ、オンセット、オ
ンセットの同期性、オフセット、オフセットの同期性、
連続性、調波性を算出する。
【0138】図6は図3の特徴量の算出手段1007の
詳細図である。図6において、1301はピッチの評価
測度の算出手段、1302はオンセットの評価測度の算
出手段、1303はオフセットの評価測度の算出手段、
1304は連続性の評価測度の算出手段、1305は調
波性の評価測度の算出手段、1306はオンセットの同
期性の評価測度の算出手段、1307はオフセットの同
期性の評価測度の算出手段である。また、評価測度とし
てSig(t+kT,fm)で各特徴量が存在する確か
らしさを用いる。
【0139】以下で前記特徴量の評価測度の算出手段に
ついて詳細に説明する。ピッチの評価測度の算出手段
は、前記ピッチ抽出手段1001で計算された分散V
pitch(kT)から推定されたピッチfp(kT)の確か
らしさを決定する。Vpitch(kT)が0の時ピッチは
正確に抽出されたとしピッチfp(kT)の確からしさ
は1とする。Vpitch(kT)が大きくなると確からし
さは減少する。ピッチの確からしさが図4100のよう
にVpitch(kT)の値によってガウス分布するとする
とピッチの確からしさRel(Vpitch(kT))が
(数19)で決定される。
【0140】
【数19】
【0141】同時に、図28のように得られたピッチの
推定値fp(kT)に対しあるピッチが存在しうる範囲
を確率的に定義しSig(kT,fm)がピッチである
確からしさを算出する。ピッチの推定値fp(kT)に
対してピッチが存在する確からしさがガウス分布をする
とするとSig(kT,fm)にピッチが存在する確か
らしさRel_pitch(kT,fm)は(数20)で与え
られる。
【0142】
【数20】
【0143】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。
【0144】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。オンセットの評価測度の算出手段1302ではこ
の変化が一つの音の時間変化ではなく図9(b)のよう
に異なるもう一つの信号が加わったために起こったもの
であるという確からしさを人間の知覚に基づき定めこれ
をオンセットの確からしさとする。前記オンセットの確
からしさは前記第3の記憶手段1006の出力によって
算出される。以下に算出方法の一つの例を挙げる。心理
学的に連続にきこえるか新たに音が加わったかという判
断基準が丁度変化する音の大きさが調べられている(19
94年日本音響学会秋期研究発表会稿論集2-7-18)。前記
エネルギー算出手段1005の出力を用いて現観測時刻
のエネルギーとそれより前の時刻までのエネルギーの平
均から前記オンセットの確からしさを定める。図10は
オンセットの確からしさの算出方法のための説明図であ
る。前記前時刻までのエネルギーの平均は現観測周波数
とその周波数に近接する2つの周波数帯域における約2
00ms区間(16個のセグメント)のセグメントの平
均とする。Sig(kT,fm)の前記オンセットの確
からしさRel_on(EDif)は(数10)で算出され
る。
【0145】図11は(数10)を図式化したものであ
る。前記オンセットの確からしさはピッチ帯域でオンセ
ットが検出されるまでピッチ帯域でのみ計算される。図
12及び図13は図8の信号に対する前記オンセットの
確からしさを説明する説明図である。図12において時
刻k=2でピッチ帯域の前記オンセットの確からしさが
1.0となり閾値0.8を越えたので時刻k=2から全
周波数帯域で前記オンセットの確からしさの計算を始め
る。(k,m)=(2,1)と(2,3)で前記オンセ
ットの確からしさ1.0が算出できたとする。この時、
図13のように(k,m)=(2,1)と(2,3)に
前記オンセットの確からしさ1.0を割り当てる。
【0146】前記オフセットの評価測度の算出手段13
03においてオフセットの確からしさが算出される。二
つの信号から一方の信号が除かれたとき音の大きさには
変化がある。そこで前記エネルギーの算出手段1005
の出力を用いてオフセットを定める。前記オフセットの
確からしさRel_off(EDif)は前記オンセットの確
からしさの算出方法と同様に(数11)で与えられる。
【0147】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図14及び図1
5は図8の信号に対する前記オフセットの確からしさを
説明する説明図である。図14において時刻k=6でピ
ッチ帯域の前記オフセットの確からしさが1.0となり
ある閾値0.9を越えたので時刻k=6において前記オ
フセットの確からしさを全周波数帯域について算出す
る。(k,m)=(6,1)と(6,3)で前記オフセ
ットの確からしさ1.0を算出できたとすると図15の
ように前記オフセットの確からしさを割り当てる。
【0148】連続性の評価測度の算出手段1304で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段1006の出力に
よって算出される。図16は前記連続性の確からしさの
算出方法のための説明図である。図16において、現観
測時刻を含む現観測時刻以前約200ms区間(16個
のセグメント)の現観測セグメントのエネルギーの平均
と現観測周波数とその周波数に隣接する2つの周波数帯
域における現観測時刻を含まない現観測時刻より前の約
200ms区間(16個のセグメント)のエネルギーの
平均から前記連続性の確からしさを決定する。前記連続
性の確からしさRel_con(EDif)は(数12)で定
義する。
【0149】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき時刻k=3から5までの間
前記連続性の確からしさが計算され各(k,m)での連
続性の確からしさが図18のように算出される。
【0150】調波性の評価測度の算出手段1305で
は、Sig(t+kT,fm)がfp(kT)に対して知
覚上調波関係である確からしさをもって調波性の確から
しさとする。ピッチの整数倍の周波数区間を中心に主観
的に調波性を感じる周波数分布を人間の心理測定関数か
ら定める。心理測定関数は電子情報通信学会論文誌'94/
5Vol.J77-ANo.5 731-740に掲載のデータを参考に決め
る。周波数帯域の中心周波数fmでの前記ピッチfp(k
T)のp倍(pは整数)の周波数からのずれuが(数1
3)で求められる。
【0151】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。
【0152】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。
【0153】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5 731-740に掲載のデ
ータを参考に前記同期性の確からしさの分布Rel_syn
c(kT,fm)を(数15)で定義する。Sig(t+
kT,fm)でオンセットが検出されたときそれと最も
近いピッチのオンセット時刻の差をv(ms)とする
と、前記オンセットの同期性の確からしさRel_sync
(kT,fm)は、(数15)で記述できる。
【0154】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。
【0155】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。
【0156】図3の重み値の算出手段1008では、評
価関数に各特徴(ピッチ、オンセット、オフセット、オ
ンセットの同期性、オフセットの同期性、調波性、連続
性)についての確からしさを入力し、Sig(t+k
T,fm)での重み値w(t+kT,fm)を算出する。
【0157】前記各特徴量のうち継時的確からしさに関
するものと周波数的確からしさに関するものに分類しそ
れぞれの確からしさの統合を行う。前記オンセットの確
からしさ、前記オンセットの同期性の確からしさ、前記
オフセットの確からしさ、前記オフセットの同期性の確
からしさ、前記パワーの連続性の確からしさを統合して
前記継時的確からしさとする。また、前記ピッチの確か
らしさ、前記ピッチの変動の範囲の確からしさ、前記調
波性の確からしさを統合して前記周波数的確からしさと
する。
【0158】図3において、前記乗算手段1009はS
ig(t+kT,fm)と重み値w(kT,fm)を乗算
する。前記乗算手段1009の出力は第4の記憶手段1
010に格納される。総和手段1011は全てのk,m
について、w(kT,fm)×Sig(t+kT,fm
を総和する。前記総和手段1011の出力は雑音が抑制
された音響信号となっている。
【0159】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また前記特徴量以外の特徴量を新たに組み
合わせてもよい。また、前記信号の時間分割手段100
0の時間幅δtや分割の時間周期Tは前記δt=13m
s、T=26msに限ったものではなく、形状もハニン
グ窓に限ったものではない。また、前記ピッチ抽出手段
1001はケプストラム法、自己相関法に限ったもので
はない。また、前記周波数帯域分割フィルタ1003の
周波数帯域は20Hzに限ったものではない。また、ピ
ッチが存在する確からしさの算出においてガウス分布以
外の分布で定義してもよい。また、オンセット時刻の判
断に用いる閾値は0.8以外でもよい。また、オフセッ
ト時刻の判断に用いる閾値は0.9以外でもよい。ま
た、前記オンセットの確からしさの算出方法は(数1
0)に限らない。また、前記オフセットの確からしさの
算出方法は(数11)に限らない。また、前記連続性の
確からしさの算出方法は(数12)に限らない。また、
前記調波性の確からしさの算出方法は(数13)および
(数14)に限らない。また、オンセットの同期性の確
からしさの算出方法やオフセットの同期性の確からしさ
の算出方法は(数15)に限らない。
【0160】なお、実施例9のように、前記周波数帯域
分割フィルタ1003はフーリエ変換を用いてもよく、
またエネルギーの算出手段1006は実効値算出手段を
用いてもよい。
【0161】(実施例6)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。
【0162】第6の実施例における主たる構成図は図3
である。以上のように構成された雑音抑制装置の動作に
ついて説明する。信号の時間分割手段1000は音響信
号を時間T毎にδtの時間セグメントに分割する。入力
信号が音声信号であるのでδtは13ms、Tは26m
sとする。前記信号の時間分割手段1000の形状はハ
ニング窓とすると前記信号の時間分割手段W(t+k
T)は(数1)で表すことができる。
【0163】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とするとSi
g(t+kT)は(数2)で表される。
【0164】ピッチ抽出手段1001はSig(t+k
T)のピッチを抽出する。ピッチはケプストラム法、自
己相関法などを用いて抽出される。第1の記憶手段10
02は前記ピッチ抽出手段1001で求められたピッチ
p(kT)を格納する。また、前記周波数帯域分割フ
ィルタ1003はSig(t+kT)を20Hzの周波
数帯域にN分割する。前記周波数帯域分割フィルタ10
03の出力をSig(t+kT,fm)と記述する(m
=1,2,・・・・N)。fmは帯域の中心周波数であ
る。N個の狭帯域信号Sig(t+kT,fm)は第2
の記憶手段1004に格納される。エネルギーの算出手
段1005では各Sig(t+kT,fm)のエネルギ
ーを算出する。前記エネルギーの算出手段1005のN
個の出力をEne(kT,fm)と記述する。Ene
(kT,fm)は(数3)で算出される。
【0165】前記N個のEne(kT,fm)は第3の
記憶手段1006に格納される。特徴量の算出手段10
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では、特徴量として、ピッチ、オンセット、オ
ンセットの同期性、オフセット、オフセットの同期性、
連続性、調波性を算出する。
【0166】図6は本実施例における特徴量の算出手段
1007の詳細図である。1301はピッチの評価測度
の算出手段、1302はオンセットの評価測度の算出手
段、1303はオフセットの評価測度の算出手段、13
04は連続性の評価測度の算出手段、1305は調波性
の評価測度の算出手段、1306はオンセットの同期性
の評価測度の算出手段、1307はオフセットの同期性
の評価測度の算出手段である。また、評価測度としてS
ig(t+kT,fm)で各特徴量が存在する確からし
さを用いる。
【0167】以下で前記特徴量の評価測度の算出手段に
ついて詳細に説明する。ピッチの評価測度の算出手段1
301において、fp(kT)に対しピッチが存在しう
る範囲を確率的に定義しSig(kT,fm)がピッチ
である確からしさを算出する。図7はピッチが存在しう
る周波数の確率分布の一例である。fp(kT)に対し
てピッチが存在する確からしさがガウス分布をするとす
るとSig(kT,fm)にピッチが存在する確からし
さRel_pitch(kT,fm)は(数9)によって与え
られる。
【0168】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。
【0169】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。オンセットの評価測度の算出手段1302ではこ
の変化が一つの音の時間変化ではなく図9(b)のよう
に異なるもう一つの信号が加わったために起こったもの
であるという確からしさを人間の知覚に基づき定めこれ
をオンセットの確からしさとする。前記オンセットの確
からしさは前記第3の記憶手段1006の出力によって
算出される。以下に算出方法の一つの例を挙げる。心理
学的に連続にきこえるか新たに音が加わったかという判
断基準が丁度変化する音の大きさが調べられている(19
94年日本音響学会秋期研究発表会稿論集2-7-18)。前記
エネルギーの算出手段1005の出力を用いて現観測時
刻のエネルギーとそれより前の時刻までのエネルギーの
平均から前記オンセットの確からしさを定める。図10
はオンセットの確からしさの算出方法のための説明図で
ある。前記前時刻までのエネルギーの平均は、現観測周
波数とその周波数に近接する2つの周波数帯域における
約200ms区間(16個のセグメント)のセグメント
の平均とする。Sig(kT,fm)の前記オンセット
の確からしさRel_on(EDif)は(数10)で算出さ
れる。
【0170】図11は(数10)を図式化したものであ
る。前記オンセットの確からしさはピッチ帯域でオンセ
ットが検出されるまでピッチ帯域でのみ計算される。図
12及び図13は図8の信号に対する前記オンセットの
確からしさを説明する説明図である。図12において時
刻k=2でピッチ帯域の前記オンセットの確からしさが
1.0となり閾値0.8を越えたので時刻k=2から全
周波数帯域で前記オンセットの確からしさの計算を始め
る。(k,m)=(2,1)と(2,3)で前記オンセ
ットの確からしさ1.0が算出できたとする。この時、
図13のように(k,m)=(2,1)と(2,3)に
前記オンセットの確からしさ1.0を割り当てる。
【0171】オフセットの評価測度の算出手段1303
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記エネルギーの算出手段1005の出
力を用いてオフセットを定める。前記オフセットの確か
らしさRel_off(EDif)は前記オンセットの確から
しさの算出方法と同様に(数11)で与えられる。
【0172】オフセットの確からしさはオンセットが検
出されてからピッチ帯域でオフセットが検出されるまで
ピッチ周波数帯域のみ計算される。図14及び図15は
図8の信号に対する前記オフセットの確からしさを説明
する説明図である。図14において時刻k=6でピッチ
帯域の前記オフセットの確からしさが1.0となりある
閾値0.9を越えたので時刻k=6において前記オフセ
ットの確からしさを全周波数帯域について算出する。
(k,m)=(6,1)と(6,3)で前記オフセット
の確からしさ1.0を算出できたとすると図16のよう
に前記オフセットの確からしさを割り当てる。
【0173】連続性の評価測度の算出手段1304で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段1006の出力に
よって算出される。図16は連続性の確からしさの算出
方法のための説明図である。図16において、現観測時
刻を含む現観測時刻以前約200ms区間(16個のセ
グメント)の現観測セグメントのエネルギーの平均と現
観測周波数とその周波数に隣接する2つの周波数帯域に
おける現観測時刻を含まない現観測時刻より前の約20
0ms区間(16個のセグメント)のエネルギーの平均
から前記連続性の確からしさを決定する。前記連続性の
確からしさRel_con(EDif)は(数12)で定義す
る。
【0174】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき、時刻k=3から5までの
間前記連続性の確からしさが計算され、各(k,m)で
の連続性の確からしさが図18のように算出される。
【0175】調波性の評価測度の算出手段1305で
は、Sig(t+kT,fm)がfp(kT)に対して知
覚上調波関係である確からしさをもって調波性の確から
しさとする。ピッチの整数倍の周波数区間を中心に主観
的に調波性を感じる周波数分布を人間の心理測定関数か
ら定める。心理測定関数は電子情報通信学会論文誌'94/
5Vol.J77-ANo.5 731-740に掲載のデータを参考に決め
る。周波数帯域の中心周波数fmでのピッチfp(kT)
のp倍(pは整数)の周波数からのずれuが(数13)
で求められる。
【0176】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。
【0177】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。
【0178】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5 731-740掲載のデー
タを参考に前記同期性の確からしさの分布Rel_sync
(kT,fm)を(数15)で定義する。Sig(t+
kT,fm)でオンセットが検出されたときそれと最も
近いピッチのオンセット時刻の差をv(ms)とする
と、前記オンセットの同期性の確からしさRel_sync
(kT,fm)は、(数15)で記述できる。
【0179】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。
【0180】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。
【0181】図3の重み値の算出手段1008では、評
価関数に各特徴(ピッチ、オンセット、オフセット、オ
ンセットの同期性、オフセットの同期性、調波性、連続
性)についての確からしさを入力し、Sig(t+k
T,fm)での重み値w(t+kT,fm)を算出する。
【0182】前記各特徴量のうち継時的確からしさに関
するものと周波数的確からしさに関するものに分類しそ
れぞれの確からしさの統合を行う。前記オンセットの確
からしさ、前記オンセットの同期性の確からしさ、前記
オフセットの確からしさ、前記オフセットの同期性の確
からしさ、前記パワーの連続性の確からしさを統合して
前記継時的確からしさとする。また、前記ピッチの確か
らしさ、前記ピッチの変動の範囲の確からしさ、前記調
波性の確からしさを統合して前記周波数的確からしさと
する。
【0183】図29は評価値の計算に関する流れ図であ
る。オンセットが検出された時刻では前記継時的確から
しさは前記オンセットの確からしさと前記同期性の確か
らしさの積で与えられ(数21)で算出される。
【0184】
【数21】
【0185】オンセットが検出された後オフセットが検
出されるまでの時間では、前記継時的確からしさRel
_t(kT,fm)は前時刻の前記継時的確からしさと前
時刻との前記連続性の確からしさとの積で与えられ(数
22)で算出される。
【0186】
【数22】
【0187】図30は前記継時的確からしさの分布の一
例である。また前記周波数的確からしさRel_f(k
T,fm)は(数23)で表現できる。
【0188】
【数23】
【0189】前記継時的確からしさと前記周波数的確か
らしさの重視度をg_t(kT,fm),g_f(kT,
m)とする。
【0190】本実施例では評価関数にλ−ファジィ積分
を用いる。このとき、総合評価値w(kT,fm)は
(数24)で計算できる。
【0191】
【数24】
【0192】図31は総合評価値の算出結果の一例であ
る。ただし、g_t(kT,fm)=g_f(kT,fm)、
λ=0である。
【0193】図3の乗算手段1009はSig(t+k
T,fm)と前記評価値w(kT,fm)を乗算する。前
記乗算手段190の出力は第4の記憶手段1010に格
納される。総和手段1011は全てのk,mについてw
(kT,fm)×Sig(t+kT,fm)を総和する。
前記総和手段1011の出力は雑音が抑制された音響信
号となっている。
【0194】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量以外の特徴量を新たに組
み合わせてもよい。また、前記信号の時間分割手段10
00の時間幅δtや分割の時間周期Tは前記δt=13
ms、T=26msに限ったものではなく、形状もハニ
ング窓に限ったものではない。また、前記ピッチ抽出手
段1001はケプストラム法、自己相関法に限ったもの
ではない。また、前記周波数帯域分割フィルタ1003
の周波数帯域は20Hzに限ったものではない。また、
前記オンセットの確からしさの閾値は0.8に限らな
い。また、前記オフセットの確からしさの閾値は0.9
に限らない。また、前記オンセットの確からしさの算出
方法は(数7)に限らない。また、前記オフセットの確
からしさの算出方法は(数11)に限らない。また、前
記連続性の確からしさの算出方法は(数12)に限らな
い。また、前記調波性の確からしさの算出方法は(数1
3)および(数14)に限らない。また、オンセットの
同期性の確からしさの算出方法やオフセットの同期性の
確からしさの算出方法は(数15)に限らない。また、
総合評価値の算出方法はλ−ファジィ積分に限らず、菅
野積分、ショケ積分、逆菅野積分など他の手段でもよ
い。
【0195】なお、実施例9のように、前記周波数帯域
分割フィルタ1003はフーリエ変換をもちいてもよ
く、またエネルギーの算出手段1006は実効値算出手
段をもちいてもよい。
【0196】(実施例7)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。
【0197】第7の実施例における主たる構成図は図3
である。以上のように構成された雑音抑制装置の動作に
ついて説明する。信号の時間分割手段1000は音響信
号を時間T毎にδtの時間セグメントに分割する。入力
信号が音声信号であるので、δtは13ms、Tは26
msとする。前記信号の時間分割手段1000の形状は
ハニング窓とすると、前記信号の時間分割手段W(t+
kT)は(数1)で表すことができる。
【0198】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とすると、S
ig(t+kT)は(数2)で表される。
【0199】ピッチ抽出手段1001は複数の抽出方法
を用いてSig(t+kT)のピッチを抽出する。図2
4は前記ピッチ抽出手段1001の詳細図である。図2
4において、3810は第1のピッチ抽出手段、382
0は第2のピッチ抽出手段、3830はピッチの推定値
p(t)の算出手段である。第1のピッチ抽出手段3
810によってピッチfp1(kT)が、第2のピッチ抽
出手段3820によってピッチfp2(kT)が計算され
たとする。このとき、ピッチの推定値fp(t)の算出
手段3830によって、ピッチの推定値fp(kT)は
(数8)で求められる。
【0200】図3において、第1の記憶手段1002
は、前記ピッチ抽出手段1001で求められたfp1(k
T)とfp2(kT)とfp(kT)を格納する。
【0201】また、周波数帯域分割フィルタ1003は
Sig(t+kT)を20Hzの周波数帯域にN分割す
る。周波数帯域分割フィルタ1003の出力をSig
(t+kT,fm)と記述する(m=1,2,・・・・
N)。fmは帯域の中心周波数である。N個の狭帯域信
号Sig(t+kT,fm)は、第2の記憶手段100
4に格納される。エネルギー算出手段1005では各S
ig(t+kT,fm)のエネルギーを算出する。前記
エネルギー算出手段1005のN個の出力をEne(k
T,fm)と記述する。Ene(kT,fm)は(数3)
で算出される。
【0202】前記N個のEne(kT,fm)は第3の
記憶手段1006に格納される。特徴量の算出手段10
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では、特徴量として、ピッチ、オンセット、オ
ンセットの同期性、オフセット、オフセットの同期性、
連続性、調波性を算出する。
【0203】図6は図本実施例の特徴量の算出手段10
07の詳細図である。1301はピッチの評価測度の算
出手段、1302はオンセットの評価測度の算出手段、
1303はオフセットの評価測度の算出手段、1304
は連続性の評価測度の算出手段、1305は調波性の評
価測度の算出手段、1306はオンセットの同期性の評
価測度の算出手段、1307はオフセットの同期性の評
価測度の算出手段である。また、評価測度としてSig
(t+kT,fm)で各特徴量が存在する確からしさを
用いる。以下で各特徴量の評価測度の算出手段について
詳細に説明する。
【0204】ピッチの評価測度の算出手段は前記ピッチ
抽出手段1001で計算されたfp1(kT)とfp2(k
T)の差からピッチfp(kT)の確からしさを決定す
る。fp1(kT)とfp2(kT)の差が0の時ピッチは
正確に抽出されたとしピッチfp(kT)の確からしさ
は1とする。fp1(kT)とfp2(kT)の差が大きく
なると確からしさは減少する。ピッチの確からしさが図
25のようにfp1(kT)−fp2(kT)の値によって
ガウス分布するとするとピッチの確からしさRel(f
p1(kT)−fp2(kT))が(数17)で決定され
る。
【0205】同時に、図26のように、得られたピッチ
の推定値fp(kT)に対しあるピッチが存在しうる範
囲を確率的に定義しSig(kT,fm)がピッチであ
る確からしさを算出する。ピッチの推定値fp(kT)
に対してピッチが存在する確からしさがガウス分布をす
るとするとSig(kT,fm)にピッチが存在する確
からしさRel_pitch(kT,fm)は(数9)で与え
られる。
【0206】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。
【0207】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。前記オンセットの評価測度の算出手段1302で
はこの変化が一つの音の時間変化ではなく図9(b)の
ように異なるもう一つの信号が加わったために起こった
ものであるという確からしさを人間の知覚に基づき定め
これをオンセットの確からしさとする。前記オンセット
の確からしさは前記第3の記憶手段1006の出力によ
って算出される。以下に算出方法の一つの例を挙げる。
心理学的に連続にきこえるか新たに音が加わったかとい
う判断基準が丁度変化する音の大きさが調べられている
(1994年日本音響学会秋期研究発表会稿論集2-7-18)。
前記エネルギー算出手段1005の出力を用いて現観測
時刻のエネルギーとそれより前の時刻までのエネルギー
の平均から前記オンセットの確からしさを定める。図1
0はオンセットの確からしさの算出方法のための説明図
である。前記前時刻までのエネルギーの平均は現観測周
波数とその周波数に近接する2つの周波数帯域における
約200ms区間(16個のセグメント)のセグメント
の平均とする。Sig(kT,fm)の前記オンセット
の確からしさRel_on(EDif)は(数10)で算出さ
れる。
【0208】図11は(数10)を図式化したものであ
る。オンセットの確からしさはピッチ帯域でオンセット
が検出されるまでピッチ帯域でのみ計算される。図12
及び図13は図8の信号に対する前記オンセットの確か
らしさを説明する説明図である。図12において時刻k
=2でピッチ帯域の前記オンセットの確からしさが1.
0となり閾値0.8を越えたので時刻k=2から全周波
数帯域で前記オンセットの確からしさの計算を始める。
(k,m)=(2,1)と(2,3)で前記オンセット
の確からしさ1.0が算出できたとする。この時、図1
3のように(k,m)=(2,1)と(2,3)に前記
オンセットの確からしさ1.0を割り当てる。
【0209】オフセットの評価測度の算出手段1303
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記エネルギーの算出手段1005の出
力を用いてオフセットを定める。前記オフセットの確か
らしさRel_off(EDif)は前記オンセットの確から
しさの算出方法と同様に(数11)で与えられる。
【0210】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図14及び図1
5は図8の信号に対する前記オフセットの確からしさを
説明する説明図である。図14において時刻k=6でピ
ッチ帯域の前記オフセットの確からしさが1.0となり
ある閾値0.9を越えたので時刻k=6において前記オ
フセットの確からしさを全周波数帯域について算出す
る。(k,m)=(6,1)と(6,3)で前記オフセ
ットの確からしさ1.0を算出できたとすると図15の
ように前記オフセットの確からしさを割り当てる。
【0211】連続性の評価測度の算出手段1304で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段1006の出力に
よって算出される。図16は連続性の確からしさの算出
方法のための説明図である。図16において、現観測時
刻を含む現観測時刻以前約200ms区間(16個のセ
グメント)の現観測セグメントのエネルギーの平均と現
観測周波数とその周波数に隣接する2つの周波数帯域に
おける現観測時刻を含まない現観測時刻より前の約20
0ms区間(16個のセグメント)のエネルギーの平均
から前記連続性の確からしさを決定する。前記連続性の
確からしさRel_con(EDif)は(数12)で定義す
る。
【0212】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき、時刻k=3から5までの
間前記連続性の確からしさが計算され、各(k,m)で
の連続性の確からしさが図18のように算出される。
【0213】調波性の評価測度の算出手段1305で
は、Sig(t+kT,fm)がfp(kT)に対して知
覚上調波関係である確からしさをもって調波性の確から
しさとする。ピッチの整数倍の周波数区間を中心に主観
的に調波性を感じる周波数分布を人間の心理測定関数か
ら定める。心理測定関数は電子情報通信学会論文誌'94/
5Vol.J77-ANo.5 731-740に掲載のデータを参考に決め
る。周波数帯域の中心周波数fmでの前記ピッチfp(k
T)のp倍(pは整数)の周波数からのずれuが(数1
3)で求められる。
【0214】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。
【0215】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。
【0216】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5731-740に掲載のデー
タを参考に前記同期性の確からしさの分布Rel_sync
(kT,fm)を(数15)で定義する。Sig(t+
kT,fm)でオンセットが検出されたときそれと最も
近いピッチのオンセット時刻の差をv(ms)とすると
前記オンセットの同期性の確からしさRel_sync(k
T,fm)は(数15)で記述できる。
【0217】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。
【0218】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。
【0219】図3の重み値の算出手段1008では、評
価関数に各特徴(ピッチ、オンセット、オフセット、オ
ンセットの同期性、オフセットの同期性、調波性、連続
性)についての確からしさを入力し、Sig(t+k
T,fm)での重み値w(t+kT,fm)を算出する。
前記各特徴量のうち継時的確からしさに関するものと周
波数的確からしさに関するものに分類しそれぞれの確か
らしさの統合を行う。前記オンセットの確からしさ、前
記オンセットの同期性の確からしさ、前記オフセットの
確からしさ、前記オフセットの同期性の確からしさ、前
記パワーの連続性の確からしさを統合して前記継時的確
からしさとする。また、前記ピッチの確からしさ、前記
ピッチの変動の範囲の確からしさ、前記調波性の確から
しさを統合して前記周波数的確からしさとする。
【0220】図29は評価値の計算に関する流れ図であ
る。オンセットが検出された時刻では前記継時的確から
しさは前記オンセットの確からしさと前記同期性の確か
らしさの積で与えられ(数21)で算出される。
【0221】オンセットが検出された後オフセットが検
出されるまでの時間では、前記継時的確からしさRel
_t(kT,fm)は前時刻の前記継時的確からしさと前
時刻との前記連続性の確からしさとの積で与えられ(数
22)で算出される。
【0222】図30は前記継時的確からしさの分布の一
例である。また前記周波数的確からしさRel_f(k
T,fm)は(数23)で表現できる。
【0223】前記継時的確からしさと前記周波数的確か
らしさの重視度をg_t(kT,fm),g_f(kT,
m)とする。
【0224】本実施例では、評価関数にλ−ファジィ積
分を用いる。このとき、総合評価値w(kT,fm)は
(数24)で計算できる。
【0225】図31は総合評価値の算出結果の一例であ
る。ただし、g_t(kT,fm)=g_f(kT,fm)、
λ=0である。
【0226】図3の乗算手段1009はSig(t+k
T,fm)と前記評価値w(kT,fm)を乗算する。前
記乗算手段190の出力は第4の記憶手段1010に格
納される。総和手段1011は全てのk,mについて、
w(kT,fm)×Sig(t+kT,fm)を総和す
る。前記総和手段1011の出力は雑音が抑制された音
響信号となっている。
【0227】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量以外の特徴量を新たに組
み合わせてもよい。また、前記信号の時間分割手段10
00の時間幅δtや分割の時間周期Tは前記δt=13
ms、T=26msに限ったものではなく、形状もハニ
ング窓に限ったものではない。また、前記ピッチ抽出手
段1001は、ケプストラム法、自己相関法に限ったも
のではない。また、前記周波数帯域分割フィルタ100
3の周波数帯域は20Hzに限ったものではない。ま
た、前記オンセットの確からしさの閾値は0.8に限ら
ない。また、前記オフセットの確からしさの閾値は0.
9に限らない。また、前記オンセットの確からしさの算
出方法は(数10)に限らない。また、前記オフセット
の確からしさの算出方法(数11)に限らない。また前
記連続性の確からしさの算出方法は(数12)に限らな
い。また、前記調波性の確からしさの算出方法は(数1
3)(数14)に限らない。またオンセットの同期性の
確からしさの算出方法やオフセットの同期性の確からし
さの算出方法は(数15)に限らない。
【0228】なお、実施例9のように、前記周波数帯域
フィルタ1003はフーリエ変換をもちいてもよく、ま
たエネルギーの算出手段1006は実効値算出手段をも
ちいてもよい。
【0229】(実施例8)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。
【0230】第8の実施例における主たる構成図は図3
である。以上のように構成された雑音抑制装置の動作に
ついて説明する。信号の時間分割手段1000は音響信
号を時間T毎にδtの時間セグメントに分割する。入力
信号が音声信号であるので、δtは13ms、Tは26
msとする。前記信号の時間分割手段1000の形状は
ハニング窓とすると、前記信号の時間分割手段W(t+
kT)は(数1)で表すことができる。
【0231】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とすると、S
ig(t+kT)は(数2)で表される。
【0232】ピッチ抽出手段1001は複数の抽出方法
を用いてSig(t+kT)のピッチを抽出する。図5
は前記ピッチ抽出手段1001の詳細図である。図5に
おいて、1200は第1のピッチ抽出手段、1201は
第2のピッチ抽出手段、1202は第nのピッチ抽出手
段、1203はピッチの推定値fp(t)の算出手段で
ある。第1のピッチ抽出手段1200によってピッチf
p1(kT)が、第2のピッチ抽出手段1201によって
ピッチfp2(kT)が、第nのピッチ抽出手段1202
によってピッチfpn(kT)が計算されたとする。この
とき、ピッチの推定値fp(t)の算出手段1203に
よって、ピッチの推定値fp(kT)は(数8)で求め
られる。
【0233】また、fp1(kT)からfpn(kT)の分
散Vpitch(kT)を(数18)で求める。
【0234】図3において、第1の記憶手段1002は
前記ピッチ抽出手段1001で求められたfp(kT)
と分散Vpitch(kT)を格納する。
【0235】また、周波数帯域分割フィルタ1003は
Sig(t+kT)を20Hzの周波数帯域にN分割す
る。前記周波数帯域分割フィルタ1003の出力をSi
g(t+kT,fm)と記述する(m=1,2,・・・
・N)。fmは帯域の中心周波数である。N個の狭帯域
信号Sig(t+kT,fm)は第2の記憶手段100
4に格納される。エネルギー算出手段1005では各S
ig(t+kT,fm)のエネルギーを算出する。前記
エネルギー算出手段1005のN個の出力をEne(k
T,fm)と記述する。Ene(kT,fm)は(数3)
で算出される。
【0236】前記N個のEne(kT,fm)は第3の
記憶手段1006に格納される。特徴量の算出手段10
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では特徴量としてピッチ、オンセット、オンセ
ットの同期性、オフセット、オフセットの同期性、連続
性、調波性を算出する。
【0237】図6は図3の特徴量の算出手段1007の
詳細図である。1301はピッチの評価測度の算出手
段、1302はオンセットの評価測度の算出手段、13
03はオフセットの評価測度の算出手段、1304は連
続性の評価測度の算出手段、1305は調波性の評価測
度の算出手段、1306はオンセットの同期性の評価測
度の算出手段、1307はオフセットの同期性の評価測
度の算出手段である。また、評価測度としてSig(t
+kT,fm)で各特徴量が存在する確からしさを用い
る。
【0238】以下で各特徴量の評価測度の算出手段につ
いて詳細に説明する。前記ピッチの評価測度の算出手段
は、前記ピッチ抽出手段1001で計算された分散V
pitch(kT)から推定されたピッチfp(kT)の確か
らしさを決定する。Vpitch(kT)が0の時ピッチは
正確に抽出されたとしピッチfp(kT)の確からしさ
は1とする。Vpitch(kT)が大きくなると確からし
さは減少する。ピッチの確からしさが図27のようにV
pitch(kT)の値によってガウス分布するとすると、
ピッチの確からしさRel(Vpitch(kT))が(数
19)で決定される。
【0239】同時に、図28のように得られたピッチの
推定値fp(kT)に対しあるピッチが存在しうる範囲
を確率的に定義しSig(kT,fm)がピッチである
確からしさを算出する。ピッチの推定値fp(kT)に
対してピッチが存在する確からしさがガウス分布をする
とするとSig(kT,fm)にピッチが存在する確か
らしさRel_pitch(kT,fm)は(数20)で与え
られる。
【0240】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。
【0241】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。オンセットの評価測度の算出手段1302ではこ
の変化が一つの音の時間変化ではなく図9(b)のよう
に異なるもう一つの信号が加わったために起こったもの
であるという確からしさを人間の知覚に基づき定めこれ
をオンセットの確からしさとする。前記オンセットの確
からしさは前記第3の記憶手段1006の出力によって
算出される。以下に算出方法の一つの例を挙げる。心理
学的に連続にきこえるか新たに音が加わったかという判
断基準が丁度変化する音の大きさが調べられている(19
94年日本音響学会秋期研究発表会稿論集2-7-18)。前記
エネルギー算出手段1005の出力を用いて現観測時刻
のエネルギーとそれより前の時刻までのエネルギーの平
均から前記オンセットの確からしさを定める。図10は
オンセットの確からしさの算出方法のための説明図であ
る。前記前時刻までのエネルギーの平均は現観測周波数
とその周波数に近接する2つの周波数帯域における約2
00ms区間(16個のセグメント)のセグメントの平
均とする。Sig(kT,fm)の前記オンセットの確
からしさRel_on(EDif)は(数10)で算出され
る。
【0242】図11は(数10)を図式化したものであ
る。前記オンセットの確からしさはピッチ帯域でオンセ
ットが検出されるまでピッチ帯域でのみ計算される。図
12及び図13は図8の信号に対する前記オンセットの
確からしさを説明する説明図である。図12において時
刻k=2でピッチ帯域の前記オンセットの確からしさが
1.0となり閾値0.8を越えたので時刻k=2から全
周波数帯域で前記オンセットの確からしさの計算を始め
る。(k,m)=(2,1)と(2,3)で前記オンセ
ットの確からしさ1.0が算出できたとする。この時、
図13のように(k,m)=(2,1)と(2,3)に
前記オンセットの確からしさ1.0を割り当てる。
【0243】オフセットの評価測度の算出手段1303
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記エネルギーの算出手段1005の出
力を用いてオフセットを定める。前記オフセットの確か
らしさRel_off(EDif)は前記オンセットの確から
しさの算出方法と同様に(数11)で与えられる。
【0244】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図214及び図
15は図8の信号に対する前記オフセットの確からしさ
を説明する説明図である。
【0245】図14において時刻k=6でピッチ帯域の
前記オフセットの確からしさが1.0となりある閾値
0.9を越えたので時刻k=6において前記オフセット
の確からしさを全周波数帯域について算出する。(k,
m)=(6,1)と(6,3)で前記オフセットの確か
らしさ1.0を算出できたとすると図15のように前記
オフセットの確からしさを割り当てる。
【0246】連続性の評価測度の算出手段1304で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段1006の出力に
よって算出される。図16は連続性の確からしさの算出
方法のための説明図である。図16において、現観測時
刻を含む現観測時刻以前約200ms区間(16個のセ
グメント)の現観測セグメントのエネルギーの平均と現
観測周波数とその周波数に隣接する2つの周波数帯域に
おける現観測時刻を含まない現観測時刻より前の約20
0ms区間(16個のセグメント)のエネルギーの平均
から前記連続性の確からしさを決定する。前記連続性の
確からしさRel_con(EDif)は(数12)で定義す
る。
【0247】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき、時刻k=3から5までの
間前記連続性の確からしさが計算され、各(k,m)で
の連続性の確からしさが図18のように算出される。
【0248】調波性の評価測度の算出手段1305で
は、Sig(t+kT,fm)が前記fp(kT)に対し
て知覚上調波関係である確からしさをもって調波性の確
からしさとする。ピッチの整数倍の周波数区間を中心に
主観的に調波性を感じる周波数分布を人間の心理測定関
数から定める。心理測定関数は電子情報通信学会論文
誌'94/5Vol.J77-ANo.5 731-740に掲載のデータを参考
に決める。周波数帯域の中心周波数fmでの前記ピッチ
p(kT)のp倍(pは整数)の周波数からのずれu
が(数13)で求められる。
【0249】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。
【0250】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。
【0251】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5 731-740に掲載のデ
ータを参考に前記同期性の確からしさの分布Rel_syn
c(kT,fm)を(数15)で定義する。Sig(t+
kT,fm)でオンセットが検出されたときそれと最も
近いピッチのオンセット時刻の差をv(ms)とする
と、前記オンセットの同期性の確からしさRel_sync
(kT,fm)は、(数15)で記述できる。
【0252】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。
【0253】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。
【0254】図3の重み値の算出手段1008では、評
価関数に各特徴(ピッチ、オンセット、オフセット、オ
ンセットの同期性、オフセットの同期性、調波性、連続
性)についての確からしさを入力し、Sig(t+k
T,fm)での重み値w(t+kT,fm)を算出する。
【0255】各特徴量のうち継時的確からしさに関する
ものと周波数的確からしさに関するものに分類しそれぞ
れの確からしさの統合を行う。前記オンセットの確から
しさ、前記オンセットの同期性の確からしさ、前記オフ
セットの確からしさ、前記オフセットの同期性の確から
しさ、前記パワーの連続性の確からしさを統合して前記
継時的確からしさとする。また、前記ピッチの確からし
さ、前記ピッチの変動の範囲の確からしさ、前記調波性
の確からしさを統合して前記周波数的確からしさとす
る。
【0256】図29は評価値の計算に関する流れ図であ
る。オンセットが検出された時刻では前記継時的確から
しさは前記オンセットの確からしさと前記同期性の確か
らしさの積で与えられ(数21)で算出される。
【0257】オンセットが検出された後オフセットが検
出されるまでの時間では前記継時的確からしさRel_t
(kT,fm)は前時刻の前記継時的確からしさと前時
刻との前記連続性の確からしさとの積で与えられ(数2
2)で算出される。
【0258】図4400は前記継時的確からしさの分布
の一例である。また前記周波数的確からしさRel
_f(kT,fm)は(数23)で表現できる。
【0259】前記継時的確からしさと前記周波数的確か
らしさの重視度をg_t(kT,fm),g_f(kT,
m)とする。
【0260】本実施例では、評価関数にλ−ファジィ積
分を用いる。このとき、総合評価値w(kT,fm)は
(数24)で計算できる。
【0261】図31は総合評価値の算出結果の一例であ
る。ただし、g_t(kT,fm)=g_f(kT,fm)、
λ=0である。
【0262】図3の乗算手段1009はSig(t+k
T,fm)と前記評価値w(kT,fm)を乗算する。前
記乗算手段1009の出力は第4の記憶手段1010に
格納される。総和手段1011は全てのk,mについ
て、w(kT,fm)×Sig(t+kT,fm)を総和
する。前記総和手段1011の出力は雑音が抑制された
音響信号となっている。
【0263】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量以外の特徴量を新たに組
み合わせてもよい。また、前記ピッチ抽出手段1001
はケプストラム法、自己相関法に限ったものではない。
また、前記周波数帯域分割フィルタ1003の周波数帯
域は20Hzに限ったものではない。また、前記オンセ
ットの確からしさの閾値は0.8に限らない。また、前
記オフセットの確からしさの閾値は0.9に限らない。
また、前記オンセットの確からしさの算出方法は(数1
0)に限らない。また、前記オフセットの確からしさの
算出方法は(数11)に限らない。また、前記調波性の
確からしさの算出方法は(数13)(数14)に限らな
い。また、オンセットの同期性の確からしさの算出方法
やオフセットの同期性の確からしさの算出方法は(数1
5)に限らない。また、ピッチが存在する確からしさの
算出においてガウス分布以外の分布で定義してもよい。
【0264】なお、実施例9のように、前記周波数帯域
フィルタ1003はフーリエ変換をもちいてもよく、ま
たエネルギーの算出手段1006は実効値算出手段を用
いてもよい。
【0265】(実施例9)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。
【0266】図32は本発明の第9の実施例における雑
音抑制装置の構成を示す構成図である。図32におい
て、9000は信号の時間切り出しを行う信号の時間分
割手段、9001はピッチ抽出手段、9002は第1の
記憶手段、9003はフーリエ変換手段、9004は第
2の記憶手段、9005は実効値算出手段、9006は
第3の記憶手段、9007は特徴量の算出手段、900
8は重み値の算出手段、9009は乗算手段、9010
はフーリエ逆変換手段、9011は第4の記憶手段、9
012は総和手段である。
【0267】以上のように構成された雑音抑制装置の動
作について説明する。信号の時間分割手段9000は音
響信号を時間T毎にδtの時間セグメントに分割する。
入力信号が音声信号であるので、δtは13ms、Tは
26msとする。前記信号の時間分割手段9000の形
状はハニング窓とすると、前記信号の時間分割手段W
(t+kT)は(数1)で表すことができる。
【0268】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とすると、S
ig(t+kT)は(数2)で表される。
【0269】ピッチ抽出手段9001はSig(t+k
T)のピッチを抽出する。ピッチは、ケプストラム法、
自己相関法などを用いて抽出される。第1の記憶手段9
002は前記ピッチ抽出手段9001で求められたピッ
チfp(kT)を格納する。また、フーリエ変換手段9
003はSig(t+kT)をフーリエ変換する。この
時の周波数分解能は20Hzとする。前記フーリエ変換
手段9003の出力をSig(t+kT,fm)と記述
する(m=1,2,・・・・N)。fmは周波数であ
る。N個の周波数サンプル点Sig(t+kT,fm
は、第2の記憶手段9004に格納される。実効値算出
手段9005では、各Sig(t+kT,f m)の実効
値を算出する。前記実効値算出手段9005のN個の出
力をEne(kT,fm)と記述する。Ene(kT,
m)は(数25)で算出される。
【0270】
【数25】
【0271】前記N個のEne(kT,fm)は第3の
記憶手段9006に格納される。特徴量の算出手段90
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では特徴量としてピッチ、オンセット、オンセ
ットの同期性、オフセット、オフセットの同期性、連続
性、調波性を算出する。
【0272】
【数26】
【0273】図5は本実施例の特徴量の算出手段900
7の詳細図である。1201はピッチの評価測度の算出
手段、1202はオンセットの評価測度の算出手段、1
203はオフセットの評価測度の算出手段、1204は
連続性の評価測度の算出手段、1205は調波性の評価
測度の算出手段、1206はオンセットの同期性の評価
測度の算出手段、1207はオフセットの同期性の評価
測度の算出手段、また、評価測度としてSig(t+k
T,fm)で各特徴量が存在する確からしさを用いる。
以下で各特徴量の評価測度の算出手段について詳細に説
明する。
【0274】ピッチの評価測度の算出手段1201にお
いて、fp(kT)に対しピッチが存在しうる範囲を確
率的に定義しSig(kT,fm)がピッチである確か
らしさを算出する。図7はピッチが存在しうる周波数の
確率分布の一例である。前記fp(kT)に対してピッ
チが存在する確からしさがガウス分布をするとすると前
記Sig(kT,fm)にピッチが存在する確からしさR
el_pitch(kT,fm)は(数9)によって与えられ
る。
【0275】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。
【0276】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。前記オンセットの評価測度の算出手段1202で
はこの変化が一つの音の時間変化ではなく図9(b)の
ように異なるもう一つの信号が加わったために起こった
ものであるという確からしさを人間の知覚に基づき定め
これをオンセットの確からしさとする。前記オンセット
の確からしさは第3の記憶手段9006の出力によって
算出される。以下に算出方法の一つの例を挙げる。心理
学的に連続にきこえるか新たに音が加わったかという判
断基準が丁度変化する音の大きさが調べられている(19
94年日本音響学会秋期研究発表会稿論集2-7-18)。実効
値算出手段9005の出力を用いて現観測時刻の実効値
とそれより前の時刻までの実効値の平均から前記オンセ
ットの確からしさを定める。図10はオンセットの確か
らしさの算出方法のための説明図である。前記前時刻ま
での実効値の平均は、現観測周波数とその周波数に近接
する2つの周波数帯域における約200ms区間(16
個のセグメント)のセグメントの平均とする。Sig
(kT,fm)の前記オンセットの確からしさRel_on
(EDif)は(数10)で算出される。
【0277】図11は(数10)を図式化したものであ
る。オンセットの確からしさはピッチ帯域でオンセット
が検出されるまでピッチ帯域でのみ計算される。図12
及び図13は図8の信号に対する前記オンセットの確か
らしさを説明する説明図である。図12において時刻k
=2でピッチ帯域の前記オンセットの確からしさが1.
0となり閾値0.8を越えたので時刻k=2から全周波
数帯域で前記オンセットの確からしさの計算を始める。
(k,m)=(2,1)と(2,3)で前記オンセット
の確からしさ1.0が算出できたとする。この時図27
00のように(k,m)=(2,1)と(2,3)に前
記オンセットの確からしさ1.0を割り当てる。
【0278】オフセットの評価測度の算出手段1203
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記実効値の算出手段9005の出力を
用いてオフセットを定める。前記オフセットの確からし
さRel_off(EDif)は前記オンセットの確からしさの算
出方法と同様に(数11)で与えられる。
【0279】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図14及び図1
5は図8の信号に対する前記オフセットの確からしさを
説明する説明図である。図14において時刻k=6でピ
ッチ帯域の前記オフセットの確からしさが1.0となり
ある閾値0.9を越えたので時刻k=6において前記オ
フセットの確からしさを全周波数帯域について算出す
る。(k,m)=(6,1)と(6,3)で前記オフセ
ットの確からしさ1.0を算出できたとすると図15の
ように前記オフセットの確からしさを割り当てる。
【0280】連続性の評価測度の算出手段1204で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段9006の出力に
よって算出される。図16は連続性の確からしさの算出
方法のための説明図である。図16において、現観測時
刻を含む現観測時刻以前約200ms区間(16個のセ
グメント)の現観測セグメントの実効値の平均と現観測
周波数とその周波数に隣接する2つの周波数帯域におけ
る現観測時刻を含まない現観測時刻より前の約200m
s区間(16個のセグメント)の実効値の平均から前記
連続性の確からしさを決定する。前記連続性の確からし
さRel_con(EDif)は(数12)で定義する。
【0281】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき、時刻k=3から5までの
間前記連続性の確からしさが計算され、各(k,m)で
の連続性の確からしさが図18のように算出される。
【0282】調波性の評価測度の算出手段1205で
は、Sig(t+kT,fm)がfp(kT)に対して知
覚上調波関係である確からしさをもって調波性の確から
しさとする。ピッチの整数倍の周波数区間を中心に主観
的に調波性を感じる周波数分布を人間の心理測定関数か
ら定める。心理測定関数は電子情報通信学会論文誌'94/
5Vol.J77-ANo.5731-740に掲載のデータを参考に決め
る。周波数帯域の中心周波数fmでの前記ピッチfp(k
T)のp倍(pは整数)の周波数からのずれuが(数1
3)で求められる。
【0283】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。
【0284】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。
【0285】オンセットの同期性の評価測度の算出手段
1206では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5731-740に掲載のデー
タを参考に前記同期性の確からしさの分布Rel_sync
(kT,fm)を(数15)で定義する。Sig(t+
kT,fm)でオンセットが検出されたときそれと最も
近いピッチのオンセット時刻の差をv(ms)とする
と、前記オンセットの同期性の確からしさRel_sync
(kT,fm)は、(数15)で記述できる。
【0286】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。
【0287】オフセットの同期性の評価測度の算出手段
1207は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。
【0288】図32の重み値の算出手段9008では、
評価関数に前記各特徴(ピッチ、オンセット、オフセッ
ト、オンセットの同期性、オフセットの同期性、調波
性、連続性)についての確からしさを入力し、Sig
(t+kT,fm)での重み値w(t+kT,fm)を算
出する。
【0289】各特徴量のうち継時的確からしさに関する
ものと周波数的確からしさに関するものに分類しそれぞ
れの確からしさの統合を行う。前記オンセットの確から
しさ、前記オンセットの同期性の確からしさ、前記オフ
セットの確からしさ、前記オフセットの同期性の確から
しさ、前記パワーの連続性の確からしさを統合して、前
記継時的確からしさとする。また、前記ピッチの確から
しさ、前記ピッチの変動の範囲の確からしさ、前記調波
性の確からしさを統合して、前記周波数的確からしさと
する。
【0290】図29は評価値の計算に関する流れ図であ
る。オンセットが検出された時刻では前記継時的確から
しさは前記オンセットの確からしさと前記同期性の確か
らしさの積で与えられ(数21)で算出される。
【0291】オンセットが検出された後オフセットが検
出されるまでの時間では、前記継時的確からしさRel
_t(kT,fm)は前時刻の前記継時的確からしさと前
時刻との前記連続性の確からしさとの積で与えられ、
(数22)で算出される。
【0292】図30は前記継時的確からしさの分布の一
例である。また前記周波数的確からしさRel_f(k
T,fm)は、(数23)で表現できる。
【0293】前記継時的確からしさと、前記周波数的確
からしさの重視度をg_t(kT,f m),g_f(kT,
m)とする。
【0294】本実施例では、評価関数にλ−ファジィ積
分を用いる。このとき、総合評価値w(kT,fm)は
(数24)で計算できる。
【0295】図31は総合評価値の算出結果の一例であ
る。ただし、g_t(kT,fm)=g_f(kT,fm)、
λ=0である。
【0296】図32の乗算手段9009はSig(t+
kT,fm)と前記評価値w(kT,fm)を乗算する。
前記乗算手段190の出力は、第4の記憶手段9010
に格納される。フーリエ逆変換手段9011は全ての
k,mについて、w(kT,fm)×Sig(t+k
T,fm)をフーリエ逆変換する。前記フーリエ逆変換
手段9011の出力は雑音が抑制された音響信号となっ
ている。
【0297】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量以外の特徴量を新たに組
み合わせてもよい。また。前記信号の時間分割手段90
00の時間幅δtや分割の時間周期Tは前記δt=13
ms、T=26msに限ったものではなく、形状もハニ
ング窓に限ったものではない。また、前記ピッチ抽出手
段9001はケプストラム法、自己相関法に限ったもの
ではない。また、前記フーリエ変換手段9003と前記
フーリエ逆変換手段9010の周波数分解能は20Hz
に限ったものではない。また、前記オンセットの確から
しさの閾値は0.8に限らない。また、前記オンセット
の確からしさの閾値は0.9に限らない。また、前記オ
ンセットの確からしさの算出方法は(数10)に限らな
い。また、前記オフセットの確からしさの算出方法は
(数11)に限らない。また、前記連続性の確からしさ
の算出方法は(数12)に限らない。また、前記調波性
の確からしさの算出方法は(数13)および(数14)
に限らない。また、オンセットの同期性の確からしさの
算出方法やオフセットの同期性の確からしさの算出方法
は(数15)に限らない。また、総合評価値の算出方法
はλ−ファジィ積分に限らず、菅野積分、ショケ積分、
逆菅野積分など他の手段でもよい。
【0298】図33は前記構成によって得られた出力信
号のS/N比と残差を示す図である。図33の(A)は
入力信号のS/N比と残差、(B)はλ=−0.9のと
きのS/N比と残差、(C)はλ=0.9のときのS/
N比と残差である。図10000のように(B)(C)
とも(A)に比べてS/N比が増加し残差が減少してお
り、前記構成の効果が確認できる。
【0299】
【発明の効果】以下のように本発明は、信号の時間分割
手段、ピッチ抽出手段、第1の記憶手段、周波数帯域分
割手段、第2の記憶手段、エネルギーまたは実効値の算
出手段、第3の記憶手段、特徴量の算出手段、重み値の
算出手段、乗算手段、第4の記憶手段、総和手段を設け
ることにより、人間の聴覚が聴感上の雑音抑制のためい
利用している音の物理的な特徴を用いて入力信号の周波
数の重みづけを行うことにより雑音が混在した音響信号
から雑音を抑制することにより目的の音響信号を抽出こ
とができる優れた雑音抑制装置を実現するものである。
【図面の簡単な説明】
【図1】従来例における雑音抑制装置の構成を示すブロ
ック図
【図2】本発明の雑音抑制装置の構成図
【図3】本発明の雑音抑制装置の実施例1及び実施例2
および実施例3および実施例4および実施例5および実
施例6および実施例7および実施例8における構成図
【図4】本発明の雑音抑制装置の実施例1および実施例
2における特徴量の算出手段の一例を示す図
【図5】本発明の雑音抑制装置の実施例2および実施例
5および実施例8および実施例9におけるピッチ抽出手
段の一例を示す図
【図6】本発明の雑音抑制装置の実施例3および実施例
4および実施例5および実施例6および実施例7および
実施例8における特徴量の算出手段の一例を示す図
【図7】本発明の雑音抑制装置の実施例3および実施例
6および実施例9におけるピッチが存在する周波数の確
率分布の一例を示す図
【図8】本発明の雑音抑制装置の実施例3および実施例
4およぴ実施例5および実施例6および実施例7および
実施例8および実施例9における動作の説明のための図
【図9】本発明の雑音抑制装置の実施例3および実施例
4および実施例5および実施例6および実施例7および
実施例8および実施例9においてオンセットである判断
の基準を説明するための音の大きさの変化に対する聴覚
知覚に関する模式図
【図10】本発明の雑音抑制装置の実施例3および実施
例5および実施例6および実施例7および実施例8およ
び実施例9において、オンセットの確からしさの算出方
法の説明図
【図11】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における(数10)を図式化
した図
【図12】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
【図13】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
【図14】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
【図15】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
【図16】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9において、連続性の確からし
さの算出方法の説明図
【図17】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における(数12)を図式化
した図
【図18】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
【図19】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における(数14)を図式化
した図
【図20】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
【図21】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における(数15)を図式化
した図
【図22】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
【図23】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
【図24】本発明の雑音抑制装置の実施例4および実施
例7におけるピッチ抽出手段の一例を示す図
【図25】本発明の雑音抑制装置の実施例4および実施
例7におけるピッチの確からしさの分布の一例を示す図
【図26】本発明の雑音抑制装置の実施例4および実施
例7において、ピッチの推定値に対しピッチが存在する
確率分布の一例を示す図
【図27】本発明の雑音抑制装置の実施例5および実施
例8において、ピッチの推定値に対する確からしさの確
率分布の一例を示す図
【図28】本発明の雑音抑制装置の実施例5および実施
例8において、ピッチの推定値に対しピッチが存在する
確率分布の一例を示す図
【図29】本発明の雑音抑制装置の実施例6および実施
例7および実施例8および実施例9において、評価値の
計算の一例を示す流れ図
【図30】本発明の雑音抑制装置の実施例6および実施
例7および実施例8および実施例9における動作の説明
のための図
【図31】本発明の雑音抑制装置の実施例6および実施
例7および実施例8および実施例9における動作の説明
のための図
【図32】本発明の実施例9における雑音抑制装置の構
成を示す構成図
【図33】本発明の実施例9における雑音抑制装置によ
る効果を示す図
【符号の説明】
1 音声入力用の接話マイク 2 雑音成分信号入力用のセンサマイク 3 ローパスフィルタ 4 ローパスフィルタ 5 バンドパスフィルタバンク 10iから10N 雑音除去回路 11iから11N 位相差検出補正回路 12iから12N レベル差検出補正回路 100 信号の時間分割手段 200 ピッチ抽出手段 300 第1の記憶手段 400 周波数帯域分割手段 500 第2の記憶手段 600 エネルギーまたは実効値の算出手段 700 第3の記憶手段 800 特徴量の算出手段 900 重み値の算出手段 910 乗算手段 920 第4の記憶手段 930 総和手段 3810 第1のピッチ抽出手段 3820 第2のピッチ抽出手段 3830 ピッチの推定値の算出手段 1000 信号の時間分割手段 1001 ピッチ抽出手段 1002 第1の記憶手段 1003 周波数帯域分割フィルタ 1004 第2の記憶手段 1005 エネルギーの算出手段 1006 第3の記憶手段 1007 特徴量の算出手段 1008 重み値の算出手段 1009 乗算手段 1010 第4の記憶手段 1011 総和手段 1101 オンセットの算出手段 1102 オフセットの算出手段 1103 連続性の算出手段 1104 調波性の算出手段 1105 オンセットの同期性の算出手段 1106 オフセットの同期性の算出手段 1200 第1のピッチ抽出手段 1201 第2のピッチ抽出手段 1202 第nのピッチ抽出手段 1203 ピッチの推定値の算出手段 1301 ピッチの評価測度の算出手段 1302 オンセットの評価測度の算出手段 1303 オフセットの評価測度の算出手段 1304 連続性の評価測度の算出手段 1305 調波性の評価測度の算出手段 1306 オンセットの同期性の評価測度の算出手段 1307 オフセットの同期性の評価測度の算出手段 9000 信号の時間分割手段 9001 ピッチ抽出手段 9002 第1の記憶手段 9003 フーリエ変換手段 9004 第2の記憶手段 9005 実効値算出手段 9006 第3の記憶手段 9007 特徴量の算出手段 9008 重み値の算出手段 9009 乗算手段 9010 フーリエ逆変換手段 9011 第4の記憶手段 9012 総和手段

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】音響信号を時間分割する信号の時間分割手
    段と、前記信号の時間分割手段による短時間セグメント
    の信号のピッチを抽出するピッチ抽出手段と、前記ピッ
    チ抽出手段によって求められたピッチを格納する第2の
    記憶手段と、前記信号の時間分割手段の出力信号を複数
    の周波数帯域に分割する周波数帯域分割手段と、前記周
    波数帯域分割手段の出力を格納する第3の記憶手段と、
    前記第3の記憶手段の出力のエネルギーまたは実効値を
    算出するエネルギーまたは実効値算出手段と、前記エネ
    ルギーまたは実効値または実効値算出手段の出力を格納
    する第4の記憶手段と、前記第4の記憶手段と前記第2
    の記憶手段の出力から特徴量の算出を行う特徴量の算出
    手段と、ある時間区間のある周波数帯域の信号の重み値
    の算出を行う重み値の算出手段と、前記第3の記憶手段
    の出力と前記重み値の算出手段の積を算出する乗算手段
    と、前記乗算手段の出力を格納する第4の記憶手段と、
    前記第4の記憶手段の出力の総和を算出する総和手段と
    を備えたことを特徴とする雑音抑制装置。
  2. 【請求項2】重み値の算出手段は特徴量の有無によって
    重み値を決定することを特徴とする請求項1記載の雑音
    抑制装置。
  3. 【請求項3】特徴量の算出手段は特徴量の確からしさを
    特徴量の評価尺度とすることを特徴とする請求項1記載
    の雑音抑制装置。
  4. 【請求項4】重み値の算出手段は特徴量の評価測度を乗
    算により統合することにより重み値を算出することを特
    徴とする請求項2記載の雑音抑制装置。
  5. 【請求項5】重み値の算出手段は特徴量の評価測度をフ
    ァジィ積分により統合することにより重み値を算出する
    ことを特徴とする請求項2記載の雑音抑制装置。
  6. 【請求項6】ピッチの抽出手段は複数のピッチ抽出方法
    を用い複数の出力の平均値をピッチとして用いることを
    特徴とする請求項2記載の雑音抑制装置。
  7. 【請求項7】特徴量の算出手段は複数のピッチ抽出手段
    の出力からピッチの確からしさを算出することを特徴と
    する請求項3記載の雑音抑制装置。
  8. 【請求項8】ピッチ抽出手段は異なる複数のピッチ推定
    法により推定されたピッチによりピッチを推定すること
    を特徴とする雑音抑制装置。
  9. 【請求項9】特徴量の算出手段は異なる二つのピッチ推
    定法により推定されたピッチの差から推定されたピッチ
    の確からしさを求めることを特徴とする雑音抑制装置。
  10. 【請求項10】特徴量の算出手段は異なる複数のピッチ
    推定法により推定されたピッチの分散から推定されたピ
    ッチの確からしさを求めることを特徴とする雑音抑制装
    置。
JP7194580A 1995-07-31 1995-07-31 雑音抑制装置 Pending JPH0944186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7194580A JPH0944186A (ja) 1995-07-31 1995-07-31 雑音抑制装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7194580A JPH0944186A (ja) 1995-07-31 1995-07-31 雑音抑制装置

Publications (1)

Publication Number Publication Date
JPH0944186A true JPH0944186A (ja) 1997-02-14

Family

ID=16326913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7194580A Pending JPH0944186A (ja) 1995-07-31 1995-07-31 雑音抑制装置

Country Status (1)

Country Link
JP (1) JPH0944186A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004086362A1 (ja) * 2003-03-26 2004-10-07 Kabushiki Kaisha Kenwood 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
JP2005070779A (ja) * 2003-08-25 2005-03-17 Microsoft Corp 調波モデルに基づくフロントエンドを使用する頑強な音声認識のための方法および装置
JP2008203879A (ja) * 2005-09-02 2008-09-04 Nec Corp 雑音抑圧の方法及び装置並びにコンピュータプログラム
JP2009063700A (ja) * 2007-09-05 2009-03-26 Nippon Telegr & Teleph Corp <Ntt> 音声信号区間推定装置、方法、プログラムおよびこれを記録した記録媒体
JP2011203500A (ja) * 2010-03-25 2011-10-13 Toshiba Corp 音情報判定装置、及び音情報判定方法
JP2013534651A (ja) * 2010-07-12 2013-09-05 オーディエンス,インコーポレイテッド 計算聴覚シーン解析に基づくモノラルノイズ抑制

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004086362A1 (ja) * 2003-03-26 2004-10-07 Kabushiki Kaisha Kenwood 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
JP2005070779A (ja) * 2003-08-25 2005-03-17 Microsoft Corp 調波モデルに基づくフロントエンドを使用する頑強な音声認識のための方法および装置
JP4731855B2 (ja) * 2003-08-25 2011-07-27 マイクロソフト コーポレーション 調波モデルに基づくフロントエンドを使用する頑強な音声認識のための方法およびコンピュータ可読記録媒体
JP2008203879A (ja) * 2005-09-02 2008-09-04 Nec Corp 雑音抑圧の方法及び装置並びにコンピュータプログラム
JPWO2007026691A1 (ja) * 2005-09-02 2009-03-26 日本電気株式会社 雑音抑圧の方法及び装置並びにコンピュータプログラム
US9318119B2 (en) 2005-09-02 2016-04-19 Nec Corporation Noise suppression using integrated frequency-domain signals
JP2009063700A (ja) * 2007-09-05 2009-03-26 Nippon Telegr & Teleph Corp <Ntt> 音声信号区間推定装置、方法、プログラムおよびこれを記録した記録媒体
JP4691079B2 (ja) * 2007-09-05 2011-06-01 日本電信電話株式会社 音声信号区間推定装置、方法、プログラムおよびこれを記録した記録媒体
JP2011203500A (ja) * 2010-03-25 2011-10-13 Toshiba Corp 音情報判定装置、及び音情報判定方法
JP2013534651A (ja) * 2010-07-12 2013-09-05 オーディエンス,インコーポレイテッド 計算聴覚シーン解析に基づくモノラルノイズ抑制

Similar Documents

Publication Publication Date Title
JP4177755B2 (ja) 発話特徴抽出システム
US8065115B2 (en) Method and system for identifying audible noise as wind noise in a hearing aid apparatus
EP1083541B1 (en) A method and apparatus for speech detection
US6804643B1 (en) Speech recognition
EP2546831B1 (en) Noise suppression device
CA2215746C (en) Method and apparatus for separation of sound source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
US7508948B2 (en) Reverberation removal
KR100911679B1 (ko) 오디오 신호를 오디토리 이벤트로 세그먼트하는 방법
CA2448182C (en) Segmenting audio signals into auditory events
CN102054480B (zh) 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
US20100185439A1 (en) Segmenting audio signals into auditory events
JP2004531767A5 (ja)
JP2000515987A (ja) 音声活性度検出器
US4091237A (en) Bi-Phase harmonic histogram pitch extractor
JP2008236077A (ja) 目的音抽出装置,目的音抽出プログラム
Denbigh et al. Pitch extraction and separation of overlapping speech
Itoh et al. Environmental noise reduction based on speech/non-speech identification for hearing aids
JP2005266797A (ja) 音源信号分離装置及び方法、並びにピッチ検出装置及び方法
Kumar Spectral subtraction using modified cascaded median based noise estimation for speech enhancement
JPH0944186A (ja) 雑音抑制装置
US11622208B2 (en) Apparatus and method for own voice suppression
Lee et al. Cochannel speech separation
Yegnanarayana et al. Analysis of instantaneous f 0 contours from two speakers mixed signal using zero frequency filtering
JP2001222289A (ja) 音響信号分析方法及び装置並びに音声信号処理方法及び装置
RU2364957C1 (ru) Способ определения параметров линейчатых спектров вокализованных звуков и система для его реализации

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20031216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040316

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040803