JP2001027895A - 信号分離方法及び装置 - Google Patents

信号分離方法及び装置

Info

Publication number
JP2001027895A
JP2001027895A JP11200078A JP20007899A JP2001027895A JP 2001027895 A JP2001027895 A JP 2001027895A JP 11200078 A JP11200078 A JP 11200078A JP 20007899 A JP20007899 A JP 20007899A JP 2001027895 A JP2001027895 A JP 2001027895A
Authority
JP
Japan
Prior art keywords
signal
frequency
frequency component
analysis
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11200078A
Other languages
English (en)
Inventor
So Kishida
創 岸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP11200078A priority Critical patent/JP2001027895A/ja
Publication of JP2001027895A publication Critical patent/JP2001027895A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【課題】 複数の信号源からの音響信号を分離し、所望
の信号を合成出力する。 【解決手段】 解析対象の混合音声・音響信号に対し時
間・周波数解析を行い、周波数成分の倍音構成を得る。
倍音周波数成分の内、立上がり時間及び立下がり時間の
少なくとも一方が共通であるか否かで、同一信号源から
の周波数成分であるかどうかを同定する。その周波数成
分を抽出・再構成することにより、単一信号源からの信
号を分離する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、信号分離方法及び
装置に関し、より具体的には、例えば、生活環境下にお
ける音声信号と環境雑音の混合音、及び複数の楽器の同
時演奏音等の、複数の音源からの音響信号の混合信号か
ら所望の音源の信号を分離する方法及び装置に関する。
【0002】
【従来の技術】従来、音響信号の分離にはくし型フィル
タ等が使用されているが、特定の周波数帯域の音声信号
又は音響信号以外の信号を分離するのは困難であった。
【0003】特開平10−228296号公報に記載の
音響信号分離方法では、混合信号を複数の音源に分離す
ることは可能であるが、基本的にテンプレートマッチン
グ法を採用するので、予め対象の信号に含まれている可
能性のある波形をテンプレートとしてすべて記憶してお
く必要がある。従って、対象の信号に含まれる信号又は
音源の性質が未知である場合、正確に信号を分離出来
ず、柔軟性に欠ける。
【0004】特開平05−127668号公報には、ウ
ェーヴレット変換により音響信号からMIDIコード等
を自動採譜する方法が開示されている。しかし、この公
報には、信号源が単一の周波数成分の純音ではなく、複
数の周波数成分が重畳した複合信号であり、且つその信
号源が複数個存在するというような複雑な構成の混合信
号に対して、MIDIコードを正確に得るための手段は
開示されていない。
【0005】
【発明が解決しようとする課題】しかし、通常の生活環
境等においては、複数且つ不特定の音源からの音響信号
又は音声信号が混在している。このような状況で、周波
数帯域及び信号波形等を特定せずに、所望の音源からの
信号を分離する手段が望まれている。
【0006】本発明は、このような要望を満たし、複数
の信号源からの信号の混合信号から所望の信号源の信号
を分離する信号分離方法及び装置を提示することを目的
とする。
【0007】
【課題を解決するための手段】本発明に係る信号分離方
法は、観察信号が複数の信号源からの信号の混合信号を
分離する信号分離方法であって、当該混合信号を時間的
に連続解析して単一の信号源毎に分離する解析分離ステ
ップと、当該分離ステップの分離結果から所望の信号源
の信号を再構成する再構成ステップとを有することを特
徴とする。
【0008】本発明に係る信号分離装置は、観察信号が
複数の信号源からの信号の混合信号を分離する信号分離
装置であって、当該混合信号を時間的に連続解析して単
一の信号源毎に分離する解析分離手段と、当該分離手段
の分離結果から所望の信号源の信号を再構成する再構成
手段とを有することを特徴とする。
【0009】
【実施例】以下、図面を参照して、本発明の実施例を詳
細に説明する。
【0010】図1は、本発明の一実施例の概略構成とフ
ローチャートを示す図である。音響信号では、Breg
manの4つの発見的法則がある。すなわち、 (1)共通の立上り/立下りに関する規則 (2)漸近的変化に関する規則 (3)調波関係に関する規則 (4)一つの音響事象に生じる変化に関する法則であ
る。 最後の法則(4)は、「一つの音響事象に生じる変化は
その音を構成する各成分に同じ様な影響を与える」とい
う意味である。
【0011】本実施例では、これらの規則または法則を
物理的制約条件として利用して、複数の音響信号からな
る混合信号から所望の音響信号を分離する。
【0012】Bregmanの法則(3)に着目し、打
楽器等の一部の楽器を除いた多くの楽器音の周波数成分
が調波構造を成すことを利用する。所定の周波数分解能
により入力信号の周波数成分に分解し、基本周波数成分
と中心周波数が倍音関係にある周波数成分とを抽出し、
調波構造が検出されるまで、順次、周波数分解能の変更
を繰り返す。
【0013】本実施例では、解析開始時には、観察信号
(分離対象の信号)に含まれる基本周波数及び倍音成分
の周波数は未知であることを前提とする。例えば、人の
可聴域を参考とすると、人の可聴域は一般に約20〜2
0,000Hzにあるとされるので、初期設定する周波
数分解能を可聴域の低周波側として最低通過周波数を2
0Hzに設定し、最低通過周波数の整数倍の周波数40
Hz、60Hz、80Hz、・・・、20,000Hz
のフィルタバンクを形成し、その通過帯域幅を基本周波
数と同等の20Hzとして観察信号をろ波する。
【0014】近接する周波数帯域に周波数成分が現われ
れば、調波構造判定部が、調波構造を形成し単一信号源
を構成する周波数成分の候補と判定する。初期周波数分
解能設定機能により観察信号の性質を知らずに第1回目
の周波数分解を定めても、上手く調波構造を捉えること
は難しい。そこで、本実施例では、周波数分解能変更部
により、例えば、順次、最低通過周波数をシフトさせる
操作を繰り返す。第2回目の操作では、高周波側に最低
通過周波数をnHz変更すると、最低通過周波数は(2
0+n)Hzとなり、高域側の通過周波数は(40+2
n)Hz、(60+3n)Hz、(80+4n)Hz、
・・・、(20,000+1000n)Hzとなる。こ
の周波数分解能変更操作の繰り返しにより、やがて中心
周波数が整数倍の倍音成分群が検出され、これが単一信
号源からの信号を構成する候補の周波数成分となる。こ
の、周波数分解能を順次変更して周波数分解を反復して
繰り返す手段により、未知の信号源からの信号を構成す
る調波構造の周波数成分の候補を得ることができる。
【0015】上述のように、単純に周波数分解能をシフ
トするようにすると、シフトの刻み幅の設定が広すぎる
場合に、最適周波数分解能を飛び越して最適周波数分解
能を検出出来ないことがある。又は、フィルタの通過帯
域幅と解析信号の帯域幅が合致せずに、周波数成分が検
出されないこともある。しかし、周波数分解能変更部及
び解析条件変更部は、調波構造が検出されるまで周波数
分解能、又はフィルタを用いる場合にはそのフィルタの
通過帯域幅などの解析条件を変更して、調波構造が検出
されるまで解析条件の変更操作を繰り返す。これによ
り、調波構造が有るのに誤って無しと判定するのを防止
できる。
【0016】解析条件変更手段の詳細を限定せずに、例
えば調波構造の探索を早めるには、分解された周波数成
分の信号の大きさの情報を参照すればよい。ニュートン
法又は最急降下法などの、何らかの収束アルゴリズムを
用いるのが適当である。ニュートン法を用いる場合、周
波数分解能のシフト幅と検出される周波数成分の信号の
大きさ変化を傾きとする関数を定義し、その解を求める
ことで、通常3回程度で実用レベルに収束し、最適周波
数分解能を得ることが出来る。
【0017】図1に示すフローにおける「解析継続判定
部1:解析終了条件に達したか」は、真に調波構造が無
い場合、又は、実用上は無視出来る程度の周波数成分し
か存在しない場合に、無限ループに陥るのを避けるため
に設けられている。予め所定の解析終了条件を定め、処
理を強制終了させる。
【0018】Bregmanの規則(1)に着目し、先
に得られた周波数成分の立上り立下りを比較し、立上り
及び立下り時間の少なくとも一方が同一である周波数成
分を抽出する。調波構造だけでなく、立上り立下り時間
にも注目するのは、異なる信号源の周波数成分でありな
がら、何らかの事情で周波数帯域が近接している結果、
上述の手段だけでは同一信号源の周波数成分と見なされ
てしまう成分を弁別除去し、異なる信号源の周波数成分
を誤って再構成してしまうのを防止するためである。こ
の結果、信号源分離精度が向上する。
【0019】立上り時間及び立下り時間の両方に注目す
るか、片方だけに注目するかを選択可能にしたのは、以
下の理由による。すなわち、第1に、解析対象信号の全
体を一度に走査する場合、一般的には、立上り時間と立
下り時間の両方に注目する方が分離精度が向上すると考
えられる。しかし、信号の継続時間が未知の場合には、
必ずしもそうとは言えない。本実施例では、観察対象信
号全体の時間長に対し、解析のために読み込む時間長を
特に定めない。従って、解析時間長を短く区分し、これ
を時間的に連続して繰り返す解析を行う場合、解析に当
たり解析時間内で常に立上りと立下りの両方を観察でき
る保証が無い。例えば、解析時間が信号の継続時間に対
して相対的に短い場合、周波数成分が時間的に区切られ
てしまい、同一解析時間内では立上りか立下りのどちら
か一方しか観察できないことがありうる。
【0020】第2に、信号源から信号を採取する際の音
圧レベルの検出精度、及び信号源の音圧レベルの立上り
立下り特性等により、観察される立上り時間又は立下り
時間が見かけ上ずれることがある。信号の大きさの時間
的立上りが極めて緩やかであるか、又は、検出精度が観
察信号レベルに対し不充分である場合、真の信号立上り
時間より遅れた時間が立上り時間として検出される。全
ての周波数成分が同じ時間幅だけずれてその立上り時間
が検出されるならば、解析への影響は少ないが、本来、
同一信号源であっても特定の周波数成分が見かけ上、立
上り時間が遅い場合に、別な信号源の信号の周波数成分
として誤認識されてしまう懸念がある。同様に、信号の
立下り解析時にも、真の信号立下り時間より速い立下り
であると誤認識されることがある。
【0021】立上り時間及び立下り時間の双方の一致す
る周波数成分だけに注目して単一信号源の周波数成分を
抽出する場合、この第1又は第2の事態に陥いったとき
に、過剰に成分を振り落とす危険性があり、却って再生
信号の品質劣化を招く虞がある。
【0022】そこで、本実施例では、立上り時間及び立
下り時間のどちらか一方が一致した場合に、単一信号源
の周波数成分であると同定することにした。本実施例で
解析時間長を短く区切る第1の理由は、使用メモリ容量
の削減であるが、第2の理由は、解析を連続的に行うこ
とにより、観察信号の読み込みから僅かな時間遅れで信
号解析結果を得られるので、ほぼリアルタイムな解析環
境が得られるからである。
【0023】本実施例では更に、Bregmanの規則
(2)にも注目し、信号の代表的大きさにより周波数成
分を時間的に区分する。この目的は、同一周波数帯域に
別な信号源の信号成分が重畳した場合に、これを分離で
きるようにすることである。Bregmanの規則
(2)を適用し、同一信号源の中では基本的に音圧レベ
ルは漸近的に変化すると捉える。即ち、同一周波数帯域
内であっても急に信号の大きさが大きくなる又は小さく
なる等、信号の大きさに不連続が観察された場合には、
別の信号源の信号であると判断して、時間的に切り分け
てから再構成する。
【0024】更に本実施例では、ピアノの音の様に急激
な音圧レベルの立上りをみせる信号源にも対応できる。
即ち、上述のように、信号の代表的大きさを平均的に捉
えるだけでは、急激な立上りピークが不連続点とみなさ
れ、ピーク位置で別の信号源として区分されてしまう。
ここで、Bregmanの法則(4)を適用すると、周
波数分解された他の成分にもピーク点は観察され、これ
を信号の代表的大きさとして複数の周波数成分をグルー
プ化して同一信号源の周波数成分として抽出できる。即
ち、他の周波数成分との対比によって、同一周波数帯域
に別な信号源の成分が重畳した場合にもこれらを分離で
きる。
【0025】このような手段を設けることで、単一信号
源の周波数成分を同定し、これを再構成することによ
り、単一信号源の信号を分離できる。
【0026】更に、本実施例では、図1に示す解析継続
判定部2及び解析継続判定部3により、一旦、信号源が
同定され再構成出力されても、周波数分解能の初期設定
が低周波側の場合であれば周波数分解能を更に高周波寄
りに更新し、再び以上の処理を施すことにより、基本周
波数が高周波にシフトした異なる単一音源を順次、同定
し再構成して出力することができる。この反復操作は、
外部から強制的な解析中止入力が無い限り、所定の周波
数分解能に達するか又は信号成分が無くなる迄、継続す
る。これにより、観察信号に含まれる全ての信号源を同
定して、その出力信号を抽出できる。
【0027】このようにして、各音源の信号は独立して
再生されるが、図2に示すフロチャートのように変更す
ることで、任意の数の信号源を合成して同時に出力する
ことが可能になる。すなわち、再構成された単一音源信
号を順次、再構成信号記憶部に記憶させ、指示された信
号源の信号のみを合成して出力する。
【0028】例えば、4つの楽器A,B,C,Dからの
信号の混合信号から再構成信号出力結果を得たとする。
各楽器の再構成信号出力結果と、各楽器に対応する記憶
部格納番号を知れば、合成信号指示として再構成信号記
憶部の格納番号を再構成信号合成部に入力することで、
例えば、楽器Aと楽器Bの信号のみを合成した合成信号
出力を得ることができる。また、楽器A,B,Cを指定
すれば、楽器Dの信号のみを除いた合成信号が得られ
る。いうまでもないが、単一音源を指定すれば、例え
ば、楽器の演奏をバックにした歌曲の場合に、歌声のみ
を抽出できる。
【0029】図3は、解析処理のフローチャートを示
し、図4は、図3の時間・周波数解析部のフローチャー
トを示す。例えば、解析の初期には図1に示すフローを
用い、図1及び図4に示される周波数分解能記憶部に、
観察信号を単一信号源に分解するための周波数分解能を
保存する。図1のフローによる解析が一巡した段階で、
図3及び図4にフローに示す解析の並列処理を実行す
る。先ず、図3に示される信号分配部により、解析信号
を図4に示す少なくとも2ケ以上予め用意された時間周
波数解析部(n)に所定数、分配する。次に、図4に示
す周波数分解能部から所定の周波数分解能を得て信号を
解析する。楽器の合奏など、音源の数が限定されている
場合、又は話者が限定されている状態で音声信号のみ分
離したい場合などでは、反復ループを用いないので解析
負荷が低減される。並列処理により処理を高速化でき
る。
【0030】以下、本実施例をより具体的に説明する。
本実施例による解析には、基本的に、 (1)周波数成分に分解された情報 (2)時間軸上の情報 (3)信号の大きさの情報 の3つの情報が得られればよく、特定の解析手法に限定
されない。一つの手法として、帯域を細かく区分したフ
ィルタバンクによりろ波することにより、上述の
(1)、(2)及び(3)の情報が得られる。別な手法
としては例えばFFTを用いると、(1)と(3)の情
報が容易に得られる。(2)の情報は得られないが、単
なるFFTではなく、短時間FFTを時間的に連続して
用い、各時間区分毎の結果を逐次比較することにより、
ある周波数成分が何時立上り、何時立下ったかをスペク
トル成分の有無から判定できる。
【0031】ウェーヴレット変換を用いる解析法を詳細
に説明する。ウェーヴレット変換を用いることにより、
以下の効果がある。すなわち、第1に、周波数分解能が
2進移動するので、変換結果は、中心周波数が2倍毎に
設定されるフィルタバンクでろ波したのと等価になる。
ウェーヴレット変換は、フーリエ変換のように周波数解
析だけでなく、時間・周波数解析を行うので、周波数分
解された結果に時間情報も保存される。従って、隣り合
うレベルに同時に周波数成分が現われれば、調波構造を
容易に探索出来る。第2に、周波数分解する際の基底関
数が直交性を持つことを利用すると、分解・再構成アル
ゴリズムが確定しいるので、分解した成分から正確に信
号源を再生できる。
【0032】ウェーヴレット変換は一般に下記の数1で
定義される。すなわち、
【0033】
【数1】
【0034】
【数2】 但し、aは、スケールパラメータ、bはトランスレート
である。解析対象の信号関数f(x)と時間・周波数解
析の基底関数となるアナライジング・ウェーヴレットψ
(x)とを畳み込み積分する。ウェーヴレット変換の特
徴は、アナライジング・ウェーヴレットが数2の条件を
満たし、時間軸上を走査していく際に(トランスレート
bの値を増していくと)、周波数分解能を示すスケール
パラメータaの値が自動的に変化し、連続的に周波数成
分に展開される。このスケールパラメータが自動的に変
化する機能を、解析対象信号に対するズームイン/ズー
ムアウト機能と呼ぶ。これにより、解析対象の周波数成
分が未知であっても周波数成分に適合した最小の分解能
が自動的に得られ、図1及び図2のフローにおける初期
周波数分解能を設定するステップを省略できる。解析対
象の信号の周波数成分が未知の場合に特に有効である。
【0035】ウェーヴレット変換を用いる場合、図1の
周波数成分分解部は数1によるウェーヴレット変換を実
行する部分に相当する。通常、ウェーヴレット変換で
は、自動的なズームイン/ズームアウト機能により、解
析対象信号を時間軸上に走査していく際にスケールパラ
メータの最小値が自動的に決定する。図5は、ウェーヴ
レット変換による時間・周波数解析の模式図を示す。レ
ベル−1は最も高周波寄りの周波数成分を示す。以下、
レベルが下がる毎に、レベル内の周波数帯域の中心周波
数は前述の様に2進移動する。
【0036】ウェーヴレット変換における各レベルの中
心周波数が、解析対象の音声又は音響信号の基本周波数
及び倍音周波数と一致すれば、図5のレベル−2及び−
3又はレベル−4と−5に示すように、倍音成分が各レ
ベル間に展開された結果を得る。しかし、各レベルの中
心周波数と解析対象信号の各倍音成分の周波数が不一致
の場合、周波数成分は特定のレベルに集中せずに各レベ
ル間に無相関に分散してしまい、どのレベルとどのレベ
ルの成分を選べば元の音を再構成するかの手掛かりを得
ることが出来ない。場当たり的にレベル同士を再構成し
ても、他の音源の成分が含まれている可能性も高く、各
レベルに展開する前の元の信号源を正確に再構成できる
保証はない。
【0037】そこで、本実施例では、通常のウェーヴレ
ット変換の様にアナライジングウェーヴレットのスケー
ルパラメータの値を数1から自動的に決定するのではな
く、以下の方法を採用することにした。すなわち、先ず
周波数解析された結果、隣接するレベル間同士に周波数
成分が現れ、各レベルに倍音成分が分配されているかど
うかを、調波構造判定部(図1)により判定する。ここ
では、ウェーヴレット変換を用いているので、図5に示
すように隣接するレベル同士に成分が集中して出現する
かどうかで、容易に判定できる。
【0038】成分が無相関に分散している場合、周波数
分解能変更部(図1)を用いる。一度目の信号走査で自
動的にズームインした結果、得られたスケールパラメー
タの最小値を周波数分解能記憶部に記憶しておき、二度
目以降のウェーヴレット変換の際には、この最小値の使
用を許可せずに適当なきざみ幅で使用許可するスケール
パラメータの最小値を順次微増していく。これにより、
周波数分解能変更操作を容易に実現できる。
【0039】この操作を、中心周波数が2倍づつの構成
のフィルタバンクで捉えるなら、初期に構成されるフィ
ルタバンクは、各レベルの中心周波数が分離したい信号
源の周波数成分より高周波側にずれていても、調波構造
判定部による反復操作により帯域が順次シフトし、分離
したい信号に最適なフィルタバンクが自動的に生成され
ることを示す。
【0040】くし型フィルタ又はテンプレートマッチン
グによる従来の分離方法では、無数の特性のくし型フィ
ルタ又はテンプレートを用意しなければならないのに対
し、本実施例で必要となるのは基本的には一つのアナラ
イジングウェーヴレットだけであり、処理はパラメータ
値の変更だけで済む。この結果、本実施例では、システ
ムが用意しておく情報量が大幅に少なくなり、混合信号
のブラインド分離も可能な極めて柔軟性に富んだシステ
ムを構築できる。
【0041】ウェーヴレット変換を用いる場合、数3に
示す逆ウエーヴレット変換式によりレベルを再構成し、
混合音の中から元の単一音源信号を再構成することがで
きる。
【0042】
【数3】
【0043】
【数4】 数4は、数3の右辺を定義するためのアドミッシブル条
件である。
【0044】図5(1)が、観察時間tの間に得た混
合観察信号であり、時間t間をウェーヴレット変換に
より走査し、本実施例では、レベル−1から−6のウェ
ーヴレット成分に分解した。ウェーヴレット変換では、
あるレベルからより低次のレベルへの周波数展開は2進
移動するので、レベル−2とレベル−3の周波数成分は
調波構造の関係にあり、同じく、レベル−4とレベル−
5の周波数成分も調波構造の関係にある。
【0045】レベル−2とレベル−3には、時間tna
〜tnb間に共通の立上り及び立下り時間を示す周波数
成分があり、レベル−4とレベル−5には時間tnc
間に共通の立上り及び立下り時間を示す周波数成
分がある。従ってレベル−2とレベル−3のtna〜t
nb間の周波数成分は同一の信号源成分とみなされ、同
じくレベル−4とレベル−5のtnc〜tnd間の周波
数成分もこれに続くなんらかの単一信号源の成分とみな
せる。
【0046】立上り立下り時間判定部により、周波数解
析だけでけなく時間解析も併用している効果は次の通り
である。即ち、時間tna〜tnbが時間tnc〜t
ndに先行していること、及び、立下り時間tnbと立
上り時間tncが殆ど時間的に一致していることを、容
易に解析できる。
【0047】周波数成分を再構成する際には、解析対象
の信号の素性と目的として得たい解析結果により、再構
成の方法に微妙な差異を設ける必要がある。本実施例の
場合、立上り立下り時間は異なるが、レベル−2からレ
ベル−5迄の成分は全て互いに調波構造にあるので、同
一の音源が異なる音程の音を発している可能性がある。
解析者がこの信号が楽器の音であることを知っている場
合、再構成には解析目的により2つの方法がある。
【0048】再生信号を楽器の音として聞きたい場合に
は、以下のようにする。即ち、レベル−2から−5を時
間tna〜tnd迄まとめて再構成した方が、立上り時
間及び立下り時間を抽出する際の微弱な周波数成分の切
り落としの影響が少なく、一般に高品質の再生音を期待
できる。図5では、レベル−2,−3の周波数成分は、
時間tna〜tnbに示されているが、微弱な周波数成
分が時間tnb以降も継続していることを必ずしも否定
出来ない。一般に、高周波成分の有無は音色の違いとし
て人に知覚される事が多いので、微弱な周波数成分であ
っても再生音の品質は向上すると考えて良い。低周波側
のレベル−4,−5では、時間tna〜tnbに有意な
周波数成分が無いとみなせば(例えば、ピアノなどの場
合、一般に、急激な音圧レベルの立ち上りを示す。)、
再構成に用いても用いなくても、再生音品質には余り影
響がないと判断される。
【0049】音程情報が欲しい場合には、以下のように
する。すなわち、同一楽器から連続的に信号が出ている
場合、旋律を奏でていると考えられる。音程情報を得て
自動採譜する場合、レベル−2,−3とレベル−4,−
5を分けて再生することにより、各々が独立した音程と
して再構成される。これは、音響情報をコ−ド化する処
理の前処理の機能を実現できることを示す。
【0050】図5の例では、先行するレベル−2,−3
の音は信号レベルが低く、後続するレベル−4,−5の
方が信号レベルが高いので、これが音声である場合に
は、レベル−2,−3の音は子音であり、レベル−4,
−5は母音であると判定出来る。この場合も、再生音の
品質を優先するなら、第1の場合のように、レベル−2
からレベル−5を時間tna〜tnd迄まとめて再構成
する。何故なら、子音と母音の間には、通常、わたり音
と称される過渡的部分が介在し、また、母音を単独で発
音する場合と子音との連続で発音する場合とでは母音の
波形が微妙に変化するので、まとめて連続再生した方が
より自然な音声として知覚されるからである。
【0051】音声入力システム等でテキスト・コード化
することを目的とする場合には、子音と母音を分けて再
生した方が、音声認識部の負荷が低減される。
【0052】以上をまとめると、時間に無相関なレベル
−1の高周波成分を例えばノイズ成分とみなし、レベル
−6の低周波成分を例えば何らかの信号歪みとみなし
て、音源の再構成には用いず、レベル−2〜−5の周波
数成分のみを再構成することにより、単一信号源をノイ
ズ環境の中から分離抽出することが可能となる。
【0053】図6は、基本周波数が異なる2つの音の混
合信号をウェーヴレット変換した場合の波形例を示す。
図6(1)は対象となる観察信号であり、同(2)〜
(5)はアナライジングウェーヴレットψ(x)によ
る展開結果を示し、同(6)〜(11)はアナライジン
グウェーヴレットψ(x)による展開結果をそれぞれ
示す。ここで問題となるのは、同一の最小周波数分解能
のアナライジングウェーヴレットを用いると、互いの周
波数成分が倍音関係にない限り、2つの音を一度の操作
で調波構造を成す周波数成分に上手く展開出来ないこと
である。
【0054】個々では、各音源の調波構造を同定出来る
ように、図1に示す周波数分解能変更部及び調波構造判
定部が、アナライジング・ウェーヴレットのスケールパ
ラメータ最小値を順次変更して最適値を求め、次に、同
一立上り立下り時間周波数成分抽出部が、周波数成分を
抽出する。抽出結果再構成部が、抽出結果を再構成し
て、再生信号を出力する。
【0055】最小スケールパラメータがa−1=nの場
合、アナライジングウェーヴレットψ(x)による展
開では、レベル−2n,−3nを得た。
【0056】次に反復ループを再度、実行することによ
り、最小スケールパラメータa−1が、 a−1=m:(n<m) の時、ψ(x)とは異なる最小周波数分解能のアナラ
イジングウェーヴレットψ(x)による展開により、
レベル−3m〜−5mを得た。
【0057】図6では、本実施例では最小周波数分解能
の異なるアナライジングウェ−ヴレットを用いることに
より、異なる基本周波数の複数の信号源を分離できた。
【0058】図6ではまた、例えばレベル−3m〜−5
mのように信号源が広い周波数帯域に分布していても、
同一信号源の周波数成分として抽出できることを示す。
これは、例えば音源がピアノであり、和音を演奏してい
て帯域が広い場合でも、他の信号源から分離できること
を示す。従来の分離法の多くは、単旋律の分離にしか対
応してないことので、本実施例が極めて有効な方法であ
ることが分かる。
【0059】図7は、調波構造が類似しているが基本周
波数が異なる信号源からの信号の混合信号を展開した例
を示す。レベル−2,−3,−4とレベル−4,−5に
それぞれ異なる信号源の周波数成分が現れている。
【0060】高周波側の信号と低周波側の信号の周波数
成分が重複しているように見えるレベル−4に着目す
る。レベル−4の周波数成分は、Bregmnの規則
(1)を適用すると、立上り立下り時間判定部により、
レベル−4の中で高周波側の信号源を構成する成分が同
じく高周波側の成分であるレベル−2,−3とほぼ同じ
立上り立下り時間tna〜tnc間にあると判定出来
る。同様に、レベル−4の中で低周波側の信号源を構成
する成分がもう一つの低周波側の成分レベル−5の立上
り立下り時間tnb〜tnd間にあると判定出来る。こ
の判定結果により、レベル−4では、時間tnb〜t
nc間に高周波側の成分と低周波側の成分が重複してい
ることが分かり、この成分を高周波側と低周波側のどち
らに含めるかが問題となる。
【0061】ここで、Bregmanの規則(1)に加
えて法則(4)を適用する。図1に示す信号の大きさ比
較判定部及び信号の大きさによるグル−ピング部が、B
regmanの規則(1)及び法則(4)を適用する。
図7において、レベル−4では時間tna〜tnd間に
周波数成分が観察されるが、時刻tnbより前の信号の
代表的大きさを、例えば振幅ピ−ク幅hに代表させ、
時刻tnbより後の信号の代表的大きさを振幅ピ−ク幅
に代表させた場合に、信号の大きさ比較判定部が両
者の信号の代表的大きさに有意な差異を判定すると、レ
ベル−4の周波数成分を時間軸上の時刻tnbの前後で
別の信号源の周波数成分として弁別できる。それを下記
式のように表現するとする。すなわち、
【0062】
【数5】{h,}<{l,} 次に、信号の大きさによるグル−ピング部が、レベル−
4前後の高周波側及び低周波側の各レベル毎の信号の代
表的大きさを比較する。各レベルの信号の代表的大きさ
が高周波側の方が小さい場合、下記式のように表現する
と。即ち、
【0063】
【数6】{h,h,h,}<{l,l} このように、同一周波数帯域を先ず信号の大きさで時間
区分し、次に数5及び数6に示すような条件を見出せた
場合には、レベル−4の時間tnb〜tnc間のように
成分が重複する区間の周波数成分を、信号の代表的大き
さの大きい周波数成分グル−プの方に包含されるとみな
す。
【0064】図7では、信号の代表的大きさとして信号
の平均ピ−ク値を利用したが、例えば低域側の信号源が
ピアノの様に急激な音圧レベルの立上りをみせる信号の
場合、Bregmanの法則(4)を適用すれば、各レ
ベルで同時に鋭い立上りを見せる周波数成分を抽出して
グル−プ化することにより、レベル−4のように同一帯
域に二つの信号源が重畳しても弁別可能となる。
【0065】図7の場合、信号源を再構成する際に、高
周波側の再構成にはレベル−2と−3に対して時間t
na〜tnc間の成分を用い、レベル−4に対して時間
na〜tnb間の成分を用いる。低周波側の再構成で
は、レベル−4,−5に対して時間tnb〜tnd間の
成分を用いる。
【0066】時間tnb〜tnc間は、高周波数側成分
が重複して含まれているのに、これを低周波側の周波数
成分として再構成するのは、信号処理上、一見、厳密さ
を欠くかの如くみえる。しかし、再構成信号を音として
人が聴く場合を想定すると、人の聴覚特性により、低周
波側の音圧レベルの高い音により高周波側の音圧レベル
の低い音がマスキングされ聴覚上知覚され難いので、再
構成信号の品質劣化を回避できる。
【0067】
【発明の効果】以上の説明から容易に理解できるよう
に、本発明によれば、複数の信号源からの信号の混合信
号から、元の信号源の信号を各々単独に或いは任意の数
の信号を合成して連続した分離信号として得ることがで
きる。
【図面の簡単な説明】
【図1】 本発明の一実施例の概略構成とフローチャー
トを示す図である
【図2】 任意の数の信号源の信号を合成出力する概略
構成とフローチャートを示す図である。
【図3】 信号解析の概略構成とフローチャートを示す
図である。
【図4】 時間・周波数解析部の概略構成とフローチャ
ートを示す図である。
【図5】 本実施例による、信号源にノイズ/歪みが重
畳した信号の処理結果の模式図である。
【図6】 本実施例による、異なる周波数分解能のアナ
ライジングウェーヴレットによる信号処理結果の模式図
である。
【図7】 本実施例による、時間的に一部重畳した混合
信号の処理結果の模式図である。

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 観察信号が複数の信号源からの信号の混
    合信号を分離する信号分離方法であって、 当該混合信号を時間的に連続解析して単一の信号源毎に
    分離する解析分離ステップと、 当該分離ステップの分離結果から所望の信号源の信号を
    再構成する再構成ステップとを有することを特徴とする
    信号分離方法。
  2. 【請求項2】 当該解析分離ステップが、単一信号源の
    信号として再構成された信号を一時的に記憶する記憶ス
    テップを具備する請求項1に記載の信号分離方法。
  3. 【請求項3】 当該解析分離ステップが、当該混合信号
    を任意の数に分配する分配ステップを具備する請求項1
    に記載の信号分離方法。
  4. 【請求項4】 当該解析分離ステップが、当該混合信号
    を任意の周波数分解能をもって周波数成分に分解する周
    波数分解ステップと、当該周波数成分間の調波構造の有
    無を判定する調波構造判定ステップと、当該調波構造判
    定ステップにより周波数成分が調波構造に無いと判定さ
    れた場合に、調波構造を得る迄、周波数分解能等の解析
    条件を順次変更する解析条件変更ステップと、当該周波
    数分解ステップにより分解された周波数成分を抽出する
    周波数成分抽出ステップと、当該周波数分解能を記憶す
    る記憶ステップとを有する請求項1に記載の信号分離方
    法。
  5. 【請求項5】 当該解析分離ステップが、周波数分解さ
    れた周波数成分を時間軸で走査し信号の大きさから周波
    数成分の立上り及び立下り時間を判定する立上がり立下
    がり時間判定ステップと、当該周波数成分間同士の立上
    り時間及び立下り時間を比較する比較ステップと、当該
    立上り時間及び当該立下り時間の少なくとも一方が両者
    が一致する時間区分内の周波数成分を抽出する抽出ステ
    ップとを有する請求項4に記載の信号分離方法。
  6. 【請求項6】 当該解析分離ステップが、同一周波数帯
    域に分解された周波数成分を時間軸上で走査し、信号の
    代表的大きさに不連続が観察される場合に、当該信号の
    代表的大きさの継続する時間で解析対象周波数成分を区
    分し抽出する解析対象周波数成分抽出ステップと、区分
    された周波数成分を隣接する帯域の周波数成分と比較
    し、異なる信号源の周波数成分と判定する信号源判定ス
    テップとを有する請求項5に記載の信号分離方法。
  7. 【請求項7】 当該再構成ステップは、周波数成分間の
    調波構造が判定され、且つ当該周波数成分が立上り時間
    及び立下り時間の少なくとも一方が同一と判定された周
    波数成分を再構成し、出力する請求項5に記載の信号分
    離方法。
  8. 【請求項8】 当該再構成ステップは、周波数成分間の
    調波構造が判定され、且つ周波数成分の代表的な大きさ
    により抽出された周波数成分を各信号源毎に再構成する
    請求項6に記載の信号分離方法。
  9. 【請求項9】 当該解析分離ステップが、所定の解析条
    件及び解析結果の少なくとも一方を参照して、解析を継
    続・停止するステップを具備する請求項7又は8に記載
    の信号分離方法。
  10. 【請求項10】 解析過程の周波数分解と周波数成分の
    再構成にウェーヴレット変換を用いる請求項7又は8に
    記載の信号分離方法。
  11. 【請求項11】 観察信号が複数の信号源からの信号の
    混合信号を分離する信号分離装置であって、 当該混合信号を時間的に連続解析して単一の信号源毎に
    分離する解析分離手段と、 当該分離手段の分離結果から所望の信号源の信号を再構
    成する再構成手段とを有することを特徴とする信号分離
    装置。
  12. 【請求項12】 当該解析分離手段が、単一信号源の信
    号として再構成された信号を一時的に記憶する記憶手段
    を具備する請求項11に記載の信号分離装置。
  13. 【請求項13】 当該解析分離手段が、当該混合信号を
    任意の数に分配する分配手段を具備する請求項11に記
    載の信号分離装置。
  14. 【請求項14】 当該解析分離手段が、当該混合信号を
    任意の周波数分解能をもって周波数成分に分解する周波
    数分解手段と、当該周波数成分間の調波構造の有無を判
    定する調波構造判定手段と、当該調波構造判定手段によ
    り周波数成分が調波構造に無いと判定された場合に、調
    波構造を得る迄、周波数分解能等の解析条件を順次変更
    する解析条件変更手段と、当該周波数分解手段により分
    解された周波数成分を抽出する周波数成分抽出手段と、
    当該周波数分解能を記憶する記憶手段とを有する請求項
    11に記載の信号分離装置。
  15. 【請求項15】 当該解析分離手段が、周波数分解され
    た周波数成分を時間軸で走査し信号の大きさから周波数
    成分の立上り及び立下り時間を判定する立上がり立下が
    り時間判定手段と、当該周波数成分間同士の立上り時間
    及び立下り時間を比較する比較手段と、当該立上り時間
    及び当該立下り時間の少なくとも一方が両者が一致する
    時間区分内の周波数成分を抽出する抽出手段とを有する
    請求項14に記載の信号分離装置。
  16. 【請求項16】 当該解析分離手段が、同一周波数帯域
    に分解された周波数成分を時間軸上で走査し、信号の代
    表的大きさに不連続が観察される場合に、当該信号の代
    表的大きさの継続する時間で解析対象周波数成分を区分
    し抽出する解析対象周波数成分抽出手段と、区分された
    周波数成分を隣接する帯域の周波数成分と比較し、異な
    る信号源の周波数成分と判定する信号源判定手段とを有
    する請求項15に記載の信号分離装置。
  17. 【請求項17】 当該再構成手段は、周波数成分間の調
    波構造が判定され、且つ当該周波数成分が立上り時間及
    び立下り時間の少なくとも一方が同一と判定された周波
    数成分を再構成し、出力する請求項15に記載の信号分
    離装置。
  18. 【請求項18】 当該再構成手段は、周波数成分間の調
    波構造が判定され、且つ周波数成分の代表的な大きさに
    より抽出された周波数成分を各信号源毎に再構成する請
    求項16に記載の信号分離装置。
  19. 【請求項19】 当該解析分離手段が、所定の解析条件
    及び解析結果の少なくとも一方を参照して、解析を継続
    ・停止する手段を具備する請求項17又は18に記載の
    信号分離装置。
  20. 【請求項20】 解析過程の周波数分解と周波数成分の
    再構成にウェーヴレット変換を用いる請求項17又は1
    8に記載の信号分離装置。
JP11200078A 1999-07-14 1999-07-14 信号分離方法及び装置 Pending JP2001027895A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11200078A JP2001027895A (ja) 1999-07-14 1999-07-14 信号分離方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11200078A JP2001027895A (ja) 1999-07-14 1999-07-14 信号分離方法及び装置

Publications (1)

Publication Number Publication Date
JP2001027895A true JP2001027895A (ja) 2001-01-30

Family

ID=16418496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11200078A Pending JP2001027895A (ja) 1999-07-14 1999-07-14 信号分離方法及び装置

Country Status (1)

Country Link
JP (1) JP2001027895A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007003964A (ja) * 2005-06-27 2007-01-11 Ricoh Co Ltd 画像形成装置
JP2008518270A (ja) * 2004-10-29 2008-05-29 ゼンフ・ステューディオズ,インコーポレイテッド オーディオ信号中の音符を検出する方法、システム及びコンピュータプログラムプロダクト
KR101403086B1 (ko) 2006-09-26 2014-06-03 소니 주식회사 신호 처리 장치 및 신호 처리 방법
US11018915B2 (en) 2017-01-11 2021-05-25 Fujitsu Limited Wireless analysis device and wireless analysis method

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6134600A (ja) * 1984-07-27 1986-02-18 株式会社日立製作所 音声認識装置
JPS6361296A (ja) * 1986-09-02 1988-03-17 株式会社河合楽器製作所 電子楽器
JPH07295573A (ja) * 1994-04-22 1995-11-10 Kawai Musical Instr Mfg Co Ltd 波形形成装置およびこの出力波形を用いた電子楽器
JPH08329046A (ja) * 1995-05-31 1996-12-13 Toshiba Corp ウェーブレット変換を用いた信号解析装置
JPH0990956A (ja) * 1995-09-25 1997-04-04 Yamaha Corp 楽音信号分析方法
JPH10143194A (ja) * 1996-11-13 1998-05-29 Oki Electric Ind Co Ltd 混合音分離システム
JPH10197575A (ja) * 1997-01-14 1998-07-31 Atr Ningen Joho Tsushin Kenkyusho:Kk 信号分析方法
JPH10313497A (ja) * 1996-09-18 1998-11-24 Nippon Telegr & Teleph Corp <Ntt> 音源分離方法、装置及び記録媒体
JPH10319948A (ja) * 1997-05-15 1998-12-04 Nippon Telegr & Teleph Corp <Ntt> 音楽演奏に含まれる楽器音の音源種類判別方法
JPH11184471A (ja) * 1997-12-18 1999-07-09 Casio Comput Co Ltd 波形発生装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6134600A (ja) * 1984-07-27 1986-02-18 株式会社日立製作所 音声認識装置
JPS6361296A (ja) * 1986-09-02 1988-03-17 株式会社河合楽器製作所 電子楽器
JPH07295573A (ja) * 1994-04-22 1995-11-10 Kawai Musical Instr Mfg Co Ltd 波形形成装置およびこの出力波形を用いた電子楽器
JPH08329046A (ja) * 1995-05-31 1996-12-13 Toshiba Corp ウェーブレット変換を用いた信号解析装置
JPH0990956A (ja) * 1995-09-25 1997-04-04 Yamaha Corp 楽音信号分析方法
JPH10313497A (ja) * 1996-09-18 1998-11-24 Nippon Telegr & Teleph Corp <Ntt> 音源分離方法、装置及び記録媒体
JPH10143194A (ja) * 1996-11-13 1998-05-29 Oki Electric Ind Co Ltd 混合音分離システム
JPH10197575A (ja) * 1997-01-14 1998-07-31 Atr Ningen Joho Tsushin Kenkyusho:Kk 信号分析方法
JPH10319948A (ja) * 1997-05-15 1998-12-04 Nippon Telegr & Teleph Corp <Ntt> 音楽演奏に含まれる楽器音の音源種類判別方法
JPH11184471A (ja) * 1997-12-18 1999-07-09 Casio Comput Co Ltd 波形発生装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008518270A (ja) * 2004-10-29 2008-05-29 ゼンフ・ステューディオズ,インコーポレイテッド オーディオ信号中の音符を検出する方法、システム及びコンピュータプログラムプロダクト
JP2007003964A (ja) * 2005-06-27 2007-01-11 Ricoh Co Ltd 画像形成装置
KR101403086B1 (ko) 2006-09-26 2014-06-03 소니 주식회사 신호 처리 장치 및 신호 처리 방법
US11018915B2 (en) 2017-01-11 2021-05-25 Fujitsu Limited Wireless analysis device and wireless analysis method

Similar Documents

Publication Publication Date Title
Saint-Arnaud et al. Analysis and synthesis of sound textures
EP2264696B1 (en) Voice converter with extraction and modification of attribute data
Duxbury et al. Separation of transient information in musical audio using multiresolution analysis techniques
US8761915B2 (en) System and method for automatically producing haptic events from a digital audio file
JP4207902B2 (ja) 音声合成装置およびプログラム
JP4065314B2 (ja) 対象音分析装置、対象音分析方法および対象音分析プログラム
US6336092B1 (en) Targeted vocal transformation
US7565213B2 (en) Device and method for analyzing an information signal
JP4645241B2 (ja) 音声処理装置およびプログラム
Ebner et al. Audio inpainting with generative adversarial network
EP1662479A1 (en) System and method for generating audio wavetables
JP2015138053A (ja) 音響信号処理装置およびその方法
JP2010210758A (ja) 音声を含む信号の処理方法及び装置
EP1918911A1 (en) Time scale modification of an audio signal
JP3174777B2 (ja) 信号処理方法および装置
JP2001027895A (ja) 信号分離方法及び装置
Haider et al. Extraction of rhythmical features with the Gabor scattering transform
JP5163606B2 (ja) 音声分析合成装置、及びプログラム
JP4513556B2 (ja) 音声分析合成装置、及びプログラム
Anikin Package ‘soundgen’
JP2000003200A (ja) 音声信号処理装置及び音声信号処理方法
JP2008096844A (ja) 自動採譜装置及び方法
Delgado Castro Iterative Separation of Note Events from Single-Channel Polyphonic Recordings
Ligtenberg The Effect of Deep Learning-based Source Separation on Predominant Instrument Classification in Polyphonic Music
JP4267954B2 (ja) 概周期信号生成方法、装置、それを用いた音声合成方法、装置、音声合成プログラムおよびその記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060706

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090602