JP5373473B2 - 音声抽出装置 - Google Patents

音声抽出装置 Download PDF

Info

Publication number
JP5373473B2
JP5373473B2 JP2009114631A JP2009114631A JP5373473B2 JP 5373473 B2 JP5373473 B2 JP 5373473B2 JP 2009114631 A JP2009114631 A JP 2009114631A JP 2009114631 A JP2009114631 A JP 2009114631A JP 5373473 B2 JP5373473 B2 JP 5373473B2
Authority
JP
Japan
Prior art keywords
signal
filter
filter coefficient
adaptive
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009114631A
Other languages
English (en)
Other versions
JP2010263567A (ja
Inventor
琢磨 鈴木
克昌 佐藤
栄治 三澤
友紀 勝俣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AMENITY RESEARCH INSTITUTE CO., LTD.
Original Assignee
AMENITY RESEARCH INSTITUTE CO., LTD.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AMENITY RESEARCH INSTITUTE CO., LTD. filed Critical AMENITY RESEARCH INSTITUTE CO., LTD.
Priority to JP2009114631A priority Critical patent/JP5373473B2/ja
Publication of JP2010263567A publication Critical patent/JP2010263567A/ja
Application granted granted Critical
Publication of JP5373473B2 publication Critical patent/JP5373473B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

本発明は、音響エコーやハウリングを抑制、防止して音声の抽出を行う音声抽出装置に関する。
スピーカとマイクロフォンを用いて通話が行われる、会議システムなどのハンズフリーフォンシステム(図7)では、通常話者Aの送話音声信号は、話者B側のスピーカから再生されると同時に話者Bのマイクロフォンで受音され、このため、話者A側のスピーカから再生される。
これにより、話者A側では、自分の発声した音声が自分の側のスピーカから出力されることになり、これがエコーとして聞こえてしまう。
また、話者A側のスピーカから再生されたエコーが、話者A側のマイクで受音されることにより、信号の閉ループが形成され、ゲインが1を超えるとハウリングが発生してしまう。
このような、音響エコーやハウリングを、適応信号処理に基づき抑制、防止するための関連技術として、音響エコーキャンセラを含む拡声通話システム(特許文献1)やハウリングキャンセラを含む拡声装置(特許文献2)が開示されている。
また、以下に示すように、「音響システムとディジタル処理」(大賀寿郎 山崎芳男 金田豊 共著)で、関連技術が開示されている。
この音響エコーキャンセラでは、例えば、図8(話者B側)に示すように、相手側(話者A)の声である受話信号x(k)が受話スピーカから再生され、室内音響伝達系を経て、音響エコーy’(k)として送話マイクロフォンに受音される。
ここで、室内の音響インパルス応答をh’(k)で表すと、y’(k)はx(k)とh’(k)を畳み込んだ信号となる。
音響エコーキャンセラは、室内音響伝達系のインパルス応答の推定値h(k)を求めて、それを受話信号x(k)と畳み込んで推定エコー信号y(k)を合成する。
合成したy(k)をマイクロフォンで受音した信号から減算することで音響エコーの消去を行う。
尚、室内の音響インパルス応答h’(k)は話者やマイクロフォンの位置の移動など周囲環境の変化に伴って変化するため、h’(k)の推定には、通常適応フィルタが使用される。
また、この適応フィルタとしては安定な実時間動作が可能であるなどの理由からFIRフィルタが利用される。このときFIRフィルタの係数が室内音響伝達系のインパルス応答の推定値h(k)となる。
更に、適応フィルタは、受話信号x(k)が存在するときに誤差信号e(k)のパワーが最小となるようにフィルタ係数(インパルス応答推定値)h(k)を計算する。ここで、誤差信号e(k)は以下に示す[数1]により算出される。
(数1)
e(k)=y’(k)+s(k)−y(k)
このとき送話信号s(k)が0であれば、誤差信号e(k)は、エコー消去誤差y’(k)−y(k)を表し、これを最小化するフィルタ係数h(k)は、エコー経路のインパルス応答の良好な推定値となる。
しかしながら、双方向通話においては同時通話状態(double-talk:ダブルトーク)があり、この時は送話信号s(k)が存在する。送話信号s(k)が存在するとe(k)はエコーの消去誤差信号とはならないため、この状態でインパルス応答の推定を行うと推定に誤りを生じてしまう。
したがって、同時通話状態時には、適応フィルタの適応動作を停止させる、若しくは適応速度を低減させることなどが行われている(特許文献1)。
次に、拡声系およびハウリングキャンセラの一例のブロック図を、図9に示す。
この拡声系は、発話者による発話音声や楽器の音などであるs(k)をマイクロフォンで受音し、それを増幅器で増幅した信号x(k)を発話者と同一空間内(室内)にスピーカで再生する系である。
また、スピーカから出た音は室内空間伝達系h’を経てマイクロフォンで受音されて閉ループを形成する。
この系において増幅器のゲインを大きくしすぎると閉ループのゲインが1以上となり、ハウリングが発声する。
このハウリングを抑制するためのハウリングキャンセラは、上記音響エコーキャンセラと同様に、スピーカとマイクロフォンの間の伝達関数を推定し、これを用いて合成した信号y(k)をマイクロフォン受音信号から減算して帰還信号y’(k)を消去するものである。
しかしながら、伝達関数の推定を行うのに必要な信号x(k)が存在するときには常に発話者の音声(妨害信号)s(k)がマイクロフォンに入力されている。
この状態は、上記音響エコーキャンセラにおける同時通話状態に相当する。また、帰還信号y’(k)と推定の妨害信号s(k)とは強い相関をもつ。
このように、ハウリングキャンセラは、音響エコーキャンセラと比べて劣悪な条件下で空間伝達系の推定を行わなければならない。
このため、適応アルゴリズムを利用する場合にはSN比が悪い場合の対処、すなわちステップサイズを十分に小さくして、推定精度を確保するといった手法が開示されている(特許文献2)。
特開2006−270147公報 特開2006−197076公報
しかしながら、上記特許文献1に開示された関連技術では、同時通話状態、および同時通話状態の発生を正確に検出することできないという不都合がある。
また、上記特許文献2に開示された関連技術では、室内伝達系の推定に時間を要するため、伝達系の変動に十分追従できないといった不都合がある。
更に、上記特許文献1および2に開示された関連技術では、同時通話状態時における適応フィルタの適応動作を停止、若しくは収束速度を低減させる必要があるため、この場合、人の移動や周囲環境の変化への追従性が低下してしまうといった不都合がある。
また、同時通話状態の検出に誤差信号e(k)を利用する場合には、適応フィルタの適応動作が良好なときにe(k)が送話信号s(k)となるため、s(k)が存在すると、適応の推定に誤りを生じ、安定してe(k)を利用することが困難となってしまう不都合がある。
更に、誤差信号e(k)は、エコーや帰還信号を消去した後の最終的な送話信号となるが、同時通話状態の検出に失敗しインパルス応答推定に誤りが生じている場合には、この送話信号に劣化が生じてしまう不都合がある。また、適応動作を停止せずに常時更新した場合でも、送話信号の品質が劣化してしまう不都合が生じ得る。
これは、特に送話信号を入力信号として音声認識処理に利用する場合など、抽出された送話信号の品質が高いことが要求される場合に大きな問題となり得る。
[発明の目的]
本発明は、上記関連技術の有する不都合を改善し、スピーカから発せられた帰還音とスピーカ以外の音源からの外部音とがマイクロフォンより収音された同時通話状態時に、外部音声を有効に抽出し得る音声抽出装置を提供することを、その目的とする。
上記目的を達成するために、本発明に係る音声抽出装置は、マイクロフォンに接続され、予め設定されたスピーカ以外の外部音源から前記マイクロフォンに入力された外部音声信号を抽出信号として抽出する適応信号処理部を備えた音声信号抽出装置であって、前記適応信号処理部は、前記スピーカに入力される音声信号と前記マイクロフォンから入力されたマイク入力音声信号とに基づき前記スピーカから前記マイクロフォンへの伝達系を模擬したフィルタ係数の設定および更新を行う第1および第2の適応フィルタと、前記スピーカに入力される入力音声信号を前記第1の適応フィルタで演算処理し得られた模擬信号と前記マイク入力音声信号との差分を第1の残差信号として抽出すると共に、当該第1の残差信号を前記第1の適応フィルタ部に送り込む第1の減算部と、前記入力音声信号を前記第2の適応フィルタで演算処理して得られた模擬信号と前記マイク入力音声信号との差分を第2の残差信号として抽出すると共に、当該第2の残差信号を前記第2の適応フィルタ部に送り込む第2の減算部と、前記第1の減算部における前記マイク入力音声信号および前記第1の残差信号の差分量と前記第2の減算部における前記マイク入力音声信号および前記第2の残差信号の差分量とを監視する減算量監視部と、前記差分量の高い側の残差信号を前記抽出信号として送出する構成とし、前記減算量監視部は、前記第1の減算部で予め設定された値を超える差分量が検知された場合に、前記第1の適応フィルタにおけるフィルタ係数の更新動作を停止する係数更新停止制御機能を備えると共に、この減算量監視部は、更に、前記第1および第2の適応フィルタにおける係数更新の収束速度を、予め設定された収束速度の速いパラメータおよび遅いパラメータの少なくとも2種のパラメータを用いて制御する収束速度制御機能と、前記第1の適応フィルタにおけるフィルタ係数の更新動作停止中に、前記第2の適応フィルタにおける係数更新の収束速度を前記収束速度の遅いパラメータに基づき動作制御する低収束速度同定制御機能とを備えた構成をとっている。
本発明は、以上のように構成され機能するので、これによると、フィルタ係数の設定および更新を行う異なる二つの適応フィルタと、異なる適応フィルタからの模擬信号に基づき残差信号を生成する異なる二つの減算部と、各減算部で減算処理された減算量を監視する減算量監視部を備え、生成された残差信号のうち前記減算量の高い減算処理により生成された残差信号を前記抽出信号として送出する構成としたことにより、同時通話状態時においても外部音声を有効に抽出し得る音声抽出装置を提供することができる。
本発明による音声入力装置を含む一実施形態を示した概略ブロック図である。 本発明による音声入力装置を含む一実施形態を示した概略ブロック図である。 本発明による音声入力装置(音響エコーキャンセルシステム)を含む一実施形態を示す概略ブロック図である。 図1に開示した音声入力装置における学習時における全体の動作処理ステップを示すフローチャートである。 図1に開示した音声入力装置における学習完了時における全体の動作処理ステップを示すフローチャートである。 図1に開示した音声入力装置における再学習時における全体の動作処理ステップを示すフローチャートである。 通話拡声系であるハンズフリーフォンの構成例を示した概略ブロック図である。 図7に示したハンズフリーフォンにおける音響エコーキャンセラの一例を示したブロック図である。 拡声系の一例を示した概略ブロック図である。
[実施形態1]
次に、本発明の実施形態1について、その基本的構成内容を説明する。
本実施形態1は、図1に示すように、車内に設置されたカーナビゲーションシステム5に対してユーザの発話音声の入力を行う音声入力装置1である。
この音声入力装置1は、その内部に車内に設置されたカーオーディオシステム4からの音声信号を取得する適応フィルタ部11を備えると共に、ユーザによる発話音声を収音するためのマイクロフォン3を備えた構成となっている。
尚、カーオーディオシステム4は、音声信号として音楽やラジオ放送を放音しているものとする。
また、カーオーディオシステム4には、上記適応フィルタ部11が取得する音声信号(以下「入力信号x(k)という」)と同一の音声信号を送出するスピーカ2が接続して設けられている。
また、カーナビゲーションシステム5は、音声認識機能によりアドレス指定を行うカーナビゲーションシステムであり、その内部に音声認識部6を備え、この音声認識部6が入力された送話信号に基づき、カーナビゲーションシステム5に予め設定された地図情報における住所を特定する機能を備えているものとする。
このため、アドレス指定を行うにあたっては、この音声認識部6に入力される送話信号は、より高品質であることが望ましい。
また、音声入力装置1の適応フィルタ部11は、スピーカ2からマイクロフォン3への室内伝達系(帰還伝達系)100を模擬したフィルタ係数を自己設定する。
尚、音声入力装置1は、プロセッサを備えたコンピュータであって、予め設定されたプログラムに基づく実行処理を行うことにより、以下に示す各部、および各手段の動作機能を実現するものとする。
スピーカ2は、カーオーディオシステム4からのアナログ音声信号を放音する。
尚、このアナログ音声信号は、遅延バッファ113に入力される入力信号x(k)に対してD/A(Digital/Analog)変換を行い生成された音声信号であり、この音声信号をアンプなどを介して増幅したものとする。
マイクロフォン3は、上記カーオーディオシステム4の設置された車内に設置され、音声入力装置1外部からの音声をマイクロフォン入力音声信号として音声入力装置1に入力する。
このマイクロフォン入力信号は、スピーカ2から出力(再生)され、帰還伝達系100を介して、マイクロフォン入力信号として、マイクロフォン3に受音される。
尚、上記マイクロフォン入力信号は、A/D(Analog/Digital)コンバータ(図示なし)によりA/D変換され、図1に示すように、帰還音信号d(k)として加算部12,13、およびキャンセル量算出部14,15に入力されるものとする。
ここで、カーナビゲーションシステム5に対してアドレス指定を行うために、例えば、ユーザが、マイクロフォン3に対して、「東京都八王子」と発話したとする。
この場合、マイクロフォン3に入力される音声の状態は、スピーカ2から帰還伝達系100を介してマイクロフォンに入力された帰還音声と、ユーザの発話したアドレス指定音声(「東京都八王子」という音声:送話信号s(k)とする)とが含まれる同時通話状態(ダブルトーク状態)となる。
また、音声入力装置1には、カーオーディオシステム4からの音声(スピーカ2に供給される音声と同一)がA/D(Analog/Digital)コンバータ(図示なし)によってA/D変換され、入力デジタル信号(以下「入力信号x(k)」という)として入力される。ここで、この入力デジタル信号(入力信号x(k))は、遅延バッファ13に記憶される。
適応フィルタ部11は、入力信号x(k)を取得し一時的に記憶保持する遅延バッファ手段113と、後述する加算部12、13から出力されたリファレンス信号に基づきフィルタ係数の算出を行うフィルタ係数算出手段111、112と、このフィルタ係数算出手段111により決定されたフィルタ係数を用いて内積演算処理(畳み込み演算)を行う内積演算手段(適応フィルタ)114、115を備えた構成となっている。
また、適応フィルタ部11では、フィルタ係数算出手段111および内積演算手段114と、フィルタ係数算出手段112および内積演算手段115とにおいて、それぞれ適応信号処理が行われる。
ここで、遅延バッファ手段113は、帰還伝達系100を介した帰還音信号d(k)の遅れ時間τを模擬するものであり、内積演算手段114および115は、帰還伝達系100の音声伝播特性である伝達関数を模擬するものとする。
本発明に係る実施形態では、上述のように、入力信号x(k)が、スピーカ3から出力されるのに並行して、遅延バッファ113に供給されることで、内積演算手段114、および115から出力される模擬信号yf(k)、およびyb(k)を、帰還音信号d(k)に近似させることができる。
フィルタ係数算出手段111は、加算部12から出力された残差信号ef(k)と、遅延バッファ手段113からの遅延音声信号x(k−τ)に基づいて、室内伝達系100の伝達関数を推定し、この伝達関数に合わせて(模擬して)内積演算手段114のフィルタ係数を算出する(フィルタ係数算出機能)。
また、フィルタ係数算出手段111は、算出されたフィルタ係数の更新を行い、内積演算手段114に対してこれを通知する(フィルタ係数更新設定機能)。これにより、内積演算手段114におけるフィルタ係数の設定を行う。
尚、上記フィルタ係数更新設定機能は、残差信号ef(k)ができるだけ小さくなるように実行される。
また、フィルタ係数更新設定機能は、予め設定された時間間隔毎(例えば、数μsec〜数百μsec毎)に行われる設定としてもよい。
以下、フィルタ係数算出手段111、112それぞれでフィルタ係数の更新が行われている状態を「学習状態」という。
また、フィルタ係数算出手段111は、以下に示すキャンセル量比較部16からの制御信号に応じて、フィルタ係数の更新を停止する学習停止実行機能を有する。
これにより、フィルタ係数算出手段111は、一定のキャンセル量が得られた時点で、学習を完了し(学習完了状態)、この時点でフィルタ係数が固定されるものとする。
また、フィルタ係数算出手段111は、以下に示す係数コピー手段116によりフィルタ係数の書き換えが行われた場合には、書き換えの行われたフィルタ係数を内積演算手段114に通知する。
これにより、フィルタ係数算出手段111、112で更新(算出)されたフィルタ係数のうち、キャンセル量の高い、つまり、室内伝達系100のより正確に(精度よく)同定されたフィルタ係数を内積演算手段114に設定することができる。
フィルタ係数算出手段112は、以下に示す加算部13から出力された残差信号eb(k)と、遅延バッファ手段113からの遅延音声信号x(k−τ)に基づいて、室内伝達系100の伝達関数を推定し、この伝達関数に合わせて(模擬して)内積演算手段115のフィルタ係数を算出する(フィルタ係数算出機能)。
また、フィルタ係数算出手段112は、算出されたフィルタ係数の更新を行い、内積演算手段115に対してこれを通知する(フィルタ係数更新設定機能)。これにより、内積演算手段115におけるフィルタ係数の設定を行う。
尚、上記フィルタ係数更新設定機能は、残差信号eb(k)ができるだけ小さくなるように実行される。
また、フィルタ係数更新設定機能は、予め設定された時間間隔毎(例えば、数μsec〜数百μsec毎)に行われる設定としてもよい。
尚、フィルタ係数算出手段111の学習中は、フィルタ係数算出手段112も同時にフィルタ係数の更新を行うものとする。
また、フィルタ係数算出手段111、112には、それぞれ、収束速度を制御するパラメータ(収束速度パラメータ)が、少なくとも2種類、つまり収束速度が速いパラメータ値v1と、収束速度の遅いパラメータ値v2とが設定できるものとする。
ここで、フィルタ係数算出手段111における学習完了時、つまりフィルタ係数算出手段111で同定されたインパルス応答が安定しているときに、フィルタ係数算出手段112は、適応制御の同定の程度を下げた収束速度(収束速度を低減した状態:v2)でフィルタ係数の算出更新(適応制御)を行うものとする。
これにより、適応フィルタ部11は、突発的に生じ得るマイクロフォン3における同時通話などに対するフィルタ係数破壊や推定誤りなどの変動を軽減することができる。
尚、フィルタ係数算出手段111の学習中には、収束の早いパラメータ(v1)により、フィルタ係数の更新を行うものとし、更には、フィルタ係数算出手段112も、収束の早いパラメータ(v1)により、同時にフィルタ係数の更新を行うものとする。
尚、本発明にかかる実施形態では、フィルタ係数算出手段111、112における学習状態(学習中、学習停止、学習開始(学習再開))は、以下で説明するキャンセル量比較部16により制御されるものとする。
キャンセル量比較部16は、例えば、キャンセル量算出部14のキャンセル量がcan1dB(例えば、24dBとする)を上回った場合に、学習が完了したと判定し、フィルタ係数更新手段111におけるフィルタ係数の算出更新を停止する制御を行う(学習停止)。
また、キャンセル量算出部14のキャンセル量がcan2dB(例えば、9dBとする)を下回った場合に、キャンセル量比較部16は、再学習が必要と判定され、フィルタ係数更新手段111におけるフィルタ係数の更新を再開する制御を行う(再学習開始)。このとき、フィルタ係数更新手段111および112は、同時に更新を開始する。
これにより、例えば、マイクロフォン3、スピーカ2の位置の変化することなどによる室内伝達系100の変動が生じた場合に、この変動に対して迅速に適応した適応信号処理を行うことができる。
また、フィルタ係数更新手段111および112における、室内(帰還)伝達系100の伝達関数の推定およびフィルタ係数の算出更新は、適応アルゴリズムを用いて行われる。
ここで、適応アルゴリズムとしては、例えば、学習同定法、LMS法、射影法及びRLS法などを適用することができる。
遅延バッファ手段113は、カーオーディオ4から入力された入力信号x(k)を遅れ時間τだけ遅延させ、この遅延させた遅延信号x(k−τ)を内積演算手段114、115、およびフィルタ係数算出手段111、112に対して入力する。
尚、内積演算手段114、115は、具体的にはデジタルフィルタであって(典型的にはFIR:Finite Impulse Response Filter)、この内積演算手段114、および115それぞれのフィルタ係数を決定するフィルタ係数算出手段111、および112に接続された構成となっている。
また、内積演算手段114、115は、入力された遅延信号x(k−τ)を、フィルタ係数算出手段111により算出されたフィルタ係数で畳み込み演算処理を行う。
これにより、内積演算手段114は、模擬信号yf(k)を生成し、この模擬信号yf(k)を加算部12に対して出力する。また、内積演算手段115は、模擬信号yb(k)を生成し、この模擬信号yb(k)を加算部13に対して出力する。
尚、本発明に係る実施形態では、適応フィルタ部11における適応信号処理を、特許第4067269号に開示された高速H∞フィルタ(FHF:高速算出フィルタ)を用いて行うものとする。このFHFを用いて一定時間毎に適応係数を高速に算出することにより、適応フィルタ部11では、スピーカ2からマイクロフォン3への帰還伝達系(室内空間伝達系)100の特性を正確かつ迅速に同定することができる。
また、この高速H∞フィルタは、パラメータγfによって、適応信号処理の収束速度を制御可能であるものとする。このパラメータγfは、0<γf<100の値をとり、この数値が大きいほど収束速度が遅くなる。
ここで、この高速H∞フィルタでは、例えば、収束速度の速いパラメータv1としてのγf1、および収束速度の遅いパラメータv2としてのγf2(ただしγf1<γf2とする)が予め設定されているものとする。
この高速H∞フィルタを用いることにより、音声入力装置1の同時通話(ダブルトーク)状態時においても、フィルタ係数の係数破壊(推定誤り)が生じにくく、更には、帰還伝達系100における急激な変動、および微小な変動を追随することにより生じる推定誤り等を有効に軽減することができる。
係数コピー手段116は、キャンセル量比較部16からの要求に応じて、フィルタ係数算出手段112で算出されたフィルタ係数を複製し、このフィルタ係数によりフィルタ係数算出111のフィルタ係数を書き換えるフィルタ係数書換え実行機能を備えている。
尚、係数コピー手段116は、比較判定部16の機能として設定されてもよい。
加算部12には、模擬信号yf(k)と帰還音信号d(k)とが入力される。加算部12は、模擬信号yf(k)(マイナス成分)および帰還音信号d(k)(プラス成分)の加算処理を行い、帰還音信号d(k)から模擬信号yf(k)を除いた残差信号ef(k)を、キャンセル量算出部14に出力すると共に、フィルタ係数算出手段111に出力する。
また、ここで出力される模擬信号ef(k)は、送出信号(Sout)として、カーナビゲーションシステム5の音声認識部6に入力される。
ここで、マイクロフォン3における音声入力状態が、ユーザからのアドレス指定音声がマイクロフォン3に入力された同時通話状態にあり、且つ適応フィルタ部11における適応信号処理が有効に機能している場合、加算部12から送出される残差信号ef(k)(つまり送出信号(Sout))には、ユーザからのアドレス指定音声である送話信号s(k)だけが含まれることとなり、高品質な送話信号を音声認識部6に対して入力することができる。
加算部13には、加算部12と同様に、模擬信号yb(k)と帰還音信号d(k)とが入力される。加算部13は、模擬信号yb(k)(マイナス成分)および帰還音信号d(k)(プラス成分)の加算処理を行い、帰還音信号d(k)から模擬信号yb(k)を除いた残差信号eb(k)を、キャンセル量算出部15に出力すると共に、リファレンス信号としてフィルタ係数算出手段112に出力する。
キャンセル量算出部14には、帰還音信号d(k)と残差信号ef(k)とが入力される。ここで、キャンセル量算出部14は、入力された信号の差分値の算出を行う。
ここで、キャンセル量算出部14は、d(k)/ef(k)(デシベル表現では、d(k)−ef(k))の値を算出する。
キャンセル量算出部15には、帰還音信号d(k)と残差信号eb(k)とが入力される。ここで、キャンセル量算出部15は、キャンセル量算出部14と同様に、入力された信号の差分値の算出を行う。
ここで、キャンセル量算出部15は、d(k)/eb(k)(デシベル表現では、d(k)−eb(k))の値を算出する。
キャンセル量比較部16は、キャンセル量算出部14および15におけるキャンセル量を常時監視するキャンセル量監視機能を備えている。
また、キャンセル量比較部16は、キャンセル量算出部14のキャンセル量(foregroundキャンセル量という)が予め設定されたキャンセル量閾値(can1dB:例えば、24dBとする)に達した(上回った)場合、フィルタ係数算出手段111における学習が完了したと判定し、フィルタ係数算出手段111における係数算出更新機能を停止する制御を行う学習停止制御機能を備えている。
これにより、フィルタ係数算出手段111では、フィルタ係数の算出更新が停止される。
このとき、フィルタ係数算出手段112では、フィルタ係数の算出更新が継続して行われる。
更に、キャンセル量比較部16は、上記学習停止制御機能を実行したとき、フィルタ係数算出手段112におけるフィルタ係数の算出更新の収束速度を落とす(同定の程度を下げる)制御を行う(ステップサイズ制御機能)。
具体的には、キャンセル量比較部16は、フィルタ係数算出手段112におけるフィルタ係数の算出更新の収束速度を、予め設定された遅い方の(ステップサイズ)パラメータv2に設定する。
ここで、フィルタ係数算出手段112が高速H∞フィルタである場合には、上述のように、γf2に設定する。
これにより、フィルタ係数算出手段112では、収束速度を落とした状態でフィルタ係数の算出更新が継続して行われる。
これにより、音声入力装置1の周囲環境や帰還伝達系100が安定している場合における(学習完了時)、同時通話(ダブルトーク)状態ときに、適応フィルタ部11がフィルタ係数に生じる意図しない変動や微細な変化を追従してしまうことにより生ずる、適応信号処理における係数破壊や推定誤りを有効に抑制することができる。
また、キャンセル量比較部16は、キャンセル量算出部14のキャンセル量(foregroundキャンセル量)が予め設定されたキャンセル量閾値(can2dB:例えば9dBとする)より小さくなった(下回った)場合には、フィルタ係数算出手段111,112における再学習が必要と判定し、フィルタ係数算出手段111、112における収束速度パラメータを予め設定された収束速度の速い方のステップサイズパラメータv2に設定する制御を行う(再学習起動機能)。
これにより、フィルタ係数算出手段111,112では、同時に学習が再開され、フィルタ係数の算出更新が開始される。
更に、キャンセル量比較部16は、フィルタ係数算出手段111における学習完了時に、キャンセル量算出部14で算出されたキャンセル量(foregroundキャンセル量)とキャンセル量算出部15で算出されたキャンセル量(backgroundキャンセル量)とを取得し、その大小比較を行う(キャンセル量比較機能)。
このとき、キャンセル量比較部16は、backgroundキャンセル量がforegroundキャンセル量より大きい場合、係数コピー手段116に対して指示を行い、フィルタ係数算出手段112のフィルタ係数をコピーしてフィルタ係数算出手段111のフィルタ係数と置き換える制御を行う(フィルタ係数置き換え制御機能)。
以上のように、本発明に係る実施形態では、音声入力装置1における同時通話(ダブルトーク)状態時においても、室内(帰還)伝達系100の変動に対して迅速に追従した適応信号処理を行うことができるため、例えば、車内で音楽やラジオなどのオーディオ音声だけを有効に除去することができると共に、住所が発話された送話信号を(送出信号(Sout)として)カーナビゲーション5に対して入力することができるので、車内でオーディオ信号を流している状態(ダブルトーク状態)でも、カーナビゲーションの音声認識機能を有効に利用することができる。
[実施形態1の動作説明]
次に、本実施形態1である音声入力装置1の学習時における動作について、図4のフローチャートに基づいて説明する。
(学習時)
まず、フィルタ係数算出手段111,112が同時にフィルタ係数の算出更新処理を行う(ステップS1)。
このとき、フィルタ係数算出手段111、112では、予め設定された収束速度の速いパラメータv1(H∞フィルタである場合はパラメータγf1)に基づき、高速にフィルタ係数の算出更新が行われるものとする。
ここで、キャンセル量比較部16がキャンセル量算出部14におけるキャンセル量がcan1dB(例えば24dB)を上回ったことを検知した場合に(ステップS2)、キャンセル量比較部16は、フィルタ係数算出手段111の算出更新動作(学習動作)を停止する制御を行う(ステップS3)と共に、フィルタ係数算出手段112における学習動作を収束速度の遅いパラメータv2(H∞フィルタである場合はパラメータγf2)に基づき行うように制御する、つまり、フィルタ係数算出手段112におけるフィルタ係数の算出更新処理を、収束速度を下げた状態で行う(ステップS4)。
次に、適応フィルタ部11における学習完了(状態)時における音声入力装置1の動作について、図5のフローチャートに基づき説明する。
(学習停止時)
まず、キャンセル量比較部16は、常時キャンセル量算出部14および15のキャンセル量を監視している(ステップS11)。
ここで、backgroundキャンセル量がforegroundキャンセル量を上回った場合に(ステップS12)、キャンセル量比較部16は、係数コピー手段116に対して係数コピー機能の実行を指示する(ステップS13)。
係数コピー手段116は、フィルタ係数算出手段112で算出されたフィルタ係数を取得し、フィルタ係数算出手段111におけるフィルタ係数を書き換える処理を行う(ステップS14)。
これにより、フィルタ係数算出手段112で算出(更新)されたフィルタ係数は、係数コピー手段116によりコピーされ、フィルタ係数算出手段111で算出されたフィルタ係数に書き換えられ、この書き換えられたフィルタ係数に基づき内積演算(畳み込み演算)が行われる。
(再学習開始)
次に、本実施形態1で、適応フィルタ部11における再学習動作が開始される場合の音声入力装置1の動作について、図6のフローチャートに基づき説明する。
まず、キャンセル量比較部16は、常時キャンセル量算出部におけるforegroundキャンセル量およびbackgroundキャンセル量の監視を行っている(ステップS21)。
foregroundキャンセル量が、予め設定されたcan1dB(例えば9dB)を下回ったことを検知した場合(ステップS22)、キャンセル量比較部16は、帰還伝達系100に変動が生じたものと判定し、適応フィルタ部11に対して再学習動作の開始を指示する(ステップS23)。
この指示に応じてフィルタ係数算出手段111および112は、同時に再学習動作を開始する(ステップS24)。このとき、フィルタ係数算出手段111および112は、共に収束速度の速いパラメータv1(γf1)に基づき、高速にフィルタ係数の算出更新動作を行うものとする。
以上のように、本実施形態の音声入力装置(音響エコーキャンセル装置)では、適応フィルタの適応動作を平行して行う手段(具体的には、フィルタ係数算出手段および内積演算手段)と、適応動作のキャンセル量の監視を行う手段(キャンセル量比較部)とを備えた簡易な構成により、高精度な同時通話状態の検出処理を行うことなく、同時通話状態における適応信号処理を高精度に行うことができる。
また、この音声入力装置(音響エコーキャンセル装置)により処理され出力される送出信号(Sout)の劣化を有効に抑制することができる。
更には、上述のように、実施形態1、2、および3における適応フィルタの適応動作をH∞フィルタ(「高速算出フィルタ」に相当)を用いて行うことにより、同時通話(ダブルトーク)状態時でも、適応フィルタの適応動作を迅速に行うことができ、更には、フィルタ係数の係数破壊(推定誤り)を抑制し、更には、帰還伝達系における急激な変動、および微小な変動の影響により生じる推定誤り等を有効に軽減することができる。
[実施形態2]
次に、本発明に係る実施形態2について説明する。
この実施形態2における音声入力装置1の機器構成部分は、図2に示すように、前述した実施形態1と同一の構成を備えている。
また、前述の実施形態1におけるカーオーディオシステム4およびカーナビゲーションシステム5に代えて、予め設定された室内に設置され、カラオケ伴奏音信号の再生出力を行うカラオケ装置7を備えた構成となっている。
このカラオケ装置7は、その内部に、カラオケ伴奏音信号の再生出力を行う再生部と、この再生部からのカラオケ伴奏音信号と音声入力装置1で処理された送出信号(Sout)とをミキシングする処理(ミキシング処理)を行うミキサー8とを有し、ミキシング処理された合成音声信号をスピーカ2に提供する。
ここで、前述した実施形態1と同一の部分については、同一の符号を付するものとする。
また、本実施形態2で、音声入力装置1は、このカラオケ装置7(ミキサー8)からの合成音声信号を入力信号x(k)として取得すると共に、ミキサー8に対して送出信号(Sout)の入力を行う。
これにより、マイクロフォン3から入力された音声信号にカラオケ伴奏音信号と話者による発話音声とが含まれた状態(同時通話状態に相当)においても、音声入力装置1は、帰還音信号であるカラオケ伴奏音信号を有効に除去することができ、更に、話者(ユーザ)による発話信号だけを送出信号(Sout)としてミキサー8に入力することができ、これにより、カラオケ装置7におけるハウリングの発生を有効に抑制することができる。
[実施形態3]
次に、本発明に係る実施形態3について説明する。
この実施形態3は、図3に示すように、音響エコーキャンセル装置(音声入力装置)31および32を、それぞれ話者A側および話者B側に設置し、話者AおよびBは、自己側に設置されたスピーカおよびマイクを用いて相互通話を行う構成とする。
尚、音響エコーキャンセル装置31および32の内部機器構成部分は、前述した実施形態1および2の音声入力装置1と同一の構成を備えているものとする。
ここで、音響エコーキャンセラ31は、話者A側のスピーカから発生する音響エコーを抑制するように機能し、また、音響エコーキャンセラ32は、話者B側のスピーカから発生する音響エコーを抑制するように機能する。
また、音響エコーキャンセル装置31の適応フィルタ部に対しては、伝送路30を介して音響エコーキャンセル装置32からの送出信号(Sout)が入力信号x(k)として入力される(ここでは、xa(k)とする)。一方、音響エコーキャンセル装置32の適応フィルタブに対しては、伝送路30を介して音響エコーキャンセル装置31からの送出信号(Sout)が入力信号x(k)として入力される(ここでは、xb(k)とする)。
これにより、本実施形態3では、話者B側で、マイクロフォンBから入力された音声信号に、スピーカBからの出力された相手(話者A)の発話信号と話者Bによる発話音声とが入力された状態(同時通話状態:ダブルトーク状態)であっても、音響エコーキャンセル装置32は、帰還音信号としての話者Aの発話信号を有効に除去し、話者Bによる発話信号だけを送出信号(Sout)として話者A側(伝送路)へと送出することができる。
一方、話者A側でも、同様に、マイクロフォンAから入力された音声信号に、スピーカAからの出力された相手(話者B)の発話信号と話者Aによる発話音声とが入力された状態(同時通話状態:ダブルトーク状態)であっても、音響エコーキャンセル装置31は、帰還音信号としての話者Bの発話信号を有効に除去し、話者Aによる発話信号だけを送出信号(Sout)として話者B側(伝送路)へと送出することができる。
これにより、本実施形態3では、音響エコーの発生を有効に抑制することができ、更には、話者A側のスピーカAから再生されたエコーが話者A側のマイクロフォンAで受音されることにより(話者B側についても同様)、音声信号の閉ループが形成されるという現象の発生を有効に抑制することができるため、ハウリングの発生を有効に防止することが可能となる。
以上実施形態1,2,3に示すように、本発明の音声入力装置(音響エコーキャンセル装置)では、適応フィルタの適応動作を平行して行う手段(具体的には、フィルタ係数算出手段および内積演算手段)と、適応動作のキャンセル量の監視を行う手段(キャンセル量比較部)とを備えた簡易な構成により、高精度な同時通話状態の検出処理を行うことなく、同時通話状態における適応信号処理を高精度に行うことができる。
また、この音声入力装置(音響エコーキャンセル装置)により処理され出力される送出信号(Sout)の劣化を有効に抑制することができる。
更には、上述のように、実施形態1、2、および3における適応フィルタの適応動作をH∞フィルタ(「高速算出フィルタ」に相当)を用いて行うことにより、同時通話(ダブルトーク)状態時でも、適応フィルタの適応動作を迅速に行うことができ、更には、フィルタ係数の係数破壊(推定誤り)を抑制し、更には、帰還伝達系における急激な変動、および微小な変動の影響により生じる推定誤り等を有効に軽減することができる。
本発明は、会議システムや携帯電話等におけるエコーキャンセルシステムやカラオケなどの音声拡張装置におけるハウリングキャンセルシステムに対して有用に適用することができる。
1 音声入力(収音)装置
2 スピーカ
3 マイクロフォン
4 カーオーディオ
5 カーナビゲーションシステム
6 音声認識部
7 カラオケ音源
8 ミキサー
11 適応フィルタ部
12 加算部(第1の減算部)
13 加算部(第2の減算部)
14,15 キャンセル量算出部
16 キャンセル量比較部(減算量監視部)
100 帰還伝達系
111,112 フィルタ係数算出手段
113 遅延バッファ手段
114,115 内積演算手段(適応フィルタ)

Claims (4)

  1. マイクロフォンに接続され、予め設定されたスピーカ以外の外部音源から前記マイクロフォンに入力された外部音声信号を抽出信号として抽出する適応信号処理部を備えた音声信号抽出装置であって、
    前記適応信号処理部は、
    前記スピーカに入力される音声信号と前記マイクロフォンから入力されたマイク入力音声信号とに基づき前記スピーカから前記マイクロフォンへの伝達系を模擬したフィルタ係数の設定および更新を行う第1および第2の適応フィルタと、
    前記スピーカに入力される入力音声信号を前記第1の適応フィルタで演算処理し得られた模擬信号と前記マイク入力音声信号との差分を第1の残差信号として抽出すると共に、当該第1の残差信号を前記第1の適応フィルタ部に送り込む第1の減算部と、
    前記入力音声信号を前記第2の適応フィルタで演算処理して得られた模擬信号と前記マイク入力音声信号との差分を第2の残差信号として抽出すると共に、当該第2の残差信号を前記第2の適応フィルタ部に送り込む第2の減算部と、
    前記第1の減算部における前記マイク入力音声信号および前記第1の残差信号の差分量と前記第2の減算部における前記マイク入力音声信号および前記第2の残差信号の差分量とを監視する減算量監視部と、
    前記差分量の高い側の残差信号を前記抽出信号として送出する構成とし、
    前記減算量監視部は、前記第1の減算部で予め設定された値を超える差分量が検知された場合に、前記第1の適応フィルタにおけるフィルタ係数の更新動作を停止する係数更新停止制御機能を備えると共に、
    この減算量監視部は、更に、前記第1および第2の適応フィルタにおける係数更新の収束速度を、予め設定された収束速度の速いパラメータおよび遅いパラメータの少なくとも2種のパラメータを用いて制御する収束速度制御機能と、
    前記第1の適応フィルタにおけるフィルタ係数の更新動作停止中に、前記第2の適応フィルタにおける係数更新の収束速度を前記収束速度の遅いパラメータに基づき動作制御する低収束速度同定制御機能とを備えたことを特徴とする音声信号抽出装置。
  2. 前記請求項に記載の音声信号抽出装置において、
    前記減算量監視部は、前記第1の適応フィルタにおけるフィルタ係数の更新動作停止中に、前記第1の減算部で予め設定された値を下回る差分量が検知された場合に、前記第1および第2の適応フィルタにおける設定および更新動作を起動する再学習起動機能を備えたことを特徴とする音声信号抽出装置。
  3. 前記請求項1又は2に記載の音声信号抽出装置において、
    前記減算量監視部は、前記第1の適応フィルタにおけるフィルタ係数の更新動作停止中に前記第2の減算部の差分量が前記第1の減算部の差分量を超えたことが検知された場合に、前記第1の適応フィルタにおけるフィルタ係数を前記第2の適応フィルタのフィルタ係数に書き換えるフィルタ係数複製設定機能を備えたことを特徴とする音声信号抽出装置。
  4. 前記請求項1乃至の何れか1つに記載の音声信号抽出装置を要部として備えた拡声装置において、
    前記適応フィルタとして当該適応フィルタにおけるフィルタ係数を高速に算出する高速算出フィルタを用いることを特徴とした拡声装置。
JP2009114631A 2009-05-11 2009-05-11 音声抽出装置 Active JP5373473B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009114631A JP5373473B2 (ja) 2009-05-11 2009-05-11 音声抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009114631A JP5373473B2 (ja) 2009-05-11 2009-05-11 音声抽出装置

Publications (2)

Publication Number Publication Date
JP2010263567A JP2010263567A (ja) 2010-11-18
JP5373473B2 true JP5373473B2 (ja) 2013-12-18

Family

ID=43361251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009114631A Active JP5373473B2 (ja) 2009-05-11 2009-05-11 音声抽出装置

Country Status (1)

Country Link
JP (1) JP5373473B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10068585B2 (en) 2014-07-24 2018-09-04 Amenity Research Institute Co., Ltd. Echo canceller device

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101976091B1 (ko) 2013-01-24 2019-05-09 삼성전자주식회사 청각 기기의 동작 모드를 결정하는 방법 및 청각 기기
JP7045165B2 (ja) * 2017-11-02 2022-03-31 リオン株式会社 フィードバックキャンセラ及びそれを備えた補聴器

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09148965A (ja) * 1995-11-22 1997-06-06 Nec Corp 音響用エコーキャンセラ
JPH09153848A (ja) * 1995-11-30 1997-06-10 Sony Corp エコーキャンセラー
FI104524B (fi) * 1997-04-18 2000-02-15 Nokia Mobile Phones Ltd Kaiunpoistojärjestelmä ja -menetelmä sekä matkaviestin

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10068585B2 (en) 2014-07-24 2018-09-04 Amenity Research Institute Co., Ltd. Echo canceller device

Also Published As

Publication number Publication date
JP2010263567A (ja) 2010-11-18

Similar Documents

Publication Publication Date Title
EP2847760B1 (en) Error-signal content controlled adaptation of secondary and leakage path models in noise-canceling personal audio devices
JP6280199B2 (ja) パーソナルオーディオデバイスにおける適応雑音消去(anc)の有効性推定および補正
JP6964581B2 (ja) 固定応答フィルタによって部分的に提供されるフィードバック応答を有するフィードバック適応雑音消去(anc)コントローラおよび方法
US9264807B2 (en) Multichannel acoustic echo reduction
US20210112157A1 (en) Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters
US8811602B2 (en) Full duplex speakerphone design using acoustically compensated speaker distortion
JP2006217542A (ja) ハウリング抑制装置および拡声装置
US9392364B1 (en) Virtual microphone for adaptive noise cancellation in personal audio devices
US20060210091A1 (en) Howling canceler apparatus and sound amplification system
WO2016013667A1 (ja) エコーキャンセラ装置
JP5373473B2 (ja) 音声抽出装置
JP2006261967A (ja) ハウリング抑制装置および拡声装置
JP2001005463A (ja) 音響装置
JP2006067127A (ja) 残響除去方法及びその装置
JP4852068B2 (ja) ステレオ音響エコーキャンセル方法、ステレオ音響エコーキャンセル装置、ステレオ音響エコーキャンセルプログラム、その記録媒体
JPH09116469A (ja) エコー・ノイズキャンセラおよびエコー・ノイズ消去方法
JP7497233B2 (ja) 車内コミュニケーション支援システム
US11462203B2 (en) In-vehicle communication support system
JP2006148375A (ja) エコー除去方法、エコーキャンセラ及び電話中継装置
US20230274723A1 (en) Communication support system
WO2024042938A1 (ja) 通話装置、通話方法及び通話プログラム
JP4247158B2 (ja) 多チャネル音響エコー消去方法、多チャネル音響エコー消去装置、多チャネル音響エコー消去プログラム、記録媒体
CN113347527A (zh) 声学路径的确定方法、装置、可读存储介质及电子设备
JP2004080647A (ja) エコーキャンセラー及び通話音声処理装置
JP2016025619A (ja) エコーキャンセラ装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130919

R150 Certificate of patent or registration of utility model

Ref document number: 5373473

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250