JP4432916B2 - 音声処理装置 - Google Patents

音声処理装置 Download PDF

Info

Publication number
JP4432916B2
JP4432916B2 JP2006057085A JP2006057085A JP4432916B2 JP 4432916 B2 JP4432916 B2 JP 4432916B2 JP 2006057085 A JP2006057085 A JP 2006057085A JP 2006057085 A JP2006057085 A JP 2006057085A JP 4432916 B2 JP4432916 B2 JP 4432916B2
Authority
JP
Japan
Prior art keywords
filter
coefficient
adaptive
semi
adaptive filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006057085A
Other languages
English (en)
Other versions
JP2007235770A (ja
Inventor
洋平 櫻庭
靖彦 加藤
信之 木原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006057085A priority Critical patent/JP4432916B2/ja
Priority to US11/681,025 priority patent/US8107617B2/en
Publication of JP2007235770A publication Critical patent/JP2007235770A/ja
Application granted granted Critical
Publication of JP4432916B2 publication Critical patent/JP4432916B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は音声処理装置に関し、特にスピーカとマイクロフォン(以下、マイクとする)とを備える拡声通話系の音声処理装置に関する。
ハンズフリー電話やテレビ会議システムなど、各装置がスピーカとマイクとを備えた拡声通話系では、ネットワークを介して接続する遠端装置と近端装置間において、遠端装置のマイクで収音された音声が近端装置に送られ、近端装置のスピーカから放音される。一方、近端装置が装備するマイクから収音される近端話者の音声も遠端装置へ送られ、遠端装置のスピーカから放音されるように構成されている。このため、遠端装置、近端装置それぞれでスピーカから放音される相手の音声がマイクに印加される。何も処理を行わない場合は、この音声が再び相手装置へ送られるため、自分の発声がこだまのように少し遅れてスピーカから聞こえる「エコー」という現象を引き起こす。エコーが大きくなると、再びマイクに印加されて系をループし、ハウリングを引き起こす。
従来、このようなエコーやハウリングを防止するための音声処理装置としてエコーキャンセラが知られている。エコーキャンセラでは、一般的に、適応フィルタを用いてスピーカとマイク間のインパルスレスポンスを学習し、スピーカから放音されるレファレンス信号に学習したインパルスレスポンスを畳み込んだ擬似エコーを生成し、擬似エコーをマイクに印加されるスピーカからの音声と見なし、マイクから入力した音声から差し引くことでエコーを除去する。一般に、適応フィルタの係数は、フィルタのエラー(マイク入力信号と擬似エコーとの差)が小さいほど優れていると判断される。
このようなインパルスレスポンスの学習では、近端話者の位置変動や環境変化などの系変動によって変化するため、適応フィルタの係数は、変化に追従して常に学習する必要がある。そこで、特定帯域を除去するフィルタの出力信号の電力と、特定帯域成分のみを通過させるフィルタの出力信号の電力とに応じて、適応フィルタの係数決定のためのステップサイズを制御するエコーキャンセラなどが提案されている(たとえば、特許文献1参照)。このようなエコーキャンセラでは、音声信号対外乱の比率が小さな領域では、ステップサイズを抑えて適応フィルタの係数の安定化を図り、信号対外乱の比率が大きくなり、外乱の影響が少ない状態では、ステップサイズを大きくして速い収束速度を得るようにステップサイズ制御を行っている。
特開2004−357053号公報(段落番号〔0032〕〜〔0041〕、図1)
しかしながら、上述のようなエコーキャンセル処理は、遠端話者が発話しておらず、スピーカからレファレンス信号のみが放音されているシングルトーク状態の場合には有効であるが、近端話者と遠端話者が同時に発話しているダブルトーク状態では、適応フィルタの係数を悪化させてしまう恐れがあるという問題点がある。
ダブルトーク状態では、近端話者の音声とともに、遠端話者の音声が加わったスピーカからの出力音声がマイクに入力されてしまう。これは、適応フィルタ処理において、エコー成分に加えて遠端話者の音声が外乱としてマイクに入力されることになる。したがって、エラーの大きさに応じて適応フィルタの係数を設定していると、遠端話者の音声を消すような間違ったフィルタ係数の方が設定されるという問題点がある。この結果、適応フィルタの係数が悪化し、エコーが発生してしまう。
これは、ステップサイズの制御を行う場合も同様であり、ダブルトーク時、外乱の比率が大きいとしてステップサイズを抑えて適応フィルタ係数の安定化が図られるが、結果として間違ったフィルタ係数が設定されてしまう。一旦、悪い適応フィル係数が設定されると、回復までに時間がかかり、その間の出力音声は安定しない。
本発明はこのような点に鑑みてなされたものであり、ダブルトークなどの外乱の変動による影響を抑え、フィルタ係数が崩れにくく安定的であって、収束の速い(系変動へ追従性がよい)音声処理装置を提供することを目的とする。
本発明では上記課題を解決するために、スピーカとマイクロフォンとを備える拡声通話系の音声処理装置であって、複数の適応フィルタ、半固定フィルタ、適応フィルタ評価手段、及び係数設定手段を具備する音声処理装置が提供される。複数の適応フィルタは、学習時の更新量が各々異なる任意の値に設定され、設定された更新量に応じてフィルタ係数を逐次決定する。半固定フィルタは、マイクから入力される音声入力信号のエコー除去処理に適用される。適応フィルタ評価手段は、複数の適応フィルタが各々決定したフィルタ係数に基づく更新ベクトルの大きさと、半固定フィルタに設定されるフィルタ係数に基づく更新ベクトルの大きさとを算出し、更新ベクトルの大きさに応じてフィルタ係数を評価する。係数設定手段は、適応フィルタ評価手段によるフィルタ係数の評価に基づいて、複数の適応フィルタのフィルタ係数のうち、所定の基準を満たす適応フィルタのフィルタ係数を検索し、検索した所定の基準を満たす適応フィルタのフィルタ係数を選択して半固定フィルタに設定する。
このような音声処理装置によれば、複数の適応フィルタは、学習時の更新量が各々異なる任意の値に設定されており、各々がマイクから入力する音声入力信号とレファレンス信号に基づき、設定された更新量に応じたフィルタ係数を逐次決定している。半固定フィルタは、係数設定手段の設定したフィルタ係数を用いて、マイクから入力される音声入力信号からエコーを除去する処理を行う。適応フィルタ評価手段は、複数の適応フィルタのフィルタ係数に基づく更新ベクトルの大きさと、半固定フィルタのフィルタ係数に基づく更新ベクトルの大きさとを算出し、更新ベクトルの大きさに基づいてフィルタ係数を評価する。更新ベクトルが小さいということは、更新する必要がない、すなわち、正解に近いということを意味し、評価が高くなる。係数設定手段は、適応フィルタ評価手段による評価結果に基づき、複数の適応フィルタのフィルタ係数のうち、所定の基準を満たす適応フィルタのフィルタ係数を検索し、検索した所定の基準を満たす適応フィルタのフィルタ係数を選択して半固定フィルタのフィルタ係数に設定して更新する。
本発明の音声処理装置によれば、更新量が任意に設定される適応フィルタのフィルタ係数を更新ベクトルの大きさに応じて評価し、所定の基準を満たす適応フィルタのフィルタ係数を選択して半固定フィルタに設定することができる。したがって、所定の基準を満たすフィルタ係数をエコーキャンセル処理に用いることができるようになる。特に、ダブルトークなどの外乱によって、更新ベクトルは大きくなるので、更新ベクトルの大きさに基づく評価を用いてフィルタ係数を選択することにより、外乱の影響を抑えることができる。
以下、本発明の実施の形態を図面を参照して説明する。まず、実施の形態に適用される発明の概念について説明し、その後、実施の形態の具体的な内容を説明する。
図1は、実施の形態に適用される発明の概念図である。
本発明にかかる音声処理装置は、それぞれ異なる更新量が設定されている適応フィルタ1(3−1)、適応フィルタ2(3−2)、・・・、適応フィルタN(3−3)、音声処理に適用される処理用フィルタである半固定フィルタ4、適応フィルタをフィルタ係数に基づく更新ベクトルの大きさで評価する適応フィルタ評価手段5、半固定フィルタ4のフィルタ係数を設定する係数設定手段6及び判定情報を記憶する判定情報データベース(以下、DBとする)7を具備する。以下、特に適応フィルタ1(3−1)、適応フィルタ2(3−2)、・・・、適応フィルタN(3−3)を指定する必要がない場合は、適応フィルタ(3−n)と表記する。
更新量が異なる値に設定される適応フィルタ1(3−1)、適応フィルタ2(3−2)、・・・、適応フィルタN(3−3)は、スピーカへ出力する音声信号に基づくレファレンス信号1から、マイクから入力される音声信号であるマイク入力信号2に含まれるエコー成分の推定値を算出し、その値をマイク入力信号2から差し引いてから所定の適応アルゴリズムに基づきフィルタ係数を更新する。更新量が大きめに設定されている場合は、係数の収束は速いが、エコー以外の音によって係数が崩れやすい。一方、小さめに設定されている場合は、エコー以外の音においても係数は崩れにくくなるが、係数の収束は遅くなる。適応フィルタ(3−n)のフィルタ係数は、適応フィルタ評価手段5から読み出し可能であるとともに、係数設定手段6から読み出しと書き込みが可能である。
半固定フィルタ4は、レファレンス信号1とマイク入力信号2とを入力し、係数設定手段6によって設定されたフィルタ係数に基づきマイク入力信号2に含まれるエコー成分の推定値を算出し、マイク入力信号2から算出されたエコー成分の推定値を差し引くことによってエコー除去処理を行う。半固定フィルタ4のフィルタ係数は、適応フィルタ評価手段5から読み出し可能であるとともに、係数設定手段6から読み出しと書き込みが可能である。また、逐次フィルタ係数を更新する適応フィルタ(3−n)とは異なり、フィルタ係数は、係数設定手段6によって更新する場合を除き、設定された値に固定する。
適応フィルタ評価手段5は、適応フィルタ1(3−1)、適応フィルタ2(3−2)、・・・、適応フィルタN(3−3)各々について更新ベクトルの大きさを算出し、算出された更新ベクトルの大きさに基づき、各々の適応フィルタのフィルタ係数を評価する。更新ベクトルの詳細については後述するが、w(n)を{w,w,・・・,wp−1}の順で配列されたn回目のエコーキャンセリング処理での適応フィルタの係数ベクトル(p次元)、x(n)を{x,xt−1,xt−2,・・・,xt−(p−1)}の順で配列されたレファレンス信号の時間領域データベクトル(同じくp次元)とすると、n+1回目の係数ベクトルw(n+1)は、
w(n+1)=w(n)+μ{a(n)x(n)+a(n)x(n−1)}
・・・(1)
と表すことができる。なお、μは、更新のステップサイズである。右辺の{a(n)x(n)+a(n)x(n−1)}が更新ベクトルに相当し、更新ベクトルとステップサイズによって、n+1回目の係数ベクトルw(n+1)が決定する。更新ベクトルの大きさは、更新ベクトルの絶対値を算出することによって得られる。ここで、更新ベクトルが大きいということは、フィルタ係数の変化量が大きいということで、小さいということは、フィルタ係数をあまり変化させる必要がない、すなわち、正解に近いということである。したがって、適応フィルタ評価手段5では、算出された更新ベクトルの大きさに応じて、各々のフィルタ係数が正解に近いかどうかを評価する。なお、半固定フィルタ4のフィルタ係数も同様に評価を行う。評価結果は、係数設定手段6へ通知する。
係数設定手段6は、適応フィルタ評価手段5による判定結果に応じて、最も適している適応フィルタ(3−n)のフィルタ係数を選択し、選択したフィルタ係数を半固定フィルタ4にコピーする。なお、半固定フィルタ4のフィルタ係数を安定的に変化させるためには、1回の評価でコピーを行うのではなく、適応フィルタ(3−n)が、予め決められた所定の回数連続してエコー消去量の基準値を超えた場合に、更新の基準を満たしたと判定し、コピーを行う。判定は、判定情報DB7に格納される判定基準を参照して行う。さらに、必要に応じて、適応フィルタ(3−n)の更新ベクトルの大きさが所定の基準(たとえば、半固定フィルタ4の更新ベクトルの大きさ)よりも大きい状態が所定の回数以上連続して発生したと判定された場合には、当該適応フィルタ(3−n)のフィルタ係数に半固定フィルタ4のフィルタ係数を設定する。以下、このように、半固定フィルタ4のフィルタ係数を適応フィルタ(3−n)に設定する処理を逆コピーとする。
判定情報DB7は、判定に関する情報を格納する記憶手段である。係数設定手段6が参照する適応フィルタ(3−n)がコピーの基準を満たしたと判定されるために「更新ベクトルが連続して基準値を下回らなければならない回数」などの判定基準となる閾値情報や、適応フィルタ(3−n)の各々が基準値を超えた回数などのワーク情報が記憶される。
このような構成の音声処理装置の動作について説明する。
適応フィルタ1(3−1)、適応フィルタ2(3−2)、・・・、適応フィルタN(3−3)は、学習時の更新量が各々異なる値に設定されており、それぞれにレファレンス信号1とマイク入力信号2とを入力し、所定の適応アルゴリズムに基づいてフィルタ係数を逐次更新している。半固定フィルタ4には、所定のフィルタ係数が設定されており、レファレンス信号1とマイク入力信号2とを入力し、擬似エコー成分を算出してマイク入力信号2から差し引くことによって、マイク入力信号2からエコーを除去している。
適応フィルタ評価手段5は、適応フィルタ(3−n)それぞれに設定されるフィルタ係数により算出される更新ベクトルの大きさと、更新ベクトルの大きさの基準値、たとえば半固定フィルタ4に設定されるフィルタ係数により算出される更新ベクトルの大きさとを比較し、適応フィルタ(3−n)のフィルタ係数を評価する。係数設定手段6は、評価に基づいて、順コピー条件または逆コピー条件が成立したかどうかを判定し、成立していれば、フィルタ係数の順コピー、または逆コピーを行う。このとき、適応フィルタ(3−n)が所定の回数連続して基準値を下回ったかどうかを順コピーの条件とし、順コピー条件が成立したかどうかを判定する。なお、順コピー条件となる、適応フィルタ(3−n)が連続して基準値を超える回数は、適応フィルタ(3−n)の優先度に応じて設定しておくこともできる。優先度の高い適応フィルタ(3−n)の回数を小さくしておくことにより、優先度の高い適応フィルタ(3−n)のフィルタ係数が優先的に順コピーされる。これにより、半固定フィルタ4のフィルタ係数は、より適した値に更新される。なお、順コピー条件となる適応フィルタ(3−n)が連続して基準値を下回る回数はすべて同じにしておき、予め設定された優先度に従って選択する適応フィルタ(3−n)を決定するようにしてもよい。また、順コピー条件とは反対に、適応フィルタ(3−n)が所定の回数連続して基準値を上回ったかどうかを逆コピーの条件とし、逆コピー条件が成立したかどうかも判定する。そして、逆コピー条件が成立したと判定された適応フィルタ(3−n)のフィルタ係数に半固定フィルタ4のフィルタ係数をコピーする。
このように、半固定フィルタは、適応フィルタのフィルタ係数の方が適していると判定された場合に更新され、常に、その時点で最も適したフィルタ係数が設定されている。フィルタ係数のコピー元は、更新量が大きく、系変動への追従性のよい適応フィルタから、更新量が小さくフィルタ係数の崩れにくい適応フィルタまで、更新量の異なる複数の適応フィルタのうち、その時点で最も効果的な適応フィルタのフィルタ係数となる。したがって、系変動への追従性とフィルタ係数の安定性とをともに満たすことが可能となる。
さらに、各々の適応フィルタで係数が大きく崩れてしまった場合であっても、半固定フィルタからの逆コピーを行うことで、より正しいと思われる係数に修正される。これにより、すべての適応フィルタが半固定フィルタを介してお互いのフィルタ係数を修正することができる。
以下、実施の形態を、テレビ会議システムの音声処理部に適用した場合を例に図面を参照して詳細に説明する。
図2は、本発明の実施の形態におけるテレビ会議システムの構成を示した図である。図では、本発明の説明と関係のない処理部を省略している。
本実施の形態のテレビ会議システムは、スピーカ21aとマイク22aとを接続する会議端末10aと、スピーカ21bとマイク22bとを接続する会議端末10bが通信回線23によって接続されている。以下、任意の話者の近くに配置される会議端末10aを近端装置、近端装置10aと通信回線23を介して接続し、この話者からは遠方に位置する会議端末10bを遠端装置10bとする。近端装置10aと遠端装置10bは、同様の構成をしており、図では遠端装置10bの内部ブロック図を省略している。なお、通信回線23は、イーサネット(登録商標)などの一般的なディジタル通信回線である。
近端装置10aに接続されたスピーカ21aは、遠端装置10bから送られた音声データを近端装置10aで処理して放音する。近端装置10aに接続されたマイク22aは、近端装置10aのテレビ会議出席者の発言音声を収音する。このとき、空間を介して入力されるスピーカ21aから放音される音声が重畳して収音される。遠端装置10bの場合も同様である。
以下、近端装置10a及び遠端装置10bの内部構成を近端装置10aの場合で説明する。近端装置10aは、スピーカ21aに接続するD/A変換器11、マイク22aに接続するA/D変換器12、音声信号を処理する信号処理部13、音声信号の符号化/復号処理を行う音声コーデック14及び通信回線23に接続する通信部15を具備する。
D/A変換器11は、信号処理部13で処理されたディジタル音声データをアナログへ変換する。アナログ音声信号は、図示しない増幅器で増幅された後、スピーカ21aから放音される。A/D変換器12は、マイク22aで収音された音声が、図示しない増幅器で増幅されたアナログ音声信号をディジタル音声データに変換する。信号処理部13は、一般的にディジタルシグナルプロセッサー(DSP)で構成され、入力及び出力の音声データを所望のデータへ変換する処理を行うとともに、入力音声データからエコーを除去するエコーキャンセリング処理を実行する。このエコーキャンセリング処理の詳細は後述する。音声コーデック14は、信号処理部13から送られてくるマイク22a入力に基づく音声データをテレビ会議システムの通信で標準的に定められている符号へ変換するとともに、通信部15から送られてくる遠端装置10bによって符号化された音声データをデコードし、信号処理部13へ送る。通信部15は、遠端装置10bとの間で、符号化された音声データを含む入出力データを、所定のディジタルデータ通信プロトコルに基づき、通信回線23を介して送受信する。
このような構成の近端装置における音声処理について説明する。
図3は、本発明の実施の形態の近端装置(音声処理装置)の処理手順を示すフローチャートである。
近端装置10aは、遠端装置10bから音声データを受信すると同時に、マイク22aが収音した音声データの処理を行う。まず、遠端装置10bからのデータ受信処理について説明する。
[ステップS01a] 近端装置10aは、通信回線23を介して遠端装置10bから送信される符号化された音声データを通信部15で受信する。受信データは、音声コーデック14へ送る。
[ステップS02a] 音声コーデック14は、この受信データをデコードし、たとえば、32KHzサンプリング16ビットストレートPCMのディジタル音声データとして信号処理部13へ送る。ディジタル音声データは、信号処理部13を経由して、D/A変換器11にも送られる。
次に、同時に実行されるマイクで収音した音声データの処理について説明する。
[ステップS01b] マイク22aは、近端装置10aの周辺の音を収音する。したがって、マイク22aの入力信号には、近端装置10aの周辺にいる話者の音声のほか、スピーカ21aから放音された音声信号が含まれる。
[ステップS02b] マイク22aの入力信号をA/D変換器12によってディジタル音声データに変換し、信号処理部13へ送る。
以上の処理手順が実行されることにより、D/A変換器11には遠端装置10bの音声データが、そして信号処理部13には、遠端装置10bの音声信号と、マイク22aで収音した入力信号が入力される。
[ステップS03] D/A変換器11は、ステップS02aによって送られたディジタル音声データをアナログ信号に変換する。
[ステップS04] ステップS03により生成されたアナログ信号は、アンプによって増幅された後、スピーカ21aから放音される。
一方、信号処理部13には、マイク22aの入力信号とともに、遠端装置10bの音声データが参照信号として入力される。この参照信号とマイク22aの入力信号は、常に1サンプルずつ、同じタイミングで与えられるものとする。
[ステップS05] 信号処理部13は、ステップS02aにより入力された参照信号に基づき、ステップS02bにより入力されたマイク22aの入力信号からエコー成分を除去する音声信号処理を行う。詳細は、後述する。
[ステップS06] 信号処理部13によってエコー成分が除去されたマイク22aの入力信号は、音声コーデック14で、予め定められている符号へエンコードされ、通信部15へ送られる。
[ステップS07] 通信部15は、音声コーデック14でエンコードされた音声データを、通信回線23を介して遠端装置10bへ送信する。
このように、近端装置10aは、遠端装置10bによってエコー成分が除去された音声データをスピーカ21aから出力するとともに、マイク22aが収音した入力信号からスピーカ21aからの放音に由来するエコー成分を除去した音声データを遠端装置10bに送信する。
以下、信号処理部13の詳細を、第1、第2、及び第3の実施の形態により説明する。
第1の実施の形態では、適応フィルタが、更新量の異なる複数の適応フィルタにより構成される。
図4は、本発明の第1の実施の形態の信号処理部の構成を示した図である。なお、信号処理部30は、図2に示した会議端末の信号処理部13に組み込まれる。
レファレンス信号31は、音声コーデック14から入力され、D/A変換器11を経てスピーカ21aから出力される音声データである。
マイク入力信号32は、マイク22aによって収音された音声信号で、A/D変換器12を経て入力され、エコーキャンセリング処理を施した後、音声コーデック14へ出力される。
信号処理部30は、更新量を制御するステップサイズの異なる適応フィルタ1(33−1)、適応フィルタ2(33−2)、・・・、適応フィルタN(33−3)及び半固定フィルタ34を有する。また、信号処理部30へは、レファレンス信号31と、マイク入力信号32とが入力される。なお、レファレンス信号31とマイク入力信号32とは、常に1サンプルずつ同じタイミングで与えられるものとする。
適応フィルタ1(33−1)、適応フィルタ2(33−2)、・・・、適応フィルタN(33−3)は、それぞれにステップサイズ(μ)の異なる適応フィルタである。ステップサイズは、適応フィルタの更新量を制御するパラメータで、式(1)に示したように、ステップサイズ(μ)が大きいほど更新量は大きくなり、ステップサイズ(μ)が小さいほど更新量は小さくなる。
半固定フィルタ34は、レファレンス信号31から擬似エコー成分を算出し、マイク入力信号32から擬似エコー成分を差し引くことによってエコーを除去し、その信号を音声コーデック14へ出力する。半固定フィルタ34のフィルタ係数は、図示しない適応フィルタ評価部による更新ベクトルの大きさに応じた評価に基づき、最も評価の高い適応フィルタのフィルタ係数が設定される。
音量レベル制御35は、更新ベクトルの大きさ、たとえば、適応フィルタ評価部により最も高い評価を受けた適応フィルタの更新ベクトルの大きさに基づき、出力する音量レベルを制御する。実際のエコーキャンセラ処理では、人の動きなどのような小さな系変動や部屋のノイズなどによりフィルタ係数が完全な正解になることはできず、残留エコー(エコーの消し残り)が生じる。シングルトーク時には、適応フィルタは、処理開始から安定するまでの更新ベクトルは大きくなるが、収束するに従って次第に小さくなる方向に変わる。しかし、ダブルトーク状態になると、更新ベクトルがいきなり大きな値をとるようになる。この状態を検出して、シングルトークまたはダブルトークを判定し、音量レベルを制御する。すなわち、更新ベクトルが小さくなっていく場合はシングルトークと判断し、エコーキャンセル処理後の半固定フィルタ34の出力信号をミュートする。もしくは、音量を小さくするようにしてもよい。逆に更新ベクトルが大きくなった場合は、ダブルトーク状態と判断し、エコーキャンセル処理後の出力信号を相手にそのまま送る。これにより、ダブルトーク時の音声を損なうことなく、エコーの消し残りを抑制することができる。
このような信号処理部30における処理の大まかな流れについて説明する。図5は、本発明の第1の実施の形態の信号処理部の処理手順を示すフローチャートである。
1サンプルのレファレンス信号31とマイク入力信号32とが与えられて処理が開始される。
[ステップS51] まず、半固定フィルタ34のフィルタ係数を用いてエコーキャンセリング処理を行う。エコーキャンセリング処理では、
Figure 0004432916
によって、エコーキャンセリング処理の対象となる時刻tのマイク入力信号32に含まれるエコー成分の推定値y(t)を算出する。そして、その値をマイク入力信号32の値から減算(エコーキャンセリング)して音声コーデック14へ送る。
前述のように、w(n)は、{w,w,・・・,wp−1}の順で配列されたn回目のエコーキャンセリング処理での適応フィルタの係数ベクトル(p次元)、x(n)は、{x,xt−1,xt−2,・・・,xt−(p−1)}の順で配列されたレファレンス信号の時間領域データベクトル(同じくp次元)を表す。また、t−1はtの1ターン前、t−2はtの2ターン前のエコーキャンセリング処理対象となる時刻を表し、各々の時間は一定間隔で並んでいる。
[ステップS52] 適応フィルタ1(33−1)、適応フィルタ2(33−2)、・・・、適応フィルタN(33−3)において、それぞれ式(1)によりエコーキャンセリング処理の対象となる時刻tのマイク入力信号32に含まれるエコー成分の推定値y(t)を算出する。次に、推定されたy(t)をマイク入力信号32から減算した値をエラー信号e(n)として、たとえば、前述の式(1)、及び以下に示した式(3)を用いて、n+1ターン目の係数ベクトルw(n+1)を決定する。
Figure 0004432916
ここで、係数ベクトルの次元pは、適応フィルタのタップ長と呼ばれ、これを短めに設定すると係数の収束は速いが、係数の収束限界が浅くなり、逆に長く設定すると収束限界は深くなるものの、収束は遅くなる。このように、タップ長を変化させてもステップサイズを変化させた場合と同様の効果が得られるので、適応フィルタ1(33−1)、適応フィルタ2(33−2)、・・・、適応フィルタN(33−3)を、タップ長の値を変えて構成してもよい。なお、このような更新式は他にもいくつか存在し、使用する更新式によって性質は多少異なる。
[ステップS53] 適応フィルタ1(33−1)、適応フィルタ2(33−2)、・・・、適応フィルタN(33−3)から半固定フィルタ34への順コピー判定を行い、順コピー条件を満たした適応フィルタの中で最も優先度の高い適応フィルタの係数を半固定フィルタ34へコピーする。順コピー処理の詳細は後述する。
[ステップS54] 半固定フィルタ34から適応フィルタ1(33−1)、適応フィルタ2(33−2)、・・・、適応フィルタN(33−3)への逆コピー判定を行い、逆コピー条件を満たした適応フィルタには、半固定フィルタ34の係数をコピーする。逆コピー処理の詳細は後述する。
[ステップS55] ステップS53で選択された最も優先度の高い適応フィルタの係数に基づく更新ベクトルの大きさに応じて、エコーキャンセル処理終了後の音声出力信号の音量レベルを制御する。音量レベルの制御は、たとえば、更新ベクトルの大きさを所定の閾値と比較し、閾値より下であれば、シングルトークと判断してミュート処理を行い、閾値を超えていればダブルトークと判断して音量レベルを維持する。また、音量レベルを、更新ベクトルの絶対値の最小値を音量レベル0(ミュート)、更新ベクトルの最大値を音量レベル1(音量を絞らない)とする更新ベクトルの絶対値の関数として算出してもよい。
ここで、順コピー処理の詳細について説明する。図6は、本発明の第1の実施の形態の逆コピーの前に実行する順コピー処理手順を示したフローチャートである。
なお、ここでは、半固定フィルタがなるべく速く収束するように、適応フィルタはステップサイズの小さい順に1からNの番号が割り振られているとする。したがって、N番目は最もステップサイズが大きく設定されている適応フィルタで、優先度が最も高い。また勝利回数カウンタV1〜VNの初期値は全て0とする。
[ステップS501] 2つの使い捨て変数i、jを初期化する。iは、半固定フィルタと比較を行う適応フィルタに割り振られた番号に対応し、1(適応フィルタの最小番号)に初期化する。jは、順コピー条件を満たした適応フィルタの中で最も優先度の高い適応フィルタを記憶するための変数であり、0(順コピー条件を満たす適応フィルタなし)に初期化する。以下、i番目の適応フィルタを適応フィルタ(i)と表記する。
[ステップS502] 対象の適応フィルタを指示するiと、適応フィルタの総数(N)とを比較する。iがNより大きい場合、全適応フィルタに対する処理が終了したと判断し、処理をステップS509へ進める。iがN以下の場合、iが指示する対象の適応フィルタに対し、ステップS503以降の処理を行う。
[ステップS503] 適応フィルタ(i)と半固定フィルタとを比較する。ここでは、各々のフィルタ係数から算出される更新ベクトルの絶対値を比較し、値の小さい方を勝ちとする。前述のように、更新ベクトルの絶対値が小さい方が正解に近いフィルタ係数と見なせる。半固定フィルタが勝ちの場合、処理をステップS504に進め、適応フィルタが勝ちの場合、処理をステップS505へ進める。まれに引き分ける場合もあるが、ここでは引き分けた場合も適応フィルタの勝ちとする。
[ステップS504] 半固定フィルタが勝ちの場合、半固定フィルタのフィルタ係数の方が適していると判断し、適応フィルタ(i)に対応する勝利回数カウンタ(図では、単にカウンタとしている)Viのカウンタ値を1減算する。具体的には、逆コピー条件も順コピー条件と同一のカウンタで管理するため、勝利回数カウンタViの値に応じて、Viが正の値であれば、Vi=−1を設定し、そうでない場合はViの値を1減算する。そして、処理をステップS508へ進める。
[ステップS505] 適応フィルタが勝ちの場合、適応フィルタのフィルタ係数の方が適していると判断し、適応フィルタ(i)に対応する勝利回数カウンタViをカウントアップする。具体的には、勝利回数カウンタViが負の値の場合もあるので、勝利回数カウンタViが負の値ならば、Vi=1を設定し、そうでない場合はViの値を1増加させる。
[ステップS506] 勝利回数カウンタViの値と、順コピー条件を満たす連続勝利回数の閾値(閾値1)とを比較し、適応フィルタ(i)が順コピー条件を満たしたかどうかを判定する。勝利回数カウンタViの値が閾値1に到達した場合は、順コピー条件成立と判定し、処理をステップS507へ進める。閾値1に到達しない場合は、順コピー条件不成立と判定し、処理をステップS508へ進める。
[ステップS507] ステップS506によって順コピー条件成立と判定された場合、jにiの値を代入する。
[ステップS508] iを1増加させてステップS502に戻って、次の適応フィルタに関する処理を繰り返す。
以上の処理手順が実行されることにより、優先度の低い適応フィルタから順に半固定フィルタとの比較が行われる。適応フィルタが勝った場合は勝利回数カウンタを正の方向に増加させる(1から開始し、1ずつ増加させる)。半固定フィルタが勝った場合は、勝利回数カウンタを負の方向に減少させる(−1から開始し、1ずつ減少させる)。したがって、符号が正である場合、Viの値は適応フィルタ(i)が連続して勝利した連続勝利回数を表し、符号が負である場合Viの絶対値は連続して敗北した連続敗北回数を表す。そして、連続勝利回数が閾値1を超えている場合には、適応フィルタ(i)の番号iをjに格納する。i=1から順に繰り返すことにより、jには、順コピー条件が成立した適応フィルタのうち、最も優先度の高い適応フィルタの番号が設定される。
[ステップS509] すべての適応フィルタについて比較が行われたので、順コピー条件が成立した適応フィルタがあれば、jにはそのうち最も優先度の高い適応フィルタの番号が設定されている。jが0でないかどうかを判定し、0であれば、順コピー条件成立フィルタなしと判断し、処理を終了する。
[ステップS510] jが0でなければ、jが指示する適応フィルタ(j)のフィルタ係数を半固定フィルタにコピーして、フィルタ係数を更新する。さらに、各適応フィルタに対応する勝利回数カウンタV1〜VNの値を0に設定し、処理を終了する。
以上の処理手順が実行されることにより、順コピー条件が成立した適応フィルタのうち、最も優先度の高い適応フィルタのフィルタ係数が半固定フィルタにコピーされる。
次に、続けて実行される逆コピー処理手順について説明する。
図7は、本発明の第1の実施の形態の順コピー終了後の逆コピー処理手順を示したフローチャートである。図6に示した順コピー処理により、勝利回数カウンタViには、値が設定されているとする。
[ステップS511] まず、使い捨て変数iを1に初期化する。iは、図6の場合と同様に、適応フィルタを指示する。
[ステップS512] iと適応フィルタの総数(N)とを比較する。iがNより大きい場合、全適応フィルタに対する処理が終了したと判断し、処理を終了する。iがN以下の場合、iが指示する対象の適応フィルタに対し、以下の処理を行う。
[ステップS513] 勝利回数カウンタViの値と、逆コピー条件である閾値2とを比較し、逆コピー条件が成立するかどうかを判定する。閾値2で指定された連続敗北回数となった場合、逆コピー条件を満たしたと判定し、処理をステップS514へ進める。連続敗北回数に到達しない場合、処理をステップS516へ進める。
[ステップS514] 逆コピー条件が満たされた場合、適応フィルタ(i)のフィルタ係数に半固定フィルタのフィルタ係数をコピーする。
[ステップS515] 勝利回数カウンタViの値を0に初期化する。
[ステップS516] iを1増加させてステップS512に戻って、次の適応フィルタに関する処理を繰り返す。
以上の処理手順が実行されることにより、逆コピー条件が成立した適応フィルタに、半固定フィルタのフィルタ係数がコピーされる。
なお、上記の説明の本発明の第1の実施の形態は、一例であり、本発明はこれに限定されない。実施の形態の変形例など、他にも様々な適用形態が可能である。
たとえば、上記の説明では、適応フィルタから半固定フィルタへの順コピー条件と、半固定フィルタから適応フィルタコピーへの逆コピー条件とがすべての適応フィルタで同じとしたが、この条件は各々の適応フィルタで異なっていてもよい。たとえば、適応フィルタ1(33−1)では、エラーのパワー値が小さい方を勝ちとし、30回連続で勝利したら半固定フィルタへの順コピー条件を満たし、15回連続で敗北したら逆コピー条件を満たすとする。これに対し、適応フィルタ2(33−2)では、倍の60回連続で勝利したら順コピー条件を満たし、30回連続で敗北したら逆コピー条件を満たすといった設定も可能である。
また、上記の説明では、順コピーが行われた後、勝利回数カウンタV1〜VNのすべての値を0に初期化したが、負の値をとるものに関しては、初期化を行わないなどの方法も考えられる。
さらに、ステップサイズの大きいものほど優先度を高くしたが、上述のように適応フィルタごとに順コピー条件・逆コピー条件が異なる場合などには、これに限る必要はない。
また、図5に示した音声処理手順も、以下のような変形が可能である。
図5の音声処理手順では、半固定フィルタのエコーキャンセリング処理(ステップS51)は、順コピー処理(ステップS53)及び逆コピー処理(ステップS54)よりも前に行うとしているが、後に行うようにすることもできる。この場合、コピーが行われる前の半固定フィルタにおけるエラーを予め算出しておかなければならないが、半固定フィルタの係数の更新が図5の処理手順よりも1ターン分早くなるという利点がある。
また、上記の説明では、順コピー処理(ステップS53)を実行した後、逆コピー処理(ステップS54)を実行するとしたが、その順番は逆であってもよい。
ここで逆コピー処理、順コピー処理の順で処理を行う場合の手順について説明する。なお、i、j、Vi(ここでも勝利回数カウンタV1〜VNの初期値は0)、及び適応フィルタの並び順については、図6、図7と同様である。
図8は、本発明の第1の実施の形態の順コピー処理の前に実行する逆コピー処理手順を示したフローチャートである。
[ステップS521] 使い捨て変数iを1に初期化する。
[ステップS522] 対象の適応フィルタを指示するiと、適応フィルタの総数(N)とを比較する。iがNより大きい場合、全適応フィルタに対する処理が終了したと判断し、処理を終了する。iがN以下の場合、iが指示する対象の適応フィルタに対し、以下の処理を行う。
[ステップS523] 適応フィルタ(i)と、半固定フィルタとを比較する。図6と同様に、各々のフィルタ係数から算出される更新ベクトルの絶対値を比較し、値の小さい方を勝ちとする。半固定フィルタが勝ちの場合、処理をステップS525に進め、適応フィルタが勝ちの場合、処理をステップS524へ進める。ここでも引き分けた場合は適応フィルタの勝ちとする。
[ステップS524] 適応フィルタが勝ちの場合、適応フィルタのフィルタ係数の方が適していると判断し、適応フィルタ(i)に対応する勝利回数カウンタViをカウントアップする。具体的には、勝利回数カウンタViが負の値の場合もあるので、勝利回数カウンタViが負の値ならば、Vi=1を設定し、そうでない場合はViの値を1増加させる。そして、処理をステップS528に進める。
[ステップS525] 半固定フィルタが勝ちの場合、半固定フィルタのフィルタ係数の方が適していると判断し、適応フィルタ(i)に対応する勝利回数カウンタViのカウンタ値を1減算する。具体的には、逆コピー条件も順コピー条件と同一のカウンタで管理するため、勝利回数カウンタViの値に応じて、Viが正の値であれば、Vi=−1を設定し、そうでない場合は1減算する。
[ステップS526] 勝利回数カウンタViの値と、逆コピー条件である閾値2とを比較し、逆コピー条件が成立するかどうかを判定する。閾値2で指定された連続敗北回数となった場合、逆コピー条件を満たしたと判定し、処理をステップS527へ進める。連続敗北回数に到達しない場合、処理をステップS528へ進める。
[ステップS527] 逆コピー条件が満たされた場合、適応フィルタ(i)のフィルタ係数に半固定フィルタのフィルタ係数をコピーし、勝利回数カウンタViの値を0に初期化する。
[ステップS528] iを1増加させてステップS522に戻って、次の適応フィルタに関する処理を繰り返す。
以上の処理手順が実行されることにより、優先度の低い適応フィルタから順に半固定フィルタとの比較が行われる。適応フィルタが勝った場合は勝利回数カウンタを正の方向に増加させる(1から開始し、1ずつ増加させる)。半固定フィルタが勝った場合は、勝利回数カウンタを負の方向に減少させる(−1から開始し、1ずつ減少させる)。したがって、符号が正である場合、Viの値は連続して勝利した連続勝利回数を表し、符号が負である場合Viの絶対値は連続して敗北した連続敗北回数を表す。そして、連続敗北回数が閾値2に到達した場合には、逆コピー条件が成立したとみなし、適応フィルタ(i)のフィルタ係数に、半固定フィルタのフィルタ係数をコピーする。
続けて、順コピー処理が行われる。
図9は、本発明の第1の実施の形態の逆コピー終了後の順コピー処理手順を示したフローチャートである。
[ステップS531] 使い捨て変数iを1に、jを0に初期化する。
[ステップS532] 対象の適応フィルタを指示するiと、適応フィルタの総数(N)とを比較する。iがNより大きい場合、全適応フィルタに対する処理が終了したと判断し、処理をステップS536へ進める。iがN以下の場合、以下の処理を行う。
[ステップS533] 勝利回数カウンタViの値と、順コピー条件を満たす勝利回数の閾値(閾値1)とを比較し、適応フィルタ(i)が順コピー条件を満たしたかどうかを判定する。勝利回数カウンタViの値が閾値1に到達しない場合は、順コピー条件不成立と判定し、処理をステップS535へ進める。
[ステップS534] ステップS533によって順コピー条件成立と判定された場合、jにiの値を代入する。
[ステップS535] iを1増加させてステップS532に戻って、次の適応フィルタに関する処理を繰り返す。
[ステップS536] すべての適応フィルタについて比較が行われたので、順コピー条件が成立した適応フィルタがあれば、jにはそのうち最も優先度の高い適応フィルタの番号が設定されている。jが0でないかどうかを判定し、0であれば、順コピー条件成立フィルタなしと判断し、処理を終了する。
[ステップS537] jが0でなければ、jが指示する適応フィルタ(j)のフィルタ係数を半固定フィルタにコピーして、フィルタ係数を更新する。さらに、各適応フィルタに対応する勝利回数カウンタV1〜VNの値を0に設定し、処理を終了する。
以上の処理手順が実行されることにより、順コピー条件が成立した適応フィルタのうち、最も優先度の高い適応フィルタのフィルタ係数が半固定フィルタにコピーされる。
次に、第2の実施の形態について説明する。第1の実施の形態では、適応フィルタを更新量の異なる複数の適応フィルタで構成したが、第2の実施の形態では、適応フィルタを任意の更新量を設定することができる1の適応フィルタで構成する。
なお、第2の実施の形態における信号処理部が有する処理機能の構成要素は、図4に示した第1の実施の形態の構成要素と同様である。そこで、図4に示した構成要素の符号を用いて、第2の実施の形態における機能を説明する。また、第2の実施の形態における処理の全体的な流れは、図5に示した第2の実施の形態と同じである。ただし、順コピー及び逆コピーの判定は、適応フィルタ33bと半固定フィルタ34との間でのみ行われる。
図10は、本発明の第2の実施の形態の信号処理部の構成を示した図である。
第2の実施の形態の信号処理部30bは、適応フィルタ部が、1の適応フィルタ33bのみで構成されており、適応フィルタ33bの更新量を制御する更新量制御部37を有する。
第1の実施の形態で説明したように、シングルトーク時には、適応フィルタが収束するに従って更新ベクトルの大きさが次第に小さくなる方向に変わるが、ダブルトーク状態になると、更新ベクトルがいきなり大きな値をとるようになる。そこで、更新量制御部37は、更新ベクトルの大きさに応じて、適応フィルタ33bのフィルタ係数の更新量、たとえば、ステップサイズを設定する。たとえば、更新ベクトルの大きさに応じてダブルトーク状態であると判定したときは、フィルタ係数を更新しない。すなわち、ステップサイズを0にする。また、ダブルトークではないと判定した場合には、ステップサイズを通常値に戻す。
図11は、本発明の第2の実施の形態におけるステップサイズ設定の一例を示した図である。図は、水平方向が更新ベクトルの絶対値を表し、垂直方向がステップサイズのレベルを表している。
例1(101)は、前述のように、更新ベクトルの絶対値が閾値以下の場合をシングルトークと判断して更新量(ステップサイズμ)を通常レベル(=1.0)に戻す。そして、更新ベクトルの絶対値が閾値を超えた場合、ダブルトークと判断して、更新量(ステップサイズμ)を0にする。
例2(102)及び例3(103)は、更新量(ステップサイズμ)を、更新ベクトルの大きさに応じて順次変化させる場合を示しており、更新ベクトルの絶対値が小さくなる方向にあるときは、ステップサイズμを大きくし、更新ベクトルの絶対値が大きくなる方向にあるときは、ステップサイズμを小さくする。なお、更新レベルの絶対値に応じてステップサイズを決定する関数は、システムに応じて任意に設定することができる。
このように、第2の実施の形態では、更新ベクトルの絶対値の大きさに応じて更新量を変化させることにより、第1の実施の形態と同様の効果が得られる。
次に、第3の実施の形態について説明する。第1及び第2の実施の形態では、音声信号の全周端数帯域を一括して処理していたが、第3の実施の形態では、音声信号を周波数帯域で分割し、分割された周波数帯域ごとに処理する。
なお、第3の実施の形態における信号処理部30cが有する処理機能の構成要素は、図4に示した第1の実施の形態の構成要素と同様である。そこで、図4に示した構成要素の符号を用いて、第3の実施の形態における機能を説明する。
図12は、第3の実施の形態の信号処理部の構成を示した図である。
第3の実施の形態の信号処理部30cは、分析フィルタバンク39a、39cによる帯域分割を256チャンネルとし、第1チャンネルを最も低い周波数の成分を出力するとし、順番に番号を付し、最も高い周波数成分のフィルタを第256チャンネルとする。そして、第1チャンネルから第128チャンネルについては、フィルタ1(38a)、フィルタ2(38b)、フィルタ3(38c)、・・・、フィルタ128(38d)を用いた音声処理を行い、第129チャンネルから第256チャンネルについては奇数または偶数のチャンネルの音声信号のみが伝達される。
フィルタ1(38a)、フィルタ2(38b)、フィルタ3(38c)、・・・、フィルタ128(38d)は、各々が第1の実施の形態の信号処理部30、または第2の実施の形態の信号処理部30bの構成をとる。したがって、帯域分割された音声信号ごとに、図4の第1の実施の形態、または図10の第2の実施の形態で説明した処理を行う。なお、第1チャンネルから第128チャンネルについてフィルタを用いた音声処理を行うのは、一般的に、低域側の周波数帯域に音声信号が多く含まれることによる。
第129チャンネルから第256チャンネルについては、スピーカ音声処理として、分析フィルタバンク39aによって帯域分割されたチャンネルの信号成分のうち、偶数番目のチャンネルの信号成分を除去して合成フィルタバンク39bへ送る。また、マイク音声処理として、分析フィルタバンク39cによって帯域分割されたチャンネルの信号成分のうち、奇数番目のチャンネルの信号成分を除去して合成フィルタバンク39dへ送る。
このように、第3の実施の形態では、帯域分割された音声信号ごとに、更新ベクトルの大きさに応じた適応フィルタの評価と、最適なフィルタ係数を半固定フィルタに設定する処理を行うことにより、第1の実施の形態及び第2の実施の形態と同様の効果を得ることができる。
実施の形態に適用される発明の概念図である。 本発明の実施の形態におけるテレビ会議システムの構成を示した図である。 本発明の実施の形態の近端装置(音声処理装置)の処理手順を示すフローチャートである。 本発明の第1の実施の形態の信号処理部の構成を示した図である。 本発明の第1の実施の形態の信号処理部の処理手順を示すフローチャートである。 本発明の第1の実施の形態の逆コピーの前に実行する順コピー処理手順を示したフローチャートである。 本発明の第1の実施の形態の順コピー終了後の逆コピー処理手順を示したフローチャートである。 本発明の第1の実施の形態の順コピーの前に実行する逆コピー処理手順を示したフローチャートである。 本発明の第1の実施の形態の逆コピー終了後の順コピー処理手順を示したフローチャートである。 本発明の第2の実施の形態の信号処理部の構成を示した図である。 本発明の第2の実施の形態におけるステップサイズ設定の一例を示した図である。 第3の実施の形態の信号処理部の構成を示した図である。
符号の説明
1・・・レファレンス信号、2・・・マイク入力信号、3−1・・・適応フィルタ1、3−2・・・適応フィルタ2、3−3・・・適応フィルタN、4・・・半固定フィルタ、5・・・適応フィルタ評価手段、6・・・係数設定手段、7・・・判定情報データベース(DB)

Claims (9)

  1. スピーカとマイクロフォンとを備える拡声通話系の音声処理装置において、
    学習時の更新量が各々異なる任意の値に設定され、設定された前記更新量に応じてフィルタ係数を逐次決定する複数の適応フィルタと、
    前記マイクロフォンから入力される音声入力信号のエコー除去処理に適用される半固定フィルタと、
    前記複数の適応フィルタが各々決定した前記フィルタ係数に基づく更新ベクトルの大きさと、前記半固定フィルタに設定される前記フィルタ係数に基づく前記更新ベクトルの大きさとを算出し、前記更新ベクトルの大きさに応じて前記フィルタ係数を評価する適応フィルタ評価手段と、
    前記適応フィルタ評価手段による前記フィルタ係数の評価に基づいて、前記複数の適応フィルタのフィルタ係数のうち、所定の基準を満たす適応フィルタのフィルタ係数を検索し、検索した前記所定の基準を満たす適応フィルタのフィルタ係数を選択して前記半固定フィルタに設定する係数設定手段と、
    を具備することを特徴とする音声処理装置。
  2. 前記係数設定手段は、評価に基づいて、前記複数の適応フィルタのフィルタ係数のうちの2以上の前記適応フィルタのフィルタ係数が前記所定の基準を満たす場合は、予め設定された優先度にしたがって前記半固定フィルタに設定する前記適応フィルタのフィルタ係数を選択する、
    ことを特徴とする請求項1記載の音声処理装置。
  3. 前記係数設定手段は、前記複数の適応フィルタ各々について、前記適応フィルタのフィルタ係数に基づく更新ベクトルの大きさと、前記半固定フィルタのフィルタ係数に基づく更新ベクトルの大きさとを比較し、前記適応フィルタのフィルタ係数に基づく更新ベクトルの大きさが前記半固定フィルタのフィルタ係数に基づく更新ベクトルの大きさよりも大きい状態が所定の回数以上連続して発生したと判定されたときは、該適応フィルタのフィルタ係数に前記半固定フィルタのフィルタ係数を設定する、
    ことを特徴とする請求項1記載の音声処理装置。
  4. 前記係数設定手段は、前記複数の適応フィルタ各々について、前記適応フィルタのフィルタ係数に基づく更新ベクトルの大きさと、前記半固定フィルタのフィルタ係数に基づく更新ベクトルの大きさとを比較した比較結果に基づき、前記適応フィルタのフィルタ係数に基づく更新ベクトルの大きさが前記半固定フィルタのフィルタ係数に基づく更新ベクトルの大きさよりも小さい状態を継続して検出した回数が予め決められた順コピー条件を満たしたときは、前記半固定フィルタのフィルタ係数に該適応フィルタのフィルタ係数を設定し、前記適応フィルタのフィルタ係数に基づく更新ベクトルの大きさが前記半固定フィルタのフィルタ係数に基づく更新ベクトルの大きさよりも大きい状態を継続して検出した回数が予め決められた逆コピー条件を満たしたときは、該適応フィルタのフィルタ係数に前記半固定フィルタの係数を設定する、
    ことを特徴とする請求項1記載の音声処理装置。
  5. 前記複数の適応フィルタの代わりに、前記更新量を任意に設定できる1の適応フィルタを有し
    前記係数設定手段は、前記1の適応フィルタに設定される前記フィルタ係数に基づく前記更新ベクトルの絶対値の大きさに応じて前記1の適応フィルタの更新量を算出し、前記1の適応フィルタに設定する、
    ことを特徴とする請求項1記載の音声処理装置。
  6. さらに、最も評価の高い前記適応フィルタのフィルタ係数に基づく前記更新ベクトルの大きさに応じて、前記半固定フィルタを用いてエコーが除去された前記音声入力信号の音量レベルを制御して残留エコー成分を除去する音量レベル制御手段、
    を具備することを特徴とする請求項1記載の音声処理装置。
  7. 前記音量レベル制御手段は、前記更新ベクトルの大きさが所定の基準値以下の場合は、前記残留エコー成分をミュートする、
    ことを特徴とする請求項6記載の音声処理装置。
  8. 前記音量レベル制御手段は、前記更新ベクトルの大きさに応じて、前記音量レベルの値を決定する、
    ことを特徴とする請求項6記載の音声処理装置。
  9. さらに、前記スピーカから出力する放音信号を複数の周波数帯域に帯域分割する放音信号分割手段と、前記マイクロフォンから入力される収音信号を前記複数の周波数帯域に帯域分割する収音信号分割手段と、前記周波数帯域に帯域分割された前記放音信号を合成する放音信号合成手段と、前記周波数帯域に帯域分割された前記収音信号を合成する収音信号合成手段と、
    を具備し、
    前記適応フィルタ、前記半固定フィルタ、前記適応フィルタ評価手段、及び前記係数設定手段は、前記周波数帯域の一部の周波数帯域範囲ごとに設けられる、
    ことを特徴とする請求項1記載の音声処理装置。
JP2006057085A 2006-03-03 2006-03-03 音声処理装置 Expired - Fee Related JP4432916B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006057085A JP4432916B2 (ja) 2006-03-03 2006-03-03 音声処理装置
US11/681,025 US8107617B2 (en) 2006-03-03 2007-03-01 Audio processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006057085A JP4432916B2 (ja) 2006-03-03 2006-03-03 音声処理装置

Publications (2)

Publication Number Publication Date
JP2007235770A JP2007235770A (ja) 2007-09-13
JP4432916B2 true JP4432916B2 (ja) 2010-03-17

Family

ID=38471525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006057085A Expired - Fee Related JP4432916B2 (ja) 2006-03-03 2006-03-03 音声処理装置

Country Status (2)

Country Link
US (1) US8107617B2 (ja)
JP (1) JP4432916B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101878637B (zh) 2007-11-29 2013-09-18 艾利森电话股份有限公司 用于对语音信号进行回声消除的方法和配置
JP4991649B2 (ja) * 2008-07-02 2012-08-01 パナソニック株式会社 音声信号処理装置
EP2410763A4 (en) 2009-03-19 2013-09-04 Yugengaisya Cepstrum FEEDBACK SUPPRESSION
US10720138B2 (en) * 2017-04-24 2020-07-21 Cirrus Logic, Inc. SDR-based adaptive noise cancellation (ANC) system
CN111883156B (zh) * 2020-07-22 2023-04-07 Oppo(重庆)智能科技有限公司 音频处理方法、装置、电子设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5429847B2 (ja) 1971-08-13 1979-09-26
JPH0810843B2 (ja) 1988-02-24 1996-01-31 松下電器産業株式会社 適応等化装置
JP2749780B2 (ja) * 1994-09-30 1998-05-13 株式会社エイ・ティ・アール人間情報通信研究所 適応化型相互相関装置
JPH09261135A (ja) * 1996-03-25 1997-10-03 Pioneer Electron Corp 音響エコー消去装置
JP3139405B2 (ja) * 1997-02-28 2001-02-26 日本電気株式会社 エコーキャンセラ
JPH11313014A (ja) 1998-04-27 1999-11-09 Mitsubishi Electric Corp 帯域分割型エコーキャンセラ
JP2000196507A (ja) * 1998-12-28 2000-07-14 Nec Corp 多重化回線用エコ―除去の方法及び装置
JP2000307485A (ja) 1999-04-21 2000-11-02 Mitsubishi Electric Corp エコーキャンセラ
US6909782B2 (en) * 2000-09-08 2005-06-21 Intel Corporation Fast converging affine projection based echo canceller for sparse multi-path channels
US6700978B2 (en) * 2000-09-08 2004-03-02 Intel Corporation Method and apparatus for fast converging affine projection based echo canceller
JP2004357053A (ja) 2003-05-29 2004-12-16 Fujitsu Ltd エコーキャンセラ装置およびエコーキャンセラ方法

Also Published As

Publication number Publication date
JP2007235770A (ja) 2007-09-13
US20070206817A1 (en) 2007-09-06
US8107617B2 (en) 2012-01-31

Similar Documents

Publication Publication Date Title
US9818425B1 (en) Parallel output paths for acoustic echo cancellation
JP2538176B2 (ja) エコ―制御装置
US7945442B2 (en) Internet communication device and method for controlling noise thereof
JP5061853B2 (ja) エコーキャンセラ及びエコーキャンセルプログラム
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
US11812237B2 (en) Cascaded adaptive interference cancellation algorithms
US10348887B2 (en) Double talk detection for echo suppression in power domain
JP2004133403A (ja) 音声信号処理装置
JP4432916B2 (ja) 音声処理装置
JP6903884B2 (ja) 信号処理装置、プログラム及び方法、並びに、通話装置
US9191519B2 (en) Echo suppressor using past echo path characteristics for updating
JP5205935B2 (ja) 雑音消去装置、雑音消去方法および雑音消去プログラム
JP2009094802A (ja) 通信装置
JP2003188776A (ja) 音響エコー消去方法、装置及び音響エコー消去プログラム
JP2944310B2 (ja) エコーキャンセラ
JP4542538B2 (ja) ダブルトーク状態判定方法、その方法を用いた反響消去装置、そのプログラム及びその記録媒体
US8363821B2 (en) Apparatus and method for canceling echo
JP2007189454A (ja) 音声処理装置
JP2008060715A (ja) エコー消去装置、その方法、そのプログラム、およびその記録媒体
JP4527654B2 (ja) 音声通信装置
JP5131416B2 (ja) 適応フィルタの制御装置及び適応フィルタの制御方法
JP4735419B2 (ja) 音声通話装置
JP2007180646A (ja) 音声処理装置
JP2007151038A (ja) 音声処理装置
WO2024009892A1 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090526

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091201

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091214

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees