JP2007336364A - Echo canceler - Google Patents
Echo canceler Download PDFInfo
- Publication number
- JP2007336364A JP2007336364A JP2006167604A JP2006167604A JP2007336364A JP 2007336364 A JP2007336364 A JP 2007336364A JP 2006167604 A JP2006167604 A JP 2006167604A JP 2006167604 A JP2006167604 A JP 2006167604A JP 2007336364 A JP2007336364 A JP 2007336364A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency
- delay
- output
- echo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、エコーキャンセラに関し、例えば、エコー経路による遅延が変動する場合にも適正なエコー成分を送話信号から除去するエコーキャンセラに適用し得る。 The present invention relates to an echo canceller, and can be applied to, for example, an echo canceller that removes an appropriate echo component from a transmission signal even when a delay due to an echo path varies.
特許文献1には、ネットワークを介して音声データを送受信するハンズフリー通話装置に関する技術が開示されている。以下では、特許文献1に記載の従来のハンズフリー通話装置におけるエコーキャンセラの機能を図2を参照しながら説明する。
図2は、従来のハンズフリー通話装置の構成を示すブロック図であり、図2では、ネットワーク(例えば、インタネット100)に接続可能なネットワーク端末装置(例えば、パーソナルコンピュータ等)115が、サウンドボード103を装備しているものとする。 FIG. 2 is a block diagram showing a configuration of a conventional hands-free call device. In FIG. 2, a network terminal device (for example, a personal computer) 115 that can be connected to a network (for example, the Internet 100) is connected to a sound board 103. Is equipped.
ネットワーク端末装置115は、インターネット100に接続する回線インターフェース114、復号器101、音声出力ドライバー102、音声入力ドライバー110、符号化器113を有し、また、サウンドボード103は、途切れ緩衝用蓄積バッファ104及び109、ディジタル−アナログ変換器(以後、D/Aという)105、スピーカ106と接続するスピーカ端子116、マイク107と接続するマイク端子117、アナログ−ディジタル変換器(以後、A/Dという)108を有する。
The
まず、図2において、図示しない遠端話者からの音声データは、ネットワーク100を通じてネットワーク端末装置115内の回線インターフェース114に入力し、復号器101により音声波形信号(以後、音声信号という)に復号される。
First, in FIG. 2, voice data from a far-end speaker (not shown) is input to the line interface 114 in the
音声信号は、復号器101から音声出力ドライバー102に与えられ、音声出力ドライバー102からネットワーク端末装置115に装備されたサウンドボード103の途切れ緩衝用蓄積バッファ104に与えられる。
The audio signal is supplied from the decoder 101 to the
途切れ緩衝用蓄積バッファ104は過去に蓄積された音声信号から順にD/A105に出力し、出力された音声信号は、D/A105によりアナログ信号に変換され、スピーカ端子116を通じてスピーカ106とA/D108とに与えられる。
The interruption
このとき、スピーカ106から放射された音声信号がマイク107に回り込み、その音声信号がA/D108に入力する。
At this time, the audio signal radiated from the
A/D108に入力された信号のうちD/A105から直接入力された信号は、途切れ緩衝用蓄積バッファ109を経由して信号r(k)として、音声入力ドライバー109内の適応フィルタ111に入力される。
Of the signals input to the A /
一方、スピーカ106を経由してA/D108に入力された信号は、途切れ緩衝用畜積バッファ109を経由して加算器112に入力される。
On the other hand, the signal input to the A /
適応フィルタ111では信号r(k)と信号f(k)を入力として打ち消し信号s(k)を作成する。
The
ここで、信号s(k)の作成に関しては、信号f(k)を最小にする適応アルゴリズム、例えば既存技術であるNLMSアルゴリズムなどを適用して作成することができ、信号f(k)を最小にする適応アルゴリズムであれば種々の方法を適用することができ、特にここでは説明を省略する。 Here, regarding the generation of the signal s (k), it can be generated by applying an adaptive algorithm that minimizes the signal f (k), for example, the NLMS algorithm that is an existing technology, and the signal f (k) is minimized. Various methods can be applied as long as they are adaptive algorithms, and the description thereof is omitted here.
加算器112では、スピーカ106から入力された信号、すなわちエコー信号と信号s(k)を相殺し、信号f(k)を適応フィルタ111と符号化器113に出力する。
The adder 112 cancels the signal input from the
符号化器113では、音声信号をインターネット1に出力するため、音声データをパケット整形して変換し、回線インターフェース114を通じてインターネット100に出力する。
In the
ところで、ネットワーク端末装置115が、例えばPCのように通信処理の他にもいろいろな処理を実行する機能を有しているものである場合、特殊な事情が発生する。すなわち、通信のようにリアルタイム性を必要とする処理の他にも、いろいろなアプリケーションプログラムを実行させて、図示しない計算資源(CPUやメモリ)を使っていることが多い。
By the way, when the
この場合、音声出力ドライバー102、音声入力ドライバー110は処理を一旦待機させられることがしばしば発生する。通常、音声処理の待機はそのまま音声信号の断絶につながる。
In this case, the
そこで、従来技術では、途切れ緩衝用蓄積バッファ104、109にあらかじめ音声データを蓄積しておき、音声処理の待機が発生しても、その間、途切れ緩衝用蓄積バッファ104、109に蓄積済みの音声信号をD/A105、A/D108に出力し、音声の途切れを防ぐようになっている。
Therefore, in the prior art, audio data is stored in advance in the interruption
ところで、逆に音声出力ドライバー102、音声入力ドライバー109は動作しているのに途切れ緩衝用畜積バッファ109の出力が待機される場合は、途切れ緩衝用蓄積バッファ109にどんどんデータが流れ込み、途切れ緩衝用蓄積バッファ109のデータ格納量が飽和してしまう。また、飽和中に途切れ緩衝用蓄積バッファ109に入力しようとするデータは、途切れ緩衝用蓄積バッファ109に蓄積できずに破棄されてしまう。こうした、途切れ緩衝用蓄積バッファ109のデータの枯渇や飽和は、音声信号として双方とも音声の途切れという現象になって現れることとなる。
On the other hand, when the
この音声信号の途切れや途切れ緩衝用蓄積バッファの蓄積量変動は、適応フィルタ111を用いたエコー除去にとって性能劣化となることが広く知られている。
It is widely known that the interruption of the audio signal and the fluctuation in the accumulation amount of the interruption buffer accumulation buffer cause performance degradation for echo removal using the
つまり、通常エコー除去のための適応フィルタ111(エコーキャンセラ)は、復号器101の出力と音声入力ドライバー110の出力とをそれぞれ適応フィルタ111の入力として動作させている。そのため、信号経路として音声出力ドライバー102から始まって、途切れ緩衝用蓄積バッファ104、スピーカ106、マイク107を経由し、途切れ緩衝用蓄積バッファ109、音声入力ドライバー110に至るまでの経路は、2つの途切れ緩衝用バッファ104及び109の蓄積量変化(遅延変化)と、音声の途切れ(バッファの枯渇、飽和)とがエコー経路の時変動と要因となる。
That is, the adaptive filter 111 (echo canceller) for normal echo removal operates using the output of the decoder 101 and the output of the audio input driver 110 as inputs of the
公知のように適応フィルタ111は、エコー経路が時間不変である前提が成り立つとき効果を発揮するので、上記のようなエコー経路の時間変動があると性能が大きく劣化することになる。
As is well known, the
従来技術では、D/A105の出力から直接A/D108に信号を入力し、A/D108からの出力を途切れ緩衝用蓄積バッファ109を経由して適応フィルタ111に入力するようにして、途切れ緩衝用蓄積バッファの途切れや飽和の影響を受けた後の信号を適応フィルタ111の参照入力信号r(k)として入力し、一方で、これもまた途切れ緩衝用蓄積バッファ109の途切れや飽和の影響が反映されているエコー信号を加算器112に入力し、適応フィルタ111の入力にも途切れ緩衝用蓄積バッファ109の影響を取り込むことで、見かけ上、送受2つの経路上の途切れ緩衝用蓄積バッファ109の影響を相殺して、適応フィルタ111にとってエコー経路の時変動をなくすことでエコー除去能力の劣化を防止している。
In the prior art, a signal is directly input to the A /
しかし、従来技術では、エコー除去のため、スピーカ106からマイク107までを結線させる必要があり、専用サウンドボード103を用いる必要があり、装置として高価なものであった。あるいは、専用ボードを使わない場合でも、ステレオで動作する片方のチャンネルのスピーカ106用出力を電線で他方のチャンネルのマイク107端子に接続する必要があり、本来のステレオサウンドを用いることができなくなってしまうという欠点があった。
However, in the prior art, it is necessary to connect the
そのため、サウンドボードは汎用のものを使い、特段のハードウエア的改造をすることなく、また、ステレオサウンドを犠牲にしてモノラルにすることなく、途切れ緩衝用バッファの状態によってエコーの遅延が変わっても速やかにエコーを追従し、除去できるエコーキャンセラが望まれている。 Therefore, even if the delay of the echo changes depending on the state of the buffer for interruption, the sound board uses a general-purpose one, without special hardware modification, and without sacrificing stereo sound to monaural. An echo canceller that can quickly follow and remove echoes is desired.
かかる課題を解決するために、第1の本発明のエコーキャンセラは、適応フィルタを有する擬似エコー生成手段が受信信号に基づいて生成した擬似エコー信号を、エコー除去手段が送信信号から減算してエコー成分を除去するエコーキャンセラにおいて、(1)非可聴な時間軸波形成分を有する非可聴信号を発生する非可聴信号発生手段と、(2)受信信号に非可聴信号を加算した出力信号を生成する出力信号生成手段と、(3)非可聴信号に対して所定のフィルタ処理を施して第1の遅延推定信号を生成する第1の遅延推定信号生成手段と、(4)送信信号に対して所定のフィルタ処理を施して第2の遅延推定信号を生成する第2の遅延推定信号生成手段と、(5)第1の遅延推定信号と第2の遅延推定信号との相互相関に基づいて、エコー経路による可変遅延特性を反映させた遅延時間情報を求める遅延時間情報算出手段と、(6)遅延時間情報算出手段が算出した遅延時間情報に基づいて上記適応フィルタへの受信信号の入力を遅延させる遅延付加手段とを備えることを特徴とする。 In order to solve this problem, the echo canceller according to the first aspect of the present invention includes an echo canceler that subtracts a pseudo echo signal generated based on a received signal by a pseudo echo generator having an adaptive filter from a transmission signal. In an echo canceller for removing components, (1) a non-audible signal generating means for generating a non-audible signal having a non-audible time axis waveform component, and (2) an output signal obtained by adding the non-audible signal to the received signal is generated. Output signal generation means; (3) first delay estimation signal generation means for generating a first delay estimation signal by applying a predetermined filter process to the inaudible signal; and (4) predetermined for the transmission signal. Second delay estimation signal generation means for generating a second delay estimation signal by performing the filtering process of (5), and (5) based on the cross-correlation between the first delay estimation signal and the second delay estimation signal, Delay time information calculating means for obtaining delay time information reflecting variable delay characteristics according to the path; and (6) delaying the input of the received signal to the adaptive filter based on the delay time information calculated by the delay time information calculating means. Delay adding means.
本発明のエコーキャンセラによれば、エコー経路の遅延が変動する場合にも速やかにエコーを追従し、エコー成分を除去することができる。 According to the echo canceller of the present invention, even when the delay of the echo path fluctuates, it is possible to quickly follow the echo and remove the echo component.
(A)第1の実施形態
以下、本発明のエコーキャンセラの第1の実施形態を図面を参照しながら説明する。
(A) First Embodiment Hereinafter, a first embodiment of an echo canceller of the present invention will be described with reference to the drawings.
第1の実施形態は、途切れ緩衝用蓄積バッファを有するサウンドボードを装備したネットワーク端末装置がハンズフリー通話装置として機能する場合のエコーキャンセルに本発明のエコーキャンセルを適用した場合を説明する。 1st Embodiment demonstrates the case where the echo cancellation of this invention is applied to the echo cancellation in case the network terminal device equipped with the sound board which has the accumulation | storage buffer for interruption buffers functions as a hands-free call apparatus.
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係るハンズフリー通話装置として機能する装置の内部構成を示すブロック図である。
(A-1) Configuration of First Embodiment FIG. 1 is a block diagram showing an internal configuration of a device that functions as a hands-free call device according to the first embodiment.
図1において、第1の実施形態に係る装置は、インターネット1に接続可能なネットワーク端末装置24が、サウンドボード8を装備しているものとする。
In FIG. 1, in the device according to the first embodiment, a
ネットワーク端末装置24は、回線インターフェース19、復号器2、低周波発生器3、スイッチ23、第1の帯域制限フィルタ(BPF1)4、加算器25、音声出力ドライバー5、音声入力ドライバー15、第2の帯域制限フィルタ(BPF2)16、加算器17、符号化器18、初期遅延付加部20、適応フィルタ21、初期遅延判定部22、第1の低域通過フィルタ(LPO1)26、第2の低域通過フィルタ(LPO2)27を有する。
The
ネットワーク端末装置24は、例えば、パーソナルコンピュータ等のような通信処理機能を有する情報処理装置を適用することができる。
As the
また、サウンドボード8は、途切れ緩衝用蓄積バッファ6、ディジタル−アナログ変換器(以後、D/Aという)7、スピーカ10と接続するスピーカ端子9、マイク11と接続するマイク端子12、アナログ‐ディジタル変換器(以後、A/Dという)13、途切れ緩衝用蓄積バッファ14を有する。
Further, the
サウンドボード8は、ネットワーク端末装置24に組み込むことができるユニットであり、少なくとも途切れ緩衝用蓄積バッファ6及び14を有していれば既存のものを適用することができる。
The
以下では、ネットワーク端末装置24及びサウンドボード8の内部構成を図1を参照しながら説明する。
Hereinafter, the internal configurations of the
回線インターフェース19は、インターネット1との間でデータを送受信するものであり、音声パケットデータを受信した場合、その音声パケットデータを復号器2に与え、又符号化器18から音声パケットデータをインターネット1に送出するものである。
The
復号器2は、回線インターフェース19からの音声パケットデータを所定の復号方式に従って復号し、復号した音声信号(音声波形信号)を第1の帯域制限フィルタ(BPF1)4に与えるものである。
The
第1の帯域制限フィルタ(BPF1)4は、音声信号を所望の周波数帯域に帯域制限するものである。第1の実施形態では、BPF4は、信号の周波数を電話帯域である300〜3400Hzに帯域制限するものとし、その帯域制限した信号x(k)を初期遅延付加部20及び第1の加算器25に与える。ここで、信号x(k)についてkはデータの順番を表す。
The first band limiting filter (BPF1) 4 limits the audio signal to a desired frequency band. In the first embodiment, the BPF 4 limits the frequency of the signal to the telephone band of 300 to 3400 Hz, and the band-limited signal x (k) is added to the initial
第1の加算器25は、スイッチ23を経由して、低周波発生器3からの低周波信号を入力として取り込み、BPF4からの信号x(k)と低周波信号とを加算し、信号x1(k)を第1の低域通過フィルタ(LPO1)26及び音声出力ドライバー5に与えるものである。
The
スイッチ23は、初期状態は開放しており、ネットワーク端末装置24の立ち上げ時(例えば電源投入時)に閉じられ、低周波発生器3が発生した低周波信号を加算器25に出力するものである。なお、スイッチ23は、図示しない装置操作者の操作により切替指示信号などによって、電源投入時以外にも、所望のタイミングで閉じるようにしてもよい。例えば、適応フィルタ21をリセットしたいときなどにスイッチ23を閉じるようにしてもよい。
The
低周波発生器3は、人間には聞こえにくい低い周波数の信号を発生するものである。第1の実施形態では、例えば20Hzのトーン信号を用いるものとするが、これに限定しない。すなわち、聴覚的に捕らえにくい周波数であれば、どのような低周波数を発声するものであってもよい。
The
第1の低域通過フィルタ(LPO1)26は、加算器25から信号x1(k)を受け取り、信号x1(k)に対して低域通過フィルタ処理を施し、信号x2(k)として初期遅延判定部22に出力するものである。第1の実施形態では、LPO26は、例えば30Hz未満を通過帯域とし、それ以外の帯域を阻止域としたが、通過帯域はこれに限定されない。
The first low-pass filter (LPO1) 26 receives the signal x1 (k) from the
音声出力ドライバー5は、加算器25からの出力信号を受け取り、受信データの途切れ緩衝用蓄積バッファ6に出力するものである。
The
途切れ緩衝用蓄積バッファ6は、音声出力ドライバー5からの制御信号を受けており、その制御信号による制御の下、音声出力ドライバー5からの出力データを一時的に蓄積しながら、古いデータから順番にD/A7に与えるものである。
The interruption
ディジタル−アナログ変換器(D/A)7は、途切れ緩衝用蓄積バッファ6から受け取ったディジタル音声信号をアナログ音声信号に変換し、そのアナログ変換信号をスピーカ端子9を通じてスピーカ10に与えるものである。
The digital-analog converter (D / A) 7 converts the digital audio signal received from the interruption
スピーカ10は、受信したアナログ音声信号を空間に出力するものである。また、マイク11は、話者が発した音声を捕捉し、マイク端子12を通じてアナログ−ディジタル変換器(A/D)13に与えるものである。
The
このとき、スピーカ10から空間に放射された音声信号の一部はマイク11に漏れこみ、この音声信号もマイク端子12を経由してA/D13に入力される。
At this time, part of the audio signal radiated from the
アナログ−ディジタル変換器(A/D)13は、マイク11からのアナログ音声信号をディジタル音声信号に変換し、そのディジタル音声信号を送信データの途切れ緩衝用蓄積バッファ14に与えるものである。このとき、スピーカ10から漏れた音声信号もディジタル変換される。
The analog-to-digital converter (A / D) 13 converts an analog audio signal from the
途切れ緩衝用蓄積バッファ14は、音声入力ドライバー15からの制御信号を受けており、その制御信号による制御の下、A/D13から受信した音声信号を一時的に蓄積しながら、古いデータから順番に音声入力ドライバー15に与えるものである。
The interruption
音声入力ドライバー15は、途切れ緩衝用蓄積バッファ14から受け取った音声信号を、音声信号y(k)として第2の帯域制限フィルタ(BPF2)16及び第2の低域通過フィルタ(LPO2)27に与えるものである。
The
第2の帯域制限フィルタ(BPF2)16は、音声入力ドライバー15から信号y(k)を所望の周波数帯域に帯域制限し、加算器17に与えるものである。第1の実施形態では、例えば300〜3400Hzとするがこれに限定されない。
The second band limiting filter (BPF 2) 16 band-limits the signal y (k) from the
第2の低域通過フィルタ(LPO2)27は、音声入力ドライバー15からの信号y(k)に、低域通過フィルタ処理を施し、信号y2(k)として初期遅延判定部22に出力するものである。LPO27の動作は、LPO26と同一であるのでここでは説明しない。
The second low-pass filter (LPO2) 27 performs low-pass filter processing on the signal y (k) from the
第2の加算器17は、適応フィルタ21からの出力信号y’(k)と、BPF16からの出力信号y1(k)とを受け取り、出力信号y’(k)と出力信号y1(k)との相殺処理を行なうものである。ここで、kはデータの順番を表す。また、第2の加算器17は、出力信号e(k)を、適応フィルタ21及び符号化器18に与えるものである。
The
適応フィルタ21は、初期遅延付加部20の出力信号x3(k)と、第2の加算器17の出力信号e(k)とを取り込み、逐次、信号e(k)のパワーが最小になるように、出力信号x3(k)と出力信号e(k)に基づいて擬似エコー信号y’(k)を作成し、その擬似エコー信号y’(k)を出力するものである。
The
ここで、適応フィルタ21における擬似エコー信号y’(k)の作成は、既存技術である学習同定法等の係数更新アルゴリズムを適用して求めることができ、信号e(k)のパワーを最小にすることができるアルゴリズムであれば、どのようなものをアルゴリズムを適用してもよい。
Here, the generation of the pseudo echo signal y ′ (k) in the
符号化器18は、第2の加算器17の出力信号e(k)を受け取り、信号e(k)を符号化し、回線インターフェース19を介してインターネット1に出力するものである。これにより、図示しない遠方話者に向かって出力される。
The
初期遅延判定部22は、LPO26の出力信号x2(k)と、LPO27の出力信号y2(k)とを受け取り、これら信号x2(k)及びy2(k)に基づいて、エコー信号経路初期遅延を推定するものである。
The initial
ここで、エコー信号経路初期遅延とは、第1の加算器25を出発し、音声出力ドライバー5、受信データ途切れ緩衝用蓄積バッファ6、D/A7、スピーカ10、マイク11、A/D13、送信データ途切れ緩衝用蓄積バッファ14、音声入力ドライバーを経由して第2の加算器17の入力に至るまでの経路遅延をいう。
Here, the initial delay of the echo signal path means that the
初期遅延付加部20は、初期遅延判定部22によりエコー信号経路初期遅延が判定されると、適応フィルタ21の入力に対して時間τだけ遅延させた信号x3(k)を適用フィルタ21に与えるものである。
When the initial
(A−2)第1の実施形態の動作
続いて、第1の実施形態に係る装置の動作を図1を参照しながら詳細に説明する。
(A-2) Operation of First Embodiment Subsequently, the operation of the apparatus according to the first embodiment will be described in detail with reference to FIG.
まず、図示しない遠方話者からの音声パケットデータは、インターネット1を経由して、ネットワーク端末24内の回線インターフェース19に与えられ、回線インターフェース19から復号器2に与えられる。
First, voice packet data from a distant speaker (not shown) is given to the
復号器2において音声パケットデータは復号され、復号された音声波形信号(音声信号)は、BPF4に与えられ、BPF4により所望周波数帯域に制限され(ここでは、電話帯域である300〜3400Hzに制限され)、帯域制限された音声信号は第1の加算器25及び初期遅延付加部20に与えられる。
The voice packet data is decoded by the
第1の加算器25では、例えばネットワーク端末装置24の電源投入により閉じたスイッチ23を通じて、低周波発生器3から聴覚的に捕らえにくい低周波信号(例えば、20Hzのトーン信号)を入力している。
In the
そして、BPF4からの帯域制限された音声信号が加算器25に与えられると、帯域制限された音声信号と20Hzのトーン信号(低周波信号)とは、加算器25により加算され、信号x1(k)として音声出力ドライバー5及び低域通過フィルタ(LPO1)26に出力される。
When the band-limited audio signal from the BPF 4 is supplied to the
信号x1(k)が低域通過フィルタ(LPO1)26に与えられると、信号x1(k)は低域通過フィルタ処理が施され(30Hz未満)、低域通過フィルタ処理された信号x2(k)が初期遅延判定部22に与えられる。
When the signal x1 (k) is given to the low-pass filter (LPO1) 26, the signal x1 (k) is subjected to low-pass filtering (less than 30 Hz), and the low-pass filtered signal x2 (k) Is provided to the initial
加算器25の出力信号x1(k)が音声出力ドライバー5に与えられると、受信データの途切れ緩衝用蓄積バッファ6に出力され、その後D/A7に与えられる。そして、信号(ディジタル音声信号)は、D/A7によりアナログ信号に変換されてスピーカ10に与えられる。
When the output signal x1 (k) of the
このとき、一般に、ネットワーク端末装置24(例えばPC)において、音声処理よりも優先度の高いプログラムが実行状態にあるときは、音声出力ドライバー25は、途切れ緩衝用蓄積バッファ6に対しデータを出力できず、待機状態となる。
At this time, generally, in the network terminal device 24 (for example, PC), when a program having a higher priority than the audio processing is in an execution state, the
この間、D/A7には途切れ緩衝用蓄積バッファ6からあらかじめ蓄積されたデータが出力され、音声出力ドライバー5からのデータ出力がなくても、見かけ上、音声が欠けないようにD/A7から音声信号がスピーカ10に与えられ、スピーカ10から音声が出力される。もちろん、途切れ緩衝用蓄積バッファ6に蓄積される音声データがなくなり、完全に枯渇すれば音声データはなくなってしまう。ただし、音声出力ドライバー5の待機状態が復帰さえすれば、音声は大きな遅延を受けながらも、やがてはスピーカ10から音声が出力される。つまり現象としては”音声遅れ”、または”音声の間あき”になる。
During this time, the data accumulated in advance from the interruption
一方で、なんらかの都合で、D/A7が出力待機状態となると、途切れ緩衝用蓄積バッファ6のデータが出力されず、逆に途切れ緩衝用蓄積バッファ6の蓄積容量のほうが足りなくなるため、音声出力ドライバー5の出力データは破棄されてしまい、もはやスピーカ10から音声が出力されず、”音声欠け”となる。
On the other hand, if the D /
上述のように途切れ緩衝用蓄積バッファ6では、データの音声信号が極力途切れないようにデータの蓄積と出力を行なう。
As described above, the interruption
すなわち、途切れ緩衝用蓄積バッファ6は、音声出力ドライバー5からの制御信号に応じた蓄積量だけ一旦蓄積したあと、古い順番から順にD/A7に音声信号を出力し、D/A7は、ディジタル音声信号をアナログ音声信号に変換して、スピーカ端子9を経由してスピーカ10に出力するようにする。
That is, the interruption
スピーカ10は音声を空間に出力すると、出力された音声の一部がマイク11に漏れこみ、入力信号としてマイク端子12を経由してA/D13に入力され、ディジタル信号に変換される。そして、ディジタル信号に変換された信号は、途切れ緩衝用蓄積バッファ14に出力される。
When the
途切れ緩衝用蓄積バッファ14は、データの音声信号が途切れないように、A/D13からの音声信号のデータを蓄積する。
The interruption
ここで、マイク11側でもスピーカ10側で説明した状態と同じような状態が発生する場合があるので、マイク11側での動作を説明しておく。
Here, since a state similar to the state described on the
ネットワーク端末装置24(例えばPC)が音声処理よりも優先度の高いプログラムを実行しようとするとき、A/D13は、途切れ緩衝用蓄積バッファ14に対しデータを出力できず、待機状態となる。
When the network terminal device 24 (for example, PC) tries to execute a program having a higher priority than the voice processing, the A /
この間、音声入力ドライバー15には途切れ緩衝用畜積バッファ14からあらかじめ蓄積されたデータが出力され、A/D13からのデータ出力がなくても、見かけ上、音声が欠けないように音声入力ドライバー15に対して音声データが出力される。もちろん、途切れ緩衝用蓄積バッファ14が完全に枯渇すれば音声データはなくなってしまう。
During this time, the data stored in advance from the interrupt
ただし、音声入力ドライバー15の待機状態が復帰さえすれば、音声は大きな遅延を受けながらも、やがては音声入力ドライバー15から信号が出力される。つまり現象としては送信する音声の”音声遅れ”、または”音声の間あき”になる。
However, as long as the standby state of the
一方で、なんらかの都合で、音声入力ドライバー15のデータ出力が待機するときは、途切れ緩衝用蓄積バッファ14は、音声入力ドライバー15になにも出力できないから、逆に途切れ緩衝用蓄積バッファ14の蓄積容量のほうが足りなくなり、新たなA/D13の出力データは破棄されてしまい、もはや音声入力ドライバー15に対して出力できず、”音声欠け”となる。
On the other hand, when the data output of the
このような音声欠けや音声遅れが極力発生しないよう、送信データの途切れ緩衝用蓄積バッファ14や受信データの途切れ緩衝用蓄積バッファ6の蓄積量は、あらかじめネットワーク端末設計者等によって適宜設定される。
The amount of transmission data stored in the interruption
上述したように、途切れ緩衝用蓄積バッファ14は、音声欠けがないように、音声入力ドライバー15からの制御信号に応じた蓄積分だけ蓄積したあと、古い蓄積順番から順に音声入力ドライバー15に音声データを出力する。
As described above, the interruption
途切れ緩衝用蓄積バッファ14からの音声データが音声入力ドライバー15に与えられると、音声信号y(k)が、低域通過フィルタ(LPO2)27及び帯域制限フィルタ(BPF2)16に与えられる。
When the audio data from the interruption
音声入力ドライバー15からの出力信号y(k)が帯域制限フィルタ(BPF2)16に与えられると、信号y(k)は帯域制限フィルタ処理が施され(例えば、300〜3400Hz)、信号y1(k)として第2の加算器17に出力される。
When the output signal y (k) from the
加算器17においては、帯域制限フィルタ(BPF2)16の信号y1(k)から、適応フィルタ21で生成された擬似エコー信号y’(k)が相殺され、エコー成分が除去された信号e(k)が、符号化器18に与えられて、符号化処理がなされて、音声パケットデータがインターネット1を通じて遠端話者に送信される。
The
このとき、加算器17からの出力信号e(k)は適応フィルタ21にも戻されて、適応フィルタ21におけるフィルタ係数更新処理に寄与される。
At this time, the output signal e (k) from the
一方、音声入力ドライバー15からの出力信号y(k)が低域通過フィルタ(LPO2)27に与えられると、信号y(k)は低域通過フィルタ処理が施され(例えば、30Hz未満)、信号y2(k)として初期遅延判定部22に出力される。
On the other hand, when the output signal y (k) from the
初期遅延判定部22では、第1の低域通過フィルタ(LPO1)26の出力信号x2(k)及び第2の低域通過フィルタ(LPO2)27の出力信号y2(k)が入力されており、信号x2(k)及び信号y2(k)に基づいてエコー信号経路初期遅延が推定される。
The initial
ここでは、初期遅延判定部22によるエコー信号経路初期遅延を推定する動作を説明する。
Here, an operation of estimating the initial delay of the echo signal path by the initial
初期遅延判定部22は、信号x2(k)と信号y2(k)を用いて、下記式(1)に示す相互相関関数を用いて、エコー信号経路初期遅延を推定する。
第1の実施形態では、N=320000とする。 In the first embodiment, N = 320000.
式(1)は、2つの信号の似通い度を調べるために用いられる一般的な関数(相互相関関数)であり、信号x2(k)と信号y2(k)が似ていれば大きな値をとり、似ていなければ小さな値をとるものである。 Expression (1) is a general function (cross-correlation function) used to examine the similarity between two signals. If the signal x2 (k) and the signal y2 (k) are similar, a large value is obtained. If it is not similar, it takes a small value.
信号x2(k)は、低周波信号の20Hzのトーン信号であるので、サンプリング周波数を決めれば、トーン信号は1周期サンプル数に1回、自分自身と同じ波形になるので、関数R(l)は大きな値をとる。
Since the signal x2 (k) is a low-
例えば、信号x2(k)とy2(k)とが同じ信号であれば、y2(k)=x2(k)となるから、l=0としたときと同じであり、上記式(1)に代入すると、式(2)より関数R(l)の最大値は1/2となる。
また、信号y2(k)が反転していれば、関数R(l)の最大値は−1/2をとる。さらに、まったく信号がない、あるいは信号同士が関係ないときには、関数R(l)は0となる。 If the signal y2 (k) is inverted, the maximum value of the function R (l) takes −½. Furthermore, the function R (l) is 0 when there is no signal at all or the signals are not related to each other.
すなわち、関数R(l)の絶対値|R(l)|を計算すれば、信号の似通いの具合を知ることができ、値は0≦|R(l)|≦1/2となる。 That is, if the absolute value | R (l) | of the function R (l) is calculated, the degree of similarity of the signals can be known, and the value is 0 ≦ | R (l) | ≦ 1/2.
信号y2(k)は、信号x2(k)に起因するエコー信号であるから、基本的には信号x2(k)と同様にトーン信号であるため、信号x2(k)と信号y2(k)とを用いて、上記式(1)で計算すると、本来は1周期毎に大きな関数値を示す。 Since the signal y2 (k) is an echo signal resulting from the signal x2 (k), it is basically a tone signal similarly to the signal x2 (k), and therefore the signal x2 (k) and the signal y2 (k) When the above equation (1) is used for calculation, a large function value is originally shown for each cycle.
しかし、信号y2(k)は、初期遅延のあとエコー信号が到来する信号なので、初期遅延の間はy2(k)=0となっており、相互相関関数値は小さな値しかとらない。その後、信号がはじめて大きな値をとるのは、相互相関関数のずらし量lが1周期に達したときか、エコー経路の初期遅延τに一致したときである。 However, since the signal y2 (k) is a signal in which an echo signal arrives after the initial delay, y2 (k) = 0 during the initial delay, and the cross-correlation function value takes only a small value. Thereafter, the signal takes a large value for the first time when the shift amount l of the cross-correlation function reaches one period or when it coincides with the initial delay τ of the echo path.
つまり、初期遅延判定部22は、式(1)を用いて信号x2(k)の1周期分を計算し、1周期以内に最大を示したずらし量lがエコー経路の初期遅延τであると判定する。
That is, the initial
初期遅延判定部22は、推定した初期遅延τを、初期遅延付加部20に出力し、初期遅延付加部20は、適応フィルタ21の入力を時間τだけ遅延させる。
The initial
適応フィルタ21は、初期遅延付加部20の出力x3(k)と加算器の出力e(k)を用いて擬似エコー信号を作成する。
The
本実施形態では、式(1)を用いて相互相関を計算するようにしたが、式(1)を更に信号のパワー
で正規化して0≦|R(l)|≦1で信号の相関を判定するようにしてもよく、2つの信号の相関が始めて発生するタイミングを計算できる方法であればどのような方法であってもかまわない。 The correlation between signals may be determined by 0 ≦ | R (l) | ≦ 1, and any method can be used as long as the timing at which the correlation between two signals first occurs can be calculated. It doesn't matter.
また、適応フィルタ21における擬似エコーy’(k)作成にあたっては、公知の学習同定法などのアルゴリズムを用いればよく特に限定はしない。
In addition, the creation of the pseudo echo y ′ (k) in the
(A−3)第1の実施形態の効果
第1の実施形態では、途切れ緩衝用蓄積バッファを有するサウンドボード8を装備するハンズフリー通話装置において、復号器2で復号した入力音声信号を、帯域制限フィルタ4で所望周波数帯に帯域制限し、帯域制限フィルタ4からの出力に対して初期遅延付加部20が遅延を加えるようにし、初期遅延付加部20が加える遅延は、初期遅延判定22部が判定した遅延τになるようにし、加える遅延については、初期遅延判定部22でスイッチ23を経由した低周波発生器3の出力を低域通過フィルタ処理した信号x2(k)と、エコー経路を経由したエコー信号を低域通過フィルタ処理した信号y2(k)との相互相関を計算することにより求めるようにした。
(A-3) Effect of First Embodiment In the first embodiment, in a hands-free call device equipped with a
また、初期遅延判定部22による初期遅延の判定の際、2つの信号入力について、いずれか一方の信号に低域通過フィルタを用いることで初期遅延の推定値がくるうことがある。そこで、第1の実施形態では、初期遅延判定部22の2つの入力信号に同じ低域通過フィルタを用いることで、初期遅延の推定値がくるわないようにした。
In addition, when the initial delay is determined by the initial
また、初期遅延判定部22は、人間の耳には聞こえずらい低周波信号を発生する低周波発生器3の出力を用いるようにしたので、初期遅延計算の信号をスピーカ経由で出力しても通話の妨げになることがなく、帯域制限フィルタ16を用いて、低周波信号を除去して適応フィルタ21を駆動するようにした。
Further, since the initial
以上のことから、第1の実施形態によれば、初期遅延計算用の低周波信号が適応フィルタ21の動作を妨げることなく、かつ、スピーカ端子9とマイク端子12の間を結線が必要でないものであっても、ハードウエアの改造が不要の状態で、エコー信号を精度よく推定し、エコーの除去を行なうことができる。
From the above, according to the first embodiment, the low-frequency signal for calculating the initial delay does not interfere with the operation of the
(B)第2の実施形態
次に、本発明のエコーキャンセラの第2の実施形態を図面を参照しながら説明する。
(B) Second Embodiment Next, a second embodiment of the echo canceller of the present invention will be described with reference to the drawings.
図3は、第1の実施形態に係るハンズフリー通話装置として機能する装置の内部構成を示すブロック図である。 FIG. 3 is a block diagram showing an internal configuration of a device that functions as a hands-free call device according to the first embodiment.
第2の実施形態の構成が第1の実施形態の構成と異なる点は、低周波発生器3を高周波発生器2Aに変更する点、低域通過フィルタ26及び27を高域通過フィルタ2B及び2Cに変更する点であり、それ以外の構成要素は図1に示す第1の実施形態の構成と対応である。
The configuration of the second embodiment is different from the configuration of the first embodiment in that the
そのため、以下では、第2の実施形態の特徴となる点を詳細に説明し、第1の実施形態で説明した構成要素の詳細な説明については省略する。なお、図3において図1に対応する構成要素については対応する符号を付している。 Therefore, below, the point used as the characteristic of 2nd Embodiment is demonstrated in detail, and detailed description of the component demonstrated in 1st Embodiment is abbreviate | omitted. In FIG. 3, the components corresponding to those in FIG.
一般に、適応フィルタを駆動するためのアルゴリズムは、低周波数成分、例えば直流成分(以後DC)が混入すると、収束性能が急激に劣化することが知られている。したがって、第1の実施形態において、このような低周波成分の影響を適応フィルタに及ぼさないようにするには、精密に低域周波数をカットする音声帯域フィルタ16を具備する必要があり、このような音声帯域フィルタは高価なものとなり、装置としても高価な装置となる。
In general, it is known that an algorithm for driving an adaptive filter rapidly degrades convergence performance when a low frequency component, for example, a direct current component (hereinafter referred to as DC) is mixed. Therefore, in the first embodiment, in order to prevent the influence of such a low frequency component from affecting the adaptive filter, it is necessary to include the
そこで、第2の実施形態では、高域周波数成分を用いて初期遅延を求めるようにすることで、装置コストの低減を図るものである。 Therefore, in the second embodiment, the apparatus cost is reduced by obtaining the initial delay using the high frequency component.
高周波発生器2Aは、例えば、電話帯域の上限帯域近くの周波数帯域、又はそれ以上の周波数帯域の信号を発生するものである。本実施形態では、高周波発生器2Aは、7kHzのトーン信号を発生するものとするが、これに限定されない。 The high frequency generator 2A generates a signal in a frequency band near the upper limit band of the telephone band or a frequency band higher than that, for example. In the present embodiment, the high frequency generator 2A generates a 7 kHz tone signal, but is not limited thereto.
高域通過フィルタ(HPF1)2Bは、加算器25からの出力信号x1(k)を取り込み、所定の高域成分を通過させるフィルタであり、出力は初期遅延判定部22に与えるものである。また、高域通過フィルタ(HPF2)2Cは、音声入力ドライバー15からの出力信号y(k)を取り込み、所定の高域成分を通過させるフィルタであり、出力は初期遅延判定部22に与えるものである。本実施形態では、高域通過フィルタ(HPF1)2B及び(HPF2)2Cは、7kHz以上の成分を通過させるものとする。
The high-pass filter (HPF1) 2B is a filter that takes in the output signal x1 (k) from the
次に、第2の実施形態に係るエコーキャンセラの動作を説明する。まず、高周波発生器2Aからの高周波信号(7kHzのトーン信号)は、スイッチ23を介して加算器25に与えられる。なお、スイッチ23は、第1の実施形態と同様に、初期状態は開放しており、例えば装置電源投入時等に閉鎖するものであり、運用者等による所望タイミングで閉鎖できるようにしてもよい。
Next, the operation of the echo canceller according to the second embodiment will be described. First, a high frequency signal (7 kHz tone signal) from the
加算器25において、帯域制限フィルタ(BFP1)4からの出力信号x(k)と高周波信号とが加算され、その加算された信号x1(k)は高域通過フィルタ(HPF1)2Bと音声出力ドライバー5に与えられる。
In the
なお、音声出力ドライバー5からエコー経路を通って再び音声入力ドライバー15に与えられるまでの動作は、第1の実施形態で説明した動作と同様であるから、ここでの詳細な説明は省略する。
Since the operation from the
音声入力ドライバー15からの出力信号y(k)は、帯域制限フィルタ(BPF2)16と高域通過フィルタ(HPF2)2Cとに与えられる。
The output signal y (k) from the
加算器25からの出力信号x1(k)が高域通過フィルタ(HPF1)2Bに与えられると、信号x1(k)は高域通過フィルタ処理(7kHz以上の成分通過処理)が施され、高域通過フィルタ処理された信号x2(k)が初期遅延判定部22に与えられる。
When the output signal x1 (k) from the
また、音声入力ドライバー15からの出力信号y(k)が高域通過フィルタ(HPF2)2Cに与えられると、信号y(k)は高域通過フィルタ処理(7kHz以上の成分通過処理)が施され、高域通過フィルタ処理された信号y2(k)が初期遅延判定部22に与えられる。
When the output signal y (k) from the
なお、高域通過フィルタ(HPF1)2B及び(HPF2)2Cは共に、通常音声周波数帯域を阻止し、遅延推定信号を通過させる。また、本実施形態では、7kHz以上の周波数成分だけを通過させるようにした。 Note that the high-pass filters (HPF1) 2B and (HPF2) 2C both block the normal audio frequency band and pass the delay estimation signal. In the present embodiment, only frequency components of 7 kHz or higher are allowed to pass.
初期遅延判定部22における信号x2(k)と信号y2(k)とに基づく初期遅延の求める動作や適応フィルタ21の動作は第1の実施形態と同様であるので、ここでの詳細な説明は省略する。
Since the initial
以上のように、第2の実施形態によれば、第1の実施形態と同様の効果を得ることができる。 As described above, according to the second embodiment, the same effect as that of the first embodiment can be obtained.
また、第2の実施形態によれば、高周波発生器2A、高域通過フィルタ(HPF1)2B及び(HPF2)2Cを用いることとしたので、低周波周波数に対する対策が不要であるから、音声帯域フィルタに対する精密さが要求されず、結果としてフィルタ構成が簡単となり、装置コストを低減させることができる。 Further, according to the second embodiment, since the high frequency generator 2A, the high-pass filters (HPF1) 2B and (HPF2) 2C are used, it is not necessary to take measures against the low frequency frequencies. Is not required, and as a result, the filter configuration becomes simple and the apparatus cost can be reduced.
さらに、例えば図示しない遠方話者側装置が同一構成の装置であるときなどは、相手側にも音声帯域フィルタ4があることになり、適応アルゴリズムへの影響の観点からは、音声帯域フィルタ16を省略することも可能となり、さらに装置の製造コストを小さくすることができる。
Further, for example, when the far-side device (not shown) has the same configuration, the other side also has the voice band filter 4. From the viewpoint of the influence on the adaptive algorithm, the
(C)第3の実施形態
次に、本発明のエコーキャンセラの第3の実施形態を図4のブロック図を参照しながら説明する。
(C) Third Embodiment Next, a third embodiment of the echo canceller of the present invention will be described with reference to the block diagram of FIG.
第3の実施形態に係るハンズフリー通話装置は、ステレオサウンドに対応可能なサウンドボード8を装備する場合である。また、第3の実施形態は、従来の技術では、通信装置がステレオサウンドにも対応する場合、1チャンネル分を制御用に結線することでステレオ性能を損なってしまうことを鑑みてなされたものである。
The hands-free communication device according to the third embodiment is a case where a
図4に示すように、第3の実施形態に係るネットワーク端末装置24は、回線インターフェース19、復号器2、低周波発生器3、高周波発生器2A、スイッチ23(23−1、23−2)、第1の帯域制限フィルタ(BPF1)4、第1の高域通過フィルタ(HPF1)2B、加算器25(25−1、25−2)、音声出力ドライバー5、音声入力ドライバー15、第2の帯域制限フィルタ(BPF2)16、加算器17(17−1、17−2)、符号化器18、初期遅延付加部20、適応フィルタ21(21−1、21−2)、初期遅延判定部22、第1の低域通過フィルタ(LPO1)26、第2の低域通過フィルタ(LPO2)27、第2の高域通過フィルタ(HPF2)2Cを有する。
As shown in FIG. 4, the
また、第3の実施形態に係るサウンドボード8は、ステレオサウンドに対応可能なものであり、途切れ緩衝用蓄積バッファ6、ディジタル−アナログ変換器(以後、D/Aという)7、スピーカ10(10−1、10−2)と接続するスピーカ端子9(9−1、9−2)、マイク11(11−1、11−2)と接続するマイク端子12(12−1、12−2)、アナログ‐ディジタル変換器(以後、A/Dという)13、途切れ緩衝用蓄積バッファ14を有する。
Further, the
なお、図4では、第1及び第2の実施形態の構成と対応する構成については図1及び図3で示した符号と対応する符号を付している。さらに、以下では、第3の実施形態に特徴的な構成について詳細に説明する。 In FIG. 4, components corresponding to those in the first and second embodiments are denoted by reference symbols corresponding to the reference symbols illustrated in FIGS. 1 and 3. Further, the configuration characteristic to the third embodiment will be described in detail below.
図4に示すように、第3の実施形態に係るネットワーク端末装置24は、第1の実施形態で説明した低周波発生器3、スイッチ23−2、加算器25−2、低域通過フィルタ(LPO1)26及び(LPO2)27と、第2の実施形態で説明した高周波発生器2A、スイッチ23−1、加算器25−1、高域通過フィルタ(HPF1)2B及び(HPF2)2Cとを備える。
As shown in FIG. 4, the
回線インターフェース19は、インターネット1から入力された信号をステレオ信号に変換して、ステレオ信号を形成する2チャネルの信号を復号器2に与えるものである。また、符号化部18により符号化された送信データとしての2チャンネルの信号を受け取ると、インターネッ卜1に出力するために適したデータサイズ、構成のパケットに整形し、図示しない相手側話者に出力するものである。
The
なお、本実施形態では、回線インターフェース19がステレオ信号への変換機能を有するものとして説明するが、復号器2がステレオ信号への変換機能を備えるものとしてもよい。
In the present embodiment, the
復号器2は、回線インターフェース19からの2チャネルの信号のそれぞれに対して復号処理を施し、復号した2チャネルの信号を帯域制限フィルタ(BPF1)4に与えるものである。
The
帯域制限フィルタ(BPF1)4は、復号器2からの復号した2チャネルの信号それぞれに対して帯域制限のフィルタ処理を施し、各信号を加算器25−1及び25−2に与えるものである。
The band-limiting filter (BPF1) 4 performs band-limiting filter processing on each of the decoded 2-channel signals from the
このとき、例えば、ステレオ信号のRチャンネルの信号を低周波発生器3に接続可能な加算器25−2に与え、又ステレオ信号のLチャンネルの信号を高周波発生器2Aに接続可能な加算器25−1に与える。もちろん、それぞれのチャンネルの信号をいずれかの加算器に与えるものとできれば、これに限定されない。
At this time, for example, the R channel signal of the stereo signal is supplied to the adder 25-2 connectable to the
加算器25−1は、第2の実施形態と同様に、帯域制限フィルタ(BPF1)4からの信号と高周波発生器2Aからの出力を加算して、音声出力ドライバー5及び高域通過フィルタ(HPF1)2Bに与える。
Similarly to the second embodiment, the adder 25-1 adds the signal from the band limiting filter (BPF1) 4 and the output from the high frequency generator 2A, and outputs the
また、加算器25−2は、第1の実施形態と同様に、帯域制限フィルタ(BPF1)4からの信号と低周波発生器3からの出力を加算して、音声出力ドライバー5及び低域通過フィルタ(LPO1)26に与える。
Similarly to the first embodiment, the adder 25-2 adds the signal from the band limiting filter (BPF1) 4 and the output from the
音声入力ドライバー15は、2チャンネルの出力信号を、帯域制限フィルタ(BPF2)16、高域通過フィルタ(HPF2)2C及び低域通過フィルタ(LPO2)27に与える。
The
帯域制限フィルタ(BPF2)16は、音声入力ドライバー15からの2チャンネルの各信号を、加算器17−1及び17−2に与えるものである。
The band limiting filter (BPF2) 16 gives the two-channel signals from the
加算器17−1は、帯域制限フィルタ(BPF2)16から出力と適応フィルタ21−1からの出力とに基づいて擬似エコー成分を減算し、出力を適応フィルタ21−1及び符号化器18に与える。
The adder 17-1 subtracts the pseudo echo component based on the output from the band limiting filter (BPF2) 16 and the output from the adaptive filter 21-1, and provides the output to the adaptive filter 21-1 and the
また、加算器17−2は、帯域制限フィルタ(BPF2)16から出力と適応フィルタ21−2からの出力とに基づいて擬似エコー成分を減算し、出力を適応フィルタ21−2及び符号化器18に与える。
Further, the adder 17-2 subtracts the pseudo echo component based on the output from the band-limiting filter (BPF2) 16 and the output from the adaptive filter 21-2, and outputs the output to the adaptive filter 21-2 and the
適応フィルタ21−1及び21−2は、初期遅延付加部20から、帯域制限フィルタ4の2チャンネルの出力信号x(k)のそれぞれに対して初期遅延付加部20により遅延を加えた信号が入力されている。
The adaptive filters 21-1 and 21-2 receive from the initial delay adding unit 20 a signal obtained by adding a delay by the initial
初期遅延付加部20は、帯域制限フィルタ4から2チャンネルの信号x(k)を取り込み、初期遅延判定部22からの初期遅延制御信号に基づいてそれぞれの信号に遅延を加えて、それぞれの適応フィルタ21−1及び21−2に与えるものである。
The initial
初期遅延判定部22は、低域通過フィルタ(LPO1)26及び(LPO2)27からの出力と、高域通過フィルタ(HPF1)2B及び(HPF2)2Cからの出力を取り込み、それぞれのチャンネルについての初期遅延を判定し、初期遅延付加部20に与えるものである。
The initial
以上のように、第3の実施形態によれば、第1及び第2の実施形態と同様の効果を得ることができる。 As described above, according to the third embodiment, the same effects as those of the first and second embodiments can be obtained.
また、第3の実施形態によれば、低周波発生器3側に係る経路を用いて例えばスピーカ1、マイク1に関わる経路をステレオのRチヤンネル、高周波発生器2A側に係る経路を用いて例えばスピーカ2、マイク2に関わる経路をステレオのLチャンネルに割り当てることによって、ステレオサウンドを損なうことなく通信を実現する通信装置を提供できる。
In addition, according to the third embodiment, for example, a path related to the
(D)第4の実施形態
次に、本発明のエコーキャンセラの第4の実施形態を図面を参照しながら説明する。
(D) Fourth Embodiment Next, a fourth embodiment of the echo canceller of the present invention will be described with reference to the drawings.
途切れ緩衝用蓄積バッファによる遅延の変化には2通りの種類があり、1つは初期遅延の量的な変動であり、もう1つは完全な信号の欠落である。 There are two types of delay changes caused by the interruption buffer accumulation buffer, one is a quantitative variation in the initial delay, and the other is a complete signal loss.
エコーを適切に打消すためには、適応フィルタがこれらの種類を区別することが望ましい。なぜなら、信号の欠落は途切れ緩衝用蓄積バッファの容量飽和に原因して発生するものであるから、欠落が発生している間は、欠落の量が不確定となるので、その間はエコー経路を一定のものと仮定したままで推定するのは不適切である。つまり、定常的な遅延となって、エコーに反映されるまでは追従しないほうがよい。 In order to properly cancel the echo, it is desirable for the adaptive filter to distinguish between these types. Because the signal loss occurs due to the capacity saturation of the accumulation buffer for the interruption buffer, the amount of the loss is indefinite while the loss is occurring, so the echo path is constant during that time. It is inappropriate to estimate with the assumption. In other words, it is better not to follow until a steady delay is reflected in the echo.
そこで、信号の欠落を区別できれば、その間は、初期遅延の推定を実行しないようにできる。 Therefore, if it is possible to distinguish the missing signal, the estimation of the initial delay can be prevented during that period.
図5は、第4の実施形態に係るハンズフリー通話装置の構成を示すブロック図である。 FIG. 5 is a block diagram showing a configuration of a hands-free call device according to the fourth embodiment.
図5において、第4の実施形態の構成が第1の実施形態の構成と異なる点は、低周波発生器3とスイッチ23との間に位相反転器41を備える点、タイマ40を新たに備える点、初期遅延判定部22が初期遅延判定部42に変わった点である。
In FIG. 5, the configuration of the fourth embodiment is different from the configuration of the first embodiment in that a
なお、図5に示す第4の実施形態の構成要素のうち図1に示す第1の実施形態の構成要素と対応するものについては、図1と対応する符号を示してあり、これら構成要素についての詳細な説明は省略する。 In addition, about the component corresponding to the component of 1st Embodiment shown in FIG. 1 among the components of 4th Embodiment shown in FIG. 5, the code | symbol corresponding to FIG. 1 is shown, About these components The detailed description of is omitted.
タイマ40は、スイッチ23の閉鎖後の時間をカウントするものであり、例えば、低周波発生器3の1周期分の時間毎に位相反転器41に対して位相反転タイミング信号revを出力するものである。
The
位相反転器41は、低周波発生器3が発生した低周波信号を取り込み、タイマ40から位相反転タイミング信号revを受信するたびに、上記低周波信号を移送反転して出力するものである。
The
初期遅延判定部42は、低域通過フィルタ(LPO1)26からの出力信号x2(k)を取り込むと共に、低周波発生器3が発生した低周波信号を取り込む。そして、初期遅延判定部42は、信号x2(k)と低周波信号とを加算し、加算結果が0になる周期、すなわち低周波信号の位相の反転周期REV_Tを計算すると共に、低域通過フィルタ26の出力においても、第1の実施形態で説明したように相関が位相の反転周期REV_T毎に強い相関を表す値C0、例えば0.5(正規化をしたときは1.0)をとることを計算する。
The initial delay determination unit 42 takes in the output signal x2 (k) from the low-pass filter (LPO1) 26 and takes in the low-frequency signal generated by the low-
相関が位相の反転周期REV_T毎に所定の閾値C0を超えない場合は、初期遅延判定部42は、初期遅延付加量の変更をしないままの値を初期遅延付加部20に出力する。また、相関が位相の反転周期REV_T毎に所定の閾値C0を超えた場合は、初期遅延判定部42は、新たに初期遅延判定部42で計算した初期遅延を付加するよう初期遅延付加部20に初期遅延判定部42の出力である遅延量を出力する。
When the correlation does not exceed the predetermined threshold value C0 for each phase inversion period REV_T, the initial delay determination unit 42 outputs a value without changing the initial delay addition amount to the initial
ここで、初期遅延判定部42による信号の欠落方法を説明する。信号の欠落が発生したときには信号の周期性が失われる。低周波発生器3からの低周波信号はトーン信号であるので、2周期目の信号は位相反転器41により位相反転されており、次に大きな相関が発生するのは3周期目となる。
Here, a signal omission method by the initial delay determination unit 42 will be described. When signal loss occurs, signal periodicity is lost. Since the low-frequency signal from the low-
従って、初期遅延付加部42は、3周期目でちょうど強い相関を検知したとき、その間のエコー経路における信号の欠落は発生していないものと判定し、初期遅延の推定をしてもよいことと判断し、求めた遅延量を初期遅延付加部20に与える。
Therefore, when the initial delay adding unit 42 detects a strong correlation in the third period, it determines that no signal loss has occurred in the echo path during that period, and may estimate the initial delay. The determined delay amount is given to the initial
一方、3周期目以外の場所で強い相関を検知した場合、エコー経路において信号のどこかに欠落が生じているものと判定し、遅延をエコー除去に反映させないようにする。特に、信号の欠落があった場合は3周期目以後に強い相関が現れることが多い。 On the other hand, when a strong correlation is detected at a place other than the third period, it is determined that a signal is missing somewhere in the echo path, and the delay is not reflected in echo removal. In particular, when a signal is missing, a strong correlation often appears after the third period.
以上のように、第4の実施形態によれば、第1の実施形態と同様の効果を得ることができる。 As described above, according to the fourth embodiment, the same effect as that of the first embodiment can be obtained.
また、第4の実施形態によれば、初期遅延判定部42が、加算器25からの出力信号と低周波信号との相関をとることにより、途切れ緩衝用蓄積バッファによる遅延の変動が初期遅延の量的な変動によるものであるか又は信号欠落によるものであるかを判定することができ、その判定結果に応じて適切なエコーを都合よく推定し、通話品質を向上できる。
In addition, according to the fourth embodiment, the initial delay determination unit 42 correlates the output signal from the
(E)第5の実施形態
次に、本発明のエコーキャンセラの第5の実施形態を図面を参照しながら説明する。
(E) Fifth Embodiment Next, a fifth embodiment of the echo canceller of the present invention will be described with reference to the drawings.
第5の実施形態は、本来、会話のためには余分な信号であるエコー経路推定のための遅延推定信号をできるだけ短く出力して済ますようにしたものである。 In the fifth embodiment, a delay estimation signal for echo path estimation, which is an extra signal for conversation, is output as short as possible.
非特許文献1(p.115〜p.117)では、人間の聴覚特性として、大きな音のあとに続く小さな音が感覚としてあたかも隠蔽され、聞き取れない現象があることを述べている(継時マスキング)。 Non-Patent Document 1 (p.115 to p.117) states that as a human auditory characteristic, there is a phenomenon that a small sound that follows a loud sound is concealed as a sensation and cannot be heard (continuous masking). ).
非可聴域の高周波は人間には聞こえないが、犬などの動物にとっては可聴域信号であることが知られており、人間にとっての非可聴域の高周波であっても長時間にわたって継続的にスピーカから出力することが望ましくない場合がある。例えば装置設置近辺に小動物、例えばペットなどがいるような場合には、当該不動物の異常挙動を誘発するおそれがある。このような場合には遅延推定信号である高周波の出力時間をできるだけ短くすることが望ましい。 High frequencies in the non-audible range cannot be heard by humans, but it is known to be an audible range signal for animals such as dogs. May not be desirable. For example, when there is a small animal such as a pet in the vicinity of the installation of the device, there is a risk of inducing abnormal behavior of the animal. In such a case, it is desirable to shorten the output time of the high frequency that is the delay estimation signal as much as possible.
そこで、第5の実施形態は、上記の点に鑑みて、本来、会話のためには余分な信号であるエコー経路推定のための遅延推定信号をできるだけ短く出力して済ますようにしたものである。 Therefore, in the fifth embodiment, in view of the above points, the delay estimation signal for estimating the echo path, which is an extra signal for conversation, can be output as short as possible. .
図6は、第5の実施形態に係るハンズフリー通話装置の構成を示すブロック図である。 FIG. 6 is a block diagram showing a configuration of a hands-free call device according to the fifth embodiment.
図6において、第5の実施形態の構成が第2の実施形態の構成と異なる点は、スイッチ23がスイッチ51に変更した点、加算器25の前に音声レベル検出器50を備える点である。
In FIG. 6, the configuration of the fifth embodiment is different from the configuration of the second embodiment in that the
なお、図6に示す第5の実施形態の構成要素のうち図2に示す第2の実施形態の構成要素と対応するものについては、図2と対応する符号を示してあり、これら構成要素についての詳細な説明は省略する。 In addition, about the component corresponding to the component of 2nd Embodiment shown in FIG. 2 among the components of 5th Embodiment shown in FIG. 6, the code | symbol corresponding to FIG. 2 is shown, About these components The detailed description of is omitted.
スイッチ51は、初期状態では開放であり、ネットワーク端末装置24の立ち上げ時、例えば電源投入時に閉じられる。なお、スイッチ51は、図示しない装置操作者の操作による指示信号などによって、電源投入時以外にも、所望のタイミングで閉じるようにしてもよい。例えば、適応フィルタ21のリセットをしたいときなどにスイッチ51を閉じるようにしてもよい。
The
音声レベル検出器50は、帯域制限フィルタ4からの出力信号x(k)を取り込み、この信号x(k)の信号パワーを計算し、この信号x(k)のパワーが予め定められたレベル以上である場合に所定時間だけスイッチ51を閉じるようにし、それ以外で開放させるものである。
The audio level detector 50 takes in the output signal x (k) from the band limiting filter 4, calculates the signal power of the signal x (k), and the power of the signal x (k) exceeds a predetermined level. In this case, the
ここで、本実施形態では、音声レベル検出器50は、信号x(k)のパワーが継時マスキング効果を発生するのに十分なレベルとして、例えば30dB以上のとき、その後10msだけスイッチ51を閉じるようにし、その時間経過後スイッチ51を開放させるものとする。
Here, in the present embodiment, the audio level detector 50 closes the
なお、音圧レベルの基準値である0dBは公知のように、1000Hz、20μPaを0dBとすればよく、後述する維持マスキングに必要なレベルを計算できれば、どのような単位を用いてもかまわない。 As is well known, 0 dB which is a reference value of the sound pressure level may be set to 1000 Hz and 20 μPa to 0 dB, and any unit may be used as long as a level necessary for maintenance masking described later can be calculated.
このように、音声レベル検出器50が、継時マスキング効果を発生するのに十分なレベルの信号パワーx(k)を検出したときに、所定の時間だけ遅延推定信号を混ぜ込み、それ以外の時間には混ぜ込まないようにすることで、近辺事物に対する影響を最小化させることができる。 As described above, when the audio level detector 50 detects the signal power x (k) at a level sufficient to generate the continuous masking effect, the delay estimation signal is mixed for a predetermined time, By not mixing in time, the influence on nearby things can be minimized.
高周波発生器2Aからの信号はスイッチ51が閉じられている間だけ加算器25に出力され、それ以外は加算器25に出力されない。
The signal from the high frequency generator 2A is output to the
以上のように、第5の実施形態によれば、第1及び第2の実施形態と同様の効果を得ることができる。 As described above, according to the fifth embodiment, the same effects as those of the first and second embodiments can be obtained.
また、第5の実施形態によれば、音声レベル検出器50を設け、音声レベル検出器50のレベル検出結果に応じて、大きなレベルの音声信号があるときにだけ、維持マスキングによって隠蔽されるレベルの遅延推定信号を、高周波発生器2Aから短時間だけ出力するようにしたので、装置使用の話者など、装置の使用場所に不必要に長時間エコー遅延推定のための信号を出力することがなく、信号出力のための電力を節約すると共に、不可避的に装置近傍に位置して信号を受ける生物等に対し、与える影響を軽微にする安全な装置を実現することができる。 Further, according to the fifth embodiment, the audio level detector 50 is provided, and the level concealed by the maintenance masking only when there is a high level audio signal according to the level detection result of the audio level detector 50. The delay estimation signal is output from the high-frequency generator 2A for a short time, so that a signal for estimating the echo delay for a long time may be output unnecessarily to the place where the apparatus is used, such as a speaker using the apparatus. In addition, it is possible to realize a safe device that saves power for signal output and inevitably has a small influence on a living organism or the like that is positioned near the device and receives a signal.
(F)第6の実施形態
次に、本発明のエコーキャンセラの第6の実施形態を図面を参照しながら説明する。
(F) Sixth Embodiment Next, a sixth embodiment of the echo canceller of the present invention will be described with reference to the drawings.
非特許文献1(p.109〜p.113)では、人間の聴覚特性として、ある周波数を聞いている最中はその周波数の倍数に当たる周波数などの、特別な周波数に関しては、たとえ信号があっても聞き取り感度が鈍化する効果が示されている(以後、これをマスキング効果という)。 In Non-Patent Document 1 (p.109 to p.113), as a human auditory characteristic, there is a signal for a special frequency such as a frequency that is a multiple of the frequency while listening to a certain frequency. Has also been shown to have an effect of decreasing the listening sensitivity (hereinafter referred to as a masking effect).
これは、第5の実施形態における、大きな音に続いて小さな音があるときに小さな音に対する感度が鈍る「維持マスキング」と感度が鈍る点で性質が似ているが、マスクされる側とマスクする側に周波数成分として一定の関係があるという点で性質が異なっている。 This is similar in nature to the "maintenance masking" in which the sensitivity to a small sound is dull when there is a small sound following a loud sound in the fifth embodiment, but the sensitivity is dull. The nature is different in that there is a certain relationship as a frequency component on the side to be performed.
そこで、第6の実施形態では、このマスキング効果を利用して、遅延推定信号発生器の周波数帯域を低周波や高周波などの非可聴領域の信号としなくても同様の動作を実現することで、安全性を向上させ、装置の設計コストを軽減させることを図る。 Therefore, in the sixth embodiment, by using this masking effect, by realizing the same operation without using the frequency band of the delay estimation signal generator as a signal in a non-audible region such as a low frequency or a high frequency, To improve safety and reduce device design costs.
図7は、第6の実施形態に係るハンズフリー通話装置の構成を示すブロック図である。 FIG. 7 is a block diagram showing the configuration of the hands-free call device according to the sixth embodiment.
図7において、第6の実施形態の構成が第5の実施形態の構成と異なる点は、音声レベル検出器50が音声周波数分析器60に変更されている点、高周波発生器2Aが被マスク信号発生器62に変更されている点、スイッチ51がスイッチ61に変更されている点、高域通過フィルタ(HPF1)2Bがなくなった点、高域通過フィルタ(HPF2)2Cが周波数弁別器63に変更されている点、帯域制限フィルタ(BPF2)16がなくなった点、初期遅延付加部20の入力が加算器25からの出力を取り入れる点である。
In FIG. 7, the configuration of the sixth embodiment is different from the configuration of the fifth embodiment in that the audio level detector 50 is changed to an
なお、図7に示す第7の実施形態の構成要素のうち図6に示す第5の実施形態の構成要素と対応するものについては対応する符号を付し、これらの構成要素の詳細な説明は省略する。 Of the constituent elements of the seventh embodiment shown in FIG. 7, those corresponding to the constituent elements of the fifth embodiment shown in FIG. 6 are denoted by the corresponding reference numerals, and detailed descriptions of these constituent elements are as follows. Omitted.
音声周波数分析器60は、帯域制限フィルタ(BPF1)4からの出力を取り込み、入力音声信号を周波数成分に変換し、後述のように周波数成分に変換した信号のうち比較的周波数成分のパワーが弱い部分を少なくとも1以上求めるものである。
The
また、音声周波数分析器60は、上述した比較的周波数成分のパワーが弱い部分を求めると、その部分の周波数の半分に当たる周波数成分のパワーを求める。そして、音声周波数分析器60は、当該部分の周波数成分のパワーと当該部分の周波数の半分に当たる周波数成分のパワーとに基づいて音声入力成分でない周波数を求めるものである。
In addition, when the
さらに、音声周波数分析器60は、音声入力成分でない周波数を求めると、その音声入力成分でない周波数成分の信号を出力させるように、被マスク信号発生器62、スイッチ61及び周波数弁別器63に指示するものである。
Furthermore, when the
ここで、音声周波数分析器60による周波数成分の変換方法は、時間軸信号を周波数成分に変更することができれば、特に限定されるものではないが、例えば、既存する高速フーリエ変換(以後FFT)を適用して変換する方法を適用することができる。
Here, the method of converting the frequency component by the
また、音声周波数分析器60により比較的周波数成分のパワーが弱い部分を求める方法は、例えば、一旦FFTで求めたパワースペクトルを平滑化した包絡を計算し、その計算した包絡線の谷部分を、比較的周波数成分のパワーが弱い部分として求める。なお、音声周波数分析器60が求める比較的周波数成分のパワーが弱い部分の数は、少なくとも1以上であればよいが、本実施形態では5箇所を求めるものとする。
In addition, the method for obtaining a portion where the power of the frequency component is relatively weak by the
さらに、音声周波数分析器60により音声入力成分でない周波数を求める方法は、例えば、パワースペクトル成分の谷の部分の周波数成分のパワーと、その谷の部分の周波数の半分に当たる周波数成分のパワーとの関係が、以下に示す条件1を満たしているか否かを判定する。
Further, a method for obtaining a frequency that is not an audio input component by the
条件1:半分に当たる周波数成分のパワー≧谷部分周波数のパワー+δdB。 Condition 1: Power of frequency component corresponding to half ≧ power of valley frequency + δ dB.
ここで、δは予め定めることができる値であり、本実施形態ではδ=30dBとするが、この値は特に限定されない。 Here, δ is a value that can be determined in advance. In this embodiment, δ = 30 dB, but this value is not particularly limited.
例えば、音声周波数分析器60は、パワースペクトル成分の谷の部分を5個求めると、それぞれの谷の部分の周波数成分のパワーと、それに対応する周波数が半分に当たる周波数成分のパワーとを比較して、周波数が半分に当たる周波数成分のパワーが、谷の部分の周波数成分のパワーより予め定めた値δより大きいから否かを、すべての谷の部分の周波数成分について判断する。
For example, when the
例えば、周波数2400Hzにおけるパワースペクトルが谷を示したとき、音声周波数分析器60は、その周波数2400Hzの半分に当たる周波数1200Hzにおけるパワーを求める。
For example, when the power spectrum at a frequency of 2400 Hz indicates a valley, the
そして、(1200Hzのパワー)≧(2400Hzのパワー)+30dBの条件を満たしているか否かを判断し、この条件を満たしている「谷の部分」を複数個求めるようにする。 Then, it is determined whether or not the condition of (1200 Hz power) ≧ (2400 Hz power) +30 dB is satisfied, and a plurality of “valley portions” satisfying this condition are obtained.
なお、本実施形態では、谷の周波数と、その半分の周波数との比較を行なう場合を示すが、谷の周波数の半分の周波数でなく、1/N(Nは正の整数)の周波数としてもよい。 In the present embodiment, the case where the frequency of the valley is compared with the half of the frequency is shown. However, the frequency of 1 / N (N is a positive integer) may be used instead of the half of the frequency of the valley. Good.
次に、音声周波数分析器60は、条件1を満たしている谷の部分を複数個求めると、その谷の部分の周波数成分のパワーと、半分に当たる周波数成分のパワーとの差が、最も大きいパワー差となる最大乖離谷周波数F1を1個求め、この最大乖離谷周波数F1(例えば、1200Hz)を被マスク信号発生器62及び周波数弁別器63に出力する。
Next, when the
被マスク信号発生器62は、音声周波数分析器60から最大乖離谷周波数F1の入力を取り込むと、その最大乖離谷周波数F1を成分に有する時間軸信号を発生して、スイッチ61に出力するものである。
When receiving the input of the maximum deviation valley frequency F1 from the
スイッチ61は、被マスク信号発生器62からの出力信号を初期遅延判定部22に出力するものである。
The
周波数弁別器63は、音声周波数分析器60から最大乖離谷周波数F1の入力を取り込み、その最大乖離谷周波数F1の周波数成分をもつ信号だけを初期遅延判定部22に通すように周波数を弁別するものである。
The
ここで、周波数弁別器63による弁別の方法は、例えば、一旦FFTで周波数成分に変換し、音声周波数分析器60からの周波数成分以外をすべて0にしたあと、既存技術である逆高速フーリエ変換変換(以後IFFT)を施して時間波形に戻すなどすればよく、所望周波数の弁別ができればこの方法には限定しない。
Here, the discrimination method by the
初期遅延判定部22は、周波数弁別器63とスイッチ61を経由した被マスク信号発生器62からの出力を用いて初期遅延量の推定を実施するものである。これにより、前述した実施例と同様の方法でエコー経路の初期遅延を求めるようにしたので、スピーカ側にいる装置の使用者にとってはマスキング効果によって、遅延推定信号が聞こえてしまう不快感がない。
The initial
初期遅延付加部20では、加算器25の出力に対して初期遅延判定部22から出力される遅延量を付加するものである。
The initial
以上のように、第6の実施形態によれば、マスキング効果を利用して、初期遅延付加部20が付与する初期遅延量を推定する遅延推定信号を可聴域の信号としたことにより、周波数帯域を低周波や高周波などの非可聴領域の信号にしなくてもよくなり、安全性を向上させ、装置の設計コストを低減させることができる。
As described above, according to the sixth embodiment, the delay estimation signal for estimating the initial delay amount provided by the initial
また、第6の実施形態では、音声周波数分析器60を備えることで、入力音声信号のうち本来の入力音声成分のない周波数帯域がどこであるかを求めることができ、被マスク信号発生器62に当該周波数成分の音声信号を発生させることができる。
Further, in the sixth embodiment, by providing the
さらに、第6の実施形態によれば、被マスク信号発生器62及び周波数弁別器63を設けることで、入力音声成分のない周波数成分の信号だけを初期遅延判定部22に与えるようにしたので、初期遅延判定部22は、当該周波数成分の信号だけを用いて初期遅延を判定することができ、スピーカ側の使用者にマスキング効果による不快感のない遅延推定信号を出力できる。
Furthermore, according to the sixth embodiment, by providing the masked signal generator 62 and the
また、第6の実施形態では、周波数弁別器63を設け、エコー信号に関しても音声周波数分析器60から出力された周波数成分の信号だけを初期遅延判定部22に出力するようにしたので、周波数弁別器63の出力信号である出力信号に関しても、エコー経路をとおった、ほぼ遅延推定信号成分のみで構成されていて、エコー推定に最も望ましい観測信号を入手でき、高周波などの非可聴領域の信号を用いず、加算器25からの出力を初期遅延付加部20を経由して適応フィルタ21に入力するようにしたので、適応フィルタ21に対して悪影響のある信号がはじめからないので、第2の音声帯域フィルタ16等を用いて周波数帯域以外の制限処理をしなくても、初期遅延推定信号が混じったままで適応フィルタ21のエコー経路推定に用いてよくなり、第5の実施例での音声入力ドライバー15と適応フィルタ21の間にある第2の帯域制限フィルタ16等をなくすことができる。
In the sixth embodiment, since the
その結果、装置構成を簡単にできるばかりでなく、第2の帯域制限フィルタ16の帯域制限処理に伴う不可避的な処理遅延をなくすことができるので、遅延感のない、より自然な会話が可能になる。
As a result, not only the apparatus configuration can be simplified, but also the inevitable processing delay associated with the band limiting process of the second
さらに、高周波などの非可聴領域の信号を用いないので、信号を相当時間長時間にわたってスピーカから出力しても、装置使用者は会話の音声信号しか聞こえないので、聴感的に違和感なく、スピーカ近辺の事物に対しても、非可聴周波数、例えば高周波を聞かせることによる異常挙動を少なくすることができ、長時間通信を行なっても、安全で通話品質に優れた通信端末を実現化するエコーキャンセラを提供できるのである。 Furthermore, since a signal in a non-audible region such as a high frequency is not used, even if the signal is output from the speaker for a long time, the device user can only hear the voice signal of the conversation. Echo cancellers that can reduce the abnormal behavior caused by listening to non-audible frequencies, such as high frequencies, and realize a safe and excellent communication quality even for long-term communication Can be provided.
(G)他の実施形態
第4の実施形態では、初期遅延判定部42が低周波発生器3の出力と加算器25を経由した位相反転器の出力を比較して、位相反転のタイミングを計算するようにしたが、タイマ40から直接位相反転のタイミング信号を入力し、入力周期をカウントして位相反転周期の判断を行なうようにしてもよい。
(G) Other Embodiments In the fourth embodiment, the initial delay determination unit 42 compares the output of the
第5の実施形態において、遅延推定のための信号発生器を高周波発生器としたが、第5の実施例のおもな効果は継時マスキングによって、遅延推定信号を話者に悟られることなくスピーカから出力してエコー経路の遅延を推定することであるので、維持マスキングの効果に重点をおき、可聴域の信号を発生する任意信号発生器を用いてもよい。 In the fifth embodiment, the signal generator for delay estimation is a high-frequency generator. The main effect of the fifth embodiment is that the delay estimation signal is not recognized by the speaker by successive masking. Since the delay of the echo path is estimated by outputting from the speaker, an arbitrary signal generator that generates an audible signal with emphasis on the effect of the maintenance masking may be used.
第6の実施形態において、周波数弁別器としてFFTとIFFTを用いる例を示したが、フィルタバンク、すなわち複数の帯域通過フィルタを設けて、音声周波数分析器の出力に応じた通過帯域をもつ、フィルタバンクの中の1つのフィルタを選択して通過させるようにしてもよい。 In the sixth embodiment, an example in which FFT and IFFT are used as frequency discriminators has been described. However, a filter bank, that is, a filter having a plurality of band pass filters and having a pass band corresponding to the output of the audio frequency analyzer One filter in the bank may be selected and passed.
1…ネットワーク(インターネット)、2…復号器、3…低周波発生器、4…帯域制限フィルタ(BPF1)、5…音声出力ドライバー、6…途切れ緩衝用蓄積バッファ、7…D/A(ディジタル/アナログ変換器)、8…サウンドボード、9…スピーカ端子、10…スピーカ、11…マイク、12…マイク端子、13…A/D(アナログ/ディジタル変換器)、14…途切れ緩衝用蓄積バッファ、15…音声入力ドライバー、16…帯域制限フィルタ(BPF2)、17(17−1、17−2)…加算器、18…符号化器、19…回線インターフェース、20…初期遅延付加部、21(21−1、21−2)…適応フィルタ、22…初期遅延判定部、23(23−1、23−2)…スイッチ、24…ネットワーク端末装置、25(25−1、25−2)…加算器、26…低域通過フィルタ(LPO1)、27…低域通過フィルタ(LPO2)、2A…高周波発生器、2B…高域通過フィルタ(HPF1)、2C…高域通過フィルタ(HPF2)、40…タイマ、41…位相反転器、42…初期遅延判定部、50…音声レベル検出器、51…スイッチ、60…音声周波数分析器、61…スイッチ、62…被マスク信号発生器、63…周波数弁別器。
DESCRIPTION OF
Claims (9)
非可聴な時間軸波形成分を有する非可聴信号を発生する非可聴信号発生手段と、
上記受信信号に上記非可聴信号を加算した出力信号を生成する出力信号生成手段と、
上記非可聴信号に対して所定のフィルタ処理を施して第1の遅延推定信号を生成する第1の遅延推定信号生成手段と、
上記送信信号に対して所定のフィルタ処理を施して第2の遅延推定信号を生成する第2の遅延推定信号生成手段と、
上記第1の遅延推定信号と上記第2の遅延推定信号との相互相関に基づいて、エコー経路による可変遅延特性を反映させた遅延時間情報を求める遅延時間情報算出手段と、
上記遅延時間情報算出手段が算出した上記遅延時間情報に基づいて上記適応フィルタへの受信信号の入力を遅延させる遅延付加手段と
を備えることを特徴とするエコーキャンセラ。 In an echo canceller in which a pseudo echo signal generated based on a received signal by a pseudo echo generating means having an adaptive filter is subtracted from a transmission signal by an echo removing means to remove an echo component,
A non-audible signal generating means for generating a non-audible signal having a non-audible time axis waveform component;
Output signal generating means for generating an output signal obtained by adding the inaudible signal to the received signal;
First delay estimation signal generation means for generating a first delay estimation signal by applying a predetermined filtering process to the inaudible signal;
Second delay estimation signal generation means for generating a second delay estimation signal by applying a predetermined filtering process to the transmission signal;
Delay time information calculating means for obtaining delay time information reflecting variable delay characteristics by an echo path based on a cross-correlation between the first delay estimation signal and the second delay estimation signal;
An echo canceller comprising: delay addition means for delaying input of a received signal to the adaptive filter based on the delay time information calculated by the delay time information calculation means.
上記第1の遅延推定信号生成手段及び上記第2の遅延推定信号生成手段が、複数のチャンネルを有する受信信号の各チャンネルの信号に対してそれぞれ異なる非可聴信号を割り当てて、第1の遅延推定信号及び第2の遅延推定信号を生成する
ことを特徴とする請求項1に記載のエコーキャンセラ。 The non-audible signal generating means generates two or more non-audible signals;
The first delay estimation signal generation means and the second delay estimation signal generation means allocate different inaudible signals to the signals of the respective channels of the reception signal having a plurality of channels, and perform the first delay estimation. The echo canceller according to claim 1, wherein the signal and the second delay estimation signal are generated.
上記遅延時間情報算出手段が、上記非可聴信号と、位相反転した非可聴信号が加算された第1の遅延推定信号及び第2の遅延推定信号との位相の一致を判定し、その判定結果に応じた遅延時間情報を出力する
ことを特徴とする請求項1〜6のいずれかに記載のエコーキャンセラ。 Inverting the phase of the non-audible signal output from the non-audible signal generating means, and comprising a phase inverting means for causing the output signal generating means to add the phase of the non-audible signal to the received signal.
The delay time information calculating means determines the coincidence of the phase between the non-audible signal and the first delay estimation signal and the second delay estimation signal to which the phase-inverted non-audible signal is added. The corresponding delay time information is output. The echo canceller according to any one of claims 1 to 6.
上記非可聴信号発生手段が、上記周波数分析手段が特定した周波数の周波数信号を発生するものであり、
上記第2の遅延推定信号生成手段が、上記送信信号のうち上記周波数分析手段が特定した周波数の周波数成分信号を弁別すると共に、その弁別した周波数成分信号を上記遅延時間情報算出手段に与えるものであり、
上記遅延時間情報算出手段が、上記非可聴信号発生手段が出力した上記周波数信号と、上記第2の遅延推定信号生成手段が弁別した周波数成分信号とに基づいて、遅延時間情報を算出する
ことを特徴とする請求項1〜8のいずれかに記載のエコーキャンセラ。
In order to utilize the frequency masking effect, the frequency component of the received signal is analyzed, and the frequency component of the frequency component of relatively low power among the audio components of the received signal is specified,
The non-audible signal generating means generates a frequency signal having a frequency specified by the frequency analyzing means;
The second delay estimation signal generation means discriminates a frequency component signal having a frequency specified by the frequency analysis means from the transmission signal and supplies the discriminated frequency component signal to the delay time information calculation means. Yes,
The delay time information calculating means calculates delay time information based on the frequency signal output from the non-audible signal generating means and the frequency component signal discriminated by the second delay estimation signal generating means. The echo canceller according to any one of claims 1 to 8.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006167604A JP4894368B2 (en) | 2006-06-16 | 2006-06-16 | Echo canceller |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006167604A JP4894368B2 (en) | 2006-06-16 | 2006-06-16 | Echo canceller |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007336364A true JP2007336364A (en) | 2007-12-27 |
JP4894368B2 JP4894368B2 (en) | 2012-03-14 |
Family
ID=38935392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006167604A Expired - Fee Related JP4894368B2 (en) | 2006-06-16 | 2006-06-16 | Echo canceller |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4894368B2 (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008124577A (en) * | 2006-11-08 | 2008-05-29 | Oki Electric Ind Co Ltd | Echo canceller |
JP2009260699A (en) * | 2008-04-17 | 2009-11-05 | Mitsubishi Electric Corp | Echo canceler |
JP2010068213A (en) * | 2008-09-10 | 2010-03-25 | Mitsubishi Electric Corp | Echo canceler |
JP2010206515A (en) * | 2009-03-03 | 2010-09-16 | Oki Electric Ind Co Ltd | Echo canceller |
WO2011033924A1 (en) * | 2009-09-17 | 2011-03-24 | ブラザー工業株式会社 | Echo removal device, echo removal method, and program for echo removal device |
JP2011130145A (en) * | 2009-12-17 | 2011-06-30 | Toa Corp | Network device |
JP2011130170A (en) * | 2009-12-17 | 2011-06-30 | Oki Electric Industry Co Ltd | Echo canceller |
US11363147B2 (en) | 2018-09-25 | 2022-06-14 | Sorenson Ip Holdings, Llc | Receive-path signal gain operations |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5864895A (en) * | 1981-10-14 | 1983-04-18 | Shigetaro Muraoka | Howling preventing method |
JPH1198065A (en) * | 1997-09-19 | 1999-04-09 | Nec Eng Ltd | On-air monitor system |
JP2002237769A (en) * | 2001-02-08 | 2002-08-23 | Nippon Telegr & Teleph Corp <Ntt> | Multi-channel echo suppressing method and its device and its program and its recording medium |
JP2003060530A (en) * | 2001-08-13 | 2003-02-28 | Fujitsu Ltd | Echo suppression processing system |
-
2006
- 2006-06-16 JP JP2006167604A patent/JP4894368B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5864895A (en) * | 1981-10-14 | 1983-04-18 | Shigetaro Muraoka | Howling preventing method |
JPH1198065A (en) * | 1997-09-19 | 1999-04-09 | Nec Eng Ltd | On-air monitor system |
JP2002237769A (en) * | 2001-02-08 | 2002-08-23 | Nippon Telegr & Teleph Corp <Ntt> | Multi-channel echo suppressing method and its device and its program and its recording medium |
JP2003060530A (en) * | 2001-08-13 | 2003-02-28 | Fujitsu Ltd | Echo suppression processing system |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008124577A (en) * | 2006-11-08 | 2008-05-29 | Oki Electric Ind Co Ltd | Echo canceller |
JP2009260699A (en) * | 2008-04-17 | 2009-11-05 | Mitsubishi Electric Corp | Echo canceler |
JP2010068213A (en) * | 2008-09-10 | 2010-03-25 | Mitsubishi Electric Corp | Echo canceler |
JP2010206515A (en) * | 2009-03-03 | 2010-09-16 | Oki Electric Ind Co Ltd | Echo canceller |
US8433059B2 (en) | 2009-03-03 | 2013-04-30 | Oki Electric Industry Co., Ltd. | Echo canceller canceling an echo according to timings of producing and detecting an identified frequency component signal |
WO2011033924A1 (en) * | 2009-09-17 | 2011-03-24 | ブラザー工業株式会社 | Echo removal device, echo removal method, and program for echo removal device |
JP2011066668A (en) * | 2009-09-17 | 2011-03-31 | Brother Industries Ltd | Echo canceler, echo canceling method, and program of echo canceler |
JP2011130145A (en) * | 2009-12-17 | 2011-06-30 | Toa Corp | Network device |
JP2011130170A (en) * | 2009-12-17 | 2011-06-30 | Oki Electric Industry Co Ltd | Echo canceller |
US11363147B2 (en) | 2018-09-25 | 2022-06-14 | Sorenson Ip Holdings, Llc | Receive-path signal gain operations |
Also Published As
Publication number | Publication date |
---|---|
JP4894368B2 (en) | 2012-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4894368B2 (en) | Echo canceller | |
JP5332733B2 (en) | Echo canceller | |
US9461702B2 (en) | Systems and methods of echo and noise cancellation in voice communication | |
JP3279372B2 (en) | Noise attenuation system | |
US9100756B2 (en) | Microphone occlusion detector | |
US9443528B2 (en) | Method and device for eliminating echoes | |
US9462552B1 (en) | Adaptive power control | |
CN110896509A (en) | Earphone wearing state determining method, electronic equipment control method and electronic equipment | |
US20140098950A1 (en) | Detection and Suppression of Returned Audio at Near-End | |
WO2016056167A1 (en) | Echo cancellation device, echo cancellation program, and echo cancellation method | |
JP2009050013A (en) | Echo detection and monitoring | |
JP3607625B2 (en) | Multi-channel echo suppression method, apparatus thereof, program thereof and recording medium thereof | |
US8588404B2 (en) | Method and apparatus for acoustic echo cancellation in VoIP terminal | |
JP5232121B2 (en) | Signal processing device | |
KR101035736B1 (en) | Apparatus and method for cancelling residual echo in a wireless communication system | |
JP4312227B2 (en) | Echo processing method and apparatus | |
JP6396829B2 (en) | Information processing apparatus, determination method, and computer program | |
JP4448423B2 (en) | Echo suppression method, apparatus for implementing this method, program, and recording medium therefor | |
JP5963077B2 (en) | Telephone device | |
JP2007151047A (en) | Voice switch method, voice switch apparatus, voice switch program and recording medium recorded with the program | |
JP2010010856A (en) | Noise cancellation device, noise cancellation method, noise cancellation program, noise cancellation system, and base station | |
JP5640393B2 (en) | Echo removal apparatus, method and program | |
RU2786157C2 (en) | Echo cancellation device, echo cancellation method, and echo cancellation program | |
JP2005534258A (en) | System and method for operating a speakerphone in a communication device | |
JP4448424B2 (en) | Voice switch method, apparatus for implementing the method, program, and recording medium therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110324 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110809 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111102 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20111109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111129 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111212 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150106 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |