JP2010527181A - Method and system for reducing acoustic echo in a multi-channel audio communication system - Google Patents

Method and system for reducing acoustic echo in a multi-channel audio communication system Download PDF

Info

Publication number
JP2010527181A
JP2010527181A JP2010506328A JP2010506328A JP2010527181A JP 2010527181 A JP2010527181 A JP 2010527181A JP 2010506328 A JP2010506328 A JP 2010506328A JP 2010506328 A JP2010506328 A JP 2010506328A JP 2010527181 A JP2010527181 A JP 2010527181A
Authority
JP
Japan
Prior art keywords
impulse response
vector
location
approximate
digital signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010506328A
Other languages
Japanese (ja)
Other versions
JP4897921B2 (en
Inventor
フォズンバル・マジド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of JP2010527181A publication Critical patent/JP2010527181A/en
Application granted granted Critical
Publication of JP4897921B2 publication Critical patent/JP4897921B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】本願は、適応リアルタイム音響エコーキャンセル方法およびシステムを対象とする。
【解決手段】本方法は、複数のスピーカ604、及び、第1の場所において生成される音及び該複数のスピーカによって生成される音響エコーを含む複数のマイクロフォンデジタル信号のうちの1つを生成する複数のマイクロフォン606を備えた第1の場所102から第2の場所104に伝送されるマイクロフォンデジタル信号において音響エコーを低減することを対象とする。本方法は、それぞれマイクロフォンとスピーカとの間の1つのエコーパス702に対応する複数の近似インパルス応答を求めることと、それぞれスピーカのうちの1つによって再生されるデジタル信号を多数の近似インパルス応答で畳み込むことに対応する複数の近似音響エコーを求めることとを含み、マイクロフォンデジタル信号のうちの少なくとも1つにおける音響エコーが、対応する近似音響エコーに基づいて低減される。
【選択図】図6
The present application is directed to an adaptive real-time acoustic echo cancellation method and system.
The method generates a plurality of speakers 604 and one of a plurality of microphone digital signals including sound generated at a first location and acoustic echo generated by the plurality of speakers. It is intended to reduce acoustic echo in a microphone digital signal transmitted from a first location 102 having a plurality of microphones 606 to a second location 104. The method determines a plurality of approximate impulse responses, each corresponding to one echo path 702 between the microphone and the speaker, and convolves the digital signal reproduced by each one of the speakers with a number of approximate impulse responses. Determining a corresponding plurality of approximate acoustic echoes, wherein acoustic echoes in at least one of the microphone digital signals are reduced based on the corresponding approximate acoustic echoes.
[Selection] Figure 6

Description

本発明は音響エコーキャンセルに関し、詳細には、マルチチャネル音声通信システムにおいて音響エコーを低減するための方法およびシステムに関する。   The present invention relates to acoustic echo cancellation, and in particular to a method and system for reducing acoustic echo in a multi-channel audio communication system.

インターネット、電子プレゼンテーション、ボイスメールおよび音声会議通信システムのような通信媒体への関心が高まりつつあることによって、高忠実度の音声技術および通信技術に対する要求が増大している。
現在、個人および企業が、これらの通信媒体を用いて効率性および生産性を高め、同時にコストおよび複雑性を低減している。
たとえば、音声会議通信システムによれば、ヘッドセットを装着することなく、またはハンドヘルド通信デバイスを使用することなく、第1の場所にいる一人または複数人の個人が、全二重通信線を通じて概ねリアルタイムに、他の場所にいる一人または複数人の個人と同時に会話できるようになる。
Increasing interest in communication media such as the Internet, electronic presentations, voicemail, and audio conferencing communication systems has increased the demand for high fidelity audio and communication technologies.
Currently, individuals and businesses are using these communication media to increase efficiency and productivity while simultaneously reducing cost and complexity.
For example, according to an audio conferencing communication system, one or more individuals in a first location can be substantially real-time through full-duplex communication lines without wearing a headset or using a handheld communication device. In addition, you can talk to one or more individuals at other locations at the same time.

多くの音声会議通信システムにおいて、音声信号が大量のデータを搬送し、広範囲の周波数を利用する。
最新の音声会議通信システムは、感知可能な歪み、背景雑音および他の望ましくない音声アーティファクト(artifact)を含まない、「モノチャネル」とも呼ばれる単一のチャネルを介して音声信号の明瞭な伝送を提供しようと試みる。
1つの一般的なタイプの望ましくない音声アーティファクトは音響エコーである。
音響エコーは、1つの場所においてマイクロフォンおよびスピーカが結合することに起因して、伝送された音声信号が音声会議通信システムを通じてループするときに生じる可能性がある。
図1は、1つの例示的な2地点間モノチャネル音声会議通信システム100の概略図を示す。
音声会議通信システム100は、近い部屋102および遠い部屋104を含む。
近い部屋102において生成される声のような音がマイクロフォン106によって検出され、遠い部屋104において生成される音がマイクロフォン108によって検出される。
マイクロフォン106および108はそれぞれ、音をx(t)およびy(t)によって表される信号に変換する。
ただし、tは時間を表す。
In many audio conferencing communication systems, audio signals carry large amounts of data and utilize a wide range of frequencies.
Modern audio conferencing communication systems provide unambiguous transmission of audio signals over a single channel, also referred to as a “mono-channel”, that does not contain perceptible distortion, background noise, and other undesirable audio artifacts Try to try.
One common type of undesirable speech artifact is acoustic echo.
Acoustic echo can occur when the transmitted audio signal loops through the audio conferencing communication system due to the combination of the microphone and speaker at one location.
FIG. 1 shows a schematic diagram of one exemplary point-to-point mono-channel audio conference communication system 100.
The audio conference communication system 100 includes a near room 102 and a far room 104.
A voice-like sound generated in the near room 102 is detected by the microphone 106, and a sound generated in the far room 104 is detected by the microphone 108.
Microphones 106 and 108 each convert sound into a signal represented by x (t) and y (t).
However, t represents time.

マイクロフォン106は、近い部屋102において生成される多くの異なる音を検出する可能性があり、その中にはスピーカ114によって出力される音が含まれる。
マイクロフォン106によって生成されるアナログ信号は以下の式によって表される。
y(t)=s(t)+f(x(t))+ν(t)
ただし、
s(t)は、近い部屋102において生成される音を表すアナログ信号であり、
ν(t)は、マイクロフォンまたは通信チャネル110において外乱によって引き起こされる雑音または外来信号を表すアナログ信号であり、たとえば、それはスピーカ116から出力される耳障りなブーンといううなり音を生成する場合があり、
f(x(t))は、音響エコーを表すアナログ信号である。
音響エコーf(x(t))は、近い部屋102における音響的な伝搬遅延、並びに通信チャネル110および112を介するアナログ信号x(t)のラウンドトリップ伝送遅延の両方に起因する。
アナログ信号y(t)によって生成される音は、遠い部屋104内のスピーカ116から出力される。
信号y(t)の振幅における増幅または利得、および音響エコーf(x(t))の大きさによっては、遠い部屋104においてマイクロフォン108に話しかけている人が、信号s(t)によって搬送される音のほかに、音響エコーf(x(t))によって生成される音の結果としてスピーカ116から生じるエコーまたは耳障りな高ピッチのハウリング音を聞く場合がある。
音声会議通信システムの設計者および製造者は、種々の方法で音響エコーを補償しようと試みてきた。
1つの補償技法は、音響エコーを低減するフィルタリングシステムを利用する。
典型的には、フィルタリングシステムは、音声信号受信場所における条件変化に適応する適応フィルタを利用する。
The microphone 106 may detect many different sounds that are generated in the near room 102, including the sound output by the speaker 114.
The analog signal generated by the microphone 106 is represented by the following equation.
y (t) = s (t) + f (x (t)) + ν (t)
However,
s (t) is an analog signal representing sound generated in the near room 102;
ν (t) is an analog signal representing noise or extraneous signals caused by disturbances in the microphone or communication channel 110, for example, it may generate a harsh humming sound output from the speaker 116;
f (x (t)) is an analog signal representing an acoustic echo.
The acoustic echo f (x (t)) is due to both the acoustic propagation delay in the near room 102 and the round trip transmission delay of the analog signal x (t) through the communication channels 110 and 112.
The sound generated by the analog signal y (t) is output from the speaker 116 in the far room 104.
Depending on the amplification or gain in the amplitude of the signal y (t) and the magnitude of the acoustic echo f (x (t)), a person talking to the microphone 108 in the far room 104 is carried by the signal s (t). In addition to sound, you may hear an echo or an annoying high pitch howling sound produced by the speaker 116 as a result of the sound generated by the acoustic echo f (x (t)).
Voice conferencing communication system designers and manufacturers have attempted to compensate for acoustic echo in a variety of ways.
One compensation technique utilizes a filtering system that reduces acoustic echo.
Typically, the filtering system utilizes an adaptive filter that adapts to changing conditions at the audio signal receiving location.

近年になって、音声会議の使用感を向上させることを目指して、マルチチャネル音声通信システムを開発することへの関心が高まってきた。
これらのシステムは、第1の場所および第2の場所において、複数のマイクロフォンおよびスピーカを用いる。
しかしながら、それぞれの場所において複数のマイクロフォンおよびスピーカを用いることによって、数百ミリ秒の通信時間だけ隔てて音響エコーが引き起こされ、それが、マルチチャネル音声会議通信システムを開発することへの障害になっている。
たとえば、設計者および製造者は、スピーカを励振する前に、無相関の励振信号に対して非線形関数を利用する方法を開発した。
しかしながら、この非線形性は最終的に、空間的な音声使用感を劣化させる。
音声会議通信システムの設計者、製造者および使用者は、リアルタイムに音声信号から音響エコーを確実に除去することができ、且つ音声信号受信場所における条件変化に迅速的に適応することができるマルチチャネル音声会議通信方法およびシステムが必要であることを認識している。
In recent years, there has been increased interest in developing multi-channel audio communication systems aimed at improving the usability of audio conferencing.
These systems use multiple microphones and speakers in a first location and a second location.
However, using multiple microphones and speakers at each location causes acoustic echoes separated by a communication time of hundreds of milliseconds, which is an obstacle to developing a multi-channel audio conferencing communication system. ing.
For example, designers and manufacturers have developed a method that utilizes a non-linear function for an uncorrelated excitation signal before exciting the speaker.
However, this non-linearity ultimately degrades the spatial audio experience.
Multi-channel, which enables designers, manufacturers and users of voice conference communication systems to reliably remove acoustic echoes from voice signals in real time and to quickly adapt to changing conditions at the voice signal receiving location Recognizing the need for an audio conference communication method and system.

本発明の種々の実施形態は、適応リアルタイム音響エコーキャンセル方法およびシステムを対象とする。
本発明の1つの方法実施の形態は、第1の場所から第2の場所に伝送される複数のマイクロフォンデジタル信号において音響エコーを低減することを対象とする。
第1の場所は、複数のスピーカおよび複数のマイクロフォンを備え、該複数のマイクロフォンのそれぞれは、第1の場所において生成される音および該複数のスピーカによって生成される音響エコーを含む、複数のマイクロフォンデジタル信号のうちの1つを生成する。
本方法は、近似インパルス応答を求めることを含み、各近似インパルス応答は、複数のマイクロフォンのそれぞれと複数のスピーカのそれぞれとの間の1つのエコーパスに対応する。
本方法は、複数の近似音響エコーを求めることも含み、各近似音響エコーは、複数のスピーカのうちの1つによって再生されるデジタル信号を多数の近似インパルス応答で畳み込むことに対応する。
マイクロフォンデジタル信号のうちの少なくとも1つにおける音響エコーが、対応する近似音響エコーに基づいて低減される。
Various embodiments of the present invention are directed to adaptive real-time acoustic echo cancellation methods and systems.
One method embodiment of the present invention is directed to reducing acoustic echo in a plurality of microphone digital signals transmitted from a first location to a second location.
The first location comprises a plurality of speakers and a plurality of microphones, each of the plurality of microphones including a sound generated at the first location and an acoustic echo generated by the plurality of speakers. Generate one of the digital signals.
The method includes determining approximate impulse responses, each approximate impulse response corresponding to one echo path between each of the plurality of microphones and each of the plurality of speakers.
The method also includes determining a plurality of approximate acoustic echoes, each approximate acoustic echo corresponding to convolving a digital signal reproduced by one of the plurality of speakers with a number of approximate impulse responses.
Acoustic echoes in at least one of the microphone digital signals are reduced based on the corresponding approximate acoustic echoes.

1つの例示的な2地点間音声会議通信システムの概略図である。 アナログ信号からデジタル信号への変換を示す図である。 アナログ信号からデジタル信号への変換を示す図である。 アナログ信号からデジタル信号への変換を示す図である。 スピーカのインパルス励振のプロット、およびそのインパルス励振に応答して結果としてマイクロフォンの出力において生じる部屋全体のインパルス応答のプロットを示す図である。 入力デジタル信号をマイクロフォンインパルス応答で畳み込むことによってマイクロフォンから出力されるデジタル信号を求める例を示す図である。 入力デジタル信号をマイクロフォンインパルス応答で畳み込むことによってマイクロフォンから出力されるデジタル信号を求める例を示す図である。 入力デジタル信号をマイクロフォンインパルス応答で畳み込むことによってマイクロフォンから出力されるデジタル信号を求める例を示す図である。 入力デジタル信号をマイクロフォンインパルス応答で畳み込むことによってマイクロフォンから出力されるデジタル信号を求める例を示す図である。 畳み込み済みデジタル信号を得るために、デジタル信号を5成分インパルス応答で畳み込むことを示す図である。 本発明の一実施形態を表す混合マルチチャネル音声通信システムのブロック図である。 本発明の一実施形態による、図6に示されるスピーカとマイクロフォンとの間の音響結合を示す図である。 本発明の一実施形態による、マルチチャネルエコー制御ユニットによって実行される音響エコーキャンセルのブロック図である。 本発明の一実施形態による、近似インパルス応答ベクトルに関連付けられる決定期間および決定エポックのプロットを示す図である。 第1の場所から第2の場所に伝送される複数の音声信号において音響エコーを低減するための本発明の一実施形態を表す制御フロー図である。 本発明の一実施形態を表す、図10のステップ1008において呼び出されるルーチン「制御状態を求める」のための制御フロー図である。 本発明の一実施形態を表す、図10のステップ1008において呼び出されるルーチン「制御状態を求める」のための制御フロー図である。 本発明の一実施形態を表す、図10のステップ1008において呼び出されるルーチン「制御状態を求める」のための制御フロー図である。 本発明の一実施形態を表す、図10のステップ1009において呼び出されるルーチン「残留エコー抑圧」ための制御フロー図である。 本発明の一実施形態を表す、図10のステップ1015において呼び出されるルーチン「

Figure 2010527181
を求める」のための制御フロー図である。
本発明の一実施形態を表す、4つのタイプの制御状態の場合の増幅エネルギー対時間の1つのプロットを示す図である。 本発明の一実施形態を表す、4つのタイプの制御状態の場合の増幅エネルギー対時間の1つのプロットを示す図である。 本発明の一実施形態を表す、図14のステップ1304において呼び出されるルーチン「
Figure 2010527181
を計算する」のための制御フロー図である。
本発明の一実施形態を表す、探索空間内に配置される超楕円領域の2次元の図である。 本発明の一実施形態を表す、図14のステップ1404において呼び出されるルーチン「
Figure 2010527181
を求める」のための制御フロー図である。
本発明の一実施形態を表す、図14のステップ1406において呼び出されるルーチン「μij,mを求める」のための制御フロー図である。 本発明の一実施形態を表す、図14のステップ1407において呼び出されるルーチン「γij,mを求める」のための制御フロー図である。 1 is a schematic diagram of one exemplary point-to-point audio conference communication system. FIG. It is a figure which shows the conversion from an analog signal to a digital signal. It is a figure which shows the conversion from an analog signal to a digital signal. It is a figure which shows the conversion from an analog signal to a digital signal. FIG. 5 is a plot of a speaker impulse excitation and a plot of the overall room impulse response resulting in the microphone output in response to the impulse excitation. It is a figure which shows the example which calculates | requires the digital signal output from a microphone by convolving an input digital signal with a microphone impulse response. It is a figure which shows the example which calculates | requires the digital signal output from a microphone by convolving an input digital signal with a microphone impulse response. It is a figure which shows the example which calculates | requires the digital signal output from a microphone by convolving an input digital signal with a microphone impulse response. It is a figure which shows the example which calculates | requires the digital signal output from a microphone by convolving an input digital signal with a microphone impulse response. FIG. 6 illustrates convolution of a digital signal with a five component impulse response to obtain a convolved digital signal. 1 is a block diagram of a mixed multi-channel audio communication system that represents an embodiment of the present invention. FIG. FIG. 7 illustrates acoustic coupling between the speaker and microphone shown in FIG. 6 according to one embodiment of the present invention. FIG. 4 is a block diagram of acoustic echo cancellation performed by a multi-channel echo control unit according to an embodiment of the present invention. FIG. 4 shows a plot of decision periods and decision epochs associated with approximate impulse response vectors, according to one embodiment of the invention. FIG. 6 is a control flow diagram representing an embodiment of the present invention for reducing acoustic echo in a plurality of audio signals transmitted from a first location to a second location. FIG. 11 is a control flow diagram for the routine “find control state” called in step 1008 of FIG. 10, representing one embodiment of the present invention. FIG. 11 is a control flow diagram for the routine “find control state” called in step 1008 of FIG. 10, representing one embodiment of the present invention. FIG. 11 is a control flow diagram for the routine “find control state” called in step 1008 of FIG. 10, representing one embodiment of the present invention. FIG. 11 is a control flow diagram for a routine “residual echo suppression” called in step 1009 of FIG. 10, representing one embodiment of the present invention. The routine “invoked in step 1015 of FIG. 10, representing one embodiment of the present invention.
Figure 2010527181
FIG.
FIG. 4 shows one plot of amplified energy versus time for four types of control states that represents an embodiment of the present invention. FIG. 4 shows one plot of amplified energy versus time for four types of control states that represents an embodiment of the present invention. A routine “invoked in step 1304 of FIG. 14, representing one embodiment of the present invention.
Figure 2010527181
FIG. 6 is a control flow diagram for “calculating”.
FIG. 3 is a two-dimensional view of a hyperelliptic region located in a search space that represents an embodiment of the present invention. A routine “invoked in step 1404 of FIG. 14, representing one embodiment of the present invention.
Figure 2010527181
FIG.
FIG. 16 is a control flow diagram for a routine “find μ ij, m ” called at step 1406 of FIG. 14 that represents an embodiment of the present invention. FIG. 15 is a control flow diagram for a routine “find γ ij, m ” called at step 1407 of FIG. 14, representing one embodiment of the present invention.

本発明の種々の実施形態は、マルチチャネル音声通信システムにおけるリアルタイム適応音響エコーキャンセル方法を対象とする。
詳細には、これらの方法は、マルチチャネル音声通信システムを介して第1の場所と第2の場所との間で伝送される複数の音声信号内の音響エコーを低減する。
本発明の通信システム実施形態は、電子プレゼンテーション、ボイスメール、音声会議通信システム、または第1の場所と第2の場所との間で音声信号を伝送することができる任意の他のタイプの通信システムとすることができる。
第1の場所および第2の場所において、複数のマイクロフォンおよびスピーカが用いられる。
本発明の方法実施形態は、マイクロフォンとスピーカとの間の音響結合毎に制御状態を計算する。
その制御状態は、以下の4つのタイプの通信、(1)第1の場所からのみ音が伝送される;(2)第2の場所からのみ音が伝送される;(3)第1の場所と第2の場所との間で同時に音が伝送される;および(4)第1の場所と第2の場所との間で音が伝送されない、のうちの1つのタイプを特徴付ける。
その後、その方法は、第1の場所に配置されるマイクロフォンによって検出される信号毎に、制御状態に基づいて近似音響エコーを計算する。
その方法は、第2の場所から第1の場所に伝送されるデジタル信号のそれぞれから、対応する計算された近似音響エコーを減算し、それらの信号が第1の場所において出力される前に、これらの信号の利得を調整する。
Various embodiments of the present invention are directed to a real-time adaptive acoustic echo cancellation method in a multi-channel audio communication system.
In particular, these methods reduce acoustic echoes in multiple audio signals transmitted between a first location and a second location via a multi-channel audio communication system.
The communication system embodiment of the present invention is an electronic presentation, voice mail, audio conferencing communication system, or any other type of communication system capable of transmitting audio signals between a first location and a second location. It can be.
A plurality of microphones and speakers are used at the first location and the second location.
The method embodiment of the present invention calculates the control state for each acoustic coupling between the microphone and the speaker.
The control states are the following four types of communication: (1) Sound is transmitted only from the first location; (2) Sound is transmitted only from the second location; (3) First location And (2) characterize one type of sound transmitted between the first location and the second location; and (4) no sound transmitted between the first location and the second location.
The method then calculates an approximate acoustic echo based on the control state for each signal detected by the microphone located at the first location.
The method subtracts a corresponding calculated approximate acoustic echo from each of the digital signals transmitted from the second location to the first location, and before those signals are output at the first location, Adjust the gain of these signals.

本発明の実施形態は本来は数学的であり、このため、多数の式およびグラフ表示を参照しながら下記で説明される。
音響エコーキャンセルの技術分野の熟練者にとっては、本発明の実施形態を十分に説明すると共に特徴付けるのに数式だけで十分であるかもしれないが、以下の論考に含まれる、さらに図式的で問題志向の例、および制御フロー図による手法は、本発明が種々の経歴を有する読者にとって理解しやすいように、本発明の多くの実施形態のうちの1つだけを例示するように意図される。
本発明の種々の実施形態の説明を理解するのを助けるために、最初のサブセクションにおいて、デジタル信号、インパルス応答および畳み込みの概説が提供される。
第2のサブセクションにおいて、本発明の実施形態が提供される。
Embodiments of the present invention are mathematical in nature and are therefore described below with reference to a number of equations and graphical representations.
For those skilled in the art of acoustic echo cancellation, mathematical formulas alone may be sufficient to fully describe and characterize embodiments of the present invention, but are further schematic and problem-oriented that are included in the discussion below. The example and control flow diagram approaches are intended to illustrate only one of many embodiments of the present invention so that the present invention will be readily understood by readers of various backgrounds.
To help understand the description of the various embodiments of the present invention, an overview of digital signals, impulse responses and convolutions is provided in the first subsection.
In the second subsection, embodiments of the invention are provided.

デジタル信号、インパルス応答および畳み込みの概説:
このセクションは、モノチャネル音声伝送システムにおけるデジタル信号、インパルス応答および畳み込みの概括的な説明を提供するように意図される。
その後、このサブセクションにおいて導入される概念を用いて、次のサブセクションにおいて下記で説明されるマルチチャネル音響エコー実施形態における音声チャネルのそれぞれが説明される。用語「マイクロフォン」は、音を信号に変換する変換器または任意の適切なデバイスを指している。
「スピーカ」は、信号を音に変換することができる任意の適切なデバイスを指している。
Overview of digital signals, impulse response and convolution:
This section is intended to provide a general description of digital signals, impulse responses and convolutions in a mono channel audio transmission system.
Then, using the concepts introduced in this subsection, each of the audio channels in the multi-channel acoustic echo embodiment described below in the next subsection is described. The term “microphone” refers to a transducer or any suitable device that converts sound into a signal.
"Speaker" refers to any suitable device that can convert a signal into sound.

マイクロフォンによって受信される音は、時間依存性の、絶えず変化する電圧を含むアナログ信号に変換される。
デジタルコンピュータを用いてアナログ信号を処理するために、そのアナログ信号は最初に、アナログ信号に含まれる不可欠な情報を最小限に変更したデジタル信号に変換される。
デジタル信号は、電子的に、磁気的に、または光学的に格納することができ、コンピュータプログラム内に符号化される論理演算を用いて処理することができる。
The sound received by the microphone is converted to an analog signal containing a time-dependent, constantly changing voltage.
In order to process an analog signal using a digital computer, the analog signal is first converted into a digital signal with minimal changes to essential information contained in the analog signal.
Digital signals can be stored electronically, magnetically, or optically and can be processed using logical operations encoded in a computer program.

図2A〜図2Cは、アナログ信号のデジタル信号への変換を示す。
図2Aおよび図2Bでは、横軸202のような横軸は時間を表し、縦軸204のような縦軸は、ボルト単位のアナログ信号振幅を表す。
図2Aは、時間依存性の、絶えず変化するアナログ信号x(t)206のプロットである。
アナログ信号x(t)206は最初に、離散的なサンプリング時刻において、アナログ信号x(t)の振幅を測定することによってサンプリングされる。
アナログ信号に含まれる不可欠な情報が失われるのを防ぐために、サンプリング時刻間の持続時間は一般的に、連続したサンプリング時刻間でアナログ信号がほとんど変化しないほど十分に短くなるように選択される。
図2Bは、図2A内のアナログ信号206をサンプリングすることによって得られるサンプリング済み信号208のプロットである。
サンプリング時間は数十分の1秒であり、サンプリング済み信号208は、サンプリング時刻間で一定の信号振幅を仮定することによって、ステップ関数として近似される。
たとえば、定振幅領域210は、サンプリング時刻0.2秒と0.3秒との間で−1.9ボルトの一定値を表す。
2A-2C illustrate the conversion of an analog signal to a digital signal.
2A and 2B, the horizontal axis such as the horizontal axis 202 represents time, and the vertical axis such as the vertical axis 204 represents the analog signal amplitude in volts.
FIG. 2A is a plot of a time-dependent, constantly changing analog signal x (t) 206.
The analog signal x (t) 206 is first sampled by measuring the amplitude of the analog signal x (t) at discrete sampling times.
In order to prevent the loss of essential information contained in the analog signal, the duration between sampling times is generally selected to be short enough that the analog signal hardly changes between successive sampling times.
FIG. 2B is a plot of the sampled signal 208 obtained by sampling the analog signal 206 in FIG. 2A.
The sampling time is tens of seconds, and the sampled signal 208 is approximated as a step function by assuming a constant signal amplitude between sampling times.
For example, constant amplitude region 210 represents a constant value of -1.9 volts between sampling times 0.2 seconds and 0.3 seconds.

効率的に、且つ都合よくデジタル信号を処理するために、時間および大きさの両方の値が整数であることが望ましい。
それゆえ、ステップ関数内の各ステップの振幅およびサンプリング時刻を表す整数値を生成するために、各定振幅領域の値に第1の定数を乗算することによって、且つサンプリング時刻に第2の定数を乗算することによって、整数符号化されたデジタル信号が生成される。
整数値化されたサンプリング時刻は「時刻サンプル」と呼ばれ、整数値化された振幅は「デジタル振幅」と呼ばれる。
結果として生成されたデジタル信号は、x[n]によって関数で表すことができる。
ただし、nは独立変数であり、時刻サンプル領域を表す。
図2Cは、図2B内のサンプリング済み信号208から得られるデジタル信号のプロットである。
図2Cでは、横軸212は、時刻サンプル領域であり、縦軸214は、デジタル信号軸である。
グラフ内の各点は、スケールされたサンプリング時刻におけるデジタル信号のスケールされた振幅を表す量子化された値を表す。
たとえば、座標(2,−19)の点x[2]216は、図2Bのステップ210を表す。
In order to process digital signals efficiently and conveniently, it is desirable for both time and magnitude values to be integers.
Therefore, to generate an integer value representing the amplitude and sampling time of each step in the step function, the value of each constant amplitude region is multiplied by the first constant, and the second constant is set at the sampling time. By multiplying, an integer-coded digital signal is generated.
The sampling time converted to an integer value is called “time sample”, and the amplitude converted to an integer value is called “digital amplitude”.
The resulting digital signal can be expressed as a function by x [n].
However, n is an independent variable and represents a time sample area.
FIG. 2C is a plot of the digital signal obtained from the sampled signal 208 in FIG. 2B.
In FIG. 2C, the horizontal axis 212 is a time sample area, and the vertical axis 214 is a digital signal axis.
Each point in the graph represents a quantized value representing the scaled amplitude of the digital signal at the scaled sampling time.
For example, a point x [2] 216 at coordinates (2, −19) represents step 210 in FIG. 2B.

デジタル信号x[n]は、一般的に、一連のインパルスと見なすことができ、各インパルスは固有の成分に対応する。
表記x[n]は、デジタル信号の「成分」と呼ばれるデジタル信号の単一のインパルスを表すために用いることもできる。
ただし、nは特定の時刻サンプルを表す。
各成分は、単一の時刻サンプルにおける振幅を表す単一の値を除いて全て0のサンプル値を含む信号であり、それは数学的には以下の式によって表される。
x[n]=dδ[n−p]
ただし、
dはインパルスの振幅、すなわち強さを表す整数倍率であり、
pは時刻サンプルであり、
δは以下の式によって定義されるδ関数である。
The digital signal x [n] can generally be viewed as a series of impulses, each impulse corresponding to a unique component.
The notation x [n] can also be used to represent a single impulse of a digital signal called a “component” of the digital signal.
Here, n represents a specific time sample.
Each component is a signal that contains all zero sample values except for a single value that represents the amplitude at a single time sample, which is mathematically represented by the following equation:
x [n] = dδ [n−p]
However,
d is an integer magnification representing the amplitude, i.e. strength, of the impulse;
p is a time sample,
δ is a δ function defined by the following equation.

Figure 2010527181
Figure 2010527181

たとえば、図2Cでは、成分x[0]218は10δ[p]に等しく、成分x[2]216は−19δ[2−p]に等しい。
言い換えると、デルタ関数δ[n−p]内のpは時刻サンプルシフトを表し、n−pは時刻サンプルnに対する時刻サンプルを表す。
For example, in FIG. 2C, component x [0] 218 is equal to 10δ [p] and component x [2] 216 is equal to −19δ [2-p].
In other words, p in the delta function δ [n−p] represents a time sample shift, and n−p represents a time sample with respect to time sample n.

デジタルインパルス応答h[n]は、マイクロフォンへの入力が単位インパルスδ[n]であるときにマイクロフォンから出力されるデジタル信号である。
ただし、pは「0」であり、dは「1」に等しい。
マイクロフォンのインパルス応答は、非常に持続時間が短い音のインパルスをマイクロフォンに加えて、マイクロフォンによって出力される信号を測定することによって求めることができる。
マイクロフォンのインパルス応答は、以下のようにベクトルによって表すこともできる。
The digital impulse response h [n] is a digital signal output from the microphone when the input to the microphone is a unit impulse δ [n].
However, p is “0” and d is equal to “1”.
The impulse response of a microphone can be determined by applying a very short duration sound impulse to the microphone and measuring the signal output by the microphone.
The impulse response of a microphone can also be represented by a vector as follows:

Figure 2010527181
Figure 2010527181

ただし、
[・]はインパルス応答成分であり、
Lはインパルス応答を構成する成分の数である。
However,
h n [•] is an impulse response component,
L is the number of components constituting the impulse response.

図3は、インパルスx[n]のプロット、およびインパルスx[n]に応答して生成される部屋全体のインパルス応答h[n]のプロットである。
インパルス応答h[n]は、スピーカによって生成される音インパルス、および室内で反射され、マイクロフォンによって受信されるインパルスの音を含む。
図3において、インパルスプロット302は、仮想的なマイクロフォン304に入力されるインパルスx[n]を表す。
インパルスx[n]302は、n=0における単一の0でない点306を除いて全て0を含み、それはdδ[n−p]によって表される。
この場合、dは「1」に等しく、pは「0」に等しいので、インパルスはδ[n]によって表すことができる。
インパルス302に応答して、マイクロフォン304は、インパルス応答プロット308によって表されるインパルス応答h[n]を出力する。
インパルス応答308は、点310〜312によって表される3つの0でないデジタル信号を除いて全て0を含む。
1つのインパルスへの実際のデジタルインパルス応答は典型的には、図3に示されるように、そのインパルス内に含まれる数よりも多くの数の0でない成分を含む。
インパルス応答308は、3成分ベクトルによって表すことができる。
FIG. 3 is a plot of the impulse x [n] and a plot of the impulse response h [n] of the entire room generated in response to the impulse x [n].
The impulse response h [n] includes the sound impulse generated by the speaker and the sound of the impulse reflected in the room and received by the microphone.
In FIG. 3, an impulse plot 302 represents an impulse x [n] input to the virtual microphone 304.
Impulse x [n] 302 contains all zeros except for a single non-zero point 306 at n = 0, which is represented by dδ [n−p].
In this case, since d is equal to “1” and p is equal to “0”, the impulse can be represented by δ [n].
In response to the impulse 302, the microphone 304 outputs an impulse response h [n] represented by the impulse response plot 308.
The impulse response 308 includes all zeros except for the three non-zero digital signals represented by points 310-312.
The actual digital impulse response to an impulse typically includes a greater number of non-zero components than the number contained in that impulse, as shown in FIG.
Impulse response 308 can be represented by a three-component vector.

Figure 2010527181
Figure 2010527181

典型的には、インパルス応答を求めるために用いられるインパルスは、スピーカによって部屋の中に出力され、マイクロフォンによって検出される。
スピーカ、部屋およびマイクロフォンは「システム」と呼ばれ、関連付けられるインパルス応答は「システムインパルス応答」と呼ぶことができる。
システムのスピーカによって生成されるデジタル信号は、スピーカによって生成される音を表すデジタル信号x[n]をシステムのインパルス応答h[n]で畳み込むことによって求められる。
畳み込み済みのデジタル信号はx[n]によって表される。
図4A〜図4Dは、システムから出力されるデジタル信号x[n]を生成するために、仮想的なスピーカによって生成される3成分デジタル信号x[n]をインパルス応答h[n]で畳み込む一実施例をグラフで与える。
図4Aは、仮想的なシステムによって生成される2成分インパルス応答例h[n]402のプロットである。
インパルス応答h[n]は、時間と共に変化しないものと仮定される。
Typically, the impulse used to determine the impulse response is output into the room by a speaker and detected by a microphone.
Speakers, rooms and microphones are referred to as “systems” and the associated impulse responses can be referred to as “system impulse responses”.
The digital signal generated by the system speaker is determined by convolving a digital signal x [n] representing the sound generated by the speaker with the system impulse response h [n].
The convolved digital signal is represented by x c [n].
4A to 4D convolve a three-component digital signal x [n] generated by a virtual speaker with an impulse response h [n] to generate a digital signal x c [n] output from the system. An example is given in a graph.
FIG. 4A is a plot of an example two-component impulse response h [n] 402 generated by a virtual system.
It is assumed that the impulse response h [n] does not change with time.

図4Bは、時刻サンプル「0」におけるデジタル信号x[n]の第1の成分のプロットである。
第1の成分は、スケールされたインパルス2δ[0]404によって表される。
システムは、インパルス2δ[n]404に応答して、時刻サンプル「0」において第1の成分406を含むインパルス応答h[n]を出力し、後の時刻サンプル「1」において第2の成分408を出力する。
インパルス2δ[n]404に対するインパルス応答は基本的に、インパルス倍率「2」を乗算した成分を有する、図4Aのインパルス応答である。
FIG. 4B is a plot of the first component of the digital signal x [n] at time sample “0”.
The first component is represented by the scaled impulse 2δ [0] 404.
In response to the impulse 2δ [n] 404, the system outputs an impulse response h [n] including the first component 406 at the time sample “0” and the second component 408 at the later time sample “1”. Is output.
The impulse response to the impulse 2δ [n] 404 is basically the impulse response of FIG. 4A having a component multiplied by the impulse magnification “2”.

図4Cは、後の時刻サンプル「1」においてシステムに入力されるデジタル信号x[n]の第2の成分のプロットである。
第2の成分は、インパルスδ[n−1]410によって表される。
システムは、インパルスδ[n−1]410に応答して、時刻サンプル「1」において第3の成分412を含むインパルス応答を出力し、後の時刻サンプル「2」において第4の成分414を出力する。
インパルスδ[n−1]410に対するインパルス応答は基本的に、「1」倍だけシフトした成分時刻サンプルを有する、図4Aのインパルス応答である。
第2の成分408および第3の成分412は同じ時刻サンプル「1」において生じるので、時刻サンプル「1」における出力である第5の成分416を得るために、成分408および412の振幅は加算される。
FIG. 4C is a plot of the second component of the digital signal x [n] input to the system at a later time sample “1”.
The second component is represented by impulse δ [n−1] 410.
In response to the impulse δ [n−1] 410, the system outputs an impulse response including the third component 412 at the time sample “1”, and outputs a fourth component 414 at the later time sample “2”. To do.
The impulse response for impulse δ [n−1] 410 is basically the impulse response of FIG. 4A with component time samples shifted by “1” times.
Since the second component 408 and the third component 412 occur at the same time sample “1”, the amplitudes of the components 408 and 412 are added to obtain the fifth component 416 that is the output at the time sample “1”. The

図4Dは、時刻サンプル「2」においてシステムに入力されるデジタル信号x[n]の第3の成分のプロットである。
第2の成分は、インパルス−2δ[n−2]418によって表される。
システムは、インパルス−2δ[n−2]に応答して、時刻サンプル「2」において第6の成分420を含むインパルス応答を出力し、後の時刻サンプル「3」において第7の成分422を出力する。
インパルス−2δ[n−2]418に対するインパルス応答は基本的に、倍率「−2」を乗算した成分、および「2」倍だけシフトした成分時刻サンプルを有する、図4Aのインパルス応答である。
第5の成分414および第6の成分420は同じ時刻サンプル「2」において生じるので、時刻サンプル「2」における出力である第8の成分424を与えるために、成分414および420の振幅は加算される。
FIG. 4D is a plot of the third component of the digital signal x [n] input to the system at time sample “2”.
The second component is represented by impulse-2δ [n-2] 418.
In response to the impulse-2δ [n-2], the system outputs an impulse response including the sixth component 420 at the time sample “2”, and outputs a seventh component 422 at the later time sample “3”. To do.
The impulse response for impulse-2δ [n-2] 418 is basically the impulse response of FIG. 4A with the component multiplied by the factor “−2” and the component time sample shifted by “2” times.
Since the fifth component 414 and the sixth component 420 occur at the same time sample “2”, the amplitudes of the components 414 and 420 are added to provide an eighth component 424 that is the output at the time sample “2”. The

3成分入力デジタル信号x[n]を2成分インパルス応答h[n]で畳み込むことによって、4成分デジタル信号x[n]が出力されることに留意されたい。
一般的に、N成分入力デジタル信号x[n]をL成分インパルス応答h[n]で畳み込むことによって、N+L−1成分の畳み込み済みデジタル信号x[n]が与えられる。
Note that the 4-component digital signal x c [n] is output by convolving the 3-component input digital signal x [n] with the 2-component impulse response h [n].
In general, convolution of an N component input digital signal x [n] with an L component impulse response h [n] gives a convolved digital signal x c [n] of N + L−1 components.

図4Dにおける畳み込み済みデジタル信号x[n]426の成分は、インパルス応答の2成分ベクトル表現と、以下の式によって与えられるデジタル信号x[n]の各成分に対応する2成分ベクトルとのスカラー積またはドット積を計算することによって求めることもできる。 The components of the convolved digital signal x c [n] 426 in FIG. 4D are scalars of a two-component vector representation of the impulse response and a two-component vector corresponding to each component of the digital signal x [n] given by It can also be determined by calculating the product or dot product.

Figure 2010527181
Figure 2010527181

列ベクトル   Column vector

Figure 2010527181
Figure 2010527181

および   and

Figure 2010527181
Figure 2010527181

内の成分の順序は、時間順序において互いに逆である。
たとえば、列ベクトル
The order of the components within is opposite to each other in time order.
For example, column vector

Figure 2010527181
Figure 2010527181

において、第1の成分h[0]が第2の成分h[1]よりも時間的に前に現れ、一方、列ベクトル The first component h [0] appears before the second component h [1] in time, while the column vector

Figure 2010527181
Figure 2010527181

において、第1の成分x[n]が第2の成分x[n−1]よりも時間的に後に現れる。
負の値を有する時刻サンプルに対応するベクトル
1, the first component x [n] appears later in time than the second component x [n−1].
Vector corresponding to time samples with negative values

Figure 2010527181
Figure 2010527181

の成分は値「0」を割り当てられることに留意されたい。
たとえば、図4Dの第1の成分406は、以下の式によって計算される。
Note that the components of are assigned the value “0”.
For example, the first component 406 of FIG. 4D is calculated by the following equation:

Figure 2010527181
Figure 2010527181

ただし、成分x[−1]は値「0」を割り当てられ、上付き文字Tは、行列の転置演算を特定する。
第2の成分416、第3の成分424および第4の成分422は以下のように計算される。
However, the component x [−1] is assigned the value “0”, and the superscript T identifies the transpose operation of the matrix.
The second component 416, the third component 424, and the fourth component 422 are calculated as follows.

Figure 2010527181
Figure 2010527181

一般的に、畳み込み済みデジタル信号の成分x[n]は数学的に以下の式によって求められる。 In general, the component x c [n] of the convolved digital signal is mathematically obtained by the following equation.

Figure 2010527181
Figure 2010527181

ただし、「」は畳み込みを表す記号であり、 However, “ * ” is a symbol representing convolution,

Figure 2010527181
Figure 2010527181

である。
畳み込み済み信号成分x[n]を計算するために、デジタル信号x[n]の成分のうちの先行して得られたL個のデジタル信号成分が用いられ、負の値を有する時刻サンプルに対応するベクトル
It is.
In order to calculate the convolved signal component x c [n], L digital signal components obtained in advance among the components of the digital signal x [n] are used to obtain a time sample having a negative value. Corresponding vector

Figure 2010527181
Figure 2010527181

の成分は値「0」を割り当てられる。
畳み込みは以下のように表すこともできる。
Are assigned the value “0”.
Convolution can also be expressed as:

Figure 2010527181
Figure 2010527181

図5は、プロット504内に表示される畳み込み済みデジタル信号を得るために、プロット502内に表示されるデジタル信号を5成分インパルス応答で畳み込むことを示す。
プロット502および504において、横軸506のような横軸は時刻サンプル軸であり、縦軸508のような縦軸はデジタル数軸である。
プロット504内の畳み込み済みデジタル信号サンプル510は、図5に示されるように得られ、数学的には以下の式によって表される。
FIG. 5 illustrates convolution of the digital signal displayed in plot 502 with a five component impulse response to obtain a convolved digital signal displayed in plot 504.
In plots 502 and 504, the horizontal axis, such as horizontal axis 506, is the time sample axis, and the vertical axis, such as vertical axis 508, is the digital number axis.
The convolved digital signal sample 510 in plot 504 is obtained as shown in FIG. 5 and is mathematically represented by the following equation:

Figure 2010527181
Figure 2010527181

上述した畳み込みの例では、インパルス応答は、時間領域内の各時刻サンプルにおいて一定のままであるものと仮定される。
しかしながら、実際には、システムのインパルス応答は多くの場合に、部屋の条件に依存する。
言い換えると、システムのインパルス応答は、部屋の条件が変化するのに応じて、経時的に変化する場合がある。
たとえば、部屋内で音が生成されていないシステムのインパルス応答は、後に部屋内で音が生成される時点の同じシステムのインパルス応答とは異なる。
In the convolution example described above, the impulse response is assumed to remain constant at each time sample in the time domain.
In practice, however, the impulse response of the system often depends on room conditions.
In other words, the impulse response of the system may change over time as room conditions change.
For example, the impulse response of a system in which no sound is generated in a room is different from the impulse response of the same system at the time when sound is subsequently generated in the room.

本発明の実施形態:
本発明の種々の実施形態は、第1の場所と第2の場所との間で伝送される複数の音声信号において音響エコーを低減するための、適応的で、リアルタイムの音響エコーキャンセル方法およびシステムを対象とする。
音響エコーキャンセル方法およびシステムの実施形態の概説が最初に説明され、その後、本発明の多くの実施形態のうちの1つが説明される。
本発明の実施形態は、多数のブロック図、制御フロー図、数式およびグラフ表示を参照しながら説明される。
Embodiments of the invention:
Various embodiments of the present invention provide an adaptive, real-time acoustic echo cancellation method and system for reducing acoustic echo in a plurality of audio signals transmitted between a first location and a second location. Is targeted.
An overview of acoustic echo cancellation method and system embodiments is first described, followed by one of many embodiments of the present invention.
Embodiments of the present invention are described with reference to a number of block diagrams, control flow diagrams, mathematical formulas and graphical representations.

1.混合マルチチャネル音声通信システムにおける音響エコーキャンセルの概説:
図6は、本発明の一実施形態を表す、混合マルチチャネル音声通信システム600のブロック図を示す。
混合マルチチャネル音声通信システム600は、マルチチャネルエコー制御ユニット(「MECU」)602と、近い部屋102内に配置されるI個のスピーカ604およびJ個のマイクロフォン606とを備える。
ただし、IおよびJはそれぞれ、スピーカの全数およびマイクロフォンの全数を表す自然数である。
遠い部屋104において生成されるデジタル信号x[n],...,x[n]がMECU602に伝送され、近い部屋102内に配置されるスピーカ604を通じて同時に再生される。
マイクロフォン606が、近い部屋102内に位置する人々、音声デバイスおよび他の雑音発生源によって生成された音を検出し、且つスピーカ604から生じる音によって生成される残響音またはエコーを検出する。
スピーカ604とマイクロフォン606との間の音響結合が、図7を参照しながら下記で説明される。
マイクロフォン606によって検出された音は、J個のマイクロフォンデジタル信号y[n],...,y[n]の形でMECU602に伝送される。
図8を参照しながら下記でさらに詳細に説明されるMECU602は、J個の処理済みデジタル信号r[n],...,r[n]を得るために、マイクロフォンデジタル信号y[n],...,y[n]を処理する。
それらの処理済みデジタル信号は、音響エコーおよび背景雑音が概ねない信号であり、遠い部屋104に伝送される。
1. Overview of acoustic echo cancellation in mixed multichannel speech communication systems:
FIG. 6 shows a block diagram of a mixed multi-channel audio communication system 600 that represents an embodiment of the present invention.
The mixed multi-channel audio communication system 600 includes a multi-channel echo control unit (“MECU”) 602 and I speakers 604 and J microphones 606 disposed in the near room 102.
However, I and J are natural numbers representing the total number of speakers and the total number of microphones, respectively.
Digital signals x 1 [n],..., X l [n] generated in the far room 104 are transmitted to the MECU 602 and simultaneously reproduced through the speaker 604 disposed in the near room 102.
Microphone 606 detects sounds generated by people, audio devices, and other noise sources located within near room 102, and detects reverberant sounds or echoes generated by sounds originating from speaker 604.
Acoustic coupling between the speaker 604 and the microphone 606 is described below with reference to FIG.
The sound detected by the microphone 606 is transmitted to the MCU 602 in the form of J microphone digital signals y 1 [n],..., Y J [n].
MECU602 which is described in further detail below with reference to FIG. 8, J-number of processed digital signals r 1 [n], ..., in order to obtain r J [n], the microphone the digital signal y 1 [ n], ..., y J [n] is processed.
These processed digital signals are substantially free of acoustic echo and background noise and are transmitted to the far room 104.

本発明の以下の説明では、表記{・}は、N個のデジタル信号から成る集合を表す簡潔な方法として導入される。
ただし、Nは集合内の要素の数である。
たとえば、デジタル信号x[n],...,x[n]は、代わりに、{x[n]}によって表すこともできる。
In the following description of the invention, the notation {·} N is introduced as a concise way of representing a set of N digital signals.
Where N is the number of elements in the set.
For example, the digital signals x 1 [n],..., X I [n] can alternatively be represented by {x i [n]} I.

任意の所与の時刻サンプルnにおいて、近い部屋102内に配置される各スピーカと各マイクロフォンとの間に結合が存在する場合がある。
この結合は、「エコーパス」と呼ばれ、第iのスピーカおよび第jのマイクロフォンの音響結合毎に、時間と共に変化する実数値インパルス応答ベクトル
There may be a coupling between each speaker and each microphone located in the near room 102 at any given time sample n.
This coupling is called an “echo path” and is a real-valued impulse response vector that varies with time for each acoustic coupling of the i th speaker and the j th microphone.

Figure 2010527181
Figure 2010527181

が存在する。
ただし、i∈{1,...,I}はスピーカのインデックス (index)であり、j∈{1,...,J}はマイクロフォンのインデックスである。
図7は、本発明の一実施形態を表す、図6に示される、スピーカ604とマイクロフォン606との間の音響結合を示す。
図7に示されるように、スピーカおよびマイクロフォンを結合するエコーパスのうちの16個が線によって表されており、これらの16個のエコーパスのうちの4個が対応するインパルス応答ベクトル
Exists.
Here, i∈ {1,..., I} is a speaker index, and j∈ {1,..., J} is a microphone index.
FIG. 7 illustrates the acoustic coupling between the speaker 604 and the microphone 606 shown in FIG. 6 that represents one embodiment of the present invention.
As shown in FIG. 7, 16 of the echo paths coupling the loudspeaker and microphone are represented by lines, and 4 of these 16 echo paths are the corresponding impulse response vectors.

Figure 2010527181
Figure 2010527181

をラベル付けされている。
たとえば、時刻サンプルnにおいて、第2のスピーカ704と第1のマイクロフォン706との間のエコーパス702に関連付けられるインパルス応答ベクトルは
Is labeled.
For example, at time sample n, the impulse response vector associated with the echo path 702 between the second speaker 704 and the first microphone 706 is

Figure 2010527181
Figure 2010527181

である。
第iのスピーカを通じて再生され、第jのマイクロフォンによって検出される特定のデジタル信号x[n]の残響バージョンまたはエコーは、
It is.
The reverberant version or echo of a particular digital signal x i [n] played through the i th speaker and detected by the j th microphone is

Figure 2010527181
Figure 2010527181

によって表される。
第jのマイクロフォンによって検出されるデジタル信号{x[n]}に関連付けられる全エコーは以下の式によって与えられる。
Represented by
The total echo associated with the digital signal {x i [n]} I detected by the j th microphone is given by:

Figure 2010527181
Figure 2010527181

図6および図7に示されるように、マイクロフォン606はJ個のマイクロフォンデジタル信号{x[n]}をMECU602に伝送する。
ただし、各マイクロフォンデジタル信号は以下の式によって特徴付けられ、
[n]=s[n]+e[n]
[n]は、近い部屋102内に位置する人々、音声デバイスおよび他の雑音発生源によって生成された局所音源信号を表す。
As shown in FIGS. 6 and 7, the microphone 606 transmits J microphone digital signals {x j [n]} J to the MCU 602.
However, each microphone digital signal is characterized by the following equation:
y j [n] = s j [n] + e j [n]
s j [n] represents a local sound source signal generated by people, audio devices, and other noise sources located in the near room 102.

本発明の方法およびシステム実施形態は、マイクロフォンデジタル信号毎に、局所音源信号{s[n]}に対して大きな歪みを引き起こすことなく、対応するマイクロフォンデジタル信号{y[n]}から、音響エコー{e[n]}を概ねキャンセルすることを対象とする。
図8は、本発明の一実施形態を表す、図6に示されるMECU602によって実行される音響エコーキャンセルのブロック図を示す。
MECU602は、入力チャネル804〜806およびマイクロフォンチャネル810〜808を推定および追跡ブロック802に接続する矢印によって示されるように、デジタル信号{x[n]}およびマイクロフォンデジタル信号{y[n]}を受信する推定および追跡ブロック802を含む。
推定および追跡ブロック802は、近似インパルス応答ベクトルを生成して、
The method and system embodiments of the present invention, for each microphone a digital signal, without causing large distortion to the local source signal {s j [n]} J , corresponding microphone digital signal {y j [n]} J Therefore, the acoustic echo {e j [n]} J is generally cancelled.
FIG. 8 shows a block diagram of acoustic echo cancellation performed by the MECU 602 shown in FIG. 6, which represents an embodiment of the present invention.
The MECU 602 determines that the digital signal {x i [n]} I and the microphone digital signal {y j [n] as indicated by the arrows connecting the input channels 804-806 and the microphone channels 810-808 to the estimation and tracking block 802. } Includes an estimation and tracking block 802 that receives J.
The estimation and tracking block 802 generates an approximate impulse response vector and

Figure 2010527181
Figure 2010527181

を生成し、それに応じて、それらは、J個の適応フィルタにおいてマイクロフォンデジタル信号{y[n]}から減算され、それらのフィルタのうちの3つが破線の枠812〜814によって表される。
しかしながら、時刻サンプルn毎に近似インパルス応答ベクトル
Are subtracted from the microphone digital signal {y j [n]} J in J adaptive filters, and three of those filters are represented by dashed boxes 812-814. .
However, the approximate impulse response vector for each time sample n

Figure 2010527181
Figure 2010527181

を生成するのではなく、本発明の方法実施形態は、インパルス応答ベクトル The method embodiment of the present invention does not generate an impulse response vector

Figure 2010527181
Figure 2010527181

が、「コヒーレンス時間」と呼ばれる多数の時刻サンプルNにわたってほとんど変化しないという仮定に基づく。
言い換えると、インパルス応答ベクトル毎に、N個の時刻サンプルにわたる最大偏差は、以下の式によって制限される。
Is based on the assumption that hardly changes over a large number of time samples N c , called “coherence time”.
In other words, for each impulse response vector, the maximum deviation over N c time samples is limited by the following equation:

Figure 2010527181
Figure 2010527181

ただし、Eは、インパルスに応答してマイクロフォンによって生成される最大増幅エネルギーまたは利得を表す。
結果として、本発明の方法は、時刻サンプルn毎に近似インパルス応答ベクトルの集合
Where E represents the maximum amplified energy or gain generated by the microphone in response to the impulse.
As a result, the method of the present invention produces a set of approximate impulse response vectors for each time sample n.

Figure 2010527181
Figure 2010527181

を求める代わりに、N個の時刻サンプル毎の開始時点において、 At the start of every N d time samples,

Figure 2010527181
Figure 2010527181

によって表される近似インパルス応答ベクトルの集合を計算する。
ただし、N<<Nであり、mは正の整数である。
個の時刻サンプルに伴う時間間隔は「決定期間」と呼ばれ、決定期間の開始時点は「決定エポック」と呼ばれる。
A set of approximate impulse response vectors represented by
However, N d << N C and m is a positive integer.
The time interval associated with N d time samples is called the “decision period”, and the starting point of the decision period is called the “decision epoch”.

図9は、本発明の実施形態を表す、近似インパルス応答ベクトルに関連付けられる決定期間および決定エポックのプロットを示す。
図9において、横軸902は時間軸を表し、構造904〜907はデジタル信号を表しており、エコーパスのためのインパルス応答を近似する。
縦方向の各線分は時刻サンプルに関連付けられるデジタル信号またはインパルス応答を表す。
詳細には、構造904内の縦方向の線分は、n+1個の連続したインパルス応答ベクトル
FIG. 9 shows a plot of the decision period and decision epoch associated with the approximate impulse response vector that represents an embodiment of the present invention.
In FIG. 9, the horizontal axis 902 represents the time axis, and structures 904 to 907 represent digital signals, which approximate the impulse response for the echo path.
Each vertical line represents a digital signal or impulse response associated with the time sample.
Specifically, the vertical line segments in structure 904 are n + 1 consecutive impulse response vectors.

Figure 2010527181
Figure 2010527181

を表し、構造905内の縦方向の線分は、n+1個のマイクロフォンデジタル信号y[n]を表し、構造906内の縦方向の線分は、n+1個のデジタル信号x[n]を表す。
図8において、決定期間は6時刻サンプルから構成され、それぞれの開始時点は破線908〜910のうちの1つによって特定される。
本発明の方法実施形態によれば、推定および追跡ブロック802は、各決定期間の開始時点において、近似インパルス応答ベクトルの新たな集合
The vertical line segment in structure 905 represents n + 1 microphone digital signals y j [n], and the vertical line segment in structure 906 represents n + 1 digital signals x i [n]. To express.
In FIG. 8, the determination period is composed of 6 time samples, and each start time point is specified by one of broken lines 908 to 910.
In accordance with the method embodiment of the present invention, the estimation and tracking block 802 performs a new set of approximate impulse response vectors at the start of each decision period.

Figure 2010527181
Figure 2010527181

を生成する。
たとえば、決定期間912中に、推定および追跡ブロック802が、決定期間912のための残響デジタル信号
Is generated.
For example, during the decision period 912, the estimation and tracking block 802 may reverberate digital signals for the decision period 912.

Figure 2010527181
Figure 2010527181

を求めるために用いられる近似インパルス応答ベクトル   Approximate impulse response vector used to find

Figure 2010527181
Figure 2010527181

を生成するものと仮定する。
次の決定期間914の開始時点908において、推定および追跡ブロック802は、新たな近似インパルス応答ベクトル
Is generated.
At the start time 908 of the next decision period 914, the estimation and tracking block 802 performs a new approximate impulse response vector.

Figure 2010527181
Figure 2010527181

を生成し、その後、その新たな近似インパルス応答ベクトルを用いて、決定期間914の次のN個の時刻サンプルのための残響デジタル信号 And then using the new approximate impulse response vector, the reverberant digital signal for the next N d time samples of decision period 914

Figure 2010527181
Figure 2010527181

が求められる。
一般的に、決定期間mNの開始時点において、近似インパルス応答ベクトルの集合
Is required.
In general, at the beginning of the decision period mN d, a set of approximate impulse response vector

Figure 2010527181
Figure 2010527181

が、時間間隔[mN,(m+1)N−1]内の時刻サンプルn毎の近似インパルス応答ベクトルとして計算される。 Is calculated as an approximate impulse response vector for each time sample n within the time interval [mN d , (m + 1) N d −1].

図8に戻ると、適応フィルタ812〜814は、J個の適応フィルタのうちの最初の2つおよび最後のフィルタを表しており、該フィルタのそれぞれは、近似的な残響デジタル信号   Returning to FIG. 8, adaptive filters 812-814 represent the first two and the last of the J adaptive filters, each of which is an approximate reverberant digital signal.

Figure 2010527181
Figure 2010527181

を得るために、デジタル信号{x[n]}を推定および追跡ブロック802によって生成される対応する近似インパルス応答ベクトル To obtain the corresponding approximate impulse response vector generated by the estimation and tracking block 802 for the digital signal {x i [n]} I

Figure 2010527181
Figure 2010527181

で畳み込むことを表す。
たとえば、適応フィルタ812は、デジタル信号{x[n]}を、近似インパルス応答ベクトル
Represents folding.
For example, the adaptive filter 812 converts the digital signal {x i [n]} I into an approximate impulse response vector.

Figure 2010527181
Figure 2010527181

でそれぞれ畳み込むことを表しており、それは、近似的な残響デジタル信号   Each of which represents an approximate reverberation digital signal.

Figure 2010527181
Figure 2010527181

を与える。
一般的に、第jの適応フィルタは、近似的な残響デジタル信号
give.
In general, the jth adaptive filter is an approximate reverberant digital signal.

Figure 2010527181
Figure 2010527181

を得るために、デジタル信号{x[n]}を近似インパルス応答ベクトル To obtain a digital signal {x i [n]} I as an approximate impulse response vector

Figure 2010527181
Figure 2010527181

でそれぞれ畳み込むことを表す。   Represents each folding.

J個の適応フィルタのそれぞれに関連付けられる残響デジタル信号を加算することによって、J個の近似音響エコーから成る集合   A set of J approximate acoustic echoes by adding the reverberant digital signals associated with each of the J adaptive filters

Figure 2010527181
Figure 2010527181

が生成される。
ただし、各ベクトルは以下の式によって与えられる。
Is generated.
However, each vector is given by the following equation.

Figure 2010527181
Figure 2010527181

J個の近似音響エコー   J approximate acoustic echoes

Figure 2010527181
Figure 2010527181

は、生成されるのに応じて、加算接合部816〜818のような加算接合部においてマイクロフォンデジタル信号{y[n]}のそれぞれから減算され、結果として、J個の制御済みデジタル信号 Are subtracted from each of the microphone digital signals {y j [n]} J at summing junctions, such as summing junctions 816-818, as a result, resulting in J controlled digital signals.

Figure 2010527181
Figure 2010527181

が生成され、それらの信号の各要素は以下の式によって与えられる。   Are generated and each element of those signals is given by:

Figure 2010527181
Figure 2010527181

その差   The difference

Figure 2010527181
Figure 2010527181

は「残留エコー」と呼ばれる。
推定および追跡ブロック802によって実行される本発明の方法実施形態は、残留エコーを低減することを対象とする。
また、推定および追跡ブロック802は、制御済みデジタル信号
Is called "residual echo".
The method embodiment of the present invention performed by the estimation and tracking block 802 is directed to reducing residual echo.
The estimation and tracking block 802 also includes a controlled digital signal.

Figure 2010527181
Figure 2010527181

のそれぞれの非線形処理も制御する。
たとえば、マイクロフォンチャネル808〜810内に非線形処理ブロック(「NPB」)820〜822が配置されており、それらは、推定および追跡ブロック802によって実行されるJ個の非線形処理のうちの3つを表す。
NPBは、J個の処理済みデジタル信号{r[n]}を生成するために、対応する制御済みデジタル信号によって搬送される背景雑音および任意の残留エコーを減衰させる。
It also controls each non-linear process.
For example, non-linear processing blocks (“NPB”) 820-822 are located within the microphone channels 808-810, which represent three of the J non-linear processes performed by the estimation and tracking block 802. .
The NPB attenuates background noise and any residual echo carried by the corresponding controlled digital signal in order to produce J processed digital signals {r j [n]} J.

図6を参照しながら上述したように、MECU602はJ個の処理済みデジタル信号{r[n]}を生成し、それらは、音響エコーおよび背景雑音が概ねない遠い部屋104に伝送される。 As described above with reference to FIG. 6, the MECU 602 generates J processed digital signals {r j [n]} J , which are transmitted to a far room 104 that is largely free of acoustic echo and background noise. .

図6に示されるように、MECU602は、近い部屋102の外に配置することができる。
実際に、本発明の特定の実施形態では、MECU602は、隣の部屋に、同じ建物内の一室に、または近い部屋102から数十、さらには数千マイルも離れて位置する部屋内に配置することができる。
本発明の他の実施形態では、MECU602は、近い部屋102内に配置することができる。
本発明の他の実施形態では、遠い部屋104から近い部屋102に伝送されるデジタル信号{x[n]}内の音響エコーをキャンセルするために、第2のMECUを備えることができる。
As shown in FIG. 6, the MECU 602 can be disposed outside the near room 102.
Indeed, in certain embodiments of the present invention, the MECU 602 is located in a room that is located in an adjacent room, in a room in the same building, or in a room that is tens or even thousands of miles away from the near room 102. can do.
In other embodiments of the present invention, the MECU 602 can be located in the near room 102.
In another embodiment of the present invention, a second MECU may be provided to cancel the acoustic echo in the digital signal {x i [n]} I transmitted from the far room 104 to the near room 102.

II.実施態様:
推定および追跡ブロック802は、近い部屋102と推定および追跡ブロック802との間で伝送される信号のための直流(「DC」)オフセット除去も含む場合がある。
DCオフセットは、電気的な干渉によって引き起こされることが多い低周波の歪みである。
この電気的な干渉は、一定の電圧を生成し、それにより、スピーカから出力される音の中にクリック音およびポップ音を引き起こす可能性がある。
DCオフセット除去は、以下のように、遠い部屋104において生成されるデジタル信号{x[n]}のそれぞれにおけるDCオフセットを補正し、
[n]=ax[n−1]+.5(1+a)(xi,rec[n]−xi,rec[n−1])
以下のように、近い部屋102において生成されるマイクロフォンデジタル信号{y[n]}のそれぞれにおけるDCオフセットを補正する。
[n]=ay[n−1]+.5(1+a)(yj,mic[n]−yj,mic[n−1])
ただし、aは約0.9〜0.9999の範囲の定数である。
II. Embodiment:
The estimation and tracking block 802 may also include direct current (“DC”) offset removal for signals transmitted between the near room 102 and the estimation and tracking block 802.
DC offset is a low frequency distortion that is often caused by electrical interference.
This electrical interference generates a constant voltage, which can cause clicks and pops in the sound output from the speaker.
DC offset removal corrects the DC offset in each of the digital signals {x i [n]} I generated in the far room 104 as follows:
x i [n] = ax i [n−1] +. 5 (1 + a) (xi , rec [n] -xi , rec [n-1])
The DC offset in each of the microphone digital signals {y j [n]} J generated in the near room 102 is corrected as follows.
y j [n] = ay j [n−1] +. 5 (1 + a) (y j, mic [n] −y j, mic [n−1])
However, a is a constant in the range of about 0.9 to 0.9999.

図10〜図16および以下の論考において示される制御フロー図は、マイクロフォンデジタル信号{y[n]}内の音響エコーを低減すると共に、関連付けられる処理済みデジタル信号{r[n]}を生成するための多くの方法実施形態のうちの1つの実施形態の説明を提供する。 The control flow diagrams shown in FIGS. 10-16 and the following discussion reduce the acoustic echo in the microphone digital signal {y j [n]} J and the associated processed digital signal {r j [n]}. A description of one of many method embodiments for generating J is provided.

図10は、近い部屋102から遠い部屋104まで伝送される複数の音声信号内の音響エコーを低減するための本発明の一実施形態を表す制御フロー図を示す。
図10のステップ1001では、下記で記述される式において用いられるパラメータが初期化される。
表1〜表3は、或る特定の用途において用いられる場合があるこれらのパラメータおよび関連付けられる初期値例を示す。
表1〜表3において示される値は、部屋の構成に依存し、それゆえ、変わることがあることに留意されたい。
FIG. 10 shows a control flow diagram representing one embodiment of the present invention for reducing acoustic echo in multiple audio signals transmitted from a near room 102 to a far room 104.
In step 1001 of FIG. 10, parameters used in the equations described below are initialized.
Tables 1 through 3 show examples of these parameters and associated initial values that may be used in certain applications.
Note that the values shown in Tables 1 to 3 depend on the room configuration and may therefore vary.

表1は、本発明の方法実施形態の動作中に典型的には変更されないままである定数を示す。
また、表1は、定数のそれぞれに関連付けられる値例も含む。
Table 1 shows constants that typically remain unchanged during operation of the method embodiments of the present invention.
Table 1 also includes example values associated with each of the constants.

Figure 2010527181
Figure 2010527181

表1において示されるパラメータに関連付けられる値は、近い部屋および遠い部屋の種々の条件、および部屋の構成に基づいて調整できることに留意されたい。
パラメータPは、図10のステップ1004を参照しながら下記で説明されるデジタル信号ベクトル
Note that the values associated with the parameters shown in Table 1 can be adjusted based on various conditions of the near and far rooms and the configuration of the rooms.
The parameter P is a digital signal vector described below with reference to step 1004 of FIG.

Figure 2010527181
Figure 2010527181

内のデジタル信号y (m)[n]の数である。
パラメータNは、周波数領域ベクトル
Is the number of digital signals y j (m) [n].
Parameter N is a frequency domain vector

Figure 2010527181
Figure 2010527181

および and

Figure 2010527181
Figure 2010527181

内のデジタル信号の数である。
パラメータβ、η、λ、KおよびKは、図10〜図14を参照しながら下記で説明される式の項に相対的重要度または重みを割り当てるために用いられる値である。
パラメータGmaxおよびGminは、J個のマイクロフォンのそれぞれに関連付けられる最大利得および最小利得である。
パラメータMは、図10を参照しながら下記で説明されるダブルトーク中に用いられる。
The number of digital signals in
The parameters β, η, λ, K 1 and K 2 are values used to assign relative importance or weight to the terms of the equations described below with reference to FIGS.
The parameters G max and G min are the maximum and minimum gains associated with each of the J microphones.
The parameter M is used during the double talk described below with reference to FIG.

表2は、図11〜図12を参照しながら下記で説明される方法の反復中に変化する可変パラメータのための初期値を示す。   Table 2 shows initial values for variable parameters that change during the iterations of the method described below with reference to FIGS.

Figure 2010527181
Figure 2010527181

パラメータ   Parameters

Figure 2010527181
Figure 2010527181

および and

Figure 2010527181
Figure 2010527181

はそれぞれ、デジタル信号x (m)[n]およびy (m)[n]に関連付けられる短期エネルギー分散(variance)である。
パラメータ
Are the short-term energy variances associated with the digital signals x i (m) [n] and y j (m) [n], respectively.
Parameters

Figure 2010527181
Figure 2010527181

は制御済みデジタル信号   Is a controlled digital signal

Figure 2010527181
Figure 2010527181

内のエネルギーに関連付けられる短期エネルギー分散である。
パラメータ
The short-term energy variance associated with the energy within.
Parameters

Figure 2010527181
Figure 2010527181

および   and

Figure 2010527181
Figure 2010527181

はそれぞれ、デジタル信号x (m)[n]およびy (m)[n]に関連付けられる長期エネルギー分散である。
パラメータ
Are the long-term energy variances associated with the digital signals x i (m) [n] and y j (m) [n], respectively.
Parameters

Figure 2010527181
Figure 2010527181

は雑音に関連付けられる長期エネルギー分散である。
パラメータMi,x 2(0)およびMj,y 2(0)は、デジタル信号x (m)[n]およびy (m)[n]に関連付けられる最大二乗エネルギーである。
パラメータG(0)は、図12を参照しながら下記で説明される初期利得適応値である。
Is the long-term energy variance associated with noise.
The parameters M i, x 2 (0) and M j, y 2 (0) are the maximum square energy associated with the digital signals x i (m) [n] and y j (m) [n].
The parameter G (0) is an initial gain adaptation value described below with reference to FIG.

表3は、図13〜図14を参照しながら下記で説明される方法の反復中に変化するベクトル   Table 3 shows the vectors that change during the iterations of the method described below with reference to FIGS.

Figure 2010527181
Figure 2010527181

および   and

Figure 2010527181
Figure 2010527181

の成分のための初期値を示す。 The initial values for the components of

Figure 2010527181
Figure 2010527181

ベクトル vector

Figure 2010527181
Figure 2010527181

はベクトル   Is a vector

Figure 2010527181
Figure 2010527181

に関連付けられる初期平均スペクトルであり、ベクトル   Is the initial average spectrum associated with the vector

Figure 2010527181
Figure 2010527181

はベクトル   Is a vector

Figure 2010527181
Figure 2010527181

に関連付けられる初期平均スペクトルであり、それらは、図14Aのステップ1402を参照しながら下記で説明される。
ベクトル
, Which are described below with reference to step 1402 of FIG. 14A.
vector

Figure 2010527181
Figure 2010527181

は図14Aのステップ1405を参照しながら下記で説明される発展信頼領域(evolving trust region)を定義する。
ベクトル
Defines an evolving trust region described below with reference to step 1405 of FIG. 14A.
vector

Figure 2010527181
Figure 2010527181

は図14Aのステップ1408を参照しながら下記で説明される初期シャドーインパルス応答ベクトルである。
ベクトル
Is the initial shadow impulse response vector described below with reference to step 1408 of FIG. 14A.
vector

Figure 2010527181
Figure 2010527181

は図14Aのステップ1409を参照しながら下記で説明される初期近似インパルス応答ベクトルである。   Is the initial approximate impulse response vector described below with reference to step 1409 of FIG. 14A.

ステップ1002においてforループが始まると、ステップ1003〜1015が決定エポックm毎に繰り返される。
ステップ1003においてforループが始まると、時刻サンプルn毎にステップ1004〜1012が繰り返される。
ステップ1004では、推定および追跡ユニット802が遠い部屋104から出力されるI個のデジタル信号{x (m)[n]}、および近い部屋102から出力されるJ個のデジタル信号{y (m)[n]}を受信する。
ステップ1005では、デジタル信号ベクトルの集合
When the for loop starts in step 1002, steps 1003 to 1015 are repeated for each decision epoch m.
When the for loop starts in step 1003, steps 1004 to 1012 are repeated for each time sample n.
In step 1004, the estimation and tracking unit 802 outputs I digital signals {x i (m) [n]} I output from the far room 104 and J digital signals {y j output from the near room 102. (M) [n]} J is received.
In step 1005, a set of digital signal vectors

Figure 2010527181
Figure 2010527181

が形成される。
ただし、各デジタル信号ベクトルは、デジタル信号x (m)[n]およびL+P−1個の先行するデジタル信号x (m)[n]から形成される(L+P)成分デジタル信号ベクトル
Is formed.
However, each digital signal vector is an (L + P) component digital signal vector formed from a digital signal x i (m) [n] and L + P−1 preceding digital signals x i (m) [n].

Figure 2010527181
Figure 2010527181

である。
またステップ1005では、マイクロフォンデジタル信号ベクトルの集合
It is.
Also in step 1005, a set of microphone digital signal vectors.

Figure 2010527181
Figure 2010527181

が形成される。
ただし、各マイクロフォンデジタル信号ベクトルは、マイクロフォンデジタル信号y (m)[n]およびP−1個の先行するデジタル信号y (m)[n]から形成されるP成分マイクロフォンデジタル信号ベクトル
Is formed.
However, each microphone digital signal vector is a P component microphone digital signal vector formed from a microphone digital signal y j (m) [n] and P−1 preceding digital signals y j (m) [n].

Figure 2010527181
Figure 2010527181

である。
ステップ1006では、集合
It is.
In step 1006, the set

Figure 2010527181
Figure 2010527181

および   and

Figure 2010527181
Figure 2010527181

内の各ベクトルに高速フーリエ変換(「FFT」)が適用され、それによって対応する周波数領域ベクトルの集合   A fast Fourier transform (“FFT”) is applied to each vector in the, thereby a corresponding set of frequency domain vectors

Figure 2010527181
Figure 2010527181

および

Figure 2010527181
and
Figure 2010527181

が得られる。
ただし、ベクトル要素は以下の式によって与えられる。
Is obtained.
However, the vector element is given by the following equation.

Figure 2010527181
Figure 2010527181

FFTおよび対応する逆高速フーリエ変換(「IFFT」)は、時刻サンプル領域において畳み込みを実行するのを避けるために用いられることが多いタイプのフーリエ変換である。
FFTおよびIFFTを用いることは、時刻サンプル領域においてデジタル信号を畳み込むことよりも数百倍、さらには数千倍速くなり得る。
デジタル信号処理の分野のための多くの参考文献のうちの1つにすぎないが、多数の異なるFFT方法およびIFFT方法が、A. Oppenhiemer、R. SchaferおよびJ. Buck著「Discrete-Time Signal Processing(第2版)」(Prentice Hall, Inc.,(1999-2000))において記述される。
上記で参照された書籍から、またはこの分野における多くの他の教本、論文および雑誌記事から、さらなる詳細を入手することができる。
ステップ1007では、制御済みデジタル信号ベクトルの集合
FFT and the corresponding inverse fast Fourier transform (“IFFT”) is a type of Fourier transform that is often used to avoid performing convolution in the time sample domain.
Using FFT and IFFT can be hundreds or even thousands times faster than convolving digital signals in the time sample domain.
Although only one of many references for the field of digital signal processing, a number of different FFT and IFFT methods are described by A. Oppenhiemer, R. Schafer and J. Buck, “Discrete-Time Signal Processing. (Second Edition) ”(Prentice Hall, Inc., (1999-2000)).
Further details can be obtained from the books referenced above or from many other textbooks, papers and journal articles in the field.
In step 1007, a set of controlled digital signal vectors

Figure 2010527181
Figure 2010527181

が計算される。
ただし、各制御済みデジタル信号ベクトルは以下のように計算される。
Is calculated.
However, each controlled digital signal vector is calculated as follows.

Figure 2010527181
Figure 2010527181

ただし、   However,

Figure 2010527181
Figure 2010527181

は長さNの打切り演算子であり、
Is a truncation operator of length N d ,
"

Figure 2010527181
Figure 2010527181

」は2つのベクトルの成分毎の乗算を表し、   "Represents the multiplication of each component of two vectors,

Figure 2010527181
Figure 2010527181

であり、   And

Figure 2010527181
Figure 2010527181

は第jのマイクロフォンデジタル信号内の周波数領域音響エコーを表す。
3つ組(1,2,3)および(3,1,2)の成分毎の乗算は以下のように表される。
Represents a frequency domain acoustic echo in the jth microphone digital signal.
Multiplication for each component of the triples (1, 2, 3) and (3, 1, 2) is expressed as follows.

Figure 2010527181
Figure 2010527181

ステップ1008では、ルーチン「制御状態を求める」が呼び出され、該ルーチンは、近い部屋102と遠い部屋104との間に存在する可能性がある4つのタイプの音声信号伝送を特定する。
4つのタイプの音声信号伝送は、「制御状態」(「CS」)と呼ばれ、以下のように特定される:(1)近端の部屋102からのみ音声信号が出力され、SNEOによって表される;(2)遠端の部屋104からのみ音声信号が出力され、SFEOによって表される;(3)近端の部屋102および遠端の部屋104の両方から同時に音声信号が出力され、「ダブルトーク」呼ばれ、SDTよって表される;(4)近端の部屋102および遠端の部屋104から音声信号が出力されず、SNSによって表される。
ステップ1009では、J個の利得補正された処理済みデジタル信号{r (m)[n]}を計算するために、ルーチン「残留エコー抑圧」が呼び出される。
ステップ1010では、処理済みデジタル信号{r (m)[n]}が遠い部屋104に伝送される。
ステップ1011では、nが(m+1)N−1以下であるとき、制御がステップ1012に移り、そうでない場合には、制御はステップ1013に移る。
ステップ1012では、時刻サンプルnが「1」だけインクリメントされ、ステップ1004〜1011が繰り返される。
言い換えると、N決定期間中に、近似インパルス応答ベクトル
In step 1008, the routine “Get Control State” is called, which identifies four types of audio signal transmissions that may exist between the near room 102 and the far room 104.
The four types of audio signal transmissions are called “control states” (“CS”) and are specified as follows: (1) Audio signals are output only from the near-end room 102 and are represented by S NEO . (2) the audio signal is output only from the far-end room 104 and is represented by S FEO ; (3) the audio signal is output simultaneously from both the near-end room 102 and the far-end room 104; "double-talk" is called, S DT thus represented; (4) does not output the audio signal from the near end room 102 and the far room 104, represented by the S NS.
In step 1009, the routine “residual echo suppression” is called to calculate J gain-corrected processed digital signals {r j (m) [n]} J.
In step 1010, the processed digital signal {r j (m) [n]} J is transmitted to the far room 104.
In step 1011, when n is less than or equal to (m + 1) N d −1, control passes to step 1012; otherwise, control passes to step 1013.
In step 1012, the time sample n is incremented by “1” and steps 1004 to 1011 are repeated.
In other words, during the N d determination period, the approximate impulse response vector

Figure 2010527181
Figure 2010527181

は更新されない。
ステップ1013では、別の決定エポックmが入手可能であるとき、制御がステップ1014に移り、そうでない場合には、ルーチン「{r[n]}を求める」が終了される。
ステップ1014では、決定エポックmが「1」だけインクリメントされる。ステップ1015では、ルーチン「
Will not be updated.
At step 1013, when another decision epoch m is available, control passes to step 1014, otherwise, the routine “find {r j [n]} J ” is terminated.
In step 1014, the decision epoch m is incremented by “1”. In step 1015, the routine “

Figure 2010527181
Figure 2010527181

を求める」が呼び出される。
言い換えると、N個の決定エポックを有する新たな決定期間が開始され、近似インパルス応答ベクトルが更新される。
Is called.
In other words, a new decision period begins with N d number of decision epoch, the approximate impulse response vector is updated.

図11A〜図11Cは、本発明の一実施形態を表す、図10のステップ1008において呼び出されるルーチン「制御状態を求める」のための制御フロー図を示す。
図11Aのステップ1101においてforループが始まると、インデックスi∈{1,...,I}毎にステップ1102〜1114が繰り返される。
ステップ1102では、ベクトル
11A-11C show a control flow diagram for the routine “find control state” called in step 1008 of FIG. 10, which represents one embodiment of the present invention.
When the for loop starts in step 1101 of FIG. 11A, steps 1102 to 1114 are repeated for each index iε {1,..., I}.
In step 1102, a vector

Figure 2010527181
Figure 2010527181

に関連付けられる平均二乗エネルギーが以下のように計算され、   The mean square energy associated with is calculated as

Figure 2010527181
Figure 2010527181

その平均二乗エネルギーに関して長期エネルギー分散が以下の式によって再帰的に求められる。   With respect to the mean square energy, the long-term energy variance is recursively determined by the following equation.

Figure 2010527181
Figure 2010527181

ステップ1103〜1107では、デジタル信号ベクトル   In steps 1103 to 1107, a digital signal vector

Figure 2010527181
Figure 2010527181

に関連付けられる最大二乗エネルギーMi,x 2(m)が求められる。
ステップ1103では、最大二乗エネルギーMi,x 2(m−1)が平均二乗エネルギーEi,x 2(m)未満である場合には、制御がステップ1104に移り、そうでない場合には、制御はステップ1105に移る。
ステップ1104では、最大二乗エネルギーは以下の式によって計算され、
The maximum square energy M i, x 2 (m) associated with is determined.
In step 1103, if the maximum square energy M i, x 2 (m−1) is less than the mean square energy E i, x 2 (m) , the control moves to step 1104; Moves to step 1105.
In step 1104, the maximum square energy is calculated by the following equation:

Figure 2010527181
Figure 2010527181

制御はステップ1108に移る。
ステップ1105では、平均二乗エネルギーEi,x 2(m)が0.1Mi,x 2(m−1)よりも大きいとき、制御がステップ1106に移り、そうでない場合には、制御はステップ1107に移る。
ステップ1106では、最大二乗エネルギーが以下の式によって計算され、
Control transfers to step 1108.
In step 1105, when the mean square energy E i, x 2 (m) is greater than 0.1M i, x 2 (m−1) , control passes to step 1106; otherwise, control passes to step 1107. Move on.
In step 1106, the maximum square energy is calculated by the following equation:

Figure 2010527181
Figure 2010527181

制御はステップ1108に移る。
ステップ1107では、最大二乗エネルギーMi,x 2(m)が、先行する決定期間からのMi,x 2(m−1)の値を割り当てられる。
ステップ1108〜1113では、ブール論理値「真」および「偽」がブール変数T1、T2に割り当てられる。
ステップ1108では、長期分散
Control transfers to step 1108.
In step 1107, the maximum square energy M i, x 2 (m) is assigned the value of M i, x 2 (m−1) from the preceding decision period.
In steps 1108 to 1113, the Boolean logic values “true” and “false” are assigned to the Boolean variables T1 i and T2 i .
In step 1108, long-term dispersion

Figure 2010527181
Figure 2010527181

が0.01Mi,x 2(m)以上であるとき、制御がステップ1109に移り、T1が「真」に設定され、そうでない場合には、制御はステップ1110に移り、T1は「偽」に設定される。
ステップ1111では、平均二乗エネルギーEi,x 2(m)が0.01Mi,x 2(m)以上であるとき、制御がステップ1112に移り、T2が「真」に設定され、そうでない場合には、制御はステップ1114に移り、T2は「偽」に設定される。
ステップ1114では、iがIよりも大きい場合には、制御が図11Bのステップ1116に移り、そうでない場合には、制御はステップ1115に移る。
ステップ1115では、iが「1」だけインクリメントされ、ステップ1102〜1114が繰り返される。
When is equal to or greater than 0.01M i, x 2 (m) , control is transferred to step 1109 and T1 i is set to “true”; otherwise, control is transferred to step 1110 and T1 i is “ Set to false.
In step 1111, when the mean square energy E i, x 2 (m) is equal to or greater than 0.01M i, x 2 (m) , the control moves to step 1112 and T2 i is set to “true”, otherwise. If so, control passes to step 1114 where T2 i is set to “false”.
In step 1114, if i is greater than I, control moves to step 1116 in FIG. 11B, otherwise control moves to step 1115.
In step 1115, i is incremented by “1”, and steps 1102 to 1114 are repeated.

図11Bのステップ1116においてforループが始まると、インデックスj∈{1,...,J}毎にステップ1117〜1131が繰り返される。
ステップ1116では、以下のように、
When the for loop starts in step 1116 of FIG. 11B, steps 1117 to 1131 are repeated for each index jε {1,..., J}.
In step 1116, as follows:

Figure 2010527181
Figure 2010527181

およびシャドーエラーベクトル   And shadow error vector

Figure 2010527181
Figure 2010527181

に関して平均エネルギーが計算され、   Average energy is calculated for

Figure 2010527181
Figure 2010527181

以下の式によって、それらの平均二乗エネルギーに関して長期エネルギー分散が再帰的に求められる。   The long-term energy variance is recursively determined with respect to their mean square energy by the following equation.

Figure 2010527181
Figure 2010527181

ステップ1118〜1122では、デジタル信号ベクトル In steps 1118 to 1122, a digital signal vector

Figure 2010527181
Figure 2010527181

に関連付けられる最大二乗エネルギーMi,y 2(m)が求められる。
ステップ1118では、最大二乗エネルギーMi,y 2(m−1)が平均二乗エネルギーEi,y 2(m)未満であるとき、制御がステップ1119に移り、そうでない場合には、制御はステップ1120に移る。
ステップ1119では、最大二乗エネルギーが、以下の式によって計算され、
i,y 2(m)=min{Ei,y 2(m),10Mi,y 2(m−1)}
制御がステップ1123に移る。
ステップ1120では、平均二乗エネルギーEi,y 2(m)が0.1Mi,y 2(m−1)よりも大きいときに、制御がステップ1121に移り、そうでない場合には、制御はステップ1121に移る。
ステップ1121では、最大二乗エネルギーが以下の式によって計算され、
i,y 2(m)=0.999Mi,y 2(m−1)+0.001Ei,y 2(m)
制御がステップ1123に移る。
ステップ1123〜1128では、ブール論理値「真」および「偽」が、ブール変数T3、T4に割り当てられる。
ステップ1123では、平均二乗エネルギー
The maximum square energy M i, y 2 (m) associated with is determined.
In step 1118, when the maximum square energy M i, y 2 (m−1) is less than the mean square energy E i, y 2 (m) , control passes to step 1119; Go to 1120.
In step 1119, the maximum square energy is calculated by the following equation:
M i, y 2 (m) = min {E i, y 2 (m) , 10M i, y 2 (m−1) }
Control transfers to step 1123.
In step 1120, when the mean square energy E i, y 2 (m) is greater than 0.1M i, y 2 (m−1) , control passes to step 1121, otherwise control passes to step Move to 1121.
In step 1121, the maximum square energy is calculated by the following equation:
M i, y 2 (m) = 0.999M i, y 2 (m-1) + 0.001E i, y 2 (m)
Control transfers to step 1123.
In steps 1123 to 1128, the Boolean logic values “true” and “false” are assigned to the Boolean variables T3 j , T4 j .
In step 1123, the mean square energy

Figure 2010527181
Figure 2010527181

が、   But,

Figure 2010527181
Figure 2010527181

以上であるとき、制御がステップ1124に移り、T3が「真」に設定され、そうでない場合には、制御はステップ1125に移り、T3は「偽」に設定される。
ステップ1126では、長期分散
If so, control moves to step 1124 and T3 j is set to “true”; otherwise, control passes to step 1125 and T3 j is set to “false”.
In step 1126, long-term dispersion

Figure 2010527181
Figure 2010527181

が0.01Mi,y 2(m)以上であるときに、制御がステップ1127に移り、T4が「真」に設定され、そうでない場合には、制御はステップ1128に移り、T4は「偽」に設定される。
ステップ1129では、以下の式に従って、エコーリターンロスエンハンスメント値(「ERLE」)が計算される。
Is greater than 0.01M i, y 2 (m) , control passes to step 1127 and T4 j is set to “true”; otherwise, control passes to step 1128 where T4 j is Set to “false”.
In step 1129, an echo return loss enhancement value (“ERLE”) is calculated according to the following equation:

Figure 2010527181
Figure 2010527181

ただし、   However,

Figure 2010527181
Figure 2010527181

は平均二乗エネルギーEi,x 2(m)および Is the mean square energy E i, x 2 (m) and

Figure 2010527181
Figure 2010527181

にそれぞれ関連付けられる短期分散である。
ERLEを用いて、システムが状態SFEOにあるときに音響エコーキャンセルの性能を測定することができ、システムが図13Aのステップ1309において下記で説明されるダブルトークにあるときに近似インパルス応答ベクトルを求めることができる。
ステップ1130では、jがJよりも大きいとき、制御が図11Cのステップ1132に移り、そうでない場合には、制御はステップ1131に移る。
ステップ1131では、jが「1」だけインクリメントされ、ステップ1117〜1130が繰り返される。
Are the short-term variances associated with each.
ERLE can be used to measure acoustic echo cancellation performance when the system is in state S FEO and approximate impulse response vectors when the system is in double talk as described below in step 1309 of FIG. 13A. Can be sought.
In step 1130, when j is greater than J, control passes to step 1132 of FIG. 11C, otherwise control passes to step 1131.
In step 1131, j is incremented by “1”, and steps 1117 to 1130 are repeated.

図11Cのステップ1132においてforループが始まると、j∈{1,...,J}毎にステップ1133〜1145が繰り返される。
ステップ1133においてforループが始まると、i∈{1,...,I}毎にステップ1134〜1143が繰り返される。
ステップ1134〜1141では、図11Aのステップ1108〜1113および図11Bのステップ1123〜1128において求められたブール論理値を用いて、エコーパス毎の制御状態CSijが求められる。
ステップ1134では、T1およびT3が「真」であり、且つT2およびT4が「偽」であるときに、制御がステップ1135に移り、CSijがSNEOを割り当てられ、そうでない場合には、制御はステップ1136に移る。
ステップ1136では、T1およびT4が「真」であり、且つT2が「偽」である場合には、制御がステップ1137に移り、CSijがSNSを割り当てられ、そうでない場合には、制御はステップ1138に移る。
ステップ1138では、T2が「真」であり、且つT1、T3およびT4が「偽」である場合には、制御がステップ1139に移り、CSijがSFEOを割り当てられ、そうでない場合には、制御はステップ1140に移る。
ステップ1140では、T2およびT3が「真」であり、且つT1およびT4が「偽」である場合には、制御がステップ1141に移り、CSijがSDTを割り当てられ、そうでない場合には、制御はステップ1142に移る。
ステップ1142では、iがIよりも大きいとき、制御がステップ1144に移り、そうでない場合には、制御はステップ1143に移る。
ステップ1143では、iが「1」だけインクリメントされ、ステップ1134〜1142が繰り返される。
ステップ1144において、jがJよりも大きいとき、{CSijIJおよび{ERLE (m)が返され、そうでない場合には、ステップ1145において、jが「1」だけインクリメントされ、ステップ1133〜1144が繰り返される。
When the for loop starts in Step 1132 of FIG. 11C, Steps 1133 to 1145 are repeated every jε {1,..., J}.
When the for loop starts in step 1133, steps 1134 to 1143 are repeated for each i∈ {1,..., I}.
In steps 1134 to 1141, the control state CS ij for each echo path is obtained using the Boolean logic values obtained in steps 1108 to 1113 in FIG. 11A and steps 1123 to 1128 in FIG. 11B.
At step 1134, when T1 i and T3 j are “true” and T2 i and T4 j are “false”, control is transferred to step 1135, CS ij is assigned S NEO , otherwise Then, control passes to step 1136.
In step 1136, if T1 i and T4 j are “true” and T2 i is “false”, then control passes to step 1137 where CS ij is assigned S NS , otherwise Control passes to step 1138.
In step 1138, if T2 i is “true” and T1 i , T3 j and T4 j are “false”, then control passes to step 1139, CS ij is assigned S FEO , and not If so, control passes to step 1140.
In step 1140, if T2 i and T3 j are “true” and T1 i and T4 j are “false”, control is transferred to step 1141, CS ij is assigned S DT , otherwise If so, control passes to step 1142.
At step 1142, when i is greater than I, control passes to step 1144, otherwise control passes to step 1143.
In step 1143, i is incremented by “1”, and steps 1134 to 1142 are repeated.
In step 1144, when j is greater than J, {CS ij } IJ and {ERLE j (m) } J are returned; otherwise, in step 1145, j is incremented by “1”. 1133 to 1144 are repeated.

図12は、本発明の一実施形態を表す、図10のステップ1009において呼び出されるルーチン「残留エコー抑圧」のための制御フロー図である。
ステップ1201においてforループが始まると、インデックスj毎にステップ1202〜1207が繰り返される。
音声伝送の制御状態を用いて、処理済みデジタル信号{r (m)[n]}のそれぞれにおける利得が補正される。
たとえば、ダブルトーク中に、または近い部屋102においてのみ音声信号が生成されるとき、制御済みデジタル信号
FIG. 12 is a control flow diagram for the routine “residual echo suppression” called in step 1009 of FIG. 10, representing one embodiment of the present invention.
When the for loop starts in step 1201, steps 1202 to 1207 are repeated for each index j.
The gain in each of the processed digital signals {r j (m) [n]} J is corrected using the control state of the voice transmission.
For example, a controlled digital signal when an audio signal is generated during double talk or only in the near room 102

Figure 2010527181
Figure 2010527181

によって得られる利得は、遠い部屋104においてのみ音声信号が生成されるとき、または音声信号が全く伝送されないときよりも大きい。
制御済みデジタル信号が得ることができる利得の最大量および最小量はそれぞれ、定数GmaxおよびGminによって表される。
ステップ1202〜1205は、各処理済みデジタル信号{r (m)[n]}のそれぞれにおける利得を調整する。
ステップ1202において、ダブルトークであるとき、または近い部屋102においてのみ音が生成されるとき、制御がステップ1203に移り、そうでない場合には、制御はステップ1204に移る。
ステップ1203では、以下のように、利得が計算される。
(m)=K(m−1)+(1−K)Gmax
ただし、Kは、G(m−1)に対して、最大利得Gmaxよりも低い相対的重要度を割り当てる重みである。
ステップ1204では、その利得は以下のように計算される。
(m)=K(m−1)+(1−K)Gmin
ただし、Kは、G(m−1)に対して、最小利得Gminよりも相対的に高い重要度を割り当てる重みである。
ステップ1205において、第jの処理済みデジタル信号は以下の式によって求められる。
Is greater than when an audio signal is generated only in the far room 104 or when no audio signal is transmitted.
The maximum and minimum amounts of gain that the controlled digital signal can obtain are represented by the constants G max and G min , respectively.
Steps 1202-1205 adjust the gain in each of each processed digital signal {r j (m) [n]} J.
In step 1202, when it is double talk or when sound is generated only in near room 102, control passes to step 1203, otherwise control passes to step 1204.
In step 1203, the gain is calculated as follows.
G (m) = K 2 G (m-1) + (1-K 2) G max
However, K 2, relative to G (m-1), a weight to assign a lower relative importance than maximum gain G max.
In step 1204, the gain is calculated as follows.
G (m) = K 1 G (m-1) + (1-K 1) G min
However, K 1 is a weight for assigning a relatively higher importance to G (m−1) than the minimum gain G min .
In step 1205, the j th processed digital signal is determined by the following equation.

Figure 2010527181
Figure 2010527181

ステップ1206では、jがJ以下であるとき、制御がステップ1207に移り、jが「1」だけインクリメントされ、そうでない場合には、処理済みデジタル信号{r (m)[n]}が返される。 In step 1206, when j is less than or equal to J, control is transferred to step 1207, where j is incremented by “1”, otherwise, the processed digital signal {r j (m) [n]} J is returned.

図13Aは、本発明の一実施形態を表す、図10のステップ1015において呼び出されるルーチン「   FIG. 13A illustrates a routine “invoked in step 1015 of FIG. 10 that represents one embodiment of the present invention.

Figure 2010527181
Figure 2010527181

を求める」のための制御フロー図である。
ステップ1302においてforループが始まると、i∈{1,...,I}毎にステップ1302〜1313が繰り返される。
ステップ1302においてforループが始まると、j∈{1,...,J}毎にステップ1303〜1311が繰り返される。
ステップ1303では、CSijがSFEOであるとき、制御がステップ1304に移り、そうでない場合には、制御はステップ1305に移る。
ステップ1304では、ルーチン「
FIG.
When the for loop starts in step 1302, steps 1302 to 1313 are repeated for each i∈ {1,..., I}.
When the for loop starts in step 1302, steps 1303 to 1311 are repeated every jε {1,..., J}.
In step 1303, when CS ij is S FEO , control passes to step 1304, otherwise control passes to step 1305.
In step 1304, the routine “

Figure 2010527181
Figure 2010527181

を計算する」が呼び出され、近似インパルス応答ベクトル   Is calculated and the approximate impulse response vector

Figure 2010527181
Figure 2010527181

が計算される。
ステップ1305において、CSijがSNEOまたはSNSであるとき、制御がステップ1306に移り、そうでない場合には、制御はステップ1307に移る。
ステップ1306では、先行するインパルス応答
Is calculated.
In step 1305, when CS ij is S NEO or S NS , control is transferred to step 1306, otherwise control is transferred to step 1307.
In step 1306, the preceding impulse response

Figure 2010527181
Figure 2010527181

内の対応する値にベクトル   Vector to the corresponding value in

Figure 2010527181
Figure 2010527181

内の要素を割り当てることによって、インパルス応答ベクトルが更新され、先行する決定期間からのシャドーインパルス応答ベクトル   By assigning elements in the impulse response vector is updated and the shadow impulse response vector from the preceding decision period

Figure 2010527181
Figure 2010527181

内の対応する要素にシャドーインパルス応答ベクトル   Shadow impulse response vector to the corresponding element in

Figure 2010527181
Figure 2010527181

内の要素を割り当てることによってシャドーインパルス応答ベクトルが更新される。
ステップ1307、1308および1309を用いて、図13B〜図13Cを参照しながら下記で説明されるように、ダブルトークの存在を誤って解釈するのを防ぐ。
ステップ1307において、「カウント」が「0」に等しくないとき、制御がステップ1307に移り、そうでない場合には、制御はステップ1309に移る。
ステップ1308では、「カウント」が「1」だけデクリメントされ、制御がステップ1306に移る。
ステップ1309では、集合
The shadow impulse response vector is updated by assigning the elements in
Steps 1307, 1308, and 1309 are used to prevent misinterpretation of the presence of double talk, as described below with reference to FIGS. 13B-13C.
In step 1307, when “count” is not equal to “0”, control passes to step 1307, otherwise control passes to step 1309.
In Step 1308, “Count” is decremented by “1”, and control is transferred to Step 1306.
In step 1309, the set

Figure 2010527181
Figure 2010527181

によって表されるインパルス応答データ構造から、ダブルトークのための近似インパルス応答ベクトル   Approximate impulse response vector for double talk from the impulse response data structure represented by

Figure 2010527181
Figure 2010527181

が選択される。
ステップ1310では、「カウント」が値Mを割り当てられる。
値Mは10、12、15、18または任意の他の適切な値とすることができる。
ステップ1310では、jがJよりも大きいとき、制御がステップ1312に移り、そうでない場合には、制御はステップ1311に移る。
ステップ1311では、iが「1」だけインクリメントされ、ステップ1302〜1310が繰り返される。
ステップ1312では、iがIよりも大きい場合には、近似インパルス応答ベクトルの集合
Is selected.
In step 1310, “Count” is assigned the value M.
The value M can be 10, 12, 15, 18, or any other suitable value.
In step 1310, when j is greater than J, control passes to step 1312; otherwise, control passes to step 1311.
In step 1311, i is incremented by "1", and steps 1302 to 1310 are repeated.
In step 1312, if i is greater than I, a set of approximate impulse response vectors

Figure 2010527181
Figure 2010527181

が返され、そうでない場合には、制御はステップ1313に移り、jが「1」だけインクリメントされる。   Is returned, otherwise control passes to step 1313 where j is incremented by "1".

I×J個のインパルス応答データ構造が存在し、異なるエコーパス毎に1つのインパルス応答データ構造が存在することに留意されたい。
各データ構造は、最も高い信号対雑音比を有する、K個の最新の近似インパルス応答を含む。
決定エポックmの下付き文字は、インパルス応答ベクトルがデータ構造に追加された順序に対応する。
たとえば、ステップ1309のデータ構造では、インパルス応答ベクトル
Note that there are I × J impulse response data structures, one impulse response data structure for each different echo path.
Each data structure includes the K most recent approximate impulse responses with the highest signal-to-noise ratio.
The subscript of decision epoch m corresponds to the order in which impulse response vectors were added to the data structure.
For example, in the data structure of step 1309, the impulse response vector

Figure 2010527181
Figure 2010527181

は、そのデータ構造内に最も長く存在しており、インパルス応答ベクトル   Is the longest in the data structure and the impulse response vector

Figure 2010527181
Figure 2010527181

は、そのデータ構造に直前に追加された。
ダブルトーク中に信号対雑音比は急激に劣化するので、ダブルトーク中に近似インパルス応答ベクトルは更新されないことに留意されたい。
雑音が増加すると、近似インパルス応答ベクトルが歪む。
この歪みを回避するために、近似インパルス応答ベクトル
Was added just before that data structure.
Note that the approximate impulse response vector is not updated during double talk because the signal-to-noise ratio degrades rapidly during double talk.
As noise increases, the approximate impulse response vector is distorted.
To avoid this distortion, the approximate impulse response vector

Figure 2010527181
Figure 2010527181

は、対応するインパルス応答データ構造から選択される。
本発明の種々の実施形態において、近似インパルス応答ベクトルは、任意の数の異なる判定基準に基づいて選択することができる。
たとえば、本発明の一実施形態では、ステップ1309において、いずれのインパルス応答ベクトルが最も大きな対応する
Are selected from the corresponding impulse response data structure.
In various embodiments of the present invention, the approximate impulse response vector can be selected based on any number of different criteria.
For example, in one embodiment of the present invention, in step 1309, any impulse response vector corresponds to the largest.

Figure 2010527181
Figure 2010527181

を有するかに従って、1つの近似インパルス応答ベクトルを選択することができる。
本発明の別の実施形態では、ステップ1309において、いずれの近似インパルス応答ベクトルがデータ構造内で最も長く存在しているかに基づいて、対応するデータ構造から近似インパルス応答ベクトルを選択することができ、その近似インパルス応答ベクトルは
One approximate impulse response vector can be selected according to
In another embodiment of the present invention, in step 1309, an approximate impulse response vector can be selected from the corresponding data structure based on which approximate impulse response vector has been present the longest in the data structure; Its approximate impulse response vector is

Figure 2010527181
Figure 2010527181

である。   It is.

図13Aの制御フロー図において、対応するエコーパスにおいて伝送される雑音を誤ってSDTと解釈するのを防ぐために、ステップ1307、1308および1306がM回にわたって繰り返される。
図13B〜図13Cは、本発明の一実施形態を表す、4つのタイプの制御状態のための増幅エネルギー対時間の2つのプロットを示す。
図13B〜図13Cにおいて、縦軸1314のような縦軸は、近い部屋102と遠い部屋104との間で伝送される信号に関連付けられる増幅エネルギーを表し、横軸1315のような横軸は時刻を表し、破線1316のような水平な破線は、ダブルトークしきい値エネルギーEthに対応する。
曲線1318および1320は、近い部屋102と遠い部屋104との間で伝送される信号に関連付けられる増幅エネルギーを表す。
ダブルトークしきい値エネルギーEthより低い増幅エネルギーは、SFEO、SNEOまたはSNS制御状態に対応する。
ピーク1322はダブルトークから生じる増幅エネルギーに対応し、それはダブルトークしきい値Ethよりも大きい。
しかしながら、ピーク1324は、近い部屋102または遠い部屋104において生成されるエコーパス雑音に対応する。
ダブルトークが実際には発生していない場合であっても、増幅エネルギーがダブルトークしきい値エネルギーEthを超えているので、この雑音が発生した当初には、ダブルトークが発生したかのように見える。
短い持続時間の雑音をダブルトークと誤って解釈するのを防ぐために、時刻1326において、ステップ1306、1307および1305を参照しながら説明された変数「カウント」でカウントダウンが始まり、ダブルトークがM回繰り返されたことが確認されるまで、ステップ1308においてデータ構造
In the control flow diagram of FIG. 13A, in order to prevent the interpretation and S DT incorrectly noise transmitted in the corresponding echo paths, steps 1307, 1308 and 1306 are repeated for M times.
FIGS. 13B-13C show two plots of amplified energy versus time for four types of control conditions that represent one embodiment of the present invention.
13B to 13C, the vertical axis such as the vertical axis 1314 represents the amplification energy associated with the signal transmitted between the near room 102 and the far room 104, and the horizontal axis such as the horizontal axis 1315 represents the time. A horizontal broken line such as the broken line 1316 corresponds to the double talk threshold energy Eth .
Curves 1318 and 1320 represent the amplified energy associated with the signal transmitted between near room 102 and far room 104.
An amplification energy lower than the double talk threshold energy E th corresponds to the S FEO , S NEO or S NS control state.
Peak 1322 corresponds to the amplified energy resulting from double talk, which is greater than the double talk threshold Eth .
However, peak 1324 corresponds to echo path noise generated in near room 102 or far room 104.
Even if double talk does not actually occur, the amplified energy exceeds the double talk threshold energy Eth , so that at the beginning of this noise, it appears as if double talk has occurred. Looks like.
In order to prevent misinterpretation of short duration noise as double talk, at time 1326 the countdown begins with the variable “count” described with reference to steps 1306, 1307 and 1305, and double talk is repeated M times. In step 1308, the data structure is

Figure 2010527181
Figure 2010527181

から近似インパルス応答ベクトルを選択するのを防ぐ。
言い換えると、本発明の方法は、M回の決定期間にわたってダブルトークが生じなかったかのように動作し続ける。
図13Bの時刻1328において示されるように、M回繰り返した後に増幅エネルギーが減少している場合には、ダブルトークのための近似インパルス応答ベクトルを不適切に選択するのが回避されている。
言い換えると、図13Cの時刻1330における曲線1320において示されるように、M回繰り返した後に、増幅エネルギーが増加している場合には、ステップ1309において、ダブルトークのための近似インパルス応答ベクトルが選択される。
To select an approximate impulse response vector from
In other words, the method of the present invention continues to operate as if double talk did not occur over M decision periods.
As shown at time 1328 in FIG. 13B, if the amplification energy has decreased after repeating M times, it is avoided to inappropriately select the approximate impulse response vector for double talk.
In other words, if the amplified energy has increased after M iterations, as shown in curve 1320 at time 1330 in FIG. 13C, an approximate impulse response vector for double talk is selected in step 1309. The

図14〜図17を参照しながらここで説明される方法はエコーパス毎に繰り返される。
図14Aは、本発明の一実施形態を表す、図14のステップ1304において呼び出されるルーチン「
The method described herein with reference to FIGS. 14-17 is repeated for each echo path.
FIG. 14A illustrates a routine “invoked in step 1304 of FIG. 14 that represents one embodiment of the present invention.

Figure 2010527181
Figure 2010527181

を計算する」のための制御フロー図である。
ステップ1401では、周波数領域依存ベクトルを得るために、シャドーインパルス応答ベクトル
FIG. 6 is a control flow diagram for “calculating”.
In step 1401, a shadow impulse response vector is obtained to obtain a frequency domain dependent vector.

Figure 2010527181
Figure 2010527181

にFFTが適用される。   FFT is applied.

Figure 2010527181
Figure 2010527181

ステップ1402では、周波数領域シャドーエラーベクトルが以下のように計算される。   In step 1402, a frequency domain shadow error vector is calculated as follows.

Figure 2010527181
Figure 2010527181

ただし、Trは長さPの打切り演算子であり、 Where Tr P is a truncation operator of length P,

Figure 2010527181
Figure 2010527181

である。
ステップ1403では、シャドーエラーベクトルを得るために、周波数領域シャドーエラーベクトルにIFFTが適用される。
It is.
In step 1403, IFFT is applied to the frequency domain shadow error vector to obtain a shadow error vector.

Figure 2010527181
Figure 2010527181

ステップ1404では、シャドーミスマッチベクトル   In step 1404, the shadow mismatch vector

Figure 2010527181
Figure 2010527181

を計算するために、ルーチン「   To calculate the routine "

Figure 2010527181
Figure 2010527181

を求める」が呼び出される。
ステップ1405では、以下の再帰式に従って、発展信頼領域ベクトルが求められる。
Is called.
In step 1405, an evolved trust region vector is obtained according to the following recursive formula.

Figure 2010527181
Figure 2010527181

パラメータηは重み係数である。
信頼領域ベクトル
The parameter η is a weighting factor.
Trust region vector

Figure 2010527181
Figure 2010527181

を用いて、ステップ1406において呼び出されるルーチン「μij,mを求める」においてシャドー更新ステップサイズμij,mが計算される。
また、信頼領域ベクトル
Is used to calculate the shadow update step size μ ij, m in the routine “find μ ij, m ” called in step 1406.
Trust region vector

Figure 2010527181
Figure 2010527181

を用いて、ステップ1407において呼び出されるルーチン「γij,mを求める」において適応ステップサイズγij,mが計算される。
ステップ1408では、ステップ1404において求められたシャドーミスマッチベクトル
Is used to calculate the adaptive step size γ ij, m in the routine “find γ ij, m ” called in step 1407.
In step 1408, the shadow mismatch vector obtained in step 1404 is obtained.

Figure 2010527181
Figure 2010527181

およびステップ1406において求められたシャドー更新ステップサイズμij,mを用いて、シャドーインパルス応答ベクトルが再帰的に計算される。 Using the shadow update step size μ ij, m obtained in step 1406, a shadow impulse response vector is recursively calculated.

Figure 2010527181
Figure 2010527181

ステップ1409では、ステップ1407において求められた適応ステップサイズγij,mを用いて、以下のように、近似インパルス応答ベクトルが再帰的に計算される。 In step 1409, the approximate impulse response vector is recursively calculated using the adaptive step size γ ij, m obtained in step 1407 as follows.

Figure 2010527181
Figure 2010527181

パラメータγij,mは重み係数として用いられる。
ステップ1410では、ERLE (m)がしきい値Cよりも大きいとき、制御がステップ1411に移る。
しきい値Cは、10、12、15または近似インパルス応答ベクトル
The parameter γ ij, m is used as a weighting factor.
In step 1410, when ERLE j (m) is larger than the threshold value C, the control moves to step 1411.
Threshold C is 10, 12, 15 or approximate impulse response vector

Figure 2010527181
Figure 2010527181

を重み付けするための任意の他の適切な値とすることができる。
ステップ1411では、図13Aのステップ1309を参照しながら上記で説明されたインパルス応答データ構造
Can be any other suitable value for weighting.
In step 1411, the impulse response data structure described above with reference to step 1309 in FIG. 13A.

Figure 2010527181
Figure 2010527181

が更新される。   Is updated.

インパルス応答ベクトルは、インパルス応答データ構造内に、m>m>...>mK−1>mのように決定エポック値が大きくなる順序に配列される。
ただし、決定エポックmは、最も長い時間にわたってデータ構造内に存在している近似インパルス応答ベクトルに対応し、決定エポックmは、直前にデータ構造に追加された近似インパルス応答ベクトルに対応する。
本発明の一実施形態では、データ構造からインパルス応答ベクトル
The impulse response vectors are arranged in the order of increasing determined epoch values in the impulse response data structure, such as m 1 > m 2 >...> M K−1 > m K.
However, the decision epoch m K corresponds to the approximate impulse response vector that exists in the data structure for the longest time, and the decision epoch m 1 corresponds to the approximate impulse response vector added to the data structure immediately before.
In one embodiment of the present invention, an impulse response vector is derived from the data structure.

Figure 2010527181
Figure 2010527181

を除去し、ステップ1409において計算されたデータ構造に、直前に計算されたインパルス応答ベクトル   And the data structure calculated in step 1409 is replaced with the impulse response vector calculated immediately before.

Figure 2010527181
Figure 2010527181

を追加することによって、ステップ1411においてデータ構造を更新することができ、それにより以下のインパルス応答データ構造が与えられる。   To update the data structure in step 1411, which gives the following impulse response data structure:

Figure 2010527181
Figure 2010527181

本発明の他の実施形態では、ステップ1411において、各近似インパルス応答ベクトルに関連付けられるERLE値の大きさに従ってデータ構造を更新することができる。
ステップ1409において計算された、直前に計算された近似インパルス応答ベクトルの追加に対応すると共に、ステップ1410においてERLEがしきい値条件を満たすようにするために、たとえば、関連するERLE値が最も小さな近似インパルス応答ベクトルが、そのデータ構造から除去される。
In other embodiments of the invention, the data structure can be updated in step 1411 according to the magnitude of the ERLE value associated with each approximate impulse response vector.
In order to accommodate the addition of the previously calculated approximate impulse response vector calculated in step 1409 and to ensure that ERLE satisfies the threshold condition in step 1410, for example, the approximation with the smallest associated ERLE value. The impulse response vector is removed from the data structure.

ステップ1406において呼び出されるルーチン「μij,mを求める」によって求められるシャドー更新ステップサイズμij,mは、ステップ1408において求められたシャドーインパルス応答ベクトル The shadow update step size μ ij, m obtained by the routine “find μ ij, m ” called in step 1406 is the shadow impulse response vector obtained in step 1408.

Figure 2010527181
Figure 2010527181

が、L次元探索空間(search space)U内にある発展「信頼領域」内に存在するのを概ね確実にする。
シャドーインパルス応答ベクトル
Generally exists in an evolutionary “trust region” in the L-dimensional search space U.
Shadow impulse response vector

Figure 2010527181
Figure 2010527181

毎に、探索空間U内にある1つの別個の信頼領域が存在する。
その信頼領域は、探索空間U内にある、超円領域、超楕円領域、超立方領域、または任意の他の超次元領域のような多くの異なる超次元形状を有することができる。
For each, there is one separate trust region in the search space U.
The confidence region can have many different superdimensional shapes, such as a supercircular region, a superelliptical region, a hypercubic region, or any other superdimensional region within the search space U.

図14Bを参照しながら説明される本発明の一実施形態では、信頼領域は、探索空間U内に存在する超楕円領域であると仮定される。
図14Bは、本発明の一実施形態を表す、探索空間U1422内に位置する超楕円領域1420の2次元表示を提供する。
図14Bにおいて、領域1420および1422は2次元において表されるが、実際には、これらの領域は、実際
In one embodiment of the invention described with reference to FIG. 14B, the trust region is assumed to be a hyperelliptic region that exists in the search space U.
FIG. 14B provides a two-dimensional representation of a hyperelliptic region 1420 located within the search space U1422 that represents one embodiment of the present invention.
In FIG. 14B, regions 1420 and 1422 are represented in two dimensions, but in practice these regions are actually

Figure 2010527181
Figure 2010527181

のL次元ベクトル部分空間であり、   L-dimensional vector subspace of

Figure 2010527181
Figure 2010527181

の原点を中心にして配置される。
超楕円領域1420の形状は、ステップ1405において計算される信頼領域ベクトル
It is arranged around the origin of.
The shape of the hyperelliptic region 1420 is the confidence region vector calculated in step 1405.

Figure 2010527181
Figure 2010527181

によって決定され、この例では、そのベクトルは超楕円領域1420の形状を定義する超楕円ベクトルである。
言い換えると、図14Bに示されるように、点によって表される予め求められた6つのシャドーインパルス応答ベクトルが、ベクトル
In this example, the vector is a hyperelliptic vector that defines the shape of the hyperelliptic region 1420.
In other words, as shown in FIG. 14B, six previously determined shadow impulse response vectors represented by points

Figure 2010527181
Figure 2010527181

に関連付けられる超楕円領域1420内に存在する。
後続の超楕円体規定ベクトル
Exists in the hyperelliptic region 1420 associated with.
Subsequent hyperelliptic rule vector

Figure 2010527181
Figure 2010527181

が求められるとき、関連する領域は探索空間U1422内で向きを変えるが、この新たな向きの楕円領域も概ね楕円形状を保持するので、この超楕円領域1420は「発展する」超楕円領域と呼ばれる。
図15を参照しながら下記で説明されるように、シャドー更新ステップサイズμij,mは超楕円体規定ベクトル
The associated region changes direction in the search space U1422, but this newly oriented elliptical region also retains a generally elliptical shape, so this superelliptical region 1420 is called a “evolving” superelliptical region. .
As will be described below with reference to FIG. 15, the shadow update step size μ ij, m is a hyperellipsoid defining vector.

Figure 2010527181
Figure 2010527181

の関数であるので、再帰式   Recursive expression

Figure 2010527181
Figure 2010527181

に従って計算された、新たに計算されたシャドーインパルス応答ベクトル   A newly calculated shadow impulse response vector calculated according to

Figure 2010527181
Figure 2010527181

は新たな向きの超楕円領域内に入る。
図14Bに示されるように、ベクトル1424によって示されるように、シャドーミスマッチベクトル
Falls within the super-elliptical region of the new orientation.
As shown in FIG. 14B, a shadow mismatch vector, as indicated by vector 1424

Figure 2010527181
Figure 2010527181

の大きさおよび方向が大きいとき、ベクトル1426によって示されるように、シャドー更新ステップサイズμij,mがシャドーミスマッチベクトル Is large, the shadow update step size μ ij, m is the shadow mismatch vector , as indicated by vector 1426.

Figure 2010527181
Figure 2010527181

を小さくし、その方向を変更する。
結果として、シャドーインパルス応答ベクトル
And change its direction.
As a result, the shadow impulse response vector

Figure 2010527181
Figure 2010527181

は新たな向きの超楕円領域1428内に入る。   Enters the super-elliptical region 1428 in a new orientation.

本発明の他の実施形態では、シャドーインパルス応答ベクトルを更新するために、単一のシャドー更新ステップサイズμij,mを計算するのではなく、結果として生成されるシャドーインパルス応答ベクトルが信頼領域内に入るように、シャドーインパルス応答ベクトル In another embodiment of the invention, rather than calculating a single shadow update step size μ ij, m to update the shadow impulse response vector, the resulting shadow impulse response vector is within the confidence region. The shadow impulse response vector

Figure 2010527181
Figure 2010527181

に加えられる第2のベクトルを計算することによって、シャドーインパルス応答ベクトルの大きさを変更して信頼領域内に入るようにすることができることに留意されたい。   Note that the magnitude of the shadow impulse response vector can be changed to fall within the confidence region by calculating the second vector applied to.

図15は、本発明の一実施形態を表す、図14のステップ1404において呼び出されるルーチン「   FIG. 15 illustrates a routine “invoked in step 1404 of FIG. 14 that represents one embodiment of the present invention.

Figure 2010527181
Figure 2010527181

を求める」のための制御フロー図である。
ステップ1501では、周波数領域ベクトル
FIG.
In step 1501, a frequency domain vector

Figure 2010527181
Figure 2010527181

の平均スペクトルが以下のように計算され、   The average spectrum of is calculated as

Figure 2010527181
Figure 2010527181

周波数領域シャドーエラーベクトル   Frequency domain shadow error vector

Figure 2010527181
Figure 2010527181

の平均スペクトルが以下のように計算される。   Is calculated as follows.

Figure 2010527181
Figure 2010527181

ただし、以下の式が成り立つ。   However, the following equation holds.

Figure 2010527181
Figure 2010527181

パラメータβは重み係数である。
ステップ1502では、図11において計算される最大エネルギーを用いて、以下の値が求められる。
The parameter β is a weighting factor.
In step 1502, the following values are obtained using the maximum energy calculated in FIG.

Figure 2010527181
Figure 2010527181

ステップ1503〜1506では、N成分周波数領域プレコンディショニングベクトル   In steps 1503-1506, N component frequency domain preconditioning vectors

Figure 2010527181
Figure 2010527181

の要素が求められる。
ステップ1503においてforループが始まると、周波数領域のインデックスk毎にステップ1504〜1506が繰り返される。
ステップ1504では、プレコンディショニングベクトル
Elements are required.
When the for loop starts in step 1503, steps 1504 to 1506 are repeated for each index k in the frequency domain.
In step 1504, the preconditioning vector

Figure 2010527181
Figure 2010527181

の要素が以下のように計算される。   The elements of are calculated as follows:

Figure 2010527181
Figure 2010527181

ただし、kは0〜N−1の範囲にある。
ステップ1505では、kがN−1未満であるとき、制御がステップ1506に移り、そうでない場合には、制御はステップ1507に移る。
ステップ1506では、インデックスkが値「1」だけインクリメントされる。
ステップ1507では、ベクトル
However, k is in the range of 0 to N-1.
In step 1505, if k is less than N−1, control passes to step 1506; otherwise, control passes to step 1507.
In step 1506, the index k is incremented by the value “1”.
In step 1507, the vector

Figure 2010527181
Figure 2010527181

が以下のように計算される。   Is calculated as follows.

Figure 2010527181
Figure 2010527181

ただし、TrはサイズLの打切り演算子であり、 Where Tr L is a truncation operator of size L,

Figure 2010527181
Figure 2010527181

である。   It is.

図16は、本発明の一実施形態を表す、図14のステップ1406において呼び出されるルーチン「μij,mを求める」のための制御フロー図である。
ステップ1601では、パラメータ
FIG. 16 is a control flow diagram for the routine “find μ ij, m ” called at step 1406 of FIG. 14 that represents one embodiment of the present invention.
In step 1601, parameters

Figure 2010527181
Figure 2010527181

が以下のように計算される。   Is calculated as follows.

Figure 2010527181
Figure 2010527181

ステップ1602では、   In step 1602,

Figure 2010527181
Figure 2010527181

が値「1」よりも大きいとき、制御がステップ1603に移り、そうでない場合には、制御はステップ1604に移る。
ステップ1603では、μij,mが値
If is greater than the value “1”, control passes to step 1603, otherwise control passes to step 1604.
In step 1603, μ ij, m is a value.

Figure 2010527181
Figure 2010527181

を割り当てられる。
ステップ1604では、μij,mが値「0.2」を割り当てられる。
Assigned.
In step 1604, μ ij, m is assigned the value “0.2”.

図17は、本発明の一実施形態を表す、図14のステップ1407において呼び出されるルーチン「γij,mを求める」のための制御フロー図である。
ステップ1701では、パラメータγ_scaleij (m)が以下のように計算される。
FIG. 17 is a control flow diagram for the routine “find γ ij, m ” called in step 1407 of FIG. 14, representing one embodiment of the present invention.
In step 1701, the parameter γ_scale ij (m) is calculated as follows.

Figure 2010527181
Figure 2010527181

ステップ1702では、 In step 1702,

Figure 2010527181
Figure 2010527181

であるとき、且つM個の時刻サンプル後に、制御がステップ1703に移り、そうでない場合には、制御はステップ1704に移る。
ステップ1703では、パラメータcij,mが以下のように再帰的に計算される。
ij,m=max{=cij,m−1−4000,400}
ステップ1704では、パラメータcij,mが以下のように再帰的に計算される。
ij,m=max{=cij,m−1+1,40000}
ステップ1705では、以下の式に従って、γij,mが値を割り当てられる。
And after M time samples, control passes to step 1703, otherwise control passes to step 1704.
In step 1703, the parameters c ij, m are recursively calculated as follows.
c ij, m = max {= c ij, m−1 −4000,400}
In step 1704, the parameters c ij, m are recursively calculated as follows.
c ij, m = max {= c ij, m−1 +1,40000}
In step 1705, γ ij, m is assigned a value according to the following equation:

Figure 2010527181
Figure 2010527181

ただし、νij,mは図15のステップ1502において計算される。
ステップ1706では、γ_scaleij (m)が「1」より大きいとき、制御がステップ1707に移る。
ステップ1707では、γij,mが以下の値を割り当てられる。
However, ν ij, m is calculated in step 1502 of FIG.
In step 1706, when γ_scale ij (m) is larger than “1”, the control proceeds to step 1707.
In step 1707, γ ij, m is assigned the following value:

Figure 2010527181
Figure 2010527181

本発明が1つの実施形態に関して説明されてきたが、本発明の方法はこの実施形態には限定されない。
たとえば、本発明の他の実施形態では、音響エコーキャンセルは、マイクロフォンデジタル信号の一部にのみ適用される場合がある。
詳細には、本発明の音響エコーキャンセル方法は、全てのマイクロフォンデジタル信号に適用するのではなく、振幅が或る所定のしきい値よりも高いマイクロフォンデジタル信号にのみ適用することができる。
Although the present invention has been described with respect to one embodiment, the method of the present invention is not limited to this embodiment.
For example, in other embodiments of the present invention, acoustic echo cancellation may be applied only to a portion of the microphone digital signal.
Specifically, the acoustic echo cancellation method of the present invention is not applied to all microphone digital signals, but can be applied only to microphone digital signals whose amplitude is higher than a predetermined threshold value.

これまでの説明は、本発明の完全な理解を提供するために、説明の目的上、特殊な用語を使用した。
しかしながら、本発明を実施するのに、具体的な細部が不要であることは当業者には明らかになるであろう。
本発明の特定の実施形態のこれまでの説明は、例示および説明の目的のために提示された。
それらの実施形態は、本発明を包括的に述べることも、本発明を開示されるのと全く同じ形態に限定することも意図していない。
上記の教示に鑑みて、多くの変更および変形が可能であることは明らかである。
それらの実施形態は、本発明の原理およびその実用的な用途を最もよく説明し、それにより、当業者が、意図される特定の用途に合わせるように種々の変更を加えて、本発明および種々の実施形態を最大限に利用できるようにするために、図示および説明される。
本発明の範囲は、以下の特許請求の範囲およびそれらの均等物によって規定されることが意図されている。
The previous description uses specific terminology for the purpose of explanation in order to provide a thorough understanding of the present invention.
However, it will be apparent to one skilled in the art that the specific details are not required in order to practice the invention.
The foregoing descriptions of specific embodiments of the present invention have been presented for purposes of illustration and description.
These embodiments are not intended to be exhaustive or to limit the invention to the exact form disclosed.
Obviously, many modifications and variations are possible in view of the above teachings.
These embodiments best illustrate the principles of the invention and its practical application, so that those skilled in the art can make various changes to the invention and various modifications to suit the particular application intended. In order to make the best use of the embodiments, they are shown and described.
It is intended that the scope of the invention be defined by the following claims and their equivalents.

100・・・2地点間モノチャネル音声会議通信システム,
102・・・近い部屋,
104・・・遠い部屋,
106,108・・・マイクロフォン,
110,112・・・通信チャネル,
114・・・スピーカ、
600・・・混合マルチチャネル音声通信システム,
602・・・マルチチャネルエコー制御ユニット(MECU),
604・・・スピーカ,
606・・・マイクロフォン,
100: Monochannel audio conference communication system between two points,
102 ... Close room,
104 ... distant room,
106, 108 ... microphones,
110, 112 ... communication channel,
114 ... speaker,
600... Mixed multi-channel audio communication system,
602... Multi-channel echo control unit (MECU),
604 ... Speaker,
606 ... Microphone,

Claims (10)

第1の場所(102)から第2の場所(104)に伝送される複数のマイクロフォンデジタル信号において音響エコーを低減する方法であって、
前記第1の場所に配置される複数のスピーカ(604)、および、それぞれ前記第1の場所において生成される音および該複数のスピーカによって生成される音響エコーを含む前記複数のマイクロフォンデジタル信号のうちの1つを生成する複数のマイクロフォン(606)を設けることと、
前記複数のマイクロフォンのそれぞれと前記複数のスピーカのそれぞれとの間の1つのエコーパス(702)に対応する近似インパルス応答を求めることと、
それぞれ前記複数のスピーカのうちの1つによって再生されるデジタル信号を多数の前記近似インパルス応答で畳み込むことに対応する複数の近似音響エコーを求めることと、
前記対応する近似音響エコーに基づいて、前記マイクロフォンデジタル信号のうちの少なくとも1つにおいて前記音響エコーを低減することと
を含む音響エコーを低減する方法。
A method for reducing acoustic echo in a plurality of microphone digital signals transmitted from a first location (102) to a second location (104), comprising:
Among the plurality of microphone digital signals including a plurality of speakers (604) disposed at the first location, and a sound generated at the first location and an acoustic echo generated by the plurality of speakers, respectively. Providing a plurality of microphones (606) for generating one of
Determining an approximate impulse response corresponding to one echo path (702) between each of the plurality of microphones and each of the plurality of speakers;
Determining a plurality of approximate acoustic echoes each corresponding to convolving a digital signal reproduced by one of the plurality of speakers with a number of the approximate impulse responses;
Reducing the acoustic echo in at least one of the microphone digital signals based on the corresponding approximate acoustic echo.
前記近似インパルス応答を求めることは、
前記第1の場所においてのみ音声信号が生成されるタイプと、
前記第2の場所においてのみ音声信号が生成されるタイプと、
前記第1の場所および前記第2の場所において同時に音声信号が生成されるタイプと、
前記第1の場所または前記第2の場所のいずれにおいても音声信号が生成されないタイプのうちの1つとして、各前記エコーパスに関連付けられる音声伝送のタイプを特定することと
をさらに含む請求項1に記載の方法。
Finding the approximate impulse response is
A type in which an audio signal is generated only in the first location;
A type in which an audio signal is generated only in the second location;
A type in which an audio signal is simultaneously generated in the first location and the second location;
The method of claim 1, further comprising: identifying a type of audio transmission associated with each echo path as one of the types in which no audio signal is generated at either the first location or the second location. The method described.
前記各マイクロフォンデジタル信号のそれぞれにおいて前記音響エコーを低減することは、以下のように、制御済みデジタル信号を求めることであって、
Figure 2010527181
ただし、
j∈{1,K J}はマイクロフォンのインデックス(index)であり、
i∈{1,K I}はスピーカのインデックスであり、
TrNdは決定期間長Nの打切り演算子であり、
IFFTは逆高速フーリエ変換であり、

Figure 2010527181
」は2つのベクトルの成分毎の乗算であり、
Figure 2010527181
は周波数領域マイクロフォンデジタル信号であり、
Figure 2010527181
は周波数領域デジタル信号であり、
Figure 2010527181
は周波数領域近似インパルス応答ベクトルであり、
Figure 2010527181
は周波数領域近似音響エコーである
制御済みデジタル信号を求めること
をさらに含む請求項1に記載の方法。
Reducing the acoustic echo in each of the microphone digital signals is to determine a controlled digital signal as follows:
Figure 2010527181
However,
j∈ {1, K J} is the index of the microphone,
i∈ {1, KI} is the index of the speaker,
Tr Nd is a truncation operator with a decision period length N d ,
IFFT is an inverse fast Fourier transform,
"
Figure 2010527181
"Is the multiplication of the components of the two vectors,
Figure 2010527181
Is a frequency domain microphone digital signal,
Figure 2010527181
Is a frequency domain digital signal,
Figure 2010527181
Is the frequency domain approximate impulse response vector,
Figure 2010527181
The method of claim 1, further comprising: determining a controlled digital signal that is a frequency domain approximate acoustic echo.
前記周波数領域近似インパルス応答ベクトルを求めることは、
Figure 2010527181
を計算することであって、ただし、
FFTは高速フーリエ変換であり、
Figure 2010527181
は音声伝送の前記タイプに依存する近似インパルス応答ベクトルである、計算することをさらに含む、請求項3に記載の方法。
Finding the frequency domain approximate impulse response vector is
Figure 2010527181
Where, however,
FFT is a fast Fourier transform,
Figure 2010527181
The method of claim 3, further comprising: calculating an approximate impulse response vector that depends on the type of voice transmission.
前記近似インパルス応答ベクトル
Figure 2010527181
を計算することは、
前記第1の場所と前記第2の場所との間で信号が伝送されないとき、または前記第1の場所から前記第2の場所に信号が伝送されるときに、
Figure 2010527181
を割り当てることであって、ただし、
Figure 2010527181
はm−1によって特定される先行する決定期間に関連付けられる近似インパルス応答ベクトルである割り当てることと、
前記第1の場所と前記第2の場所との間で信号が同時に伝送されるときに、最も高い信号対雑音比を有するK個の最新の近似インパルス応答
Figure 2010527181
を有するインパルス応答データ構造から前記近似インパルス応答ベクトル
Figure 2010527181
を選択することと、
前記第2の場所から前記第1の場所にのみ信号が伝送されるときに、
Figure 2010527181
によって与えられる再帰式を利用することであって、ただし、
Figure 2010527181
はmによって特定される決定期間に関連付けられるシャドーインパルス応答ベクトルであり、
Figure 2010527181
はm−1によって特定される先行する決定期間に関連付けられる近似インパルス応答ベクトルであり、
γij,mはインパルス応答ステップサイズである、利用することと
をさらに含む、請求項4に記載の方法。
The approximate impulse response vector
Figure 2010527181
To calculate
When no signal is transmitted between the first location and the second location, or when a signal is transmitted from the first location to the second location,
Figure 2010527181
With the exception that
Figure 2010527181
Assigning is an approximate impulse response vector associated with the preceding decision period identified by m−1;
K most recent approximate impulse responses with the highest signal-to-noise ratio when signals are transmitted simultaneously between the first location and the second location
Figure 2010527181
The approximate impulse response vector from the impulse response data structure having
Figure 2010527181
Selecting
When a signal is transmitted only from the second location to the first location,
Figure 2010527181
Using the recursive expression given by
Figure 2010527181
Is a shadow impulse response vector associated with the decision period specified by m,
Figure 2010527181
Is an approximate impulse response vector associated with the preceding decision period specified by m−1,
The method of claim 4, further comprising: using γ ij, m is an impulse response step size.
前記インパルス応答ステップサイズγij,mは、
Figure 2010527181
を計算することであって、ただし、
Figure 2010527181
であり、
M回の決定期間にわたって、
Figure 2010527181
の場合に、
ij,m=max{=cij,m−1−4000,400}
であり、そうでない場合には、
ij,m=max{=cij,m−1+1,40000}
である
計算すること
をさらに含む請求項5に記載の方法。
The impulse response step size γ ij, m is
Figure 2010527181
Where, however,
Figure 2010527181
And
Over M decision periods,
Figure 2010527181
In the case of
c ij, m = max {= c ij, m−1 −4000,400}
And if not,
c ij, m = max {= c ij, m−1 +1,40000}
The method of claim 5, further comprising: calculating.
前記インパルス応答ステップサイズγij,mは、γ_scaleij (m)が「1」より大きいときに、
Figure 2010527181
を設定することであって、ただし、
Figure 2010527181
であり、
Figure 2010527181
はシャドーインパルスベクトル
Figure 2010527181
の第nの要素であり、Λij (m)[n]は信頼領域ベクトル
Figure 2010527181
の第nの要素である
設定すること
をさらに含む請求項6に記載の方法。
The impulse response step size γ ij, m is determined when γ_scale ij (m) is larger than “1”.
Figure 2010527181
Where, however,
Figure 2010527181
And
Figure 2010527181
Is the shadow impulse vector
Figure 2010527181
Λ ij (m) [n] is the trust region vector
Figure 2010527181
The method of claim 6, further comprising setting the n th element of.
前記シャドーインパルス応答ベクトルを再帰的に計算することは、
Figure 2010527181
によって与えられる再帰式を利用することであって、ただし、
Figure 2010527181
はシャドーミスマッチベクトルであり、
Figure 2010527181
はm−1によって特定される先行する決定期間に関連付けられるシャドーインパルス応答ベクトルであり、
μij,mはシャドー更新ステップサイズである
利用すること
をさらに含む請求項5に記載の方法。
Recursively calculating the shadow impulse response vector includes
Figure 2010527181
Using the recursive expression given by
Figure 2010527181
Is the shadow mismatch vector,
Figure 2010527181
Is the shadow impulse response vector associated with the preceding decision period specified by m−1,
The method of claim 5, further comprising: μ ij, m is a shadow update step size.
前記シャドーミスマッチベクトルを計算することは、
Figure 2010527181
によって与えられる再帰式を利用することであって、
ただし、
mは決定期間に関連付けられる整数であり、
Lはベクトル成分の数であり、
IFFTは逆フーリエ変換演算子であり、
TrはサイズLの打切り演算子であり、
Figure 2010527181
は音声信号に対応する周波数領域ベクトルであり、
Figure 2010527181
は周波数領域シャドーエラーベクトルであり、
Figure 2010527181
であり、ここで以下のことが成り立ち、
Figure 2010527181

Figure 2010527181
によって与えられる周波数領域ベクトル
Figure 2010527181
の平均スペクトルの成分であり、
Figure 2010527181

Figure 2010527181
によって与えられる周波数領域シャドーエラーベクトル
Figure 2010527181
の平均スペクトルの成分であり、
λは安定化定数であり、
Figure 2010527181
であり、
i,x 2(m)は前記デジタル信号に関連付けられる最大エネルギーであり、
j,y 2(m)は前記マイクロフォンデジタル信号に関連付けられる最大エネルギーである
利用することをさらに含む請求項8に記載の方法。
Calculating the shadow mismatch vector
Figure 2010527181
Using the recursive expression given by
However,
m is an integer associated with the decision period;
L is the number of vector components,
IFFT is an inverse Fourier transform operator,
Tr L is a truncation operator of size L,
Figure 2010527181
Is the frequency domain vector corresponding to the audio signal,
Figure 2010527181
Is the frequency domain shadow error vector,
Figure 2010527181
Where the following holds:
Figure 2010527181
Is
Figure 2010527181
Frequency domain vector given by
Figure 2010527181
Of the average spectrum of
Figure 2010527181
Is
Figure 2010527181
Frequency domain shadow error vector given by
Figure 2010527181
Of the average spectrum of
λ is the stabilization constant
Figure 2010527181
And
M i, x 2 (m) is the maximum energy associated with the digital signal;
9. The method of claim 8, further comprising using Mj, y2 (m) is a maximum energy associated with the microphone digital signal.
前記シャドー更新ステップサイズμij,mは、μ_scaleij (m)が>1であるときに、
μij,m=0.2を設定し、
そうでない場合には、
Figure 2010527181
を設定することであって、ただし、
Figure 2010527181
であり、
Figure 2010527181
は前記シャドーミスマッチベクトル
Figure 2010527181
の第nの要素であり、Λij (m)[n]は信頼領域ベクトル
Figure 2010527181
の第nの要素であり、
Figure 2010527181
である
設定すること
をさらに含む請求項8に記載の方法。
The shadow update step size μ ij, m is equal to when μ_scale ij (m) is> 1.
Set μ ij, m = 0.2,
If not,
Figure 2010527181
Where, however,
Figure 2010527181
And
Figure 2010527181
Is the shadow mismatch vector
Figure 2010527181
Λ ij (m) [n] is the trust region vector
Figure 2010527181
The n th element of
Figure 2010527181
The method of claim 8, further comprising: setting.
JP2010506328A 2007-04-30 2008-04-30 Method and system for reducing acoustic echo in a multi-channel audio communication system Expired - Fee Related JP4897921B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/799,266 US8204249B2 (en) 2007-04-30 2007-04-30 Methods and systems for reducing acoustic echoes in multichannel audio-communication systems
US11/799,266 2007-04-30
PCT/US2008/005662 WO2008137059A2 (en) 2007-04-30 2008-04-30 Methods and systems for reducing acoustic echoes in multichannel audio-communication systems

Publications (2)

Publication Number Publication Date
JP2010527181A true JP2010527181A (en) 2010-08-05
JP4897921B2 JP4897921B2 (en) 2012-03-14

Family

ID=39887006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010506328A Expired - Fee Related JP4897921B2 (en) 2007-04-30 2008-04-30 Method and system for reducing acoustic echo in a multi-channel audio communication system

Country Status (5)

Country Link
US (1) US8204249B2 (en)
EP (1) EP2130298A4 (en)
JP (1) JP4897921B2 (en)
KR (1) KR20100016119A (en)
WO (1) WO2008137059A2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019168730A (en) * 2013-12-05 2019-10-03 マイクロソフト テクノロジー ライセンシング,エルエルシー Estimating room impulse response for acoustic echo cancellation

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8204249B2 (en) * 2007-04-30 2012-06-19 Hewlett-Packard Development Company, L.P. Methods and systems for reducing acoustic echoes in multichannel audio-communication systems
US8208649B2 (en) * 2009-04-28 2012-06-26 Hewlett-Packard Development Company, L.P. Methods and systems for robust approximations of impulse responses in multichannel audio-communication systems
US9215327B2 (en) * 2011-06-11 2015-12-15 Clearone Communications, Inc. Methods and apparatuses for multi-channel acoustic echo cancelation
CN103337242B (en) * 2013-05-29 2016-04-13 华为技术有限公司 A kind of sound control method and opertaing device
GB201309781D0 (en) 2013-05-31 2013-07-17 Microsoft Corp Echo cancellation
GB201414352D0 (en) * 2014-08-13 2014-09-24 Microsoft Corp Reversed echo canceller

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2691186B2 (en) * 1988-09-26 1997-12-17 日本電信電話株式会社 Echo canceller for multipoint conference
US5796819A (en) 1996-07-24 1998-08-18 Ericsson Inc. Echo canceller for non-linear circuits
US6553122B1 (en) * 1998-03-05 2003-04-22 Nippon Telegraph And Telephone Corporation Method and apparatus for multi-channel acoustic echo cancellation and recording medium with the method recorded thereon
KR100272131B1 (en) 1998-04-15 2000-11-15 윤종용 Adaptive reverbation cancelling apparatus
JP4734714B2 (en) * 2000-12-22 2011-07-27 ヤマハ株式会社 Sound collection and reproduction method and apparatus
JP3506138B2 (en) 2001-07-11 2004-03-15 ヤマハ株式会社 Multi-channel echo cancellation method, multi-channel audio transmission method, stereo echo canceller, stereo audio transmission device, and transfer function calculation device
JP4591685B2 (en) * 2004-03-31 2010-12-01 ヤマハ株式会社 Double talk state determination method, echo cancellation method, double talk state determination device, echo cancellation device, and program
JP4504782B2 (en) 2004-10-25 2010-07-14 日本電信電話株式会社 Echo cancellation method, apparatus for implementing this method, program, and recording medium therefor
US8204249B2 (en) * 2007-04-30 2012-06-19 Hewlett-Packard Development Company, L.P. Methods and systems for reducing acoustic echoes in multichannel audio-communication systems

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019168730A (en) * 2013-12-05 2019-10-03 マイクロソフト テクノロジー ライセンシング,エルエルシー Estimating room impulse response for acoustic echo cancellation

Also Published As

Publication number Publication date
EP2130298A4 (en) 2010-04-07
US20080267420A1 (en) 2008-10-30
KR20100016119A (en) 2010-02-12
EP2130298A2 (en) 2009-12-09
JP4897921B2 (en) 2012-03-14
US8204249B2 (en) 2012-06-19
WO2008137059A3 (en) 2008-12-31
WO2008137059A2 (en) 2008-11-13

Similar Documents

Publication Publication Date Title
JP5288723B2 (en) Multi-channel echo compensation
US11297178B2 (en) Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters
KR101250124B1 (en) Apparatus and Method for Computing Control Information for an Echo Suppression Filter and Apparatus and Method for Computing a Delay Value
KR101676393B1 (en) Acoustic multi-channel cancellation
US9800734B2 (en) Echo cancellation
US8000482B2 (en) Microphone array processing system for noisy multipath environments
JP4897921B2 (en) Method and system for reducing acoustic echo in a multi-channel audio communication system
TWI682672B (en) Echo cancellation system and method with reduced residual echo
CA2574713A1 (en) Separation of target acoustic signals in a multi-transducer arrangement
US8320574B2 (en) Methods and systems for reducing acoustic echoes in communication systems
SE518039C2 (en) Apparatus and Procedure for Increasing the Understanding of Loudspeaker Output and for Echo Leakage in Phones
JP4544993B2 (en) Echo processing apparatus for single-channel or multi-channel communication system
JP2004349806A (en) Multichannel acoustic echo canceling method, apparatus thereof, program thereof, and recording medium thereof
KR100633213B1 (en) Methods and apparatus for improving adaptive filter performance by inclusion of inaudible information
CN109326297B (en) Adaptive post-filtering
US20100272274A1 (en) Methods and systems for robust approximations of impulse reponses in multichannel audio-communication systems
US8045730B1 (en) Methods and systems for reducing acoustic echoes in communication systems
Garre et al. An Acoustic Echo Cancellation System based on Adaptive Algorithm
Kotte Performance Analysis of Adaptive Algorithms based on different parameters Implemented for Acoustic Echo Cancellation in Speech Signals
WO1997007624A1 (en) Echo cancelling using signal preprocessing in an acoustic environment
Nwe et al. Acoustic Echo Cancellation Using Adaptive Least Mean Square Algorithm
Isen Applied Adaptive Filtering

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111128

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111222

R150 Certificate of patent or registration of utility model

Ref document number: 4897921

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees