JP2003274481A - 音声処理装置、コンピュータプログラム、及び記録媒体 - Google Patents

音声処理装置、コンピュータプログラム、及び記録媒体

Info

Publication number
JP2003274481A
JP2003274481A JP2002070868A JP2002070868A JP2003274481A JP 2003274481 A JP2003274481 A JP 2003274481A JP 2002070868 A JP2002070868 A JP 2002070868A JP 2002070868 A JP2002070868 A JP 2002070868A JP 2003274481 A JP2003274481 A JP 2003274481A
Authority
JP
Japan
Prior art keywords
voice
signal
acoustic echo
linear
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002070868A
Other languages
English (en)
Inventor
Yasuo Nomura
康雄 野村
Yoshinobu Kajikawa
嘉延 梶川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka Industrial Promotion Organization
Original Assignee
Osaka Industrial Promotion Organization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka Industrial Promotion Organization filed Critical Osaka Industrial Promotion Organization
Priority to JP2002070868A priority Critical patent/JP2003274481A/ja
Publication of JP2003274481A publication Critical patent/JP2003274481A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 音響エコー信号の非線形成分を速やかに除去
することができる音声処理装置、コンピュータプログラ
ム、及び該コンピュータプログラムが記録されているコ
ンピュータでの読取りが可能な記録媒体の提供。 【解決手段】 通信先からの音声信号が入力される音声
信号入力端子1と入力された音声信号を拡声部3から音
声として出力する前に非線形の歪みを予め取除く非線形
逆システム6と、音声信号入力端子1から音声信号出力
端子2に至る経路にて音響エコー信号の線形成分を推定
する線形適応フィルタ5とを備え、受音部4にて発生し
た音響エコー信号から推定した音響エコー信号の線形成
分を差引くようにしている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声の双方向通信で
発生する音響エコー信号を低減するための音声処理装
置、入力された音声信号に基づき音響エコー信号を低減
させる処理を行うコンピュータプログラム、及び該コン
ピュータプログラムが記録されているコンピュータでの
読取りが可能な記録媒体に関する。
【0002】
【従来の技術】拡声機能付き携帯電話機、自動車電話等
の装置にあっては、テレビ会議システム、ハンズフリー
フォン等と同様に、ハンドセットを用いることなく、ス
ピーカとマイクロホンとを利用して通話先の遠端話者と
通話することが可能である。
【0003】拡声機能付き携帯電話機、自動車電話等で
は携帯電話網のような通信回線を通じて音声信号の送受
信を行う。このとき、通話先から送信された音声信号
は、スピーカによって拡声されて話者の耳に届くととも
に、拡声された音声がマイクロホンに回込み、拡声音が
重畳された音声信号が通話先に送信されることになる。
すなわち、通話先の遠端話者がマイクロホンに向かって
発した音声が、その遠端話者の耳に遅れて戻ってくると
いうフィードバック現象が生じることになり、いわゆる
音響エコーが発生する。
【0004】このような音響エコーは自然な通話を妨害
するため、抑制する必要がある。従来、音響エコーを抑
制するために、スピーカからマイクロホンに至るスピー
カ出力の伝搬路(音響エコー経路)における音響エコー
信号を適応フィルタにより推定することによって、疑似
音響エコー信号を生成し、生成した疑似音響エコー信号
を差引くことによって音響エコーを抑制する音響エコー
キャンセラ装置が開発されている。
【0005】前述の適応フィルタには、FIR(finite
impulse response)フィルタに代表される線形適応フ
ィルタを用いることが一般的である。適応フィルタとし
て線形適応フィルタを用いた場合、音響エコー経路に非
線形の要因が存在するときにはその性能が劣化すること
が知られている。ところで、拡声通話で用いられるスピ
ーカは非線形性を有するため、従来の音響エコーキャン
セラ装置では十分に音響エコー信号を低減することがで
きないという問題点を有していた。特に、拡声機能付き
携帯電話機で利用されるスピーカは安価であり、しかも
小型のものであることが多く、非線形性が強くなるため
性能の劣化が著しいという問題点を有していた。
【0006】そこで、前述の問題点を解決するために、
非線形適応フィルタを利用した音響エコーキャンセラ装
置が開発されている。図8は従来の音響エコーキャンセ
ラ装置を説明するブロック図である。音響エコーキャン
セラ装置は、例えば、拡声機能付き携帯電話機、自動車
電話等に内蔵されている。通話先からデジタル信号によ
って送信された音声信号は、公衆電話回線網、携帯電話
網等の通信回線を通じて音声信号入力端子1に入力され
た後、スピーカを有する拡声部3によって外部に音声と
して出力される。また、話者の音声はマイクロホンを有
する受音部4から入力された後、音声信号出力端子2か
ら通信回線を通じて通話先に送信される。
【0007】線形適応フィルタ5aは、音声信号入力端
子1から入力された音声信号に基づいて、受音部4に生
じる音響エコー信号の線形成分を推定して、疑似音響エ
コー信号の線形成分を生成するようになっており、非線
形適応フィルタ5aは、同様に、受音部4に生じる音響
エコー信号の非線形成分を推定して、疑似音響エコー信
号の非線形成分を生成するようになっている。生成され
た疑似音響エコー信号の線形成分と非線型成分とは演算
処理部5cによって加算されて出力される。
【0008】そして、線形成分と非線形成分とを加算し
て生成した疑似音響エコー信号は演算処理部7に入力さ
れる。演算処理部7は、音声入力部4にて発生した音響
エコー信号から疑似音響エコー信号を差引く処理を行
う。したがって、音声入力部4で発生した音響エコー信
号は、演算処理部7にて消去されることになる。
【0009】
【発明が解決しようとする課題】しかしながら、従来の
音響エコーキャンセラ装置では、Volterraフィルタと呼
ばれる非線形適応フィルタが利用されているが、Volter
raフィルタの収束速度(音響エコー経路の同定速度)は
一般的に遅く、また、達成されるエコー消去量が劣化す
る等の問題点を含んでいるため、実用化の面で克服すべ
き多くの課題が残されていた。とりわけ、拡声機能付き
携帯電話機で利用されるスピーカは安価であり、しかも
小型のものであることが多く、このようなスピーカから
出力される音声は非線形性が強くなるため音響エコー信
号の非線形成分を確実かつ速やかに低減することができ
る音響エコーキャンセラ装置の開発が望まれていた。
【0010】本発明は斯かる事情に鑑みてなされたもの
であり、受信手段が音声信号を受信した場合、推定した
非線形の歪みを音声として出力すべき音声信号から除去
し、音声出力手段から出力された音声が音声入力手段に
入力されることにより生じる音響エコー信号の線形成分
を推定し、推定した音響エコー信号の線形成分を音声入
力手段にて生じた音響エコー信号から除去する構成とす
ることにより、発生し得る音響エコー信号の非線形成分
を抑制するとともに、速やかに音響エコー信号を除去す
ることが可能な音声処理装置、コンピュータプログラ
ム、及びコンピュータでの読取りが可能な記録媒体を提
供することを目的とする。
【0011】
【課題を解決するための手段】第1発明に係る音声処理
装置は、通信機器から送信された音声信号を受信する受
信手段と、該受信手段が受信した音声信号に基づいて外
部へ音声を出力する音声出力手段と、外部の音声を受音
して音声信号を生成する音声入力手段と、該音声入力手
段にて生成された音声信号を前記通信機器へ送信する送
信手段とを備え、前記音声出力手段から出力された音声
が前記音声入力手段に入力されることにより生じる音響
エコー信号を低減すべくなしてある音声処理装置におい
て、前記受信手段にて音声信号を受信した場合、前記音
声出力手段から出力される音声に伴う非線形の歪みを前
記音声信号に基づき推定する手段と、音響エコー信号の
線形成分を前記音声信号に基づき推定する手段と、推定
した非線形の歪みを前記音声出力手段から出力すべき音
声信号から除去する手段と、推定した音響エコー信号の
線形成分を前記音声入力手段にて生じた音響エコー信号
から除去する手段とを備えることを特徴とする。
【0012】第2発明に係る音声処理装置は、第1発明
に係る音声処理装置において、前記非線形の歪みを推定
する際に生じる遅延時間を算出する手段を備え、前記受
信手段にて音声信号を受信した後、算出した遅延時刻が
経過した場合に推定した音響エコー信号の線形成分を前
記音声入力手段にて生じた音響エコー信号から除去すべ
くなしてあることを特徴とする。
【0013】第3発明に係る音声処理装置は、第1発明
又は第2発明に係る音声処理装置において、音声信号と
Volterra級数との畳込み演算処理により、前記音声出力
手段から出力される音声に伴う非線形の歪みを推定すべ
くなしてあることを特徴とする。
【0014】第4発明に係るコンピュータプログラム
は、コンピュータに、入力された音声信号に基づいて出
力すべき音声に伴う非線形の歪みを推定させるステップ
と、コンピュータに、推定した非線形の歪みを前記音声
信号から除去させるステップと、コンピュータに、非線
形の歪みを除去した音声信号に基づいて音声を出力させ
るステップと、コンピュータに、入力された音声信号に
基づいて音響エコー信号の線形成分を推定させるステッ
プと、コンピュータに、推定した音響エコー信号の線形
成分を送信すべき音声信号から除去させるステップと、
コンピュータに、音響エコー信号の線形成分を除去した
音声信号を送信させるステップとを有することを特徴と
する。
【0015】第5発明に係るコンピュータでの読取りが
可能な記録媒体は、コンピュータに、入力された音声信
号に基づいて出力すべき音声に伴う非線形の歪みを推定
させるステップと、コンピュータに、推定した非線形の
歪みを前記音声信号から除去させるステップと、コンピ
ュータに、非線形の歪みを除去した音声信号に基づいて
音声を出力させるステップと、コンピュータに、入力さ
れた音声信号に基づいて音響エコー信号の線形成分を推
定させるステップと、コンピュータに、推定した音響エ
コー信号の線形成分を送信すべき音声信号から除去させ
るステップと、コンピュータに音響エコー信号の線形成
分を除去した音声信号を送信させるステップとを有する
コンピュータプログラムが記録されていることを特徴と
する。
【0016】第1発明にあっては、受信手段にて音声信
号を受信した場合、音声信号から非線形の歪み及び音声
入力手段に発生する音響エコー信号の線形成分を推定
し、推定した非線形の歪みを音声として出力すべき音声
信号から除去すると共に、音声出力手段から出力された
音声が音声入力手段に入力されることにより生じる音響
エコー信号から推定した音響エコー信号の線形成分を除
去するようにしている。したがって、例えば、スピーカ
のような音声出力手段の特性を考慮した非線形適応フィ
ルタを音声出力手段の前段に実装することによって、出
力される音声に伴う非線形の歪みを容易に除去すること
が可能である。また、出力される音声から非線形の歪み
を除去することによって、予め非線形の要因を取り除い
ているため、音声入力手段に生じうる音響エコー信号は
線形成分のみとなる。音響エコー信号の線形成分は、F
IRフィルタのような従来から利用されている線形適応
フィルタを用いて容易に除去することが可能であるた
め、本発明では、音響エコー信号の非線形成分を同定す
る必要がなく、速やかに音響エコー信号を低減すること
が可能となる。また、出力される音声から非線形の歪み
が除去されるため、拡声通話の音質が向上する。
【0017】第2発明にあっては、非線形の歪みを推定
する際に生じる遅延時間を算出する手段を備えており、
音声信号を受信した後、算出した遅延時間が経過した場
合に推定した音響エコー信号の線形成分を除去するよう
にしている。したがって、発生し得る音響エコー信号の
みを送信すべき音声信号から取り除くことが可能であ
る。
【0018】第3発明にあっては、受信した音声信号と
Volterra級数との畳込み演算処理により、出力される音
声に伴う非線形の歪みを推定するようにしている。した
がって、例えば、スピーカのような音声出力手段の特性
に応じてVolterra級数を予め定めておくことにより、速
やかに非線形の歪みを除去することが可能となる。
【0019】第4発明及び第5発明にあっては、入力さ
れた音声信号に基づいて出力音声に伴う非線形の歪みと
発生しうる音響エコー信号の線形成分を推定し、出力す
べき音声信号から非線形の歪みを除去すると共に、送信
すべき音声信号から音響エコー信号の線形成分を除去す
るようにしている。したがって、例えば、スピーカのよ
うな音声出力手段の特性を考慮して非線形の歪みを推定
することによって、出力される音声に伴う非線形の歪み
を容易に除去することが可能である。また、出力される
音声から非線形の歪みを除去することによって、予め非
線形の要因を取り除いているため、音声入力手段に生じ
うる音響エコー信号は線形成分のみとなり、容易に音響
エコー信号の線形成分を除去することが可能である。本
発明では、音響エコー信号の非線形成分を同定する必要
がなく、速やかに音響エコー信号を低減することが可能
となる。また、出力される音声から非線形の歪みが除去
されるため、拡声通話の音質が向上する。
【0020】
【発明の実施の形態】以下、本発明の音声処理装置を具
体化した音響エコーキャンセラ装置についてその実施の
形態を示す図面を用いて具体的に説明する。音響エコー
キャンセラ装置は、例えば、拡声機能付き携帯電話機、
自動車電話機等に備えられており、スピーカを備える音
声出力手段から出力された音声がマイクロホンを備える
音声入力手段に入力されることによって生じる音響エコ
ーを抑制する機能を有する。
【0021】実施の形態1.図1は本実施の形態に係る
音響エコーキャンセラ装置を説明するブロック図であ
る。図中1は、通話相手の遠端話者が持つ電話機、携帯
電話機等の通信端末装置(不図示)から送信される音声
信号を公衆電話回線網、携帯電話網等の通信回線(不図
示)を介して受信するための音声信号入力端子であり、
該音声信号入力端子1に入力された音声信号は後述する
非線形逆システム6により信号処理が施された後、拡声
部3から音声として外部に出力される。また、話者から
発せられる音声は、受音部4から入力された後、音声信
号出力端子2から音声信号として出力され、遠端話者の
通信端末装置に送信される。
【0022】なお、前記通信回線を通じて送受信がされ
る音声信号はデジタル信号であることが望ましい。しか
し、アナログ信号によって音声信号を送受信することも
可能であり、その場合には、音声信号入力端子1に入力
された音声信号をデジタル信号に変換するA/D変換
器、及び音声信号出力端子2から送信する信号をアナロ
グ信号に変換するD/A変換器を備えている必要があ
る。
【0023】拡声部3は、図に示していないD/A変換
器、増幅器、スピーカを備えており、非線形逆システム
6によって信号処理が施された音声信号が音声として出
力される。受音部4は、図に示していないマイクロホ
ン、増幅器、A/D変換器を備えており、外部の音声を
受音してデジタル信号による音声信号を生成する。
【0024】音声信号入力端子1から音声信号出力端子
2に至る経路には、遅延器8及び線形適応フィルタ5が
接続されている。音声信号入力端子1に入力された音声
信号は遅延器8により所定時間(例えば、数十mse
c)だけ遅延した後、線形適応フィルタ5に入力され
る。線形適応フィルタは、例えば、FIRフィルタであ
り、入力された音声信号に基づき疑似音響エコー信号の
線形成分を生成する。
【0025】生成された疑似音響エコー信号の線形成分
は演算処理部7に入力される。演算処理部7は、受音部
4で発生した音響エコー信号から疑似音響エコー信号の
線形成分を差引く処理を行う。
【0026】一方、非線形逆システム6は、入力された
音声信号に基づいて拡声部から出力される音声に伴う非
線形の歪みを推定し、拡声部3で生じる非線形の歪みを
予め除去しており、拡声部3から出力される音声に非線
形の歪みが伴わないようにしている。
【0027】本発明では、前述のように受音部4で発生
する音響エコー信号の線形成分を推定した疑似音響エコ
ー信号を生成して除去するとともに、音声信号の伝達経
路における非線形の歪みを拡声部3から出力される音声
信号から除去することによって、受音部4で発生する音
響エコー信号の非線形成分を抑制する。また、拡声部3
から出力される音声から非線形の歪みを除去するため、
拡声音の音質が向上する。
【0028】図2は、非線形逆システム6の機能を説明
するブロック図である。非線形逆システム6と拡声部3
とからなる伝達系に非線形時不変の因果関係がある場
合、その伝達系の入出力関係は、次式のようなVolterra
級数展開によって表すことが可能である。
【0029】
【数1】
【0030】ここで、x(n)及びy(n)は、それぞ
れ伝達系に対する入力信号および出力信号であり、h1
(k1 )は1次のVolterra核、h2 (k1 ,k2 )は2
次のVolterra核を表している。本実施の形態では、簡易
化のために2次のVolterra核まで採用し、また、Volter
ra核が有限のタップ数Nを持つとして前記伝達系の非線
形性を表現する。
【0031】本発明では、拡声部3(特に、拡声部3が
有するスピーカ)で発生する非線形の歪みを除去するこ
とを一つの目的としており、その非線形の歪みをVolter
ra級数と入力信号x(n)との畳込みによって表すこと
を特徴としている。すなわち、図2に示した如く、拡声
部3に仮想的に1次Volterraフィルタ31と2次Volter
raフィルタ32とを設けたことと等価であり、演算処理
部33によりVolterraフィルタ31,32から出力され
た信号を加算して、非線形の歪みを仮想的に発生させる
構成としている。
【0032】非線形逆システム6では、逆に拡声部3で
発生する非線形の歪みを推定し、入力された音声信号か
ら非線形の歪みを差引いた音声信号を出力する。したが
って、演算処理部33には非線形の歪みが含まれていな
い音声信号が出力されることになり、音声信号における
非線形の要因を予め取り除くことが可能である。
【0033】非線形逆システム6では、以下の2種類の
音声信号を生成する。一つは、遅延器61を通過させる
ことによって、所定時間だけ遅延した音声信号を生成す
る。ここで生成した音声信号が2次Volterraフィルタ3
2を通過することによって、所定時間だけ遅延した非線
形の歪みを伴う音声信号が発生する。一方、音声信号が
モデル信号生成部62に入力された場合、入力された音
声信号に基づいて非線形の歪みを模擬した音声信号が生
成され、更に線形逆フィルタ63によって、線形の歪み
を伴う音声信号を生成する。ここで生成した信号は、演
算処理部64にて符号が反転され、前述の遅延した音声
信号に印加される。そして、線形の歪み及び非線形の歪
みを伴う音声信号が、1次Volterraフィルタ31に入力
されることによって、まず線形の歪みが除去され、次い
で演算処理部33にて非線形の歪みが除去される。
【0034】図3は、本実施の形態に係る音響エコーキ
ャンセラ装置のエコー消去特性を示すグラフである。横
軸には時間、縦軸にはエコー消去量をとる。ここで、エ
コー消去量は、ある入力信号(例えば、有色雑音または
白色雑音)y0 (k)と、該入力信号y0 (k)を入力
した場合に推定される音響エコー信号y1 (k)とを用
いて、
【0035】
【数2】
【0036】のように表すことができる。
【0037】図3では、本実施の形態の音響エコーキャ
ンセラ装置によるエコー消去特性をグラフ3bに示して
おり、比較の対象として、伝達経路を線形として音響エ
コーキャンセラ装置に線形適応フィルタを用いたシュミ
レーションの結果(グラフ3a)、伝達経路を非線形と
して音響エコーキャンセラ装置に線形適応フィルタを用
いたシュミレーションの結果(グラフ3d)、従来のVo
lterraフィルタを用いた音響エコーキャンセラ装置の結
果(グラフ3c)を示している。
【0038】図3に示した如く、本実施の形態の音響エ
コーキャンセラ装置による場合、比較的短時間でエコー
消去量が25[dB]を超えていることが分かる。伝達
経路を線形として音響エコーキャンセラ装置に線形適応
フィルタを用いた場合(グラフ3a)、エコー消去量が
最も改善されているが、これは伝達経路の非線形性を考
慮していない理想的な状態であるからであり、いわば性
能限界を示すグラフである。一方、伝達経路を非線形と
して音響エコーキャンセラ装置に線形適応フィルタを用
いた場合(グラフ3d)、伝達経路の非線形性が外乱と
して影響を及ぼすため、伝達経路を線形と仮定した場合
と比較してエコー消去量が著しく劣化している。また、
従来のVolterraフィルタを用いた音響エコーキャンセラ
装置では、エコー消去量が改善されているが、音響エコ
ー信号を算出する速度が非常に遅い。これらに対して、
本実施の形態に係る音響エコーキャンセラ装置は、短時
間で音響エコー信号を算出することができ、従来の音響
エコーキャンセラ装置と比較してもエコー消去量が改善
されていることが分かる。
【0039】図4は、音響エコーキャンセラ装置で必要
な演算量を比較したグラフである。グラフの横軸にはタ
ップ数(数式1におけるNの値)をとり、縦軸には本実
施の形態に係る音響エコーキャンセラ装置で必要な演算
量を従来のVolterraフィルタで必要な演算量により除算
した値をとる。
【0040】本実施の形態に係る音響エコーキャンセラ
装置では、拡声部3で発生する非線形の歪みを推定する
とき、非線形逆システム6のモデル信号生成部62で事
前にプリセットした信号を生成する構成であるため、タ
ップ数Nに依らず一定の演算量を消費するだけである。
したがって、全体の演算量は、音響エコー信号の線形成
分を線形適応フィルタ5で推定する際に必要な演算量に
依存しており、タップ数Nに比例した値となる。一方、
従来のVolterraフィルタを用いた音響エコーキャンセラ
装置による場合、Volterra級数の2次の項を算出する必
要があり、演算量はタップ数Nの二乗に比例することに
なる。
【0041】発明者らによるシュミレーションの結果、
タップ数を増加させる程、エコー消去量の改善をするこ
とが可能であることが知られているが、全体の演算量お
よび非線形逆システム6での遅延を考慮した場合、タッ
プ数Nは128が実用的である。タップ数Nを128に
とった場合、図4に示されているように演算量は従来の
ものと比べておよそ1/5に削減することが可能であ
る。
【0042】このように、本実施の形態に係る音響エコ
ーキャンセラ装置では、Volterraフィルタを利用した従
来の音響エコーキャンセラ装置と比較して演算量が大幅
に削減され、エコー消去量の改善が見られる。また、拡
声部3から出力する音声信号の非線形の歪みを除去して
いるため、音質が向上するという利点も有している。
【0043】なお、本実施の形態に係る音響エコーキャ
ンセラ装置を携帯電話機のような小型の装置に組込む場
合、線形適応フィルタ5、及び非線形逆システム6はD
SP(デジタルシグナルプロセッサ)、専用LSI等を
利用することにより実現することができ、また、線形適
応フィルタ5、非線形逆システム6、線形適応フィルタ
5、及び遅延器8を一体化したDSP又は専用LSIを
用いることも可能である。
【0044】また、本実施の形態では、Volterra級数の
2次の項まで用いて音声信号の非線形歪みを算出してい
るが、3次以上の高次の項を用いて非線形歪みを算出す
ることもできることは、勿論のことである。
【0045】実施の形態2.前述の音響エコーキャンセ
ラ装置は、拡声機能付き携帯電話機、自動車電話機等に
適用されるだけでなく、テレビ会議システム、電話会議
システム等の音声信号の双方向通信が利用されるシステ
ムにも適用することが可能である。本実施の形態では、
テレビ会議システムに適用した実施の形態について説明
する。
【0046】図5は、本実施の形態に係るテレビ会議シ
ステムを説明する模式図である。図中100は、テレビ
会議システムで利用される通信装置であり、該通信装置
100は、公衆電話回線網のような通信ネットワークN
を介して通信先の通信装置100に接続されている。
【0047】通信装置100は、後述するようにスピー
カ及びマイクロホンを備えており、通信ネットワークN
を介して音声信号の送受信を行うことが可能であり、ま
た、CCDカメラ、ビデオカメラのような撮像装置、液
晶ディスプレイのような表示装置を備えており、通信ネ
ットワークNを介して映像データの送受信を行うことが
可能である。なお、音声信号及び映像データを送信する
際、それらを同期して送信することが望ましいが、本発
明にあっては必ずしも必須の要件ではない。
【0048】本実施の形態では、通信ネットワークNを
介して音声信号を受信した場合、受信した音声信号から
非線形の歪み、及び音響エコー信号の線形成分をコンピ
ュータプログラムの演算処理により算出し、マイクロホ
ンから出力すべき音声信号から算出した非線形の歪みを
除去するとともに、スピーカにて発生した音響エコー信
号の線形成分を除去するようにしている。
【0049】図6は、テレビ会議システムで利用される
通信装置100の内部構成を示すブロック図である。通
信装置100は、CPUを有する制御部101を備えて
おり、バス102を介して、ROM103、RAM10
4、操作部105、表示部106、通信部107、拡声
部108、受音部109、撮像部110、及び補助記憶
装置111等の各ハードウェアに接続されている。制御
部101は、ROM103に格納された本発明のプログ
ラム、演算処理プログラム、キー入力処理プログラム等
の各種制御プログラムに従って、それらのハードウェア
を制御する。RAM104はSRAM又はフラッシュメ
モリ等で構成され、ROM103に格納された各種制御
プログラムの実行時に発生するデータ、通信部107に
て送受信する映像データ等を一時的に記憶する。
【0050】操作部105は、通信装置100を操作す
るために必要なテンキー、ファンクションキー等のハー
ドウェアキー又はソフトウェアキーを備えている。表示
部106は、液晶ディスプレイのような表示装置を備え
ており、通信部107にて受信した映像データ等を表示
する。
【0051】通信部107は、モデムのような回線終端
装置を備えており、拡声部108及び受音部109に入
力された音声信号、並びに撮像部110に入力された映
像データ等を通信ネットワークNを通じて送受信する際
の制御を行う。
【0052】拡声部108は、図に示していないD/A
変換器、増幅器、スピーカを備えており、制御部101
により信号処理が施された後、音声信号が音声として出
力される。受音部4は、図に示していないマイクロホ
ン、増幅器、A/D変換器を備えており、外部の音声を
受音してデジタル信号としての音声信号を生成する。
【0053】撮像部110は、CCDカメラ、又はビデ
オカメラのような撮像装置を有しており、話者を撮像し
て映像データを取得し、通信ネットワークNを通じて通
信先の通信装置100に送信する。
【0054】補助記憶部111は、本発明のコンピュー
タプログラム及びデータを記録したCD−ROM等の記
録媒体112からコンピュータプログラム及びデータを
読取るCD−ROMドライブ等からなり、読取られたコ
ンピュータプログラム及びデータは、ROM103に記
憶される。なお、本発明のコンピュータプログラムは、
必ずしも記録媒体112により提供される形態である必
要はなく、ROM103に予め記憶されている形態であ
ってもよい。
【0055】図7は、通信装置100による音声信号の
処理手順を示すフローチャートである。制御部101
は、まず、通信部107にて音声信号を受信したか否か
を判断する(ステップS1)。音声信号を受信していな
い場合(S1:NO)、音声信号を受信するまで待機す
る。
【0056】音声信号を受信した場合(S1:YE
S)、受信した音声信号に基づいて拡声部108にて出
力される音声に伴う非線形の歪みを算出する(ステップ
S2)。非線形の歪みを算出する際、拡声部108の特
性を考慮して予めプリセットしてあるVolterra級数の2
次の項を利用して学習同定法(NLMS法)により算出
する。また、受信した音声信号に基づいて音響エコー信
号の線形成分を算出する(ステップS3)。音響エコー
信号の線形成分を算出する際、前述の学習同定法の他、
LMSアルゴリズム、RLSアルゴリズム等の従来法を
用いることが可能である。
【0057】次いで、制御部101は、ステップS2に
より算出した非線形の歪みを受信した音声信号から除去
し(ステップS4)、非線形の歪みを除去した音声信号
を音声として拡声部108から出力する(ステップS
5)。
【0058】次いで、制御部101は、ステップS1に
て音声信号を受信してから所定時間が経過したか否かを
判断する(ステップS6)。所定時間が経過していない
と判断した場合(S6:NO)、所定時間が経過するま
で待機する。なお、前記所定時間は、ステップS2にて
非線形の歪みを算出する際に生じる遅延時間に対応して
おり、音響エコー信号の線形成分を算出するにあたっ
て、入力された音声信号に基づき算出される時間であ
る。
【0059】所定時間が経過したと判断した場合(S
6:YES)、受音部109にて受音した音声信号から
音響エコー信号の線形成分を除去する(ステップS
7)。そして、音響エコー信号の線形成分を除去した
後、音声信号を通信部107から送信する(ステップS
8)。
【0060】なお、本実施の形態では、コンピュータプ
ログラムの処理により音声信号の非線形歪みと、音響エ
コー信号の線形成分とを除去することとしたが、実施の
形態1で説明したようなDSP、専用LSIを用いて実
現することも可能である。
【0061】
【発明の効果】以上、詳述したように、第1発明による
場合は、受信手段にて音声信号を受信した場合、音声信
号から非線形の歪み及び音声入力手段に発生する音響エ
コー信号の線形成分を推定し、推定した非線形の歪みを
音声として出力すべき音声信号から除去すると共に、音
声出力手段から出力された音声が音声入力手段に入力さ
れることにより生じる音響エコー信号から推定した音響
エコー信号の線形成分を除去するようにしている。した
がって、例えば、スピーカのような音声出力手段の特性
を考慮した非線形適応フィルタを音声出力手段の前段に
実装することによって、出力される音声に伴う非線形の
歪みを容易に除去することが可能である。また、出力さ
れる音声から非線形の歪みを除去することによって、予
め非線形の要因を取り除いているため、音声入力手段に
生じうる音響エコー信号は線形成分のみとなる。音響エ
コー信号の線形成分は、FIRフィルタのような従来か
ら利用されている線形適応フィルタを用いて容易に除去
することが可能であるため、本発明では、音響エコー信
号の非線形成分を同定する必要がなく、速やかに音響エ
コー信号を低減することが可能となる。また、出力され
る音声から非線形の歪みが除去されるため、拡声通話の
音質が向上する。
【0062】第2発明による場合は、非線形の歪みを推
定する際に生じる遅延時間を算出する手段を備えてお
り、音声信号を受信した後、算出した遅延時間が経過し
た場合に推定した音響エコー信号の線形成分を除去する
ようにしている。したがって、発生し得る音響エコー信
号のみを送信すべき音声信号から取り除くことが可能で
ある。
【0063】第3発明による場合は、受信した音声信号
とVolterra級数との畳込み演算処理により、出力される
音声に伴う非線形の歪みを推定するようにしている。し
たがって、例えば、スピーカのような音声出力手段の特
性に応じてVolterra級数を予め定めておくことにより、
速やかに非線形の歪みを除去することが可能となる。
【0064】第4発明及び第5発明による場合は、入力
された音声信号に基づいて出力音声に伴う非線形の歪み
と発生しうる音響エコー信号の線形成分を推定し、出力
すべき音声信号から非線形の歪みを除去すると共に、送
信すべき音声信号から音響エコー信号の線形成分を除去
するようにしている。したがって、例えば、スピーカの
ような音声出力手段の特性を考慮して非線形の歪みを推
定することによって、出力される音声に伴う非線形の歪
みを容易に除去することが可能である。また、出力され
る音声から非線形の歪みを除去することによって、予め
非線形の要因を取り除いているため、音声入力手段に生
じうる音響エコー信号は線形成分のみとなり、容易に音
響エコー信号の線形成分を除去することが可能である。
本発明では、音響エコー信号の非線形成分を同定する必
要がなく、速やかに音響エコー信号を低減することが可
能となる。また、出力される音声から非線形の歪みが除
去されるため、拡声通話の音質が向上する等、本発明は
優れた効果を奏する。
【図面の簡単な説明】
【図1】本実施の形態に係る音響エコーキャンセラ装置
を説明するブロック図である。
【図2】非線形逆システムの機能を説明するブロック図
である。
【図3】本実施の形態に係る音響エコーキャンセラ装置
のエコー消去特性を示すグラフである。
【図4】音響エコーキャンセラ装置で必要な演算量を比
較したグラフである。
【図5】本実施の形態に係るテレビ会議システムを説明
する模式図である。
【図6】テレビ会議システムで利用される通信装置の内
部構成を示すブロック図である。
【図7】通信装置による音声信号の処理手順を示すフロ
ーチャートである。
【図8】従来の音響エコーキャンセラ装置を説明するブ
ロック図である。
【符号の説明】
1 音声信号入力端子 2 音声信号出力端子 3 拡声部 4 受音部 5 線形適応フィルタ 6 非線形逆システム 7 演算処理部 8 遅延器
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D020 CC00 5K027 DD07 DD10 HH03 5K046 BB01 CC29 HH24 HH30 HH54 HH79 HH80

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 通信機器から送信された音声信号を受信
    する受信手段と、該受信手段が受信した音声信号に基づ
    いて外部へ音声を出力する音声出力手段と、外部の音声
    を受音して音声信号を生成する音声入力手段と、該音声
    入力手段にて生成された音声信号を前記通信機器へ送信
    する送信手段とを備え、前記音声出力手段から出力され
    た音声が前記音声入力手段に入力されることにより生じ
    る音響エコー信号を低減すべくなしてある音声処理装置
    において、 前記受信手段にて音声信号を受信した場合、前記音声出
    力手段から出力される音声に伴う非線形の歪みを前記音
    声信号に基づき推定する手段と、音響エコー信号の線形
    成分を前記音声信号に基づき推定する手段と、推定した
    非線形の歪みを前記音声出力手段から出力すべき音声信
    号から除去する手段と、推定した音響エコー信号の線形
    成分を前記音声入力手段にて生じた音響エコー信号から
    除去する手段とを備えることを特徴とする音声処理装
    置。
  2. 【請求項2】 前記非線形の歪みを推定する際に生じる
    遅延時間を算出する手段を備え、前記受信手段にて音声
    信号を受信した後、算出した遅延時刻が経過した場合に
    推定した音響エコー信号の線形成分を前記音声入力手段
    にて生じた音響エコー信号から除去すべくなしてあるこ
    とを特徴とする請求項1に記載の音声処理装置。
  3. 【請求項3】 音声信号とVolterra級数との畳込み演算
    処理により、前記音声出力手段から出力される音声に伴
    う非線形の歪みを推定すべくなしてあることを特徴とす
    る請求項1又は請求項2に記載の音声処理装置。
  4. 【請求項4】 コンピュータに、入力された音声信号に
    基づいて出力すべき音声に伴う非線形の歪みを推定させ
    るステップと、コンピュータに、推定した非線形の歪み
    を前記音声信号から除去させるステップと、コンピュー
    タに、非線形の歪みを除去した音声信号に基づいて音声
    を出力させるステップと、コンピュータに、入力された
    音声信号に基づいて音響エコー信号の線形成分を推定さ
    せるステップと、コンピュータに、推定した音響エコー
    信号の線形成分を送信すべき音声信号から除去させるス
    テップと、コンピュータに、音響エコー信号の線形成分
    を除去した音声信号を送信させるステップとを有するこ
    とを特徴とするコンピュータプログラム。
  5. 【請求項5】 コンピュータに、入力された音声信号に
    基づいて出力すべき音声に伴う非線形の歪みを推定させ
    るステップと、コンピュータに、推定した非線形の歪み
    を前記音声信号から除去させるステップと、コンピュー
    タに、非線形の歪みを除去した音声信号に基づいて音声
    を出力させるステップと、コンピュータに、入力された
    音声信号に基づいて音響エコー信号の線形成分を推定さ
    せるステップと、コンピュータに、推定した音響エコー
    信号の線形成分を送信すべき音声信号から除去させるス
    テップと、コンピュータに音響エコー信号の線形成分を
    除去した音声信号を送信させるステップとを有するコン
    ピュータプログラムが記録されていることを特徴とする
    コンピュータでの読取りが可能な記録媒体。
JP2002070868A 2002-03-14 2002-03-14 音声処理装置、コンピュータプログラム、及び記録媒体 Pending JP2003274481A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002070868A JP2003274481A (ja) 2002-03-14 2002-03-14 音声処理装置、コンピュータプログラム、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002070868A JP2003274481A (ja) 2002-03-14 2002-03-14 音声処理装置、コンピュータプログラム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2003274481A true JP2003274481A (ja) 2003-09-26

Family

ID=29201318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002070868A Pending JP2003274481A (ja) 2002-03-14 2002-03-14 音声処理装置、コンピュータプログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2003274481A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009232436A (ja) * 2008-03-24 2009-10-08 Matech Inc 単一トランスデューサを用いた全二重通話回路及びオーディオ回路
JP2010531567A (ja) * 2007-06-21 2010-09-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号を処理する装置及び方法
WO2014147552A1 (en) * 2013-03-19 2014-09-25 Koninklijke Philips N.V. Method and apparatus for audio processing

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010531567A (ja) * 2007-06-21 2010-09-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号を処理する装置及び方法
JP2009232436A (ja) * 2008-03-24 2009-10-08 Matech Inc 単一トランスデューサを用いた全二重通話回路及びオーディオ回路
WO2014147552A1 (en) * 2013-03-19 2014-09-25 Koninklijke Philips N.V. Method and apparatus for audio processing
JP2016515332A (ja) * 2013-03-19 2016-05-26 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオ処理のための方法及び装置
US9674368B2 (en) 2013-03-19 2017-06-06 Koninklijke Philips N.V. Method and apparatus for audio processing
RU2664717C2 (ru) * 2013-03-19 2018-08-22 Конинклейке Филипс Н.В. Способ и устройство для аудиообработки

Similar Documents

Publication Publication Date Title
KR100974370B1 (ko) 에코 억압 방법 및 장치
KR101469739B1 (ko) 오디오 신호들을 처리하는 디바이스 및 방법
KR100974371B1 (ko) 에코 억압 방법 및 장치
US8311234B2 (en) Echo canceller and communication audio processing apparatus
US20130012275A1 (en) Echo cancelling device, communication device, and echo cancelling method having the error signal generating circuit
JP2004165888A (ja) ハウリング処理装置
JP3864914B2 (ja) エコー抑圧装置
JP2861888B2 (ja) エコー・ノイズキャンセラおよびエコー・ノイズ消去方法
JP2003274481A (ja) 音声処理装置、コンピュータプログラム、及び記録媒体
JP3982823B2 (ja) 音声処理装置、音声処理方法および音声処理プログラム
US10819858B2 (en) Method for improving echo cancellation effect and system thereof
JP4403491B2 (ja) エコーキャンセラ、エコーキャンセル方法及びエコーキャンセルプログラム
JP2008263441A (ja) 非線形エコーキャンセラ装置
JP4396053B2 (ja) エコー抑圧装置
CN112863532A (zh) 回音抑制装置、回音抑制方法以及存储介质
JP2003273782A (ja) 音声処理装置、コンピュータプログラム、及び記録媒体
JP2007336132A (ja) エコー抑圧装置
JP2000353989A (ja) エコーキャンセラ
JP3321411B2 (ja) エコー除去装置
JP5118099B2 (ja) 側音キャンセル方法および側音キャンセラ
JPH01314438A (ja) エコーキャンセラ
WO2019244535A1 (ja) エコー消去装置、エコー消去方法、プログラム
JP3442535B2 (ja) エコーキャンセラ
JP2009124386A (ja) 音声信号処理装置、音声信号処理方法
CN114449114A (zh) 一种针对回声消除残余回声的处理方法