WO2017134798A1

WO2017134798A1 - 音声通話装置

Info

Publication number: WO2017134798A1
Application number: PCT/JP2016/053375
Authority: WO
Inventors: 茂明鈴木; 訓古田; 智治粟野
Original assignee: 三菱電機株式会社
Priority date: 2016-02-04
Filing date: 2016-02-04
Publication date: 2017-08-10
Also published as: CN108495803B; JP6011751B1; CN108495803A; JPWO2017134798A1

Abstract

この発明に係る音声通話装置は、エレベータ用の音声通話装置であり、信号のエコーの経路に依存するパラメータを保持するパラメータ保持部と、前記パラメータを用いて音声通話時の音声信号を処理する信号処理部と、自装置が設置されたエレベータ内の環境に応じて、前記音声通話に先立って前記パラメータの学習を行うことが可能か否かを判定する学習契機判定部と、前記学習契機判定部で学習を行うことが可能と判定されたとき、前記パラメータの学習を行う学習信号を発生する学習信号発生部と、を備えたことを特徴とする。この構成によって、ユーザに違和感を与えることなく適切なタイミングで自動的に初期学習を行うことができる。

Description

音声通話装置

　この発明は、音声通話を行う際に用いられる音声通話装置に関する。

　スピーカホン電話などのハンズフリー通話が可能な音声通話装置においては、ハウリングやエコーを防止するためのエコーキャンセラが用いられている。エコーが発生する条件は、音声通話装置が設定される環境に依存し、一般に狭くて硬い壁に囲まれた部屋は残響が大きいため大きなエコーが発生し、逆に広い部屋であればエコーが比較的小さい場合もある。エコーキャンセラは、エコー経路の特性（インパルス応答など）を逐次学習する適応フィルタを備えており、適応フィルタは環境によって異なるエコー経路の特性を逐次学習してエコーを消去する。但し、設置環境が大きく異なる場合などに、この逐次学習が困難となる、あるいは学習に時間がかかるといった問題が生じるため、通話前に初期学習を行って予め学習したパラメータを与えておく技術が開示されている（例えば、特許文献１）。

　特許文献１に開示される技術では、初期学習を行う学習モードにおいて、エコーキャンセラの校正音を発生して音声通話装置のスピーカに出力し、このときマイクロフォンに入力される信号を用いて初期学習を行う。この初期学習を行うタイミングについては、電源投入時に自動的に初期学習を行うか、または音声通話装置に初期学習スイッチを備えてユーザがそのスイッチを用いて指定したタイミングで初期学習を行う方法が開示されている。

特開２００５－３２３３０８号公報．

エレベータの非常通報に用いられる音声通話装置は、エレベータ内に設置されたインターホンのマイクとスピーカによりハンズフリー通話を行う装置であり、エコーキャンセラが必要となる。このマイクとスピーカ特性のばらつきや、エレベータの大きさによって、エコー環境は大きく異なるため、従来技術で示される初期学習の導入は有効である。しかし、エレベータ非常通報用の音声通話装置は、エレベータ内での閉じ込めなどの事態に遭遇したエレベータ搭乗者が用いることになるため、閉じ込められた状況でユーザが初期学習の開始を指定することには困難が伴う。従って、従来技術をそのまま用いると、初期学習のタイミングとして適しているとは言えないという問題がある。

　この発明は上記のような問題点を解決するためになされたもので、ユーザに違和感を与えることなく適切な時間帯で自動的に初期学習を行うことが可能な音声通話装置を得ることを目的とする。

　この発明に係る音声通話装置は、エレベータ用の音声通話装置であり、信号のエコーの経路に依存するパラメータを保持するパラメータ保持部と、前記パラメータを用いて音声通話時の音声信号を処理する信号処理部と、自装置が設置されたエレベータ内の環境に応じて、前記音声通話に先立って前記パラメータの学習を行うことが可能か否かを判定する学習契機判定部と、前記学習契機判定部で学習を行うことが可能と判定されたとき、前記パラメータの学習を行う学習信号を発生する学習信号発生部と、を備えたことを特徴とする。

この発明によれば、ユーザに違和感を与えることなく適切な時間帯で自動的に初期学習を行うことができる。

実施の形態１に係る音声通話装置が用いられるエレベータ非常通報用システムの構成図。実施の形態１に係る音声通話装置４の内部構成。実施の形態１に係る音声通話装置４のハードウェア構成を示す図。実施の形態１に係る音声通話装置４の図３と異なるハードウェア構成を示す図。実施の形態１に係る音声通話装置４の動作を示すフローチャート。実施の形態１に係る学習契機判定部４１の初期学習時間の判定フロー。実施の形態１に係る信号処理部４５の内部構成を示す図。実施の形態２に係る学習契機判定部４１の初期学習時間の判定フロー。実施の形態３に係る学習契機判定部４１の初期学習時間の判定フロー。実施の形態５に係る音声通話装置４の動作を示すフローチャート。実施の形態６による信号処理部４５の内部構成図。実施の形態６による信号処理部４５の内部構成図。

実施の形態１．
　この発明の実施の形態１に係る音声通話装置について説明する。図１は、この発明による音声通話装置が用いられるエレベータ非常通報用システムの構成図である。図において、１はエレベータ、２はエレベータ１内に設置されるインターホン、３はエレベータ１の動作を制御するエレベータ運転制御部、４は音声通話装置、５は通信ネットワーク、６はエレベータ１の通話先となる監視センター、７は監視センター６内の電話端末である。

　このシステムは、例えば、エレベータ１が故障してエレベータ１内に搭乗者が閉じ込められた場合、監視センター６のオペレータを呼出して通話する場合に用いられる。このとき、インターホン２は、エレベータ１に閉じ込められた人の音声入出力に用いられ、音声通話装置４はインターホン２のアナログ音声と通信ネットワーク５上を伝送するデジタル音声との相互変換、エレベータ１内で発生するエコーの抑圧を行う。通信ネットワーク５は音声通話装置４と監視センター６との間の音声データを伝送する。電話端末７は監視センター６内のオペレータが通話に用いる。なお、エレベータ運転制御部３はエレベータ１内に設置され、エレベータ１の運転、すなわち昇降やドアの開閉の制御を行い、上記音声通話には直接関係しないが、本実施形態においては、音声通話装置４が初期学習の時間を判断するための情報を提供する。

図２には、音声通話装置４の内部構成を、同装置に接続されるインターホン２、エレベータ運転制御部３と共に示す。図において、４１は初期学習の契機を判定する学習契機判定部、４２は通話の開始・終了を制御する通話制御部、４３は学習用の信号を発生する学習信号発生部、４４は通信回線からの入力と学習信号との何れかを選択するスイッチ、４５はインターホン２のスピーカ２１から出力された音声がインターホン２のマイクに回り込んだ信号であるエコーを抑圧するエコーキャンセラ機能を有する信号処理部、４６はデジタル信号をアナログ信号に変換するＤ／Ａ変換器、４７はアナログ信号をデジタル信号に変換するＡ／Ｄ（Ａｎａｌｏｇ／Ｄｉｇｉｔａｌ）変換器、４８は初期学習によって得られたパラメータを保持するパラメータ保持部、４９は通信回線とデータの送受信を行う通信回線インターフェース、２１はインターホン２内部のスピーカ、２２はインターホン２内部のマイクロフォン（以下、マイクと呼ぶ）、２３はインターホン２による非常通話開始に用いられる非常通話ボタンである。

　図３は、この発明の実施の形態１における音声通話装置４のハードウェア構成を示す図である。学習契機判定部４１、通話制御部４２、学習信号発生部４３、スイッチ４４、信号処理部４５、パラメータ保持部４８は、メモリ４０２に記憶されたプログラムを実行するプロセッサ４０１によって実現される。なお、これは一例であって、これ以外の専用処理回路などを用いたハードウェア構成であっても構わない。

　Ｄ／Ａ変換器４６、Ａ／Ｄ変換器４７は、Ａ／Ｄ、Ｄ／Ａ変換ＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ）４０３により実現される。なお、これは一例であって、例えばプロセッサ４０１が、Ａ／Ｄ、Ｄ／Ａ変換ＬＳＩ４０３と統合されたシステムＬＳＩ等であっても良い。

　スイッチ開閉検出ＬＳＩ４０４は、非常通話ボタン２３のボタン押下状態を、プロセッサ４０１の特定ポートから参照できるように電気変換する。なお、これは一例であって、例えばプロセッサ４０１がスイッチ開閉検出ＬＳＩ４０４と統合されたシステムＬＳＩ等であっても良い。

　エレベータ運転制御部３は、学習契機判定部４１に出力する各種情報をネットワークフレームに乗せて出力し、ネットワークインターフェースＡ４０５がこれを受信する。また、ネットワークフレームに乗せられた通信回線側の入出力データは、ネットワークインターフェースＢ４０６が送受信する。すなわち、ネットワークインターフェースＢ４０６は図２における通信回線インターフェース４９に相当する。なお、これは一例であって、例えば、１つのネットワークインターフェースが、エレベータ運転制御部３からの情報の受信と、通信回線側の入出力データの送受信を行う構成でも良い。

　更に、図４に示す構成として、プロセッサ４０１が実現する処理を複数のプロセッサで実現しても良く、この図においては、信号処理部４５、学習信号発生部４３などの信号処理をデジタル信号処理プロセッサ４０７が実現する。

図５は音声通話装置４の動作を示すフローチャートであり、以下、図５を用いて音声通話装置４の動作を説明する。

まず、搭乗者がエレベータ１に閉じ込められる状況などが発生して通話が行われる場合について説明する。通話制御部４２は非常通話ボタン２３が押下されたかどうかを監視しており（ＳＴ１）、エレベータ１内に閉じ込められた搭乗者が非常通話ボタン２３を押下すると、これを契機に通話制御部４２が通信回線インターフェース４９を介して監視センター６と制御信号を送受信し、監視センター６を呼出して通信を確立する（ＳＴ２）。この通信確立は、例えば、ＩＥＴＦ（Ｉｎｔｅｒｎｅｔ　Ｅｎｇｉｎｅｅｒｉｎｇ　Ｔａｓｋ　Ｆｏｒｃｅ）のＲＦＣ（Ｒｅｑｕｅｓｔ　ｆｏｒ　Ｃｏｍｍｅｎｔｓ）３２６１で規定されるＳＩＰ（Ｓｅｓｓｉｏｎ　Ｉｎｉｔｉａｔｉｏｎ　Ｐｒｏｔｏｃｏｌ）によって行われる。また、通話制御部４２はその通信状態、すなわち、センター呼出し中か、通話中か、その何れでもないアイドル状態であるかを、学習契機判定部４１と信号処理部４５に出力する。監視センター６との通信が確立すると、信号処理部４５はパラメータ保持部４８に格納されたパラメータを入力し（ＳＴ３）、通話が始まる。通話中、スイッチ４４は通信回線インターフェース４９からの入力信号を選択して信号処理部４５に出力するため、通信回線インターフェース４９からの入力信号は信号処理部４５を経由してＤ／Ａ変換器４６に出力される（ＳＴ４）。そして、Ｄ／Ａ変換器４６でアナログ信号に変換されてインターホン２内のスピーカ２１から出力される。また、インターホン２内のマイク２２からのエレベータ１内登場者の音声は、Ａ／Ｄ変換器４７でデジタル信号に変換された後、信号処理部４５によってエコーが消去され、通信回線インターフェース４９を経て通信回線に出力される（ＳＴ５）。そして、通話が終了するまでこの動作を継続する（ＳＴ６）。

なお、スイッチ４４は、学習契機判定部４１で行われる初期学習が可能か否かの判定結果が初期学習が可能でない場合、上述の通りに選択する。この学習契機判定部４１で行われる初期学習が可能か否かの判定動作については後述する。

　続いて、通話制御部４２が非常通話ボタン２３を押下されていないと判定する環境において（ＳＴ１）、学習契機判定部４１が初期学習可能と判定した場合の動作を説明する。学習契機判定部４１が初期学習が可能な時間（初期学習時間）と判定すると（ＳＴ７）、学習処理が開始される。学習信号発生部４３はパラメータ初期学習用の信号として白色雑音を出力する（ＳＴ８）。スイッチ４４は、通信回線インターフェース４９ではなく、学習信号発生部４３からの入力を選択して信号処理部４５に出力するので、学習信号発生部４３の出力信号は、信号処理部４５を経てＤ／Ａ変換器４６に出力される（ＳＴ９）。そして、Ｄ／Ａ変換器４６でアナログ信号に変換されてインターホン２内のスピーカ２１から出力される。インターホン２内のマイク２２からのエレベータ１内登場者の音声は、Ａ／Ｄ変換器４７でデジタル信号に変換された後、信号処理部４５によってエコーが消去される（ＳＴ１０）。そして、初期学習時間が終了するまでこの動作を継続し（ＳＴ１１）、初期学習時間が終了すると、エコー消去動作に伴って信号処理部４５が学習したパラメータをパラメータ保持部４８に格納する（ＳＴ１２）。

　なお、パラメータ初期学習用の信号は、信号処理部４５によってエコーを消去できる信号であれば、白色雑音以外の信号であっても構わない。

　学習契機判定部４１は、初期学習が可能か否かの判定結果をスイッチ４４、信号処理部４５、学習信号発生部４３に出力する。以下、図５のフローにおいてＳＴ７に示した判定、すなわち学習契機判定部４１が初期学習が可能か否かを判定する動作について説明する。

この判定は、エレベータ運転制御部３からの情報とＡ／Ｄ変換器４７からの信号を基に行われる。まず、エレベータ運転制御部３は、エレベータ１の昇降、ドアの開閉制御を行うものだが、そのため、エレベータ１が停止中か動作（上昇または下降）中かどうかを示すエレベータ動作・停止情報、ドアが開いているか閉じているかを示すドア開閉情報、エレベータ１内の行先ボタンやドア開閉ボタンを押下したかどうかを示すボタン押下情報を持っており、これらの情報を学習契機判定部４１に出力する。信号処理部４５の初期学習は、エレベータ１が停止、かつドアが閉じた状態で、エレベータ１内に搭乗者がおらず、騒音が少ない状態で行うことが望ましい。このような条件を満たす時間帯を判定するため、学習契機判定部４１は、エレベータ運転制御部３からの各情報、通話制御部４２からの情報、及び、Ａ／Ｄ変換器４７の出力信号を用いる。

　なお、従来の音声通話装置では、電源投入は通話装置の設置時に行われるが、運用前の状態であるため、例えばエレベータのドアが開いているなど通話時のエコー環境と異なる状態である可能性がある。これに対して、本実施の形態において、ドアが閉じた状態で、エレベータ１内に搭乗者がおらず、騒音が少ない状態で初期学習を行う場合には、通話時のエコー環境に近い環境で初期学習を行うことができる。

図６は、学習契機判定部４１での初期学習が可能か否かを判定する判定フローの一例である。以下、このフローを参照して説明する。初めは初期学習時間でないという判定状態からスタートする（ＳＴ１３）。そして、エレベータ運転制御部３からのエレベータ動作・停止情報によりエレベータ１が停止中であり（ＳＴ１４）、かつ、エレベータ運転制御部３からのドア開閉情報によりドアが閉じており（ＳＴ１５）、かつ、エレベータ運転制御部３からのボタン押下情報よりエレベータ１内のボタンが最後に押下されてから所定の時間以上が経過しており（ＳＴ１６）、かつ、通話制御部４２からの情報により通話のための呼出し中でも通話中でもなく（ＳＴ１７）、かつ、Ａ／Ｄ変換器４７の出力信号レベルが所定値以下（これはエレベータ１内の騒音が少ないことを意味する）である（ＳＴ１８）、という全ての条件が満たされると初期学習が可能な時間（初期学習時間）と判定する（ＳＴ１９）。そして、初期学習時間と判定したタイミングから一定時間、例えば１０秒間を初期学習の時間と判定し（ＳＴ２０）、この時間が経過すると初期学習時間でないという判定状態に戻る（ＳＴ１３）。

　なお、エレベータ運転制御部３からのボタン押下情報よりエレベータ１内のボタンが最後に押下されてから所定の時間以上が経過しているという条件（ＳＴ１６）はエレベータ１に搭乗者がいないという条件に相当する。従って、エレベータ１に搭乗者がいないことを他の条件から識別する構成を用いることも可能である。また、図６に示す判断フローは一例であって、音声通話装置４の置かれた環境を認識し、その環境に応じて初期学習が可能か否かを判定する構成であれば、他の条件設定に基づく判断フローを用いることも可能である。

　次に、信号処理部４５の動作を、その内部構成を示す図７を用いて説明する。図において、４５１はエコー経路のインパルス応答を推定して擬似エコー信号を生成する適応フィルタ、４５２はインターホン２側から入力する送話信号から擬似エコーを減算する減算器、４５３は送話側の信号と受話側の信号から適応フィルタ４５１のインパルス応答推定動作の可否を判定する適応動作可否判定部、４５４は減算器４５２によってエコー抑圧後の残留エコーを更に抑圧する残留エコー抑圧部である。

まず、学習契機判定部４１での判定結果が初期学習時間ではなく、通話が行われる場合について説明する。適応フィルタ４５１は、通話開始のタイミングでパラメータ保持部４８に保持されたパラメータを読込む。ここで、パラメータ保持部４８より入力するパラメータはエコー経路のインパルス応答推定値である。その後、適応フィルタ４５１は動作を開始し、受話側の信号（通信回線側の入力信号）より適応フィルタ４５１を通して擬似エコー信号を生成して出力し、減算器４５２がこの擬似エコー信号を送話信号（インターホン２側入力信号）から減算して適応動作可否判定部４５３、残留エコー抑圧部４５４に出力すると共に、適応フィルタに４５１に出力する。適応フィルタ４５１は、減算器４５２からの信号を用いてエコー経路のインパルス応答推定を行う。エコー経路のインパルス応答推定には、例えば、ＬＭＳ（Ｌｅａｓｔ　Ｍｅａｎ　Ｓｑｕａｒｅｄ）アルゴリズムを用いる。ここで、エコー経路のインパルス応答推定動作を行うかどうかは、適応動作可否判定部４５３の判定に従う。適応動作可否判定部４５３は、適応フィルタ４５１におけるエコー経路推定動作が可能かどうかを判定し、判定結果を適応フィルタ４５１に出力する。ここで、受話側に通話信号があり、送話側には通話信号がなく受話側の信号がエレベータ１内で回り込んだエコー信号のみがある状態がエコー経路推定動作に最も望ましい状態であり、適応動作可否判定部４５３は、受話側の信号（通信回線側の入力信号）と減算器４５２による擬似エコー減算後の送話側信号を入力そのパワーを比較し、受話側の信号のパワーが送話側の信号のパワーよりも一定しきい値以上大きい場合、エコー経路推定動作が可能と判定する。減算器４５２の出力信号は、適応フィルタ４５１で生成した擬似エコー信号を送話信号から減算したエコー消去後の信号であるが、一般にはエコー成分が残留する。これを抑圧するため、残留エコー抑圧部４５４は、減算器４５２の出力信号に損失を与える。

なお、上記説明した適応動作可否判定部４５３の動作や残留エコー抑圧部４５４の動作は一例であって、例えば適応動作可否判定部４５３は擬似エコー減算前の送話側信号を併用する判定方法を取っても良く、残留エコー抑圧部４５４を備えない構成であっても良い。

次に、学習契機判定部４１が初期学習が可能と判定した場合の初期学習中の動作を説明する。適応フィルタ４５１は、初期学習開始のタイミングでエコー経路のインパルス応答推定値を初期化(全て“０”)し、その後学習時間完了まで、通話時と同様な処理を行う。すなわち、受話側の信号（通信回線側の入力信号）より適応フィルタ４５１を通して擬似エコー信号を生成して出力し、減算器４５２からの信号を用いてエコー経路のインパルス応答推定を行う。適応動作可否判定部４５３は通話時と同様の動作を行う。同様に、残留エコー抑圧部４５４も通話時と同様の動作を行うが、通話中でないため、その出力は通信回線に送信されることはなく使用されない。初期学習時間が完了すると、その完了のタイミングにおいて、初期学習時間中に推定したエコー経路のインパルス応答推定値をパラメータ保持部４８に出力し、これを格納させる。

以上のように、本実施の形態に係る発明によれば、学習契機判定部４１が、周辺の環境を認識し、その環境に応じて初期学習が可能か否かを判定する構成を用いることにより、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能な音声通話装置４を得ることができる。

特に、その周辺の環境として、エレベータ１が停止中で、ドアが閉まっており、エレベータ１内の行先ボタンが押下されてから所定の時間以上が経過し、通話中でなく、マイク２２からの入力信号レベルが所定値以下の場合に初期学習可能と判断することにより、実際に音声通話装置４が用いられる環境に近い環境で、初期学習を行うことができ、実際に音声通話装置４が用いられる環境に適用することが可能となる。

　すなわち、実施の形態１に係る音声通話装置４は、エレベータ用の音声通話装置であり、信号のエコーの経路に依存するパラメータを保持するパラメータ保持部４８と、前記パラメータを用いて音声通話時の音声信号を処理する信号処理部４５と、自装置が設置されたエレベータ１内の環境に応じて、音声通話に先立って前記パラメータの学習を行うことが可能か否かを判定する学習契機判定部４１と、前記学習契機判定部４１で学習を行うことが可能と判定されたとき、前記パラメータの学習を行う学習信号を発生する学習信号発生部４３と、を備えたことを特徴とする。この構成によって、ユーザに違和感を与えることなく自動的に適切なタイミングで初期学習を行うことが可能となる。

　また、実施の形態１に係る音声通話装置４では、学習契機判定部４１は、エレベータ１内に人がいないときに、前記パラメータの学習を行うことが可能と判定することを特徴とする。この構成によって、音声通話装置４はエレベータ１内に人がいないタイミングで初期学習を行うことができる。

　また、実施の形態１に係る音声通話装置４では、学習契機判定部４１は、エレベータ１が停止中であり、前記エレベータ１のドアが閉まった状態であり、前記エレベータ１内のボタンが押下されてから所定の時間が経過したとき、前記エレベータ１内の環境が前記パラメータの学習が可能な環境であると判定し、前記パラメータの学習を行うタイミングを決定することを特徴とする。この構成によって、ユーザに違和感を与えることなく自動的に適切なタイミングで初期学習を行うことが可能となる。

　また、実施の形態１に係る音声通話装置４では、パラメータ保持部４８で保持されるパラメータは学習信号が音声通話装置４から送信される時点から音声通話装置４で受信される時点までに前記学習信号が通る経路のインパルス応答の値である。この構成によって、音声通話装置４はパラメータ保持部４８で保持されたインパルス応答の値を用いて通話信号のエコーキャンセルを行うことができ、良好な通話信号の品質を確保することができる。

実施の形態２．
実施の形態１では、学習契機判定部４１が図６に示すフローに基づいて初期学習が可能な時間か否かの判定が行われた。具体的には、エレベータ１に搭乗者がいないことをエレベータ運転制御部３からのボタン押下情報よりエレベータ１内のボタンが最後に押下されてから所定の時間以上が経過しているという条件（ＳＴ１６）によって初期学習時間を判定した。これに対して、本実施の形態では、エレベータ１に搭乗者がいないことを他の手段で判定する構成を示す。

エレベータ１の中には、乗り過ぎを通知するブザーを備えたものがある。そのようなエレベータ１においては、エレベータ運転制御部３は学習契機判定部４１に対して、エレベータ１内の重量情報を出力することができる。学習契機判定部４１はこの情報を初期学習時間の判定に用いる。図８に初期学習時間の判定フローを示す。このフローでは、エレベータ１内のボタンが最後に押下されてから所定の時間以上が経過しているという条件に代わり、エレベータ１内の重量が一定値以下である（ＳＴ２１）という条件を判定に用いており、それ以外は図６と同様のフローである。エレベータ１内の重量が一定値以下であれば搭乗者はいないと言える。

以上のように、本実施の形態に係る発明によれば、学習契機判定部４１がエレベータ１内の重量が所定値以下であることを判定することにより、搭乗者がいないことを判定し、学習可能な時間か否かを決定する。この構成によって、実施の形態１と同様に、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能な音声通話装置を得ることができる。

　すなわち、実施の形態２に係る音声通話装置４では、学習契機判定部４１は、エレベータ１が停止中であり、前記エレベータ１のドアが閉まった状態であり、前記エレベータ１内の重量が所定値以下であるとき、前記エレベータ１内の環境が前記パラメータの学習が可能な環境であると判定し、前記パラメータの学習を行う時間帯を決定することを特徴とする。この構成によって、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能となる。

実施の形態３．
本実施の形態では、エレベータ１内に搭乗者がいないという条件をカメラ画像により判定する構成を示す。この通話の際、音声通信だけでなく画像通信も同時に可能なエレベータもある。

図９に学習契機判定部４１が初期学習時間を判定するフローを示す。このフローでは、エレベータ１内のボタンが最後に押下されてから所定の時間以上が経過しているという条件に代わり、カメラ画像内が無人である（ＳＴ２２）という条件を判定に用いており、それ以外は図６と同様のフローである。

以上のように、本実施の形態に係る発明によれば、学習契機判定部４１はカメラ画像内が無人であることを判定することにより、搭乗者がいないことを判定し、初期学習が可能か否かを判定する。この構成によって、実施の形態１、２と同様に、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能な音声通話装置を得ることができる。

　すなわち、実施の形態３に係る音声通話装置４では、学習契機判定部４１は、エレベータ１が停止中であり、前記エレベータ１のドアが閉まった状態であり、前記エレベータ１内に設置されたカメラの画像が無人であるとき、前記エレベータ１内の環境が前記パラメータの学習が可能な環境であると判定することを特徴とする。この構成によって、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能となる。

実施の形態４．
実施の形態１～３では、信号処理部４５がパラメータ保持部４８に保持するパラメータをエコー経路のインパルス応答推定値とした。これに対して、本実施の形態では、このインパルス応答推定値の全てを保持するのではなく、所定の遅延時間内のインパルス応答推定値のみを保持する構成を示す。

適応フィルタ４５１が備えるインパルス応答推定値がｎ個ある場合、本実施の形態ではこれを遅延時間の短い順に並べるとＨ０、Ｈ１、・・・Ｈｎ－１となるとすると、パラメータ保持部４８にはｍ個のインパルス応答Ｈ０、Ｈ１、・・・Ｈｍ－１（ｍ＜ｎ）のみを格納する。また、通話開始の際、信号処理部４５はパラメータ保持部４８からｍ個のインパルス応答のみを入力することになるため、残りｎ－ｍ個のインパルス応答Ｈｍ、Ｈｍ＋１、・・・Ｈｎ－１については０値を用いて動作を開始する。

インパルス応答は、エコー経路特性をインパルス入力時の応答信号で表現するものであり、遅延時間の短いインパルス応答はインターホン２のスピーカ２１から出力される音声が直接インターホン２のマイク２２に伝わる直接音によるエコーに相当し、遅延時間の長いインパルス応答はインターホン２のスピーカ２１から出力される音声がエレベータ１の壁、ドアなどで反射してからインターホン２のマイク２２に伝わる反射音によるエコーに相当する。反射音はエレベータ１内の搭乗者の人数や位置に依存して変化するが、直接音は変化しない。このため、通話開始の際に、遅延時間の長いインパルス応答推定値Ｈｍ、Ｈｍ＋１、・・・Ｈｎ－１について全て０の状態で通話が開始されたとしても、全インパルス応答推定値Ｈ０、Ｈ１、・・・Ｈｎ－１をパラメータ保持部４８から入力する場合とエコー消去性能に殆ど差異はなく、保持するインパルス応答推定値が少なくなることからパラメータ保持部４８に要するメモリ量、すなわちＨ／Ｗ（Ｈａｒｄｗａｒｅ）規模を削減することができる。

以上のように、本実施の形態に係る発明によれば、パラメータ保持部４８に所定の遅延時間内のインパルス応答推定値のみを保持するためＨ／Ｗ規模を削減が可能となる。また、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能な音声通話装置を得ることができる。

　すなわち、実施の形態４に係る音声通話装置４では、パラメータ保持部４８で保持されるパラメータは学習信号が音声通話装置４から送信される時点から音声通話装置４で受信される時点までに前記学習信号が通る経路のインパルス応答の値の中で遅延時間の短い一部のインパルス応答の値である。この構成によって、保持するインパルス応答推定値が少なくなることからパラメータ保持部４８に要するメモリ量、すなわちＨ／Ｗ規模を削減することができる。

実施の形態５．
実施の形態１～４においては、エレベータ搭乗者がなく、センターとの間の通話が行われていない間にパラメータの初期学習を行うことが可能と判定した。これに対して、本実施の形態では、エレベータの閉じ込めなどが発生して通話が行われる直前に初期学習を行う形態を示す。

初期学習時には白色雑音などの学習信号をスピーカから出力する必要があるが、エレベータ内で緊急事態に遭遇したユーザに対して耳障りな学習信号を聞かせる運用は許容し難いという問題がある。そこで、本実施の形態では、緊急事態に遭遇したユーザに対して耳障りに感じない学習信号を用いる構成を示す。

図１０は音声通話装置４の動作を示すフローチャートであり、以下、この図を用いて音声通話装置４の動作を説明する。通話制御部４２は非常通話ボタン２３が押下されたかどうかを監視しており（ＳＴ１）、エレベータ内に閉じ込められた搭乗者が非常通話ボタン２３を押下すると、これを契機に通話制御部４２が通信回線インターフェース４９を介して監視センター６と制御信号を送受信し、監視センター呼出しを開始する（ＳＴ２３）。これと同時に、学習契機判定部４１は初期学習の時間と判定し（ＳＴ２４）、初期学習を開始する。

初期学習が始まると、学習信号発生部４３はパラメータ初期学習用の信号としてチャープ信号を出力する（ＳＴ２５）。なお、チャープ信号の説明は後述する。スイッチ４４は、通信回線インターフェース４９ではなく、学習信号発生部４３からの入力を選択して信号処理部４５に出力するので、学習信号発生部４３の出力信号は、信号処理部４５を経てＤ／Ａ変換器４６に出力される（ＳＴ９）。そして、Ｄ／Ａ変換器４６でアナログ信号に変換されてインターホン２内のスピーカ２１から出力される。インターホン２内のマイク２２からのエレベータ内登場者の音声は、Ａ／Ｄ変換器４７でデジタル信号に変換された後、信号処理部４５によってエコーが消去される（ＳＴ１０）。学習契機判定部４１は、初期学習の開始から一定時間、例えば１０秒経過するまでを初期学習時間と判定し（ＳＴ２０）、その間、上記の学習動作（ＳＴ２５、ＳＴ９、ＳＴ１０）を継続する。初期学習時間が終了すると、エコー消去動作に伴って信号処理部４５が学習したパラメータをパラメータ保持部４８に格納する（ＳＴ１２）。

上記初期学習動作と、通話制御部４２による監視センター６への呼出しは並行して行われ、監視センター６との通信が確立して呼出しが完了すると（ＳＴ２６）、信号処理部４５はパラメータ保持部４８に格納されたパラメータを入力し（ＳＴ３）、通話が始まる。通話中、スイッチ４４は通信回線インターフェース４９からの入力信号を選択して信号処理部４５に出力するため、通信回線インターフェース４９からの入力信号は信号処理部４５を経由してＤ／Ａ変換器４６に出力される（ＳＴ４）。そして、Ｄ／Ａ変換器４６でアナログ信号に変換されてインターホン２内のスピーカ２１から出力される。また、インターホン２内のマイク２２からのエレベータ内登場者の音声は、Ａ／Ｄ変換器４７でデジタル信号に変換された後、信号処理部４５によってエコーが消去され、通信回線インターフェース４９を経て通信回線に出力される（ＳＴ５）。そして、通話が終了するまでこの動作を継続する（ＳＴ６）。

以下、初期学習において学習信号発生部４３が発生する信号について説明する。初期学習の時間はセンター呼出し中であることから、学習信号発生部４３は、学習信号として、断続する呼出し音を発生する。一般の電話通信で用いられる呼出し音は、４００Ｈｚのトーン信号を１６Ｈｚで振幅変調した信号であるが、このような周波数帯域の狭い信号は学習信号には適していない。そこで、チャープ信号を断続的に出力し、これを呼出し音とする。チャープ信号とは、周波数が時間とともに増加または下降する信号である。ある時間ｔ（０≦ｔ≦Ｔ）におけるチャープ信号をＣＨ（ｔ）とし、この信号が時間０からＴの間に、周波数Ｆ０からＦ１まで増加するものである場合、下式のように表すことができる。

上式において、Ａはチャープ信号の最大振幅である。チャープ信号は、虫や鳥の鳴き声（ｃｈｉｒｐ）に似た音であることから白色雑音のように耳障りでない。また断続音とすることで呼出し音として自然に感じられるため、エレベータ搭乗者に違和感を与えることがない。更に、広い周波数帯域を持つため適応フィルタ４５１の学習にも適している。

以上のように、本発明によれば、学習契機判定部４１が、センターの呼出しが開始されてから一定時間と、呼出し開始から通話確立までの時間のうち、何れか長い方を初期学習可能と判断する。また、学習信号発生部４３は周波数帯域が広く断続する呼出し音を学習信号として発生する。この構成を用いることにより、ユーザに違和感を与えることなく自動的に適切な時間帯で初期学習を行うことが可能な音声通話装置を得ることができる。

また、実施の形態５において、センターの呼出しが開始されるのはエレベータ１内に人がいるときである。すなわち、実施の形態５に係る音声通話装置４では、エレベータ１内に人がいるときに、前記学習信号発生部はチャープ信号を前記学習信号として用いることを特徴とする。この構成によって、エレベータの閉じ込めなどが発生して通話が行われる直前にユーザの存在する環境で初期学習を行う場合でも、ユーザにとって耳障りでない環境を維持しつつ、初期学習を行うことができる。その結果、ユーザにとって、違和感を与えることなく、良好な通話環境を実現することができる。

実施の形態６．
実施の形態１～５では、エコー経路のインパルス応答推定値を初期学習で学習するパラメータとしたのに対し、本実施の形態では、エコー経路のインパルス応答推定値以外のパラメータを初期学習で学習するパラメータとする構成を示す。

図１１は、本実施の形態による信号処理部４５の内部構成図であり、図において、４５５は減算器４５２の前後の信号に与えるゲインまたはロスを算出するゲイン／ロス算出部、４５６及び４５７は信号にゲインまたはロスを与えるゲイン／ロス挿入部である。

図において、適応動作可否判定部４５３と残留エコー抑圧部４５４の動作は、図７に示した信号処理部４５と同様である。適応フィルタ４５１の動作については、学習契機判定部４１が初期学習可能と判定した初期学習中の動作のみが図７に示した信号処理部４５と異なる。適応フィルタ４５１は、学習開始のタイミングから一定時間経過後、例えば１秒後にエコー経路のインパルス応答推定値を初期化(全て“０”)し、その後学習時間完了まで、通話時と同様な処理を行う。初期学習時間が完了すると、その完了のタイミングにおいて、初期学習時間中に推定したエコー経路のインパルス応答推定値をパラメータ保持部４８に出力し、これを格納させる。

そして、学習契機判定部４１が初期学習可能と判定したタイミングから適応フィルタ４５１が学習を開始するまでの間は、ゲイン／ロス算出部４５５がゲイン／ロスの学習を行う。この間、ゲイン／ロス算出部４５５は、インターホン２に出力される信号レベルＬ１とインターホン２から入力される信号レベルＬ２とを算出し、適応フィルタ４５１が学習を開始するタイミングで、ゲイン／ロス挿入部４５６に与えるゲイン／ロス値としてα×Ｌ２／Ｌ１を、ゲイン／ロス挿入部４５７にはその逆数であるＬ１／（α×Ｌ２）を与えると共に、ゲイン／ロス挿入部４５６用のゲイン／ロス値であるα×Ｌ２／Ｌ１とその逆数でありゲイン／ロス挿入部４５７用のゲイン／ロス値であるＬ１／（α×Ｌ２）とをパラメータ保持部４８に出力して格納させる。ここで、αは安全係数であり、１以下の固定値を用いる。また、ゲイン／ロス算出部４５５は、通話制御部４２からの情報により通話開始のタイミングを知り、この通話開始のタイミングでパラメータ保持部４８からゲイン／ロス挿入部４５６用のゲイン／ロス値とゲイン／ロス挿入部４５７用のゲイン／ロス値を取り出し、それぞれゲイン／ロス挿入部４５６及びゲイン／ロス挿入部４５７に設定する。

ゲイン／ロス挿入部４５６及びゲイン／ロス挿入部４５７は通話時、初期学習時ともに同じ動作を行い、ゲイン／ロス算出部４５５から設定されたゲイン／ロス値を、入力信号に対して乗算して出力する。

上記のようなゲイン／ロスの挿入は、適応フィルタ４５１を固定小数点演算で実現する場合に以下のような効果がある。エコー経路のインパルス応答は、エコー経路のゲインが大きいと大きな値となり、逆に、エコー経路のゲインが小さいと小さな値となる。従って、上記のようなゲイン／ロスの挿入を行わない場合、適応フィルタ４５１内のエコー経路インパルス応答推定値Ｈ０、Ｈ１、・・・、Ｈｎ－１が固定小数点数であれば、数値のオーバーフローを防止するため想定される最大のエコー経路ゲインに応じて、予め小数点位置を定めておくことになる。このような方法を取ると、エコー経路のゲインが小さい場合には固定小数点数であるＨ０、Ｈ１、・・・、Ｈｎ－１の上位側のビットが余って有効ビット数が減ることになり、エコー経路インパルス応答の推定精度が低くなる。上記のようなゲイン／ロスの挿入を行うと、ゲイン／ロス挿入部４５６で挿入されるゲイン／ロスによって適応フィルタ４５１から見たエコー経路のゲインが常に同様になり、Ｈ０、Ｈ１、・・・、Ｈｎ－１の有効ビット減少を防止することが可能となる。また、ゲイン／ロス挿入部４５７では、ゲイン／ロス挿入部４５６で挿入するゲイン／ロスの逆数を乗算するため、その他の処理に影響を与えないことになる。

なお、図１１に示す構成に変わり、ゲイン／ロス挿入部４５６とゲイン／ロス挿入部４５７によるゲイン／ロスの挿入位置を図１２のようにしても全く同様な効果がある。

以上のように、本発明によれば、ゲイン／ロス算出部４５５がエコー経路のゲインに応じたゲイン／ロス値を求め、適応フィルタ４５１の入力、出力信号に求めたゲイン／ロス値とその逆数を乗算する。この構成によって、適応フィルタ４５１によるエコー経路インパルス応答の推定精度を高く保つことができる音声通話装置を得ることができる。

すなわち、実施の形態６に係る音声通話装置４では、パラメータ保持部４８で保持されるパラメータは学習信号が音声通話装置４から送信される時点から音声通話装置４で受信される時点までに学習信号が通る経路のゲインであることを特徴とする。この構成によって、適応フィルタ４５１によるエコー経路インパルス応答の推定精度を高く保つことができる音声通話装置を得ることができる。

なお、実施の形態１～６では初期学習を扱ったが、初期学習は通話に先立って行われる学習を意味するものである。従って、初期学習を１回だけ行ってもよいし、初期学習を数回行っても構わない。

１：エレベータ、２：インターホン、３：エレベータ運転制御部、４：音声通話装置、５：通信ネットワーク、６：監視センター、７：電話端末、２１：スピーカ、２２：マイクロフォン、２３：非常通話ボタン、４１：学習契機判定部、４２：通話制御部、４３：学習信号発生部、４４：スイッチ、４５：信号処理部、４６：Ｄ／Ａ変換器、４７：Ａ／Ｄ変換器、４８：パラメータ保持部、４９：通信回線インターフェース、４０１：プロセッサ、４０２：メモリ、４０３：Ａ／Ｄ、Ｄ／Ａ変換ＬＳＩ、４０４：スイッチ開閉検出ＬＳＩ、４０５：ネットワークインターフェースＡ、４０６：ネットワークインターフェースＢ、４０７：デジタル信号処理プロセッサ、４５１：適応フィルタ、４５２：減算器、４５３：適応動作可否判定部、４５４：残留エコー抑圧部、４５５：ゲイン／ロス算出部、４５６、４５７：ゲイン／ロス挿入部

Claims

　信号のエコーの経路に依存するパラメータを保持するパラメータ保持部と、
前記パラメータを用いて音声通話時の音声信号を処理する信号処理部と、
自装置が設置されたエレベータ内の環境に応じて、前記音声通話に先立って前記パラメータの学習を行うことが可能か否かを判定する学習契機判定部と、
前記学習契機判定部で学習を行うことが可能と判定されたとき、前記パラメータの学習を行う学習信号を発生する学習信号発生部と、
を備えたことを特徴とするエレベータ用の音声通話装置。
　前記学習契機判定部は、前記エレベータ内に人がいないときに、前記パラメータの学習を行うことが可能と判定すること
を特徴とする請求項１に記載の音声通話装置。
　前記学習契機判定部は、
前記エレベータが停止中であり、
前記エレベータのドアが閉まった状態であり、
前記エレベータ内のボタンが押下されてから所定の時間が経過したとき、
前記エレベータ内の環境が前記パラメータの学習が可能と判定することを特徴とする請求項１または請求項２に記載の音声通話装置。
　前記学習契機判定部は、
前記エレベータが停止中であり、
前記エレベータのドアが閉まった状態であり、
前記エレベータ内の重量が所定値以下であるとき、
前記エレベータ内の環境が前記パラメータの学習が可能と判定することを特徴とする請求項１または請求項２に記載の音声通話装置。
　前記学習契機判定部は、
前記エレベータが停止中であり、
前記エレベータのドアが閉まった状態であり、
前記エレベータ内に設置されたカメラの画像が無人であるとき、
前記エレベータ内の環境が前記パラメータの学習が可能と判定することを特徴とする請求項１または請求項２に記載の音声通話装置。
前記パラメータは前記学習信号が前記音声通話装置から送信される時点から前記音声通話装置で受信される時点までに前記学習信号が通る経路のインパルス応答の値である
ことを特徴とする請求項１乃至５のいずれか１項に記載の音声通話装置。
前記パラメータは、前記インパルス応答の値の中で遅延時間の短い一部のインパルス応答の値であることを特徴とする請求項６に記載の音声通話装置。
前記パラメータは前記学習信号が前記音声通話装置から送信される時点から前記音声通話装置で受信される時点までに前記学習信号が通る経路のゲインである
ことを特徴とする請求項１乃至５のいずれか１項に記載の音声通話装置。
前記エレベータ内に人がいるときに、前記学習信号発生部はチャープ信号を前記学習信号として用いる
ことを特徴とする請求項１に記載の音声通話装置。