JP4317222B2 - ネットワークにおける通信リンクの送話品質の測定 - Google Patents

ネットワークにおける通信リンクの送話品質の測定 Download PDF

Info

Publication number
JP4317222B2
JP4317222B2 JP2006524298A JP2006524298A JP4317222B2 JP 4317222 B2 JP4317222 B2 JP 4317222B2 JP 2006524298 A JP2006524298 A JP 2006524298A JP 2006524298 A JP2006524298 A JP 2006524298A JP 4317222 B2 JP4317222 B2 JP 4317222B2
Authority
JP
Japan
Prior art keywords
signal
noise
quality
return
measuring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006524298A
Other languages
English (en)
Other versions
JP2007504687A (ja
Inventor
ヴァン・ヴグト,イェロエン・マルティン
Original Assignee
コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ filed Critical コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ
Publication of JP2007504687A publication Critical patent/JP2007504687A/ja
Application granted granted Critical
Publication of JP4317222B2 publication Critical patent/JP4317222B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/002Applications of echo suppressors or cancellers in telephonic connections

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Telephonic Communication Services (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

発明の分野
本発明は、電気通信システムにおける通信リンクの送話品質を測定する領域に関し、より詳細には、特に(送話者)エコーおよび(バックグラウンド)雑音切替えの存在から生じる影響をモデル化することに関する。電気通信システムは、例えば、IPネットワークを使用して2者間の通信リンクを提供する、(移動)電話通信システムやヴォイス・オーバー・インターネットプロトコル(VoIP)システムとすることができる。
従来技術
そのような方法およびシステムは、参照により本明細書に組み込まれる、本出願と同じ出願人の欧州特許出願公開第206104号明細書から知られる。この方法は、すでに、送話品質を測定する標準ITU−T手順として提唱されており、知覚的エコーおよび側音品質尺度(PESQM)と呼ばれる。
この公知の方法およびシステムは、ある一定の状況において、特に、戻り信号で最小雑音レベルが過度に低いレベルで推定されたときに、この方法が誤った出力を生じるという欠点を有する。これは、例えば、音声活動化検出が戻り信号における雑音低下を引き起こし得る、ヴォイス・オーバーIPシステムにおいて発生し得る。過度に低い推定バックグラウンド雑音レベルの結果として、基準音声信号と戻り音声信号の間の差が大きくなり、したがって、低い品質指標が出力される。
発明の概要
本発明は、バックグラウンド雑音レベルの変動がある状況において妥当且つしっかりとした送話品質指標を提供する、改善された品質測定システムおよび方法(知覚的エコーおよび側音品質測定、PESQMともいう)を提供しようとするものである。
本発明の第1の態様によれば、電気通信システムにおける通信リンクの送話品質を測定する方法であって、基準音声信号s(t)に対する劣化音声信号s’(t)を、音声信号の知覚的品質を測定して送話品質劣化に関する推定値を表す品質信号qを生成する客観的測定技法(32)で処理する主要ステップを含む方法において、
劣化音声信号は戻り信号r(t)を含み、
客観的測定技法は、劣化音声信号s’(t)の局所的最小値を求めることによる閾値雑音レベルの決定を含む、戻り信号に存在する雑音の結果としてのマスキング効果をモデル化するステップを含む方法が提供される。
欧州特許出願公開第206104号明細書に記載されている公知のPESQM方法では、雑音レベルは、ネットワークを介して供給される音声サンプル全体にわたって取られる、大域的最小値として推定される。戻り信号の局所的最小値を求めることによって、バックグラウンド雑音レベルが変化する場合に妥当で堅固な送話品質指標を獲得することも可能である。
本発明の方法の第1の実施形態において、基準音声信号s(t)は無音期間を含み、閾値雑音レベルは、基準音声信号s(t)中の無音期間に対応する劣化音声信号s’(t)の部分において決定される。音声信号中の無音期間の間、ネットワーク特性は変化せず、戻り信号は、どんなエコー信号も抑制されたバックグラウンド雑音レベルも含まず、信頼性の高い閾値雑音レベルが決定され得る。無音期間は、例えば、基準音声信号s(t)の開始時に、少なくとも0.5秒間、より好ましくは少なくとも0.9秒間として設けられ得る。このように、無音期間の前の音声活動によって生じる劣化音声信号s’(t)には、エコーもバックグラウンド雑音切替えも存在しないことが確実である。
別の実施形態において、閾値雑音レベルは、劣化音声信号s’(t)の連続する部分の局所的最小値として推定される。次いで、送話品質指標が、各連続部分における推定閾値雑音レベルを使用して確実に決定され得る。これは、戻り信号の雑音フロアに動的に従うことを可能にし、このことは戻り信号における(徐々に)変化する雑音フロアに対して送話品質指標をより堅固にする。
別の実施形態において、閾値雑音レベルは、事前定義された値域における劣化音声信号s’(t)の局所的最小値として推定される。戻り信号には、基準音声信号(側音)または基準音声信号からのエコー(エコー)に起因する信号中の正のピークが存在する。また、バックグラウンド雑音切替えなどによる、より低い雑音レベルへの偏移も存在し得る。値が2つの境界値の間にある戻り信号の部分における最小値を求めるだけで、真の雑音レベルを決定することができ、結果として信頼性の高い送話品質指標が生じる。
別の実施形態において、主要ステップは、劣化音声信号s’(t)を処理し、第1の表示信号R’(t,f)を生成する第1の処理ステップと、基準音声信号s(t)を処理し、第2の表示信号R(t,f)を生成する第2の処理ステップと、差分信号D(t,f)を生成するために第1の表示信号を第2の表示信号から減じるステップと、戻り信号に存在する雑音のラウドネスの推定値Neを生成する第1のサブステップと、修正差分信号D’(t,f)を生成するために前記生成された推定値Neを使用して差分信号に対して実行される雑音抑制の第2のサブステップと、品質信号qを生成するために周波数および時間に関して修正差分信号D’(t,f)を統合するステップとを含む。この実施形態は、時間および周波数領域におけるいくつかの変換によって送話品質指標を求める計算方法の効率的実施を可能にする。
別の態様において、本発明は、通信ネットワークにおける通信リンクの送話品質を測定する装置に関連し、この装置は、基準音声信号s(t)に対する劣化音声信号s’(t)を、音声信号の知覚的品質を測定して送話品質劣化に関する推定値を表す品質信号(q)を生成する客観的測定技法で処理するように構成される、通信リンクに接続された測定手段を備え、劣化音声信号は戻り信号r(t)を含み、測定手段は、劣化音声信号s’(t)の局所的最小値を求めることによる閾値雑音レベルの決定を含み、戻り信号に存在する雑音の結果としてのマスキング効果をモデル化することによる客観的測定技法を実行するように構成される。本発明の装置の別の実施形態は従属請求項に記載されており、本発明の装置は、本発明の方法に関連して前述した利点を提供する。
以下で、添付の図面を参照し、いくつかの例示的実施形態を使用して、本発明をより詳細に論じる。
例としての実施の形態の詳細な説明
遅延およびエコーは、電話技術サービスの品質においてますます大きな役割を果たす。というのは、GSM、UMTS、DECT、IPおよびATMのような現在の無線および/またはパケットベースのネットワーク技法は、本質的に、SDHやPDHのような旧来の回線交換網よりも多くの遅延を導入するからである。遅延およびエコーは、側音と共に、送話者が電話リンクにおける自分自身の音声をどのように知覚するか決定する。送話者が自分自身の音声を知覚する品質は送話品質と定義される。送話品質は、受話者が他の音声(および音楽)をどのように知覚するかを扱う受話品質と区別される必要がある。送話品質および受話品質は、対話品質と共に、電話リンクの通話品質を決定する。対話品質は、通話において相手と対話する容易さとして定義され、システムにおける遅延およびダブルトーク状態への対処方法によって決定付けられる。本発明は、通信(電話)リンクの送話品質の客観的測定に関し、より詳細には、その中の雑音の影響の評価に関するものである。
図1に、電気通信ネットワーク10のA加入者とB加入者の間で確立された通常の電話リンクの一例を概略的に示す。A加入者およびB加入者の電話機11および12は、それぞれ、2線式接続13、14および4線式インターフェース、すなわち、ハイブリッド15、16によって、ネットワーク10に接続される。ネットワークを介して、確立された電話リンクは、A加入者からの音声信号がそれを介して伝えられる、2線式部分、すなわち2線式接続13、14、および4線式送信部分17を含む順方向チャネルと、B加入者からの音声信号がそれを介して伝えられる2線式部分、すなわち2線式接続14、13、および4線式受信部分18を含む戻りチャネルを備える。A加入者の電話機11のマイクロホンMに入ってくる音声信号sは、電話リンクの順方向チャネル(13、17、14)を経由して、電話機12の受話器Rに渡され、そこでB加入者にとって、ネットワークによって影響を受けた音声信号s”として聞こえるようになる。順方向チャネル上の各音声信号s(t)は、一般に、特に前記ハイブリッドの存在のために電話リンクの戻りチャネル(18、13)上に電気的な種類のエコー信号を含む戻り信号r(t)を生じさせ、これが電話機11の受話器Rに渡され、したがって、そこでA加入者の妨げになり得る。さらに、受話器またはスピーカ信号のB加入者の電話機のマイクロホンへの音響的、かつ/または機械的結合は、A加入者の電話機に戻る音響的な種類のエコー信号を生じさせることがあり、それが戻り信号の一因になる。(GSMシステムやヴォイス・オーバーIPシステムの場合など)エンドツーエンドディジタル電話リンクにおいては、そのような音響エコー信号が、戻り信号の一因になる唯一の種類のエコー信号である。
要約すると、戻り信号r(t)には、電話リンクの順方向チャネル中の音声信号s(t)によって引き起こされる、電話リンクの戻りチャネルでの様々な段階における、
音響エコーを表す信号r1、
おそらく音響エコーと組み合わさった電気エコーを表す信号r2、
ネットワーク10によって影響を受けた、すなわち遅延し、または歪んだ信号r2を表す信号r3、
側音信号と組み合わさった信号r3を表す信号r4、および
局所的に生成された側音も含む、信号r4から導出される音響信号である信号r5
が含まれ得る。
上記の図1の一般的なシステムの説明は、特に、有線通信リンクを使用する従来方式の電話システムを対象とするものである。しかしながら、本発明は、ネットワーク10がRFリンクを含む移動電話技術システムにも、ネットワーク10がインターネットプロトコルリンクを有するコンピュータネットワークを含むヴォイス・オーバーIP(VoIP)ネットワークにも等しく適用可能である。
図2に、PCT/EP00/08884号に記載されている、音声信号の知覚的品質を測定する公知の客観的測定技法を使用して通信リンクの送話品質を測定するための構成を概略的に示す。この構成は、以後、簡潔にするためにネットワーク20と呼ぶ、試験用システムまたは電気通信ネットワーク20と、以後、簡潔にするためにすぎないが、品質測定システム22と呼ぶ、提供される音声信号の知覚的分析のためのシステム22を備える。任意の送話者の音声信号s(t)が、一方では、ネットワーク20の入力信号として、他方では、品質測定システム22の第1の入力(または基準)信号として使用される。入力送話者音声信号s(t)に対応する、ネットワーク20から得られる戻り信号r(t)は、組合せ回路24において、送話者音声信号s(t)と組み合わされて組合せ音声信号s’(t)を提供し、それが、品質測定システムの第2の入力(または劣化)信号として使用される。電気的測定の場合には、r4が測定される。次いで、r(t)およびs(t)が(24によって)組み合わされて、その局所的側音が評価されるs’(t)になる。音響的測定の場合には、r5が測定され、やはり局所的側音が測定される。この場合、s’(t)=r(t)である。必要ならば、信号s(t)は、組合せ回路において戻り信号r(t)と組み合わされる前に、正しいレベルにスケーリングされる。品質測定システム22の出力信号qは、送話品質、すなわち、電話ユーザによってユーザ自身の電話機で送話中に体験される、ネットワーク20を介した電話リンクの知覚的品質の推定値を表す。ここでは、データベース上に格納されている信号が利用され得る。これらの信号は、シミュレーションによって、またはB加入者と音声無音時にリンクが確立された場合にA加入者の電話機から(例えば、電気領域における信号r4または音響領域における信号r5)獲得し、または獲得しておくことができる。電話加入者アクセスポイントとネットワークへの4線インターフェースとの間の2線接続は、戻り信号r(t)中のエコー成分の一因にはならず、または、ほとんどならない(当然ながら、それは、電話リンクのB加入者の戻りチャネルにおいて発生する戻り信号中のエコー成分の一因になる)。しかしながら、任意のそのような信号の影響は短い遅延を有し、事実上、側音の一部を形成する。
また、信号s(t)およびr(t)は、それぞれ4線インターフェース15に近い、順方向チャネルの4線部分17および戻りチャネルの4線部分18から取り出されてもよい。これは、すでに参照文献[1]に記載されているように、ライブトラフィックを邪魔にならないように使用して、確立された電話リンクの場合に、送話品質の永続的測定の機会を提供する。
また、試験用システムまたはネットワークは、当然ながら、電気通信ネットワークをシミュレートするシミュレーションシステムとすることができる。
図3に、可聴信号の知覚的品質を客観的に測定する品質測定システム22の一実施形態を概略的に示す。品質測定システム22は、信号プロセッサ31および組合せ構成32を備える。信号プロセッサは、信号入力33、34、および組合せ構成32の対応する信号入力に結合された信号出力35、36を備える。組合せ構成32の信号出力37は、同時に、品質測定システム22の信号出力でもある。信号プロセッサは、それぞれ信号入力33および34に結合され、入力信号s(t)およびs’(t)を処理し、人間の聴覚系の知覚モデルに従って、それぞれ、入力信号s(t)およびs’(t)の時間/周波数表現を形成する表示信号R(t,f)およびR’(t,f)を生成する、知覚モデル化手段38および39を含む。表示信号は、時間および周波数の関数である(Hz尺度またはバーク尺度)。信号処理は、通常どおり、フレームごとに行われる。すなわち、音声信号が人間の耳のウィンドウにほぼ等しいフレーム(10から100ミリ秒の間)に分割され、フレームごとのラウドネスが知覚モデルに基づいて計算される。簡単にするためにすぎないが、このフレームごとの処理は図には示さない。
表示信号R(t,f)およびR’(t,f)は、信号出力35、36を介して組合せ構成32に渡される。公知のPESQM様のアルゴリズム(欧州特許出願公開第206104号明細書参照)の組合せ構成においては、最初に、表示信号の差分信号D(t,f)が求められ、その後に、差分信号に対して様々な処理ステップが実行される。様々な処理ステップの最後のステップは、信号出力37において利用可能な品質信号qを生じることになる、周波数および時間にわたる統合ステップを意味する。
送話品質を正確に測定するために、戻り信号に存在する雑音が知覚されるエコー障害に対して及ぼし得るマスキング効果をモデル化するステップが導入される。そのようなモデル化ステップは、戻り信号r(t)に存在するエコー成分および雑音成分の可能な分離に基づくものとすることができる。しかしながら、異なる、より簡単なやり方で信頼性の高いモデル化に到達することもできる。このモデル化ステップは、雑音の推定値を使用することにより差分信号に対して実行される特定の雑音抑制ステップを意味する。したがって、組合せ構成32は、
第1の部分32aにおける、信号プロセッサ31から受け取られる2つの表示信号R(t,f)とR’(t,f)との知覚的減算を行って差分信号D(t,f)を生成する減算手段40と、
第2の部分32bにおける、入力信号s’(t)に存在する雑音の推定雑音値Neを生成する雑音推定手段41と、差分信号D(t,f)および推定雑音値Neから、修正差分信号D’(t,f)を導出する雑音抑制手段42と、
第3の部分32cにおける、周波数および時間に対して修正差分信号D’(t,f)を連続的に統合し、品質信号qを生成する統合手段43と
を備える。
欧州特許出願公開第206104号明細書による公知の送話品質決定方法およびシステムでは、推定雑音値Neは、例えば、電話リンクの種類などから導出される所定値とすることができ、あるいは、好ましくは、図3に信号出力36と雑音推定手段41の信号入力44の間の破線で描かれている、表示信号の1つ、すなわちR’(t,f)から獲得される。表示信号R(t,f)およびR’(t,f)は、通常どおり、それぞれ、基準音声信号s(t)および劣化音声信号s’(t)のラウドネス密度関数である。減算手段40の出力信号、すなわちD(t,f)は、好ましくは、小規模の知覚的修正、すなわち、いわゆる内部雑音のための小規模の密度修正によって低減された、劣化した(すなわち、戻り信号におけるエコー、側音および雑音信号の存在によって歪んだ)信号と基準信号(すなわち、元の送話者音声信号)のラウドネス密度の間の符号付きの差分を表す。
結果として生じる、実際にはラウドネス密度関数である差分信号D(t,f)が、バックグラウンドマスキング雑音推定で処理される。この背後にある主要な考え方は、通話中の送話者は常にその音声中に無音間隔を有するため、(当然ながらエコー遅延時間後の)そのような間隔の間、ある期間にわたる劣化信号の最小のラウドネスは、ほぼ完全に、バックグラウンド雑音によって生じるというものである。一般に、送話品質は音声サンプルを使用して決定される。音声サンプル処理はフレーム単位で実行されるため、この最小値は、完全な音声サンプルに対応する表示信号R’(t,f)のフレームで見出される最小ラウドネス密度Neに等しくすることができる。その場合、この最小値Neは、この閾値を下回るラウドネスを有する差分信号D(t,f)のすべてのフレームの内容をゼロに設定し、その他のフレームの内容を不変のままとするための閾値T(Ne)を定義するのに使用され得る。ゼロに設定されるフレームおよび不変のフレームは、共に、修正差分信号D’(t,f)、すなわち雑音抑制手段42の出力信号がそこから導出される信号を構成する(以下を参照)。
公知のPESQM方法の有利な実施形態では、戻り信号中の小変動による最終的な送話品質測定への影響を打ち消すために、小さいデルタ値が決定どおりに閾値T(Ne)に加算される。
欧州特許出願公開第206104号明細書による公知の方法およびシステムでは、雑音レベルは、送話品質を決定するのに使用される音声サンプルに対応する戻りの歪み音声信号R’(t,f)全部を使用して推定される。これは、(入力信号s(t)に対応する)入力音声信号4、(戻り信号r(t)に対応し、歪み信号およびエコー信号を含む)戻り信号3、(音声サンプル全体にわたる戻り信号における決定された最小雑音レベルに対応する)推定雑音閾値2の時間におけるラウンドネス表現を示す、図4のグラフに描かれている。そこで、送話品質は、図4のグラフに斜線領域で描かれている、前述の修正差分信号D’(t,f)を使用して測定される。
しかしながら、音声サンプルを使用した送話品質の測定時に、通信システムにおいてバックグラウンド雑音レベルに影響を及ぼす変化が発生した場合、公知のPESQM方法はすべて失敗することがある。これは図5に示すグラフに描かれている。送話品質測定時に、戻り信号3の雑音レベルが、例えばバックグラウンド雑音切替えなどのために、より低いレベルになったとき、公知のPESQM方法は、閾値雑音レベルT(Ne)を音声サンプル全体の間に得られた最小レベルに設定する。しかしながら、これは、図5の斜線領域によって示すような修正差分信号D’(t,f)を使用した送話品質測定をもたらし、誤った送話品質測定を生じることになる。
バックグラウンド雑音切替えは、例えば、音声活動化検出を使用するVoIP電話技術システムなどにおいて、いくつかの状況によって生じ得る。A側とB側の間で通話が行われるとき、いくつかの状況が区別され得る。
0.Aが無音であり、Bが無音である
1.Aが話し、Bが無音である
2.Aが話し、Bが話している
3.Aが無音であり、Bが雑音を送る(Bは、街頭雑音、機械雑音、混信雑音など、環境雑音を伴う場所にいる)
4.Aが話し、Bが雑音を送る
事例0では、両側が無音である。この場合には、無音(雑音なし)、または電話接続から生じる雑音だけがAまたはBに聞こえる。
事例1をシングルトーク状況という。Bは受話品質を体験し、Aは送話品質を体験する。Aから入ってくる音声はB側において(音響的または電気的に)、あるいは両者の間のネットワークにおいて(電気的に)反射され得る。この反射によりAに自分自身の音声が聞こえることがある。これが、約20ミリ秒を下回る低い遅延で発生するとき、これは、Aによって、電話接続の望ましい特徴である直接の側音として体験される(側音がない場合、回線は活動していないと思われる)。Aの音声の反射が20ミリ秒を上回る遅延で到着するとき、Aはこれが、送話者Aにとって妨げになる自分自身の音声の別個のエコーであると気付き始める。このエコーは、エコーの遅延またはレベルがますます大きくなるにつれて一層邪魔になる。
エコー制御(EC)とは、エコーの消去または抑制である。エコー消去器は、Aから入ってくる音声を使用してエコーの予測を行い、これをBからAへの信号から減じる。そこで、エコーが消去される。エコー抑制器は、Aが送話中に、BからAへの音声を消去または抑制する。そこで、BからAへのエコーが抑制される。
事例2をダブルトークという。この場合、両側が送話しており、両方向にエコーおよび雑音を生じる。このマスキングは、可能なエコー問題を低減する。PESQMはダブルトーク状況のために作り出されたものではなかった。
事例3では、雑音がBからAに送られる。これは、AにBの環境に関する情報をもたらし、接続が依然としてオープンであることを指示する。雑音抑制は雑音レベルを低減させ得る。
事例4では、Aが話し始めたために、状況が事例3から変化する。ECおよび雑音抑制器がないと、Aには、Bから入ってくる雑音に加えて、自分自身の音声のエコーが聞こえる。雑音はエコーをマスキングするが、エコーレベルがバックグラウンド雑音レベルより高い場合には、やはりAにとって妨げになる。ECを伴う場合、Aによって知覚されるエコーは低減され得るが、ECはBからAへの雑音にも影響を及ぼし得る。特に、エコー抑制器は、(事例4で)抑制を始めるときに雑音レベルを低減することができる。事例4から事例3に進むと、抑制器は抑制を停止し、それがAによって知覚される雑音の瞬間的上昇をもたらす。この雑音レベルの変化をバックグラウンド雑音切替えといい、Aにとっての妨げとなる。また、雑音抑制器は、バックグラウンド雑音切替えも引き起こし得る。バックグラウンド雑音切替えを防ぐために、ECおよび雑音抑制器は、実際の雑音に匹敵する雑音信号を作成し、実際の雑音が抑制されるときに、これをAに向かう信号に加えることができる。これをコンフォートノイズ挿入という。コンフォートノイズ挿入が使用されず、または十分でないときには、バックグラウンド雑音切替えが残存する。
事例4から事例3に進むと、バックグラウンド雑音切替えは、ECが十分に速く応答しないために、即座にではなく、Aが話し止めてから短時間の後(数ミリ秒後)に発生し得る。この場合、エコーおよび雑音の抑制は、事例3の最初の数ミリ秒の間の雑音抑制をもたらす。図5の曲線3に比べて図4の曲線3を参照されたい。図5のバックグラウンド雑音レベルの低下は、簡潔に雑音低下と呼ばれ、全体のバックグランド雑音レベルの推定値が最小レベルに基づくものである場合には、誤った推定値をもたらす。
エコーは、(例えば、モバイルネットワーク、VoIP、長距離通話など)高い遅延を伴う、または(例えば、アナログ電話機での4/2線ハイブリッドにおける電気的な、あるいは(車内、コンピュータスピーカによる)ハンズフリー電話機による、または音響的に不良な設計の(モバイル)電話機による音響的な)高レベルの反射を伴うネットワークに関連する。
図6に、本発明の第1の実施形態の結果を示す。この実施形態で、音声サンプルは、開始時において、例えば0.9秒の無音期間を含む。閾値雑音値は、公知のPESQM方法の場合と同じ種類の処理を使用して求められるが、音声サンプルの無音期間に対応する戻り信号3についてだけである。音声サンプルの無音期間の間、通信ネットワークは、まだ、バックグラウンド雑音切替えを生じにくく、ゆえに、送話品質測定の信頼性の高い決定につながる。送話品質測定を決定するのに使用される音声サンプルは、別の例では、無音期間およびいくつか、例えば5つの実際の音声サンプルを含み得る。次いで、音声サンプルの無音期間に対応する間隔の間の戻り信号3だけから閾値が求められ、全ての音声サンプルに対する送話品質測定で使用される。また、PESQM方法は、記憶された音声サンプルを処理するのに適するため、無音期間に対応する戻り信号部分を5つの音声サンプルのそれぞれに加え、すべてが無音期間を含む音声サンプルの組合せのそれぞれについて送話品質を決定することも可能である。
図7に、本発明の別の実施形態の結果を示す。一般に、送話品質測定は、例えば32ミリ秒のフレームにおける関連するパラメータおよび信号を計算することによって実施される。この別の実施形態では、閾値雑音レベルT(Ne)は、少数の連続するフレームでの局所的最小レベルに従って変動する閾値として求められる。バックグラウンド雑音切替えの場合、図7に、第1の音声発声直後に発生するものとして示すように、閾値雑音レベルは戻り信号3に動的に従う。バックグラウンド雑音が低下を示すとき、閾値雑音レベルT(Ne)はいくつかのフレームにわたって低下し、次いで、戻り信号にエコー信号が存在するときに上昇する。また、戻り信号は、バックグラウンド雑音低下の期間にはるかに低いラウドネス・レベルを示すため、結果として生じる修正差分信号D’(t,f)には誤りがない。
本発明のさらに別の実施形態では、閾値雑音レベルは、確率的特性を使用して戻り信号3から決定される。戻り信号3の公知の一特性は、それが、やがて、音声サンプル中の音声発声に対応するいくつかのピーク((歪んだ)側音およびエコー)を示すことである。おそらく、戻り信号は、例えば、バックグラウンド雑音切替えによる、いくつかの一時的な低い値を示すことになる。しかしながら、大部分について、戻り信号は雑音レベルを表す。使用される確率的特性は、例えば、戻り信号の中央値を計算し、この中央値を閾値雑音レベルT(Ne)として使用するものとすることができる。また、戻り信号3値が(戻り信号3中の実際の音声信号、およびバックグラウンド雑音切替えによる偽りの低レベル値も除く)所定の範囲内にある(例えば32ミリ秒フレームなどの)戻り信号部分のみについて、戻り信号3の最小値を求めることも可能である。この実施形態の結果は、図6に示す実施形態の結果と実質上等しくなる。
送話品質の測定では、表示信号R’(t,f)が、送話者音声信号と戻り信号の信号組合せの表現であることが必要である。しかしながら、これを実現するのに、劣化信号s’(t)が、図2(信号組み合わせ回路24)および図3(s’(t)=s(t)+r(t))に示すようにこれら2つの信号の信号組合せである必要はない。また、戻り信号(r(t))を劣化信号(s’(t))として使用し、知覚モデル化手段38によって実行される、基準信号を処理する中間段における中間信号を獲得し、次いで、それを、知覚モデル化手段39によって実行される、劣化信号を処理する対応する中間段で獲得される対応する中間信号(Ps’(f))と組み合わせることも可能である。好ましくは、中間信号は、基準音声信号(s(t))の高速フーリエ変換パワー表現(Ps(f))である。この修正の概略を図8により詳細に示す。知覚モデル化手段38および39は、それぞれボックス51および52で示す、通常どおりの第1の処理段(ITU−T勧告P.861:電話帯域(330−3400Hz)音声コードの客観的品質測定、August 1996年8月参照)において、ハニング窓(HW)を求めるステップに続いて、高速フーリエ変換(FFT)パワー表現を求めるステップを実行して、送話者音声信号s(t)と、戻り信号r(t)に等しい劣化信号s’(t)とのそれぞれのFTTパワー表現である中間信号Ps(f)およびPr(f)を生成する。それぞれボックス53および54で示す第2の処理段では、スケール調整のための周波数ワーピング(FW)ステップが実行された後に、周波数スミアリング(FS)ステップおよび強さワーピングステップが実行され、表示信号R(t,f)およびR’(t,f)が生成される。ボックス52および54で示す第1段と第2段の間には、信号加算器55で示す中間信号Ps(f)およびPr(f)の中間信号加算が実行され、加算された中間信号の和が第2の処理段(ボックス54)の入力になる。中間信号加算が適用される前に、中間信号P(s(f))は、通常どおりの正しいレベルにスケーリングされる必要がある。
したがって、外部加算(s’(t)=s(t)+r(t))ではなく、知覚モデル化手段内部のそのような中間信号加算(Ps(f)+Pf(f))を使用する場合、組合せ回路24は不要になる。図8を参照して説明した変更を含んでいる、図3を参照して説明した装置が、電話リンクにおいて、PCT/欧州特許第00/08884号にすでに記載されているやり方で使用される場合、装置の入力ポート33および34は、それぞれ、電話リンクの順方向および戻りチャネルの4線部分17および18に直接結合され得る。
電気通信ネットワークにおける通常の電話リンクの一例を概略的に示す図である。 音声信号の知覚的品質を測定する公知の客観的測定技法を使用して電話リンクの送話品質を測定するための前述の構成を概略的に示す図である。 図2の構成で使用される本発明による電話リンクの送話品質の客観的測定のための装置を概略的に示す図である。 基準音声信号、戻り信号、最新技術による決定されるバックグラウンド雑音レベルおよび関連付けられる送話品質の尺度を表すグラフである。 雑音低下が存在する場合の、基準音声信号、戻り信号、最新技術による決定されるバックグラウンド雑音レベルおよび関連付けられる送話品質の尺度を表すグラフである。 基準音声信号、戻り信号、本発明の一実施形態による決定されるバックグラウンド雑音レベルおよび関連付けられる送話品質の尺度を表すグラフである。 基準音声信号、戻り信号、本発明の別の実施形態による決定されるバックグラウンド雑音レベルおよび関連付けられる送話品質の尺度を表すグラフである。 図3に示す装置の別の部分における変更を概略的に示す図である。

Claims (4)

  1. 通信ネットワークにおいて通信リンクの送話品質を測定する方法であって、
    基準音声信号s(t)に対する劣化音声信号s’(t)を、音声信号の知覚的品質を測定して、前記送話品質劣化に関する推定値を表す品質信号qを生成する客観的測定技法(32)で処理する主要ステップ
    を含み、
    前記劣化音声信号は戻り信号r(t)を含み、
    前記客観的測定技法は、閾値雑音レベルの決定を含む、前記戻り信号に存在する雑音の結果としてのマスキング効果をモデル化するステップを含み、
    動的な閾値雑音レベルが、前記劣化音声信号s’(t)の連続する部分におけるそれぞれの局所的最小値を求めることで推定されることを特徴とする、
    方法。
  2. 前記主要ステップは、
    前記劣化音声信号s’(t)を処理し、第1の表示信号R’(t,f)を生成する第1の処理ステップと、
    前記基準音声信号s(t)を処理し、第2の表示信号R(t,f)を生成する第2の処理ステップと、
    差分信号D(t,f)を生成するために前記第1の表示信号を前記第2の表示信号から減じるステップ(32a)と、
    前記戻り信号に存在する前記雑音のラウドネスの推定値Neを生成する第1のサブステップ(41)と、
    修正差分信号D’(t,f)を生成するために前記生成された推定値Neを使用して前記差分信号に対して実行される雑音抑制の第2のサブステップ(42)と、
    前記品質信号qを生成するために、前記修正差分信号D’(t,f)を周波数および時間に関して統合するステップ(32c)と、
    を含む請求項1に記載の方法。
  3. 通信ネットワーク(10)において通信リンクの送話品質を測定する装置であって、
    基準音声信号s(t)に対する劣化音声信号s’(t)を、音声信号の知覚的品質を測定して、前記送話品質劣化に関する推定値を表す品質信号(q)を生成する客観的測定技法で処理するように構成される、前記通信リンクに接続された測定手段(22;31、36)を備え、
    前記劣化音声信号は戻り信号r(t)を含み、
    前記測定手段(22;31、36)は、前記戻り信号に存在する雑音の結果としての前記マスキング効果をモデル化することによる前記客観的測定技法であって、閾値雑音レベルの決定を含む前記客観的測定技法を実行するように構成され
    前記測定手段は、動的な閾値雑音レベルが、前記劣化音声信号s’(t)の連続する部分におけるそれぞれの局所的最小値を求めることで推定されるように構成されることを特徴とする、
    装置。
  4. 前記劣化音声信号s’(t)を処理し、送話者音声信号と前記戻り信号の信号との組合せの表示信号である第1の表示信号R’(t,f)を生成する第1の処理手段(39)と、
    前記送話者音声信号s(t)を処理し、第2の表示信号R(t,f)を生成する第2の処理手段(38)と、
    前記出力信号qを生成するために前記第1と第2の表示信号を組み合わせる組合せ手段(32)であって、
    差分信号D(t,f)を生成するために前記第1の表示信号を前記第2の表示信号から減じる減算手段(40)、
    前記戻り信号に存在する前記雑音のラウドネスの推定値Neを生成する手段(41)および前記生成された推定値Neを使用して前記差分信号に対する雑音抑制を実行し、修正差分信号D’(t,f)を生成する手段(42)を含む、修正差分信号を生成するために前記差分信号に対して実行されるマスキング効果をモデル化するモデル化手段(41、42)、および、
    前記品質信号qを生成するために、前記修正差分信号を周波数および時間に関して統合する統合手段(43)を含む組合せ手段(32)手段と、
    を備える、請求項3に記載の装置。
JP2006524298A 2003-08-28 2004-08-18 ネットワークにおける通信リンクの送話品質の測定 Expired - Fee Related JP4317222B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US49852503P 2003-08-28 2003-08-28
PCT/EP2004/009299 WO2005022876A1 (en) 2003-08-28 2004-08-18 Measuring a talking quality of a communication link in a network

Publications (2)

Publication Number Publication Date
JP2007504687A JP2007504687A (ja) 2007-03-01
JP4317222B2 true JP4317222B2 (ja) 2009-08-19

Family

ID=34272689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006524298A Expired - Fee Related JP4317222B2 (ja) 2003-08-28 2004-08-18 ネットワークにおける通信リンクの送話品質の測定

Country Status (4)

Country Link
US (1) US7353002B2 (ja)
EP (1) EP1661377A1 (ja)
JP (1) JP4317222B2 (ja)
WO (1) WO2005022876A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050228655A1 (en) * 2004-04-05 2005-10-13 Lucent Technologies, Inc. Real-time objective voice analyzer
US7856355B2 (en) * 2005-07-05 2010-12-21 Alcatel-Lucent Usa Inc. Speech quality assessment method and system
US8370132B1 (en) * 2005-11-21 2013-02-05 Verizon Services Corp. Distributed apparatus and method for a perceptual quality measurement service
US8737573B2 (en) 2011-05-09 2014-05-27 Intelligent Decisions, Inc. Systems, methods, and devices for testing communication lines
WO2015005914A1 (en) * 2013-07-10 2015-01-15 Nuance Communications, Inc. Methods and apparatus for dynamic low frequency noise suppression
EP2922058A1 (en) * 2014-03-20 2015-09-23 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating quality of a degraded speech signal
CN113824843B (zh) * 2020-06-19 2023-11-21 大众问问(北京)信息科技有限公司 语音通话质量检测方法、装置、设备及存储介质
CN113393863B (zh) * 2021-06-10 2023-11-03 北京字跳网络技术有限公司 一种语音评价方法、装置和设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69517325T2 (de) * 1994-08-18 2000-12-28 British Telecommunications P.L.C., London Tonqualitätsanalyse
US6424635B1 (en) * 1998-11-10 2002-07-23 Nortel Networks Limited Adaptive nonlinear processor for echo cancellation
WO2001033814A1 (en) * 1999-11-03 2001-05-10 Tellabs Operations, Inc. Integrated voice processing system for packet networks
ATE333751T1 (de) * 2000-11-09 2006-08-15 Koninkl Kpn Nv Messen einer übertragungsqualität einer telefonverbindung in einem fernmeldenetz
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
AU2003212285A1 (en) * 2002-03-08 2003-09-22 Koninklijke Kpn N.V. Method and system for measuring a system's transmission quality

Also Published As

Publication number Publication date
US20060166624A1 (en) 2006-07-27
US7353002B2 (en) 2008-04-01
WO2005022876A1 (en) 2005-03-10
EP1661377A1 (en) 2006-05-31
JP2007504687A (ja) 2007-03-01

Similar Documents

Publication Publication Date Title
JP4098083B2 (ja) 電気通信網における電話リンクの会話品質の測定
JP3568922B2 (ja) エコー処理装置
JP4522497B2 (ja) デジタル電話システムの機能素子を制御するために状態決定を使用する方法および装置
JP4568439B2 (ja) エコー抑圧装置
JP4204754B2 (ja) 通信システムにおける適応信号利得制御のための方法及び装置
JP2001350498A (ja) 時間領域雑音抑圧
JPWO2010146711A1 (ja) 音声信号処理装置及び音声信号処理方法
US20110228946A1 (en) Comfort noise generation method and system
JP3420705B2 (ja) エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
JP4317222B2 (ja) ネットワークにおける通信リンクの送話品質の測定
JP2009094802A (ja) 通信装置
US20010006511A1 (en) Process for coordinated echo- and/or noise reduction
JP2006033789A (ja) 反響路結合量推定方法、反響路結合量推定装置、反響路結合量推定プログラム、エコー抑圧方法、エコー抑圧装置、エコー抑圧プログラム、エコーサプレス方法、エコーサプレッサ、エコーサプレッサプログラム、通信路上の損失量制御方法、通信路上の損失量制御装置、通信路上の損失制御プログラム、多チャネルエコー抑圧方法、多チャネルエコー抑圧装置、多チャネルエコー抑圧プログラム、記録媒体
KR101035736B1 (ko) 이동통신 시스템의 단말 장치에서 반향 제거 장치 및 방법
JP3573241B2 (ja) 反響消去方法および装置
Gierlich et al. Background Noise Transmission and Comfort Noise Insertion: The Influence of Signal Processing on" Speech"-Quality in Complex Telecommunication Scenarios
KR100377797B1 (ko) 이동통신용 핸즈프리 단말기의 잔여 반향 제거장치
JP2003516673A (ja) 端末通信システムのエコー処理装置
JP2019200366A (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
JP6635211B1 (ja) エコーキャンセラおよびip電話機
WO2022202012A1 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
JP2004274683A (ja) エコーキャンセル装置、エコーキャンセル方法、プログラムおよび記録媒体
JPH11122144A (ja) エコー消去方法および装置
JP3579622B2 (ja) 反響抑圧における所望エコー抑圧量導出方法及びその装置
EP1216519B1 (en) Measuring the perceptual quality of speech signals including echo disturbances

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080514

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080521

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080815

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090422

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090521

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120529

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130529

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees