JP2005519339A - システムの伝送品質を測定する方法及びシステム - Google Patents
システムの伝送品質を測定する方法及びシステム Download PDFInfo
- Publication number
- JP2005519339A JP2005519339A JP2003575064A JP2003575064A JP2005519339A JP 2005519339 A JP2005519339 A JP 2005519339A JP 2003575064 A JP2003575064 A JP 2003575064A JP 2003575064 A JP2003575064 A JP 2003575064A JP 2005519339 A JP2005519339 A JP 2005519339A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- equal
- input
- input signal
- output signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000005540 biological transmission Effects 0.000 title claims abstract description 21
- 241001415288 Coccidae Species 0.000 claims description 10
- 238000012360 testing method Methods 0.000 abstract description 17
- 230000000694 effects Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 238000001914 filtration Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 238000001303 quality assessment method Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000001934 delay Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- FEPMHVLSLDOMQC-UHFFFAOYSA-N virginiamycin-S1 Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC=CC=2)N(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O FEPMHVLSLDOMQC-UHFFFAOYSA-N 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012074 hearing test Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
本発明は、被試験システムの伝送品質を測定する方法及びシステムであって、被試験システムに入力された入力信号と、被試験システムから生じた出力信号とを処理して、互いに比較する方法及びシステムに関する。
2001年2月に出されたITU−TのP.862勧告草案「電話伝送品質、電話設置、ローカル・ライン・ネットワーク−客観的及び主観的品質評価方法−音声品質の知覚的評価方法(PESQ)、ナローバンド電話網及び音声コーデックのエンド・ツー・エンドの音声品質を評価する客観的方法」は、従来技術であるPESQの方法及びシステムを開示する。
本発明の一つの態様によれば、システムの出力信号及び/又は入力信号は、パワー比に応じて、パワーの小さなひずみが補償され、より大きなひずみが部分補償される方法でスケーリングされる。
第1のサブ・アルゴリズムに制御される第1のソフトスケール処理において、出力信号における局所利得変動を補正するためにP.862勧告で用いられる補償は、パワー比に応じて、パワーの小さな偏差が(好ましくは時間フレーム又は時間期間ごとに)補償され、より大きな偏差が部分補償される方法で出力(又は入力)をスケーリングすることにより改良される。
F=(PX+Δ)/(PY+Δ)
である。ただし、ΔはPYの小さな値に対してCの値を最適化するために利用される。Fは、クリッピングされた比Cを得るためにレベルmm及びMMでクリッピングされた振幅である。即ち、
F<mm<1.0のときC=mm、
F>MM>1.0のときC=MM
となり、それ以外の場合には、
C=F
となる。クリッピングされた比Cは、mm<m<1.0且つMM>M>1.0である係数m及びMを用いてソフトスケール比Sを計算するために利用される。即ち、
C<m且つ0.5<a<1.0のときS=Ca+C−C(m)a-1、
C>M且つ0.5<a<1.0のときS=Ca+C−C(M)a-1
であり、それ以外の場合には、
S=C
である。ただし、aは(第1の)同調パラメータとして利用され得る。このように、本発明に係る局所スケーリングは、m<F<Mである限り、先行技術文献であるP.862勧告及び欧州特許出願01200945号において与えられたスケーリングと等しい。しかし、F<m又はF>Mである値については、スケーリングは徐々に1.0より、次いで従来技術におけるスケーリングより低くなる。ソフトスケール係数Sは、各フレームの出力パワーを局所的に補償するように従来技術の方法及びシステムにおいてFが利用されるのと同じ方法で利用される。
入力信号(参照信号)が低レベルのノイズを含む場合、トランスペアレントな音声伝達システムは、やはり低レベルのノイズを含む出力音声信号を生じさせる。音声伝達システムの出力は、伝達システムにより導入されたノイズのために期待以下の品質を有するとの判定される。入力音声信号を聞いて比較をすることができる場合に、ノイズは伝達システムにより引き起こされたものではないという事実に気付き得るに過ぎない。しかし、たいていの主観的音声品質試験では、入力参照信号は被験者に提示されず、従って、被験者は、入力信号における低レベルのノイズの差は音声伝達システムの品質の差であると判定する。客観的試験システムにおいてそのような主観的試験との相関を高めるため、進歩した客観的音声品質評価アルゴリズムにおいて、この効果がエミュレートされる。
D(f)n=|LY(f)n−LX(f)n|
及び、これを置き換えた
D(f)n=|LY(f)n−H(t,f)|
である。ただし、LX(f)n<Kのとき
H(t、f)=LX(f)nb/Kb-1
であり、LX(f)n>Kのとき
H(t、f)=LX(f)n
である。これらの公式において、Kは、特定の実現形態に応じて時間周波数セルごとの低レベルのノイズ・パワー条件を表し、b>1である。
D(f)n=|LY(f)n−H(t,f)|
であって、LX(t)<K’のとき
H(t,f)=LX(f)nb/Kb-1
であり、LX(t)>K’とのき
H(t,f)=LX(f)n
である。これらの公式において、K’は、特定の実現形態に依存する時間フレームごとの低レベルのノイズのパワー条件を表し、b>1である。
図1に示されるPESQシステムは、原信号(入力信号)X(t)と、例えば通信システムにX(t)を通過させた結果である劣化信号(出力信号)Y(t)とを比較する。PESQシステムの出力は、主観的聴音試験において被験者によりY(t)に与えられるであろう知覚品質の予測である。PESQシステムにより実行される第1の段階において、遅延が以前の時間区間と大きく異なる時間区間ごとに、原入力と劣化出力との間の一連の遅延が計算される。これらの各区間について、対応する始点及び終点が計算される。整列アルゴリズムは、或る時間区間内に2つの遅延があるという確度と、当該区間に単一の遅延があるという確度との比較の原理に基づく。該アルゴリズムは、無音部分及びアクティブな音声部分の両期間において、遅延の変動を処理することができる。
図1に示されるPESQシステムの知覚モデルは、原音声信号と劣化音声信号との間の距離(「PESQスコア」)を計算するために利用される。これは、所与の主観的試験における主観的MOSの予測を得るために単調関数に通され得る。PESQスコアは、−0.5〜4.5の範囲内の単一の数値であるMOSと同様のスケールにマッピングされるが、大抵の場合、出力範囲はACR聴音品質実験におけるMOS値の正常範囲である1.0〜4.5である。
或る種の定数値及び関数は事前計算される。これらはサンプル周波数に依存するため、8kHzと16kHzのサンプル周波数のバージョンがプログラムに格納されている。
PESQシステムにおいて、時刻信号は、32msサイズのハニング窓による短期間FFT(高速フーリエ変換)を用いて時間周波数ドメインにマッピングされる。8kHzの場合、これは1ウィンドウ当り256個のサンプルに相当し、16kHzの場合、ウィンドウは隣接フレームが50%だけ重なり合うが、512個のサンプルを計数する。
絶対聴覚閾値P0(f)は、利用されるBark帯域の中央における値を得るために補間される。これらの値は配列に記憶され、ツビッカーのラウドネス公式において利用される。
時間−周波数分析のためのFFTに付随する任意の利得定数が存在する。この定数は、32ms以上のウィンドウを用いたFFTにより周波数ドメインに変換された、29.54(40dB SPL)の振幅を有する周波数1000Hzの正弦波から計算される。次いで、(離散)周波数軸が、FFT帯域のビンニングにより修正Barkスケールに変換される。Bark周波数スケールにビンニングされたスペクトルのピーク振幅(「ピッチ・パワー密度」と呼ばれる)は、10000(40dB SPL)になるはずである。後者は、パワー・スケーリング係数Spである定数を右から乗ずることにより実行される。
同じ40dBの参照音が、心理音響的な(Sone)ラウドネス・スケールを校正するために利用される。修正Barkスケールへのビンニングの後、強度軸は、絶対聴覚閾値に基づき、ツビッカーの法則を用いてラウドネス・スケールにワープされる。1000Hz及び40dB SPLの校正音を用いて、Bark周波数スケールに対してラウドネス密度を積分すると、1Soneの値が得られる。後者は、ラウドネス・スケーリング係数S1である定数を右から乗ずることにより実行される。
セクション10.1.2で述べられているように、聴音試験は、ハンドセットにおけるIRS受信特性又は修正されたIRS受信特性を用いて実行されると想定される。音声信号に対する必要なフィルタリングは、既に前処理において適用されている。
原音声ファイル及び劣化音声ファイルが大きな無音区間で開始又は終了している場合、これは、ファイルにおける特定の平均ひずみ値の計算に影響し得る。そのため、これらのファイルの最初又は最後に、無音部分が見積もられる。或る位置がアクティブな区間の始点又は終点であるとみなされる為には、連続した5つの絶対サンプル値の和が、原音声ファイルの最初及び最後から500を超えなければならない。この始点と終点との間の区間が、アクティブな音声時間区間と定義される。計算サイクル及び/又は記憶サイズを節約するため、幾つかの計算はアクティブな区間に限られる。
人間の耳は、時間−周波数変換を実行する。PESQシステムにおいて、これは、ウィンドウ・サイズが32msの短期間FFTにより実現される。連続する時間ウィンドウ(フレーム)どうしの重なりは50%である。パワースペクトル、即ち複素数FFT要素の実部の二乗と虚部の二乗との和は、原信号及び劣化信号について別々の実数値配列に格納される。単一のハニング窓内の位相情報はPESQシステムにおいて廃棄され、全ての計算はパワー表現PXWIRSS(f)n及びPYWIRSS(f)nのみに基づく。劣化信号におけるウィンドウの始点は、遅延のために移動される。原音声信号の時間軸はそのままに留められる。遅延が増加すると、劣化信号の一部が処理から省略され、遅延が減少すると、部分が繰り返される、
ピッチ・パワー密度の計算
Barkスケールは、人間の聴覚システムが低周波数において高周波数におけるよりも優れた周波数分解能を有することを反映する。これは、FFT帯域をビンニングして、FFT帯域の対応するパワーを加算し、加算された部分を正規化することにより実現される。Hertzの周波数スケールをBarkのピッチ・スケールにマッピングするワーピング関数は、与えられた通りの値に正確に従うのではない。結果としての信号は、ピッチ・パワー密度PPXWIRSS(f)n及びPPYWIRSS(f)nとして知られる。
被試験システムのフィルタリングを扱うために、原ピッチ・パワー密度及び劣化ピッチ・パワー密度のパワー・スペクトルは、時間平均される。この平均は、パワーが絶対聴音閾値の1000倍より大きい時間−周波数セルを用いて、アクティブな音声フレームについてのみ計算される。修正されたBarkビンごとに、劣化スペクトルの原スペクトルに対する比率から部分補償係数が計算される。補償は最大でも20dBを超えることは無い。個々のフレームnの原ピッチ・パワー密度PPXWIRSS(f)nは、原信号を劣化信号と等しくするよう、この部分補償係数を乗じられる。この結果、逆フィルター処理された原ピッチ・パワー密度PPX’WIRSS(f)nが得られる。厳格なフィルター処理は聴取者の妨げとなるため、この部分補償が利用される。ACR実験において劣化信号は被験者により判断されるものであるため、補償は原信号に実行される。
短期間利得変動は、ピッチ・パワー密度をフレームごとに処理することにより部分補償される。原ピッチ・パワー密度及び劣化ピッチ・パワー密度について、個々のフレームnにおける絶対聴音閾値を超える全ての値の合計が計算される。原ファイル及び劣化ファイルにおけるパワーの比率が計算され、範囲[3・10-4,5]に結び付けられる。(時間軸に沿った)第一次のローパス・フィルターは、この比率に適用される。各フレームnにおけるひずみのあるピッチ・パワー密度は、この比率を乗じられて、部分的に利得補償されたひずみのあるピッチ・パワー密度PPY’WIRSS(f)nを生ずる。
フィルター処理及び短期間利得変動に対する部分補償の後、原ピッチ・パワー密度及び劣化ピッチ・パワー密度が、ツビッカーの法則[7]を用いてSoneラウドネス・スケールに変換される。即ち、
ひずみのあるラウドネス密度と原ラウドネス密度との符号付きの差が計算される。この差が正である場合、ノイズなどの要素が追加されている。この差が負である場合、原信号から要素が省略されている。この差の配列は、未処理外乱密度と呼ばれる。
・未処理外乱密度が正でありマスク値より大きい場合、マスク値が未処理外乱から減じられる。
・未処理外乱密度がマスク値の大きさの正の値と負の値との間にある場合、外乱密度はゼロに設定される。
・未処理外乱密度がマスク値の負の値より更に小さい場合、マスク値が未処理外乱密度に加算される。
コーデックが入力信号をひずませる際に、入力信号と統合する新しい時間−周波数要素を導入することは一般に非常に難しいため、結果としての出力信号は入力信号とひずみとの2つの異なる知覚対象に分解され、明らかに聞き取れるひずみ[2]をもたらすという事実により、非対称効果が引き起こされる。コーデックが時間−周波数要素を無視する場合、結果としての出力信号は同様には分解され得ず、ひずみの不快さは小さくなる。この効果は、外乱密度D(f)nに非対称係数を乗じてフレームごとの非対称外乱密度DA(f)nを計算することによりモデル化される。この非対称係数は、ひずみピッチ・パワー密度と1.2乗された原ピッチ・パワー密度との比率に等しい。非対称係数が3より小さい場合、ゼロに設定される。非対称係数が12を超える場合、その値でクリッピングされる。従って、劣化ピッチ・パワー密度が原ピッチ・パワー密度を超える時間周波数セルのみが非ゼロの値として留まり得る。
外乱密度D(f)nと非対称外乱密度DA(f)nとは、2つの異なるLp標準及びソフト・フレーム上の(ラウドネスの低い)重み付けを用いて、周波数軸に沿って統合(加算)される。即ち、
ひずみ信号が16ms(ウィンドウの半分)より大きな遅延の減少を含む場合、10.2.4に述べられた繰返し戦略が修正される。客観音声品質の計算において、そのようなイベント期間のフレーム外乱は無視したほうがよいことがわかっている。その結果、これが起こる場合、フレーム外乱がゼロにされる。結果としてのフレーム外乱を、D’n及びDA’nと呼ぶ。
閾値を超えるフレーム外乱を有する連続したフレームは、不良区間と呼ばれる。少数のケースにおいて、客観的測定は、前処理により観察される不正確な時間遅延に起因する最小数の不良フレームにおける大きな歪みを予測する。いわゆる不良区間に対して、絶対原信号と、前処理により観察された遅延に応じて調整された絶対劣化信号との相関を最大化することにより、新しい遅延値が予測される。最大化された相関が閾値以下である場合、該区間ではノイズとノイズとを釣り合わせており、該区間はもはや不良と呼ばれず、該区間に対する処理が中止されることが結論付けられる。そうではない場合、不良区間のフレームに対するフレーム外乱が再計算され、より小さい場合には、原フレーム外乱と置き換えられる。結果として、知覚品質を計算するために利用される最終的なフレーム外乱D’’n及びDA’’nが得られる。
次に、フレーム外乱値及び非対称フレーム外乱値が、L6標準と、音声ファイル長の集合におけるのと同様のより高いp値とを用いて、20フレームからなる瞬時区間(約320msであるフレームの重なりを考慮する)を通して集計される。これらの区間もまた、50%ずつ重なりあい、窓関数は利用されない。
瞬時外乱値及び非対称瞬時外乱値は、L2標準を用いて、音声ファイルのアクティブな区間(対応するフレーム)を通して集計される。音声ファイルの第1のセンテンスがひずんだ場合でも他のセンテンスの品質はそのままであるのに対し、瞬時区間の一部がひずむとその瞬時が意味を失うという事実のために、音声ファイルの集合における低いp値よりも瞬時区間内の集合に対するp値は高くなる。
最終的なPESQスコアは、平均外乱値と平均非対称外乱値との線形結合である。PESQスコアの範囲は−0.5〜4.5であるが、たいていの場合、出力範囲は聴音品質を示すMOSと同様の1.0〜4.5のスコアであり、これはACR(絶対範囲評価)実験におけるMOS値の正常範囲である。
図3は、図2に示された第1の新しいモジュールの動作を示す。図3におけるモジュールの動作は、パワー比に応じて、パワーの小さな偏差が望ましくは時間フレーム又は時間期間ごとに補償され、より大きな偏差が部分補償される方法で入力に対して出力をスケーリングすることにより、出力信号における局所利得変動を補正するための補償機能を改良する、フロー図に示された第1のサブ・アルゴリズムにより制御される。本発明の好ましい単純且つ効果的な実現形態は、局所パワー、即ち(例えば、30msの)フレームごとのパワーをとり、局所補償比Fを計算する。即ち、F=(PX+Δ)/(PY+Δ)であるが、PX及びPYはそれぞれ、図1、2及び3で使われているPPXWIRSS(f)n及びPPYWIRSS(f)nの短縮形であり、Fはクリッピングされた比Cを得るためにレベルmm及びMMでクリッピングされた振幅である。即ち、F<mm<1.0のときC=mmであり、F>MM>1.0のときC=MMであり、又はC=Fである。ただし、ΔはPX及び/又はPYの小さな値についてCを最適化する。
LX(f)n<KのときD(f)n=|LY(f)n−LX(f)nb/Kb-1|であり、
LX(f)n>KのときD(f)n=|LY(f)n−LX(f)n|
に設定される。これらの公式において、b>1であり、Kは時間周波数セルごとの低レベルのノイズ・パワー条件を表す。
LX(t)<K’のときD(f)n=|LY(f)n−LX(f)nb/Kb-1|であり、
LX(t)>K’のときD(f)n=|LY(f)n−LX(f)n|
に設定される。これらの代わりの公式において、b>1であり、K’は時間フレームごとの低レベルのノイズ・パワー基準を表す。
[1] BEERENDS (J.G.), STEMERDINK (J.A.): A Perceptual Speech-Quality Measure Based on a Psychoacoustic Sound Representation, J. Audio Eng. Soc., Vol. 42, No. 3, pp. 115-123, March 1994.
[2] BEERENDS (J.G.): Modeling Cognitive Effects that Play a Role in the Perception of Speech Quality, Speech Quality Assessment, Workshop papers, Bochum, pp. 1-9, November 1994.
[3] BEERENDS (J.G.): Measuring the quality of speech and music codecs, an integrated psychoacoustic approach, 98th AES Convention, pre-print No. 3945,1995.
[4] HOLLIER (M.P.), HAWKSFORD (M.O.), GUARD (D.R.) : Error activity and error entropy as a measure of psychoacoustic significance in the perceptual domain, IEE Proceedings-Vision, Image and Signal Processing, 141 (3), 203-208, June 1994.
[5] RIX (A.W.), REYNOLDS (R.), HOLLIER (M.P.): Perceptual measurement of end-to-end speech quality over audio and packet-based networks, 106th AES Convention, pre-print No. 4873, May 1999.
[6] HOLLIER (M.P.), HAWKSFORD (M.O.), GUARD (D.R.), Characterization of communications systems using a speech-like test stimulus, Journal of the AES, 41 (12), 1008-1021, December 1993.
[7] ZWICKER (Feldtkeller): Das Ohr als Nachrichtenempfanger, S. Hirzel Verlag, Stuttgart, 1967.
[8] ITU−T P.862勧告草案、"Telephone transmission quality, telephone installations, local line networks-Methods for objective and subjective assessment of quality-Perceptual evaluation of speech quality (PESQ), an objective method for en-to-end speech quality assessment of narrow-bank telephone networks and speech codecs", ITU-T 02.2001
[9] 欧州特許出願第01200945号, 出願人Koninklijke KPN n. v.
Claims (10)
- 音声システムの伝送品質を測定する方法であって、入力信号(X)が前記音声システムに入力されて前記音声システムから出力される出力信号(Y)を生じさせ、前記入力信号及び前記出力信号が処理され、望ましくは比較される方法において、
前記音声システムの前記出力信号及び/又は前記入力信号が、パワー比に応じて、前記パワーの小さな偏差が補償され、より大きな偏差が部分補償される方法でスケーリングされる方法。 - 請求項1記載の方法であって、
補償比Fが、前記入力信号(X)及び出力信号(Y)のそれぞれのパワー表現PX及びPYから計算されるものであって、PX/PYの比に等しく、
F<mmのとき第1のクリッピング値mmと等しく、F>MMのとき第2のクリッピング値MMと等しく、それ以外のときにFといとしいクリッピングされた比Cが計算され、
ソフトスケール比Sが第1のスケーリング係数m及び第2のスケーリング係数Mから計算され、mm<m<1且つMM>M>1であり、aが0より大きく且つ1より小さい値に設定される第一の同調パラメータであるとき、C<mの場合にSがCa+C−C(m)a-1と等しく、C>Mの場合にSがCa+C−C(M)a-1と等しく、それ以外の場合にSがCと等しい方法。 - 請求項1記載の方法であって、前記入力のノイズの局所レベルに依存するスケーリング係数により、前記原入力音声信号に存在するノイズ・レベルが低減された人工的な参照音声信号が作成される方法。
- 請求項3記載の方法であって、前記時間−周波数平面における前記入力信号(X)及び前記出力信号(Y)のそれぞれに対する内部表現LX(f)n及びLY(f)nの前記差D(f)nが、bが1より大きい値に設定される第二の同調パラメータであり、Kが所望の低レベル・ノイズ・パワー条件を表す低レベル・ノイズ・パワー条件値であるときに、LX(f)n<Kの場合に|LY(f)n−LX(f)nb/Kb-1|と、LX(f)n>Kの場合に|LY(f)n−LX(f)n|と等しくなるよう設定される方法。
- 請求項3記載の方法であって、前記時間−周波数平面における前記入力信号(X)及び前記出力信号(Y)のそれぞれに対する内部表現LX(f)n及びLY(f)nの差D(f)nが、bが1より大きい値に設定される第二の同調パラメータであり、K’が所望の低レベル・ノイズ・パワー条件を表す低レベル・ノイズ・パワー条件値であるときに、LX(t)<K’の場合に|LY(f)n−LX(f)nb/Kb-1|と、LX(f)n>K’の場合に|LY(f)n−LX(f)n|と等しくなるよう設定される方法。
- 音声システムの伝送品質を測定するシステムであって、入力信号(X)が前記音声システムに入力されて前記音声システムから出力される出力信号(Y)を生じさせ、前記入力信号及び前記出力信号が互いに処理され、望ましくは比較されるシステムにおいて、
パワー比に応じて、パワーの小さな偏差が補償され、より大きな偏差が部分補償される方法で、前記音声システムの前記出力信号及び/又は前記入力信号をスケーリングするスケーリング手段を備えるシステム。 - 請求項6記載のシステムであって、
前記入力信号(X)及び前記出力信号(Y)のそれぞれに対する前記パワー表現PX及びPYから、PX/PYの比に等しい補償比Fを計算する手段と、
F<mmの場合に第一のクリッピング値mmと等しく、F>MMの場合に第二のクリッピング値MMと等しく、それ以外の場合にはFと等しいクリッピングされた比Cを計算する手段と、
第一のスケーリング係数m及び第二のスケーリング係数Mからソフトスケール比Sを計算する手段であって、mm<m<1且つMM>M>1であり、aが0より大きく且つ1より小さい値に設定される第一の同調パラメータであるときに、C<mの場合にSがCa+C−C(m)a-1と等しく、C>Mの場合にSがCa+C−C(M)a-1と等しく、それ以外の場合にSがCと等しい手段と、
を備えるシステム。 - 請求項6記載のシステムであって、前記原入力音声信号に存在するノイズ・レベルが、該入力のノイズの局所レベルに依存するスケーリング係数により低減された、人工的な参照音声信号を作成する手段を備えるシステム。
- 請求項8記載のシステムであって、前記時間−周波数平面における前記入力信号(X)及び前記出力信号(Y)のそれぞれの内部表現LX(f)n及びLY(f)nの差D(f)nを、bが1より大きい値に設定される第二の同調パラメータであり、Kが所望の低レベル・ノイズ・パワー条件を表す低レベル・ノイズ・パワー条件値であるときに、LX(f)n<Kの場合に|LY(f)n−LX(f)nb/Kb-1|と、LX(f)n>Kの場合に|LY(f)n−LX(f)n|と等しくなるよう設定する手段を備えるシステム。
- 請求項8記載のシステムであって、前記時間−周波数平面における前記入力信号(X)及び前記出力信号(Y)のそれぞれに対する内部表現LX(f)n及びLY(f)nの差D(f)nを、bが1より大きい値に設定される第二の同調パラメータであり、K’が所望の低レベル・ノイズ・パワー条件を表す低レベル・ノイズ・パワー条件値であるときに、LX(t)<K’の場合に|LY(f)n−LX(f)nb/Kb-1|と、LX(t)>K’の場合に|LY(f)n−LX(f)n|と等しくなるよう設定する手段を備えるシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02075973A EP1343145A1 (en) | 2002-03-08 | 2002-03-08 | Method and system for measuring a sytems's transmission quality |
EP02075997 | 2002-03-11 | ||
PCT/EP2003/002058 WO2003076889A1 (en) | 2002-03-08 | 2003-02-26 | Method and system for measuring a system's transmission quality |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005519339A true JP2005519339A (ja) | 2005-06-30 |
JP4263620B2 JP4263620B2 (ja) | 2009-05-13 |
Family
ID=27806525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003575064A Expired - Fee Related JP4263620B2 (ja) | 2002-03-08 | 2003-02-26 | システムの伝送品質を測定する方法及びシステム |
Country Status (9)
Country | Link |
---|---|
US (1) | US7689406B2 (ja) |
EP (1) | EP1485691B1 (ja) |
JP (1) | JP4263620B2 (ja) |
AT (1) | ATE339676T1 (ja) |
AU (1) | AU2003212285A1 (ja) |
DE (1) | DE60308336T2 (ja) |
DK (1) | DK1485691T3 (ja) |
ES (1) | ES2272952T3 (ja) |
WO (1) | WO2003076889A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006025337A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | ステレオ信号生成装置およびステレオ信号生成方法 |
JP2008513834A (ja) * | 2004-09-20 | 2008-05-01 | ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー | 知覚音声分析のための周波数補償 |
JP2011501206A (ja) * | 2007-10-11 | 2011-01-06 | コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ | オーディオ送信システムの音声理解度測定方法およびシステム |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7327985B2 (en) * | 2003-01-21 | 2008-02-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Mapping objective voice quality metrics to a MOS domain for field measurements |
JP4317222B2 (ja) * | 2003-08-28 | 2009-08-19 | コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ | ネットワークにおける通信リンクの送話品質の測定 |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
US8086451B2 (en) * | 2005-04-20 | 2011-12-27 | Qnx Software Systems Co. | System for improving speech intelligibility through high frequency compression |
EP1975924A1 (en) * | 2007-03-29 | 2008-10-01 | Koninklijke KPN N.V. | Method and system for speech quality prediction of the impact of time localized distortions of an audio transmission system |
ES2403509T3 (es) * | 2007-09-11 | 2013-05-20 | Deutsche Telekom Ag | Método y sistema para la evaluación integral y diagnóstica de la calidad de la voz de escucha |
US8949114B2 (en) | 2009-06-04 | 2015-02-03 | Optis Wireless Technology, Llc | Method and arrangement for estimating the quality degradation of a processed signal |
US8818798B2 (en) | 2009-08-14 | 2014-08-26 | Koninklijke Kpn N.V. | Method and system for determining a perceived quality of an audio system |
US9025780B2 (en) | 2009-08-14 | 2015-05-05 | Koninklijke Kpn N.V. | Method and system for determining a perceived quality of an audio system |
US8983833B2 (en) * | 2011-01-24 | 2015-03-17 | Continental Automotive Systems, Inc. | Method and apparatus for masking wind noise |
EP2595145A1 (en) * | 2011-11-17 | 2013-05-22 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating intelligibility of a degraded speech signal |
EP2595146A1 (en) * | 2011-11-17 | 2013-05-22 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating intelligibility of a degraded speech signal |
US20150179181A1 (en) * | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Adapting audio based upon detected environmental accoustics |
KR102366988B1 (ko) * | 2014-07-03 | 2022-02-25 | 한국전자통신연구원 | 레이어드 디비전 멀티플렉싱을 이용한 신호 멀티플렉싱 장치 및 신호 멀티플렉싱 방법 |
KR102362788B1 (ko) * | 2015-01-08 | 2022-02-15 | 한국전자통신연구원 | 레이어드 디비전 멀티플렉싱을 이용한 방송 신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법 |
CA3062640C (en) * | 2015-01-08 | 2022-04-26 | Electronics And Telecommunications Research Institute | An apparatus and method for broadcast signal reception using layered divisional multiplexing |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4110692A (en) * | 1976-11-12 | 1978-08-29 | Rca Corporation | Audio signal processor |
IT1121496B (it) * | 1979-12-14 | 1986-04-02 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per l effettuazione di misure oggettive di qualita su apparecchiature di trasmissione di segnali fonici |
GB2116801A (en) * | 1982-03-17 | 1983-09-28 | Philips Electronic Associated | A system for processing audio frequency information for frequency modulation |
GB9213459D0 (en) * | 1992-06-24 | 1992-08-05 | British Telecomm | Characterisation of communications systems using a speech-like test stimulus |
EP0705501B1 (en) * | 1993-06-21 | 1999-11-17 | BRITISH TELECOMMUNICATIONS public limited company | Method and apparatus for testing telecommunications equipment using a reduced redundancy test signal |
IN184794B (ja) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
WO1996006495A1 (en) * | 1994-08-18 | 1996-02-29 | British Telecommunications Public Limited Company | Test method |
NL9500512A (nl) * | 1995-03-15 | 1996-10-01 | Nederland Ptt | Inrichting voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal, alsmede werkwijze voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal. |
FI97837C (fi) * | 1995-04-11 | 1997-02-25 | Nokia Mobile Phones Ltd | Tiedonsiirtomenetelmä sekä lähetin |
AU694932B2 (en) * | 1995-07-27 | 1998-08-06 | British Telecommunications Public Limited Company | Assessment of signal quality |
GB9604315D0 (en) * | 1996-02-29 | 1996-05-01 | British Telecomm | Training process |
US5672999A (en) * | 1996-01-16 | 1997-09-30 | Motorola, Inc. | Audio amplifier clipping avoidance method and apparatus |
WO1998053589A1 (en) * | 1997-05-16 | 1998-11-26 | British Telecommunications Public Limited Company | Testing telecommunications equipment |
JP4076202B2 (ja) * | 2000-08-07 | 2008-04-16 | 富士通株式会社 | スペクトラム拡散信号受信機及び受信方法 |
JP2002215192A (ja) * | 2001-01-17 | 2002-07-31 | Nec Corp | オーディオ情報処理装置及び処理方法 |
US7027982B2 (en) * | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
-
2003
- 2003-02-26 JP JP2003575064A patent/JP4263620B2/ja not_active Expired - Fee Related
- 2003-02-26 US US10/504,619 patent/US7689406B2/en not_active Expired - Fee Related
- 2003-02-26 ES ES03708155T patent/ES2272952T3/es not_active Expired - Lifetime
- 2003-02-26 AT AT03708155T patent/ATE339676T1/de active
- 2003-02-26 DE DE60308336T patent/DE60308336T2/de not_active Expired - Lifetime
- 2003-02-26 EP EP03708155A patent/EP1485691B1/en not_active Expired - Lifetime
- 2003-02-26 AU AU2003212285A patent/AU2003212285A1/en not_active Abandoned
- 2003-02-26 WO PCT/EP2003/002058 patent/WO2003076889A1/en active IP Right Grant
- 2003-02-26 DK DK03708155T patent/DK1485691T3/da active
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006025337A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | ステレオ信号生成装置およびステレオ信号生成方法 |
US8019087B2 (en) | 2004-08-31 | 2011-09-13 | Panasonic Corporation | Stereo signal generating apparatus and stereo signal generating method |
JP2008513834A (ja) * | 2004-09-20 | 2008-05-01 | ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー | 知覚音声分析のための周波数補償 |
JP4879180B2 (ja) * | 2004-09-20 | 2012-02-22 | ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー | 知覚音声分析のための周波数補償 |
JP2011501206A (ja) * | 2007-10-11 | 2011-01-06 | コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ | オーディオ送信システムの音声理解度測定方法およびシステム |
Also Published As
Publication number | Publication date |
---|---|
US7689406B2 (en) | 2010-03-30 |
DE60308336T2 (de) | 2007-09-20 |
JP4263620B2 (ja) | 2009-05-13 |
DE60308336D1 (de) | 2006-10-26 |
ES2272952T3 (es) | 2007-05-01 |
EP1485691A1 (en) | 2004-12-15 |
US20050159944A1 (en) | 2005-07-21 |
ATE339676T1 (de) | 2006-10-15 |
AU2003212285A1 (en) | 2003-09-22 |
WO2003076889A1 (en) | 2003-09-18 |
EP1485691B1 (en) | 2006-09-13 |
DK1485691T3 (da) | 2007-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4263620B2 (ja) | システムの伝送品質を測定する方法及びシステム | |
JP4570609B2 (ja) | 音声伝送システムの音声品質予測方法及びシステム | |
EP2780909B1 (en) | Method of and apparatus for evaluating intelligibility of a degraded speech signal | |
US9953663B2 (en) | Method of and apparatus for evaluating quality of a degraded speech signal | |
US9472202B2 (en) | Method of and apparatus for evaluating intelligibility of a degraded speech signal | |
US20100211395A1 (en) | Method and System for Speech Intelligibility Measurement of an Audio Transmission System | |
US20120143601A1 (en) | Method and System for Determining a Perceived Quality of an Audio System | |
US8566082B2 (en) | Method and system for the integral and diagnostic assessment of listening speech quality | |
US9659565B2 (en) | Method of and apparatus for evaluating intelligibility of a degraded speech signal, through providing a difference function representing a difference between signal frames and an output signal indicative of a derived quality parameter | |
EP1343145A1 (en) | Method and system for measuring a sytems's transmission quality | |
US20230260528A1 (en) | Method of determining a perceptual impact of reverberation on a perceived quality of a signal, as well as computer program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070709 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20071005 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20071015 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090115 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090212 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140220 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |