JP7184173B2 - 音響品質評価装置、音響品質評価方法、およびプログラム - Google Patents

音響品質評価装置、音響品質評価方法、およびプログラム Download PDF

Info

Publication number
JP7184173B2
JP7184173B2 JP2021518230A JP2021518230A JP7184173B2 JP 7184173 B2 JP7184173 B2 JP 7184173B2 JP 2021518230 A JP2021518230 A JP 2021518230A JP 2021518230 A JP2021518230 A JP 2021518230A JP 7184173 B2 JP7184173 B2 JP 7184173B2
Authority
JP
Japan
Prior art keywords
evaluation
quality
acoustic
far
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021518230A
Other languages
English (en)
Other versions
JPWO2020225850A1 (ja
Inventor
祥子 栗原
登 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2020225850A1 publication Critical patent/JPWO2020225850A1/ja
Application granted granted Critical
Publication of JP7184173B2 publication Critical patent/JP7184173B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S15/00Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
    • G01S15/88Sonar systems specially adapted for specific applications
    • G01S15/885Meteorological systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/24Arrangements for testing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、通話品質を評価するための技術に関し、特に拡声系通信システムの品質評価試験技術に関する。
通信技術の発達とともに、機器を持たずに通話できる手軽さから、会議システムやスマートフォンによるハンズフリー拡声通話などの拡声系通信システムを利用する機会が増えている。拡声系通信システムで問題となる音響エコーや周辺雑音を除去し、快適な通話環境を提供するために、音響エコーキャンセラ(AEC: Acoustic Echo Canceller)が利用されている。
音響エコーとは、近端から送信された音声が遠端のスピーカから出力され、遠端のマイクロホンが拾うことで発生する現象である。音響エコーキャンセラの効果が弱ければ音響エコーが消し残り、強すぎれば遠端からの送話音声までもが除去されてしまい、歪んだり消えたりして聞き取りにくくなる。音響エコーキャンセラの性能は音響エコーがどれだけ的確に消去されているかに依存することから、従来の音響エコーキャンセラの性能評価は、音響エコーの消去量に着目した客観評価が主流であった。客観評価は計算機処理で評価できるため手軽であるが、必ずしも実際の通話でユーザが体感する品質(「ユーザ体感品質」とも呼ぶ)とは一致しないという問題があった。
ハンドセットを使用して通話するIP電話では、遠端から送信される音声は、音響エコーなど近端話者の影響を受けず、遠端音声のみを評価対象にできる。そのため、IP電話の品質評価は、会話試験を簡略化し、片方向通話を対象とした受聴試験により行うことが一般的である。受聴試験は、会話試験に較べて再現性が高く、実施時間が短いため、利便性が高い。また、受聴試験による主観評価値(「受聴MOS: Mean Opinion Score」とも呼ぶ)を推定するPESQ(Perceptual Evaluation of Speech Quality)などの客観評価法も確立されている(非特許文献1参照)。
一方、主観評価で音響エコーや音響エコーキャンセラによる処理音を評価するためには、音響エコーを知覚する必要があり、評価者本人が通話することで初めて評価可能となる。そのため、ハンズフリー拡声通話などの拡声系通信システムでは、双方向の会話試験による品質評価が推奨されてきた(非特許文献2参照)。
近年ではスマートフォンや携帯電話など音響品質が低い通話環境が普及している。音響品質が低いとは、例えばQ値が10db以下であるような音響信号である。このような音響信号は、本来であればMOS値が1~2となることが期待される。MOS値は通常1~5の5段階で表され、数値が大きいほど品質が高いことを表す。Q値と期待されるMOS値との関係については、非特許文献3を参照されたい。
音響品質が低い通話環境に慣れている評価者は音響品質に対する基準が低くなっているため、例えば相手の音声が聞き取れれば音響品質が良いなど、高い評価値を与える傾向が強い。そのため、従来の会話試験で主観評価を行った場合、高い評価値に偏り、適切な評価値が得られないという問題があった。
この発明の目的は、上記のような技術的課題に鑑みて、会話試験による音響品質評価において、音響品質が低い通話環境に慣れた評価者であっても、適切な評価値を得ることができる音響品質評価技術を実現することである。
上記の課題を解決するために、本発明の一態様の音響品質評価装置は、複数の通信端末間で行われる通話の音響品質を評価する音響品質評価装置であって、複数の評価観点それぞれについて所定数の段階に分類した評価カテゴリーを評価者へ提示する評価値提示部と、評価者が各評価観点について選択した評価カテゴリーに割り当てられた評価値のうち最も低い評価値を音響品質の主観評価値として決定する評価値決定部と、を含む。
この発明の音響品質評価技術によれば、会話試験による音響品質評価において、音響品質が低い通話環境に慣れた評価者であっても、適切な評価値を得ることができる。
図1は、音響品質評価システムの機能構成を例示する図である。 図2は、音響品質評価方法の処理手順を例示する図である。 図3は、評価入力画面の表示内容を例示する図である。 図4は、実験結果を説明するための図である。
以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
<拡声系通信システムでの会話試験>
まず、拡声系通信システムでの会話試験による音響品質評価試験を概念的に説明する。この評価試験では、近端話者と遠端話者とが拡声系通信システムを通じて会話を行い、近端話者側に位置する評価者が当該拡声系通信システムの品質評価を行う。なお、拡声系通信システムとは、マイクロホンとスピーカとを備えた端末装置間で音響信号を送受信する通信システムであって、端末装置のスピーカから出力された音の少なくとも一部がその端末装置のマイクロホンで受音されるもの(音の回り込みが生じるもの)をいう。拡声系通信システムの一例は、音声会議システムやテレビ会議システムである。
拡声系通信システムでは、近端話者の音声が近端話者側のマイクロホンで受音され、それに基づいて得られた音響信号がネットワーク経由で遠端話者側に伝送され、当該音響信号が表す音が遠端話者側のスピーカから出力される。また、遠端話者側の音が遠端話者側のマイクロホンで受音され、それに基づいて得られた音響信号がネットワーク経由で近端話者側に伝送され、当該音響信号が表す音が近端話者側のスピーカから出力される。ただし、遠端話者側のスピーカから出力された音の少なくとも一部は遠端話者側のマイクロホンでも受音される。すなわち、遠端話者側のマイクロホンで受音される遠端話者側の音は、遠端話者の音声に近端話者の音声の回り込み(音響エコー)が重畳されたものである。すなわち、遠端話者側のマイクロホンで受音される遠端話者側の音は、遠端話者の音声に基づく信号に近端話者の音声に基づく信号が遠端話者側の空間で劣化して重畳した信号に基づく。なお、近端話者が発話していないときは、近端話者の音声に基づく信号が重畳しないため遠端話者の音声が劣化することはない。また、遠端話者側の音の劣化は、遠端話者側の周囲騒音の重畳も要因となり得る。
近端話者側に伝送される音響信号は、遠端話者側のマイクロホンで受音された音を表す信号に所定の信号処理を行って得られた処理信号に由来するものであってもよいし、このような信号処理を行うことなく得られたものであってもよい。信号処理は、どのような処理であってもよい。信号処理の例は、エコーキャンセル処理およびノイズキャンセル処理の少なくとも一方を含む処理である。なお、エコーキャンセル処理とは、エコーを低減させるための広義のエコーキャンセラによる処理を意味する。広義のエコーキャンセラによる処理とは、エコーを低減させるための処理全般を意味する。広義のエコーキャンセラによる処理は、例えば、適応フィルタを用いた狭義のエコーキャンセラのみによって実現されてもよいし、音声スイッチによって実現されてもよいし、エコーリダクションによって実現されてもよいし、これらの少なくとも一部の技術の組み合わせによって実現されてもよいし、さらにその他の技術との組み合わせによって実現されてよい(下記参考文献1参照)。またノイズキャンセル処理とは、遠端端末のマイクロホンの周囲で発生する、遠端話者の音声以外のあらゆる環境雑音に起因する雑音成分を抑圧または除去する処理を意味する。環境雑音とは、例えば、オフィスの空調音、走行中の車内音、交差点での車の通行音、虫の音、キーボードのタッチ音、複数の人の声(ガヤガヤ音)などを指し、音の大/小、屋内/屋外は問わない(下記参考文献2参照)。
〔参考文献1〕知識ベース 知識の森、2群-6編-5章、“音響エコーキャンセラ”、電子情報通信学会、[online]、[平成31年3月5日検索]、インターネット<URL:http://www.ieice-hbkb.org/files/02/02gun_06hen_05.pdf>
〔参考文献2〕阪内澄宇,羽田陽一,田中雅史,佐々木潤子,片岡章俊,“雑音抑圧及びエコー抑圧機能を備えた音響エコーキャンセラ”,電子情報通信学会論文誌,Vol.J87-A,No.4,pp.448-457,2004年4月
評価者(近端話者)は、近端話者側のスピーカから出力される音響信号を受聴し、予め定めた所定数の段階に分類された評価カテゴリーから近端話者の主観に基づいて最も適合する評価カテゴリーを選択する。例えば、非特許文献1に挙げたITU-T Recommendation P.800では"Excellent", "Good", "Fair", "Poor", "Bad"の5段階の評価カテゴリーに分類し、各評価カテゴリーに順に5, 4, 3, 2, 1の評価値を割り当てることが提案されている。この主観評価を、複数の評価者が通話相手を入れ替えながらそれぞれ複数回行い、収集した評価値を集計することで音響品質の評価が行われる。
<音響品質評価システム>
実施形態の音響品質評価システムは、上述の会話試験を実行するための情報通信システムである。実施形態の音響品質評価システム10は、図1に示すように、近端話者が用いる近端端末1と、遠端話者が用いる遠端端末2と、音響品質評価装置3とを含む。近端端末1は、少なくとも送話部11、受話部12、表示部13、および入力部14を備える。遠端端末2は、少なくとも送話部21および受話部22を備え、さらに信号処理部23を備えてもよい。音響品質評価装置3は、評価値提示部31、評価値決定部32、集計部33、および集計結果記憶部30を備える。この音響品質評価システム10が図2に例示する各ステップの処理を行うことにより実施形態の音響品質評価方法が実現される。
以下の説明では、近端端末1を使用する近端話者が音響品質を評価する評価者であり、遠端端末2を使用する遠端話者が音響品質の評価対象となる会話の通話相手とするが、同一の通話を近端話者と遠端話者とが同時に評価してもよい。この場合、近端話者と遠端話者はいずれも評価者であり、かつ、通話相手となる。このとき、近端端末1と遠端端末2とは同一の機能構成となり、近端端末1が信号処理部をさらに備え、遠端端末2が表示部および入力部をさらに備えることになる。また、以下の説明では、近端端末1と遠端端末2との二者間の通話の音響品質を評価することを前提とするが、遠端端末2が複数存在し、近端端末1と複数の遠端端末2との間で行われる三者以上の会議通話を評価対象としてもよい。
近端端末1と遠端端末2とは音声通信網4を介して接続される。音響品質評価装置3は、近端端末1と図示していないネットワークを介して接続される。ただし、音声通信網4が帯域制御等により音声用の通信経路とデータ用の通信経路とを論理的に分割可能であれば、音声通信網4を介して近端端末1と音響品質評価装置3とが接続されてもよい。音声通信網4は、接続される各装置が相互に通信可能なように構成された回線交換方式もしくはパケット交換方式の通信網であり、特に音声通信を想定して構成されたものである。音声通信網4は、具体的には、インターネットやWAN(Wide Area Network)、LAN(Local Area Network)、専用線、公衆交換電話網、携帯電話通信網などで構成することができる。
近端端末1および遠端端末2は、例えば、中央演算処理装置(CPU: Central Processing Unit)、主記憶装置(RAM: Random Access Memory)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。近端端末1および遠端端末2は、例えば、中央演算処理装置の制御のもとで各処理を実行する。近端端末1および遠端端末2に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて中央演算処理装置へ読み出されて他の処理に利用される。近端端末1および遠端端末2は、少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。近端端末1および遠端端末2は、具体的には、スマートフォンやタブレットのようなモバイル端末、もしくはデスクトップ型やラップトップ型のパーソナルコンピュータなどの音声送受信機能およびデータ通信機能を備えた情報処理装置である。
音響品質評価装置3は、例えば、中央演算処理装置(CPU: Central Processing Unit)、主記憶装置(RAM: Random Access Memory)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。音響品質評価装置3は、例えば、中央演算処理装置の制御のもとで各処理を実行する。音響品質評価装置3に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて中央演算処理装置へ読み出されて他の処理に利用される。音響品質評価装置3は、少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。音響品質評価装置3が備える各記憶部は、例えば、RAM(Random Access Memory)などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ(Flash Memory)のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。音響品質評価装置3は、具体的には、デスクトップ型やラックマウント型のサーバコンピュータなどのデータ通信機能およびデータ処理機能を備えた情報処理装置である。
ステップS1において、近端端末1と遠端端末2とが音響品質の評価対象とする通話を開始する。まず、近端端末1が近端話者の操作に従って遠端端末2へ発信を行う。遠端端末2は遠端話者の操作に従って近端端末1からの着信に応答する。これにより、近端端末1と遠端端末2との間で通話が確立する。ここでは近端端末1から遠端端末2へ発信する例を示したが、遠端端末2から近端端末1へ発信することで通話を確立しても構わない。
通話が確立すると、近端話者の発話した音声が近端端末1のマイクロホンM1により音響信号に変換され、送話部11がその音響信号を遠端端末2の受話部22へ送信する。遠端端末2の受話部22は、近端端末1の送話部11から受信した音響信号を遠端端末2のスピーカS2から出力する。遠端話者の発話した音声は遠端端末2のマイクロホンM2により音響信号に変換されるが、このとき遠端端末2のスピーカS2から出力された近端話者の音声の回り込みが遠端話者の音声に重畳して音響信号に変換される。遠端端末2の送話部21は、音響信号を近端端末1の受話部12へ送信する。遠端端末2が信号処理部23を備える場合、信号処理部23が送信される音響信号に対してエコーキャンセル処理およびノイズキャンセル処理の少なくとも一方を含む信号処理を行う。近端端末1の受話部12は、遠端端末2の送話部21から受信した音響信号を近端端末1のスピーカS1から出力する。このようにして、近端話者と遠端話者とは近端端末1と遠端端末2との間で確立した通話を介して会話を行う。
ステップS2において、音響品質評価装置3の評価値提示部31は、近端端末1の表示部13へ近端話者が音響品質の評価を入力する評価入力画面を表示させるための制御信号を送信する。近端端末1の表示部13は、受信した制御信号に従って評価入力画面を表示する。評価入力画面には、予め定めた複数の評価観点それぞれについて複数の段階に分類した評価カテゴリーが表示される。これらの評価カテゴリーには各評価観点での品質の高さに応じた評価値が割り当てられている。評価入力画面は、各評価観点について1つの評価カテゴリーのみが選択できるように設定されるものとする。
評価観点は、例えば、「相手の声の聞き取り易さ」「雑音感」「自分の声の戻り」の3つの観点を含む。「相手の声の聞き取り易さ」の評価観点に対しては、例えば「非常に聞き取りやすい」「聞き取りには問題がない」「少し聞き取りにくい」「聞き取りにくい」「非常に聞き取りにくい」の5段階の評価カテゴリーが設けられ、各評価カテゴリーには順に5, 4, 3, 2, 1の評価値が割り当てられる。「雑音感」の評価観点に対しては、例えば「雑音が全くない」「雑音が少しある」「雑音がある」「雑音がかなり重畳している」「雑音が非常に多く重畳している」の5段階の評価カテゴリーが設けられ、各評価カテゴリーには順に5, 4, 3, 2, 1の評価値が割り当てられる。「自分の声の戻り」の評価観点に対しては、例えば「自分の声の戻りが全くない」「自分の声の戻りが少しある」「自分の声の戻りがある」「自分の声の戻りが大きい」「自分の声の戻りが非常に大きい」の5段階の評価カテゴリーが設けられ、各評価カテゴリーには順に5, 4, 3, 2, 1の評価値が割り当てられる。上記の例で示した評価観点と評価カテゴリーと評価値の関係をまとめると、下記のようになる。
Figure 0007184173000001
図3に、上記の例の評価カテゴリーに基づいて評価を入力するための評価入力画面を例示する。評価入力画面130には、「相手の声の聞き取り易さ」の評価観点に対応するエリア131-1、「雑音感」の評価観点に対応するエリア131-2、および「自分の声の戻り」の評価観点に対応するエリア131-3が設けられる。エリア131-1には「相手の声の聞き取り易さ」を5段階に分類した評価カテゴリーを表すラベル132-1が表示され、各評価カテゴリーに対して一対一で5つのボタン133-1が設けられる。ボタン133-1は選択状態が切り替えられる機能を持ち、エリア131-1内で1つのみが選択できるように設定される。例えば、ボタン133-1はエリア131-1内でグループが設定されたオプションボタンである。エリア131-2およびエリア131-3についても同様にラベル132-2,132-3およびボタン133-2,133-3が設けられる。図3は評価入力画面のデザインの一例であり、操作の利便性等を鑑みて異なるデザインとしても構わない。
ステップS3において、近端話者は近端端末1のスピーカS1から出力される音声を受聴し、その音響品質を評価する。音響品質の評価は、表示部13に表示された評価入力画面において、各評価観点について、自らの主観に基づいて最も当てはまると考える評価カテゴリーを選択することで行う。図3の評価入力画面130の例であれば、「相手の声の聞き取り易さ」について最も当てはまる評価カテゴリーを選択し、そのラベル132-1に対応するボタン133-1を選択する。同様に、「雑音感」について最も当てはまる評価カテゴリーおよび「自分の声の戻り」について最も当てはまる評価カテゴリーにそれぞれ対応するボタン133-2,133-3を選択する。近端話者はすべての評価観点について評価カテゴリーを選択した後、確定ボタン134を押下する。近端端末1の入力部14は、評価入力画面130中の選択状態に従って、選択された各評価カテゴリーに割り当てられた評価値を音響品質評価装置3の評価値決定部32へ送信する。
ステップS4において、音響品質評価装置3の評価値決定部32は、近端端末1の入力部14から受信した各評価観点についての評価値に基づいて、音響品質に関する1つの主観評価値を決定する。具体的には、各評価観点についての評価値のうち最も低い評価値を音響品質に関する主観評価値として決定する。図3の例であれば、評価者は、「相手の声の聞き取り易さ」について「非常に聞き取りやすい」(評価値は5)、「雑音感」について「雑音がある」(評価値は3)、「自分の声の戻り」について「自分の声の戻りが少しある」(評価値は4)をそれぞれ選択しているため、主観評価値は最も低い評価値である“3”に決定する。評価値決定部32は、決定した主観評価値を集計部33へ出力する。
音響品質評価装置3の集計部33は、評価値決定部32から複数回入力された複数の主観評価値を集計し、その集計結果を集計結果記憶部30へ記憶する。複数の主観評価値は、同じ評価者により複数回実行された会話試験に基づく複数の主観評価値であってもよいし、1つの会話試験において複数の評価者が入力した複数の主観評価値であってもよいし、複数の評価者がそれぞれ複数回実行された会話試験に基づいて入力した複数の主観評価値であってもよい。集計部33は、集計結果記憶部30へ記憶された複数の主観評価値に基づいて、例えば平均等の統計処理を行って集計結果記憶部30へ記憶してもよい。
図4に、実施形態の音響品質評価システムによる評価試験の実験結果を示す。この試験では、4つの実験条件I~IVを設定し、各実験条件下で4名の評価者が通信相手を入れ替えながら4日間にわたって3回ずつの会話試験を行った。実験条件Iは、明らかに良い音であり、4~5の評価値が付くことが想定される(言い換えると、評価値1~2を付ける人はいないであろう)条件である。実験条件IIは、明らかに悪い音であり、1~2の評価値が付くことが想定される(言い換えると、評価値4~5を付ける人はいないであろう)条件である。実験条件IIIは、多くの人が普通と判断する音のうち比較的良い音であり、3~4の評価値が付くことが想定される(言い換えると、評価値1を付ける人はいないであろう)条件である。実験条件IVは、多くの人が普通と判断する音のうち比較的悪い音であり、2~3の評価値が付くことが想定される(言い換えると、評価値5を付ける人はいないであろう)条件である。このような実験条件それぞれで、従来の一般的な評価カテゴリー(「大変良い」「良い」「やや悪い」「悪い」「大変悪い」)と、実施形態の評価カテゴリー(3つの評価観点それぞれで5段階の評価カテゴリーを設定)とを用いて会話試験を行い、それぞれの評価値の平均を集計した。図4に示すように、実施形態の評価カテゴリーでは想定評価値の範囲内の評価値を得ることができたが、従来の評価カテゴリーでは、特に低い評価値が付くことが想定される実験条件IIやIVで、想定よりも高い評価値が付いていることがわかる。すなわち、従来の評価カテゴリーでは高い評価値を与える傾向がある評価者であっても、実施形態の評価カテゴリーを用いれば適切な評価値を得られることが、本実験により実証されたと言える。
以上、この発明の実施の形態について説明したが、具体的な構成は、これらの実施の形態に限られるものではなく、この発明の趣旨を逸脱しない範囲で適宜設計の変更等があっても、この発明に含まれることはいうまでもない。実施の形態において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
[プログラム、記録媒体]
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
10 音響品質評価システム
1 近端端末
2 遠端端末
3 音響品質評価装置
4 音声通信網
11 送話部
12 受話部
13 表示部
14 入力部
21 送話部
22 受話部
23 信号処理部
30 集計結果記憶部
31 評価値提示部
32 評価値決定部
33 集計部

Claims (4)

  1. 複数の通信端末間で行われる通話の音響品質を評価する音響品質評価装置であって、
    複数の評価観点それぞれについて所定数の段階に分類した評価カテゴリーを評価者へ提示する評価値提示部と、
    上記評価者が各評価観点について選択した評価カテゴリーに割り当てられた評価値のうち最も低い評価値を上記音響品質の主観評価値として決定する評価値決定部と、
    を含む音響品質評価装置。
  2. 請求項1に記載の音響品質評価装置であって、
    上記評価観点は、少なくとも相手の声の聞き取り易さ、雑音感、および自分の声の戻りを含み、
    上記評価カテゴリーは、各評価観点での品質の高さを5段階で分類し、品質が高いほど高い評価値が割り当てられている、
    音響品質評価装置。
  3. 複数の通信端末間で行われる通話の音響品質を評価する音響品質評価方法であって、
    評価値提示部が、複数の評価観点それぞれについて所定数の段階に分類した評価カテゴリーを評価者へ提示し、
    評価値決定部が、上記評価者が各評価観点について選択した評価カテゴリーに割り当てられた評価値のうち最も低い評価値を上記音響品質の主観評価値として決定する、
    音響品質評価方法。
  4. 請求項1または2に記載の音響品質評価装置としてコンピュータを機能させるためのプログラム。
JP2021518230A 2019-05-07 2019-05-07 音響品質評価装置、音響品質評価方法、およびプログラム Active JP7184173B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/018260 WO2020225850A1 (ja) 2019-05-07 2019-05-07 音響品質評価装置、音響品質評価方法、およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2020225850A1 JPWO2020225850A1 (ja) 2020-11-12
JP7184173B2 true JP7184173B2 (ja) 2022-12-06

Family

ID=73050819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021518230A Active JP7184173B2 (ja) 2019-05-07 2019-05-07 音響品質評価装置、音響品質評価方法、およびプログラム

Country Status (3)

Country Link
US (1) US11699458B2 (ja)
JP (1) JP7184173B2 (ja)
WO (1) WO2020225850A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020240768A1 (ja) * 2019-05-30 2020-12-03 日本電信電話株式会社 自動車内会話評価値変換装置、自動車内会話評価値変換方法、およびプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004146922A (ja) 2002-10-22 2004-05-20 Nippon Telegr & Teleph Corp <Ntt> VoIP通信の品質レベル毎に対応する課金処理サービス装置とその方法、およびそのプログラム
US20110141925A1 (en) 2009-12-10 2011-06-16 Mihails Velenko Measuring call quality
JP2015142212A (ja) 2014-01-28 2015-08-03 エヌ・ティ・ティ・コミュニケーションズ株式会社 通信端末、音声品質測定サーバ、コーデック制御方法及びコンピュータプログラム
JP2016045389A (ja) 2014-08-25 2016-04-04 日本電信電話株式会社 データ構造、データ生成装置、データ生成方法、およびプログラム
JP2016525702A (ja) 2013-06-26 2016-08-25 クゥアルコム・インコーポレイテッドQualcomm Incorporated 音声信号品質を測定するためのシステムおよび方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6965597B1 (en) * 2001-10-05 2005-11-15 Verizon Laboratories Inc. Systems and methods for automatic evaluation of subjective quality of packetized telecommunication signals while varying implementation parameters
US7274670B2 (en) * 2002-09-27 2007-09-25 Netiq Corporation Methods, systems and computer program products for assessing network quality
US9524733B2 (en) * 2012-05-10 2016-12-20 Google Inc. Objective speech quality metric
US9386308B2 (en) * 2013-07-16 2016-07-05 Cisco Technology, Inc. Quality optimization with buffer and horizon constraints in adaptive streaming

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004146922A (ja) 2002-10-22 2004-05-20 Nippon Telegr & Teleph Corp <Ntt> VoIP通信の品質レベル毎に対応する課金処理サービス装置とその方法、およびそのプログラム
US20110141925A1 (en) 2009-12-10 2011-06-16 Mihails Velenko Measuring call quality
JP2016525702A (ja) 2013-06-26 2016-08-25 クゥアルコム・インコーポレイテッドQualcomm Incorporated 音声信号品質を測定するためのシステムおよび方法
JP2015142212A (ja) 2014-01-28 2015-08-03 エヌ・ティ・ティ・コミュニケーションズ株式会社 通信端末、音声品質測定サーバ、コーデック制御方法及びコンピュータプログラム
JP2016045389A (ja) 2014-08-25 2016-04-04 日本電信電話株式会社 データ構造、データ生成装置、データ生成方法、およびプログラム

Also Published As

Publication number Publication date
US11699458B2 (en) 2023-07-11
WO2020225850A1 (ja) 2020-11-12
US20220277765A1 (en) 2022-09-01
JPWO2020225850A1 (ja) 2020-11-12

Similar Documents

Publication Publication Date Title
US9942400B2 (en) System and methods for analyzing multichannel communications including voice data
KR101361724B1 (ko) 재귀적 적응형 상호작용 관리 시스템
JP6163468B2 (ja) 音響品質評価装置、音響品質評価方法、およびプログラム
US7876890B2 (en) Method for coordinating co-resident teleconferencing endpoints to avoid feedback
CN102461139B (zh) 增强的通信桥接器
US20070112563A1 (en) Determination of audio device quality
US8467321B1 (en) Real time voice quality statistics in audio teleconferencing
JP7310939B2 (ja) 評価方法、評価装置、およびプログラム
JP7238978B2 (ja) 評価装置、評価方法、およびプログラム
JP4522345B2 (ja) 電話業務検査システム及びそのプログラム
JP7184173B2 (ja) 音響品質評価装置、音響品質評価方法、およびプログラム
JP2018064162A (ja) 音響品質評価装置、音響品質評価方法、およびプログラム
Möller et al. Telephone speech quality prediction: towards network planning and monitoring models for modern network scenarios
JP6363429B2 (ja) データ構造、データ生成装置、データ生成方法、およびプログラム
JP7184174B2 (ja) データ補正装置、データ補正方法、およびプログラム
Holub et al. Delay effect on conversational quality in telecommunication networks: Do we mind?
Issing et al. Conversational quality as a function of delay and interactivity
Möller et al. A new dimension-based framework model for the quality of speech communication services
JP6126053B2 (ja) 音響品質評価装置、音響品質評価方法、およびプログラム
JP6594840B2 (ja) 音響品質評価装置、音響品質評価方法、データ構造、およびプログラム
WO2023218600A1 (ja) 通話品質評価装置、通話品質評価方法、プログラム
CN112151068B (zh) 用于确定经由电信网络传输的语音的质量的方法
JP2006203844A (ja) 通信品質推定方法、装置、およびプログラム
Möller et al. Towards a universal value scale for quantifying the quality of speech communication across services
Rumsey Sound field control

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221025

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221107

R150 Certificate of patent or registration of utility model

Ref document number: 7184173

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150