JP4745916B2 - 雑音抑圧音声品質推定装置、方法およびプログラム - Google Patents

雑音抑圧音声品質推定装置、方法およびプログラム Download PDF

Info

Publication number
JP4745916B2
JP4745916B2 JP2006225158A JP2006225158A JP4745916B2 JP 4745916 B2 JP4745916 B2 JP 4745916B2 JP 2006225158 A JP2006225158 A JP 2006225158A JP 2006225158 A JP2006225158 A JP 2006225158A JP 4745916 B2 JP4745916 B2 JP 4745916B2
Authority
JP
Japan
Prior art keywords
noise
speech
signal
suppressed
speech signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006225158A
Other languages
English (en)
Other versions
JP2008015443A (ja
Inventor
則次 恵木
仁志 青木
玲 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006225158A priority Critical patent/JP4745916B2/ja
Publication of JP2008015443A publication Critical patent/JP2008015443A/ja
Application granted granted Critical
Publication of JP4745916B2 publication Critical patent/JP4745916B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Description

本発明は、雑音抑圧処理技術を利用する音声通信サービスにおける音声品質の評価技術に係り、特に周囲騒音の影響が大きい通信環境下での音声品質を評価する技術に関するものである。
周囲騒音が大きい環境の音声通信では、送話器に騒音が混入することで、受話者は雑音が重畳した音声を受聴することとなる。ハンズフリー通信では、ハンドセットやヘッドセットを利用する場合に比べて、人間の口とマイクとの間の距離が長くなるため、マイクの収音範囲が広くなり、周囲騒音の影響を受けやすい。また、携帯電話による音声通信では、周囲騒音の大きい室外の環境で使用されることが多いため、ハンドセット通信においても周囲騒音の影響を受けやすい。そのため、このような通信形態では雑音抑圧処理技術が重要となる。
従来、様々な手法を用いた雑音抑圧処理技術が開発されている。高品質な音声通信サービスを提供するためには、雑音抑圧処理技術の性能を正確に把握し、方式のパラメータ最適化および方式選定を行うことが重要である。そのため、雑音抑圧音声の品質評価法が望まれる。
音声品質評価の基本は、実際に音声受聴や会話を行うことによる心理評価に基づく主観品質評価である。主観品質評価は、ユーザが実感する品質を直接的に評価することができる反面、十分な数の被験者や専用の設備が必要となり、多大なコストや時間を要するなど簡便ではない。
そこで、人間による主観評価の代わりに、音声信号の物理量に基づいて効率的に主観品質を推定する技術が望まれる。このような技術を客観品質評価と呼ぶ。現在、雑音抑圧処理性能の客観的指標として最も広く用いられている特徴量に雑音除去量が挙げられるが、主観品質との対応という観点では必ずしも十分ではない。なぜなら、雑音の抑圧処理の過程で音声や雑音に歪みが生じ、主観品質に影響を与える要因となるため、主観品質を適切に推定するためには、このような歪みも考慮する必要があるからである。
音声歪みを評価可能な客観品質評価技術として、非特許文献1に開示されたPESQ(Perceptual evaluation of speech quality )がある。PESQは、原音声信号と、評価対象となる符号化方式や装置で処理された劣化音声信号とを入力とし、両信号の差分から評価対象の品質を測定する技術である。図8、図9はPESQを用いた品質評価系の構成例を示すブロック図である。図8は雑音が重畳していない音声信号の品質評価を行う場合の構成を示し、図9は雑音が重畳している音声信号の品質評価を行う場合の構成を示している。図8、図9において、100は評価対象装置、101はPESQ装置、102は音声加算器である。
ITU-T Recommendation P.862,「Perceptual evaluation of speech quality(PESQ),an obective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs」,Feb.2001
図9に示すとおり、PESQでは、雑音が重畳される前の音声信号と雑音抑圧音声信号とを入力としているため、音声歪みを考慮した雑音重畳音声を品質評価することは可能である。しかしながら、PESQでは、抑圧処理前の雑音に関する入力が無いために、雑音歪みを考慮した評価を行うことができない。よって、非特許文献1に開示されたPESQでは、雑音抑圧音声の評価を正確に行うことはできないという問題点があった。
本発明は、上記課題を解決するためになされたもので、雑音抑圧音声の評価を正確に行うことができる雑音抑圧音声品質推定装置、方法およびプログラムを提供することを目的とする。
本発明は、雑音抑圧音声の品質を客観的に推定する雑音抑圧音声品質推定装置であって、評価対象となる雑音抑圧処理装置への入力として雑音重畳音声信号を与えたときに、前記雑音抑圧処理装置から出力される雑音抑圧音声信号の品質要因の特徴量を検出する検出手段と、この検出手段により検出された特徴量に基づいて前記雑音抑圧音声信号の品質を推定する推定手段とを備え、前記検出手段は、前記雑音抑圧音声信号を一定時間で区切ったときの各区間が音声区間か無音声区間かを判別する判別手段と、音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する音声区間特徴量検出手段と、無音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する無音声区間特徴量検出手段とを備え、前記音声区間特徴量検出手段は、雑音が重畳される前の音声信号とこれに対応する前記音声区間における雑音抑圧音声信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として音声歪みを検出する音声歪み測定部と、前記雑音抑圧音声信号の品質要因の特徴量として前記音声区間における雑音抑圧音声信号の音量を検出する音量測定部とを有し、前記無音声区間特徴量検出手段は、前記無音声区間における雑音抑圧音声信号とこれに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として雑音歪みを検出する雑音歪み測定部と、前記雑音抑圧音声信号の品質要因の特徴量として前記無音声区間における雑音抑圧音声信号の雑音量を検出する雑音量測定部とを有し、前記雑音歪みは、前記無音声区間における雑音抑圧音声信号を劣化音声信号、これに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号を参照信号としたときのPESQ値もしくはWideband−PESQ値であり、前記推定手段は、前記音声歪みと前記雑音抑圧音声信号の音量と前記雑音歪みと前記雑音抑圧音声信号の雑音量とに基づいて前記雑音抑圧音声信号の品質を推定することを特徴とするものである。
また、本発明の雑音抑圧音声品質推定装置の1構成例は、さらに、音声信号が予め登録された音声データベースと、この音声データベースの音声信号を実通話環境下で再生する音声再生手段と、前記再生された音声を集音したときに得られる信号を前記雑音重畳音声信号として出力する音声録音手段とを備えるものである。
また、本発明の雑音抑圧音声品質推定装置の1構成例は、さらに、音声信号が予め登録された音声データベースと、実通話環境下で雑音信号を集音する音声録音手段と、前記音声データベースの音声信号と前記音声録音手段が集音した雑音信号とを加算した信号を前記雑音重畳音声信号として出力する音声加算手段とを備えるものである。
また、本発明の雑音抑圧音声品質推定装置の1構成例は、さらに、音声信号が予め登録された音声データベースと、雑音信号が予め登録された雑音データベースと、前記音声データベースの音声信号と前記雑音データベースの雑音信号とを加算した信号を前記雑音重畳音声信号として出力する音声加算手段とを備えるものである。
また、本発明の雑音抑圧音声品質推定方法は、評価対象となる雑音抑圧処理装置への入力として雑音重畳音声信号を与えたときに、前記雑音抑圧処理装置から出力される雑音抑圧音声信号の品質要因の特徴量を検出する検出手順と、この検出手順により検出された特徴量に基づいて前記雑音抑圧音声信号の品質を推定する推定手順とを備え、前記検出手順は、前記雑音抑圧音声信号を一定時間で区切ったときの各区間が音声区間か無音声区間かを判別する判別手順と、音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する音声区間特徴量検出手順と、無音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する無音声区間特徴量検出手順とからなり、前記音声区間特徴量検出手順は、雑音が重畳される前の音声信号とこれに対応する前記音声区間における雑音抑圧音声信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として音声歪みを検出する音声歪み測定手順と、前記雑音抑圧音声信号の品質要因の特徴量として前記音声区間における雑音抑圧音声信号の音量を検出する音量測定手順とからなり、前記無音声区間特徴量検出手順は、前記無音声区間における雑音抑圧音声信号とこれに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として雑音歪みを検出する雑音歪み測定手順と、前記雑音抑圧音声信号の品質要因の特徴量として前記無音声区間における雑音抑圧音声信号の雑音量を検出する雑音量測定手順とからなり、前記雑音歪みは、前記無音声区間における雑音抑圧音声信号を劣化音声信号、これに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号を参照信号としたときのPESQ値もしくはWideband−PESQ値であり、前記推定手順は、前記音声歪みと前記雑音抑圧音声信号の音量と前記雑音歪みと前記雑音抑圧音声信号の雑音量とに基づいて前記雑音抑圧音声信号の品質を推定することを特徴とするものである。
また、本発明の雑音抑圧音声品質推定プログラムは、評価対象となる雑音抑圧処理装置への入力として雑音重畳音声信号を与えたときに、前記雑音抑圧処理装置から出力される雑音抑圧音声信号の品質要因の特徴量を検出する検出手順と、この検出手順により検出された特徴量に基づいて前記雑音抑圧音声信号の品質を推定する推定手順とをコンピュータに実行させ、前記検出手順は、前記雑音抑圧音声信号を一定時間で区切ったときの各区間が音声区間か無音声区間かを判別する判別手順と、音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する音声区間特徴量検出手順と、無音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する無音声区間特徴量検出手順とからなり、前記音声区間特徴量検出手順は、雑音が重畳される前の音声信号とこれに対応する前記音声区間における雑音抑圧音声信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として音声歪みを検出する音声歪み測定手順と、前記雑音抑圧音声信号の品質要因の特徴量として前記音声区間における雑音抑圧音声信号の音量を検出する音量測定手順とからなり、前記無音声区間特徴量検出手順は、前記無音声区間における雑音抑圧音声信号とこれに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として雑音歪みを検出する雑音歪み測定手順と、前記雑音抑圧音声信号の品質要因の特徴量として前記無音声区間における雑音抑圧音声信号の雑音量を検出する雑音量測定手順とからなり、前記雑音歪みは、前記無音声区間における雑音抑圧音声信号を劣化音声信号、これに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号を参照信号としたときのPESQ値もしくはWideband−PESQ値であり、前記推定手順は、前記音声歪みと前記雑音抑圧音声信号の音量と前記雑音歪みと前記雑音抑圧音声信号の雑音量とに基づいて前記雑音抑圧音声信号の品質を推定することを特徴とするものである。
本発明によれば、評価対象となる雑音抑圧処理装置への入力として雑音重畳音声信号を与え、雑音抑圧処理装置から出力される雑音抑圧音声信号の品質要因の特徴量を検出する際に、雑音重畳音声信号又は雑音重畳音声信号の元となる雑音信号と雑音抑圧音声信号とを比較することにより、雑音抑圧音声信号の品質要因の特徴量として少なくとも雑音歪みを検出し、この特徴量に基づいて雑音抑圧音声信号の品質を推定することにより、雑音抑圧音声のユーザ体感に即した品質推定が可能となり、雑音抑圧処理技術の適切な設定や性能の比較を安価かつ容易に行うことが可能となる。例えば、音声通話を行う環境に応じた音声信号および雑音信号を入力として与えることで、各環境における雑音抑圧処理技術の性能を知ることができる。また、雑音抑圧処理技術を開発している業者にとって、開発技術の性能を知ることを可能とする。さらに、音声通信端末を設計している業者にとって、端末内に雑音抑圧処理技術を組み込む場合に、想定される使用環境に応じた最良の技術の選択および設定を可能とする。
本発明では、雑音抑圧音声信号の雑音量を測定する際に、一定時間ごとの音量を測定することで突発的な雑音を捉える。これにより、突発的な雑音が体感品質に与える影響を考慮した雑音抑圧音声信号の雑音量の測定を行うことが可能となる。
本発明では、雑音抑圧音声信号の音声歪みを測定する際に、雑音抑圧音声信号と雑音重畳音声信号の元となる音声信号を比較することにより検出した歪みの大きさから、雑音の音量に基づいて雑音による歪みの影響を取り除く。これにより、雑音抑圧音声信号の純粋な音声歪みの測定を行うことが可能となる。
また、本発明では、音声データベースの音声信号を実通話環境下で再生し、再生された音声を集音したときに得られる信号を雑音重畳音声信号として出力することにより、実通話環境下における雑音抑圧音声のユーザ体感に即した品質推定を正確かつ容易に行うことが可能となる。
また、本発明では、実通話環境下で雑音信号を集音し、音声データベースの音声信号と集音した雑音信号とを加算した信号を雑音重畳音声信号として出力することにより、実通話環境下における雑音抑圧音声のユーザ体感に即した品質推定を正確かつ容易に行うことが可能となる。
また、本発明では、音声データベースの音声信号と雑音データベースの雑音信号とを加算した信号を雑音重畳音声信号として出力することにより、様々な雑音環境下における雑音抑圧音声のユーザ体感に即した品質推定を正確かつ容易に行うことが可能となる。
[第1の実施の形態]
以下、本発明の実施の形態について図面を用いて説明する。図1は、本発明の第1の実施の形態に係る雑音抑圧音声品質推定装置の構成例を示すブロック図である。
図1に示すように、雑音抑圧音声品質推定装置1は、音声データベース部2、音声再生部3、スピーカ4、音声録音部5、マイク6、音声区間検出部7(判別手段)、遅延補正部8−1,8−2−1,8−2−2、スイッチ制御部9、音声連結部10(10−1〜10−4)、音声歪み測定部11、雑音歪み測定部12、音量測定部13、雑音量測定部14、音声品質推定部15(推定手段)、音声品質出力部16、スイッチ20,21,22を備えている。
音声区間検出部7と遅延補正部8−1,8−2−1,8−2−2とスイッチ制御部9と音声連結部10と音声歪み測定部11と雑音歪み測定部12と音量測定部13と雑音量測定部14とスイッチ20〜22とは、雑音抑圧音声信号の品質要因の特徴量を検出する検出手段を構成している。
音声再生部3は、音声データベース部2から音声信号Aを取得し、音声通話を行う環境下で音声信号Aをスピーカ4から出力する。
マイク6は、スピーカ4から出力された音声を集音する。このとき、マイク6が集音する音声には雑音が重畳されているので、マイク6から出力される音声信号を雑音重畳音声信号Bとする。音声録音部5は、マイク6が集音した雑音重畳音声信号Bを取得して評価対象装置100(雑音抑圧処理装置)と遅延補正部8−2−2に入力する。雑音重畳音声信号Bを評価対象装置100に入力することで、評価対象装置100から出力される雑音抑圧処理された音声信号をCとする。評価対象装置100の例としては、例えば音声通信端末がある。
遅延補正部8−1は、音声信号Aと雑音抑圧音声信号Cとを入力とし、雑音抑圧音声信号Cの音声信号Aに対する遅延時間を測定する。遅延補正部8−1は、音声信号Aと雑音抑圧音声信号Cとの間の短時間相互相関係数が最大となる時間を求めることにより、雑音抑圧音声信号Cの遅延時間を測定する。遅延補正部8−2−1は、音声信号Aに遅延補正部8−1で測定された遅延時間分だけ遅延を与えることにより、雑音抑圧音声信号Cと時刻が同期した音声信号A’を出力する。遅延補正部8−2−2は、雑音重畳音声信号Bに遅延補正部8−1で測定された遅延時間分だけ遅延を与えることにより、雑音抑圧音声信号Cと時刻が同期した雑音重畳音声信号B’を出力する。
音声区間検出部7は、音声信号A’を一定の短区間(20ms)ごとに分けて、各区間が音声の存在する音声区間か無音声の区間かをVAD(Voice Activity Detection)を用いて区間ごとに判別する。音声区間検出部7は、このようにして得られた音声信号A’の各区間の種別情報(音声区間又は無音性区間)をスイッチ制御部9に送信する。
スイッチ制御部9は、音声区間検出部7から通知された音声信号A’の各区間の種別を基にスイッチ20〜22を制御する。
図2は、音声信号A’の短区間x1が音声区間と判別されたときのスイッチ制御を示す図である。スイッチ制御部9は、音声信号A’の短区間x1が音声区間であることを示す種別情報が入力された場合、スイッチ20を切り換えて、音声信号A’の短区間x1が音声連結部10−1に入力されるようにすると同時に、スイッチ21を切り換えて、雑音抑圧音声信号Cの短区間が音声連結部10−3に入力されるようにする。雑音抑圧音声信号Cは音声信号A’と同期しているため、音声信号A’の短区間x1に対応した雑音抑圧音声信号Cの短区間が音声連結部10−3に入力されることになる。また、スイッチ制御部9は、スイッチ22を制御して、音声連結部10−2への信号入力を無入力とする。
図3は、音声信号A’の短区間x2が無音声区間と判別されたときのスイッチ制御を示す図である。スイッチ制御部9は、音声信号A’の短区間x2が無音声区間であることを示す種別情報が入力された場合、スイッチ21を切り換えて、雑音抑圧音声信号Cの短区間が音声連結部10−4に入力されるようにすると同時に、スイッチ22を切り換えて、雑音重畳音声信号B’の短区間が音声連結部10−2に入力されるようにする。雑音重畳音声信号B’および雑音抑圧音声信号Cは音声信号A’と同期しているため、音声信号A’の短区間x2に対応した雑音重畳音声信号B’の短区間が音声連結部10−2に入力され、短区間x2に対応した雑音抑圧音声信号Cの短区間が音声連結部10−4に入力されることになる。また、スイッチ制御部9は、スイッチ20を制御して、音声連結部10−1への信号入力を無入力とする。
音声連結部10−1は、最初に入力された短区間の信号を記憶し、以降は短区間の信号が入力される度に、入力された短区間の信号を現在記憶している最新の信号の後ろに連結して、この連結した信号を新たに記憶する。音声連結部10−1は、入力される全ての音声信号A’の短区間を以上のように連結して記憶する。音声連結部10−2,10−3,10−4は、それぞれ同様に入力される短区間の信号を連結して記憶する。
これにより、音声連結部10−1には音声信号A’の全ての音声短区間を連結した音声信号aが記憶され、音声連結部10−2には音声信号A’の全ての無音声短区間に対応した雑音重畳音声信号B’の短区間を連結した雑音信号bが記憶され、音声連結部10−3には音声信号A’の全ての音声短区間に対応した雑音抑圧音声信号Cの短区間を連結した音声信号c1が記憶され、音声連結部10−4には音声信号A’の全ての無音声短区間に対応した雑音抑圧音声信号Cの短区間を連結した雑音信号c2が記憶される。音声信号A’、雑音重畳音声信号B’および雑音抑圧音声信号Cと、音声信号a,c1および雑音信号b,c2との関係を図4に示す。なお、図4の縦軸は信号レベル、横軸は時間である。
音声歪み測定部11には、音声信号a,c1が入力される。音声歪み測定部11は、音声信号aとc1とを比較することにより、雑音抑圧音声信号Cの音声歪みを測定する。本実施の形態では、音声の比較に公知のPESQを用い、音声信号aを参照信号、音声信号c1を劣化音声信号として音声歪みの測定を行う。PESQでは歪みの特徴量をPESQ値として出力する。音声歪み測定部11は、測定したPESQ値を音声歪み量x1として音声品質推定部15に送信する。
雑音歪み測定部12には、雑音信号b,c2が入力される。雑音歪み測定部12は、雑音信号bとc2とを比較することにより、雑音抑圧音声信号Cの雑音歪みを測定する。本実施の形態では、音声歪みの測定のときと同様に、音声の比較に公知のPESQを用い、雑音信号bを参照信号、雑音信号c2を劣化音声信号として測定を行う。雑音歪み測定部12は、測定したPESQ値を雑音歪み量x2として音声品質推定部15に送信する。
音量測定部13には、音声信号c1が入力される。音量測定部13は、音声信号c1の音量を測定することにより、雑音抑圧音声信号Cの音量を測定する。本実施の形態では、音量の測定にISO532で規格化された方法を用いる。音量測定部13は、測定した音量x3の値を音声品質推定部15に送信する。
雑音量測定部14には、雑音信号c2が入力される。雑音量測定部14は、雑音信号c2の音量を測定することにより、雑音抑圧音声信号Cの雑音量を測定する。本実施の形態では、音量の測定のときと同様に、測定にISO532で規格化された方法を用いる。雑音量測定部14は、測定した雑音量x4の値を音声品質推定部15に送信する。
音声品質推定部15は、音声歪み測定部11、雑音歪み測定部12、音量測定部13および雑音量測定部14から入力された雑音抑圧音声信号Cの音声歪み量、雑音歪み量、音量および雑音量を基に、雑音抑圧音声信号Cの主観品質を推定し、この主観品質の推定値を音声品質出力部16へ送信する。音声品質推定部15では、例えば以下の方法によって求めた推定式を用いて主観品質を推定することができる。
まず、推定式を求めるために、音声歪み、雑音歪み、音量、雑音量に対して様々な特徴量を与えた音声サンプルを予め用意し、各音声サンプルに対して複数の被験者が5段階の絶対範疇尺度による主観品質評価を行う。この主観品質評価により得られた評価値の平均をMOS(Mean Opinion Score)値と呼ぶ。MOS値では、5点が非常に良く、1点が非常に悪いということを示している。
そして、各音声サンプルに対するMOS値を基に、音声歪みと雑音歪みと音量と雑音量の4つの品質要因の特徴量を変数として主観品質を推定する式を重回帰分析を用いて求めることで、以下のような式(1)を導出する。
y=α1・x1+α2・x2+α3・x3+α4・x4+α5 ・・・(1)
ここで、x1は音声歪み量、x2は雑音歪み量、x3は音量、x4は雑音量、yはMOS値(主観品質推定値)を表している。α1、α2、α3、α4、α5は定数である。音声品質推定部15は、式(1)を用いて主観品質の推定値を求める。
音声品質出力部16は、音声品質推定部15から入力された雑音抑圧音声信号Cの主観品質の推定値を、雑音抑圧音声品質推定装置1の出力値として出力する。
以上のように、本実施の形態では、従来の問題点を解決するために、雑音抑圧処理前と処理後の雑音を比較して、雑音抑圧音声の雑音歪みを検出する。このために、本実施の形態では、雑音抑圧処理前の雑音信号に関する情報として、抑圧処理前の雑音重畳音声信号を用いる。さらに、雑音抑圧処理後の雑音を得るために、雑音抑圧音声信号を音声区間と無音声区間に分ける。無音声区間における雑音抑圧処理前と処理後の雑音の差分より、雑音抑圧音声の雑音歪みを正確に検出することができる。また、本実施の形態では、無音声区間の雑音抑圧音声の音量を測定することで雑音量を検出する。さらに、本実施の形態では、雑音抑圧音声信号の音声区間における、音声と雑音抑圧音声の差分により音声歪みを検出し、この音声区間の雑音抑圧音声の音量を測定することで音量を検出する。
このようにして検出した雑音抑圧音声の品質要因である音声歪み、雑音歪み、音量、雑音量から、雑音抑圧音声のユーザ体感品質を推定する。本実施の形態では、雑音抑圧音声の品質を推定するために、予め求めた推定式を用いる。この推定式は、各品質要因に対して様々な特徴量の雑音抑圧音声を用意し、主観品質評価実験によってそれぞれの主観品質評価値を取得して、取得した主観品質評価値と品質要因の特徴量の関係から導出したものである。
こうして、本実施の形態では、従来の客観品質評価では不可能であった雑音歪みについて考慮した雑音抑圧音声の品質評価を容易に行うことが可能となる。これにより、本実施の形態では、従来技術よりもユーザ体感品質に近い推定を行うことができる。また、本実施の形態では、音声データベース部2の音声信号を実通話環境下で再生し、再生した音声を集音したときに得られる信号を雑音重畳音声信号とすることにより、実際の通話環境下で生じる雑音重畳音声信号を用いて、雑音抑圧音声のユーザ体感に即した品質推定を正確かつ容易に行うことが可能となる。
[第2の実施の形態]
以下、本発明の第2の実施の形態について図面を用いて説明する。図5は、本発明の第2の実施の形態に係る雑音抑圧音声品質推定装置の構成例を示すブロック図であり、図1と同様の構成には同一の符号を付してある。
本実施の形態においても、雑音抑圧音声品質推定装置の構成は第1の実施の形態とほぼ同様であるので、第1の実施の形態と異なる部分のみ説明する。
まず、第1の実施の形態では、雑音量測定部14が雑音信号c2の音量を測定する際に、ISO532で規格化された方法を用いるとしたが、このISO532で規格化された方法を実施する際に、以下の方法を用いることもできる。雑音量測定部14は、一定時間t(ms)ごとに測定した音量B1,B2,・・・,Bnを式(2)に代入することで、突発的な雑音が体感品質に与える影響を考慮した雑音c2の音量x5[dB]を算出する。本実施の形態ではt=120、p=4とするが、この値に限定されるものではない。雑音量測定部14は、測定した音量x5を雑音c2の雑音量として音声品質推定部15に送信する。また、雑音量測定部14は、雑音量x5とは別に、ISO532で規格化された方法を用いて雑音c2の音量x4[dB]を算出する。雑音量測定部14は、測定した音量x4を音声歪み測定部11に送信する。
Figure 0004745916
次に、第1の実施の形態では、音声歪み測定部11における音声の比較にPESQを用いたが、PESQに代えてWideband−PESQを用いてもよい。Wideband−PESQは公知のPESQの対象範囲を電話帯域から広帯域に拡張した技術であり、7kHz帯域までを考慮した音声歪みの評価が可能である。本実施の形態の場合、音声歪み測定部11には、音声a,c1の他に、音量測定部13から音量x3が入力され、雑音量測定部14から音量x4が入力される。
音声歪み測定部11は、音声aと音声c1の比較により雑音抑圧音声Cの音声歪みを得る。本実施の形態では、Wideband−PESQを用い、音声aを参照信号、音声c1を劣化音声としてW−PESQ値x6’を算出する。しかし、Wideband−PESQは重畳する雑音も歪みとして捉えるため、W−PESQ値x6’に対して、音声区間の音声の音量x3と無音声区間の雑音の音量x4に基づいて補正を加える。W−PESQ値x6’、音量x3,x4を式(3)に代入することにより、W−PESQ値x6’を補正した値x6を得る。
Figure 0004745916
式(3)は、α1と、x6’/(1−x6’/α2 α3(x3-x4))のうちどちらか小さい方を補正値x6とすることを意味している。ここでα1,α2,α3は定数である。本実施の形態ではα1=4.644、α2=3、α3=0.07としたが、この値に限定されるものではない。音声歪み測定部11は、測定した値x6を音声c1の音声歪み量として音声品質推定部15に送信する。
次に、第1の実施の形態では、雑音歪み測定部12における音声の比較にPESQを用いたが、PESQに代えてWideband−PESQを用いてもよい。雑音歪み測定部12には、雑音b,c2が入力される。雑音歪み測定部12は、雑音bと雑音c2の比較により雑音抑圧音声Cの雑音歪みを得る。本実施の形態では、Wideband−PESQを用い、雑音bを参照信号、雑音c2を劣化音声としてW−PESQ値x7を算出する。雑音歪み測定部12は、算出したW−PESQ値x7を音声c1の雑音歪み量として音声品質推定部15に送信する。
音声の比較にPESQに代えてWideband−PESQを用いる場合、音声品質推定部15は、入力された音量x3、雑音量x5、音声歪み量x6、雑音歪み量x7をもとに、雑音抑圧音声信号Cの主観品質を推定する。音声品質推定部15は、式(4)に音量x3、雑音量x5、音声歪み量x6、雑音歪み量x7を代入することで値Qを算出する。
Figure 0004745916
ただし、式(4)ではx3−x5≧10を制約条件とする。ここで、β1〜β11は定数である。本実施の形態では、β1=3.7、β2=0.215、β3=0.4、β4=3、β5=1.1、β6=0.9、β7=0.05、β8=0.2、β9=4、β10=0.0002、β11=24としたが、この値に限定されるものではない。音声品質推定部15は、算出した値Qを雑音抑圧音声信号Cの主観品質の推定値として音声品質出力機能16へ送信する。
他の構成は第1の実施の形態と同じである。こうして、本実施の形態においても、第1の実施の形態と同様の効果を得ることができる。
[第3の実施の形態]
以下、本発明の第3の実施の形態について図面を用いて説明する。図6は、本発明の第3の実施の形態に係る雑音抑圧音声品質推定装置の構成例を示すブロック図であり、図1と同一の構成には同一の符号を付してある。
図6に示すように、雑音抑圧音声品質推定装置17は、音声データベース部2、音声録音部5、マイク6、音声区間検出部7、遅延補正部8−1,8−2−1,8−2−2、スイッチ制御部9、音声連結部10(10−1〜10−4)、音声歪み測定部11、雑音歪み測定部12、音量測定部13、雑音量測定部14、音声品質推定部15、音声品質出力部16、音声加算部18、スイッチ20〜22を備えている。
本実施の形態では、通話環境下においてマイク6が収音して音声録音部5が取得する実環境雑音を雑音信号Bとする。音声録音部5は、雑音信号Bを音声加算部18と遅延補正部8−2−2に入力する。
音声加算部18は、音声データベース部2から取得した音声信号Aと雑音信号Bとを入力とし、音声信号Aと雑音信号Bとを加算して雑音重畳音声信号を生成する。この雑音重畳音声信号を評価対象装置100に入力することで、評価対象装置100から出力される雑音抑圧処理された音声信号をCとする。
遅延補正部8−1は、第1の実施の形態と同様に、音声信号Aと雑音抑圧音声信号Cとを入力とし、雑音抑圧音声信号Cの音声信号Aに対する遅延時間を測定する。遅延補正部8−2−1は、音声信号Aに遅延補正部8−1で測定された遅延時間分だけ遅延を与えることにより、雑音抑圧音声信号Cと時刻が同期した音声信号A’を出力する。遅延補正部8−2−2は、雑音信号Bに遅延補正部8−1で測定された遅延時間分だけ遅延を与えることにより、雑音抑圧音声信号Cと時刻が同期した雑音信号B’を出力する。
音声区間検出部7は、第1の実施の形態と同様に、音声信号A’を短区間に分けて、各区間の種別情報をスイッチ制御部9に送信する。
スイッチ制御部9と音声連結部10は、第1の実施の形態と同様の処理を行う。ただし、スイッチ22を介して音声連結部10−2に入力される信号は、雑音重畳音声信号ではなく雑音信号B’である。これにより、音声連結部10−2には音声信号A’の全ての無音声短区間に対応した雑音信号B’の短区間を連結した雑音信号bが記憶される。それ以外は実施形態1と同様に、音声連結部10−1には音声信号A’の全ての音声短区間を連結した音声信号aが記憶され、音声連結部10−3には音声信号A’の全ての音声短区間に対応した雑音抑圧音声信号Cの短区間を連結した音声信号c1が記憶され、音声連結部10−4には音声信号A’の全ての無音声短区間に対応した雑音抑圧音声信号Cの短区間を連結した雑音信号c2が記憶される。
音声歪み測定部11、雑音歪み測定部12、音量測定部13、雑音量測定部14、音声品質推定部15及び音声品質出力部16は、第1の実施の形態と同様の処理を行う。
以上の構成により、本実施の形態では、第1の実施の形態と同様の効果を得ることができる。
[第4の実施の形態]
以下、本発明の第4の実施の形態について図面を用いて説明する。図7は、本発明の第4の実施の形態に係る雑音抑圧音声品質推定装置の構成例を示すブロック図であり、図1と同一の構成には同一の符号を付してある。
本実施の形態の雑音抑圧音声品質推定装置19は、第3の実施の形態の雑音抑圧音声品質推定装置17における音声録音部5とマイク6の代わりに、雑音データベース部23を用いたものである。
本実施の形態では、雑音データベース部23に予め登録されている雑音信号をBとする。この雑音信号Bが音声加算部18と遅延補正部8−2−2に入力される。以降の動作は第3の実施の形態と同じである。
以上の構成により、本実施の形態では、第1の実施の形態と同様の効果を得ることができる。さらに、本実施の形態では、雑音信号Bとして雑音データベース部23に予め登録されている信号を用いるため、様々な雑音環境下における雑音抑圧音声のユーザ体感に即した品質推定を正確かつ容易に行うことが可能となる。
なお、第3、第4の実施の形態を第2の実施の形態に適用してもよいことは言うまでもない。
また、第1〜第4の実施の形態の雑音抑圧音声品質推定装置は、CPU、記憶装置および外部とのインタフェースを備えたコンピュータとこれらのハードウェア資源を制御するプログラムによって実現することができる。このようなコンピュータにおいて、本発明の雑音抑圧音声品質推定方法を実現させるための雑音抑圧音声品質推定プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供される。CPUは、記録媒体から読み込んだプログラムを記憶装置に書き込み、プログラムに従って第1〜第4の実施の形態で説明した処理を実行する。
本発明は、音声品質の評価技術に適用することができる。
本発明の第1の実施の形態に係る雑音抑圧音声品質推定装置の構成例を示すブロック図である。 本発明の第1の実施の形態において音声信号の短区間が音声区間と判別されたときのスイッチ制御を示す図である。 本発明の第1の実施の形態において音声信号の短区間が無音声区間と判別されたときのスイッチ制御を示す図である。 本発明の第1の実施の形態における音声信号、雑音重畳音声信号および雑音抑圧音声信号と、これらの信号を短区間に区切って連結した後の音声信号および雑音信号との関係を示す波形図である。 本発明の第2の実施の形態に係る雑音抑圧音声品質推定装置の構成例を示すブロック図である。 本発明の第3の実施の形態に係る雑音抑圧音声品質推定装置の構成例を示すブロック図である。 本発明の第4の実施の形態に係る雑音抑圧音声品質推定装置の構成例を示すブロック図である。 PESQを用いた無雑音音声信号の品質評価系の構成例を示すブロック図である。 PESQを用いた雑音重畳音声信号の品質評価系の構成例を示すブロック図である。
符号の説明
1,17,19…雑音抑圧音声品質推定装置、2…音声データベース部、3…音声再生部、4…スピーカ、5…音声録音部、6…マイク、7…音声区間検出部、8−1,8−2−1,8−2−2…遅延補正部、9…スイッチ制御部、10…音声連結部、11…音声歪み測定部、12…雑音歪み測定部、13…音量測定部、14…雑音量測定部、15…音声品質推定部、16…音声品質出力部、18…音声加算部、20,21,22…スイッチ、23…雑音データベース部。

Claims (6)

  1. 雑音抑圧音声の品質を客観的に推定する雑音抑圧音声品質推定装置であって、
    評価対象となる雑音抑圧処理装置への入力として雑音重畳音声信号を与えたときに、前記雑音抑圧処理装置から出力される雑音抑圧音声信号の品質要因の特徴量を検出する検出手段と、
    この検出手段により検出された特徴量に基づいて前記雑音抑圧音声信号の品質を推定する推定手段とを備え、
    前記検出手段は、
    前記雑音抑圧音声信号を一定時間で区切ったときの各区間が音声区間か無音声区間かを判別する判別手段と、
    音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する音声区間特徴量検出手段と、
    無音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する無音声区間特徴量検出手段とを備え、
    前記音声区間特徴量検出手段は、
    雑音が重畳される前の音声信号とこれに対応する前記音声区間における雑音抑圧音声信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として音声歪みを検出する音声歪み測定部と、
    前記雑音抑圧音声信号の品質要因の特徴量として前記音声区間における雑音抑圧音声信号の音量を検出する音量測定部とを有し、
    前記無音声区間特徴量検出手段は、
    前記無音声区間における雑音抑圧音声信号とこれに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として雑音歪みを検出する雑音歪み測定部と、
    前記雑音抑圧音声信号の品質要因の特徴量として前記無音声区間における雑音抑圧音声信号の雑音量を検出する雑音量測定部とを有し、
    前記雑音歪みは、前記無音声区間における雑音抑圧音声信号を劣化音声信号、これに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号を参照信号としたときのPESQ値もしくはWideband−PESQ値であり、
    前記推定手段は、前記音声歪みと前記雑音抑圧音声信号の音量と前記雑音歪みと前記雑音抑圧音声信号の雑音量とに基づいて前記雑音抑圧音声信号の品質を推定することを特徴とする雑音抑圧音声品質推定装置。
  2. 請求項1記載の雑音抑圧音声品質推定装置において、
    さらに、音声信号が予め登録された音声データベースと、
    この音声データベースの音声信号を実通話環境下で再生する音声再生手段と、
    前記再生された音声を集音したときに得られる信号を前記雑音重畳音声信号として出力する音声録音手段とを備えることを特徴とする雑音抑圧音声品質推定装置。
  3. 請求項記載の雑音抑圧音声品質推定装置において、
    さらに、音声信号が予め登録された音声データベースと、
    実通話環境下で雑音信号を集音する音声録音手段と、
    前記音声データベースの音声信号と前記音声録音手段が集音した雑音信号とを加算した信号を前記雑音重畳音声信号として出力する音声加算手段とを備えることを特徴とする雑音抑圧音声品質推定装置。
  4. 請求項記載の雑音抑圧音声品質推定装置において、
    さらに、音声信号が予め登録された音声データベースと、
    雑音信号が予め登録された雑音データベースと、
    前記音声データベースの音声信号と前記雑音データベースの雑音信号とを加算した信号を前記雑音重畳音声信号として出力する音声加算手段とを備えることを特徴とする雑音抑圧音声品質推定装置。
  5. 雑音抑圧音声の品質を客観的に推定する雑音抑圧音声品質推定方法であって、
    評価対象となる雑音抑圧処理装置への入力として雑音重畳音声信号を与えたときに、前記雑音抑圧処理装置から出力される雑音抑圧音声信号の品質要因の特徴量を検出する検出手順と、
    この検出手順により検出された特徴量に基づいて前記雑音抑圧音声信号の品質を推定する推定手順とを備え、
    前記検出手順は、
    前記雑音抑圧音声信号を一定時間で区切ったときの各区間が音声区間か無音声区間かを判別する判別手順と、
    音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する音声区間特徴量検出手順と、
    無音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する無音声区間特徴量検出手順とからなり、
    前記音声区間特徴量検出手順は、
    雑音が重畳される前の音声信号とこれに対応する前記音声区間における雑音抑圧音声信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として音声歪みを検出する音声歪み測定手順と、
    前記雑音抑圧音声信号の品質要因の特徴量として前記音声区間における雑音抑圧音声信号の音量を検出する音量測定手順とからなり、
    前記無音声区間特徴量検出手順は、
    前記無音声区間における雑音抑圧音声信号とこれに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として雑音歪みを検出する雑音歪み測定手順と、
    前記雑音抑圧音声信号の品質要因の特徴量として前記無音声区間における雑音抑圧音声信号の雑音量を検出する雑音量測定手順とからなり、
    前記雑音歪みは、前記無音声区間における雑音抑圧音声信号を劣化音声信号、これに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号を参照信号としたときのPESQ値もしくはWideband−PESQ値であり、
    前記推定手順は、前記音声歪みと前記雑音抑圧音声信号の音量と前記雑音歪みと前記雑音抑圧音声信号の雑音量とに基づいて前記雑音抑圧音声信号の品質を推定することを特徴とする雑音抑圧音声品質推定方法
  6. 雑音抑圧音声の品質を客観的に推定する雑音抑圧音声品質推定装置としてコンピュータを動作させる雑音抑圧音声品質推定プログラムであって、
    評価対象となる雑音抑圧処理装置への入力として雑音重畳音声信号を与えたときに、前記雑音抑圧処理装置から出力される雑音抑圧音声信号の品質要因の特徴量を検出する検出手順と、
    この検出手順により検出された特徴量に基づいて前記雑音抑圧音声信号の品質を推定する推定手順とを前記コンピュータに実行させ、
    前記検出手順は、
    前記雑音抑圧音声信号を一定時間で区切ったときの各区間が音声区間か無音声区間かを判別する判別手順と、
    音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する音声区間特徴量検出手順と、
    無音声区間における前記雑音抑圧音声信号の品質要因の特徴量を検出する無音声区間特徴量検出手順とからなり、
    前記音声区間特徴量検出手順は、
    雑音が重畳される前の音声信号とこれに対応する前記音声区間における雑音抑圧音声信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として音声歪みを検出する音声歪み測定手順と、
    前記雑音抑圧音声信号の品質要因の特徴量として前記音声区間における雑音抑圧音声信号の音量を検出する音量測定手順とからなり、
    前記無音声区間特徴量検出手順は、
    前記無音声区間における雑音抑圧音声信号とこれに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号とを比較することにより、前記雑音抑圧音声信号の品質要因の特徴量として雑音歪みを検出する雑音歪み測定手順と、
    前記雑音抑圧音声信号の品質要因の特徴量として前記無音声区間における雑音抑圧音声信号の雑音量を検出する雑音量測定手順とからなり、
    前記雑音歪みは、前記無音声区間における雑音抑圧音声信号を劣化音声信号、これに対応する前記雑音重畳音声信号又はこの雑音重畳音声信号の元となる雑音信号を参照信号としたときのPESQ値もしくはWideband−PESQ値であり、
    前記推定手順は、前記音声歪みと前記雑音抑圧音声信号の音量と前記雑音歪みと前記雑音抑圧音声信号の雑音量とに基づいて前記雑音抑圧音声信号の品質を推定することを特徴とする雑音抑圧音声品質推定プログラム。
JP2006225158A 2006-06-07 2006-08-22 雑音抑圧音声品質推定装置、方法およびプログラム Expired - Fee Related JP4745916B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006225158A JP4745916B2 (ja) 2006-06-07 2006-08-22 雑音抑圧音声品質推定装置、方法およびプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006158229 2006-06-07
JP2006158229 2006-06-07
JP2006225158A JP4745916B2 (ja) 2006-06-07 2006-08-22 雑音抑圧音声品質推定装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2008015443A JP2008015443A (ja) 2008-01-24
JP4745916B2 true JP4745916B2 (ja) 2011-08-10

Family

ID=39072488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006225158A Expired - Fee Related JP4745916B2 (ja) 2006-06-07 2006-08-22 雑音抑圧音声品質推定装置、方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4745916B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
JP5157852B2 (ja) 2008-11-28 2013-03-06 富士通株式会社 音声信号処理評価プログラム、音声信号処理評価装置
JP5293329B2 (ja) 2009-03-26 2013-09-18 富士通株式会社 音声信号評価プログラム、音声信号評価装置、音声信号評価方法
US20110178800A1 (en) 2010-01-19 2011-07-21 Lloyd Watts Distortion Measurement for Noise Suppression System
JP5606764B2 (ja) * 2010-03-31 2014-10-15 クラリオン株式会社 音質評価装置およびそのためのプログラム
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
JP5623961B2 (ja) * 2011-03-30 2014-11-12 クラリオン株式会社 音声通話装置及び車載装置
JP5849758B2 (ja) * 2012-02-20 2016-02-03 株式会社Jvcケンウッド 通信装置、状態通知方法
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
EP2733700A1 (en) * 2012-11-16 2014-05-21 Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating intelligibility of a degraded speech signal
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
CN112967735A (zh) * 2021-02-23 2021-06-15 北京达佳互联信息技术有限公司 语音质量检测模型的训练方法及语音质量的检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004056612A (ja) * 2002-07-23 2004-02-19 Nippon Telegr & Teleph Corp <Ntt> 客観品質評価方法、客観品質評価装置、客観品質評価プログラム、客観品質評価プログラムを記録した記録媒体
JP2005328527A (ja) * 2004-05-14 2005-11-24 Agilent Technol Inc 信号品質評価のための測定雑音の低減

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004056612A (ja) * 2002-07-23 2004-02-19 Nippon Telegr & Teleph Corp <Ntt> 客観品質評価方法、客観品質評価装置、客観品質評価プログラム、客観品質評価プログラムを記録した記録媒体
JP2005328527A (ja) * 2004-05-14 2005-11-24 Agilent Technol Inc 信号品質評価のための測定雑音の低減

Also Published As

Publication number Publication date
JP2008015443A (ja) 2008-01-24

Similar Documents

Publication Publication Date Title
JP4745916B2 (ja) 雑音抑圧音声品質推定装置、方法およびプログラム
RU2651616C2 (ru) Способ и устройство оценки аудиопомехи
Falk et al. A non-intrusive quality and intelligibility measure of reverberant and dereverberated speech
KR101430321B1 (ko) 오디오 시스템의 지각 품질을 결정하기 위한 방법 및 시스템
US9959886B2 (en) Spectral comb voice activity detection
US20080312918A1 (en) Voice performance evaluation system and method for long-distance voice recognition
WO2009145192A1 (ja) 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体
JP2018156044A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
CN107645696B (zh) 一种啸叫检测方法和装置
JP2012027186A (ja) 音声信号処理装置、音声信号処理方法及びプログラム
CN104919525B (zh) 用于评估退化语音信号的可理解性的方法和装置
JP2011033717A (ja) 雑音抑圧装置
CN108885864B (zh) 测量装置、滤波器生成装置、测量方法及滤波器生成方法
CN109600697A (zh) 终端外放音质确定方法及装置
Sun et al. Investigations into the relationship between measurable speech quality and speech recognition rate for telephony speech
JP5627440B2 (ja) 音響装置及びその制御方法、プログラム
Moeller et al. Objective estimation of speech quality for communication systems
JP2004325127A (ja) 音源検出方法、音源分離方法、およびこれらを実施する装置
JP4113481B2 (ja) 音声品質客観評価装置および音声品質客観評価方法
Reimes et al. The relative approach algorithm and its applications in new perceptual models for noisy speech and echo performance
Gierlich et al. Advances in perceptual modeling of speech quality in telecommunications
Ghimire Speech intelligibility measurement on the basis of ITU-T Recommendation P. 863
JP4495704B2 (ja) 音像定位強調再生方法、及びその装置とそのプログラムと、その記憶媒体
Rund et al. Objective quality assessment for the acoustic zoom
JP3490380B2 (ja) 信号伝送媒体の信号伝送品質の評価装置、評価方法、ならびに、情報記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110512

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees