WO2011034090A1

WO2011034090A1 - 音声品質解析装置、音声品質解析方法およびプログラム

Info

Publication number: WO2011034090A1
Application number: PCT/JP2010/065938
Authority: WO
Inventors: 一範小澤
Original assignee: 日本電気株式会社
Priority date: 2009-09-18
Filing date: 2010-09-15
Publication date: 2011-03-24
Also published as: US9112961B2; US20120170761A1; JPWO2011034090A1; JP5668687B2

Abstract

　サービス運用中のネットワークへの不要な信号、パケットの送出を行わずに、音声通信サービス品質の異常を検出する。音声品質解析装置は、端末同士の音声通信中に、少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納したパケットを、ネットワークから採取する。音声品質解析装置は、前記採取したパケットのヘッダの解析に加えて、ペイロードヘッダの解析および前記ペイロードに格納されたビットストリームの解析のうちの少なくとも一つを行って、音声通信サービス品質の劣化を検出し、上位装置に検出結果を通知する音声品質解析部を有する。

Description

音声品質解析装置、音声品質解析方法およびプログラム

　（関連出願についての記載）
　本発明は、日本国特許出願：特願２００９－２１７７５３号（２００９年９月１８日出願）、日本国特許出願：特願２００９－２１７７５４号（２００９年９月１８日出願）、日本国特許出願：特願２００９－２１７７５６号（２００９年９月１８日出願）の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
　本発明は、音声品質解析装置、音声品質解析方法およびプログラムに関し、特に、音声を格納した音声パケットによる音声通信サービスの音声品質解析装置、音声品質解析方法およびプログラムに関する。

　音声通信サービス中に、ネットワーク（例えば、ＩＰ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ）ネットワーク、ＮＧＮ（Ｎｅｘｔ　Ｇｅｎｅｒａｔｉｏｎ　Ｎｅｔｗｏｒｋ）、インターネット網、モバイルネットワークなど）を流れる音声パケットを採取し、音声品質を解析し、音声品質の劣化等を検出することのできる装置が知られている。例えば、ＵＤＰヘッダやＲＴＰヘッダなどのヘッダ解析やＲＴＣＰの解析などを行うことで、パケットロス率、往復遅延または片方向遅延、ジッタなどを検出することができる。さらに、これらの少なくとも一つがあらかじめ定められたしきい値を超える場合に音声品質の劣化と判定し、アラーム等を出力させることもできる。これら解析結果または音声品質の劣化を、上位の監視装置に通知し、そのまま、あるいは加工・編集した上で監視端末に出力・表示させることもできる。

　上記音声品質解析装置の一例が特許文献１に開示されている。特許文献１によると、通信先から受信した音声／画像パケットに受信時刻のタイムスタンプを付与して収集する機能１１ｃと、自身のパフォーマンスデータを収集する機能１１ｈと、収集した音声／画像パケットのタイムスタンプ及びシーケンス番号の情報並びに通信先からの送信時刻のタイムスタンプ及びシーケンス番号の情報に基づいて、品質劣化要因たる伝送遅延、パケットロス率及びゆらぎの情報を算出する機能１１ｅ、１１ｆ、１１ｇと、これら算出した品質劣化要因及び前記収集したパフォーマンスデータの情報が閾値を超過しているか否か判定する機能１１ｉと、この判定により閾値を超過している場合に品質劣化発生の可能性があることをモニタ上に通知する機能１１ｊとを設けた通信端末を用いることにより、マルチメディア通信の品質劣化を高精度にユーザに先駆けて通知できるとされている。

　その他特許文献２に、ＩＰ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ）におけるパケット転送と既存公衆網における音声信号の伝達とを中継する複数のＶｏＩＰゲートウェイ装置を備えたＩＰネットワークシステムにおける音声品質調整装置において、評価手段は、ＩＰネットワークを経由する伝送経路を介して通話中の回線それぞれについて、ＩＰネットワークを介してＶｏＩＰゲートウェイ装置に到達したＶｏＩＰパケットに関する情報に基づいて、即時的に通話音声の品質を評価する評価手段と、この評価結果に基づいて、調整手段は、ＶｏＩＰパケットの送信元のＶｏＩＰゲートウェイ装置が通話中の回線それぞれに対応してＩＰネットワークに送出する処理を調整する調整手段を備える構成が開示されている。

　また、特許文献３に、パケット化した音声を多重化する際に、音声パケットを詰め込んだ固定長セルの隙間に誤り検出情報を埋め込み、受信側において音声パケットを抽出すると共に埋め込まれた誤り検出情報から通信路の誤り状態を計測し、予め設定した誤り発生の条件を超えた場合には送信側に対して伝送エラー過多を通知し、この伝送エラー過多通知を受信した送信側通信装置において音声符号化方式を符号誤りに対して音声品質特性が強い符号化方式に切り替え、また多重化方法を制御することにより、音声品質の劣化を極力抑える機能を備えた通信装置が開示されている。

　特許文献４に回線交換網とパケット交換網とを中継するメディアストリーム中継装置においてパケット交換網のゆらぎを吸収するバッファを有し、パケットの輻輳やロスを低減できるようにした構成が開示されている。

　特許文献５には、システム運用中に試験が必要な場合にメディアゲートウェイからＩＰ網に試験用音声信号を送出し、ネットワークを経由して戻ってきた音声信号を採取し、前記試験用音声信号との差分を求め、差分の程度により音声品質の監視を行う音声品質監視方法が開示されている。また、特許文献１には、エコー成分を盛り込ませた試験用音声信号に対し、エコーキャンセラでエコー成分をカットさせ、カットさせた後の音声信号を用いてエコーキャンセラの動作を監視することにより、エコーキャンセラの性能監視を行うことが記載されている。

　特許文献６には、パケット網に接続される端末において、エコー量の測定機能を具備させた構成が開示されている。特許文献２に開示されているエコーの測定方法は、具体的には、ハンドセット等、ＶｏＰ電話機各部における音声の折り返し量を測定することでエコー量を測定するアナログ音響的な手法である（特許文献２の段落００７１－００７３参照）。

　特許文献７には、音声品質管理機能を有するハイブリッド電話システムが開示されている。同文献記載のハイブリッドＰＢＸは、試験信号送出機能および試験結果解析機能を有し、その解析結果に基づいて、通話路における音声品質に対する各種パラメータの設定をエコーキャンセラに対して最適化するようにしている。

特開２００４－２８９７４８号公報特開２００５－５７３３１号公報特開２００３－８７３２１号公報特開２００７－２８８３４２号公報特開２００４－３２８３４５号公報特開２００３－２４４２３５号公報特開２００５－１７６０７１号公報

　以下の分析は、本発明によって与えられたものである。なお、上記特許文献の全開示内容はその引用をもって本書に繰込み記載する。
　しかしながら、上記した音声品質解析装置は、解析のために試験用音声信号をネットワークに流しネットワークを経由して戻ってくる信号を採取し、もとの信号と比較したり、または音声パケット中の特定のフィールドに試験用音声信号を埋め込んで送信側装置から送出し、これを受信側装置で受信した上で前記試験用音声信号を抽出し元の試験用音声信号を比較する必要があるため、サービス運用中のネットワークに不要な信号を流してしまうという問題点がある。

　さらに、上記した音声品質解析装置は、処理量の削減のために、パケットのヘッダのみの解析やＲＴＣＰの解析のみを行う構成であるため、パケットロスの発生の有無、パケットロス率、ジッタ、往復遅延または片道遅延の解析しかできないという問題点がある。従って、これら以外の解析、例えば、モバイル網で無線転伝送区間を含む場合にビット誤りの発生による音質の劣化や、音声通話中に異常による無音や片通話が発生しているのかどうか等の解析も不可能である。なお、片通話とは、通話中に、一方の声が相手方に届かなくなる現象のことである。

　本発明の目的は、上記した音声品質解析装置のように運用中のネットワークに試験用音声信号を流す必要や音声パケットの特定のフィールドに試験用音声信号を埋め込む必要がなく、上記したビット誤りの発生による音質劣化や、装置の異常などによる無音や片通話などの解析や検出を実現することのできる音声品質解析装置、音声品質解析方法およびプログラムを提供することにある。

　本発明の第１の視点によれば、端末同士の音声通信中に、少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納したパケットを、ネットワークから採取し、前記パケットのヘッダの解析に加えて、ペイロードヘッダの解析および前記ペイロードに格納されたビットストリームの解析のうちの少なくとも一つを行うことで音声通信サービス品質の劣化を検出し、上位装置に検出結果を通知する音声品質解析部を有することを特徴とする音声品質解析装置が提供される。

　本発明の第２の視点によれば、端末同士の音声通信中に、少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納したパケットをネットワークから採取するステップと、前記パケットのヘッダの解析に加えて、ペイロードヘッダの解析およびペイロードに格納されたビットストリームの解析のうちの少なくとも一つを実行するステップと、前記解析結果に基づいて音声通信サービス品質の劣化を検出し、上位装置に検出結果を通知するステップと、を含む音声品質解析方法が提供される。本方法は、上記のようにネットワークからパケットを採取する音声品質解析装置という、特定の機械に結びつけられている。

　本発明の第３の視点によれば、端末同士の音声通信中に、少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納したパケットをネットワークから採取する処理と、前記パケットのヘッダの解析に加えて、ペイロードヘッダの解析およびペイロードに格納されたビットストリームの解析のうちの少なくとも一つを実行する処理と、前記解析結果に基づいて音声通信サービス品質の劣化を検出し、上位装置に検出結果を通知する処理と、を音声品質解析装置を構成するコンピュータに実行させるプログラムが提供される。なお、このプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。即ち、本発明は、コンピュータプログラム製品として具現することも可能である。

　本発明によれば、サービス運用中のネットワークへの不要な信号、パケットの送出を行わずに、音声通信サービス品質の劣化・異常を検出することが可能になる。また本発明によれば、ビット誤りに起因する音質の劣化や、無音や片通話の発生なども検出することが可能になる。

本発明の第１の実施形態の構成を表した図である。本発明の第１の実施形態の音声解析装置の詳細構成を表した図である。本発明の第２の実施形態の音声解析装置の詳細構成を表した図である。図３のビットストリーム解析部の詳細構成を表した図である。図３のビットストリーム解析部の変形実施形態を表した図である。本発明の第３の実施形態の構成を表した図である。本発明の第３の実施形態の音声解析装置の詳細構成を表した図である。本発明の第４の実施形態の構成を表した図である。本発明の第４の実施形態の音声解析装置の詳細構成を表した図である。図９のビットストリーム解析部の詳細構成を表した図である。図９のビットストリーム解析部の変形実施形態を表した図である。

　はじめに本発明の概要を説明する。本発明の音声品質解析装置は、音声通信をしている、ある端末から送出された音声を圧縮符号化したビットストリームを格納したパケットを採取する（図１参照）。前記音声品質解析装置は、前記パケットのヘッダの解析に加えて、ペイロードヘッダの解析およびペイロードに格納されたビットストリームの解析のうちの少なくとも一つを実行する。本発明の音声品質解析装置は、前記解析により音声通信サービス品質の劣化を検出し、上位装置に検出結果を通知する。

　以上により、運用中のネットワークに試験用音声信号を流す必要や音声パケットの特定のフィールドに試験用音声信号を埋め込むことなく、ビット誤りの発生による音質劣化や、装置の異常などによる無音や片通話などを検出することが可能になる。

［第１の実施形態］
　続いて、本発明をモバイルネットワークでの音声通信サービスに対して音声品質解析を行う第１の実施形態について図面を参照して詳細に説明する。図１は、本発明の第１の実施形態の構成を表した図である。

　図１を参照すると、無線網１９０およびモバイルコアネットワーク１８０および無線網１９１を介して、音声通信（音声電話）を行っている携帯端末１７０および携帯端末１７１が示されている。

　モバイルコアネットワーク１８０は、ＣＳＩＰ網（Ｃｉｒｃｕｉｔ　Ｓｗｉｔｃｈｅｄ　ｏｖｅｒ　－ＩＰ　ＮｅｔＷｏｒｋ）であると想定する。つまり回線交換の音声信号は対向して配置された音声通信装置１５０、１５１によりＩＰパケットに変換されてモバイルコアネットワーク１８０上を転送される。

　携帯端末１７０（１７１）は、入力した音声を、所定の音声圧縮符号化方式により圧縮符号化されたビットストリームに変換し、該ビットストリームを出力する機能を備えている。ここで音声圧縮符号化方式としては、ＡＭＲ（Ａｄａｐｔｉｖｅ　Ｍｕｌｔｉ－Ｒａｔｅ　ｓｐｅｅｃｈ　ｃｏｄｅｃ）の１２．２ｋｂｐｓのビットレートを用いるものとする。ＡＭＲの詳細は、例えば、３ＧＰＰ　ＴＳ２６．０９０規格を参照できるのでここでは詳細な説明は省略する。

　本実施形態では、ＡＭＲビットストリームは、無線網１９０を経由し、無線網１９０からモバイルコアネットワーク１８０に送出される際に、ＩｕＵＰ（Ｉｕ　Ｕｓｅｒ　Ｐｌａｎｅ）プロトコルフレームに格納される。ＩｕＵＰプロトコルフレームはモバイルコアネットワーク１８０に達し、音声通信装置１５０に入力される。ここでＩｕＵＰプロトコルフレームの詳細は、３ＧＰＰ　ＴＳ２６．１０２規格を参照することができる。

　ここで、携帯端末１７０および携帯端末１７１は音声コーデックをバイパスするＴｒＦＯ（Ｔｒａｎｓｃｏｄｅｒ　Ｆｒｅｅ　Ｏｐｅｒａｔｉｏｎ）で通信するものと想定する。従って、音声通信装置１５０は、ＩｕＵＰプロトコルフレームをＲＴＰ（Ｒｅａｌ－ｔｉｍｅ　Ｔｒａｎｓｐｏｒｔ　Ｐｒｏｔｏｃｏｌ）パケットのペイロード部に格納した上で、相手端末側の音声通信装置１５１に向け、ＲＴＰ／ＵＤＰ／ＩＰプロトコルを用いて、ＲＴＰパケットを送出する。また、音声通信装置１５０は、一定時間間隔（例えば５秒）でＲＴＣＰ（Ｒｅａｌ－ｔｉｍｅ　Ｔｒａｎｓｐｏｒｔ　Ｃｏｎｔｒｏｌ　Ｐｒｏｔｏｃｏｌ）パケットを音声通信装置１５１に送出する。

　音声通信装置１５１は、前記ＲＴＰパケットを入力し、ＲＴＰペイロード部分に格納されたＩｕＵＰプロトコルフレームを取り出して、無線網１９１に出力する。無線網１９１においては、ＩｕＵＰプロトコルフレームに格納された１２．２ｋｂｐｓ　ＡＭＲビットストリームが取り出されて携帯端末１７１に送出される。

　携帯端末１７１は、１２．２　ｋｂｐｓ　ＡＭＲビットストリームを受信して、ビットストリームを復号し音声を再生する。

　携帯端末１７１から携帯端末１７０の方向の音声通信は、上記と逆方向の流れとなるだけであり、同様であるので、説明は省略する。

　音声品質解析装置１１０は、音声通信装置１５０と音声通信装置１５１間でやりとりされる、Ｎチャネル分（Ｎ≧１）の、上りおよび下りのＲＴＰパケット、ならびに、Ｎチャネル分の上りおよび下りのＲＴＣＰパケットを採取する。なお、図１の例では、上り方向と下り方向を別々の音声品質解析装置が担う構成としているが、同一の音声品質解析装置が上りと下りの両方を担う構成とすることもできる。

　音声品質解析装置１１０は、前記採取したＲＴＰパケットおよびＲＴＣＰパケットの解析を行う。上位装置１３０は、音声品質解析装置１１０から音声通信サービス品質の劣化等の報告を受ける装置である。

　図２は、本発明の第１の実施形態の音声品質解析装置の詳細構成を示すブロック図である。図２を参照すると、パケット受信部１１１と、パケット受信部１１１から出力されたパケットが入力されるＲＴＰヘッダ解析部１１２と、ＲＴＣＰ解析部１１３と、ＲＴＰペイロードヘッダ解析部１１４と、これら各解析部からの解析結果が入力される出力部１１５と、を備えた構成が示されている。なお、これら音声品質解析装置の各部は、ハードウェアのみならず、音声品質解析装置を構成するコンピュータに後記する処理を実行させるプログラムにより実現することもできる。

　パケット受信部１１１は、ＡＭＲ　ＩｕＵＰプロトコルフレームを格納したＲＴＰパケットを採取して、ＲＴＰヘッダ解析部１１２とＲＴＰペイロードヘッダ解析部１１４に出力する。また、パケット受信部１１１は、ＲＴＣＰパケットを一定時間毎に受信してＲＴＣＰ解析部１１３に出力する。

［ＲＴＰヘッダ解析］
　ＲＴＰヘッダ解析部１１２は、ヘッダ解析として、パケットロス解析を実施し、その結果を出力部１１５に出力する。ここで、パケットロス解析とは、あらかじめ定められた観測期間（例えば、１分間）に対し、ＲＴＰヘッダのシーケンス番号の連続性を調べ、連続性を欠く場合はパケットロスと判断し、パケットロスが継続する区間や、観測期間全体でのパケットロス率を算出する。

［ＲＴＣＰ解析］
　ＲＴＣＰ解析部１１３は、次に記載する解析のうち、少なくとも一つの解析を行う。
（１）遅延時間の解析：ＲＴＣＰ解析部１１３は、ＲＴＣＰパケットを受信した時刻（ＮＴＰタイムスタンプ表示）と、ＲＴＣＰの中のＲＲ（Ｒｅｃｅｉｖｅｒ　Ｒｅｐｏｒｔ）に格納されたＬＳＲおよびＤＬＳＲを用いて、次式により往復遅延Ｄを算出する。
　Ｄ＝ＲＴＣＰパケット受信時刻－ＤＬＳＲ－ＬＳＲ　・・・（１）

　ＲＴＣＰ解析部１１３は、観測期間（例えば、１分間）内での往復遅延Ｄの値または往復遅延Ｄの値の時間変化を、出力部１１５に出力する。さらに、往復遅延Ｄの値が予め定められたしきい値より大きい場合、ＲＴＣＰ解析部１１３は、警告情報（アラーム）を出力部１１５に出力する。

（２）ジッタ量の解析：ＲＴＣＰ解析部１１３は、ＲＴＣＰ　ＲＲに格納されているジッタ量をコピーしてジッタ量の値ならびにジッタ量の時間変化を出力部１１５に出力する。さらに、ジッタの値が予め定められたしきい値より大きい場合、ＲＴＣＰ解析部１１３は、警告情報を出力部１１５に出力する。

［ＲＴＰペイロードヘッダ解析］
　ＲＴＰペイロードヘッダ解析部１１４は、ビット誤りの発生による音質劣化の解析を行う。具体的には、ＲＴＰペイロードヘッダ解析部１１４は、ＲＴＰパケットのペイロード部に格納されたＩｕＵＰプロトコルフレームに対し、ペイロードヘッダ部のＦＱＣ（Ｆｒａｍｅ　Ｑｕａｌｉｔｙ　Ｃｌａｓｓｉｆｉｅｒ）フィールドの値をチェックし、観測期間中に０（Ｇｏｏｄ）以外の値になっている回数と継続時間を算出する。ＲＴＰペイロードヘッダ解析部１１４は、これらの数値を出力部１１５に出力する。さらに、ＲＴＰペイロードヘッダ解析部１１４は、回数と継続時間の少なくとも一方が予め定められたしきい値を超える場合、品質劣化であると判断し、警告情報を出力部１１５に出力する。

　出力部１１５は、観測期間内に、上記各解析部から出力された解析結果、数値の時間変化、警告情報を、観測期間毎に、上位装置１３０に出力する。

　以上のとおり、本発明の第１の実施形態によれば、運用中のネットワークに試験用音声信号を流す必要や音声パケットの特定のフィールドに試験用音声信号を埋め込むことなく、パケットロス状況、往復遅延の状況、ジッタの状況に加えて、ペイロードヘッダのＦＱＣ値の状況や異常を検出し、上位装置１３０に伝えることが可能になる。

［第２の実施形態］
　続いて、ビットストリーム解析を実施するようにした本発明の第２の実施形態について図面を参照して詳細に説明する。
　図３は、第２の実施形態の音声品質解析装置の詳細構成を示すブロック図である。図３において、図２と同一の番号を付した構成要素は、第１の実施形態と同等の構成要素であるので説明を省略し、以下、相違点を説明する。

　図３を参照すると、第２の実施形態の音声品質解析装置は、第１の実施形態の音声品質解析装置の構成（図２参照）に加えて、パケット受信部１１１から出力されたパケットが入力されるビットストリーム解析部１１６を備えるとともに、出力部１１７にはビットストリーム解析部１１６から出力される解析結果が入力される構成となっている。

　ビットストリーム解析部１１６は、ＲＴＰパケットの受信がある場合において、ビットストリームを解析し、通信装置等の異常に起因する無音事象の発生を検出するために追加されたものである。以下、無音事象の検出方法について詳細に説明する。

　無音事象の検出：観測期間内で以下のいずれか（ＲＴＰパケットの受信なし／レベル推定値＝０）を検出した場合に、ルータや通信装置などの異常に起因する無音と判断する。

　まず、観測期間中にＲＴＰパケットの受信が全くなくシーケンス番号がカウントアップされない場合、ＲＴＰヘッダ解析部１１２が、モバイルコアネットワーク１８０に設置されたルータなどの異常でパケットが転送されないことに起因する無音と判断し、出力部１１７に警告情報を出力する。

　観測期間中にＲＴＰパケットの受信がある場合、ＲＴＰヘッダ解析部１１２は、ビットストリーム解析部１１６に対しＲＴＰパケットの受信を通知する。前記通知を受けたビットストリーム解析部１１６が解析を行う。

　図４は、ビットストリーム解析部１１６の構成例を示している。図４を参照すると、ビットストリーム抽出部１１８と、ゲインパラメータ復号部１１９と、レベル推定部１２０とを備えた構成が示されている。

　ビットストリーム抽出部１１８は、ＲＴＰヘッダ解析部１１２からＲＴＰパケットの受信があることを通知されると、入力したＲＴＰパケットに対し、ペイロード部からＩｕＵＰプロトコルフレームを取り出し、さらにＩｕＵＰプロトコルフレームに格納されているＡＭＲのビットストリームを抽出する。

　ここで、ＡＭＲが無音圧縮モードの場合、ゲインパラメータ復号部１１９は、ＳＩＤ（Ｓｉｌｅｎｃｅ　Ｉｎｓｅｒｔｉｏｎ　Ｄｅｓｃｒｉｐｔｏｒ）フレームでのゲインパラメータを復号し、レベル推定部１２０に復号結果を出力する。レベル推定部１２０は、前記入力された復号結果をレベル推定値とし、レベル推定値がゼロでなければ正常と判断し、出力部１１７に結果（正常）を出力する。一方、レベル推定値がゼロの場合、レベル推定部１２０は、ルータや通信装置の異常に起因する無音であると判断し、観測期間内にＳＩＤフレームのレベルがゼロである回数等を含んだ警告情報を出力部１１７に出力する。

　一方、ＡＭＲが無音圧縮モードでない場合、ゲインパラメータ復号部１１９は、ＡＭＲビットストリームのうちの固定コードブック（Ｆｉｘｅｄ　Ｃｏｄｅｂｏｏｋ）に関するゲインパラメータを復号し、レベル推定部１２０に復号結果を出力する。レベル推定部１２０は、固定コードブックに対するゲインパラメータの予測値を加算する処理を行い、これをレベル推定値とし、レベル推定値がゼロでなければ正常と判断し、出力部１１７に結果（正常）を出力する。一方、レベル推定値がゼロの場合は、ルータや通信装置の異常に起因する無音であると判断し、観測期間内でのレベル推定値がゼロの回数とその継続時間等を含んだ警告情報を出力部１１７に出力する。

　以上のとおり、本発明の第２の実施形態によれば、上記した第１の実施形態の効果に加えてルータや通信装置等の異常に起因する無音事象を検出し、上位装置１３０に伝えることが可能になる。

　なお、音声圧縮符号化方式としては、ＡＭＲ以外の他の音声コーデック、例えば、ＶｏＩＰで使われるＩＴＵ－Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７２９等を用いることもできる。Ｇ．７２９の場合、ＩｕＵＰプロトコルは使われずに、ＲＴＰヘッダのペイロードタイプフィールドがＧ．７２９であることを示す番号（具体的には１８）となっている。

　また、上記した第２の実施形態のビットストリーム解析部１１６は、下記のような構成とすることもできる。

　図５は、ビットストリーム解析部１１６の変形実施形態の構成を示すブロック図である。図５の構成は、音声圧縮符号化方式がＩＴＵ－Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７１１である場合の構成を示している。Ｇ．７１１の場合も、上記したＧ．７２９と同様に、ＩｕＵＰプロトコルは使われずに、ＲＴＰヘッダのペイロードタイプフィールドがＧ．７１１であることを示す番号（具体的には０）となっている。

　図５において、図４と同一の番号を付した構成要素は、第２の実施形態と同等の構成要素であるので説明を省略し、以下、相違点を説明する。ビットストリーム復号部１２１は、Ｇ．７１１のビットストリームを予め定められたフレーム間隔（例えば、１０ｍｓまたは２０ｍｓ）に区切り、フレーム間隔に含まれるビットストリームをすべて復号し、復号して得た信号Ｓ（ｎ）をレベル推定部１２２に出力する。

　レベル推定部１２２は、次式［数１］に基づき、フレーム区間でのレベル推定値Ｌを算出する。

　上記［数１］中、Ｎはフレーム区間に含まれる信号のサンプル数を示す。例えば、２０ｍｓ区間の場合は、Ｎ＝１６０である。レベル推定値Ｌがゼロの場合、レベル推定部１２２は、ルータや通信装置の異常に起因する無音であると判断し、観測期間内におけるレベル推定値Ｌがゼロであった回数とその継続時間を含む警告情報を出力部１１７に出力する。

　以上のように、ＡＭＲ以外の音声圧縮符号化方式、例えば、Ｇ．７２９やＧ．７１１等においても、無音事象の検出を行うことができる。

［第３の実施形態］
　続いて、第２の音声品質解析部を追加した本発明の第３の実施形態について図面を参照して詳細に説明する。

　はじめに本実施形態の概要を説明する。図６に示すように、本発明の音声品質解析装置は、音声通信をしている、ある端末から送出された音声を圧縮符号化したビットストリームを格納した第１のパケットをネットワークから採取し、前記第１のパケットのヘッダの解析に加えて、ペイロードヘッダの解析および前記ペイロードに格納されたビットストリームの解析のうちの少なくとも一つを行うことで音声通信サービス品質の劣化を検出する第１の音声品質解析部（図６の「Ｕ－Ｐｌａｎｅ解析装置」参照）と、制御信号を格納した第２のパケットをネットワークから採取し、前記第２のパケットを解析する第２の音声品質解析部（図６の「Ｃ－Ｐｌａｎｅ解析装置」参照）と、前記第１、第２の音声品質解析部から出力された解析結果が入力される上位装置（図６の「上位装置」参照）により実現できる。

　上位装置は、前記第１の音声品質解析部より検出された音声通信サービス品質の劣化が、第２の音声品質解析部の解析結果と整合するか否かを確認する。

　以上により、運用中のネットワークに試験用音声信号を流す必要や音声パケットの特定のフィールドに試験用音声信号を埋め込むことなく、ビット誤りの発生による音質劣化や、装置の異常などによる無音や片通話などの解析や検出を行うことが可能になる。また上記構成により、ユーザプレーン（Ｕ－Ｐｌａｎｅ）のパケットの解析のみでなく、コントロールプレーン（Ｃ－Ｐｌａｎｅ）の制御信号の解析を行ない当該チャネルが通話中であることを確認・検証する構成としたため、異常による無音を精度よく検出することが可能になる。なお、第１、第２の音声品質解析部は、図６のように、上位装置と独立した形態で設けることができるが、上位装置に組み込んだ形態とすることもできる。また、第１の音声品質解析部からの音声通信サービス品質の劣化通知を、第２の音声品質解析部が受け取って検証する構成や、第２の音声品質解析部からの解析結果を、第１の音声品質解析部が受け取って検証する構成も採用可能である。

　図６は、本発明の第３の実施形態の構成を表した図である。
　図６を参照すると、無線網１９０およびモバイルコアネットワーク１８０および無線網１９１を介して、音声通信（音声電話）を行っている携帯端末１７０および携帯端末１７１が示されている。

　モバイルコアネットワーク１８０は、ＣＳＩＰ網（Ｃｉｒｃｕｉｔ　Ｓｗｉｔｃｈｅｄ　ｏｖｅｒ　－ＩＰ　ＮｅｔＷｏｒｋ）であると想定する。つまり回線交換の音声信号は対向して配置された音声通信装置１５０、１５１によりＩＰパケットに変換されてモバイルコアネットワーク１８０を転送される。

　上記ＡＭＲビットストリームは、無線網１９０を経由し、無線網１９０からモバイルコアネットワーク１８０に送出される際に、ＩｕＵＰ（Ｉｕ　Ｕｓｅｒ　Ｐｌａｎｅ）プロトコルフレームに格納される。ＩｕＵＰプロトコルフレームはモバイルコアネットワーク１８０に達し、音声通信装置１５０に入力される。ここでＩｕＵＰプロトコルフレームの詳細は、３ＧＰＰ　ＴＳ２６．１０２規格を参照することができる。

　本実施形態では、音声通信装置１５０と音声通信装置１５１との間で、前記音声を圧縮符号化したビットストリームを格納した第１のパケットであるＵ－Ｐｌａｎｅのパケットは、ＲＴＰ／ＵＤＰ／ＩＰプロトコルを用いて転送されるものとする。同様に、制御信号を格納した第２のパケットは、ＵＤＰ／ＩＰプロトコルにより転送されるものとする。以下、本実施形態では、ＳＩＰ（Ｓｅｓｓｉｏｎ　Ｉｎｉｔｉａｔｉｏｎ　Ｐｒｏｔｏｃｏｌ）を用いて呼制御が行われているものとして説明するが、他の呼制御方式であってもよい。

　ここで、携帯端末１７０および携帯端末１７１の間の音声通信は音声コーデックをバイパスするＴｒＦＯ（Ｔｒａｎｓｃｏｄｅｒ　Ｆｒｅｅ　Ｏｐｅｒａｔｉｏｎ）で通信するものと想定する。従って、音声通信装置１５０は、ＩｕＵＰプロトコルフレームをＲＴＰ（Ｒｅａｌ－ｔｉｍｅ　Ｔｒａｎｓｐｏｒｔ　Ｐｒｏｔｏｃｏｌ）パケットのペイロード部に格納した上で、相手端末側の音声通信装置１５１に向け、ＲＴＰ／ＵＤＰ／ＩＰプロトコルを用いて、ＲＴＰパケットを送出する。また、音声通信装置１５０は、一定時間間隔（例えば５秒）でＲＴＣＰ（Ｒｅａｌ－ｔｉｍｅ　Ｔｒａｎｓｐｏｒｔ　Ｃｏｎｔｒｏｌ　Ｐｒｏｔｏｃｏｌ）パケットを音声通信装置１５１に送出する。

　音声通信装置１５１は、上記のように制御信号が格納されたＵＤＰパケットを入力し、制御信号を取り出して呼接続処理を行ない、さらに、回線交換の呼制御信号（例えば、ＩＳＵＰ（ＩＳＤＮ　Ｕｓｅｒ　Ｐａｒｔ））に変換し、無線網１９１に出力する。また、音声通信装置１５１は、前記ＲＴＰパケットを入力し、ＲＴＰペイロード部分に格納されたＩｕＵＰプロトコルフレームを取り出して、無線網１９１に出力する。無線網１９１においては、ＩｕＵＰプロトコルフレームに格納された１２．２ｋｂｐｓ　ＡＭＲビットストリームが取り出されて携帯端末１７１に送出される。

　携帯端末１７１は、１２．２　ｋｂｐｓ　ＡＭＲビットストリームを受信して、ビットストリームを復号し音声を再生する。
　携帯端末１７１から携帯端末１７０の方向の音声通信は、上記と逆方向の流れとなるだけであり、同様であるので、説明は省略する。

　Ｕ－Ｐｌａｎｅ解析装置１１１０は、音声通信装置１５０と音声通信装置１５１間でやりとりされる、Ｎチャネル分（Ｎ≧１）の、上りおよび下りのＲＴＰパケット（第１のパケット）、ならびに、Ｎチャネル分の上りおよび下りのＲＴＣＰパケットを採取する。なお、図１の例では、上り方向と下り方向の解析を同一のＵ－Ｐｌａｎｅ解析装置１１１０が担う構成としているが、上り、下りで異なるＵ－Ｐｌａｎｅ解析装置を用いる構成とすることもできる。

　Ｕ－Ｐｌａｎｅ解析装置１１１０は、第１の実施形態の音声品質解析部に相当し、前記採取したＲＴＰパケット（第１のパケット）およびＲＴＣＰパケットの解析を行う。

　Ｃ－Ｐｌａｎｅ解析装置１１３０は、上記した第２の音声品質解析部に相当し、音声通信装置１５０と１５１の間でやりとりされる制御信号を格納した第２のパケットであるＵＤＰパケットを採取し、この解析を行う。例えば、ＳＩＰを用いて呼制御を行う場合、ＳＩＰによる呼制御のやりとりのうち、音声通信装置１５０からセッション確立メソッド「Ｉｎｖｉｔｅ」を送り、音声通信装置１５１から応答「２００　ＯＫ」が来たとする。Ｃ－Ｐｌａｎｅ解析装置１３０は、応答「２００　ＯＫ」を受信した時点で当該セッションは音声通話開始であると判断し、当該セッションの番号、受信ＩＰアドレス、送信元ＩＰアドレス、受信ポート番号等を上位装置１４０に通知する。さらに、Ｃ－Ｐｌａｎｅ解析装置１１３０は、音声通信装置１５０または音声通信装置１５１から送信されたセッション終了メソッド「ＢＹＥ」を採取した時点で、通話終了と判断し、上位装置１４０に通知する。

　続いて、採取した第１のパケットによりサービス品質の異常検出を行うＵ－Ｐｌａｎｅ解析装置１１１０の詳細構成について説明する。

　図７は、本発明の第１の実施形態のＵ－Ｐｌａｎｅ解析装置の詳細構成を示すブロック図である。図７を参照すると、パケット受信部１１１と、パケット受信部１１１から出力されたパケットが入力されるＲＴＰヘッダ解析部１１２と、ＲＴＣＰ解析部１１３と、ＲＴＰペイロードヘッダ解析部１１４と、ビットストリーム解析部１１６と、これら各解析部からの解析結果が入力される出力部１１７と、を備えた構成が示されている。なお、これらＵ－Ｐｌａｎｅ解析装置の各部は、上記した第１の実施形態の音声解析装置の各部と同等であるので説明を省略する。また、これらＵ－Ｐｌａｎｅ解析装置の各部は、ハードウェアのみならず、Ｕ－Ｐｌａｎｅ解析装置、あるいは、Ｕ－Ｐｌａｎｅ解析装置やＣ－Ｐｌａｎｅ解析装置を含む上位装置を構成するコンピュータに後記する処理を実行させるプログラムにより実現することもできる。

　以上の構成にて、Ｕ－Ｐｌａｎｅ解析装置１１１０からは、パケットロス、遅延時間、ジッタ量、ビット誤り、無音事象の発生状況が検出され、Ｃ－Ｐｌａｎｅ解析装置１１３０からは、制御信号に基づく解析結果（通話状態）が出力される。

　図６を参照すると、上位装置１４０は、上記のように、Ｕ－Ｐｌａｎｅ解析装置１１１０およびＣ－Ｐｌａｎｅ解析装置１１３０から通知された内容に基づいて、サービス品質の異常発生を判定する。例えば、あるセッションで、Ｃ－Ｐｌａｎｅ解析装置１１３０から通話中であるとの通知を受けているにも拘らず、Ｕ－Ｐｌａｎｅ解析装置１１１０からは、異常による無音の可能性ありとの通知を受けている場合、上位装置１４０は、当該セッションは異常による無音事象が発生していると判断し、監視装置１４５にアラームを通知する。

　図６の監視装置１４５は、上位装置１４０からアラームを受けると、所定の表示装置等に、当該セッションにおいて異常による無音が発生している旨のメッセージ等を出力する。

　以上のとおり、本発明の第３の実施形態によれば、運用中のネットワークに試験用音声信号を流す必要や音声パケットの特定のフィールドに試験用音声信号を埋め込むことなく、パケットロス状況、往復遅延の状況、ジッタの状況、ペイロードヘッダのＦＱＣ値の状況、無音事象の発生を検出し、これを制御信号を用いて検証してから、監視装置１４５に出力させることが可能になる。

［第４の実施形態］
　続いて、上記した特許文献５～７等に記載の音声品質解析装置の問題点を考慮した本発明の第４の実施形態について説明する。

　上記した特許文献５～７等に記載の音声品質解析装置は、解析のために試験用音声信号をネットワークに流しネットワークを経由して戻ってくる信号を採取し、もとの信号と比較したり、または音声パケット中の特定のフィールドに試験用音声信号を埋め込んで送信側装置から送出し、これを受信側装置で受信した上で前記試験用音声信号を抽出し元の試験用音声信号を比較する必要があるため、サービス運用中のネットワークに不要な信号を流してしまうという問題点がある。

　さらに、上記した音声品質解析装置は、処理量の削減のために、パケットのヘッダのみの解析やＲＴＣＰの解析のみを行う構成であるため、パケットロスの発生の有無、パケットロス率、ジッタ、往復遅延または片道遅延の解析しかできないという問題点がある。従って、これら以外の解析、例えば、ネットワーク内にＰＳＴＮ網（公衆交換電話網）とＩＰ網とを相互接続するゲートウェイが存在するような場合に、エコー信号が残留することによる音質劣化を検出できないという問題点がある。

　そこで、本実施形態では、上記した音声品質解析装置のように運用中のネットワークに試験用音声信号を流す必要や音声パケットの特定のフィールドに試験用音声信号を埋め込む必要がなく、エコー信号の残留による音質劣化を検出することのできるようにする。

　はじめに本実施形態の概要を説明する。本実施形態の音声品質解析装置は、音声通信をしている各端末から送出された音声を圧縮符号化したビットストリームを格納した上り下りのパケットをそれぞれ採取する（図８参照）。前記音声品質解析装置は、前記各パケットのペイロードに格納されたビットストリームのうちのスペクトルパラメータをそれぞれ復号し、前記上り方向および下り方向の復号結果を用いて、上り方向のスペクトルと下り方向のスペクトルとの相関を求めることでエコーが残留しているか否かを検出し、上位装置に検出結果を通知する。

　以上により、運用中のネットワークに試験用音声信号を流す必要や音声パケットの特定のフィールドに試験用音声信号を埋め込むことなく、エコー信号の残留を検出することが可能になる。

　続いて、本発明をモバイルネットワークとＰＳＴＮ網２１９１間の音声通信サービスに対して音声品質解析を行う第４の実施形態について図面を参照して詳細に説明する。図８は、本発明の第４の実施形態の構成を表した図である。

　図８を参照すると、無線網１９０およびモバイルコアネットワーク１８０およびＰＳＴＮ網２１９１を介して、音声通信（音声電話）を行っている携帯端末１７０および電話端末２１７１が示されている。

　モバイルコアネットワーク１８０は、ＣＳＩＰ網（Ｃｉｒｃｕｉｔ　Ｓｗｉｔｃｈｅｄ　ｏｖｅｒ　－ＩＰ　ＮｅｔＷｏｒｋ）であると想定する。つまり回線交換の音声信号は対向して配置された音声通信装置１５０およびゲートウェイ装置２１５１によりＩＰパケットに変換されてモバイルコアネットワーク１８０を転送される。

　携帯端末１７０は、入力した音声を、所定の音声圧縮符号化方式により圧縮符号化されたビットストリームに変換し、該ビットストリームを出力する機能を備えている。ここで音声圧縮符号化方式としては、ＡＭＲ（Ａｄａｐｔｉｖｅ　Ｍｕｌｔｉ－Ｒａｔｅ　ｓｐｅｅｃｈ　ｃｏｄｅｃ）の１２．２ｋｂｐｓのビットレートを用いるものとする。ＡＭＲの詳細は、例えば、３ＧＰＰ　ＴＳ２６．０９０規格を参照できるのでここでは詳細な説明は省略する。

　音声通信装置１５０は、ＩｕＵＰプロトコルフレームの中から１２．２ｋｂｐｓ　ＡＭＲに関するヘッダ情報やビットストリームを取り出し、ＲＴＰ（Ｒｅａｌ－ｔｉｍｅ　Ｔｒａｎｓｐｏｒｔ　Ｐｒｏｔｏｃｏｌ）パケットのペイロード部に格納する。ここで、ＲＴＰペイロード部に格納する際に、ＡＭＲについてはＲＦＣ３２６７で規格化されたＲＴＰペイロードフォーマットを使用するものとする（３ＧＰＰ　ＴＳ２９．１６３参照）。従って、音声通信装置１５０は、ＲＦＣ３２６７によるペイロードフォーマットに、ＩｕＵＰフレームから必要な情報をコピーして移した上で、ペイロード部分に１２．２ｋｂｐｓ　ＡＭＲビットストリームを格納したＲＴＰパケットを、ＲＴＰ／ＵＤＰ／ＩＰプロトコルを用いてゲートウェイ装置２１５１に送出する。また、音声通信装置１５０は、一定時間間隔（例えば５秒）でＲＴＣＰ（Ｒｅａｌ－ｔｉｍｅ　Ｔｒａｎｓｐｏｒｔ　Ｃｏｎｔｒｏｌ　Ｐｒｏｔｏｃｏｌ）パケットをゲートウェイ装置２１５１に送出する。

　ゲートウェイ装置２１５１は、前記ＲＴＰパケットを入力し、ＲＴＰペイロードフォーマットを確認した上で、ペイロード部分に格納された１２．２ｋｂｐｓ　ＡＭＲストリームを、Ｇ．７１１ストリームに変換し、変換したＧ．７１１ストリームをＳＴＭ（Ｓｙｎｃｈｒｏｎｏｕｓ　Ｔｒａｎｓｆｅｒ　Ｍｏｄｅ）によりＰＳＴＮ網２１９１に出力する。

　電話端末２１７１は、接続するＰＳＴＮ網２１９１を介して音声信号を受信する。

　電話端末２１７１から携帯端末１７０の方向の音声通信は、上記と逆方向の流れとなるだけであり、同様であるので、説明は省略する。

　音声品質解析装置２１１０は、音声通信装置１５０とゲートウェイ装置２１５１間でやりとりされる、Ｎチャネル分（Ｎ≧１）の、上りおよび下りのＲＴＰパケット、ならびに、Ｎチャネル分の上りおよび下りのＲＴＣＰパケットを採取する。

　音声品質解析装置２１１０は、前記採取したＲＴＰパケットおよびＲＴＣＰパケットの解析を行う。

　図９は、本発明の第４の実施形態の音声品質解析装置の詳細構成を示すブロック図である。図９を参照すると、パケット受信部２１１１と、パケット受信部２１１１から出力されたパケットが入力されるＲＴＰヘッダ解析部２１１２と、ＲＴＣＰ解析部２１１３と、ＲＴＰペイロードヘッダ解析部２１１４と、ビットストリーム解析部２１１６と、これら各解析部からの解析結果が入力される出力部２１１７と、を備えた構成が示されている。なお、これら音声品質解析装置の各部は、ハードウェアのみならず、音声品質解析装置を構成するコンピュータに後記する処理を実行させるプログラムにより実現することもできる。

　パケット受信部２１１１は、上り方向および下り方向について、ＲＦＣ３２６７ペイロードフォーマットおよび１２．２　ｋｂｐｓ　ＡＭＲビットストリームを格納したＲＴＰパケットを採取して、ＲＴＰヘッダ解析部２１１２とＲＴＰペイロードヘッダ解析部２１１４とビットストリーム解析部２１１６とに出力する。また、パケット受信部２１１１は、ＲＴＣＰパケットを一定時間毎に受信してＲＴＣＰ解析部２１１３に出力する。

［ＲＴＰヘッダ解析］
　ＲＴＰヘッダ解析部２１１２は、ヘッダ解析として、パケットロス解析を実施し、その結果を出力部２１１７に出力する。ここで、パケットロス解析とは、あらかじめ定められた観測期間（例えば、１分間）に対し、ＲＴＰヘッダのシーケンス番号の連続性を調べ、連続性を欠く場合はパケットロスと判断し、パケットロスが継続する区間や、観測期間全体でのパケットロス率を算出する。

［ＲＴＣＰ解析］
　ＲＴＣＰ解析部２１１３は、次に記載する解析のうち、少なくとも一つの解析を行う。
（１）遅延時間の解析：ＲＴＣＰパケットを受信した時刻（ＮＴＰタイムスタンプ表示）と、ＲＴＣＰの中のＲＲ（Ｒｅｃｅｉｖｅｒ　Ｒｅｐｏｒｔ）に格納されたＬＳＲおよびＤＬＳＲを用いて、次式（３）により往復遅延Ｄを算出する。
　Ｄ＝ＲＴＣＰパケット受信時刻－ＤＬＳＲ－ＬＳＲ　・・・（３）
　ＲＴＣＰ解析部２１１３は、観測期間（例えば、１分間）内での往復遅延Ｄの値または往復遅延Ｄの値の時間変化を、出力部２１１７に出力する。さらに、往復遅延Ｄの値が予め定められたしきい値より大きい場合、ＲＴＣＰ解析部２１１３は、警告情報（アラーム）を出力部２１１７に出力する。

（２）ジッタ量の解析：ＲＴＣＰ解析部２１１３は、ＲＴＣＰ　ＲＲに格納されているジッタ量をコピーしてジッタ量の値ならびにジッタ量の時間変化を出力部２１１７に出力する。さらに、ジッタの値が予め定められたしきい値より大きい場合、ＲＴＣＰ解析部２１１３は、警告情報を出力部２１１７に出力する。

［ＲＴＰペイロードヘッダ解析］
　ＲＴＰペイロードヘッダ解析部２１１４は、ビット誤りの発生による音質劣化の解析を行う。具体的には、ＲＴＰペイロードヘッダ解析部２１１４は、ＲＴＰパケットのＲＦＣ３２６７ペイロードフォーマットのヘッダ部に格納されたＱ（Ｑｕａｌｉｔｙ）フィールドの値をチェックし、観測期間中に１（Ｇｏｏｄ）以外の値になっている回数と継続時間を算出する。ＲＴＰペイロードヘッダ解析部２１１４は、これらの数値を出力部２１１７に出力する。さらに、ＲＴＰペイロードヘッダ解析部２１１４は、回数と継続時間の少なくとも一方が予め定められたしきい値を超える場合、品質劣化であると判断し、警告情報を出力部２１１７に出力する。

［ビットストリーム解析（残留エコーの検出）］
　続いて、残留エコーの検出方法について詳細に説明する。
　図１０は、ビットストリーム解析部２１１６の構成例を示している。図１０を参照すると、ビットストリーム抽出部２１１８と、ＬＳＰパラメータ復号部２１１９と、残留エコー検出部２１２０とを備えた構成が示されている。

　ビットストリーム抽出部２１１８は、ＲＴＰヘッダ解析部２１１２からＲＴＰパケットの受信があることを通知されると、上り方向と下り方向のＲＴＰパケットを入力し、それぞれに対して、ＲＦＣ３２６７ペイロードフォーマット部に格納されている１２．２ｋｂｐｓ　ＡＭＲのビットストリームを抽出する。ここでは、フレーム当たりのＡＭＲビットストリーム２４４ビットのうち、ＬＳＰ（線スペクトル対）パラメータをあらわす３８ビットを抽出して出力するものとする。

　ＬＳＰパラメータ復号部２１１９は、上り方向ならびに下り方向の両方について、前記３８ビットの部分（ＬＳＰパラメータ）のみを復号し、残留エコー検出部２１２０に出力する。

　残留エコー検出部２１２０は、上り方向ならびに下り方向の両方について、復号したＬＳＰパラメータを入力してＬＰＣ（線形予測符号）係数に変換し、さらに、ＬＰＣスペクトルＰ（ｎ）　（ｎは１以上でＮ以下）、または、ＬＰＣケプストラムｃ（ｎ）　（ｎは１以上でＭ以下）に変換する。

　なお以下では、ＬＰＣスペクトルＰ（ｎ）を用いるものとして説明する。ここで、上り方向のＬＳＰパラメータから計算したＬＰＣスペクトルをＰｆ（ｎ）と表し、下り方向のＬＳＰパラメータから計算したＬＰＣスペクトルをＰｂ（ｎ）と表す。（但し、それぞれのｎは１以上でＮ以下）とする。

　残留エコー検出部２１２０は、さらに次式（４）の計算を行う。
　ＣＣ（τ）＝Ｍａｘ［ΣＰｂ（ｎ）Ｐｆ（ｎ＋τ）］　・・・（４）
　式（４）で、ＣＣ（τ）は遅れ時刻τの場合の、上りならびに下りのＬＰＣスペクトル同士のクロスパワスペクトルを表す。残留エコー検出部２１２０は、遅れ時刻τを１からフレーム長の整数倍（例えば１００ｍｓ）まで、フレーム長間隔（例えば２０ｎｍｓ）で変化させ、ＣＣ（τ）を最大にする遅れ時刻τを算出する。ＣＣ（τ）の最大値があらかじめ定められた閾値を超える場合、残留エコー検出部２１２０は、残留エコーが存在すると判定し、検出結果や警告情報等を出力部２１１７に出力する。

　出力部２１１７は、各解析部からの検出結果やアラーム情報を収集し、これらを、あらかじめ定められた時間毎に、またはアラームを検出する毎に、上位装置２１３０に出力する。

　以上のとおり、本発明の第４の実施形態によれば、運用中のネットワークに試験用音声信号を流す必要や音声パケットの特定のフィールドに試験用音声信号を埋め込むことなく、ネットワークにＰＳＴＮ網とＩＰ網とを相互接続するゲートウェイが存在するような図１に示した構成においてエコー信号が残留することによる音質劣化を検出することが可能になる。

　また、本発明の第４の実施形態における残留エコーの検出方法は、ビットストリーム全体を復号して信号を再生した上で再生信号からスペクトルパラメータを計算し相関をとる方法や、前記再生信号同士の相互相関を計算する方法に比べ、極めて少ない処理量でエコーの残留を検出することができる。その理由は、上り方向ならびに下り方向のビットストリームのうちのスペクトルパラメータのみを復号し、上り方向のスペクトルと下り方向のスペクトルの相関を求めることにより、エコーの残留を検出する手法を採用したことにある。

　また、上記した第４の実施形態のビットストリーム解析部２１１６は、下記のような構成とすることもできる。

　図１１は、ビットストリーム解析部の変形実施形態の構成を示すブロック図である。図１１において、図１０と同一の番号を付した構成要素は、第４の実施形態と同等の構成要素であるので説明を省略し、以下、相違点を説明する。

　ゲインパラメータ復号部２１２５は、ＡＭＲ　１２．２ｋｂｐｓ　フレームあたり２４４ビットのビットストリームのうちの固定コードブックゲインの部分である７ビットについて、上りならびに下りの両方向を復号し、ゲインを求める。次に、ゲインパラメータ復号部２１２５は、フレーム毎にゲインが予め定められたしきい値を超えているかどうかを判別し、しきい値以下のフレームは無音フレームと判断し、これを残留エコー検出部２１２８に出力する。

　残留エコー検出部２１２８は、上り方向ならびに下り方向のＬＰＣスペクトルのクロスパワスペクトルを式（４）に従い、計算するが、この計算のときに、前記ゲインパラメータ復号部２１２５にて無音フレームと判断されたフレームはクロスパワスペクトル計算には含めない。これは、無音フレーム同士でクロスパワスペクトルを計算すると、相関値が大きくなり、誤判断してしまうことを防止するためである。

　以上のように、図１１に示した変形実施形態によれば、図１０の構成と比較して、より精度よく残留エコーを検出することが可能になる。

　以上、本発明の好適な実施形態を説明したが、本発明は、上記した実施形態に限定されるものではなく、本発明の基本的技術的思想を逸脱しない範囲で、更なる変形・置換・調整を加えることができる。例えば、上記した実施形態では、モバイルネットワークの音声品質の解析に適用する例を挙げて説明したが、ブロードバンドネットワーク、ＮＧＮやインターネット等における音声品質解析にも適用することができる。ただし、この場合は、ＡＭＲが用いられる場合であっても、ＲＴＰペイロードとして、モバイル特有のＩｕＵＰプロトコルは用いられず、ＲＦＣ３２６７プロトコルが用いられるので、ＩｕＵＰの代わりにＲＦＲＣ３２６７に置き換えればよい。また、Ｇ．７２９やＧ．７１１が用いられる場合は、上記のとおり、ＩｕＵＰは使われていないが上記と同様に音声品質解析を行うことが可能である。

　最後に、本発明の好ましい形態を要約する。
［第１の形態］
　（上記第１の視点による音声品質解析装置参照）
［第２の形態］
　第１の形態の音声品質解析装置において、
　予め定められた時間毎に前記上位装置に対し検出結果を通知する音声品質解析装置。
［第３の形態］
　第１または第２の形態の音声品質解析装置において、
　音声品質の劣化を検出したときに、前記上位装置に対し検出結果を通知する音声品質解析装置。
［第４の形態］
　第１から第３いずれか一の形態の音声品質解析装置において、
　前記音声品質解析部は、ペイロードに格納されたビットストリーム中のゲインに関するパラメータを復号することにより推定したレベルに基づいて装置の異常を検出する音声品質解析装置。
［第５の形態］
　第１から第４いずれか一の形態の音声品質解析装置において、
　前記音声品質解析部は、ペイロードに格納されたビットストリーム中のＳＩＤ（Ｓｉｌｅｎｃｅ　Ｉｎｓｅｒｔｉｏｎ　Ｄｅｓｃｒｉｐｔｏｒ）フレームを復号することにより、推定したレベルに基づいて装置の異常を検出する音声品質解析装置。
［第６の形態］
　第１から第５いずれか一の形態の音声品質解析装置において、
　前記音声品質解析部は、音声圧縮符号化方式がＩＴＵ－Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７１１である場合、ペイロードに格納されたビットストリーム全体を復号することにより推定したレベルに基づいて装置の異常を検出する音声品質解析装置。
［第７の形態］
　第１から第６いずれか一の形態の音声品質解析装置において、
　前記パケットを採取するネットワークとして、ＩＰ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ）ネットワーク、ＮＧＮ（Ｎｅｘｔ　Ｇｅｎｅｒａｔｉｏｎ　Ｎｅｔｗｏｒｋ）、インターネット網またはモバイルネットワークの少なくとも一つを含む音声品質解析装置。
［第８の形態］
　（上記第２の視点による音声品質解析方法参照）
［第９の形態］
　（上記第３の視点によるプログラム参照）
［第１０の形態］
　少なくとも２つの端末の少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納した第１のパケットをネットワークから採取し、前記第１のパケットのヘッダの解析に加えて、ペイロードヘッダの解析および前記ペイロードに格納されたビットストリームの解析のうちの少なくとも一つを行うことで音声通信サービス品質の劣化を検出する第１の音声品質解析部と、制御信号を格納した第２のパケットをネットワークから採取し、前記第２のパケットを解析する第２の音声品質解析部とを有し、前記第１の音声品質解析部の検出結果を、前記第２の音声品質解析部の解析結果により検証することを特徴とする音声品質解析装置。
［第１１の形態］
　第１０の形態の音声品質解析装置において、
　前記第１、第２の音声品質解析部は、予め定められた時間毎に上位装置に対し検出結果を通知し、
　前記上位装置は、前記第１の音声品質解析部の検出結果を、前記第２の音声品質解析部の解析結果により検証する音声品質解析装置。
［第１２の形態］
　第１０または第１１の形態の音声品質解析装置において、
　前記第１の音声品質解析部は、音声品質の劣化を検出したときに、前記上位装置に対し検出結果を通知し、
　前記上位装置は、前記第１の音声品質解析部の検出結果を、前記第２の音声品質解析部の解析結果により検証する音声品質解析装置。
［第１３の形態］
　第１０から第１２いずれか一の形態の音声品質解析装置において、
　前記第１の音声品質解析部は、ペイロードに格納されたビットストリーム中のゲインに関するパラメータを復号することにより推定したレベルに基づいて装置の異常を検出する音声品質解析装置。
［第１４の形態］
　第１０から第１３いずれか一の形態の音声品質解析装置において、
　前記第１の音声品質解析部は、ペイロードに格納されたビットストリーム中のＳＩＤ（Ｓｉｌｅｎｃｅ　Ｉｎｓｅｒｔｉｏｎ　Ｄｅｓｃｒｉｐｔｏｒ）フレームを復号することにより、推定したレベルに基づいて装置の異常を検出する音声品質解析装置。
［第１５の形態］
　第１０から第１４いずれか一の形態の音声品質解析装置において、
　前記第１の音声品質解析部は、音声圧縮符号化方式がＩＴＵ－Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７１１である場合、ペイロードに格納されたビットストリーム全体を復号することにより推定したレベルに基づいて装置の異常を検出する音声品質解析装置。
［第１６の形態］
　第１０から第１５いずれか一の形態の音声品質解析装置において、
　前記第２のパケットに格納される制御信号は、ＳＩＰ（Ｓｅｓｓｉｏｎ　Ｉｎｉｔｉａｔｉｏｎ　Ｐｒｏｔｏｃｏｌ）のメッセージである音声品質解析装置。
［第１７の形態］
　第１０から第１６いずれか一の形態の音声品質解析装置において、
　前記第１、第２のパケットを採取するネットワークとして、ＩＰ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ）ネットワーク、ＮＧＮ（Ｎｅｘｔ　Ｇｅｎｅｒａｔｉｏｎ　Ｎｅｔｗｏｒｋ）、インターネット網またはモバイルネットワークの少なくとも一つを含む音声品質解析装置。
［第１８の形態］
　少なくとも２つの端末の少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納した第１のパケットと制御信号を格納した第２のパケットとをネットワークから採取するステップと、
　前記第１のパケットのヘッダの解析に加えて、ペイロードヘッダの解析および前記ペイロードに格納されたビットストリームの解析のうちの少なくとも一つを行うことで音声通信サービス品質の劣化を検出する第１の音声品質解析ステップと、
　前記第２のパケットを解析する第２の音声品質解析ステップと、含み、
　前記第１の音声品質解析ステップの検出結果を、前記第２の音声品質解析ステップの解析結果により検証することを特徴とする音声品質解析方法。
［第１９の形態］
　少なくとも２つの端末の少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納した第１のパケットと制御信号を格納した第２のパケットとをネットワークから採取する処理と、
　前記第１のパケットのヘッダの解析に加えて、ペイロードヘッダの解析および前記ペイロードに格納されたビットストリームの解析のうちの少なくとも一つを行うことで音声通信サービス品質の劣化を検出する第１の音声品質解析処理と、
　前記第２のパケットを解析する第２の音声品質解析処理と、
　前記第１の音声品質解析ステップの検出結果を、前記第２の音声品質解析ステップの解析結果により検証する処理と、
　を音声品質解析装置を構成するコンピュータに実行させるプログラム。
［第２０の形態］
　端末同士の音声通信中に、各端末から送出された音声を圧縮符号化したビットストリームを格納した上り方向パケットと下り方向パケットとをそれぞれネットワークから採取し、前記各パケットのペイロードに格納されたビットストリームのうちのスペクトルパラメータをそれぞれ復号し、前記上り方向および下り方向の復号結果を用いて、上り方向のスペクトルと下り方向のスペクトルとの相関を求めることでエコーが残留しているか否かを検出し、上位装置に通知する音声品質解析部を有することを特徴とする音声品質解析装置。
［第２１の形態］
　第２０の形態の音声品質解析装置において、
　さらに、前記各パケットのペイロードに格納されたビットストリームのうちのゲインに関するパラメータを復号し、
　前記上り方向のスペクトルと下り方向のスペクトルとの相関を求める際に、前記ゲインにより特定した無音フレームを除外すること、
　を特徴とする音声品質解析装置。
［第２２の形態］
　第２０または２１の形態の音声品質解析装置において、
　前記スペクトルパラメータとして、ビットストリームに含まれる線スペクトル対(ＬＳＰ)パラメータを用いる音声品質解析装置。
［第２３の形態］
　第２０から第２２いずれか一の形態の音声品質解析装置において、
　前記スペクトルパラメータの復号結果を、線形予測符号係数に変換し、さらに、線形予測符号スペクトルまたは線形予測符号ケプストラムに変換し、
　遅れ時間を所定の範囲で変化させながら、上り方向と下り方向の線形予測符号スペクトルまたは線形予測符号ケプストラム同士の相関値を求め、
　前記遅れ時間を変化させて求めた複数の相関値のうちの最大値が、所定のしきい値より大きい場合に、エコーが残留していると判定する音声品質解析装置。
［第２４の形態］
　第２０から第２３いずれか一の形態の音声品質解析装置において、
　前記残留エコーの検出に加えて、パケットロス、遅延時間、ジッタ量、ビット誤りの発生状況を検出する機能を備える音声品質解析装置。
［第２５の形態］
　第２０から第２４いずれか一の形態の音声品質解析装置において、
　予め定められた時間毎に前記上位装置に対し検出結果を通知する音声品質解析装置。
［第２６の形態］
　第２０から第２５いずれか一の形態の音声品質解析装置において、
　エコーの残留を検出したときに、前記上位装置に対し検出結果を通知する音声品質解析装置。
［第２７の形態］
　第２０から第２６いずれか一の形態の音声品質解析装置において、
　前記パケットを採取するネットワークとして、ＩＰ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ）ネットワーク、ＮＧＮ（Ｎｅｘｔ　Ｇｅｎｅｒａｔｉｏｎ　Ｎｅｔｗｏｒｋ）、インターネット網またはモバイルネットワークの少なくとも一つを含む音声品質解析装置。
［第２８の形態］
　端末同士の音声通信中に、各端末から送出された音声を圧縮符号化したビットストリームを格納した上り方向パケットと下り方向パケットとをそれぞれネットワークから採取するステップと、
　前記各パケットのペイロードに格納されたビットストリームのうちのスペクトルパラメータをそれぞれ復号するステップと、
　前記上り方向および下り方向の復号結果を用いて、上り方向のスペクトルと下り方向のスペクトルとの相関を求めて、エコーが残留しているか否かを判定するステップと、を含み、
　前記相関値が所定のしきい値より大きい場合に、エコーが残留していると判定する音声品質解析方法。
［第２９の形態］
　端末同士の音声通信中に、各端末から送出された音声を圧縮符号化したビットストリームを格納した上り方向パケットと下り方向パケットとをそれぞれネットワークから採取する処理と、
　前記各パケットのペイロードに格納されたビットストリームのうちのスペクトルパラメータをそれぞれ復号する処理と、
　前記上り方向および下り方向の復号結果を用いて、上り方向のスペクトルと下り方向のスペクトルとの相関を求めて、エコーが残留しているか否かを判定する処理と、を音声品質解析装置を構成するコンピュータに実行させ、
　前記コンピュータに、前記相関値が所定のしきい値より大きい場合に、エコーが残留していると判定させるプログラム。

１１０、１１０Ａ、２１１０　音声品質解析装置
１１１　パケット受信部
１１２　ＲＴＰヘッダ解析部
１１３　ＲＴＣＰ解析部
１１４　ＲＴＰペイロードヘッダ解析部
１１５、１１７　出力部
１１６　ビットストリーム解析部
１１８　ビットストリーム抽出部
１１９　ゲインパラメータ復号部
１２０、１２２　レベル推定部
１２１　ビットストリーム復号部
１３０、１４０　上位装置
１４５　監視装置
１５０、１５１　音声通信装置
１７０、１７１　携帯端末
１８０　モバイルコアネットワーク
１９０、１９１　無線網
１１１０　Ｕ－Ｐｌａｎｅ解析装置
１１３０　Ｃ－Ｐｌａｎｅ解析装置
２１１１　パケット受信部
２１１２　ＲＴＰヘッダ解析部
２１１３　ＲＴＣＰ解析部
２１１４　ＲＴＰペイロードヘッダ解析部
２１１７　出力部
２１１６、２１１６Ａ　ビットストリーム解析部
２１１８　ビットストリーム抽出部
２１１９　ＬＳＰパラメータ復号部
２１２０、２１２８　残留エコー検出部
２１２５　ゲインパラメータ復号部
２１５１　ゲートウェイ装置
２１７１　電話端末
２１９１　ＰＳＴＮ網

Claims

　端末同士の音声通信中に、少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納したパケットを、ネットワークから採取し、前記パケットのヘッダの解析に加えて、ペイロードヘッダの解析および前記ペイロードに格納されたビットストリームの解析のうちの少なくとも一つを行うことで音声通信サービス品質の劣化を検出し、上位装置に検出結果を通知する音声品質解析部を有することを特徴とする音声品質解析装置。
　さらに、制御信号を格納した第２のパケットをネットワークから採取し、前記第２のパケットを解析する第２の音声品質解析部を有し、前記音声品質解析部の検出結果を、前記第２の音声品質解析部の解析結果により検証する請求項１の音声品質解析装置。
　前記音声品質解析部は、ペイロードに格納されたビットストリーム中のゲインに関するパラメータを復号することにより推定したレベルに基づいて装置の異常を検出する請求項１または２の音声品質解析装置。
　前記音声品質解析部は、ペイロードに格納されたビットストリーム中のＳＩＤ（Ｓｉｌｅｎｃｅ　Ｉｎｓｅｒｔｉｏｎ　Ｄｅｓｃｒｉｐｔｏｒ）フレームを復号することにより推定したレベルに基づいて装置の異常を検出する請求項１または２の音声品質解析装置。
　前記音声品質解析部は、音声圧縮符号化方式がＩＴＵ－Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７１１である場合、ペイロードに格納されたビットストリーム全体を復号することにより推定したレベルに基づいて装置の異常を検出する請求項１または２の音声品質解析装置。
　前記音声品質解析部に代えて、
　端末同士の音声通信中に、各端末から送出された音声を圧縮符号化したビットストリームを格納した上り方向パケットと下り方向パケットとをそれぞれネットワークから採取し、前記各パケットのペイロードに格納されたビットストリームのうちのスペクトルパラメータをそれぞれ復号し、前記上り方向および下り方向の復号結果を用いて、上り方向のスペクトルと下り方向のスペクトルとの相関を求めることでエコーが残留しているか否かを検出し、上位装置に通知する第３の音声品質解析部を有する請求項１から５いずれか一の音声品質解析装置。
　さらに、前記各パケットのペイロードに格納されたビットストリームのうちのゲインに関するパラメータを復号し、
　前記上り方向のスペクトルと下り方向のスペクトルとの相関を求める際に、前記ゲインにより特定した無音フレームを除外すること、
　を特徴とする請求項６の音声品質解析装置。
　前記スペクトルパラメータとして、ビットストリームに含まれる線スペクトル対(ＬＳＰ)パラメータを用いる請求項６または７の音声品質解析装置。
　前記スペクトルパラメータの復号結果を、線形予測符号係数に変換し、さらに、線形予測符号スペクトルまたは線形予測符号ケプストラムに変換し、
　遅れ時間を所定の範囲で変化させながら、上り方向と下り方向の線形予測符号スペクトルまたは線形予測符号ケプストラム同士の相関値を求め、
　前記遅れ時間を変化させて求めた複数の相関値のうちの最大値が、所定のしきい値より大きい場合に、エコーが残留していると判定する請求項６から８いずれか一記載の音声品質解析装置。
　前記残留エコーの検出に加えて、パケットロス、遅延時間、ジッタ量、ビット誤りの発生状況を検出する機能を備える請求項５から８いずれか一記載の音声品質解析装置。
　予め定められた時間毎に前記上位装置に対し検出結果を通知する請求項１から１０いずれか一の音声品質解析装置。
　音声品質の劣化またはエコーの残留を検出したときに、前記上位装置に対し検出結果を通知する請求項１から１１いずれか一の音声品質解析装置。
　前記パケットを採取するネットワークとして、ＩＰ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ）ネットワーク、ＮＧＮ（Ｎｅｘｔ　Ｇｅｎｅｒａｔｉｏｎ　Ｎｅｔｗｏｒｋ）、インターネット網またはモバイルネットワークの少なくとも一つを含む請求項１から１２いずれか一の音声品質解析装置。
　端末同士の音声通信中に、少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納したパケットをネットワークから採取するステップと、
　前記パケットのヘッダの解析に加えて、ペイロードヘッダの解析およびペイロードに格納されたビットストリームの解析のうちの少なくとも一つを実行するステップと、
　前記解析結果に基づいて音声通信サービス品質の劣化を検出し、上位装置に検出結果を通知するステップと、
　を含む音声品質解析方法。
　前記端末同士の音声通信中に、少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納したパケットをネットワークから採取するステップと、前記パケットのヘッダの解析に加えて、ペイロードヘッダの解析およびペイロードに格納されたビットストリームの解析のうちの少なくとも一つを実行するステップと、前記解析結果に基づいて音声通信サービス品質の劣化を検出し、上位装置に検出結果を通知するステップと、に代えて、
　端末同士の音声通信中に、各端末から送出された音声を圧縮符号化したビットストリームを格納した上り方向パケットと下り方向パケットとをそれぞれネットワークから採取するステップと、
　前記各パケットのペイロードに格納されたビットストリームのうちのスペクトルパラメータをそれぞれ復号するステップと、
　前記上り方向および下り方向の復号結果を用いて、上り方向のスペクトルと下り方向のスペクトルとの相関を求めて、エコーが残留しているか否かを判定するステップと、を含み、
　前記相関値が所定のしきい値より大きい場合に、エコーが残留していると判定する請求項１４の音声品質解析方法。
　端末同士の音声通信中に、少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納したパケットをネットワークから採取する処理と、
　前記パケットのヘッダの解析に加えて、ペイロードヘッダの解析およびペイロードに格納されたビットストリームの解析のうちの少なくとも一つを実行する処理と、
　前記解析結果に基づいて音声通信サービス品質の劣化を検出し、上位装置に検出結果を通知する処理と、
　を音声品質解析装置を構成するコンピュータに実行させるプログラム。
　前記端末同士の音声通信中に、少なくとも一方の端末から送出された音声を圧縮符号化したビットストリームを格納したパケットをネットワークから採取する処理と、前記パケットのヘッダの解析に加えて、ペイロードヘッダの解析およびペイロードに格納されたビットストリームの解析のうちの少なくとも一つを実行する処理と、前記解析結果に基づいて音声通信サービス品質の劣化を検出し、上位装置に検出結果を通知する処理と、に代えて、
　端末同士の音声通信中に、各端末から送出された音声を圧縮符号化したビットストリームを格納した上り方向パケットと下り方向パケットとをそれぞれネットワークから採取する処理と、
　前記各パケットのペイロードに格納されたビットストリームのうちのスペクトルパラメータをそれぞれ復号する処理と、
　前記上り方向および下り方向の復号結果を用いて、上り方向のスペクトルと下り方向のスペクトルとの相関を求めて、エコーが残留しているか否かを判定する処理と、を音声品質解析装置を構成するコンピュータに実行させ、
　前記コンピュータに、前記相関値が所定のしきい値より大きい場合に、エコーが残留していると判定させる請求項１６のプログラム。