JP5074749B2 - 音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体 - Google Patents

音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP5074749B2
JP5074749B2 JP2006327051A JP2006327051A JP5074749B2 JP 5074749 B2 JP5074749 B2 JP 5074749B2 JP 2006327051 A JP2006327051 A JP 2006327051A JP 2006327051 A JP2006327051 A JP 2006327051A JP 5074749 B2 JP5074749 B2 JP 5074749B2
Authority
JP
Japan
Prior art keywords
audio signal
frame
packet loss
waveform
delay buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006327051A
Other languages
English (en)
Other versions
JP2008139661A (ja
Inventor
仲 大室
岳至 森
祐介 日和▲崎▼
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006327051A priority Critical patent/JP5074749B2/ja
Publication of JP2008139661A publication Critical patent/JP2008139661A/ja
Application granted granted Critical
Publication of JP5074749B2 publication Critical patent/JP5074749B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

この発明は、ディジタル化された音声、音楽などの音響信号(以下総称して音声信号)をインターネットをはじめとするパケット通信網を介して送信する際に、受信側において、安定した品質で音声信号を再生するための音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体に関する。
音声信号をVoice over IP技術を利用して送信するサービスが普及しつつある。図1に示すように、入力音声信号を音声信号送信装置20でフレームと呼ばれる一定の時間(例えば10ミリ秒〜20ミリ秒)ごとに区切って音声パケットに変換し、パケット通信網30を通して音声信号受信装置10にリアルタイムに送信する場合、通信網の状態によっては通信路の途中でパケットロスが生じ、それによって再生音声が途切れるといった品質劣化が問題となっている。特に、インターネットなどのベストエフォートと呼ばれる通信サービスの場合には、通信網の混雑時に特にこの問題が顕著である。
そこで、音声信号をパケット通信網で通信する場合には、パケット消失補償と呼ばれる手法を用いて、パケットが通信路の途中で消失あるいは通信路の遅延によって制限時間内に受信側に届かなかった場合(以下総称してパケットロスの場合)に、届かなかったパケット(以下ロスパケット)に対応する区間の音声信号を受信側で推定して補償する方法が用いられる。パケット消失補償処理の代表的な方法として、非特許文献1が知られている。
図2は、非特許文献1で用いられている音声信号受信装置10の構成例である。以下では説明を簡単にするため、音声信号送信装置では1フレーム毎の音声信号符号データを1パケットに挿入して送出するものとする。一連の音声パケットは、ゆらぎ吸収バッファとも呼ばれるパケット受信部11によって順次受信され、受信バッファ12に格納される。
制御部16の制御に従って受信バッファ12から蓄積された音声パケットがフレーム番号の小さい順に取り出される。取り出された音声パケットは、音声波形復号部13に送られ、ディジタル音声信号に復号されて出力される。出力されたディジタル音声信号は、予め決められた時間(フレーム数)だけ、出力音声バッファ14に蓄積される。なお、以降の説明においても音声波形復号部により復号され出力される音声信号はこの発明の場合も含めてディジタル音声信号であり、従って、以下においては特にディジタル信号であることをことわらず単に音声信号と呼ぶ。
受信バッファ12から音声パケットを取り出す段階において、取り出すべきフレーム番号の音声パケットが蓄積されていない場合、パケットロス判定部15
は、当該フレームでパケットロスが発生したと判断し、パケットロスである旨を制御部16に伝える。
制御部16は、パケットロスが発生した旨を受け取ると、スイッチSWをB側にセットする。音声波形補間処理部17は、出力音声バッファ14内の音声信号を用いて、パケットロスが発生したフレームの音声信号を補間処理により生成し、スイッチSWを通して出力する。
図3は音声波形補間処理部17において出力音声信号を生成する補間処理を概念的に表したものである。出力音声バッファ14内の音声信号の最後のサンプル点SEからピッチ長と呼ばれる音声の基本周期に対応した長さだけ遡った波形3Aをコピーし、その波形を音声波形補間処理部17内の図示してないロスフレームバッファに順に波形3B、3C、3Dとして並べて貼り付ける。この合成された波形の音声信号を現フレーム(ロスフレーム)の音声信号としてスイッチSWを通して出力する。なお、波形接続部が不連続とならないように、波形3Aを1ピッチ長よりも少し長く取り、波形の一部を重ね合わせながらコピーする方法を用いてもよい。
非特許文献1(図3)の方法の問題は、過去の出力信号のみを用いて波形の補間処理(一方向の外挿ともいう)を行うために、音声の特性が変動している過渡部、例えば無音(背景雑音)区間から音声区間への変化部、あるいは無声音から有声音への変化部などでパケットロスが発生すると、音質が劣化することである。
この問題を解決する方法として、非特許文献2の方法が提案されている。図4に、非特許文献2で用いられている音声信号受信装置の構成例を、図2と同じ構成要素には同じ参照番号を付けて示す。
図4に示す音声信号受信装置10は、図2の装置においてバッファ探索部18が追加された構成となっている。図4の装置では、パケットロスが発生すると、バッファ探索部18において受信バッファ12内を探索し、パケットロスが発生したフレームよりも後のフレーム番号のパケットが受信バッファ12内に到着している揚合には、当該パケットをデコードし、デコードして得られた音声信号(以下先読み波形と呼ぶ)を音声波形補間処理部17に送る。
図5は、図4における音声波形補間処理部17によって音声波形を補間処理により生成する補間処理を概念的に示す。音声波形補間処理部17は、非特許文献1(図3)の方法と同様に出力音声バッファ14内の音声信号から1ピッチ長の波形3Aをコピーして1フレームを埋めるように波形3B,3C,3Dとして並べて貼り付ける処理と、先読み波形の先頭から1ピッチ長の波形4Aをコピーして、後向きに1フレームを埋めるように波形4B,4C,4Dとして並べて貼り付ける処理とによって、前向き補間されたフレーム波形31と後ろ向き補間されたフレーム波形41を生成し、それら2つのフレーム波形の加重和によって1つのフレーム波形を生成する。このような処理を、前後方向の内挿ともいう。なお、図3の説明と同様に、波形接続部が不連続とならないように、波形3Aあるいは4Aを1ピッチ長よりも少し長く取り、波形の一部を重ね合わせながらコピーする方法を用いてもよい。
ITU-T Rec. G.711 Appendix I(1999) 大室、森、日和崎、栗原、片岡、"音声特徴量並行送信によるバーストパケットロス耐性の向上"、電子情報通信学会 信学技報 SP2004-77(2004)
非特許文献2(図5)の方法は、音声信号の過渡部でパケットロスが発生した場合において、過渡部の品質劣化を抑える優れた方法である。一般的なパケット音声通信端末では、受信バッファとパケット消失補償処理は別のプロセッサに実装することが多い。しかしながら、図4において受信バッファとパケット消失補償を別のプロセッサに実装するハードウェア上では、同じ受信バッファ12に対し受信バッファ処理とパケット消失補償処理、特に受信バッファ探索部18による探索処理とを密に連動させて非特許文献2の方法を実現することは、大変に複雑な実装が必要となり、実質的に実現が困難であった。
この発明の目的は、パケット消失補償処理が容易に実行可能な音声信号受信装置、音声パケット消失補償方法、及びその方法のプログラムと、そのプログラムを記録した記録媒体を提供することである。
この発明による音声信号受信装置は、
受信した音声パケットを一時的に蓄える受信バッファと、
上記受信バッファから、フレーム番号の小さい順に音声パケットを取り出し、音声パケット内の音声符号を復号して音声信号を得る復号手段と、
取り出すべき音声パケットが上記受信バッファに蓄積されているか否かを判定し、判定結果をパケットロスが発生したか否かを表すパケットロスフラグとして生成するパケットロス判定手段と、
復号された上記音声信号を指定されたフレーム数まで蓄積し、フレーム番号の小さい順に音声信号を出力する遅延バッファ手段と、
予め決められた時間またはフレーム数の出力音声信号を蓄積する出力音声バッファ手段と、
上記遅延バッファ手段から出力すべきフレームがパケットロスであった場合に、上記出力音声バッファ内の出力音声信号から波形をコピーすることによって第1の補間波形を生成し、上記遅延バッファ手段内から探索された、上記パケットロスのフレームよりも後のフレーム番号の音声信号からコピーした波形によって第2の補間波形を生成し、上記第1の補間波形と上記第2の補間波形を用いて補間音声信号を生成し、それをパケットロスのフレームに対応する出力音声とする音声波形補間処理手段と、
上記遅延バッファ手段から出力すべきフレームがパケットロスでなければ上記遅延バッファ手段からの音声信号を出力音声信号として出力し、パケットロスであれば上記音声波形補間処理手段からの上記補間音声信号を出力音声信号として出力する出力制御手段、
とを含むように構成されている。
また、この発明による音声パケット消失補償方法は、
(a) 受信した音声パケットを受信バッファに一時的に蓄えるステップと、
(b) 上記受信バッファから、フレーム番号の小さい順に音声パケットを取り出し、音声パケット内の音声符号を復号して音声信号を得るステップと、
(c) 取り出すべき音声パケットが上記受信バッファに蓄積されているか否かを判定し、判定結果をパケットロスが発生したか否かを表すパケットロスフラグとして生成するステップと、
(d) 復号された上記音声信号を指定されたフレーム数まで遅延バッファ手段に蓄積し、フレーム番号の小さい順に音声信号を遅延バッファ手段から出力するステップと、
(e) 予め決められた時間またはフレーム数の出力音声信号を出力音声バッファ手段に蓄積するステップと、
(f) 上記遅延バッファ手段から出力すべきフレームがパケットロスであった場合に、上記出力音声バッファ内の出力音声信号から波形をコピーすることによって第1の補間波形を生成し、上記遅延バッファ手段内から探索された、上記パケットロスのフレームよりも後のフレーム番号の音声信号からコピーした波形によって第2の補間波形を生成し、上記第1の補間波形と上記第2の補間波形を用いて補間音声信号を生成し、それをパケットロスのフレームに対応する出力音声とするステップと、
(g) 上記遅延バッファ手段から出力すべきフレームがパケットロスでなければ上記遅延バッファ手段からの音声信号を出力音声信号として出力し、パケットロスであれば上記音声波形補間処理手段からの上記補間音声信号を出力音声信号として出力するステップ、
とを含む。
この発明によれば、復号音声信号を遅延バッファ手段に指定されたフレーム数だけ保持し、出力し、パケットロスのフレームについては遅延バッファ手段内のロスフレームより後の音声信号を先読みして補間波形を生成するので、受信バッファとパケット消失補償を別プロセッサにインプリメントする場合においても、必要最小限の遅延の増加で、過渡部における音質劣化の少ないパケット消失補償を実現できる。結果として、低コストで通話品質の高いパケット音声通信端末が容易に実現可能である。
本発明は、コンピュータ本体とコンピュータプログラムとして実行することが可能であるし、デジタルシグナルプロセッサや専用LSIに実装して実現することも可能である。
[実施例1]
図6は、本発明における音声信号受信装置の構成例である。図2,4における装置と共通する構成要素には同じ参照番号を付けて示してある。この発明による音声信号受信装置は、パケット受信部11,受信バッファ12,音声波形復号部13,出力音声バッファ14,パケットロス判定部15、制御部16,音声波形補間処理部17,バッファ探索部18が設けられている点は図4の場合と同様である。図6の実施例では、更に遅延バッファ部19と出力制御部21が追加されている。出力音声バッファ14、音声波形補間処理部17、バッファ探索部18、遅延バッファ部19、スイッチSWはパケット消失補償処理部100を構成している。
図2で説明したと同様に、音声パケットは、パケット受信部11によって受信され、受信バッファ12に送られる。制御部16の制御に従って受信バッファ12からフレーム番号の小さい順に蓄積された音声パケットが取り出される。取り出された音声パケットは、音声波形復号部13に送られ、音声信号に復号されて、この発明では遅延バッファ部19に送られる。ここで、復号された音声信号には、狭義の音声波形信号即ちPCM形式を代表とする音声波形信号だけでなく、音声波形復号時に得られる音声パラメータ(例えば、ピッチ、パワー、フレーム番号情報等)も含んでもよい。
パケットロス判定部15は、受信バッファから音声パケットが取り出される段階において、取り出されるべきフレーム番号の音声パケットが蓄積されていいるか否かを判定し、判定結果を当該フレームでパケットロスが発生したか否かを表すパケットロスフラグFPLとして制御部16に与える。例えばFPL=1の場合はパケットロスが生じたことを表すものとする。
制御部16は、パケットロスフラグFPLを受け取ると、それを遅延バッファ部19に伝える。あるいはパケットロス判定部15から直接パケットロスフラグFPLを遅延バッファ部19に与えてもよい。制御部16の統計値計算部16Aは、パケットロス判定部15からパケットロスフラグFPLを受け取るごとに統計的にパケットロスの頻度やパターンをパケットロスの統計値として求め、遅延バッファ部19内に保持すべきフレーム数NFを決定して、遅延バッファ部19に与える。パケットロスの頻度やパターンと、要保持フレーム数NFの関係は、予め規則(対応表)を作成して表メモリ16Bに格納しておき、それを参照して要保持フレーム数NFを決定する。
パケットロスの頻度としてはパケットロス率を使用し、統計値計算部16Aで例えば、フレームkにおけるパケットロス率e(k)をフレーム毎に、
e(k)=e(k-1)×0.99+0.01, パケットロス(FPL=1)の場合 (1)
e(k)=e(k-1)×0.99, パケットロスでない(FPL=0)場合 (2)
により計算する。kはフレーム番号k=1,2,3,...であり、e(k)の初期値をe(0)=0とする。または、パケットロスフラグFPLを統計値計算部16A内の図示してないバッファに一定時間蓄積して、フレーム毎にバッファ内のパケットロスフラグFPLからパケットロス率e(k)をバッファ内のFPL=1の数とFPLの全数(フレーム数)の比として計算してもよい。
パケットロスのパターンを数値で表すには、連続パケットロス率を計算する。n連続パケットロス率(nは1以上の整数)は、nフレーム以上連続してパケットロスした率と定義し、第kフレームにおけるn連続パケットロス率をen(k)と表記することにする。ここでは、ei(k), i=1, 2, ..., nの各連続パケットロス率を計算し、それらに基づいて後述のように表を参照して要保持フレーム数NFを決定する。ei(k)の計算方法を図7のフロー図を参照して以下に説明する。
まず、連続回数パラメータrの初期値を0に設定する(ステップS1)。次にパケットロスフラグFPLが1か0であるかによりパケットロスであるか判定する(ステップS2)。パケットロスであった場合はステップS3でrの値を1増加させ、ステップS2に戻る。ステップS2でパケットロスでないと判定された場合は、ステップS4でei(k), i=1, 2, ..., nの計算を以下のように行う。
r<iのei(k)に対しそれぞれ
ei(k)=ei(k-1) ×0.99 (3)
をr+1回ずつ計算する。
r≧iのei(k)に対しそれぞれ
ei(k)=ei(k-1)×0.99+0.01 (4)
をr回ずつ計算し、さらに
ei(k)=ei(k-1)×0.99 (5)
の計算を1回ずつ行う。なお、i=1の場合であるe1(k)は前記e(k)と同じである。また、ei(k)の計算は、上記e(k)の計算と同様に、パケットロスフラグFPLを一定時間バッファに蓄積して、フレーム毎にバッファ内のパケットロスフラグFPLから連続パケットロス率を計算してもよい。式(1)〜(5)における定数0.99及び0.01は実験的に適当なものを予め決めることとし、例えば、それぞれ0.95と0.05、0.995と0.005といった組み合わせでもよい。また、フレーム番号kが小さい間、即ち音声パケットの受信を開始してから間もない間は0.95と0.05という定数の組を用い、一定の時間が経過後は0.99と0.01の組を用いるというように、途中で定数を変更してもよい。
図8と図9Aに、それぞれe(k)とei(k), i=2, 3, 4によって要保持フレーム数NFを決める規則の例を表で示す。これらの表は制御部16の表メモリ16Bに予め格納しておく。要保持フレーム数NFは図8に示すe(k)だけに基づいて決めてもよいし、図8のe(k)と図9Aのei(k)に基づいて決めてもよい。後者の場合、図8と図9Aで該当する項目が複数ある場合は、該当する中で最も大きい値を要保持フレーム数NFとする。なお、図8と図9Aの各閾値は他の値に変更してもよく、図9Aの代わりに図9Bを用いてもよい。一般に閾値を大きく設定すると要保持フレーム数が小さく設定されて、遅延バッファ部19による通話遅延は少なくなるが、パケットロス時の品質劣化が大きくなり、逆に閾値を小さく設定すると要保持フレーム数が大きく設定されて、パケットロス時の品質劣化は抑えられるが、遅延バッファ部19による通話遅延が大きくなるため、トレードオフの関係にある。従って、閾値は品質劣化が目立たない範囲でできるだけ大きくなるように実際にパケットロスが発生する環境で調整するのがよい。
遅延バッファ部19は、制御部16から指定される要保持フレーム数NF分の復号された音声信号を内部に保持するシフトバッファまたはリングバッファである。遅延バッファ部19は音声波形復号部13から受け取った音声信号を保持し、保持している音声信号のうち、最もフレーム番号の小さい音声信号を出力する。ただし、制御部16からパケットロスが発生した旨(FPL=1)を受け取ると、音声波形復号部13から復号音声信号を受け取って遅延バッファ部19に格納する代わりに、そのフレームはパケットロスである旨の情報を格納する。パケットロス情報としては、例えばパケットロスフラグFPLとフレーム番号情報を使う。制御部16から指定される要保持フレーム数NFが0のときは、音声波形復号部13から音声信号を受け取ると同時にそれを出力するので、遅延は生じない。
遅延バッファ部19から出力された音声信号は、スイッチSWのA端子に送られる。出力制御部21は遅延バッファ部19から最もフレーム番号の小さい音声信号を出力させるときに、当該フレームがパケットロスでない場合は、スイッチSWをA側即ち遅延バッファ部側にセットする。遅延バッファ部19から出力されるフレームが当該フレームにおいて復号音声信号の代わりにパケットロスである旨の情報が格納されていた場合は、スイッチSWをB側即ち音声波形補間処理部17側にセットする。音声信号はスイッチSWを通して出力されるとともに、出力音声バッファ14に書き込まれる。
出力音声バッファ14は、スイッチSWから送られる出力音声信号を、予め決められた時間(フレーム数)だけ内部に蓄積し、蓄積した音声信号を音声波形補間部17に送る。バッファ探索部18は、遅延バッファ部19から出力されるフレームがパケットロスであった場合に、遅延バッファ部19内を探索し、パケットロスが発生したフレームよりも後のフレーム番号(大きいフレーム番号)のパケットが遅延バッファ部19に蓄積されている場合には、探索して得られた波形(先読み波形)を音声波形補間処理部17に送る。
音声波形補間処理部17は、図5で説明した方法と同様に、出力音声バッファ14内の音声信号から1ピッチ波形を切り出して並べる処埋と、遅延バッファ部19からの先読み波形の先頭から1ピッチ波形を切り出して、後向きに波形を並べる処理によって2つのフレーム波形を生成し、それらの加重和によって1つのフレーム波形を補間音声信号として生成する。図5の説明と同様に、波形接続部が不連続とならないように、切り出す波形は1ピッチ長よりも少し長く取り、波形の一部を重ね合わせながらコピーする方法を用いてもよい。生成した補間音声信号は、スイッチSWのB端子から出力音声信号として出力されるとともに、出力音声バッファ14に書き込まれる。
上述した図6の音声信号受信装置において実施される音声パケット消失補償方法を図10のフロー図で説明する。
ステップS1:受信バッファ12に取り出すべき音声パケットが蓄積されているか判定し、パケットロスフラグFPLを生成する。
ステップS2:制御部16においてパケットロスフラグFPLに基づいて連続パケットロス率ei(k), i=1, 2, ..., nを計算する。
ステップS3:制御部16において連続パケットロス率から、表メモリ16Bの表(図8及び9A)を参照して要保持フレーム数NFを決定する。
ステップS4:パケットロスフラグFPLがパケットロスを表しているか判定する。
ステップS5:ステップS4でパケットロスでないと判定された場合は、受信バッファ12から取り出した音声パケットを復号して音声信号を得て、要保持フレーム数NFの条件の下に復号音声信号を遅延バッファ部に書き込む。NFの制限の下に実際に復号音声信号を遅延バッファ部19に書き込むか否かについては後述の実施例において説明する。
ステップS6:ステップS4でパケットロスであると判定された場合は、パケットロス情報を遅延バッファ部19に書き込む。
ステップS7:遅延バッファ部19内の最も番号の小さいフレームがパケットロスであるか判定する。
ステップS8:ステップS7でパケットロスでないと判定された場合は、読み出した音声信号を音声信号受信装置から出力するとともに、出力音声バッファ14に書き込み、ステップS1に戻る。
ステップS9:ステップS7でパケットロスであると判定された場合は、バッファ探索部18により遅延バッファ部19内のパケットロスのフレーム番号より大きい番号のフレームがパケットロスであるか判定し、パケットロスでないフレームが見つかるまでフレーム番号の小さい順に判定することを繰り返す。
ステップS10:ステップS9の探索により得られたフレームの音声信号と、出力音声バッファ14に保持されている前フレームの音声信号を使って音声波形補間処理部17において前述した補間処理により補間音声信号を生成してスイッチSWを介して出力するとともに出力音声バッファ14に書き込み、ステップS1に戻る。
以上説明したように、この発明では復号音声信号を保持する遅延バッファ部19を設けて、その遅延バッファ部19内を探索して補間処理に使用するための先読み波形を得ているので、受信バッファ12の書き込み、読み出し処理とのタイミングを考慮する必要がなく、補間処理によるパケット消失補償処理を容易に実施することができる。
[実施例2]
図6の構成において、遅延バッファ部19は、制御部16から指定される要保持フレーム数NF分の復号音声信号を内部に保持するが、制御部16から指定される要保持フレーム数NFが途中で変わった場合は、遅延バッファ部19は更新された要保持フレーム数NFの復号音声信号を内部に保持するように、遅延バッファ部19の内部状態を遷移させる。例えば、要保持フレーム数NFが減った場合には、無音区間または非音声区間の復号音声信号の遅延バッファ部19への取り込みを禁止して破棄することにより、遅延バッファ部19内に保持されているフレーム数を減らす。要保持フレーム数NFが増えた場合には、無音区間または非音声区間での同じ復号音声信号の遅延バッファ部19への取り込みを複数回行なうことにより遅延バッファ部19内に保持するフレーム数を増やす。
そのような遅延バッファ部19の構成例を図11に、その動作フローを図12に示す。遅延バッファ部19はフレームバッファ19Aと、比較部19Bと、無音区間検出部19Cと、書込み制御部19Dとで構成する。以下では簡単のため、要保持フレーム数NFの初期値NF0は予め決められた値であり、復号開始からパケットロスが生じないでフレームバッファ19Aにフレーム数mがm=NF0となるまで復号音声信号SDが取り込まれたものとする。
比較部19Bは制御部16から要保持フレーム数NFを受け(ステップS1)、書込み制御部19Dから与えられたフレームバッファ19A内のフレーム数mと比較し、比較結果を書込み制御部19Dに与える(ステップS2)。
無音区間検出部19Cは音声波形復号部13から与えられている復号音声信号SDが無音区間の信号であるか否かを判定し(ステップS3及びS6)、判定結果を書込み制御部19Dに与える。書込み制御部19Dは、m<NFで、かつ復号音声信号SDが無音区間のものである場合は復号音声信号SDをフレームバッファ19Aに取り込み、mの値を1だけ増加させ(ステップS4)、ステップS5に移る。ステップS3で復号音声信号SDが無音区間のものでないと判定された場合は、そのままステップS5に移る。ステップS2でm=NFの場合もステップS5に移る。
ステップS5で書込み制御部19Dは与えられている復号音声信号SDをフレームバッファ19Aに取り込み、ステップS1に戻る。フレームバッファ19Aは1フレーム分の音声信号が取り込まれると、最も番号の小さいフレームの音声信号を出力するので、ステップS5の処理によるmの値の増減はない。
m>NFの場合は、ステップS6で無音区間でないと判定されていれば上記ステップS5を実行する。ステップS6で無音区間と判定されている場合、書込み制御部19Dは、与えられているその無音区間の復号音声信号SDの取込を禁止して破棄し、フレームバッファ19Aから最も番号の小さいフレームを出力するので、フレームバッファ19A内のフレーム数mは1だけ減り、従って、mの値を1だけ減じて(ステップS7)ステップS1に戻る。
このように、フレーム毎に図12の処理を行なうことにより、m=NFとなるように次第にフレーム数mが変化する。
無音区間検出部19Cによる無音区間の検出方法としては、例えば復号音声信号に含まれている音声パラメータの1つであるパワーが予め決めた閾値より小さい場合に無音区間と判定する。上記ステップS4、S5を実行した場合は、与えられている同じ復号音声信号SDが2回フレームバッファ19Aに取り込まれることになる。ステップS4において復号音声信号SDをフレームバッファ19Aに取り込む代わりに、例えば図11に破線で示すように波形メモリ19Eに無音区間または非音声区間の予め決めた音声波形を格納しておき、ステップS4でその音声波形の音声信号をフレームバッファ19Aに取り込んでもよい。
[実施例3]
図13は、前述のように、復号された第kフレームの音声信号SDが、狭義の音声波形信号即ちPCM形式を代表とする音声波形信号SPCMと、フレーム番号差分である相対位置jと、第k-jフレームの音声パラメータPk-jとがセットになっている例である。つまり、音声信号送信装置(図1参照)側で第kフレームのPCM形式音声波形信号SPCMの符号に、jフレーム前である第k-jフレームの音声パラメータPk-jの符号をセットにして音声パケットに挿入し、送信するものとする。
もし第kフレームのパケットに第kフレームの音声波形信号符号と第kフレームの音声パラメータ符号のみを挿入した場合には、第kフレームのパケットが受信できなかった場合にその第kフレームの音声情報はまったく無くなってしまうので、隣接フレームの音声信号から補間処理により音声信号を生成しても品質の高い音声信号が得られない。これに対し、図13のように第kフレームの音声波形信号SPCMに対し第k-jフレームの音声パラメータPk-jを付加しておけば、出力制御部21が、遅延バッファ部19から出力しようとする第kフレームがパケットロスであることを検出した場合に、遅延バッファ部19内に保持されている第k+jフレームの音声信号SDに含まれている第kフレームの音声パラメータPk中のピッチ長を使って例えば図5で説明した前後のフレーム波形からそれぞれ1ピッチ長の波形を切り出し、補間処理により波形生成を行い、更に必要であれば音声パラメータPk中のパワーを使って、補間処理により生成した波形のパワーを補正することにより、第kフレームにパケットロスが生じても比較的に品質の高い音声出力を得ることができるからである。
遅延バッファ部19に制御部16から指定される要保持フレーム数NFが途中で変化し、前述の図12で説明した処理により遅延バッファ部19が更新された要保持フレーム数NFの音声信号を内部に保持するためにフレーム波形を破棄/挿入する場合、その対象がPCM音声波形信号SPCMだけであれば、破棄/挿入に伴って必要となるような処理は発生しないが、図13のように、第kフレームのPCM音声波形信号SPCMに、フレーム番号k-jの音声パラメータPk-jがセットになっている場合には、フレーム波形の破棄/挿入処理によって、PCM音声波形信号SPCMと音声パラメータPk-jのフレーム相対位置関係がずれてしまうことになる。そのような揚合には、遅延バッファ部19において、フレーム波形の破棄/挿入処理とともに、音声パラメータの相対位置関係の修正処理を併せて行う必要がある。
図14にそのための遅延バッファ部19の構成を示し、図15にその処理フローを示す。図14の遅延バッファ部19は、図11に示した遅延バッファ部19において書込み制御部19D内に相対位置修正部19D1を設け構成になっている。音声波形復号部13からの復号音声信号SDの挿入または削除を行う場合は、相対位置修正部19D1が復号音声信号に続くj個またはj-1個のフレームの音声信号に含まれる相対位置jをそれぞれj+1またはj-1に修正を行う。
図15に示す処理フローは、図12に示した処理フローにおいてステップS4とS7に相対位置jの修正処理が追加されいる。m<NFの場合、ステップS3で復号音声信号が無音区間のものであると判定されると、ステップS4において復号音声信号に続くj個のフレームの音声信号にそれぞれ含まれる相対位置jをj+1に修正し、その後、復号音声信号をフレームバッファ19Aに取り込むとともに、mを1だけ増加させる。ステップS7においては、復号音声信号の書き込みを禁止し、mを1だけ減算し、復号音声信号に続くj-1個のフレームにそれぞれ含まれる相対位置jをj-1に修正する。その他の処理は図12の処理と同じである。
なお、図13,14,15の説明では、相対位置jは第kフレームの音声パラメータがjフレーム後の第k+jフレームに収納されていることを意味する場合として説明したが、相対位置jがjフレーム前の第k-jフレームに収納されていると定義することもできる。その場合は、例えばステップS4で音声信号の挿入が行われると、フレームバッファ19A内の最新のj個のフレームに対し、jをj+1に修正し、ステップS7で書き込み禁止を行った場合は、フレームバッファ19A内の最新のj-1個のフレームに対しjをj-1に修正すればよい。
[実施例4]
図16は、本発明の音声信号受信装置を広帯域音声符号化に代表される帯域分割符号化に適用した構成例である。図6におけるパケット消失補償処理部100が低域パケット消失補償処理部100Lと高域パケット消失補償処理部100Hの2つ設けられた構成になっている。それらの構成部は低域側には記号Lを、高域側には記号Hをそれぞれの参照番号に付加して示してある。
音声波形復号部13は、受信バッファ12から取り出した音声パケットを復号して、高域音声信号SDHと低域音声信号SDLをそれぞれ出力する。高域音声信号SDHは、高域パケット消失補償処理部100Hの遅延バッファ部19Hに送られる。低域音声信号SDLは、低域パケット消失補償処理部100Lの遅延バッファ部19Lに送られる。
高域パケット消失補償処理部100Hと低域パケット消失補償処理部100Lの処理は、それぞれ実施例1〜3の図6と同様である。ただし、高域の音声波形補間処理部17Hの補間処理は、ピッチ単位で切り出して並べる方法をとらず、単純にフレーム長の波形をピッチ単位の波形とみなしてそのまま補間に使用する方法でもよい。高域パケット消失補償処理部100Hと低域パケット消失補償処理部100Lから出力されたそれぞれの音声信号は、帯域合成部22で帯域合成されて、出力音声として出力される。
制御部16は、パケットロス判定部15からパケットロスが発生した旨(即ちパケットロスフラグFPL=1)を受け取ると、その旨を遅延バッファ部19H,19Lに伝える。また、制御部16は、図6の場合と同様に、パケットロス判定部15から受け取るパケットロスの情報(パケットロスフラグFPL)から統計的にパケットロスの頻度やパターンを求め、遅延バッファ部19H,19L内に保持すべきフレーム数NFを決定して、要保持フレーム数NFを高域パケット消失補償処理部100Hと低域パケット消失補償処理部100Lの遅延バッファ部19H,19Lに指示する。
遅延バッファ部19H,19Lは、制御部16から指定された要保持フレーム数NFの復号音声信号を内部に保持する。制御部16から指定された要保持フレーム数NFが途中で変わった場合は、遅延バッファ部19H,19Lは更新された要保持フレーム数NFの復号音声信号を内部に保持するように、遅延バッファ部19H.19L内のフレーム保持状態を遷移させる。即ち、図6の構成と同様に、例えば、要保持フレーム数NFが減った場合には、無音区間または非音声区間でフレーム波形を破棄し、要保持フレーム数NFが増えた場合には、無音区間または非音声区間で無音に相当するフレーム波形を挿入すればよい。
[実施例5]
図12の説明から理解されるように、図16の構成において、制御部16による要保持フレーム数NFの変更指示から、両方の遅延バッファ部19H,19Lに、指示されたフレーム数NFの音声信号が実際に蓄積される状態になるまで、タイムラグが生じることが多い。無音区間で波形の削除、挿入を行う方法では、指示を受けた後、無音区間になるまで待たなければならないからである。その場合でも、高域パケット消失補償処理部100Hと低域パケット消失補償処理部100Lの両遅延バッファ部19H,19Lの実際の遅延量の増減、即ち保持フレーム数の増減は、必ず同期するように制御する。
例えば、低域のほうが、制御部16から要保持フレーム数NFの変更を遅延バッファ部19Lに指示した後、実際に低域保持フレーム数mLが指示値NFに遷移するまでに時間がかかることが多いため、制御部16はまず低域の遅延バッファ部19Lに要保持フレーム数NFの指示を行い、低域の遅延バッファ部19Lの実際の保持フレーム数mLを図16中に破線で示すように高域の遅延バッファ部19Hに伝えて、与えられた高域復号音声信号SDHが無音区間のものであるか否かにかかわらず、削除または複数回取り込みを行なうことで高域の遅延バッファ部19Hの保持フレーム数mHを強制的に低域の現フレーム数mLに合わせるようにしてもよい。
[実施例6]
図17は、図6(及び図16)における音声波形補間処理部17(17H,17L)の構成例を示したものである。この例では音声波形補間処理部17はピッチ抽出部17A,前向き波形生成部17B、後向き波形生成部17C、及び重み付け加算部17Dとから構成されている。ピッチ抽出部17Aは、出力音声バッファ14(14H,14L)内の音声信号を分析して、音声の基本周期に対応するピッチ長を決定し、ピッチ長を前向き波形生成部17Bと後向き波形生成部17Cに送る。ピッチ長は、通常サンプル数で表し、8kHzサンプリングの場合は20〜140程度の値であることが多い。前向き波形生成部17Bは、図5を用いて説明したように、出力音声バッファ14内の音声信号の最後のサンプル点からピッチ長の波形をコピーして、ロスフレームバッファ内に順に並べて貼り付ける。
後向き波形生成部17Cも、図5を用いて説明したように、先読み波形の先頭から1ピッチ波形をコピーして、現在のフレームバッファ内に後向きに波形を並べて貼り付ける処理を行う。重み付け加算部17Dは、上記前向き波形生成部17Bによって生成された波形と、上記後向き波形生成部17Cによって生成された波形に重み付けをして加算することによって、1フレーム分の補間波形を作成し、補間音声信号として出力する。
[変形実施例]
図17では出力音声バッファ14に保持されている音声信号を分析してピッチ長を抽出し、そのピッチ長で音声波形のコピー、貼り付けを行なって補間音声信号を生成したが、例えば前述のように、復号された各フレームの音声信号SDが、狭義の音声波形信号即ちPCM形式を代表とする音声波形信号と、音声パラメータがセットになっている場合には、その音声パラメータに含まれるピッチパラメータを利用してもよい。ここでは、図13の例とは異なり、各フレームの音声信号SDが図18に示すように、kを現在のフレーム番号とすると、第kフレームの音声波形信号SPCMと、第kフレームの音声パラメータPkがセットになっているものとする。
図19は、図18の音声信号を使用する場合の音声波形補間処理部17(17H,17L)の構成例である。この場合には、遅延バッファ部19内の各フレームの音声信号、出力音声バッファ14内の音声信号とも音声パラメータがセットになっている。遅延バッファ部19内の探索により読み出された先読み波形の音声信号にセットされている音声パラメータからピッチパラメータ取得部17Eでピッチ長が取得され、得られたピッチ長は後向き波形生成部17Cに送られる。出力音声バッファ14内の音声信号にセットされている音声パラメータからピッチパラメータ取得部17Fでピッチ長が取得され、得られたピッチ長は前向き波形生成部17Bに送られる。その他の処理は図17の場合と同様である。
図17の方法と図19の方法を比べると、図19のほうが品質劣化の少ない補間波形が得られる。また、図19のほうが、受信側の処理量が少ないというメリットもある。
図19の音声波形補間処理部では図18のように同じフレーム番号の音声波形信号と音声パラメータのセットで構成された音声信号を使用する場合の構成例を示したが、図13で示したように音声波形信号のフレーム番号と音声パラメータのフレーム番号が異なる復号音声信号SDを使うこともできる。その場合は、図19においてピッチパラメータ取得部17Fは設けず、遅延バッファ部19から出力しようとする第kフレームがロスフレームであった場合、ピッチパラメータ取得部17Eは遅延バッファ部19内に保持されている第k+jフレームの復号音声信号に含まれている第kフレームの音声パラメータPkからピッチ長を取得して後向き波形生成部17Cに与えると共に、同じピッチ長を破線で示すように前向き波形生成部17Bにも与える。
以上説明したこの発明による音声信号受信装置は、その処理をコンピュータでプログラムを実行することにより実施するように構成してもよい。また、この発明による音声パケット消失補償方法をコンピュータで実施可能なプログラムとして記録媒体に格納しておき、その記録媒体のプログラムをコンピュータで実施するようにしてもよい。
パケット通信網上で音声通信を行う利用形態が普及してきており、本発明を適用することによって、安価で信頼駐の高い音声通信が実現できる。
音声信号をパケット化して通信するシステムの例を示す図。 従来の音声信号受信装置の構成例を示すブロック図。 図2における音声波形補間処理を概念的に示す波形図。 従来の音声信号受信装置の他の構成例を示すブロック図。 図4における音声波形補間処理を概念的に示す波形図。 本発明による音声信号受信装置の構成例を示すブロック図。 n連続パケットロス率の計算を実行する処理フロー図。 パケットロス率に対する要保持フレーム数の例を示す表。 Aは連続パケットロス率に対する要保持フレーム数を示す表の一例、Bは表の他の例。 音声パケット消失補償の処理フロー図。 フレーム波形削除/挿入を行なう遅延バッファ部の構成例を示すブロック図。 図11におけるフレーム波形削除/挿入処理を行なうフロー図。 PCM音声波形信号に音声パラメータがセットになった音声信号の例を示す図。 音声パラメータのフレーム相対位置を修正する遅延バッファ部の構成例を示すブロック図。 図14における音声パラメータのフレーム相対位置を修正する処理フロー図。 本発明による音声信号受信装置の他の構成例を示すブロック図。 音声波形補間処理部の構成例を示すブロック図。 PCM音声波形信号に音声パラメータがセットになった音声信号の他の例を示す図。 音声波形補間処理部の他の構成例を示すブロック図。

Claims (15)

  1. 受信した音声パケットを一時的に蓄える受信バッファと、
    上記受信バッファから、フレーム番号の小さい順に音声パケットを取り出し、音声パケット内の音声符号を復号して、第kフレーム(kはフレーム番号)のPCM形式音声波形信号S PCM と、フレーム番号差分である相対位置jと、第k-jフレームの音声パラメータP k-j とがセットになった音声信号を得る復号手段と、
    取り出すべき音声パケットが上記受信バッファに蓄積されているか否かを判定し、判定結果をパケットロスが発生したか否かを表すパケットロスフラグとして生成するパケットロス判定手段と
    遅延バッファ手段内に保持すべきフレーム数(以下要保持フレーム数)を決定して、遅延バッファ手段に与える要保持フレーム数決定手段と、
    遅延バッファ手段内に保持されているフレーム数が上記要保持フレーム数よりも大きい場合は、復号された上記音声信号を破棄するとともに、フレームバッファに蓄積された音声信号をフレーム番号の小さい順に出力し、遅延バッファ手段内に保持されているフレーム数が上記要保持フレーム数よりも小さい場合は、復号された上記音声信号をフレームバッファに二度蓄積するとともに、フレームバッファに蓄積された音声信号をフレーム番号の小さい順に出力し、遅延バッファ手段内に保持されているフレーム数と上記要保持フレーム数とが等しい場合は、復号された上記音声信号をフレームバッファに蓄積するとともに、フレームバッファに蓄積された音声信号をフレーム番号の小さい順に出力する遅延バッファ手段と、
    出力音声信号を予め決められた時間またはフレーム数だけ蓄積する出力音声バッファ手段と、
    上記遅延バッファ手段から出力すべきフレームがパケットロスであった場合に、上記出力音声バッファ内の出力音声信号の音声波形信号と、上記遅延バッファ手段内の上記パケットロスであるフレームより後のフレームの音声波形信号と、上記遅延バッファ手段内の上記パケットロスであるフレームの音声波形信号に対応する音声パラメータとを用いて補間音声信号を生成する音声波形補間処理手段と、
    上記遅延バッファ手段から出力すべきフレームがパケットロスでなければ上記遅延バッファ手段からの音声信号を出力音声信号として出力し、パケットロスであれば上記音声波形補間処理手段からの上記補間音声信号を出力音声信号として出力する出力制御手段、とを含む音声信号受信装置であって、
    上記遅延バッファ手段は、
    遅延バッファ手段内に保持されているフレーム数が上記要保持フレーム数よりも大きい場合は、上記破棄したフレームに続くj-1個の音声信号に含まれる相対位置jの値をj-1に修正し、遅延バッファ手段内に保持されているフレーム数が上記要保持フレーム数よりも小さい場合は、該フレームに続くフレームのj個のフレームの音声信号に含まれる相対位置jの値をj+1に修正する相対位置修正手段、
    とを含むことを特徴とする音声信号受信装置。
  2. 請求項1記載の音声信号受信装置において
    記パケットロスフラグが与えられ、パケットロスの統計値を求めるパケットロス統計値計算手段をさらに有し、
    上記要保持フレーム数決定手段は、
    上記パケットロス統計値に基づいて、上記遅延バッファ手段内に保持すべきフレーム数(以下要保持フレーム数)を決定して、上記遅延バッファ手段に与えることを特徴とする音声信号受信装置。
  3. 請求項2記載の音声信号受信装置において、予めパケットロスの統計値に対する要保持フレーム数を規定した規則を格納したメモリ手段をさらに有し、
    上記要保持フレーム数決定手段は上記パケットロス統計値から上記メモリ手段の規則を参照して上記要保持フレーム数を決定することを特徴とする音声信号受信装置。
  4. 請求項2または3記載の音声信号受信装置において、上記遅延バッファ手段は、
    復号された上記音声信号が無音区間または非音声区間の音声信号であるかを判定する無音区間検出手段とを有し、
    上記書き込み制御手段における破棄または二度蓄積する音声信号は無音区間または非音声区間の音声信号であることを特徴とする音声信号受信装置。
  5. 請求項1乃至4のいずれか記載の音声信号受信装置において、
    上記復号手段は、各音声パケットから得た高域音声符号と低域音声符号をそれぞれ復号して高域復号音声信号及び低域復号音声信号を出力し、
    上記遅延バッファ手段と上記出力バッファ手段と上記音声波形補間処理手段の組は、復号音声信号として与えられた上記高域復号音声信号を処理して高域出力音声信号を生成する高域用の組と、復号音声信号として与えられた上記低域復号音声信号を処理して低域出力音声信号を生成する低域用の組の2組が設けられており、さらに、
    上記高域出力音声信号と上記低域出力音声信号を帯域合成して出力音声信号を生成する帯域合成手段が設けられていることを特徴とする音声信号受信装置。
  6. 請求項5記載の音声信号受信装置において、上記高域用の組の遅延バッファ手段と上記低域用の遅延バッファ手段には、同じ値の上記要保持フレーム数が与えられ、それぞれ高域復号音声信号及び低域復号音声信号の削除または挿入によって、上記高域用の遅延バッファ手段と上記低域用の遅延バッファ手段の実際の保持フレーム数が常に同期するように制御する手段が設けられていることを特徴とする音声信号受信装置。
  7. 請求項5記載の音声信号受信装置において、上記低域用の遅延バッファ手段は与えられた要保持フレーム数に従って上記低域用の遅延バッファ手段が低域復号音声信号の削除または挿入によって、異なる保持フレーム数の状態に遷移した後に、上記保持フレーム数を上記高域用の遅延バッファ手段に与え、上記高域用の遅延バッファ手段は上記保持フレーム数に合わせて強制的に高域復号音声信号の削除または挿入を実行することを特徴とする音声信号受信装置。
  8. 請求項1乃至4のいずれか記載の音声信号受信装置において、上記音声波形補間処理手段は、
    上記出力音声バッファ手段内の出力音声信号に含まれる音声パラメータから第1ピッチ長を取得し、上記出力音声信号から上記第1ピッチ長に対応する波形をコピーして上記第1の補間波形を生成する前向き波形生成手段と、
    上記遅延バッファ手段内から探索された上記音声信号に含まれる音声パラメータから第2ピッチ長を取得し、上記探索された音声信号から上記第2ピッチ長に対応する波形をコピーして上記第2補間波形を生成する後ろ向き波形生成手段と、
    上記第1補間波形と上記第2補間波形の重み付け加算により上記補間音声信号を生成する重み付け加算手段、
    とを含むことを特徴とする音声信号受信装置。
  9. 請求項1乃至4のいずれか記載の音声信号受信装置において、上記音声波形補間処理手段は、
    上記遅延バッファ手段内の、パケットロスのフレームより予め指定されたjフレーム後の音声信号に含まれる音声パラメータからピッチ長を取得し、上記探索した音声信号から上記ピッチ長に対応する波形をコピーして上記第2補間波形を生成する後ろ向き波形生成手段と、
    上記出力音声バッファ手段内の出力音声信号から上記ピッチ長に対応する波形をコピーして上記第1の補間波形を生成する前向き波形生成手段と、
    上記第1補間波形と上記第2補間波形の重み付け加算により上記補間音声信号を生成する重み付け加算手段、
    とを含むことを特徴とする音声信号受信装置。
  10. 音声パケット消失補償方法であり、
    (a) 受信した音声パケットを受信バッファに一時的に蓄えるステップと、
    (b) 上記受信バッファから、フレーム番号の小さい順に音声パケットを取り出し、音声パケット内の音声符号を復号して、第kフレーム(kはフレーム番号)のPCM形式音声波形信号S PCM と、フレーム番号差分である相対位置jと、第k-jフレームの音声パラメータP k-j とがセットになった音声信号を得るステップと、
    (c) 取り出すべき音声パケットが上記受信バッファに蓄積されているか否かを判定し、判定結果をパケットロスが発生したか否かを表すパケットロスフラグとして生成するステップと、
    (d) 遅延バッファ手段内に保持すべきフレーム数(以下要保持フレーム数)を決定して、遅延バッファ手段に与えるステップと、
    (e) 遅延バッファ手段内に保持されているフレーム数が上記要保持フレーム数よりも大きい場合は、復号された上記音声信号を破棄するとともに、フレームバッファに蓄積された音声信号をフレーム番号の小さい順に出力し、遅延バッファ手段内に保持されているフレーム数が上記要保持フレーム数よりも小さい場合は、復号された上記音声信号をフレームバッファに二度蓄積するとともに、フレームバッファに蓄積された音声信号をフレーム番号の小さい順に出力し、遅延バッファ手段内に保持されているフレーム数と上記要保持フレーム数とが等しい場合は、復号された上記音声信号をフレームバッファに蓄積するとともに、フレームバッファに蓄積された音声信号をフレーム番号の小さい順に遅延バッファ手段から出力するステップと、
    (f) 出力音声信号を予め決められた時間またはフレーム数だけ出力音声バッファ手段に蓄積するステップと、
    (g) 上記遅延バッファ手段から出力すべきフレームがパケットロスであった場合に、上記出力音声バッファ内の出力音声信号の音声波形信号と、上記遅延バッファ手段内の上記パケットロスであるフレームより後のフレームの音声波形信号と、上記遅延バッファ手段内の上記パケットロスであるフレームの音声波形信号に対応する音声パラメータとを用いて補間音声信号を生成するステップと、
    (h) 上記遅延バッファ手段から出力すべきフレームがパケットロスでなければ上記遅延バッファ手段からの音声信号を出力音声信号として出力し、パケットロスであれば上記音声波形補間処理手段からの上記補間音声信号を出力音声信号として出力するステップ、
    とを含む音声パケット消失補償方法であって、
    上記ステップ(e) は、
    遅延バッファ手段内に保持されているフレーム数が上記要保持フレーム数よりも大きい場合は、上記破棄したフレームに続くj-1個の音声信号に含まれる相対位置jの値をj-1に修正し、遅延バッファ手段内に保持されているフレーム数が上記要保持フレーム数よりも小さい場合は、該フレームに続くフレームのj個のフレームの音声信号に含まれる相対位置jの値をj+1に修正するステップ、
    とを含むことを特徴とする音声パケット消失補償方法。
  11. 請求項10記載の方法においてさらに、
    (i) 上記パケットロスフラグからパケットロスの統計値を求めるステップを含み、
    上記ステップ(d) は、
    記パケットロス統計値に基づいて、上記遅延バッファ手段内に保持すべきフレーム数(以下要保持フレーム数)を決定して、上記遅延バッファ手段に与えることを特徴とする音声パケット消失補償方法。
  12. 請求項11記載の方法において、上記ステップ(d) は予めパケットロスの統計値に対する要保持フレーム数を規定した規則を参照して上記パケットロス統計値から上記要保持フレーム数を決定することを特徴とする音声パケット消失補償方法。
  13. 請求項11まは12記載の方法において、上記ステップ(e) は、
    (e-1) 復号された上記音声信号が無音区間または非音声区間の音声信号であるかを判定するステップを含み、
    上記書き込み制御手段における破棄または二度蓄積する音声信号は無音区間または非音声区間の音声信号であることを特徴とする音声パケット消失補償方法。
  14. 請求項10乃至13のいずれか記載の音声パケット消失方法をコンピュータで実施するためのプログラム。
  15. 請求項14記載のプログラムを記録した、コンピュータで読み取り可能な記録媒体。
JP2006327051A 2006-12-04 2006-12-04 音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体 Active JP5074749B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006327051A JP5074749B2 (ja) 2006-12-04 2006-12-04 音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006327051A JP5074749B2 (ja) 2006-12-04 2006-12-04 音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2008139661A JP2008139661A (ja) 2008-06-19
JP5074749B2 true JP5074749B2 (ja) 2012-11-14

Family

ID=39601186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006327051A Active JP5074749B2 (ja) 2006-12-04 2006-12-04 音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP5074749B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080075050A (ko) * 2007-02-10 2008-08-14 삼성전자주식회사 오류 프레임의 파라미터 갱신 방법 및 장치
US20220407825A1 (en) * 2019-11-12 2022-12-22 Sony Group Corporation Data processing apparatus, data processing method, and data processing program
CN112634912B (zh) * 2020-12-18 2024-04-09 北京猿力未来科技有限公司 丢包补偿方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06130998A (ja) * 1992-10-22 1994-05-13 Oki Electric Ind Co Ltd 圧縮音声復号化装置
JPH10200580A (ja) * 1997-01-16 1998-07-31 Matsushita Electric Ind Co Ltd 音声パケット再生方法
JP2001296894A (ja) * 2000-04-12 2001-10-26 Matsushita Electric Ind Co Ltd 音声処理装置および音声処理方法
JP2004064390A (ja) * 2002-07-29 2004-02-26 Matsushita Electric Ind Co Ltd パケット補間装置
JP4331928B2 (ja) * 2002-09-11 2009-09-16 パナソニック株式会社 音声符号化装置、音声復号化装置、及びそれらの方法
JP2005157045A (ja) * 2003-11-27 2005-06-16 Matsushita Electric Ind Co Ltd 音声伝送方法
US7711554B2 (en) * 2004-05-11 2010-05-04 Nippon Telegraph And Telephone Corporation Sound packet transmitting method, sound packet transmitting apparatus, sound packet transmitting program, and recording medium in which that program has been recorded

Also Published As

Publication number Publication date
JP2008139661A (ja) 2008-06-19

Similar Documents

Publication Publication Date Title
US11580997B2 (en) Jitter buffer control, audio decoder, method and computer program
JP4146489B2 (ja) 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体
US7711554B2 (en) Sound packet transmitting method, sound packet transmitting apparatus, sound packet transmitting program, and recording medium in which that program has been recorded
JP4933605B2 (ja) 適応デジッタバッファの方法及び装置
KR101952192B1 (ko) 품질 제어를 이용하는 오디오 디코더, 방법 및 컴퓨터 프로그램
JP4485690B2 (ja) マルチメディア信号を伝送する伝送システム
JP2007258928A (ja) ゆらぎ吸収バッファ制御装置
JPWO2004068098A1 (ja) 音声パケット消失隠蔽装置,音声パケット消失隠蔽方法,受信端末および音声通信システム
US20090326950A1 (en) Voice waveform interpolating apparatus and method
US20120323585A1 (en) Artifact Reduction in Time Compression
JP5074749B2 (ja) 音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体
JP2008003177A (ja) 音声伝送装置および音声伝送方法
KR100594599B1 (ko) 수신단 기반의 패킷 손실 복구 장치 및 그 방법
JP4093174B2 (ja) 受信装置および方法
JP2005534984A (ja) 音声フレームのエラー軽減用の音声通信ユニットおよび方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110520

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120814

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120824

R150 Certificate of patent or registration of utility model

Ref document number: 5074749

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150831

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350