JP2002196795A - 音声復号装置及び音声符号化・復号装置 - Google Patents
音声復号装置及び音声符号化・復号装置Info
- Publication number
- JP2002196795A JP2002196795A JP2000395644A JP2000395644A JP2002196795A JP 2002196795 A JP2002196795 A JP 2002196795A JP 2000395644 A JP2000395644 A JP 2000395644A JP 2000395644 A JP2000395644 A JP 2000395644A JP 2002196795 A JP2002196795 A JP 2002196795A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- decoding
- encoded data
- speech
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
いて、より改善された復号音声品質を実現することので
きる音声復号装置及び音声符号化・復号装置を提供する
こと。 【解決手段】 受信バッファ101により、前フレーム
が損失フレームであり且つ現時刻においてその損失フレ
ームの符号化データが時間的に遅れて受信された場合、
その前フレーム符号化データと現時刻の正しく受信され
た現フレーム符号化データを損失フレーム復号部105
に入力する。損失フレーム復号部105では入力された
前フレーム及び現フレーム符号化データを順次用いて音
声復号を行い現フレーム符号化データに対する復号音声
信号を出力する。また復号に必要な状態データが更新さ
れ状態データ保持部103で保持される。切替え部10
6では、以上のフレーム損失情報に応じた切り替えが行
われ当該フレームの復号音声信号が出力される。
Description
して伝送する移動通信や有線通信システム等の用途に用
いられる音声復号装置に関し、特に音声復号時の符号化
データが損失した際に復号音声品質の劣化を抑えるフレ
ーム補償機能を備えた音声復号装置及び音声符号化・復
号装置に関する。
分野においては、電波や有線回線の有効利用のために音
声情報を圧縮し、低いビットレートで符号化する音声符
号化装置が用いられている。そして、そのような通信シ
ステムにおいて、特にパケット単位で伝送を行うシステ
ムでは、受信側(音声復号側)で受信するパケットが損
失したり、時間的に遅れて到着して、音声復号を行うの
に必要なデータが得られないこと(フレーム損失)があ
り、その際に復号音声品質の劣化を抑えるためのフレー
ム補償が行われる。
勧告G.729("Coding of speech at 8kbit/s using
conjugate-structure algebraic-code-excited linear
-prediction(CS-ACELP)")のCS−ACELP符号化方
式に記載された誤り補償方法がある。
フレーム補償機能を備えた音声復号装置の構成を示すブ
ロック図である。この図において、音声復号は10ms
のフレーム単位で行われ、そのフレーム単位でフレーム
損失の有無が音声復号器に通知されるものとする。
ムにおいては、データ分離部1101において、復号に
必要な各パラメータに分離される。そして、ラグパラメ
ータ復号部1102により復号されたラグパラメータを
用いて適応音源符号帳部1103により適応音源が、ま
た固定音源符号帳部1104により固定音源が生成さ
れ、ゲインパラメータ復号部1105により復号された
ゲインを用いて、乗算部1106による乗算および加算
部1107による加算により駆動音源が生成され、LP
Cパラメータ復号部1108により復号されたLPCパ
ラメータを用いてLPC合成フィルタ1109およびポ
ストフィルタ1110を経由して復号音声が生成され
る。
に対しては、ラグパラメータとして、誤りが検出されな
かった前フレームのラグパラメータを用いて適応音源を
生成し、また、固定音源符号帳部1104に対してラン
ダムな固定音源符号を与えることで固定音源を生成し、
ゲインパラメータとして、前フレームの適応音源ゲイン
および固定音源ゲインを減衰させた値を用いて駆動音源
を生成し、LPCパラメータとして、前フレームLPC
パラメータを用いてLPC合成およびポストフィルタ処
理を行い復号音声を得る。このように、フレーム損失時
にフレーム補償処理を行う。
来の音声復号装置においては、次のような問題がある。
すなわち、損失フレームより過去のパラメータを用いて
フレーム補償処理を行っているため、損失フレームの次
の正常フレームにおける復号において、その復号に必要
な過去の状態データ(適応符号帳やLSPパラメータや
ゲインパラメータのMA予測フィルタ状態など)が、本
来の(フレーム損失がない場合の)値との相違が大きく
なることがあり、それにより復号音声の品質が劣化す
る。
ど過渡的な区間を含む場合には、その区間の再生が行わ
れないことになり、復号音声の品質劣化が生じる。この
ように、フレーム補償時の復号音声品質劣化の改善に限
界がある。
あり、フレーム損失が検出されたフレームにおいて、よ
り改善された復号音声品質を実現することのできる音声
復号装置及び音声符号化・復号装置を提供することを目
的とする。
は、フレーム単位の符号化データを受け取り蓄積する受
信バッファと、現フレームの符号化データを正しく受信
した場合にその符号化データを用いて通常の音声復号を
行う音声復号手段と、現フレームの符号化データが損失
により受信できなかった場合に損失フレーム補償を行う
損失フレーム補償手段と、前記受信バッファが符号化デ
ータを時間的に遅れて受信した場合にその符号化データ
と現フレームの符号化データとを用いて音声復号を行う
と共に前記音声復号手段で復号に必要な状態データを更
新する損失フレーム復号手段と、を具備する構成を採
る。
データが時間的に遅れて受信された場合に、フレーム補
償で復号音声を出力後、その符号化データを用いて過去
の損失フレームに相当する区間の音声復号を行って音声
復号のために必要な状態データを更新し、その後現在の
正常フレームの音声復号を行うことにより、より本来の
値に近い状態データを用いた復号が可能となり、復号音
声品質の劣化を抑えることが可能となる。
単位の符号化データを受け取り蓄積する受信バッファ
と、現フレームの符号化データを正しく受信した場合に
その符号化データを用いて通常の音声復号を行う音声復
号手段と、現フレームの符号化データが損失により受信
できなかった場合に損失フレーム補償を行う損失フレー
ム補償手段と、前記受信バッファが符号化データを時間
的に遅れて受信した場合にその符号化データと現フレー
ムの符号化データを用いて音声復号を行うと共に前記音
声復号手段で復号に必要な状態データを更新する損失フ
レーム復号手段と、前記損失フレーム復号手段が復号し
た現フレームの復号音声信号と前記音声復号手段が復号
した現フレームの復号音声信号とを用いて窓かけ加算を
行う窓かけ加算手段と、を具備する構成を採る。
データが時間的に遅れて受信された場合、フレーム補償
で復号音声を出力後、その符号化データを用いて過去の
損失フレームに相当する区間の音声復号を行って状態デ
ータを更新し、その後、現在の正常フレームの音声復号
を行って得られた復号音声信号と、損失フレームのフレ
ーム補償処理により状態データを更新した後に音声復号
を行って得られた現在の正常フレームの復号音声信号と
を用いて、窓かけ加算を行うことにより、より滑らかな
復号を行うことが可能となる。
ム単位の入力音声の特性を表す音声モードを判定する音
声モード判定手段と、フレーム単位の入力音声に対して
音声符号化を行い前記音声モード判定手段で得られた音
声モード情報と共に符号化データを出力する音声符号化
手段と、フレーム単位の符号化データを受け取り蓄積す
る受信バッファと、現フレームの符号化データを正しく
受信した場合にその符号化データを用いて通常の音声復
号を行う音声復号手段と、現フレームの符号化データが
損失により受信できなかった場合に損失フレーム補償を
行う損失フレーム補償手段と、前記受信バッファが符号
化データを時間的に遅れて受信した場合にその符号化デ
ータと現フレームの符号化データを用いて音声復号を行
うと共に前記音声復号手段で復号に必要な状態データを
更新する損失フレーム復号手段と、前記損失フレーム復
号手段が復号した損失フレームと現フレームの復号音声
信号に対して時間軸圧縮する時間軸圧縮手段と、前記音
声モード判定手段で得られた音声モードに応じて前記時
間軸圧縮手段で得られた復号音声信号又は前記損失フレ
ーム復号手段で得られた現フレームの復号音声信号のい
ずれかを選択し、選択した復号音声信号と前記音声復号
手段が復号した現フレームの復号音声信号とを用いて窓
かけ加算を行う窓かけ加算手段と、を具備する構成を採
る。
データが時間的に遅れて受信された場合、フレーム補償
で復号音声を出力後、その符号化データおよび現在の正
常フレームの符号化データを用いて過去の損失フレーム
および現在の正常フレームの区間の音声復号を行い、符
号化側で判定されたモード情報が過渡的区間であること
を示す場合には、得られた復号信号を時間軸圧縮して正
常フレームの復号音声として用いることにより、過渡区
間でのフレーム損失に伴う復号音声品質の劣化を抑える
ことが可能となる。
又は音声復号装置又は音声符号化・復号装置のいずれか
を具備する構成を採る。
置又は音声復号装置又は音声符号化・復号装置のいずれ
かを具備する構成を採る。
符号化データを受け取り蓄積する受信バッフリング工程
と、現フレームの符号化データを正しく受信した場合に
その符号化データを用いて通常の音声復号を行う音声復
号工程と、現フレームの符号化データが損失により受信
できなかった場合に損失フレーム補償を行う損失フレー
ム補償工程と、前記受信バッファが符号化データを時間
的に遅れて受信した場合にその符号化データと現フレー
ムの符号化データを用いて音声復号を行うと共に前記音
声復号工程で復号に必要な状態データを更新する損失フ
レーム復号工程と、を具備する。
データが時間的に遅れて受信された場合、フレーム補償
で復号音声を出力後、その符号化データを用いて過去の
損失フレームに相当する区間の音声復号を行って音声復
号のために必要な状態データを更新し、その後、現在の
正常フレームの音声復号を行うことにより、より本来の
値に近い状態データを用いた復号が可能となり、復号音
声品質の劣化を抑えることが可能となる。
を格納し、コンピュータにより読み取り可能な記録媒体
であって、前記音声復号プログラムは、フレーム単位の
符号化データを受け取り蓄積する手順と、現フレームの
符号化データを正しく受信した場合にその符号化データ
を用いて通常の音声復号を行う手順と、現フレーム符号
化データが損失により受信できなかった場合に損失フレ
ーム補償を行う手順と、符号化データを時間的に遅れて
受信した場合にその符号化データと現フレーム符号化デ
ータを用いて音声復号を行うと共に復号に必要な状態デ
ータを更新する手順と、を実行させるためのプログラム
を記録した機械読み取り可能なものである。
符号化データが時間的に遅れて受信された場合に、フレ
ーム補償で復号音声を出力後、その符号化データを用い
て過去の損失フレームに相当する区間の音声復号を行っ
て音声復号のために必要な状態データを更新し、その後
現在の正常フレームの音声復号を行うことである。
を参照して詳細に説明する。
形態1に係る音声復号装置の構成を示すブロック図であ
る。この図において、本実施の形態の音声復号装置は、
受信バッファ101と、音声復号部102と、状態デー
タ保持部103と、損失フレーム補償部104と、損失
フレーム復号部105と、切替え部106とを備えて構
成される。
単位で符号化されてパケット単位で伝送された符号化デ
ータを受信し、受信した符号化データを出力するととも
に、受信したパケット単位のデータをフレーム単位の符
号化データに分解してフレーム損失が生じたか否かの情
報(フレーム損失情報)を出力する。
ータを正しく受信した場合にその符号化データを用いて
通常の音声復号を行う。状態データ保持部103は、音
声復号部102及び損失フレーム復号部105で使用さ
れる状態データを保持するものである。この状態データ
は、音声復号部102の具体構成に依存するが、CEL
P型の復号器の場合には、適応符号帳やLSP・ゲイン
パラメータのMA予測フィルタ状態などがある。
符号化データが損失により受信できなかった場合に損失
フレーム補償を行う。損失フレーム復号部105は、受
信バッファ101が符号化データを時間的に遅れて受信
した場合に、その符号化データと現フレーム符号化デー
タを用いて音声復号を行うと共に、音声復号部102で
復号に必要な状態データを更新する。切替え部106
は、フレーム損失情報に応じて、音声復号部102の出
力と、損失フレーム補償部104と、損失フレーム復号
部105との切り替えを行う。
は、現時刻のフレームに対するフレーム損失情報によっ
て異なる動作を行う。まず、現時点のフレームに対する
符号化データが損失や遅延なく正しく受信された場合に
は、音声復号部102にてその符号化データを用いて通
常の音声復号を行い復号音声信号として出力する。その
際、復号に必要な状態データが更新されて状態データ保
持部103で保持される。
ータを損失フレーム即ち損失または遅延のため正しく受
信できない場合には、損失フレーム補償部104にて損
失フレーム補償を行い、それにより得られた復号音声信
号を出力する。この補償処理は任意であり、従来の方法
による過去の符号化パラメータや復号データを用いた補
償処理を行ってもよい。
かつ現時点においてその損失フレームの符号化データが
時間的に遅れて受信された場合は、その前フレーム符号
化データと現時点の正しく受信された現フレームの符号
化データを損失フレーム復号部105に入力する。
た前フレーム及び現フレームの符号化データを順次用い
て音声復号を行い(図2の(a)および(b))、現フ
レームの符号化データに対する復号音声信号(図2の
(b))を出力する。また復号に必要な状態データが更
新されて、状態データ保持部103で保持される。損失
フレーム復号部105における音声復号処理は、音声復
号部102と基本的には同じ処理でよい。切替え部10
6では、以上のフレーム損失情報に応じた切り替えを行
って当該フレームの復号音声信号を出力する。
本実施の形態に係る音声復号装置の動作を説明する。
フレーム単位で符号化されてパケット単位で伝送された
符号化データを受信して蓄積し、さらに蓄積したパケッ
ト単位のデータをフレーム単位の符号化データに分解
し、フレーム損失が生じたか否かを示す情報(フレーム
損失情報)と共に出力する。
のフレームに対するフレーム損失情報を判定する。この
判定において、現時点のフレームに対する符号化データ
が損失や遅延なく正しく受信できたと判断すると、ステ
ップ103に進み、その符号化データを用いて通常の音
声復号を行い、復号音声信号として出力する。これに対
して、現時点のフレームに対する符号化データが損失フ
レーム即ち損失または遅延のため正しく受信できないと
判断すると、ステップ104に進み、損失フレーム補償
を行い、それにより得られた復号音声信号を出力する。
かつ現時刻においてその損失フレームの符号化データが
時間的に遅れて受信したと判断すると、ステップ105
に進み、前フレームの符号化データと現時点の正しく受
信された現フレームの符号化データを順次用いて音声復
号を行い、現フレーム符号化データに対する復号音声信
号を出力する。この復号音声信号を出力した後は、ステ
ップ106で復号に必要な状態データを更新する。ステ
ップ103、ステップ104又はステップ106の処理
を行った後、ステップ107で復号音声信号を出力信号
として出力する。
装置によれば、損失フレームの符号化データが時間的に
遅れて受信された場合には、フレーム補償で復号音声を
出力した後、その符号化データを用いて過去の損失フレ
ームに相当する区間の音声復号を行って音声復号のため
に必要な状態データを更新し、その後現在の正常フレー
ムの音声復号を行うようにしたので、より本来の値に近
い状態データを用いた復号が可能となり、復号音声品質
の劣化を抑えることが可能となる。
形態2に係る音声復号装置の構成を示すブロック図であ
る。なお、この図において前述した図1と共通する部分
には同一の符号を付けている。
装置は、実施の形態1の音声復号装置と同一の構成に加
えて、窓かけ加算部107を備えている。受信バッファ
101において、送信側でフレーム単位で符号化され、
パケット単位で伝送された符号化データを受信する。そ
して、パケット単位のデータをフレーム単位の符号化デ
ータに分解して、フレーム損失が生じたか否かの情報
(フレーム損失情報)と共に出力する。そして、以降の
動作は現時刻のフレームに対するフレーム損失情報によ
って異なる。
ータが損失や遅延なく正しく受信された場合には、音声
復号部102において、その符号化データを用いて通常
の音声復号を行い、復号音声信号として出力する。その
際、復号に必要な状態データが更新されて状態データ保
持部103で保持される。
ータが損失フレーム即ち損失または遅延のため正しく受
信できない場合には、損失フレーム補償部104におい
て損失フレーム補償を行い、それにより得られた復号音
声信号を出力する。なお、この補償処理は任意であり、
従来の方法による過去の符号化パラメータや復号データ
を用いた補償処理を行ってもよい。
かつ現時刻においてその損失フレームの符号化データが
時間的に遅れて受信された場合には、その前フレーム符
号化データと現時刻の正しく受信された現フレーム符号
化データを損失フレーム復号部105に入力する。
た前フレーム及び現フレーム符号化データを順次用いて
音声復号を行い(図5の(a)および(b))、現フレ
ーム符号化データに対する復号音声信号(図5の
(b))を出力する。また、復号に必要な状態データが
更新されて状態データ保持部103で保持される。損失
フレーム復号部105における音声復号処理は音声復号
部102と基本的には同じ処理でよい。また、現時点の
正しく受信された現フレーム符号化データを用いて、音
声復号部102において音声復号を行い、復号音声信号
(図5の(c))を出力する。
号部105からの出力信号(図5の(b))および音声
復号部102からの出力信号(図5の(c))を用い
て、当該フレームの開始端では音声復号部102の出力
が、終了端では損失フレーム復号部105の出力が支配
的になるような窓かけ加算を行い、復号音声信号として
出力する。そして、切替え部106において、以上のフ
レーム損失情報に応じた切り替えが行われて、当該フレ
ームの復号音声信号が出力される。
本実施の形態に係る音声復号装置の動作を説明する。
フレーム単位で符号化されパケット単位で伝送された符
号化データを受信し、さらに受信したパケット単位のデ
ータをフレーム単位の符号化データに分解して、フレー
ム損失が生じたか否かを示す情報(フレーム損失情報)
と共に出力する。次いで、ステップ202において、現
時刻のフレームに対するフレーム損失情報を判定する。
する符号化データを損失や遅延なく正しく受信できたと
判断すると、ステップ203に進み、その符号化データ
を用いて通常の音声復号を行い、復号音声信号として出
力する。これに対して、現時点のフレームに対する符号
化データが損失フレーム即ち損失または遅延のため正し
く受信できないと判断すると、ステップ204に進み、
損失フレーム補償を行い、それにより得られた復号音声
信号を出力する。
かつ現時刻においてその損失フレームの符号化データを
時間的に遅れて受信したと判断すると、ステップ205
に進み、前フレームの符号化データと現時点の正しく受
信された現フレームの符号化データを順次用いて音声復
号を行い、現フレームの符号化データに対する復号音声
信号を出力する。そして、ステップ206で復号に必要
な状態データを更新する。
において、現時点の正しく受信された現フレームの符号
化データを用いて通常の音声復号を行い、復号音声信号
を出力する。次いで、ステップ208において、ステッ
プ204における出力信号およびステップ205におけ
る出力信号を用いて窓かけ加算を行い、復号音声信号と
して出力する。ステップ203、ステップ204又はス
テップ208の処理を行った後、ステップ209で復号
音声信号を出力信号として出力する。
装置によれば、損失フレームの符号化データが時間的に
遅れて受信された場合には、フレーム補償で復号音声を
出力した後、そのときの符号化データを用いて過去の損
失フレームに相当する区間の音声復号を行って状態デー
タを更新し、その後、現在の正常フレームの音声復号を
行って得られた復号音声信号と損失フレームのフレーム
補償処理により状態データを更新した後に音声復号を行
って得られた現在の正常フレームの復号音声信号とを用
いて、窓かけ加算を行うようにしたので、より滑らかな
復号を行うことが可能となる。
形態3に係る音声符号化・復号装置の構成を示すブロッ
ク図である。なお、この図において前述した図1又は図
4と共通する部分には同一の符号を付けている。
化・復号装置の符号化側は、音声モード判定部110
と、音声符号化部111と、多重化部112とを備えて
構成され、復号側は、受信バッファ101と、分離部1
13と、音声復号部102と、状態データ保持部103
と、損失フレーム補償部104と、損失フレーム復号部
105と、時間軸圧縮部114と、切替え部115と、
切替え部106と、窓かけ加算部107とを備えて構成
される。
入力音声に対して音声符号化を行い、符号化データを出
力する。音声モード判定部110では、フレーム単位の
入力音声の音声モードを判定する。ここで、音声モード
とは、フレーム単位の入力音声が定常的区間か立ち上が
り等の過渡的な区間かという特性を表すものである。多
重化部112は、音声符号化部111から出力される符
号化データと音声モード判定部110で得られた音声モ
ードを多重化して音声モード情報込みの符号化データと
して出力する。
ム単位で符号化され、パケット単位で伝送された符号化
データを受信する。さらに、受信したパケット単位のデ
ータをフレーム単位の符号化データに分解して、フレー
ム損失が生じたか否かの情報(フレーム損失情報)と共
に出力する。分離部113では、音声モード情報込みの
符号化データから音声モード情報と音声符号化データに
分離する。そして、以降の動作は、現時刻のフレームに
対するフレーム損失情報によって異なる動作となる。
が、損失や遅延なく正しく受信された場合には、音声復
号部102において、その符号化データを用いて通常の
音声復号を行い、復号音声信号として出力する。その
際、復号に必要な状態データが更新されて状態データ保
持部103で保持される。
の具体構成に依存するが、CELP型の復号器の場合に
は、適応符号帳やLSP・ゲインパラメータのMA予測
フィルタ状態などがある。
ータが、損失フレーム即ち損失または遅延のため正しく
受信できない場合には、損失フレーム補償部104にお
いて損失フレーム補償を行い、それにより得られた復号
音声信号を出力する。この補償処理は任意であり、従来
の方法による過去の符号化パラメータや復号データを用
いた補償処理を行ってもよい。
かつ現時点においてその損失フレームの符号化データが
時間的に遅れて受信された場合は、その前フレーム符号
化データと現時刻の正しく受信された現フレーム符号化
データを損失フレーム復号部105に入力する。
た前フレーム及び現フレームの符号化データを順次用い
て音声復号を行い(図8の(a)および(b))、現フ
レーム符号化データに対する復号音声信号(図8の
(b))を切替え部115に、前フレーム及び現フレー
ムの符号化データに対する復号音声信号(図8の(a)
と(b))を時間軸圧縮部114に出力する。また、復
号に必要な状態データが更新され状態データ保持部10
3で保持される。この損失フレーム復号部105におけ
る音声復号処理は、音声復号部102と基本的には同じ
処理で良い。
現フレームの符号化データに対する復号音声信号(図8
の(a)と(b))を1フレームの区間の信号となるよ
うに時間軸圧縮を行い、圧縮後の信号(図8の(d))
を切替え部115に出力する。また、現時点の正しく受
信された現フレームの符号化データを用いて、音声復号
部102において音声復号を行い復号音声信号(図8の
(c))を出力する。そして、切替え部115におい
て、分離部113から得られた損失フレームである前フ
レームの音声モード情報が過渡的モードを示す場合に
は、時間軸圧縮部114の出力を、そうでない場合即ち
定常モード場合には、損失フレーム復号部105の出力
を窓かけ加算部107に出力する。
を通過した出力信号(図8の(b)または(d))およ
び音声復号部102における出力信号(図8の(c))
を用いて、当該フレームの開始端では音声復号部102
の出力が、終了端では切替え部115を通過した出力信
号が支配的になるような窓かけ加算を行い、復号音声信
号として出力する。そして、切替え部106において、
以上のフレーム損失情報に応じた切り替えが行われ当該
フレームの復号音声信号が出力される。
動作を説明する。図9は、符号化側の動作を示すフロー
チャートである。ステップ301において、フレーム単
位の入力音声に対して音声符号化を行い符号化データを
出力する。次いで、ステップ302においてフレーム単
位の入力音声の音声モードを判定する。そして、ステッ
プ303においてステップ301で得られる符号化デー
タとステップ302で得られた音声モードを多重化して
音声モード情報込みの符号化データとして出力する。
ートである。まず。ステップ304において、送信側で
フレーム単位で符号化され、パケット単位で伝送された
符号化データを受信する。さらに受信したパケット単位
のデータをフレーム単位の符号化データに分解して、フ
レーム損失が生じたか否かの情報(フレーム損失情報)
と共に出力する。次いで、ステップ305において音声
モード情報込みの符号化データから音声モード情報と音
声符号化データに分離する。
のフレームに対するフレーム損失情報を判定する。ま
ず、現時刻のフレームに対する符号化データが損失や遅
延なく正しく受信できたと判断すると、ステップ307
に進み、その符号化データを用いて通常の音声復号を行
い、復号音声信号として出力する。
ータが損失フレーム即ち損失または遅延のため正しく受
信できないと判断すると、ステップ308に進み、損失
フレーム補償を行い、それにより得られた復号音声信号
を出力する。
かつ現時刻においてその損失フレームの符号化データが
時間的に遅れて受信したと判断すると、ステップ309
に進み、前フレームの符号化データと現時点の正しく受
信された現フレームの符号化データを順次用いて音声復
号を行い、前フレーム及び現フレーム符号化データに対
する復号音声信号を出力する。次いで、ステップ310
において、復号に必要な状態データを更新する。
プ309で得られた前フレーム及び現フレームの符号化
データに対する復号音声信号を1フレームの区間の信号
となるように時間軸圧縮を行い、圧縮後の信号を出力す
る。次いで、ステップ312において、現時点の正しく
受信された現フレームの符号化データを用いて通常の音
声復号を行い復号音声信号を出力する。
プ305で得られた、損失フレームである前フレームの
音声モード情報を判定する。この判定において、音声モ
ード情報が過渡的モードであると判断すると、ステップ
314に進み、ステップ311の処理の出力とステップ
312の処理の出力を用いた窓かけ加算を行い、復号音
声信号として出力する。一方、音声モード情報が過渡的
モードでないと判断すると、ステップ315に進み、ス
テップ309の処理で得られた現フレームの符号化デー
タに対する復号音声信号とステップ312の処理の出力
を用いた窓かけ加算を行い、復号音声信号として出力す
る。ステップ307、ステップ308、ステップ314
又はステップ315の処理を行った後、ステップ316
で復号音声信号を出力信号として出力する。
装置によれば、損失フレームの符号化データが時間的に
遅れて受信した場合に、フレーム補償で復号音声を出力
後、その符号化データおよび現在の正常フレームの符号
化データを用いて、過去の損失フレームおよび現在の正
常フレームの区間の音声復号を行い、符号化側で判定さ
れたモード情報が過渡的区間であることを示す場合に
は、得られた復号信号を時間軸圧縮して正常フレームの
復号音声として用いるので、過渡区間でのフレーム損失
に伴う復号音声品質の劣化を抑えることができる。
装置によれば、損失フレームの符号化データが時間的に
遅れて受信された場合に、フレーム補償で復号音声を出
力後、その符号化データを用いて、過去の損失フレーム
に相当する区間の音声復号を行って音声復号のために必
要な状態データを更新した後に、現在の正常フレームの
音声復号を行うことにより、より本来の値に近い状態デ
ータを用いた復号が可能となり、復号音声品質の劣化を
抑えることができる。
失フレームの符号化データが時間的に遅れて受信された
場合に、フレーム補償で復号音声を出力後、その符号化
データを用いて、過去の損失フレームに相当する区間の
音声復号を行って状態データを更新した後に、現在の正
常フレームの音声復号を行って得られた復号音声信号
と、損失フレームのフレーム補償処理により状態データ
を更新した後に音声復号を行って得られた現在の正常フ
レームの復号音声信号とを用いて、窓かけ加算を行うこ
とにより、より滑らかな復号を行うことができる。
れば、損失フレームの符号化データが時間的に遅れて受
信された場合に、フレーム補償で復号音声を出力後、そ
の符号化データおよび現在の正常フレームの符号化デー
タを用いて、過去の損失フレームおよび現在の正常フレ
ームの区間の音声復号を行い、符号化側で判定されたモ
ード情報が過渡的区間であることを示す場合には、得ら
れた復号信号を時間軸圧縮して正常フレームの復号音声
として用いることにより、過渡区間でのフレーム損失に
伴う復号音声品質の劣化を抑えることができる。
成を示すブロック図
フレームの符号化データが遅延して受信された場合の処
理を説明する図
フローチャート
成を示すブロック図
フレームの符号化データが遅延して受信された場合の処
理を説明する図
フローチャート
装置の構成を示すブロック図
ける損失フレームの符号化データが遅延して受信された
場合の処理を説明する図
作を示すフローチャート
動作を示すフローチャート
Claims (7)
- 【請求項1】 フレーム単位の符号化データを受け取り
蓄積する受信バッファと、現フレームの符号化データを
正しく受信した場合にその符号化データを用いて通常の
音声復号を行う音声復号手段と、現フレームの符号化デ
ータが損失により受信できなかった場合に損失フレーム
補償を行う損失フレーム補償手段と、前記受信バッファ
が符号化データを時間的に遅れて受信した場合にその符
号化データと現フレームの符号化データとを用いて音声
復号を行うと共に前記音声復号手段で復号に必要な状態
データを更新する損失フレーム復号手段と、を具備する
ことを特徴とする音声復号装置。 - 【請求項2】 フレーム単位の符号化データを受け取り
蓄積する受信バッファと、現フレームの符号化データを
正しく受信した場合にその符号化データを用いて通常の
音声復号を行う音声復号手段と、現フレームの符号化デ
ータが損失により受信できなかった場合に損失フレーム
補償を行う損失フレーム補償手段と、前記受信バッファ
が符号化データを時間的に遅れて受信した場合にその符
号化データと現フレームの符号化データを用いて音声復
号を行うと共に前記音声復号手段で復号に必要な状態デ
ータを更新する損失フレーム復号手段と、前記損失フレ
ーム復号手段が復号した現フレームの復号音声信号と前
記音声復号手段が復号した現フレームの復号音声信号と
を用いて窓かけ加算を行う窓かけ加算手段と、を具備す
ることを特徴とする音声復号装置。 - 【請求項3】 フレーム単位の入力音声の特性を表す音
声モードを判定する音声モード判定手段と、フレーム単
位の入力音声に対して音声符号化を行い前記音声モード
判定手段で得られた音声モード情報と共に符号化データ
を出力する音声符号化手段と、フレーム単位の符号化デ
ータを受け取り蓄積する受信バッファと、現フレームの
符号化データを正しく受信した場合にその符号化データ
を用いて通常の音声復号を行う音声復号手段と、現フレ
ームの符号化データが損失により受信できなかった場合
に損失フレーム補償を行う損失フレーム補償手段と、前
記受信バッファが符号化データを時間的に遅れて受信し
た場合にその符号化データと現フレームの符号化データ
を用いて音声復号を行うと共に前記音声復号手段で復号
に必要な状態データを更新する損失フレーム復号手段
と、前記損失フレーム復号手段が復号した損失フレーム
と現フレームの復号音声信号に対して時間軸圧縮する時
間軸圧縮手段と、前記音声モード判定手段で得られた音
声モードに応じて前記時間軸圧縮手段で得られた復号音
声信号又は前記損失フレーム復号手段で得られた現フレ
ームの復号音声信号のいずれかを選択し、選択した復号
音声信号と前記音声復号手段が復号した現フレームの復
号音声信号とを用いて窓かけ加算を行う窓かけ加算手段
と、を具備することを特徴とする音声符号化・復号装
置。 - 【請求項4】 請求項1記載の音声復号装置又は請求項
2記載の音声復号装置又は請求項3記載の音声符号化・
復号装置のいずれかを具備することを特徴とする基地局
装置。 - 【請求項5】 請求項1記載の音声復号装置又は請求項
2記載の音声復号装置又は請求項3記載の音声符号化・
復号装置のいずれかを具備することを特徴とする通信端
末装置。 - 【請求項6】 フレーム単位の符号化データを受け取り
蓄積する受信バッフリング工程と、現フレームの符号化
データを正しく受信した場合にその符号化データを用い
て通常の音声復号を行う音声復号工程と、現フレームの
符号化データが損失により受信できなかった場合に損失
フレーム補償を行う損失フレーム補償工程と、前記受信
バッファが符号化データを時間的に遅れて受信した場合
にその符号化データと現フレームの符号化データを用い
て音声復号を行うと共に前記音声復号工程で復号に必要
な状態データを更新する損失フレーム復号工程と、を具
備することを特徴とする音声復号方法。 - 【請求項7】 音声復号プログラムを格納し、コンピュ
ータにより読み取り可能な記録媒体であって、前記音声
復号プログラムは、フレーム単位の符号化データを受け
取り蓄積する手順と、現フレームの符号化データを正し
く受信した場合にその符号化データを用いて通常の音声
復号を行う手順と、現フレーム符号化データが損失によ
り受信できなかった場合に損失フレーム補償を行う手順
と、符号化データを時間的に遅れて受信した場合にその
符号化データと現フレーム符号化データを用いて音声復
号を行うと共に復号に必要な状態データを更新する手順
と、を具備することを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000395644A JP4597360B2 (ja) | 2000-12-26 | 2000-12-26 | 音声復号装置及び音声復号方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000395644A JP4597360B2 (ja) | 2000-12-26 | 2000-12-26 | 音声復号装置及び音声復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002196795A true JP2002196795A (ja) | 2002-07-12 |
JP4597360B2 JP4597360B2 (ja) | 2010-12-15 |
Family
ID=18861074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000395644A Expired - Lifetime JP4597360B2 (ja) | 2000-12-26 | 2000-12-26 | 音声復号装置及び音声復号方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4597360B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101321033B (zh) * | 2007-06-10 | 2011-08-10 | 华为技术有限公司 | 帧补偿方法及*** |
CN102271024B (zh) * | 2007-06-10 | 2014-04-30 | 华为技术有限公司 | 帧补偿方法及*** |
JP2017142542A (ja) * | 2010-11-22 | 2017-08-17 | 株式会社Nttドコモ | 音声符号化装置および方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07334191A (ja) * | 1994-06-06 | 1995-12-22 | Nippon Telegr & Teleph Corp <Ntt> | パケット音声復号方法 |
WO1996037964A1 (en) * | 1995-05-22 | 1996-11-28 | Ntt Mobile Communications Network Inc. | Sound decoding device |
WO1999059282A2 (en) * | 1998-05-14 | 1999-11-18 | Telefonaktiebolaget Lm Ericsson | Delayed packet concealment method and apparatus |
-
2000
- 2000-12-26 JP JP2000395644A patent/JP4597360B2/ja not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07334191A (ja) * | 1994-06-06 | 1995-12-22 | Nippon Telegr & Teleph Corp <Ntt> | パケット音声復号方法 |
WO1996037964A1 (en) * | 1995-05-22 | 1996-11-28 | Ntt Mobile Communications Network Inc. | Sound decoding device |
WO1999059282A2 (en) * | 1998-05-14 | 1999-11-18 | Telefonaktiebolaget Lm Ericsson | Delayed packet concealment method and apparatus |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101321033B (zh) * | 2007-06-10 | 2011-08-10 | 华为技术有限公司 | 帧补偿方法及*** |
CN102271024B (zh) * | 2007-06-10 | 2014-04-30 | 华为技术有限公司 | 帧补偿方法及*** |
JP2017142542A (ja) * | 2010-11-22 | 2017-08-17 | 株式会社Nttドコモ | 音声符号化装置および方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4597360B2 (ja) | 2010-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4518714B2 (ja) | 音声符号変換方法 | |
US6985856B2 (en) | Method and device for compressed-domain packet loss concealment | |
US7835912B2 (en) | Signal processing method, processing apparatus and voice decoder | |
JP4456601B2 (ja) | 音声データ受信装置および音声データ受信方法 | |
JP2746033B2 (ja) | 音声復号化装置 | |
JPH07311598A (ja) | 線形予測係数信号生成方法 | |
US9123328B2 (en) | Apparatus and method for audio frame loss recovery | |
JPH07311596A (ja) | 線形予測係数信号生成方法 | |
KR20160111550A (ko) | 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램 | |
JPH0730496A (ja) | 音声信号復号化装置 | |
US20110040557A1 (en) | Transmitter and receiver for speech coding and decoding by using additional bit allocation method | |
JP2004138756A (ja) | 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム | |
US20020065648A1 (en) | Voice encoding apparatus and method therefor | |
US8279968B2 (en) | Method of transmitting data in a communication system | |
JPH0946233A (ja) | 音声符号化方法とその装置、音声復号方法とその装置 | |
US7502735B2 (en) | Speech signal transmission apparatus and method that multiplex and packetize coded information | |
JP2002221994A (ja) | 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体 | |
JP2004102074A (ja) | 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム | |
JP4597360B2 (ja) | 音声復号装置及び音声復号方法 | |
JP4437052B2 (ja) | 音声復号化装置および音声復号化方法 | |
KR100542435B1 (ko) | 패킷 망에서의 프레임 손실 은닉 방법 및 장치 | |
JP2002252644A (ja) | 音声パケット通信装置及び音声パケット通信方法 | |
JP4065383B2 (ja) | 音声信号送信装置、音声信号受信装置及び音声信号伝送システム | |
JP2006350373A (ja) | 音声符号変換方法および装置 | |
JPH0588697A (ja) | 欠落音声補間方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100601 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100730 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100831 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100922 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4597360 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131001 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |