JP5123516B2 - 復号装置、符号化装置、復号方法及び符号化方法 - Google Patents

復号装置、符号化装置、復号方法及び符号化方法 Download PDF

Info

Publication number
JP5123516B2
JP5123516B2 JP2006294824A JP2006294824A JP5123516B2 JP 5123516 B2 JP5123516 B2 JP 5123516B2 JP 2006294824 A JP2006294824 A JP 2006294824A JP 2006294824 A JP2006294824 A JP 2006294824A JP 5123516 B2 JP5123516 B2 JP 5123516B2
Authority
JP
Japan
Prior art keywords
audio signal
signal
auxiliary information
concealment
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006294824A
Other languages
English (en)
Other versions
JP2008111991A (ja
Inventor
圭 菊入
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2006294824A priority Critical patent/JP5123516B2/ja
Publication of JP2008111991A publication Critical patent/JP2008111991A/ja
Application granted granted Critical
Publication of JP5123516B2 publication Critical patent/JP5123516B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Detection And Prevention Of Errors In Transmission (AREA)

Description

本発明は、音声・音響信号(以下、音声信号)に対して復号処理を施す復号装置及び復号方法、及び、音声信号に対して符号化処理を施す符号化装置及び符号化方法に関する。
具体的には、欠落フレームの音声信号を補償するための隠蔽信号を出力する復号装置及び復号方法、及び、かかる復号装置及び復号方法と共に用いられる符号化装置及び符号化方法に関する。
現在、音声信号を高効率に圧縮して符号化する符号化方式(方法及び装置)が、数多く存在する。
かかる音声符号化方式は、時間領域で音声信号を符号化する第1の符号化方式と、何らかの変換規則(例えば、離散フーリエ変換(DFT:Discrete Fourier Transform)や離散コサイン変換(DCT:Discrete Cosine Transform)等)に従って音声信号を所定領域の信号に変換することによって、かかる変換領域で符号化する第2の符号化方式(変換符号化方式)とに大別できる。
第1の符号化方式としては、主に音声信号の符号化に用いられる「CELP(Coded Excitation Linear Prediction)符号化方式」が知られており、広く用いられている。
一方、第2の符号化方式(変換符号化方式)としては、ISO/IECで規格化された「MPEG-2 Audio AAC(Advanced Audio Coding)」方式が知られている(例えば、非特許文献1参照)。
なお、「MPEG-2 Audio AAC方式」では、時間‐周波数変換規則として、「修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)」と呼ばれる変換規則が用いられている。
また、近年、インターネットや無線通信技術の普及に伴い、インターネット通信によって音声信号を送受信するアプリケーションが利用されている。
インターネット通信のようなパケット通信においては、伝送路においてパケットが損失する等、受信側で、所定フレームの音声信号が、正常に受信されずに欠落してしまう場合には、一般的に、かかる所定フレームの音声信号の欠落を補償する処理を行う。
非特許文献2では、様々な音声信号の欠落の補償技術が紹介されており、「受信側での補償技術」と「送信側での補償技術」とに大別されている。
「受信側での補償技術」として、受信側で生成した信号を当該所定フレーム(欠落区間、欠落フレーム)に挿入する技術や、当該所定フレームの前フレーム又は後フレームの音声信号により当該所定フレームの音声信号を補償する技術等が知られている。
これらの技術は、送信側からの音声信号の補助情報を必要としないため、送信側から冗長な情報を伝送する必要は無いが、当該所定フレームの前後のフレームで正常に受信できた音声信号から、当該所定フレームの音声信号を推定するため、補償精度が十分ではないという問題点があった。
また、「送信側での補償技術」として、当該所定フレームの音声信号を再送信する技術や、予め音声信号が欠落する場合を想定して当該音声信号の補助情報を併せて送信する技術が知られている。
かかる技術は、受信側で、当該所定フレームの音声信号の補助情報を用いることができるため、高い精度で当該所定フレームの音声信号を補償することができ、当該所定フレームの音声信号を完全に元に戻すことが可能な場合もある。
しかしながら、かかる技術では、当該所定フレームの音声信号の補償するために、送信側から、当該音声信号の補助情報を伝送する必要があり冗長であるという問題点があった。
これらの問題点を解決するために、「受信側での補償技術」と「送信側での補償技術」とを組み合わせた補償技術が知られている(特許文献1又は特許文献2参照)。
特許文献1に係る補償技術では、所定の符号化方式で現フレームの音声信号を符号化して送信した場合に、現フレームの前後のフレームについて、受信側での補償技術による補償精度が十分でないと推定されると、送信側において、別の符号化方式で現フレームの前後のフレームの音声信号を符号化して、上述の符号化方式で符号化した現フレームの音声信号と併せて送信するように構成されている。
また、特許文献2に係る補償技術では、送信側において、音声信号を符号化するフレームごとの振幅情報、及び、当該フレームよりも短い区間(サブフレーム)ごとの相関が高い位置情報を、補助情報として作成して、当該補助情報の伝送量を抑えるためにステガノグラフィ技術により当該補助情報を埋め込み送信し、受信側において、当該補助情報を抽出して音声信号の欠落を補償するための隠蔽信号を生成するように構成されている。
ISO/IEC JTC1/SC29/WG11 MPEG、「International Standard IS 13818-7 Information Technology-Generic Coding of Moving Pictures and Associated Audio, Part 7」、MPEG-2 AAC、1997年 C.Parkins等、「A Survey of Packet Loss Recovery Techniques for Streaming Audio」、IEEE Network、1998年9/10月 特許3722366号 特開2003-316670号公報
しかしながら、特許文献1に係る補償技術は、受信側において補償精度が不十分な場合に、所定の符号化方式で符号化した音声信号に加えて、補助情報として別の符号化方式で符号化した音声信号も伝送するように構成されているため、音声信号の欠落に対して高い補償精度で補償できるが、所定フレームの前後のフレームの音声信号の符号化系列により構成されている補助情報を送信する必要があるため、非常に冗長であり、補助情報の伝送量を抑えることができないという問題点があった。
また、特許文献2に係る補償技術は、ステガノグラフィ技術により補助情報を送信するように構成されているため、補助情報の伝送量を抑えることができるが、逆に、送信する補助情報の内容が十分とはいえず、音声信号の欠落を補償するための隠蔽信号の精度が十分とはいえないという問題点があった。
また、特許文献2に係る補償技術は、ステガノグラフィ技術により、補助情報を音声信号に埋め込むように構成されているため、受信側で、かかる音声信号を正常に受信できた場合においても、補助情報の情報量やステガノグラフィ技術の方法によっては、音声信号に何らかの劣化を生じる場合があるという問題点があった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、パケット損失等により欠落した音声信号を補償するために、送信側からの補助情報の伝送量を抑えつつ、受信側において十分な精度の隠蔽信号を生成することが実現できる復号装置、復号方法、符号化装置及び符号化方法を提供することを目的とする。
本発明の第1の特徴は、欠落フレームの音声信号を補償するための隠蔽信号を出力する復号装置であって、入力された音声信号符号化系列から、現フレームの音声信号を復号するように構成されている音声信号復号部と、前記欠落フレームに対応する第1隠蔽信号を生成するように構成されている第1隠蔽信号生成部と、前記現フレームの音声信号と前記欠落フレームの音声信号との相関を利用して、入力された補助情報符号化系列から、前記欠落フレームの音声信号の補助情報を復号するように構成されている補助情報復号部と、生成された前記第1隠蔽信号と、復号された前記欠落フレームの音声信号の補助情報とに基づいて、前記欠落フレームに対応する第2隠蔽信号を生成して、前記隠蔽信号として出力するように構成されている第2隠蔽信号生成部とを具備することを要旨とする。
本発明の第1の特徴において、隠蔽信号選択情報が、前記第2隠蔽信号を出力するように指示している場合に、前記第2隠蔽信号生成部が、前記第2隠蔽信号を前記隠蔽信号として出力するように構成されており、前記隠蔽信号選択情報が、前記第1隠蔽信号を出力するように指示している場合に、前記第1隠蔽信号生成部が、前記第1隠蔽信号を前記隠蔽信号として出力するように構成されていてもよい。
本発明の第1の特徴において、前記補助情報復号部は、入力された前記補助情報符号化系列から、前記現フレームの音声信号の補助情報から前記欠落フレームの音声信号の補助情報を予測した際の誤差を示す補助情報予測誤差を復号するように構成されている補助情報予測誤差復号部と、前記現フレームの音声信号の補助情報と、復号された前記補助情報予測誤差とに基づいて、前記欠落フレームの音声信号の補助情報を算出するように構成されている欠落フレーム補助情報算出部とを具備していてもよい。
本発明の第1の特徴において、前記欠落フレーム補助情報算出部は、前記欠落フレームの音声信号から別の欠落フレームの音声信号を予測した際の誤差を示す第2の補助情報予測誤差に基づいて、前記第2の欠落フレームの音声信号の補助情報を算出するように構成されていてもよい。
本発明の第1の特徴において、前記補助情報は、前記音声信号の周波数パワースペクトル包絡情報、電力情報又はピッチ情報の少なくとも1つを含んでいてもよい。
本発明の第1の特徴において、前記音声信号復号部は、変換符号化方式に基づいて、入力された前記音声信号符号化系列から前記現フレームの音声信号を復号するように構成されていてもよい。
本発明の第2の特徴は、欠落フレームの音声信号を補償するための隠蔽信号を生成する復号装置と共に用いられる符号化装置であって、現フレームの音声信号を符号化することによって音声信号符号化系列を生成して出力するように構成されている音声信号符号化部と、前記現フレームの音声信号と前記欠落フレームの音声信号との相関を利用して、前記隠蔽信号の生成に用いられる前記欠落フレームの音声信号の補助情報を算出して符号化することによって補助情報符号化系列を生成して出力するように構成されている補助情報符号化部とを具備することを要旨とする。
本発明の第2の特徴において、前記補助情報符号化部は、前記現フレームの音声信号の補助情報から前記欠落フレームの音声信号の補助情報を予測した際の誤差を示す補助情報予測誤差を算出するように構成されている補助情報予測誤差算出部と、前記欠落フレームの音声信号の前記補助情報予測誤差を符号化することによって前記補助情報符号化系列を生成して出力するように構成されている補助情報符号化系列出力部とを具備していてもよい。
本発明の第2の特徴において、前記補助情報は、前記音声信号の周波数パワースペクトル包絡情報、電力情報又はピッチ情報の少なくとも1つを含んでいてもよい。
本発明の第2の特徴において、前記音声信号符号化部は、変換符号化方式に基づいて、前記音声信号を符号化することによって前記音声信号符号化系列を生成して出力するように構成されていてもよい。
本発明の第3の特徴は、欠落フレームの音声信号を補償するための隠蔽信号を出力する復号方法であって、入力された音声信号符号化系列から、現フレームの音声信号を復号する工程と、前記欠落フレームに対応する第1隠蔽信号を生成する工程と、前記現フレームの音声信号と前記欠落フレームの音声信号との相関を利用して、入力された補助情報符号化系列から、前記欠落フレームの音声信号の補助情報を復号する工程と、生成された前記第1隠蔽信号と、復号された前記欠落フレームの音声信号の補助情報とに基づいて、前記欠落フレームに対応する第2隠蔽信号を生成して、前記隠蔽信号として出力する工程とを有することを要旨とする。
本発明の第4の特徴は、欠落フレームの音声信号を補償するための隠蔽信号を生成する復号装置と共に用いられる符号化方法であって、現フレームの音声信号を符号化することによって音声信号符号化系列を生成して出力する工程と、前記現フレームの音声信号と前記欠落フレームの音声信号との相関を利用して、前記隠蔽信号の生成に用いられる前記欠落フレームの音声信号の補助情報を算出して符号化することによって補助情報符号化系列を生成して出力する工程とを有することを要旨とする。
以上説明したように、本発明によれば、パケット損失等により欠落した音声信号を補償するために、送信側からの補助情報の伝送量を抑えつつ、受信側において十分な精度の隠蔽信号を生成することが実現できる復号装置、復号方法、符号化装置及び符号化方法を提供することができる。
以下、本発明の第1の実施形態及び第2に実施形態について、図面により説明する。なお、以下の説明では、信号は、アナログ・デジタル変換後のデジタル信号とする。なお、図面の説明においては、同一要素には、同一の符号を付し、重複する説明は、省略する。
(本発明の第1の実施形態に係る復号装置及び符号化装置の構成)
本発明の第1の実施形態に係る復号装置10は、欠落フレーム(欠落区間)の音声信号を補償するための隠蔽信号を出力するように構成されている。
図1に示すように、本発明の第1の実施形態に係る復号装置10は、音声信号復号部101と、第1隠蔽信号生成部102と、補助情報復号部103と、第2隠蔽信号生成部104とを有する。
音声信号復号部101は、入力された音声信号符号化系列から、現フレームの音声信号を復号するように構成されている。
また、音声信号復号部101は、上述の復号段階で得られた音声信号に対応する音声信号情報を、第1隠蔽信号生成部102及び補助情報復号部103へ出力するように構成されている。ここで、音声信号情報には、上述の音声信号の特徴を示すパラメータ等が含まれているものとする。
第1隠蔽信号生成部102は、隠蔽信号生成判断情報により動作するように指示された場合に、欠落フレーム(欠落区間)に対応する第1隠蔽信号を生成するように構成されている。
例えば、本実施形態に係る復号装置10に接続されている受信装置は、所定フレームにおいて受信エラーが発生したことを検知した場合に、第1隠蔽信号生成部102に対して、かかる隠蔽信号生成判断情報を用いて、かかる所定フレーム(欠落フレーム)に対応する第1隠蔽信号を生成するように指示する。
なお、本実施形態に係る復号装置10において、第1隠蔽信号の生成方法は、特定されない。
例えば、符号化装置30が、一定区間(フレーム)ごとに音声信号を区切って符号化することによって音声符号化系列を生成し、生成した音声信号符号化系列によりパケットを構成して通信するパケット通信を想定する。
ここで、第1隠蔽信号生成部102は、音声信号復号部101からの音声信号情報を利用して、損失パケットの前のパケットで、最後に正常に受信されたパケットに含まれるフレームの音声信号のうち、最後のフレームの音声信号を複製して、欠落フレームに対応する第1隠蔽信号とするように構成されていてもよい。
また、第1隠蔽信号生成部102は、音声信号復号部101からの音声信号情報を利用して、損失パケットの前(又は、後)のパケットで、正常に受信されたパケット(複数であってもよい)に含まれるフレームの音声信号のピッチ周期を推定し、当該ピッチ周期の音声信号を、損失パケットに対応するフレームの長さだけ繰り返すことによって、欠落フレームに対応する第1隠蔽信号を生成するように構成されていてもよい。
また、第1隠蔽信号生成部102は、上述のように、音声信号復号部101からの音声信号情報を利用する方法の他に、かかる音声信号情報を利用することなく、損失パケットに対応するフレームの長さだけ雑音を発生させることによって、欠落フレームに対応する第1隠蔽信号を生成するように構成されていてもよい。かかる例のように、第1隠蔽信号生成部102が、欠落フレームに対応する第1隠蔽信号の生成する際に、音声信号復号部101からの音声信号情報を用いない場合には、音声信号復号部101は、第1隠蔽信号生成部102に対して音声信号情報を出力しない。
補助情報復号部103は、隠蔽信号生成判断情報により動作するように指示された場合に、現フレームの音声信号(欠落フレームに続くフレーム)と欠落フレームの音声信号との相関を利用して、入力された補助情報符号化系列から、欠落フレームの音声信号の補助情報を復号して第1隠蔽信号生成部104へ出力するように構成されている。
ここで、入力される補助情報符号化系列は、音声信号復号部101により復号される現フレームの音声信号と欠落フレームの音声信号との相関を利用して符号化されている。
そのため、補助情報復号部103は、上述のように、入力される補助情報符号化系列から、音声信号復号部101により出力される音声信号情報を利用して、欠落フレームの音声信号の補助情報を復号するように構成されている。
なお、補助情報復号部103により取得される補助情報としては、例えば、周波数パワースペクトル包絡情報や電力情報やピッチ情報等が挙げられる。
第2隠蔽信号生成部104は、第1隠蔽信号生成部102により生成された欠落フレームに対応する第1隠蔽信号と、補助情報復号部103により復号された欠落フレームの音声信号の補助情報とに基づいて、欠落フレームに対応する第2隠蔽信号を生成して、欠落フレームの音声信号を補償するための隠蔽信号として出力するように構成されている。
具体的には、第2隠蔽信号生成部104は、第1隠蔽信号生成部102により生成された欠落フレームに対応する第1隠蔽信号を、補助情報復号部103により復号された欠落フレームの音声信号の補助情報に従って修正することによって、欠落フレームに対応する第2隠蔽信号を生成するように構成されている。
なお、再生装置(図示せず)が、復号装置10から出力された音声信号又は隠蔽信号のいずれかについて再生する。例えば、再生装置は、通常の場合には、音声信号に基づいて再生処理を行い、損失パケットの発生による音声信号の欠落(欠落フレーム)が発生した場合に、欠落フレームに対応する隠蔽信号に基づいて再生処理を行うように構成されている。
なお、第2隠蔽信号生成部104は、隠蔽信号生成判断情報が、隠蔽信号を生成するように指示している場合に、第2隠蔽信号を隠蔽信号として出力するように構成されている。
一方、第1隠蔽信号生成部102は、隠蔽信号判断生成情報が、隠蔽信号を生成しないように指示している場合に、隠蔽信号を生成しないように構成されている。
ここで、隠蔽信号生成判断情報は、当該復号装置10を含む受信機において生成されるように構成されていてもよいし、後述する符号化装置20から送信されるように構成されていてもよい。
図2を参照して、本実施形態に係る復号装置10における補助情報復号部103の機能の第1例について説明する。上述のとおり、補助情報復号部103は、隠蔽信号生成判断情報により動作するように指示された場合に動作する。
第1例では、補助情報として、周波数パワースペクトル包絡情報を用い、また、具体的なパラメータとして、所定の周波数帯域(サブバンド)ごとのスペクトルの利得(サブバンド利得)を用いる。
なお、周波数パワースペクトル包絡情報の具体的なパラメータとして、線形予測係数又はそれと等価なパラメータ(例えば、線スペクトル対係数等)等を用いてもよい。
また、補助情報として、ピッチ情報を用い、具体的なパラメータとして、ピッチ周期情報等を用いてもよい。また、補助情報として、これらの複数の情報を用いてもよい。
図2に示すように、補助情報復号部103は、サブバンド利得算出部103Aと、サブバンド利得予測誤差復号部103Bと、サブバンド利得情報復号部103Cと、隠蔽区間サブバンド利得算出部103Dとを有する。
サブバンド利得算出部103Aは、現フレームの音声信号の補助情報として、所定のサブバンドごとに、現フレームの音声信号のサブバンド利得を算出して、隠蔽区間サブバンド利得算出部103Dに出力するように構成されている。
サブバンド利得算出部103Aは、所定の時間-周波数変換規則を適用して算出した変換係数を用いて、サブバンド利得を算出するように構成されている。
上述のように、時間-周波数変換規則として、例えば、DFTやDCTやMDCT等が適用可能であるが、本発明では、時間-周波数変換規則は、これらに限定されない。
例えば、具体的には、サブバンド利得算出部103Aは、現フレームkの音声信号のサブバンドn(n=0,1,…,N-1)の変換係数を「Wn,k(m)(m=0,1,…,Mn-1)」とすると、
Figure 0005123516
によって、現フレームkの音声信号のサブバンドnのサブバンド利得f(k)を算出することができる。
ただし、音声信号復号部101において、現フレームの音声信号のサブバンド利得が得られる場合は、サブバンド利得算出部103Aを省略することができ、音声信号復号部101から隠蔽区間サブバンド利得算出部103Dに対して、現フレームの音声信号のサブバンド利得が出力される。
サブバンド利得予測誤差復号部103Bは、入力されたサブバンド利得符号化系列(補助情報符号化系列)から、現フレームの音声信号のサブバンド利得(補助情報)から欠落フレームの音声信号のサブバンド利得(補助情報)を予測した際の誤差を示すサブバンド利得予測誤差(補助情報予測誤差)を復号するように構成されている。
サブバンド利得情報復号部103Cは、入力されたサブバンド利得符号化系列(補助情報符号化系列)から、欠落フレームの音声信号のサブバンド利得から別の欠落フレームの音声信号のサブバンド利得を予測した際の誤差を示す第2の補助情報予測誤差(上述のサブバンド利得予測誤差以外のサブバンド利得情報)を復号するように構成されている。
このとき、サブバンド利得情報復号部103Cは、必要に応じて、サブバンド利得予測誤差復号部103Bにより復号されたサブバンド利得予測誤差を利用して、上述のサブバンド利得予測誤差以外のサブバンド利得情報を復号するように構成されている。
サブバンド利得情報復号部103Cは、上述のサブバンド利得予測誤差以外のサブバンド利得情報を、サブバンド利得予測誤差と併せて、隠蔽区間サブバンド利得算出部103Dに出力するように構成されている。
ここで、例えば、図3に示すように、1パケットに、複数のフレーム(Jフレーム)の音声信号が含まれるパケット通信について考える。
かかるパケット通信において、パケットk-1の損失が発生した場合、フレームJ(k-1)からフレームJk-1に対応する区間の音声信号(音声信号符号化系列)が欠落する。
ここで、パケットkに含まれるフレームJkと、パケットk-1に含まれるフレームとの相関を考えると、一般的に、フレームJkと隣接するフレームJk-1との相関は強いが、フレームJkから時間的に離れていくに従い、フレームJkとの相関は弱まる。
一般的には、隣接するフレーム同士の相関が強いので、例えば、フレームJk-1の音声信号の補助情報(サブバンド利得)は、フレームJkとの相関を利用すれば、効率的に符号化でき、フレームJk-2の音声信号の補助情報(サブバンド利得)は、フレームJk-1との相関を利用すれば、効率的に符号化できる。
そのため、サブバンド利得符号化系列(補助情報符号化系列)には、上述のように正常に受信されたフレームとの相関を利用したサブバンド利得予測誤差以外のサブバンド利得情報(第2の補助情報予測誤差)も含まれることがある。
上述の例のように、サブバンド利得情報を考えた場合、一般的に、フレームJk-1の音声信号のサブバンド利得情報は、フレームJkの音声信号のサブバンド利得情報から予測すると、予測誤差の情報量が小さく、効率的に符号化できる。
また、フレームJk-2の音声信号のサブバンド利得情報は、フレームJk-1の音声信号のサブバンド利得情報から予測すると、予測誤差の情報量が小さく、効率的に符号化できる。
したがって、サブバンド利得符号化系列には、正常に受信したパケットに含まれるフレームの音声信号のサブバンド利得(補助情報)と損失パケットに含まれるフレームの音声信号のサブバンド利得(補助情報)との間の予測誤差以外にも、損失パケットに含まれるフレームの音声信号のサブバンド利得情報間の予測誤差が、上述のサブバンド利得予測誤差以外のサブバンド利得情報として含まれることがある。
ただし、サブバンド利得符号化系列において、上述のサブバンド利得予測誤差以外のサブバンド利得情報が含まれていない場合には、サブバンド利得情報復号部103Cを省略することができる。
また、サブバンド利得情報復号部103Cは、サブバンド利得符号化系列から全ての第2の補助情報予測誤差を復号するのではなく、サブバンド利得符号化系列から所定フレームについての第2の補助情報予測誤差について復号するように構成されていてもよい。
隠蔽区間サブバンド利得算出部103Dは、サブバンド利得算出部103Aにより算出された現フレームの音声信号のサブバンド利得(補助情報)と、サブバンド利得予測誤差復号部103Bにより復号されたサブバンド利得予測誤差(補助情報予測誤差)とに基づいて、隠蔽区間(欠落フレーム)の音声信号のサブバンド利得(補助情報)を算出するように構成されている。
なお、隠蔽区間サブバンド利得算出部103Dは、当該隠蔽区間において、サブバンド利得符号化系列を受信していない区間については、上記のように算出されたサブバンド利得から、補間や外挿や繰り返し等の処理により、サブバンド利得を算出するように構成されていてもよい。
例えば、図4に示すように、正常に受信されたパケットkに含まれる現フレームkの音声信号のサブバンドn(n=0,1,…,N-1)のサブバンド利得を「g(k)」とし、損失パケットk-1に含まれる欠落フレームk-1の音声信号のサブバンドnのサブバンド利得予測誤差を「eg(k-1)」とすると、例えば、予測係数aのとき、隠蔽区間サブバンド利得算出部103Dは、
g’(k-1)=−ag(k)+eg(k-1) (数2)
により、損失パケットk-1に含まれる欠落フレームk-1のサブバンドnのサブバンド利得g’(k-1)を算出するように構成されている。
さらに、隠蔽区間サブバンド利得算出部103Dは、正常に受信されたパケットkに含まれるフレームkの音声信号のサブバンド利得からの予測を用いずに、サブバンド利得情報復号部103Cにより入力されるサブバンド利得予測誤差以外のサブバンド利得情報(例えば、第2のサブバンド利得予測誤差)を用いた所定方法に基づいて、欠落フレームの音声信号のサブバンド利得を算出するように構成されていてもよい。
かかる場合、図3におけるパケットkにおいて、当該パケットk内に音声信号符号化系列が含まれている区間の音声信号、例えば、フレームJkの音声信号との相関を用いて符号化されていない補助情報(例えば、第2のサブバンド利得予測誤差)が含まれる。
なお、隠蔽区間サブバンド利得算出部103Dは、必要に応じて、サブバンド利得算出部103Aにより入力されたフレームkの音声信号のサブバンド利得と、サブバンド利得予測誤差復号部103Bにより入力されるサブバンド利得予測誤差とを用いた所定方法に基づいて、欠落フレームk-1の音声信号のサブバンド利得を算出するように構成されていてもよい。
隠蔽区間サブバンド利得算出部103Dは、最終的に得られた隠蔽区間の音声信号のサブバンド利得を、第2隠蔽信号生成部104に出力するように構成されている。
図5を参照して、本実施形態に係る復号装置10における補助情報復号部103の機能の第2例について説明する。上述のとおり、補助情報復号部103は、隠蔽信号生成判断情報により動作するように指示された場合に動作する。
第2例では、補助情報として、ピッチ情報を用い、また、具体的なパラメータとして、ピッチ周期情報を用いる。
図5に示すように、補助情報復号部103は、ピッチ周期算出部103Eと、ピッチ周期予測誤差復号部103Fと、ピッチ周期情報復号部103Gと、隠蔽区間ピッチ周期算出部103Hとを有する。
ピッチ周期算出部103Eは、現フレームの音声信号の補助情報として、現フレームの音声信号のピッチ周期を算出するように構成されている。
本実施形態では、ピッチ周期の算出方法は、限定されず、例えば、ITU-T勧告G.711、Appendix I、「A High quality low-complexity algorithm for packet loss concealment with G.711」に記載されている方法を適用することができる。
ピッチ周期算出部103Eは、算出した現フレームの音声信号のピッチ周期を、隠蔽区間ピッチ周期算出部103Hに出力するように構成されている。
ただし、音声信号復号部101において、現フレームの音声信号のピッチ周期が得られる場合は、ピッチ周期算出部103Eを省略することができ、音声信号復号部101から隠蔽区間ピッチ周期算出部103Hに対して、現フレームの音声信号のピッチ周期が出力される。
ピッチ周期予測誤差復号部103Fは、入力されたピッチ周期符号化系列(補助情報符号化系列)から、現フレームの音声信号のピッチ周期(補助情報)から欠落フレームの音声信号のピッチ周期(補助情報)を予測した際の誤差を示すピッチ周期予測誤差(補助情報予測誤差)を復号するように構成されている。
ピッチ周期情報復号部103Gは、入力されたピッチ周期符号化系列(補助情報符号化系列)から、欠落フレームの音声信号のピッチ周期から別の欠落フレームの音声信号のピッチ周期を予測した際の誤差を示す第2の補助情報予測誤差(上述のピッチ周期予測誤差以外のピッチ周期情報)を復号するように構成されていてもよい。
かかる場合、図3におけるパケットkにおいて、当該パケットk内に音声信号符号化系列が含まれている区間の音声信号、例えば、フレームJkの音声信号との相関を用いて符号化されていない補助情報(例えば、第2の補助情報予測誤差)が含まれる
このとき、ピッチ周期情報復号部103Gは、必要に応じて、ピッチ周期予測誤差復号部103Fにより復号されたピッチ周期予測誤差を利用して、上述のピッチ周期予測誤差以外のピッチ周期情報を復号するように構成されている。
ピッチ周期情報復号部103Gは、上述のピッチ周期予測誤差以外のピッチ周期情報を、ピッチ周期予測誤差と併せて、隠蔽区間ピッチ周期算出部103Hに出力するように構成されている。
ただし、補助情報符号化系列において、上述のピッチ周期予測誤差以外のピッチ周期情報が含まれていない場合には、ピッチ周期情報復号部103Gを省略することができる。
また、ピッチ周期情報復号部103Gは、ピッチ周期符号化系列から全ての第2の補助情報予測誤差を復号するのではなく、ピッチ周期符号化系列から所定フレームについての第2の補助情報予測誤差について復号するように構成されていてもよい。
隠蔽区間ピッチ周期算出部103Hは、ピッチ周期算出部103Eにより算出された現フレームの音声信号のピッチ周期(補助情報)と、ピッチ周期予測誤差復号部103Fにより取得されたピッチ周期予測誤差(補助情報予測誤差)と、ピッチ周期情報復号部103Gにより取得されたピッチ周期予測誤差以外のピッチ周期情報(第2の補助情報予測誤差)とに基づいて、隠蔽区間(欠落フレーム)の音声信号のピッチ周期(補助情報)を算出するように構成されている。
なお、隠蔽区間ピッチ周期算出部103Hは、当該隠蔽区間において、ピッチ周期符号化系列を受信していない区間については、上記のように算出されたピッチ周期から、補間や外挿や繰り返し等の処理により、ピッチ周期を算出するように構成されていてもよい。
例えば、隠蔽区間ピッチ周期算出部103Hは、ピッチ周期情報復号部103Gから入力された欠落フレームの音声信号のピッチ周期情報とピッチ周期予測誤差とに基づいて、正常に受信された現フレームの音声信号のピッチ周期情報からの予測を用いて、隠蔽区間(欠落フレーム)の音声信号のピッチ周期を算出するように構成されている。
例えば、図4に示すように、正常に受信されたパケットkに含まれるフレームkの音声信号のピッチ周期を「p(k)」とし、損失パケットk-1に含まれるフレームk-1の音声信号のピッチ周期予測誤差を「ep(k-1)」とすると、例えば、予測係数bのとき、隠蔽区間ピッチ周期算出部103Hは、
p’(k-1)=−bp(k)+ep(k-1) (数3)
により、損失パケットk-1に含まれる欠落フレームk-1の音声信号のピッチ周期p’(k-1)を算出するように構成されている。
さらに、隠蔽区間ピッチ周期算出部103Hは、正常に受信されたパケットkに含まれるフレームkの音声信号のピッチ周期からの予測を用いずに、ピッチ周期情報復号部103Gにより入力されるピッチ周期予測誤差以外のピッチ周期情報を用いた所定方法に基づいて、欠落フレームの音声信号のピッチ周期を算出するように構成されていてもよい。
なお、隠蔽区間ピッチ周期算出部103Hは、必要に応じて、ピッチ周期算出部103Eにより入力された現フレームの音声信号のピッチ周期と、ピッチ周期情報復号部103Gにより入力されたピッチ周期予測誤差とを用いた所定方法に基づいて、欠落フレームk-1の音声信号のピッチ周期を算出するように構成されていてもよい。
隠蔽区間ピッチ周期算出部103Hは、最終的に得られた隠蔽区間の音声信号のピッチ周期を、第2隠蔽信号生成部104に出力するように構成されている。
図6を参照して、本実施形態に係る復号装置10における第2隠蔽信号生成部104の機能について説明する。上述のとおり、第2隠蔽信号生成部104は、隠蔽信号生成判断情報により動作するように指示された場合に動作する。ここで、音声信号の補助情報として、上述のサブバンド利得情報を用いる。
図6に示すように、第2隠蔽信号生成部104は、第1隠蔽信号時間-周波数変換部104Aと、第1隠蔽信号変換係数正規化部104Bとサブバンド利得適用部104Cと、第2隠蔽信号周波数-時間変換部104Dとを有する。
第1隠蔽信号時間-周波数変換部104Aは、所定の変換規則を用いて第1隠蔽信号を変換することによって、第1隠蔽信号変換係数を算出するように構成されている。
第1隠蔽信号変換係数正規化部104Bは、所定のサブバンドごとに、第1隠蔽信号変換係数を正規化するように構成されている。
例えば、具体的には、第1隠蔽信号変換係数正規化部104Bは、フレームk-1の音声信号のサブバンドn(n=0,1,…,N-1)の第1隠蔽信号変換係数を「Xn,k-1(m)(m=0,1,…,Mn-1)」とすると、
Figure 0005123516
によって、第1隠蔽信号正規化変換係数xn,k-1(m)を算出することができる。
サブバンド利得情報適用部104Cは、補助情報復号部103によって補助情報として入力される隠蔽区間(欠落フレーム)の音声信号のサブバンド利得g’(k-1)と、第1隠蔽信号変換係数正規化部104Bにより入力される第1隠蔽信号正規化変換係数xn,k-1(m)とを用いて、第2隠蔽信号変換係数を算出するように構成されている。
例えば、サブバンド利得情報適用部104Cは、損失パケットに含まれる欠落フレームk-1の音声信号のサブバンドnのサブバンド利得が「g’(k-1)」のとき、
n,k-1(m)=g’(k-1)・xn,k-1(m) (数5)
によって、第2隠蔽信号変換係数Yn,k-1(m)を算出することができる。
第2隠蔽信号周波数-時間変換部104Dは、所定の周波数-時間変換規則を用いて第2隠蔽信号変換係数を時間信号に変換することによって、第2隠蔽信号を生成して出力するように構成されている。
ここでは、音声信号の補助情報として、音声信号のサブバンド利得を用いた場合の例について説明したが、本発明は、音声信号の補助情報として、音声信号のピッチ周期を用いた場合の例についても適用可能である(例えば、ITU-T勧告G.711、Appendix I、「A High quality low-complexity algorithm for packet loss concealment with G.711」や、特開2005-107283号公報等参照)。
図7を参照して、本実施形態に係る復号装置10における音声信号復号部101の機能について説明する。
本実施形態では、例として、時間-周波数変換規則による変換符号化方式の符号化系列の復号方式を用いて説明しているが、本発明で用いられる復号方式は、かかる復号方式に特定されない。
また、上述のように、時間-周波数変換規則としては、例えば、DFTや、DCTや、MDCT等が想定され、これらに対応する周波数-時間変換規則としては、IDFT(Inverse Discrete Fourier Transform:逆離散フーリエ変換)や、IDCT(Inverse Discrete Cosine Transform:逆離散コサイン変換)や、IMDCT(Inverse Modified Discrete Cosine Transform:逆修正離散コサイン変換)が想定されるが、本発明は、かかる場合に限定されない。
図7に示すように、本実施形態に係る復号装置10における音声信号復号部101は、音声信号符号化系列復号部101Aと、サブバンド利得適用部101Bと、周波数-時間変換部101Cとを具備している。
音声信号符号化系列復号部101Aは、所定方法により、入力される音声信号符号化系列に対して復号処理を施すことによって、正規化変換係数及び音声信号のサブバンド利得を取得するように構成されている。
上述の例のように、補助情報復号部103において現フレームの音声信号のサブバンド利得が用いられる場合に、音声信号符号化系列復号部101Aは、復号した音声信号のサブバンド利得を補助情報復号部103に対して出力すればよい。
サブバンド利得適用部101Bは、音声信号符号化系列復号部101Aにより入力された正規化変換係数に対して、音声信号符号化系列復号部101Aにより入力されたサブバンド利得を適用することによって、変換係数を得るように構成されている。
例えば、具体的にはサブバンド利得適用部101Bは、フレームkの音声信号のサブバンドn(n=0,1,…,N-1)の正規化変換係数を「zn,k(m)(m=0,1,…,Mn-1)」とし、フレームkの音声信号のサブバンドnのサブバンド利得を「g(k)」とすると、
n,k(m)=g(k)・zn,k(m) (数6)
によって、変換係数Zn,k(m)を算出することができる。
周波数-時間変換部101Cは、サブバンド利得適用部101Bにより算出された変換係数を、所定の周波数-時間変換規則を用いて時間信号に変換することによって音声信号を生成して出力するように構成されている。
次に、図8を参照して、本実施形態に係る符号化装置20の機能について説明する。本実施形態に係る符号化装置20は、欠落フレーム(現フレームの前のフレーム)の音声信号を補償するための隠蔽信号を生成する復号装置10と共に用いられるものである。
図8に示すように、本実施形態に係る符号化装置20は、音声信号符号化部201と、補助情報符号化部202とを有する。
音声信号符号化部201は、所定方法に従って、現フレームの音声信号を符号化することによって音声信号符号化系列を生成して出力するように構成されている。
また、音声信号符号化部201は、入力された音声信号を符号化した後に復号することによって生成された音声信号に関する情報(音声信号情報)を、補助情報符号化部へ出力するように構成されている。
補助情報符号化部202は、現フレームの音声信号と欠落フレーム(現フレームの前のフレーム)の音声信号との相関を利用して、上述の隠蔽信号の生成に用いられる欠落フレームの音声信号の補助情報を算出して符号化することによって補助情報符号化系列を生成して出力するように構成されている。
このとき、補助情報符号化部202は、音声信号符号化部201により入力された音声信号情報を用いて、欠落フレームの音声信号の補助情報を算出して符号化するように構成されている。
ただし、補助情報符号化部202は、所定の補助情報の算出及び符号化の際に、音声信号を利用しない場合は、音声信号符号化部201は、補助情報符号化部202に対して音声信号を出力しないように構成されている。
例えば、図4に示す場合では、補助情報符号化部202は、現フレームkの1つ前のフレームk-1の音声信号の補助情報を符号化することになる。
そして、フレームkに対応する音声信号符号化系列とフレームk-1に対応する音声信号の補助情報符号化系列とが同じパケットに含まれる。
図9を参照して、本発明の第1の実施形態に係る符号化装置20における補助情報符号化部202の機能の第1例について説明する。
第1例では、補助情報符号化部202は、隠蔽信号を生成するために用いられる音声信号の補助情報として、周波数パワースペクトル包絡情報を用い、また、具体的なパラメータとして、符号化した後に復号された所定の周波数帯域ごとの利得(サブバンド利得)を用いる。
この他にも、補助情報符号化部202は、周波数パワースペクトル包絡情報の具体的なパラメータとして、線形予測係数又はそれと等価なパラメータ(例えば、線スペクトル対係数等)等を用いてもよく、また、音声信号の補助情報として、ピッチ情報を用い、具体的なパラメータとして、ピッチ周期等を用いてもよい。
また、補助情報符号化部202は、音声信号の補助情報として、これらの複数の情報を用いてもよい。
図9に示すように、補助情報符号化部202は、サブバンド利得算出部202Aと、サブバンド利得保持部202Bと、サブバンド利得予測誤差算出部202Cと、サブバンド利得予測誤差符号化部202Dと、サブバンド利得情報符号化部202Eと、サブバンド利得符号化系列出力部202Fとを具備する。
サブバンド利得保持部202Bは、サブバンド利得算出部202Aにより算出された現フレームの音声信号のサブバンド利得を保持するように構成されている。
サブバンド利得保持部202Bは、保持している音声信号のサブバンド利得から、過去のフレーム(現フレームより前のフレーム)の音声信号のサブバンド利得を、サブバンド利得予測誤差算出部202C及びサブバンド利得情報符号化部202Eに出力するように構成されている。
サブバンド利得予測誤差算出部202Cは、現フレームの音声信号のサブバンド利得(補助情報)から欠落フレームの音声信号のサブバンド利得(補助情報)を予測した際の誤差を示すサブバンド利得予測誤差(補助情報予測誤差)を算出するように構成されている。
サブバンド利得予測誤差符号化部202Dは、サブバンド利得予測誤差算出部202Cにより算出されたサブバンド利得予測誤差を、所定方法に基づいて符号化するように構成されている。
サブバンド利情報符号化部202Eは、上述のサブバンド利得予測誤差以外のサブバンド利得情報を符号化するように構成されている。
サブバンド利得符号化系列出力部202Fは、欠落フレームの音声信号のサブバンド利得(補助情報)及びサブバンド利得予測誤差(補助情報予測誤差)を符号化することによってサブバンド利得符号化系列(補助情報符号化系列)を生成して出力するように構成されている
図10の例では、現在のパケットkに、音声信号符号化部201から出力されたフレーム2k及びフレーム2k+1の音声信号符号化系列が格納されている。
また、現在のパケットkに、補助情報符号化部202から出力されたフレーム2k-1のサブバンド利得予測誤差符号化系列及びフレーム2k-2のサブバンド利得情報符号化系列が格納されている。
図10の例では、音声信号符号化部201が、現フレーム2k及び2k+1の音声信号を符号化することによって現フレーム2k及び2k+1の音声信号符号化系列を生成して、現在のパケットkに格納する。
また、サブバンド利得算出部202Aが、音声信号符号化部201により入力された現フレーム2k及び2k+1の音声信号に基づいて、現フレーム2k及び2k+1の音声信号のサブバンド利得を算出し、サブバンド利得保持部202B及びサブバンド利得予測誤差算出部202Cに出力する。
サブバンド利得予測誤差算出部202Cは、サブバンド利得算出部202Aから入力された現フレーム2kの音声信号のサブバンド利得とサブバンド利得保持部202Bから入力された過去のフレーム2k-1の音声信号のサブバンド利得とに基づいて、過去のフレーム2k-1の音声信号のサブバンド利得予測誤差を算出してサブバンド利得予測誤差符号化部202Dに出力する。
例えば、図10の場合、現フレーム2k及び1つ前のフレーム2k-1の音声信号のサブバンドn(n=0,1,…,N-1)のサブバンド利得をそれぞれ「g(2k)」及び、「g(2k-1)」とすると、予測係数aのとき、サブバンド利得予測誤差算出部202Cは、
eg(2k-1)=ag(2K)-g(2k-1) (数7)
によって、
フレーム2k-1の音声信号のサブバンドnのサブバンド利得予測誤差eg(2k-1)を算出することができる。
一方、サブバンド利得情報符号化部202Eは、サブバンド利得保持部202Bから入力された過去のフレーム2k-1及び2k-2の音声信号のサブバンド利得とに基づいて、過去のフレーム2k-2の音声信号のサブバンド利得情報(第2のサブバンド利得予測誤差)を算出し、かかる過去のフレーム2k-2の音声信号のサブバンド利得情報を符号化することによって過去のフレーム2k-2の音声信号のサブバンド利得情報符号化系列を生成してサブバンド利得符号化系列出力部202Fに出力してもよい。
例えば、図10の場合、フレーム2k-2の音声信号のサブバンド利得情報は、フレーム2k-1の音声信号のサブバンド利得との相関を用いて符号化されるため(例えば、フレーム2k-1の音声信号のサブバンド利得との予測誤差情報が符号化されるため)、サブバンド利情報符号化部202Eにて符号化されてもよい。
サブバンド利得予測誤差符号化部202Dは、サブバンド利得予測誤差算出部202Cから入力された過去のフレーム2k-1の音声信号のサブバンド利得予測誤差を符号化することによって、過去のフレーム2k-1の音声信号のサブバンド利得予測誤差符号化系列を生成してサブバンド利得符号化系列出力部202Fに出力してもよい。
また、サブバンド利得符号化系列出力部202Fは、サブバンド利得予測誤差符号化部202Dにより入力された過去のフレーム2k-1の音声信号のサブバンド利得予測誤差符号化系列と、サブバンド利得情報符号化部202Eにより入力された過去のフレーム2k-2の音声信号のサブバンド利得情報符号化系列とに基づいて、サブバンド利得符号化系列を生成して出力する。
図11を参照して、本発明の第1の実施形態に係る符号化装置20における音声信号符号化部201の機能について説明する。
本実施形態では、時間-周波数変換規則による変換符号化方式が用いられている例が記載されているが、本発明は、かかる例に限定されない。また、上述のように、時間-周波数変換規則としてDFTやDCTやMDCT等が用いられている例が記載されているが、本発明は、かかる例に限定されない。
音声信号符号化部201は、時間-周波数変換部201Aと、サブバンド利得符号化部201Bと、変換係数正規化部201Cと、正規化変換係数符号化部201Dと、音声信号符号化系列出力部201Eとを有する。
時間-周波数変換部201Aは、入力された音声信号を、時間-周波数変換を用いて変換係数に変換し、サブバンド利得符号化部201B及び変換係数正規化部201Cに出力するように構成されている。
サブバンド利得符号化部201Bは、時間-周波数変換部201Aにより入力された変換係数に基づいて、入力された音声信号のサブバンド利得を算出するように構成されている。
例えば、サブバンド利得符号化部201Bは、(数1)を用いて、入力された音声信号のサブバンド利得を算出することができる。
サブバンド利得符号化部201Bは、所定方法に基づいて、算出したサブバンド利得を符号化することによってサブバンド利得符号化系列を生成して、音声信号符号化系列出力部201Eに出力するように構成されている。
また、サブバンド利得符号化部201Bは、符号化した音声信号のサブバンド利得を、変換係数正規化部201Cに出力するように構成されている。
上述の例のように、補助情報符号化部202において、サブバンド利得が用いられる場合、サブバンド利得符号化部201Bは、算出したサブバンド利得を、補助情報符号化部202に出力するように構成されている。
変換係数正規化部201Cは、時間-周波数変換部201Aにより入力された変換係数を、サブバンド利得情報符号化部201Bにより入力されたサブバンド利得で正規化するように構成されている。
例えば、具体的には、フレームkのサブバンドn(n=0,1,…,N-1)の変換係数を「Wn,k(m)、(m=0,1,…,Mn-1)」とし、サブバンドnのサブバンド利得を「g(k)」とすると、変換係数正規化部201Cは、
Figure 0005123516
によって、フレームkのサブバンドnの正規化変換係数wn,k(m)を算出することができる。
なお、変換係数正規化部201Cは、算出した正規化変換係数を、正規化変換係数符号化部201Dに出力するように構成されている。
正規化変換係数符号化部201Dは、所定方法に基づいて、変換係数正規化部201Cにより入力された正規化変換係数を符号化することによって、正規化変換係数符号化系列を生成して、音声信号符号化系列出力部201Eに出力するように構成されている。
音声信号符号化系列出力部201Eは、サブバンド利得符号化部201Bにより入力された音声信号サブバンド利得情報符号化系列、及び、正規化変換係数符号化部201Dにより入力された正規化変換係数符号化系列を、音声信号符号化系列として出力するように構成されている。
(本発明の第1の実施形態に係る復号装置及び符号化装置の動作)
第1に、図12を参照して、本発明の第1の実施形態に係る復号装置10の全体動作について説明する。
図12に示すフローチャートは、所定区間(フレーム)ごとに音声信号が符号化された場合の1フレームの音声信号に対応する動作を示しているため、特定のフレームの音声信号に対する動作が終了した後、次のフレームの音声信号に対しても同様に動作する。
図12に示すように、ステップS101において、音声信号復号部101が、入力された音声信号符号化系列から、音声信号を復号する。
ステップS102において、隠蔽信号生成判断情報の指示により、第1隠蔽信号生成部102及び第2隠蔽信号生成部104が、それぞれ第1隠蔽信号及び第2隠蔽信号を生成するか否かについて判断する。すなわち、欠落フレームが検出されたか否かについて判断される。
生成しないと判断された場合(すなわち、欠落フレームが検出されていないと判断された場合)は、第1隠蔽信号生成部102及び第2隠蔽信号生成部104が、共に、第1隠蔽信号及び第2隠蔽信号を生成せず、本動作は、終了する。
一方、生成すると判断された場合(すなわち、欠落フレームが検出されたと判断された場合)は、ステップS103において、第1隠蔽信号生成部102が、欠落フレームに対応する第1隠蔽信号を生成する。
ステップS104において、補助情報復号部103が、入力された補助情報符号化系列から、欠落フレームの音声信号の補助情報を復号する。
なお、ステップS103及びステップS104は、どちらを先に行ってもよく、また同時に行ってもよい。
ステップS105において、第2隠蔽信号生成部104が、欠落フレームに対応する第1隠蔽信号に対して、欠落フレームの音声信号の補助情報を適用することよって、欠落フレームに対応する第2隠蔽信号を生成する。
ステップS106において、第2隠蔽信号生成部104が、欠落フレームの音声信号を補償するための隠蔽信号として、欠落フレームに対応する第2隠蔽信号を出力する。
第2に、図13を参照して、本発明の第1の実施形態に係る復号装置10における音声信号復号部101の動作例について説明する。
図13に示すように、ステップS201において、音声信号符号化系列復号部101Aが、入力された音声信号符号化系列を復号することによって、正規化変換係数及びサブバンド利得情報を取得する。
ステップS202において、サブバンド利得適用部101Bが、所定のサブバンドごとにサブバンド利得を正規化変換係数に適用することによって、変換係数を算出する。
ステップS203において、周波数-時間変換部101Cが、変換係数に対して周波数-時間変換処理を施すことによって時間信号に変換し、音声信号として出力する。
第3に、図14を参照して、本発明の第1の実施形態に係る復号装置10における補助情報復号部103の第1の動作例について説明する。
図14に示すように、ステップS301において、サブバンド利得算出部103Aが、入力された音声信号情報に基づいて、現フレームの音声信号のサブバンド利得を算出する。
ステップS302において、サブバンド利得予測誤差復号部103Bが、サブバンド利得符号化系列のうち、正常に受信した現フレームの音声信号のサブバンド利得との予測誤差に対応する部分を復号することによって、サブバンド利得予測誤差を得る。
ステップS303において、サブバンド利得情報復号部103Cが、サブバンド利得符号化系列のうち、上述のサブバンド利得予測誤差以外のサブバンド利得情報に対応する部分を復号することによって、サブバンド利得予測誤差以外のサブバンド利得情報を得る。
ステップS304において、隠蔽区間サブバンド利得算出部103Dが、現フレームの音声信号のサブバンド利得と、サブバンド利得予測誤差と、上述のサブバンド利得予測誤差以外のサブバンド利得情報(第2のサブバンド利得予測誤差)に基づいて、隠蔽区間(欠落フレーム)の音声信号のサブバンド利得を算出して出力する。
ただし、サブバンド利得符号化系列に、正常に受信したフレームの音声信号のサブバンド利得予測誤差に関する符号化系列のみが含まれている場合は、上述のステップS303は、省略可能である。
また、音声信号復号部101から、現フレームの音声信号のサブバンド利得が、音声信号情報として入力される場合は、上述のステップS301は、省略可能である。
第4に、図15を参照して、本発明の第1の実施形態に係る復号装置10における補助情報復号部103の第2の動作例について説明する。
図15に示すように、ステップS401において、ピッチ周期算出部103Eが、入力された音声信号情報に基づいて、現フレームの音声信号のピッチ周期を算出する。
ステップS402において、ピッチ周期予測誤差復号部103Fが、ピッチ周期符号化系列のうち、正常に受信した現フレームの音声信号のピッチ周期との予測誤差に対応する部分を復号することによって、ピッチ周期予測誤差を得る。
ステップS403において、ピッチ周期情報復号部103Gが、ピッチ周期符号化系列のうち、上述のピッチ周期予測誤差以外のピッチ周期情報に対応する部分を復号することによって、ピッチ周期予測誤差以外のピッチ周期情報を得る。
ステップS404において、隠蔽区間ピッチ周期算出部103Hが、現フレームの音声信号のピッチ周期と、ピッチ周期予測誤差と、上述のピッチ周期予測誤差以外のピッチ周期情報(第2のピッチ周期予測誤差)に基づいて、隠蔽区間(欠落フレーム)の音声信号のピッチ周期を算出して出力する。
ただしピッチ周期符号化系列に、正常に受信したフレームの音声信号のピッチ周期予測誤差に関する符号化系列のみが含まれている場合は、上述のステップS403は、省略可能である。
また、音声信号復号部101から、現フレームの音声信号のピッチ周期が、音声信号情報として入力される場合は、上述のステップS401は、省略可能である。
第5に、図16を参照して、本発明の第1の実施形態に係る復号装置10における第2隠蔽信号生成部104の動作例について説明する。
図16に示すように、ステップS501において、第1隠蔽信号時間-周波数変換部104Aが、所定の時間-周波数変換規則を用いて第1隠蔽信号を変換することによって、第1隠蔽信号変換係数を算出する。
ステップS502において、第1隠蔽信号変換係数正規化部104Bが、第1隠蔽信号変換係数を、所定のサブバンドごとに正規化することによって、第1隠蔽信号正規化変換係数を算出する。
ステップS503において、サブバンド利得適用部104Cが、所定のサブバンドごとにサブバンド利得を第1隠蔽信号正規化変換係数に適用することによって、第2隠蔽信号変換係数を算出する。
ステップS504において、第2隠蔽信号周波数-時間変換部104Dが、所定の周波数-時間変換処理を施して第2隠蔽信号変換係数を時間信号に変換することによって、欠落フレームに対応する第2隠蔽信号を生成して出力する。
第6に、図17を参照して、本発明の第1の実施形態に係る符号化装置20の全体動作について説明する。
図17に示すように、ステップS601において、音声信号符号化部201が、所定方法に基づいて、現フレームの音声信号を符号化することによって、音声信号符号化系列を生成して出力する。
ステップS602において、補助情報符号化部202が、音声信号符号化部201により入力された現フレームの音声信号情報、及び、必要に応じて、入力された現フレームの音声信号を用いて、欠落フレームに対応する第2の隠蔽信号の生成に必要な欠落フレーム(現フレームの前のフレーム)の音声信号の補助情報を求め、補助情報符号化系列に符号化する。
ステップS603において、補助情報符号化部202が、補助情報符号化系列を出力する。
以上のステップによって、現フレームの音声信号についての符号化処理は、終了し、本動作は、次のフレームの音声信号に対しても同様に動作する。
第7に、図18を参照して、本発明の第1の実施形態に係る符号化装置20における音声信号符号化部201の動作例について説明する。
本動作は、所定区間(フレーム))ごとに音声信号が符号化される場合の1フレームに対応する動作を示しているため、音声信号符号化部201は、特定のフレームに対する動作が終了した後、次のフレームに対しても同様に動作する。
図18に示すように、ステップS701において、時間-周波数変換部201Aが、現フレームの音声信号を時間-周波数変換することによって、変換係数を算出する。
ステップS702において、サブバンド利得符号化部201Bが、変換係数に基づいて、所定のサブバンドごとにサブバンド利得を算出し、所定方法に基づいて、サブバンド利得符号化系列に符号化する。
ステップS703において、サブバンド利得符号化部201Bが、サブバンド利得符号化系列を復号して得られるサブバンド利得を算出する。
なお、上述のように、補助情報符号化部202においてサブバンド利得が用いられる場合、サブバンド利得符号化部201Bは、算出したサブバンド利得を、補助情報符号化部202に出力する。
ステップS704において、変換係数正規化部201Cが、所定のサブバンドごとに、サブバンド利得符号化部201Bにより入力されたサブバンド利得を用いて変換係数を正規化することによって、正規化変換係数を算出する。
ステップS705において、正規化変換係数符号化部201Dが、所定方法に基づいて、正規化変換係数を正規化変換係数符号化系列に符号化する。
ステップS706において、音声信号符号化系列出力部201Eが、サブバンド利得符号化系列と正規化変換係数符号化系列とをまとめて、音声信号符号化系列として出力する。
以上のステップによって、現フレームの音声信号の符号化処理は、終了し、音声信号符号化部201は、次のフレームの音声信号に対しても同様に動作する。
第8に、図19を参照して、本発明の第1の実施形態に係る符号化装置20における補助情報符号化部202の第1の動作例について説明する。
図19に示すように、ステップS801において、サブバンド利得算出部202Aが、入力された現フレームの音声情報に基づいて、現フレームの音声信号のサブバンド利得を算出する。
ステップS802において、サブバンド利得保持部202Bが、現フレームの音声信号のサブバンド利得を保持し、欠落フレームを補償するための隠蔽信号を生成するための音声信号の補助情報として、過去のフレーム(欠落フレーム)の音声信号のサブバンド利得を出力する。
ステップS803において、サブバンド利得予測誤差算出部202Cが、現フレームの音声信号のサブバンド利得から過去のフレーム(欠落フレーム)の音声信号のサブバンド利得を予測した際の誤差を示すサブバンド利得予測誤差を算出する。
ステップS804において、サブバンド利得予測誤差符号化部202Dが、算出されたサブバンド利得予測誤差を符号化する。
ステップS805において、サブバンド利得情報符号化部202Eが、上述のサブバンド利得予測誤差以外のサブバンド利得情報を符号化する。
なお、ステップS805は、ステップS803の前に行われてもよいし、ステップS804の前に行われてもよい。
ステップS806において、サブバンド利得符号化系列出力部202Fが、サブバンド利得予測誤差符号化系列及びサブバンド利得情報符号化系列を、サブバンド利得符号化系列として出力する。
(本発明の第1の実施形態に係る復号装置及び符号化装置の作用・効果)
本発明の第1の実施形態に係る復号装置10及び符号化装置20によれば、現フレームの音声信号と欠落フレームの音声信号との相関を利用して、欠落フレームの音声信号を補償するための第2の隠蔽信号を生成するため、パケット損失等により欠落した音声信号を補償するために、送信側からの補助情報の伝送量を抑えつつ、受信側において十分な精度の隠蔽信号を生成することが実現できる。
(本発明の第2の実施形態に係る復号装置及び符号化装置)
図20乃至図25を参照して、本発明の第2の実施形態に係る復号装置10及び符号化装置20について説明する。以下、本実施形態に係る復号装置10及び符号化装置20について、上述の第1の実施形態に係る復号装置10及び符号化装置20との相違点に着目して説明する。
第1に、図20を参照して、本発明の第2の実施形態に係る復号装置10について説明する。
本発明の第1の実施形態に係る復号装置10の構成との相違点は、隠蔽信号生成判断情報の代わりに、隠蔽信号選択情報が、第1隠蔽信号生成部102と補助情報復号部103と第2隠蔽信号生成部104とに入力される点、及び、隠蔽信号として出力される信号は、隠蔽信号選択情報により、第1隠蔽信号生成部102から出力されるか或いは第2隠蔽信号生成部104から出力されるかが決定される点である。
なお、隠蔽信号選択情報は、隠蔽信号を生成しないように指示するか、隠蔽信号として第1隠蔽信号を出力するように指示するか、或いは、第2隠蔽信号を出力するように指示するかのいずれかである。
隠蔽信号選択情報が、隠蔽信号を生成しないように指示した場合、第1隠蔽信号生成部102、補助情報復号部103及び第2隠蔽信号生成部104は、動作せず、いずれも隠蔽信号を出力しないように構成されている。
また、隠蔽信号選択情報が、隠蔽信号として第1隠蔽信号を出力するように指示した場合、補助情報復号部103及び第2隠蔽信号生成部104は、動作せず、第1隠蔽信号生成部102が、隠蔽信号として第1隠蔽信号を出力するように構成されている。
また、隠蔽信号選択情報が、隠蔽信号として第2隠蔽信号を出力するように指示した場合、補助情報復号部103及び第2隠蔽信号生成部104は、本発明の第1の実施例に係る復号装置10における補助情報復号部103及び第2隠蔽信号生成部104と同様に動作し、第2隠蔽信号生成部104が、隠蔽信号として第2隠蔽信号が出力するように構成されている。
第2に、図21を参照して、本発明の第2の実施形態に係る符号化装置20の第1の例について説明する。
本発明の第1の実施形態に係る符号化装置20の構成との相違点は、第1隠蔽信号生成部102と第2隠蔽信号生成部104と隠蔽信号評価部203とを有する点、及び、補助情報符号化系列の出力が、隠蔽信号選択情報に従う点である。
第1隠蔽信号生成部102は、本発明の第1の実施形態に係る復号装置10における第1隠蔽信号生成部102と同様に、欠落フレームに対応する第1隠蔽信号を生成するように構成されている。
第2隠蔽信号生成部104は、本発明の第1の実施形態に係る復号装置10における第2隠蔽信号生成部104と同様に、上述の第1隠蔽信号に対して補助情報を適用することによって、欠落フレームに対応する第2隠蔽信号を生成するように構成されている。
隠蔽信号評価部203は、上述の第1隠蔽信号及び第2隠蔽信号の補償精度を評価し、復号装置10において隠蔽信号として第1隠蔽信号を出力するように指示する隠蔽信号選択情報、又は、復号装置10において隠蔽信号として第2隠蔽信号を出力するかを指示する隠蔽信号選択情報のいずれかを生成するように構成されている。
例えば、隠蔽信号評価部203は、第1隠蔽信号及び第2隠蔽信号の音声信号に対する信号対雑音電力比(SNR:Signal-to-Noise Ratio)を算出するように構成されている。
具体的には、隠蔽区間(欠落フレーム)に対応する音声信号を「s(t)、(t=0,1,…,T-1)」とし、第1隠蔽信号を「c1(t)」とし、第2隠蔽信号を「c2(t)」とすると、隠蔽信号評価部203は、
Figure 0005123516
によって、第1隠蔽信号及び第2隠蔽信号のSNRであるSNRc1及びSNRc2をそれぞれ算出することができる。
そして、SNRc1とSNRc2とを比較して、SNRc1が大きい場合は、隠蔽信号評価部203は、第1隠蔽信号を隠蔽信号として出力するように指示する隠蔽信号選択情報を生成し、SNRc2が大きい場合は、隠蔽信号評価部203は、第2隠蔽信号を隠蔽信号として出力するように指示する隠蔽信号選択情報を生成する。
また、別の例としては、SNRc1が所定閾値よりも大きい場合は、隠蔽信号評価部203は、第1隠蔽信号を隠蔽信号として出力するように指示する隠蔽信号選択情報を生成し、SNRc1が所定閾値よりも小さい場合は、隠蔽信号評価部203は、第2隠蔽信号を隠蔽信号として出力するように指示する隠蔽信号選択情報を生成することもできる。
かかる場合のように、隠蔽信号評価部203は、第1隠蔽信号の補償精度のみを評価するように構成されていてもよい。
かかる場合、第2隠蔽信号を生成する必要が無く、第2隠蔽信号生成部104を省略することができ、隠蔽信号評価部203において第2隠蔽信号の補償精度は評価されない。
隠蔽信号選択情報が、隠蔽信号として第1隠蔽信号を出力するように指示する場合には、補助情報符号化系列は、符号化装置20から出力されず、隠蔽信号選択情報が、隠蔽信号として第2隠蔽信号を出力するように指示する場合には、補助情報符号化系列が、符号化装置20から出力される。
第3に、図22を参照して、本発明の第2の実施形態に係る符号化装置20の第2の例について説明する。
本発明の第1の実施形態に係る符号化装置20の構成との相違点は、隠蔽信号選択情報が、補助情報符号化部202に入力される点、及び、補助情報符号化系列の出力が、隠蔽信号選択情報に従う点であり、本発明の第2の実施形態に係る符号化装置20の第1の例との相違点は、隠蔽信号選択情報が符号化装置20において生成されるのではなく、外部により入力される点である。
以下、主として、本発明の第2の実施形態に係る符号化装置20の第2の例について、本発明の第1の実施形態に係る符号化装置20及び本発明の第2の実施形態に係る符号化装置20の第1の例との相違点について説明する。
補助情報符号化部202は、隠蔽信号選択情報によって、復号装置10において隠蔽信号として第2隠蔽信号を出力するように指示された場合にのみ、補助情報を算出して符号化することによって、補助情報符号化系列を出力するように構成されている。
次に、図23乃至図25を参照して、本発明の第2の実施形態に係る復号装置10及び符号化装置20の動作について説明する。
第1に、図23を参照して、本発明の第2の実施形態に係る復号装置10の動作について説明する。
以下、主として、本発明の第1の実施形態に係る復号装置10の動作との相違点について説明する。
図23に示すように、ステップS902の判断は、隠蔽信号選択情報の指示により行われる。
ステップS903の後、ステップS922において、隠蔽信号選択情報が、隠蔽信号として第2隠蔽信号を出力ように指示しているか否かについて判断する。
隠蔽信号選択情報が、隠蔽信号として第2隠蔽信号を出力するように指示している場合は、上述の第1の実施形態に係る復号装置10の動作と同様に、ステップS904乃至ステップS906の処理が行われ、本動作は終了する。
一方、隠蔽信号選択情報が、隠蔽信号として第1隠蔽信号を出力するように指示していない場合は、ステップS907において、第1隠蔽信号生成部102が、隠蔽信号として第1隠蔽信号を出力し、本動作は終了する。
ここで、隠蔽信号選択情報は、後述するように、本発明の第2の実施形態に係る符号化装置20から送信されるように構成されていてもよいし、当該復号装置10を含む受信機において生成されるように構成されていてもよい。
第2に、図24を参照して、本発明の第2の実施形態に係る符号化装置20の第1の例における動作について説明する。
以下、主として、本発明の第1の実施形態に係る符号化装置20の動作との相違点について説明する。
図24に示すように、ステップS1001の後に、ステップS1002において、第1隠蔽信号生成部102が、第1隠蔽信号を生成する。
また、ステップS1003の後に、ステップS1004において、第2隠蔽信号生成部104が、第1隠蔽信号に対して補助情報を適用することによって、第2隠蔽信号を生成する。
ステップS1005において、隠蔽信号評価部203が、第1隠蔽信号及び第2隠蔽信号の補償精度について評価する。
ステップS1006において、隠蔽信号評価部203が、上述の評価結果に基づいて、復号装置10において隠蔽信号として第2隠蔽信号を出力するべきか否かについて判断する。
隠蔽信号として第2隠蔽信号を出力するべきであると判断された場合には、ステップS1007の処理が行われ、隠蔽信号として第2隠蔽信号を出力するべきではないと判断された場合には、ステップS1007の処理は行われない。
ステップS1008において、隠蔽信号評価部203が、隠蔽信号として第2隠蔽信号を出力するべきか否かについての判断結果に基づいて、隠蔽信号選択情報を出力する。
ただし、上述の例のように、隠蔽信号評価部203が、第1隠蔽信号の補償精度のみを評価する場合には、ステップS1004の処理を省略することができ、ステップS1005の処理において、隠蔽信号評価部203は、第1隠蔽信号の補償精度のみを評価する。
また、ステップS1003において、補助情報符号化部202は、復号装置10で適用される補助情報のみを算出し、ステップS1006において、隠蔽信号として第2隠蔽信号を出力するべきであると判断される場合に、補助情報符号化部202は、ステップS1007の処理の前に、補助情報を符号化してもよい。
第3に、図25を参照して、本発明の第2の実施形態に係る符号化装置20の第2の例における動作について説明する。
以下、主として、本発明の第1の実施形態に係る符号化装置20の動作との相違点について説明する。
図25に示すように、ステップS1101の後に、ステップS1102において、補助情報符号化部202が、隠蔽信号選択情報の指示により補助情報を符号化するか否かについて判断する。
隠蔽信号選択情報が、復号装置10において隠蔽信号として第2隠蔽信号を出力するように指示している場合には、補助情報符号化部202が、補助情報を符号化するべきであると判断し、ステップS1103及びステップS1104の処理が行われる。
本発明の第1の実施形態に係る復号装置を示す機能ブロック図である。 本発明の第1の実施形態に係る復号装置の補助情報復号部の機能ブロック図である。 本発明の第1の実施形態に係る復号装置に入力される符号化系列が納められたパケットの構成例を示す図である。 本発明の第1の実施形態に係る復号装置における隠蔽信号の生成方法の一例を示す図である。 本発明の第1の実施形態に係る復号装置の補助情報復号部の機能ブロック図である。 本発明の第1の実施形態に係る復号装置の第2隠蔽信号生成部の機能ブロック図である。 本発明の第1の実施形態に係る復号装置の音声信号復号部の機能ブロック図である。 本発明の第1の実施形態に係る符号化装置を示す機能ブロック図である。 本発明の第1の実施形態に係る符号化装置の補助情報符号化部の機能ブロック図である。 本発明の第1の実施形態に係る符号化装置における補助情報符号化系列の生成方法の一例を示す図である。 本発明の第1の実施形態に係る符号化装置の音声信号符号化部の機能ブロック図である。 本発明の第1の実施形態に係る復号装置の全体動作を示すフローチャートである。 本発明の第1の実施形態に係る復号装置の音声信号復号部の動作を示すフローチャートである。 本発明の第1の実施形態に係る復号装置の補助情報復号部の動作を示すフローチャートである。 本発明の第1の実施形態に係る復号装置の補助情報復号部の動作を示すフローチャートである。 本発明の第1の実施形態に係る復号装置の第2隠蔽信号生成部の動作を示すフローチャートである。 本発明の第1の実施形態に係る符号化装置の全体動作を示すフローチャートである。 本発明の第1の実施形態に係る符号化装置の音声信号符号化部の全体動作を示すフローチャートである。 本発明の第1の実施形態に係る符号化装置の補助情報符号化部の動作を示すフローチャートである。 本発明の第2の実施形態に係る復号装置を示す機能ブロック図である。 本発明の第2の実施形態に係る符号化装置を示す機能ブロック図である。 本発明の第2の実施形態に係る符号化装置を示す機能ブロック図である。 本発明の第2の実施形態に係る復号装置の全体動作を示すフローチャートである。 本発明の第2の実施形態に係る符号化装置の全体動作を示すフローチャートである。 本発明の第2の実施形態に係る符号化装置の全体動作を示すフローチャートである。
符号の説明
10…復号装置
101…音声信号復号部
101A…音声信号符号化系列復号部
101B…サブバンド利得情報適用部
101C…周波数-時間変換部
102…第1隠蔽信号生成部
103…補助情報復号部
103A、202A…サブバンド利得算出部
103B…サブバンド利得予測誤差復号部
103C…サブバンド利得情報復号部
103D…隠蔽区間サブバンド利得算出部
103E…ピッチ周期算出部
103F…ピッチ周期予測誤差復号部
103G…ピッチ周期情報復号部
103H…隠蔽区間ピッチ周期算出部
104…第2隠蔽信号生成部
104A…第1隠蔽信号時間-周波数変換部
104B…第1隠蔽信号変換係数正規化部
104C…サブバンド利得情報適用部
104D…第2隠蔽信号周波数-時間変換部
20…符号化装置
201…音声信号符号化部
201A…時間-周波数変換部
201B…サブバンド利得符号化部
201C…変換係数正規化部
201D…正規化変換係数符号化部
201E…音声信号符号化系列出力部
202…補助情報符号化部
202B…サブバンド利得情報保持部
202C…サブバンド利得予測誤差算出部
202D…サブバンド利得予測誤差符号化部
202E…サブバンド利得情報符号化部
202F…サブバンド利得情報符号化系列出力部
203…隠蔽信号評価部

Claims (12)

  1. 損失パケットの発生によって音声信号が欠落した欠落フレームの音声信号を補償するための隠蔽信号を出力する復号装置であって、
    入力された音声信号符号化系列から、現フレームの音声信号を復号するように構成されている音声信号復号部と、
    前記音声信号復号部からの音声信号情報を利用して前記欠落フレームに対応する第1隠蔽信号を生成するように構成されている第1隠蔽信号生成部と、
    前記現フレームの音声信号と前記欠落フレームの音声信号との相関を利用して、入力された補助情報符号化系列から、前記欠落フレームの音声信号の補助情報を復号するように構成されている補助情報復号部と、
    生成された前記第1隠蔽信号を、前記補助情報復号部により復号された前記欠落フレームの音声信号の補助情報に従って修正することによって、前記欠落フレームに対応する第2隠蔽信号を生成して、前記隠蔽信号として出力するように構成されている第2隠蔽信号生成部とを具備することを特徴とする復号装置。
  2. 隠蔽信号選択情報が、前記第2隠蔽信号を出力するように指示している場合に、前記第2隠蔽信号生成部が、前記第2隠蔽信号を前記隠蔽信号として出力するように構成されており、
    前記隠蔽信号選択情報が、前記第1隠蔽信号を出力するように指示している場合に、前記第1隠蔽信号生成部が、前記第1隠蔽信号を前記隠蔽信号として出力するように構成されていてもよいことを特徴とする請求項1に記載の復号装置。
  3. 前記補助情報復号部は、
    入力された前記補助情報符号化系列から、前記現フレームの音声信号の補助情報から前記欠落フレームの音声信号の補助情報を予測した際の誤差を示す補助情報予測誤差を復号するように構成されている補助情報予測誤差復号部と、
    前記現フレームの音声信号の補助情報と、復号された前記補助情報予測誤差とに基づいて、前記欠落フレームの音声信号の補助情報を算出するように構成されている欠落フレーム補助情報算出部とを具備することを特徴とする請求項1に記載の復号装置。
  4. 前記欠落フレーム補助情報算出部は、前記欠落フレームの音声信号から別の欠落フレームの音声信号を予測した際の誤差を示す第2の補助情報予測誤差に基づいて、前記第2の欠落フレームの音声信号の補助情報を算出するように構成されていることを特徴とする請求項3に記載の復号装置。
  5. 前記補助情報は、前記音声信号の周波数パワースペクトル包絡情報、前記音声信号の電力情報又は前記音声信号のピッチ情報の少なくとも1つを含むことを特徴とする請求項1乃至4のいずれか一項に記載の復号装置。
  6. 前記音声信号復号部は、変換符号化方式に基づいて、入力された前記音声信号符号化系列から前記現フレームの音声信号を復号するように構成されていることを特徴とする請求項1乃至5のいずれか一項に記載の復号装置。
  7. 損失パケットの発生によって音声信号が欠落した欠落フレームの音声信号を補償するための隠蔽信号を生成する復号装置と共に用いられる符号化装置であって、
    現フレームの音声信号を符号化することによって音声信号符号化系列を生成して出力するように構成されている音声信号符号化部と、
    前記現フレームの音声信号と前記欠落フレームの音声信号との相関を利用して、前記隠蔽信号の生成に用いられる前記欠落フレームの音声信号の補助情報を算出して符号化することによって補助情報符号化系列を生成して出力するように構成されている補助情報符号化部とを具備することを特徴とする符号化装置。
  8. 前記補助情報符号化部は、
    前記現フレームの音声信号の補助情報から前記欠落フレームの音声信号の補助情報を予測した際の誤差を示す補助情報予測誤差を算出するように構成されている補助情報予測誤差算出部と、
    前記欠落フレームの音声信号の前記補助情報予測誤差を符号化することによって前記補助情報符号化系列を生成して出力するように構成されている補助情報符号化系列出力部とを具備することを特徴とする請求項7に記載の符号化装置。
  9. 前記補助情報は、前記音声信号の周波数パワースペクトル包絡情報、前記音声信号の電力情報又は前記音声信号のピッチ情報の少なくとも1つを含むことを特徴とする請求項7又は8に記載の符号化装置。
  10. 前記音声信号符号化部は、変換符号化方式に基づいて、前記音声信号を符号化することによって前記音声信号符号化系列を生成して出力するように構成されていることを特徴とする請求項7乃至9のいずれか一項に記載の符号化装置。
  11. 損失パケットの発生によって音声信号が欠落した欠落フレームの音声信号を補償するための隠蔽信号を出力する復号方法であって、
    入力された音声信号符号化系列から、現フレームの音声信号を復号する工程と、
    前記音声信号復号部からの音声信号情報を利用して前記欠落フレームに対応する第1隠蔽信号を生成する工程と、
    前記現フレームの音声信号と前記欠落フレームの音声信号との相関を利用して、入力された補助情報符号化系列から、前記欠落フレームの音声信号の補助情報を復号する工程と、
    生成された前記第1隠蔽信号を、前記補助情報復号部により復号された前記欠落フレームの音声信号の補助情報に従って修正することによって、前記欠落フレームに対応する第2隠蔽信号を生成して、前記隠蔽信号として出力する工程とを有することを特徴とする復号方法。
  12. 損失パケットの発生によって音声信号が欠落した欠落フレームの音声信号を補償するための隠蔽信号を生成する復号装置と共に用いられる符号化方法であって、
    現フレームの音声信号を符号化することによって音声信号符号化系列を生成して出力する工程と、
    前記現フレームの音声信号と前記欠落フレームの音声信号との相関を利用して、前記隠蔽信号の生成に用いられる前記欠落フレームの音声信号の補助情報を算出して符号化することによって補助情報符号化系列を生成して出力する工程とを有することを特徴とする符号化方法。
JP2006294824A 2006-10-30 2006-10-30 復号装置、符号化装置、復号方法及び符号化方法 Active JP5123516B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006294824A JP5123516B2 (ja) 2006-10-30 2006-10-30 復号装置、符号化装置、復号方法及び符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006294824A JP5123516B2 (ja) 2006-10-30 2006-10-30 復号装置、符号化装置、復号方法及び符号化方法

Publications (2)

Publication Number Publication Date
JP2008111991A JP2008111991A (ja) 2008-05-15
JP5123516B2 true JP5123516B2 (ja) 2013-01-23

Family

ID=39444530

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006294824A Active JP5123516B2 (ja) 2006-10-30 2006-10-30 復号装置、符号化装置、復号方法及び符号化方法

Country Status (1)

Country Link
JP (1) JP5123516B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5013822B2 (ja) * 2006-11-09 2012-08-29 キヤノン株式会社 音声処理装置とその制御方法、及び、コンピュータプログラム
EP4239635A3 (en) 2010-11-22 2023-11-15 Ntt Docomo, Inc. Audio encoding device and method
HUE064739T2 (hu) * 2010-11-22 2024-04-28 Ntt Docomo Inc Audio kódoló eszköz és eljárás
JP5694745B2 (ja) * 2010-11-26 2015-04-01 株式会社Nttドコモ 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
WO2013183977A1 (ko) 2012-06-08 2013-12-12 삼성전자 주식회사 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
WO2014042439A1 (ko) * 2012-09-13 2014-03-20 엘지전자 주식회사 손실 프레임 복원 방법 및 오디오 복호화 방법과 이를 이용하는 장치
CN107731237B (zh) 2012-09-24 2021-07-20 三星电子株式会社 时域帧错误隐藏设备
PL2922053T3 (pl) * 2012-11-15 2019-11-29 Ntt Docomo Inc Urządzenie do kodowania audio, sposób kodowania audio, program do kodowania audio, urządzenie do dekodowania audio, sposób dekodowania audio, i program do dekodowania audio
CN112489665B (zh) * 2020-11-11 2024-02-23 北京融讯科创技术有限公司 语音处理方法、装置以及电子设备
CN112634912B (zh) * 2020-12-18 2024-04-09 北京猿力未来科技有限公司 丢包补偿方法及装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3186013B2 (ja) * 1995-01-13 2001-07-11 日本電信電話株式会社 音響信号変換符号化方法及びその復号化方法
JPH1097295A (ja) * 1996-09-24 1998-04-14 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
EP1199709A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
JP2002162998A (ja) * 2000-11-28 2002-06-07 Fujitsu Ltd パケット修復処理を伴なう音声符号化方法
JP3566931B2 (ja) * 2001-01-26 2004-09-15 日本電信電話株式会社 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
JP3722366B2 (ja) * 2002-02-22 2005-11-30 日本電信電話株式会社 パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP2005284162A (ja) * 2004-03-30 2005-10-13 Ntt Docomo Inc 信号符号化装置、信号復号装置、信号符号化方法、及び、信号復号方法
CN1906663B (zh) * 2004-05-10 2010-06-02 日本电信电话株式会社 声学信号分组通信方法、传送方法、接收方法、及其设备和程序

Also Published As

Publication number Publication date
JP2008111991A (ja) 2008-05-15

Similar Documents

Publication Publication Date Title
JP5123516B2 (ja) 復号装置、符号化装置、復号方法及び符号化方法
JP6951536B2 (ja) 音声符号化装置および方法
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
JP6073830B2 (ja) フレームエラー隠匿装置
KR101513184B1 (ko) 계층적 디코딩 구조에서의 디지털 오디오 신호의 송신 에러에 대한 은닉
JP5046653B2 (ja) 音声符号化装置および音声符号化方法
US7765100B2 (en) Method and apparatus for recovering line spectrum pair parameter and speech decoding apparatus using same
US20080262853A1 (en) Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US10504525B2 (en) Adaptive forward error correction redundant payload generation
AU2017208369B2 (en) Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
JPWO2007116809A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
US20140088974A1 (en) Apparatus and method for audio frame loss recovery
JP2008261904A (ja) 符号化装置、復号化装置、符号化方法および復号化方法
KR100591350B1 (ko) 오디오 데이터 보간장치 및 방법, 오디오 데이터관련 정보작성장치 및 방법, 오디오 데이터 보간 정보 송신장치 및방법, 및 그 프로그램 및 기록 매체
JP2004138756A (ja) 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム
JP4216364B2 (ja) 音声符号化/復号化方法および音声信号の成分分離方法
JP2004102074A (ja) 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム
JP4536621B2 (ja) 復号装置、および復号方法
JP2004069963A (ja) 音声符号変換装置及び音声符号化装置
KR100594599B1 (ko) 수신단 기반의 패킷 손실 복구 장치 및 그 방법
KR20230023634A (ko) 스트림 준수 비트 에러 복원력
JP7420829B2 (ja) 予測コーディングにおける低コスト誤り回復のための方法および装置
EP1560201A1 (en) Code conversion method and device for code conversion
JP2005284162A (ja) 信号符号化装置、信号復号装置、信号符号化方法、及び、信号復号方法
JP2005151235A (ja) 復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110912

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120810

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121023

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121026

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5123516

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250