JP4958780B2 - 符号化装置、復号化装置及びこれらの方法 - Google Patents

符号化装置、復号化装置及びこれらの方法 Download PDF

Info

Publication number
JP4958780B2
JP4958780B2 JP2007528236A JP2007528236A JP4958780B2 JP 4958780 B2 JP4958780 B2 JP 4958780B2 JP 2007528236 A JP2007528236 A JP 2007528236A JP 2007528236 A JP2007528236 A JP 2007528236A JP 4958780 B2 JP4958780 B2 JP 4958780B2
Authority
JP
Japan
Prior art keywords
signal
decoding
decoded signal
encoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007528236A
Other languages
English (en)
Other versions
JPWO2006120931A1 (ja
Inventor
薫 佐藤
利幸 森井
智史 山梨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2007528236A priority Critical patent/JP4958780B2/ja
Publication of JPWO2006120931A1 publication Critical patent/JPWO2006120931A1/ja
Application granted granted Critical
Publication of JP4958780B2 publication Critical patent/JP4958780B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、入力信号をスケーラブル符号化して伝送する通信システムに使用される符号化装置、復号化装置及びこれらの方法に関する。
ディジタル無線通信、インターネット通信に代表されるパケット通信あるいは音声蓄積などの分野では、電波などの伝送路容量や記憶媒体の有効利用を図るため、音声信号の符号化/復号化技術が不可欠であり、これまでに多くの音声符号化/復号化方式が開発されてきた。
そして、現在では、CELP方式の音声符号化/復号化方式が主流の方式として実用化されている(例えば、非特許文献1)。CELP方式の音声符号化方式は、主に発声音のモデルを記憶し、予め記憶された音声モデルに基づいて入力音声をコード化するものである。
そして、近年、音声信号、楽音信号の符号化において、CELP方式を応用し、符号化情報の一部からでも音声・楽音信号を復号化でき、パケット損失が発生するような状況においても音質劣化を抑制することができるスケーラブル符号化技術が開発されている(例えば、特許文献1参照)。
スケーラブル符号化方式は、一般的に、基本レイヤと複数の拡張レイヤとからなり、各レイヤは、基本レイヤを最も下位のレイヤとし、階層構造を形成している。そして、各レイヤでは、より下位レイヤの入力信号と出力信号との差である残差信号について符号化が行われる。この構成により、全レイヤの符号化情報もしくは一部のレイヤの符号化情報を用いて、音声・楽音を復号化することができる。
また、スケーラブル符号化においては、一般的に、入力信号のサンプリング周波数変換を行い、ダウンサンプリング後の入力信号を符号化することが行われる。この場合、上位のレイヤが符号化する残差信号は、下位レイヤの復号化信号をアップサンプリングし、入力信号とアップサンプリング後の復号化信号との差を求めることにより、生成される。
特開平10−97295号公報 M.R.Schroeder, B.S.Atal, "Code Excited Linear Prediction: High Quality Speech at Very Low Bit Rate", IEEE proc., ICASSP'85 pp.937-940
ここで、一般的に、符号化装置は復号化信号の品質劣化の原因となる固有の特性を有する。例えば、ダウンサンプリング後の入力信号を基本レイヤで符号化する場合、サンプリング周波数変換により復号化信号に位相のずれが生じ、復号化信号の品質が劣化する。
しかしながら、従来のスケーラブル符号化方式では、符号化装置に固有の特性を考慮せずに符号化を行っているため、この符号化装置に固有の特性により下位レイヤの復号化信号の品質が劣化し、復号化信号と入力信号との誤差は大きくなり、上位のレイヤの符号化効率を落とす原因となる。
本発明の目的は、スケーラブル符号化方式において、符号化装置に固有の特性が存在する場合であっても、復号化信号が影響を受けている特性を打ち消すことができる符号化装
置、復号化装置及びこれらの方法を提供することである。
本発明の符号化装置は、入力信号をスケーラブル符号化する符号化装置であって、前記入力信号を符号化して第1符号化情報を生成する第1符号化手段と、前記第1符号化情報を復号化して第1復号化信号を生成する第1復号化手段と、前記第1復号化信号と調整用のインパルス応答とを畳み込むことにより前記第1復号化信号の調整を行う調整手段と、調整後の第1復号化信号と同期するように前記入力信号を遅延させる遅延手段と、遅延処理後の入力信号と前記調整後の第1復号化信号との差分である残差信号を求める加算手段と、前記残差信号を符号化して第2符号化情報を生成する第2符号化手段と、を具備する構成を採る。
本発明の符号化装置は、入力信号をスケーラブル符号化する符号化装置であって、前記入力信号に対してダウンサンプリングすることによりサンプリング周波数変換を行う周波数変換手段と、ダウンサンプリング後の入力信号を符号化して第1の符号化情報を生成する第1符号化手段と、前記第1符号化情報を復号化して第1復号化信号を生成する第1復号化手段と、前記第1復号化信号に対してアップサンプリングすることによりサンプリング周波数変換を行う周波数変換手段と、アップサンプリング後の第1復号化信号と調整用のインパルス応答とを畳み込むことにより前記アップサンプリング後の第1復号化信号の調整を行う調整手段と、調整後の第1復号化信号と同期するように前記入力信号を遅延させる遅延手段と、遅延処理後の入力信号と前記調整後の第1復号化信号との差分である残差信号を求める加算手段と、前記残差信号を符号化して第2符号化情報を生成する第2符号化手段と、を具備する構成を採る。
本発明の復号化装置は、上記の符号化装置が出力する符号化情報を復号化する復号化装置であって、前記第1符号化情報を復号化して第1復号化信号を生成する第1復号化手段と、前記第2符号化情報を復号化して第2復号化信号を生成する第2復号化手段と、前記第1復号化信号と調整用のインパルス応答とを畳み込むことにより前記第1復号化信号の調整を行う調整手段と、調整後の第1復号化信号と前記第2復号化信号とを加算する加算手段と、前記第1復号化手段が生成した第1復号化信号あるいは前記加算手段の加算結果のいずれかを選択して出力する信号選択手段と、を具備する構成を採る。
本発明の復号化装置は、上記の符号化装置が出力する符号化情報を復号化する復号化装置であって、前記第1符号化情報を復号化して第1復号化信号を生成する第1復号化手段と、前記第2符号化情報を復号化して第2復号化信号を生成する第2復号化手段と、前記第1復号化信号に対してアップサンプリングすることによりサンプリング周波数変換を行う周波数変換手段と、アップサンプリング後の第1復号化信号と調整用のインパルス応答とを畳み込むことにより前記アップサンプリング後の第1復号化信号の調整を行う調整手段と、調整後の第1復号化信号と前記第2復号化信号とを加算する加算手段と、前記第1復号化手段が生成した第1復号化信号あるいは前記加算手段の加算結果のいずれかを選択して出力する信号選択手段と、を具備する構成を採る。
本発明の符号化方法は、入力信号をスケーラブル符号化する符号化方法であって、前記入力信号を符号化して第1符号化情報を生成する第1符号化工程と、前記第1符号化情報を復号化して第1復号化信号を生成する第1復号化工程と、前記第1復号化信号と調整用のインパルス応答とを畳み込むことにより前記第1復号化信号の調整を行う調整工程と、調整後の第1復号化信号と同期するように前記入力信号を遅延させる遅延工程と、遅延処理後の入力信号と前記調整後の第1復号化信号との差分である残差信号を求める加算工程と、前記残差信号を符号化して第2符号化情報を生成する第2符号化工程と、を具備する方法を採る。
本発明の復号化方法は、上記の符号化方法によって符号化された符号化情報を復号化する復号化方法であって、前記第1符号化情報を復号化して第1復号化信号を生成する第1復号化工程と、前記第2符号化情報を復号化して第2復号化信号を生成する第2復号化工程と、前記第1復号化信号と調整用のインパルス応答とを畳み込むことにより前記第1復号化信号の調整を行う調整工程と、調整後の第1復号化信号と前記第2復号化信号とを加算する加算工程と、前記第1復号化工程で生成した第1復号化信号あるいは前記加算工程の加算結果のいずれかを選択して出力する信号選択工程と、を具備する方法を採る。
本発明によれば、出力される復号化信号の調整を行うことにより、符号化装置に固有の特性を打ち消すことができ、復号化信号の品質向上を図ることができ、上位のレイヤの符号化効率を向上させることができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、以下の実施の形態では、2階層で構成された階層的な信号符号化/復号化方法によりCELPタイプの音声符号化/復号化を行う場合について説明する。なお、階層的な信号符号化方法とは、下位レイヤでの入力信号と出力信号との差分信号を符号化し、符号化情報を出力する信号符号化方法が、上位レイヤに複数存在して階層構造を成している方法である。
(実施の形態1)
図1は、本発明の実施の形態1に係る符号化装置100および復号化装置150の主要な構成を示すブロック図である。符号化装置100は、周波数変換部101、104と、第1符号化部102と、第1復号化部103と、調整部105と、遅延部106と、加算器107と、第2符号化部108と、多重化部109と、から主に構成される。また、復号化装置150は、多重化分離部151と、第1復号化部152と、第2復号化部153と、周波数変換部154と、調整部155と、加算器156と、信号選択部157と、から主に構成される。符号化装置100から出力される符号化情報は、伝送路Mを介して、復号化装置150へ伝送される。
以下、図1に示された符号化装置100の各構成部の処理内容について説明する。周波数変換部101及び遅延部106には、音声・楽音信号である信号が入力される。周波数変換部101は、入力信号のサンプリング周波数変換を行い、ダウンサンプリング後の入力信号を第1符号化部102へ出力する。
第1符号化部102は、CELP方式の音声・楽音符号化方法を用いて、ダウンサンプ
リング後の入力信号を符号化し、符号化によって生成された第1符号化情報を第1復号化部103及び多重化部109へ出力する。
第1復号化部103は、CELP方式の音声・楽音復号化方法を用いて、第1符号化部102から出力された第1符号化情報を復号化し、復号化によって生成された第1復号化信号を周波数変換部104へ出力する。周波数変換部104は、第1復号化部103から出力された第1復号化信号のサンプリング周波数変換を行い、アップサンプリング後の第1復号化信号を調整部105へ出力する。
調整部105は、アップサンプリング後の第1復号化信号と調整用のインパルス応答とを畳み込むことによりアップサンプリング後の第1復号化信号を調整し、調整後の第1復号化信号を加算器107へ出力する。このように、調整部105において、アップサンプリング後の第1復号化信号を調整することにより、符号化装置に固有の特性を吸収することができる。なお、調整部105の内部構成及び畳み込み処理の詳細は後述する。
遅延部106は、入力された音声・楽音信号を一時的にバッファへ格納し、調整部105から出力された第1復号化信号と時間的な同期が取れるようにバッファから音声・楽音信号を取り出して加算器107へ出力する。加算器107は、遅延部106から出力された入力信号に、調整部105から出力された第1復号化信号を極性反転してから加算し、加算結果である残差信号を第2符号化部108へ出力する。
第2符号化部108は、CELP方式の音声・楽音符号化方法を用いて、加算器107から出力された残差信号を符号化し、符号化によって生成された第2符号化情報を多重化部109へ出力する。
多重化部109は、第1符号化部102から出力された第1符号化情報と第2符号化部108から出力された第2符号化情報とを多重化して多重化情報として伝送路Mへ出力する。
次に、図1に示された復号化装置150の各構成部の処理内容について説明する。多重化分離部151は、符号化装置100から伝送された多重化情報を、第1符号化情報と第2符号化情報とに分離し、第1符号化情報を第1復号化部152へ出力し、第2符号化情報を第2復号化部153へ出力する。
第1復号化部152は、多重化分離部151から第1符号化情報を入力し、CELP方式の音声・楽音復号化方法を用いて第1符号化情報を復号化し、復号化により求められる第1復号化信号を周波数変換部154及び信号選択部157へ出力する。
第2復号化部153は、多重化分離部151から第2符号化情報を入力し、CELP方式の音声・楽音復号化方法を用いて第2符号化情報を復号化し、復号化により求められる第2復号化信号を加算器156へ出力する。
周波数変換部154は、第1復号化部152から出力された第1復号化信号のサンプリング周波数変換を行い、アップサンプリング後の第1復号化信号を調整部155へ出力する。
調整部155は、調整部105と同様の方法を用いて、周波数変換部154から出力された第1復号化信号の調整を行い、調整後の第1復号化信号を加算器156へ出力する。
加算器156は、第2復号化部153から出力された第2復号化信号と調整部155か
ら出力された第1復号化信号とを加算し、加算結果である第2復号化信号を求める。
信号選択部157は、制御信号に基づいて、第1復号化部152から出力された第1復号化信号あるいは加算器156から出力された第2復号化信号のいずれか一方を後工程に出力する。
次に、周波数変換部101が、サンプリング周波数が16kHzの入力信号を8kHzへダウンサンプリングする場合を例に、符号化装置100および復号化装置150における周波数変換処理について詳細に説明する。
この場合、周波数変換部101は、まず、入力信号を低域通過フィルタへ入力し、入力信号の周波数成分が0〜4kHzとなるように高域の周波数成分(4〜8kHz)をカットする。そして、周波数変換部101は、低域通過フィルタ通過後の入力信号のサンプルを、一つ置きに取り出し、取り出したサンプルの系列をダウンサンプリング後の入力信号とする。
周波数変換部104、154は、第1復号化信号のサンプリング周波数を8kHzから16kHzへアップサンプリングする。具体的には、周波数変換部104、154は、8kHzの第1復号化信号のサンプルとサンプルとの間に、「0」の値を持つサンプルを挿入し、第1復号化信号のサンプルの系列を二倍の長さに伸長する。次に、周波数変換部104、154は、伸長後の第1復号化信号を低域通過フィルタへ入力し、第1復号化信号の周波数成分が0〜4kHzとなるように高域の周波数成分(4〜8kHz)をカットする。次に、周波数変換部104、154は、低域通過フィルタ通過後の第1復号化信号のパワーの補償を行い、補償後の第1復号化信号をアップサンプリング後の第1復号化信号とする。
パワーの補償は次の手順で行う。周波数変換部104、154は、パワー補償用の係数rを記憶している。係数rの初期値は「1」とする。また、係数rの初期値は、符号化装置によって適した値となるように変更しても良い。以下の処理は、フレーム毎に行われる。始めに、以下の式(1)により、伸長前の第1復号化信号のRMS(二乗平均平方根)と低域通過フィルタ通過後の第1復号化信号のRMS´とを求める。
Figure 0004958780
ここで、ys(i)は伸長前の第1復号化信号であり、iは0〜N/2−1の値をとる。また、ys´(i)は低域通過フィルタ通過後の第1復号化信号であり、iは0〜N−1の値をとる。また、Nはフレームの長さに相当する。次に、各i(0〜N−1)について、以下の式(2)により、係数rのアップデートと、第1復号化信号のパワー補償と、を行う。
Figure 0004958780
式(2)の上式は、係数rをアップデートする式であり、係数rの値は、現フレームでのパワー補償が行われた後、次フレームでの処理に引き継がれる。式(2)の下式は、係数rを用いてパワー補償を行う式である。式(2)により求められるys´´(i)がアップサンプリング後の第1復号化信号である。式(2)の0.99、0.01という値は、符号化装置によって適した値となるように変更しても良い。また、式(2)において、RMS´の値が「0」である場合、(RMS/RMS´)の値を求めることができるように処理を行う。例えば、RMS´の値が「0」である場合、RMS´にRMSの値を代入し、(RMS/RMS´)の値が「1」となるようにする。
次に、第1符号化部102および第2符号化部108の内部構成について図2のブロック図を用いて説明する。なお、これらの符号化部の内部構成は同一であるが、符号化の対象とする音声・楽音信号のサンプリング周波数が異なる。また、第1符号化部102および第2符号化部108は、入力される音声・楽音信号をNサンプルずつ区切り(Nは自然数)、Nサンプルを1フレームとしてフレーム毎に符号化を行う。このNの値は、第1符号化部102と第2符号化部108とで異なる場合がある。
入力信号、残差信号のいずれかの音声・楽音信号は、前処理部201に入力される。前処理部201は、DC成分を取り除くハイパスフィルタ処理や後続する符号化処理の性能改善につながるような波形整形処理やプリエンファシス処理を行い、これらの処理後の信号(Xin)をLSP分析部202および加算器205へ出力する。
LSP分析部202は、Xinを用いて線形予測分析を行い、分析結果であるLPC(線形予測係数)をLSP(Line Spectral Pairs)に変換し、LSP量子化部203へ出力する。
LSP量子化部203は、LSP分析部202から出力されたLSPの量子化処理を行い、量子化された量子化LSPを合成フィルタ204へ出力する。また、LSP量子化部203は、量子化LSPを表す量子化LSP符号(L)を多重化部214へ出力する。
合成フィルタ204は、量子化LSPに基づくフィルタ係数により、後述する加算器211から出力される駆動音源に対してフィルタ合成を行うことにより合成信号を生成し、合成信号を加算器205へ出力する。
加算器205は、合成信号の極性を反転させてXinに加算することにより誤差信号を算出し、誤差信号を聴覚重み付け部212へ出力する。
適応音源符号帳206は、過去に加算器211によって出力された駆動音源をバッファに記憶しており、パラメータ決定部213から出力される信号によって特定される切り出し位置から1フレーム分のサンプルをバッファより切り出し、適応音源ベクトルとして乗算器209へ出力する。また、適応音源符号帳206は、加算器211から駆動音源を入力する毎にバッファのアップデートを行う。
量子化利得生成部207は、パラメータ決定部213から出力される信号によって、量子化適応音源利得と量子化固定音源利得とを決定し、これらをそれぞれ乗算器209及び
乗算器210へ出力する。
固定音源符号帳208は、パラメータ決定部213から出力された信号によって特定される形状を有するベクトルを固定音源ベクトルとして乗算器210へ出力する。
乗算器209は、量子化利得生成部207から出力された量子化適応音源利得を、適応音源符号帳206から出力された適応音源ベクトルに乗じて、加算器211へ出力する。乗算器210は、量子化利得生成部207から出力された量子化固定音源利得を、固定音源符号帳208から出力された固定音源ベクトルに乗じて、加算器211へ出力する。
加算器211は、利得乗算後の適応音源ベクトルと固定音源ベクトルとをそれぞれ乗算器209と乗算器210から入力し、利得乗算後の適応音源ベクトルと固定音源ベクトルとを加算し、加算結果である駆動音源を合成フィルタ204および適応音源符号帳206へ出力する。なお、適応音源符号帳206に入力された駆動音源は、バッファに記憶される。
聴覚重み付け部212は、加算器205から出力された誤差信号に対して聴覚的な重み付けをおこない、符号化歪みとしてパラメータ決定部213へ出力する。
パラメータ決定部213は、聴覚重み付け部212から出力される符号化歪みを最小とする適応音源ラグを適応音源符号帳206から選択し、選択結果を示す適応音源ラグ符号(A)を多重化部214に出力する。ここで、「適応音源ラグ」とは、適応音源ベクトルを切り出す切り出し位置であり、詳細な説明は後述する。また、パラメータ決定部213は、聴覚重み付け部212から出力される符号化歪みを最小とする固定音源ベクトルを固定音源符号帳208から選択し、選択結果を示す固定音源ベクトル符号(F)を多重化部214に出力する。また、パラメータ決定部213は、聴覚重み付け部212から出力される符号化歪みを最小とする量子化適応音源利得と量子化固定音源利得とを量子化利得生成部207から選択し、選択結果を示す量子化音源利得符号(G)を多重化部214に出力する。
多重化部214は、LSP量子化部203から量子化LSP符号(L)を入力し、パラメータ決定部213から適応音源ラグ符号(A)、固定音源ベクトル符号(F)および量子化音源利得符号(G)を入力し、これらの情報を多重化して符号化情報として出力する。ここでは、第1符号化部102が出力する符号化情報を第1符号化情報、第2符号化部108が出力する符号化情報を第2符号化情報、とする。
次に、LSP量子化部203が量子化LSPを決定する処理を、量子化LSP符号(L)に割り当てるビット数を「8」とし、LSPをベクトル量子化する場合を例に挙げ、簡単に説明する。
LSP量子化部203は、予め作成された256種類のLSPコードベクトルlsp(l)(i)が格納されたLSPコードブックを備える。ここで、lはLSPコードベクトルに付されたインデクスであり0〜255の値をとる。また、LSPコードベクトルlsp(l)(i)はN次元のベクトルであり、iは0〜N−1の値をとる。LSP量子化部203は、LSP分析部202から出力されたLSPα(i)を入力する。ここで、LSPα(i)はN次元のベクトルであり、iは0〜N−1の値をとる。
次に、LSP量子化部203は、式(3)によりLSPα(i)とLSPコードベクトルlsp(l)(i)との二乗誤差erを求める。
Figure 0004958780
次に、LSP量子化部203は、全てのlについて二乗誤差erを求め、二乗誤差erが最小となるlの値(lmin)を決定する。次に、LSP量子化部203は、lminを量子化LSP符号(L)として多重化部214へ出力し、また、lsp(lmin)(i)を量子化LSPとして合成フィルタ204へ出力する。
このように、LSP量子化部203によって求められるlsp(lmin)(i)が「量子化LSP」である。
次に、パラメータ決定部213が適応音源ラグを決定する処理について図3を用いて説明する。
この図3において、バッファ301は適応音源符号帳206が備えるバッファであり、位置302は適応音源ベクトルの切り出し位置であり、ベクトル303は、切り出された適応音源ベクトルである。また、数値「41」、「296」は、切り出し位置302を動かす範囲の下限と上限とに対応している。
切り出し位置302を動かす範囲は、適応音源ラグを表す符号(A)に割り当てるビット数を「8」とする場合、「256」の長さの範囲(例えば、41〜296)に設定することができる。また、切り出し位置302を動かす範囲は、任意に設定することができる。
パラメータ決定部213は、切り出し位置302を設定された範囲内で動かし、順次、適応音源符号帳206に切り出し位置302を指示する。次に、適応音源符号帳206は、パラメータ決定部213により指示された切り出し位置302を用いて、適応音源ベクトル303をフレームの長さだけ切り出し、切り出した適応音源ベクトルを乗算器209に出力する。次に、パラメータ決定部213は、全ての切り出し位置302で適応音源ベクトル303を切り出した場合について、聴覚重み付け部212から出力される符号化歪みを求め、符号化歪みが最小となる切り出し位置302を決定する。
このように、パラメータ決定部213によって求められるバッファの切り出し位置302が「適応音源ラグ」である。
次に、パラメータ決定部213が固定音源ベクトルを決定する処理について図4を用いて説明する。なお、ここでは、固定音源ベクトル符号(F)に割り当てるビット数を「12」とする場合を例にとって説明する。
図4において、トラック401、トラック402、トラック403は、それぞれ単位パルス(振幅値が1)を1本生成する。また、乗算器404、乗算器405、乗算器406は、それぞれトラック401〜403で生成される単位パルスに極性を付する。加算器407は、生成された3本の単位パルスを加算する加算器であり、ベクトル408は、3本の単位パルスから構成される「固定音源ベクトル」である。
各トラックは単位パルスを生成できる位置が異なっており、図4においては、トラック
401は{0,3,6,9,12,15,18,21}の8箇所のうちのいずれかに、トラック402は{1,4,7,10,13,16,19,22}の8箇所のうちのいずれかに、トラック403は{2,5,8,11,14,17,20,23}の8箇所のうちのいずれかに、それぞれ単位パルスを1本ずつ立てる構成となっている。
次に、生成された単位パルスはそれぞれ乗算器404〜406により極性が付され、加算器407により3本の単位パルスが加算され、加算結果である固定音源ベクトル408が構成される。
この例では、各単位パルスに対して位置が8通り、極性が正負の2通りであるので、位置情報3ビット、極性情報1ビット、が各単位パルスを表現するのに用いられる。したがって、合計12ビットの固定音源符号帳となる。パラメータ決定部213は、3本の単位パルスの生成位置と極性とを動かし、順次、生成位置と極性とを固定音源符号帳208に指示する。次に、固定音源符号帳208は、パラメータ決定部213により指示された生成位置と極性とを用いて固定音源ベクトル408を構成して、構成された固定音源ベクトル408を乗算器210に出力する。次に、パラメータ決定部213は、全ての生成位置と極性との組み合わせについて、聴覚重み付け部212から出力される符号化歪みを求め、符号化歪みが最小となる生成位置と極性との組み合わせを決定する。次に、パラメータ決定部213は、符号化歪みが最小となる生成位置と極性との組み合わせを表す固定音源ベクトル符号(F)を多重化部214に出力する。
次に、パラメータ決定部213が、量子化利得生成部207から生成される量子化適応音源利得と量子化固定音源利得とを決定する処理を、量子化音源利得符号(G)に割り当てるビット数を「8」とする場合を例に挙げ、簡単に説明する。量子化利得生成部207は、予め作成された256種類の音源利得コードベクトルgain(k)(i)が格納された音源利得コードブックを備える。ここで、kは音源利得コードベクトルに付されたインデクスであり0〜255の値をとる。また、音源利得コードベクトルgain(k)(i)は2次元のベクトルであり、iは0〜1の値をとる。パラメータ決定部213は、kの値を0から255まで、順次、量子化利得生成部207に指示する。量子化利得生成部207は、パラメータ決定部213により指示されたkを用いて音源利得コードブックから音源利得コードベクトルgain(k)(i)を選択し、gain(k)(0)を量子化適応音源利得として乗算器209に出力し、また、gain(k)(1)を量子化固定音源利得として乗算器210に出力する。
このように、量子化利得生成部207によって求められるgain(k)(0)が「量子化適応音源利得」であり、gain(k)(1)が「量子化固定音源利得」である。
パラメータ決定部213は、全てのkについて、聴覚重み付け部212より出力される符号化歪みを求め、符号化歪みが最小となるkの値(kmin)を決定する。次に、パラメータ決定部213は、kminを量子化音源利得符号(G)として多重化手段214に出力する。
次に、第1復号化部103、第1復号化部152および第2復号化部153の内部構成について図5のブロック図を用いて説明する。なお、これらの復号化部の内部構成は同一である。
第1符号化情報、第2符号化情報のいずれかの符号化情報は、多重化分離部501に入力される。入力された符号化情報は、多重化分離部501によって個々の符号(L、A、G、F)に分離される。分離された量子化LSP符号(L)はLSP復号化部502に出力され、分離された適応音源ラグ符号(A)は適応音源符号帳505に出力され、分離された量子化音源利得符号(G)は量子化利得生成部506に出力され、分離された固定音
源ベクトル符号(F)は固定音源符号帳507へ出力される。
LSP復号化部502は、多重化分離部501から出力された量子化LSP符号(L)から量子化LSPを復号化し、復号化した量子化LSPを合成フィルタ503へ出力する。
適応音源符号帳505は、多重化分離部501から出力された適応音源ラグ符号(A)で指定される切り出し位置から1フレーム分のサンプルをバッファより切り出し、切り出したベクトルを適応音源ベクトルとして乗算器508へ出力する。また、適応音源符号帳505は、加算器510から駆動音源を入力する毎にバッファのアップデートを行う。
量子化利得生成部506は、多重化分離部501から出力された量子化音源利得符号(G)で指定される量子化適応音源利得と量子化固定音源利得とを復号化し、量子化適応音源利得を乗算器508へ出力し、量子化固定音源利得を乗算器509へ出力する。
固定音源符号帳507は、多重化分離部501から出力された固定音源ベクトル符号(F)で指定される固定音源ベクトルを生成し、乗算器509へ出力する。
乗算器508は、適応音源ベクトルに量子化適応音源利得を乗算して、加算器510へ出力する。乗算器509は、固定音源ベクトルに量子化固定音源利得を乗算して、加算器510へ出力する。
加算器510は、乗算器508、509から出力された利得乗算後の適応音源ベクトルと固定音源ベクトルとの加算を行い、駆動音源を生成し、駆動音源を合成フィルタ503及び適応音源符号帳505に出力する。なお、適応音源符号帳505に入力された駆動音源は、バッファに記憶される。
合成フィルタ503は、加算器510から出力された駆動音源と、LSP復号化部502によって復号化されたフィルタ係数とを用いてフィルタ合成を行い、合成信号を後処理部504へ出力する。
後処理部504は、合成フィルタ503から出力された合成信号に対して、ホルマント強調やピッチ強調といったような音声の主観的な品質を改善する処理や、定常雑音の主観的品質を改善する処理などを施し、復号化信号として出力する。ここでは、第1復号化部103および第1復号化部152が出力する復号化信号を第1復号化信号、第2復号化信号153が出力する復号化信号を第2復号化信号とする。
次に、調整部105および調整部155の内部構成について図6のブロック図を用いて説明する。
格納部603は、後述する学習方法により前以て求められる調整用インパルス応答h(i)を格納している。
第1復号化信号は、記憶部601に入力される。以下、第1復号化信号をy(i)と表すこととする。第1復号化信号y(i)はN次元のベクトルであり、iはn〜n+N−1の値をとる。ここで、Nはフレームの長さに相当する。また、nは各フレームの先頭に位置するサンプルであり、nはNの整数倍に相当する。
記憶部601は、過去に周波数変換部104、154から出力された第1復号化信号を記憶するバッファを備える。以下、記憶部601が備えるバッファをybuf(i)と表すこと
とする。バッファybuf(i)は長さがN+W−1のバッファであり、iは0〜N+W−2の値をとる。ここで、Wは畳み込み部602が畳み込みを行う際の窓の長さに相当する。記憶部601は、式(4)により、入力した第1復号化信号y(i)を用いてバッファの更新を行う。
Figure 0004958780
式(4)の更新により、バッファybuf(0)からybuf(W-2)には、更新前のバッファの一部ybuf(N)からybuf(N+W-2)が格納され、バッファybuf(W-1)からybuf(N+W-2)には、入力の第1復号化信号y(n)〜y(n+N-1)が格納される。次に、記憶部601は、更新後のバッファybuf(i)を全て畳み込み部602へ出力する。
畳み込み部602は、記憶部601からバッファybuf(i)を入力し、格納部603から調整用インパルス応答h(i)を入力する。調整用インパルス応答h(i)はW次元のベクトルであり、iは0〜W−1の値をとる。次に、畳み込み部602は、式(5)の畳み込みにより、第1復号化信号の調整を行い、調整後の第1復号化信号を求める。
Figure 0004958780
このように、調整後の第1復号化信号ya(n-D+i)は、バッファybuf(i)からybuf(i+W-1)と調整用インパルス応答h(0)〜h(W-1)とを畳み込むことによって求めることができる。調整用インパルス応答h(i)は、調整を行うことにより、調整後の第1復号化信号と入力信号との誤差が小さくなるように、学習されている。ここで、求められる調整後の第1復号化信号は、ya(n-D)からya(n-D+N-1)であり、記憶部601に入力される第1復号化信号y(n)〜y(n+N-1)に比べ、時間(サンプル数)にしてDの遅延が生じていることとなる。次に、畳み込み部602は、求めた第1復号化信号を出力する。
次に、調整用インパルス応答h(i)を前以て学習により求める方法を、説明する。始めに、学習用の音声・楽音信号を用意し、これを符号化装置100へ入力する。ここで、学習用の音声・楽音信号をx(i)とする。次に、学習用の音声・楽音信号の符号化/復号化を行い、周波数変換部104から出力される第1復号化信号y(i)をフレーム毎に調整部105へ入力する。次に、記憶部601において、式(4)によるバッファの更新をフレーム毎に行う。バッファに格納された第1復号化信号と未知の調整用インパルス応答h(i)とを畳み込んだ信号と、学習用の音声・楽音信号x(i)とのフレーム単位での二乗誤差E(n)は式(6)のようになる。
Figure 0004958780
ここで、Nはフレームの長さに相当する。また、nは各フレームの先頭に位置するサン
プルであり、nはNの整数倍になる。また、Wは畳み込みを行う際の窓の長さに相当する。
フレームの総数がRである場合、フレーム毎の二乗誤差E(n)の総和Eaは、式(7)のようになる。
Figure 0004958780
ここで、バッファybufk(i)は、フレームkでのバッファybuf(i)である。バッファybuf(i)は、フレーム毎に更新されるので、フレーム毎にバッファの内容は異なる。また、x(-D)〜x(-1)の値は全て「0」とする。また、バッファybuf(0)からybuf(n+W-2)の初期値は全て「0」とする。
調整用インパルス応答h(i)を求めるには、式(7)の二乗誤差の総和Eaが最小となるh(i)を求める。即ち、式(7)の全てのh(J)について、δEa/δh(j)を満たすh(j)を求める。式(8)は、δEa/δh(j)=0から導出される連立方程式である。式(8)の連立方程式を満たすh(j)を求めることにより、学習された調整用インパルス応答h(i)を求めることができる。
Figure 0004958780
次に、式(9)によりW次元のベクトルVと、W次元のベクトルHを定義する。
Figure 0004958780
また、式(10)によりW×Wの行列Yを定義すると、式(8)は式(11)のように表すことができる。
Figure 0004958780
Figure 0004958780
従って、調整用インパルス応答h(i)を求めるには、式(12)によりベクトルHを求める。
Figure 0004958780
このように、学習用の音声・楽音信号を用いて学習を行うことにより、調整用インパルス応答h(i)を求めることができる。調整用インパルス応答h(i)は、第1復号化信号の調整を行うことにより、調整後の第1復号化信号と入力信号との二乗誤差が小さくなるように、学習されている。調整部105において、以上の方法により求めた調整用インパルス応答h(i)と周波数変換部104から出力される第1復号化信号とを畳み込むことにより、符号化装置100に固有の特性を打ち消し、第1復号化信号と入力信号との二乗誤差をより小さくすることができる。
次に、遅延部106が、入力信号を遅延させて出力する処理を、説明する。遅延部106は、入力された音声・楽音信号をバッファへ格納する。次に、遅延部106は、調整部105から出力された第1復号化信号と時間的な同期が取れるようにバッファから音声・楽音信号を取り出し、これを入力信号として加算器107へ出力する。具体的には、入力された音声・楽音信号がx(n)〜x(n+N-1)である場合、時間(サンプル数)にしてDの遅延が生じている信号をバッファから取り出し、取り出した信号x(n-D)〜x(n-D+N-1)を入力信号として加算器107へ出力する。
なお、本実施の形態では、符号化装置100が2つの符号化部を有する場合を例にとって説明したが、符号化部の個数はこれに限定されず、3つ以上であっても良い。
また、本実施の形態では、復号化装置150が2つの復号化部を有する場合を例にとっ
て説明したが、復号化部の個数はこれに限定されず、3つ以上であっても良い。
また、本実施の形態では、固定音源符号帳208が生成する固定音源ベクトルが、パルスにより形成されている場合について説明したが、固定音源ベクトルを形成するパルスが拡散パルスである場合についても本発明は適用することができ、本実施の形態と同様の作用・効果を得ることができる。ここで、拡散パルスとは、単位パルスではなく、数サンプルに渡って特定の形状を有するパルス状の波形である。
また、本実施の形態では、符号化部/復号化部がCELPタイプの音声・楽音符号化/復号化方法である場合について説明したが、符号化部/復号化部がCELPタイプ以外の音声・楽音符号化/復号化方法(例えば、パルス符号変調、予測符号化、ベクトル量子化、ボコーダ)である場合についても本発明は適用することができ、本実施の形態と同様の作用・効果を得ることができる。また、音声・楽音符号化/復号化方法が、各々の符号化部/復号化部において異なる音声・楽音符号化/復号化方法である場合についても本発明は適用することができ、本実施の形態と同様の作用・効果を得ることができる。
(実施の形態2)
図7は、上記実施の形態1で説明した符号化装置を含む、本発明の実施の形態2に係る音声・楽音送信装置の構成を示すブロック図である。
音声・楽音信号701は、入力装置702によって電気的信号に変換され、A/D変換装置703に出力される。A/D変換装置703は、入力装置702から出力された(アナログ)信号をディジタル信号に変換し、音声・楽音符号化装置704へ出力する。音声・楽音符号化装置704は、図1に示した符号化装置100を実装し、A/D変換装置703から出力されたディジタル音声・楽音信号を符号化し、符号化情報をRF変調装置705へ出力する。RF変調装置705は、音声・楽音符号化装置704から出力された符号化情報を電波等の伝播媒体に載せて送出するための信号に変換し送信アンテナ706へ出力する。送信アンテナ706はRF変調装置705から出力された出力信号を電波(RF信号)として送出する。なお、図中のRF信号707は送信アンテナ706から送出された電波(RF信号)を表す。
図8は、上記実施の形態1で説明した復号化装置を含む、本発明の実施の形態2に係る音声・楽音受信装置の構成を示すブロック図である。
RF信号801は、受信アンテナ802によって受信されRF復調装置803に出力される。なお、図中のRF信号801は、受信アンテナ802に受信された電波を表し、伝播路において信号の減衰や雑音の重畳がなければRF信号707と全く同じものになる。
RF復調装置803は、受信アンテナ802から出力されたRF信号から符号化情報を復調し、音声・楽音復号化装置804へ出力する。音声・楽音復号化装置804は、図1に示した復号化装置150を実装し、RF復調装置803から出力された符号化情報から音声・楽音信号を復号し、D/A変換装置805へ出力する。D/A変換装置805は、音声・楽音復号化装置804から出力されたディジタル音声・楽音信号をアナログの電気的信号に変換し出力装置806へ出力する。出力装置806は電気的信号を空気の振動に変換し音波として人間の耳に聴こえるように出力する。なお、図中、参照符号807は出力された音波を表す。
無線通信システムにおける基地局装置および通信端末装置に、上記のような音声・楽音信号送信装置および音声・楽音信号受信装置を備えることにより、高品質な出力信号を得ることができる。
このように、本実施の形態によれば、本発明に係る符号化装置および復号化装置を音声・楽音信号送信装置および音声・楽音信号受信装置に実装することができる。
本発明に係る符号化装置および復号化装置は、上記の実施の形態1、2に限定されず、種々変更して実施することが可能である。
本発明に係る符号化装置および復号化装置は、移動体通信システムにおける移動端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する移動端末装置および基地局装置を提供することができる。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
本明細書は、2005年5月11日出願の特願2005−138151に基づく。この内容はすべてここに含めておく。
本発明は、符号化装置に固有の特性が存在する場合であっても、品質の良い復号化音声信号を得る効果を有し、音声・楽音信号を符号化して伝送する通信システムの符号化装置および復号化装置に用いるに好適である。
本発明の実施の形態1に係る符号化装置および復号化装置の主要な構成を示すブロック図 本発明の実施の形態1に係る第1符号化部、第2符号化部の内部構成を示すブロック図 適応音源ラグを決定する処理について簡単に説明するための図 固定音源ベクトルを決定する処理について簡単に説明するための図 本発明の実施の形態1に係る第1復号化部、第2復号化部の内部構成を示すブロック図 本発明の実施の形態1に係る調整部の内部構成を示すブロック図 本発明の実施の形態2に係る音声・楽音送信装置の構成を示すブロック図 本発明の実施の形態2に係る音声・楽音受信装置の構成を示すブロック図

Claims (8)

  1. 入力信号をスケーラブル符号化する符号化装置であって、
    前記入力信号に対してダウンサンプリングすることによりサンプリング周波数変換を行う周波数変換手段と、
    ダウンサンプリング後の入力信号を符号化して第1の符号化情報を生成する第1符号化手段と、
    前記第1符号化情報を復号化して第1復号化信号を生成する第1復号化手段と、
    前記第1復号化信号に対してアップサンプリングすることによりサンプリング周波数変換を行う周波数変換手段と、
    アップサンプリング後の第1復号化信号と調整用のインパルス応答とを畳み込むことにより前記アップサンプリング後の第1復号化信号の調整を行う調整手段と、
    調整後の第1復号化信号と同期するように前記入力信号を遅延させる遅延手段と、
    遅延処理後の入力信号と前記調整後の第1復号化信号との差分である残差信号を求める加算手段と、
    前記残差信号を符号化して第2符号化情報を生成する第2符号化手段と、
    を具備する符号化装置。
  2. 請求項に記載の符号化装置が出力する符号化情報を復号化する復号化装置であって、
    前記第1符号化情報を復号化して第1復号化信号を生成する第1復号化手段と、
    前記第2符号化情報を復号化して第2復号化信号を生成する第2復号化手段と、
    前記第1復号化信号に対してアップサンプリングすることによりサンプリング周波数変換を行う周波数変換手段と、
    アップサンプリング後の第1復号化信号と調整用のインパルス応答とを畳み込むことにより前記アップサンプリング後の第1復号化信号の調整を行う調整手段と、
    調整後の第1復号化信号と前記第2復号化信号とを加算する加算手段と、
    前記第1復号化手段が生成した第1復号化信号あるいは前記加算手段の加算結果のいずれかを選択して出力する信号選択手段と、
    を具備する復号化装置。
  3. 請求項1に記載の符号化装置を具備する基地局装置。
  4. 請求項に記載の復号化装置を具備する基地局装置。
  5. 請求項1に記載の符号化装置を具備する通信端末装置。
  6. 請求項に記載の復号化装置を具備する通信端末装置。
  7. 入力信号をスケーラブル符号化する符号化方法であって、
    前記入力信号に対してダウンサンプリングすることによりサンプリング周波数変換を行う周波数変換工程と、
    ダウンサンプリング後の入力信号を符号化して第1の符号化情報を生成する第1符号化工程と、
    前記第1符号化情報を復号化して第1復号化信号を生成する第1復号化手段と、
    前記第1復号化信号に対してアップサンプリングすることによりサンプリング周波数変換を行う周波数変換工程と、
    アップサンプリング後の第1復号化信号と調整用のインパルス応答とを畳み込むことにより前記アップサンプリング後の第1復号化信号の調整を行う調整工程と、
    調整後の第1復号化信号と同期するように前記入力信号を遅延させる遅延工程と、
    遅延処理後の入力信号と前記調整後の第1復号化信号との差分である残差信号を求める加算工程と、
    前記残差信号を符号化して第2符号化情報を生成する第2符号化工程と、
    を具備する符号化方法。
  8. 請求項7に記載の符号化方法によって符号化された符号化情報を復号化する復号化方法であって、
    前記第1符号化情報を復号化して第1復号化信号を生成する第1復号化工程と、
    前記第2符号化情報を復号化して第2復号化信号を生成する第2復号化工程と、
    前記第1復号化信号に対してアップサンプリングすることによりサンプリング周波数変換を行う周波数変換工程と、
    アップサンプリング後の第1復号化信号と調整用のインパルス応答とを畳み込むことにより前記アップサンプリング後の第1復号化信号の調整を行う調整工程と、
    調整後の第1復号化信号と前記第2復号化信号とを加算する加算工程と、
    前記第1復号化工程で生成した第1復号化信号あるいは前記加算工程の加算結果のいずれかを選択して出力する信号選択工程と、
    を具備する復号化方法。
JP2007528236A 2005-05-11 2006-04-28 符号化装置、復号化装置及びこれらの方法 Expired - Fee Related JP4958780B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007528236A JP4958780B2 (ja) 2005-05-11 2006-04-28 符号化装置、復号化装置及びこれらの方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005138151 2005-05-11
JP2005138151 2005-05-11
PCT/JP2006/308940 WO2006120931A1 (ja) 2005-05-11 2006-04-28 符号化装置、復号化装置及びこれらの方法
JP2007528236A JP4958780B2 (ja) 2005-05-11 2006-04-28 符号化装置、復号化装置及びこれらの方法

Publications (2)

Publication Number Publication Date
JPWO2006120931A1 JPWO2006120931A1 (ja) 2008-12-18
JP4958780B2 true JP4958780B2 (ja) 2012-06-20

Family

ID=37396440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007528236A Expired - Fee Related JP4958780B2 (ja) 2005-05-11 2006-04-28 符号化装置、復号化装置及びこれらの方法

Country Status (7)

Country Link
US (1) US7978771B2 (ja)
EP (1) EP1881488B1 (ja)
JP (1) JP4958780B2 (ja)
CN (1) CN101176148B (ja)
BR (1) BRPI0611430A2 (ja)
DE (1) DE602006018129D1 (ja)
WO (1) WO2006120931A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
WO2008023682A1 (fr) * 2006-08-22 2008-02-28 Panasonic Corporation Décodeur de sortie pondéré, décodeur itératif et procédé de calcul de valeur de décision pondérée
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
MY146431A (en) * 2007-06-11 2012-08-15 Fraunhofer Ges Forschung Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal
CN101989429B (zh) 2009-07-31 2012-02-01 华为技术有限公司 转码方法、装置、设备以及***
AU2015200065B2 (en) * 2010-07-02 2016-10-20 Dolby International Ab Post filter, decoder system and method of decoding
KR101730356B1 (ko) 2010-07-02 2017-04-27 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
JP5492139B2 (ja) * 2011-04-27 2014-05-14 富士フイルム株式会社 画像圧縮装置、画像伸長装置、方法、及びプログラム
KR102138320B1 (ko) * 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
EP2806423B1 (en) * 2012-01-20 2016-09-14 Panasonic Intellectual Property Corporation of America Speech decoding device and speech decoding method
KR102318581B1 (ko) * 2014-06-10 2021-10-27 엠큐에이 리미티드 오디오 신호의 디지털 캡슐화
CN112786001B (zh) * 2019-11-11 2024-04-09 北京地平线机器人技术研发有限公司 语音合成模型训练方法、语音合成方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003081196A1 (en) * 2002-03-26 2003-10-02 Nec Corporation Hierarchical lossless encoding/decoding method, hierarchical lossless encoding method, hierarchical lossless decoding method, its apparatus, and program
JP2004102186A (ja) * 2002-09-12 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1085466C (zh) * 1993-09-14 2002-05-22 株式会社金星社 图象解码器中包括半象素单元运动补偿装置的b帧处理装置
JPH1097295A (ja) 1996-09-24 1998-04-14 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
EP2224597B1 (en) * 1997-10-22 2011-12-21 Panasonic Corporation Multistage vector quantization for speech encoding
WO1999065017A1 (en) * 1998-06-09 1999-12-16 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus and speech decoding apparatus
JP2000305599A (ja) * 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
AUPQ941600A0 (en) * 2000-08-14 2000-09-07 Lake Technology Limited Audio frequency response processing sytem
CN1639984B (zh) * 2002-03-08 2011-05-11 日本电信电话株式会社 数字信号编码方法、解码方法、编码设备、解码设备
WO2003091989A1 (en) * 2002-04-26 2003-11-06 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
CA2524243C (en) * 2003-04-30 2013-02-19 Matsushita Electric Industrial Co. Ltd. Speech coding apparatus including enhancement layer performing long term prediction
EP1688917A1 (en) * 2003-12-26 2006-08-09 Matsushita Electric Industries Co. Ltd. Voice/musical sound encoding device and voice/musical sound encoding method
JP3598111B2 (ja) 2004-04-09 2004-12-08 三菱電機株式会社 広帯域音声復元装置
JP4445328B2 (ja) * 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003081196A1 (en) * 2002-03-26 2003-10-02 Nec Corporation Hierarchical lossless encoding/decoding method, hierarchical lossless encoding method, hierarchical lossless decoding method, its apparatus, and program
JP2004102186A (ja) * 2002-09-12 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法

Also Published As

Publication number Publication date
DE602006018129D1 (de) 2010-12-23
EP1881488A1 (en) 2008-01-23
JPWO2006120931A1 (ja) 2008-12-18
CN101176148B (zh) 2011-06-15
US7978771B2 (en) 2011-07-12
US20090016426A1 (en) 2009-01-15
EP1881488B1 (en) 2010-11-10
CN101176148A (zh) 2008-05-07
WO2006120931A1 (ja) 2006-11-16
BRPI0611430A2 (pt) 2010-11-23
EP1881488A4 (en) 2008-12-10

Similar Documents

Publication Publication Date Title
JP4958780B2 (ja) 符号化装置、復号化装置及びこれらの方法
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
US7636055B2 (en) Signal decoding apparatus and signal decoding method
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
EP1768105B1 (en) Speech coding
WO2004097796A1 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP4445328B2 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
CN101006495A (zh) 语音编码装置、语音解码装置、通信装置以及语音编码方法
WO2003091989A1 (en) Coding device, decoding device, coding method, and decoding method
JP2004102186A (ja) 音響符号化装置及び音響符号化方法
JP2003223189A (ja) 音声符号変換方法及び装置
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP4287840B2 (ja) 符号化装置
JP2002169595A (ja) 固定音源符号帳及び音声符号化/復号化装置
JP2005215502A (ja) 符号化装置、復号化装置、およびこれらの方法
JPH0537393A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120319

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4958780

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees