JP5714002B2 - 符号化装置、復号装置、符号化方法及び復号方法 - Google Patents

符号化装置、復号装置、符号化方法及び復号方法 Download PDF

Info

Publication number
JP5714002B2
JP5714002B2 JP2012511525A JP2012511525A JP5714002B2 JP 5714002 B2 JP5714002 B2 JP 5714002B2 JP 2012511525 A JP2012511525 A JP 2012511525A JP 2012511525 A JP2012511525 A JP 2012511525A JP 5714002 B2 JP5714002 B2 JP 5714002B2
Authority
JP
Japan
Prior art keywords
encoding
subbands
subband
decoding
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012511525A
Other languages
English (en)
Other versions
JPWO2011132368A1 (ja
Inventor
智史 山梨
智史 山梨
押切 正浩
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Priority to JP2012511525A priority Critical patent/JP5714002B2/ja
Publication of JPWO2011132368A1 publication Critical patent/JPWO2011132368A1/ja
Application granted granted Critical
Publication of JP5714002B2 publication Critical patent/JP5714002B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0006Tree or treillis structures; Delayed decisions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、信号を符号化して伝送する通信システムに用いられる符号化装置、復号装置、符号化方法及び復号方法に関する。
インターネット通信に代表されるパケット通信システム又は移動通信システム等で音声信号又は楽音信号を伝送する場合、音声信号又は楽音信号の伝送効率を高めるために、圧縮技術又は符号化技術がよく使われる。また、近年では、単に低ビットレートで音声信号又は楽音信号を符号化するという一方で、より広帯域の音声信号又は楽音信号を高品質に符号化する技術に対するニーズが高まっている。
このようなニーズに対して、音声信号又は楽音信号の符号化において、符号化情報の一部からでも音声信号又は楽音信号を復号することが可能であり、パケット損失が発生するような状況においても音質劣化を抑制することができるスケーラブル符号化技術が開発されている(非特許文献1)。例えば、非特許文献1には、符号化ビットレートが16kbps〜24kbpsである時、入力信号が音声信号と判定された場合に、一定時間分の入力信号を変換して得られるスペクトルデータを複数のサブベクトルに分割し、各サブベクトルに対してマルチレート符号化する技術「EAVQ(Embedded Algebraic Vector Quantization)」が開示されている。なお、上記非特許文献1に開示されているEAVQに関連する技術は非特許文献2、非特許文献3及び特許文献1にも開示されている。
特表2005−528839号公報
ITU-T:G.718; Frame error robust narrowband and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s. ITU-T Recommendation G.718(2008) Stephane Ragot, Bruno Bessette, and Roch Lefebvre, "Low-complexity Multi-rate Lattice Vector Quantization with Application to Wideband TCX Speech Coding", ICASSP 2004 Minjie Xie and Jean-Pierre Adoul, "Embedded Algebraic Vector Quantizers (EAVQ) with Application to Wideband Speech Coding", IEEE 1996
しかしながら、上記非特許文献1に開示された符号化装置及び復号装置の構成では、一部のビットレートで符号化/復号する場合において、復号信号の品質が不十分であるという問題点がある。以下、この問題点について説明する。
上記非特許文献1に開示された符号化装置及び復号装置では、入力信号が音声信号であると判定された場合、16kbps〜24kbpsの符号化ビットレートにおいて、EAVQという符号化方式が適用される。このとき、EAVQに利用できるビットレートは、コアとなる符号化レイヤ(レイヤ1)及び第1拡張レイヤ(レイヤ2)のビットレートを除いた、4kbps〜12kbpsである。より詳細には、符号化装置は、レイヤ3にて4kbpsのビットレートで符号化を行い、レイヤ4にて8kbpsのビットレートで符号化を行う。符号化ビットレートが32kbpsの時に、レイヤ5ではさらに8kbpsのビットレートで符号化が行われるが、この符号化レイヤについては本発明とは本質的に関係しないため、以降の説明では省略する。
ここで、上記非特許文献1では、符号化装置側でレイヤ3及びレイヤ4の符号化処理をまとめて行い、合計12kbpsのビットレートに相当する符号化パラメータを復号装置に伝送し、復号装置側において所望のビットレートで復号するという処理を行う。このとき、伝送される符号化パラメータのうち、どの部分がレイヤ3の符号化パラメータ(4kbps)に相当し、どの部分がレイヤ4の符号化パラメータ(8kbps)に相当するかの区別はされていない。このため、復号装置は、受信した符号化パラメータ(12kbps)のうち、先頭部分から所望のビットレート(4kbps又は12kbps)分のみを単純に復号処理する構成になっている。よって、例えば、復号装置は、レイヤ1からレイヤ3までのビットレート(12kbps)で復号する場合には、レイヤ3及びレイヤ4の符号化パラメータのうち聴感的に重要な特定の部分を選択して復号処理していないので、この復号条件では復号信号の品質が十分ではないと言える。
本発明の目的は、非特許文献1のようなスケーラブル符号化/復号方法において、符号化装置側で聴感的に重要な特定の符号化パラメータを部分的に選択し、符号化パラメータに前記聴感的な重要度を反映させることにより、一部のビットレートで復号する際に復号信号の品質を改善するスケーラブル符号化/復号方法を提供することである。
本発明の第1の態様に係る符号化装置は、符号化処理をまとめて行う複数の符号化レイヤを有する符号化装置であって、前記複数の符号化レイヤに入力されるスペクトルデータを分割して複数のサブバンドを生成し、前記複数のサブバンドに対して近傍探索を行うことにより、前記複数のサブバンドのスペクトルのラティスベクトルを算出する探索手段と、前記ラティスベクトルを用いて、前記複数のサブバンド毎にマルチレートインデキシングを行い、前記複数のサブバンド毎のマルチレートインデキシングの結果を示すインデックス情報を生成する符号化手段と、前記インデックス情報において前記複数のサブバンド毎に割り当てられる符号化ビット数、及び、前記複数のサブバンド毎のエネルギであるサブバンドエネルギを用いて、前記複数のサブバンドのうち、前記符号化ビット数の合計が予め設定された値以下となるサブバンドの選択範囲であり、かつ、前記サブバンドエネルギの合計が最大となる前記サブバンドの選択範囲を、前記複数の符号化レイヤにおける、特定サブバンド群として決定する選択手段と、を備える。
本発明の第2の態様に係る復号装置は、符号化処理をまとめて行う複数の符号化レイヤを有する符号化装置からの信号を復号する復号装置であって、前記符号化装置で生成された、前記複数の符号化レイヤに入力されたスペクトルデータを分割して生成された複数のサブバンドに対する近傍探索を行うことにより得られたラティスベクトルを用いた、前記複数のサブバンド毎のマルチレートインデキシングを行って得られた結果を示すインデックス情報と、前記複数のサブバンド毎に割り当てられた符号化ビット、及び、前記複数のサブバンド毎のエネルギであるサブバンドエネルギを用いて、前記複数のサブバンドのうち、前記マルチレートインデキシングにおいて前記複数のサブバンド毎に割り当てられた符号化ビット数の合計が予め設定された値以下となるサブバンドの選択範囲であり、かつ、前記複数のサブバンド毎のエネルギであるサブバンドエネルギの合計が最大となる前記サブバンドの選択範囲である、特定サブバンド群を示す帯域情報と、を受信する受信手段と、前記複数の符号化レイヤのうち一部の符号化レイヤのみに対して復号処理が行われる場合、前記インデックス情報のうち、前記帯域情報に示される前記特定サブバンド群に対応する部分のみを復号して復号信号を生成する復号手段と、を備える。
本発明の第3の態様に係る符号化方法は、符号化処理をまとめて行う複数の符号化レイヤを有する符号化装置における符号化方法であって、前記複数の符号化レイヤに入力されるスペクトルデータを分割して複数のサブバンドを生成し、前記複数のサブバンドに対して近傍探索を行うことにより、前記複数のサブバンドのスペクトルのラティスベクトルを算出する探索ステップと、前記ラティスベクトルを用いて、前記複数のサブバンド毎にマルチレートインデキシングを行い、前記複数のサブバンド毎のマルチレートインデキシングの結果を示すインデックス情報を生成する符号化ステップと、前記インデックス情報において前記複数のサブバンド毎に割り当てられる符号化ビット数、及び、前記複数のサブバンド毎のエネルギであるサブバンドエネルギを用いて、前記複数のサブバンドのうち、前記符号化ビット数の合計が予め設定された値以下となるサブバンドの選択範囲であり、かつ、前記サブバンドエネルギの合計が最大となる前記サブバンドの選択範囲を、前記複数の符号化レイヤにおける、特定サブバンド群として決定する選択ステップと、を備える。
本発明の第4の態様に係る復号方法は、符号化処理をまとめて行う複数の符号化レイヤを有する符号化装置からの信号を復号する復号装置における復号方法であって、前記符号化装置で生成された、前記複数の符号化レイヤに入力されたスペクトルデータを分割して生成された複数のサブバンドに対する近傍探索を行うことにより得られたラティスベクトルを用いた、前記複数のサブバンド毎のマルチレートインデキシングを行って得られた結果を示すインデックス情報と、前記複数のサブバンド毎に割り当てられた符号化ビット、及び、前記複数のサブバンド毎のエネルギであるサブバンドエネルギを用いて、前記複数のサブバンドのうち、前記マルチレートインデキシングにおいて前記複数のサブバンド毎に割り当てられた符号化ビット数の合計が予め設定された値以下となるサブバンドの選択範囲であり、かつ、前記複数のサブバンド毎のエネルギであるサブバンドエネルギの合計が最大となる前記サブバンドの選択範囲である、特定サブバンド群を示す帯域情報と、を受信する受信ステップと、前記複数の符号化レイヤのうち一部の符号化レイヤのみに対して復号処理が行われる場合、前記インデックス情報のうち、前記帯域情報に示される前記特定サブバンド群に対応する部分のみを復号して復号信号を生成する復号ステップと、を備える。
本発明によれば、聴感的な重要度を考慮した符号化処理、符号化パラメータ生成処理を行い、復号信号の品質を改善することができる。
本発明の実施の形態1に係る符号化装置及び復号装置を有する通信システムの構成を示すブロック図 図1に示した符号化装置の内部の主要な構成を示すブロック図 図2に示した第3−4レイヤ符号化部の内部の主要な構成を示すブロック図 図3に示したマルチレートインデキシング部における処理のフローチャート 図3に示した帯域選択部における処理の概要を示す図 図3に示したインデックス情報調整部における処理の概要を示す図 図2に示した第3−4レイヤ復号部の内部の主要な構成を示すブロック図 図7に示したインデックス情報調整部における処理の概要を示す図 図1に示した復号装置の内部の主要な構成を示すブロック図 図9に示した第3−4レイヤ復号部の内部の主要な構成を示すブロック図 本発明の実施の形態2に係る符号化装置の内部の主要な構成を示すブロック図 図11に示した第2レイヤ符号化部の内部の主要な構成を示すブロック図 本発明の実施の形態2に係る復号装置の内部の主要な構成を示すブロック図 図13に示した第2レイヤ復号部の内部の主要な構成を示すブロック図
以下、本発明の各実施の形態について、図面を参照して詳細に説明する。なお、本発明に係る符号化装置及び復号装置として、音声符号化装置及び音声復号装置を例にとって説明する。
(実施の形態1)
図1は、本実施の形態に係る符号化装置及び復号装置を有する通信システムの構成を示すブロック図である。図1において、通信システムは、符号化装置101と復号装置103とを備える。符号化装置101と復号装置103とは、伝送路102を介して通信可能な状態となっている。なお、符号化装置及び復号装置はいずれも、通常、基地局装置又は通信端末装置等に搭載されて用いられる。
符号化装置101は、入力信号をN(Nは自然数)サンプルずつ区切り、Nサンプルを1フレームとしてフレーム毎に符号化を行う。すなわち、Nサンプルが符号化処理単位とされる。ここで、各符号化処理単位に対応する入力信号をx(n=0、…、N−1)と表す。nは、入力信号がNサンプルずつ区切られた信号要素群のうち、(n+1)番目の信号要素を示す。符号化装置101は、符号化によって得られた情報(以下「符号化情報」という)を、伝送路102を介して復号装置103に送信する。
復号装置103は、伝送路102を介して符号化装置101から送信された符号化情報を受信し、受信した符号化情報を復号し出力信号を得る。
図2は、図1に示した符号化装置101の内部の主要な構成を示すブロック図である。符号化装置101は、一例として5つの符号化階層(レイヤ)からなる階層符号化装置とする。ここでは、ビットレートの低い方から順に、第1レイヤ、第2レイヤ、第3レイヤ、第4レイヤ、第5レイヤと呼ぶ。なお、本実施の形態で説明する符号化装置101の構成は、非特許文献1の符号化装置と同様の構成である。ただし、本実施の形態で説明する符号化装置101の構成は、入力信号が音声信号であると判定された場合の符号化処理の構成である。また、符号化装置101において、第3レイヤと第4レイヤの符号化/復号処理はまとめて行われるため、図2では、第3レイヤと第4レイヤを統合し、第3−4レイヤとして表記している。また、符号化装置101において、第3−4レイヤ符号化部以外の構成要素については、非特許文献1に開示されている構成要素と同一であるため、詳細な説明は省略する。
図2に示す符号化装置101の第1レイヤ符号化部201は、入力信号に対して、CELP(Code Excited Linear Prediction)方式の音声符号化方法を用いて符号化を行って、第1レイヤ符号化情報を生成し、生成した第1レイヤ符号化情報を第1レイヤ復号部202及び符号化情報統合部212に出力する。
第1レイヤ復号部202は、第1レイヤ符号化部201から入力される第1レイヤ符号化情報に対して、CELP方式の音声復号方法を用いて復号を行って、第1レイヤ復号信号を生成し、生成した第1レイヤ復号信号を加算部203に出力する。
加算部203は、第1レイヤ復号部202から入力される第1レイヤ復号信号の極性を反転させて、入力信号に加算することにより、入力信号と第1レイヤ復号信号との差分信号を算出し、得られた差分信号を第1レイヤ差分信号として直交変換処理部204に出力する。
直交変換処理部204は、バッファbuf1(n)(n=0、…、N−1)を内部に有し、加算部203から入力される第1レイヤ差分信号x1(n)を修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform。つまり、直交変換)することにより、周波数領域パラメータ(周波数領域信号。つまり、スペクトルデータ)に変換する。
ここで、直交変換処理部204における直交変換処理について、その計算手順及び内部バッファへのデータ出力に関して説明する。
まず、直交変換処理部204は、次式(1)によりバッファbuf1(n)を、「0」を初期値として初期化する。
Figure 0005714002
次いで、直交変換処理部204は、次式(2)に従って、第1レイヤ差分信号x1(n)に対し修正離散コサイン変換(MDCT)を行い、第1レイヤ差分信号x1(n)のMDCT係数(以下「第1レイヤ差分スペクトル」と呼ぶ)X1(k)を求める。
Figure 0005714002
ここで、kは1フレームにおける各サンプルのインデックスを示す。直交変換処理部204は、第1レイヤ差分信号x1(n)とバッファbuf1(n)とを結合させたベクトルであるx1’(n)を次式(3)により求める。
Figure 0005714002
次いで、直交変換処理部204は、次式(4)によりバッファbuf1(n)を更新する。
Figure 0005714002
そして、直交変換処理部204は、第1レイヤ差分スペクトルX1(k)(第1レイヤ差分信号を直交変換して形成されるスペクトルデータ)を、第2レイヤ符号化部205及び加算部207に出力する。
第2レイヤ符号化部205は、直交変換処理部204から入力される第1レイヤ差分スペクトルX1(k)を用いて第2レイヤ符号化情報を生成し、生成した第2レイヤ符号化情報を第2レイヤ復号部206及び符号化情報統合部212に出力する。なお、第2レイヤ符号化部205の詳細については非特許文献1に開示されているため、ここでは省略する。
第2レイヤ復号部206は、第2レイヤ符号化部205から入力される第2レイヤ符号化情報を復号し、第2レイヤ復号スペクトルを算出し、算出した第2レイヤ復号スペクトルを加算部207に出力する。なお、第2レイヤ復号部206の詳細については非特許文献1に開示されているため、ここでは省略する。
加算部207は、第2レイヤ復号部206から入力される第2レイヤ復号スペクトルの極性を反転させて、直交変換処理部204から入力される第1レイヤ差分スペクトルに加算することにより、第1レイヤ差分スペクトルと第2レイヤ復号スペクトルとの差分スペクトルを算出する。そして、加算部207は、得られた差分スペクトルを第2レイヤ差分スペクトルとして第3−4レイヤ符号化部208及び加算部210に出力する。
第3−4レイヤ符号化部208は、加算部207から入力される第2レイヤ差分スペクトルを用いて第3−4レイヤ符号化情報を生成する。そして、第3−4レイヤ符号化部208は、生成した第3−4レイヤ符号化情報を第3−4レイヤ復号部209及び符号化情報統合部212に出力する。なお、第3−4レイヤ符号化部208の詳細については後述する。
第3−4レイヤ復号部209は、第3−4レイヤ符号化部208から入力される第3−4レイヤ符号化情報を復号し、第3−4レイヤ復号スペクトルを算出し、算出した第3−4レイヤ復号スペクトルを加算部210に出力する。なお、第3−4レイヤ復号部209の詳細については後述する。
加算部210は、第3−4レイヤ復号部209から入力される第3−4レイヤ復号スペクトルの極性を反転させて、加算部207から入力される第2レイヤ差分スペクトルに加算することにより、第2レイヤ差分スペクトルと第3−4レイヤ復号スペクトルとの差分スペクトルを算出する。そして、加算部210は、得られた差分スペクトルを第3−4レイヤ差分スペクトルとして第5レイヤ符号化部211に出力する。
第5レイヤ符号化部211は、加算部210から入力される第3−4レイヤ差分スペクトルを用いて第5レイヤ符号化情報を生成する。そして、第5レイヤ符号化部211は、生成した第5レイヤ符号化情報を符号化情報統合部212に出力する。なお、第5レイヤ符号化部211の詳細については非特許文献1に開示されているため、ここでは省略する。
符号化情報統合部212は、第1レイヤ符号化部201から入力される第1レイヤ符号化情報と、第2レイヤ符号化部205から入力される第2レイヤ符号化情報と、第3−4レイヤ符号化部208から入力される第3−4レイヤ符号化情報と、第5レイヤ符号化部211から入力される第5レイヤ符号化情報とを統合する。そして、符号化情報統合部212は、統合された情報源符号に対し、必要であれば伝送誤り符号などを付加した上でこれを符号化情報として伝送路102に出力する。
図3は、図2に示す第3−4レイヤ符号化部208の内部の主要な構成を示すブロック図である。第3−4レイヤ符号化部208は、グローバルゲイン算出部301、近傍探索部302、マルチレートインデキシング部303、帯域選択部304、インデックス情報調整部305及び多重化部306から主に構成される。各部は以下の動作を行う。
グローバルゲイン算出部301は、加算部207から入力される第2レイヤ差分スペクトルX2(k)に対するグローバルゲインを算出する。グローバルゲインの算出方法については、非特許文献1に開示されており、本実施の形態における算出方法も同一方法である。具体的には、グローバルゲイン算出部301は、次式(5)及び次式(6)に従って、グローバルゲインgを算出する。グローバルゲイン算出部301は、式(6)に従って算出したグローバルゲインgを多重化部306に出力する。ここで、式(5)におけるNB_BITSは符号化処理に利用できるビット数を表し、Pは第2レイヤ差分スペクトルX2(k)を分割するサブバンド数を表す。
Figure 0005714002
Figure 0005714002
より詳細には、式(5)における1段目には、初期化に関する式が記載されている。そして、初期化の後に、式(5)では、3段目に記載された式による、第1のオフセット計算が行われる。一方で、式(5)では、6,7段目に記載された式による、第2のオフセット計算も行われる。また、式(5)における4段目に記載された式により、nbitsが求められる。そして、式(5)における5段目の条件に基づいて、第1のオフセット計算によって求められたオフセット(offset)、又は、第2のオフセット計算によって求められたオフセット(offset)が選択される。すなわち、式(5)における5段目の条件が満たされない場合には、第1のオフセット計算によって求められたオフセットが選択される。一方、式(5)における5段目の条件が満たされる場合には、第2のオフセット計算によって求められたオフセットが選択される。
そして、式(6)では、式(5)で選択されたオフセット(offset)に基づいて、グローバルゲインgが求められる。このグローバルゲインgは、多重化部306へ出力される。
また、グローバルゲイン算出部301は、式(6)により算出したグローバルゲインgを用いて第2レイヤ差分スペクトルX2(k)を式(7)に従って正規化し、正規化した第2レイヤ差分スペクトルX’2(k)を近傍探索部302に出力する。
Figure 0005714002
近傍探索部302は、グローバルゲイン算出部301における処理と同様にして、グローバルゲイン算出部301から入力される正規化された第2レイヤ差分スペクトルX’2(k)(スペクトルデータ)をP個のサブバンドに分割する。ここで、P個の各サブバンドを構成するサンプル(MDCT係数)の数、つまり、サブバンド幅をそれぞれQ(p)とする。なお、以下では、説明の簡略化のため、各サブバンド幅が全てQである場合について説明するが、もちろん本発明はサブバンド毎にサブバンド幅が異なる場合についても同様に適用できる。
近傍探索部302は、P個に分割した各サブバンドのスペクトルに対して、近傍探索処理を行う。なお、以下の説明では、各サブバンドのスペクトルをサブスペクトルSS(k)(p=0、・・・、P−1、k=BS、・・・、BE)と呼ぶ。ここで、BS、及びBEは各サブバンドの先頭サンプルのインデックス、及び最終サンプルのインデックスをそれぞれ表す。近傍探索部302は、サブスペクトルSS(k)に対して、非特許文献1及び非特許文献3で開示されている技術を用いて、サブスペクトルSS(k)の近傍ベクトル(ラティス(lattice)ベクトル(格子ベクトル))を算出する。具体的には、近傍探索部302は、次式(8)に従い、REに含まれるサブベクトル(ラティスベクトル(lattice point)y1p又はy2p)を算出する。ここで、REはいわゆる循環Gosset格子(rotated Gosset lattice)の集合を意味する。RE及び式(8)の処理の詳細については、非特許文献1、非特許文献2を参照されたい。
Figure 0005714002
近傍探索部302は、算出した近傍ベクトル(式(8)におけるy1p又はy2p)をマルチレートインデキシング部303に出力する。
マルチレートインデキシング部303は、非特許文献1及び非特許文献3で開示されている技術を用いて、近傍探索部302から入力される近傍ベクトルを用いて、各サブバンドに対してマルチレートインデキシングを行い、各サブバンドのマルチレートインデキシング結果を示すインデックス情報を生成する。
ここで、図4に、マルチレートインデキシング部303の処理フローを示す。なお、以下では、非特許文献1に記載されているAVQ符号化部と同様に、レイヤ3及びレイヤ4に割り当てられる合計ビット数(ここでは例えばレイヤ3及びレイヤ4にそれぞれ4kbps、8kbpsが割り当てられ、合計のビットレートが12kbpsとする)に対して符号化処理する場合について説明する。
ステップ(以下、STと記す)1010では、マルチレートインデキシング部303は、サブバンド毎に、サブスペクトルSS(k)のエネルギを算出し、算出したサブバンド毎のエネルギ(サブバンドエネルギ)をエネルギの降順にソートする。ここで、各サブスペクトルのサブバンドエネルギEは次式(9)により算出される。
Figure 0005714002
ST1020では、マルチレートインデキシング部303は、全サブバンドのサブスペクトルSS(k)が量子化済みか否かを判定する。マルチレートインデキシング部303において全サブバンドのサブスペクトルSS(k)が既に量子化済みである場合(ST1020:YES)にはST1070に進み、量子化済みでない場合(ST1020:NO)はST1030に進む。
ST1030では、マルチレートインデキシング部303は、各サブバンドのサブスペクトルSS(k)のマルチレートインデキシング(量子化)を行い、各サブバンドのサブスペクトルSS(k)のマルチレートインデキシング(量子化)結果を示すインデックス情報を生成する。なお、マルチレートインデキシング処理の詳細については、非特許文献3に開示されているため、ここでは説明を省略する。
ST1040では、マルチレートインデキシング部303は、ST1030でマルチレートインデキシング(量子化)に使用したビットの合計がマルチレートインデキシング部303に割り当てられているビットを超えていないかどうかの判定を行う。ここで、図4に示すST1040において、BITは、処理を開始(スタート)してから現時点までのST1030においてマルチレートインデキシング処理で使用したビットの合計を示し、mは現在量子化対象であるサブバンドのサブスペクトルのマルチレートインデキシング処理で使用したビット数を示し、BITTOTALはマルチレートインデキシング部303に割り当てられているビット数を示す。つまり、ST1040では、BITにmを加算した値がBITTOTAL以下である場合(ST1040:YES)にはST1060に進み、BITにmを加算した値がBITTOTALより大きい場合(ST1040:NO)にはST1050に進む。
ST1050では、マルチレートインデキシング部303は、現在量子化対象であるサブバンド(図4に示す当該サブバンド)のサブスペクトルの値(スペクトル値)SS(k)を次式(10)に従って、ゼロに設定する。
Figure 0005714002
ST1060では、マルチレートインデキシング部303は、マルチレートインデキシング処理で使用したビットの合計値BITを(BIT+m)に更新する。
ST1070では、マルチレートインデキシング部303は、ST1010で算出した各サブバンドのサブバンドエネルギを示すサブバンドエネルギ情報、ST1030で算出したインデックス情報、及び、マルチレートインデキシング部303に割り当てられている符号化ビットレートを帯域選択部304に出力し、処理を終了する。
帯域選択部304(図3)は、マルチレートインデキシング部303から入力されるインデックス情報、サブバンドエネルギ情報、及び、マルチレートインデキシング部303に割り当てられている符号化ビットレートを用いて、聴感的に重要な特定のサブバンド群(重要サブバンド群)を選択する。ここで、マルチレートインデキシング部303に割り当てられている符号化ビットレートとして、レイヤ3に割り当てられている4kbpsを例に挙げて説明する。以下、帯域選択部304における帯域選択方法について説明する。
帯域選択部304は、インデックス情報に含まれる各サブバンドのサブスペクトルの量子化に使用したビット数(つまり、各サブバンドに割り当てられた符号化ビット数)の合計が、予め設定された符号化ビットレート(ビット数。ここでは、レイヤ3に割り当てられている符号化ビットレート(4kbps))以下である条件において、サブバンドエネルギ情報に示されるサブバンドエネルギが最大となる特定のサブバンド群を、重要サブバンド群として選択する。
つまり、帯域選択部304は、複数のサブバンド毎のマルチレートインデキシングに使用した符号化ビット数(複数のサブバンド毎に割り当てられる符号化ビット数)、及び、複数のサブバンド毎のサブバンドエネルギを用いて、複数のサブバンドのうち、符号化ビット数の合計が予め設定された値(ここではレイヤ3に割り当てられている符号化ビットレート)以下となるサブバンドの範囲であり、かつ、サブバンドエネルギの合計が最大となるサブバンドの範囲を、レイヤ3及びレイヤ4(まとめて符号化処理される符号化レイヤ)における聴感的に重要な特定のサブバンド群(重要サブバンド群)として決定する。ただし、ここでは、サブバンドを周波数の昇順に並べた場合に対して(降順でも可)、連続するサブバンドの集合のみを重要サブバンド群の対象にするものとする。
図5に帯域選択部304における処理の概要を示す。図5に示す各ブロック(□(四角))は各サブバンドを意味する。また、図5において、ブロック内の数値はサブバンドエネルギの順位(数字が小さいほど、サブバンドエネルギが大きいものとする。)を示し、各サブバンドの下の数値Bはサブバンドのサブスペクトルの量子化に使用するビット数を示し、Eはサブバンドエネルギを示す。また、図5では、サブバンドエネルギが大きい方から5番目までのサブバンドしか示していないが、6番目以降についても同様に考えることができる。
なお、非特許文献1に記載されているマルチレートインデキシング部の方法では、符号化ビットが不足すると、高域側の幾つかのサブバンドは符号化されず、ビットも割り当てられないことがある。従って、図5に示すサブバンド数はフレーム毎に異なることがあり得る。
また、図5に示す第nエントリ(n=1,2,3,…)とは、重要サブバンド群の選択候補(サブバンドの選択範囲)を意味する。図5に示したように、帯域選択部304は、連続するサブバンド群に対する使用ビット数がレイヤ3の符号化ビット数(4kbps相当)以下となるエントリのうち、合計サブバンドエネルギが最大となるエントリを探索する。そして、帯域選択部304は、探索したエントリ(つまり、重要サブバンド群)の開始サブバンド位置を帯域符号化情報としてインデックス情報調整部305に出力する。例えば、図5において、第2エントリが重要サブバンド群として選択された場合、サブバンドエネルギの順位が「1」であるサブバンドのインデックス(図5では先頭から5番目であるのでインデックスは4)が帯域符号化情報に相当する。
なお、重要サブバンド群は連続するサブバンドを対象とするため、候補エントリのうち、最も低域側の候補エントリは「先頭サブバンドを最初のサブバンドとする候補エントリ」であり、最も高域側の候補エントリは「終端サブバンドを最後のサブバンドとするエントリ」である。つまり、先頭サブバンド又は終端サブバンドの境界を超えるような候補エントリは対象としないものとする。
また、帯域選択部304は、マルチレートインデキシング部303から入力されたインデックス情報もインデックス情報調整部305に出力する。
インデックス情報調整部305は、帯域選択部304から入力されるインデックス情報及び帯域符号化情報を用いて、インデックス情報の並び替え処理を行う。具体的には、インデックス情報調整部305は、全サブバンドのインデックス情報のうち帯域符号化情報が示すサブバンドを含む重要サブバンド群に対応する部分が先頭に位置し、残りのサブバンドのインデックス情報がその後ろに位置するように、インデックス情報の並び替え処理を行う。
図6にインデックス情報調整部305における並び替え処理の概念図を示す。なお、インデックス情報調整部305は、帯域選択部304と同様にして、帯域符号化情報と、インデックス情報の量子化に使用された符号化ビット数とから、上記重要サブバンド群がどのサブバンドを含むのかを算出できる。図6では、帯域選択部304において、第2エントリが示すサブバンド群が重要サブバンド群として算出された場合について説明する。
まず、インデックス情報調整部305は、図6Aに示すステップ1において、帯域符号化情報を用いて、周波数の昇順にソートしたインデックス情報に対して、重要サブバンド群を算出する。インデックス情報調整部305で選択される重要サブバンド群は、帯域選択部304で選択された重要サブバンド群と同一である。
次いで、インデックス情報調整部305は、図6Bに示すステップ2において、ステップ1で選択した重要サブバンド群、前記重要サブバンド群よりも低域側のサブバンド(低域サブバンド群)、前記重要サブバンド群よりも高域側のサブバンド(高域サブバンド群)に切り分ける。
次いで、インデックス情報調整部305は、図6Cに示すステップ3において、ステップ1で選択した重要サブバンド群を先頭にし、それ以外のサブバンドについては、周波数の昇順を維持したまま、前記重要サブバンド群に後続させる形で並び替える。つまり、並び順としては、図6に示すように、低域側から、「重要サブバンド群」、「低域サブバンド群」、「高域サブバンド群」となる。
以上が、インデックス情報調整部305における、インデックス情報の並び替え処理の説明である。次いで、インデックス情報調整部305は、並び替え後のインデックス情報と帯域符号化情報とを多重化部306に出力する。
多重化部306は、グローバルゲイン算出部301から入力されるグローバルゲインgと、インデックス情報調整部305から入力されるインデックス情報及び帯域符号化情報と、を多重化して第3−4レイヤ符号化情報を生成する。そして、多重化部306は、生成した第3−4レイヤ符号化情報を、第3−4レイヤ復号部209及び符号化情報統合部212に出力する。
以上が、第3−4レイヤ符号化部208の処理の説明である。
図7は、図2に示す第3−4レイヤ復号部209の内部の主要な構成を示すブロック図である。第3−4レイヤ復号部209は、分離部701、インデックス情報調整部702及びマルチレート復号部703から主に構成される。
分離部701は、第3−4レイヤ符号化部208から入力される第3−4レイヤ符号化情報を、インデックス情報と、帯域符号化情報と、グローバルゲインとに分離する。そして、分離部701は、インデックス情報及び帯域符号化情報をインデックス情報調整部702に出力し、グローバルゲインをマルチレート復号部703に出力する。
インデックス情報調整部702は、分離部701から出力されるインデックス情報及び帯域符号化情報を用いて、インデックス情報の並び替え処理を行う。具体的には、インデックス情報調整部702は、帯域符号化情報を用いて、インデックス情報の並び替え処理を行う。ここで、インデックス情報調整部702は、第3−4レイヤ符号化部208内のインデックス情報調整部305(図3)と逆の処理を行う。以下にインデックス情報調整部702の処理について説明する。
図8にインデックス情報調整部702の処理の概念図を示す。ここで、図8中の表記は、図6中の表記と同様である。なお、第3−4レイヤ復号部209内の復号処理(図8)では、サブバンドエネルギの順位(サブバンドエネルギの大きい方から何番目かを示す番号)は特に必要ないが、図8では、第3−4レイヤ符号化部208内の符号化処理と対比しやすいように表記している。
まず、インデックス情報調整部702は、図8Aに示すステップ1において、分離部701から出力される帯域符号化情報を復号し、分離部701から出力されるインデックス情報の先頭サブバンドの周波数帯域(先頭サブバンドが周波数領域のどの帯域に対応するか)を算出する。次いで、インデックス情報調整部702は、先頭サブバンドから順に、各サブバンドで使用する符号化ビット数を加算していき、合計ビット数が予め指定されたビット数を超えない最大となるサブバンドの位置を探索し、重要サブバンド群を決定する。ここで、予め指定されたビット数とは、レイヤ3の符号化ビット数(4kbps相当)を意味する。図8Aでは、先頭から4番目までのサブバンドを重要サブバンド群とした場合を示している。
次いで、インデックス情報調整部702は、図8Bに示すステップ2において、ステップ1で求めた重要サブバンド群に後続するサブバンドのうち、重要サブバンド群よりも周波数領域で低い帯域に相当するサブバンド(低域サブバンド群)を決定する。これは、ステップ1において算出した先頭サブバンドの周波数帯域から算出することができる。つまり、インデックス情報調整部702は、ステップ1における先頭サブバンドの周波数帯域から、先頭サブバンドよりも低域側に幾つのサブバンドが存在するかを求め、重要サブバンド群に後続するサブバンドから求めたサブバンド数分を低域側サブバンド群と判定すればよい。このとき、サブバンドの分割方法は、第3−4レイヤ符号化部208において行った分割方法と同様である。インデックス情報調整部702では、上記方法によって決定した低域サブバンド群に後続する部分を、周波数領域で重要サブバンド群よりも高い帯域に相当するサブバンド(高域サブバンド群)とする。
次いで、インデックス情報調整部702は、図8Cに示すステップ3において、ステップ1及びステップ2で決定した、重要サブバンド群、低域サブバンド群、高域サブバンド群を、低域側から、「低域サブバンド群」、「重要サブバンド群」、「高域サブバンド群」となるように並び替える。
インデックス情報調整部702は、以上の処理によって並び替えを行ったインデックス情報をマルチレート復号部703に出力する。
マルチレート復号部703は、分離部701から入力されるグローバルゲイン、及び、インデックス情報調整部702から入力されるインデックス情報を復号し、第3−4レイヤ復号スペクトルを算出する。そして、マルチレート復号部703は、算出した第3−4レイヤ復号スペクトルを加算部210に出力する。なお、マルチレート復号部703における復号処理の詳細については、非特許文献1に開示されているため、ここでは説明を省略する。
以上が、符号化装置101における処理の説明である。
図9は、図1に示した復号装置103の内部の主要な構成を示すブロック図である。復号装置103は、一例として5つの復号階層(レイヤ)からなる階層復号装置とする。ここでは、符号化装置101と同様、ビットレートの低い方から順に、第1レイヤ、第2レイヤ、第3レイヤ、第4レイヤ、第5レイヤと呼ぶことにする。また、符号化装置101に対応して、第3レイヤ及び第4レイヤの復号処理をまとめて第3−4レイヤ復号部804にて行う。
符号化情報分離部801は、伝送路102を介して符号化装置101から送られる符号化情報を受信し、受信した符号化情報を各レイヤの符号化情報に分離し、それぞれの復号処理を担当する復号部に出力する。具体的には、符号化情報分離部801は、符号化情報に含まれる第1レイヤ符号化情報を第1レイヤ復号部802に出力し、符号化情報に含まれる第2レイヤ符号化情報を第2レイヤ復号部803に出力し、符号化情報に含まれる第3−4レイヤ符号化情報を第3−4レイヤ復号部804に出力し、符号化情報に含まれる第5レイヤ符号化情報を第5レイヤ復号部806に出力する。なお、符号化情報分離部801は、符号化情報に、或るレイヤの符号化情報が含まれていない場合には、該当するレイヤの復号部には何も出力しない。また、符号化情報分離部801は、第3−4復号レイヤの復号動作の制御を行う。具体的には、符号化情報分離部801は、符号化情報に第3−4レイヤ符号化情報が含まれており、かつ、前記第3−4符号化情報が第3レイヤと第4レイヤの符号化ビット数の合計ビット数である場合には、第3−4復号レイヤの復号動作を「通常モード(L3−L4モード)」に制御する。また、符号化情報分離部801は、符号化情報に第3−4レイヤ符号化情報が含まれているが、第3−4符号化情報が第3レイヤの符号化ビット数のみである場合には、第3−4復号レイヤの復号動作を「低ビットレートモード(L3モード)」に制御する。図9では、この符号化情報分離部801の制御動作を破線で示している。
第1レイヤ復号部802は、符号化情報分離部801から入力される第1レイヤ符号化情報に対して、CELP方式の音声復号方法を用いて復号を行って第1レイヤ復号信号を生成し、生成した第1レイヤ復号信号を加算部809に出力する。
第2レイヤ復号部803は、符号化情報分離部801から入力される第2レイヤ符号化情報を復号し、得られる第2レイヤ復号スペクトルX2”(k)を加算部805に出力する。第2レイヤ復号部803の処理については非特許文献1に開示されているため、ここでは説明を省略する。
第3−4レイヤ復号部804は、符号化情報分離部801から入力される第3−4レイヤ符号化情報を復号し、得られる第3−4レイヤ復号スペクトルX34”(k)を加算部805に出力する。また、第3−4レイヤ復号部804は、符号化情報分離部801によって、その復号動作を制御される。第3−4レイヤ復号部804の処理の詳細については後述する。
加算部805には、第2レイヤ復号部803から第2レイヤ復号スペクトルX2”(k)が入力され、第3−4レイヤ復号部804から第3−4レイヤ復号スペクトルX34”(k)が入力される。加算部805は、入力された第2レイヤ復号スペクトルX2”(k)及び第3−4レイヤ復号スペクトルX34”(k)を加算し、加算したスペクトルを第1加算スペクトルXadd1”(k)として加算部807に出力する。
第5レイヤ復号部806は、符号化情報分離部801から入力される第5レイヤ符号化情報を復号し、得られる第5レイヤ復号スペクトルX5”(k)を加算部807に出力する。第5レイヤ復号部806の処理については非特許文献1に開示されているため、ここでは説明を省略する。
加算部807には、加算部805から第1加算スペクトルXadd1(k)が入力され、第5レイヤ復号部806から第5レイヤ復号スペクトルX5”(k)が入力される。加算部807は、入力された第1加算スペクトルXadd1”(k)及び第5レイヤ復号スペクトルX5”(k)を加算し、加算したスペクトルを第2加算スペクトルXadd2(k)として直交変換処理部808に出力する。
直交変換処理部808は、まず、次式(11)に従い内蔵のバッファbuf’(k)を「0」値に初期化する。
Figure 0005714002
次いで、直交変換処理部808は、第2加算スペクトルXadd2(k)を入力とし、次式(12)に従い第2加算復号信号y”(n)を求める。
Figure 0005714002
式(12)において、X6(k)は、第2加算スペクトルXadd2(k)とバッファbuf’(k)とを結合させたベクトルであり、次式(13)を用いて求められる。
Figure 0005714002
次いで、直交変換処理部808は、次式(14)に従いバッファbuf’(k)を更新する。
Figure 0005714002
そして、直交変換処理部808は、第2加算復号信号y”(n)を加算部809に出力する。
加算部809には、第1レイヤ復号部802から第1レイヤ復号信号が入力され、直交変換処理部808から第2加算復号信号が入力される。加算部809は、入力された第1レイヤ復号信号及び第2加算復号信号を加算し、加算した信号を出力信号として出力する。
図10は、図9に示した第3−4レイヤ復号部804の内部の主要な構成を示すブロック図である。第3−4レイヤ復号部804は、分離部1001、インデックス情報調整部1002及びマルチレート復号部1003から主に構成される。
分離部1001は、符号化情報分離部801から出力される第3−4レイヤ符号化情報を、インデックス情報と、帯域符号化情報と、グローバルゲインとに分離する。次いで、分離部1001は、インデックス情報及び帯域符号化情報をインデックス情報調整部1002に出力し、グローバルゲインをマルチレート復号部1003に出力する。
インデックス情報調整部1002は、分離部1001から出力されるインデックス情報及び帯域符号化情報を用いて、インデックス情報の並び替え処理を行う。また、インデックス情報調整部1002は、符号化情報分離部801(図9)によって、その処理を制御される。以下、インデックス情報調整部1002における処理の制御方法について説明する。
符号化情報分離部801による制御が「通常モード(L3−L4モード)」である場合、インデックス情報調整部1002は、符号化装置101内のインデックス情報調整部702と逆の処理を行う。つまり、インデックス情報調整部1002は、レイヤ3及びレイヤ4に対して復号処理が行われる場合、符号化装置101内のインデックス情報調整部702において重要サブバンド群に対応する部分が先頭に位置するように並び替えられたインデックス情報に対して、インデックス情報調整部702と逆の並び替え処理を行う。なお、ここではインデックス情報調整部1002における並べ替え処理の具体的な説明を省略する。
一方、符号化情報分離部801による制御が「低ビットレートモード(L3モード)」である場合には、第3−4レイヤ符号化情報には、第3レイヤに割り当てられるビット数分のインデックス情報、つまり、重要サブバンド群のインデックス情報が格納されている。このとき、インデックス情報調整部1002は、重要サブバンド群の先頭サブバンドの周波数がどの帯域であるかを示す帯域符号化情報と、インデックス情報をマルチレート復号部1003に出力する。つまり、インデックス情報調整部1002は、レイヤ3に対してのみ復号処理が行われる場合、符号化装置101内のインデックス情報調整部702において重要サブバンド群に対応する部分が先頭に位置するように並び替えられたインデックス情報に対して、並び替え処理を行わない。
マルチレート復号部1003は、分離部1001から入力されるグローバルゲインと、インデックス情報調整部1002から入力されるインデックス情報及び帯域符号化情報とを、復号して第3−4レイヤ復号スペクトルを算出する。また、マルチレート復号部1003は、符号化情報分離部801によって、その処理を制御される。以下、マルチレート復号部1003における処理の制御方法について説明する。
符号化情報分離部801による制御が「通常モード(L3−L4モード)」である場合、マルチレート復号部1003は、符号化装置101内のマルチレート復号部703と同様の処理を行う。ここでは、説明を省略する。なお、このときは、インデックス情報調整部1002から帯域符号化情報は入力されなくてもよい。
符号化情報分離部801による制御が「低ビットレートモード(L3モード)」である場合には、マルチレート復号部1003は、入力される帯域符号化情報から決定される周波数帯域に対して、インデックス情報を復号し、第3−4復号スペクトルを算出する。具体的には、マルチレート復号部1003は、インデックス情報に含まれる先頭サブバンドを、帯域符号化情報が示す周波数帯域に対応させ、先頭サブバンドに対応する周波数帯域から周波数領域で高域側に順に、インデックス情報を復号する。このとき、マルチレート復号部1003は、帯域符号化情報が示す周波数帯域よりも低域側については、第3−4復号スペクトルの値をゼロとする。同様に、マルチレート復号部1003は、インデックス情報に対応する周波数帯域よりも高域側についても、第3−4復号スペクトルの値をゼロとする。つまり、マルチレート復号部1003は、第3−4レイヤ符号化情報に格納されている第3レイヤに割り当てられるビット数分のインデックス情報(重要サブバンド群のインデックス情報)のみを、対応する周波数帯域のスペクトルとして復号する。
このように、マルチレート復号部1003は、複数の符号化レイヤのうち一部の符号化レイヤのみに対して復号処理が行われる場合、インデックス情報のうち、帯域符号化情報に示される重要サブバンド群に対応する部分のみを復号し、復号信号(第3−4レイヤ復号スペクトル)を生成する。そして、マルチレート復号部1003は、算出した第3−4レイヤ復号スペクトルを加算部805に出力する。
以上が、復号装置103における処理の説明である。
このようにして、符号化装置101は、符号化処理をまとめて行う複数の符号化レイヤ(レイヤ3及びレイヤ4)において、聴感的に重要であるサブバンド群を特定して帯域符号化情報を生成する。これにより、復号装置103は、伝送される符号化パラメータ(インデックス情報)のうち、どの部分がレイヤ3の符号化パラメータに相当するかを区別することができる。よって、例えば、復号装置103は、符号化処理をまとめて行う符号化レイヤのうち一部のみで復号処理が行われる場合(レイヤ1からレイヤ3までのビットレート(12kbps)で復号する場合)でも、レイヤ3及びレイヤ4をまとめて符号化処理した際の符号化パラメータのうち聴感的に重要な特定の部分を選択して復号処理することができる。よって、復号装置103では、全レイヤのAVQパラメータを復号しない場合でも、復号信号の品質を向上させることができる。
また、符号化装置101は、インデックス情報のうち重要サブバンド群に対応する部分を先頭に位置するように、インデックス情報を並び替える。これにより、復号装置103は、符号化処理をまとめて行う符号化レイヤのうち一部のみで復号処理が行われる場合には、インデックス情報の先頭から順に、復号対象の符号化レイヤに対応する部分を復号すればよい。よって、復号装置103では、符号化処理をまとめて行う符号化レイヤのうち一部のみで復号処理が行われる場合には、より低演算量で復号処理を行うことができる。
よって、本実施の形態によれば、スケーラブル符号化方式に対して、複数の符号化レイヤを持つAVQ技術を適用する構成において、符号化装置側で聴感的に重要な特定の符号化パラメータを部分的に選択し、符号化パラメータに前記聴感的な重要度を反映させる。これにより、全レイヤのAVQパラメータを復号しない場合でも、復号信号の品質を向上させることができる。よって、本実施の形態によれば、聴感的な重要度を考慮した符号化処理、符号化パラメータ(符号化情報)生成処理を行い、復号信号の品質を改善することができる。
(実施の形態2)
実施の形態1では、AVQ符号化部が複数の符号化レイヤから構成される場合(スケーラブルである場合)について説明したのに対し、本実施の形態では、AVQ符号化部がマルチレート符号化方式である場合に対して本発明を適用した構成について説明する。
実施の形態2に係る通信システム(図示せず)は、図1に示した通信システムと基本的に同様であり、符号化装置の構成及び動作の一部、及び、復号装置の構成及び動作の一部のみにおいて、図1の通信システムの符号化装置101と相違する。以下、本実施の形態に係る通信システムの符号化装置に対し符号「111」を付し、復号装置に対し符号「113」を付して説明を行う。
図11は、符号化装置111の内部の主要な構成を示すブロック図である。符号化装置111は、一例として2つの符号化階層(レイヤ)からなる階層符号化装置とする。ここで、ビットレートの低い方から順に、第1レイヤ、第2レイヤと呼ぶことにする。なお、第2レイヤはマルチレート符号化方式を採るものとする。
符号化装置111は、第1レイヤ符号化部201、第1レイヤ復号部202、加算部203、直交変換処理部1104、第2レイヤ符号化部1105、及び符号化情報統合部1112とから主に構成される。ここで、第1レイヤ符号化部201、第1レイヤ復号部202、及び加算部203については、実施の形態1(図2)で説明した構成と同様のため、同一の符号を付し、説明を省略する。
直交変換処理部1104は、加算部203から出力される第1レイヤ差分信号に対して直交変換を施し、周波数領域の成分である第1レイヤ差分スペクトルを算出する。直交変換処理部1104は、算出した第1レイヤ差分スペクトルを第2レイヤ符号化部1105に出力する。直交変換処理部1104における直交変換処理については、上述した方法(例えば、直交変換処理部204)と同様であるため、説明は省略する。
第2レイヤ符号化部1105は、直交変換処理部1104から出力される第1レイヤ差分スペクトルを入力とする。また、第2レイヤ符号化部1105には、外部より符号化時のビットレートが入力される。第2レイヤ符号化部1105は、前記ビットレートに基づいて、第1レイヤ差分スペクトルの符号化を行い、第2レイヤ符号化情報を算出する。次いで、第2レイヤ符号化部1105は、第2レイヤ符号化情報を符号化情報統合部1112に出力する。第2レイヤ符号化部1105の処理の詳細については後述する。
符号化情報統合部1112は、第1レイヤ符号化部201から入力される第1レイヤ符号化情報と、第2レイヤ符号化部1105から入力される第2レイヤ符号化情報とを統合する。そして、符号化情報統合部1112は、統合された情報源符号に対し、必要であれば伝送誤り符号などを付加した上でこれを符号化情報として伝送路102に出力する。
図12は、第2レイヤ符号化部1105の内部の主要な構成を示すブロック図である。第2レイヤ符号化部1105は、グローバルゲイン算出部301、近傍探索部302、マルチレートインデキシング部303、帯域選択部1204、及び多重化部306から主に構成される。各部は以下の動作を行う。ここで、グローバルゲイン算出部301、近傍探索部302、マルチレートインデキシング部303及び多重化部306については、実施の形態1(図3)で説明した構成要素と同一であるため、同一の符号を付し、説明を省略する。但し、図12に示すマルチレートインデキシング部303においては、BITTOTALは外部から入力される符号化時のビットレートに対応するビット数であるという点のみ、実施の形態1で説明した構成要素とは異なる。
帯域選択部1204は、マルチレートインデキシング部303から入力されるインデックス情報、サブバンドエネルギ情報と、外部から入力される符号化時のビットレートとから、聴感的に重要な特定のサブバンド群(重要サブバンド群)を選択する。ここで、外部から入力されるビットレートとしては、4kbps又は8kbpsである場合を例に挙げて説明する。以下に、帯域選択部1204における帯域選択方法について説明する。
帯域選択部1204は、インデックス情報に含まれる各サブバンドのサブスペクトルの量子化に使用したビット数の合計が、外部から入力されるビットレート(ビット数)以下である条件において、サブバンドエネルギ情報が最大となるサブバンド群(重要サブバンド群)を選択する。つまり、帯域選択部1204は、実施の形態1の帯域選択部304と同様、マルチレートインデキシングにおいて複数のサブバンド毎に割り当てられた符号化ビット、及び、複数のサブバンド毎のサブバンドエネルギを用いて、複数のサブバンドのうち、符号化ビット数の合計が予め設定された値(ここでは外部から入力される符号化ビットレート)以下となるサブバンドの範囲であり、かつ、サブバンドエネルギの合計が最大となるサブバンドの範囲を、聴感的に重要な特定のサブバンド群(重要サブバンド群)として選択する。但し、ここでは、サブバンドを周波数の昇順(降順でも可)に並べた場合に対して、連続するサブバンドの集合のみを重要サブバンド群の対象にする。帯域選択部1204における重要サブバンド群の選択方法は、実施の形態1で説明した方法(帯域選択部304)と同一であるため、説明は省略する。帯域選択部1204は、選択した重要サブバンド群の開始サブバンド(先頭サブバンド)の周波数帯域を示す帯域符号化情報を多重化部306に出力する。また、帯域選択部1204は、重要サブバンド群に対応するインデックス情報のみを抜き出し、これを新たなインデックス情報として多重化部306に出力する。
つまり、帯域選択部1204は、実施の形態1で説明した帯域選択部304と比較して、「外部から入力されるビットレートに応じて、重要サブバンド群を探索する点」と「重要サブバンド群に対応するインデックス情報のみを多重化部306に出力する点」が異なる。
以上が、第2レイヤ符号化部1105における処理の説明である。
図13は、本実施の形態に係る復号装置113の内部の主要な構成を示すブロック図である。復号装置113は、一例として2つの復号階層(レイヤ)からなる階層復号装置とする。ここでは、符号化装置111と同様、ビットレートの低い方から順に、第1レイヤ、第2レイヤと呼ぶことにする。また、符号化装置101に対応して、第2レイヤ復号部では、マルチレート復号処理を行う。
図13に示すように、復号装置113は、符号化情報分離部1301、第1レイヤ復号部802、第2レイヤ復号部1303、直交変換処理部1308及び加算部1309とから主に構成される。ここで、第1レイヤ復号部802については、実施の形態1(図9)で説明した構成要素と同一であるため、同一の符号を付し説明を省略する。
符号化情報分離部1301は、伝送路102を介して符号化装置111から送られる符号化情報を受信し、受信した符号化情報を各レイヤの符号化情報に分離し、それぞれの復号処理を担当する復号部に出力する。具体的には、符号化情報分離部1301は、符号化情報に含まれる第1レイヤ符号化情報を第1レイヤ復号部802に出力し、符号化情報に含まれる第2レイヤ符号化情報を第2レイヤ復号部1303に出力する。
第2レイヤ復号部1303は、符号化情報分離部1301から入力される第2レイヤ符号化情報を復号し、得られる第2レイヤ復号スペクトルX2”(k)を直交変換処理部1308に出力する。第2レイヤ復号部1303の処理の詳細については後述する。
直交変換処理部1308は、第2レイヤ復号部1303から入力される第2レイヤ復号スペクトルに対して直交変換を施し、時間領域の信号である第2レイヤ復号信号を算出する。直交変換処理部1308は、算出した第2レイヤ復号信号を加算部1309に出力する。ここで、直交変換処理部1308における直交変換処理は、実施の形態1の直交変換処理部808(図9)での直交変換処理と同様であるため、説明は省略する。
加算部1309には、第1レイヤ復号部802から第1レイヤ復号信号が入力され、直交変換処理部1308から第2レイヤ復号信号が入力される。加算部1309は、入力された第1レイヤ復号信号及び第2レイヤ復号信号を加算し、加算した信号を出力信号として出力する。
図14は、図13に示した第2レイヤ復号部1303の内部の主要な構成を示すブロック図である。第2レイヤ復号部1303は、分離部1401及びマルチレート復号部1403から主に構成される。
分離部1401は、符号化情報分離部1301から入力される第2レイヤ符号化情報を、インデックス情報と、帯域符号化情報と、グローバルゲインとに分離する。次いで、分離部1401は、インデックス情報、帯域符号化情報及びグローバルゲインをマルチレート復号部1403に出力する。
マルチレート復号部1403は、分離部1401から入力されるグローバルゲイン、インデックス情報及び帯域符号化情報を復号して第2レイヤ復号スペクトルを算出する。このとき、マルチレート復号部1403は、符号化情報分離部1301から入力されるビットレートに応じた復号処理を行う。以下、マルチレート復号部1403における処理の制御方法について説明する。
マルチレート復号部1403は、入力される帯域符号化情報から決定される周波数帯域に対して、ビットレートに対応するビット数のインデックス情報を復号し、第2復号スペクトルを算出する。具体的には、マルチレート復号部1403は、インデックス情報に含まれる先頭サブバンドを、帯域符号化情報が示す周波数帯域に対応させ、先頭サブバンドに対応する周波数帯域から周波数領域で高域側に順に、インデックス情報を復号する。このとき、マルチレート復号部1403は、帯域符号化情報が示す周波数帯域よりも低域側については、第2復号スペクトルの値をゼロとする。同様に、マルチレート復号部1403は、インデックス情報に対応する周波数帯域よりも高域側についても、第2復号スペクトルの値をゼロとする。つまり、マルチレート復号部1403は、第2レイヤ符号化情報に格納されているインデックス情報(重要サブバンド群のインデックス情報)のみを、対応する周波数帯域のスペクトルとして復号する。
そして、マルチレート復号部1403は、算出した第2レイヤ復号スペクトルを直交変換処理部1308に出力する。
以上が、復号装置113における処理の説明である。
このように、本実施の形態によれば、実施の形態1と同様、複数の符号化ビットレートに対応するAVQ符号化方式を採る構成において、符号化装置側で聴感的に重要な特定の符号化パラメータを部分的に選択し、符号化パラメータに前記聴感的な重要度を反映させる。これにより、符号化ビットレートに応じて、復号信号の品質を向上させることができる。よって、本実施の形態によれば、実施の形態1と同様、聴感的な重要度を考慮した符号化処理により符号化パラメータ(符号化情報)生成処理を行い、復号信号の品質を改善することができる。
以上、本発明の各実施の形態について説明した。
なお、各実施の形態では、帯域選択部において、重要サブバンド群を決定する際の候補エントリについては特に制限しない場合について説明した(但し、重要サブバンド群が連続するサブバンド群という制限は有り)。しかし、本発明はこれに限らず、帯域選択部(例えば、帯域選択部304(図3)又は帯域選択部1204(図12))において、候補エントリを効率的に制限する構成についても同様に適用できる。以下、その具体例を説明する。例えば、帯域選択部では、重要サブバンド群が、サブバンドエネルギが最大であるサブバンドを必ず含むというような制限を設けることによって、候補エントリの数を減少させることができる。このように、候補エントリの数を減少させることによって、重要サブバンド群を探索する際の処理演算量を減らすことができる。また、帯域選択部において、サブバンドエネルギが或る閾値以下であるサブバンドに対しては、そのサブバンドのエネルギを考慮しない(0と見積もる)ことにより、候補エントリの数を減少させることができる。具体的には、帯域選択部は、複数のサブバンドのうち、サブバンドエネルギが閾値以上であるサブバンドのみを用いて、サブバンド毎に割り当てられた符号化ビット数の合計が予め設定された値以下となるサブバンドの選択範囲(エントリ)であり、かつ、サブバンドエネルギの合計が最大となるサブバンドの選択範囲(エントリ)を選択する。これにより、帯域選択部は、サブバンドエネルギがゼロでないサブバンドを始点とした候補エントリのみを探索すればよくなり、処理演算量を大きく減らすことができる。
また、各実施の形態では、帯域選択部において、重要サブバンド群を決定する際の候補エントリについて、先頭サブバンド及び終端サブバンドのそれぞれの境界を超えないようにするという制限を設けていた。しかし、本発明はこれに限らず、候補エントリが先頭サブバンド及び終端サブバンドの境界を越えてもよいような構成についても同様に適用できる。具体的には、サブバンドの列を巡回させて、重要サブバンド群の候補エントリを探索する場合が例に挙げられる。例えば、符号化装置(帯域選択部)は、入力信号を直交変換して得られるスペクトルデータの先頭と終端とを連結させて巡回させたスペクトルデータを分割して生成される複数のサブバンドに対して、重要なサブバンド群となる選択範囲(重要サブバンド群)を決定してもよい。このようにサブバンドの列を巡回させることで、候補エントリに対する制限がなくなり、本実施の形態で説明した重要サブバンド群よりも、さらに聴感的に重要な特定のサブバンド群を探索できる可能性がある。但し、上記構成の場合、復号処理において、サブバンドの列が巡回しているという条件で、サブバンド群を並び替え直す必要があり、本実施の形態で説明した構成よりも処理演算量がかかってしまうことが有り得る。
また、各実施の形態では、重要サブバンド群の先頭サブバンドに対応する周波数帯域を帯域符号化情報として復号装置側に伝送する構成について説明した。従って、従来技術に対して、追加の符号化ビット数が必要になる。しかし、本発明はこれに限らず、重要サブバンド群の先頭サブバンドに対応する周波数帯域情報を、下位の復号スペクトルを利用して算出する構成についても同様に適用できる。これにより、追加ビットを使用しなくても復号信号の品質を向上させることができる。具体的には、復号スペクトルのサブバンドエネルギを利用する例が挙げられる。
また、各実施の形態では、符号化装置が、聴感的に重要な特定のサブバンド群(重要サブバンド群)の選択処理を、フレーム毎に独立に行う場合に対して説明した。しかし、本発明はこれに限らず、符号化装置が、時間的に前のフレームの選択結果を考慮して、現フレームで重要サブバンド群の選択をする構成についても同様に適用できる。例えば、前フレームにおいて重要サブバンド群として選択した帯域の近隣の帯域を、現フレームの重要サブバンド群の選択候補とする構成が一例に挙げられる。又は、符号化装置は、前回のフレームで重要サブバンド群として選択されたサブバンドに近いサブバンドほど、現時点のフレームにおける重要サブバンド群として選択されやすくなる重みを用いて、複数のサブバンドから重要サブバンド群となる選択範囲(選択候補)を決定してもよい。これらの構成により、フレーム間で、重要サブバンド群の帯域が大きく変動することを抑制することができ、結果として、復号信号の品質劣化を抑えることができる。
また、各実施の形態では、符号化装置が、マルチレートインデキシング処理した後に、聴感的に重要な特定の帯域を選択しているが、本発明はこれに限らず、マルチレートインデキシング処理する前に、聴感的に重要な特定の帯域を選択するという構成についても同様に適用できる。但し、この構成の場合には、帯域選択時には、各サブバンドの符号化に使用するビット数が確定していないため、暫定的に符号化ビット数の推定値を利用する。具体的には、全サブバンドが同一の符号化ビット数であるとする構成が一例として挙げられる。つまり、符号化装置(帯域選択部)は、予め設定された固定のビット数を、複数のサブバンド毎に割り当てられる符号化ビット数として用いて、複数のサブバンドから重要サブバンド群となる選択範囲(選択候補)を決定する。この構成では、各サブバンドの符号化に使用するビット数が統一されるため、帯域選択時の処理演算量を減少させることができる。
また、各実施の形態では、符号化対象として、ベクトルで表されるスペクトルデータを代表的に用いて説明したが、必ずしもこれに限定されない。符号化対象として、ベクトルにより入力信号の特性を表現することが可能な異なるデータを用いても、本実施の形態と同様の作用効果が得られる。
また、各実施の形態に係る復号装置103は、上記符号化装置101から伝送された符号化情報を用いて処理を行うとした。しかし、本発明はこれに限定されず、必要なパラメータやデータを含む符号化情報であれば、必ずしも上記符号化装置101からの符号化情報でなくても、復号装置103は処理を行うことが可能である。
また、各実施の形態では、符号化対象の入力信号及び復号されて出力される出力信号を音声信号としたが、これに限定されない。例えば、入力信号/出力信号は、音楽信号であってもよく、又は、音声信号と音楽信号とが混在した信号であってもよい。
また、上記機能を実行可能な信号処理プログラムを、メモリ、ディスク、テープ、CD、DVD等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用及び効果を得ることができる。
また、各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はハードウェアとの連携においてソフトウェアでも実現することも可能である。
また、各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2010年4月19日出願の特願2010−096095の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る符号化装置、復号装置、符号化方法及び復号方法は、聴感的な重要度を考慮した符号化処理による符号化パラメータ生成処理を行うことにより、非常に低いビットレートで、かつ低い処理演算量で、復号信号の品質を改善することができ、例えば、パケット通信システム、移動通信システムなどに好適である。
101,111 符号化装置
102 伝送路
103,113 復号装置
201 第1レイヤ符号化部
202,802 第1レイヤ復号部
203,207,210,805,807,809,1309 加算部
204,808,1104,1308 直交変換処理部
205,1105 第2レイヤ符号化部
206,803,1303 第2レイヤ復号部
208 第3−4レイヤ符号化部
209,804 第3−4レイヤ復号部
211 第5レイヤ符号化部
212,1112 符号化情報統合部
301 グローバルゲイン算出部
302 近傍探索部
303 マルチレートインデキシング部
304,1204 帯域選択部
305,702,1002 インデックス情報調整部
306 多重化部
701,1001,1401 分離部
703,1003,1403 マルチレート復号部
801,1301 符号化情報分離部
806 第5レイヤ復号部

Claims (15)

  1. 符号化処理をまとめて行う複数の符号化レイヤを有する符号化装置であって、
    前記複数の符号化レイヤに入力されるスペクトルデータを分割して複数のサブバンドを生成し、前記複数のサブバンドに対して近傍探索を行うことにより、前記複数のサブバンドのスペクトルのラティスベクトルを算出する探索手段と、
    前記ラティスベクトルを用いて、前記複数のサブバンド毎にマルチレートインデキシングを行い、前記複数のサブバンド毎のマルチレートインデキシングの結果を示すインデックス情報を生成するマルチレートインデキシング手段と、
    前記インデックス情報において前記複数のサブバンド毎に割り当てられる符号化ビット数、及び、前記複数のサブバンド毎のエネルギであるサブバンドエネルギを用いて、前記複数のサブバンドのうち、前記符号化ビット数の合計が予め設定された値以下となるサブバンドの選択範囲であり、かつ、前記サブバンドエネルギの合計が最大となる前記サブバンドの選択範囲であり、かつ、前記サブバンドを周波数の昇順または降順に並べた場合の連続するサブバンドの集合を、前記複数の符号化レイヤにおける、特定サブバンド群として決定し、前記特定サブバンド群を示す情報を帯域符号化情報として出力する選択手段と、
    前記インデックス情報および前記帯域符号化情報を多重化し、出力する多重化手段と、
    を具備する符号化装置。
  2. 前記インデックス情報のうち前記特定サブバンド群に対応する部分が先頭に位置するように、前記インデックス情報を並び変える調整手段、を更に具備する、
    請求項1記載の符号化装置。
  3. 前記選択手段は、前記複数のサブバンドのうち、前回のフレームで前記特定サブバンド群として選択されたサブバンドに近いサブバンドほど、現時点のフレームにおける前記特定サブバンド群として選択されやすくなる重みを用いて、前記複数のサブバンドから前記特定サブバンド群となる前記選択範囲を決定する、
    請求項1記載の符号化装置。
  4. 前記選択手段は、前記複数のサブバンド毎のマルチレートインデキシングに使用したビット数を、前記複数のサブバンド毎に割り当てられる符号化ビット数として用いて、前記複数のサブバンドから前記特定サブバンド群となる前記選択範囲を決定する、
    請求項1記載の符号化装置。
  5. 前記選択手段は、予め設定された固定のビット数を、前記複数のサブバンド毎に割り当てられる符号化ビット数として用いて、前記複数のサブバンドから前記特定サブバンド群となる前記選択範囲を決定する、
    請求項1記載の符号化装置。
  6. 前記選択手段は、前記複数のサブバンドのうち、サブバンドエネルギが閾値以上であるサブバンドのみを用いて、前記複数のサブバンドから前記特定サブバンド群となる前記選択範囲を決定する、
    請求項1記載の符号化装置。
  7. 前記選択手段は、前記スペクトルデータの先頭と終端とを連結させて巡回させたスペクトルデータを分割して生成される前記複数のサブバンドに対して、前記特定サブバンド群となる前記選択範囲を決定する、
    請求項1記載の符号化装置。
  8. 請求項1記載の符号化装置を具備する通信端末装置。
  9. 請求項1記載の符号化装置を具備する基地局装置。
  10. 符号化処理をまとめて行う複数の符号化レイヤを有する符号化装置からの信号を復号する復号装置であって、
    前記符号化装置で生成された、
    前記複数の符号化レイヤに入力されたスペクトルデータを分割して生成された複数のサブバンドに対する近傍探索を行うことにより得られたラティスベクトルを用いた、前記複数のサブバンド毎のマルチレートインデキシングを行って得られた結果を示すインデックス情報と、
    前記複数のサブバンド毎に割り当てられた符号化ビット、及び、前記複数のサブバンド毎のエネルギであるサブバンドエネルギを用いて、前記複数のサブバンドのうち、前記マルチレートインデキシングにおいて前記複数のサブバンド毎に割り当てられた符号化ビット数の合計が予め設定された値以下となるサブバンドの選択範囲であり、かつ、前記複数のサブバンド毎のエネルギであるサブバンドエネルギの合計が最大となる前記サブバンドの選択範囲であり、かつ、前記サブバンドを周波数の昇順または降順に並べた場合の連続するサブバンドの集合である、特定サブバンド群を示す帯域符号化情報と、を受信する受信手段と、
    前記複数の符号化レイヤのうち一部の符号化レイヤのみに対して復号処理が行われる場合、前記インデックス情報のうち、前記帯域符号化情報に示される前記特定サブバンド群に対応する部分のみを復号して復号信号を生成する復号手段と、
    を具備する復号装置。
  11. 前記受信手段は、前記符号化装置において前記特定サブバンド群に対応する部分が先頭に位置するように並び替えられた前記インデックス情報を受信し、
    前記複数の符号化レイヤに対して復号処理が行われる場合、前記インデックス情報に対して、前記符号化装置における並び替え処理と逆の並び替え処理を行い、前記複数の符号化レイヤのうち一部の符号化レイヤのみに対して復号処理が行われる場合、前記インデックス情報に対して並び替え処理を行わない調整手段、を更に具備する、
    請求項10記載の復号装置。
  12. 請求項10記載の復号装置を具備する通信端末装置。
  13. 請求項10記載の復号装置を具備する基地局装置。
  14. 符号化処理をまとめて行う複数の符号化レイヤを有する符号化装置における符号化方法であって、
    前記複数の符号化レイヤに入力されるスペクトルデータを分割して複数のサブバンドを生成し、前記複数のサブバンドに対して近傍探索を行うことにより、前記複数のサブバンドのスペクトルのラティスベクトルを算出する探索ステップと、
    前記ラティスベクトルを用いて、前記複数のサブバンド毎にマルチレートインデキシングを行い、前記複数のサブバンド毎のマルチレートインデキシングの結果を示すインデックス情報を生成するマルチレートインデキシングステップと、
    前記インデックス情報において前記複数のサブバンド毎に割り当てられる符号化ビット数、及び、前記複数のサブバンド毎のエネルギであるサブバンドエネルギを用いて、前記複数のサブバンドのうち、前記符号化ビット数の合計が予め設定された値以下となるサブバンドの選択範囲であり、かつ、前記サブバンドエネルギの合計が最大となる前記サブバンドの選択範囲であり、かつ、前記サブバンドを周波数の昇順または降順に並べた場合の連続するサブバンドの集合を、前記複数の符号化レイヤにおける、特定サブバンド群として決定し、前記特定サブバンド群を示す情報を帯域符号化情報として出力する選択ステップと、
    前記インデックス情報および前記帯域符号化情報を多重化し、出力する出力ステップと、
    を具備する符号化方法。
  15. 符号化処理をまとめて行う複数の符号化レイヤを有する符号化装置からの信号を復号する復号装置における復号方法であって、
    前記符号化装置で生成された、
    前記複数の符号化レイヤに入力されたスペクトルデータを分割して生成された複数のサブバンドに対する近傍探索を行うことにより得られたラティスベクトルを用いた、前記複数のサブバンド毎のマルチレートインデキシングを行って得られた結果を示すインデックス情報と、
    前記複数のサブバンド毎に割り当てられた符号化ビット、及び、前記複数のサブバンド毎のエネルギであるサブバンドエネルギを用いて、前記複数のサブバンドのうち、前記マルチレートインデキシングにおいて前記複数のサブバンド毎に割り当てられた符号化ビット数の合計が予め設定された値以下となるサブバンドの選択範囲であり、かつ、前記複数のサブバンド毎のエネルギであるサブバンドエネルギの合計が最大となる前記サブバンドの選択範囲であり、かつ、前記サブバンドを周波数の昇順または降順に並べた場合の連続するサブバンドの集合である、特定サブバンド群を示す帯域符号化情報と、を受信する受信ステップと、
    前記複数の符号化レイヤのうち一部の符号化レイヤのみに対して復号処理が行われる場合、前記インデックス情報のうち、前記帯域符号化情報に示される前記特定サブバンド群に対応する部分のみを復号して復号信号を生成する復号ステップと、
    を具備する復号方法。
JP2012511525A 2010-04-19 2011-04-01 符号化装置、復号装置、符号化方法及び復号方法 Active JP5714002B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012511525A JP5714002B2 (ja) 2010-04-19 2011-04-01 符号化装置、復号装置、符号化方法及び復号方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2010096095 2010-04-19
JP2010096095 2010-04-19
PCT/JP2011/001986 WO2011132368A1 (ja) 2010-04-19 2011-04-01 符号化装置、復号装置、符号化方法及び復号方法
JP2012511525A JP5714002B2 (ja) 2010-04-19 2011-04-01 符号化装置、復号装置、符号化方法及び復号方法

Publications (2)

Publication Number Publication Date
JPWO2011132368A1 JPWO2011132368A1 (ja) 2013-07-18
JP5714002B2 true JP5714002B2 (ja) 2015-05-07

Family

ID=44833913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012511525A Active JP5714002B2 (ja) 2010-04-19 2011-04-01 符号化装置、復号装置、符号化方法及び復号方法

Country Status (4)

Country Link
US (1) US9508356B2 (ja)
EP (1) EP2562750B1 (ja)
JP (1) JP5714002B2 (ja)
WO (1) WO2011132368A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9076434B2 (en) 2010-06-21 2015-07-07 Panasonic Intellectual Property Corporation Of America Decoding and encoding apparatus and method for efficiently encoding spectral data in a high-frequency portion based on spectral data in a low-frequency portion of a wideband signal
KR101398189B1 (ko) * 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
EP2898506B1 (en) 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
CN104282312B (zh) 2013-07-01 2018-02-23 华为技术有限公司 信号编码和解码方法以及设备
WO2015049820A1 (ja) 2013-10-04 2015-04-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法
US10559315B2 (en) 2018-03-28 2020-02-11 Qualcomm Incorporated Extended-range coarse-fine quantization for audio coding
US10762910B2 (en) 2018-06-01 2020-09-01 Qualcomm Incorporated Hierarchical fine quantization for audio coding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219197A (ja) * 1998-02-02 1999-08-10 Fujitsu Ltd オーディオ信号符号化方法及び装置
WO2007063913A1 (ja) * 2005-11-30 2007-06-07 Matsushita Electric Industrial Co., Ltd. サブバンド符号化装置およびサブバンド符号化方法
JP2008224902A (ja) * 2007-03-09 2008-09-25 Fujitsu Ltd 符号化装置および符号化方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0551705A3 (en) * 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
JP3307138B2 (ja) * 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
KR100738077B1 (ko) * 2005-09-28 2007-07-12 삼성전자주식회사 계층적 오디오 부호화 및 복호화 장치와 방법
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
AU2007332508B2 (en) * 2006-12-13 2012-08-16 Iii Holdings 12, Llc Encoding device, decoding device, and method thereof
FR2912249A1 (fr) * 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
RU2441286C2 (ru) * 2007-06-22 2012-01-27 Войсэйдж Корпорейшн Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов
US8428957B2 (en) * 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
EP2215629A1 (en) * 2007-11-27 2010-08-11 Nokia Corporation Multichannel audio coding
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP2254110B1 (en) * 2008-03-19 2014-04-30 Panasonic Corporation Stereo signal encoding device, stereo signal decoding device and methods for them
JP5383676B2 (ja) * 2008-05-30 2014-01-08 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
JP2010096095A (ja) 2008-10-16 2010-04-30 Nippon Soken Inc 内燃機関装置およびこれを備える車両並びに内燃機関装置の始動制御方法
RU2468451C1 (ru) * 2008-10-29 2012-11-27 Долби Интернэшнл Аб Защита от ограничения сигнала с использованием заранее существующих метаданных коэффициента усиления аудиосигнала
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219197A (ja) * 1998-02-02 1999-08-10 Fujitsu Ltd オーディオ信号符号化方法及び装置
WO2007063913A1 (ja) * 2005-11-30 2007-06-07 Matsushita Electric Industrial Co., Ltd. サブバンド符号化装置およびサブバンド符号化方法
JP2008224902A (ja) * 2007-03-09 2008-09-25 Fujitsu Ltd 符号化装置および符号化方法

Also Published As

Publication number Publication date
EP2562750B1 (en) 2020-06-10
WO2011132368A1 (ja) 2011-10-27
US20130035943A1 (en) 2013-02-07
JPWO2011132368A1 (ja) 2013-07-18
US9508356B2 (en) 2016-11-29
EP2562750A4 (en) 2014-07-30
EP2562750A1 (en) 2013-02-27

Similar Documents

Publication Publication Date Title
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
CA2679192C (en) Speech encoding device, speech decoding device, and method thereof
JP5714002B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
JP5058152B2 (ja) 符号化装置および符号化方法
JP5511785B2 (ja) 符号化装置、復号装置およびこれらの方法
JPWO2007132750A1 (ja) Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
JPWO2007114290A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
US20120221344A1 (en) Encoder apparatus, decoder apparatus and methods of these
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2012035781A1 (ja) 量子化装置及び量子化方法
JP5606457B2 (ja) 符号化装置および符号化方法
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ
JP5544371B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法
CN112352277B (zh) 编码装置及编码方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131128

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20140605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150310

R150 Certificate of patent or registration of utility model

Ref document number: 5714002

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150