JP5724338B2 - 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム - Google Patents

符号化装置および符号化方法、復号装置および復号方法、並びにプログラム Download PDF

Info

Publication number
JP5724338B2
JP5724338B2 JP2010270544A JP2010270544A JP5724338B2 JP 5724338 B2 JP5724338 B2 JP 5724338B2 JP 2010270544 A JP2010270544 A JP 2010270544A JP 2010270544 A JP2010270544 A JP 2010270544A JP 5724338 B2 JP5724338 B2 JP 5724338B2
Authority
JP
Japan
Prior art keywords
encoded data
audio signal
scale factor
concealment
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010270544A
Other languages
English (en)
Other versions
JP2012118462A (ja
Inventor
戸栗 康裕
康裕 戸栗
松本 淳
淳 松本
前田 祐児
祐児 前田
鈴木 志朗
志朗 鈴木
松村 祐樹
祐樹 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010270544A priority Critical patent/JP5724338B2/ja
Priority to US13/303,443 priority patent/US8626501B2/en
Priority to CN201110380792.6A priority patent/CN102486923B/zh
Publication of JP2012118462A publication Critical patent/JP2012118462A/ja
Application granted granted Critical
Publication of JP5724338B2 publication Critical patent/JP5724338B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、符号化装置および符号化方法、復号装置および復号方法、並びにプログラムに関し、特に、より自然な音のコンシールメント用のオーディオ信号を生成することができるようにした符号化装置および符号化方法、復号装置および復号方法、並びにプログラムに関する。
近年、オーディオ信号をディジタル化し、その結果得られるディジタル信号を圧縮・符号化して、伝送したり保存したりすることが多い。オーディオ信号の符号化は、主に波形符号化と分析合成符号化に分類される。波形符号化には、帯域分割フィルタを用いてオーディオ信号を複数の周波数成分に分割し、符号化する帯域分割符号化や、ディジタルオーディオ信号を所定のブロック単位で時間-周波数変換し、その結果得られるスペクトルを符号化する変換符号化などがある。波形符号化では、帯域分割フィルタや時間-周波数変換によって周波数成分に分割されたオーディオ信号に対して所定の帯域毎に量子化が行われ、いわゆる聴覚マスキング効果などを利用した高能率な符号化が行われる。
図1は、変換符号化を行う符号化装置の構成の一例を示すブロック図である。
図1の符号化装置10は、時間‐周波数変換部11、スペクトル正規化部12、スペクトル量子化部13、エントロピー符号化部14、スケールファクタ符号化部15、および多重化部16により構成される。
符号化装置10の時間‐周波数変換部11には、時間信号であるオーディオ信号が入力される。時間‐周波数変換部11は、入力されたオーディオ信号に対して所定のフレーム単位でMDCT(Modified Discrete Cosine Transform)(修正コサイン変換)などの時間−周波数変換を行う。時間‐周波数変換部11は、その結果得られるフレーム単位の周波数スペクトル係数(MDCT係数)をスペクトル正規化部12に供給する。
スペクトル正規化部12は、時間‐周波数変換部11から供給されるフレーム単位の周波数スペクトル係数を、所定の帯域幅の量子化単位(量子化ユニット)ごとにグルーピングする。スペクトル正規化部12は、グルーピングされた量子化ユニットの周波数スペクトル係数を、以下の式(1)により、所定のステップ幅の係数2-λ×SF[n]を用いてフレーム単位で正規化する。
XNorm(k)=X(k)×2-λ×SF[n]
・・・(1)
なお、式(1)において、X(k)は、n番目の量子化ユニットのk番目の周波数スペクトル係数を表し、XNorm(k)は、正規化された周波数スペクトル係数を表す。また、λは、ステップ幅を決定する値であり、例えば、λ=0.5である場合ステップ幅は3dBとなる。ここでは、ステップ幅λはフレームによらず一定であるものとする。また、ここでは、係数2-λ×SF[n]に関する情報としての指数インデックスSF[n](整数)をスケールファクタという。
スペクトル正規化部12は、以上のようにして正規化されたフレーム単位の周波数スペクトル係数をスペクトル量子化部13に供給し、正規化に用いられたフレーム単位のスケールファクタをスケールファクタ符号化部15に供給する。
スペクトル量子化部13は、スペクトル正規化部12から供給される正規化されたフレーム単位の周波数スペクトル係数を所定のビット数で量子化し、量子化されたフレーム単位の周波数スペクトル係数をエントロピー符号化部14に供給する。また、スペクトル量子化部13は、正規化されたフレーム単位の周波数スペクトル係数の各量子化ユニットの量子化時のビット数を表す量子化情報を多重化部16に供給する。
エントロピー符号化部14は、スペクトル量子化部13から供給される量子化されたフレーム単位の周波数スペクトル係数を、ハフマン符号化や算術符号化などによって可逆圧縮し、その結果得られるフレーム単位の周波数スペクトル係数を符号化スペクトルデータとして多重化部16に供給する。
スケールファクタ符号化部15は、スペクトル正規化部12から供給されるフレーム単位のスケールファクタを符号化する。スケールファクタ符号化部15は、符号化されたフレーム単位のスケールファクタを符号化スケールファクタとして多重化部16に供給する。
多重化部16は、エントロピー符号化部14からの符号化スペクトルデータ、スケールファクタ符号化部15からの符号化スケールファクタ、およびスペクトル量子化部13からの量子化情報を多重化し、フレーム単位の符号化データを生成する。多重化部16は、その符号化データを出力する。
ところで、上述したような符号化装置10において、フレームのビット数が符号化に必要なビット数より少ない、リアルタイム処理可能な時間より多くの時間を符号化に要するなどの原因で、符号化エラーが発生することがある。このような場合、再符号化を行うことは不可能であるため、不定なデータが符号化データとして出力されないように、その不定なデータの代わりにコンシールメント用の符号化データを出力するエラーコンシールメント手段が必要である。
エラーコンシールメント手段としては、例えば、制限時間内に符号化が終了しない場合に、符号化対象のフレームの符号化データの代わりに、そのフレームの前のフレームの符号化データをコンシールメント用の符号化データとして出力するものが提案されている(例えば、特許文献1参照)。
また、エラーコンシールメント手段としては、無音信号などを符号化することにより予めコンシールメント用の符号化データを用意しておき、その符号化データを符号化エラーが発生したフレームの符号化データの代わりに出力するものも提案されている(例えば、特許文献2参照)。
一方、復号時に符号化データの同期異常が検出された場合、その符号化データの代わりに、予め記憶されている無音の符号化データをコンシールメント用の符号化データとして出力する音声圧縮伝送装置が提案されている(例えば、特許文献3参照)。
また、外部からのミュート指示にしたがって、符号化データを予め作成された無音の符号化データに置き換えて出力する装置が提案されている(例えば、特許文献4参照)。
特許第3463592号 特開2003−5798号 特許第2731514号 特開平9−294077号
しかしながら、特許文献1に記載されているようなエラーコンシールメント手段では、符号化対象のオーディオ信号のレベルの時間変化が大きい場合、コンシールメント用の符号化データの信号レベルは、符号化エラーが発生したフレームの本来の符号化データの信号レベルとは大きく異なる。その結果、コンシールメント用の符号化データの復号結果として、不自然な音のオーディオ信号が生成される場合がある。
また、特許文献2に記載されているようなエラーコンシールメント手段では、コンシールメント用の符号化データの信号レベルと、符号化エラーが発生したフレームの本来の符号化データの信号レベルが大きく異なる。その結果、コンシールメント用の符号化データの復号結果として、異音や不連続で不自然な音のオーディオ信号が生成される場合がある。
本発明は、このような状況に鑑みてなされたものであり、より自然な音のコンシールメント用のオーディオ信号を生成することができるようにするものである。
本発明の第1の側面の符号化装置は、オーディオ信号を時間周波数変換し、周波数スペクトル係数を生成する時間周波数変換手段と、前記時間周波数変換手段により生成された前記周波数スペクトル係数を正規化し、正規化された前記周波数スペクトル係数と、その正規化に用いられたスケールファクタからなる符号化データを生成する正規化手段と、前記オーディオ信号のレベルを計算するレベル計算手段と、前記レベル計算手段により計算された前記オーディオ信号のレベルに基づいて、微小ノイズ信号を時間周波数変換し、正規化することによって得られるコンシールメント用の符号化データに含まれるスケールファクタを変更するスケールファクタ変更手段と、前記オーディオ信号の符号化時にエラーが発生しない場合、前記正規化手段により生成された前記オーディオ信号の前記符号化データを出力し、前記オーディオ信号の符号化時にエラーが発生した場合、前記スケールファクタ変更手段により前記スケールファクタが変更された前記コンシールメント用の符号化データを、そのオーディオ信号の前記符号化データとして出力する出力手段とを備える符号化装置である。
本発明の第1の側面の符号化方法およびプログラムは、本発明の第1の側面の符号化装置に対応する。
本発明の第1の側面においては、オーディオ信号が時間周波数変換されて、周波数スペクトル係数が生成され、前記周波数スペクトル係数が正規化されて、正規化された前記周波数スペクトル係数と、その正規化に用いられたスケールファクタからなる符号化データが生成され、前記オーディオ信号のレベルが計算され、前記オーディオ信号のレベルに基づいて、微小ノイズ信号を時間周波数変換し、正規化することによって得られるコンシールメント用の符号化データに含まれるスケールファクタが変更され、前記オーディオ信号の符号化時にエラーが発生しない場合、生成された前記オーディオ信号の前記符号化データが出力され、前記オーディオ信号の符号化時にエラーが発生した場合、前記スケールファクタ変更手段により前記スケールファクタが変更された前記コンシールメント用の符号化データが、そのオーディオ信号の前記符号化データとして出力される。
本発明の第2の側面の復号装置は、オーディオ信号の符号化時にエラーが発生しない場合、そのオーディオ信号を時間周波数変換し、正規化することによって生成された、正規化された周波数スペクトル係数と、その正規化に用いられたスケールファクタからなる符号化データを出力し、前記オーディオ信号の符号化時にエラーが発生した場合、微小ノイズ信号を時間周波数変換し、正規化することによって得られるコンシールメント用の符号化データに含まれるスケールファクタを、そのオーディオ信号のレベルに基づいて変更し、そのオーディオ信号の前記符号化データとして出力する符号化装置から供給される前記符号化データに含まれる前記スケールファクタを用いて、その符号化データに含まれる前記正規化された周波数スペクトル係数を逆正規化する逆正規化手段と、前記逆正規化手段により逆正規化された結果得られる前記周波数スペクトル係数を周波数時間変換する周波数時間変換手段とを備える復号装置である。
本発明の第2の側面の復号方法およびプログラムは、本発明の第2の側面の復号装置に対応する。
本発明の第2の側面においては、オーディオ信号の符号化時にエラーが発生しない場合、そのオーディオ信号を時間周波数変換し、正規化することによって生成された、正規化された周波数スペクトル係数と、その正規化に用いられたスケールファクタからなる符号化データを出力し、前記オーディオ信号の符号化時にエラーが発生した場合、微小ノイズ信号を時間周波数変換し、正規化することによって得られるコンシールメント用の符号化データに含まれるスケールファクタを、そのオーディオ信号のレベルに基づいて変更し、そのオーディオ信号の前記符号化データとして出力する符号化装置から供給される前記符号化データに含まれる前記スケールファクタを用いて、その符号化データに含まれる前記正規化された周波数スペクトル係数が逆正規化され、逆正規化された結果得られる前記周波数スペクトル係数が周波数時間変換される。
本発明の第1の側面によれば、より自然な音のコンシールメント用のオーディオ信号の符号化データを生成することができる。
また、本発明の第2の側面によれば、より自然な音のコンシールメント用のオーディオ信号を生成することができる。
従来の符号化装置の構成の一例を示すブロック図である。 本発明を適用した符号化装置の一実施の形態の構成例を示すブロック図である。 コンシールメント符号化データのフレーム構造の例を示す図である。 符号化スケールファクタの変更を説明する図である。 図2の符号化装置による符号化処理を説明するフローチャートである。 復号装置の構成例を示すブロック図である。 図6の復号装置による復号処理を説明するフローチャートである。 復号装置の他の構成例を示すブロック図である。 符号化データの比較を説明する図である。 図8の復号装置による復号処理を説明するフローチャートである。 コンピュータの一実施の形態の構成例を示すブロック図である。
<一実施の形態>
[符号化装置の一実施の形態の構成例]
図2は、本発明を適用した符号化装置の一実施の形態の構成例を示すブロック図である。
図2に示す構成のうち、図1の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図2の符号化装置30の構成は、主に、エラー検出部31、信号レベル計算部32、符号化スケールファクタ置換部33、および代替符号化データ出力部34が新たに設けられている点、および、スケールファクタ符号化部15、多重化部16の代わりにスケールファクタ符号化部35、多重化部36が設けられている点が図1の構成と異なる。符号化装置30は、符号化エラーが発生した場合、オーディオ信号のレベルに基づいて、フレーム単位のコンシールメント用のオーディオ信号の符号化データ(以下、コンシールメント符号化データという)を生成する。
具体的には、符号化装置30のエラー検出部31は、符号化においてエラーが発生したかどうか、および、符号化時間が所定の時間(例えば、リアルタイム処理可能な時間)を超過しているかどうかをフレーム単位で判定する。エラー検出部31は、判定結果に基づいて符号化エラーを検出し、検出結果を信号レベル計算部32と多重化部36に供給する。
信号レベル計算部32は、エラー検出部31からの検出結果に応じて、スペクトル正規化部12により得られるフレーム単位のスケールファクタの平均値、最大値、最小値などを、符号化対象のフレームのオーディオ信号のスペクトルレベルとして計算する。信号レベル計算部32は、計算されたスペクトルレベルを符号化スケールファクタ置換部33に供給する。
符号化スケールファクタ置換部33には、予め符号化装置30の図示せぬメモリに記憶されている、コンシールメント符号化データが入力される。コンシールメント符号化データとしては、例えば、微小ノイズ信号をコンシールメント用のオーディオ信号として、符号化装置30に入力されるオーディオ信号と同様に符号化された、符号化装置30が処理可能な最小のフレーム長(ビット数)のデータが用いられる。
符号化スケールファクタ置換部33は、スケールファクタ変更手段として機能し、信号レベル計算部32から供給されるスペクトルレベルに基づいて、コンシールメント符号化データ内の符号化スケールファクタを変更する。符号化スケールファクタ置換部33は、符号化スケールファクタが変更されたコンシールメント符号化データを代替符号化データ出力部34に供給する。また、符号化スケールファクタ置換部33は、変更後の符号化スケールファクタに対応するスケールファクタをスケールファクタ符号化部35に供給して保持させる。
代替符号化データ出力部34は、符号化スケールファクタ置換部33から供給されるコンシールメント符号化データのビット数が出力ビットレートに対応するように、コンシールメント符号化データをパディングする。
コンシールメント符号化データは、符号化装置30が処理可能な最小のフレーム長のデータであるので、代替符号化データ出力部34は、パディングを行うことにより任意の出力ビットレートに対応するフレーム長のコンシールメント符号化データを生成することができる。従って、符号化装置30は、フレーム長ごとに、コンシールメント符号化データを保持する必要がなく、コンシールメント符号化データを保持する図示せぬメモリを節約することができる。
代替符号化データ出力部34は、パディングされたコンシールメント符号化データを多重化部36に供給する。
スケールファクタ符号化部35は、スペクトル正規化部12から供給されるフレーム単位のスケールファクタを、保持している過去のフレームのスケールファクタを用いてフレーム間予測符号化する。このように、スケールファクタ符号化部35は、スケールファクタをフレーム間予測符号化するので、符号化効率を向上させることができる。
スケールファクタ符号化部35は、フレーム間予測符号化されたフレーム単位のスケールファクタを符号化スケールファクタとして多重化部36に供給する。また、スケールファクタ符号化部35は、スペクトル正規化部12から供給されるフレーム単位のスケールファクタ、または、符号化スケールファクタ置換部33から供給されるスケールファクタを、過去のフレームのスケールファクタとして保持する。
多重化部36は、エラー検出部31から供給される検出結果に応じて、エントロピー符号化部14からの符号化スペクトルデータ、スケールファクタ符号化部15からの符号化スケールファクタ、およびスペクトル量子化部13からの量子化情報を多重化し、フレーム単位の符号化データを生成する。多重化部36は、出力手段として機能し、エラー検出部31からの検出結果に応じて、生成されたフレーム単位の符号化データを出力するか、または、代替符号化データ出力部34から供給されるパディングされたコンシールメント符号化データを、符号化エラーが発生したフレームの符号化データとして出力する。多重化部16から出力される符号化データおよびコンシールメント符号化データは、例えば、図示せぬ出力バッファに一時的に保持され、他の装置に送信される。
なお、符号化エラーが、フレームのビット数が符号化に必要なビット数より少ない、符号化時間が所定の時間を超過しているなどによるものである場合、符号化エラーは、複雑なビットアロケーションを行う量子化時に発生しやすい。従って、符号化エラーの検出時にフレーム単位のスケールファクタは計算済みである場合が多い。よって、本実施の形態では、信号レベル計算部32が、フレーム単位のスケールファクタを用いて、スペクトルレベルを計算するものとする。
しかしながら、符号化エラーの検出時にフレーム単位のスケールファクタがまだ計算されていない場合には、符号化エラーの検出時に得られているフレーム単位の周波数スペクトル係数やオーディオ信号そのものを用いてスペクトルレベルが計算される。例えば、符号化エラーの検出時にフレーム単位の周波数スペクトル係数まで計算されている場合、その周波数スペクトル係数の平均値や最大値が、スペクトルレベルとして計算される。また、符号化エラーの検出時にフレーム単位のオーディオ信号しか得られていない場合、そのオーディオ信号の時間サンプルの最大値、平均値、エネルギーなどに対して、時間-周波数変換部11による時間-周波数変換に応じた適切なスケーリングが行われ、スペクトルレベルとされる。
[コンシールメント符号化データのフレーム構造の例]
図3は、コンシールメント符号化データのフレーム構造の例を示す図である。
図3に示すように、コンシールメント符号化データには、フレームごとに、コンシールメント用のオーディオ信号のスケールファクタの符号化モード、符号化スケールファクタ、量子化情報、符号化スペクトルなどが多重化されている。
スケールファクタの符号化モードとしては、例えば、オフセット値とそのオフセット値からの差分に符号化するオフセットモード、量子化ユニット間予測符号化を行う量子化ユニット間予測モード、フレーム間予測符号化を行うフレーム間予測モード、チャンネル間予測符号化を行うチャンネル間予測モードなどがある。
本実施の形態では、コンシールメント用のオーディオ信号のスケールファクタが、オフセットモードで符号化される。従って、コンシールメント符号化データの符号化スケールファクタは、図3に示すように、オフセット値sf_offset(整数)、以下の式(2)で定義される差分情報ΔSF[n]のビット数N、および差分情報ΔSF[n]により構成される。
ΔSF[n]=SFec[n]-sf_offset
・・・(2)
なお、式(2)において、SFec[n]は、n番目の量子化ユニットのコンシールメント用のオーディオ信号のスケールファクタを表す。また、コンシールメント用のオーディオ信号は、微小なノイズ信号であるので、差分ΔSF[n]は十分に小さく、N=2程度である。
また、図示は省略するが、本来のオーディオ信号の符号化データのフレーム構造も、図3のコンシールメント符号化データと同様に構成される。但し、符号化モードは、フレーム間予測モードであり、符号化スケールファクタには、過去のフレームの各量子化ユニットのスケールファクタとの差分情報などが配置される。
[コンシールメント符号化データのスケールファクタの変更の説明]
図4は、符号化スケールファクタ置換部33によるコンシールメント符号化データの符号化スケールファクタの変更を説明する図である。なお、図4において、横軸は、量子化ユニットの番号nを表し、縦軸は、スケールファクタのレベルを表している。
図4に示すように、符号化装置30に入力されるオーディオ信号のフレーム単位のスケールファクタがSFsig[n]であり、信号レベル計算部32により計算されるスペクトルレベルがSigLevである場合、符号化スケールファクタ置換部33は、符号化スケールファクタのオフセット値sf_offsetを以下の式(3)で表されるオフセット値sf_offset'に変更する。
sf_offset'=SigLev-A
・・・(3)
なお、式(3)において、Aは、コンシールメント用のオーディオ信号のレベル調整のための整数である。整数Aは、図4に示すように、コンシールメント用のオーディオ信号の補正後のスケールファクタSF'ec[n]がスペクトルレベルSigLevより若干(数dB)下回るように設定されることが望ましい。
オフセット値sf_offsetがオフセット値sf_offset'に変更されると、コンシールメント用のオーディオ信号の変更後のスケールファクタSF'ec[n]は、以下の式(4)に示すようになる。
SF'ec[n]=ΔSF[n]+sf_offset'
・・・(4)
以上のように、コンシールメント符号化データの符号化スケールファクタでは、フレーム単位のコンシールメント用のオーディオ信号の各量子化ユニットのスケールファクタSFec[n]が、オフセット値sf_offsetとの差分ΔSF[n]で表される。従って、符号化スケールファクタ置換部33は、オフセット値sf_offsetを変更するだけで、フレーム単位のコンシールメント用のオーディオ信号の全量子化ユニットのスケールファクタを容易に変更することができる。また、符号化スケールファクタ置換部33は、オフセット値sf_offsetだけを変更するので、差分情報ΔSF[n]のビット数Nおよび差分情報ΔSF[n]は変化しない。
[符号化装置の処理の説明]
図5は、図2の符号化装置30による符号化処理を説明するフローチャートである。この符号化処理は、フレーム単位のオーディオ信号を順に符号化対象として、フレームごとに行われる。
図5のステップS11において、符号化装置30は、符号化対象の符号化を開始する。具体的には、時間‐周波数変換部11、スペクトル正規化部12、スペクトル量子化部13、エントロピー符号化部14、およびスケールファクタ符号化部35による処理が開始される。なお、符号化対象が最初のフレームのオーディオ信号である場合、符号化装置30の初期化が行われた後、符号化が行われる。
ステップS12において、エラー検出部31は、符号化エラーが検出されたかどうかを判定する。具体的には、エラー検出部31は、符号化においてエラーが発生したかどうか、および、符号化時間が所定の時間(例えば、リアルタイム処理可能な時間)を超過しているかどうかを判定する。符号化においてエラーが発生したか、または、符号化時間が所定の時間を超過している場合、ステップS12で符号化エラーが検出されたと判定され、エラー検出部31は、符号化エラーの検出を表す検出結果を信号レベル計算部32と多重化部36に供給する。
そして、ステップS13において、符号化装置30は、符号化対象の符号化を停止し、以下のステップS14乃至S19のエラーコンシールメント処理を行う。
具体的には、ステップS14において、信号レベル計算部32は、エラー検出部31からの検出結果に応じて、スペクトル正規化部12により得られるフレーム単位のスケールファクタの平均値、最大値、最小値などをスペクトルレベルとして計算する。信号レベル計算部32は、計算されたスペクトルレベルを符号化スケールファクタ置換部33に供給する。
ステップS15において、符号化スケールファクタ置換部33は、信号レベル計算部32から供給されるスペクトルレベルに基づいて、上述した式(3)により、オフセット値sf_offset'を計算する。
ステップS16において、符号化スケールファクタ置換部33は、オフセット値sf_offset'に基づいて、コンシールメント符号化データ内の符号化スケールファクタのオフセット値を変更する。符号化スケールファクタ置換部33は、オフセット値が変更されたコンシールメント符号化データを代替符号化データ出力部34に供給する。
ステップS17において、代替符号化データ出力部34は、符号化スケールファクタ置換部33から供給されるコンシールメント符号化データのビット数が出力ビットレートに対応するように、コンシールメント符号化データに対してパディングを行う。そして、代替符号化データ出力部34は、パディングされたコンシールメント符号化データを多重化部36に供給する。
ステップS18において、多重化部36は、エラー検出部31から供給される検出結果に応じて、代替符号化データ出力部34から供給されるパディングされたコンシールメント符号化データを、符号化対象の符号化データとして出力する。
ステップS19において、符号化スケールファクタ置換部33は、ステップS16の処理でオフセット値が変更された符号化スケールファクタに対応する、上述した式(4)で表されるスケールファクタSF'ec[n]を、スケールファクタ符号化部35に供給し、保持させる。
その結果、スケールファクタ符号化部35に保持されるスケールファクタSFsig[n]は、以下の式(5)で表される。
SFsig[n]=SF'ec[n]=ΔSF[n]+sf_offset'
・・・(5)
このように、符号化エラーが発生した場合であっても、符号化対象の符号化データとされるコンシールメント符号化データのスケールファクタがスケールファクタ符号化部35に保持されるので、スケールファクタ符号化部35は、次のフレームの符号化時に、保持しているスケールファクタを用いてフレーム間予測符号化を正確に行うことができる。
一方、符号化においてエラーが発生しておらず、符号化時間が所定の時間を超過していない場合、ステップS12で符号化エラーが検出されていないと判定される。そして、エラー検出部31は、符号化エラーが検出されていないことを表す検出結果を信号レベル計算部32と多重化部36に供給する。
そして、ステップS20において、符号化装置30は、符号化対象の符号化が終了したかどうかを判定し、符号化対象の符号化が終了していないと判定した場合、処理はステップS12に戻る。そして、符号化エラーが検出されるか、または、符号化対象の符号化が終了するまで、ステップS12およびステップS20の処理が繰り返される。
ステップS20で符号化対象の符号化が終了したと判定された場合、ステップS21において、多重化部16は、エラー検出部31から供給される検出結果に応じて、符号化により生成された符号化対象の符号化データを出力し、処理を終了する。
以上のように、符号化装置30は、符号化対象のオーディオ信号のレベルに基づいて、コンシールメント符号化データのスケールファクタを変更するので、より自然な音のコンシールメント符号化データを生成することができる。
[復号装置の構成例]
図6は、図2の符号化装置30から出力される符号化データを復号する復号装置の構成例を示すブロック図である。
図6の復号装置50は、逆多重化部51、エントロピー復号部52、スペクトル逆量子化部53、スケールファクタ復号部54、スペクトル逆正規化部55、および周波数‐時間変換部56により構成される。復号装置50は、符号化装置30から出力されるフレーム単位の符号化データを復号し、その結果得られるオーディオ信号を出力する。
具体的には、逆多重化部51は、抽出手段として機能し、符号化装置30から供給されるフレーム単位の符号化データがパディングされている場合、その符号化データから、パディング前の符号化データを抽出する。逆多重化部51は、抽出されたパディング前の符号化データ、または、符号化装置30から供給されるパディングされていないフレーム単位の符号化データを逆多重化し、符号化スペクトルデータ、符号化スケールファクタ、および量子化情報を抽出する。逆多重化部51は、符号化スペクトルデータをエントロピー復号部52に供給し、量子化情報をスペクトル逆量子化部53に供給する。また、逆多重化部51は、符号化スケールファクタをスケールファクタ復号部54に供給する。
エントロピー復号部52は、逆多重化部51から供給される符号化スペクトルデータに対して、ハフマン符号化や算術符号化などの可逆圧縮に対応する可逆復号を行い、その結果得られる量子化されたフレーム単位の周波数スペクトル係数をスペクトル逆量子化部53に供給する。
スペクトル逆量子化部53は、逆多重化部51から供給される量子化情報に基づいて、エントロピー復号部52から供給される量子化されたフレーム単位の周波数スペクトル係数を逆量子化し、正規化されたフレーム単位の周波数スペクトル係数を得る。スペクトル逆量子化部53は、その正規化されたフレーム単位の周波数スペクトル係数をスペクトル逆正規化部55に供給する。
スケールファクタ復号部54は、逆多重化部51から供給される符号化スケールファクタを復号し、フレーム単位のスケールファクタを得る。具体的には、符号化モードがオフセットモードである場合、スケールファクタ復号部54は、符号化スケールファクタに含まれるオフセット値sf_offset'と差分情報ΔSF[n]を用いて、上述した式(4)により、スケールファクタSF'ec[n]を求める。
一方、符号化モードがフレーム間予測モードであある場合、スケールファクタ復号部54は、保持している過去のフレームのスケールファクタを用いて、符号化スケールファクタをフレーム間予測復号する。具体的には、スケールファクタ復号部54は、符号化スケールファクタに含まれる差分情報と、保持している過去のフレームのスケールファクタを加算し、現在のフレームのスケールファクタを求める。スケールファクタ復号部54は、求められたフレーム単位のスケールファクタを保持するとともに、スペクトル逆正規化部55に供給する。
スペクトル逆正規化部55は、スケールファクタ復号部54から供給されるフレーム単位のスケールファクタに基づいて、スペクトル逆量子化部53から供給される正規化されたフレーム単位の周波数スペクトル係数を量子化ユニットごとに逆正規化する。スペクトル逆正規化部55は、逆正規化の結果得られるフレーム単位の周波数スペクトル係数を周波数‐時間変換部56に供給する。
周波数‐時間変換部56は、スペクトル逆正規化部55から供給されるフレーム単位の周波数スペクトル係数に対してIMDCT(Inverse Modified Discrete Cosine Transform)(逆修正コサイン変換)などの周波数‐時間変換を行う。周波数‐時間変換部56は、その結果得られるフレーム単位の時間信号であるオーディオ信号を出力する。
なお、フレーム単位の周波数スペクトル係数に対してIMDCTが行われる場合、各フレームのオーディオ信号は、そのフレームの周波数スペクトル係数に対応するオーディオ信号と、前のフレームの周波数スペクトル係数に対応するオーディオ信号とが重複加算されたものである。
ここで、コンシールメント符号化データのスケールファクタは、上述したように、符号化エラーが発生した際のオーディオ信号のスペクトルレベルに基づいて設定される。従って、コンシールメント用のオーディオ信号のスペクトルレベルは、本来のオーディオ信号のスペクトルレベルと大きく異ならない。よって、コンシールメント用のオーディオ信号は、周波数‐時間変換部56で前後のフレームの周波数スペクトル係数に対応するオーディオ信号と加算されることにより、前後のフレームのオーディオ信号と滑らかに接続される。
[復号処理の説明]
図7は、図6の復号装置50による復号処理を説明するフローチャートである。この復号処理は、例えば、図2の符号装置30から出力されたフレーム単位の符号化データが復号装置50に入力されたときに、開始される。なお、最初のフレームの符号化データの復号処理時には、復号処理の前に復号装置50が初期化される。
図7のステップS31において、逆多重化部51は、符号化装置30から供給されるフレーム単位の符号化データに対して逆多重化を行い、符号化スペクトルデータ、符号化スケールファクタ、および量子化情報を抽出する。なお、符号化装置30から供給されるフレーム単位の符号化データがパディングされている場合には、逆多重化部51は、パディング前の符号化データを抽出した後、逆多重化を行う。逆多重化部51は、符号化スペクトルデータをエントロピー復号部52に供給し、量子化情報をスペクトル逆量子化部53に供給する。また、逆多重化部51は、符号化スケールファクタをスケールファクタ復号部54に供給する。
ステップS32において、エントロピー復号部52は、逆多重化部51から供給される符号化スペクトルデータを、ハフマン符号化や算術符号化などの可逆圧縮に対応する可逆復号する。エントロピー復号部52は、その結果得られる量子化されたフレーム単位の周波数スペクトル係数をスペクトル逆量子化部53に供給する。
ステップS33において、スペクトル逆量子化部53は、逆多重化部51から供給される量子化情報に基づいて、エントロピー復号部52から供給される量子化されたフレーム単位の周波数スペクトル係数を逆量子化する。スペクトル逆量子化部53は、その結果得られる正規化されたフレーム単位の周波数スペクトル係数をスペクトル逆正規化部55に供給する。
ステップS34において、スケールファクタ復号部54は、逆多重化部51から供給される符号化スケールファクタに含まれる符号化モードに応じて、符号化スケールファクタを復号し、スケールファクタを得る。
ステップS35において、スケールファクタ復号部54は、得られたスケールファクタを保持する。このスケールファクタは、現在の復号対象のフレームより後のフレームの符号化スケールファクタの符号化モードがフレーム間予測モードである場合に、その符号化スケールファクタの復号に用いられる。スケールファクタ復号部54はまた、得られたスケールファクタを、スペクトル逆正規化部55に供給する。
ステップS36において、スペクトル逆正規化部55は、スケールファクタ復号部54から供給されるスケールファクタに基づいて、スペクトル逆量子化部53から供給される正規化されたフレーム単位の周波数スペクトル係数を量子化ユニットごとに逆正規化する。スペクトル逆正規化部55は、逆正規化の結果得られるフレーム単位の周波数スペクトル係数を周波数‐時間変換部56に供給する。
ステップS37において、周波数‐時間変換部56は、スペクトル逆正規化部55から供給されるフレーム単位の周波数スペクトル係数に対してIMDCTなどの周波数‐時間変換を行う。
ステップS38において、周波数‐時間変換部56は、周波数‐時間変換の結果得られるフレーム単位の時間信号であるオーディオ信号を出力し、処理を終了する。
以上のように、復号装置50は、コンシールメント符号化データに含まれる、本来のオーディオ信号のスペクトルレベルに基づいて変更された符号化スケールファクタに基づいて、コンシールメント符号化データの正規化された周波数スペクトル係数を逆正規化する。その結果、復号装置50は、本来のオーディオ信号のスペクトルレベルに応じたスペクトルレベルの、自然な音のコンシールメント用のオーディオ信号を復号結果として生成することができる。
[復号装置の他の構成例]
図8は、図2の符号化装置30から出力される符号化データを復号する復号装置の他の構成例を示すブロック図である。
図8に示す構成のうち、図6の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図8の復号装置70の構成は、主に、コンシールメントデータ検出部71とコンシールメントスペクトル生成部72が新たに設けられている点、および、スペクトル逆正規化部55の代わりにスペクトル逆正規化部73が設けられている点が図6の構成と異なる。復号装置70は、符号化装置30から供給されるフレーム単位の符号化データがコンシールメント符号化データである場合、コンシールメント符号化データを復号するのではなく、コンシールメント用のオーディオ信号を新たに生成する。
具体的には、復号装置70のコンシールメントデータ検出部71は、判定手段として機能し、図示せぬメモリに保持されている、符号化装置30に保持されているコンシールメント符号化データと同一のコンシールメント符号化データと、符号化装置30から供給されるフレーム単位の符号化データを比較する。コンシールメントデータ検出部71は、比較結果に基づいて、符号化装置30から供給されるフレーム単位の符号化データがコンシールメント符号化データであるかどうかを判定し、判定結果をコンシールメントスペクトル生成部72に供給する。
コンシールメントスペクトル生成部72は、コンシールメントデータ検出部71からの判定結果に応じて、スペクトル逆量子化部53により得られる正規化されたフレーム単位の周波数スペクトル係数に基づいて、コンシールメント用係数を生成する。なお、コンシールメント用係数とは、復号装置70により生成されるコンシールメント用のオーディオ信号の正規化された周波数スペクトル係数である。コンシールメントスペクトル生成部72は、生成されたコンシールメント用係数をスペクトル逆正規化部73に供給する。
スペクトル逆正規化部73は、スペクトル逆量子化部53からの正規化された周波数スペクトル係数、または、コンシールメントスペクトル生成部72からのコンシールメント用係数を、スケールファクタ復号部54からのスケールファクタに基づいて逆正規化する。スペクトル逆正規化部73は、逆正規化の結果得られる周波数スペクトル係数を周波数-時間変換部56に供給する。その結果、スペクトル逆量子化部53からの正規化された周波数スペクトル係数に対応するオーディオ信号が、本来のオーディオ信号として生成され、コンシールメント用係数に対応するオーディオ信号が、新たなコンシールメント用のオーディオ信号として生成される。
[符号化データの比較の説明]
図9は、図8のコンシールメントデータ検出部71による符号化データの比較を説明する図である。
図9に示すように、図示せぬメモリに保持されているコンシールメント符号化データ、および、符号化装置30から供給されるフレーム単位の符号化データには、フレームごとに、符号化モード、符号化スケールファクタ、量子化情報、符号化スペクトルなどが配置される。
コンシールメントデータ検出部71は、コンシールメント符号化データおよびフレーム単位の符号化データの符号化スケールファクタを除くデータを比較する。なお、コンシールメントデータ検出部71は、符号化スケールファクタを除くデータをまとめて一度で比較してもよいし、分割して段階的に比較するようにしてもよい。
コンシールメントデータ検出部71が、符号化スケールファクタを除くデータを段階的に比較する場合には、まず、図9に示すような、符号化スペクトルのうちの最も特徴的な数バイト程度のデータ(1)をコンシールメント符号化データおよびフレーム単位の符号化データから抽出する。なお、データ(1)としては、例えばパターン出現頻度の低い数バイト程度のデータがある。
次に、コンシールメントデータ検出部71は、コンシールメント符号化データおよびフレーム単位の符号化データのデータ(1)どうしを比較する。データ(1)は数バイト程度のデータであるので、この比較は高速に行うことができる。比較の結果、コンシールメント符号化データおよびフレーム単位の符号化データのデータ(1)どうしが一致していない場合、コンシールメントデータ検出部71は、フレーム単位の符号化データはコンシールメント符号化データではないと判定する。
一方、コンシールメント符号化データおよびフレーム単位の符号化データのデータ(1)どうしが一致している場合、コンシールメントデータ検出部71は、例えば、コンシールメント符号化データおよびフレーム単位の符号化データの符号化スペクトルのうちのデータ(1)以外のデータ(2)どうしを抽出し、比較する。そして、比較の結果、コンシールメント符号化データおよびフレーム単位の符号化データのデータ(2)どうしが一致していない場合、コンシールメントデータ検出部71は、フレーム単位の符号化データはコンシールメント符号化データではないと判定する。
以降も同様にして、コンシールメントデータ検出部71は、コンシールメント符号化データおよびフレーム単位の符号化データの量子化情報(3)を抽出し、比較する。そして、コンシールメントデータ検出部71は、量子化情報(3)どうしが一致している場合、コンシールメント符号化データおよびフレーム単位の符号化データの符号化スケールファクタ、データ(1)、データ(2)、および量子化情報(3)を除くデータ(4)を抽出して比較する。そして、コンシールメント符号化データおよびフレーム単位の符号化データのデータ(1)、データ(2)、量子化情報(3)およびデータ(4)どうしが全て一致した場合、コンシールメントデータ検出部71は、フレーム単位の符号化データはコンシールメント符号化データであると判定する。一方、コンシールメント符号化データおよびフレーム単位の符号化データの量子化情報(3)どうし、または、データ(4)どうしが一致していない場合、コンシールメントデータ検出部71は、フレーム単位の符号化データはコンシールメント符号化データではないと判定する。
以上のように、コンシールメントデータ検出部71は、符号化スケールファクタを除くデータを段階的に比較する場合、コンシールメント符号化データおよびフレーム単位の符号化データのデータ(1)どうし、データ(2)どうし、量子化情報(3)どうし、およびデータ(4)どうしのいずれか1つが一致しない時点で、フレーム単位の符号化データはコンシールメント符号化データではないと判定することができる。従って、コンシールメントデータ検出部71は、フレーム単位の符号化データがコンシールメント符号化データであるかどうかの判定を効率良く行うことができる。
また、コンシールメントデータ検出部71は、符号化スケールファクタを除くデータが全て一致した場合に、フレーム単位の符号化データがコンシールメント符号化データであると判定するので、精度良くコンシールメント符号化データを検出することができる。
なお、データ(2)、量子化情報(3)、およびデータ(4)の比較の順序は、上述した場合に限定されない。
[他の復号処理の説明]
図10は、図8の復号装置70による復号処理を説明するフローチャートである。この復号処理は、例えば、図2の符号装置30から出力されたフレーム単位の符号化データが復号装置70に入力されたときに、開始される。なお、最初のフレームの符号化データの復号処理時には、復号処理の前に復号装置70が初期化される。
図10のステップS51乃至S55の処理は、図7のステップS31乃至S35の処理と同様であるので、説明は省略する。
ステップS55の処理後、ステップS56において、コンシールメントデータ検出部71は、図9で説明したように、復号対象のフレーム単位の符号化データとコンシールメント符号化データの符号化スケールファクタを除くデータどうしを比較する。
ステップS57において、コンシールメントデータ検出部71は、比較結果に基づいて、復号対象のフレーム単位の符号化データがコンシールメント符号化データであるかどうかを判定し、判定結果をコンシールメントスペクトル生成部72に供給する。
ステップS57で復号対象のフレーム単位の符号化データがコンシールメント符号化データではないと判定された場合、処理はステップS58に進む。ステップS58において、スペクトル逆正規化部73は、スペクトル逆量子化部53からの正規化された周波数スペクトル係数を、スケールファクタ復号部54からのスケールファクタに基づいて逆正規化する。スペクトル逆正規化部73は、逆正規化の結果得られる周波数スペクトル係数を周波数-時間変換部56に供給する。そして、処理はステップS61に進む。
一方、ステップS57で復号対象のフレーム単位の符号化データがコンシールメント符号化データであると判定された場合、処理はステップS59に進む。
ステップS59において、コンシールメントスペクトル生成部72は、スペクトル逆量子化部53により得られる正規化された周波数スペクトル係数に基づいて、コンシールメント用係数を生成する。具体的には、コンシールメントスペクトル生成部72は、復号対象のフレームより前のフレームの正規化された周波数スペクトル係数の平均値、復号対象のフレームの直前および直後のフレームの正規化された周波数スペクトル係数の平均値などを、コンシールメント用係数として生成する。
但し、復号対象のフレームより後ろのフレームの正規化された周波数スペクトル係数がコンシールメント用係数の生成に用いられる場合、遅延が発生する。なお、コンシールメント用係数の生成方法は、上述した方法に限定されない。コンシールメントスペクトル生成部72は、生成されたコンシールメント用係数をスペクトル逆正規化部73に供給する。
ステップS60において、スペクトル逆正規化部73は、コンシールメントスペクトル生成部72から供給されるコンシールメント用係数を、スケールファクタ復号部54からのスケールファクタに基づいて逆正規化する。スペクトル逆正規化部73は、逆正規化の結果得られる周波数スペクトル係数を周波数-時間変換部56に供給する。そして、処理はステップS61に進む。
ステップS61およびS62の処理は、図7のステップS37およびS38の処理と同様であるので、説明は省略する。
以上のようなステップS59乃至S61の処理により、復号対象の符号化データがコンシールメント符号化データであると判定された場合、そのコンシールメント符号化データに含まれる符号化スケールファクタと、そのコンシールメント符号化データより前または後の符号化データとが用いられて、新たなコンシールメント用のオーディオ信号が生成される。従って、この場合、コンシールメントスペクトル生成部72、スペクトル逆正規化部73、および周波数-時間変換部56は、新たなコンシールメント用のオーディオ信号を生成する生成手段として機能する。
なお、図10の復号処理では、復号対象がコンシールメント符号化データであっても、本来のオーディオ信号の符号化データであっても、ステップS52およびS53の処理が行われるようにしたが、復号対象がコンシールメント符号化データである場合、ステップS52乃至S53の処理は行われないようにしてもよい。
以上のように、復号装置70は、復号対象のフレーム単位の符号化データとコンシールメント符号化データを比較することにより、復号対象のフレーム単位の符号化データがコンシールメント符号化データであるかどうかを判定する。従って、符号化装置30は、符号化データがコンシールメント符号化データであるかどうかを表すフラグを復号装置70に伝送する必要がなく、伝送ビットを節約することができる。これに対して、符号化データがコンシールメント符号化データであるかどうかを表すフラグを復号装置に伝送する必要がある場合、例えば、符号化データのフォーマットが既に規定されていると、そのフラグを新たなヘッダとして符号化データに付加したり、新たなフォーマットを規定したりする必要がある。
また、復号装置70は、復号対象のフレーム単位の符号化データがコンシールメント符号化データである場合、コンシールメント用係数を生成し、そのコンシールメント用係数に対して、コンシールメント符号化データに含まれる符号化スケールファクタに基づく逆正規化を行う。従って、復号装置70は、コンシールメント用係数を生成するだけで、本来のオーディオ信号のスペクトルレベルに応じたスペクトルレベルの、自然な音のコンシールメント用のオーディオ信号を容易に生成することができる。これに対して、符号化エラーが発生したフレームの本来のオーディオ信号のスペクトルレベルに基づくスケールファクタを用いずに、コンシールメント用のオーディオ信号を生成する復号装置では、演算器やメモリなどの多くのリソースが必要であり、また自然な音のコンシールメント用のオーディオ信号を生成することは困難である。
さらに、復号装置70は、復号対象のフレームより前または後の少なくとも一方のフレームの正規化された周波数スペクトル係数に基づいて、コンシールメント用係数を生成するので、より自然な音のコンシールメント用のオーディオ信号を生成することができる。
本実施の形態では、コンシールメント用のオーディオ信号のスケールファクタの符号化モードがオフセットモードであったが、符号化モードはこれに限定されない。例えば、左チャネルのコンシールメント用のオーディオ信号のスケールファクタの符号化モードが量子化ユニット間予測モードであり、右チャネルのコンシールメント用のオーディオ信号のスケールファクタの符号化モードがチャンネル間予測モードであるようにすることも可能である。
但し、コンシールメント用のオーディオ信号のスケールファクタの符号化モードとしては、フレーム間予測モードが設定されないことが望ましい。フレーム間予測モードが設定されない場合、エラーコンシールメント処理の処理量を低減し、符号化装置30の記憶領域を節約することができる。
また、スケールファクタの符号化モードは、フレームごとに設定されるようにしてもよい。
さらに、上述した符号化データには、符号化スケールファクタが含まれたが、符号化データに含まれる正規化に関する情報は、符号化スケールファクタではなく、正規化に用いられた係数やスケールファクタそのものであってもよい。
[本発明を適用したコンピュータの説明]
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図11は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としての記憶部208やROM(Read Only Memory)202に予め記録しておくことができる。
あるいはまた、プログラムは、リムーバブルメディア211に格納(記録)しておくことができる。このようなリムーバブルメディア211は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブルメディア211としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
なお、プログラムは、上述したようなリムーバブルメディア211からドライブ210を介してコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵する記憶部208にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
コンピュータは、CPU(Central Processing Unit)201を内蔵しており、CPU201には、バス204を介して、入出力インタフェース205が接続されている。
CPU201は、入出力インタフェース205を介して、ユーザによって、入力部206が操作等されることにより指令が入力されると、それに従って、ROM202に格納されているプログラムを実行する。あるいは、CPU201は、記憶部208に格納されたプログラムを、RAM(Random Access Memory)203にロードして実行する。
これにより、CPU201は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU201は、その処理結果を、必要に応じて、例えば、入出力インタフェース205を介して、出力部207から出力、あるいは、通信部209から送信、さらには、記憶部208に記録等させる。
なお、入力部206は、キーボードや、マウス、マイク等で構成される。また、出力部207は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
11 時間-周波数変換部, 12 スペクトル正規化部, 30 符号化装置, 32 信号レベル計算部, 33 符号化スケールファクタ置換部, 35 スケールファクタ符号化部, 36 多重化部, 50 復号装置, 51 逆多重化部, 54 スケールファクタ復号部, 55 スペクトル逆正規化部, 56 周波数-時間変換部, 70 復号装置, 71 コンシールメントデータ検出部, 72 コンシールメントスペクトル生成部, 73 スペクトル逆正規化部

Claims (16)

  1. オーディオ信号を時間周波数変換し、周波数スペクトル係数を生成する時間周波数変換手段と、
    前記時間周波数変換手段により生成された前記周波数スペクトル係数を正規化し、正規化された前記周波数スペクトル係数と、その正規化に用いられたスケールファクタからなる符号化データを生成する正規化手段と、
    前記オーディオ信号のレベルを計算するレベル計算手段と、
    前記レベル計算手段により計算された前記オーディオ信号のレベルに基づいて、微小ノイズ信号を時間周波数変換し、正規化することによって得られるコンシールメント用の符号化データに含まれるスケールファクタを変更するスケールファクタ変更手段と、
    前記オーディオ信号の符号化時にエラーが発生しない場合、前記正規化手段により生成された前記オーディオ信号の前記符号化データを出力し、前記オーディオ信号の符号化時にエラーが発生した場合、前記スケールファクタ変更手段により前記スケールファクタが変更された前記コンシールメント用の符号化データを、そのオーディオ信号の前記符号化データとして出力する出力手段と
    を備える符号化装置。
  2. 前記レベル計算手段は、前記オーディオ信号の前記スケールファクタ平均値、最大値、または最小値を、前記オーディオ信号のレベルとして計算する
    請求項1に記載の符号化装置。
  3. 前記微小ノイズ信号の前記スケールファクタは、オフセット値、および、前記オフセット値と前記スケールファクタの差分に符号化されており、
    前記スケールファクタ変更手段は、前記オフセット値を変更することにより、前記スケールファクタを変更する
    請求項1に記載の符号化装置。
  4. 過去のフレームの前記オーディオ信号の前記スケールファクタまたは前記微小ノイズ信号の変更後の前記スケールファクタを用いて、前記オーディオ信号の前記スケールファクタフレーム間予測符号化するスケールファクタ符号化手段
    をさらに備え、
    前記オーディオ信号の前記符号化データは、前記正規化手段により正規化された前記周波数スペクトル係数と、前記スケールファクタ符号化手段によりフレーム間予測符号化された前記スケールファクタとからなる
    請求項1に記載の符号化装置。
  5. 前記コンシールメント用の符号化データのビット数は、前記符号化装置で処理可能な最小のビット数であり、
    前記出力手段は、前記コンシールメント用の符号化データのビット数が出力ビットレートに対応するように、前記コンシールメント用の符号化データをパディングして出力する
    請求項1に記載の符号化装置。
  6. 符号化装置が、
    オーディオ信号を時間周波数変換し、周波数スペクトル係数を生成する時間周波数変換ステップと、
    前記時間周波数変換ステップの処理により生成された前記周波数スペクトル係数を正規化し、正規化された前記周波数スペクトル係数と、その正規化に用いられたスケールファクタからなる符号化データを生成する正規化ステップと、
    前記オーディオ信号のレベルを計算するレベル計算ステップと、
    前記レベル計算ステップの処理により計算された前記オーディオ信号のレベルに基づいて、微小ノイズ信号を時間周波数変換し、正規化することによって得られるコンシールメント用の符号化データに含まれるスケールファクタを変更するスケールファクタ変更ステップと、
    前記オーディオ信号の符号化時にエラーが発生しない場合、前記正規化ステップの処理により生成された前記オーディオ信号の前記符号化データを出力し、前記オーディオ信号の符号化時にエラーが発生した場合、前記スケールファクタ変更ステップの処理により前記スケールファクタが変更された前記コンシールメント用の符号化データを、そのオーディオ信号の前記符号化データとして出力する出力ステップと
    を含む符号化方法。
  7. コンピュータに、
    オーディオ信号を時間周波数変換し、周波数スペクトル係数を生成する時間周波数変換ステップと、
    前記時間周波数変換ステップの処理により生成された前記周波数スペクトル係数を正規化し、正規化された前記周波数スペクトル係数と、その正規化に用いられたスケールファクタからなる符号化データを生成する正規化ステップと、
    前記オーディオ信号のレベルを計算するレベル計算ステップと、
    前記レベル計算ステップの処理により計算された前記オーディオ信号のレベルに基づいて、微小ノイズ信号を時間周波数変換し、正規化することによって得られるコンシールメント用の符号化データに含まれるスケールファクタを変更するスケールファクタ変更ステップと、
    前記オーディオ信号の符号化時にエラーが発生しない場合、前記正規化ステップの処理により生成された前記オーディオ信号の前記符号化データを出力し、前記オーディオ信号の符号化時にエラーが発生した場合、前記スケールファクタ変更ステップの処理により前記スケールファクタが変更された前記コンシールメント用の符号化データを、そのオーディオ信号の前記符号化データとして出力する出力ステップと
    を含む処理を実行させるためのプログラム。
  8. オーディオ信号の符号化時にエラーが発生しない場合、そのオーディオ信号を時間周波数変換し、正規化することによって生成された、正規化された周波数スペクトル係数と、その正規化に用いられたスケールファクタからなる符号化データを出力し、前記オーディオ信号の符号化時にエラーが発生した場合、微小ノイズ信号を時間周波数変換し、正規化することによって得られるコンシールメント用の符号化データに含まれるスケールファクタを、そのオーディオ信号のレベルに基づいて変更し、そのオーディオ信号の前記符号化データとして出力する符号化装置から供給される前記符号化データに含まれる前記スケールファクタを用いて、その符号化データに含まれる前記正規化された周波数スペクトル係数を逆正規化する逆正規化手段と、
    前記逆正規化手段により逆正規化された結果得られる前記周波数スペクトル係数を周波数時間変換する周波数時間変換手段と
    を備える復号装置。
  9. 前記符号化データと、前記スケールファクタが変更される前の前記コンシールメント用の符号化データである比較用コンシールメント符号化データとを比較することにより、前記符号化データが前記コンシールメント用の符号化データであるかどうかを判定する判定手段
    をさらに備える
    請求項8に記載の復号装置。
  10. 前記判定手段は、前記符号化データのうちの前記正規化された周波数スペクトル係数と、前記比較用コンシールメント符号化データのうちの前記正規化された周波数スペクトル係数とが一致する場合、前記符号化データが前記コンシールメント用の符号化データであると判定する
    請求項9に記載の復号装置。
  11. 前記判定手段により前記符号化データが前記コンシールメント用の符号化データであると判定された場合、そのコンシールメント用の符号化データに含まれる前記スケールファクタと、そのコンシールメント用の符号化データより前の符号化データとを用いて、コンシールメント用のオーディオ信号を生成する生成手段
    をさらに備え、
    前記逆正規化手段は、前記判定手段により前記符号化データが前記コンシールメント用の符号化データではないと判定された場合、その符号化データを逆正規化する
    請求項9に記載の復号装置。
  12. 前記微小ノイズ信号の前記スケールファクタは、オフセット値、および、前記オフセット値と前記スケールファクタの差分に符号化されている
    請求項8に記載の復号装置。
  13. 過去のフレームの前記オーディオ信号の前記スケールファクタまたは前記微小ノイズ信号の変更後の前記スケールファクタを用いて、前記オーディオ信号の前記符号化データに含まれる、フレーム間予測符号化された前記スケールファクタをフレーム間予測復号し、前記オーディオ信号の前記スケールファクタを生成するスケールファクタ復号手段
    をさらに備え
    請求項8に記載の復号装置。
  14. 前記符号化装置から供給される、パディングされた前記コンシールメント用の符号化データから前記コンシールメント用の符号化データを抽出する抽出手段
    をさらに備える
    請求項8に記載の復号装置。
  15. 復号装置が、
    オーディオ信号の符号化時にエラーが発生しない場合、そのオーディオ信号を時間周波数変換し、正規化することによって生成された、正規化された周波数スペクトル係数と、その正規化に用いられたスケールファクタからなる符号化データを出力し、前記オーディオ信号の符号化時にエラーが発生した場合、微小ノイズ信号を時間周波数変換し、正規化することによって得られるコンシールメント用の符号化データに含まれるスケールファクタを、そのオーディオ信号のレベルに基づいて変更し、そのオーディオ信号の前記符号化データとして出力する符号化装置から供給される前記符号化データに含まれる前記スケールファクタを用いて、その符号化データに含まれる前記正規化された周波数スペクトル係数を逆正規化する逆正規化ステップと、
    前記逆正規化ステップの処理により逆正規化された結果得られる前記周波数スペクトル係数を周波数時間変換する周波数時間変換ステップと
    を含む復号方法。
  16. コンピュータに、
    オーディオ信号の符号化時にエラーが発生しない場合、そのオーディオ信号を時間周波数変換し、正規化することによって生成された、正規化された周波数スペクトル係数と、その正規化に用いられたスケールファクタからなる符号化データを出力し、前記オーディオ信号の符号化時にエラーが発生した場合、微小ノイズ信号を時間周波数変換し、正規化することによって得られるコンシールメント用の符号化データに含まれるスケールファクタを、そのオーディオ信号のレベルに基づいて変更し、そのオーディオ信号の前記符号化データとして出力する符号化装置から供給される前記符号化データに含まれる前記スケールファクタを用いて、その符号化データに含まれる前記正規化された周波数スペクトル係数を逆正規化する逆正規化ステップと、
    前記逆正規化ステップの処理により逆正規化された結果得られる前記周波数スペクトル係数を周波数時間変換する周波数時間変換ステップと
    を含む処理を実行させるためのプログラム。
JP2010270544A 2010-12-03 2010-12-03 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム Expired - Fee Related JP5724338B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010270544A JP5724338B2 (ja) 2010-12-03 2010-12-03 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
US13/303,443 US8626501B2 (en) 2010-12-03 2011-11-23 Encoding apparatus, encoding method, decoding apparatus, decoding method, and program
CN201110380792.6A CN102486923B (zh) 2010-12-03 2011-11-25 编码设备、编码方法、解码设备、解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010270544A JP5724338B2 (ja) 2010-12-03 2010-12-03 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2012118462A JP2012118462A (ja) 2012-06-21
JP5724338B2 true JP5724338B2 (ja) 2015-05-27

Family

ID=46152406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010270544A Expired - Fee Related JP5724338B2 (ja) 2010-12-03 2010-12-03 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム

Country Status (3)

Country Link
US (1) US8626501B2 (ja)
JP (1) JP5724338B2 (ja)
CN (1) CN102486923B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6179087B2 (ja) * 2012-10-24 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07183854A (ja) * 1993-12-24 1995-07-21 Matsushita Electric Ind Co Ltd 音声圧縮データ編集装置
JP2731514B2 (ja) 1994-11-18 1998-03-25 株式会社日立製作所 音声圧縮伝送装置
JPH08328599A (ja) * 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
JPH09294077A (ja) 1996-04-26 1997-11-11 Hitachi Ltd 圧縮音声データ処理方法及びデータストリーム再生方法とそれらの装置
DE19730129C2 (de) * 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
JPH11202899A (ja) * 1998-01-13 1999-07-30 Matsushita Electric Ind Co Ltd 再生装置
JPH11355145A (ja) * 1998-06-10 1999-12-24 Mitsubishi Electric Corp 音響符号器および音響復号器
JP3463592B2 (ja) * 1999-03-01 2003-11-05 松下電器産業株式会社 符号化回路
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
KR100898879B1 (ko) * 2000-08-16 2009-05-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 부수 정보에 응답하여 하나 또는 그 이상의 파라메터를변조하는 오디오 또는 비디오 지각 코딩 시스템
US6862567B1 (en) * 2000-08-30 2005-03-01 Mindspeed Technologies, Inc. Noise suppression in the frequency domain by adjusting gain according to voicing parameters
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
WO2002082428A1 (en) * 2001-04-05 2002-10-17 Koninklijke Philips Electronics N.V. Time-scale modification of signals applying techniques specific to determined signal types
JP2003005798A (ja) 2001-06-21 2003-01-08 Sony Corp 記録装置および再生装置
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP2005292702A (ja) * 2004-04-05 2005-10-20 Kddi Corp オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム
JP4639073B2 (ja) * 2004-11-18 2011-02-23 キヤノン株式会社 オーディオ信号符号化装置および方法
WO2007000988A1 (ja) * 2005-06-29 2007-01-04 Matsushita Electric Industrial Co., Ltd. スケーラブル復号装置および消失データ補間方法
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置

Also Published As

Publication number Publication date
JP2012118462A (ja) 2012-06-21
US8626501B2 (en) 2014-01-07
CN102486923B (zh) 2015-10-21
CN102486923A (zh) 2012-06-06
US20120143614A1 (en) 2012-06-07

Similar Documents

Publication Publication Date Title
US10297270B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US9842603B2 (en) Encoding device and encoding method, decoding device and decoding method, and program
JP5942358B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP4899359B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4918841B2 (ja) 符号化システム
KR102055022B1 (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
EP2693430B1 (en) Encoding apparatus and method, and program
US20100020827A1 (en) Signal processing system, signal processing apparatus and method, recording medium, and program
KR20100086000A (ko) 오디오 신호 처리 방법 및 장치
JP2011059714A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4736812B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4399185B2 (ja) 符号化装置および復号化装置
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit
JP5724338B2 (ja) 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP4317355B2 (ja) 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム
JP2012022021A (ja) 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP2007178529A (ja) 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法
JP4993992B2 (ja) 信号処理方法、信号処理装置及びプログラム
JP5569476B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2012032713A (ja) 復号装置、復号方法、およびプログラム
JPWO2019244666A1 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP2010079032A (ja) 量子化装置、量子化方法、逆量子化装置、逆量子化方法、音声音響符号化装置および音声音響復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140918

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150316

R151 Written notification of patent or utility model registration

Ref document number: 5724338

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees