JP5970602B2 - 条件付き量子化器をもつオーディオ・エンコードおよびデコード - Google Patents

条件付き量子化器をもつオーディオ・エンコードおよびデコード Download PDF

Info

Publication number
JP5970602B2
JP5970602B2 JP2015504552A JP2015504552A JP5970602B2 JP 5970602 B2 JP5970602 B2 JP 5970602B2 JP 2015504552 A JP2015504552 A JP 2015504552A JP 2015504552 A JP2015504552 A JP 2015504552A JP 5970602 B2 JP5970602 B2 JP 5970602B2
Authority
JP
Japan
Prior art keywords
data
mantissa
exponent
quantization
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015504552A
Other languages
English (en)
Other versions
JP2015512532A (ja
Inventor
メルコーテ,ヴィナイ
キュー ロビンソン,チャールズ
キュー ロビンソン,チャールズ
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2015512532A publication Critical patent/JP2015512532A/ja
Application granted granted Critical
Publication of JP5970602B2 publication Critical patent/JP5970602B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/14Conversion to or from non-weighted codes
    • H03M7/24Conversion to or from floating-point codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

関連出願への相互参照
本願は2012年4月25日に出願された米国仮特許出願第61/638,090号および2012年7月27日に出願された米国実用特許出願第13/560,144号の優先権を主張するものである。これらの出願の内容は、ここに参照によってその全体において組み込まれる。
技術分野
本開示は、オーディオ信号のエンコードまたはエンコードされたオーディオ信号のデコードに関する。特に、本開示は、量子化および逆量子化プロセスに関する。
オーディオおよびビデオ・データのためのデジタル・エンコードおよびデコード・プロセスの発展は、エンターテインメント・コンテンツの送達に有意な影響を持ち続けている。メモリ装置の増大した容量およびますます高い帯域幅での広く利用可能なデータ送達にもかかわらず、記憶および/または伝送されるべきデータの量を最小化しようとする圧力は続いている。オーディオおよびビデオ・データはしばしば一緒に送達され、オーディオ・データのための帯域幅はしばしばビデオ部分の要求によって制約される。
よって、オーディオ・データはしばしば高い圧縮率で、時に30:1またはそれ以上の圧縮率でエンコードされる。適用される圧縮の量とともに信号歪みが増すので、デコードされたオーディオ・データの忠実度とエンコードされたデータの記憶および/または伝送の効率との間でトレードオフがなされてもよい。
さらに、エンコードおよびデコード・アルゴリズムの複雑さを低下させることが望ましい。エンコード・プロセスに関する追加的なデータのエンコードは、デコード・プロセスを単純化することができるが、追加的なエンコードされるデータを記憶および/または伝送するという代償を払ってである。したがって、パラメトリックな後方適応方法(parametric backward adaptive methods)では、各仮数についてのビット割り当てデータはエンコードされない。その代わり、デコーダは、他のエンコードされている情報からビット割り当てデータを再計算する必要がある。そのような方法は、エンコードされるデータを少なくできるが、デコーダ側で相対的により大きな複雑さを必要とする。同様に、損失のある仮数エンコード・プロセスは、かなりのデータ圧縮を許容するものの、もとの仮数値についてのいくらかの情報がエンコード・プロセスにおいて、特に仮数量子化プロセスの間に失われる。
既存のオーディオ・エンコードおよびデコード方法は一般に満足いくものであるが、改善された方法が望ましいであろう。
本開示において記載される主題のいくつかの側面は、エンコードまたはデコード方法において実装されることができる。いくつかのそのような方法は、変換係数データを含むエンコードされたオーディオ・データのフレームを受領することに関わってもよい。変換係数データは、指数(exponent)データおよび仮数(mantissa)データを含んでいてもよい。仮数データは、量子化区間の一様または非一様な境界をもってエンコードされた仮数値を含んでいてもよい。仮数値は、少なくとも部分的に指数についての情報に基づいて再構築されてもよい。そのような情報は、本稿では、指数プロファイル・データと称されることがある。該指数プロファイル・データに基づいて、事前量子化(pre-quantization)仮数値に関する統計が推定されてもよい。
いくつかの実装によれば、指数プロファイル・データは指数差分データを含んでいてもよい。いくつかのそのような指数差分データは指数差対であってもよいが、代替的な実装では二つより多くの指数差分データ点が評価されてもよい。各周波数ビンにおいて、仮数値再構成は、指数差分データ、たとえば指数差対を条件として調整されてもよい。
本稿に記載されるいくつかの方法は、オーディオ・データを含むエンコードされたフレームを受領し、前記エンコードされたフレームから抽出された情報に応答して量子化器分解能データを決定することを含む。量子化器分解能データは、エンコードされたフレームのオーディオ・データについての変換係数の仮数値を量子化するプロセスの間に使用された量子化区間の数に対応していてもよい。本方法は、エンコードされたフレームから変換係数の指数プロファイル・データを決定し、少なくとも部分的に前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記エンコードされたフレームの仮数値について複数の量子化解除方法を決定することを含んでいてもよい。本方法はまた、前記量子化解除方法に従って前記仮数値を量子化解除することを含んでいてもよい。
指数プロファイル・データは、指数差分データを含んでいてもよい。いくつかのそのような実装では、指数差分データは5つの差分状態に対応していてもよい。指数差分データはたとえば、指数差対を含んでいてもよい。仮数値を量子化解除することは、ある周波数についての仮数値を、その周波数についての指数差対に対応する量子化解除方法に従って量子化解除することを含んでいてもよい。前記周波数についての指数差対は、より低い周波数についての指数に対する第一の指数差と、より高い周波数についての指数に対する第二の指数差を含んでいてもよい。
いくつかの実装では、仮数値を量子化するプロセスの間に使われた量子化区間は一様な量子化区間であってもよい。しかしながら、他の実装では、量子化区間は一様な量子化区間でなくてもよい。仮数値を量子化するプロセスの間に使われた量子化値は、いくつかの実装では、量子化区間の境界の間の中点に対応してもよい。しかしながら、少なくともいくつかの量子化解除値は量子化区間の境界の間の中点に対応しなくてもよい。
前記量子化解除方法の少なくともいくつかは、エンコードされたフレームの仮数値を量子化するプロセスの間に使われた量子化値とは異なる量子化解除値の適用を含んでいてもよい。いくつかの実装では、指数プロファイル・データは、前記エンコードされたフレームにおける対応する仮数値がない指数についてのデータを含んでいてもよい。
本稿に記載されるいくつかの実装は、一つまたは複数のインターフェースおよび論理システムを含む装置を提供する。論理システムは、汎用の単一チップまたは複数チップ・プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラム可能なゲート・アレイ(FPGA)または他のプログラム可能論理デバイス、離散的なゲートまたはトランジスタ論理または離散的なハードウェア・コンポーネントのうちの一つまたは複数を含んでいてもよい。論理システムは、インターフェースから、オーディオ・データを含むエンコードされたフレームを受領し、前記エンコードされたフレームから抽出された情報に応答して量子化器分解能データを決定するよう構成されていてもよい。エンコードされたフレームは、AC-3フォーマットまたは向上AC-3フォーマットのようなさまざまなフォーマットの一つであってもよい。量子化器分解能データは、前記エンコードされたフレームのオーディオ・データについての変換係数の仮数値を量子化するプロセスの間に使われる量子化区間の数に対応してもよい。
論理システムはまた、エンコードされたフレームから、変換係数の指数プロファイル・データを決定するよう構成されていてもよい。論理システムは、少なくとも部分的には前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記エンコードされたフレームの仮数値について複数の量子化解除方法を決定するよう構成されていてもよい。論理システムはまた、前記複数の量子化解除方法に従って仮数値を量子化解除するよう構成されていてもよい。
前記装置は、メモリ・デバイスを含んでいてもよい。前記インターフェースは、前記論理システムと前記メモリ・デバイスとの間のインターフェースであってもよい。代替的または追加的に、前記インターフェースはネットワーク・インターフェースを有していてもよい。
いくつかの実装では、指数プロファイル・データは指数差分データを含んでいてもよい。たとえば、指数差分データは複数の周波数のそれぞれに対応する指数差対を含んでいてもよい。いくつかのそのような実装では、前記装置は、データ構造が記憶されているメモリを含む。データ構造は、複数の量子化解除方法および対応する指数差分データを記憶していてもよい。論理システムは、このデータ構造を参照することによって、指数差分データに対応する量子化解除方法を決定するよう構成されていてもよい。
本稿に記載されるいくつかの実装は、ソフトウェアが記憶されている非一時的な媒体において実装されてもよい。前記ソフトウェアは、オーディオ・データを含むエンコードされたフレームを受領し、前記エンコードされたフレームから抽出された情報に応答して量子化器分解能データを決定するようデコード装置を制御するための命令を含んでいてもよい。前記量子化器分解能データは、前記エンコードされたフレームのオーディオ・データについての変換係数の仮数値を量子化するプロセスの間に使われる量子化区間の数に対応してもよい。
前記ソフトウェアは、前記エンコードされたフレームから、変換係数の指数プロファイル・データを決定し、少なくとも部分的には前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記エンコードされたフレームの仮数値について複数の量子化解除方法を決定するようデコード装置を制御するための命令を含んでいてもよい。前記ソフトウェアは、前記複数の量子化解除方法に従って仮数値を量子化解除するようデコード装置を制御するための命令を含んでいてもよい。
本稿では代替的な方法が与えられる。いくつかのそのような方法は、時間領域で第一のオーディオ・データを受領し、前記第一のオーディオ・データを周波数領域の第二のオーディオ・データに変換することを含んでいてもよい。前記第二のオーディオ・データは変換係数を含んでいてもよい。上記の諸方法は、前記変換係数から、指数プロファイル・データを含む指数データを決定し、該指数データに応答して量子化器分解能データを決定することを含んでいてもよい。量子化器分解能データは、前記変換係数の仮数値を量子化するプロセスの間に使用されるべき量子化区間の数に対応していてもよい。上記の諸方法は、少なくとも部分的には前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記変換係数の仮数値についての複数の量子化方法を決定することを含んでいてもよい。上記の諸方法は、前記複数の量子化方法に従って仮数値を量子化することを含んでいてもよい。
上記の諸方法は、前記第二のオーディオ・データ、前記指数データおよび前記量子化された仮数値を含むエンコードされたフレームを形成することを含んでいてもよい。いくつかの実装では、仮数値を量子化するプロセスの間に使われる一つまたは複数の量子化値は、量子化区間の境界の間の中点に対応しなくてもよい。前記量子化方法の一つまたは複数は、一様に離間していない境界をもつ量子化区間を使ってもよい。
本開示の代替的な諸側面は、少なくとも一つのインターフェースおよび論理システムを含む装置において実装されてもよい。論理システムは、インターフェースから、周波数領域の第一のオーディオ・データ、指数データおよび量子化された仮数値を含むエンコードされたフレームを受領するよう構成されていてもよい。量子化された仮数値は、少なくとも部分的には量子化器分解能データと、前記指数データから決定される指数プロファイル・データとに基づく諸量子化方法に従って仮数値を決定されてもよい。
論理システムは、量子化された仮数値から量子化解除された仮数値を決定し、部分的に量子化解除された仮数値に基づいて変換係数を決定し、前記変換係数を使って逆変換演算を実行して時間領域の第二のオーディオ・データを生成するよう構成されていてもよい。
本明細書に記載される主題の一つまたは複数の実装は、付属の図面および以下の記述において記述される。以下の記述、図面および請求項から、他の特徴、側面および利点が明白になるであろう。図面における相対的な寸法は縮尺通りに描かれていないことがあることを注意しておく。
オーディオ・エンコード・プロセスの例を示す流れ図である。 Aは、絶対指数値に対する指数テンティング(tenting)プロセスの一例の結果を示すグラフである。Bは、差分指数値を示すグラフである。 3レベルの対称的な量子化プロセスの例を描くグラフである。 4レベルの非対称的な量子化プロセスの例を描くグラフである。 オーディオ・デコード・プロセスの例を示す流れ図である。 条件付きの逆量子化器に関わる代替的なオーディオ・デコード・プロセスの例を示す流れ図である。 変換係数値の確率密度関数の例を示すグラフである。 図6Aの変換係数の仮数および選択された指数値についての確率密度関数の例を示すグラフである。 図6Aの変換係数の仮数および選択された指数値についての確率密度関数の例を示すグラフである。 図6Aの変換係数の仮数および選択された指数値についての確率密度関数の例を示すグラフである。 さまざまな周波数での指数値の例を示すグラフである。 後方指数差分(backward exponent differential)および前方指数差分(forward exponent differential)に基づく、規格化された仮数分散の例を描く図である。 条件付き逆量子化器を用いたオーディオ・デコードの方法のためのパラメータを確立するプロセスの例を示す流れ図である。 エンコーダまたはデコーダ装置のコンポーネントの例を与えるブロック図である。 さまざまな図面における同様の参照符号および記号は同様の要素を示す。
以下の記述は、本開示のいくつかの革新的な側面を記述するためのある種の実装およびそうした革新的な側面が実装されうるコンテキストの例に向けられる。しかしながら、本稿の教示はさまざまな異なる仕方で適用できる。本願において与えられる例は主としてAC-3オーディオ・コーデック(「ドルビー・デジタル」としても知られる)および向上AC-3オーディオ・コーデック(E-AC-3または「ドルビー・デジタル・プラス」としても知られる)を使って記述されるが、本稿で与えられる概念は、MPEG-2 AACおよびMPEG-4 AACを含むがこれに限られない他のオーディオ・コーデックにも当てはまる。さらに、記述された実装は、携帯電話、スマートフォン、デスクトップ・コンピュータ、ハンドヘルドまたはポータブル・コンピュータ、ネットブック、ノートブック、スマートブック、タブレット、ステレオ・システム、テレビジョン、DVDプレーヤー、デジタル記録装置および多様な他の装置に含まれていてもよいさまざまなオーディオ・エンコーダおよび/またはデコーダにおいて実装されてもよい。よって、本開示の教示は、図面に示されるおよび/または本稿に記載される実装に限定されることは意図されておらず、広い適用可能性をもつものである。
図1は、オーディオ・エンコード・プロセスの例を示す流れ図である。本願において図示および/または記述される他のプロセスと同様に、オーディオ・エンコード・プロセス100の動作は必ずしも示されている順序で実行されない。さらに、本願で提供されるプロセスは、図示および/または記述されているより多数または少数のブロックを含んでいてもよい。オーディオ・エンコード・プロセス100および本願で記述される他のオーディオ・エンコードおよびデコード・プロセスは、少なくとも部分的に、ハードウェア、ファームウェア、非一時的媒体上に記録されたソフトウェアなどを介して実装されることのできるオーディオ・エンコーダおよび/またはデコーダによって実行されてもよい。
オーディオ・エンコード・プロセス100において、時間領域の入力サンプル102は変換プロセス104において周波数領域に変換される。入力サンプル102は、各フレームにおいて複数のブロックをもつオーディオ・データ・フレームにグループ化されてもよい。いくつかのそのような例では、変換プロセス104は、入力サンプル102から変換係数106aを生成する修正離散コサイン変換(MDCT)に関わる。しかしながら、(高速フーリエ変換またはさまざまな分解フィルタバンク、すなわち直交ミラー・フィルタバンク(QMF)のような)他の変換方法が代替的な実装において使用されてもよい。入力サンプル102のブロックは、窓掛けされ(windowed)、重複され(overlapped)てもよい。変換プロセス104からの出力は、ある種の値内に制約されてもよい。たとえば、MDCTの出力は、−1.0から1.0までの間に制約されている「端数表現(fractional representation)」であってもよい。
プロセス108では、端数表現がその後の処理のための浮動小数点表現に変換される。いくつかの実装では、プロセス108の出力は、仮数値および指数値をもつ変換係数であってもよい。いくつかのそのような実装では、プロセス108の出力は次の形
X=Y2-k [式1]
であってもよい。
式1において、Xは変換係数106aを表わし、Yは仮数値112aを表わし、kは指数値110を表わす(図1参照)。いくつかの実装では、仮数値112aおよび指数値110は、所定の範囲内にはいるよう制約されていてもよい。たとえば、AC-3オーディオ・コーデックでのエンコードのために、指数値110は0以上であってもよい。仮数値112aは、0.5以上かつ1.0以下に制約されてもよい。
指数値110は、該指数値110がオーディオ・データのエンコードされたフレーム130に含められるプロセス128の前に、多様な仕方で処理されてもよい。いくつかの実装では、指数値110は、時間および/または周波数を横断してグループ化されてもよい。そのようなグループ化は、指数値が時間的におよび/または周波数を横断して比較的ゆっくり変化している場合により望ましいことがある。
たとえば、指数値110は、周波数のある範囲を表わしていてもよい各周波数成分(本稿では「ビン」または「周波数ビン」とも称される)について、単一の指数値110をもってエンコードされてもよい。あるいはまた、指数値110は、複数のビンについて(たとえば2個、4個またはそれ以上のビンについて)単一の指数値110をもってエンコードされてもよい。指数値110が複数の周波数ビンを横断してグループ化される場合、それらのビンのいくつかに対応する指数値110は変わる必要があることがある。その場合、対応する仮数値112aは、変換係数106aのそれぞれを等価な値に維持するために、変えられてもよい。
同様に、指数値110は、時間を横断してグループ化されてもされなくてもよい。グループ化されない場合、各ブロックについて異なる指数値110がエンコードされてもよい。しかしながら、単一の指数値110が複数のブロックを横断して共有される場合は、他のブロックにおける指数値110のいくつかは変わる必要がある。その場合、対応する仮数値112aは、各変換係数106aについての等価な値を維持するために、変えられてもよい。
指数値110の変化に従って仮数値112aが変えられるとき、無損失な仕方でそうすることが望ましい。いくつかの実装では、対応する指数値110が変えられるときに仮数値112aがある閾値より上に調整されたとしたら、仮数値112aはある最大値(たとえば1.0)に「クリッピングされる」。そのような「クリッピング」は信号歪みを導入する。よって、対応する指数値110が変えられるときに仮数値112aを閾値より上に調整する代わりに、より低い仮数値112aをもつ変換係数106aの等価な値をエンコードすることが好ましいことがありうる。
図2Aは、絶対指数値に対する指数テンティング(tenting)プロセスの一例の結果を示すグラフである。この例では、グラフ220は、絶対指数値110および対応する周波数ビン225のシーケンスを描いている。この例では、隣接する指数値110の間の差分が±12dB未満となるよう制約される。ここで、隣接するビン225iおよび225jにおけるそれぞれ指数値110aおよび110bの間の差分は12dBを超える。よってビン225jについての指数値は、この指数テンティング・プロセスの結果として、110bから110cに減らされる。この例では、対応する仮数値112aは、対応する変換係数106aについての等価な値を維持するために調整される。
図2のBは、差分指数値を示している。図2のBのグラフ250に示される差分指数値225は、指数テンティング・プロセス後の図2のAの絶対指数値の間の差に対応する。たとえば、差分指数値225a(−1)は、ビン225bの指数値110とビン225aの指数値110との間の差に対応する。差分指数値225b(−2)は、ビン225cの指数値110とビン225bの指数値110との間の差に対応する。
この例において、差分指数値255は、−2から2までの範囲内にはいるよう制約され、5つの可能な状態をもつ:−2、−1、0、1または2である。したがって、差分指数値225i(ビン225jの指数値110とビン225iの指数値110との間の差に対応する)は3から2に減らされている。再び図1を参照するに、これらの差分指数値255は、ビットストリーム・パッキング・プロセス128の間に、エンコードされたフレーム130の指数データ120に含められてもよい。指数データ120は、本稿で指数プロファイル・データと称されるものを含んでいてもよい。いくつかの実装では、指数プロファイル・データは、指数データ120から導出されてもよい。指数プロファイル・データを使ういくつかの例について以下で述べる。
ここで、仮数値112aのエンコードのいくつかの例を述べる。ビット割り当てプロセス114は、仮数値112aのそれぞれについて最適な量子化器分解能を決定することを含んでいてもよい。たとえば、オーバーヘッド、指数エンコードなどのために必要とされるビット数が、フレーム当たりに利用可能な全ビット数から減算されてもよい。パワースペクトル密度、各ビンについてのスペクトル・エネルギーの推定値が、指数値110から、または参照指数値および差分指数値255を使うことによって、計算されてもよい。
人間の聴覚の音響心理学的属性を取り入れるマスキング曲線が計算され、各ビンについてのパワースペクトル密度と比較されてもよい。いくつかのそのような実装では、マスキング曲線は、複数の周波数帯のそれぞれに適用される。人間の聴覚の絶対的な閾値が適用されてもよい。
前記パワースペクトル密度と各ビンについての対応するマスク値との間の差を表わす信号対マスク比が計算されてもよい。いくつかの実装では、量子化器分解能は、信号対マスク比に基づいていてもよい。たとえば、仮数量子化プロセス116の間に適用される量子化器分解能は、信号対マスク比に比例していてもよい。いくつかの実装では、エンコードされるフレーム130に含まれるビット割り当てパラメータ118は、この量子化器分解能と対応してもよい。よって、エンコードされたフレーム130のビット割り当てパラメータ118は、仮数量子化プロセス116の間に使用される量子化区間の数に対応する量子化器分解能データを含んでいてもよい。しかしながら、代替的な実装では、ビット割り当てパラメータ118はエンコードされたフレーム130に含まれない。ドルビー・デジタルおよびドルビー・デジタル・プラスのようなパラメトリックな後方適応実装では、ビット割り当てパラメータ118(または量子化器分解能に対応する他のデータ)は、エンコードされたフレームに含まれる指数データ、マスキング曲線オフセット・データなどから、デコーダによって計算されてもよい。そのような方法は、エンコードされるべきデータを少なくできるが、デコーダ側で相対的により大きな複雑さを必要とする。
いくつかの実装では、各ビンについてのマスキング曲線値(または人間の聴覚の絶対的な閾値)を越えるパワースペクトル密度値に対応するビットのみが、エンコードされるフレーム130に含まれる。しかしながら、パワースペクトル密度値がマスキング曲線値を超える度合いは時間を追って実質的に変わりうる。したがって、潜在的にエンコードされることのできるビットの対応する数も時間を追って実質的に変わりうる。
そのような多様性を補償するため、いくつかのエンコーダ実装は、利用可能なビット数についての信号対マスク比を最適にするよう逐次反復的な探索に関わる。いくつかのそのような実装では、潜在的にエンコードされうるビット数が利用可能なビット数を超える場合、マスキング曲線は上にシフトされてもよい。潜在的にエンコードされうるビット数が利用可能なビット数より少ない場合には、マスキング曲線は下にシフトされてもよい。利用可能なビット数を超えることなくできるだけ多くのビットを使うことにつながる最適なマスキング曲線オフセットが決定されうる。
ここで、仮数量子化プロセス116のいくつかの例について述べる。上記のように、仮数量子化プロセス116の量子化器分解能は、信号対マスキング比に基づいていてもよい。いくつかのエンコード実装は、かなりの数の可能な量子化器分解能に関わりうる。
たとえばドルビー・デジタルは、16個の可能な量子化器分解能を含み、そのそれぞれがビット割り当てポインタ値に対応する。ビット割り当てポインタ0は、パワースペクトル密度値がマスキング曲線または絶対聴覚閾値のレベルを下回ったため、あるサンプルについて仮数値がエンコードされないインスタンスに対応する。ビット割り当てポインタ1は3レベルの対称的な量子化プロセスに対応する。ビット割り当てポインタ2〜5は5レベル、7レベル、11レベルおよび15レベルの対称的な量子化プロセスに対応する。ビット割り当てポインタ6〜16は、2nレベルの非対称的な量子化プロセスに対応する。ここで、nは5〜12、14または16の範囲内の整数であってもよい。
図3Aは、3レベルの対称的な量子化プロセスの例を描くグラフである。この例では、量子化区間305は一様であり、量子化区間305a、305bおよび305cはそれぞれ2/3である。中点310は、量子化区間305の境界315を参照して決定されうる。たとえば、中点310aは、量子化区間305aの境界315aと315bの間の中間点である。
グラフ300では、仮数量子化プロセス116の間に適用される量子化値122は、量子化区間305の中点310に対応する。たとえば、量子化区間305aの中点310aは−2/3であり、これが量子化された仮数値122aに対応する。同様に、量子化区間305cの中点310cは2/3であり、これが量子化された仮数値122cに対応する。
代替的な量子化プロセス116は、一様な量子化区間305の適用に関わってもそうでなくてもよい。さらに、代替的な量子化プロセス116は、量子化値320と量子化区間305の中点310との間の対応に関わってもそうでなくてもよい。一つのそのような代替的な量子化プロセス116のためのパラメータが図3Bに示されている。
図3Bは、4レベルの非対称的な量子化プロセスの例を描くグラフである。この例では、量子化区間305は1/4(量子化区間305d参照)から3/4(量子化区間305g参照)までの範囲である。量子化区間305eおよび305fはこの例では1/2である。量子化区間305eおよび305fについては、中点310eおよび310fが量子化された仮数値122eおよび122fに対応する。しかしながら、量子化区間305dおよび305gの中点310dおよび310gは量子化された仮数値122dおよび122gに対応しない。
いくつかの代替的な非一様な量子化プロセス116はベクトル量子化に関わる。いくつかのベクトル量子化方法は、多次元データ・ベクトルが単一の符号語によって表わされることを許容する。符号語は、ベクトルのあらかじめ定義されたデータ構造(たとえばテーブル)のある特定のベクトルに対応してもよい。符号語の長さは、該データ構造中のベクトルの数に依存してもよい。相対的により多くのベクトルが相対的により長い符号語に対応しうる。
たとえば、ドルビー・デジタル・プラスのいくつかの量子化プロセス116は、符号語が2ビットから9ビットまでの範囲でありうるベクトル量子化に関わる。単一の符号語が各仮数ベクトルを表わすために使用されうる。ドルビー・デジタル・プラス・エンコーダは、ある仮数ベクトルについて、信号対マスク比に基づいてベクトルの適切なテーブルを選択してもよい。そのテーブル内で、エンコーダは、どのベクトルが前記仮数ベクトルに最もよくマッチするかを決定してもよい。最良マッチするベクトルについてのテーブル・インデックスに対応する符号語が、エンコードされるフレーム130に含められてもよい。その符号語を使って、デコーダは、その符号語に対応するベクトルを前記適切なテーブルから抽出することによって、量子化された仮数値を復元できる。仮数量子化プロセス116の追加的な実装は後述する。
図4は、オーディオ・デコード・プロセスの例を示す流れ図である。おおまかな言い方をすると、オーディオ・デコード・プロセス400は、オーディオ・エンコード・プロセス100の間になされたことを取り消すことに関わる。いくつかの実装では、オーディオ・デコード・プロセス400は実質的に、オーディオ・エンコード・プロセス100の鏡像である。
オーディオ・デコード・プロセス400は、デコーダがエンコードされたフレーム130を受領するときに始まる。たとえば、プロセスは、デコード装置が複数のエンコードされたフレーム130を、ネットワーク・インターフェースのようなインターフェースを介して受領するときに始まってもよい。代替的または追加的に、デコード装置の論理システムが、エンコードされたフレーム130を、論理システムとメモリ・デバイスとの間のインターフェースを介して受領してもよい。
ビットストリーム・アンパッキング・プロセス402の間に、エンコードされたフレーム130から指数データ120および量子化された仮数データ122が抽出される。いくつかの実装では、ビット割り当てパラメータ118(または量子化器分解能に対応する他のデータ)もエンコードされたフレーム130に含まれている。ビット割り当てプロセス404においてビット割り当てパラメータ118からビット割り当て値が計算されてもよい。量子化された仮数値122は、仮数量子化解除プロセス406において量子化解除されて仮数値112bを生じる。ビット割り当てパラメータ118は、仮数量子化解除プロセス406の間に使うべき量子化区間の数を指示する量子化器分解能データを含んでいてもよい。しかしながら、いくつかの実装では、ビット割り当てパラメータ118は、エンコードされたフレーム130に含まれない。ビット割り当てパラメータ118(または量子化器分解能に対応する他のデータ)は、エンコードされたフレームに含まれる指数データ、マスキング曲線オフセット・データなどからデコーダによって計算されうる。仮数量子化プロセス116は損失のあるプロセスなので、仮数値112bは必ずしも、仮数量子化プロセス116に入力された仮数値112aと同じではない。仮数量子化解除プロセス406のいくつかの新規な変形について後述する。
ブロック浮動小数点デコード・プロセス408の間、仮数値112bおよび対応する指数値110は浮動小数点表現から変換係数106bの端数表現に変換される。ブロック浮動小数点デコード・プロセス408からの出力は、ある種の値内に制約されてもよい。たとえば、変換係数106bの値は−1.0から1.0までの間に制約されてもよい。
逆変換プロセス410において、周波数領域の変換係数106bが時間領域におけるデコードされたサンプル412に変換される。いくつかのそのような例では、逆変換プロセス410は、デコードされたサンプル412を生成するための、変換係数106bの逆MDCTに関わる。しかしながら、代替的な実装は、高速フーリエ変換または合成フィルタバンク(すなわち、逆QMF)のような他の逆変換方法に関わることもある。
図5は、条件付きの逆量子化器(conditional inverse quantizer)に関わる代替的なオーディオ・デコード・プロセスの例を示す流れ図である。いくつかの実装では、オーディオ・デコード・プロセス500は上記のオーディオ・デコード・プロセス400と同様であってもよい。しかしながら、オーディオ・デコード・プロセス500は、新規な量子化解除方法および関係したプロセスに関わる。本稿に記載される他の方法と同様に、オーディオ・デコード・プロセス500のブロックは、示されている序列で実行されてもされなくてもよい。たとえば、いくつかの実装では、ブロック515はブロック510より前に実行されてもよいし、あるいはブロック510および515が実質的に同時に実行されてもよい。
この例では、オーディオ・デコード・プロセス500は、オーディオ・データを含む一つまたは複数のエンコードされたフレームがデコーダによって受領されるときに始まる(ブロック505)。たとえば、プロセスは、デコード装置がエンコードされたフレーム(または複数のエンコードされたフレーム)をインターフェースを介して受領するときに始まってもよい。いくつかの実装では、エンコードされたフレームは上記のエンコードされたフレーム130と実質的に同様であってもよく、AC-3フォーマット、向上AC-3フォーマットまたは当業者に既知の他のオーディオ・コーデックであってもよい。しかしながら、下記で論じるように、いくつかの実装では、エンコードされたフレームは、本稿に記述される新規なプロセスに従ってエンコードされたものであってもよい。いくつかのそのような実装によれば、仮数再構成が、指数情報を条件としていてもよい。
エンコードされたフレームが受領されるインターフェースはネットワーク・インターフェースであってもよい。代替的または追加的に、論理システムは、エンコードされたフレームを、論理システムとメモリ・デバイスとの間のインターフェースを介して受領してもよい。エンコーダまたはデコーダ装置のコンポーネントの例は図10に示されており、後述する。
ブロック510では、量子化器分解能データがエンコードされたフレームから抽出されるまたはフレームに含まれる他の情報に応じて決定される。量子化器分解能データは、エンコードされたフレームのオーディオ・データについての変換係数の仮数値を量子化するプロセスの間に使われた量子化区間の数に対応していてもよい。量子化区間は、仮数量子化プロセスに依存して一様な量子化区間であってもなくてもよい。同様に、仮数量子化プロセスの間に使われる量子化値は、仮数量子化プロセスに依存して量子化区間の境界の間の中点に対応していてもいなくてもよい。
図1を参照して上述したように、仮数量子化プロセス116の間に適用された量子化器分解能は、信号対マスク比に比例していてもよい。エンコードされたフレーム130に含まれるビット割り当てパラメータ118はこの量子化器分解能に対応していてもよい。よって、エンコードされたフレーム130のビット割り当てパラメータ118は、仮数量子化プロセス116の間に使われた量子化区間の数に対応する量子化器分解能を含んでいてもよい。
いくつかの実装では、量子化器分解能データは、ビット割り当てポインタを含んでいてもよい。上記のように、ドルビー・デジタルは16個の可能な量子化器分解能を含み、そのそれぞれがエンコードされたフレーム130中のデータに応じて決定されるビット割り当てポインタに対応する。ビット割り当てポインタ0は、パワースペクトル密度値がマスキング曲線または絶対聴覚閾値のレベルを下回ったため、あるサンプルについて仮数値がエンコードされないインスタンスに対応する。ビット割り当てポインタ1は3レベルの対称的な量子化プロセスに対応する。ビット割り当てポインタ2〜5は5レベル、7レベル、11レベルおよび15レベルの対称的な量子化プロセスに対応する。ビット割り当てポインタ6〜16は、2nレベルの非対称的な量子化プロセスに対応する。ここで、nは5〜12、14または16の範囲内の整数であってもよい。
ブロック515では、変換係数の指数プロファイル・データがエンコードされたフレームから抽出されるまたはフレームに含まれる指数情報に従って決定される。いくつかの実装では、指数プロファイル・データは指数差分データを含む。そのような実装では、指数差分データは、実質的に差分指数値255を参照して上述したように決定されてもよい(図2のAおよびBならびに対応する議論を参照)。いくつかのそのような実装では、差分指数値255は−2から2までの範囲内にはいるよう制約されてもよく、5つの可能な状態:−2、−1、0、1または2をもっていてもよい。
ブロック520では、エンコードされたフレームの仮数値についての量子化解除方法が、少なくとも部分的に、前記量子化分解能データおよび前記指数プロファイル・データに従って決定される。いくつかの実装では、量子化解除方法の少なくともいくつかは、エンコードされたフレームの仮数値を量子化するプロセスの間に使われた量子化値とは異なる量子化解除値の適用を含んでいてもよい。たとえば、量子化プロセスの間に使われた量子化値が量子化区間の境界の間の中点であったとしても、量子化解除方法の少なくともいくつかは、量子化区間の境界の間の中点に対応しない量子化解除値の適用を含んでいてもよい。そのような実装の背後にある動機についてこれから図6A〜図6Dを参照しつつ説明する。
図6Aは、変換係数値の確率密度関数の例を示すグラフである。グラフ600では、軸605は、変換係数106の対応する値のそれぞれについての確率密度px(x)を表わす。最高の確率密度値は変換係数106についての0の値に対応する。この例では、確率密度値は、変換係数106の絶対値が増すとともに減少する。この例では、変換係数106の絶対値は1以下である。
図6B〜6Dは、図6Aの変換係数の仮数および選択された指数値についての確率密度関数(probability density function)のグラフである。これらのグラフのそれぞれは、図6Aの例示的なpdfから導出される次の式に基づいている。
Figure 0005970602
式2において、Py|k(y|k)は、指数値kを条件とする仮数yの確率密度関数を表わす。式1の議論において上記したように、仮数値は(今の場合と同様)、0.5以上1.0以下に制約されてもよい。
図6Bでは、k=0であり、一方図6Cではk=2、図6Dではk=7である。まず図6Bを参照するに、k=0のとき、量子化値(または量子化解除値)を量子化区間の境界の間の中点として設定することが、最小平均平方量子化誤差のような誤差メトリックを最小にする結果につながらないという意味で最適とならないことがしばしばあることが見て取れる。しかしながら、kの値が増すにつれて、量子化器区間内の仮数統計が十分一様になり、諸量子化器区間についての(平均平方誤差を最小化する点での)最適な再構成がその中点とほぼ同じになる、すなわち、再構成を区間の中点として設定することに起因する平均量子化誤差が、平均平方誤差を最小化するという点でその最適な値に再構成を設定する場合とほぼ同じになる。平均絶対量子化誤差のような他の誤差メトリックが使用されてもよい。
上記の分析は、所与の量子化器分解能データ値について、kの異なる値が、量子化解除値が量子化区間の境界の間の中点に対応するべきかどうかを示しうることを示唆している。しかしながら、オーディオ・データはしばしば時間を追ってきわめて可変であり、よってpx(x)は時間を追ってしばしばきわめて可変となりうる。オーディオ・データは、周波数スペクトルを通じて同様の変動をもちうる。よって、絶対的な指数値は、仮数統計の一貫して信頼できる指標ではないことがある。
時間および周波数におけるそのような変動を考慮に入れるため、いくつかの実装では、各周波数ビンについての仮数量子化解除方法は、少なくとも部分的に、差分指数値および/または指数値の傾向に基づいていてもよい。そのような傾向は、逐次的な周波数ビンについて二つ以上の差分指数値を比較することによって決定されてもよい。いくつかのそのような実装によれば、各周波数ビンについての仮数量子化解除方法は、前記量子化分解能データおよび指数差対に従って決定されてもよい。いくつかのそのような実装についてこれから図7を参照して述べる。
図7は、さまざまな周波数における指数値の例を示すグラフである。変換係数の値は指数値の値に反比例するので、kはグラフ700において下方に増大する。さまざまな周波数ビン725についてのkの値が示されている。いくつかの実装では、各周波数ビン725についての指数差対は、より低い周波数についての指数に対する第一の指数差およびより高い周波数についての指数に対する第二の指数差である。
たとえば、周波数ビン725bについての指数差対は、周波数ビン725aについての指数値に対する第一の指数差および周波数ビン725cについての指数値に対する第二の指数差である。第一の指数差は本稿では「後方指数差」と称されることがあり、第二の指数差は本稿では「前方指数差」と称されることがある。用語「diff」および「差」は本稿では交換可能に使用されうる。
各周波数ビンについて少なくとも後方指数差および前方指数差を考えることによって、指数値がどのような傾向をもっているかについての判定がなされうる。たとえば、周波数ビン725bおよび725iについての後方指数差および前方指数差は上向きの傾きを示す。ここではk値は減少している。周波数ビン725cについての後方指数差および前方指数差はスペクトル・ピークを示し、該スペクトル・ピークは周波数ビン725cについての変換係数の極大値に対応する。そのような値については、仮数の分布はゆがんでいる(skewed)傾向がある。したがって、(k=0である図6Bを参照して上記した場合と同様に)量子化解除値を量子化区間の境界の間の中点として設定することは一般には最適とはならない。
周波数ビン725fおよび725gについての後方指数差および前方指数差は下向きの傾きを示す。周波数ビン725hについての後方指数差および前方指数差は谷または溝を示す。スペクトル・ピークと同様、指数データにおけるそのような傾向も仮数統計に対応しうる。
図8は、後方指数差分および前方指数差分に基づく実際のオーディオ・データの規格化された仮数分散の例を描く図である。グラフ800に描かれている結果は、現在まで使われているオーディオ・データの特定の諸型についての結果を表わす。この例において、グラフ800の縦軸805は規格化された仮数分散をデシベル単位で示す。軸810は前方指数差を示し、軸815は後方指数差を示す。この例において、指数差分データは、両端を含め−2.0から2.0までの範囲の整数に対応する5つの異なる状態をもつ。よって、指数対は25個の異なる可能な組み合わせを含む。
点820は指数差対(−2,2)に対応し、これは鋭いスペクトル・ピークに対応している。点820はこの例では約−2.5dBの規格化された仮数分散に対応しており、これは指数差対すべてのうちで最低の分散である。グラフ800では、より低い分散は、可能な仮数値の範囲を横断しての確率密度値の相対的により一様でない分布に対応する。分布がより一様でないほど、仮数値が相対的によりゆがんでいる(skewed)可能性が高くなる。したがって、量子化解除値を量子化区間の境界の間の中点として設定することは一般に、それほど最適ではなくなる。
他の極端では、点825は指数差対(2,−2)に対応し、これは鋭いスペクトルの谷に対応する。点825はこの例では約1.7dBの規格化された仮数分散をもち、これは指数差対すべてのうちで最高の分散である。グラフ800では、より高い分散は、可能な仮数値の範囲を横断しての確率密度値の相対的により一様な分布に対応する。確率密度値のより一様な分布は、量子化解除値を量子化区間の境界の間の中点として設定することが満足のいく結果を与える可能性がより高いことを意味する。
図5を参照するに、いくつかの実装では、ブロック520における各周波数ビンについての仮数量子化解除方法は、(少なくとも部分的に)量子化分解能データおよびその周波数ビンに対応する指数差対に従って決定されてもよい。ブロック520は、各周波数ビンについて後方指数差および前方指数差を含む指数差対を決定することを含んでいてもよい。いくつかの実装では、エンコードされたフレームから抽出された(ブロック515参照)指数プロファイル・データが差分指数値を含んでいてもよい。そのような実装は、指数差対を決定するプロセスをさらに合理化する。
指数差対のそれぞれが量子化解除方法に対応しうる。ブロック520は、指数差対および対応する量子化解除方法のデータ構造を参照することによって特定の周波数ビンについての量子化解除方法を取得することを含んでいてもよい。ブロック520は、該データ構造から、その周波数ビンについての指数差対に対応する量子化解除方法の指示を取得することを含んでいてもよい。いくつかの実装では、データ構造は、その周波数ビンについての量子化分解能データに対応してもよい。たとえば、データ構造は、特定のビット割り当てポインタ値に対応してもよい。
エンコードされたフレームから抽出された(ブロック515参照)指数プロファイル・データは、エンコードされたフレーム中に対応する仮数値がない指数値を含んでいてもよい。たとえば、仮数量子化プロセスの間に、そのような仮数値に対しては0ビットが割り当てられたことがありうる。いくつかの実装では、それでも、関連する指数データは、対応する仮数値についての量子化解除方法を決定するために使用されうる。ランダムな仮数値を割り当てる代わりに、周波数ビンについての仮数値は、その周波数ビンについての指数差対および量子化分解能データに対応する量子化解除方法に従って再構成されてもよい。
ブロック525では、各周波数ビンに対応する仮数値が、ブロック525で決定された量子化解除方法および対応する量子化分解能データに従って量子化解除される。これらの量子化解除方法の少なくともいくつかは、エンコード・プロセスにおいて使用される量子化方法と異なっていてもよい。たとえば、エンコード・プロセスにおいて使用された量子化値は量子化区間の境界の間の中点であったことがありうるが、一方、ブロック520で決定されブロック525で適用されるこれらの量子化解除方法の少なくともいくつかは、量子化区間の境界の間の中点に対応する量子化解除値を適用することに関わるものでなくてもよい。しかしながら、本稿に記載されるいくつかのエンコード方法では、量子化値は必ずしも量子化区間の境界の間の中点ではない。
ブロック530では、そのフレームについてのデコード・プロセスが完了する。ブロック530は、量子化解除された仮数値に対応する絶対的な指数値を再構成することを含んでいてもよい。ブロック530は、量子化解除された仮数値および対応する指数値が浮動小数点表現から変換係数の端数表現に変換されるブロック浮動小数点デコード・プロセスに関わっていてもよい。ブロック530は、周波数領域の変換係数が時間領域のデコードされたサンプルに変換される逆変換プロセスに関わっていてもよい。
ブロック535では、処理される必要のある残っているエンコードされたフレームがあるかどうかが判定される。もしあれば、プロセスはこの例ではブロック505に戻る。もしなければ、プロセスは終了する(ブロック540)。
図9は、条件付き逆量子化器を用いたオーディオ・デコードの方法についてのパラメータを確立するプロセスの例を示す流れ図である。方法900はブロック905で始まる。ここでは仮数トレーニング・データが収集される。そのようなトレーニング・データは、多様な異なる音楽スタイルについてのオーディオ・データ、多様な映画サウンドトラックについてのオーディオ・データ、聴衆拍手データ、環境オーディオ・データ、それらの組み合わせなどといったさまざまな型のオーディオ・データを含んでいてもよい。
ブロック910では、仮数トレーニング・データは指数差対の諸セットに分割される。たとえば、仮数トレーニング・データは、時間領域から周波数領域に変換されてもよい。該データにブロック浮動小数点エンコード・プロセスが適用されて、仮数値および対応する絶対指数値を生成してもよい。絶対指数値について差分指数値が計算されてもよい。差分指数値の対が、複数の周波数ビンのそれぞれにおける仮数値に関連付けられてもよい。
次いで各指数差対について量子化解除方法が決定されてもよい(ブロック915)。量子化方法は、特定の量子化分解能にも対応しうる。たとえば、3レベルの対称的な量子化方法、5レベルの対称的な量子化方法、7レベルの対称的な量子化方法および/または他の量子化方法に従って量子化される仮数について、異なる量子化解除方法が決定されてもよい。いくつかのそのような量子化解除方法は、これらの量子化方法において使われた量子化区間の境界の間の中点に対応しない量子化解除値を適用することに関わってもよい。その代わり、量子化解除値は、仮数トレーニング・データから決定される統計に対応してもよい。しかしながら、他の量子化解除方法は、そのような中点に対応する量子化解除値を適用することに関わっていてもよい。
ブロック920では、各量子化分解能についてデータ構造にデータが入れられる。データ構造は、量子化解除方法および対応する指数差対を含んでいてもよい。データ構造は、メモリに保存されていてもよい。ブロック925では、さらなる量子化分解能について量子化解除方法が決定されるかどうかが決定される。もしそうであれば、プロセスはブロック915または920に戻ってもよい。もしそうでなければ、プロセスは終了する(ブロック930)。
プロセス900は単に、条件付き逆量子化器のための設計プロセスの一例であることを注意しておくべきである。この例では、逆量子化器の条件となる指数プロファイル・データは、指数差対の諸セットを有する。しかしながら、本稿の他所で述べるように、代替的な実装では、逆量子化器は他の型の指数プロファイル・データを条件としてもよい。たとえば、代替的な実装では、指数プロファイル・データは、各周波数ビンについて三つ以上の指数差値を含んでいてもよい。逆量子化器が異なる型の指数プロファイル・データを条件としているときには、図9の諸段階はしかるべく修正される。たとえば、ブロック910において、トレーニング・データは、それぞれが代替的な指数プロファイル・データの特定の値に対応する、より小さなグループに分割されてもよい。
本稿に記載されるさまざまなデコード方法は、ドルビー・デジタルおよびドルビー・デジタル・プラスを含むがそれに限られない既存のコーデックに従ってエンコードされたオーディオ・データとともに使われてもよい。しかしながら、本稿に開示されるいくつかの実装は、新規な量子化および量子化解除方法を提供する。
いくつかのそのような実装によれば、量子化区間境界および/または量子化値の選択は、同じ量子化分解能についてでさえ、変わりうる。いくつかのそのような実装では、量子化区間境界および/または量子化値のエンコード装置による選択は、ある特定の周波数ビンについての指数差対のような指数情報を条件としていてもよい。エンコード装置は、実際のオーディオ・データに基づいていてもよい仮数トレーニング・データに従って、指数差対に関連する量子化区間境界および/または量子化値を決定してもよい。デコード装置はたとえば、対応する量子化解除区間境界および/または量子化解除値に従ってエンコードされたオーディオ・データを量子化解除してもよい。
本稿に記載される新規なエンコーダについての条件付き量子化器の設計は、図9を参照して上記したプロセス900と同様のプロセスに関わっていてもよい。しかしながら、そのような実装においては、ステップ915は、量子化解除方法の代わりにまたはそれに加えて量子化方法を決定するよう適宜修正されうる。いくつかのそのような実装によれば、段階920は、量子化解除方法の代わりにまたはそれに加えて量子化方法を含むデータ構造にデータを入れるよう修正されてもよい。
そのような新規なエンコード技法は、本稿に記載される新規なデコード装置によってのみならず、レガシー・デコード装置によって使用されるのにも好適であるエンコードされたオーディオ・データを与える。
図10は、エンコーダまたはデコーダ装置のコンポーネントの例を与えるブロック図である。装置1000は、携帯電話、スマートフォン、デスクトップ・コンピュータ、ハンドヘルドまたはポータブル・コンピュータ、ネットブック、ノートブック、スマートブック、タブレット、ステレオ・システム、テレビジョン、DVDプレーヤー、デジタル記録装置または多様な他の装置であってもよい。
この例において、装置はインターフェース・システム1005を含む。インターフェース・システム1005は、無線ネットワーク・インターフェースのようなネットワーク・インターフェースを含んでいてもよい。代替的または追加的に、インターフェース・システム1005はユニバーサル・シリアル・バス(USB)インターフェースまたは他のそのようなインターフェースを含んでいてもよい。
装置1000は論理システム1010を含む。論理システム1010は、汎用の単一チップまたは複数チップ・プロセッサのようなプロセッサを含んでいてもよい。論理システム1010はデジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラム可能なゲート・アレイ(FPGA)または他のプログラム可能論理デバイス、離散的なゲートまたはトランジスタ論理または離散的なハードウェア・コンポーネントまたはそれらの組み合わせを含んでいてもよい。論理システム1010は、装置1000の他のコンポーネントを制御するよう構成されていてもよい。装置1000のコンポーネントの間のインターフェースは図10には示されていないが、論理システム1010は他のコンポーネントとの通信のために構成されていてもよい。他のコンポーネントは、適宜互いとの通信のために構成されていてもいなくてもよい。
論理システム1010は、本稿に記載される型のエンコーダおよび/またはデコーダ機能を含むがそれに限られないエンコーダおよび/またはデコーダ機能を実行するよう構成されていてもよい。いくつかのそのような実装では、論理システム1010は、(少なくとも部分的には)一つまたは複数の非一時的な媒体上に記憶されるソフトウェアに従って動作するよう構成されていてもよい。非一時的な媒体は、ランダム・アクセス・メモリ(RAM)および/または読み出し専用メモリ(ROM)のような論理システム1010に関連付けられたメモリを含んでいてもよい。非一時的な媒体はメモリ・システム1015のメモリを含んでいてもよい。メモリ・システム1015は、フラッシュ・メモリ、ハードドライブなどといった一つまたは複数の好適な型の非一時的な記憶媒体を含んでいてもよい。
たとえば、論理システム1010は、インターフェース・システム1005を介して、エンコードされたオーディオ・データのフレームを受領し、本稿に記載されるデコーダ方法に従って、エンコードされたオーディオ・データをデコードするよう構成されていてもよい。代替的または追加的に、論理システム1010は、メモリ・システム1015と論理システム1010との間のインターフェースを介して、エンコードされたオーディオ・データのフレームを受領するよう構成されていてもよい。論理システム1010は、デコードされたオーディオ・データに従ってスピーカー(単数または複数)1020を制御するよう構成されていてもよい。いくつかの実装では、論理システム1010は、通常のエンコード方法に従っておよび/または本稿に記載されるエンコード方法に従ってオーディオ・データをエンコードするよう構成されていてもよい。論理システム1010は、マイクロホン1025を介して、インターフェース・システム1005を介してなどでそのようなオーディオ・データを受領するよう構成されていてもよい。
表示システム1030は、装置1000の具現に依存して、一つまたは複数の好適な型のディスプレイを含んでいてもよい。たとえば、表示システム1030は液晶ディスプレイ、プラズマ・ディスプレイ、双安定ディスプレイなどを含んでいてもよい。
ユーザー入力システム1035は、ユーザーからの入力を受け容れるよう構成された一つまたは複数の装置を含んでいてもよい。いくつかの実装では、ユーザー入力システム1035は、表示システム1030の表示に重なるタッチスクリーンを含んでいてもよい。ユーザー入力システム1035はボタン、キーボード、スイッチなどを含んでいてもよい。いくつかの実装では、ユーザー入力システム1035はマイクロホン1025を含んでいてもよい。ユーザーはマイクロホン1025を介して装置1000のための音声コマンドを提供してもよい。論理システムは、音声認識をするよう、またそのような音声コマンドに従って装置1000の少なくともいくつかの動作を制御するよう構成されていてもよい。
電源システム1040は、ニッケル・カドミウム電池またはリチウム・イオン電池のような一つまたは複数の好適なエネルギー蓄積デバイスを含んでいてもよい。電源システム1040は電気コンセントから電力を受け取るよう構成されていてもよい。
本開示に記述されている実装に対するさまざまな修正が当業者にはすぐに明白となることがありうる。本稿で定義されている一般原理は、本開示の精神や範囲から外れることなく他の実装に適用されてもよい。たとえば、さまざまな実装が指数差対を使って記述されているが、代替的な実装は各周波数ビンについて三つ以上の指数差値に関わっていてもよい。さらに、さまざまな実装がドルビー・デジタルおよびドルビー・デジタル・プラスを使って記述されているが、本稿に記載される方法は他のオーディオ・コーデックとの関連で実装されてもよい。このように、特許請求は、本稿に示される実装に限定されることは意図されておらず、本開示、本稿に開示される原理および新規な特徴と整合する最も広い範囲を与えられるべきものである。
いくつかの態様を記載しておく。
〔態様1〕
オーディオ・データを含むエンコードされたフレームを受領する段階と;
前記エンコードされたフレームから抽出された情報に応答して量子化器分解能データを決定する段階であって、前記量子化器分解能データは、前記エンコードされたフレームの前記オーディオ・データについての変換係数の仮数値を量子化するプロセスの間に使用された量子化区間の数に対応する、段階と;
前記エンコードされたフレームから変換係数の指数プロファイル・データを決定する段階と;
少なくとも部分的に前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記エンコードされたフレームの前記仮数値について複数の量子化解除方法を決定する段階と;
前記複数の量子化解除方法に従って前記仮数値を量子化解除する段階とを含む、
方法。
〔態様2〕
前記指数プロファイル・データが指数差分データを含む、態様1記載の方法。
〔態様3〕
前記指数差分データは5つの差分状態に対応する、態様2記載の方法。
〔態様4〕
前記指数差分データは指数差対を含む、態様2記載の方法。
〔態様5〕
前記仮数値を量子化解除することが、ある周波数についての仮数値を、その周波数についての指数差対に対応する量子化解除方法に従って量子化解除することを含む、態様4記載の方法。
〔態様6〕
前記周波数についての前記指数差対は、より低い周波数についての指数に対する第一の指数差と、より高い周波数についての指数に対する第二の指数差を含む、態様5記載の方法。
〔態様7〕
仮数値を量子化するプロセスの間に使われた前記量子化区間は一様な量子化区間である、態様1ないし6のうちいずれか一項記載の方法。
〔態様8〕
仮数値を量子化するプロセスの間に使われた量子化値は、量子化区間の境界の間の中点に対応し、少なくともいくつかの量子化解除値は量子化区間の前記境界の間の中点に対応しない、態様1ないし7のうちいずれか一項記載の方法。
〔態様9〕
前記量子化解除方法の少なくともいくつかは、前記エンコードされたフレームの仮数値を量子化するプロセスの間に使われた量子化値とは異なる量子化解除値の適用を含む、態様1ないし8のうちいずれか一項記載の方法。
〔態様10〕
前記指数プロファイル・データは、前記エンコードされたフレームにおける対応する仮数値がない指数についてのデータを含む、態様1ないし9のうちいずれか一項記載の方法。
〔態様11〕
インターフェースおよび論理システムを有する装置であって、
前記論理システムは:
前記インターフェースから、オーディオ・データを含むエンコードされたフレームを受領する段階と;
前記エンコードされたフレームから抽出された情報に応答して量子化器分解能データを決定する段階であって、前記量子化器分解能データは、前記エンコードされたフレームの前記オーディオ・データについての変換係数の仮数値を量子化するプロセスの間に使用された量子化区間の数に対応する、段階と;
前記エンコードされたフレームから変換係数の指数プロファイル・データを決定する段階と;
少なくとも部分的に前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記エンコードされたフレームの前記仮数値について複数の量子化解除方法を決定する段階と;
前記複数の量子化解除方法に従って前記仮数値を量子化解除する段階とを実行するよう構成されている、
装置。
〔態様12〕
前記エンコードされたフレームはAC-3フォーマットまたは向上AC-3フォーマットである、態様11記載の装置。
〔態様13〕
前記論理システムが、汎用の単一チップまたは複数チップ・プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラム可能なゲート・アレイ(FPGA)または他のプログラム可能論理デバイス、離散的なゲートまたはトランジスタ論理または離散的なハードウェア・コンポーネントのうちの少なくとも一つを含む、態様11または12記載の装置。
〔態様14〕
メモリ・デバイスをさらに有する態様11ないし13のうちいずれか一項記載の装置であって、前記インターフェースが、前記論理システムと前記メモリ・デバイスとの間のインターフェースを有する、装置。
〔態様15〕
前記インターフェースがネットワーク・インターフェースを有する、態様11ないし14のうちいずれか一項記載の装置。
〔態様16〕
前記指数プロファイル・データが指数差分データを含む、態様11ないし15のうちいずれか一項記載の装置。
〔態様17〕
前記指数差分データが複数の周波数のそれぞれに対応する指数差対を含む、態様16記載の装置。
〔態様18〕
データ構造が記憶されているメモリをさらに有する態様16または17記載の装置であって、前記データ構造は、複数の量子化解除方法および対応する指数差分データを含んでいる、装置。
〔態様19〕
前記論理システムが、前記データ構造を参照することによって、指数差分データに対応する量子化解除方法を決定するよう構成されている、態様18記載の装置。
〔態様20〕
ソフトウェアが記憶されている非一時的な媒体であって、前記ソフトウェアが:
オーディオ・データを含むエンコードされたフレームを受領する段階と;
前記エンコードされたフレームから抽出された情報に応答して量子化器分解能データを決定する段階であって、前記量子化器分解能データは、前記エンコードされたフレームの前記オーディオ・データについての変換係数の仮数値を量子化するプロセスの間に使われた量子化区間の数に対応する、段階と;
前記エンコードされたフレームから、変換係数の指数プロファイル・データを決定する段階と;
少なくとも部分的には前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記エンコードされたフレームの仮数値について複数の量子化解除方法を決定する段階と;
前記複数の量子化解除方法に従って前記仮数値を量子化解除する段階とを実行するようデコード装置を制御するための命令を含んでいる、媒体。
〔態様21〕
時間領域の第一のオーディオ・データを受領する段階と;
前記第一のオーディオ・データを周波数領域の第二のオーディオ・データに変換する段階であって、前記第二のオーディオ・データは変換係数を含む、段階と;
前記変換係数から、指数プロファイル・データを含む指数データを決定する段階と;
前記指数データに応答して量子化器分解能データを決定する段階であって、前記量子化器分解能データは、前記変換係数の仮数値を量子化するプロセスの間に使用されるべき量子化区間の数に対応する、段階と;
少なくとも部分的には前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記変換係数の仮数値についての複数の量子化方法を決定する段階と;
前記複数の量子化方法に従って前記仮数値を量子化する段階とを含む、
方法。
〔態様22〕
前記第二のオーディオ・データ、前記指数データおよび前記量子化された仮数値を含むエンコードされたフレームを形成する段階をさらに含む、態様21記載の方法。
〔態様23〕
仮数値を量子化するプロセスの間に使われる一つまたは複数の量子化値は、量子化区間の境界の間の中点に対応しない、態様21または22記載の方法。
〔態様24〕
前記量子化方法の一つまたは複数は、一様に離間していない境界をもつ量子化区間を使う、態様21ないし23のうちいずれか一項記載の方法。
〔態様25〕
インターフェースおよび論理システムを有する装置であって、
前記論理システムは:
前記インターフェースから、周波数領域の第一のオーディオ・データ、指数データおよび量子化された仮数値を含むエンコードされたフレームを受領する段階であって、前記量子化された仮数値は、少なくとも部分的には量子化器分解能データと、前記指数データから決定される指数プロファイル・データとに基づく諸量子化方法に従って決定されている、段階と;
前記量子化された仮数値から量子化解除された仮数値を決定する段階と;
部分的に前記量子化解除された仮数値に基づいて変換係数を決定する段階と;
前記変換係数を使って逆変換演算を実行して時間領域の第二のオーディオ・データを生成する段階とを実行するよう構成されている、
装置。
〔態様26〕
前記エンコードされたフレームはAC-3フォーマットまたは向上AC-3フォーマットである、態様25記載の装置。
〔態様27〕
前記論理システムが、汎用の単一チップまたは複数チップ・プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラム可能なゲート・アレイ(FPGA)または他のプログラム可能論理デバイス、離散的なゲートまたはトランジスタ論理または離散的なハードウェア・コンポーネントのうちの少なくとも一つを含む、態様25または26記載の装置。
〔態様28〕
メモリ・デバイスをさらに有する態様25ないし27のうちいずれか一項記載の装置であって、前記インターフェースが、前記論理システムと前記メモリ・デバイスとの間のインターフェースを有する、装置。
〔態様29〕
前記インターフェースがネットワーク・インターフェースを有する、態様25ないし28のうちいずれか一項記載の装置。
〔態様30〕
前記量子化方法の一つまたは複数は、一様に離間していない境界をもつ量子化区間を使う、態様25ないし29のうちいずれか一項記載の装置。
〔態様31〕
前記量子化方法の一つまたは複数は、量子化区間の境界の間の中点に対応しない量子化値を使う、態様25ないし30のうちいずれか一項記載の装置。

Claims (24)

  1. オーディオ・データを含むエンコードされたフレームを受領する段階と;
    前記エンコードされたフレームから抽出された情報に応答して量子化器分解能データを決定する段階であって、前記量子化器分解能データは、前記エンコードされたフレームの前記オーディオ・データについての変換係数の仮数値を量子化するプロセスの間に使用された量子化区間の数に対応する、段階と;
    前記エンコードされたフレームから変換係数の指数プロファイル・データを決定する段階と;
    少なくとも部分的に前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記エンコードされたフレームの前記仮数値について複数の量子化解除方法を決定する段階と;
    前記複数の量子化解除方法に従って前記仮数値を量子化解除する段階とを含む、
    方法。
  2. 前記指数プロファイル・データが指数差分データを含む、請求項1記載の方法。
  3. 前記指数差分データは5つの差分状態に対応する、請求項2記載の方法。
  4. 前記指数差分データは指数差対を含む、請求項2記載の方法。
  5. 前記仮数値を量子化解除することが、ある周波数についての仮数値を、その周波数についての指数差対に対応する量子化解除方法に従って量子化解除することを含む、請求項4記載の方法。
  6. 前記周波数についての前記指数差対は、より低い周波数についての指数に対する第一の指数差と、より高い周波数についての指数に対する第二の指数差を含む、請求項5記載の方法。
  7. 仮数値を量子化するプロセスの間に使われた前記量子化区間は一様な量子化区間である、請求項1ないし6のうちいずれか一項記載の方法。
  8. 仮数値を量子化するプロセスの間に使われた量子化値は、量子化区間の境界の間の中点に対応し、少なくともいくつかの量子化解除値は量子化区間の前記境界の間の中点に対応しない、請求項1ないし7のうちいずれか一項記載の方法。
  9. 前記量子化解除方法の少なくともいくつかは、前記エンコードされたフレームの仮数値を量子化するプロセスの間に使われた量子化値とは異なる量子化解除値の適用を含む、請求項1ないし8のうちいずれか一項記載の方法。
  10. 前記指数プロファイル・データは、前記エンコードされたフレームにおける対応する仮数値がない指数についてのデータを含む、請求項1ないし9のうちいずれか一項記載の方法。
  11. インターフェースおよび論理システムを有する装置であって、
    前記論理システムは:
    前記インターフェースから、オーディオ・データを含むエンコードされたフレームを受領する段階と;
    前記エンコードされたフレームから抽出された情報に応答して量子化器分解能データを決定する段階であって、前記量子化器分解能データは、前記エンコードされたフレームの前記オーディオ・データについての変換係数の仮数値を量子化するプロセスの間に使用された量子化区間の数に対応する、段階と;
    前記エンコードされたフレームから変換係数の指数プロファイル・データを決定する段階と;
    少なくとも部分的に前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記エンコードされたフレームの前記仮数値について複数の量子化解除方法を決定する段階と;
    前記複数の量子化解除方法に従って前記仮数値を量子化解除する段階とを実行するよう構成されている、
    装置。
  12. 前記エンコードされたフレームはAC-3フォーマットまたは向上AC-3フォーマットである、請求項11記載の装置。
  13. 前記論理システムが、汎用の単一チップまたは複数チップ・プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラム可能なゲート・アレイ(FPGA)または他のプログラム可能論理デバイス、離散的なゲートまたはトランジスタ論理または離散的なハードウェア・コンポーネントのうちの少なくとも一つを含む、請求項11または12記載の装置。
  14. メモリ・デバイスをさらに有する請求項11ないし13のうちいずれか一項記載の装置であって、前記インターフェースが、前記論理システムと前記メモリ・デバイスとの間のインターフェースを有する、装置。
  15. 前記インターフェースがネットワーク・インターフェースを有する、請求項11ないし14のうちいずれか一項記載の装置。
  16. 前記指数プロファイル・データが指数差分データを含む、請求項11ないし15のうちいずれか一項記載の装置。
  17. 前記指数差分データが複数の周波数のそれぞれに対応する指数差対を含む、請求項16記載の装置。
  18. データ構造が記憶されているメモリをさらに有する請求項16または17記載の装置であって、前記データ構造は、複数の量子化解除方法および対応する指数差分データを含んでいる、装置。
  19. 前記論理システムが、前記データ構造を参照することによって、指数差分データに対応する量子化解除方法を決定するよう構成されている、請求項18記載の装置。
  20. ソフトウェアが記憶されている非一時的な媒体であって、前記ソフトウェアが:
    オーディオ・データを含むエンコードされたフレームを受領する段階と;
    前記エンコードされたフレームから抽出された情報に応答して量子化器分解能データを決定する段階であって、前記量子化器分解能データは、前記エンコードされたフレームの前記オーディオ・データについての変換係数の仮数値を量子化するプロセスの間に使われた量子化区間の数に対応する、段階と;
    前記エンコードされたフレームから、変換係数の指数プロファイル・データを決定する段階と;
    少なくとも部分的には前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記エンコードされたフレームの仮数値について複数の量子化解除方法を決定する段階と;
    前記複数の量子化解除方法に従って前記仮数値を量子化解除する段階とを実行するようデコード装置を制御するための命令を含んでいる、媒体。
  21. 時間領域の第一のオーディオ・データを受領する段階と;
    前記第一のオーディオ・データを周波数領域の第二のオーディオ・データに変換する段階であって、前記第二のオーディオ・データは変換係数を含む、段階と;
    前記変換係数から、指数プロファイル・データを含む指数データを決定する段階と;
    前記指数データに応答して量子化器分解能データを決定する段階であって、前記量子化器分解能データは、前記変換係数の仮数値を量子化するプロセスの間に使用されるべき量子化区間の数に対応する、段階と;
    少なくとも部分的には前記量子化器分解能データおよび前記指数プロファイル・データに基づいて前記変換係数の仮数値についての複数の量子化方法を決定する段階と;
    前記複数の量子化方法に従って前記仮数値を量子化する段階とを含む、
    方法。
  22. 前記第二のオーディオ・データ、前記指数データおよび前記量子化された仮数値を含むエンコードされたフレームを形成する段階をさらに含む、請求項21記載の方法。
  23. 仮数値を量子化するプロセスの間に使われる一つまたは複数の量子化値は、量子化区間の境界の間の中点に対応しない、請求項21または22記載の方法。
  24. 前記量子化方法の一つまたは複数は、一様に離間していない境界をもつ量子化区間を使う、請求項21ないし23のうちいずれか一項記載の方法。
JP2015504552A 2012-04-25 2013-02-15 条件付き量子化器をもつオーディオ・エンコードおよびデコード Expired - Fee Related JP5970602B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261638090P 2012-04-25 2012-04-25
US61/638,090 2012-04-25
US13/560,144 US8401863B1 (en) 2012-04-25 2012-07-27 Audio encoding and decoding with conditional quantizers
US13/560,144 2012-07-27
PCT/US2013/026481 WO2013162679A1 (en) 2012-04-25 2013-02-15 Audio encoding and decoding with conditional quantizers

Publications (2)

Publication Number Publication Date
JP2015512532A JP2015512532A (ja) 2015-04-27
JP5970602B2 true JP5970602B2 (ja) 2016-08-17

Family

ID=47844802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015504552A Expired - Fee Related JP5970602B2 (ja) 2012-04-25 2013-02-15 条件付き量子化器をもつオーディオ・エンコードおよびデコード

Country Status (6)

Country Link
US (1) US8401863B1 (ja)
EP (1) EP2842126B1 (ja)
JP (1) JP5970602B2 (ja)
CN (1) CN104246875B (ja)
TW (1) TWI585750B (ja)
WO (1) WO2013162679A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396119B1 (en) * 2009-09-30 2013-03-12 Ambarella, Inc. Data sample compression and decompression using randomized quantization bins
US11609784B2 (en) * 2018-04-18 2023-03-21 Intel Corporation Method for distributing a computational process, workload distribution device and system for distributing a computational process
US10769819B2 (en) * 2018-09-24 2020-09-08 Qualcomm Incorporated Floating-point data compression
US12045724B2 (en) 2018-12-31 2024-07-23 Microsoft Technology Licensing, Llc Neural network activation compression with outlier block floating-point
US11562247B2 (en) * 2019-01-24 2023-01-24 Microsoft Technology Licensing, Llc Neural network activation compression with non-uniform mantissas

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
EP1228569A1 (en) * 1999-10-30 2002-08-07 STMicroelectronics Asia Pacific Pte Ltd. A method of encoding frequency coefficients in an ac-3 encoder
US6807528B1 (en) * 2001-05-08 2004-10-19 Dolby Laboratories Licensing Corporation Adding data to a compressed data frame
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
CN101427307B (zh) * 2005-09-27 2012-03-07 Lg电子株式会社 编码/解码多声道音频信号的方法和装置
US8090587B2 (en) * 2005-09-27 2012-01-03 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
US8301803B2 (en) * 2009-10-23 2012-10-30 Samplify Systems, Inc. Block floating point compression of signal data

Also Published As

Publication number Publication date
CN104246875B (zh) 2016-08-24
CN104246875A (zh) 2014-12-24
TWI585750B (zh) 2017-06-01
WO2013162679A1 (en) 2013-10-31
TW201351395A (zh) 2013-12-16
EP2842126A1 (en) 2015-03-04
US8401863B1 (en) 2013-03-19
JP2015512532A (ja) 2015-04-27
EP2842126B1 (en) 2016-05-04

Similar Documents

Publication Publication Date Title
JP6702593B2 (ja) 音声信号の符号化と復号化の方法および装置
JP5970602B2 (ja) 条件付き量子化器をもつオーディオ・エンコードおよびデコード
CN105723454B (zh) 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备
JP6351770B2 (ja) オーディオ信号中でビットを割り当てる方法及び装置
MX2014004797A (es) Método y aparato de codificación sin perdida de energia, método y aparato de codificación de audio, método y aparato de decodificación sin perdida de energia y método y aparato de decodificación de audio.
JP2015521759A (ja) サブバンド領域内での自由選択可能な周波数偏移のための装置、方法およびコンピュータプログラム
US10789964B2 (en) Dynamic bit allocation methods and devices for audio signal
US20200135218A1 (en) Signal Processing Method and Device
TWI438770B (zh) 使用通道間及時間冗餘減少之音訊信號編碼
JP2020518030A (ja) デジタルオーディオ信号における差分データ
CN110235197A (zh) 立体声音频信号编码器
JP6179087B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム
EP2481048B1 (en) Audio coding
CN116189693A (zh) 一种带宽扩展方法、装置、介质及设备
JP2008090178A (ja) 信号処理方法、信号処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160711

R150 Certificate of patent or registration of utility model

Ref document number: 5970602

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees