JP2011501828A - Mdctスペクトルの組み合せエンコーディングを使用する、スケーラブルなスピーチおよびオーディオエンコーディング - Google Patents
Mdctスペクトルの組み合せエンコーディングを使用する、スケーラブルなスピーチおよびオーディオエンコーディング Download PDFInfo
- Publication number
- JP2011501828A JP2011501828A JP2010531210A JP2010531210A JP2011501828A JP 2011501828 A JP2011501828 A JP 2011501828A JP 2010531210 A JP2010531210 A JP 2010531210A JP 2010531210 A JP2010531210 A JP 2010531210A JP 2011501828 A JP2011501828 A JP 2011501828A
- Authority
- JP
- Japan
- Prior art keywords
- spectral lines
- signal
- encoding
- transform
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 106
- 230000003595 spectral effect Effects 0.000 claims abstract description 203
- 238000000034 method Methods 0.000 claims abstract description 111
- 230000005236 sound signal Effects 0.000 claims abstract description 70
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims 3
- 230000009466 transformation Effects 0.000 abstract description 4
- 239000010410 layer Substances 0.000 description 108
- 238000010586 diagram Methods 0.000 description 26
- 238000013139 quantization Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 18
- 230000006870 function Effects 0.000 description 16
- 239000012792 core layer Substances 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 11
- 230000003044 adaptive effect Effects 0.000 description 8
- 239000002131 composite material Substances 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 230000005284 excitation Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000007493 shaping process Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005549 size reduction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
図1は、1つ以上のコード化の特徴を実現してもよい通信システムを図示するブロック図である。コーダ102は、到来する入力オーディオ信号104を受け取り、エンコードされたオーディオ信号106を発生させる。エンコードされたオーディオ信号106は、(例えば、ワイヤレスまたはワイヤードの)送信チャネルを通してデコーダ108に送信される。デコーダ108は、エンコードされたオーディオ信号106に基づいて入力オーディオ信号104を再構成することを試みて、再構成された出力オーディオ信号110を発生させる。説明のために、コーダ102は、送信デバイス上で動作してもよく、一方、デコーダデバイスは、受信デバイス上で動作してもよい。しかしながら、そのようなデバイスは、エンコーダおよびデコーダの両方を含んでいてもよいことが明白であるはずである。
コーダ102(図1)、デコーダ108(図1)、スピーチ/オーディオエンコーディングモジュール212(図2)および/またはスピーチ/オーディオデコーディングモジュール316(図3)は、スケーラブルなオーディオコーデックとして実現されてもよい。そのようなスケーラブルなオーディオコーデックは、高品質の、配信されるエンコードされた狭帯域スピーチ信号または広帯域オーディオ/音楽信号をともなう、誤りをこうむりやすい電気通信チャネルに対して、高性能広帯域スピーチコード化を提供するように実現されていてもよい。スケーラブルなオーディオコーデックに対する1つのアプローチは、反復的エンコーディングレイヤを提供することであり、1つのレイヤからの誤差信号(残差)が、後続のレイヤにおいてエンコードされて、前のレイヤにおいてエンコードされたオーディオ信号がさらに改善される。例えば、コードブック励振線形予測(CELP)は、異なる励振信号のコードブックがエンコーダおよびデコーダ上で維持される線形予測コード化の概念に基づいている。エンコーダは、最も適切な励振信号を見つけ、(固定型の代数コードブック、および/または適応型コードブックから)その対応するインデックスをデコーダに送り、デコーダは次に、それを使用して、(コードブックに基づいて)信号を再生する。エンコーダは、オーディオ信号をエンコードし、次にデコードすることによって、合成による分析を実行して、再構成された、または合成されたオーディオ信号を生成する。エンコーダは次に、誤差信号の、すなわち、元のオーディオ信号と、再構成された、または、合成されたオーディオ信号との間の差の、エネルギーを最小にするパラメータを見つける。出力ビットレートは、より多いまたはより少ないコード化レイヤを使用することによって調整して、チャネル要求および所望のオーディオ品質を満たすことができる。そのようなスケーラブルなオーディオコーデックは、いくつかのレイヤを含んでいてもよく、より低いレイヤのデコーディングに影響を及ぼすことなく、より高いレイヤのビットストリームを廃棄できる。
図4は、1つの例にしたがった、スケーラブルなエンコーダ402のブロック図である。エンコーディングの前の事前処理の段階において、入力信号404は、望まれない低周波数成分を抑制するためにハイパスフィルタリング406されて、フィルタリングされた入力信号SHP(n)が生成される。例えば、ハイパスフィルタ406は、広帯域入力信号に対して25Hzのカットオフと、狭帯域入力信号に対して100Hzのカットオフとを有していてもよい。フィルタリングされた入力信号SHP(n)は次に、再サンプリングモジュール408によって再サンプリングされて、再サンプリングされた入力信号S12.8(n)が生成される。例えば、オリジナル入力信号404は、16kHzでサンプリングされていてもよく、12.8kHzに再サンプリングされ、12.8kHzは、レイヤL1および/またはL2エンコーディングに対して使用される内部周波数であってもよい。事前エンファシスモジュール410が次に、1次ハイパスフィルタを適用して、再サンプリングされた入力信号S12.8(n)のより高い周波数を強調し、(および低周波数を減衰させる)。結果として生じる信号は次に、エンコーダ/デコーダモジュール412に渡され、エンコーダ/デコーダモジュール412は、コード励振線形予測(CELP)ベースのアルゴリズムに基づいてレイヤL1および/またはL2エンコーディングを実行してもよく、スピーチ信号は、スペクトル包絡を表す線形予測(LP)合成フィルタを通過した励振信号によってモデル化される。信号エネルギーが、各知覚臨界帯域に対して計算されて、レイヤL1およびL2エンコーディングの一部として使用されてもよい。さらに、エンコードされるエンコーダ/デコーダモジュール412はまた、入力信号のバージョンを合成(再構成)してもよい。すなわち、エンコーダ/デコーダモジュール412が入力信号をエンコードした後、エンコーダ/デコーダモジュール412は、入力信号をデコードし、逆エンファシスモジュール416および再サンプリングモジュール418が、入力信号404のバージョンs2^(n)を再作成する。残差信号x2(n)が、元の信号SHP(n)と、再作成された信号s2^(n)との間の差420を取ることにより発生される(すなわち、x2(n)=SHP(n)−s2^(n))。残差信号x2(n)は次に、重み付けモジュール424によって知覚的に重み付けされ、MDCTモジュール428によってMDCTスペクトルまたは領域に変換されて、残差信号X2(k)が発生される。残差信号X2(k)は次に組み合せスペクトルエンコーダ432に提供され、組み合せスペクトルエンコーダ432は、残差信号X2(k)をエンコードして、レイヤL3、L4および/またはL5に対してエンコードされたパラメータを生成させる。1つの例において、組み合せスペクトルエンコーダ432は、残差信号X2(k)において非ゼロのスペクトル線(パルス)を表すインデックスを発生させる。例えば、インデックスは、非ゼロのスペクトル線の位置を表す複数の可能性のあるバイナリストリングのうちの1つを表してもよい。組み合せ技術のために、インデックスは、バイナリストリングの長さよりも少ないビットで、バイナリストリングにおける非ゼロのスペクトル線を表してもよい。
レイヤL3、L4およびL5は、MDCTスペクトル(例えば、前のレイヤに対する残差を表すMDCT係数)においてコード化を実行することから、そのようなMDCTスペクトルコード化は効率的であることが望まれる。それゆえに、MDCTスペクトルコード化の効率的な方法を提供する。
選択されたサブパルスを表わす辞書式インデックスを、2項係数に基づく組み合せ位置コード化技術を使用して発生させてもよい。例えば、k個の非ゼロビット(ストリングw中の非ゼロの各ビットは、エンコードすべきパルスの位置を示す)を有する長さnの、1組の可能性のあるすべての
1つの例にしたがうと、選択されたサブパルスの位置を表すバイナリストリングに対する辞書式インデックスは、2項係数に基づいて計算してもよく、1つの可能な構成において、2項係数は、事前に計算し、以下のように三角形のアレイ(パスカルの三角形)において記憶させることができる。
図10は、スケーラブルなスピーチおよびオーディオコーデックにおいて変換スペクトルをエンコードする方法を説明するブロック図である。残差信号が、コード励振線形予測(CELP)ベースのエンコーディングレイヤから取得され、ここで、残差信号は、元のオーディオ信号と、元のオーディオ信号の再構成されたバージョンとの間の差である(1002)。元のオーディオ信号の再構成されたバージョンは、(a)CELPベースのエンコーディングレイヤからの元のオーディオ信号のエンコードされたバージョンを合成して、合成信号を取得することと、(b)合成信号を再強調することと、および/または、(c)元のオーディオ信号の再構成されたバージョンを取得するために、再強調された信号をアップサンプリングすることと、によって取得してもよい。
図11は、デコーダの例を図示するブロック図である。各オーディオフレーム(例えば、20ミリ秒フレーム)において、デコーダ1102は、1つ以上のレイヤの情報を含んでいる入力ビットストリーム1104を受信してもよい。受信レイヤは、レイヤ1からレイヤ5までの範囲にわたり、8kビット/sないし32kビット/sのビットレートに対応してもよい。これは、デコーダの動作が、各フレームにおいて受信される、ビットの数(レイヤ)により調整されることを意味する。この例において、出力信号1132はWBであり、すべてのレイヤがデコーダ1102において正確に受信されているものと仮定する。コアレイヤ(レイヤ1)およびACELP強化レイヤ(レイヤ2)が、デコーダモジュール1106によって最初にデコードされ、信号合成が実行される。合成された信号は次に、逆エンファシスモジュール1108によって逆強調され、再サンプリングモジュール1110によって16kHzに再サンプリングされて、信号s16^(n)が発生される。事後処理モジュールが信号s16^(n)をさらに処理して、レイヤ1またはレイヤ2の合成信号s2^(n)を発生させる。
サブパルスの位置を表す、受信された辞書式インデックスをデコードするために、所定の辞書式インデックスに基づいて、逆プロセスを実行して、シーケンスまたはバイナリストリングを取得してもよい。そのような逆プロセスの1つの例は、次のように実現できる:
図13は、スケーラブルなスピーチおよびオーディオコーデックにおいて変換スペクトルをデコードする方法を説明するブロック図である。残差信号の複数の変換スペクトルのスペクトル線を表すインデックスが取得され、ここで、残差信号は、元のオーディオ信号と、コード励振線形予測(CELP)ベースのエンコーディングレイヤからの、元のオーディオ信号の再構成されたバージョンとの間の差である(1302)。インデックスは、バイナリストリングの長さよりも少ないビットで、バイナリストリング中の非ゼロのスペクトル線を表すことができる。1つの例において、取得されるインデックスは、バイナリストリング内のスペクトル線の位置を表わしてもよく、スペクトル線の位置は、次の組み合せ公式に基づいてエンコードされている:
Claims (40)
- スケーラブルなスピーチおよびオーディオコーデック中でエンコードする方法において、
コード励振線形予測(CELP)ベースのエンコーディングレイヤから残差信号を取得し、前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号の再構成されたバージョンとの間の差であることと、
離散コサイン変換(DCT)タイプの変換レイヤにおいて前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得することと、
組み合せ位置コード化技術を使用して、前記変換スペクトルのスペクトル線をエンコードすることとを含む方法。 - 前記DCTタイプの変換レイヤは、修正離散コサイン変換(MDCT)レイヤであり、前記変換スペクトルは、MDCTスペクトルである請求項1記載の方法。
- 前記変換スペクトルのスペクトル線をエンコードすることは、
非ゼロのスペクトル線の位置に対して前記組み合せ位置コード化技術を使用してスペクトル線の位置を表すことに基づいて、選択されたサブセットのスペクトル線の位置をエンコードすることを含む請求項1記載の方法。 - 前記複数のスペクトル線を複数のサブバンドに分割することと、
連続するサブバンドをリージョンにグループ化することとをさらに含む請求項1記載の方法。 - 前記リージョン中のサブバンドのそれぞれに対する複数のスペクトル線から選択されたメインパルスをエンコードすることをさらに含む請求項4記載の方法。
- 非ゼロのスペクトル線の位置に対して前記組み合せ位置コード化技術を使用してスペクトル線の位置を表すことに基づいて、リージョン内の選択されたサブセットのスペクトル線の位置をエンコードすることをさらに含み、
前記変換スペクトルのスペクトル線をエンコードすることは、前記リージョン中のすべての位置に等しい長さのすべての可能性のあるバイナリストリングの、前記選択されたサブセットのスペクトル線の位置に基づいて、アレイを発生させることを含む請求項4記載の方法。 - 前記リージョンは、オーバーラップしており、各リージョンは、複数の連続するサブバンドを含む請求項4記載の方法。
- 前記組み合せ位置コード化技術は、
選択されたサブセットのスペクトル線に対する辞書式インデックスを発生させることを含み、各辞書式インデックスは、前記選択されたサブセットのスペクトル線の位置を表している複数の可能性のあるバイナリストリングのうちの1つを表す請求項1記載の方法。 - 前記辞書式インデックスは、バイナリストリングの長さよりも少ないビットで、前記バイナリストリングにおける非ゼロのスペクトル線を表す請求項8記載の方法。
- エンコードすることに先立って、1組のスペクトル線を落として、スペクトル線の数を低減させることをさらに含む請求項1記載の方法。
- 前記元のオーディオ信号の再構成されたバージョンは、
前記CELPベースのエンコーディングレイヤからの、前記元のオーディオ信号のエンコードされたバージョンを合成して、合成された信号を取得することと、
前記合成された信号を再強調することと、
前記元のオーディオ信号の再構成されたバージョンを取得するために、前記再強調された信号をアップサンプリングすることとにより取得される請求項1記載の方法。 - スケーラブルなスピーチおよびオーディオエンコーダデバイスにおいて、
コード励振線形予測(CELP)ベースのエンコーディングレイヤモジュールから残差信号を取得するように適合され、前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号の再構成されたバージョンとの間の差であり、前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得するように適合されている離散コサイン変換(DCT)タイプの変換レイヤモジュールと、
組み合せ位置コード化技術を使用して、前記変換スペクトルのスペクトル線をエンコードするように適合されている組み合せスペクトルエンコーダとを具備するデバイス。 - 前記DCTタイプの変換レイヤモジュールは、修正離散コサイン変換(MDCT)レイヤモジュールであり、前記変換スペクトルは、MDCTスペクトルである請求項13記載のデバイス。
- 前記変換スペクトルのスペクトル線をエンコードすることは、
非ゼロのスペクトル線の位置に対して前記組み合せ位置コード化技術を使用してスペクトル線の位置を表すことに基づいて、選択されたサブセットのスペクトル線の位置をエンコードすることを含む請求項13記載のデバイス。 - 前記複数のスペクトル線を複数のサブバンドに分割するように適合されているサブバンド発生器と、
連続するサブバンドをリージョンにグループ化するように適合されているリージョン発生器とをさらに具備する請求項13記載のデバイス。 - 前記リージョン中のサブバンドのそれぞれに対する複数のスペクトル線から選択されたメインパルスをエンコードするように適合されているメインパルスエンコーダをさらに具備する請求項16記載のデバイス。
- 非ゼロのスペクトル線の位置に対して前記組み合せ位置コード化技術を使用してスペクトル線の位置を表すことに基づいて、リージョン内の選択されたサブセットのスペクトル線の位置をエンコードするように適合されているサブパルスエンコーダをさらに具備し、
前記変換スペクトルのスペクトル線をエンコードすることは、前記リージョン中のすべての位置に等しい長さのすべての可能性のあるバイナリストリングの、前記選択されたサブセットのスペクトル線の位置に基づいて、アレイを発生させることを含む請求項16記載の方法。 - 前記リージョンは、オーバーラップしており、各リージョンは、複数の連続するサブバンドを含む請求項16記載のデバイス。
- 前記組み合せ位置コード化技術は、
選択されたサブセットのスペクトル線に対する辞書式インデックスを発生させることを含み、各辞書式インデックスは、前記選択されたサブセットのスペクトル線の位置を表している複数の可能性のあるバイナリストリングのうちの1つを表す請求項13記載のデバイス。 - 前記辞書式インデックスは、バイナリストリングの長さよりも少ないビットで、前記バイナリストリングにおける非ゼロのスペクトル線を表す請求項20記載のデバイス。
- 前記元のオーディオ信号の再構成されたバージョンは、
前記CELPベースのエンコーディングレイヤからの、前記元のオーディオ信号のエンコードされたバージョンを合成して、合成された信号を取得することと、
前記合成された信号を再強調することと、
前記元のオーディオ信号の再構成されたバージョンを取得するために、前記再強調された信号をアップサンプリングすることとにより取得される請求項13記載のデバイス。 - スケーラブルなスピーチおよびオーディオエンコーダデバイスにおいて、
コード励振線形予測(CELP)ベースのエンコーディングレイヤから残差信号を取得する手段と、
離散コサイン変換(DCT)タイプの変換レイヤにおいて前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得する手段と、
組み合せ位置コード化技術を使用して、前記変換スペクトルのスペクトル線をエンコードする手段とを具備し、
前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号の再構成されたバージョンとの間の差であるデバイス。 - スケーラブルなスピーチおよびオーディオエンコーディング回路を含むプロセッサにおいて、
前記回路は、
コード励振線形予測(CELP)ベースのエンコーディングレイヤから残差信号を取得するように適合され、
離散コサイン変換(DCT)タイプの変換レイヤにおいて前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得するように適合され、
組み合せ位置コード化技術を使用して、前記変換スペクトルのスペクトル線をエンコードするように適合されており、
前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号の再構成されたバージョンとの間の差であるプロセッサ。 - スケーラブルなスピーチおよびオーディオエンコーディングに対して動作可能な命令を含む機械読み取り可能媒体において、
1つ以上のプロセッサによって実行されるとき、前記命令は、
コード励振線形予測(CELP)ベースのエンコーディングレイヤから残差信号を取得することと、
離散コサイン変換(DCT)タイプの変換レイヤにおいて前記残差信号を変換して、複数のスペクトル線を有する対応する変換スペクトルを取得することと、
組み合せ位置コード化技術を使用して、前記変換スペクトルのスペクトル線をエンコードすることとを前記プロセッサに生じさせ、
前記残差信号は、元のオーディオ信号と、前記元のオーディオ信号の再構成されたバージョンとの間の差である機械読み取り可能媒体。 - スケーラブルなスピーチおよびオーディオデコーディングの方法において、
残差信号の複数の変換スペクトルのスペクトル線を表すインデックスを取得し、前記残差信号は、元のオーディオ信号と、コード励振線形予測(CELP)ベースのエンコーディングレイヤからの、前記元のオーディオ信号の再構成されたバージョンとの間の差であることと、
前記複数の変換スペクトルのスペクトル線をエンコードするために使用される組み合せ位置コード化技術を逆に行うことによって、前記インデックスをデコードすることと、
逆離散コサイン変換(IDCT)タイプの逆変換レイヤにおいて、前記デコードされた、複数の変換スペクトルのスペクトル線を使用して、前記残差信号のバージョンを合成することとを含む方法。 - 前記元のオーディオ信号をエンコードしているCELPエンコード信号を受信することと、
CELPエンコード信号をデコードして、デコードされた信号を発生させることと、
前記デコード信号を、前記残差信号の合成されたバージョンと組み合わせて、前記元のオーディオ信号の再構成されたバージョンを取得することとをさらに含む請求項27記載の方法。 - 前記残差信号のバージョンを合成することは、逆DCTタイプの変換を前記変換スペクトルのスペクトル線に適用して、前記残差信号の時間領域バージョンを生成させることを含む請求項27記載の方法。
- 前記変換スペクトルのスペクトル線をデコードすることは、
非ゼロのスペクトル線の位置に対して前記組み合せ位置コード化技術を使用してスペクトル線の位置を表すことに基づいて、選択されたサブセットのスペクトル線の位置をデコードすることを含む請求項27記載の方法。 - 前記インデックスは、バイナリストリングの長さよりも少ないビットで、前記バイナリストリングにおける非ゼロのスペクトル線を表す請求項27記載の方法。
- 前記DCTタイプの逆変換レイヤは、逆修正離散コサイン変換(IMDCT)レイヤであり、前記変換スペクトルは、MDCTスペクトルである請求項27記載の方法。
- スケーラブルなスピーチおよびオーディオデコーダデバイスにおいて、
残差信号の複数の変換スペクトルのスペクトル線を表すインデックスを取得するように適合され、前記残差信号は、元のオーディオ信号と、コード励振線形予測(CELP)ベースのエンコーディングレイヤからの、前記元のオーディオ信号の再構成されたバージョンとの間の差であり、前記複数の変換スペクトルのスペクトル線をエンコードするために使用される組み合せ位置コード化技術を逆に行うことによって、前記インデックスをデコードするように適合されている組み合せスペクトルデコーダと、
前記デコードされた、複数の変換スペクトルのスペクトル線を使用して、前記残差信号のバージョンを合成するように適合されている、逆離散コサイン変換(IDCT)タイプの逆変換レイヤモジュールとを具備するデバイス。 - 前記元のオーディオ信号をエンコードしているCELPエンコード信号を受信し、
CELPエンコード信号をデコードして、デコードされた信号を発生させ、
前記デコード信号を、前記残差信号の合成されたバージョンと組み合わせて、前記元のオーディオ信号の再構成されたバージョンを取得するように適合されているCELPデコーダをさらに具備する請求項34記載のデバイス。 - 前記残差信号のバージョンを合成する、前記(IDCT)タイプの逆変換レイヤモジュールは、逆DCTタイプの変換を前記変換スペクトルのスペクトル線に適用して、前記残差信号の時間領域バージョンを生成させるように適合されている請求項34記載のデバイス。
- 前記インデックスは、バイナリストリングの長さよりも少ないビットで、前記バイナリストリングにおける非ゼロのスペクトル線を表す請求項34記載のデバイス。
- スケーラブルなスピーチおよびオーディオデコーダデバイスにおいて、
残差信号の複数の変換スペクトルのスペクトル線を表すインデックスを取得する手段であって、前記残差信号は、元のオーディオ信号と、コード励振線形予測(CELP)ベースのエンコーディングレイヤからの、前記元のオーディオ信号の再構成されたバージョンとの間の差である手段と、
前記複数の変換スペクトルのスペクトル線をエンコードするために使用される組み合せ位置コード化技術を逆に行うことによって、前記インデックスをデコードする手段と、
逆離散コサイン変換(IDCT)タイプの逆変換レイヤにおいて、前記デコードされた、複数の変換スペクトルのスペクトル線を使用して、前記残差信号のバージョンを合成する手段とを具備するデバイス。 - スケーラブルなスピーチおよびオーディオデコーディング回路を含むプロセッサにおいて、
前記回路は、
残差信号の複数の変換スペクトルのスペクトル線を表すインデックスを取得するように適合され、前記残差信号は、元のオーディオ信号と、コード励振線形予測(CELP)ベースのエンコーディングレイヤからの、前記元のオーディオ信号の再構成されたバージョンとの間の差であり、
前記複数の変換スペクトルのスペクトル線をエンコードするために使用される組み合せ位置コード化技術を逆に行うことによって、前記インデックスをデコードするように適合され、
逆離散コサイン変換(IDCT)タイプの逆変換レイヤにおいて、前記デコードされた、複数の変換スペクトルのスペクトル線を使用して、前記残差信号のバージョンを合成するように適合されているプロセッサ。 - スケーラブルなスピーチおよびオーディオデコーディングに対して動作可能な命令を含む機械読み取り可能媒体において、
1つ以上のプロセッサによって実行されるとき、前記命令は、
残差信号の複数の変換スペクトルのスペクトル線を表すインデックスを取得し、前記残差信号は、元のオーディオ信号と、コード励振線形予測(CELP)ベースのエンコーディングレイヤからの、前記元のオーディオ信号の再構成されたバージョンとの間の差であることと、
前記複数の変換スペクトルのスペクトル線をエンコードするために使用される組み合せ位置コード化技術を逆に行うことによって、前記インデックスをデコードすることと、
逆離散コサイン変換(IDCT)タイプの逆変換レイヤにおいて、前記デコードされた、複数の変換スペクトルのスペクトル線を使用して、前記残差信号のバージョンを合成することとを前記プロセッサに生じさせる機械読み取り可能媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US98181407P | 2007-10-22 | 2007-10-22 | |
US12/255,604 US8527265B2 (en) | 2007-10-22 | 2008-10-21 | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
PCT/US2008/080824 WO2009055493A1 (en) | 2007-10-22 | 2008-10-22 | Scalable speech and audio encoding using combinatorial encoding of mdct spectrum |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013083340A Division JP2013178539A (ja) | 2007-10-22 | 2013-04-11 | Mdctスペクトルの組み合せエンコーディングを使用する、スケーラブルなスピーチおよびオーディオエンコーディング |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011501828A true JP2011501828A (ja) | 2011-01-13 |
Family
ID=40210550
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010531210A Ceased JP2011501828A (ja) | 2007-10-22 | 2008-10-22 | Mdctスペクトルの組み合せエンコーディングを使用する、スケーラブルなスピーチおよびオーディオエンコーディング |
JP2013083340A Withdrawn JP2013178539A (ja) | 2007-10-22 | 2013-04-11 | Mdctスペクトルの組み合せエンコーディングを使用する、スケーラブルなスピーチおよびオーディオエンコーディング |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013083340A Withdrawn JP2013178539A (ja) | 2007-10-22 | 2013-04-11 | Mdctスペクトルの組み合せエンコーディングを使用する、スケーラブルなスピーチおよびオーディオエンコーディング |
Country Status (13)
Country | Link |
---|---|
US (1) | US8527265B2 (ja) |
EP (1) | EP2255358B1 (ja) |
JP (2) | JP2011501828A (ja) |
KR (1) | KR20100085994A (ja) |
CN (2) | CN101836251B (ja) |
AU (1) | AU2008316860B2 (ja) |
BR (1) | BRPI0818405A2 (ja) |
CA (1) | CA2701281A1 (ja) |
IL (1) | IL205131A0 (ja) |
MX (1) | MX2010004282A (ja) |
RU (1) | RU2459282C2 (ja) |
TW (1) | TWI407432B (ja) |
WO (1) | WO2009055493A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013537647A (ja) * | 2010-07-30 | 2013-10-03 | クゥアルコム・インコーポレイテッド | オーディオ信号の従属モードコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体 |
JPWO2013051210A1 (ja) * | 2011-10-07 | 2015-03-30 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 符号化装置及び符号化方法 |
JP2016538602A (ja) * | 2013-09-16 | 2016-12-08 | サムスン エレクトロニクス カンパニー リミテッド | 信号符号化方法及びその装置、並びに信号復号化方法及びその装置 |
JP2017506771A (ja) * | 2014-02-17 | 2017-03-09 | サムスン エレクトロニクス カンパニー リミテッド | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 |
US10388293B2 (en) | 2013-09-16 | 2019-08-20 | Samsung Electronics Co., Ltd. | Signal encoding method and device and signal decoding method and device |
US10395663B2 (en) | 2014-02-17 | 2019-08-27 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus, and signal decoding method and apparatus |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
DK2827327T3 (da) | 2007-04-29 | 2020-10-12 | Huawei Tech Co Ltd | Fremgangsmåde til excitationsimpulskodning |
WO2010044593A2 (ko) | 2008-10-13 | 2010-04-22 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
KR101649376B1 (ko) | 2008-10-13 | 2016-08-31 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
CN101931414B (zh) * | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
WO2011045926A1 (ja) * | 2009-10-14 | 2011-04-21 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
CN102667923B (zh) | 2009-10-20 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法 |
WO2011058758A1 (ja) * | 2009-11-13 | 2011-05-19 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
JP5812998B2 (ja) * | 2009-11-19 | 2015-11-17 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置 |
CN102081926B (zh) * | 2009-11-27 | 2013-06-05 | 中兴通讯股份有限公司 | 格型矢量量化音频编解码方法和*** |
CA2786944C (en) | 2010-01-12 | 2016-03-15 | Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries |
CN104252862B (zh) | 2010-01-15 | 2018-12-18 | Lg电子株式会社 | 处理音频信号的方法和装置 |
EP2357649B1 (en) | 2010-01-21 | 2012-12-19 | Electronics and Telecommunications Research Institute | Method and apparatus for decoding audio signal |
CN102918590B (zh) * | 2010-03-31 | 2014-12-10 | 韩国电子通信研究院 | 编码方法和装置、以及解码方法和装置 |
ES2501840T3 (es) * | 2010-05-11 | 2014-10-02 | Telefonaktiebolaget Lm Ericsson (Publ) | Procedimiento y disposición para el procesamiento de señales de audio |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
CN102959873A (zh) * | 2010-07-05 | 2013-03-06 | 日本电信电话株式会社 | 编码方法、解码方法、装置、程序及记录介质 |
US8879634B2 (en) | 2010-08-13 | 2014-11-04 | Qualcomm Incorporated | Coding blocks of data using one-to-one codes |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
MY164164A (en) | 2011-05-13 | 2017-11-30 | Samsung Electronics Co Ltd | Bit allocating, audio encoding and decoding |
US9472199B2 (en) | 2011-09-28 | 2016-10-18 | Lg Electronics Inc. | Voice signal encoding method, voice signal decoding method, and apparatus using same |
US8924203B2 (en) | 2011-10-28 | 2014-12-30 | Electronics And Telecommunications Research Institute | Apparatus and method for coding signal in a communication system |
CN103493130B (zh) * | 2012-01-20 | 2016-05-18 | 弗劳恩霍夫应用研究促进协会 | 用以利用正弦代换进行音频编码及译码的装置和方法 |
WO2013142650A1 (en) | 2012-03-23 | 2013-09-26 | Dolby International Ab | Enabling sampling rate diversity in a voice communication system |
KR101398189B1 (ko) * | 2012-03-27 | 2014-05-22 | 광주과학기술원 | 음성수신장치 및 음성수신방법 |
WO2014009775A1 (en) * | 2012-07-12 | 2014-01-16 | Nokia Corporation | Vector quantization |
EP2720222A1 (en) | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
PL3584791T3 (pl) * | 2012-11-05 | 2024-03-18 | Panasonic Holdings Corporation | Urządzenie do kodowania mowy/dźwięku oraz sposób kodowania mowy/dźwięku |
RU2660605C2 (ru) | 2013-01-29 | 2018-07-06 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Концепция заполнения шумом |
PL2951820T3 (pl) | 2013-01-29 | 2017-06-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób wyboru jednego spośród pierwszego algorytmu kodowania i drugiego algorytmu kodowania |
HUE030163T2 (en) | 2013-02-13 | 2017-04-28 | ERICSSON TELEFON AB L M (publ) | Hide frame failure |
KR102148407B1 (ko) * | 2013-02-27 | 2020-08-27 | 한국전자통신연구원 | 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법 |
PL2936814T3 (pl) * | 2013-03-26 | 2018-07-31 | Dolby Laboratories Licensing Corporation | Kodowanie percepcyjnie kwantyzowanej treści wideo podczas wielowarstwowego kodowania VDR |
CA2915805C (en) | 2013-06-21 | 2021-10-19 | Jeremie Lecomte | Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation |
TR201808890T4 (tr) | 2013-06-21 | 2018-07-23 | Fraunhofer Ges Forschung | Bir konuşma çerçevesinin yeniden yapılandırılması. |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
KR101782278B1 (ko) * | 2013-10-18 | 2017-10-23 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 스펙트럼의 피크 위치의 코딩 및 디코딩 |
RU2638734C2 (ru) | 2013-10-18 | 2017-12-15 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодирование спектральных коэффициентов спектра аудиосигнала |
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
PL3336840T3 (pl) | 2013-10-31 | 2020-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu |
PT3285255T (pt) | 2013-10-31 | 2019-08-02 | Fraunhofer Ges Forschung | Descodificador de áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo |
CN104751849B (zh) | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
CN107369455B (zh) * | 2014-03-21 | 2020-12-15 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
BR122020015614B1 (pt) | 2014-04-17 | 2022-06-07 | Voiceage Evs Llc | Método e dispositivo para interpolar parâmetros de filtro de predição linear em um quadro de processamento de sinal sonoro atual seguindo um quadro de processamento de sinal sonoro anterior |
EP2980797A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
CN111968655B (zh) | 2014-07-28 | 2023-11-10 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
FR3024582A1 (fr) | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
CN107004417B (zh) * | 2014-12-09 | 2021-05-07 | 杜比国际公司 | Mdct域错误掩盖 |
US10504525B2 (en) * | 2015-10-10 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Adaptive forward error correction redundant payload generation |
US11276411B2 (en) | 2017-09-20 | 2022-03-15 | Voiceage Corporation | Method and device for allocating a bit-budget between sub-frames in a CELP CODEC |
CN112669860B (zh) * | 2020-12-29 | 2022-12-09 | 北京百瑞互联技术有限公司 | 一种增加lc3音频编解码有效带宽的方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007105586A1 (ja) * | 2006-03-10 | 2007-09-20 | Matsushita Electric Industrial Co., Ltd. | 符号化装置および符号化方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0969783A (ja) | 1995-08-31 | 1997-03-11 | Nippon Steel Corp | オーディオデータ符号化装置 |
JP3849210B2 (ja) * | 1996-09-24 | 2006-11-22 | ヤマハ株式会社 | 音声符号化復号方式 |
US6263312B1 (en) * | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
KR100335611B1 (ko) * | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6351494B1 (en) | 1999-09-24 | 2002-02-26 | Sony Corporation | Classified adaptive error recovery method and apparatus |
US6662154B2 (en) * | 2001-12-12 | 2003-12-09 | Motorola, Inc. | Method and system for information signal coding using combinatorial and huffman codes |
EP1483759B1 (en) * | 2002-03-12 | 2006-09-06 | Nokia Corporation | Scalable audio coding |
EP1619664B1 (en) * | 2003-04-30 | 2012-01-25 | Panasonic Corporation | Speech coding apparatus, speech decoding apparatus and methods thereof |
EP1688917A1 (en) * | 2003-12-26 | 2006-08-09 | Matsushita Electric Industries Co. Ltd. | Voice/musical sound encoding device and voice/musical sound encoding method |
JP4445328B2 (ja) | 2004-05-24 | 2010-04-07 | パナソニック株式会社 | 音声・楽音復号化装置および音声・楽音復号化方法 |
US7783480B2 (en) | 2004-09-17 | 2010-08-24 | Panasonic Corporation | Audio encoding apparatus, audio decoding apparatus, communication apparatus and audio encoding method |
DE602005023503D1 (de) | 2004-10-28 | 2010-10-21 | Panasonic Corp | Skalierbare codierungsvorrichtung, skalierbare decodierungsvorrichtung und verfahren dafür |
WO2006082790A1 (ja) | 2005-02-01 | 2006-08-10 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置およびスケーラブル符号化方法 |
US8711925B2 (en) * | 2006-05-05 | 2014-04-29 | Microsoft Corporation | Flexible quantization |
US7461106B2 (en) * | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
-
2008
- 2008-10-21 US US12/255,604 patent/US8527265B2/en not_active Expired - Fee Related
- 2008-10-22 AU AU2008316860A patent/AU2008316860B2/en not_active Ceased
- 2008-10-22 JP JP2010531210A patent/JP2011501828A/ja not_active Ceased
- 2008-10-22 EP EP08843220.8A patent/EP2255358B1/en not_active Not-in-force
- 2008-10-22 BR BRPI0818405A patent/BRPI0818405A2/pt not_active IP Right Cessation
- 2008-10-22 CN CN2008801125420A patent/CN101836251B/zh not_active Expired - Fee Related
- 2008-10-22 CA CA2701281A patent/CA2701281A1/en not_active Abandoned
- 2008-10-22 KR KR1020107011197A patent/KR20100085994A/ko not_active Application Discontinuation
- 2008-10-22 RU RU2010120678/08A patent/RU2459282C2/ru not_active IP Right Cessation
- 2008-10-22 TW TW097140565A patent/TWI407432B/zh not_active IP Right Cessation
- 2008-10-22 WO PCT/US2008/080824 patent/WO2009055493A1/en active Application Filing
- 2008-10-22 CN CN2012104034370A patent/CN102968998A/zh active Pending
- 2008-10-22 MX MX2010004282A patent/MX2010004282A/es active IP Right Grant
-
2010
- 2010-04-15 IL IL205131A patent/IL205131A0/en unknown
-
2013
- 2013-04-11 JP JP2013083340A patent/JP2013178539A/ja not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007105586A1 (ja) * | 2006-03-10 | 2007-09-20 | Matsushita Electric Industrial Co., Ltd. | 符号化装置および符号化方法 |
Non-Patent Citations (1)
Title |
---|
JPN6012018964; Udar Mittal, James P. Ashley, Edgardo M. Cruz-Zeno: 'Low Complexity Factorial Pulse Coding of MDCT Coefficients Using Approximation of Combinational Func' Acoustics, Speech and Signal Processing, 2007. ICASSP 2007. IEEE International Conference on , 20070415, IEEE * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013537647A (ja) * | 2010-07-30 | 2013-10-03 | クゥアルコム・インコーポレイテッド | オーディオ信号の従属モードコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体 |
JPWO2013051210A1 (ja) * | 2011-10-07 | 2015-03-30 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 符号化装置及び符号化方法 |
JP2016538602A (ja) * | 2013-09-16 | 2016-12-08 | サムスン エレクトロニクス カンパニー リミテッド | 信号符号化方法及びその装置、並びに信号復号化方法及びその装置 |
JP2018049284A (ja) * | 2013-09-16 | 2018-03-29 | サムスン エレクトロニクス カンパニー リミテッド | スペクトル符号化装置及びスペクトル復号化装置 |
US10388293B2 (en) | 2013-09-16 | 2019-08-20 | Samsung Electronics Co., Ltd. | Signal encoding method and device and signal decoding method and device |
US10811019B2 (en) | 2013-09-16 | 2020-10-20 | Samsung Electronics Co., Ltd. | Signal encoding method and device and signal decoding method and device |
US11705142B2 (en) | 2013-09-16 | 2023-07-18 | Samsung Electronic Co., Ltd. | Signal encoding method and device and signal decoding method and device |
JP2017506771A (ja) * | 2014-02-17 | 2017-03-09 | サムスン エレクトロニクス カンパニー リミテッド | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 |
US10395663B2 (en) | 2014-02-17 | 2019-08-27 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus, and signal decoding method and apparatus |
US10657976B2 (en) | 2014-02-17 | 2020-05-19 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus, and signal decoding method and apparatus |
US10902860B2 (en) | 2014-02-17 | 2021-01-26 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus, and signal decoding method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
IL205131A0 (en) | 2010-11-30 |
EP2255358A1 (en) | 2010-12-01 |
MX2010004282A (es) | 2010-05-05 |
CN101836251B (zh) | 2012-12-12 |
KR20100085994A (ko) | 2010-07-29 |
US20090234644A1 (en) | 2009-09-17 |
RU2459282C2 (ru) | 2012-08-20 |
AU2008316860A1 (en) | 2009-04-30 |
CA2701281A1 (en) | 2009-04-30 |
CN101836251A (zh) | 2010-09-15 |
US8527265B2 (en) | 2013-09-03 |
EP2255358B1 (en) | 2013-07-03 |
BRPI0818405A2 (pt) | 2016-10-11 |
TW200935402A (en) | 2009-08-16 |
RU2010120678A (ru) | 2011-11-27 |
WO2009055493A1 (en) | 2009-04-30 |
CN102968998A (zh) | 2013-03-13 |
AU2008316860B2 (en) | 2011-06-16 |
JP2013178539A (ja) | 2013-09-09 |
TWI407432B (zh) | 2013-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8527265B2 (en) | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs | |
JP5722040B2 (ja) | スケーラブルなスピーチおよびオーディオコーデックにおける、量子化mdctスペクトルに対するコードブックインデックスのエンコーディング/デコーディングのための技術 | |
US7149683B2 (en) | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding | |
Ragot et al. | Itu-t g. 729.1: An 8-32 kbit/s scalable coder interoperable with g. 729 for wideband telephony and voice over ip | |
KR101246991B1 (ko) | 오디오 신호 처리 방법 | |
CN101180676B (zh) | 用于谱包络表示的向量量化的方法和设备 | |
KR101516468B1 (ko) | 샘플링된 오디오 신호의 프레임들을 인코딩 및 디코딩하기 위한 오디오 인코더 및 디코더 | |
JP4879748B2 (ja) | 最適化された複合的符号化方法 | |
NZ563462A (en) | Sub-band voice codec with multi-stage codebooks and redundant coding | |
CN106157968A (zh) | 用于产生带宽扩展信号的设备和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120417 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120713 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120723 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120918 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120925 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130411 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130529 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20130621 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130808 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130813 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20140729 |