JP2017527843A - Lpd/fd移行フレームエンコードのためのバジェットの決定 - Google Patents
Lpd/fd移行フレームエンコードのためのバジェットの決定 Download PDFInfo
- Publication number
- JP2017527843A JP2017527843A JP2017504670A JP2017504670A JP2017527843A JP 2017527843 A JP2017527843 A JP 2017527843A JP 2017504670 A JP2017504670 A JP 2017504670A JP 2017504670 A JP2017504670 A JP 2017504670A JP 2017527843 A JP2017527843 A JP 2017527843A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- frame
- bits
- transition
- predictive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007704 transition Effects 0.000 title claims abstract description 209
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000001914 filtration Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 abstract description 4
- 238000012952 Resampling Methods 0.000 description 20
- 239000013598 vector Substances 0.000 description 17
- 230000003044 adaptive effect Effects 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 8
- 239000002131 composite material Substances 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
・音声タイプ信号の場合、AMR-WB+符号化に由来する2つの異なるモードを備えるLPDモード(「Linear Predictive Domain」の略)
- ACELPモード
- (FFT(「Fast Fourier transform」)を使用するAMR-WB+コーデックとは異なり)MDCTタイプ変換を使用するwLPT(「weighted Linear Predictive Transform」の略)と呼ばれるTCX(Transform Coded eXcitation)モード
・音楽タイプ信号の場合、1024サンプルにわたってMPEG AACタイプ(「Advanced Audio Coding」の略)のMDCT変換符号化(「Modified Discrete Cosine Transform」の略)を使用するFDモード(「Frequency Domain」の略)。
・本明細書では「MDCTウィンドウ」と呼ばれる長さ2Mを有するウィンドウによって信号を重み付けるステップ。
・長さMを有するブロックを形成するための時間領域エイリアシングステップ。
・長さMを用いたDCT変換(「Discrete Cosine Transform」の略)ステップ。
この線形結合は、時間領域エイリアシングを引き起こす。
- 移行サブフレームを予測符号化するためのビットレートを割り当てるステップであって、ビットレートは、移行フレームを変換符号化するためのビットレートと、あらかじめ決定された第1のビットレート値とのうちの最小に等しい、ステップ。
- ビットレートのための移行サブフレームを予測符号化するために割り当てられる第1のビットの数を決定するステップ。
- 第1のビットの数と、移行フレームを符号化するために利用可能なビットの数とから、移行フレームを変換符号化するために割り当てられる第2のビットの数を計算するステップ。
*予測符号化に従ってデジタル信号サンプルの先行フレームを符号化するステップ。
*デジタル信号サンプルの現在のフレームを移行フレームへ符号化するステップであって、移行フレームを符号化するステップは、移行フレームの単一のサブフレームを変換符号化および予測符号化するステップを備え、現在のフレームを符号化するステップは、以下のサブステップを備える。
- 本発明の第1の態様に従う方法によってビットの分散を決定するステップ。
- 割り当てられた第2のビットの数において移行フレームを変換符号化するステップ。
- 割り当てられた第1のビットの数において移行サブフレームを予測符号化するステップ。
*予測符号化に従って符号化されたデジタル信号サンプルの先行フレームを予測復号するステップ。
*デジタル信号サンプルの現在のフレームを符号化する移行フレームを復号するステップであって、移行フレームの単一のサブフレームを変換符号化および予測符号化するステップを備える移行フレームを含み、以下のサブステップを備える。
- 本発明の第1の態様に従う方法によって、ビットの分散を決定するステップ。
- 割り当てられた第1のビットの数において移行サブフレームを予測復号するステップ。
- 割り当てられた第2のビットの数において移行フレームを変換復号するステップ。
- 移行サブフレームを予測符号化するためのビットレートを割り当てる動作。このビットレートは、移行フレームを変換符号化するためのビットレートと、あらかじめ決定された第1のビットレート値とのうちの最小に等しい。
- ビットレートのための移行サブフレームを予測符号化するために割り当てられる、割り当てられる第1のビットの数を決定する動作。
- 符号化パラメータを符号化するために必要とされる第1のビットの数と、移行フレームを符号化するための固定されたビットの数とから、移行フレームを変換符号化するために割り当てられる第2のビットの数を計算する動作。
*本発明の第5の態様に従うデバイス。
*以下の動作を実行するために構成されたプロセッサを備える予測符号化器。
- 予測符号化に従って、デジタル信号サンプルの先行フレームを符号化する動作。
- デジタル信号サンプルの現在のフレームを符号化する移行フレームに備えられた単一のサブフレームを予測符号化する動作。移行フレームを符号化する動作は、サブフレームを変換符号化および予測符号化する動作を備え、プロセッサは、割り当てられた第1のビットの数において移行サブフレームのための予測符号化動作を実行するために構成される。
*割り当てられた第2のビットの数において移行フレームを変換符号化するために構成されたプロセッサを備える変換符号化器。
*本発明の第5の態様に従うデバイス。
*以下の動作を実行するために構成されたプロセッサを備える予測復号器。
- 予測符号化に従って符号化されたデジタル信号サンプルの先行フレームを予測復号する動作。
- デジタル信号サンプルの現在のフレームを符号化する移行フレームに備えられた単一のサブフレームを予測復号する動作。移行フレームを符号化する動作は、サブフレームを変換符号化および予測符号化する動作を備え、プロセッサは、割り当てられた第1のビットの数において移行サブフレームを予測復号する動作を実行するために構成される。
*割り当てられた第2のビットの数において移行フレームを変換符号化するために構成されたプロセッサを備える変換復号器。
- ステップ209において、現在のフレームをMDCT符号化するために利用可能なバジェットを定義するように、移行CELPサブフレームを符号化するために必要とされるビットのバジェットを予測するステップ。以下に詳述されるように、バジェットは、現在のフレームレートに依存し得る。さらに、バジェットは、使用されるCELPコアに依存して評価され得る。MDCT符号化の品質を下げないために十分なビットバジェットを確保するために、本発明は、CELPサブフレームのための符号化レートを制限するステップを提供し得る。この目的のために、それは、図7のデバイス700のように、移行フレームにおけるビットの分散を決定するためのデバイスを備える。
- ステップ210において、以下に記載される図3に準拠する符号化器において使用されるMDCTウィンドウを修正するステップ。
- 先行フレームはCELPフレームであるので、ステップ207において、MDCT変換メモリをゼロにするステップ。同様にして、MDCTメモリは、MDCT復号において無視され得る。
- スペクトルの高い(使用されるCELPコアに対応する周波数よりも高い、すなわち6.4または8kHzよりも高い)部分を確保するために、高パスフィルタによって、CELP先行フレームおよび移行フレームのCELPサブフレームをフィルタするステップ。そのようなフィルタリングは、CELP符号化器103から、有限インパルス応答FIRを備えるフィルタによって実施され得る。
- 遅延パラメータを推定し、その後、利得(フィルタされたサブフレームに対応する信号と、遅延を適用することによって予測される信号との間の振幅差)を推定するために、オリジナルの移行CELPサブフレームのフィルタされた部分と、フィルタされた先行CELPフレームとの間の相関性を探索するステップ。
- たとえば、スカラ量子化を使用して遅延パラメータおよび前述した利得を符号化するステップ(たとえば、遅延は、6ビットにわたって符号化され得、利得は、6ビットにわたって符号化され得る)。
num_bits:=num_bits-1
num_bits:=num_bits-budg1
If core_bitrate≦8000
cbrate=8000
Otherwise if core_bitrate≦14800
othercbrate=14800
Otherwise
cbrate= min(core_bitrate, 22600)
End if
num_bits:=num_bits-1
num_bits:=num_bits-budg3。
- 第1のデジタル信号フレームを符号化する予測符号化パラメータの第1のセットを、ステップ501において受信するステップ。
- 予測符号化パラメータの第1のセットに基づいて、第1のフレームをステップ605において予測復号するステップ。
- 新たなフレームのためにステップ501において、変換符号化された移行フレームの第1の移行サブフレームを予測符号化するためのパラメータの第2のセットを受信するステップ。
- ステップ614において、予測符号化パラメータの第2のセットに基づいて、第1の移行サブフレームを復号するステップ。
- ステップ614において、第2のセットの少なくとも1つの予測符号化パラメータから、第2の移行サブフレームからのサンプルを生成するステップ。
101 受信ユニット
102 前処理ユニット
103 CELP符号化器
104 移行ユニット
105 MDCT符号化器
106 移行フレーム符号化ユニット
107 メモリ
108 送信ユニット
301 先行フレーム
302 現在のフレーム
303 後続フレーム
304 MDCTウィンドウ
305 MDCTウィンドウ
306 MDCTウィンドウ
307 上昇端
309 下降端
310 ヌル部分
311 連続線
312 破線
313 MDCTウィンドウ
320 CELPフレーム、先行フレーム
321 移行フレーム
322 移行フレーム
324 合成ウィンドウ
325 合成ウィンドウ
326 合成ウィンドウ
327 合成ウィンドウ
500 復号器
501 受信ユニット
502 カテゴリ化ユニット
503 決定ユニット
504 CELP復号器
505 再サンプリングユニット
506 メモリ
507 MDCT復号器
508 遅延ユニット
509 オーバラップ追加ユニット
510 出力インターフェース
700 デバイス
701 入力インターフェース
702 デジタル信号プロセッサ
703 プロセッサ
704 ランダムアクセスメモリ
705 大容量メモリ
706 出力インターフェース
5051 管理ユニット
Claims (15)
- 移行フレーム(321, 322)を符号化するためのビットの分散を決定する方法であって、前記方法は、デジタル信号を符号化/復号するための符号化器/復号器(100, 500)において実施され、前記移行フレームは、予測符号化された先行フレーム(320)によって先行され、前記移行フレームを符号化するステップは、前記移行フレームの単一のサブフレームを変換符号化および予測符号化するステップを備え、前記方法は、
移行サブフレームの予測符号化のためのビットレートを割り当てるステップ(402, 405)であって、前記ビットレートは、前記移行フレームを変換符号化するための前記ビットレートと、あらかじめ決定された第1のビットレート値とのうちの最小に等しい、割り当てるステップと、
前記ビットレートのための前記移行サブフレームを予測符号化するために割り当てられた第1のビットの数を決定するステップ(404, 408)と、
割り当てられた前記第1のビットの数と、前記移行フレームを符号化するために利用可能なビットの数とから、前記移行フレームを変換符号化するために割り当てられる第2のビットの数を計算するステップ(410)とを備える、方法。 - 前記符号化器/復号器(100, 500)は、信号フレームを予測符号化/復号するために、第1の周波数において動作する第1のコアと、信号フレームを予測符号化/復号するために、第2の周波数において動作する第2のコアとを備え、
前記あらかじめ決定された第1のビットレート値は、前記予測符号化された先行フレーム(320)を符号化/復号するために前記第1および第2のコアから選択されたコアに依存する、請求項1に記載の方法。 - 前記予測符号化された先行フレーム(320)を符号化/復号するために前記第1のコアが選択され、前記割り当てられたビットレートはさらに、前記変換符号化された移行フレーム(322)のための前記ビットレートと、少なくとも1つのあらかじめ決定された第2のビットレート値とのうちの最大に等しく、前記第2のビットレート値は、前記第1のビットレート値よりも低い、請求項2に記載の方法。
- 前記デジタル信号は、少なくとも1つの周波数低帯域および1つの周波数高帯域へ分解され、
前記計算された第1のビットの数は、前記周波数低帯域のための前記移行サブフレーム(321)を予測符号化するために割り当てられ、あらかじめ決定された第3のビットの数は、前記周波数高帯域のための前記移行サブフレームを符号化するために割り当てられ、
前記移行フレーム(322)を変換符号化するために割り当てられる前記第2のビットの数はさらに、前記あらかじめ決定された第3のビットの数から決定される、請求項1から3のいずれか一項に記載の方法。 - 前記移行フレーム(321, 322)を符号化するために利用可能な前記ビットの数が固定されている、請求項4に記載の方法。
- 前記第2のビットの数は、前記移行フレーム(321, 322)を符号化するための前記固定されたビットの数から、前記第1のビットの数を引き、前記第3のビットの数を引いたものに等しい、請求項5に記載の方法。
- 前記第2のビットの数は、前記移行フレーム(321, 322)を符号化するための前記固定されたビットの数から、前記第1のビットの数を引き、前記第3のビットの数を引き、第1のビットを引き、第2のビットを引いたものに等しく、
前記第1のビットは、前記移行サブフレームの予測符号化パラメータを決定した場合に、低パスフィルタリングが実行されるか否かを示し、前記予測符号化パラメータは、音色リードタイムに関連し、
前記第2のビットは、前記移行サブフレームを予測符号化/復号するために前記符号化器/復号器コアによって使用される周波数を示す、請求項5に記載の方法。 - 予測符号化に従って、または、変換符号化に従って、信号フレームを符号化することができる符号化器(100)においてデジタル信号を符号化する方法であって、
予測符号化に従って、デジタル信号サンプルの先行フレーム(301)を符号化するステップと、
デジタル信号サンプルの現在のフレーム(302)を移行フレーム(321, 322)へ符号化するステップとを備え、前記移行フレーム(321, 322)を符号化するステップは、前記移行フレームの単一のサブフレーム(321)を変換符号化および予測符号化するステップを備え、前記現在のフレーム(302)を前記符号化するステップは、
請求項1から7のいずれか一項に従って、前記ビットの分散を決定するサブステップ(209)と、
前記割り当てられた第2のビットの数において前記移行フレーム(322)を変換符号化するサブステップ(212)と、
前記割り当てられた第1のビットの数において前記移行サブフレーム(321)を予測符号化するサブステップ(213)とを備える、符号化する方法。 - 予測符号化するステップは、前記割り当てられたビットレートのために決定された予測符号化パラメータを生成するステップを備える、請求項8に記載の符号化する方法。
- 予測符号化するステップは、前記先行フレーム(320)の予測符号化のための少なくとも1つのパラメータを再使用して前記先行フレームを予測符号化することに関して制限された予測符号化パラメータを生成するステップを備える、請求項8または9に記載の符号化する方法。
- 符号化されたデジタル信号を復号する方法であって、予測符号化に従って、または、変換符号化に従って信号フレームを復号することができる復号器(500)において実施され、
予測符号化に従って符号化されたデジタル信号サンプルの先行フレームを予測復号するステップ(605)と、
デジタル信号サンプルの現在のフレームを符号化する移行フレーム(321, 322)を復号するステップとを備え、前記移行フレームを符号化するステップは、前記移行フレームの単一のサブフレーム(321)を変換符号化および予測符号化するステップを備え、
請求項1から7のいずれか一項に従ってビットの分散を決定するサブステップ(611)と、
前記割り当てられた第1のビットの数において前記移行サブフレーム(321)を予測復号するサブステップ(614)と、
前記割り当てられた第2のビットの数において前記移行フレーム(322)を変換復号するサブステップ(612)とを備える、方法。 - 命令がプロセッサによって実行された場合、請求項1から11のいずれか一項に記載の方法を実施するための命令を備えるコンピュータプログラム。
- 移行フレーム(321, 322)を符号化するためのビットの分散を決定するためのデバイスであって、前記デバイス(104, 503)は、デジタル信号を符号化/復号するための符号化器/復号器において実施され、前記移行フレームは、予測符号化された先行フレーム(320)によって先行され、前記移行フレームを符号化するステップは、前記移行フレームの単一のサブフレーム(321)を変換符号化および予測符号化するステップを備え、前記移行フレームを符号化するためのビットの数は固定され、前記デバイスは、
移行サブフレームを予測符号化するためのビットレートを割り当てる動作であって、前記ビットレートは、前記移行フレームを変換符号化するための前記ビットレートと、あらかじめ決定された第1のビットレート値とのうちの最小に等しい、割り当てる動作と、
前記ビットレートのための前記移行サブフレームを予測符号化するために割り当てられた第1のビットの数を決定する動作と、
符号化パラメータを符号化するために必要とされるビットの数と、前記移行フレームを符号化するための前記固定されたビットの数とから、前記移行フレームを変換符号化するために割り当てられる第2のビットの数を計算する動作とを実行するために構成されたプロセッサを備える、デバイス。 - 予測符号化に従って、または、変換符号化に従ってデジタル信号フレームを符号化することができる符号化器であって、
請求項13に記載のデバイス(104)と、
予測符号化器(103)であって、
予測符号化に従ってデジタル信号サンプルの先行フレームを符号化する動作と、
デジタル信号サンプルの現在のフレームを符号化する移行フレームに備えられた単一のサブフレームを予測符号化する動作とを実行するために構成されたプロセッサを備え、前記移行フレームを符号化する動作は、前記サブフレームを変換符号化および予測符号化する動作を備え、前記プロセッサは、前記割り当てられた第1のビットの数において前記移行サブフレームを予測符号化するために構成された、予測符号化器(103)と、
前記割り当てられた第2のビットの数において前記移行フレームを変換符号化する動作を実行するために構成されたプロセッサを備える変換符号化器(105)とを備える、符号化器。 - 予測符号化によって、および、変換符号化によって符号化されたデジタル信号のための復号器であって、
請求項13に記載のデバイス(503)と、
予測復号器(504)であって、
予測符号化に従って符号化されたデジタル信号サンプルの先行フレーム(320)を予測復号する動作と、
デジタル信号サンプルの現在のフレームを符号化する移行フレームに備えられた単一のサブフレーム(321)を予測復号する動作とを実行するために構成されたプロセッサを備え、前記移行フレームを符号化する動作は、前記サブフレームを変換符号化および予測符号化する動作を備え、前記プロセッサは、前記割り当てられた第1のビットの数において前記移行サブフレームを予測復号する動作を実行するために構成された、予測復号器(504)と、
割り当てられた前記第2のビットの数において前記移行フレーム(222)を変換復号する動作を実行するために構成されたプロセッサを備える変換復号器(507)とを備える、復号器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1457353A FR3024581A1 (fr) | 2014-07-29 | 2014-07-29 | Determination d'un budget de codage d'une trame de transition lpd/fd |
FR1457353 | 2014-07-29 | ||
PCT/FR2015/052073 WO2016016566A1 (fr) | 2014-07-29 | 2015-07-27 | Détermination d'un budget de codage d'une trame de transition lpd/fd |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017527843A true JP2017527843A (ja) | 2017-09-21 |
JP6607921B2 JP6607921B2 (ja) | 2019-11-20 |
Family
ID=51894138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504670A Active JP6607921B2 (ja) | 2014-07-29 | 2015-07-27 | Lpd/fd移行フレームエンコードのためのバジェットの決定 |
Country Status (8)
Country | Link |
---|---|
US (2) | US10586549B2 (ja) |
EP (1) | EP3175443B1 (ja) |
JP (1) | JP6607921B2 (ja) |
KR (2) | KR102485835B1 (ja) |
CN (2) | CN112133315B (ja) |
ES (1) | ES2676832T3 (ja) |
FR (1) | FR3024581A1 (ja) |
WO (1) | WO2016016566A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3024581A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
EP3230980B1 (en) * | 2014-12-09 | 2018-11-28 | Dolby International AB | Mdct-domain error concealment |
BR112020004883A2 (pt) * | 2017-09-20 | 2020-09-15 | Voiceage Corporation | método e dispositivo para alocar um bit-budget entre subquadros em um codec celp |
CN111402908A (zh) * | 2020-03-30 | 2020-07-10 | Oppo广东移动通信有限公司 | 语音处理方法、装置、电子设备和存储介质 |
CN111431947A (zh) * | 2020-06-15 | 2020-07-17 | 广东睿江云计算股份有限公司 | 一种云桌面客户端优化显示的方法及*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014505272A (ja) * | 2010-12-23 | 2014-02-27 | オランジュ | 予測符号化と変換符号化を繰り返す低遅延音響符号化 |
JP2014510305A (ja) * | 2011-02-14 | 2014-04-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法 |
WO2016016105A1 (en) * | 2014-07-28 | 2016-02-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69926821T2 (de) * | 1998-01-22 | 2007-12-06 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6804218B2 (en) * | 2000-12-04 | 2004-10-12 | Qualcomm Incorporated | Method and apparatus for improved detection of rate errors in variable rate receivers |
DE60222445T2 (de) * | 2001-08-17 | 2008-06-12 | Broadcom Corp., Irvine | Verfahren zum verbergen von bitfehlern für die sprachcodierung |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US6647366B2 (en) * | 2001-12-28 | 2003-11-11 | Microsoft Corporation | Rate control strategies for speech and music coding |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
US7937271B2 (en) * | 2004-09-17 | 2011-05-03 | Digital Rise Technology Co., Ltd. | Audio decoding using variable-length codebook application ranges |
US8090573B2 (en) * | 2006-01-20 | 2012-01-03 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision |
FR2897733A1 (fr) * | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
PT2102619T (pt) * | 2006-10-24 | 2017-05-25 | Voiceage Corp | Método e dispositivo para codificação de tramas de transição em sinais de voz |
KR100848324B1 (ko) * | 2006-12-08 | 2008-07-24 | 한국전자통신연구원 | 음성 부호화 장치 및 그 방법 |
CN101206860A (zh) * | 2006-12-20 | 2008-06-25 | 华为技术有限公司 | 一种可分层音频编解码方法及装置 |
CN101025918B (zh) * | 2007-01-19 | 2011-06-29 | 清华大学 | 一种语音/音乐双模编解码无缝切换方法 |
CN100578619C (zh) * | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
CN101261836B (zh) * | 2008-04-25 | 2011-03-30 | 清华大学 | 基于过渡帧判决及处理的激励信号自然度提高方法 |
MX2011000369A (es) * | 2008-07-11 | 2011-07-29 | Ten Forschung Ev Fraunhofer | Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas. |
RU2515704C2 (ru) * | 2008-07-11 | 2014-05-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодер и аудиодекодер для кодирования и декодирования отсчетов аудиосигнала |
ES2683077T3 (es) * | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
KR101315617B1 (ko) * | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
WO2011013980A2 (en) * | 2009-07-27 | 2011-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
MX2012004116A (es) * | 2009-10-08 | 2012-05-22 | Fraunhofer Ges Forschung | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, metodo y programa de computacion que usan un modelado de ruido en base a linealidad-prediccion-codi ficacion. |
PL2491555T3 (pl) * | 2009-10-20 | 2014-08-29 | Fraunhofer Ges Forschung | Wielotrybowy kodek audio |
RU2591011C2 (ru) * | 2009-10-20 | 2016-07-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров) |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法***及瞬态信号可分层编解码方法 |
CN102985968B (zh) * | 2010-07-01 | 2015-12-02 | Lg电子株式会社 | 处理音频信号的方法和装置 |
US8990094B2 (en) * | 2010-09-13 | 2015-03-24 | Qualcomm Incorporated | Coding and decoding a transient frame |
CN102737636B (zh) * | 2011-04-13 | 2014-06-04 | 华为技术有限公司 | 一种音频编码方法及装置 |
FR2977439A1 (fr) * | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
CA2966987C (en) * | 2011-06-30 | 2019-09-03 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
FR2981781A1 (fr) * | 2011-10-19 | 2013-04-26 | France Telecom | Codage hierarchique perfectionne |
KR20140085453A (ko) * | 2011-10-27 | 2014-07-07 | 엘지전자 주식회사 | 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
TWI591620B (zh) * | 2012-03-21 | 2017-07-11 | 三星電子股份有限公司 | 產生高頻雜訊的方法 |
CN103915100B (zh) * | 2013-01-07 | 2019-02-15 | 中兴通讯股份有限公司 | 一种编码模式切换方法和装置、解码模式切换方法和装置 |
ES2634621T3 (es) * | 2013-02-20 | 2017-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple |
FR3024581A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
TWI602172B (zh) * | 2014-08-27 | 2017-10-11 | 弗勞恩霍夫爾協會 | 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法 |
-
2014
- 2014-07-29 FR FR1457353A patent/FR3024581A1/fr active Pending
-
2015
- 2015-07-27 WO PCT/FR2015/052073 patent/WO2016016566A1/fr active Application Filing
- 2015-07-27 KR KR1020227015119A patent/KR102485835B1/ko active IP Right Grant
- 2015-07-27 JP JP2017504670A patent/JP6607921B2/ja active Active
- 2015-07-27 CN CN202010879909.4A patent/CN112133315B/zh active Active
- 2015-07-27 CN CN201580044697.5A patent/CN106605263B/zh active Active
- 2015-07-27 KR KR1020177005825A patent/KR20170037660A/ko not_active Application Discontinuation
- 2015-07-27 EP EP15745542.9A patent/EP3175443B1/fr active Active
- 2015-07-27 US US15/329,671 patent/US10586549B2/en active Active
- 2015-07-27 ES ES15745542.9T patent/ES2676832T3/es active Active
-
2020
- 2020-01-29 US US16/775,569 patent/US11158332B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014505272A (ja) * | 2010-12-23 | 2014-02-27 | オランジュ | 予測符号化と変換符号化を繰り返す低遅延音響符号化 |
JP2014510305A (ja) * | 2011-02-14 | 2014-04-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法 |
WO2016016105A1 (en) * | 2014-07-28 | 2016-02-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
Also Published As
Publication number | Publication date |
---|---|
US20180182408A1 (en) | 2018-06-28 |
ES2676832T3 (es) | 2018-07-25 |
CN106605263B (zh) | 2020-11-27 |
CN112133315B (zh) | 2024-03-08 |
KR20220066412A (ko) | 2022-05-24 |
EP3175443A1 (fr) | 2017-06-07 |
WO2016016566A1 (fr) | 2016-02-04 |
US20200168236A1 (en) | 2020-05-28 |
KR20170037660A (ko) | 2017-04-04 |
CN106605263A (zh) | 2017-04-26 |
FR3024581A1 (fr) | 2016-02-05 |
JP6607921B2 (ja) | 2019-11-20 |
CN112133315A (zh) | 2020-12-25 |
US11158332B2 (en) | 2021-10-26 |
KR102485835B1 (ko) | 2023-01-09 |
US10586549B2 (en) | 2020-03-10 |
EP3175443B1 (fr) | 2018-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9218817B2 (en) | Low-delay sound-encoding alternating between predictive encoding and transform encoding | |
KR101941978B1 (ko) | 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 | |
KR101957906B1 (ko) | 시간 도메인 여기 신호를 기초로 하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 | |
US11158332B2 (en) | Determining a budget for LPD/FD transition frame encoding | |
TWI587291B (zh) | 音訊解碼/編碼裝置及其運作方法及電腦程式 | |
JP6110314B2 (ja) | 整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法 | |
JP7026711B2 (ja) | Fd/lpd遷移コンテキストにおけるフレーム喪失管理 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180403 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190304 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191021 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6607921 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |