JP7077290B2 - マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ - Google Patents
マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ Download PDFInfo
- Publication number
- JP7077290B2 JP7077290B2 JP2019189837A JP2019189837A JP7077290B2 JP 7077290 B2 JP7077290 B2 JP 7077290B2 JP 2019189837 A JP2019189837 A JP 2019189837A JP 2019189837 A JP2019189837 A JP 2019189837A JP 7077290 B2 JP7077290 B2 JP 7077290B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- encoder
- decoder
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 104
- 238000000034 method Methods 0.000 claims description 88
- 230000003595 spectral effect Effects 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 28
- 238000001228 spectrum Methods 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- 230000008878 coupling Effects 0.000 claims description 10
- 238000010168 coupling process Methods 0.000 claims description 10
- 238000005859 coupling reaction Methods 0.000 claims description 10
- 238000011049 filling Methods 0.000 claims description 9
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012423 maintenance Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 42
- 230000006870 function Effects 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 14
- 230000007704 transition Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000009432 framing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Analogue/Digital Conversion (AREA)
Description
MPEG-D USACコア符号器に対して、前/後プロセッサとしてPSおよびMPS
MPEG-D USAC規格
MPEG-H 3Dオーディオ規格
-MDCTのAACに対して、IGFおよび結合ステレオ符号化
-QMFのHeAACv2に対して、SBR+PS
-QMFのUSACに対して、SBR+MPS212。
セクション5.3.2補助ペイロードのUSAC規格[1]の表23は、次の通り修正されるべきである。
詳細な復号化手続は、7.x LPDステレオ復号化セクションで説明される。
lpd_stereo_stream():LPDモードのためのステレオデータを復号化するためのデータ要素。
res_mode:パラメータ帯域の周波数解像度を示すフラグ。
q_mode:パラメータ帯域の時間解像度を示すフラグ。
ipd_mode:IPDパラメータに対してパラメータ帯域の最大値を定義するビットフィールド。
pred_mode:仮に予測が使われるならば示すフラグ。
cod_mode:サイド信号が量子化されるためのパラメータ帯域の最大値を定義するビットフィールド。
Ild_idx[k][b]:フレームkおよび帯域bのためのILDパラメータインデックス。
Ipd_idx[k][b]:フレームkおよび帯域bのためのIPDパラメータインデックス。
pred_gain_idx[k][b]:フレームkおよび帯域bのための予測利得インデックス。
cod_gain_idx:量子化されたサイド信号のためのグローバル利得インデックス。
ccfl:コア符号フレーム長さ。
M:テーブル7.x.1において定義されるステレオLPDフレーム長さ。
band_config():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
band_limits():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
ipd_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_L:復号化されたサイド信号のためのDFTラインの数。
LPDステレオ符号化
ツール説明
LPDステレオは離散的なM/Sステレオ符号化である。中間チャンネルはモノラルLPDコア符号器によって符号化され、サイド信号はDFTドメインの中で符号化される。復号化された中間信号は、LPDモノラルデコーダから出力されて、それから、LPDステレオモジュールによって処理される。ステレオ復号化は、LチャンネルとRチャンネルとが復号化されるDFTドメインの中でなされる。2つの復号化されたチャンネルは、時間ドメインにおいて元に変換されて、それから、このドメインにおいて、FDモードから復号化されたチャンネルと結合される。FD符号化モードは、複雑な予測によって、または、予測無しで、それ自身のステレオのツール、すなわち離散的なステレオを使っている。
res_mode:パラメータ帯域の周波数解像度を示すフラグ。
q_mode:パラメータ帯域の時間解像度を示すフラグ。
ipd_mode:IPDパラメータに対してパラメータ帯域の最大値を定義するビットフィールド。
pred_mode:仮に予測が使われるならば示すフラグ。
cod_mode:サイド信号が量子化されるためのパラメータ帯域の最大値を定義するビットフィールド。
Ild_idx[k][b]:フレームkおよび帯域bのためのILDパラメータインデックス。
Ipd_idx[k][b]:フレームkおよび帯域bのためのIPDパラメータインデックス。
pred_gain_idx[k][b]:フレームkおよび帯域bのための予測利得インデックス。
cod_gain_idx:量子化されたサイド信号のためのグローバル利得インデックス。
ccfl:コア符号フレーム長さ。
M:テーブル7.x.1において定義されるステレオLPDフレーム長さ。
band_config():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
band_limits():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
ipd_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_L:復号化されたサイド信号のためのDFTラインの数。
ステレオ復号化は周波数ドメインにおいて実行される。それはLPDデコーダの後処理として作動する。それはLPDデコーダからモノラル中間信号のシンセサイズを受信する。サイド信号は、その時、周波数ドメインにおいて復号化されるか、または予測される。チャンネルスペクトルは、その時、時間ドメインにおいて再シンセサイズされる前に、周波数ドメインにおいて再構成される。ステレオLPDは、LPDモードの中で使われた符号化モードと独立して、ACELPフレームのサイズと等しい固定されたフレーム長によって働く。
フレームインデックスiのDFTスペクトルは、長さMの復号化されたフレームxから計算される。
DFTスペクトルは、パラメータ帯域と呼ばれる非オーバーラップ周波数帯域の中に分割される。スペクトルの区分化は不均一で、聴覚の周波数分解に似る。スペクトルの2つの異なる分割が、等価矩形帯域幅(ERB)の約2倍または約4倍に続く帯域幅によって可能である。スペクトル区分化はデータ要素res_modにより選択され、以下の擬似符号により定義される。
funtion nbands=band_config(N,res_mod)
band_limits[0]=1;
nbands=0;
while(band_limits[nbands++]<(N/2))[
if(stereo_lpd_res==0)
band_limits[nbands]=band_limits_erb2[nbands];
else
band_limits[nbands]=band_limits_erb4[nbands];
]
nbands--;
band_limits[nbands]=N/2;
return nbands
ここで、nbandsはパラメータ帯域の総数であり、NはDFT分析ウィンドウサイズである。表band_limits_erb2とband_limits_erb4は、表7.x.2において定義される。デコーダは、すべての2つのステレオLPDフレームでスペクトルのパラメータ帯域の解像度を順応して変更できる。
ipd_max_band=max_band[res_mod][ipd_mod]
サイド信号の符号化のためのパラメータ帯域の最大数は、2ビットフィールドcod_modデータ要素内で送られる。
cod_max_band=max_band[res_mod][cod_mod]
テーブルmax_band[][]は表7.x.3において定義される。
サイド信号に対して予側するために、復号化されたラインの数は、その時、以下の式で計算される。
cod_L=2・(band_limits[cod_max_band]-1)
ステレオパラメータ相互チャンネルレベル差(ILD)、相互チャンネル位相差(IPD)および予測利得は、フラグq_modeに依存する全てのフレームまたは全ての2つのフレームに送られる。仮に、q_modeが0に等しいならば、パラメータは全てのフレームを更新する。さもなければ、パラメータ値は、USACフレーム内のステレオLPDフレームの奇数のインデックスiに対してのみ更新する。USACフレーム内のステレオLPDフレームのインデックスiは、LPDバージョン0の中で0と3の間のどちらか、およびLPDバージョン1の中で0と1の間のどちらかが可能である。
0≦b<nbandsに対して、
ILDi[b]=ild_q[ild_idx[i][b]]
低音の後処理は2つのチャンネルで別々に行われる。処理は、[1]のセクション7.17で説明したのと同じ両方のチャンネルのためのものである。
[1]ISO/IEC DIS 23003-3, Usac
[2]ISO/IEC DIS 23008-3, 3D Audio
Claims (21)
- マルチチャンネル信号(4)を符号化するためのオーディオエンコーダ(2)であって、
線形予測ドメインエンコーダ(6)と、
周波数ドメインエンコーダ(8)と、
前記線形予測ドメインエンコーダ(6)と前記周波数ドメインエンコーダ(8)との間を切り替えるためのコントローラ(10)と、
を備えるオーディオエンコーダ(2)であって、
前記線形予測ドメインエンコーダ(6)は、前記マルチチャンネル信号(4)をダウンミックスしてダウンミックス信号(14)を得るためのダウンミキサ(12)、前記ダウンミックス信号(14)を符号化するための線形予測ドメインコアエンコーダ(16)、および、前記マルチチャンネル信号から第1マルチチャンネル情報(20)を生成するための第1結合マルチチャンネルエンコーダ(18)を含み、
前記周波数ドメインエンコーダ(8)は、前記マルチチャンネル信号(4)から第2マルチチャンネル情報(24)を生成するための第2結合マルチチャンネルエンコーダ(22)を含み、前記第2結合マルチチャンネルエンコーダ(22)は前記第1結合マルチチャンネルエンコーダ(18)と異なり、
前記コントローラ(10)は、前記マルチチャンネル信号(4)の部分が、前記線形予測ドメインエンコーダ(6)の符号化されたフレーム、または、前記周波数ドメインエンコーダ(8)の符号化されたフレームのいずれかによって表現されるように、切り替えを実行するように構成される、オーディオエンコーダ(2)。 - 前記第1結合マルチチャンネルエンコーダ(18)は、第1の時間-周波数コンバータ(82)を含み、前記第2結合マルチチャンネルエンコーダ(22)は、第2の時間-周波数コンバータ(66)を含み、前記第1の時間-周波数コンバータ(82)と前記第2の時間-周波数コンバータ(66)とが互いに異なる、請求項1に記載のオーディオエンコーダ(2)。
- 前記第1結合マルチチャンネルエンコーダ(18)は、パラメトリック結合マルチチャンネルエンコーダであるか、または、
前記第2結合マルチチャンネルエンコーダ(22)は、左右(L/R)又は中間/サイド(M/S)ステレオ符号化操作を含む波形維持結合マルチチャンネルエンコーダである、請求項1または請求項2に記載のオーディオエンコーダ(2)。 - 前記パラメトリック結合マルチチャンネルエンコーダは、ステレオ予測コーダ、パラメトリックステレオエンコーダまたは回転ベースのパラメトリックステレオエンコーダを含む、または、
前記波形維持結合マルチチャンネルエンコーダは、帯域選択的中間/サイドまたは左/右の切り替えステレオコーダを含む、請求項3に記載のオーディオエンコーダ。 - 前記周波数ドメインエンコーダ(8)が含む前記第2結合マルチチャンネルエンコーダ(22)は、
前記マルチチャンネル信号(4)の第1チャンネル(4a)および前記マルチチャンネル信号(4)の第2チャンネル(4b)を、スペクトル表現(72a、72b)に変換するための第2の時間-周波数コンバータ(66)と、
第2帯域セットのパラメトリック表現を生成するための第2パラメータ生成器(68)と、
第1帯域セット(80)の量子化されて符号化された表現を生成するための第2量子化エンコーダ(70)と、
を含む、請求項1ないし請求項4のいずれかに記載のオーディオエンコーダ(2)。 - 前記線形予測ドメインコアエンコーダ(16)は、時間ドメイン帯域幅拡張を持つACELPプロセッサと、MDCT操作を持つTCXプロセッサと、インテリジェント・ギャップ・フィリング機能とを含む、または、
前記周波数ドメインエンコーダ(8)は、前記マルチチャネル信号(4)の第1チャンネル(4a)および第2チャンネル(4b)のためのMDCT操作と、AAC操作と、インテリジェント・ギャップ・フィリング機能とを含む、または、
前記第1結合マルチチャンネルエンコーダ(18)は、前記マルチチャンネル信号(4)の全帯域幅のためのマルチチャンネル情報が導出されるような方法で動作するように構成される、請求項1ないし請求項4のいずれかに記載のオーディオエンコーダ(2)。 - 前記ダウンミキサ(12)は、前記マルチチャンネル信号(4)をスペクトル表現に変換するように構成され、前記ダウンミックスは、前記スペクトル表現を使って、または、時間ドメイン表現を使って実行され、
前記第1結合マルチチャンネルエンコーダ(18)は、前記スペクトル表現の個々の帯域に対して別個の第1マルチチャンネル情報(20)を生成するために、前記スペクトル表現を使用するように構成される、請求項1ないし請求項6のいずれかに記載のオーディオエンコーダ(2)。 - 前記ダウンミックス信号は低帯域と高帯域を有し、前記線形予測ドメインコアエンコーダ(16)は前記高帯域をパラメトリックに符号化するために帯域拡張処理(36)を適用するように構成され、前記オーディオエンコーダは、前記マルチチャンネル信号のスペクトル表現を生成するためのフィルタバンク(83)をさらに備え、
前記オーディオエンコーダは、符号化され復号化されたダウンミックス信号を使用して符号化されたマルチチャンネル残差信号を算出するためのマルチチャンネル残差コーダ(56)をさらに備え、前記符号化されたマルチチャンネル残差信号は、前記第1マルチチャンネル情報(20)を使用して得られる復号化されたマルチチャンネル表現と、前記ダウンミキサ(12)による前記ダウンミックスの前の前記マルチチャンネル信号との間のエラーを表し、
線形予測ドメインデコーダ(50)は、前記符号化され復号化されたダウンミックス信号として、前記ダウンミックス信号の前記低帯域を表す低帯域信号のみを取得するように構成され、且つ前記符号化されたマルチチャンネル残差信号は、前記ダウンミキサ(12)による前記ダウンミックスの前の前記マルチチャンネル信号の前記低帯域に相当する帯域しか持たない、請求項1に記載のオーディオエンコーダ(2)。 - 前記ダウンミックス信号は低帯域と高帯域を有し、前記線形予測ドメインコアエンコーダ(16)は前記高帯域をパラメトリックに符号化するために帯域拡張処理(36)を適用するように構成され、前記オーディオエンコーダは、前記マルチチャンネル信号のスペクトル表現を生成するためのフィルタバンク(82)をさらに備え、
前記線形予測ドメインコアエンコーダ(16)はACELPプロセッサ(30)を備え、前記ACELPプロセッサ(30)はダウンサンプル器(35)によって前記ダウンミックス信号から得られたダウンサンプリングされたダウンミックス信号に対して作用するように構成され、時間ドメイン帯域幅拡張プロセッサ(36)は、前記ダウンサンプル器(35)を使って、前記ダウンミックス信号から前記ダウンサンプリングによって除去された前記ダウンミックス信号の前記高帯域をパラメトリックに符号化するように構成され、
前記線形予測ドメインコアエンコーダ(16)はTCXプロセッサ(42)を備え、前記TCXプロセッサはダウンサンプリングされていない前記ダウンミックス信号、または前記ダウンサンプル器(35)により実行された前記ACELPプロセッサ(30)のための前記ダウンサンプリングよりも低い度合いでダウンサンプリングされた前記ダウンミックス信号に作用するように構成され、前記TCXプロセッサは、時間-周波数コンバータ(40)と、第1帯域セットのパラメトリック表現を生成するためのパラメータ生成器(42)と、第2帯域セットのための量子化され符号化されたスペクトルラインのセットを生成するための量子化エンコーダ(44)と、を備える、請求項1に記載のオーディオエンコーダ(2)。 - マルチチャンネルとは2つ以上のチャンネルを意味する、請求項1ないし請求項9のいずれかに記載のオーディオエンコーダ(2)。
- 符号化されたオーディオ信号(103)を復号化するためのオーディオデコーダ(102)であって、
線形予測ドメインデコーダ(104)と、
周波数ドメインデコーダ(106)と、
前記線形予測ドメインデコーダ(104)の出力と第1マルチチャンネル情報(20)とを使って第1マルチチャンネル表現(114)を生成するための第1結合マルチチャンネルデコーダ(108)と、
前記周波数ドメインデコーダ(106)の出力と第2マルチチャンネル情報(22,24)とを使って第2マルチチャンネル表現(116)を生成するための第2結合マルチチャンネルデコーダ(110)と、
前記第1マルチチャンネル表現(114)と前記第2マルチチャンネル表現(116)とを結合して復号化されたオーディオ信号(118)を得るための第1結合器(112)と、を含み、
前記第2結合マルチチャンネルデコーダ(110)は、前記第1結合マルチチャンネルデコーダ(108)と異なる、オーディオデコーダ(102)であって、
前記線形予測ドメインデコーダ(104)は、
ACELPデコーダ(120)、低帯域シンセサイザ(122)、前記低帯域シンセサイザ(122)によって生成される信号をアップサンプリングするためのアップサンプリング器(124)、時間ドメイン帯域幅拡張プロセッサ(126)、および、前記アップサンプリング器(124)によって生成されたアップサンプリングされた信号と、前記時間ドメイン帯域幅拡張プロセッサ(126)によって生成された帯域幅拡張された信号とを結合するための第2結合器(128)と、
TCXデコーダ(130)およびインテリジェント・ギャップ・フィリング(IGF)プロセッサ(132)と、
前記第2結合器(128)の出力と前記TCXデコーダ(130)の出力および前記IGFプロセッサ(132)の出力とを結合するための完全帯域シンセサイズプロセッサ(134)と、
前記TCXデコーダ(130)および前記IGFプロセッサ(132)によって生成された信号からの低帯域スペクトル時間変換によって導出された情報を使って、前記低帯域シンセサイザを初期設定するためのクロスパス(136)と、
を含む、オーディオデコーダ(102)。 - 前記第1結合マルチチャンネルデコーダ(108)は、前記線形予測ドメインデコーダ(104)の出力をスペクトル表現(145)に変換するための時間-周波数コンバータ(144)と、
前記スペクトル表現(145)に作用する前記第1マルチチャンネル情報(20)によってコントロールされるアップミキサ(146)と、
アップミックス結果を前記第1マルチチャンネル表現(114)に相当する時間表現に変換するための周波数-時間コンバータ(148a,148b,148)とを含む、請求項11に記載のオーディオデコーダ(102)。 - 前記第2結合マルチチャンネルデコーダ(110)は、
入力として、前記周波数ドメインデコーダ(106)によって得られたスペクトル表現を使うように構成され、ここで、前記スペクトル表現は、少なくとも複数の帯域について、第1チャンネル信号および第2チャンネル信号を含み、そして、
結合マルチチャンネル操作を前記第1チャンネル信号および前記第2チャンネル信号の複数の帯域に適用し、前記結合マルチチャンネル操作の結果を時間表現に変換して前記第2マルチチャンネル表現(116)を得るように構成される、請求項11または請求項12に記載のオーディオデコーダ(102)。 - 前記第2マルチチャンネル情報(24)は、個々の帯域について、左/右、または中間/サイドの結合マルチチャンネル符号化を示すマスクであり、前記結合マルチチャンネル操作は、前記マスクによって示された帯域を、中間/サイド表現から左/右表現に変換するための、中間/サイドから左/右への変換操作である、請求項13に記載のオーディオデコーダ(102)。
- 前記時間-周波数コンバータ(144)は、離散フーリエ変換または過剰サンプリング操作を含み、
前記周波数ドメインデコーダ(106)は、IMDCT操作(152)または臨界サンプリング操作を含む、請求項12に記載のオーディオデコーダ(102)。 - 前記符号化されたオーディオ信号は、コア符号化された信号と、帯域幅拡張パラメータと、第1マルチチャンネル情報(20)と、を含み、
前記線形予測ドメインデコーダ(104)に含まれる線形予測ドメインコアデコーダ(120)はモノラル信号を生成するように構成され、
前記線形予測ドメインデコーダ(104)は、前記モノラル信号をスペクトル表現に変換するための分析フィルタバンク(144)をさらに備え、
前記第1の結合マルチチャンネルデコーダ(108)は、前記モノラル信号の前記スペクトル表現および前記第1マルチチャンネル情報(20)から第1チャンネルスペクトルと第2チャンネルスペクトルを生成するように構成され、
前記線形予測ドメインデコーダ(104)は、前記第1チャンネルスペクトルをシンセサイズフィルタリングして第1チャンネル信号を得るため、および前記第2チャンネルスペクトルをシンセサイズフィルタリングして第2チャンネル信号を得るためのシンセサイズフィルタバンク(148)をさらに備える、
請求項11に記載のオーディオデコーダ(102)。 - 前記第1の結合マルチチャンネルデコーダ(108)は、
前記モノラル信号から前記第1チャンネルスペクトルおよび前記第2チャンネルスペクトルを取得し、ここで前記モノラル信号はマルチチャンネル信号の中間信号であり、
M/S(中間/サイド)マルチチャンネル復号化されたオーディオ信号を取得し、
前記第1マルチチャンネル情報(20)からサイド信号を算出し、
前記M/Sマルチチャンネル復号化されたオーディオ信号からL/R(左/右)マルチチャンネル復号化されたオーディオ信号を算出し、
前記マルチチャンネル情報と前記サイド信号とを使用して低帯域のための前記L/R(左/右)マルチチャンネル復号化されたオーディオ信号を算出する、または前記中間信号から予測サイド信号を算出して、前記予測サイド信号と前記第1のマルチチャンネル情報(20)のILD(チャンネル間レベル差)値とを使用して高帯域のためのL/R(左/右)マルチチャンネル復号化されたオーディオ信号を算出する
ように構成される、請求項16に記載のオーディオデコーダ(102)。 - マルチチャンネルとは2つ以上のチャンネルを意味する、請求項11ないし請求項17のいずれかに記載のオーディオデコーダ。
- マルチチャンネル信号(4)を符号化する方法(800)であって、前記方法は、
線形予測ドメイン符号化を実行するステップと、
周波数ドメイン符号化を実行するステップと、
前記線形予測ドメイン符号化と前記周波数ドメイン符号化との間の切り替えをするステップと、
を含み、
前記線形予測ドメイン符号化を実行するステップは、ダウンミックス信号(14)を得るために前記マルチチャンネル信号(4)をダウンミックスするステップと、前記ダウンミックス信号(14)を線形予測ドメインコア符号化するステップと、前記マルチチャンネル信号(4)から第1マルチチャンネル情報(20)を生成する第1結合マルチチャンネル符号化を実行するステップとを含み、
前記周波数ドメイン符号化を実行するステップは、前記マルチチャンネル信号(4)から第2マルチチャンネル情報(24)を生成する第2結合マルチチャンネル符号化を実行するステップを含み、前記第2結合マルチチャンネル符号化を実行するステップは、第1結合マルチチャンネル符号化を実行するステップと異なり、
前記切り替えをするステップは、前記マルチチャンネル信号(4)の部分が、前記線形予測ドメイン符号化の符号化されたフレーム、または、前記周波数ドメイン符号化の符号化されたフレームのいずれかによって表現されるように実行される、方法(800)。 - 符号化されたオーディオ信号を復号化する方法(900)であって、
線形予測ドメイン復号化するステップと、
周波数ドメイン復号化するステップと、
前記線形予測ドメイン復号化の出力および第1マルチチャンネル情報(20)を使って、第1マルチチャンネル表現(114)を生成する第1結合マルチチャンネル復号化を実行するステップと、
前記周波数ドメイン復号化の出力および第2マルチチャンネル情報(24)を使って、第2マルチチャンネル表現(116)を生成する第2結合マルチチャンネル復号化を実行するステップと、
復号化されたオーディオ信号を得るために、前記第1マルチチャンネル表現(114)と前記第2マルチチャンネル表現(116)を結合するステップと、
を含み、
前記第2結合マルチチャンネル復号化を実行するステップは、前記第1結合マルチチャンネル復号化を実行するステップと異なり、
前記線形予測ドメイン復号化するステップは、
ACELP復号化するステップ、低帯域シンセサイズするステップ、前記低帯域シンセサイズするステップによって生成される信号をアップサンプリングするステップ、時間ドメイン帯域幅拡張処理するステップ、および、前記アップサンプリングするステップによって生成されたアップサンプリングされた信号と、前記時間ドメイン帯域幅拡張処理するステップによって生成された帯域幅拡張された信号とを第2結合するステップと、
TCX復号するステップおよびインテリジェント・ギャップ・フィリング(IGF)処理するステップと、
前記第2結合するステップの出力と、前記TCX復号化するステップの出力および前記IGF処理するステップの出力とを結合するステップと、
前記TCX復号化するステップおよび前記IGF処理するステップによって生成された信号からの低帯域スペクトル時間変換によって導出された情報を使って、前記低帯域シンセサイズを初期化するステップと、
を含む、方法(900)。 - コンピュータ・プログラムがコンピュータまたはプロセッサ上で稼働したとき、請求項19または請求項20の方法を実行するためのコンピュータ・プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022045510A JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15158233 | 2015-03-09 | ||
EP15158233.5 | 2015-03-09 | ||
EP15172594.2A EP3067886A1 (en) | 2015-03-09 | 2015-06-17 | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
EP15172594.2 | 2015-06-17 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548014A Division JP6606190B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022045510A Division JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020038374A JP2020038374A (ja) | 2020-03-12 |
JP7077290B2 true JP7077290B2 (ja) | 2022-05-30 |
Family
ID=52682621
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548000A Active JP6643352B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2017548014A Active JP6606190B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2019189837A Active JP7077290B2 (ja) | 2015-03-09 | 2019-10-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2020000185A Active JP7181671B2 (ja) | 2015-03-09 | 2020-01-06 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022045510A Active JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022183880A Pending JP2023029849A (ja) | 2015-03-09 | 2022-11-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548000A Active JP6643352B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2017548014A Active JP6606190B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020000185A Active JP7181671B2 (ja) | 2015-03-09 | 2020-01-06 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022045510A Active JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022183880A Pending JP2023029849A (ja) | 2015-03-09 | 2022-11-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Country Status (19)
Country | Link |
---|---|
US (7) | US10388287B2 (ja) |
EP (9) | EP3067886A1 (ja) |
JP (6) | JP6643352B2 (ja) |
KR (2) | KR102151719B1 (ja) |
CN (6) | CN107430863B (ja) |
AR (6) | AR103881A1 (ja) |
AU (2) | AU2016231284B2 (ja) |
BR (4) | BR112017018439B1 (ja) |
CA (2) | CA2978812C (ja) |
ES (6) | ES2901109T3 (ja) |
FI (1) | FI3958257T3 (ja) |
MX (2) | MX366860B (ja) |
MY (2) | MY186689A (ja) |
PL (6) | PL3268958T3 (ja) |
PT (3) | PT3268958T (ja) |
RU (2) | RU2679571C1 (ja) |
SG (2) | SG11201707335SA (ja) |
TW (2) | TWI609364B (ja) |
WO (2) | WO2016142336A1 (ja) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
ES2727462T3 (es) | 2016-01-22 | 2019-10-16 | Fraunhofer Ges Forschung | Aparatos y procedimientos para la codificación o decodificación de una señal multicanal de audio mediante el uso de repetición de muestreo de dominio espectral |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
US10224045B2 (en) | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
EP3625947B1 (en) | 2017-05-18 | 2021-06-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Managing network device |
US10431231B2 (en) * | 2017-06-29 | 2019-10-01 | Qualcomm Incorporated | High-band residual prediction with time-domain inter-channel bandwidth extension |
US10475457B2 (en) | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
CN114898761A (zh) * | 2017-08-10 | 2022-08-12 | 华为技术有限公司 | 立体声信号编解码方法及装置 |
US10535357B2 (en) | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10734001B2 (en) * | 2017-10-05 | 2020-08-04 | Qualcomm Incorporated | Encoding or decoding of audio signals |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483882A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019121982A1 (en) * | 2017-12-19 | 2019-06-27 | Dolby International Ab | Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements |
TWI812658B (zh) * | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
SG11202007182UA (en) * | 2018-02-01 | 2020-08-28 | Fraunhofer Ges Forschung | Audio scene encoder, audio scene decoder and related methods using hybrid encoder/decoder spatial analysis |
EP3550561A1 (en) * | 2018-04-06 | 2019-10-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value |
EP3588495A1 (en) * | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
IL276619B2 (en) * | 2018-07-02 | 2024-03-01 | Dolby Laboratories Licensing Corp | Methods and devices for encoding and/or decoding embedded audio signals |
MX2020014077A (es) * | 2018-07-04 | 2021-03-09 | Fraunhofer Ges Forschung | Codificador multise?al, decodificador multise?al, y metodos relacionados que utilizan blanqueado de se?al o post procesamiento de se?al. |
WO2020094263A1 (en) | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
EP3719799A1 (en) * | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
CN110267142B (zh) * | 2019-06-25 | 2021-06-22 | 维沃移动通信有限公司 | 一种移动终端及控制方法 |
CN114270436A (zh) * | 2019-07-19 | 2022-04-01 | 英迪股份有限公司 | 无线通信***中的自适应音频处理方法、设备、计算机程序及其记录介质 |
FR3101741A1 (fr) * | 2019-10-02 | 2021-04-09 | Orange | Détermination de corrections à appliquer à un signal audio multicanal, codage et décodage associés |
US11432069B2 (en) * | 2019-10-10 | 2022-08-30 | Boomcloud 360, Inc. | Spectrally orthogonal audio component processing |
KR20220137005A (ko) * | 2020-02-03 | 2022-10-11 | 보이세지 코포레이션 | 다채널 사운드 코덱에 있어서 스테레오 코딩 모드들간의 스위칭 |
CN111654745B (zh) * | 2020-06-08 | 2022-10-14 | 海信视像科技股份有限公司 | 多声道的信号处理方法及显示设备 |
DE112021005027T5 (de) * | 2020-09-25 | 2023-08-10 | Apple Inc. | Nahtloses skalierbares decodieren von kanälen, objekten und hoa-audioinhalt |
CA3194876A1 (en) * | 2020-10-09 | 2022-04-14 | Franz REUTELHUBER | Apparatus, method, or computer program for processing an encoded audio scene using a bandwidth extension |
JPWO2022176270A1 (ja) * | 2021-02-16 | 2022-08-25 | ||
CN115881140A (zh) * | 2021-09-29 | 2023-03-31 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序产品 |
CA3240986A1 (en) * | 2021-12-20 | 2023-06-29 | Dolby International Ab | Ivas spar filter bank in qmf domain |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006025337A1 (ja) | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | ステレオ信号生成装置およびステレオ信号生成方法 |
JP2007515672A (ja) | 2003-12-04 | 2007-06-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号符号化 |
JP2008505368A (ja) | 2004-07-09 | 2008-02-21 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル出力信号を生成するための装置及び方法 |
JP2011527453A (ja) | 2008-07-11 | 2011-10-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム |
JP2011528129A (ja) | 2008-07-17 | 2011-11-10 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 切り換え可能なバイパスを有するオーディオ符号化/復号化方式 |
JP2012505429A (ja) | 2008-10-10 | 2012-03-01 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | エネルギ保存型マルチチャネルオーディオ符号化 |
JP2012521012A (ja) | 2009-03-17 | 2012-09-10 | ドルビー インターナショナル アーベー | 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化 |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1311059C (en) * | 1986-03-25 | 1992-12-01 | Bruce Allen Dautrich | Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words |
DE4307688A1 (de) | 1993-03-11 | 1994-09-15 | Daimler Benz Ag | Verfahren zur Geräuschreduktion für gestörte Sprachkanäle |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3593201B2 (ja) * | 1996-01-12 | 2004-11-24 | ユナイテッド・モジュール・コーポレーション | オーディオ復号装置 |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JP4907826B2 (ja) * | 2000-02-29 | 2012-04-04 | クゥアルコム・インコーポレイテッド | 閉ループのマルチモードの混合領域の線形予測音声コーダ |
SE519981C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
EP1761915B1 (en) * | 2004-06-21 | 2008-12-03 | Koninklijke Philips Electronics N.V. | Method and apparatus to encode and decode multi-channel audio signals |
ATE545131T1 (de) * | 2004-12-27 | 2012-02-15 | Panasonic Corp | Tonkodierungsvorrichtung und tonkodierungsmethode |
EP1912206B1 (en) | 2005-08-31 | 2013-01-09 | Panasonic Corporation | Stereo encoding device, stereo decoding device, and stereo encoding method |
WO2008035949A1 (en) | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
CN101067931B (zh) * | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与*** |
EP2168121B1 (fr) * | 2007-07-03 | 2018-06-06 | Orange | Quantification apres transformation lineaire combinant les signaux audio d'une scene sonore, codeur associe |
CN101373594A (zh) * | 2007-08-21 | 2009-02-25 | 华为技术有限公司 | 修正音频信号的方法及装置 |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
MX2010002629A (es) * | 2007-11-21 | 2010-06-02 | Lg Electronics Inc | Metodo y aparato para procesar una señal. |
US9275648B2 (en) * | 2007-12-18 | 2016-03-01 | Lg Electronics Inc. | Method and apparatus for processing audio signal using spectral data of audio signal |
KR101162275B1 (ko) * | 2007-12-31 | 2012-07-04 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
JP5333446B2 (ja) | 2008-04-25 | 2013-11-06 | 日本電気株式会社 | 無線通信装置 |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2346030B1 (en) | 2008-07-11 | 2014-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and computer program |
KR101227729B1 (ko) * | 2008-07-11 | 2013-01-29 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 샘플 오디오 신호의 프레임을 인코딩하기 위한 오디오 인코더 및 디코더 |
CN102089814B (zh) * | 2008-07-11 | 2012-11-21 | 弗劳恩霍夫应用研究促进协会 | 对编码的音频信号进行解码的设备和方法 |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
JP5203077B2 (ja) | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
CN101809656B (zh) * | 2008-07-29 | 2013-03-13 | 松下电器产业株式会社 | 音响编码装置、音响解码装置、音响编码解码装置及会议*** |
WO2010036061A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
RU2520402C2 (ru) * | 2008-10-08 | 2014-06-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Переключаемая аудио кодирующая/декодирующая схема с мультиразрешением |
GB2470059A (en) | 2009-05-08 | 2010-11-10 | Nokia Corp | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter |
ES2441069T3 (es) * | 2009-10-08 | 2014-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación |
ES2533098T3 (es) * | 2009-10-20 | 2015-04-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de señal de audio, decodificador de señal de audio, método para proveer una representación codificada de un contenido de audio, método para proveer una representación decodificada de un contenido de audio y programa de computación para su uso en aplicaciones de bajo retardo |
KR101508819B1 (ko) | 2009-10-20 | 2015-04-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 멀티 모드 오디오 코덱 및 이를 위해 적응된 celp 코딩 |
MX2012004648A (es) * | 2009-10-20 | 2012-05-29 | Fraunhofer Ges Forschung | Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing. |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
WO2011059254A2 (en) | 2009-11-12 | 2011-05-19 | Lg Electronics Inc. | An apparatus for processing a signal and method thereof |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
US8166830B2 (en) * | 2010-07-02 | 2012-05-01 | Dresser, Inc. | Meter devices and methods |
JP5499981B2 (ja) * | 2010-08-02 | 2014-05-21 | コニカミノルタ株式会社 | 画像処理装置 |
WO2012065081A1 (en) | 2010-11-12 | 2012-05-18 | Polycom, Inc. | Scalable audio in a multi-point environment |
KR101767175B1 (ko) * | 2011-03-18 | 2017-08-10 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩에서의 프레임 요소 길이 전송 |
CN104364842A (zh) * | 2012-04-18 | 2015-02-18 | 诺基亚公司 | 立体声音频信号编码器 |
WO2013168414A1 (ja) * | 2012-05-11 | 2013-11-14 | パナソニック株式会社 | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 |
CN102779518B (zh) * | 2012-07-27 | 2014-08-06 | 深圳广晟信源技术有限公司 | 用于双核编码模式的编码方法和*** |
TWI618050B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830052A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
TWI579831B (zh) * | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
US20150159036A1 (en) | 2013-12-11 | 2015-06-11 | Momentive Performance Materials Inc. | Stable primer formulations and coatings with nano dispersion of modified metal oxides |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
-
2015
- 2015-06-17 EP EP15172594.2A patent/EP3067886A1/en not_active Withdrawn
- 2015-06-17 EP EP15172599.1A patent/EP3067887A1/en not_active Withdrawn
-
2016
- 2016-03-02 TW TW105106305A patent/TWI609364B/zh active
- 2016-03-02 TW TW105106306A patent/TWI613643B/zh active
- 2016-03-07 BR BR112017018439-7A patent/BR112017018439B1/pt active IP Right Grant
- 2016-03-07 SG SG11201707335SA patent/SG11201707335SA/en unknown
- 2016-03-07 ES ES16708172T patent/ES2901109T3/es active Active
- 2016-03-07 PT PT167081728T patent/PT3268958T/pt unknown
- 2016-03-07 PL PL16708172T patent/PL3268958T3/pl unknown
- 2016-03-07 CN CN201680014669.3A patent/CN107430863B/zh active Active
- 2016-03-07 CN CN202110019014.8A patent/CN112614496B/zh active Active
- 2016-03-07 PL PL21171831.7T patent/PL3879528T3/pl unknown
- 2016-03-07 CN CN202110019042.XA patent/CN112614497A/zh active Pending
- 2016-03-07 BR BR122022025643-0A patent/BR122022025643B1/pt active IP Right Grant
- 2016-03-07 WO PCT/EP2016/054775 patent/WO2016142336A1/en active Application Filing
- 2016-03-07 MX MX2017011187A patent/MX366860B/es active IP Right Grant
- 2016-03-07 EP EP23166790.8A patent/EP4224470A1/en active Pending
- 2016-03-07 EP EP21171831.7A patent/EP3879528B1/en active Active
- 2016-03-07 PL PL21191544.2T patent/PL3958257T3/pl unknown
- 2016-03-07 BR BR112017018441-9A patent/BR112017018441B1/pt active IP Right Grant
- 2016-03-07 CA CA2978812A patent/CA2978812C/en active Active
- 2016-03-07 CA CA2978814A patent/CA2978814C/en active Active
- 2016-03-07 EP EP16708172.8A patent/EP3268958B1/en active Active
- 2016-03-07 PL PL21171835.8T patent/PL3910628T3/pl unknown
- 2016-03-07 FI FIEP21191544.2T patent/FI3958257T3/fi active
- 2016-03-07 MX MX2017011493A patent/MX364618B/es active IP Right Grant
- 2016-03-07 KR KR1020177028167A patent/KR102151719B1/ko active IP Right Grant
- 2016-03-07 PT PT167081710T patent/PT3268957T/pt unknown
- 2016-03-07 EP EP21171826.7A patent/EP3879527B1/en active Active
- 2016-03-07 MY MYPI2017001288A patent/MY186689A/en unknown
- 2016-03-07 ES ES21171835T patent/ES2958535T3/es active Active
- 2016-03-07 PL PL21171826.7T patent/PL3879527T3/pl unknown
- 2016-03-07 PT PT211915442T patent/PT3958257T/pt unknown
- 2016-03-07 KR KR1020177028152A patent/KR102075361B1/ko active IP Right Grant
- 2016-03-07 EP EP21191544.2A patent/EP3958257B1/en active Active
- 2016-03-07 AU AU2016231284A patent/AU2016231284B2/en active Active
- 2016-03-07 JP JP2017548000A patent/JP6643352B2/ja active Active
- 2016-03-07 AU AU2016231283A patent/AU2016231283C1/en active Active
- 2016-03-07 SG SG11201707343UA patent/SG11201707343UA/en unknown
- 2016-03-07 CN CN202110018176.XA patent/CN112634913B/zh active Active
- 2016-03-07 EP EP16708171.0A patent/EP3268957B1/en active Active
- 2016-03-07 CN CN202110178110.7A patent/CN112951248B/zh active Active
- 2016-03-07 WO PCT/EP2016/054776 patent/WO2016142337A1/en active Application Filing
- 2016-03-07 ES ES21171831T patent/ES2959970T3/es active Active
- 2016-03-07 JP JP2017548014A patent/JP6606190B2/ja active Active
- 2016-03-07 BR BR122022025766-6A patent/BR122022025766B1/pt active IP Right Grant
- 2016-03-07 PL PL16708171T patent/PL3268957T3/pl unknown
- 2016-03-07 ES ES21171826T patent/ES2959910T3/es active Active
- 2016-03-07 MY MYPI2017001286A patent/MY194940A/en unknown
- 2016-03-07 RU RU2017133918A patent/RU2679571C1/ru active
- 2016-03-07 RU RU2017134385A patent/RU2680195C1/ru active
- 2016-03-07 ES ES21191544T patent/ES2951090T3/es active Active
- 2016-03-07 EP EP21171835.8A patent/EP3910628B1/en active Active
- 2016-03-07 CN CN201680014670.6A patent/CN107408389B/zh active Active
- 2016-03-07 ES ES16708171T patent/ES2910658T3/es active Active
- 2016-03-08 AR ARP160100609A patent/AR103881A1/es active IP Right Grant
- 2016-03-08 AR ARP160100608A patent/AR103880A1/es active IP Right Grant
-
2017
- 2017-09-05 US US15/695,668 patent/US10388287B2/en active Active
- 2017-09-05 US US15/695,424 patent/US10395661B2/en active Active
-
2019
- 2019-03-22 US US16/362,462 patent/US10777208B2/en active Active
- 2019-07-09 US US16/506,767 patent/US11238874B2/en active Active
- 2019-10-17 JP JP2019189837A patent/JP7077290B2/ja active Active
-
2020
- 2020-01-06 JP JP2020000185A patent/JP7181671B2/ja active Active
- 2020-08-31 US US17/008,428 patent/US11107483B2/en active Active
-
2021
- 2021-08-24 US US17/410,033 patent/US11741973B2/en active Active
- 2021-10-18 AR ARP210102869A patent/AR123837A2/es unknown
- 2021-10-18 AR ARP210102867A patent/AR123835A2/es unknown
- 2021-10-18 AR ARP210102868A patent/AR123836A2/es unknown
- 2021-10-18 AR ARP210102866A patent/AR123834A2/es unknown
-
2022
- 2022-01-13 US US17/575,260 patent/US11881225B2/en active Active
- 2022-03-22 JP JP2022045510A patent/JP7469350B2/ja active Active
- 2022-11-17 JP JP2022183880A patent/JP2023029849A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007515672A (ja) | 2003-12-04 | 2007-06-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号符号化 |
JP2008505368A (ja) | 2004-07-09 | 2008-02-21 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル出力信号を生成するための装置及び方法 |
WO2006025337A1 (ja) | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | ステレオ信号生成装置およびステレオ信号生成方法 |
JP2011527453A (ja) | 2008-07-11 | 2011-10-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム |
JP2011528129A (ja) | 2008-07-17 | 2011-11-10 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 切り換え可能なバイパスを有するオーディオ符号化/復号化方式 |
JP2012505429A (ja) | 2008-10-10 | 2012-03-01 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | エネルギ保存型マルチチャネルオーディオ符号化 |
JP2012521012A (ja) | 2009-03-17 | 2012-09-10 | ドルビー インターナショナル アーベー | 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化 |
Non-Patent Citations (1)
Title |
---|
堤公孝 他,"VoLTEのさらなる高音質化と音楽の活用を実現する3GPP標準音声符号化方式EVS",NTT DOCOMOテクニカル・ジャーナル,2015年01月01日,Vol.22,No.4,pp.6-13 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7077290B2 (ja) | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210105 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220518 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7077290 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |