JP6185592B2 - 空間オーディオオブジェクト符号化における信号依存ズーム変換のためのエンコーダ、デコーダおよび方法 - Google Patents
空間オーディオオブジェクト符号化における信号依存ズーム変換のためのエンコーダ、デコーダおよび方法 Download PDFInfo
- Publication number
- JP6185592B2 JP6185592B2 JP2015535005A JP2015535005A JP6185592B2 JP 6185592 B2 JP6185592 B2 JP 6185592B2 JP 2015535005 A JP2015535005 A JP 2015535005A JP 2015535005 A JP2015535005 A JP 2015535005A JP 6185592 B2 JP6185592 B2 JP 6185592B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio object
- subband
- downmix
- converted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 60
- 230000001419 dependent effect Effects 0.000 title claims description 5
- 230000004913 activation Effects 0.000 claims description 80
- 230000001052 transient effect Effects 0.000 claims description 72
- 238000006243 chemical reaction Methods 0.000 claims description 57
- 230000008859 change Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 14
- 230000001131 transforming effect Effects 0.000 claims description 10
- 238000002156 mixing Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 description 36
- 230000006870 function Effects 0.000 description 28
- 230000005236 sound signal Effects 0.000 description 26
- 230000003595 spectral effect Effects 0.000 description 25
- 238000001228 spectrum Methods 0.000 description 23
- 238000001514 detection method Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 14
- 239000000203 mixture Substances 0.000 description 12
- 238000000926 separation method Methods 0.000 description 11
- 230000002123 temporal effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000007704 transition Effects 0.000 description 8
- 230000006978 adaptation Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 7
- 238000009877 rendering Methods 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000009432 framing Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 101100180304 Arabidopsis thaliana ISS1 gene Proteins 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 101100519257 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PDR17 gene Proteins 0.000 description 2
- 101100042407 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SFB2 gene Proteins 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 125000001475 halogen functional group Chemical group 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- -1 ISS2 Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 101100356268 Schizosaccharomyces pombe (strain 972 / ATCC 24843) red1 gene Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000009931 harmful effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Description
− N個の入力オーディオオブジェクト信号s1…sNが、要素d1,1…dN,Pより成るダウンミックス行列を用いてエンコーダ処理の一部としてP個のチャネルx1…xPへダウンミックスされる。さらに、エンコーダは、入力されるオーディオオブジェクトの特徴を記述するサイド情報を抽出する(サイド情報推定器(SIE)モジュール)。MPEG SAOCの場合、オブジェクト電力の相対的な関係がこのようなサイド情報の最も基本的な形式である。
− ダウンミックス信号とサイド情報が送信/蓄積される。この目的のために、ダウンミックスオーディオ信号は、例えば、MPEG−1/2レイヤIIまたはIII(aka.mp3)、MPEG−2/4アドバンスト・オーディオ・コーディング(AAC:Advanced Audio Coding)等の周知の知覚オーディオコーダを用いて圧縮することができる。
− 受信側において、デコーダは、概念的には、送信されるサイド情報を用いて(復号された)ダウンミックス信号からオリジナルのオブジェクト信号を復元(「オブジェクト分離」)するようとする。これの近似されたオブジェクト信号
は、次に、図3において係数r1,1…rN,Mにより記述されるレンダリング行列を用いて、M個のオーディオ出力チャネル
により表されるターゲットシーンにミックスされる。望ましいターゲットシーンは、極端な事例では混合物の中の1つだけのソース信号を実現するもの(ソース分離シナリオ)であってもよいが、送信された複数のオブジェクトより成る他の任意の音響シーンであってもよい。例えば、その出力は、単チャネル、2チャネルステレオまたは5.1多チャネルターゲットシーンであることができる。
標準SAOCエンコーダ([SAOC]で標準化されているようなMPEG SAOC)から発生するSAOCパラメータ・ビット・ストリームを、強化デコーダによっても標準デコーダで取得されるものに匹敵する知覚品質で復号することができ、
強化SAOCパラメータ・ビット・ストリームを、強化デコーダにより最適品質で復号することができ、かつ、
標準SAOCパラメータ・ビット・ストリームと強化SAOCパラメータ・ビット・ストリームを、例えば多地点制御装置(MCU:multi-point control unit)シナリオにおいて、標準デコーダまたは強化デコーダによって復号され得る1つの共通ビットストリームに混合することができる。
オブジェクト間クロストークを回避するために、準定常信号のスペクトル分離では周波数選択性を高くすること、および、
プレエコーおよびポストエコーを最小限に抑えるために、オブジェクト開始または過渡事象に対しては時間精度を高くすること。
但し、nは指数、iは第1のオブジェクト、jは第2のオブジェクト、bはパラメトリック帯域を示す。OLD(object level difference)は、例えば、オブジェクトレベル差を示す。
複数の分析ウインドウを決定することであって、各分析ウインドウはダウンミックス信号の複数の時間領域ダウンミックスサンプルを含み、複数の分析ウインドウの各分析ウインドウはその分析ウインドウの時間領域ダウンミックスサンプルの数を示すウインドウ長さを有し、複数の分析ウインドウの決定は、各分析ウインドウのウインドウ長さが2つ以上のオーディオオブジェクト信号のうちの少なくとも1つの信号の信号特性に依存するように実行されることと、
変換されたダウンミックスを得るために、複数の分析ウインドウの各分析ウインドウの複数の時間領域ダウンミックスサンプルを、前記分析ウインドウのウインドウ長さに依存して時間領域から時間−周波数領域へ変換することと、
オーディオ出力信号を得るために、変換されたダウンミックスを、2つ以上のオーディオオブジェクト信号に関するパラメトリックサイド情報に基づいてアンミックスすること、を含む。
複数の分析ウインドウを決定することであって、各分析ウインドウは入力されたオーディオオブジェクト信号のうちの1つの信号の複数の時間領域信号サンプルを含み、各分析ウインドウはその分析ウインドウの時間領域信号サンプルの数を示すウインドウ長さを有し、複数の分析ウインドウの決定は、各分析ウインドウのウインドウ長さが2つ以上の入力されたオーディオオブジェクト信号のうちの少なくとも1つの信号の信号特性に依存するように実行されることと、
変換された信号サンプルを得るために、各分析ウインドウの時間領域信号サンプルを時間領域から時間−周波数領域へ変換することであって、各分析ウインドウの複数の時間領域信号サンプルの変換はその分析ウインドウのウインドウ長さに依存することと、
変換された信号サンプルに依存してパラメトリックサイド情報を決定すること、を含む。
複数のサブバンドサンプルを含む複数のサブバンドを得るために、複数の時間領域ダウンミックスサンプルを変換することと、
複数の分析ウインドウを決定することであって、各分析ウインドウは複数のサブバンドのうちの1つのサブバンドの複数のサブバンドサンプルを含み、複数の分析ウインドウの各分析ウインドウはその分析ウインドウのサブバンドサンプルの数を示すウインドウ長さを有し、複数の分析ウインドウの決定は、各分析ウインドウのウインドウ長さが2つ以上のオーディオオブジェクト信号のうちの少なくとも1つの信号の信号特性に依存するように実行されることと、
変換されたダウンミックスを得るために、複数の分析ウインドウの各分析ウインドウの複数のサブバンドサンプルをその分析ウインドウのウインドウ長さに依存して変換することと、
オーディオ出力信号を得るために、変換されたダウンミックスを、2つ以上のオーディオオブジェクト信号に関するパラメトリックサイド情報に基づいてアンミックスすること、を含む。
複数のサブバンドサンプルを含む複数のサブバンドを得るために、複数の時間領域信号サンプルを変換することと、
複数の分析ウインドウを決定することであって、各分析ウインドウは複数のサブバンドのうちの1つのサブバンドの複数のサブバンドサンプルを含み、各分析ウインドウはその分析ウインドウのサブバンドサンプルの数を示すウインドウ長さを有し、複数の分析ウインドウの決定は、各分析ウインドウのウインドウ長さが2つ以上の入力されたオーディオオブジェクト信号のうちの少なくとも1つの信号の信号特性に依存するように実行されることと、
変換された信号サンプルを得るために、複数の分析ウインドウの各分析ウインドウの複数のサブバンドサンプルをその分析ウインドウのウインドウ長さに依存して変換することと、
変換された信号サンプルに依存してパラメトリックサイド情報を決定すること、を含む。
2つ以上のオーディオオブジェクト信号のうちの少なくとも1つの信号の信号特性に依存して起動指示を起動状態に設定することと、
複数の第1のサブバンドチャネルを含む第1の変換されたダウンミックスを得るために、ダウンミックス信号を変換することと、
複数の第2のサブバンドチャネルを得るために、起動指示が起動状態に設定されていると、第1のサブバンドチャネルのうちの少なくとも1つを変換することによって第2の変換されたダウンミックスを生成することであって、第2の変換されたダウンミックスは、第2の分析モジュールによって変換されていない第1のサブバンドチャネルと、第2のサブバンドチャネルとを含むことと、
起動指示が起動状態に設定されていれば、オーディオ出力信号を得るために2つ以上のオーディオオブジェクト信号に関するパラメトリックサイド情報に基づいて第2の変換されたダウンミックスをアンミックスし、かつ起動指示が起動状態に設定されていなければ、オーディオ出力信号を得るために2つ以上のオーディオオブジェクト信号に関するパラメトリックサイド情報に基づいて第1の変換されたダウンミックスをアンミックスすること、を含む。
2つ以上の入力されたオーディオオブジェクト信号のうちの少なくとも1つの信号の信号特性に依存して起動指示を起動状態に設定することと、
前記入力されたオーディオオブジェクト信号の第1の変換されたオーディオオブジェクト信号を得るために、入力されたオーディオオブジェクト信号の各々を変換することであって、前記第1の変換されたオーディオオブジェクト信号は複数の第1のサブバンドチャネルを含むことと、
複数の第2のサブバンドチャネルを得るために、入力されたオーディオオブジェクト信号の各々について、起動指示が起動状態に設定されていると、前記入力されたオーディオオブジェクト信号の第1の変換されたオーディオオブジェクト信号の第1のサブバンドチャネルのうちの少なくとも1つを変換することによって第2の変換されたオーディオオブジェクト信号を生成することであって、前記第2の変換されたダウンミックスは、第2の分析モジュールによって変換されていない前記第1のサブバンドチャネルと、前記第2のサブバンドチャネルとを含むことと、
起動指示が起動状態に設定されていれば、入力されたオーディオオブジェクト信号の各々の第2の変換されたオーディオオブジェクト信号に基づいてパラメトリックサイド情報を決定し、かつ起動指示が起動状態に設定されていなければ、入力されたオーディオオブジェクト信号の各々の第1の変換されたオーディオオブジェクト信号に基づいてパラメトリックサイド情報を決定すること、を含む。
および
を回復してユーザが選択する任意のチャネルセット
上へレンダリングするために、サイド情報20だけでなくダウンミックス信号18も受信するアップミキサを備えている。そのレンダリングは、SAOCデコーダ12へ入力されるレンダリング情報26によって規定される。
として計算する。ここで、和および指数n、kは各々、SAOCフレーム(または処理用時間スロット)の指数lとパラメータ帯域のmで表わされる所定の時間/周波数タイル42に属する全ての時間指数34および全てのスペクトル指数30に及ぶ。これにより、あるオーディオ信号またはオブジェクトiの全てのサブバンド値χiのエネルギーが合計され、かつ全てのオブジェクトまたはオーディオ信号のうちのそのタイルの最高エネルギー値に対して正規化される。xi n,k*はxi n,kの複素共役を示す。
と呼ばれる。計算式は、次の通りである。
ここで、同じく、指数nおよびkは所定の時間/周波数タイル42に属する全てのサブバンド値に及び、iおよびjはオーディオオブジェクトs1−sNの所定のペアを示し、かつRe{ }は複素引数の虚数部を放棄する演算を示す。
DMGi=20log10(di+ε) (モノラルダウンミックス)、
DMGi=10log10(d11,i 2+d12,i 2+ε) (ステレオダウンミックス)、
に従って計算される。但し、εは10-9のような小値である。
において実行する。但し、行列Eは変数OLDおよびIOCの関数であり、行列Dは、次式のようなダウンミックス係数を含む。
である行列El,mは、i=jの場合、
および
であるので、その対角線沿いにオブジェクトレベル差、即ちi=jの場合の
を有する。その対角線の外側において、推定される共分散行列Eは、オブジェクト間相互相関度(inter-object cross-correlation measure)
で重み付けされたオブジェクトiおよびj各々のオブジェクトレベル差の幾何学的平均を表す行列係数を有する。
但し
である(
は、次の整数への引数の切り上げ演算を示し、かつ
は、同様に次の整数への引数の切り捨て演算を示す)。本例示において使用されるプロトタイプウインドウ関数は、
として定義される正弦波ウインドウであるが、他の形式を用いることもできる。過渡の位置tは、3つのウインドウの中心ck-1=t−lb、ck=tおよびck+1=t+laを画定し、数字lbおよびlaは過渡前後の所望されるウインドウ範囲を画定する。
として定義される。但し、nは時間指数を示し、iは第1のオブジェクトを示し、jは第2のオブジェクトを示し、bはパラメトリック帯域を示す。OLDは、例えば、オブジェクトレベル差を示すことができる。
であってオブジェクト相互相関行列に近似し、iとjはオブジェクト指数であり、J≒(DEDT)-1であり、かつDTはDの転置行列である。非混合行列計算器131は、適宜、非混合行列を計算するように構成することができる。
である。
およびIOC
が生じる。K(f,b)は、次式によって、周波数ビンfのパラメトリック帯域bへの割当てを定義するカーネル行列である。
およびJ(f)≒(D(f)E(f)DT(f))-1である。望むなら、レンダリング行列は、非混合行列G(f)へ乗算することができる。続いて、標準SAOCのように、時間補間器132による時間補間が行われる。
- デフォルトウインドウ長さ、即ちデフォルトの信号変換ブロックの長さを、例えば2048サンプルに設定する。
- パラメータフレームの長さを、例えば、50%の重なりをもった4つのデフォルトウインドウに対応する4096サンプルに設定する。パラメータフレームは、複数のウインドウを纏めてグルーピングし、ウインドウ毎に記述子を別々に有する代わりに、ブロック全体に単一の信号記述子セットが使用される。これにより、PSIの量を減らすことができる。
- 過渡が検出されていなければ、デフォルトウインドウおよびパラメータフレーム全長を用いる。
- 過渡が検出されれば、過渡の位置においてより優れた時間分解能を与えるようにウインドウイングを適合化する。
と定義される。但し、行列
は、次式によって、(このパラメータフレームにおけるN個のフレームの)フレームnにおけるFnt/f表現ビンからパラメトリックB帯域へのマッピングを定義し、
かつ、S*はSの複素共役である。スペクトル分解能は、1つのパラメータブロック内のフレーム間で変わる可能性があり、よって、マッピング行列はデータを共通の分解能ベースに変換する。このパラメータ化タイルにおける最大オブジェクトエネルギーは、最大オブジェクトエネルギー
であるものとして定義される。この値を得れば、OLDは、次式のような正規化されたオブジェクトエネルギーであるものと定義される。
であり、ここで、Si(f,n)はオブジェクトiの時間フレームnにおける複素スペクトルである。合計は、帯域bにおける周波数ビンfに渡って行われる。データから何らかの雑音効果を除去するために、値は、一次IIRフィルタ
によって低域通過フィルタリングされる。但し、0≦aLP≦1はフィルタフィードバック係数であり、例えば、aLP=0.9である。
を用いて調べられる。全ての一意のオブジェクトペアの変化は、次式によって検出関数へと合計される。
- LONGウインドウ:WLONG(n)=f(n,NLONG)、但しNLONG=2048である。
- SHORTウインドウ:WSHORT(n)=f(n,NSHORT)、但しNSHORT=256である。
- LONGからSHORTへの遷移ウインドウ
- SHORTからLONGへの遷移ウインドウ:WSTOP(n)=WSTART(NLONG−n−1)
Claims (14)
- ダウンミックス信号から1つまたは複数のオーディオ出力チャネルを含むオーディオ出力信号を生成するためのデコーダであって、前記ダウンミックス信号は1つまたは複数のオーディオオブジェクト信号を符号化し、
該デコーダは、
前記1つまたは複数のオーディオオブジェクト信号のうちの少なくとも1つの信号の信号特性に依存して起動指示を起動状態に設定するための制御ユニット(181)と、
複数の第1のサブバンドチャネルを含む第1の変換されたダウンミックスを得るために、前記ダウンミックス信号を変換するための第1の分析モジュール(182)と、
複数の第2のサブバンドチャネルを得るために、前記起動指示が前記起動状態に設定されていれば、前記第1のサブバンドチャネルのうちの少なくとも1つを変換することによって第2の変換されたダウンミックスを生成するための第2の分析モジュール(183)であって、前記第2の変換されたダウンミックスは、前記第2の分析モジュールによって変換されていない前記第1のサブバンドチャネルと、前記第2のサブバンドチャネルとを含んでいる第2の分析モジュール(183)と、
非混合ユニット(184)と、を備え、
前記非混合ユニット(184)は、前記起動指示が前記起動状態に設定されていれば、前記オーディオ出力信号を得るために前記1つまたは複数のオーディオオブジェクト信号に関するパラメトリックサイド情報に基づいて前記第2の変換されたダウンミックスをアンミックスするように、かつ前記起動指示が前記起動状態に設定されていなければ、前記オーディオ出力信号を得るために前記1つまたは複数のオーディオオブジェクト信号に関する前記パラメトリックサイド情報に基づいて前記第1の変換されたダウンミックスをアンミックスするように構成されており、
前記制御ユニット(181)は、前記1つまたは複数のオーディオオブジェクト信号のうちの少なくとも1つが、前記1つまたは複数のオーディオオブジェクト信号のうちの少なくとも1つの信号の信号変化を示す過渡を含むかどうかに依存して、前記起動指示を前記起動状態に設定するように構成されているデコーダ。 - サブバンド変換指示が前記第1のサブバンドチャネルの各々へ割り当てられ、
前記制御ユニット(181)は、前記1つまたは複数のオーディオオブジェクト信号のうちの少なくとも1つの信号の前記信号特性に依存して、前記第1のサブバンドチャネルの各々のサブバンド変換指示をサブバンド変換状態に設定するように構成され、かつ、
前記第2の分析モジュール(183)は、その前記サブバンド変換指示が前記サブバンド変換状態に設定されている前記第1のサブバンドチャネルの各々を変換して前記複数の第2のサブバンドチャネルを取得するように、かつその前記サブバンド変換指示が前記サブバンド変換状態に設定されていない前記第2のサブバンドチャネルの各々を変換しないように構成されている請求項1に記載のデコーダ。 - 前記第1の分析モジュール(182)は、前記複数の第1のサブバンドチャネルを含む前記第1の変換されたダウンミックスを得るために、直交ミラーフィルタを使用することにより前記ダウンミックス信号を変換するように構成されている請求項1又は2に記載のデコーダ。
- 前記第1の分析モジュール(182)は、前記ダウンミックス信号を第1の分析ウインドウ長さに依存して変換するように構成され、前記第1の分析ウインドウ長さは前記信号特性に依存し、または、
前記第2の分析モジュール(183)は、前記起動指示が前記起動状態に設定されていると、前記第2の変換されたダウンミックスを、前記第1のサブバンドチャネルのうちの前記少なくとも1つを第2の分析ウインドウ長さに依存して変換することにより生成するように構成され、前記第2の分析ウインドウ長さは前記信号特性に依存する請求項1から3のいずれか一項に記載のデコーダ。 - 該デコーダは、前記ダウンミックス信号から、1つまたは複数のオーディオ出力チャネルを含む前記オーディオ出力信号を生成するように構成され、前記ダウンミックス信号は2つ以上のオーディオオブジェクト信号を符号化し、
前記制御ユニット(181)は、前記2つ以上のオーディオオブジェクト信号のうちの少なくとも1つの信号の前記信号特性に依存して前記起動指示を前記起動状態に設定するように構成され、かつ、
前記非混合ユニット(184)は、前記起動指示が前記起動状態に設定されていれば、前記オーディオ出力信号を得るために前記1つまたは複数のオーディオオブジェクト信号に関するパラメトリックサイド情報に基づいて前記第2の変換されたダウンミックスをアンミックスするように、かつ前記起動指示が前記起動状態に設定されていなければ、前記オーディオ出力信号を得るために前記2つ以上のオーディオオブジェクト信号に関する前記パラメトリックサイド情報に基づいて前記第1の変換されたダウンミックスをアンミックスするように構成されている請求項1から4のいずれか一項に記載のデコーダ。 - 入力されたオーディオオブジェクト信号を符号化するためのエンコーダであって、
前記入力されたオーディオオブジェクト信号の信号特性に依存して起動指示を起動状態に設定するための制御ユニット(191)と、
第1の変換されたオーディオオブジェクト信号を得るために、前記入力されたオーディオオブジェクト信号を変換するための第1の分析モジュール(192)であって、前記第1の変換されたオーディオオブジェクト信号は複数の第1のサブバンドチャネルを含む、第1の分析モジュール(192)と、
複数の第2のサブバンドチャネルを得るために、前記起動指示が前記起動状態に設定されていれば、前記複数の第1のサブバンドチャネルのうちの少なくとも1つを変換することによって第2の変換されたオーディオオブジェクト信号を生成するための第2の分析モジュール(193)であって、前記第2の変換されたオーディオオブジェクト信号は、前記第2の分析モジュールによって変換されていない前記第1のサブバンドチャネルと、前記第2のサブバンドチャネルとを含む、第2の分析モジュール(193)と、
PSI推定ユニット(194)と、を備え、
前記PSI推定ユニット(194)は、前記起動指示が前記起動状態に設定されていれば、前記第2の変換されたオーディオオブジェクト信号に基づいてパラメトリックサイド情報を決定し、かつ前記起動指示が前記起動状態に設定されていなければ、前記第1の変換されたオーディオオブジェクト信号に基づいて前記パラメトリックサイド情報を決定するように構成されており、
前記制御ユニット(191)は、前記入力されたオーディオオブジェクト信号が前記入力されたオーディオオブジェクト信号の信号変化を示す過渡を含むかどうかに依存して、前記起動指示を前記起動状態に設定するように構成されているエンコーダ。 - サブバンド変換指示が前記第1のサブバンドチャネルの各々へ割り当てられ、
前記制御ユニット(191)は、前記入力されたオーディオオブジェクト信号の前記信号特性に依存して、前記第1のサブバンドチャネルの各々のサブバンド変換指示をサブバンド変換状態に設定するように構成され、かつ、
前記第2の分析モジュール(193)は、その前記サブバンド変換指示が前記サブバンド変換状態に設定されている前記第1のサブバンドチャネルの各々を変換して前記複数の第2のサブバンドチャネルを取得するように、かつその前記サブバンド変換指示が前記サブバンド変換状態に設定されていない前記第1のサブバンドチャネルの各々を変換しないように構成されている請求項6に記載のエンコーダ。 - 前記第1の分析モジュール(192)は、前記入力されたオーディオオブジェクト信号の各々を、直交ミラーフィルタを使用することによって変換するように構成されている請求項6又は7に記載のエンコーダ。
- 前記第1の分析モジュール(192)は、前記入力されたオーディオオブジェクト信号を第1の分析ウインドウ長さに依存して変換するように構成され、前記第1の分析ウインドウ長さは前記信号特性に依存し、または、
前記第2の分析モジュール(193)は、前記起動指示が前記起動状態に設定されていると、前記第2の変換されたオーディオオブジェクト信号を、前記複数の第1のサブバンドチャネルのうちの少なくとも1つを第2の分析ウインドウ長さに依存して変換することにより生成するように構成され、前記第2の分析ウインドウ長さは前記信号特性に依存する、請求項6から8のいずれか一項に記載のエンコーダ。 - 該エンコーダは、前記入力されたオーディオオブジェクト信号および少なくとも1つのさらなる入力されたオーディオオブジェクト信号を符号化するように構成され、
前記制御ユニット(191)は、前記入力されたオーディオオブジェクト信号の前記信号特性に依存して、かつ前記少なくとも1つのさらなる入力されたオーディオオブジェクト信号の信号特性に依存して、前記起動指示を前記起動状態に設定するように構成され、
前記第1の分析モジュール(192)は、少なくとも1つのさらなる入力されたオーディオオブジェクト信号を変換して少なくとも1つのさらなる第1の変換されたオーディオオブジェクト信号を得るように構成され、前記少なくとも1つのさらなる第1の変換されたオーディオオブジェクト信号は、各々、複数の第1のサブバンドチャネルを含み、
前記第2の分析モジュール(193)は、複数のさらなる第2のサブバンドチャネルを得るために、前記起動指示が前記起動状態に設定されていれば、前記少なくとも1つのさらなる第1の変換されたオーディオオブジェクト信号のうちの少なくとも1つの信号の前記複数の第1のサブバンドチャネルのうちの少なくとも1つを変換するように構成され、かつ、
前記PSI推定ユニット(194)は、前記起動指示が前記起動状態に設定されていれば、前記複数のさらなる第2のサブバンドチャネルに基づいて前記パラメトリックサイド情報を決定するように構成されている請求項6から9のいずれか一項に記載のエンコーダ。 - ダウンミックス信号から1つまたは複数のオーディオ出力チャネルを含むオーディオ出力信号を生成することによって復号するための方法であって、前記ダウンミックス信号は2つ以上のオーディオオブジェクト信号を符号化し、
該方法は、
前記2つ以上のオーディオオブジェクト信号のうちの少なくとも1つの信号の信号特性に依存して起動指示を起動状態に設定することと、
複数の第1のサブバンドチャネルを含む第1の変換されたダウンミックスを得るために、前記ダウンミックス信号を変換することと、
複数の第2のサブバンドチャネルを得るために、前記起動指示が前記起動状態に設定されていれば、前記第1のサブバンドチャネルのうちの少なくとも1つを変換することによって第2の変換されたダウンミックスを生成することであって、前記第2の変換されたダウンミックスは、変換されていない前記第1のサブバンドチャネルと、前記第2のサブバンドチャネルとを含むことと、
前記起動指示が前記起動状態に設定されていれば、前記オーディオ出力信号を得るために前記2つ以上のオーディオオブジェクト信号に関するパラメトリックサイド情報に基づいて前記第2の変換されたダウンミックスをアンミックスし、かつ前記起動指示が前記起動状態に設定されていなければ、前記オーディオ出力信号を得るために前記2つ以上のオーディオオブジェクト信号に関する前記パラメトリックサイド情報に基づいて前記第1の変換されたダウンミックスをアンミックスすることを含み、
1つまたは複数のオーディオオブジェクト信号のうちの少なくとも1つが、前記1つまたは複数のオーディオオブジェクト信号のうちの少なくとも1つの信号の信号変化を示す過渡を含むかどうかに依存して、前記起動指示を前記起動状態に設定する、方法。 - 2つ以上の入力されたオーディオオブジェクト信号を符号化するための方法であって、
前記2つ以上の入力されたオーディオオブジェクト信号のうちの少なくとも1つの信号の信号特性に依存して起動指示を起動状態に設定することと、
前記入力されたオーディオオブジェクト信号の第1の変換されたオーディオオブジェクト信号を得るために、前記入力されたオーディオオブジェクト信号の各々を変換することであって、前記第1の変換されたオーディオオブジェクト信号は複数の第1のサブバンドチャネルを含むことと、
複数の第2のサブバンドチャネルを得るために、前記入力されたオーディオオブジェクト信号の各々について、前記起動指示が前記起動状態に設定されていれば、前記入力されたオーディオオブジェクト信号の前記第1の変換されたオーディオオブジェクト信号の前記第1のサブバンドチャネルのうちの少なくとも1つを変換することによって第2の変換されたオーディオオブジェクト信号を生成することであって、前記第2の変換されたダウンミックスは、変換されていない前記第1のサブバンドチャネルと、前記第2のサブバンドチャネルとを含むことと、
前記起動指示が前記起動状態に設定されていれば、前記入力されたオーディオオブジェクト信号の各々の前記第2の変換されたオーディオオブジェクト信号に基づいてパラメトリックサイド情報を決定し、かつ前記起動指示が前記起動状態に設定されていなければ、前記入力されたオーディオオブジェクト信号の各々の前記第1の変換されたオーディオオブジェクト信号に基づいて前記パラメトリックサイド情報を決定することを含み、
前記入力されたオーディオオブジェクト信号が前記入力されたオーディオオブジェクト信号の信号変化を示す過渡を含むかどうかに依存して、前記起動指示を前記起動状態に設定する、方法。 - コンピュータまたは信号プロセッサ上で実行されると、請求項11に記載の方法を実装するためのコンピュータプログラム。
- コンピュータまたは信号プロセッサ上で実行されると、請求項12に記載の方法を実装するためのコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261710133P | 2012-10-05 | 2012-10-05 | |
US61/710,133 | 2012-10-05 | ||
EP13167487.1A EP2717262A1 (en) | 2012-10-05 | 2013-05-13 | Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding |
EP13167487.1 | 2013-05-13 | ||
PCT/EP2013/070550 WO2014053547A1 (en) | 2012-10-05 | 2013-10-02 | Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015535959A JP2015535959A (ja) | 2015-12-17 |
JP6185592B2 true JP6185592B2 (ja) | 2017-08-23 |
Family
ID=48325509
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015535005A Active JP6185592B2 (ja) | 2012-10-05 | 2013-10-02 | 空間オーディオオブジェクト符号化における信号依存ズーム変換のためのエンコーダ、デコーダおよび方法 |
JP2015535006A Active JP6268180B2 (ja) | 2012-10-05 | 2013-10-02 | 空間オーディオオブジェクト符号化における時間/周波数分解能の後方互換性のある動的適応のためのエンコーダ、デコーダおよび方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015535006A Active JP6268180B2 (ja) | 2012-10-05 | 2013-10-02 | 空間オーディオオブジェクト符号化における時間/周波数分解能の後方互換性のある動的適応のためのエンコーダ、デコーダおよび方法 |
Country Status (17)
Country | Link |
---|---|
US (2) | US10152978B2 (ja) |
EP (4) | EP2717262A1 (ja) |
JP (2) | JP6185592B2 (ja) |
KR (2) | KR101685860B1 (ja) |
CN (2) | CN104798131B (ja) |
AR (2) | AR092928A1 (ja) |
AU (1) | AU2013326526B2 (ja) |
BR (2) | BR112015007649B1 (ja) |
CA (2) | CA2887028C (ja) |
ES (2) | ES2873977T3 (ja) |
HK (1) | HK1213361A1 (ja) |
MX (2) | MX350691B (ja) |
MY (1) | MY178697A (ja) |
RU (2) | RU2625939C2 (ja) |
SG (1) | SG11201502611TA (ja) |
TW (2) | TWI539444B (ja) |
WO (2) | WO2014053548A1 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2717262A1 (en) | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding |
EP2804176A1 (en) * | 2013-05-13 | 2014-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
CN110085240B (zh) | 2013-05-24 | 2023-05-23 | 杜比国际公司 | 包括音频对象的音频场景的高效编码 |
KR102243395B1 (ko) * | 2013-09-05 | 2021-04-22 | 한국전자통신연구원 | 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치 |
US20150100324A1 (en) * | 2013-10-04 | 2015-04-09 | Nvidia Corporation | Audio encoder performance for miracast |
CN106409303B (zh) | 2014-04-29 | 2019-09-20 | 华为技术有限公司 | 处理信号的方法及设备 |
CN105336335B (zh) | 2014-07-25 | 2020-12-08 | 杜比实验室特许公司 | 利用子带对象概率估计的音频对象提取 |
KR102088337B1 (ko) * | 2015-02-02 | 2020-03-13 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 인코딩된 오디오 신호를 프로세싱하기 위한 장치 및 방법 |
EP3067885A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
WO2017064264A1 (en) * | 2015-10-15 | 2017-04-20 | Huawei Technologies Co., Ltd. | Method and appratus for sinusoidal encoding and decoding |
GB2544083B (en) * | 2015-11-05 | 2020-05-20 | Advanced Risc Mach Ltd | Data stream assembly control |
US9711121B1 (en) * | 2015-12-28 | 2017-07-18 | Berggram Development Oy | Latency enhanced note recognition method in gaming |
US9640157B1 (en) * | 2015-12-28 | 2017-05-02 | Berggram Development Oy | Latency enhanced note recognition method |
US10269360B2 (en) * | 2016-02-03 | 2019-04-23 | Dolby International Ab | Efficient format conversion in audio coding |
US10210874B2 (en) * | 2017-02-03 | 2019-02-19 | Qualcomm Incorporated | Multi channel coding |
EP3566473B8 (en) | 2017-03-06 | 2022-06-15 | Dolby International AB | Integrated reconstruction and rendering of audio signals |
CN108694955B (zh) | 2017-04-12 | 2020-11-17 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
WO2018201112A1 (en) | 2017-04-28 | 2018-11-01 | Goodwin Michael M | Audio coder window sizes and time-frequency transformations |
CN109427337B (zh) * | 2017-08-23 | 2021-03-30 | 华为技术有限公司 | 立体声信号编码时重建信号的方法和装置 |
US10856755B2 (en) * | 2018-03-06 | 2020-12-08 | Ricoh Company, Ltd. | Intelligent parameterization of time-frequency analysis of encephalography signals |
TWI658458B (zh) * | 2018-05-17 | 2019-05-01 | 張智星 | 歌聲分離效能提升之方法、非暫態電腦可讀取媒體及電腦程式產品 |
GB2577885A (en) * | 2018-10-08 | 2020-04-15 | Nokia Technologies Oy | Spatial audio augmentation and reproduction |
KR20220025107A (ko) * | 2019-06-14 | 2022-03-03 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 매개변수 인코딩 및 디코딩 |
AU2021359779A1 (en) * | 2020-10-13 | 2023-06-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding a plurality of audio objects and apparatus and method for decoding using two or more relevant audio objects |
CN113453114B (zh) * | 2021-06-30 | 2023-04-07 | Oppo广东移动通信有限公司 | 编码控制方法、装置、无线耳机及存储介质 |
WO2023065254A1 (zh) * | 2021-10-21 | 2023-04-27 | 北京小米移动软件有限公司 | 一种信号编解码方法、装置、编码设备、解码设备及存储介质 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3175446B2 (ja) * | 1993-11-29 | 2001-06-11 | ソニー株式会社 | 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体 |
BRPI0304540B1 (pt) * | 2002-04-22 | 2017-12-12 | Koninklijke Philips N. V | Methods for coding an audio signal, and to decode an coded audio sign, encoder to codify an audio signal, codified audio sign, storage media, and, decoder to decode a coded audio sign |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
CN101246689B (zh) * | 2004-09-17 | 2011-09-14 | 广州广晟数码技术有限公司 | 音频编码*** |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
EP1906706B1 (en) * | 2005-07-15 | 2009-11-25 | Panasonic Corporation | Audio decoder |
US7917358B2 (en) | 2005-09-30 | 2011-03-29 | Apple Inc. | Transient detection by power weighted average |
EP1974348B1 (en) * | 2006-01-19 | 2013-07-24 | LG Electronics, Inc. | Method and apparatus for processing a media signal |
PL1999747T3 (pl) * | 2006-03-29 | 2017-05-31 | Koninklijke Philips N.V. | Dekodowanie audio |
MY145497A (en) * | 2006-10-16 | 2012-02-29 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
USRE50009E1 (en) * | 2006-10-25 | 2024-06-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
JP5161893B2 (ja) * | 2007-03-16 | 2013-03-13 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
KR101422745B1 (ko) * | 2007-03-30 | 2014-07-24 | 한국전자통신연구원 | 다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법 |
ES2593822T3 (es) * | 2007-06-08 | 2016-12-13 | Lg Electronics Inc. | Método y aparato para procesar una señal de audio |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
WO2010105695A1 (en) * | 2009-03-20 | 2010-09-23 | Nokia Corporation | Multi channel audio coding |
KR101387808B1 (ko) * | 2009-04-15 | 2014-04-21 | 한국전자통신연구원 | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
CN102460573B (zh) * | 2009-06-24 | 2014-08-20 | 弗兰霍菲尔运输应用研究公司 | 音频信号译码器、对音频信号译码的方法 |
KR101805212B1 (ko) * | 2009-08-14 | 2017-12-05 | 디티에스 엘엘씨 | 객체-지향 오디오 스트리밍 시스템 |
KR20110018107A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
WO2011048067A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Apparatus for providing an upmix signal representation on the basis of a downmix signal representation, apparatus for providing a bitstream representing a multichannel audio signal, methods, computer program and bitstream using a distortion control signaling |
MY154641A (en) * | 2009-11-20 | 2015-07-15 | Fraunhofer Ges Forschung | Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear cimbination parameter |
EP2537350A4 (en) * | 2010-02-17 | 2016-07-13 | Nokia Technologies Oy | PROCESSING AN AUDIO RECORDING OF MULTIPLE DEVICES |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法***及瞬态信号可分层编解码方法 |
EP2717262A1 (en) | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding |
-
2013
- 2013-05-13 EP EP13167487.1A patent/EP2717262A1/en not_active Withdrawn
- 2013-05-13 EP EP13167481.4A patent/EP2717265A1/en not_active Withdrawn
- 2013-10-02 BR BR112015007649-1A patent/BR112015007649B1/pt active IP Right Grant
- 2013-10-02 ES ES13776987T patent/ES2873977T3/es active Active
- 2013-10-02 KR KR1020157011739A patent/KR101685860B1/ko active IP Right Grant
- 2013-10-02 RU RU2015116645A patent/RU2625939C2/ru active
- 2013-10-02 CA CA2887028A patent/CA2887028C/en active Active
- 2013-10-02 EP EP13774118.7A patent/EP2904611B1/en active Active
- 2013-10-02 WO PCT/EP2013/070551 patent/WO2014053548A1/en active Application Filing
- 2013-10-02 CN CN201380052362.9A patent/CN104798131B/zh active Active
- 2013-10-02 MX MX2015004018A patent/MX350691B/es active IP Right Grant
- 2013-10-02 EP EP13776987.3A patent/EP2904610B1/en active Active
- 2013-10-02 JP JP2015535005A patent/JP6185592B2/ja active Active
- 2013-10-02 BR BR112015007650-5A patent/BR112015007650B1/pt active IP Right Grant
- 2013-10-02 MX MX2015004019A patent/MX351359B/es active IP Right Grant
- 2013-10-02 CN CN201380052368.6A patent/CN105190747B/zh active Active
- 2013-10-02 AU AU2013326526A patent/AU2013326526B2/en active Active
- 2013-10-02 WO PCT/EP2013/070550 patent/WO2014053547A1/en active Application Filing
- 2013-10-02 RU RU2015116287A patent/RU2639658C2/ru active
- 2013-10-02 JP JP2015535006A patent/JP6268180B2/ja active Active
- 2013-10-02 SG SG11201502611TA patent/SG11201502611TA/en unknown
- 2013-10-02 CA CA2886999A patent/CA2886999C/en active Active
- 2013-10-02 KR KR1020157011782A patent/KR101689489B1/ko active IP Right Grant
- 2013-10-02 MY MYPI2015000807A patent/MY178697A/en unknown
- 2013-10-02 ES ES13774118T patent/ES2880883T3/es active Active
- 2013-10-04 TW TW102136012A patent/TWI539444B/zh active
- 2013-10-04 TW TW102136014A patent/TWI541795B/zh active
- 2013-10-07 AR ARP130103630A patent/AR092928A1/es active IP Right Grant
- 2013-10-07 AR ARP130103631A patent/AR092929A1/es active IP Right Grant
-
2015
- 2015-03-27 US US14/671,928 patent/US10152978B2/en active Active
- 2015-04-03 US US14/678,667 patent/US9734833B2/en active Active
-
2016
- 2016-02-05 HK HK16101374.6A patent/HK1213361A1/zh unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6185592B2 (ja) | 空間オーディオオブジェクト符号化における信号依存ズーム変換のためのエンコーダ、デコーダおよび方法 | |
JP6285939B2 (ja) | 後方互換性のある多重分解能空間オーディオオブジェクト符号化のためのエンコーダ、デコーダおよび方法 | |
JP6289613B2 (ja) | オブジェクト特有時間/周波数分解能を使用する混合信号からのオーディオオブジェクト分離 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160719 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20161005 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20161005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170727 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6185592 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |