JP6479786B2 - オーディオ信号のパラメトリック再構成 - Google Patents
オーディオ信号のパラメトリック再構成 Download PDFInfo
- Publication number
- JP6479786B2 JP6479786B2 JP2016524490A JP2016524490A JP6479786B2 JP 6479786 B2 JP6479786 B2 JP 6479786B2 JP 2016524490 A JP2016524490 A JP 2016524490A JP 2016524490 A JP2016524490 A JP 2016524490A JP 6479786 B2 JP6479786 B2 JP 6479786B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- matrix
- upmix
- downmix
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 219
- 239000011159 matrix material Substances 0.000 claims description 282
- 238000000034 method Methods 0.000 claims description 75
- 238000013507 mapping Methods 0.000 claims description 73
- 238000004590 computer program Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000011664 signaling Effects 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 6
- 230000000875 corresponding effect Effects 0.000 description 22
- 230000005540 biological transmission Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/005—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo five- or more-channel type, e.g. virtual surround
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
Description
本願は2013年10月21日に出願された米国仮特許出願第61/893,770号;2014年4月3日に出願された米国仮特許出願第61/974,544号;および2014年8月15日に出願された米国仮特許出願第62/037,693号の優先権を主張するものである。各出願の内容はここに参照によってその全体において組み込まれる。
本稿に開示される発明は概括的にはオーディオ信号のエンコードおよびデコードに、特にダウンミックス信号および関連するメタデータからのマルチチャネル・オーディオ信号のパラメトリック再構成に関する。
第一の側面によれば、例示的実施形態は、オーディオ信号を再構成するためのオーディオ・デコード・システムならびに方法およびコンピュータ・プログラム・プロダクトを提案する。該第一の側面に基づく提案されるデコード・システム、方法およびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもつことがある。
図3および図4を参照して記述されるエンコーダ側では、Nチャネル・オーディオ信号X=[x1…xN]Tの線形マッピングとして、
CYYT=XYT (4)
を解くことによって、まず最小二乗の意味で可能な最良の「ドライ」アップミックス
ΔR=PPT‖Y‖2 (6)
と因子分解できる。
a.コレスキー分解(下三角行列HRにつながる);
b.正の平方根(対称的な準正定値のHRにつながる);または
c.ポーラー(polar)(Oは直交行列、Λは対角行列であるとして、HR=OΛの形のHNにつながる)
を用いることによって得られてもよい。
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
いくつかの態様を記載しておく。
〔態様1〕
Nチャネル・オーディオ信号を再構成するための方法であって、N≧3であり、当該方法は:
単一チャネル・ダウンミックス信号を、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階と;
ドライ・アップミックス信号を、前記ダウンミックス信号の線形マッピングとして計算する段階であって、ドライ・アップミックス係数の集合が前記ダウンミックス信号に適用される、段階と;
前記ダウンミックス信号に基づいて(N−1)チャネルの脱相関信号を生成する段階と;
ウェット・アップミックス信号を、前記脱相関信号の線形マッピングとして計算する段階であって、ウェット・アップミックス係数の集合が前記脱相関信号の諸チャネルに適用される、段階と;
前記ドライ・アップミックス信号および前記ウェット・アップミックス信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する多次元の再構成された信号を得る段階とを含み、当該方法はさらに:
受領されたドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の前記集合を決定する段階と;
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ中間行列に値を入れる段階であって、前記受領されたウェット・アップミックス・パラメータおよび該中間行列があらかじめ定義された行列クラスに属することを知っていることに基づく、段階と;
前記中間行列にあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の前記集合を得る段階とを含み、前記ウェット・アップミックス係数の前記集合は前記乗算から帰結する行列に対応し、前記中間行列の要素の数より多い係数を含む、
方法。
〔態様2〕
前記ウェット・アップミックス・パラメータを受領する段階は、N(N−1)/2個のウェット・アップミックス・パラメータを受領することを含み、
前記中間行列に値を入れることは、受領されたN(N−1)/2個のウェット・アップミックス・パラメータおよび前記中間行列が前記あらかじめ定義された行列クラスに属することを知っていることに基づいて、(N−1) 2 個の行列要素についての値を得ることを含み、
前記あらかじめ定義された行列はN(N−1)個の要素を含み、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、
態様1記載の方法。
〔態様3〕
前記中間行列に値を入れることは、受領されたウェット・アップミックス・パラメータを前記中間行列における要素として用いることを含む、態様1または2記載の方法。
〔態様4〕
前記ドライ・アップミックス・パラメータを受領する段階は、(N−1)個のドライ・アップミックス・パラメータを受領することを含み、ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス係数の前記集合は、受領された(N−1)個のドライ・アップミックス・パラメータに基づき、かつドライ・アップミックス係数の前記集合内の係数間のあらかじめ定義された関係に基づいて決定される、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
前記あらかじめ定義された行列クラスは:
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が0であることを含む、下三角行列または上三角行列;
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が等しいことを含む、
対称行列;および
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素の間の既知の関係を含む、直交行列と対角行列の積
のうちの一つである、態様1ないし4のうちいずれか一項記載の方法。
〔態様6〕
前記ダウンミックス信号は、あらかじめ定義された規則に従って、再構成されるべき前記Nチャネル・オーディオ信号の線形マッピングとして取得可能であり、前記あらかじめ定義された規則は、あらかじめ定義されたダウンミックス動作を定義し、前記あらかじめ定義された行列は、前記あらかじめ定義されたダウンミックス動作のカーネル空間を張るベクトルに基づく、態様1ないし5のうちいずれか一項記載の方法。
〔態様7〕
前記単一チャネル・ダウンミックス信号を関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階は、前記ダウンミックス信号の時間セグメントまたは時間/周波数タイルを、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領することを含み、前記多次元の再構成された信号は、再構成されるべき前記Nチャネル・オーディオ信号の時間セグメントまたは時間/周波数タイルに対応する、態様1ないし6のうちいずれか一項記載の方法。
〔態様8〕
第一の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてNチャネル・オーディオ信号を再構成するよう構成された第一のパラメトリック再構成部を有するオーディオ・デコード・システムであって、N≧3であり、前記第一のパラメトリック再構成部は:
前記第一のダウンミックス信号を受領して、それに基づいて第一の(N−1)チャネル脱相関信号を出力するよう構成された第一の脱相関部と;
第一のドライ・アップミックス部であって、
前記ドライ・アップミックス・パラメータおよび前記ダウンミックス信号を受領し;
前記ドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の第一の集合を決定し;
前記第一のダウンミックス信号をドライ・アップミックス係数の前記第一の集合に基づいて線形にマッピングすることによって計算される第一のドライ・アップミックス信号を出力するよう構成されている、第一のドライ・アップミックス部と;
第一のウェット・アップミックス部であって、
前記ウェット・アップミックス・パラメータおよび前記第一の脱相関信号を受領する段階と;
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ第一の中間行列に値を入れる段階であって、受領されたウェット・アップミックス・パラメータおよび前記第一の中間行列が第一のあらかじめ定義された行列クラスに属していると知っていることに基づく、段階と;
前記第一の中間行列に第一のあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の第一の集合を得る段階であって、ウェット・アップミックス係数の前記第一の集合は前記乗算から帰結する行列に対応し、前記第一の中間行列の要素の数より多い係数を含む、段階と;
前記第一の脱相関信号をウェット・アップミックス係数の前記第一の集合に従って線形にマッピングすることによって計算された第一のウェット・アップミックス信号を出力する段階とを実行するよう構成されている第一のウェット・アップミックス部と;
前記第一のドライ・アップミックス信号および前記第一のウェット・アップミックス信号を受領し、これらの信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する第一の多次元の再構成された信号を得るよう構成された第一の組み合わせ部を有する、
オーディオ・デコード・システム。
〔態様9〕
前記第一のパラメトリック再構成部とは独立に動作可能であり、第二の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてN 2 チャネル・オーディオ信号を再構成するよう構成された第二のパラメトリック再構成部をさらに有しており、N 2 ≧2であり、前記第二のパラメトリック再構成部は、第二の脱相関部、第二のドライ・アップミックス部、第二のウェット・アップミックス部および第二の組み合わせ部を有しており、前記第二のパラメトリック再構成部のこれらの部は、前記第一のパラメトリック再構成部の対応する各部と類似の構成であり、前記第二のウェット・アップミックス部は、第二のあらかじめ定義された行列クラスに属する第二の中間行列および第二のあらかじめ定義された行列を用いるよう構成されている、態様8記載のオーディオ・デコード・システム。
〔態様10〕
当該オーディオ・デコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてマルチチャネル・オーディオ信号を再構成するよう適応されており、当該オーディオ・デコード・システムは:
それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてオーディオ信号チャネルのそれぞれの集合を独立して再構成するよう動作可能なパラメトリック再構成部を含む複数の再構成部と;
前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルのいくつかについてはそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを示す信号伝達を受領するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれの関連付けられたウェット・アップミックス・パラメータに基づいてチャネルの前記それぞれの集合のうち少なくともいくつかの集合に関連付けられたウェット・アップミックス係数を得るためのあらかじめ定義された行列の集合にさらに対応する、制御部とを有しており、
当該デコード・システムは、前記受領された信号伝達が第一の符号化フォーマットを示すことに応答して、前記複数の再構成部の第一の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されており、当該デコード・システムは、前記受領された信号伝達が第二の符号化フォーマットを示すことに応答して、前記複数の再構成部の第二の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されていており、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック再構成部を含む、
態様8または9記載のオーディオ・デコード・システム。
〔態様11〕
前記複数の再構成部は、高々単一のオーディオ・チャネルがエンコードされたダウンミックス・チャネルに基づいて単一のオーディオ・チャネルを独立して再構成するよう動作可能な単一チャネル再構成部を含み、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル再構成部を有する、態様10記載のオーディオ・デコード・システム。
〔態様12〕
前記第一の符号化フォーマットは、前記第二の符号化フォーマットより、少数のダウンミックス・チャネルからの前記マルチチャネル・オーディオ信号の再構成に対応する、態様10または11記載のオーディオ・デコード・システム。
〔態様13〕
Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードする方法であって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される(N−1)チャネルの脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、当該方法は:
前記オーディオ信号を受領する段階と;
あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算する段階と;
前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定する段階と;
受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定する段階であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、段階と;
ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力する段階であって、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもち、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義される、段階とを含む、
方法。
〔態様14〕
前記中間行列を決定する段階が、ウェット・アップミックス係数の前記集合によって定義される、前記脱相関信号の前記線形マッピングによって得られる信号の共分散が、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差を近似するよう、前記中間行列を決定することを含む、態様13記載の方法。
〔態様15〕
前記ウェット・アップミックス・パラメータを出力する段階は、高々N(N−1)/2個のウェット・アップミックス・パラメータを出力することを含み、前記中間行列は(N−1) 2 個の行列要素を有し、前記中間行列が前記あらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、態様13または14記載の方法。
〔態様16〕
ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス・パラメータを出力することは、高々(N−1)個のドライ・アップミックス・パラメータを出力することを含み、ドライ・アップミックス係数の前記集合は、前記(N−1)個のドライ・アップミックス・パラメータから、前記あらかじめ定義された規則を使って導出可能である、態様13ないし15のうちいずれか一項記載の方法。
〔態様17〕
ドライ・アップミックス係数の決定された集合は、前記オーディオ信号の最小平均平方誤差近似に対応する前記ダウンミックス信号の線形マッピングを定義する、態様13ないし16のうちいずれか一項記載の方法。
〔態様18〕
Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードするよう構成されたパラメトリック・エンコード部を有するオーディオ・エンコード・システムであって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される(N−1)チャネルの脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、前記パラメトリック・エンコード部は:
前記オーディオ信号を受領し、あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算するよう構成されたダウンミックス部と;
前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定するよう構成された第一の解析部と;
受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定するよう構成されている第二の解析部であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、第二の解析部とを有しており、
前記パラメトリック・エンコード部は、ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力するよう構成されており、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもり、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義される、
オーディオ・エンコード・システム。
〔態様19〕
当該オーディオ・エンコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータの形でマルチチャネル・オーディオ信号の表現を提供するよう適応されており、当該オーディオ・エンコード・システムは:
それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたアップミックス・パラメータを、オーディオ信号チャネルのそれぞれの集合に基づいて独立して計算するよう動作可能なパラメトリック・エンコード部を含む複数のエンコード部と;
前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルの少なくともいくつかについてはそれぞれの関連付けられたアップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを決定するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれのダウンミックス・チャネルのうちの少なくともいくつかを計算するためのあらかじめ定義された規則の集合に対応する、制御部とを有しており、
当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第一の符号化フォーマットであることに応答して、前記複数のエンコード部の第一の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されており、当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第二の符号化フォーマットであることに応答して、前記複数のエンコード部の第二の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されており、前記エンコード部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック・エンコード部を含む、
態様18記載のオーディオ・エンコード・システム。
〔態様20〕
前記複数のエンコード部は、高々単一のオーディオ・チャネルをダウンミックス・チャネルにおいて独立してエンコードするよう動作可能な単一チャネル・エンコード部を含み、前記エンコード部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル・エンコード部を含む、態様19記載のオーディオ・エンコード・システム。
〔態様21〕
態様1ないし7および13ないし17のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様22〕
N=3またはN=4である、態様1ないし7および13ないし17のうちいずれか一項記載の方法、態様8ないし12のうちいずれか一項記載のオーディオ・デコード・システム、態様18ないし20のうちいずれか一項記載のオーディオ・エンコード・システムまたは態様21記載のコンピュータ・プログラム・プロダクト。
Claims (22)
- Nチャネル・オーディオ信号を再構成するための方法であって、N≧3であり、当該方法は:
単一チャネル・ダウンミックス信号を、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階と;
ドライ・アップミックス信号を、前記ダウンミックス信号の線形マッピングとして計算する段階であって、ドライ・アップミックス係数の集合が前記ダウンミックス信号に適用される、段階と;
前記ダウンミックス信号に基づいて脱相関信号を生成する段階であって、前記脱相関信号は(N−1)個のチャネルをもつ、段階と;
ウェット・アップミックス信号を、前記脱相関信号の前記(N−1)個のチャネルの線形マッピングとして計算する段階であって、ウェット・アップミックス係数の集合が前記脱相関信号の諸チャネルに適用される、段階と;
前記ドライ・アップミックス信号および前記ウェット・アップミックス信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する多次元の再構成された信号を得る段階とを含み、当該方法はさらに:
受領されたドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の前記集合を決定する段階と;
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ中間行列に、前記受領されたウェット・アップミックス・パラメータおよび該中間行列があらかじめ定義された行列クラスに属することを知っていることに基づいて値を入れる段階であって、前記あらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、段階と;
前記中間行列にあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の前記集合を得る段階とを含み、前記ウェット・アップミックス係数の前記集合は前記乗算から帰結する行列に対応し、前記中間行列の要素の数より多い係数を含む、
方法。 - 前記ウェット・アップミックス・パラメータを受領する段階は、N(N−1)/2個のウェット・アップミックス・パラメータを受領することを含み、
前記中間行列に値を入れることは、受領されたN(N−1)/2個のウェット・アップミックス・パラメータおよび前記中間行列が前記あらかじめ定義された行列クラスに属することを知っていることに基づいて、(N−1)2個の行列要素についての値を得ることを含み、
前記あらかじめ定義された行列はN(N−1)個の要素を含み、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、
請求項1記載の方法。 - 前記中間行列に値を入れることは、受領されたウェット・アップミックス・パラメータを前記中間行列における要素として用いることを含む、請求項1または2記載の方法。
- 前記ドライ・アップミックス・パラメータを受領する段階は、(N−1)個のドライ・アップミックス・パラメータを受領することを含み、ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス係数の前記集合は、受領された(N−1)個のドライ・アップミックス・パラメータに基づき、かつドライ・アップミックス係数の前記集合内の係数間のあらかじめ定義された関係に基づいて決定される、請求項1ないし3のうちいずれか一項記載の方法。
- 前記あらかじめ定義された行列クラスは:
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が0であることを含む、下三角行列または上三角行列;
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素が等しいことを含む、
対称行列;および
クラス内のすべての行列の既知の属性があらかじめ定義された行列要素の間の既知の関係を含む、直交行列と対角行列の積
のうちの一つである、請求項1ないし4のうちいずれか一項記載の方法。 - 前記ダウンミックス信号は、あらかじめ定義された規則に従って、再構成されるべき前記Nチャネル・オーディオ信号の線形マッピングとして取得可能であり、前記あらかじめ定義された規則は、あらかじめ定義されたダウンミックス動作を定義し、前記あらかじめ定義された行列は、前記あらかじめ定義されたダウンミックス動作のカーネル空間を張るベクトルに基づく、請求項1ないし5のうちいずれか一項記載の方法。
- 前記単一チャネル・ダウンミックス信号を関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領する段階は、前記ダウンミックス信号の時間セグメントまたは時間/周波数タイルを、関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に受領することを含み、前記多次元の再構成された信号は、再構成されるべき前記Nチャネル・オーディオ信号の時間セグメントまたは時間/周波数タイルに対応する、請求項1ないし6のうちいずれか一項記載の方法。
- 第一の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてNチャネル・オーディオ信号を再構成するよう構成された第一のパラメトリック再構成部を有するオーディオ・デコード・システムであって、N≧3であり、前記第一のパラメトリック再構成部は:
前記第一のダウンミックス信号を受領して、それに基づいて(N−1)個のチャネルをもつ第一の脱相関信号を出力するよう構成された第一の脱相関部と;
第一のドライ・アップミックス部であって、
前記ドライ・アップミックス・パラメータおよび前記ダウンミックス信号を受領し;
前記ドライ・アップミックス・パラメータに基づいてドライ・アップミックス係数の第一の集合を決定し;
前記第一のダウンミックス信号をドライ・アップミックス係数の前記第一の集合に基づいて線形にマッピングすることによって計算される第一のドライ・アップミックス信号を出力するよう構成されている、第一のドライ・アップミックス部と;
第一のウェット・アップミックス部であって、
前記ウェット・アップミックス・パラメータおよび前記第一の脱相関信号を受領する段階と;
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ第一の中間行列に、受領されたウェット・アップミックス・パラメータおよび前記第一の中間行列が第一のあらかじめ定義された行列クラスに属していると知っていることに基づいて値を入れる段階であって、前記第一のあらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、段階と;
前記第一の中間行列に第一のあらかじめ定義された行列を乗算することによってウェット・アップミックス係数の第一の集合を得る段階であって、ウェット・アップミックス係数の前記第一の集合は前記乗算から帰結する行列に対応し、前記第一の中間行列の要素の数より多い係数を含む、段階と;
前記第一の脱相関信号の前記(N−1)個のチャネルをウェット・アップミックス係数の前記第一の集合に従って線形にマッピングすることによって計算された第一のウェット・アップミックス信号を出力する段階とを実行するよう構成されている第一のウェット・アップミックス部と;
前記第一のドライ・アップミックス信号および前記第一のウェット・アップミックス信号を受領し、これらの信号を組み合わせて、再構成されるべき前記Nチャネル・オーディオ信号に対応する第一の多次元の再構成された信号を得るよう構成された第一の組み合わせ部を有する、
オーディオ・デコード・システム。 - 前記第一のパラメトリック再構成部とは独立に動作可能であり、第二の単一チャネル・ダウンミックス信号および関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてN2チャネル・オーディオ信号を再構成するよう構成された第二のパラメトリック再構成部をさらに有しており、N2≧2であり、前記第二のパラメトリック再構成部は、第二の脱相関部、第二のドライ・アップミックス部、第二のウェット・アップミックス部および第二の組み合わせ部を有しており、前記第二のパラメトリック再構成部のこれらの部は、前記第一のパラメトリック再構成部の対応する各部と類似の構成であり、前記第二のウェット・アップミックス部は、第二のあらかじめ定義された行列クラスに属する第二の中間行列および第二のあらかじめ定義された行列を用いるよう構成されており、前記第二のあらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、請求項8記載のオーディオ・デコード・システム。
- 当該オーディオ・デコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータに基づいてマルチチャネル・オーディオ信号を再構成するよう適応されており、当該オーディオ・デコード・システムは:
それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェットのアップミックス・パラメータに基づいてオーディオ信号チャネルのそれぞれの集合を独立して再構成するよう動作可能なパラメトリック再構成部を含む複数の再構成部と;
前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルのいくつかについてはそれぞれの関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを示す信号伝達を受領するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれの関連付けられたウェット・アップミックス・パラメータに基づいてチャネルの前記それぞれの集合のうち少なくともいくつかの集合に関連付けられたウェット・アップミックス係数を得るためのあらかじめ定義された行列の集合にさらに対応する、制御部とを有しており、
当該デコード・システムは、前記受領された信号伝達が第一の符号化フォーマットを示すことに応答して、前記複数の再構成部の第一の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されており、当該デコード・システムは、前記受領された信号伝達が第二の符号化フォーマットを示すことに応答して、前記複数の再構成部の第二の部分集合を使って前記マルチチャネル・オーディオ信号を再構成するよう構成されていており、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記第一のパラメトリック再構成部を含む、
請求項8または9記載のオーディオ・デコード・システム。 - 前記複数の再構成部は、高々単一のオーディオ・チャネルがエンコードされたダウンミックス・チャネルに基づいて単一のオーディオ・チャネルを独立して再構成するよう動作可能な単一チャネル再構成部を含み、前記再構成部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル再構成部を有する、請求項10記載のオーディオ・デコード・システム。
- 前記第一の符号化フォーマットは、前記第二の符号化フォーマットより、少数のダウンミックス・チャネルからの前記マルチチャネル・オーディオ信号の再構成に対応する、請求項10または11記載のオーディオ・デコード・システム。
- Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードする方法であって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、前記脱相関信号は(N−1)個のチャネルをもち、当該方法は:
前記オーディオ信号を受領する段階と;
あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算する段階と;
前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定する段階と;
受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定する段階であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の前記(N−1)個のチャネルの線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、段階と;
ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力する段階であって、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもち、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、前記あらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、段階とを含む、
方法。 - 前記中間行列を決定する段階が、ウェット・アップミックス係数の前記集合によって定義される、前記脱相関信号の前記線形マッピングによって得られる信号の共分散が、受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差を近似するよう、前記中間行列を決定することを含む、請求項13記載の方法。
- 前記ウェット・アップミックス・パラメータを出力する段階は、高々N(N−1)/2個のウェット・アップミックス・パラメータを出力することを含み、前記中間行列は(N−1)2個の行列要素を有し、前記中間行列が前記あらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、ウェット・アップミックス係数の前記集合はN(N−1)個の係数を含む、請求項13または14記載の方法。
- ドライ・アップミックス係数の前記集合はN個の係数を含み、ドライ・アップミックス・パラメータを出力することは、高々(N−1)個のドライ・アップミックス・パラメータを出力することを含み、ドライ・アップミックス係数の前記集合は、前記(N−1)個のドライ・アップミックス・パラメータから、前記あらかじめ定義された規則を使って導出可能である、請求項13ないし15のうちいずれか一項記載の方法。
- ドライ・アップミックス係数の決定された集合は、前記オーディオ信号の最小平均平方誤差近似に対応する前記ダウンミックス信号の線形マッピングを定義する、請求項13ないし16のうちいずれか一項記載の方法。
- Nチャネル・オーディオ信号を単一チャネル・ダウンミックス信号およびメタデータとしてエンコードするよう構成されたパラメトリック・エンコード部を有するオーディオ・エンコード・システムであって、前記メタデータは、該ダウンミックス信号および該ダウンミックス信号に基づいて決定される脱相関信号からの前記オーディオ信号のパラメトリック再構成のために好適なものであり、N≧3であり、前記脱相関信号は(N−1)個のチャネルをもち、前記パラメトリック・エンコード部は:
前記オーディオ信号を受領し、あらかじめ定義された規則に従って、前記単一チャネル・ダウンミックス信号を前記オーディオ信号の線形マッピングとして計算するよう構成されたダウンミックス部と;
前記オーディオ信号を近似する前記ダウンミックス信号の線形マッピングを定義するためのドライ・アップミックス係数の集合を決定するよう構成された第一の解析部と;
受領された前記オーディオ信号の共分散と前記ダウンミックス信号の前記線形マッピングによって近似される前記オーディオ信号の共分散との間の差に基づいて中間行列を決定するよう構成されている第二の解析部であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記オーディオ信号のパラメトリック再構成の一部として前記脱相関信号の前記(N−1)個のチャネルの線形マッピングを定義するウェット・アップミックス係数の集合に対応し、ウェット・アップミックス係数の前記集合は、前記中間行列の要素の数より多くの係数を含む、第二の解析部とを有しており、
前記パラメトリック・エンコード部は、ドライ・アップミックス係数の前記集合が導出可能であるもとになるドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータと一緒に前記ダウンミックス信号を出力するよう構成されており、前記中間行列は出力ウェット・アップミックス・パラメータの数より多くの要素をもち、前記中間行列は、該中間行列があらかじめ定義された行列クラスに属する限り、前記出力ウェット・アップミックス・パラメータによって一意的に定義され、前記あらかじめ定義された行列クラス内のすべての行列の既知の属性が、あらかじめ定義された行列要素の間の既知の関係またはあらかじめ定義された行列要素が0であることを含む、
オーディオ・エンコード・システム。 - 当該オーディオ・エンコード・システムは、複数のダウンミックス・チャネルおよび関連付けられたドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータの形でマルチチャネル・オーディオ信号の表現を提供するよう適応されており、当該オーディオ・エンコード・システムは:
それぞれのダウンミックス・チャネルおよびそれぞれの関連付けられたアップミックス・パラメータを、オーディオ信号チャネルのそれぞれの集合に基づいて独立して計算するよう動作可能なパラメトリック・エンコード部を含む複数のエンコード部と;
前記マルチチャネル・オーディオ信号のチャネルの、それぞれのダウンミックス・チャネルおよび少なくとも該ダウンミックス・チャネルの少なくともいくつかについてはそれぞれの関連付けられたアップミックス・パラメータによって表わされるチャネルの諸集合への分割に対応する、前記マルチチャネル・オーディオ信号の符号化フォーマットを決定するよう構成された制御部であって、前記符号化フォーマットはさらに、それぞれのダウンミックス・チャネルのうちの少なくともいくつかを計算するためのあらかじめ定義された規則の集合に対応する、制御部とを有しており、
当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第一の符号化フォーマットであることに応答して、前記複数のエンコード部の第一の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されており、当該オーディオ・エンコード・システムは、決定された符号化フォーマットが第二の符号化フォーマットであることに応答して、前記複数のエンコード部の第二の部分集合を使って前記マルチチャネル・オーディオ信号をエンコードするよう構成されている、
請求項18記載のオーディオ・エンコード・システム。 - 前記複数のエンコード部は、高々単一のオーディオ・チャネルをダウンミックス・チャネルにおいて独立してエンコードするよう動作可能な単一チャネル・エンコード部を含み、前記複数のエンコード部の前記第一および第二の部分集合の少なくとも一方は、前記単一チャネル・エンコード部を含む、請求項19記載のオーディオ・エンコード・システム。
- コンピュータに請求項1ないし7のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
- コンピュータに請求項13ないし17のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361893770P | 2013-10-21 | 2013-10-21 | |
US61/893,770 | 2013-10-21 | ||
US201461974544P | 2014-04-03 | 2014-04-03 | |
US61/974,544 | 2014-04-03 | ||
US201462037693P | 2014-08-15 | 2014-08-15 | |
US62/037,693 | 2014-08-15 | ||
PCT/EP2014/072570 WO2015059153A1 (en) | 2013-10-21 | 2014-10-21 | Parametric reconstruction of audio signals |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016537669A JP2016537669A (ja) | 2016-12-01 |
JP2016537669A5 JP2016537669A5 (ja) | 2017-11-24 |
JP6479786B2 true JP6479786B2 (ja) | 2019-03-06 |
Family
ID=51845388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016524490A Active JP6479786B2 (ja) | 2013-10-21 | 2014-10-21 | オーディオ信号のパラメトリック再構成 |
Country Status (9)
Country | Link |
---|---|
US (6) | US9978385B2 (ja) |
EP (1) | EP3061089B1 (ja) |
JP (1) | JP6479786B2 (ja) |
KR (4) | KR102244379B1 (ja) |
CN (3) | CN111192592B (ja) |
BR (1) | BR112016008817B1 (ja) |
ES (1) | ES2660778T3 (ja) |
RU (1) | RU2648947C2 (ja) |
WO (1) | WO2015059153A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG11201602628TA (en) | 2013-10-21 | 2016-05-30 | Dolby Int Ab | Decorrelator structure for parametric reconstruction of audio signals |
US9955276B2 (en) | 2014-10-31 | 2018-04-24 | Dolby International Ab | Parametric encoding and decoding of multichannel audio signals |
TWI587286B (zh) | 2014-10-31 | 2017-06-11 | 杜比國際公司 | 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體 |
US9986363B2 (en) | 2016-03-03 | 2018-05-29 | Mach 1, Corp. | Applications and format for immersive spatial sound |
CN106851489A (zh) * | 2017-03-23 | 2017-06-13 | 李业科 | 在小房间摆放多声道音箱的方法 |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
ES2965741T3 (es) | 2017-07-28 | 2024-04-16 | Fraunhofer Ges Forschung | Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha |
JP7107727B2 (ja) * | 2018-04-17 | 2022-07-27 | シャープ株式会社 | 音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体 |
CN111696625A (zh) * | 2020-04-21 | 2020-09-22 | 天津金域医学检验实验室有限公司 | 一种fish室荧光计数*** |
CA3240986A1 (en) | 2021-12-20 | 2023-06-29 | Dolby International Ab | Ivas spar filter bank in qmf domain |
WO2024073401A2 (en) * | 2022-09-30 | 2024-04-04 | Sonos, Inc. | Home theatre audio playback with multichannel satellite playback devices |
WO2024097485A1 (en) | 2022-10-31 | 2024-05-10 | Dolby Laboratories Licensing Corporation | Low bitrate scene-based audio coding |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6111958A (en) * | 1997-03-21 | 2000-08-29 | Euphonics, Incorporated | Audio spatial enhancement apparatus and methods |
CN1307853C (zh) * | 2000-08-31 | 2007-03-28 | 杜比实验特许公司 | 音频矩阵解码设备的方法 |
CA3026283C (en) * | 2001-06-14 | 2019-04-09 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
SE0402651D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
SE0402649D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods of creating orthogonal signals |
WO2006079086A2 (en) | 2005-01-24 | 2006-07-27 | Thx, Ltd. | Ambient and direct surround sound system |
DE102005010057A1 (de) | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms |
KR101271069B1 (ko) * | 2005-03-30 | 2013-06-04 | 돌비 인터네셔널 에이비 | 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법 |
WO2006108543A1 (en) * | 2005-04-15 | 2006-10-19 | Coding Technologies Ab | Temporal envelope shaping of decorrelated signal |
WO2006126844A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
ATE433182T1 (de) * | 2005-07-14 | 2009-06-15 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
ATE455348T1 (de) * | 2005-08-30 | 2010-01-15 | Lg Electronics Inc | Vorrichtung und verfahren zur dekodierung eines audiosignals |
CN101253556B (zh) * | 2005-09-02 | 2011-06-22 | 松下电器产业株式会社 | 能量整形装置以及能量整形方法 |
KR100888474B1 (ko) * | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
JP2007178684A (ja) * | 2005-12-27 | 2007-07-12 | Matsushita Electric Ind Co Ltd | マルチチャンネルオーディオ復号装置 |
TWI333642B (en) * | 2006-01-19 | 2010-11-21 | Lg Electronics Inc | Method and apparatus for processing a media signal |
CA2646961C (en) | 2006-03-28 | 2013-09-03 | Sascha Disch | Enhanced method for signal shaping in multi-channel audio reconstruction |
BRPI0709235B8 (pt) * | 2006-03-29 | 2019-10-29 | Dolby Int Ab | decodificador de áudio, método de decodificação de áudio, receptor para receber um sinal de n canais, sistema de transmissão para transmitir um sinal de áudio, método para receber um sinal de áudio, método para transmitir e receber um sinal de áudio, mídia de armazenamento legível por computador, e, dispositivo de reprodução de áudio |
US7965848B2 (en) * | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
KR20080086549A (ko) | 2006-04-03 | 2008-09-25 | 엘지전자 주식회사 | 미디어 신호 처리 방법 및 장치 |
US8041041B1 (en) * | 2006-05-30 | 2011-10-18 | Anyka (Guangzhou) Microelectronics Technology Co., Ltd. | Method and system for providing stereo-channel based multi-channel audio coding |
WO2007146424A2 (en) | 2006-06-15 | 2007-12-21 | The Force Inc. | Condition-based maintenance system and method |
US7876904B2 (en) | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
UA94117C2 (ru) * | 2006-10-16 | 2011-04-11 | Долби Свиден Ав | Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов |
DE102007018032B4 (de) * | 2007-04-17 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Erzeugung dekorrelierter Signale |
JP5133401B2 (ja) * | 2007-04-26 | 2013-01-30 | ドルビー・インターナショナル・アクチボラゲット | 出力信号の合成装置及び合成方法 |
CN101821799B (zh) * | 2007-10-17 | 2012-11-07 | 弗劳恩霍夫应用研究促进协会 | 使用上混合的音频编码 |
BRPI0908630B1 (pt) * | 2008-05-23 | 2020-09-15 | Koninklijke Philips N.V. | Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
US8346380B2 (en) | 2008-09-25 | 2013-01-01 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
EP2169665B1 (en) | 2008-09-25 | 2018-05-02 | LG Electronics Inc. | A method and an apparatus for processing a signal |
WO2010036059A2 (en) | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
EP2175670A1 (en) | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
EP2214161A1 (en) * | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for upmixing a downmix audio signal |
EP2214162A1 (en) | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Upmixer, method and computer program for upmixing a downmix audio signal |
US8666752B2 (en) | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
MY160545A (en) | 2009-04-08 | 2017-03-15 | Fraunhofer-Gesellschaft Zur Frderung Der Angewandten Forschung E V | Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing |
RU2011147119A (ru) * | 2009-04-21 | 2013-05-27 | Конинклейке Филипс Электроникс Н.В. | Синтез аудиосигнала |
US8705769B2 (en) | 2009-05-20 | 2014-04-22 | Stmicroelectronics, Inc. | Two-to-three channel upmix for center channel derivation |
SG177277A1 (en) * | 2009-06-24 | 2012-02-28 | Fraunhofer Ges Forschung | Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages |
MX2012004261A (es) * | 2009-10-16 | 2012-05-29 | Fraunhofer Ges Forschung | Aparato, metodo y programa de computadora para proveer uno o más parámetros ajustados para provisión de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendente y una informacion lateral paramétrica asociada con la representación de señal de mezcla descendente, usando un valor promedio. |
PL2491551T3 (pl) * | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Urządzenie do dostarczania reprezentacji sygnału upmixu w oparciu o reprezentację sygnału downmixu, urządzenie do dostarczania strumienia bitów reprezentującego wielokanałowy sygnał audio, sposoby, program komputerowy i strumień bitów wykorzystujący sygnalizację sterowania zniekształceniami |
US9026450B2 (en) | 2011-03-09 | 2015-05-05 | Dts Llc | System for dynamically creating and rendering audio objects |
CN102446507B (zh) * | 2011-09-27 | 2013-04-17 | 华为技术有限公司 | 一种下混信号生成、还原的方法和装置 |
WO2013120510A1 (en) * | 2012-02-14 | 2013-08-22 | Huawei Technologies Co., Ltd. | A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal |
CN103325383A (zh) * | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 音频处理方法和音频处理设备 |
WO2013181272A2 (en) | 2012-05-31 | 2013-12-05 | Dts Llc | Object-based audio system using vector base amplitude panning |
DE102012210525A1 (de) | 2012-06-21 | 2013-12-24 | Robert Bosch Gmbh | Verfahren zur Funktionskontrolle eines Sensors zur Detektion von Teilchen und Sensor zur Detektion von Teilchen |
US9288603B2 (en) | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
US9761229B2 (en) | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
-
2014
- 2014-10-21 CN CN202010024100.3A patent/CN111192592B/zh active Active
- 2014-10-21 BR BR112016008817-4A patent/BR112016008817B1/pt active IP Right Grant
- 2014-10-21 RU RU2016119563A patent/RU2648947C2/ru active
- 2014-10-21 KR KR1020167010113A patent/KR102244379B1/ko active IP Right Grant
- 2014-10-21 CN CN201480057568.5A patent/CN105917406B/zh active Active
- 2014-10-21 EP EP14792778.4A patent/EP3061089B1/en active Active
- 2014-10-21 WO PCT/EP2014/072570 patent/WO2015059153A1/en active Application Filing
- 2014-10-21 KR KR1020227010258A patent/KR102486365B1/ko active IP Right Grant
- 2014-10-21 JP JP2016524490A patent/JP6479786B2/ja active Active
- 2014-10-21 KR KR1020237000408A patent/KR20230011480A/ko not_active Application Discontinuation
- 2014-10-21 CN CN202010024095.6A patent/CN111179956B/zh active Active
- 2014-10-21 KR KR1020217011678A patent/KR102381216B1/ko active IP Right Grant
- 2014-10-21 US US15/031,130 patent/US9978385B2/en active Active
- 2014-10-21 ES ES14792778.4T patent/ES2660778T3/es active Active
-
2018
- 2018-05-21 US US15/985,635 patent/US10242685B2/en active Active
-
2019
- 2019-03-25 US US16/363,099 patent/US10614825B2/en active Active
-
2020
- 2020-04-07 US US16/842,212 patent/US11450330B2/en active Active
-
2022
- 2022-09-16 US US17/946,060 patent/US11769516B2/en active Active
-
2023
- 2023-09-25 US US18/474,028 patent/US20240087584A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6479786B2 (ja) | オーディオ信号のパラメトリック再構成 | |
JP6686015B2 (ja) | オーディオ信号のパラメトリック混合 | |
JP6201047B2 (ja) | オーディオ信号のパラメトリック再構成のための脱相関器構造 | |
BR122020018172B1 (pt) | Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio e meio legível por computador não transitório |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171010 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171010 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6479786 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |