JP2015525897A - 後方互換性のあるオーディオ符号化のためのシステム、方法、装置、およびコンピュータ可読媒体 - Google Patents

後方互換性のあるオーディオ符号化のためのシステム、方法、装置、およびコンピュータ可読媒体 Download PDF

Info

Publication number
JP2015525897A
JP2015525897A JP2015521630A JP2015521630A JP2015525897A JP 2015525897 A JP2015525897 A JP 2015525897A JP 2015521630 A JP2015521630 A JP 2015521630A JP 2015521630 A JP2015521630 A JP 2015521630A JP 2015525897 A JP2015525897 A JP 2015525897A
Authority
JP
Japan
Prior art keywords
basis function
group
channel signals
coefficients
function coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015521630A
Other languages
English (en)
Other versions
JP6105062B2 (ja
JP2015525897A5 (ja
Inventor
セン、ディパンジャン
シャン、ペイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2015525897A publication Critical patent/JP2015525897A/ja
Publication of JP2015525897A5 publication Critical patent/JP2015525897A5/ja
Application granted granted Critical
Publication of JP6105062B2 publication Critical patent/JP6105062B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/006Systems employing more than two channels, e.g. quadraphonic in which a plurality of audio signals are transformed in a combination of audio signals and modulated signals, e.g. CD-4 systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • H04H20/89Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/765Media network packet handling intermediate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/07Generation or adaptation of the Low Frequency Effect [LFE] channel, e.g. distribution or signal processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

音場を記述する基底関数係数のセットの後方互換性のある符号化のためのシステム、方法、および装置が提示される。【選択図】図2A

Description

米国特許法第119条に基づく優先権の主張
[0001]本特許出願は、2012年7月15日に出願され、本譲受人に譲渡された、「空間オーディオ表現のために球面調和関数係数を使用する場合の後方互換性の提供(“PROVIDING BACKWARD COMPATIBILITY WHEN USING SPHERICAL HARMONICS COEFFICIENTS FOR SPATIAL AUDIO REPRESENTATION”)」と題された仮特許出願第61/671,789号の優先権を主張する。
[0002]本開示は、空間オーディオ符号化(spatial audio coding)に関する。
[0003]サラウンドサウンドの発展は、今日のエンターテインメントのために多くの出力フォーマットを利用可能にした。市場におけるサラウンドサウンドフォーマットの範囲は、ポピュラーな5.1ホームシアターシステムフォーマットを含み、これは、ステレオ以上にリビングルームに進出しているという点で、最も成功したものである。このフォーマットは、次の6つのチャネルを含む:前方左(L)、前方右(R)、中央または前方中央(C)、後方左またはサラウンド左(Ls)、後方右またはサラウンド右(Rs)、および低周波数効果(LFE:low frequency effects)。サラウンドサウンドフォーマットの他の例は、例えば、超高精細度テレビジョン規格での使用のために、NHK(Nippon Hoso Kyokaiすなわち日本放送協会)よって開発された先進的な(futuristic)22.2フォーマットおよび発展中の7.1フォーマットを含む。サラウンドサウンドフォーマットにとっては、2次元および/または3次元でオーディオをエンコードすることが望ましくありうる。
[0004]一般的な構成による、複数の基底関数係数を処理する方法が説明される。複数の基底関数係数は、時間間隔の間の音場を記述する。この方法は、複数のチャネル信号を生成するために、複数の基底関数係数の第1のグループに対して可逆変換(reversible transform)を実行することを含み、ここで、複数のチャネル信号の各々は、対応する異なる空間領域と関連づけられる。この方法はまた、複数のチャネル信号に基づいて、(A)複数の基底関数係数の第2のグループの表現と、ここで、第2のグループは、第1のグループとは異なり、(B)第2のグループの表現とは別である、複数のチャネル信号の表現と、を含むデータ構造を生成することを含む。有形の特徴を読み取る機械にこのような方法を実行させる該特徴を有するコンピュータ可読記憶媒体(例えば、非一時的な媒体)がまた、開示される。
[0005]一般的な構成による、複数の基底関数係数を処理するための装置が説明される。複数の基底関数係数は、時間間隔の間の音場を記述する。この装置は、複数のチャネル信号を生成するために、複数の基底関数係数の第1のグループに対して可逆変換を実行するための手段を含み、ここで、複数のチャネル信号の各々は、対応する異なる空間領域と関連づけられる。この装置はまた、複数のチャネル信号に基づいて、(A)複数の基底関数係数の第2のグループの表現と、ここで、第2のグループは、第1のグループとは異なり、(B)第2のグループの該表現とは別である、複数のチャネル信号の表現と、を含むデータ構造を生成するための手段を含む。
[0006]別の一般的な構成による、複数の基底関数係数を処理するための装置が説明される。複数の基底関数係数は、時間間隔の間の音場を記述する。この装置は、複数のチャネル信号を生成するために、複数の基底関数係数の第1のグループに対して可逆変換を実行するように構成された計算器を含み、ここで、複数のチャネル信号の各々は、対応する異なる空間領域と関連づけられる。この装置はまた、複数のチャネル信号に基づいて、(A)複数の基底関数係数の第2のグループの表現と、ここで、第2のグループは、第1のグループとは異なり、(B)第2のグループの該表現とは別である、複数のチャネル信号の表現と、を含むデータ構造を生成するように構成されたデータフォーマッタを含む。
図1Aは、後方互換性を考慮しないシーンベースの(scene-based)符号化の例を示す。 図1Bは、MPEGコーデックを使用する標準化についての一般的な構造を例示する。 図1Cは、モノラル/ステレオについての後方互換性のある例を示す。 図2Aは、後方互換性のある設計によるエンコーディングプロセスの例を示す。 図2Bは、シーンベースのデータをデコードすることができない従来のデコーダ上でのデコーディングプロセスの例を示す。 図3Aは、シーンベースのデータを処理する(handle)ことができる新しいデバイスによるデコーディングプロセスの例を示す。 図3Bは、一般的な構成による、オーディオ信号処理の方法 M100のフローチャートを示す。 図3Cは、一般的な構成による、オーディオ信号処理のための装置 MF100のブロック図を示す。 図3Dは、別の一般的な構成による、オーディオ信号処理のための装置 A100のブロック図を示す。 図4は、次数0および1の球面調和関数の基底関数の大きさ(magnitudes)の表面メッシュプロットの例を示す。 図5は、次数2の球面調和関数の基底関数の大きさの表面メッシュプロットの例を示す。 図6は、5.1システムのためのラウドスピーカ角度の規格準拠の例を示す。 図7は、5.1ターゲットシステムのためのラウドスピーカ角度の等間隔を置かれた配置の例を示す。 図8は、7.1システムのためのラウドスピーカ角度の規格準拠の例を示す。 図9は、7.1ターゲットシステムのためのラウドスピーカ角度の等間隔を置かれた配置の例を示す。 図10Aは、一般的な構成による、オーディオ信号処理の方法 M200のフローチャートを示す。 図10Bは、方法 M200の実装 M210のフローチャートを示す。 図11Aは、一般的な構成による、オーディオ信号処理のための装置 MF200のブロック図を示す。 図11Bは、装置 MF100の実装 MF210のブロック図を示す。 図11Cは、別の一般的な構成による、オーディオ信号処理のための装置 A200のブロック図を示す。 図11Dは、装置 A100の実装 A210のブロック図を示す。 図11Eは、別の一般的な構成による、オーディオ信号処理のための装置 P100のブロック図を示す。
[0029]その文脈によって明確に限定されていない限り、「信号」という用語は、ここでは、ワイヤ、バス、または他の伝送媒体上で表される記憶場所(memory location)(または、記憶場所のセット)の状態を含む、その通常の意味のいずれをも示すために使用される。その文脈によって明確に限定されていない限り、「発生する(generating)」という用語は、ここでは、計算する(computing)またはさもなければ生成する(producing)など、その通常の意味のいずれをも示すために使用される。その文脈によって明確に限定されていない限り、「計算する(calculating)」という用語は、ここでは、複数の値から選択する、推定する、評価する、および/または計算する(computing)など、その通常の意味のいずれをも示すために使用される。その文脈によって明確に限定されていない限り、「得る(obtaining)」という用語は、計算する、導出する、(例えば、外部デバイスから)受信する、および/または(例えば、記憶要素のアレイから)取り出すなど、その通常の意味のいずれをも示すために使用される。その文脈によって明確に限定されていない限り、「選択する(selecting)」という用語は、2つ以上のセットのうちの、少なくとも1つ、およびすべてよりも少数を使用する、適用する、示す、および/または識別するなど、その通常の意味のいずれをも示すために使用される。「備える(comprising)」という用語は、本説明と特許請求の範囲とにおいて使用される場合、他の要素または動作を除外するものではない。「〜に基づく」(「AはBに基づく」など)という用語は、(i)「〜から導出される」(例えば、「BはAの前の形(precursor)である」)、(ii)「少なくとも〜に基づく」(例えば、「Aは少なくともBに基づく」)、および特定の文脈において適切な場合には、(iii)「〜に等しい」(例えば、「AはBに等しい」)という場合を含む、その通常の意味のいずれをも示すために使用される。同様に、「〜に応答して」という用語は、「少なくとも〜に応答して」を含む、その通常の意味のいずれをも示すために使用される。
[0030]マルチマイクロフォンオーディオ感知デバイスのマイクロフォンの「位置(location)」への参照は、文脈によって別段に示されていない限り、マイクロフォンの音響的に敏感な面の中心の位置を示す。「チャネル」という用語は、特定の文脈に応じて、ときには、信号経路を示すために使用され、またその他のときには、そのような経路によって搬送される信号を示すために使用される。別段に示されていない限り、「一連(series)」という用語は、2つ以上のアイテムのシーケンスを示すために使用される。「対数(logarithm)」という用語は、10を底とする対数を示すために使用されるが、他の底へのこのような演算の拡張は本開示の範囲内である。「周波数成分」という用語は、(例えば、高速フーリエ変換によって生成されるような)信号の周波数領域表現のサンプル、または信号のサブバンド(例えば、バーク尺度またはメル尺度のサブバンド)など、信号の周波数帯域または周波数のセットの中の1つを示すために使用される。
[0031]別段に示されていない限り、特定の特徴を有する装置の動作のいかなる開示も、類似の特徴を有する方法を開示する(その逆も同様)ように明確に意図され、また、特定の構成による装置の動作のいかなる開示も、類似の構成による方法を開示する(その逆も同様)ように明確に意図される。「構成」という用語は、その特定の文脈によって示されるように、方法、装置、および/またはシステムに関して使用されうる。「方法」、「プロセス」、「プロシージャ(procedure)」、および「技法(technique)」という用語は、特定の文脈によって別段に示されていない限り、一般的に、および交換可能に使用される。「装置」および「デバイス」という用語も、特定の文脈によって別段に示されていない限り、一般的に、および交換可能に使用される。「要素」および「モジュール」という用語は、一般に、より大きな構成の一部分を示すために使用される。その文脈によって明確に限定されていない限り、「システム」という用語は、ここでは、「共通の目的を果たすために相互作用する要素のグループ」を含む、その通常の意味のいずれをも示すために使用される。
[0032]また、文書の一部分の参照によるいかなる組み込みも、その部分内で参照される用語または変数の定義が、その文書中の他の場所、ならびに組み込まれた部分中で参照される任意の図に現れた場合、そのような定義を組み込んでいることを理解されたい。最初に定冠詞によって前置き(introduced)されていない限り、請求項の要素を修飾するために使用される順序を表す用語(例えば、「第1の」、「第2の」、「第3の」など)は、それ自体では別のものに対する請求項の要素のいかなる優先度または順序も示すものではなく、むしろ、請求項の要素を、(順序を表す用語の使用以外では)同じ名称を有する別の請求項の要素から単に区別する。その文脈によって明確に限定されていない限り、「複数」および「セット」という用語の各々は、ここでは、1よりも大きい整数の量を示ために使用される。
[0033]消費者向けオーディオにおける当該技術分野の現状は、チャネルベースのサラウンドサウンドを使用する空間符号化であり、これは、前もって指定されたポジションにおけるラウドスピーカを通じて再生されるように意図される。空間オーディオ符号化に対する別のアプローチが、オブジェクトベースのオーディオであり、これは、(他の情報の中でも)空間におけるオブジェクトの位置座標を含む関連するメタデータを有する、単一オーディオのオブジェクトのための離散パルス符号変調(PCM:pulse-code-modulation)データを伴う。
[0034]空間オーディオ符号化に対する(例えば、サラウンドサウンド符号化に対する)更なるアプローチが、シーンベースのオーディオであり、これは、球面調和関数の基底関数の係数を使用して音場を表現することを伴う。このような係数はまた、「球面調和関数係数(spherical harmonic coefficients)」すなわちSHCと呼ばれる。図1Aは、シーンベースのアプローチによる、簡単なエンコーディングおよびデコーディングのプロセスを図示する。この例では、シーンベースのエンコーダ SE10は、SHCの記述を生成し、それは、送信され(および/または記憶され)、(例えば、SHレンダラ SR10による)レンダリングのためにSHCを受信するシーンベースのデコーダ SD10においてデコードされる。このようなエンコーディングは、(例えば、1つまたは複数のコードブックインデックスへの)量子化、誤り訂正符号化、冗長符号化などのような、帯域圧縮のための1つまたは複数のロッシー(lossy)またはロスレス(lossless)の符号化技法を含みうる。追加または代替として、このようなエンコーディングは、Bフォーマット、Gフォーマット、または高次アンビソニックス(HOA:Higher-order Ambisonics)などの、アンビソニックフォーマットにオーディオチャネル(例えば、マイクロフォン出力)をエンコードすることを含みうる。一般に、エンコーダ SE10は、(ロッシーまたはロスレスの符号化のいずれかについての)無関係性(irrelevancies)および/または係数の中の冗長性(redundancies)を利用する技法を使用して、SHCをエンコードしうる。
[0035]標準化されたビットストリームへの空間オーディオ情報のエンコーディングと、レンダラの位置における音響状態およびスピーカの幾何学的配置に不可知(agnostic)および適合可能な後続するデコーディングとを提供することが望ましくありうる。このようなアプローチは、再生(reproduction)のために最終的に使用される特定のセットアップにかかわらず、均一なリスニング(listening)体験の目標を提供しうる。図1Bは、MPEGコーデックを使用する、このような標準化についての一般的な構造を例示する。この例では、エンコーダ MP10への入力オーディオソースは、例えば、次のうちの任意の1つまたは複数を含みうる:チャネルベースのソース(例えば、1.0(モノフォニック)、2.0(ステレオフォニック)、5.1、7.1、11.1、22.2)、オブジェクトベースのソース、およびシーンベースのソース(例えば、高次球面調和関数、アンビソニックス)。同様に、デコーダ(およびレンダラ)MP20によって生成されるオーディオ出力は、例えば、次のうちの任意の1つまたは複数を含みうる:モノフォニック、ステレオフォニック、5.1、7.1、および/または22.2のラウドスピーカアレイ用のフィード、不規則に分散されたラウドスピーカアレイ用のフィード、ヘッドホン用のフィード、インタラクティブオーディオ。
[0036]また、オーディオマテリアルが、(例えば、コンテンツクリエータによって)1度作られ、その後、異なる出力およびラウドスピーカセットアップへデコードおよびレンダリングされうるフォーマットにエンコードされる、「1度作り、何度も使う(create-once, use-many)」という原理に従うことが望ましくありうる。例えば、ハリウッドスタジオのようなコンテンツクリエータは、通常、映画用のサウンドトラックを1度だけ作成するのが好ましく、可能なラウドスピーカ構成ごとにそれをリミックスする労力を費やしたくない。
[0037]図1Bの標準化された例におけるMPEGエンコーダ MP10への入力は、オプションとして、チャネルベースのフォーマット、オブジェクトベースのフォーマット、およびシーンベースのフォーマットのうちの1つである。シーンベースのフォーマットを使用することの多数の利点が存在する。しかしながら、このようなフォーマットを使用することの1つの考えらえる欠点が、既存の消費者向けオーディオシステムに対する後方互換性の欠如である。SHCを使用した場合の後方互換性の欠如は、SHCがPCMデータではないという事実によるものである。(「レガシー」システムとも呼ばれる)新しいシーンベースのデコーダが欠如している既存の受信機は、このような信号をデコードすることができず、プログラムを再生することができない。本開示は、音場を表現するために係数の階層的なセット(例えば、SHC、またはその他の基底関数セットの係数)を使用する場合に、この後方互換性の欠如に対処するために使用されうる方法、システム、および装置を説明する。
[0038]ここで説明されるアプローチは、音場のSHCベースの表現の使用における潜在的な欠点に対する解決策を提供する。この解決策なしでは、SHCベースの表現は、何百万もの既存のレガシー再生システムで機能性を有することができないことにより課せられる著しい欠点により、展開するのが困難である。
[0039]レガシーモノフォニック再生システムが互換性を保持することが必要であったので、後方互換性は、ステレオフォニックフォーマットが最初に導入されたときでさえも懸念であった。このケースでは、モノラル−ステレオの後方互換性は、マトリクス化を使用して保持された。ステレオ「M−ミドル(middle)」および「S−サイド(Side)」フォーマットは、Mチャネルのみを使用することによって、モノラル対応のシステムとの互換性を保持することができる。図1Cに示されるように、ステレオ対応のシステムは、「L−左」および「R−右」のチャネルをデコードするために、単純な2×2マトリクス演算を実行する。
[0040]M−S信号は、(同一になっている(happens to be))上記マトリクスの逆のものを使用することによって、L−R信号から計算されうる。このように、レガシーモノフォニックプレーヤは、機能性を保持し、一方、ステレオフォニックプレーヤは、左および右のチャネルを正確にデコードしうる。同様の方法で、モノフォニックプレーヤおよびステレオフォニックプレーヤの機能性を保存して、3−チャネルプレーヤの機能性を追加する、後方互換性を保持する第3のチャネルが追加されうる。
[0041]追加のチャネルを含むための、従来の5.1チャネルベースのマトリクス化されたオーディオアプローチの拡張は、拡張されたチャネルフォーマットのサブセットとして5.1サンプルを含むことによって、後方互換性の問題を回避しうる。例えば、ほとんどの既存の消費者向けオーディオシステムは、5.1−チャネル入力を受け入れる。後方互換性のある拡張されたビットストリームでは、5.1サンプルは、レガシーシステムによって認識された位置にあり、余分のチャネルは、例えば、すべてのチャネルサンプルを含むフレームパケットの拡張された部分に位置する。このようなアプローチの別の例が、ドルビーデジタルプラスビットストリーム(ドルビーラボラトリーズ、Inc.、サンフランシスコ、CA)であり、これは、5.1ミックスを有するコアパケットと、7.1ミックスの4つのサラウンドチャネルを有する拡張パケットとを含む。代替として、デコーダは、より高い数のチャネルに対してマトリクス化動作を実行することによって、5.1チャネルデータを決定するように構成されうる。
[0042]オブジェクトベースのフォーマットにおける後方互換性の問題に対処するための1つの提案されるアプローチが、オブジェクトとともに、ダウンミックスされた5.1チャネル信号を送ることである。このようなシナリオでは、レガシーチャネルベースのシステムは、ダウンミックスされた5.1チャネルベースのオーディオを再生するであろう一方で、より高度なレンダラは、音場をレンダリングするために、5.1オーディオと個々のオーディオオブジェクトの組み合わせ、または個々のオブジェクトのみのいずれかを使用するであろう。不都合なことに、後方互換性に対するこのようなアプローチは、2つの異なるフォーマットで同じオーディオ情報を送ることによって、帯域幅を非効率的に使用しうる。
[0043]本開示は、音場を記述する要素の階層的なセット(例えば、SHCのセット)の2つの部分が異なって処理されるシステム、方法、および装置の説明を含む。このアプローチでは、要素のサブセットは、マルチチャネルオーディオ信号のセットを得るために、(例えば、以下に詳しく述べる変換マトリクスを使用して)変換される。このようなアプローチは、階層的なセットのサブセット(「基本セット(basic set)」)を、従来のマルチチャネルオーディオフォーマットとの互換性があるオーディオの複数のチャネルに変換するために使用されうる。このようなアプローチはまた、後方互換性を維持するために、任意の所望の数のチャネルを得るように構成されうる。このような後方互換性のあるシステムの態様の例は、エンコーダとデコーダの両方の構造についての説明とともに、図2A、図2B、および図3Aのシステム図において要約される。
[0044]図2Aは、このようなエンコーディングアプローチの一般的な例を示す。1つの特定の使用は、(さもなければ、後方互換性が問題でない場合に使用されうる)SHCの完全なセットの基本セットを、(例えば、変換マトリクス TM10および再エンコーダ/トランスコーダ TC10によって生成されるような)従来のマルチチャネルオーディオフォーマットを表す複数のチャネルに変換することである。SHCのセットの残り(例えば、サブセットの一部でない係数)は、変換されない拡張されたセットとみなされ、(例えば、ここで説明され、この例ではビットストリームマルチプレクサ MX10によって生成されるような、パケットまたはビットストリームにおいて)後方互換性のあるマルチチャネルオーディオエンコードされた信号と平行して(alongside)、記憶のために、および/または、送信チャネル(例えば、ワイヤードおよび/またはワイヤレスチャネル)を介した送信のために、(例えば、帯域圧縮のために、シーンベースのエンコーダ SE10の実装 SE20によって)別々にエンコードされうる。例えば、これらのエンコードされたビットは、フレームのためのビットストリームの拡張された部分またはパケットの拡張された部分(例えば、ユーザ定義の部分)にパックされうる。
[0045]受信側において、ビットストリームは、(例えば、デマルチプレクサ DX10によって)逆多重化され、従来のデコーダ(例えば、レガシーデコーダ LD10)のみをサポートするレガシーシステムは、後方互換性のあるマルチチャネルオーディオコンテンツのみを使用し、したがって、機能性を保持し、図2Bに示されるように、フレームのパケットまたはビットストリームの拡張された部分を無視する。
[0046]シーンベースのデコーディングをサポートする受信機が、図3Aに示される一般的な例に従って、デコーディングプロセスを実行することができ、これは、図2Aに示されたようなエンコーディングアプローチの逆(reciprocal)である。チャネルが再エンコードまたはトランスコードされている場合、デコーディングの中間ステップが実行されうる。例えば、トランス−デコーダ TC20は、後方互換性のあるビットストリームを、マルチチャネルオーディオ信号に変換するために使用されうる。その後、逆変換マトリクス IM10は、マルチチャネルオーディオ信号を、階層的なセットの元のサブセット(例えば、SHCの基本セット)に変換するために使用される。階層的なセットの残り(例えば、SHCの拡張されたセット)は、(例えば、パケットまたはビットストリームの拡張された部分から)シーンベースのデコーダ SD10の実装 SD20によって復元される。このように、完全な階層的なセット(例えば、SHCの完全なセット)は、復元されて、様々なタイプの音場レンダリングが行われることを可能にするために、SHレンダラ SR10によって処理されうる。
[0047]音場を表現するためにSHCのセットを使用することは、音場を表現するために要素の階層的なセットを使用する一般的なアプローチの特定の例である。SHCのセットのような、要素の階層的なセットは、低次要素(lower-ordered elements)の基本セットが、モデル化された音場の完全な表現を提供するように、要素が順序付けられた(ordered)セットである。セットが高次要素を含むように拡張されるにつれて、空間における音場の表現は、より詳細になる。
[0048](例えば、図3Aに示されるような)ソースSHCは、シーンベース対応の(scene-based-capable)録音スタジオでミキシング技師によってミックスされたようなソース信号でありうる。ソースSHCはまた、マイクロフォンアレイによって捕えられた信号から、またはラウドスピーカのサラウンドアレイによる音波表現(sonic presentation)の録音から生成されうる。SHCのソースセットへのPCMストリームおよび関連する位置情報(例えば、オーディオオブジェクト)の変換もまた、企図される。
[0049]音場は、以下のような式を使用して、SHCに関して表現されうる:
Figure 2015525897
この式は、音場の任意の点{r,θ,φ}における圧力pが、
Figure 2015525897
によって一意的に表されうることを示す。ここで、波数k=ω/cであり、cは、音速(約343m/s)であり、{r,θ,φ}は、基準点(または観測点)であり、j(・)は、次数nの球ベッセル関数であり、
Figure 2015525897
は、次数nおよび下位次数(suborder)mの球面調和関数の基底関数である(SHCのいくつかの記述は、nを(すなわち、対応するルジャンドル多項式の)ディグリー(degree)およびmを次数と呼ぶ(label))。角括弧内の項は、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、またはウェーブレット変換などの、様々な時間周波数変換によって近似されうる信号(すなわち、S(ω、r,θ,φ))の周波数領域表現であることが認識されうる。
[0050]図4は、次数0および1の球面調和関数の基底関数の大きさの表面メッシュプロットの例を示す。関数
Figure 2015525897
の大きさは、球状および全方向性(omnidirectional)である。関数
Figure 2015525897
は、それぞれ+yおよび−yの方向に広がる、正および負の球状ローブを有する。関数
Figure 2015525897
は、それぞれ+zおよび−zの方向に広がる、正および負の球状ローブを有する。関数
Figure 2015525897
は、それぞれ+xおよび−xの方向に広がる、正および負の球状ローブを有する。
[0051]図5は、次数2の球面調和関数の基底関数の大きさの表面メッシュプロットの例を示す。関数
Figure 2015525897
は、x−y平面に広がるローブを有する。関数
Figure 2015525897
は、y−z平面に広がるローブを有し、関数
Figure 2015525897
は、x−z平面に広がるローブを有する。関数
Figure 2015525897
は、+zおよび−zの方向に広がる正ローブと、x−y平面に広がるドーナツ形の(toroidal)負ローブとを有する。
[0052]セットにおけるSHCの総数は、様々な要因に依存しうる。シーンベースのオーディオの場合、例えば、SHCの総数は、録音アレイにおけるマイクロフォントランスデューサの数によって制約されうる。チャネルベースおよびオブジェクトベースのオーディオの場合、SHCの総数は、利用可能な帯域幅によって決定されうる。1つの例では、各周波数について25個の係数を伴う4次の表現(すなわち、0≦n≦4,−n≦m≦+n)が使用される。ここで説明されるアプローチで使用されうる階層的なセットの他の例は、ウェーブレット変換係数のセットおよび多重解像度の基底関数(multiresolution basis functions)の係数の他のセットを含む。
[0053]
Figure 2015525897
は、4面体または球状のマイクロフォンアレイなどの、任意の様々なマイクロフォンアレイ構成を使用して物理的に捕捉された(例えば、記録された)信号から導出されうる。この形式の入力は、提案されたエンコーダへのシーンベースのオーディオ入力を表す。限定されない例では、SHCエンコーダへの入力は、アイゲンマイク(Eigenmike)(登録商標)(mhアコースティックス LLC、サンフランシスコ、CA)のような、マイクロフォンアレイの異なる出力チャネルであると仮定される。アイゲンマイク(登録商標)アレイの1つの例が、em32アレイであり、これは、i=1から32の出力信号p(t)の各々が、マイクロフォンiによって時間サンプルtにおいて記録された圧力であるように、直径8.4センチメートルの球体の表面上に配置された32個のマイクロフォンを含む。代替として、
Figure 2015525897
は、音場のチャネルベースまたはオブジェクトベースの記述から導出されうる。例えば、個々のオーディオオブジェクトに対応する音場についての係数
Figure 2015525897
は、
Figure 2015525897
として表されることができ、ここで、iは、√−1であり、
Figure 2015525897
は、次数nの(第2種の)球ハンケル関数であり、{r,θ,φ}は、オブジェクトの位置であり、g(ω)は、周波数の関数としてのソースエネルギである。
[0054]周波数の関数としてのソースエネルギg(ω)を知ることは、我々に、各PCMオブジェクトとその位置を、
Figure 2015525897
に変換することを与える。このソースエネルギは、例えば、PCMストリームに対して高速フーリエ変換(例えば、256−、512−、または1024−点FFT)を実行することによってなど、時間周波数解析技法を使用して得られうる。さらに、(上記は、線形および直交の分解なので)各オブジェクトについての
Figure 2015525897
係数は、加法的(additive)であることが示されうる。このように、多数のPCMオブジェクトが、(例えば、個々のオブジェクトについての係数ベクトルの合計として)
Figure 2015525897
係数によって表されうる。本質的に、これらの係数は、音場についての情報(3D座標の関数としての圧力)を含み、上記は、観測点{r,θ,φ}の近接における、個々のオブジェクトから音場全体の表現への変換を表す。
[0055]当業者であれば、動径成分(radial component)を含まない表現などの、式(2)に示された表現以外の係数
Figure 2015525897
(または、同等に、対応する時間領域の係数
Figure 2015525897
)の表現を認識するであろう。当業者であれば、(例えば、実数、複素数、正規化(例えば、N3D)、半正規化(例えば、SN3D)、ファース・モーム(Furse-Malham)(FuMaまたはFMH)などの)球面調和関数の基底関数のいくつかの少し異なる定義が知られていること、および、その結果として、式(1)(すなわち、音場の球面調和関数分解)および式(2)(すなわち、点源(point source)によって生成された音場の球面調和関数分解)は、少し異なった形態で本書に現れうることを認識するであろう。本説明は、球面調和関数の基底関数の任意の特定の形態に限定されず、実際に、要素の他の階層的なセットにも同様に、一般的に適用可能である。
[0056]図3Bは、時間間隔の間の音場を記述する複数の基底関数係数を処理するための方法 M100のフローチャートを示す。方法 M100は、タスク T100およびタスク T200を含む。タスク T100は、複数のチャネル信号を生成するために、複数の基底関数係数の第1のグループ(「基本セット」)に対して可逆変換を実行し、ここで、複数のチャネル信号の各々は、対応する異なる空間領域と関連づけられる。複数のチャネル信号に基づいて、タスク T200は、(A)複数の基底関数係数の第2のグループ(「拡張されたセット」)の表現と、ここで、第2のグループは、第1のグループとは異なり、(B)第2のグループの該表現とは別である、複数のチャネル信号の表現と、を含むデータ構造を生成する。
[0057]方法 M100の実装の設計は、マルチチャネルオーディオに(例えば、従来のフォーマットに)変換される元の階層的なセットのサブセット(すなわち、基本セット)を選択することを含みうる。このようなアプローチが少なくとも従来の5.1サラウンド/ホームシアター能力との互換性を維持するために実装されるであろうことが予期されうる。5.1フォーマットの場合、マルチチャネルオーディオチャネルは、前方左(L)、中央(C)、前方右(R)、左サラウンド(Ls)、右サラウンド(Rs)、および低周波数効果(LFE)である。7.1フォーマットは、左後方(Lb)および右後方(Rb)のチャネルを追加する。以下の説明では、5.1フォーマットは、典型的なターゲットマルチチャネルオーディオフォーマットとして使用され、実例的なアプローチが詳しく述べられる。同じ手法が他のマルチチャネルオーディオフォーマット(例えば、7.1、22.2など)に汎用化されうることが、企図され、ここに開示される。
[0058]基本セットを選択するための様々なアプローチが可能である。5.1フォーマットでは、(特定の位置からの全帯域オーディオに対応する)5つの信号が利用可能であるので(これに加えて、LFE信号−これは、標準化された位置を持たず、これら5つのチャネルをローパスフィルタリングすることによって決定されうる)、1つのアプローチは、5.1フォーマットに変換するために、SHCのうちの5つを使用することである。さらに、対応する基底関数の空間的オリエンテーションに従って基本セットを選択することが望ましくありうる。5.1フォーマットは、2Dレンダリングのみ可能であるので、例えば、基本セットが、何らかの水平情報を搬送するSHCのみを含むことが望ましくありうる。言い換えれば、そのエネルギが、(例えば、x−y平面のような)ラウドスピーカ位置を含む平面内の少なくとも1つの方向に沿って集中された基底関数に対応するSHCを選択することが望ましくありうる。図4に見られるように、係数
Figure 2015525897
は、例えば、水平指向性についてのごくわずかの情報を搬送し、したがって、このサブセットから除外されうる。
Figure 2015525897
実数部分または虚数部分のいずれかについても同じことが当てはまる(例えば、
Figure 2015525897
として図5に示される基底関数を参照)。基本セットのために選択される特定の係数は、例えば、実装において選ばれる球面調和関数の基底関数の定義に依存して変化しうる(本書においては、様々な定義が存在する:実数、虚数、複素数、または組み合わせ)。
[0059]このように、5つの
Figure 2015525897
係数が、変換のために選ばれうる。係数
Figure 2015525897
は、全方向性の情報を搬送するので、この係数を常に使用することが望ましくありうる。同様に、それらが著しい水平指向性の情報を搬送するので、
Figure 2015525897
の実数部分および
Figure 2015525897
の虚数部分を含むことが望ましくありうる。最後に残った2つの係数については、可能な候補は、
Figure 2015525897
の実数および虚数の部分を含む。様々な他の組み合わせもまた、可能である。例えば、基本セットは、
Figure 2015525897
と、
Figure 2015525897
の実数部分と、
Figure 2015525897
の虚数部分との3つの係数のみを含むように選択されうる。基本セットについては、以下に説明されるように、望まれたチャネルの数、そしてまた、変換マトリクスに対する可逆性の制約に依存して、より多くまたはより少ない係数を含むことが可能である。
[0060]ここで説明されるような、5.1と互換性のあるシステムのための設計の詳細は、異なるターゲットフォーマットのために適宜調整されうる。例として、7.1システムについての互換性を可能にするために、2つの余分のオーディオコンテンツチャネルが互換性要件に追加され、結果として生じる変換マトリクスが正方であり、したがって可逆になるように、さらに2つのSHCが基本セットに追加されうる。7.1システム(例えば、ドルビーTrueHD)のための大多数のラウドスピーカ配置が依然として水平面上にあるので、SHCの選択は、依然として高さ情報を有するものを除外しうる。このように、水平面信号レンダリングは、レンダリングシステムにおける追加されたラウドスピーカチャネルから利益を得るであろう。高さのダイバーシティを有するラウドスピーカを含むシステム(例えば、9.1、11.1および22.2システム)では、高さ情報を有するSHCを基本セットに含むことが望ましくありうる。
[0061]我々は、マルチチャネルに対する一般論を述べたが、一方で、現在の市場における重点は、5.1チャネルに関するものであり、これは、それがセットトップボックスのようなレガシー消費者向けオーディオシステムの機能性を保証するための「最小公分母(least common denominator)」であるからである。ステレオおよびモノラルのようなより低い数のチャネルについては、多くの先行技術における既存の5.1解決策が、コンテンツ情報を維持するためにダウンミックスをカバーするのに十分であろう。これらのケース(すなわち、1.0および2.0)は、自明であると考えられ、本開示においてさらに説明されることはない。
[0062]発生しうる別の問題は、(例えば、SHCの)基本セットからマルチチャネルオーディオへ、そして基本セットに戻すまでの、順方向および逆方向の変換において、どれだけの誤りが生成されるかである。タスク T100は、各々が対応する異なる空間領域(例えば、対応する異なるラウドスピーカ位置)と関連づけられる複数のチャネル信号を生成するために、複数の基底関数係数の基本セットに対して可逆変換を実行する。SHCの基本セット(例えば、上述されたように選択された5つの係数)を、5.1フォーマットにおける5つの全帯域オーディオ信号に変換するために可逆マトリクスを適用するために、タスク T100を実装することが望ましくありうる。可逆性に対する要望は、分解能の損失が無いか少ない状態で、5つの全帯域オーディオ信号をSHCの基本セットに戻す変換を可能にすることである。
[0063]この変換マトリクス(例えば、図2Aに示されるようなマトリクス TM10)を決定するための1つの可能な方法が、「モード整合」として知られる動作である。したがって、ラウドスピーカフィードは、各ラウドスピーカが球面波を生成すると仮定することによって計算される。このようなシナリオでは、
Figure 2015525897
番目のスピーカによる、ある特定のポジションr,θ,φにおける(周波数の関数として)圧力は、
Figure 2015525897
によって与えられ、ここで、{r,θ,φ}は、
Figure 2015525897
番目のラウドスピーカのポジションを表し、g(ω)は、(周波数領域における)
Figure 2015525897
番目のスピーカのラウドスピーカフィードである。5つすべてのスピーカによる全圧力Pは、したがって、
Figure 2015525897
によって与えられる。
[0064]我々はまた、5つのSHCに関しての全圧力は、式
Figure 2015525897
によって与えられることを知っている。
[0065]上記2つの式を等しいと定義することは、以下のように、SHCに関してのラウドスピーカフィードを表すために、変換マトリクスを使用することを我々に可能にする。
Figure 2015525897
[0066]この式は、5つのラウドスピーカフィードと選択されたSHCとの間に直接的な関係があることを示す。変換マトリクスは、例えば、サブセット(例えば、基本セット)においてどの係数が使用されたか、および球面調和関数の基底関数のどの定義が使用されたかに依存して変化しうる。同様の方法で、選択された基本セットから異なるチャネルフォーマット(例えば、7.1、22.2)に変換するための変換マトリクスが構築されうる。上記変換マトリクスが「モード整合」基準から導出された一方で、代替の変換マトリクスが、圧力整合、エネルギ整合などのような、他の基準からも導出されうる。
[0067]上記式での変換マトリクスが、ラウドスピーカフィードからSHCへの変換を可能にする一方で、我々はまた、SHCから始まり、我々が5つのチャネルフィードを算出(work out)することができ、そしてその後、デコーダにおいて、(高度な(すなわち、レガシーでない)レンダラが存在する場合)我々がオプションとしてSHCに変換し戻すことができるように、マトリクスが可逆であることが好ましい。例えば、変換マトリクスについては、整数入力に応答して整数出力を生成することが望ましくありうる。マトリクスの可逆性を保証するために上記フレームワークを操作する様々な方法が、利用されうる。これらは、それに限定されるものではないが、正則化技法(例えば、周波数に依存する正則化)およびしばしばフルランクおよび明確に定義された固有値を保証するように働く様々な他のマトリクス操作技術などの、数学的技法を含む。
[0068]可逆性を保証するための技法はまた、それに限定されるものではないが、1つまたは複数のラウドスピーカのポジションを変化させることを含む。このような技法は、例えば、5.1システムの5つのラウドスピーカのうちの1つまたは複数のポジションを、それらが依然として(例えば、ITU−R BS.775−1勧告、国際電気通信連合、ジェノバ、CH、によって指定されるような)指定された角度公差に従うように、調整することを含みうる。図6は、使用されうる5.1システムのためのラウドスピーカ角度の規格準拠の例を示すT−設計に従うもののような、トランスデューサの標準間隔は、典型的に行儀のよい(well behaved)ものである。
[0069]代替として、タスク T100は、基本セットを平面において等間隔を置かれたラウドスピーカ角度に対応するチャネル信号のセットに変換する変換マトリクスを適用するために実装されうる。可逆性は、このような変換マトリクスについて典型的に保証される。図7は、5.1ターゲットシステムのためのラウドスピーカ角度のこのような配置の例を示す。このような等間隔を置かれた配置は、5.1規格と厳密には準拠していない可能性もあるが、それは、依然としてラウドスピーカフィードの適切な後方互換性のあるセットを提供し、また、係数の基本セットを復元するための可逆変換マトリクスを得る確実な方法を提供する。タスク T100の7−チャネルの実装について、図8および図9は、それぞれ、7.1システムのためのラウドスピーカ角度の規格準拠のセット、および平面において等間隔を置かれたラウドスピーカ角度の対応するセットの類似した例を示す。
[0070]5.1、7.1、および22.2などの、少なくとも1つの低周波数効果(LFE)チャネルを含むターゲットチャネルフォーマットについては、このようなチャネルも同様に含むようにチャネル信号のセットを生成するために、方法 M100を実装することが望ましくありうる。1つの例では、方法 M100は、タスク T100によって生成されるチャネル信号をローパスフィルタリングすることと、結果として生じるローパス信号を合計することとによって、LFEチャネルを生成するタスクを含む。複数のLFEチャネル(例えば、22.2フォーマットのための左LFEチャネルおよび右LFEチャネル)が必要とされるケースについて、このようなタスクは、各ターゲット位置に空間的に最も近いローパス信号を合計することによって、これらのチャネルを生成するために実装されうる。この方法で生成されたLFEチャネルは冗長であるが、それは、依然としてレガシーLFEチャネルに適した信号を提供し、このようなアプローチはまた、変換マトリクスに対するいかなる変更も回避する。
[0071]すべての操作後に、修正されたマトリクスが実際に、正しいおよび/または受け入れ可能なラウドスピーカフィードを生成することを保証するために、変換マトリクスによってレンダリングされたチャネル信号を(例えば、心理音響的に)テストすることが望ましくありうる。可逆性が保存されている限り、SHCの正しいデコーディングを保証する逆問題は、典型的に問題ではない。基本セット(例えば、SHCのサブセット)と従来のマルチチャネルオーディオとの間の変換を可能にするマトリクスが導出されうるということ、また、(マルチチャネルオーディオの忠実性を低減させない)操作後に、同様に可逆であるわずかに修正されたマトリクスも、公式化されうるということで、典型的に十分である。
[0072]複数のチャネル信号に基づいて、タスク T200は、(A)複数の基底関数係数の第2のグループ(例えば、「拡張されたセット」)の表現と、ここで、第2のグループは、第1のグループとは異なり、(B)第2のグループの該表現とは別である、複数のチャネル信号の表現と、を含むデータ構造を生成する。データ構造は、(例えば、1つまたは複数のライブのビットストリームまたはパケットのストリームを含む)時間における構造、および/または、(例えば、記憶媒体に記憶された1つまたは複数のビットストリーム、またはバッファに記憶された1つまたは複数のパケットを含む)空間における構造でありうる。
[0073]式(6)に示されたように、タスク T100は、周波数領域におけるチャネル信号を生成するために、各周波数において基本セットに変換マトリクスを適用するために実装されうる。方法 M100は、対応する時間領域チャネル信号(例えば、線形PCMストリーム)を生成するために、これらの周波数領域チャネル信号の各々に対して逆周波数変換(例えば、逆FFT)を実行するタスクを含むために実装されうる。
[0074]これらチャネル信号は、HDMI(登録商標)インタフェース(高精細度マルチメディアインタフェース、HDMIライセンス、LLC、サニーヴェール、CA)によって、線形PCMストリームとして搬送されうる。別の例では、これらチャネル信号は、CD、DVD、DVDオーディオ、またはブルーレイ(登録商標)ディスクなどの、光ディスク上に線形PCMストリームとして記憶されうる。ブルーレイディスク(例えば、ブルーレイディスクアプリケーション定義 BD−J、2005年3月、ブルーレイディスク協会、www−dot−blu−raydisc−dot−com、に準拠した光データ記憶媒体)は、MPEG−2トランスポートストリームを含むファイル「zzzzz.m2ts」を含むことができ、ここで、「zzzzz」は、AVストリームファイルをクリップ情報ファイルと関連づける5桁の番号である。ストリームファイル「zzzzz.m2ts」は、複数のエレメンタリオーディオストリーム(elementary audio streams)を含みうる。タスク T200は、LPCMストリームとしてタスク T100によって生成されたチャネル信号の時間領域バージョンを含む、このようなストリームファイルを生成するために実装されうる。
[0075]帯域幅および/または記憶のリソースの使用を低減させるためには、LPCMチャネルストリームを圧縮するために、タスク T200を実装することが望ましくありうる。SHCの基本セットの復元性を保証するためには、ロスレス圧縮スキームを使用してこのような圧縮を実行することが望ましくありうる。1つの例では、タスク T200は、DVDオーディオに準拠したビットストリームを生成するために、メリディアンロスレス圧縮(MLP:Meridian Lossless Packing)を使用してPCMストリームをエンコードするために実装される。別の例では、タスク T200は、AACコアコーデックに対してMPEG−4 SLS(スケーラブル・ツー・ロスレス(Scalable to Lossless))ロスレス拡張を使用して、PCMストリームをエンコードするために実装される。更なる例では、タスク T200は、MLPの改善されたバージョンを使用して7.1オーディオをエンコードするドルビーTrueHD、および/または、ロスレスのオプションで同様に7.1オーディオをエンコードするDTS−HDマスタオーディオ(DTS、Inc.、カラバサス、CA)を使用して、PCMストリームをロスレスにエンコーディングすることによって生成されるエレメンタリオーディオストリームを含むストリームファイル(例えば、上述されたような、ブルーレイ準拠のm2tsファイル)を生成するために実装される。
[0076]タスク T200は、さもなければ、(例えば、トランスコーダ TC10の動作によって、図2Aに例示されるように)チャネル信号を記述する後方互換性のある符号化された信号へとチャネル信号をエンコードするために実装されうる。このようなエンコーディングは、チャネル信号に対してロッシー圧縮スキームを実行することを含みうる。タスク T200のこのような実装において使用されうる後方互換性のあるコーデックの例は、(例えば、ATSC規格:デジタルオーディオ圧縮、Doc.A/52:2012、2012年3月23日、高度テレビジョンシステム委員会、ワシントン、DC、において説明され;また、ATSC A/52またはドルビーデジタルとも呼ばれ、ロッシーMDCT圧縮を使用する)AC3、(ロッシー圧縮のオプションを含む)ドルビーTrueHD、(同様にロッシー圧縮のオプションを含む)DTS−HDマスタオーディオ、およびMPEGサラウンド(MPS、ISO/IEC 14496−3、高効率アドバンストオーディオ符号化すなわちHeAACとも呼ばれ、そこで、5.1フォーマット信号の6つのチャネルは、レンダラにおいて残りのチャネルの合成(synthesis)を可能にする、両耳間レベル差、両耳間時間差、およびチャネル間コヒーレンスなどの、対応するサイド情報(side information)により、モノラルまたはステレオのPCMストリームへダウンミックスされる)を含む。これらのコーデックは、典型的に、入力として時間領域チャネル信号(例えば、線形PCMストリームのセット)を受け入れる。このようなトランスコーディングは、チャネル信号が、多くの消費者向けデバイスおよびセットトップボックス内にあるAC3デコーダとの後方互換性を保持することを可能にする。例えば、エンコードされたチャネルは、所望の対応するチャネルベースのフォーマットに準拠するパケットの対応する部分にパックされうる。
[0077]このようなケースでは、方法 M100は、トランスコードされたビットストリームの1つまたは複数の拡張された部分(例えば、AC3パケットの「auxdata」部分)での送信(および/または記憶)のために、別々に階層的なセットの残り(例えば、サブセットの一部でなかったSHC)をエンコードするために実装されうる。このような動作は、例えば、ビットストリームマルチプレクサ MX10の動作によって、図2Aに例示される。方法 M100のこのような実装については、送信および/または記憶のための2つの異なる後方互換性のあるビットストリームを生成するために、各々がマルチチャネル信号を異なるそれぞれのフォーマットに符号化する、2つ以上の異なるトランスコーディング動作(例えば、AC3トランスコーディングおよびドルビーTrueHDトランスコーディング)を含むことも可能である。
[0078]上述されたように、ドルビーデジタルプラスのビットストリームは、5.1ミックスを有するコア(A)パケットと、7.1ミックスの4つのサラウンドチャネルを有する拡張(B)パケットとを含む。このようなコーデックとの互換性のための方法 M100の実装は、このようなAパケットおよびBパケットにエンコーディングするために、(各周波数についての)7つのSHCの基本セットを7つのチャネルに変換するように構成されたタスク T100の実装を含みうる。このようなケースでは、タスク T200は、拡張されたセットにおいて8番目およびそれ以上のSHCを含むか、あるいは代替として、拡張されたセットにおいて6番目およびそれ以上のSHCを含むために実装されることができ、ここで、拡張されたセットは、1つまたは複数の更なる拡張パケットへとエンコードされうる。
[0079]異なる長さの時間間隔に対応するパケットを生成するために、タスク T200を実装することが望ましくありうる。例えば、より短い間隔が、オーディオ入力における一時的な(transient)イベントをエンコードするために使用されることができ、一方で、より長い間隔は、定常(stationary)信号をエンコードするために使用されることができる。1つのこのような例では、タスク T200は、後方互換性のためにPCMチャネルにおける一定の時間間隔をエンコードするためであるが、異なる間隔長を拡張されたセットにエンコードするために実装される。別のこのような例では、タスク T200は、対応する時間間隔の持続時間のインジケーションとともに、異なる長さの間隔をPCMストリームにエンコードするために実装される。AC−3符号化が使用されるケースでは、例えば、タスク T200は、256サンプルおよび512サンプルの2つのブロック長のオプションの間で切り替えるために実装されうる。
[0080]図2Aに例示されるように、係数の拡張されたセットは、送信および/または記憶のために、エンコードされたチャネル信号と関連づけられる(例えば、多重化される)前に、エンコードされうる。このようなエンコーディングは、帯域圧縮を含みうる。例えば、拡張されたセットは、(例えば、1つまたは複数のコードブックインデックスへの)量子化、誤り訂正符号化、冗長符号化などのような、1つまたは複数のロッシーまたはロスレスの符号化技法、および/またはパケット化を適用することによって(例えば、エンコーダ SE20によって)エンコードされうる。追加または代替として、このようなエンコーディングは、Bフォーマット、Gフォーマット、または高次アンビソニックス(HOA)などの、アンビソニックフォーマットにエンコードすることを含みうる。1つの例では、係数の拡張されたセットは、HOA Bフォーマットにエンコードされ、その後、Bフォーマット信号は、アドバンストオーディオ符号化(AAC;例えば、ISO/IEC 14496−3:2009、「情報テクノロジー−オーディオビジュアルオブジェクトの符号化−パート3:オーディオ」、国際標準化機構、ジェノバ、CH、において定義される)を使用してエンコードされる。(例えば、エンコーダ SE20によって)拡張されたセットに対して実行されうる、SHCのセットをエンコードするための他の方法の説明が、例えば、米国特許出願公開第2012/0155653 A1号(Jax他)および第2012/0314878 A1号(Daniel他)において見つけられうる。係数の拡張されたセットは、例えば、異なる時間における同じ次数の係数の間の差および/または異なる次数の係数の間の差としてエンコードされうる。
[0081](例えば、ストリーミング、ブロードキャスト、マルチキャスト、記憶、および/またはメディアマスタリング(例えば、CD、DVD、およびまたはブルーレイ(登録商標)ディスクのメディアマスタリング)のためのビットストリームを生成するために)ここで説明されるような方法 M100の実装を実行するために、図1Bに示されるようなMPEGエンコーダ MP10を実装することが望ましくありうる。
[0082]後方互換性のあるデータ構造から基底関数係数の完全なセットを得ることは、チャネル信号を得るために(例えば、デマルチプレクサ DX10、トランス−デコーダ TC20、およびシーンベースのデコーダ SD20を介して)任意の介在する符号化レイヤおよび/または領域変換を除去し、その後、これらチャネル信号に対して、(例えば、図3Aに示されるマトリクス IM10のような)上述された可逆変換の逆を適用することによって、類似の方法で実行されうる。図10Aは、一般的な構成による、時間間隔の間の音場を記述する複数の基底関数係数を得る方法 M200のフローチャートを示す。上述されたように、複数の基底関数係数の各々は、直交基底関数のセットのうちの一意的な1つ(例えば、球面調和関数の基底関数のセットのうちの一意的な1つ)に対応しうる。
[0083]方法 M200は、タスク T300およびT 400を含む。データ構造から、タスク T300は、(A)複数の基底関数係数の第2のグループ(「拡張されたセット」)の表現と、(B)第2のグループの該表現とは別である、複数のチャネル信号の表現とを得る。複数のチャネル信号のサブセットの各々は、対応する異なる空間領域(例えば、5.1または7.1フォーマットの同一平面上の方向)と関連づけられ、一方で、複数のチャネル信号はまた、LTEチャネルのような、1つまたは複数の無指向性(または全方向性)の信号を含みうる。周波数領域における複数のチャネル信号のサブセットを得るために、LPCMストリームのセットに対してFFTを実行するために、タスク T300を実装することが望ましくありうる。タスク T400は、複数の基底関数係数の第1のグループ(「基本セット」)を生成するために、複数のチャネル信号のサブセットに対して変換を実行し、ここで、第1のグループは、第2のグループとは異なる。データ構造において係数の拡張されたセットの表現が存在すると検出した際にのみ、方法 M200を実行し、さもなければ、チャネル信号を、それらを係数の基本セットに変換することなく、後方互換性のある方法で(例えば、ラウドスピーカフィードとして)レンダリングすることが望ましくありうる。
[0084]方法 M200は、そこから基本セットが復元された複数のチャネル信号と関連づけられたものとは異なるラウドスピーカの幾何学的配置に、基底関数係数の完全なセットをレンダリングするために実装されうる。図10Bは、タスク T500を含む方法 M200のこのような実装 M210のフローチャートを示す。複数の基底関数係数に基づいて、タスク T500は、第2の複数のチャネル信号を生成する。このケースでは、複数のチャネル信号のサブセットの各信号は、同一平面上の方向のセットのうちの対応する異なる1つと関連づけられ、一方、第2の複数のチャネル信号の各々は、3次元空間に広がる方向のセットのうちの対応する異なる1つと関連づけられる。例えば、第2の複数のチャネル信号は、基準面の上方(above)にあるラウドスピーカ位置に対応するか、さもなければ、高さ情報を提供する、1つまたは複数のチャネルを含みうる。1つの例では、タスク T500は、(例えば、典型的に、いかなる可逆性の制約もないが、式(3)−(6)への参照により)上述されたような、係数の基本セットを後方互換性のあるチャネル信号に変換するための変換マトリクスの導出と類似の方法で得られる、特定のラウドスピーカの幾何学的配置についてのレンダリングマトリクスを適用するために実装される。
[0085]したがって、上記は、要素の階層的なセット(例えば、SHCのセット)と複数のオーディオチャネルとの間で変換するためのロスレスメカニズムを表す。マルチチャネルオーディオ信号が更なる符号化ノイズにさらされない限り、いかなる誤りも生じない(incurred)。(例えば、ロッシー圧縮動作を介して)それらが符号化ノイズにさられるケースでは、SHCへの変換は誤りを生じうる。しかしながら、係数の値をモニタリングし、それらの影響を低減させるための適切なアクションを取ることによって、これらの誤りを考慮する(account for)ことが可能である。これらの方法は、SHC表現における固有の冗長性を含む、SHCの特性を考慮しうる。
[0086]図3Cは、時間間隔の間の音場を記述する複数の基底関数係数を処理するための装置 MF100のブロック図を示す。装置 MF100は、(例えば、タスク T100および変換マトリクス TM10の実装を参照してここで説明されたように、)複数のチャネル信号を生成するために、複数の基底関数係数の第1のグループ(「基本セット」)に対して可逆変換を実行するための手段 F100を含み、ここで、複数のチャネル信号の各々は、対応する異なる空間領域と関連づけられる。装置 MF100はまた、(例えば、タスク T200、トランスコーダ TC10、エンコーダ SE20、およびマルチプレクサ MX10の実装を参照してここで説明されたように、)複数のチャネル信号に基づいて、(A)複数の基底関数係数の第2のグループ(「拡張されたセット」)の表現と、ここで、第2のグループは、第1のグループとは異なり、(B)第2のグループの該表現とは別である、複数のチャネル信号の表現と、を含むデータ構造を生成するための手段 F200を含む。
[0087]図3Dは、時間間隔の間の音場を記述する複数の基底関数係数を処理するための装置 A100のブロック図を示す。装置 A100は、(例えば、タスク T100および変換マトリクス TM10の実装を参照してここで説明されたように、)複数のチャネル信号を生成するために、複数の基底関数係数の第1のグループ(「基本セット」)に対して可逆変換を実行するように構成された計算器100を含み、ここで、複数のチャネル信号の各々は、対応する異なる空間領域と関連づけられる。装置 A100はまた、(例えば、タスク T200、トランスコーダ TC10、エンコーダ SE20、およびマルチプレクサ MX10の実装を参照してここで説明されたように、)複数のチャネル信号に基づいて、(A)複数の基底関数係数の第2のグループ(「拡張されたセット」)の表現と、ここで、第2のグループは、第1のグループとは異なり、(B)第2のグループの該表現とは別である、複数のチャネル信号の表現と、を含むデータ構造を生成するように構成されたデータフォーマッタ200を含む。フォーマッタ200は、パケタイザ(packetizer)を含みうる。
[0088]図11Aは、一般的な構成による、時間間隔の間の音場を記述する複数の基底関数係数を得るための装置 MF200のブロック図を示す。装置 MF200は、(例えば、タスク T300、デマルチプレクサ DX10、トランスコーダ TC20、およびデコーダ SD20の実装を参照してここで説明されたように、)データ構造から、(A)複数の基底関数係数の第2のグループ(「拡張されたセット」)の表現と、(B)第2のグループの該表現とは別である、複数のチャネル信号の表現とを得るための手段 F300を含む。装置 MF200はまた、(例えば、タスク T400および逆変換マトリクス IM10の実装を参照してここで説明されたように、)複数の基底関数係数の第1のグループ(「基本セット」)を生成するために、複数のチャネル信号のサブセットに対して変換を実行するための手段 F400を含み、ここで、第1のグループは、第2のグループとは異なる。図11Bは、(例えば、タスク T500およびレンダラ SR10の実装を参照してここで説明されたように、)複数の基底関数係数に基づいて、第2の複数のチャネル信号を生成するための手段 F500を含む装置 MF200の実装 MF210のフローチャートを示す。
[0089]図11Cは、一般的な構成による、時間間隔の間の音場を記述する複数の基底関数係数を得るための装置 A200のブロック図を示す。装置 A200は、(例えば、タスク T300、デマルチプレクサ DX10、トランスコーダ TC20、およびデコーダ SD20の実装を参照してここで説明されたように、)データ構造から、(A)複数の基底関数係数の第2のグループ(「拡張されたセット」)の表現と、(B)第2のグループの該表現とは別である、複数のチャネル信号の表現とを得るように構成されたデータ抽出器(data extractor)300を含む。抽出器300は、デパケタイザ(depacketizer)を含みうる。装置 A200はまた、(例えば、タスク T400および逆変換マトリクス IM10の実装を参照してここで説明されたように、)複数の基底関数係数の第1のグループ(「基本セット」)を生成するために、複数のチャネル信号のサブセットに対して変換を実行するように構成された計算器400を含み、ここで、第1のグループは、第2のグループとは異なる。図11Dは、(例えば、タスク T500およびレンダラ SR10の実装を参照してここで説明されたように、)複数の基底関数係数に基づいて、第2の複数のチャネル信号を生成するように構成されたレンダラ500を含む装置 A200の実装 A210のフローチャートを示す。
[0090]更なる例では、方法 M100は、2つ以上の基底関数係数のセットを組み合わせるタスクを含むために実装され、ここで、各セットは、対応する時間間隔の間の対応する音場を記述し、タスク T100への入力として組み合わされたセットを提供する。例えば、このようなタスクは、組み合わされた音場の記述を生成するために、(例えば、SHCベクトルの係数ベクトル加法を実行するように)係数の複数のセットを追加するために実装されうる。基底関数係数の各セットは、例えば、オーディオオブジェクトを表しうる。このような基底関数係数のセット(例えば、1つのオブジェクトのためのSHCベクトル)は、(例えば、複数のオブジェクトのうちの別のもののための)基底関数係数の別のセットよりも高い次数(例えば、より長い長さ)を有しうる。例えば、フォアグラウンドにおけるオブジェクト(例えば、主演男優の音声)は、バックグラウンドにおけるオブジェクト(例えば、音響効果)よりも高次のセットで表されうる。
[0091]図11Eは、一般的な構成による装置 P100のためのブロック図を示す。装置 P100は、対応するデータ構造を生成するために、時間間隔の間の音場を記述する複数の基底関数係数に対して、ここで説明されたような方法 M100の実装を実行するように構成されたプロセッサ P10を含む。装置 P100はまた、プロセッサ P10によって生成されたデータ構造を記憶するように構成されたメモリ ME10を含む。
[0092]音響信号を受信するように構成された2つ以上のマイクロフォンのアレイを有する携帯用オーディオ感知デバイス内で、ここで説明されたような方法(例えば、方法 M100またはM200)を実行することが望ましくありうる。このようなアレイを含むために実装されることができ、かつ、録音および/または音声通信アプリケーションのために使用されることができる携帯用オーディオ感知デバイスの例は、電話ハンドセット(例えば、セルラ電話ハンドセット)、ワイヤードまたはワイヤレスのヘッドセット(例えば、Bluetooth(登録商標)ヘッドセット)、ハンドヘルドオーディオおよび/またはビデオレコーダ(例えば、カムコーダ)、オーディオおよび/またはビデオコンテンツを記録するように構成されたパーソナルメディアプレーヤ、携帯情報端末(PDA)または他のハンドヘルドコンピューティングデバイス、およびノートブックコンピュータ、ラップトップコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、あるいはその他の携帯用コンピューティングデバイスを含む。
[0093]ここで開示された方法および装置は、概して、このようなアプリケーションの移動型またはさもなければ携帯型の事例を含む、任意のトランシービングおよび/またはオーディオ感知のアプリケーションにおいて、および/または、遠距離にあるソースからの信号成分の感知の際に適用されうる。例えば、ここで開示された構成の範囲は、符号分割多元接続(CDMA)無線インタフェースを用いるように構成されたワイヤレス電話通信システムに存在する通信デバイスを含む。それにもかかわらず、当業者であれば、ここで説明されたような特徴を有する方法および装置が、ワイヤードおよび/またはワイヤレス(例えば、CDMA、TDMA、FDMA、および/または、TD−SCDMA)の送信チャネル上でボイスオーバーIP(VoIP)を用いるシステムのような、当業者に知られている幅広い範囲の技術を用いる任意の様々な通信システムに存在しうることを理解するであろう。
[0094]ここで開示された通信デバイス(例えば、スマートフォン、タブレットコンピュータ)が、パケット交換(例えば、VoIPのようなプロトコルに従ってオーディオ送信を搬送するように構成されている、ワイヤードおよび/またはワイヤレスネットワーク)および/または回線交換であるネットワークでの使用のために適合されうることは、明確に企図され、ここに開示されている。また、ここで開示された通信デバイスが、狭帯域符号化システム(例えば、約4または5キロヘルツのオーディオ周波数範囲をエンコードするシステム)での使用のために、および/または、全帯域広帯域符号化システムと分割帯域広帯域符号化システムを含む、広帯域符号化システム(例えば、5キロヘルツよりも大きいオーディオ周波数をエンコードするシステム)での使用のために、適合されうることも、明確に企図され、ここに開示されている。
[0095]説明された構成の先の提示は、いかなる当業者であっても、ここに開示された方法および他の構造の製造または使用を可能にするように提供される。ここで説明および示されたフローチャート、ブロック図、および他の構造は、例にすぎず、これらの構造の他の変形もまた、本開示の範囲内にある。これらの構成に対する様々な修正が可能であり、ここで提示された一般的な原理は、他の構成にも適用されうる。したがって、本開示は、上記に示された構成に限定されるようには意図されず、当初の開示の一部を形成する、提出された添付の特許請求の範囲を含む、何らかの形でここに開示された原理および新規な特徴と一致する最も広い範囲を与えられることとなる。
[0096]当業者であれば、情報および信号は、様々な異なる技術および技法のうちの任意のものを用いて表されうることを理解するであろう。例えば、上記説明の全体にわたって参照されうるデータ、命令、コマンド、情報、信号、ビット、およびシンボルは、電圧、電流、電磁波、磁場または磁性粒子、光場または光粒子、あるいはこれらの任意の組み合わせによって表されうる。
[0097]ここで開示されたような構成の実装のための重要な設計要件は、特に、圧縮されたオーディオまたはオーディオビジュアル情報(例えば、ここで識別された例のうちの1つのような、圧縮フォーマットにしたがってエンコードされたファイルまたはストリーム)の再生のような、計算集中的なアプリケーションに対して、または、広帯域通信(例えば、12、16、44.1、48、または192kHzのような、8キロヘルツよりも高いサンプリングレートにおける音声通信)のためのアプリケーションに対して、(典型的には、1秒当たり数百万の命令、すなわちMIPSにおいて測定される)処理遅延および/または計算の複雑さを最小化することを含みうる。
[0098]マルチマイクロフォン処理システムの目的は、全体的なノイズ低減において10ないし12dBを達成すること、所望のスピーカの動きの間の、音声レベルおよび色を保存すること、積極的なノイズ除去、スピーチの残響除去の代わりにノイズがバックグラウンドに移ったとの知覚を得ること、および/または、より積極的なノイズ低減のために後処理のオプションを可能にすることを含みうる。
[0099]ここで開示されたような装置(例えば、任意の装置 A100、A200、A210、MF100、MF200、MF210、およびP100)は、意図されたアプリケーションに適していると思われる、ソフトウェアを有するおよび/またはファームウェアを有するハードウェアの任意の組み合わせにおいて実装されうる。例えば、このような装置の要素は、例えば、同じチップ上またはチップセット中の2つ以上のチップの間に存在する、電子デバイスおよび/または光デバイスとして組み立てられうる。このようなデバイスの1つの例は、トランジスタまたは論理ゲートのような、論理要素の固定アレイまたはプログラマブルアレイであり、任意のこれらの要素が、1つまたは複数のこのようなアレイとして実装されうる。装置の要素のうちの任意の2つ以上またはすべてさえが、同じアレイまたは複数のアレイ内で実装されうる。このようなアレイまたは複数のアレイは、1つまたは複数のチップ内で(例えば、2つ以上のチップを含むチップセット内で)実装されうる。
[0100]ここで開示された装置(例えば、任意の装置 A100、A200、A210、MF100、MF200、MF210、およびP100)の様々な実装の1つまたは複数の要素はまた、マイクロプロセッサ、組み込まれたプロセッサ、IPコア、デジタル信号プロセッサ、FPGA(フィールドプログラマブルゲートアレイ)、ASSP(特定用途向け規格品)、およびASIC(特定用途向け集積回路)などの、論理要素の1つまたは複数の固定アレイまたはプログラマブルアレイ上で実行するように構成された命令の1つまたは複数のセットとして全体的にまたは部分的に実装されうる。ここで開示されたような装置の実装の任意の様々な要素はまた、1つまたは複数のコンピュータ(例えば、「プロセッサ」とも呼ばれる、命令の1つまたは複数のセットまたはシーケンスを実行するようにプログラムされた1つまたは複数のアレイを含む機械)として具現化されることができ、これらの要素のうちの、任意の2つ以上またはすべてさえも、このような同じコンピュータまたは複数のコンピュータ内で実装されることができる。
[0101]ここで開示されたような処理のためのプロセッサまたは他の手段(例えば、プロセッサ P10)は、例えば、同じチップ上またはチップセット中の2つ以上のチップの間に存在する、1つまたは複数の電子デバイスおよび/または光デバイスとして組み立てられうる。このようなデバイスの1つの例は、トランジスタまたは論理ゲートのような、論理要素の固定アレイまたはプログラマブルアレイであり、任意のこれらの要素は、1つまたは複数のこのようなアレイとして実装されうる。このようなアレイまたは複数のアレイは、1つまたは複数のチップ内で(例えば、2つ以上のチップを含むチップセット内で)実装されうる。このようなアレイの例は、マイクロプロセッサ、組み込まれたプロセッサ、IPコア、DSP、FPGA、ASSP、およびASICなどの、論理要素の固定アレイまたはプログラマブルアレイを含む。ここで開示されたようなプロセッサまたは処理のための他の手段はまた、1つまたは複数のコンピュータ(例えば、命令の1つまたは複数のセットまたはシーケンスを実行するようにプログラムされた1つまたは複数のアレイを含む機械)または他のプロセッサとして具現化されうる。プロセッサがその中に組み込まれているデバイスまたはシステム(例えば、オーディオ感知デバイス)の別の動作に関連するタスクのような、ここで説明されたようなオーディオ符号化プロシージャに直接的に関連しない命令の他のセットを実行するか、あるいはタスクを実行するために、ここで説明されたようなプロセッサが使用されることが可能である。ここで開示されたような方法の一部を、オーディオ感知デバイスのプロセッサによって実行し、この方法の別の部分を、1つまたは複数の他のプロセッサの制御下で実行することも可能である。
[0102]当業者であれば、ここで開示された構成に関連して説明された様々な例示的なモジュール、論理ブロック、回路、およびテストおよび他の動作は、電子ハードウェア、コンピュータソフトウェア、または両方の組み合わせとして実装されうることを理解するであろう。このようなモジュール、論理ブロック、回路、および動作は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、ASICまたはASSP、FPGAまたは他のプログラマブル論理デバイス、ディスクリートゲートまたはトランジスタ論理、ディスクリートハードウェアコンポーネント、あるいは、ここで開示されたような構成を生成するように設計されたこれらの任意の組み合わせで実装または実行されうる。例えば、このような構成は、ハードワイヤード回路として、特定用途向け集積回路中に組み立てられた回路構成として、または機械可読コードとしてデータ記憶媒体からあるいはデータ記憶媒体へロードされたソフトウェアプログラムまたは不揮発性記憶装置中にロードされたファームウェアプログラムとして、少なくとも部分的に実装されることができ、このようなコードは、汎用プロセッサまたは他のデジタル信号処理ユニットのような、論理要素のアレイによって実行可能な命令である。汎用プロセッサは、マイクロプロセッサでありうるが、代替において、このプロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、またはステートマシン(state machine)でありうる。プロセッサはまた、例えば、DSPとマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、DSPコアと連携した1つまたは複数のマイクロプロセッサ、あるいはその他任意のこのような構成である、コンピューティングデバイスの組み合わせとして実装されうる。ソフトウェアモジュールは、RAM(ランダムアクセスメモリ)、ROM(読み出し専用メモリ)、フラッシュRAMのような不揮発性RAM(NVRAM)、消去可能プログラマブルROM(EPROM)、電気的消去可能プログラマブルROM(EEPROM)、レジスタ、ハードディスク、リムーバルディスク、またはCD−ROMなどの非一時的な記憶媒体において、あるいは当該技術分野において周知であるその他任意の形態の記憶媒体において存在しうる。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、また記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替において、記憶媒体は、プロセッサと一体化されうる。プロセッサおよび記憶媒体は、ASIC内に存在しうる。ASICは、ユーザ端末内に存在しうる。代替において、プロセッサおよび記憶媒体は、ユーザ端末内にディスクリートコンポーネントとして存在しうる。
[0103]ここで開示された様々な方法(例えば、任意の方法 M100、M200、およびM210)は、プロセッサのような論理要素のアレイによって実行されることができ、また、ここで説明されたような装置の様々な要素は、このようなアレイ上で実行するように設計されたモジュールとして実装されることができることに留意されたい。ここで使用される場合、「モジュール」または「サブモジュール」という用語は、ソフトウェア、ハードウェア、またはファームウェアの形態においてコンピュータ命令(例えば、論理式(logical expressions))を含む、任意の方法、装置、デバイス、ユニットまたはコンピュータ可読データ記憶媒体を指しうる。複数のモジュールまたはシステムを組み合わせて、1つのモジュールまたはシステムにすることができ、ならびに、同じ機能を実行するために、1つのモジュールまたはシステムを、複数のモジュールまたはシステムに分離できることが理解されるべきである。ソフトウェアまたは他のコンピュータ実行可能な命令で実装される場合、プロセスの要素は本質的に、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造、および、これに類するものなどによって、関連するタスクを実行するためのコードセグメントである。「ソフトウェア」という用語は、ソースコード、アセンブリ言語コード、機械コード、バイナリコード、ファームウェア、マクロコード、マイクロコード、論理要素のアレイによって実行可能な命令の任意の1つまたは複数のセットまたはシーケンス、ならびに、このような例の任意の組み合わせを含むことが理解されるべきである。プログラムまたはコードセグメントは、プロセッサ可読記憶媒体中に記憶されることができ、または、送信媒体または通信リンク上で、搬送波で具現化されるコンピュータデータ信号によって送信されることができる。
[0104]ここで開示された方法、スキーム、および技法の実装はまた、論理要素のアレイ(例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有形のステートマシン)を含む機械によって可読および/または実行可能な命令の1つまたは複数のセットとして、(例えば、ここでリストされたような1つまたは複数のコンピュータ可読媒体において)有形的(tangibly)に具現化されうる。「コンピュータ可読媒体」という用語は、揮発性、不揮発性、取り外し可能および取り外し不可能な媒体を含む、情報を記憶または転送しうる任意の媒体を含みうる。コンピュータ可読媒体の例は、電子回路、半導体メモリデバイス、ROM、フラッシュメモリ、消去可能ROM(EROM)、フロッピー(登録商標)ディスケットまたは他の磁気記憶装置、CD−ROM/DVDまたは他の光記憶装置、ハードディスク、光ファイバー媒体、無線周波数(RF)リンク、あるいは、所望の情報を記憶するために使用されることができ、かつアクセスされることができるその他任意の媒体を含む。コンピュータデータ信号は、電子ネットワークチャネル、光ファイバー、無線、電磁気、RFリンクなどのような、送信媒体上で伝搬しうる任意の信号を含みうる。コードセグメントは、インターネットまたはイントラネットのようなコンピュータネットワークを介してダウンロードされうる。任意のケースでは、本開示の範囲は、このような実施形態によって限定されるようには解釈されるべきでない。
[0105]ここで説明された方法のタスクの各々は、直接的に、ハードウェアにおいて、プロセッサによって実行されるソフトウェアモジュールにおいて、またはこれら2つの組み合わせにおいて、具現化されうる。ここで開示されたような方法の実装の典型的なアプリケーションにおいて、論理要素(例えば、論理ゲート)のアレイは、方法の様々なタスクのうちの、1つ、1つより多くのもの、またはすべてさえも、実行するように構成される。タスクのうちの1つまたは複数(場合によってはすべて)は、コード(例えば、命令の1つまたは複数のセット)としても実装されることができ、論理要素のアレイ(例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有形のステートマシン)を含む機械(例えば、コンピュータ)によって可読および/また実行可能なコンピュータプログラム製品(例えば、ディスク、フラッシュまたは他の不揮発性メモリカード、半導体メモリチップなどのような、1つまたは複数のデータ記憶媒体)で具現化されることができる。ここで開示されたような方法の実装のタスクはまた、1つより多くのこのようなアレイまたは機械によって実行されうる。これらのまたは他の実装では、これらタスクは、このような通信能力を有するセルラ電話または他のデバイスなどの、ワイヤレス通信のためのデバイス内で実行されうる。このようなデバイスは、(例えば、VoIPのような1つまたは複数のプロトコルを使用する)回線交換ネットワークおよび/またはパケット交換ネットワークと通信するように構成されうる。例えば、このようなデバイスは、エンコードされたフレームを受信および/または送信するように構成されたRF回路を含みうる。
[0106]ここで開示された様々な方法が、ハンドセット、ヘッドセット、または携帯情報端末(PDA)のような、携帯用通信デバイスによって実行されうること、およびここで説明された様々な装置がこのようなデバイス内に含まれうることが明確に開示される。典型的なリアルタイム(例えば、オンライン)アプリケーションは、このようなモバイルデバイスを使用して実施される電話会話である。
[0107]1つまたは複数の典型的な実施形態では、ここで説明された動作は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの任意の組み合わせにおいて実装されうる。ソフトウェアで実装される場合、このような動作は、コンピュータ可読媒体上で、1つまたは複数の命令またはコードとして記憶または送信されうる。「コンピュータ可読媒体」という用語は、コンピュータ可読記憶媒体と通信(例えば、送信)媒体の両方を含む。限定ではなく例として、コンピュータ可読記憶媒体は、(限定はしないが、動的または静的なRAM、ROM、EEPROM、および/またはフラッシュRAMを含みうる)半導体メモリ、または、強誘電体、磁気抵抗、オボニック(ovonic)、高分子、または相転移メモリのような、記憶要素のアレイ、CD−ROMまたは他の光ディスク記憶装置、および/または磁気ディスク記憶装置または他の磁気記憶デバイスを備えうる。このような記憶媒体は、コンピュータによってアクセスされうる命令またはデータ構造の形態で情報を記憶しうる。通信媒体は、1つの場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む、コンピュータによってアクセスされうる命令またはデータ構造の形態で所望のプログラムコードを搬送するために使用されうる任意の媒体を備えうる。また、任意の接続は、コンピュータ可読媒体と厳密には称されうる。例えば、ソフトウェアが、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、電波、およびマイクロ波のようなワイヤレス技術を使用して、ウェブサイト、サーバ、またはその他の遠隔ソースから送信される場合には、この同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、電波、およびマイクロ波のようなワイヤレス技術は、媒体の定義に含まれる。ここで使用される場合、ディスク(disk)およびディスク(disc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタル多目的ディスク(DVD)、フロッピーディスクおよびブルーレイ(登録商標)ディスク(ブルーレイディスクアソシエィション、ユニバーサルシティ、CA)を含み、ここでディスク(disks)は、通常磁気的にデータを再生し、一方ディスク(discs)は、レーザーを用いて光学的にデータを再生する。上記の組み合わせもまた、コンピュータ可読媒体の範囲内に含まれるべきである。
[0108]ここで説明されたような音響信号処理装置(例えば、装置 A100またはMF100)は、ある動作を制御するためにスピーチ入力を受け入れるか、さもなければ、バックグラウンドノイズからの所望のノイズの分離から利益を得ることができる、通信デバイスのような電子デバイス中に組み込まれることができる。多くのアプリケーションは、複数の方向から生じるバックグラウンドサウンドから、所望のクリアなサウンドをエンハンスするまたは分離することから、利益を得ることができる。このようなアプリケーションは、音声認識と検出、スピーチエンハンスメントと分離、音声によりアクティブ化される制御、およびこれに類するものなどの能力を組み込む電子デバイスまたはコンピューティングデバイスにおけるヒューマンマシンインタフェースを含みうる。限定された処理能力のみを提供するデバイスにおいて適切であるように、このような音響信号処理装置を実装することが望ましくありうる。
[0109]ここで説明されたモジュール、要素、およびデバイスの様々な実装の要素は、例えば、同じチップ上またはチップセット中の2つ以上のチップの間に存在する、電子デバイスおよび/または光デバイスとして組み立てられうる。このようなデバイスの1つの例は、トランジスタまたはゲートのような、論理要素の固定アレイまたはプログラマブルアレイである。ここで説明された装置の様々な実装の1つまたは複数の要素はまた、マイクロプロセッサ、組み込まれたプロセッサ、IPコア、デジタル信号プロセッサ、FPGA、ASSP、およびASICなどの、論理要素の1つまたは複数の固定アレイまたはプログラマブルアレイ上で実行するように構成された命令の1つまたは複数のセットとして全体的にまたは部分的に実装されうる。
[0110]装置がその中に組み込まれているデバイスまたはシステムの別の動作に関連するタスクのような、装置の動作に直接的に関連しない命令の他のセットを実行するか、あるいはタスクを実行するために、ここで説明されたような装置の実装の1つまたは複数の要素が使用されることが可能である。このような装置の実装の1つまたは複数の要素が、共通の構造(例えば、異なる時間において、異なる要素に対応するコードの一部を実行するために使用されるプロセッサ、異なる時間において、異なる要素に対応するタスクを実行するように実行される命令のセット、あるいは、異なる時間において、異なる要素に対する動作を実行する、電子デバイスおよび/または光デバイスの構成)を有することも可能である。

Claims (38)

  1. 時間間隔の間の音場を記述する複数の基底関数係数を処理する方法であって、前記方法は、
    複数のチャネル信号を生成するために、前記複数の基底関数係数の第1のグループに対して可逆変換を実行することと、ここにおいて、前記複数のチャネル信号の各々は、対応する異なる空間領域と関連づけられる、
    前記複数のチャネル信号に基づいて、(A)前記複数の基底関数係数の第2のグループの表現と、ここにおいて、前記第2のグループは、前記第1のグループとは異なり、(B)前記第2のグループの前記表現とは別である、前記複数のチャネル信号の表現と、を含むデータ構造を生成することと
    を備える、方法。
  2. 前記複数の基底関数係数は、球面調和関数の基底関数の複数の係数である、
    請求項1に記載の方法。
  3. 前記複数のチャネル信号は、第1のラウドスピーカ位置と関連づけられた第1のチャネル信号と、前記第1のラウドスピーカ位置とは異なる第2のラウドスピーカ位置と関連づけられた第2のチャネル信号と
    を含む、請求項1に記載の方法。
  4. 前記複数のチャネル信号は、第1の空間方向と関連づけられた第1のチャネル信号と、前記第1の空間方向とは異なる第2の空間方向と関連づけられた第2のチャネル信号と
    を含む、請求項1に記載の方法。
  5. 前記第1のグループの前記係数の各々について、前記係数は、そのエネルギが、第1の平面外の任意の方向に沿うのと少なくとも同じ程度に、前記第1の平面内の少なくとも1つの方向に沿って集中された基底関数に対応し、前記第1の平面は、前記第1および第2の空間方向を含む、
    請求項4に記載の方法。
  6. 前記第1のグループの第1の係数は、全方向性である基底関数に対応し、
    前記第1のグループの他の係数の各々について、前記係数は、そのエネルギが、第1の平面内の少なくとも1つの方向に沿って集中された基底関数に対応し、前記第1の平面は、前記第1および第2の空間方向を含む、
    請求項4に記載の方法。
  7. 前記第2のグループの前記係数の少なくともいくつかの各々について、前記係数は、そのエネルギが、前記第1および第2の空間方向を含む平面外の少なくとも1つの方向に沿って集中された基底関数に対応する、
    請求項4に記載の方法。
  8. 前記複数のチャネル信号は、チャネル信号のセットを含み、前記チャネル信号のセットの各信号は、互いに等間隔を置かれた同一平面上の方向のセットのうちの対応する異なる1つと関連づけられる、
    請求項1に記載の方法。
  9. 前記複数の基底関数係数の中の各々は、前記複数の内の対応する次数を有し、
    前記複数の基底関数係数の前記第1のグループの中の各々について、前記係数の前記次数は、前記複数の基底関数係数の前記第2のグループの前記係数の前記次数の中で最も低いものよりも少ない、
    請求項1に記載の方法。
  10. 前記複数の基底関数係数の中の各々は、前記複数の内の対応する次数を有し、
    前記複数の基底関数係数の前記第2のグループの中の各々について、前記係数の前記次数は、前記複数の基底関数係数の前記第1のグループの前記係数の前記次数の中で最も高いものよりも大きい、
    請求項1に記載の方法。
  11. 前記可逆変換を前記実行することは、(A)前記複数の基底関数係数の前記第1のグループと、(B)可逆マトリクスとの積を計算することを備える、
    請求項1に記載の方法。
  12. 前記データ構造は、前記第2のグループの前記表現を含む第1のストリームと、前記複数のチャネル信号の前記表現を含む第2のストリームと
    を含む、請求項1に記載の方法。
  13. 前記方法は、前記複数のチャネル信号の各々を、時間領域サンプルのシーケンスに変換することを含み、
    前記複数のチャネル信号の前記表現は、前記時間領域サンプルのシーケンスに基づく、
    請求項1に記載の方法。
  14. 前記方法は、前記複数の基底関数係数を生成するために、複数のオーディオ入力信号をエンコードすることを含む、
    請求項1に記載の方法。
  15. 前記複数のオーディオ入力信号の各々は、マイクロフォンアレイの対応するマイクロフォンによって生成される信号に基づく、
    請求項14に記載の方法。
  16. 時間間隔の間の音場を記述する複数の基底関数係数を得る方法であって、前記方法は、
    データ構造から、(A)前記複数の基底関数係数の第2のグループの表現と、(B)前記第2のグループの前記表現とは別である、複数のチャネル信号の表現とを得ることと、ここにおいて、前記複数のチャネル信号のサブセットの各々は、対応する異なる空間領域と関連づけられる、
    前記複数の基底関数係数の第1のグループを生成するために、前記複数のチャネル信号の前記サブセットに対して変換を実行することと、ここにおいて、前記第1のグループは、前記第2のグループとは異なる、
    を備える、方法。
  17. 前記複数の基底関数係数の各々は、直交基底関数のセットのうちの一意的な1つに対応する、
    請求項16に記載の方法。
  18. 前記複数の基底関数係数の各々は、球面調和関数の基底関数のセットのうちの一意的な1つに対応する、
    請求項16に記載の方法。
  19. 前記方法は、前記複数の基底関数係数に基づいて、第2の複数のチャネル信号を生成することを備え、
    前記複数のチャネル信号の前記サブセットの各信号は、同一平面上の方向のセットのうちの対応する異なる1つと関連づけられ、
    前記第2の複数のチャネル信号の各々は、3次元空間に広がる方向のセットのうちの対応する異なる1つと関連づけられる、
    請求項16に記載の方法。
  20. 時間間隔の間の音場を記述する複数の基底関数係数を処理するための装置であって、前記装置は、
    複数のチャネル信号を生成するために、前記複数の基底関数係数の第1のグループに対して可逆変換を実行するための手段と、ここにおいて、前記複数のチャネル信号の各々は、対応する異なる空間領域と関連づけられる、
    前記複数のチャネル信号に基づいて、(A)前記複数の基底関数係数の第2のグループの表現と、ここにおいて、前記第2のグループは、前記第1のグループとは異なり、(B)前記第2のグループの前記表現とは別である、前記複数のチャネル信号の表現と、を含むデータ構造を生成するための手段と
    を備える、装置。
  21. 前記複数の基底関数係数は、球面調和関数の基底関数の複数の係数である、
    請求項20に記載の装置。
  22. 前記複数のチャネル信号は、第1の空間方向と関連づけられた第1のチャネル信号と、前記第1の空間方向とは異なる第2の空間方向と関連づけられた第2のチャネル信号とを含む、
    請求項20に記載の装置。
  23. 前記第2のグループの前記係数の少なくともいくつかの各々について、前記係数は、そのエネルギが、前記第1および第2の空間方向を含む平面外の少なくとも1つの方向に沿って集中された基底関数に対応する、
    請求項20に記載の装置。
  24. 前記複数のチャネル信号は、チャネル信号のセットを含み、前記チャネル信号のセットの各信号は、互いに等間隔を置かれた同一平面上の方向のセットのうちの対応する異なる1つと関連づけられる、
    請求項20に記載の装置。
  25. 前記複数の基底関数係数の中の各々は、前記複数の内の対応する次数を有し、
    前記複数の基底関数係数の前記第1のグループの中の各々について、前記係数の前記次数は、前記複数の基底関数係数の前記第2のグループの前記係数の前記次数の中で最も低いものよりも少ない、
    請求項20に記載の装置。
  26. 前記可逆変換を実行するための前記手段は、(A)前記複数の基底関数係数の前記第1のグループと、(B)可逆マトリクスとの積を計算するための手段を備える、
    請求項20に記載の装置。
  27. 前記装置は、前記複数のチャネル信号の各々を、時間領域サンプルのシーケンスに変換するための手段を含み、
    前記複数のチャネル信号の前記表現は、前記時間領域サンプルのシーケンスに基づく、
    請求項20に記載の装置。
  28. 前記装置は、前記複数の基底関数係数を生成するために、複数のオーディオ入力信号をエンコードするための手段を含む、
    請求項20に記載の装置。
  29. 時間間隔の間の音場を記述する複数の基底関数係数を処理するための装置であって、前記装置は、
    複数のチャネル信号を生成するために、前記複数の基底関数係数の第1のグループに対して可逆変換を実行するように構成された計算器と、ここにおいて、前記複数のチャネル信号の各々は、対応する異なる空間領域と関連づけられる、
    前記複数のチャネル信号に基づいて、(A)前記複数の基底関数係数の第2のグループの表現と、ここにおいて、前記第2のグループは、前記第1のグループとは異なり、(B)前記第2のグループの前記表現とは別である、前記複数のチャネル信号の表現と、を含むデータ構造を生成するように構成されたデータフォーマッタと
    を備える、装置。
  30. 前記複数の基底関数係数は、球面調和関数の基底関数の複数の係数である、
    請求項29に記載の装置。
  31. 前記複数のチャネル信号は、第1の空間方向と関連づけられた第1のチャネル信号と、前記第1の空間方向とは異なる第2の空間方向と関連づけられた第2のチャネル信号と
    を含む、請求項29に記載の装置。
  32. 前記第2のグループの前記係数の少なくともいくつかの各々について、前記係数は、そのエネルギが、前記第1および第2の空間方向を含む平面外の少なくとも1つの方向に沿って集中された基底関数に対応する、
    請求項29に記載の装置。
  33. 前記複数のチャネル信号は、チャネル信号のセットを含み、前記チャネル信号のセットの各信号は、互いに等間隔を置かれた同一平面上の方向のセットのうちの対応する異なる1つと関連づけられる、
    請求項29に記載の装置。
  34. 前記複数の基底関数係数の中の各々は、前記複数の内の対応する次数を有し、
    前記複数の基底関数係数の前記第1のグループの中の各々について、前記係数の前記次数は、前記複数の基底関数係数の前記第2のグループの前記係数の前記次数の中で最も低いものよりも少ない、
    請求項29に記載の装置。
  35. 前記計算器は、(A)前記複数の基底関数係数の前記第1のグループと、(B)可逆マトリクスとの積を計算するように構成される、
    請求項29に記載の装置。
  36. 前記装置は、前記複数のチャネル信号の各々を、時間領域サンプルのシーケンスに変換するように構成された第2の計算器を含み、
    前記複数のチャネル信号の前記表現は、前記時間領域サンプルのシーケンスに基づく、
    請求項29に記載の装置。
  37. 前記装置は、前記複数の基底関数係数を生成するために、複数のオーディオ入力信号をエンコードするように構成されたエンコーダを含む、
    請求項29に記載の装置。
  38. 有形の特徴を読み取る機械に請求項1に記載の方法を実行させる前記特徴を有する非一時的なコンピュータ可読データ記憶媒体。
JP2015521630A 2012-07-15 2013-06-18 後方互換性のあるオーディオ符号化のためのシステム、方法、装置、およびコンピュータ可読媒体 Active JP6105062B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261671789P 2012-07-15 2012-07-15
US61/671,789 2012-07-15
US13/844,447 US9288603B2 (en) 2012-07-15 2013-03-15 Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US13/844,447 2013-03-15
PCT/US2013/046369 WO2014014600A1 (en) 2012-07-15 2013-06-18 Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding

Publications (3)

Publication Number Publication Date
JP2015525897A true JP2015525897A (ja) 2015-09-07
JP2015525897A5 JP2015525897A5 (ja) 2016-06-30
JP6105062B2 JP6105062B2 (ja) 2017-03-29

Family

ID=49914001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015521630A Active JP6105062B2 (ja) 2012-07-15 2013-06-18 後方互換性のあるオーディオ符号化のためのシステム、方法、装置、およびコンピュータ可読媒体

Country Status (9)

Country Link
US (2) US9288603B2 (ja)
EP (1) EP2873252B1 (ja)
JP (1) JP6105062B2 (ja)
KR (2) KR101751241B1 (ja)
CN (1) CN104471960B (ja)
ES (1) ES2734512T3 (ja)
HU (1) HUE044246T2 (ja)
IN (1) IN2014MN02567A (ja)
WO (1) WO2014014600A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180066137A (ko) * 2015-10-08 2018-06-18 돌비 인터네셔널 에이비 압축된 사운드 또는 음장 표현들에 대한 계층화된 코딩
JP2018165841A (ja) * 2013-06-05 2018-10-25 ドルビー・インターナショナル・アーベー オーディオ信号を符号化する方法及び装置並びにオーディオ信号を復号する方法及び装置
JP2022120119A (ja) * 2012-05-14 2022-08-17 ドルビー・インターナショナル・アーベー 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置

Families Citing this family (106)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8788080B1 (en) 2006-09-12 2014-07-22 Sonos, Inc. Multi-channel pairing in a media system
US8483853B1 (en) 2006-09-12 2013-07-09 Sonos, Inc. Controlling and manipulating groupings in a multi-zone media system
US9202509B2 (en) 2006-09-12 2015-12-01 Sonos, Inc. Controlling and grouping in a multi-zone media system
US8923997B2 (en) 2010-10-13 2014-12-30 Sonos, Inc Method and apparatus for adjusting a speaker system
US11265652B2 (en) 2011-01-25 2022-03-01 Sonos, Inc. Playback device pairing
US11429343B2 (en) 2011-01-25 2022-08-30 Sonos, Inc. Stereo playback configuration and control
US8938312B2 (en) 2011-04-18 2015-01-20 Sonos, Inc. Smart line-in processing
US9042556B2 (en) 2011-07-19 2015-05-26 Sonos, Inc Shaping sound responsive to speaker orientation
US8811630B2 (en) 2011-12-21 2014-08-19 Sonos, Inc. Systems, methods, and apparatus to filter audio
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
US9729115B2 (en) 2012-04-27 2017-08-08 Sonos, Inc. Intelligently increasing the sound level of player
US9524098B2 (en) 2012-05-08 2016-12-20 Sonos, Inc. Methods and systems for subwoofer calibration
USD721352S1 (en) 2012-06-19 2015-01-20 Sonos, Inc. Playback device
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9706323B2 (en) 2014-09-09 2017-07-11 Sonos, Inc. Playback device calibration
US9668049B2 (en) 2012-06-28 2017-05-30 Sonos, Inc. Playback device calibration user interfaces
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
US9690539B2 (en) 2012-06-28 2017-06-27 Sonos, Inc. Speaker calibration user interface
US9690271B2 (en) 2012-06-28 2017-06-27 Sonos, Inc. Speaker calibration
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) * 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
CN104471641B (zh) 2012-07-19 2017-09-12 杜比国际公司 用于改善对多声道音频信号的呈现的方法和设备
US8930005B2 (en) 2012-08-07 2015-01-06 Sonos, Inc. Acoustic signatures in a playback system
US8965033B2 (en) 2012-08-31 2015-02-24 Sonos, Inc. Acoustic optimization
US9008330B2 (en) 2012-09-28 2015-04-14 Sonos, Inc. Crossover frequency adjustments for audio speakers
USD721061S1 (en) 2013-02-25 2015-01-13 Sonos, Inc. Playback device
US9769586B2 (en) 2013-05-29 2017-09-19 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients
EP3293734B1 (en) 2013-09-12 2019-05-15 Dolby International AB Decoding of multichannel audio content
KR102381216B1 (ko) 2013-10-21 2022-04-08 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9226087B2 (en) 2014-02-06 2015-12-29 Sonos, Inc. Audio output balancing during synchronized playback
US9226073B2 (en) 2014-02-06 2015-12-29 Sonos, Inc. Audio output balancing during synchronized playback
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
US10068577B2 (en) 2014-04-25 2018-09-04 Dolby Laboratories Licensing Corporation Audio segmentation based on spatial metadata
US9794712B2 (en) 2014-04-25 2017-10-17 Dolby Laboratories Licensing Corporation Matrix decomposition for rendering adaptive audio using high definition audio codecs
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US10134403B2 (en) * 2014-05-16 2018-11-20 Qualcomm Incorporated Crossfading between higher order ambisonic signals
WO2016001355A1 (en) * 2014-07-02 2016-01-07 Thomson Licensing Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a hoa signal representation
KR102363275B1 (ko) 2014-07-02 2022-02-16 돌비 인터네셔널 에이비 Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치
EP2963948A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation
US9838819B2 (en) * 2014-07-02 2017-12-05 Qualcomm Incorporated Reducing correlation between higher order ambisonic (HOA) background channels
EP3164868A1 (en) * 2014-07-02 2017-05-10 Dolby International AB Method and apparatus for decoding a compressed hoa representation, and method and apparatus for encoding a compressed hoa representation
EP2963949A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation
US9367283B2 (en) 2014-07-22 2016-06-14 Sonos, Inc. Audio settings
USD883956S1 (en) 2014-08-13 2020-05-12 Sonos, Inc. Playback device
US9891881B2 (en) 2014-09-09 2018-02-13 Sonos, Inc. Audio processing algorithm database
US10127006B2 (en) 2014-09-09 2018-11-13 Sonos, Inc. Facilitating calibration of an audio playback device
US9910634B2 (en) 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
US9774974B2 (en) * 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US9984693B2 (en) * 2014-10-10 2018-05-29 Qualcomm Incorporated Signaling channels for scalable coding of higher order ambisonic audio data
US10140996B2 (en) 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
US9973851B2 (en) 2014-12-01 2018-05-15 Sonos, Inc. Multi-channel playback of audio content
CN107106603A (zh) * 2015-01-14 2017-08-29 辉瑞大药厂 口服产品
WO2016172593A1 (en) 2015-04-24 2016-10-27 Sonos, Inc. Playback device calibration user interfaces
US10664224B2 (en) 2015-04-24 2020-05-26 Sonos, Inc. Speaker calibration user interface
USD886765S1 (en) 2017-03-13 2020-06-09 Sonos, Inc. Media playback device
USD906278S1 (en) 2015-04-25 2020-12-29 Sonos, Inc. Media player device
US20170085972A1 (en) 2015-09-17 2017-03-23 Sonos, Inc. Media Player and Media Player Design
USD920278S1 (en) 2017-03-13 2021-05-25 Sonos, Inc. Media playback device with lights
USD768602S1 (en) 2015-04-25 2016-10-11 Sonos, Inc. Playback device
WO2016194563A1 (ja) * 2015-06-02 2016-12-08 ソニー株式会社 送信装置、送信方法、メディア処理装置、メディア処理方法および受信装置
US10248376B2 (en) 2015-06-11 2019-04-02 Sonos, Inc. Multiple groupings in a playback system
US9729118B2 (en) 2015-07-24 2017-08-08 Sonos, Inc. Loudness matching
US9538305B2 (en) 2015-07-28 2017-01-03 Sonos, Inc. Calibration error conditions
US9736610B2 (en) 2015-08-21 2017-08-15 Sonos, Inc. Manipulation of playback device response using signal processing
US9712912B2 (en) 2015-08-21 2017-07-18 Sonos, Inc. Manipulation of playback device response using an acoustic filter
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
WO2017049169A1 (en) 2015-09-17 2017-03-23 Sonos, Inc. Facilitating calibration of an audio playback device
US9961475B2 (en) 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from object-based audio to HOA
US10249312B2 (en) 2015-10-08 2019-04-02 Qualcomm Incorporated Quantization of spatial vectors
US9961467B2 (en) 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from channel-based audio to HOA
US9881628B2 (en) * 2016-01-05 2018-01-30 Qualcomm Incorporated Mixed domain coding of audio
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US9886234B2 (en) 2016-01-28 2018-02-06 Sonos, Inc. Systems and methods of distributing audio to one or more playback devices
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
US9860670B1 (en) 2016-07-15 2018-01-02 Sonos, Inc. Spectral correction using spatial calibration
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
US9913061B1 (en) 2016-08-29 2018-03-06 The Directv Group, Inc. Methods and systems for rendering binaural audio content
US10412473B2 (en) 2016-09-30 2019-09-10 Sonos, Inc. Speaker grill with graduated hole sizing over a transition area for a media device
USD827671S1 (en) 2016-09-30 2018-09-04 Sonos, Inc. Media playback device
USD851057S1 (en) 2016-09-30 2019-06-11 Sonos, Inc. Speaker grill with graduated hole sizing over a transition area for a media device
US10712997B2 (en) 2016-10-17 2020-07-14 Sonos, Inc. Room association based on name
CN108200003B (zh) * 2016-12-08 2021-05-28 武汉斗鱼网络科技有限公司 一种音频数据的混合处理方法及装置
EP3566473B8 (en) * 2017-03-06 2022-06-15 Dolby International AB Integrated reconstruction and rendering of audio signals
GB2566992A (en) * 2017-09-29 2019-04-03 Nokia Technologies Oy Recording and rendering spatial audio signals
EP3756355A1 (en) * 2018-02-22 2020-12-30 Dolby International AB Method and apparatus for processing of auxiliary media streams embedded in a mpeg-h 3d audio stream
US10602298B2 (en) * 2018-05-15 2020-03-24 Microsoft Technology Licensing, Llc Directional propagation
US11062713B2 (en) 2018-06-25 2021-07-13 Qualcomm Incorported Spatially formatted enhanced audio data for backward compatible audio bitstreams
US20200013426A1 (en) * 2018-07-03 2020-01-09 Qualcomm Incorporated Synchronizing enhanced audio transports with backward compatible audio transports
US11081116B2 (en) * 2018-07-03 2021-08-03 Qualcomm Incorporated Embedding enhanced audio transports in backward compatible audio bitstreams
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device
US10932081B1 (en) 2019-08-22 2021-02-23 Microsoft Technology Licensing, Llc Bidirectional propagation of sound
CN113220287B (zh) * 2021-05-19 2024-06-11 类人思维(山东)智慧科技有限公司 计算机自动编程方法、***、终端及存储介质
US11877143B2 (en) 2021-12-03 2024-01-16 Microsoft Technology Licensing, Llc Parameterized modeling of coherent and incoherent sound

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012059385A1 (en) * 2010-11-05 2012-05-10 Thomson Licensing Data structure for higher order ambisonics audio data

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09244663A (ja) 1996-03-04 1997-09-19 Taimuuea:Kk 過渡応答信号生成方法、音響再生方法及び装置
US6577738B2 (en) 1996-07-17 2003-06-10 American Technology Corporation Parametric virtual speaker and surround-sound system
US6072878A (en) 1997-09-24 2000-06-06 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
EP1275272B1 (en) 2000-04-19 2012-11-21 SNK Tech Investment L.L.C. Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
US7660424B2 (en) 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US20030007648A1 (en) 2001-04-27 2003-01-09 Christopher Currell Virtual audio system and techniques
FR2847376B1 (fr) * 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US7558393B2 (en) 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
WO2005098821A2 (en) 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
DE102004042819A1 (de) 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US20090313029A1 (en) * 2006-07-14 2009-12-17 Anyka (Guangzhou) Software Technologiy Co., Ltd. Method And System For Backward Compatible Multi Channel Audio Encoding and Decoding with the Maximum Entropy
WO2008063034A1 (en) 2006-11-24 2008-05-29 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
EP2094032A1 (en) 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
GB0817950D0 (en) 2008-10-01 2008-11-05 Univ Southampton Apparatus and method for sound reproduction
ES2733878T3 (es) 2008-12-15 2019-12-03 Orange Codificación mejorada de señales de audio digitales multicanales
US8332229B2 (en) * 2008-12-30 2012-12-11 Stmicroelectronics Asia Pacific Pte. Ltd. Low complexity MPEG encoding for surround sound recordings
GB2476747B (en) 2009-02-04 2011-12-21 Richard Furse Sound system
JP5163545B2 (ja) 2009-03-05 2013-03-13 富士通株式会社 オーディオ復号装置及びオーディオ復号方法
WO2011104463A1 (fr) 2010-02-26 2011-09-01 France Telecom Compression de flux audio multicanal
CN102823277B (zh) 2010-03-26 2015-07-15 汤姆森特许公司 解码用于音频回放的音频声场表示的方法和装置
NZ587483A (en) 2010-08-20 2012-12-21 Ind Res Ltd Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions
WO2012025580A1 (en) 2010-08-27 2012-03-01 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
US20120093323A1 (en) 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
WO2012122397A1 (en) 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
EP2541547A1 (en) 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
WO2013068402A1 (en) 2011-11-10 2013-05-16 Sonicemotion Ag Method for practical implementations of sound field reproduction based on surface integrals in three dimensions
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9190065B2 (en) 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
CN104584588B (zh) 2012-07-16 2017-03-29 杜比国际公司 用于渲染音频声场表示以供音频回放的方法和设备
CN104471641B (zh) 2012-07-19 2017-09-12 杜比国际公司 用于改善对多声道音频信号的呈现的方法和设备
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9131298B2 (en) 2012-11-28 2015-09-08 Qualcomm Incorporated Constrained dynamic amplitude panning in collaborative sound systems
US9736609B2 (en) 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
US9412385B2 (en) 2013-05-28 2016-08-09 Qualcomm Incorporated Performing spatial masking with respect to spherical harmonic coefficients
EP2866475A1 (en) 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012059385A1 (en) * 2010-11-05 2012-05-10 Thomson Licensing Data structure for higher order ambisonics audio data

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022120119A (ja) * 2012-05-14 2022-08-17 ドルビー・インターナショナル・アーベー 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置
US11792591B2 (en) 2012-05-14 2023-10-17 Dolby Laboratories Licensing Corporation Method and apparatus for compressing and decompressing a higher order Ambisonics signal representation
JP7471344B2 (ja) 2012-05-14 2024-04-19 ドルビー・インターナショナル・アーベー 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置
JP2018165841A (ja) * 2013-06-05 2018-10-25 ドルビー・インターナショナル・アーベー オーディオ信号を符号化する方法及び装置並びにオーディオ信号を復号する方法及び装置
KR20180066137A (ko) * 2015-10-08 2018-06-18 돌비 인터네셔널 에이비 압축된 사운드 또는 음장 표현들에 대한 계층화된 코딩
KR102661914B1 (ko) 2015-10-08 2024-04-30 돌비 인터네셔널 에이비 압축된 사운드 또는 음장 표현들에 대한 계층화된 코딩
US12020714B2 (en) 2015-10-08 2024-06-25 Dolby International Ab Layered coding for compressed sound or sound field represententations

Also Published As

Publication number Publication date
JP6105062B2 (ja) 2017-03-29
CN104471960A (zh) 2015-03-25
US9788133B2 (en) 2017-10-10
EP2873252B1 (en) 2019-04-10
KR20150038095A (ko) 2015-04-08
ES2734512T3 (es) 2019-12-10
EP2873252A1 (en) 2015-05-20
US9288603B2 (en) 2016-03-15
KR101751241B1 (ko) 2017-06-27
US20140016784A1 (en) 2014-01-16
CN104471960B (zh) 2017-03-08
IN2014MN02567A (ja) 2015-07-24
KR101993587B1 (ko) 2019-06-27
WO2014014600A1 (en) 2014-01-23
KR20170075025A (ko) 2017-06-30
HUE044246T2 (hu) 2019-10-28
US20160219389A1 (en) 2016-07-28

Similar Documents

Publication Publication Date Title
JP6105062B2 (ja) 後方互換性のあるオーディオ符号化のためのシステム、方法、装置、およびコンピュータ可読媒体
US9473870B2 (en) Loudspeaker position compensation with 3D-audio hierarchical coding
US9478225B2 (en) Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
KR102516625B1 (ko) 몰입형 오디오를 캡처하고, 인코딩하고, 분산하고, 디코딩하기 위한 시스템 및 방법
US9761229B2 (en) Systems, methods, apparatus, and computer-readable media for audio object clustering
AU2015330758B2 (en) Signaling layers for scalable coding of higher order ambisonic audio data
EP3204942B1 (en) Signaling channels for scalable coding of higher order ambisonic audio data
US20140086416A1 (en) Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
CN112823534B (zh) 信号处理设备和方法以及程序

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160511

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160511

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20160511

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170301

R150 Certificate of patent or registration of utility model

Ref document number: 6105062

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250