JP6380389B2 - 符号化装置および方法、復号装置および方法、並びにプログラム - Google Patents
符号化装置および方法、復号装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JP6380389B2 JP6380389B2 JP2015519803A JP2015519803A JP6380389B2 JP 6380389 B2 JP6380389 B2 JP 6380389B2 JP 2015519803 A JP2015519803 A JP 2015519803A JP 2015519803 A JP2015519803 A JP 2015519803A JP 6380389 B2 JP6380389 B2 JP 6380389B2
- Authority
- JP
- Japan
- Prior art keywords
- position information
- encoding
- mode
- information
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 158
- 238000012545 processing Methods 0.000 claims description 87
- 238000007906 compression Methods 0.000 claims description 69
- 230000006835 compression Effects 0.000 claims description 63
- 238000013139 quantization Methods 0.000 claims description 52
- 230000001133 acceleration Effects 0.000 claims description 22
- 230000033001 locomotion Effects 0.000 description 137
- 238000000605 extraction Methods 0.000 description 32
- 238000005516 engineering process Methods 0.000 description 19
- 239000000284 extract Substances 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/005—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo five- or more-channel type, e.g. virtual surround
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/02—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
〈オーディオシステムの構成例〉
本技術は、音源の位置を示す情報など、音源に関する情報であるメタデータのデータ量を圧縮するための符号化および復号に関するものである。図1は、本技術を適用したオーディオシステムの一実施の形態の構成例を示す図である。
まずメタデータについて説明する。
(D1)オブジェクトを示すインデックス
(D2)オブジェクトの水平方向角度θ
(D3)オブジェクトの垂直方向角度γ
(D4)オブジェクトから視聴者までの距離r
(D5)オブジェクトの音声のゲインg
次に、上述したメタデータの符号化について説明する。
(E2)量子化された位置情報およびゲインを、さらに符号化モードに応じて圧縮する
(F2)運動パターン予測モード
(F3)残差モード
続いて、メタデータの符号化時における1段階目の処理と2段階目の処理について、より詳細に説明する。
次に、2段階目の符号化処理について説明する。
以上においては、符号化モードによる符号化によって得られた位置情報やゲイン、差分(残差)などのデータが符号化された位置情報またはゲインとされ、符号化された位置情報やゲインと符号化モード情報とがビットストリームに記述されると説明した。
(G2)符号化モードに変更があった位置情報またはゲインのみ符号化モード情報を記述する
次に、メタデータを符号化する符号化装置であるメタデータエンコーダ22の具体的な実施の形態について説明する。
続いて、図4のメタデータエンコーダ22の動作について説明する。
次に、図6のフローチャートを参照して、図5のステップS15の処理に対応する運動パターン予測モードによる符号化処理について説明する。
続いて、図7のフローチャートを参照して、図5のステップS16の処理に対応する残差モードによる符号化処理について説明する。なお、この処理では、処理対象とされているオブジェクトの水平方向角度θ、垂直方向角度γ、およびゲインgのそれぞれが処理対象とされ、それらの処理対象ごとに処理が行なわれる。
さらに、図8のフローチャートを参照して、図5のステップS18の処理に対応する符号化モード情報圧縮処理について説明する。
ところで、メタデータエンコーダ22において図5を参照して説明した符号化処理が繰り返し行なわれている間には、1フレーム分の符号化処理が行なわれた直後に、または符号化処理とほぼ同時に選択運動パターン予測モードを入れ替える入れ替え処理が行なわれる。
続いて、メタデータエンコーダ22から出力されたビットストリームを受信して、符号化メタデータを復号する復号装置であるメタデータデコーダ32について説明する。
次に、メタデータデコーダ32の動作について説明する。
〈メタデータエンコーダの構成例〉
なお、以上においては、量子化のステップサイズRなどにより定まる量子化ビット数や、差分と比較する閾値として用いられるビット数Mを予め定めておく場合について説明した。しかし、これらのビット数はオブジェクトの位置やゲイン、オーディオデータの特徴、または符号化されたメタデータとオーディオデータの情報を含めたビットストリームのビットレートなどに応じて動的に変更されるようにしてもよい。
次に、図13のフローチャートを参照して、図12に示したメタデータエンコーダ22により行なわれる符号化処理について説明する。
所定の時刻における音源の位置情報を、前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化する符号化部と、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定する決定部と、
前記決定部により決定された前記符号化モードを示す符号化モード情報と、前記決定部により決定された前記符号化モードにより符号化された前記位置情報とを出力する出力部と
を備える符号化装置。
[2]
前記符号化モードは、前記位置情報をそのまま前記符号化された前記位置情報とするRAWモード、前記音源が静止しているとして前記位置情報を符号化する静止モード、前記音源が等速度で移動しているとして前記位置情報を符号化する等速度モード、前記音源が等加速度で移動しているとして前記位置情報を符号化する等加速度モード、または前記位置情報の残差に基づいて前記位置情報を符号化する残差モードである
[1]に記載の符号化装置。
[3]
前記位置情報は前記音源の位置を表す水平方向角度、垂直方向角度、または距離である
[1]または[2]に記載の符号化装置。
[4]
前記残差モードにより符号化された前記位置情報は、前記位置情報としての角度の差分を示す情報である
[2]に記載の符号化装置。
[5]
前記出力部は、複数の前記音源について、前記所定の時刻における全ての前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと同じである場合、前記符号化モード情報を出力しない
[1]乃至[4]の何れかに記載の符号化装置。
[6]
前記出力部は、前記所定の時刻において、複数の前記音源のうちの一部の前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと異なる場合、全ての前記符号化モード情報のうち、前記直前の時刻とは前記符号化モードが異なる前記音源の前記位置情報の前記符号化モード情報のみを出力する
[1]乃至[5]の何れかに記載の符号化装置。
[7]
前記位置情報を所定の量子化幅で量子化する量子化部と、
前記音源のオーディオデータの特徴量に基づいて、前記量子化幅を決定する圧縮率決定部と
をさらに備え、
前記符号化部は、量子化された前記位置情報を符号化する
[1]乃至[6]の何れかに記載の符号化装置。
[8]
過去に出力した前記符号化モード情報および前記符号化された前記位置情報のデータ量に基づいて、前記位置情報を符号化する前記符号化モードの入れ替えを行なう切替部をさらに備える
[1]乃至[7]の何れかに記載の符号化装置。
[9]
前記符号化部は、前記音源のゲインをさらに符号化し、
前記出力部は、前記ゲインの前記符号化モード情報と、符号化された前記ゲインとをさらに出力する
[1]乃至[8]の何れかに記載の符号化装置。
[10]
所定の時刻における音源の位置情報を、前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化し、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定し、
決定された前記符号化モードを示す符号化モード情報と、決定された前記符号化モードにより符号化された前記位置情報とを出力する
ステップを含む符号化方法。
[11]
所定の時刻における音源の位置情報を、前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化し、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定し、
決定された前記符号化モードを示す符号化モード情報と、決定された前記符号化モードにより符号化された前記位置情報とを出力する
ステップを含む処理をコンピュータに実行させるプログラム。
[12]
所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得する取得部と、
前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する復号部と
を備える復号装置。
[13]
前記符号化モードは、前記位置情報をそのまま前記符号化された前記位置情報とするRAWモード、前記音源が静止しているとして前記位置情報を符号化する静止モード、前記音源が等速度で移動しているとして前記位置情報を符号化する等速度モード、前記音源が等加速度で移動しているとして前記位置情報を符号化する等加速度モード、または前記位置情報の残差に基づいて前記位置情報を符号化する残差モードである
[12]に記載の復号装置。
[14]
前記位置情報は前記音源の位置を表す水平方向角度、垂直方向角度、または距離である
[12]または[13]に記載の復号装置。
[15]
前記残差モードにより符号化された前記位置情報は、前記位置情報としての角度の差分を示す情報である
[13]に記載の復号装置。
[16]
前記取得部は、複数の前記音源について、前記所定の時刻における全ての前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと同じである場合、前記符号化された前記位置情報のみを取得する
[12]乃至[15]の何れかに記載の復号装置。
[17]
前記取得部は、前記所定の時刻において、複数の前記音源のうちの一部の前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと異なる場合、前記符号化された前記位置情報と、前記直前の時刻とは前記符号化モードが異なる前記音源の前記位置情報の前記符号化モード情報とを取得する
[12]乃至[16]の何れかに記載の復号装置。
[18]
前記取得部は、前記音源のオーディオデータの特徴量に基づいて決定された、前記位置情報の符号化時に前記位置情報を量子化した量子化幅を示す情報をさらに取得する
[12]乃至[17]の何れかに記載の復号装置。
[19]
所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得し、
前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する
ステップを含む復号方法。
[20]
所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得し、
前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する
ステップを含む処理をコンピュータに実行させるプログラム。
Claims (20)
- 取得された所定の時刻における音源の位置情報を、既に取得されて記録されている前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化する符号化部と、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定する決定部と、
前記決定部により決定された前記符号化モードを示す符号化モード情報と、前記決定部により決定された前記符号化モードにより符号化された前記位置情報とを出力する出力部と
を備える符号化装置。 - 前記符号化モードは、前記位置情報をそのまま前記符号化された前記位置情報とするRAWモード、前記音源が静止しているとして前記位置情報を符号化する静止モード、前記音源が等速度で移動しているとして前記位置情報を符号化する等速度モード、前記音源が等加速度で移動しているとして前記位置情報を符号化する等加速度モード、または前記位置情報の残差に基づいて前記位置情報を符号化する残差モードである
請求項1に記載の符号化装置。 - 前記位置情報は前記音源の位置を表す水平方向角度、垂直方向角度、または距離である
請求項1または請求項2に記載の符号化装置。 - 前記残差モードにより符号化された前記位置情報は、前記位置情報としての角度の差分を示す情報である
請求項2に記載の符号化装置。 - 前記出力部は、複数の前記音源について、前記所定の時刻における全ての前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと同じである場合、前記符号化モード情報を出力しない
請求項1乃至請求項4の何れか一項に記載の符号化装置。 - 前記出力部は、前記所定の時刻において、複数の前記音源のうちの一部の前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと異なる場合、全ての前記符号化モード情報のうち、前記直前の時刻とは前記符号化モードが異なる前記音源の前記位置情報の前記符号化モード情報のみを出力する
請求項1乃至請求項5の何れか一項に記載の符号化装置。 - 前記位置情報を所定の量子化幅で量子化する量子化部と、
前記音源のオーディオデータの特徴量に基づいて、前記量子化幅を決定する圧縮率決定部と
をさらに備え、
前記符号化部は、量子化された前記位置情報を符号化する
請求項1乃至請求項6の何れか一項に記載の符号化装置。 - 過去に出力した前記符号化モード情報および前記符号化された前記位置情報のデータ量に基づいて、前記位置情報を符号化する前記符号化モードの入れ替えを行なう切替部をさ
らに備える
請求項1乃至請求項7の何れか一項に記載の符号化装置。 - 前記符号化部は、前記音源のゲインをさらに符号化し、
前記出力部は、前記ゲインの前記符号化モード情報と、符号化された前記ゲインとをさらに出力する
請求項1乃至請求項8の何れか一項に記載の符号化装置。 - 取得された所定の時刻における音源の位置情報を、既に取得されて記録されている前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化し、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定し、
決定された前記符号化モードを示す符号化モード情報と、決定された前記符号化モードにより符号化された前記位置情報とを出力する
ステップを含む符号化方法。 - 取得された所定の時刻における音源の位置情報を、既に取得されて記録されている前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、所定の符号化モードにより符号化し、
複数の前記符号化モードのうちの1つを前記位置情報の前記符号化モードとして決定し、
決定された前記符号化モードを示す符号化モード情報と、決定された前記符号化モードにより符号化された前記位置情報とを出力する
ステップを含む処理をコンピュータに実行させるプログラム。 - 所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得する取得部と、
復号により得られ、記録されている前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する復号部と
を備える復号装置。 - 前記符号化モードは、前記位置情報をそのまま前記符号化された前記位置情報とするRAWモード、前記音源が静止しているとして前記位置情報を符号化する静止モード、前記音源が等速度で移動しているとして前記位置情報を符号化する等速度モード、前記音源が等加速度で移動しているとして前記位置情報を符号化する等加速度モード、または前記位置情報の残差に基づいて前記位置情報を符号化する残差モードである
請求項12に記載の復号装置。 - 前記位置情報は前記音源の位置を表す水平方向角度、垂直方向角度、または距離である
請求項12または請求項13に記載の復号装置。 - 前記残差モードにより符号化された前記位置情報は、前記位置情報としての角度の差分を示す情報である
請求項13に記載の復号装置。 - 前記取得部は、複数の前記音源について、前記所定の時刻における全ての前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと同じである場合、前記符号化された前記位置情報のみを取得する
請求項12乃至請求項15の何れか一項に記載の復号装置。 - 前記取得部は、前記所定の時刻において、複数の前記音源のうちの一部の前記音源の前記位置情報の前記符号化モードが、前記所定の時刻の直前の時刻における前記符号化モードと異なる場合、前記符号化された前記位置情報と、前記直前の時刻とは前記符号化モードが異なる前記音源の前記位置情報の前記符号化モード情報とを取得する
請求項12乃至請求項16の何れか一項に記載の復号装置。 - 前記取得部は、前記音源のオーディオデータの特徴量に基づいて決定された、前記位置情報の符号化時に前記位置情報を量子化した量子化幅を示す情報をさらに取得する
請求項12乃至請求項17の何れか一項に記載の復号装置。 - 所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得し、
復号により得られ、記録されている前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する
ステップを含む復号方法。 - 所定の時刻における音源の符号化された位置情報と、複数の符号化モードのうちの前記位置情報を符号化した符号化モードを示す符号化モード情報とを取得し、
復号により得られ、記録されている前記所定の時刻よりも前の時刻における前記音源の前記位置情報に基づいて、前記符号化モード情報により示される前記符号化モードに対応する方式で、前記所定の時刻における前記符号化された前記位置情報を復号する
ステップを含む処理をコンピュータに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013115724 | 2013-05-31 | ||
JP2013115724 | 2013-05-31 | ||
PCT/JP2014/063409 WO2014192602A1 (ja) | 2013-05-31 | 2014-05-21 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2014192602A1 JPWO2014192602A1 (ja) | 2017-02-23 |
JP6380389B2 true JP6380389B2 (ja) | 2018-08-29 |
Family
ID=51988635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015519803A Expired - Fee Related JP6380389B2 (ja) | 2013-05-31 | 2014-05-21 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US9805729B2 (ja) |
EP (1) | EP3007168A4 (ja) |
JP (1) | JP6380389B2 (ja) |
CN (1) | CN105229734B (ja) |
TW (1) | TWI615834B (ja) |
WO (1) | WO2014192602A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015080967A1 (en) * | 2013-11-28 | 2015-06-04 | Dolby Laboratories Licensing Corporation | Position-based gain adjustment of object-based audio and ring-based channel audio |
CN106774930A (zh) * | 2016-12-30 | 2017-05-31 | 中兴通讯股份有限公司 | 一种数据处理方法、装置及采集设备 |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
AU2018368589B2 (en) * | 2017-11-17 | 2021-10-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding |
EP3767949A1 (en) * | 2018-03-15 | 2021-01-20 | Sony Corporation | Device and method for processing image |
US11540075B2 (en) | 2018-04-10 | 2022-12-27 | Gaudio Lab, Inc. | Method and device for processing audio signal, using metadata |
US20210176582A1 (en) | 2018-04-12 | 2021-06-10 | Sony Corporation | Information processing apparatus and method, and program |
GB2582916A (en) * | 2019-04-05 | 2020-10-14 | Nokia Technologies Oy | Spatial audio representation and associated rendering |
GB2585187A (en) * | 2019-06-25 | 2021-01-06 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
US20220383881A1 (en) * | 2021-05-27 | 2022-12-01 | Qualcomm Incorporated | Audio encoding based on link data |
WO2023212880A1 (zh) * | 2022-05-05 | 2023-11-09 | 北京小米移动软件有限公司 | 音频处理方法、装置及存储介质 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
AU2547201A (en) * | 2000-01-11 | 2001-07-24 | Matsushita Electric Industrial Co., Ltd. | Multi-mode voice encoding device and decoding device |
CN1288625C (zh) * | 2002-01-30 | 2006-12-06 | 松下电器产业株式会社 | 音频编码与解码设备及其方法 |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
CN101356573B (zh) * | 2006-01-09 | 2012-01-25 | 诺基亚公司 | 对双耳音频信号的解码的控制 |
KR20070077652A (ko) * | 2006-01-24 | 2007-07-27 | 삼성전자주식회사 | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 |
CA2646278A1 (en) * | 2006-02-09 | 2007-08-16 | Lg Electronics Inc. | Method for encoding and decoding object-based audio signal and apparatus thereof |
US7876904B2 (en) * | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
EP2575130A1 (en) * | 2006-09-29 | 2013-04-03 | Electronics and Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
CN101197134A (zh) * | 2006-12-05 | 2008-06-11 | 华为技术有限公司 | 消除编码模式切换影响的方法和装置以及解码方法和装置 |
KR100964402B1 (ko) * | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
EP2097895A4 (en) * | 2006-12-27 | 2013-11-13 | Korea Electronics Telecomm | DEVICE AND METHOD FOR ENCODING AND DECODING MULTI-OBJECT AUDIO SIGNAL WITH DIFFERENT CHANNELS WITH INFORMATION BIT RATE CONVERSION |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
KR20090110242A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 신호를 처리하는 방법 및 장치 |
CN102318373B (zh) * | 2009-03-26 | 2014-09-10 | 松下电器产业株式会社 | 解码装置、编解码装置及解码方法 |
US9026450B2 (en) * | 2011-03-09 | 2015-05-05 | Dts Llc | System for dynamically creating and rendering audio objects |
KR102394141B1 (ko) * | 2011-07-01 | 2022-05-04 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 향상된 3d 오디오 오서링과 렌더링을 위한 시스템 및 툴들 |
TWI543642B (zh) * | 2011-07-01 | 2016-07-21 | 杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
-
2014
- 2014-05-20 TW TW103117629A patent/TWI615834B/zh not_active IP Right Cessation
- 2014-05-21 CN CN201480029798.0A patent/CN105229734B/zh not_active Expired - Fee Related
- 2014-05-21 WO PCT/JP2014/063409 patent/WO2014192602A1/ja active Application Filing
- 2014-05-21 EP EP14803533.0A patent/EP3007168A4/en not_active Ceased
- 2014-05-21 US US14/893,909 patent/US9805729B2/en active Active
- 2014-05-21 JP JP2015519803A patent/JP6380389B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP3007168A4 (en) | 2017-01-25 |
WO2014192602A1 (ja) | 2014-12-04 |
US9805729B2 (en) | 2017-10-31 |
US20160133261A1 (en) | 2016-05-12 |
CN105229734B (zh) | 2019-08-20 |
EP3007168A1 (en) | 2016-04-13 |
JPWO2014192602A1 (ja) | 2017-02-23 |
TW201503113A (zh) | 2015-01-16 |
CN105229734A (zh) | 2016-01-06 |
TWI615834B (zh) | 2018-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6380389B2 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
US11081117B2 (en) | Methods, apparatus and systems for encoding and decoding of multi-channel Ambisonics audio data | |
CN106415714B (zh) | 译码环境高阶立体混响系数的独立帧 | |
KR101921403B1 (ko) | 고차 앰비소닉 신호 압축 | |
US9058803B2 (en) | Multichannel audio stream compression | |
CN106133828B (zh) | 编码装置和编码方法、解码装置和解码方法及存储介质 | |
JP2009524108A (ja) | 拡張帯域周波数コーディングによる複素変換チャネルコーディング | |
KR102493482B1 (ko) | 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품 | |
WO2015146860A1 (ja) | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム | |
JP2022509440A (ja) | 空間オーディオパラメータの符号化及び対応する復号の決定 | |
CN106471578A (zh) | 较高阶立体混响信号之间的交叉淡化 | |
TW201606751A (zh) | 將高階保真立體音響信號表示之次頻帶內主導方向信號之方向編碼/解碼之方法及裝置 | |
US20240185872A1 (en) | Method and apparatus for decoding a bitstream including encoded higher order ambisonics representations | |
WO2021003570A1 (en) | Method and system for coding metadata in audio streams and for efficient bitrate allocation to audio streams coding | |
KR20220018588A (ko) | DirAC 기반 공간 오디오 코딩을 위한 패킷 손실 은닉 | |
TW202107451A (zh) | 基於操作條件執行心理聲學音訊寫碼 | |
US9781539B2 (en) | Encoding device and method, decoding device and method, and program | |
CN113129913B (zh) | 音频信号的编解码方法和编解码装置 | |
KR20230020554A (ko) | 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품 | |
Yang et al. | Multi-stage encoding scheme for multiple audio objects using compressed sensing | |
US20080137739A1 (en) | Method and Apparatus for Predicting the Size of a Compressed Signal | |
JP2017078860A (ja) | 音声符号化装置および音声符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170512 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170512 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180716 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6380389 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |