JP2006050241A - Decoder - Google Patents

Decoder Download PDF

Info

Publication number
JP2006050241A
JP2006050241A JP2004228227A JP2004228227A JP2006050241A JP 2006050241 A JP2006050241 A JP 2006050241A JP 2004228227 A JP2004228227 A JP 2004228227A JP 2004228227 A JP2004228227 A JP 2004228227A JP 2006050241 A JP2006050241 A JP 2006050241A
Authority
JP
Japan
Prior art keywords
side information
decoding
information
encoded data
listening position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004228227A
Other languages
Japanese (ja)
Inventor
Tomokazu Ishikawa
智一 石川
Shinya Omae
慎哉 御前
Masanaga Tsuji
勝長 辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2004228227A priority Critical patent/JP2006050241A/en
Publication of JP2006050241A publication Critical patent/JP2006050241A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve a problem that a hard follow-up is found in a change in a listening position when the position of a listener is changed and an enormous number of operations are required to follow up the change in the listening position. <P>SOLUTION: A decoder 1001 comprises: a side information separation means separating basic coding data from side information; a side information adjustment means 1101 adjusting the side information; a decoding means decoding the basic coding data by using the side information adjusted by the side information adjustment means 1101. The side information includes phase information, delay information, and gain information used in decoding the basic coding data. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、オーディオ信号の復号化方法に関するものである。   The present invention relates to a method for decoding an audio signal.

従来のオーディオ信号符号化方法、および、復号化方法としては、公知なものとしてISO/IECの国際標準方式、通称MPEG方式などが挙げられる。現在、幅広い応用を持ち、低ビットレート時でも高音質な符号化方式として、ISO/IEC 13818−7、通称MPEG2 AAC(Advanced Audio Coding)などがあげられる。本方式の拡張規格も複数規格化が現在なされている。その一つとして、空間音響情報(Spatial Cue Information)もしくは、聴覚的音響情報(Binaural Cue)と呼ばれる情報を利用する技術がある。このような技術の例としては、ISO国際標準規格であるMPEG-4 Audio (ISO/IEC 14496-3)において定められたパラメトリックステレオ(Parametric Stereo)方式がある(例えば、非特許文献1参照)。また、別の方式も提案されている(例えば、特許文献1、特許文献2参照)。
ISO/IEC 14496-3:2001 AMD2 "Parametric Coding for High Quality Audio" 米国公開特許US2003/0035553 "Backwards-compatible Perceptual Coding of Spatial Cues" 米国公開特許US2003/0219130 "Coherence-based Audio Coding and Synthesis"
As a conventional audio signal encoding method and decoding method, the ISO / IEC international standard system, commonly known as the MPEG system, and the like are known. Currently, ISO / IEC 13818-7, commonly known as MPEG2 AAC (Advanced Audio Coding), and the like are examples of coding schemes that have a wide range of applications and high sound quality even at low bit rates. A plurality of extended standards of this method are currently being standardized. One of them is a technology that uses information called spatial acoustic information (Spatial Cue Information) or auditory acoustic information (Binaural Cue). As an example of such a technique, there is a parametric stereo system defined in MPEG-4 Audio (ISO / IEC 14496-3) which is an ISO international standard (see, for example, Non-Patent Document 1). Another method has also been proposed (see, for example, Patent Document 1 and Patent Document 2).
ISO / IEC 14496-3: 2001 AMD2 "Parametric Coding for High Quality Audio" US 2003/0035553 "Backwards-compatible Perceptual Coding of Spatial Cues" US Published Patent US2003 / 0219130 "Coherence-based Audio Coding and Synthesis"

従来のマルチチャンネル再生装置においては、ステレオ音源を固定的な係数をもとにマルチチャンネル化していた例が多い。そのため、受聴者の位置が変化した場合には、固定的なフィルタ係数を再計算してマルチチャンネル効果を得ていたがその効果は薄く、時々刻々と変化する微妙な受聴位置変化に対応できず、マルチチャンネル効果が得にくかった。また、マルチチャンネル効果をより最適に実現するために、マルチチャンネル出力に対して遅延演算やゲイン調整演算を行う必要があり、演算負荷が大きかった。   In conventional multi-channel playback devices, there are many examples in which stereo sound sources are converted to multi-channels based on fixed coefficients. For this reason, when the listener's position changes, the multi-channel effect is obtained by recalculating fixed filter coefficients, but the effect is weak and cannot respond to subtle changes in the listening position that change from moment to moment. The multi-channel effect was difficult to obtain. In addition, in order to realize the multi-channel effect more optimally, it is necessary to perform delay calculation and gain adjustment calculation on the multi-channel output, and the calculation load is heavy.

本発明は、このような従来の問題点に鑑みてなされたものであって、マルチチャンネル出力信号を最適に制御できるような、復号化装置を提供することを目的とする。   The present invention has been made in view of such conventional problems, and an object of the present invention is to provide a decoding apparatus that can optimally control a multi-channel output signal.

上記課題を解決するため、本願請求項1の発明は、
基本符号化データとサイド情報を分離する分離手段と、前記サイド情報を調整する調整手段と、前記基本符号化データを前記調整されたサイド情報を用いて復号化する復号化手段とを備えたことを特徴とするものである。
In order to solve the above problem, the invention of claim 1 of the present application
Separating means for separating basic encoded data and side information, adjusting means for adjusting the side information, and decoding means for decoding the basic encoded data using the adjusted side information It is characterized by.

また本願請求項2の発明は、本願請求項1の発明において、
前記サイド情報には、基本符号化データを復号化する際の、位相情報が含まれており、前記調整手段は、前記位相情報を調整することを特徴とするものである。
The invention of claim 2 of the present application is the invention of claim 1 of the present application,
The side information includes phase information when decoding basic encoded data, and the adjusting means adjusts the phase information.

また本願請求項3の発明は、本願請求項1又は2に記載の発明において、
前記サイド情報には、基本符号化データを復号化する際の、遅延情報が含まれており、前記調整手段は、前記遅延情報を調整することを特徴とするものである。
The invention of claim 3 of the present application is the invention of claim 1 or 2,
The side information includes delay information when decoding the basic encoded data, and the adjusting means adjusts the delay information.

また本願請求項4の発明は、本願請求項1〜3のいずれか1項に記載の発明において、
前記サイド情報には、基本符号化データを復号化する際の、ゲイン情報が含まれており、前記調整手段は、前記ゲイン情報を調整することを特徴とするものである。
The invention of claim 4 of the present application is the invention according to any one of claims 1 to 3,
The side information includes gain information for decoding basic encoded data, and the adjusting means adjusts the gain information.

また本願請求項5の発明は、
基本符号化データとサイド情報を分離する分離手段と、前記サイド情報を調整する調整手段と、前記基本符号化データを前記調整されたサイド情報を用いて復号化する復号化手段とを備えたことを特徴とするものである。
The invention of claim 5 of the present application
Separating means for separating basic encoded data and side information, adjusting means for adjusting the side information, and decoding means for decoding the basic encoded data using the adjusted side information It is characterized by.

また本願請求項6の発明は、本願請求項5の発明において、
前記サイド情報には、基本符号化データを復号化する際の、位相情報が含まれており、前記調整手段は、前記位相情報を調整することを特徴とするものである。
The invention of claim 6 of the present application is the invention of claim 5 of the present application.
The side information includes phase information when decoding basic encoded data, and the adjusting means adjusts the phase information.

また本願請求項7の発明は、本願請求項5又は6に記載の発明において、
前記サイド情報には、基本符号化データを復号化する際の、遅延情報が含まれており、前記調整手段は、前記遅延情報を調整することを特徴とするものである。
The invention of claim 7 of the present application is the invention of claim 5 or 6,
The side information includes delay information when decoding the basic encoded data, and the adjusting means adjusts the delay information.

また本願請求項8の発明は、本願請求項5〜7のいずれか1項に記載の発明において、
前記サイド情報には、基本符号化データを復号化する際の、ゲイン情報が含まれており、前記調整手段は、前記ゲイン情報を調整することを特徴とするものである。
Further, the invention of claim 8 of the present application is the invention of any one of claims 5 to 7,
The side information includes gain information for decoding basic encoded data, and the adjusting means adjusts the gain information.

前記手段を設けることで、時々刻々と変化する微妙な受聴位置変化を検出し、少ない計算量で最適かつ効果的にマルチチャンネル再生を実現することが可能となる。   By providing the above means, it is possible to detect a subtle change in listening position that changes every moment, and to realize multi-channel reproduction optimally and effectively with a small amount of calculation.

以下、本発明の実施の形態を、図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の基本図である。復号化装置103は基本符号化データ101とサイド情報102と受聴位置受信手段104からの出力である受聴位置105を入力とし、それらからマルチチャンネル、ここでは6チャンネル分の音声データを出力する装置である。基本符号化データはたとえば2ch分の音声データをAAC方式で圧縮したものであり、復号化処理はAAC方式に従う。AAC方式で復号化された2チャンネル分の音声データと、サイド情報102を用いて、複数の(ここではLf、Rf、C、Ls、Rs、LFE)チャンネルに再構成する装置である。サイド情報102としては、たとえば、チャンネル間の相関度や位相差、チャンネル間のゲイン差などである。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(Embodiment 1)
FIG. 1 is a basic view of the present invention. The decoding apparatus 103 is an apparatus that receives the basic encoded data 101, the side information 102, and the listening position 105 as an output from the listening position receiving means 104, and outputs multi-channel audio data for 6 channels in this case. is there. The basic encoded data is, for example, audio data for 2ch compressed by the AAC method, and the decoding process follows the AAC method. This is a device that reconstructs into a plurality of channels (here, Lf, Rf, C, Ls, Rs, LFE) using the audio data for two channels decoded by the AAC method and the side information 102. The side information 102 includes, for example, the degree of correlation between channels, a phase difference, and a gain difference between channels.

復号化装置103は図2に示すような構成になっている。基本符号化データ101とサイド情報102が合わさったものを入力として、基本符号化データ203とサイド情報204を分離するサイド情報分離手段201と、受聴位置105と前記サイド情報分離手段201によって分離されたサイド情報204とを入力として、調整されたサイド情報205を出力とするサイド情報調整手段202と、基本データ203と調整されたサイド情報205を入力とし、マルチチャンネルの音声データを出力する復号化手段206で構成される。   The decryption apparatus 103 has a configuration as shown in FIG. Using the input of the basic encoded data 101 and the side information 102 as input, the side information separating means 201 for separating the basic encoded data 203 and the side information 204, and the listening position 105 and the side information separating means 201 are separated. Side information adjusting means 202 that receives side information 204 as input and outputs adjusted side information 205, and decoding means that receives basic data 203 and adjusted side information 205 as input and outputs multichannel audio data 206.

図3は、図2の復号化装置103が組み込まれた復号化機器301と、マルチチャンネルの音声データを再生する6つのスピーカの配置を表している。標準受聴位置302から受聴者が受聴位置303へと移動した場合、サイド情報調整手段202の内部では次のような処理が行われる。LfとLs、あるいはRfとRsというような前後方向のチャンネル間のゲイン差を、後ろから出力(Ls、Rs)が大きくなるように調整する。その調整割合は、標準受聴位置302と受聴位置303との距離差で比例配分した割合にする。また同時に前後のチャンネル間位相差を、前からの出力(Lf、Rf、C)が遅く出力されるように遅延させるように調整する。その調整割合は前記ゲイン差での調整と同様である。前後のチャンネルの相関度が高い場合には、位相調整はほとんど行わず、ゲイン調整を主たる処理とする。あるいは、受聴位置304にずれた場合、LfとRfあるいはLsとRsという左右方向のチャンネル間ゲイン差を、右からの出力(Rf、Rs)が大きくなるように調整する。位相差に関しても同様である。左右のチャンネルの相関度が高い場合には、位相調整はほとんど行わず、ゲイン調整を主たる処理とすることで、演算資源を節約することが出来る。   FIG. 3 shows an arrangement of a decoding device 301 in which the decoding device 103 of FIG. 2 is incorporated and six speakers for reproducing multi-channel audio data. When the listener moves from the standard listening position 302 to the listening position 303, the following processing is performed inside the side information adjusting unit 202. Adjust the gain difference between the front and rear channels such as Lf and Ls or Rf and Rs so that the output (Ls, Rs) increases from the rear. The adjustment ratio is a ratio that is proportionally distributed by the distance difference between the standard listening position 302 and the listening position 303. At the same time, the phase difference between the front and rear channels is adjusted so as to delay so that the previous outputs (Lf, Rf, C) are output later. The adjustment ratio is the same as the adjustment using the gain difference. When the degree of correlation between the front and rear channels is high, phase adjustment is hardly performed, and gain adjustment is the main process. Alternatively, when the listening position 304 is shifted, the gain difference between the left and right channels Lf and Rf or Ls and Rs is adjusted so that the output (Rf, Rs) from the right is increased. The same applies to the phase difference. When the degree of correlation between the left and right channels is high, almost no phase adjustment is performed and gain adjustment is the main process, thereby saving computation resources.

また、図3には受聴位置発信手段305が備わっている。通常は、復号化機器301を操作するためのリモコンなどである。
図4は前記復号化機器301の基本構成である。前記受聴位置発信手段305からの受聴位置情報(角度402、距離403)を入力として受聴位置404を出力する受聴位置受信手段104と前記復号化装置103で構成されている。
In FIG. 3, listening position transmission means 305 is provided. Usually, a remote controller for operating the decryption device 301 is used.
FIG. 4 shows the basic configuration of the decoding device 301. The listening position receiving means 104 for outputting the listening position 404 with the listening position information (angle 402, distance 403) from the listening position transmitting means 305 as input, and the decoding device 103 are included.

なお、図1記載の受聴位置受信手段104は、受聴位置発信手段305との組で用いられる場合もあるが、それ以外の手段、たとえば、受聴者があらかじめ受聴位置を設定した情報を入力として、受聴位置を復号化装置103に入力しても良い。   The listening position receiving means 104 shown in FIG. 1 may be used in combination with the listening position transmitting means 305, but other means, for example, the listener has set the listening position in advance as input, The listening position may be input to the decoding device 103.

本発明のより具体的な実施の形態について、
(実施例1)
図1は、本発明の基本図である。受聴者の前方の左右チャンネル信号であるLf、Rf、及び前方センターチャンネルC、受聴者の後方の左右チャンネル出力であるLs、Rs、及び超低域成分であるLFEの6ch信号を5.1ch信号と呼ぶが、それをダウンミックスして2chの信号に変換して符号化したものを基本符号化データ101と呼ぶ。5.1ch信号をダウンミックスする際に、各チャンネル間のゲイン差、位相差、相関度をサイド情報102として付加する仕組みをもつ符号化装置がある。本実施例は、前記符号化装置の出力である基本符号化データとサイド情報を復号化し、2chまたは5.1ch信号を復元することを目的とする装置である。
For more specific embodiments of the present invention,
Example 1
FIG. 1 is a basic view of the present invention. The left and right channel signals Lf, Rf and the front center channel C which are the listener's front left and right channel outputs Ls and Rs which are the left and right channel outputs of the listener, and the LFE 6ch signal which is the ultra low frequency component 5.1ch signal. The data that is downmixed, converted into a 2ch signal and encoded, is referred to as basic encoded data 101. There is an encoding apparatus having a mechanism for adding gain difference, phase difference, and correlation degree between channels as side information 102 when downmixing a 5.1ch signal. The present embodiment is an apparatus whose purpose is to decode basic encoded data and side information, which are outputs of the encoding apparatus, and to restore a 2ch or 5.1ch signal.

復号化装置103は基本符号化データ101とサイド情報102と受聴位置受信手段104からの出力である受聴位置105を入力とし、それらからマルチチャンネル、ここでは6チャンネル分の音声データを出力する装置である。基本符号化データはたとえば2ch分の音声データをAAC方式で圧縮したものであり、復号化処理はAAC方式に従う。AAC方式で復号化された2チャンネル分の音声データと、サイド情報102を用いて、複数の(ここではLf、Rf、C、Ls、Rs、LFE)チャンネルに再構成する装置である。サイド情報102としては、たとえば、チャンネル間の相関度や位相差、チャンネル間のゲイン差などである。   The decoding apparatus 103 is an apparatus that receives the basic encoded data 101, the side information 102, and the listening position 105 as an output from the listening position receiving means 104, and outputs multi-channel audio data for 6 channels in this case. is there. The basic encoded data is, for example, audio data for 2ch compressed by the AAC method, and the decoding process follows the AAC method. This is a device that reconstructs into a plurality of channels (here, Lf, Rf, C, Ls, Rs, LFE) using the audio data for two channels decoded by the AAC method and the side information 102. The side information 102 includes, for example, the degree of correlation between channels, a phase difference, and a gain difference between channels.

復号化装置103は図2に示すような構成になっている。基本符号化データ101とサイド情報102が合わさったものを入力として、基本符号化データ203とサイド情報204を分離するサイド情報分離手段201と、受聴位置105と前記サイド情報分離手段201によって分離されたサイド情報204とを入力として、調整されたサイド情報205を出力とするサイド情報調整手段202と、基本データ203と調整されたサイド情報205を入力とし、マルチチャンネルの音声データを出力する復号化手段206で構成される。   The decryption apparatus 103 has a configuration as shown in FIG. Using the input of the basic encoded data 101 and the side information 102 as input, the side information separating means 201 for separating the basic encoded data 203 and the side information 204, and the listening position 105 and the side information separating means 201 are separated. Side information adjusting means 202 that receives side information 204 as input and outputs adjusted side information 205, and decoding means that receives basic data 203 and adjusted side information 205 as input and outputs multichannel audio data 206.

図3は、図2の復号化装置103が組み込まれた復号化機器301と、マルチチャンネルの音声データを再生する6つのスピーカの配置を表している。標準受聴位置302から受聴者が受聴位置303へと移動した場合、サイド情報調整手段202の内部では次のような処理が行われる。LfとLs、あるいはRfとRsというような前後方向のチャンネル間のゲイン差を、後ろから出力(Ls、Rs)が大きくなるように調整する。その調整割合は、標準受聴位置302と受聴位置303との距離差で比例配分した割合にする。また同時に前後のチャンネル間位相差を、前からの出力(Lf、Rf、C)が遅く出力されるように遅延させるように調整する。その調整割合は前記ゲイン差での調整と同様である。前後のチャンネルの相関度が高い場合には、位相調整はほとんど行わず、ゲイン調整を主たる処理とする。あるいは、受聴位置304にずれた場合、LfとRfあるいはLsとRsという左右方向のチャンネル間ゲイン差を、右からの出力(Rf、Rs)が大きくなるように調整する。位相差に関しても同様である。左右のチャンネルの相関度が高い場合には、位相調整はほとんど行わず、ゲイン調整を主たる処理とすることで、演算資源を節約することが出来る。   FIG. 3 shows an arrangement of a decoding device 301 in which the decoding device 103 of FIG. 2 is incorporated and six speakers for reproducing multi-channel audio data. When the listener moves from the standard listening position 302 to the listening position 303, the following processing is performed inside the side information adjusting unit 202. Adjust the gain difference between the front and rear channels such as Lf and Ls or Rf and Rs so that the output (Ls, Rs) increases from the rear. The adjustment ratio is a ratio that is proportionally distributed by the distance difference between the standard listening position 302 and the listening position 303. At the same time, the phase difference between the front and rear channels is adjusted so as to delay so that the previous outputs (Lf, Rf, C) are output later. The adjustment ratio is the same as the adjustment using the gain difference. When the degree of correlation between the front and rear channels is high, phase adjustment is hardly performed, and gain adjustment is the main process. Alternatively, when the listening position 304 is shifted, the gain difference between the left and right channels Lf and Rf or Ls and Rs is adjusted so that the output (Rf, Rs) from the right is increased. The same applies to the phase difference. When the degree of correlation between the left and right channels is high, almost no phase adjustment is performed and gain adjustment is the main process, thereby saving computation resources.

また、図3には受聴位置発信手段305が備わっている。通常は、復号化機器301を操作するためのリモコンなどである。
図4は前記復号化機器301の基本構成である。前記受聴位置発信手段305からの受聴位置情報(角度402、距離403)を入力として受聴位置404を出力する受聴位置受信手段104と前記復号化装置103で構成されている。
In FIG. 3, listening position transmission means 305 is provided. Usually, a remote controller for operating the decryption device 301 is used.
FIG. 4 shows the basic configuration of the decoding device 301. The listening position receiving means 104 for outputting the listening position 404 with the listening position information (angle 402, distance 403) from the listening position transmitting means 305 as input, and the decoding device 103 are included.

なお、図1記載の受聴位置受信手段104は、受聴位置発信手段305との組で用いられる場合もあるが、それ以外の手段、たとえば、受聴者があらかじめ受聴位置を設定した情報を入力として、受聴位置を復号化装置103に入力しても良い。   The listening position receiving means 104 shown in FIG. 1 may be used in combination with the listening position transmitting means 305, but other means, for example, the listener has set the listening position in advance as input, The listening position may be input to the decoding device 103.

(実施例2)
図5で示す復号化装置501は、図1で示した復号化装置103と同様に基本符号化データ101とサイド情報102が混合されたものと、復号化装置501の音声データ出力チャンネル数を受信する出力数受信手段502の出力である出力数504を入力として、一つまたは複数の音声データ出力を行うものである。復号化装置501は図6に示す構成になっている。復号化装置501は、基本符号化データ101とサイド情報102の混合入力を基本符号化データ203とサイド情報204に分離するサイド情報分離手段201と、出力数504と前記サイド情報分離手段201によって分離されたサイド情報204とを入力として、出力数504に応じてサイド情報を調整するサイド情報調整手段601と、復号化手段206とを備える。実施例1記載のものとは、サイド情報調整手段601の作用が若干異なる。本実施例では、出力数504に応じて調整する。たとえば、図7に示すように、出力数504が3の場合、サイド情報204に含まれるチャンネル間位相差、チャンネル間相関値、チャンネル間ゲイン差を、たとえば次のように調整する。前後のチャンネル(LfとLs、RfとRs)間の相関値を1に限りなく近い値に設定し、前後のチャンネル間位相差を限りなく0に設定し、前後のチャンネル間ゲイン差を限りなく大きく設定することで実現する。そうすることによって、後ろ側の音声データ出力(Ls、Rs)が結果的に0に限りなく近くなり、3チャンネル再生が実現する。
(Example 2)
The decoding apparatus 501 shown in FIG. 5 receives the mixture of the basic encoded data 101 and the side information 102 and the number of audio data output channels of the decoding apparatus 501 in the same manner as the decoding apparatus 103 shown in FIG. One or a plurality of audio data is output using the output number 504 that is the output of the output number receiving means 502 to be input. The decryption apparatus 501 has the configuration shown in FIG. The decoding device 501 separates the mixed input of the basic encoded data 101 and the side information 102 into the basic encoded data 203 and the side information 204, and outputs the output number 504 and the side information separation means 201. The received side information 204 is input, and side information adjusting means 601 for adjusting the side information according to the number of outputs 504 and decoding means 206 are provided. The operation of the side information adjusting unit 601 is slightly different from that described in the first embodiment. In this embodiment, adjustment is made according to the number of outputs 504. For example, as shown in FIG. 7, when the number of outputs 504 is 3, the inter-phase phase difference, inter-channel correlation value, and inter-channel gain difference included in the side information 204 are adjusted as follows, for example. Set the correlation value between the front and rear channels (Lf and Ls, Rf and Rs) as close to 1 as possible, set the phase difference between the front and back channels to 0 as much as possible, and limit the gain difference between the front and back channels as much as possible This is achieved by setting a large value. By doing so, the audio data output (Ls, Rs) on the rear side becomes as close as possible to 0 as a result, and three-channel reproduction is realized.

現実的には、スピーカ配置(出力数504)は2か3か6かのどれかである。2の場合は、上記の処理に加え、センターチャンネル(C)とLf、センターチャンネル(C)とRfのチャンネル間相関値を限りなく1に近い値に設定し、前記チャンネル間のチャンネル間位相差を限りなく0に設定し、前記チャンネル間のチャンネル間ゲイン差を限りなく大きくすることで実現できる。結果的に、センターチャンネルの出力を0にすることである。   In reality, the speaker arrangement (number of outputs 504) is either 2, 3 or 6. In the case of 2, in addition to the above processing, the inter-channel correlation value of the center channels (C) and Lf and the center channels (C) and Rf is set to a value close to 1 as much as possible, and the inter-channel phase difference between the channels Is set to 0 as much as possible, and the gain difference between channels between the channels is increased as much as possible. As a result, the output of the center channel is set to zero.

出力数受信手段502は、出力数検出手段701と組で使われる。ここでいう出力数検出手段701とはたとえば復号化機器702を遠隔操作するリモコンなどである。復号化機器702には、図5載の復号化装置501と出力数受信手段502を具備している。出力数検出手段701で検出された出力数504は無線または有線にて出力数受信手段502に送られる。出力数検出手段701の構成は図8及び図9に示す。図8は出力数検出手段701の具体的構成例である。出力数検出手段701は、出力機器801から基準信号を発しその角度及び距離を入力するための音声入力手段802と、音声入力手段802の出力を入力として出力数504を算出する出力数算出手段803で構成される。   The output number receiving unit 502 is used in combination with the output number detecting unit 701. The output number detection means 701 here is, for example, a remote control for remotely operating the decryption device 702. The decryption device 702 includes the decryption device 501 and the output number reception unit 502 shown in FIG. The output number 504 detected by the output number detection unit 701 is sent to the output number reception unit 502 wirelessly or by wire. The configuration of the output number detection means 701 is shown in FIGS. FIG. 8 shows a specific configuration example of the output number detection unit 701. The output number detection unit 701 generates a reference signal from the output device 801 and inputs the angle and distance thereof. The output number calculation unit 803 calculates the output number 504 using the output of the voice input unit 802 as an input. Consists of.

なお、出力数検出手段701は、図9のような構成をとることもできる。図8との大きな違いは、出力機器801からの基準信号ではなく、出力機器801の配置を画像撮影手段901で撮影して出力数504を得る点である。   Note that the output number detection means 701 can be configured as shown in FIG. A major difference from FIG. 8 is that the image capturing means 901 captures the arrangement of the output device 801 instead of the reference signal from the output device 801 to obtain the output number 504.

なお、出力数504は、たとえば受聴者が手動で入力しても良い。
(実施例3)
図10に示すように、復号化装置1001は、基本符号化データ101とサイド情報102が合成されたものと、制御情報1003を入力として、一つまたは複数個のチャンネルの音声データを出力するものである。制御情報1003はサイド情報102を、所望の音声データ出力を得られるように制御するための情報である。制御情報1003はサイド情報制御手段1002によって出力されるが、サイド情報制御手段1002の入力としては、たとえば、受聴位置であるとか、スピーカの数であるとか、である。制御情報1003を復号化装置1001の入力とすることで、たとえば、Cの出力をLfとRfに振り分けたい場合、従来で有れば、一端復号化装置1001で復号化してから、C出力成分を半分にし、LfとRfに足し合わせる作業が必要であった。それを行うメモリも必要であったし、出力全体に対して演算を施さねばならなかった。それに比べ、制御情報1003を入力としてサイド情報102を操作することで、サイド情報102の簡単な変更だけでCの出力をなくすことも可能である。
Note that the number of outputs 504 may be manually input by a listener, for example.
(Example 3)
As shown in FIG. 10, the decoding apparatus 1001 outputs the audio data of one or a plurality of channels, with the basic encoded data 101 and the side information 102 combined and the control information 1003 as an input. It is. The control information 1003 is information for controlling the side information 102 so that desired sound data output can be obtained. The control information 1003 is output by the side information control unit 1002. The input of the side information control unit 1002 is, for example, the listening position or the number of speakers. By using the control information 1003 as an input to the decoding device 1001, for example, when it is desired to distribute the output of C to Lf and Rf, if it is conventional, the decoding device 1001 decodes the C output component and then outputs the C output component. It was necessary to halve and add to Lf and Rf. We also needed memory to do that, and had to perform operations on the entire output. In contrast, by operating the side information 102 using the control information 1003 as an input, it is possible to eliminate the output of C by simply changing the side information 102.

たとえば、サイド情報102に含まれているRfとCのゲイン差を限りなく大きくしてRfにのみ出力するように設定することで実現できる。同様にLfとCのゲイン差も設定する。
図11は復号化装置1001の構成を示している。前記のような調整を、サイド情報調整手段1101内部で行う。サイド情報分離手段201で分離されたサイド情報204のゲイン差や位相差、相関度を変更することで、LfやRf、C、Ls、Rs、LFEの出力が自動的に変化することになり、出力段での余計な演算やメモリを必要とせず、所望の音場再生が実現可能となる。
For example, it can be realized by setting the gain difference between Rf and C included in the side information 102 to be as large as possible and outputting only to Rf. Similarly, set the gain difference between Lf and C.
FIG. 11 shows the configuration of the decoding device 1001. Such adjustment is performed inside the side information adjustment unit 1101. By changing the gain difference, phase difference, and correlation degree of the side information 204 separated by the side information separation means 201, the outputs of Lf, Rf, C, Ls, Rs, and LFE will automatically change. It is possible to realize a desired sound field reproduction without requiring extra computation and memory at the output stage.

本発明は、空間音響符号化技術を用いた機器、たとえば家庭用AVアンプや携帯電話や小型情報機器に有用である。
将来、放送・通信・インターネットなどで空間符号化を施されたデータが流通する際にも有益であろう。
INDUSTRIAL APPLICABILITY The present invention is useful for devices using spatial acoustic coding technology, such as home AV amplifiers, mobile phones, and small information devices.
In the future, it will be useful when data that has undergone spatial coding is distributed in broadcasting, communication, and the Internet.

受聴位置受信手段を説明する図である。It is a figure explaining a listening position receiving means. 復号化装置を説明する図である。It is a figure explaining a decoding apparatus. 復号化機器と受聴位置を説明する図である。It is a figure explaining a decoding apparatus and a listening position. 復号化機器を説明する図である。It is a figure explaining a decoding apparatus. 出力数受信手段を説明する図である。It is a figure explaining an output number receiving means. 出力数受信手段を鑑みた復号化装置を説明する図である。It is a figure explaining the decoding apparatus in view of the output number receiving means. 出力数が3の場合を説明する図である。It is a figure explaining the case where the number of outputs is three. 音声入力手段を具備した出力数検出手段を説明する図である。It is a figure explaining the output number detection means provided with the audio | voice input means. 画像入力手段を具備した出力数検出手段を説明する図である。It is a figure explaining the output number detection means provided with the image input means. サイド情報制御手段と復号化装置を説明する図である。It is a figure explaining a side information control means and a decoding apparatus. 復号化装置を説明する図である。It is a figure explaining a decoding apparatus.

符号の説明Explanation of symbols

101 基本符号化データ
102 サイド情報
103 復号化装置
104 受聴位置受信手段
105 受聴位置
201 サイド情報分離手段
202 サイド情報調整手段
203 基本符号化データ
204 サイド情報
205 調整後のサイド情報
206 復号化手段
301 復号化機器
302 標準受聴位置
303 前後にずれた受聴位置
304 左右にずれた受聴位置
305 受聴位置発信手段
402 角度
403 距離
404 受聴位置
501 復号化装置
502 出力数受信手段
503 復号化機器
504 出力数
601 サイド情報調整手段
602 調整後のサイド情報
701 出力数検出手段
702 復号化機器
801 出力機器
802 音声入力手段
803 出力数算出手段
901 画像入力手段
902 出力数算出手段
1001 復号化装置
1002 サイド情報制御手段
1003 制御情報
1101 サイド情報調整手段

101 basic encoded data 102 side information 103 decoding device 104 listening position receiving means 105 listening position 201 side information separating means 202 side information adjusting means 203 basic encoded data 204 side information 205 adjusted side information 206 decoding means 301 decoding Listening device 302 Standard listening position 303 Listening position shifted back and forth 304 Listening position shifted left and right 305 Listening position transmitting means 402 Angle 403 Distance 404 Listening position 501 Decoding device 502 Output number receiving means 503 Decoding equipment 504 Output number 601 Side Information adjustment means 602 Side information after adjustment 701 Output number detection means 702 Decoding device 801 Output device 802 Audio input means 803 Output number calculation means 901 Image input means 902 Output number calculation means 1001 Decoding device 1002 Side information control means 1003 Control information 1101 Side information adjustment means

Claims (8)

基本符号化データとサイド情報を分離する分離手段と、前記サイド情報を調整する調整手段と、前記基本符号化データを前記調整されたサイド情報を用いて復号化する復号化手段とを備えたことを特徴とする復号化装置。   Separating means for separating basic encoded data and side information, adjusting means for adjusting the side information, and decoding means for decoding the basic encoded data using the adjusted side information A decoding device characterized by the above. 前記サイド情報には、基本符号化データを復号化する際の、位相情報が含まれており、前記調整手段は、前記位相情報を調整することを特徴とした請求項1記載の復号化装置。   2. The decoding apparatus according to claim 1, wherein the side information includes phase information for decoding basic encoded data, and the adjustment unit adjusts the phase information. 前記サイド情報には、基本符号化データを復号化する際の、遅延情報が含まれており、前記調整手段は、前記遅延情報を調整することを特徴とした請求項1又は2に記載の復号化装置。   The decoding according to claim 1 or 2, wherein the side information includes delay information when decoding basic encoded data, and the adjusting means adjusts the delay information. Device. 前記サイド情報には、基本符号化データを復号化する際の、ゲイン情報が含まれており、前記調整手段は、前記ゲイン情報を調整することを特徴とした請求項1〜3のいずれか
項に記載の復号化装置。
The side information includes gain information for decoding basic encoded data, and the adjustment unit adjusts the gain information. The decoding device according to 1.
基本符号化データとサイド情報を分離する分離手段と、前記サイド情報を調整する調整手段と、前記基本符号化データを前記調整されたサイド情報を用いて復号化する復号化手段とを備えたことを特徴とする復号化方法。   Separating means for separating basic encoded data and side information, adjusting means for adjusting the side information, and decoding means for decoding the basic encoded data using the adjusted side information A decoding method characterized by the above. 前記サイド情報には、基本符号化データを復号化する際の、位相情報が含まれており、前記調整手段は、前記位相情報を調整することを特徴とした請求項5記載の復号化装置。   6. The decoding apparatus according to claim 5, wherein the side information includes phase information for decoding basic encoded data, and the adjustment unit adjusts the phase information. 前記サイド情報には、基本符号化データを復号化する際の、遅延情報が含まれており、前記調整手段は、前記遅延情報を調整することを特徴とした請求項5又は6に記載の復号化装置。   The decoding according to claim 5 or 6, wherein the side information includes delay information when decoding basic encoded data, and the adjustment unit adjusts the delay information. Device. 前記サイド情報には、基本符号化データを復号化する際の、ゲイン情報が含まれており、前記調整手段は、前記ゲイン情報を調整することを特徴とした請求項5〜7のいずれか1項に記載の復号化装置。

The side information includes gain information for decoding basic encoded data, and the adjustment unit adjusts the gain information. The decoding device according to item.

JP2004228227A 2004-08-04 2004-08-04 Decoder Pending JP2006050241A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004228227A JP2006050241A (en) 2004-08-04 2004-08-04 Decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004228227A JP2006050241A (en) 2004-08-04 2004-08-04 Decoder

Publications (1)

Publication Number Publication Date
JP2006050241A true JP2006050241A (en) 2006-02-16

Family

ID=36028284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004228227A Pending JP2006050241A (en) 2004-08-04 2004-08-04 Decoder

Country Status (1)

Country Link
JP (1) JP2006050241A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009524104A (en) * 2006-01-19 2009-06-25 エルジー エレクトロニクス インコーポレイティド Signal decoding method and apparatus
JP2010504017A (en) * 2006-09-14 2010-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Sweet spot operation for multi-channel signals
JP2013514696A (en) * 2009-12-17 2013-04-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Apparatus and method for converting a first parametric spatial audio signal to a second parametric spatial audio signal
JP2016525716A (en) * 2013-07-22 2016-08-25 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. Suppression of comb filter artifacts in multi-channel downmix using adaptive phase alignment
JP2016527804A (en) * 2013-07-22 2016-09-08 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Renderer controlled space upmix
JP2017041897A (en) * 2011-07-01 2017-02-23 ドルビー ラボラトリーズ ライセンシング コーポレイション System and tool for enhanced 3d audio generation and expression

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009524104A (en) * 2006-01-19 2009-06-25 エルジー エレクトロニクス インコーポレイティド Signal decoding method and apparatus
US8239209B2 (en) 2006-01-19 2012-08-07 Lg Electronics Inc. Method and apparatus for decoding an audio signal using a rendering parameter
US8296155B2 (en) 2006-01-19 2012-10-23 Lg Electronics Inc. Method and apparatus for decoding a signal
JP2010504017A (en) * 2006-09-14 2010-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Sweet spot operation for multi-channel signals
JP2013514696A (en) * 2009-12-17 2013-04-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Apparatus and method for converting a first parametric spatial audio signal to a second parametric spatial audio signal
US9196257B2 (en) 2009-12-17 2015-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
JP2017041897A (en) * 2011-07-01 2017-02-23 ドルビー ラボラトリーズ ライセンシング コーポレイション System and tool for enhanced 3d audio generation and expression
US11641562B2 (en) 2011-07-01 2023-05-02 Dolby Laboratories Licensing Corporation System and tools for enhanced 3D audio authoring and rendering
JP2019193302A (en) * 2011-07-01 2019-10-31 ドルビー ラボラトリーズ ライセンシング コーポレイション System and tool for creation and expression of improved 3d audio
US9838826B2 (en) 2011-07-01 2017-12-05 Dolby Laboratories Licensing Corporation System and tools for enhanced 3D audio authoring and rendering
KR20180032690A (en) * 2011-07-01 2018-03-30 돌비 레버러토리즈 라이쎈싱 코오포레이션 System and tools for enhanced 3d audio authoring and rendering
JP2018088713A (en) * 2011-07-01 2018-06-07 ドルビー ラボラトリーズ ライセンシング コーポレイション System and tool for creation and expression of improved 3d audio
US11057731B2 (en) 2011-07-01 2021-07-06 Dolby Laboratories Licensing Corporation System and tools for enhanced 3D audio authoring and rendering
KR101958227B1 (en) * 2011-07-01 2019-03-14 돌비 레버러토리즈 라이쎈싱 코오포레이션 System and tools for enhanced 3d audio authoring and rendering
US10244343B2 (en) 2011-07-01 2019-03-26 Dolby Laboratories Licensing Corporation System and tools for enhanced 3D audio authoring and rendering
JP2020065310A (en) * 2011-07-01 2020-04-23 ドルビー ラボラトリーズ ライセンシング コーポレイション System and tool for creation and expression of improved 3d audio
US10609506B2 (en) 2011-07-01 2020-03-31 Dolby Laboratories Licensing Corporation System and tools for enhanced 3D audio authoring and rendering
JP2016525716A (en) * 2013-07-22 2016-08-25 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. Suppression of comb filter artifacts in multi-channel downmix using adaptive phase alignment
US10360918B2 (en) 2013-07-22 2019-07-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
US10341801B2 (en) 2013-07-22 2019-07-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Renderer controlled spatial upmix
US10937435B2 (en) 2013-07-22 2021-03-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
US10085104B2 (en) 2013-07-22 2018-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Renderer controlled spatial upmix
US11184728B2 (en) 2013-07-22 2021-11-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Renderer controlled spatial upmix
JP2016527804A (en) * 2013-07-22 2016-09-08 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Renderer controlled space upmix
US11743668B2 (en) 2013-07-22 2023-08-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Renderer controlled spatial upmix

Similar Documents

Publication Publication Date Title
CN107533843B (en) System and method for capturing, encoding, distributing and decoding immersive audio
US9313599B2 (en) Apparatus and method for multi-channel signal playback
AU2008225321B2 (en) A method and an apparatus for processing an audio signal
US8315396B2 (en) Apparatus and method for generating audio output signals using object based metadata
US9219972B2 (en) Efficient audio coding having reduced bit rate for ambient signals and decoding using same
US20100324915A1 (en) Encoding and decoding apparatuses for high quality multi-channel audio codec
EP3583596A1 (en) Two stage audio focus for spatial audio processing
EP3707708A1 (en) Determination of targeted spatial audio parameters and associated spatial audio playback
CN111630592A (en) Apparatus, method and computer program for encoding, decoding, scene processing and other processes related to DirAC-based spatial audio coding
US20070160236A1 (en) Audio signal encoding device, audio signal decoding device, and method and program thereof
US11924627B2 (en) Ambience audio representation and associated rendering
CN112567765B (en) Spatial audio capture, transmission and reproduction
KR20110036830A (en) A method and an apparatus for processing an audio signal
WO2020152394A1 (en) Audio representation and associated rendering
JP5328637B2 (en) Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit
JP2006050241A (en) Decoder
CN112513982A (en) Spatial audio parameters
US11432093B2 (en) Sending notification and multi-channel audio over channel limited link for independent gain control
TW202242852A (en) Adaptive gain control
JP2008286904A (en) Audio decoding device
JP2007065497A (en) Signal processing apparatus
KR101392940B1 (en) Audio output apparatus and audio output method thereof
US20230188924A1 (en) Spatial Audio Object Positional Distribution within Spatial Audio Communication Systems
JP2006270649A (en) Voice acoustic signal processing apparatus and method thereof
WO2024115045A1 (en) Binaural audio rendering of spatial audio