JP2008203315A - Audio encoding/decoding device and method, and software - Google Patents

Audio encoding/decoding device and method, and software Download PDF

Info

Publication number
JP2008203315A
JP2008203315A JP2007036077A JP2007036077A JP2008203315A JP 2008203315 A JP2008203315 A JP 2008203315A JP 2007036077 A JP2007036077 A JP 2007036077A JP 2007036077 A JP2007036077 A JP 2007036077A JP 2008203315 A JP2008203315 A JP 2008203315A
Authority
JP
Japan
Prior art keywords
signal
audio
calculated
calculating
stereo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007036077A
Other languages
Japanese (ja)
Inventor
Junji Araki
潤二 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2007036077A priority Critical patent/JP2008203315A/en
Publication of JP2008203315A publication Critical patent/JP2008203315A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve the problem that, in conventional MS stereo processing, compression efficiency is reduced, Middle-Side (MS) stereo processing is not performed since no processing is present for increasing deviation between Middle signals and Side signals generated from an input signal. <P>SOLUTION: In order to increase the deviation between Middle signals and Side signals, a weighting coefficient is introduced to a formula for calculating conventional Middle signals and Side signals, and the deviation between signals is intentionally made large. Thereby, opportunity for executing the MS stereo processing is increased, and as a result, a bit amount required for encoding is reduced and encoding efficiency is improved. Moreover, by reducing the bit amount required for encoding, more bits can be allocated to other encoding processing and high quality sound is attained. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、デジタル圧縮符号化方式を用いたオーディオ信号の符号化・復号化装置に関し、特にMSステレオ処理を有するオーディオ信号の符号化・復号化装置に関する。   The present invention relates to an audio signal encoding / decoding device using a digital compression encoding method, and more particularly to an audio signal encoding / decoding device having MS stereo processing.

従来のオーディオ信号符号化方法、および、復号化方法としては、公知なものとしてISO/IECの国際標準方式、通称MPEG方式などが挙げられる。現在、幅広い応用を持ち、低ビットレート時でも高音質な符号化方式として、非特許文献1に記載のMPEG2 AAC(Advanced Audio Coding)などがあげられる。この方式の拡張規格も複数規格化が現在なされている。   As a conventional audio signal encoding method and decoding method, ISO / IEC international standard system, commonly called MPEG system, and the like are known. Currently, MPEG2 AAC (Advanced Audio Coding) described in Non-Patent Document 1 can be cited as an encoding method having a wide range of applications and high sound quality even at low bit rates. A plurality of extended standards of this method are currently being standardized.

これらの符号化・復号化方式において、圧縮効率を高めるための処理の一つとしてMSステレオ処理がある。以下図面を参照しながら、MSステレオ処理のエンコーダとデコーダについて説明する。   In these encoding / decoding methods, there is MS stereo processing as one of the processes for improving the compression efficiency. Hereinafter, an encoder and a decoder for MS stereo processing will be described with reference to the drawings.

図5はMSステレオ処理のエンコーダにおける構成を示す図である。図5において、11はLチャンネル入力信号(以下L信号と呼ぶ)とRチャンネル入力信号(以下R信号と呼ぶ)と(以下LR信号と呼ぶ)からMiddle信号(和信号、以下M信号と呼ぶ)とSide信号(差信号、以下S信号と呼ぶ)と(以下MS信号と呼ぶ)を算出するMS信号算出手段であり、12は前記MS信号算出手段11で算出したMS信号から2乗振幅和信号(X)を算出するMS2乗振幅和算出手段であり、13はMS2乗振幅和算出手段12から算出したMS信号の2乗振幅和信号Xをもとに、MSステレオ処理を実施するかどうかの判定結果を出力するMSステレオ判定手段であり、14は前記MSステレオ判定手段13で判定した判定結果を基に、LR信号もしくはMS信号を選択して符号化処理を行い、さらに前記判定結果をフラグに設定する信号処理手段である。   FIG. 5 is a diagram showing a configuration of an encoder for MS stereo processing. In FIG. 5, reference numeral 11 denotes an L channel input signal (hereinafter referred to as L signal), an R channel input signal (hereinafter referred to as R signal), and (hereinafter referred to as LR signal) to a Middle signal (sum signal, hereinafter referred to as M signal). And Side signal (difference signal, hereinafter referred to as S signal) and MS signal calculation means for calculating (hereinafter referred to as MS signal), 12 is a square amplitude sum signal from the MS signal calculated by the MS signal calculation means 11 MS square amplitude sum calculating means for calculating (X). Reference numeral 13 denotes whether to perform MS stereo processing based on the square amplitude sum signal X of the MS signal calculated from the MS square amplitude sum calculating means 12. MS stereo determination means for outputting a determination result, and 14 selects an LR signal or an MS signal based on the determination result determined by the MS stereo determination means 13 and performs an encoding process. A signal processing means for setting the serial determination result flag.

以上のように構成されたMSステレオ処理の動作について、図6のフロー図を用いて説明する。まず、MS信号算出ステップ201にて、式1を用いて、MS信号算出手段11に入力されたLR信号(式中L(n)、R(n)、nはサンプル番号)から、MS信号(式中M(n)、S(n))を算出する。   The operation of the MS stereo processing configured as described above will be described with reference to the flowchart of FIG. First, in the MS signal calculation step 201, using the equation 1, the LR signal (L (n), R (n), where n is a sample number) input to the MS signal calculation unit 11 is used to calculate the MS signal ( In the formula, M (n), S (n)) is calculated.

Figure 2008203315
Figure 2008203315

次に、MS2乗振幅和算出ステップ202にて、MS2乗振幅和算出手段12が、MS信号算出手段11で算出したMS信号から、式2を用いてそれぞれの振幅2乗和を表すSUM_M、SUM_Sを算出する。ここで、Σの累積加算範囲はMSステレオ処理の処理単位であり、例えば1024個のサンプルからなる1フレームである。   Next, in the MS square amplitude sum calculation step 202, the MS square amplitude sum calculation means 12 uses the SUM_M and SUM_S representing the respective amplitude square sums using the expression 2 from the MS signal calculated by the MS signal calculation means 11. Is calculated. Here, the cumulative addition range of Σ is a processing unit of MS stereo processing, and is, for example, one frame composed of 1024 samples.

Figure 2008203315
Figure 2008203315

さらに式3を用いて、M信号とS信号のそれぞれの振幅2乗和を表すSUM_MとSUM_Sとの偏りを表す値Xを算出する。   Further, using Formula 3, a value X representing the bias between SUM_M and SUM_S representing the sum of squared amplitudes of the M signal and S signal is calculated.

Figure 2008203315
Figure 2008203315

次にMSステレオ判定ステップ203にて、MSステレオ判定手段13が、MS2乗振幅和算出手段12で算出した偏りを表すXと、LR信号を符号化するよりもMSステレオ処理を実行してMS信号を符号化する方が圧縮効率が上がると判断できる閾値T1,T2とを比較し、MSステレオ処理を実行するかどうかを判定し、その判定結果を出力する。ここでT1はSUM_MがSUM_Sに対して十分大きい場合の閾値で、T2はSUM_SがSUM_Mに対して十分に大きい場合の閾値である。つまり、X≧T1もしくはX≦T2であればMSステレオ処理を実行するという判定結果を出力し、MS信号選択ステップ204にて、信号処理手段14がMS信号算出手段11の出力であるMS信号を選択して符号化するとともに、次のMSステレオ実行フラグ設定ステップ205にて、信号処理手段14がMSステレオ実行フラグを設定する。また、T2<X<T1であればMSステレオ処理を実行しないという判定結果を出力し、LR信号選択ステップ206にて、信号処理手段14がLR信号を選択して符号化する。   Next, in MS stereo determination step 203, the MS stereo determination means 13 performs MS stereo processing rather than encoding the LR signal with X representing the bias calculated by the MS square amplitude sum calculation means 12, and the MS signal. Are compared with threshold values T1 and T2 that can be determined that the compression efficiency is increased, and it is determined whether or not the MS stereo processing is executed, and the determination result is output. Here, T1 is a threshold when SUM_M is sufficiently larger than SUM_S, and T2 is a threshold when SUM_S is sufficiently larger than SUM_M. That is, if X ≧ T1 or X ≦ T2, a determination result that MS stereo processing is executed is output, and in the MS signal selection step 204, the signal processing means 14 determines the MS signal that is the output of the MS signal calculation means 11 At the next MS stereo execution flag setting step 205, the signal processing means 14 sets the MS stereo execution flag. If T2 <X <T1, a determination result indicating that the MS stereo processing is not executed is output, and in LR signal selection step 206, the signal processing means 14 selects and encodes the LR signal.

続いて、MSステレオ処理のデコーダについて説明する。図7はMSステレオ処理のデコーダの構成を示す図である。16は入力信号を復号化してLR信号もしくはMS信号を出力すると共に、MSステレオ実行フラグの有無を判別する信号処理手段であり、17は信号処理手段16においてMSステレオ実行フラグを判別してエンコーダ側でMSステレオ処理が実行されたと判断した場合に、信号処理手段16からのMS信号に所定の処理を実行してLR信号を復元するデコード手段である。   Next, the MS stereo processing decoder will be described. FIG. 7 is a diagram showing a configuration of a decoder for MS stereo processing. Reference numeral 16 denotes signal processing means for decoding the input signal and outputting the LR signal or the MS signal and determining the presence or absence of the MS stereo execution flag. Reference numeral 17 denotes the encoder side by determining the MS stereo execution flag in the signal processing means 16. The decoding means restores the LR signal by executing a predetermined process on the MS signal from the signal processing means 16 when it is determined that the MS stereo processing has been executed.

以上のように構成されたMSステレオデコード処理の動作について、以下図8のフロー図を用いて説明する。図8のMSステレオ判別ステップ207にて、信号処理手段16が、エンコーダ側でMSステレオ処理されたかどうかを示すフラグを確認する事で判別し判別結果を出力する。フラグを判別してエンコーダ側でMSステレオ処理が実行されていないと判断した場合は、入力信号をデコードする必要がないため、MSステレオデコード処理を終了する。また、フラグを判別してエンコーダ側でMSステレオ処理が実行されていると判断した場合は、デコードステップ208にて、デコード手段17が、式4に従いMS信号をデコードしてLR信号を復元する。   The operation of the MS stereo decoding process configured as described above will be described below with reference to the flowchart of FIG. In the MS stereo discrimination step 207 of FIG. 8, the signal processing means 16 discriminates by checking a flag indicating whether or not MS stereo processing has been performed on the encoder side, and outputs a discrimination result. If it is determined that the MS stereo process has not been executed on the encoder side by determining the flag, the MS stereo decoding process is terminated because there is no need to decode the input signal. If it is determined that the MS stereo processing is being executed on the encoder side by determining the flag, the decoding unit 17 decodes the MS signal according to Equation 4 to restore the LR signal in decoding step 208.

Figure 2008203315
Figure 2008203315

MSステレオ処理の上記動作により、L信号とR信号が同符号でかつ絶対値が類似した信号であればS信号が小さな値となり、またL信号とR信号が異符号でかつ信号の絶対値が類似した信号であればM信号が小さな値となり、L信号とR信号をそのまま圧縮するよりも割り当てるビット量が少なくて済むために符号化効率を向上させる事が可能となる。   By the above operation of the MS stereo processing, if the L signal and the R signal have the same sign and the absolute values are similar, the S signal becomes a small value, and the L signal and the R signal have different signs and the absolute value of the signal is If the signals are similar, the M signal has a small value, and the bit amount to be allocated is smaller than the compression of the L signal and the R signal as they are, so that the encoding efficiency can be improved.

なお、MS信号を圧縮するよりもLR信号をそのまま圧縮した方が圧縮効率が良い、つまりL信号とR信号とに相関がないと判断された場合は、MSステレオ処理をしない。
国際規格 ISO/IEC 13818−7:1997
When it is determined that the compression efficiency is better when the LR signal is compressed as it is than when the MS signal is compressed, that is, when there is no correlation between the L signal and the R signal, the MS stereo processing is not performed.
International standard ISO / IEC 13818-7: 1997

しかしながら、従来のMSステレオ処理では、入力されたLR信号に何も処理を加える事なくMS信号を求めるために、入力信号に対して相関を高める処理を行う事ができず、相関がないと判断されてMSステレオ処理をせずに圧縮効率を下げている場合があった。例えば、R信号がL信号のk倍(k:整数)で表現可能な場合、R信号をkLとすると、M信号(式中M(k))、S信号(式中S(k))は式5のように求まる。   However, in the conventional MS stereo processing, in order to obtain the MS signal without performing any processing on the input LR signal, it is not possible to perform processing for increasing the correlation with respect to the input signal, and it is determined that there is no correlation. In some cases, the compression efficiency is lowered without performing MS stereo processing. For example, when the R signal can be expressed by k times the L signal (k: integer), if the R signal is kL, the M signal (M (k) in the formula) and the S signal (S (k) in the formula) are It is obtained as shown in Equation 5.

Figure 2008203315
Figure 2008203315

ここで、R信号はL信号の整数倍であるから、両信号はどちらか一方の入力信号(本例ではLチャンネル信号)を用いて表現できるため、圧縮効率を高める事が可能であるが、MSステレオ処理では和と差による演算結果のみがM信号とS信号に反映されるため、両信号の相関が高いとは判断されない。例えば、kの絶対値が1より十分大きい場合はM信号、S信号ともに絶対値が大きいままなので、L信号とR信号との間に相関がないと判断されてMSステレオ処理をされず、圧縮効率を高める事ができない、という課題があった。   Here, since the R signal is an integral multiple of the L signal, both signals can be expressed using either one of the input signals (in this example, the L channel signal), so that the compression efficiency can be increased. In the MS stereo processing, only the calculation result based on the sum and difference is reflected in the M signal and the S signal, so that it is not determined that the correlation between the two signals is high. For example, when the absolute value of k is sufficiently larger than 1, since the absolute values of both the M signal and the S signal remain large, it is determined that there is no correlation between the L signal and the R signal, and the MS stereo processing is not performed. There was a problem that the efficiency could not be increased.

上記従来の課題を解決するため、本発明のオーディオ符号化装置は、2チャンネルのオーディオ信号から重み係数を算出する重み係数算出手段と、前記重み係数算出手段で算出した前記重み係数を用いて前記オーディオ信号に対するMiddle信号とSide信号とを算出するMS信号算出手段と、前記MS信号算出手段で算出した前記Middle信号とSide信号とを符号化する第1の信号処理手段とを備え、前記重み係数算出手段は、係数を前記オーディオ信号に掛けたものから算出したMiddle信号とSide信号との偏りが最大となるような係数を重み係数として算出することを特徴とするものである。   In order to solve the above-described conventional problem, the audio encoding device of the present invention uses the weighting coefficient calculation unit that calculates a weighting coefficient from a two-channel audio signal and the weighting coefficient calculated by the weighting coefficient calculation unit. MS signal calculation means for calculating a Middle signal and Side signal for an audio signal, and first signal processing means for encoding the Middle signal and Side signal calculated by the MS signal calculation means, and the weighting factor The calculating means is characterized in that a coefficient that maximizes the bias between the middle signal and the side signal calculated from the coefficient multiplied to the audio signal is calculated as a weighting coefficient.

また、前記MS信号算出手段で算出した前記Middle信号とSide信号とをもとに、MSステレオ処理を実施するか否かを判定するMSステレオ判定手段を備えた事を特徴とするものである。   Further, the present invention is characterized by comprising MS stereo determination means for determining whether or not to perform MS stereo processing based on the Middle signal and Side signal calculated by the MS signal calculation means.

また、前記重み係数算出手段が、前記2チャンネルのオーディオ信号のそれぞれの信号の2乗を累積したものの比の平方根を前記重み係数として算出することを特徴とするものである。   Further, the weighting factor calculating means calculates the square root of the ratio of the sum of the squares of the signals of the two-channel audio signals as the weighting factor.

また、前記オーディオ信号が時間領域で表現される信号である事を特徴とするものである。   The audio signal is a signal expressed in a time domain.

また、前記オーディオ信号が周波数領域で表現される信号である事を特徴とするものである。   The audio signal is a signal expressed in a frequency domain.

また、本発明のオーディオ復号化装置は、オーディオ符号化装置で符号化された信号からMiddle信号とSide信号とを復号する第2の信号処理手段と、前記オーディオ符号化装置で算出された重み係数を用いて、前記第2の信号処理手段で算出したMiddle信号とSide信号とから2チャンネルのオーディオ信号を復元するデコード手段とを備えたことを特徴とするものである。   The audio decoding device of the present invention includes a second signal processing means for decoding a Middle signal and a Side signal from a signal encoded by the audio encoding device, and a weighting factor calculated by the audio encoding device. And a decoding means for restoring a two-channel audio signal from the Middle signal and Side signal calculated by the second signal processing means.

本発明のオーディオ符号化装置によれば、2チャンネルのオーディオ信号と重み係数から算出するMiddle信号とSide信号の偏りが最大となるような重み係数を算出し、それを用いてMiddle信号とSide信号を算出することにより、2チャンネルのオーディオ信号をそのまま圧縮符号化するよりも圧縮効率を高める事ができる。   According to the audio encoding device of the present invention, a middle signal calculated from a two-channel audio signal and a weighting factor and a weighting factor that maximizes the bias of the side signal are calculated, and the middle signal and the side signal are calculated using the weighting factor. By calculating the above, it is possible to increase the compression efficiency as compared with the case where the 2-channel audio signal is directly compressed and encoded.

また、重み係数を用いてMiddle信号とSide信号を算出する事により、MS判定手段においてMSステレオ処理を実施するように判断する場合が増加するため、圧縮効率を高める事ができる。   Further, by calculating the Middle signal and the Side signal using the weighting factor, the number of cases in which the MS determination unit determines to perform the MS stereo processing increases, so that the compression efficiency can be improved.

また本発明のオーディオ復号化装置によれば、Middle信号とSide信号とを重み係数を用いて2チャンネルの信号に復号化する事ができる。   According to the audio decoding apparatus of the present invention, the Middle signal and the Side signal can be decoded into a 2-channel signal using a weighting coefficient.

以下本発明を実施するための最良の形態について、図面を参照しながら説明する。   The best mode for carrying out the present invention will be described below with reference to the drawings.

(実施の形態1)
図1は実施の形態1におけるオーディオ符号化装置のエンコーダの構成を示す図である。図1において、1は、後述の重み計数GをLチャンネル信号(L信号)又はRチャンネル信号(R信号)に掛けた上で、Middle信号(M信号)およびSide信号(S信号)を算出するMS信号算出手段であり、2は、MS信号算出手段1で算出したM信号とS信号から2乗振幅和Xを算出するMS2乗振幅和算出手段であり、3は、2乗振幅和XからMSステレオ処理を実施するかどうかを判定するMSステレオ判定手段であり、4は、MSステレオ判定手段3で判定した判定結果を基に、LR信号又はMS信号のどちらか一方を選択して符号化処理をするとともに、MSステレオ処理を実施したかどうかをフラグに設定し、さらに重み計数Gの情報を付加する信号処理手段であり、5は、LR信号から、後述の方法で重み係数Gを算出する重み係数算出手段である。
(Embodiment 1)
FIG. 1 is a diagram showing a configuration of an encoder of an audio encoding device according to Embodiment 1. In FIG. In FIG. 1, 1 calculates a Middle signal (M signal) and a Side signal (S signal) after multiplying an L channel signal (L signal) or an R channel signal (R signal) by a weighting factor G, which will be described later. MS signal calculating means, 2 is an MS square amplitude sum calculating means for calculating a square amplitude sum X from the M signal and S signal calculated by the MS signal calculating means 1, and 3 is from the square amplitude sum X MS stereo determination means for determining whether or not to perform MS stereo processing. 4 is a code selected by selecting either the LR signal or the MS signal based on the determination result determined by the MS stereo determination means 3 This is a signal processing means that sets whether or not the MS stereo processing has been performed and adds information on the weighting coefficient G. 5 is a weighting factor G that is calculated from the LR signal by a method that will be described later. It is a weighting factor calculation means for output.

以下、重み計数Gの算出方法について説明する。重み計数Gは、L信号もしくはR信号にGを掛けて算出したM信号とS信号との2乗振幅和の比(又はその逆数)が最大になるときのGの値である。   Hereinafter, a method for calculating the weighting factor G will be described. The weighting factor G is the value of G when the ratio of the sum of squared amplitudes of the M signal and S signal (or the reciprocal thereof) calculated by multiplying the L signal or R signal by G is the maximum.

まず、nサンプル目のRチャンネル信号(R(n))を、これにGをかけたものG・R(n)に置き換えると、nサンプル目のM信号(M(n))とnサンプル目のS信号S(n)とは、式6で表される。   First, when the R channel signal (R (n)) of the nth sample is replaced with G · R (n) obtained by multiplying it by the G, the M signal (M (n)) of the nth sample and the nth sample The S signal S (n) is expressed by Expression 6.

Figure 2008203315
Figure 2008203315

次に、これらの2乗振幅和SUM_M、SUM_Sは、式7で表される。ここで、Σの累積加算範囲はMSステレオ処理の処理単位であり、例えば1024個のサンプルからなる1フレームである。   Next, these squared amplitude sums SUM_M and SUM_S are expressed by Expression 7. Here, the cumulative addition range of Σ is a processing unit of MS stereo processing, and is, for example, one frame composed of 1024 samples.

Figure 2008203315
Figure 2008203315

次に、SUM_MとSUM_Sの比Xは式8で表される。ただし、X≧1とする。つまり、SUM_M≧SUM_Sであれば式8のように立式し、SUM_M<SUM_Sであれば、式8の右辺の分母と分子を逆にする。本実施の形態では、以下SUM_M≧SUM_Sとする。   Next, the ratio X of SUM_M and SUM_S is expressed by Expression 8. However, X ≧ 1. That is, if SUM_M ≧ SUM_S, the expression is as shown in Expression 8, and if SUM_M <SUM_S, the denominator on the right side of Expression 8 is reversed. In the present embodiment, it is assumed that SUM_M ≧ SUM_S hereinafter.

Figure 2008203315
Figure 2008203315

Xは値が大きいほど前記M信号と前記S信号の信号間の偏りが大きい事を意味している。従って、Xが最大になるようなG(G>0)を算出するために、XをGで偏微分したものがゼロとなるときのGの値を算出する。XをGで偏微分したものは式9で表わされる。   X means that the larger the value, the greater the deviation between the M signal and the S signal. Therefore, in order to calculate G (G> 0) that maximizes X, the value of G is calculated when X is partially differentiated by G and becomes zero. A result of partial differentiation of X by G is expressed by Equation 9.

Figure 2008203315
Figure 2008203315

式9は次のように変形できる(以下、L(n)をLに、R(n)をRに省略して表記する。)。   Equation 9 can be modified as follows (hereinafter, L (n) is abbreviated as L and R (n) is abbreviated as R).

Figure 2008203315
Figure 2008203315

Xが最大となるのは、式9の値がゼロになるとき、すなわち上式の分子がゼロになるときである。上式の分子は下記のように変形できる。   X is maximized when the value of Equation 9 becomes zero, that is, when the numerator in the above equation becomes zero. The molecule of the above formula can be transformed as follows.

Figure 2008203315
Figure 2008203315

上式の値がゼロになるのは、下記のときである(以下LをL(n)に、RをR(n)に戻して表記する。)。   The value of the above equation becomes zero in the following cases (hereinafter, L is returned to L (n) and R is returned to R (n)).

Figure 2008203315
Figure 2008203315

従って、Xが最大となるときのGの値は式10で表わされる。   Therefore, the value of G when X is maximum is expressed by Equation 10.

Figure 2008203315
Figure 2008203315

このように、重み係数Gは、重み係数算出手段5で、L(n)の2乗を1フレーム期間で累積積算したものと、R(n)の2乗を1フレーム期間で累積積算したものとの比の平方根を計算する事により算出される。   As described above, the weighting factor G is obtained by accumulating and summing the square of L (n) in one frame period and the sum of squares of R (n) in one frame period by the weighting factor calculation means 5. It is calculated by calculating the square root of the ratio.

以上のように構成されたオーディオ符号化装置のエンコーダの動作について、図2のフロー図を用いて説明する。   The operation of the encoder of the audio encoding apparatus configured as described above will be described with reference to the flowchart of FIG.

まず、重み係数算出ステップ100にて、重み係数算出手段5が、式10に基づいて重み係数Gを算出する。   First, in the weighting factor calculating step 100, the weighting factor calculating means 5 calculates the weighting factor G based on the equation (10).

次に、MS信号算出ステップ101にて、MS信号算出手段1が、重み係数算出手段5で算出した重み係数Gを式6に代入して、M信号とS信号とを算出する。   Next, in the MS signal calculation step 101, the MS signal calculation unit 1 calculates the M signal and the S signal by substituting the weighting factor G calculated by the weighting factor calculation unit 5 into Equation 6.

次に、MS2乗振幅和算出ステップ102にて、MS2乗振幅和算出手段2が、MS信号算出手段1で算出したM信号とS信号とを式7に代入することにより、SUM_MとSUM_Sを算出し、それを式8に代入して、2チャンネルの入力信号間の偏りを意味するXを算出する。   Next, in MS square amplitude sum calculation step 102, MS square amplitude sum calculation means 2 calculates SUM_M and SUM_S by substituting the M signal and S signal calculated by MS signal calculation means 1 into Equation 7. Then, by substituting it into Expression 8, X is calculated, which means the bias between the input signals of the two channels.

次に、MSステレオ判定ステップ103にて、MSステレオ判定手段3が、MS2乗振幅和算出手段2で算出したXと、LR信号を符号化するよりもMSステレオ処理を実行して前MS信号を符号化する方が圧縮効率が上がると判断可能となる閾値T1、T2とを比較し、MSステレオ処理を実行するかどうかを判定する。ここでT1はSUM_MがSUM_Sに対して十分大きい場合の閾値で、T2はSUM_SがSUM_Mに対して十分に大きい場合の閾値である。すなわち、X≧T1もしくはX≦T2であればMSステレオ処理を実行し、T2<X<T1であればMSステレオ処理を実行しないと判定して、その判定結果を出力する。   Next, in the MS stereo determination step 103, the MS stereo determination means 3 executes MS stereo processing rather than encoding the X and LR signals calculated by the MS square amplitude sum calculation means 2 to obtain the previous MS signal. The thresholds T1 and T2 that can be determined that the compression efficiency increases when encoding is performed, and it is determined whether or not the MS stereo processing is executed. Here, T1 is a threshold when SUM_M is sufficiently larger than SUM_S, and T2 is a threshold when SUM_S is sufficiently larger than SUM_M. That is, if X ≧ T1 or X ≦ T2, MS stereo processing is executed, and if T2 <X <T1, it is determined not to execute MS stereo processing, and the determination result is output.

MSステレオ判定手段3がMSステレオ処理を実行すると判定した場合は、MS信号選択ステップ104にて、信号処理手段4がMS信号算出手段1で算出したMS信号を選択して符号化処理を行うとともに、MSステレオ実行フラグ設定ステップ105にて、信号処理手段4がMSステレオ実行フラグを設定する。   If the MS stereo determination means 3 determines that the MS stereo processing is to be executed, the MS signal selection step 104 selects the MS signal calculated by the MS signal calculation means 1 and performs the encoding process. In the MS stereo execution flag setting step 105, the signal processing means 4 sets the MS stereo execution flag.

また、MSステレオ判定手段3がMSステレオ処理を実行しないと判定した場合は、LR信号選択ステップ106にて、信号処理手段4がLR信号を選択して符号化処理を行う。   If the MS stereo determination means 3 determines not to execute the MS stereo processing, the signal processing means 4 selects the LR signal and performs the encoding process in the LR signal selection step 106.

続いて、MSステレオ処理のデコーダについて説明する。図3は実施の形態1におけるオーディオ符号化装置のデコーダの構成を示す図である。図3において、6は入力信号を復号化してLR信号もしくはMS信号を出力すると共に、MSステレオ実行フラグの有無を判別し、さらにエンコーダ側で付加された重み係数Gを検出する信号処理手段であり、7は信号処理手段6においてMSステレオ実行フラグを判別してエンコーダ側でMSステレオ処理が実施されたと判断した場合に、信号処理手段6からのMS信号に所定の処理を実行してLR信号を復元するデコード手段である。   Next, the MS stereo processing decoder will be described. FIG. 3 is a diagram showing the configuration of the decoder of the audio encoding device according to the first embodiment. In FIG. 3, 6 is a signal processing means for decoding an input signal and outputting an LR signal or an MS signal, determining the presence or absence of an MS stereo execution flag, and detecting a weighting factor G added on the encoder side. , 7 when the MS stereo execution flag is discriminated in the signal processing means 6 and it is determined that the MS stereo processing has been carried out on the encoder side, the MS signal from the signal processing means 6 is subjected to predetermined processing and the LR signal is converted. Decoding means to restore.

以上のように構成された復号化装置のデコーダの動作について以下図4のフロー図を用いて説明する。図4のMSステレオ判別ステップ107にて、信号処理手段6が、エンコーダ側でMSステレオ処理されたかどうかを示すフラグを確認する事で判別し判別結果を出力する。フラグを判別してエンコーダ側でMSステレオ処理が実行されていないと判断した場合は、入力信号をデコードする必要がないため、MSステレオデコード処理を終了する。また、フラグを判別してエンコーダ側でMSステレオ処理を実行されていると判断した場合は、デコードステップ108にて、デコード手段7が、式11に従い、信号処理手段6が検出した重み係数Gを用いてMS信号をデコードして2チャンネルのLR信号を復元する。   The operation of the decoder of the decoding apparatus configured as described above will be described below with reference to the flowchart of FIG. In the MS stereo discrimination step 107 in FIG. 4, the signal processing means 6 discriminates by checking a flag indicating whether or not MS stereo processing has been performed on the encoder side, and outputs a discrimination result. If it is determined that the MS stereo process has not been executed on the encoder side by determining the flag, the MS stereo decoding process is terminated because there is no need to decode the input signal. If it is determined that the MS stereo processing is being executed on the encoder side by determining the flag, the decoding means 7 uses the weighting coefficient G detected by the signal processing means 6 according to Equation 11 in the decoding step 108. Use to decode the MS signal to restore the 2-channel LR signal.

Figure 2008203315
Figure 2008203315

以上のように、本実施の形態によれば、M信号とS信号間の偏りを大きくするために、従来のMS信号を算出する算出式に重み係数Gを導入し、意図的にMS信号間の偏りを大きくすることにより、MSステレオ処理を実行するように判断させて、MSステレオ処理を実行する場合を増加させる事により、結果として符号化に要するビット量を削減する事ができるため、符号化効率を向上させる事が可能となる。また、符号化に要するビット量を削減する事によって他の符号化処理でより多くのビットを割り当てる事が可能となるために高音質化が可能となる。   As described above, according to the present embodiment, in order to increase the bias between the M signal and the S signal, the weighting factor G is introduced into the calculation formula for calculating the conventional MS signal, and the MS signal is intentionally inserted. By increasing the bias of, it is possible to reduce the bit amount required for encoding as a result by increasing the number of cases where MS stereo processing is executed by determining to execute MS stereo processing. It is possible to improve the efficiency. In addition, by reducing the amount of bits required for encoding, it is possible to allocate more bits in other encoding processes, so that high sound quality can be achieved.

なお、本実施の形態ではエンコーダへの入力信号はL信号、R信号と表現したが、2チャンネルの信号であれば、LR信号に限らない、また、それらは時間領域で表現される信号でも良く、また周波数領域で表現される信号でも良い。   In this embodiment, the input signal to the encoder is expressed as an L signal and an R signal. However, as long as the signal is a two-channel signal, the signal is not limited to the LR signal, and may be a signal expressed in the time domain. Also, a signal expressed in the frequency domain may be used.

本発明は、音楽信号を符号化する機能を含む機器、例えばPC、携帯電話、ポータブルオーディオ機器、ミニコンポに有用である。将来、放送、通信、インターネットなどで符号化を施されたデータが流通する際にも有益である。   The present invention is useful for a device including a function for encoding a music signal, such as a PC, a mobile phone, a portable audio device, and a minicomponent. In the future, it is also useful when data encoded by broadcasting, communication, the Internet, etc. is distributed.

本発明の実施の形態1におけるオーディオ符号化装置の構成を示すブロック図1 is a block diagram showing the configuration of an audio encoding device according to Embodiment 1 of the present invention. 本発明の実施の形態1におけるオーディオ符号化装置の動作を示すフロー図FIG. 3 is a flowchart showing the operation of the audio encoding device according to the first embodiment of the present invention. 本発明の実施の形態1におけるオーディオ復号化装置の構成を示すブロック図1 is a block diagram showing a configuration of an audio decoding device according to Embodiment 1 of the present invention. 本発明の実施の形態1におけるオーディオ復号化装置の動作を示すフロー図FIG. 3 is a flowchart showing the operation of the audio decoding apparatus according to Embodiment 1 of the present invention. 従来のオーディオ符号化装置の構成を示すブロック図Block diagram showing the configuration of a conventional audio encoding device 従来のオーディオ符号化装置の動作を示すフロー図Flow diagram showing the operation of a conventional audio encoding device 従来のオーディオ復号化装置の構成を示すブロック図The block diagram which shows the structure of the conventional audio decoding apparatus. 従来のオーディオ復号化装置の動作を示すフロー図Flow diagram showing the operation of a conventional audio decoding device

符号の説明Explanation of symbols

1 MS信号算出手段
2 MS2乗振幅和算出手段
3 MSステレオ判定手段
4 信号処理手段
5 重み係数算出手段
6 信号処理手段
7 デコード手段
100 重み係数算出ステップ
101 MS信号算出ステップ
102 MS2乗振幅和算出ステップ
103 MSステレオ判定ステップ
104 MS信号選択ステップ
105 MSステレオ実行フラグ設定ステップ
106 LR信号選択ステップ
107 MSステレオ判別ステップ
108 デコードステップ
L Lチャンネル信号
R Rチャンネル信号
M Middle信号
S Side信号
G 重み係数
DESCRIPTION OF SYMBOLS 1 MS signal calculation means 2 MS square amplitude sum calculation means 3 MS stereo determination means 4 Signal processing means 5 Weight coefficient calculation means 6 Signal processing means 7 Decoding means 100 Weight coefficient calculation step 101 MS signal calculation step 102 MS square amplitude sum calculation step 103 MS stereo determination step 104 MS signal selection step 105 MS stereo execution flag setting step 106 LR signal selection step 107 MS stereo discrimination step 108 decoding step L L channel signal R R channel signal M Middle signal S Side signal G Weight coefficient

Claims (10)

2チャンネルのオーディオ信号から重み係数を算出する重み係数算出手段と、
前記重み係数算出手段で算出した前記重み係数を用いて前記オーディオ信号に対するMiddle信号とSide信号とを算出するMS信号算出手段と、
前記MS信号算出手段で算出した前記Middle信号とSide信号とを符号化する第1の信号処理手段とを備え、
前記重み係数算出手段は、係数を前記オーディオ信号に掛けたものから算出したMiddle信号とSide信号との偏りが最大となるような係数を重み係数として算出することを特徴とするオーディオ符号化装置。
Weighting factor calculating means for calculating a weighting factor from the two-channel audio signal;
MS signal calculating means for calculating a Middle signal and a Side signal for the audio signal using the weighting coefficient calculated by the weighting coefficient calculating means;
First signal processing means for encoding the Middle signal and Side signal calculated by the MS signal calculating means;
The audio coding apparatus according to claim 1, wherein the weighting coefficient calculating means calculates a weighting coefficient that maximizes a deviation between the middle signal and the side signal, which is calculated by multiplying the audio signal by the coefficient.
前記MS信号算出手段で算出した前記Middle信号とSide信号とをもとに、MSステレオ処理を実施するか否かを判定するMSステレオ判定手段を備えた事を特徴とする請求項1記載のオーディオ符号化装置。 2. The audio according to claim 1, further comprising MS stereo determination means for determining whether or not to perform MS stereo processing based on the Middle signal and Side signal calculated by the MS signal calculation means. Encoding device. 前記重み係数算出手段が、前記2チャンネルのオーディオ信号のそれぞれの信号の2乗を累積したものの比の平方根を前記重み係数として算出することを特徴とする請求項1記載のオーディオ符号化装置。 2. The audio encoding device according to claim 1, wherein the weighting factor calculating means calculates the square root of the ratio of the sum of the squares of the two-channel audio signals as the weighting factor. 前記オーディオ信号が時間領域で表現される信号である事を特徴とする請求項1記載のオーディオ符号化装置。 The audio encoding apparatus according to claim 1, wherein the audio signal is a signal expressed in a time domain. 前記オーディオ信号が周波数領域で表現される信号である事を特徴とする請求項1記載のオーディオ符号化装置。 2. The audio encoding device according to claim 1, wherein the audio signal is a signal expressed in a frequency domain. 請求項1記載のオーディオ符号化装置で符号化された信号からMiddle信号とSide信号とを復号する第2の信号処理手段と、
前記オーディオ符号化装置で算出された重み係数を用いて、前記第2の信号処理手段で算出したMiddle信号とSide信号とから2チャンネルのオーディオ信号を復元するデコード手段とを備えたことを特徴とするオーディオ復号化装置。
A second signal processing means for decoding a Middle signal and a Side signal from the signal encoded by the audio encoding device according to claim 1;
Decoding means for restoring a 2-channel audio signal from the Middle signal and Side signal calculated by the second signal processing means using the weighting coefficient calculated by the audio encoding device. An audio decoding device.
2チャンネルのオーディオ信号から重み係数を算出する重み係数算出ステップと、
前記重み係数算出ステップで算出した前記重み係数を用いて前記オーディオ信号に対するMiddle信号とSide信号とを算出するMS信号算出ステップと、
前記MS信号算出ステップで算出した前記Middle信号とSide信号とを符号化する第1の信号処理ステップとを有し、
前記重み係数算出ステップでは、係数を前記オーディオ信号に掛けたものから算出したMiddle信号とSide信号との偏りが最大となるような係数を重み係数として算出することを特徴とするオーディオ符号化方法。
A weighting factor calculating step for calculating a weighting factor from the two-channel audio signal;
An MS signal calculating step of calculating a Middle signal and a Side signal for the audio signal using the weighting factor calculated in the weighting factor calculating step;
A first signal processing step of encoding the Middle signal and Side signal calculated in the MS signal calculation step;
In the weighting coefficient calculation step, a coefficient that maximizes the bias between the Middle signal and the Side signal calculated from the coefficient multiplied to the audio signal is calculated as a weighting coefficient.
請求項7記載のオーディオ符号化方法で符号化された信号からMiddle信号とSide信号とを復号する第2の信号処理ステップと、
前記オーディオ符号化方法で算出された重み係数を用いて、前記第2の信号処理方法で算出したMiddle信号とSide信号とから2チャンネルのオーディオ信号を復元するデコードステップとを備えたことを特徴とするオーディオ復号化方法。
A second signal processing step of decoding a Middle signal and a Side signal from the signal encoded by the audio encoding method according to claim 7;
And a decoding step of restoring a two-channel audio signal from the middle signal and the side signal calculated by the second signal processing method using the weighting coefficient calculated by the audio encoding method. Audio decoding method.
請求項7または請求項8のいずれかに記載のオーディオ復号化方法の各ステップをコンピュータに実行させるためのプログラム。 The program for making a computer perform each step of the audio decoding method in any one of Claim 7 or Claim 8. 請求項9記載のプログラムを格納した記録媒体。 A recording medium storing the program according to claim 9.
JP2007036077A 2007-02-16 2007-02-16 Audio encoding/decoding device and method, and software Pending JP2008203315A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007036077A JP2008203315A (en) 2007-02-16 2007-02-16 Audio encoding/decoding device and method, and software

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007036077A JP2008203315A (en) 2007-02-16 2007-02-16 Audio encoding/decoding device and method, and software

Publications (1)

Publication Number Publication Date
JP2008203315A true JP2008203315A (en) 2008-09-04

Family

ID=39780935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007036077A Pending JP2008203315A (en) 2007-02-16 2007-02-16 Audio encoding/decoding device and method, and software

Country Status (1)

Country Link
JP (1) JP2008203315A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010121536A1 (en) * 2009-04-20 2010-10-28 华为技术有限公司 Method and apparatus for correcting channel delay parameters of multi-channel signal
JP2011145542A (en) * 2010-01-15 2011-07-28 Yamaha Corp Reproduction device, musical sound signal output device, reproduction system and program
CN104541326A (en) * 2012-07-31 2015-04-22 英迪股份有限公司 Device and method for processing audio signal
CN109429167A (en) * 2017-08-31 2019-03-05 瑞昱半导体股份有限公司 Accentuation device and method
CN112352277A (en) * 2018-07-03 2021-02-09 松下电器(美国)知识产权公司 Encoding device and encoding method
CN112352277B (en) * 2018-07-03 2024-05-31 松下电器(美国)知识产权公司 Encoding device and encoding method

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010121536A1 (en) * 2009-04-20 2010-10-28 华为技术有限公司 Method and apparatus for correcting channel delay parameters of multi-channel signal
US8976971B2 (en) 2009-04-20 2015-03-10 Huawei Technologies Co., Ltd. Method and apparatus for adjusting channel delay parameter of multi-channel signal
JP2011145542A (en) * 2010-01-15 2011-07-28 Yamaha Corp Reproduction device, musical sound signal output device, reproduction system and program
CN104541326A (en) * 2012-07-31 2015-04-22 英迪股份有限公司 Device and method for processing audio signal
JP2015528925A (en) * 2012-07-31 2015-10-01 インテレクチュアル ディスカバリー シーオー エルティディIntellectual Discovery Co.,Ltd. Audio signal processing apparatus and method
CN109429167A (en) * 2017-08-31 2019-03-05 瑞昱半导体股份有限公司 Accentuation device and method
CN109429167B (en) * 2017-08-31 2020-10-13 瑞昱半导体股份有限公司 Audio enhancement device and method
CN112352277A (en) * 2018-07-03 2021-02-09 松下电器(美国)知识产权公司 Encoding device and encoding method
CN112352277B (en) * 2018-07-03 2024-05-31 松下电器(美国)知识产权公司 Encoding device and encoding method

Similar Documents

Publication Publication Date Title
KR101001170B1 (en) Audio coding
EP2750131A1 (en) Encoding device and method, decoding device and method, and program
CN101790756A (en) Transient detector and method for supporting encoding of an audio signal
US11869523B2 (en) Method and apparatus for decoding a bitstream including encoded higher order ambisonics representations
JP2008203315A (en) Audio encoding/decoding device and method, and software
US8392177B2 (en) Method and apparatus for frequency encoding, and method and apparatus for frequency decoding
US7860721B2 (en) Audio encoding device, decoding device, and method capable of flexibly adjusting the optimal trade-off between a code rate and sound quality
JP2004184975A (en) Audio decoding method and apparatus for reconstructing high-frequency component with less computation
CN109300480B (en) Coding and decoding method and coding and decoding device for stereo signal
US20080161952A1 (en) Audio data processing apparatus
US8224659B2 (en) Audio encoding method and apparatus, and audio decoding method and apparatus, for processing death sinusoid and general continuation sinusoid
JP6012620B2 (en) Encoder and predictive encoding method, decoder and decoding method, predictive encoding and decoding system and method, and predictively encoded information signal
CN110728986B (en) Coding method, decoding method, coding device and decoding device for stereo signal
US8160869B2 (en) Method and apparatus for encoding continuation sinusoid signal information of audio signal and method and apparatus for decoding same
JP2006211243A (en) Device and method for digital signal encoding
US8160890B2 (en) Audio signal coding method and decoding method
EP1859439B1 (en) Multichannel audio compression and decompression method using virtual source location information
KR101317269B1 (en) Method and apparatus for sinusoidal audio coding, and method and apparatus for sinusoidal audio decoding
US20240185872A1 (en) Method and apparatus for decoding a bitstream including encoded higher order ambisonics representations
US20240029745A1 (en) Spatial audio parameter encoding and associated decoding
JP4539180B2 (en) Acoustic decoding device and acoustic decoding method
US20090063161A1 (en) Method and apparatus for encoding and decoding continuation sinusoidal signal of audio signal
KR20120088425A (en) Method for estimating coding type of speech compression streams in wireless communications and apparatus thereof
JP2010164809A (en) Decode device, and method of estimating sound coding system