JP5416173B2 - Frequency band copy method, apparatus, audio decoding method, and system - Google Patents

Frequency band copy method, apparatus, audio decoding method, and system Download PDF

Info

Publication number
JP5416173B2
JP5416173B2 JP2011151189A JP2011151189A JP5416173B2 JP 5416173 B2 JP5416173 B2 JP 5416173B2 JP 2011151189 A JP2011151189 A JP 2011151189A JP 2011151189 A JP2011151189 A JP 2011151189A JP 5416173 B2 JP5416173 B2 JP 5416173B2
Authority
JP
Japan
Prior art keywords
frequency
frequency range
domain coefficient
value
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011151189A
Other languages
Japanese (ja)
Other versions
JP2013019968A (en
Inventor
江東平
袁浩
陳国明
彭科
黎家力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to JP2011151189A priority Critical patent/JP5416173B2/en
Publication of JP2013019968A publication Critical patent/JP2013019968A/en
Application granted granted Critical
Publication of JP5416173B2 publication Critical patent/JP5416173B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、オーディオ復号化技術に関し、特に、未符号化の符号化サブバンドに対して周波数スペクトル再建を行う周波数帯コピー方法、装置及オーディオ復号化方法、システムに関する。
The present invention relates to an audio decoding technique, particularly spectral band replication method for performing a frequency spectrum reconstruction on the coded sub-band of the uncoded device及Beauty audio decoding method, a system.

オーディオ符号化技術は、例えば、デジタルオーディオラジオ、インタネットにおける音楽配信及びオーディオ通信などのマルチメディア応用技術の核心であり、オーディオエンコーダの圧縮性能の向上はこれらの応用に極めて有益である。認識オーディオエンコーダがロッシー変換領域符号化の一種類として、現在の主流のオーディオエンコーダになっている。一般には、符号化ビット(encoded bit)レートの制限により、オーディオ符号化の際、部分の周波数領域係数或いは周波数成分が符号化できなくなって、未符号化サブバンドの周波数スペクトル成分をより良好的に回復するために、従来のオーディオコーデックは、常にノイズ充填或いは周波数帯コピーの方法を利用して未符号化サブバンドの周波数スペクトル成分を再建する。G.722.1Cはノイズ充填の方法、HE-AAC-V1は周波数帯コピー技術、G.719はノイズ充填及び簡単な周波数帯コピーの結合の方法を採用する。ノイズ充填を採用する方法は、良好的に未符号化サブバンドの周波数スペクトルエンベロープ及びサブバンドの内の音調、ノイズ成分を回復できない。HE-AAC-V1の周波数帯コピー方法は、符号化前のオーディオ信号に周波数スペクトル分析を行う必要があり、高周波成分の信号に対して音調及びノイズ推定を行い、パラメータを取り出し、さらにオーディオ信号にダウンサンプリングした後、AACエンコーダにより符号化し、その運算の複雑度が高く、且つ比較的に多いパラメータ情報を復号化端に送信する必要があって、多数の符号化ビットを占めると共に、さらに符号化遅延を増加する場合もある。G.719のコピー方案が簡単すぎので、良好的に未符号化サブバンドの周波数スペクトルエンベロープ及びサブバンドの内の音調及びノイズ成分を回復できない。
Audio encoding technology is at the heart of multimedia application technologies such as digital audio radio, music distribution and audio communication over the Internet, and the improvement in compression performance of audio encoders is extremely beneficial for these applications . The recognition audio encoder is the current mainstream audio encoder as one type of lossy transform domain coding. In general, due to the limited encoded bit rate, the frequency domain coefficients or frequency components of the part cannot be encoded during audio encoding, and the frequency spectrum components of the uncoded subbands are improved. In order to recover, the conventional audio codec always reconstructs the frequency spectrum components of uncoded subbands using a noise filling or frequency band copy method. G.722.1C adopts noise filling method, HE-AAC-V1 adopts frequency band copy technology, and G.719 adopts noise filling and simple frequency band copy method. The method using the noise filling cannot satisfactorily recover the tone spectrum and noise component in the frequency spectrum envelope of the uncoded subband and the subband. The frequency band copy method of HE-AAC-V1 needs to perform frequency spectrum analysis on the audio signal before encoding, perform tone and noise estimation on the high frequency component signal, extract the parameters, and further convert it to the audio signal After down-sampling, the data is encoded by an AAC encoder, the calculation complexity is high, and a relatively large amount of parameter information needs to be transmitted to the decoding end, which occupies a large number of encoded bits and further encodes. In some cases, the delay is increased. Since G.719 copy scheme is Ru easy too, it can not recover tonal and noise components of the frequency spectrum envelope and subband good to uncoded subbands.

本発明解決しようとする技術問題はオーディオ符号化/復号化過程において符号化されていない符号化サブバンド(encoding subband)のオーディオ信号の回復問題を良好に解決するための、周波数帯コピー方法、装置及オーディオ復号化方法、システムを提供することである
A technical problem to be solved by the present invention is a frequency band copying method for satisfactorily solving the problem of recovery of an audio signal of an encoding subband that has not been encoded in an audio encoding / decoding process, device及audio decoding method is to provide a system.

前記の技術問題を解決するために、本発明は周波数帯コピー方法を提供し、
A、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索すること、
B、音調の所在位置により周波数帯コピー周期及びソース周波数範囲を確定し、該周波数帯コピー周期が0周波数点から音調位置の周波数点までの帯域幅であり、該ソース周波数範囲は、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲であり、その中、前記オフセット量copyband_offsetが0より大きいまたは0と等しいであること、
C、周波数帯コピー周期によりゼロビットの符号化サブバンドに対し周波数帯コピーを行うことを含む。
In order to solve the above technical problem, the present invention provides a frequency band copy method,
A, searching for the location of the tone of the audio signal in the MDCT frequency domain coefficient,
B, the frequency band copy period and the source frequency range are determined by the location of the tone, and the frequency band copy period is a bandwidth from the frequency point of the 0 tone point to the frequency point of the tone position, the source frequency range is 0 frequency point Is the frequency range from the offset of copyband_offset frequency points to the frequency point of the tone position to the offset of the copyband_offset frequency points, in which the offset amount copyband_offset is greater than or equal to 0. There is,
C, including performing frequency band copy on a zero-bit encoded subband with a frequency band copy period.

さらに、
ステップAにおいて、
第1周波数範囲の周波数領域係数に対し絶対値或いは平方値を取得して、平滑化フィルタを行い、
平滑化フィルタの結果によって、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値の所在の位置をある音調の所在の位置とする、
方法を採用して、ある音調の位置を搜索する。
further,
In step A,
Obtain the absolute value or square value for the frequency domain coefficient of the first frequency range, perform a smoothing filter,
According to the result of the smoothing filter, the location of the maximum extreme value of the first frequency range filter output value is searched, and the location of the maximum extreme value is set as the location of a certain tone.
The method is used to search for the position of a certain tone.

さらに、
該第1周波数範囲の周波数領域係数に対して絶対値を取得して、平滑化フィルタを行う計算式が
further,
A calculation formula for obtaining an absolute value for the frequency domain coefficient of the first frequency range and performing a smoothing filter is as follows:

Figure 0005416173
Figure 0005416173

であり、或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタを行う計算式が   Or a calculation formula for performing a smoothing filter on the frequency domain coefficient square value of the first frequency range is

Figure 0005416173
Figure 0005416173

であり、そのなか、   And in that,

Figure 0005416173
Figure 0005416173

が平滑化フィルタ係数であり、 Is the smoothing filter coefficient,

Figure 0005416173
Figure 0005416173

が第iフレームの第k個の周波数点のフィルタ出力値を表し、 Represents the filter output value of the kth frequency point of the i-th frame,

Figure 0005416173
Figure 0005416173

が第iフレームの第k個の周波数点の復号化された後のMDCT係数であり、且つi=0の場合、 Is the MDCT coefficient after decoding of the kth frequency points of the i-th frame, and i = 0,

Figure 0005416173
Figure 0005416173

である。 It is.

さらに、
前記第1周波数範囲は周波数スペクトルの統計特性によって確定される、エネルギーが比較的に集中する低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。
further,
The first frequency range is determined by statistical characteristics of a frequency spectrum, and is a low frequency range where energy is relatively concentrated. Among them, a low frequency is a frequency smaller than a half signal total bandwidth. Spectral component.

さらに、
直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とする方法によってフィルタ出力値の最大極値を確定する。
further,
The first maximum value is searched from the filter output value of the frequency domain coefficient corresponding to the first frequency range, and the maximum value of the filter output value is determined by using the maximum value as the maximum extreme value of the first frequency range filter output value. Determine the extreme value.

さらに、
以下の方法を採用してフィルタ出力値の最大極値を確定し、
該第1周波数範囲のその中の一段を第2周波数範囲とし、第2周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最初の最大値が対応する周波数領域係数の位置によって異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得た場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値である場合、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
further,
The following method is adopted to determine the maximum extreme value of the filter output value,
One stage in the first frequency range is set as the second frequency range, the first maximum value is searched from the filter output value of the frequency domain coefficient corresponding to the second frequency range, and the frequency corresponding to the first maximum value corresponds to the first frequency range. Perform different processing depending on the position of the area coefficient
a. If the first maximum value is the filter output value of the frequency domain coefficient of the lowest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the lowest frequency of the second frequency range is the previous one in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter output value of the previous frequency domain coefficient The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or continues to be compared, and the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is the next frequency. If you get greater than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is the maximum extreme value finally determined,
b. If the first maximum value is the filter output value of the frequency domain coefficient of the highest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the highest frequency of the second frequency range is incremented by one in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter frequency output value of the next frequency domain coefficient, The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or the comparison is continued, and the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the previous frequency. If it is greater than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the maximum extreme value finally determined,
c. When the first maximum value is a filter output value of a frequency domain coefficient between the lowest frequency and the highest frequency of the second frequency range, the frequency domain coefficient corresponding to the first maximum value is a position where the tone is located; That is, the first maximum value is the maximum extreme value finally determined.

さらに、
ステップCにおいて、ゼロビットの符号化サブバンドに対して周波数帯コピーする場合、先ず、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算し、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーする。
further,
In Step C, when frequency band copying is performed for a zero bit encoding subband, first, the zero bit encoding subband is determined by the source frequency range and the starting serial number of the zero bit encoding subband that needs to be frequency band copied. Calculate the source frequency range copy start serial number of the band and periodically copy the frequency domain coefficients of the source frequency range starting from the source frequency range copy start serial number to the zero-bit coded subband, with the frequency band copy period as the period. .

さらに、
ステップCにおける該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する方法は、
周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始MDCT周波数領域係数の周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯のコピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、周波数帯コピーオフセットをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを減りつづけ、該値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとする。
further,
The method of calculating the source frequency range copy start serial number of the zero bit encoded subband in step C is:
Obtain the serial number of the frequency point of the start MDCT frequency domain coefficient of the zero bit coding subband that needs to be reconstructed, and fillband_start_freq, the serial number of the frequency point corresponding to the tone is Tonal_pos, The copy period is set to copy_period, the value is equal to adding 1 to Tonal_pos, the frequency band copy offset is set to copyband_offset, the copy_period is continuously reduced to the value of fillband_start_freq, and the value is located in the serial number value interval of the source frequency range. In this case, the value is the source frequency range copy start serial number, and is copy_pos_mod.

さらに、
ステップCにおいて、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーする方法は、
ソース周波数範囲コピー開始シリアルナンバーからはじめとする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達するあと、再び第copyband_offset個の周波数点から開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数の周波数帯コピーを完成するまで行うことである。
further,
In step C, with the frequency band copy period as the period, the method of periodically copying the frequency domain coefficient of the source frequency range starting from the source frequency range copy start serial number to the encoded subband of zero bits is as follows:
The frequency domain coefficients starting from the source frequency range copy start serial number are sequentially copied back to the zero-bit encoded subband starting from fillband_start_freq, and the frequency point of the source frequency range copy is changed to the Tonal_pos + copyband_offset frequency point. After that, the frequency domain coefficients starting again from the copyband_offset frequency points are continued and subsequently copied to the zero-bit coded subband, and so on, all frequencies of the current zero-bit coded subband. This is done until the frequency band copy of the region coefficient is completed.

以上の技術問題を解決するため、本発明はまた周波数帯コピー装置を提供し、該装置には、順次に接続する音調位置捜索モジュール、周期及びソース周波数範囲計算モジュール、ソース周波数範囲コピー開始シリアルナンバー計算モジュール及び周波数帯コピーモジュールを含み、その中、
音調位置捜索モジュールは、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索するためのものであり、
周期及びソース周波数範囲計算モジュールは、音調の所在位置によりコピーに用いる周波数帯コピー周期及びソース周波数範囲を確定するものでり、該周波数帯コピー周期が0周波数点から音調位置の周波数点までの帯域幅であり、前記ソース周波数範囲 は、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲でああり、
ソース周波数範囲コピー開始シリアルナンバー計算モジュールは、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算するためのものであり、
前記周波数帯コピーモジュールは、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーするためのものである。
In order to solve the above technical problems, the present invention also provides a frequency band copy apparatus, which includes a tone position search module, a period and source frequency range calculation module, a source frequency range copy start serial number, which are sequentially connected. Includes a calculation module and a frequency band copy module, among them,
The tone position search module is for searching the location of a tone with an audio signal in the MDCT frequency domain coefficient,
The period and source frequency range calculation module determines the frequency band copy period and source frequency range used for copying according to the location of the tone, and the frequency band copy period is a band from the 0 frequency point to the frequency point of the tone position. And the source frequency range is a frequency range from a frequency point offset of 0 after the copyband_offset frequency points to a frequency point of the tone position after the offset of the copyband_offset frequency points;
The source frequency range copy start serial number calculation module calculates the source frequency range copy start serial number of the zero bit encoded subband by the start serial number of the zero bit encoded subband that needs to be copied. For calculating,
The frequency band copy module is for copying a frequency domain coefficient in a source frequency range periodically to a zero-bit encoding subband, starting from a source frequency range copy start serial number, with a frequency band copy period as a period.

さらに、
前記音調位置捜索モジュールが音調位置を捜索する方法は、
第1周波数範囲のMDCT周波数領域係数に対して絶対値または平方値を取り得て、平滑化フィルタを行い、
平滑化フィルタの結果により、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値が所在の位置が即ち音調の所在位置、
である。
further,
The method for searching the tone position by the tone position search module is as follows:
The absolute value or square value can be taken for the MDCT frequency domain coefficient of the first frequency range, and a smoothing filter is performed.
According to the result of the smoothing filter, the location of the maximum extreme value of the first frequency range filter output value is searched, and the location of the maximum extreme value is the position of the tone,
It is.

さらに、
前記音調位置捜索モジュールが該第1周波数範囲のMDCT周波数領域係数に対して絶対値を取り得て、平滑化フィルタを行う計算式が
further,
The tone position search module can obtain an absolute value for the MDCT frequency domain coefficient of the first frequency range, and a calculation formula for performing a smoothing filter is provided.

Figure 0005416173
Figure 0005416173

であり、
或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタを行う計算が
And
Alternatively, a calculation for performing a smoothing filter on the frequency domain coefficient square value of the first frequency range is performed.

Figure 0005416173
Figure 0005416173

であり、
そのなか、
And
Among them,

Figure 0005416173
Figure 0005416173

が平滑化フィルタ係数であり、 Is the smoothing filter coefficient,

Figure 0005416173
Figure 0005416173

が第iフレームの第k個の周波数点のフィルタ出力値であり、 Is the filter output value of the kth frequency point of the i-th frame,

Figure 0005416173
Figure 0005416173

が第iフレームの第k個の周波数点の復号化後のMDCT係数であり、且つi=0の場合、 Is the MDCT coefficient after decoding of the kth frequency point of the i-th frame, and i = 0,

Figure 0005416173
Figure 0005416173

である。 It is.

さらに、
前記第1周波数範囲は、周波数スペクトルの統計特性により確定されたエネルギーが比較的に集中している低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。
further,
The first frequency range is a low frequency range in which energy determined by statistical characteristics of the frequency spectrum is relatively concentrated. Among them, the low frequency is a signal bandwidth of 1/2. It is a small frequency spectrum component.

さらに、
前記音調位置捜索モジュールは、直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とする。
further,
The tone position search module searches for the first maximum value directly from the filter output value of the frequency domain coefficient corresponding to the first frequency range, and sets the maximum value as the maximum extreme value of the first frequency range filter output value.

さらに、
前記音調位置捜索モジュールは、フィルタ出力値の最大極値を確定する時、該第1周波数範囲の中の一段を第2周波数範囲として、先ず、第2周波数範囲が対応する周波数領域係数のフィルタ出力値から最初の最大値を捜索し、さらに該最初の最大値が対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
further,
The tone position search module, when determining the maximum extreme value of the filter output value, first stage in the first frequency range as the second frequency range, first, the filter output of the frequency domain coefficient corresponding to the second frequency range Search for the first maximum value from the values, and perform different processing depending on the position of the frequency domain coefficient corresponding to the first maximum value,
a. If the first maximum value is the filter output value of the frequency domain coefficient of the lowest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the lowest frequency of the second frequency range is the previous one in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter output value of the previous frequency domain coefficient The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or continues to be compared, and the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is the next frequency. If it gets larger than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the lowest frequency of the first frequency range is the maximum extreme value finally determined,
b. If the first maximum value is the filter output value of the frequency domain coefficient of the highest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the highest frequency of the second frequency range is one step behind in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter frequency output value of the next frequency domain coefficient, The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or the comparison is continued, and the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the previous frequency. If you get greater than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the maximum extreme value that was finally determined,
c. When the first maximum value is a filter output value of a frequency domain coefficient between the lowest frequency and the highest frequency of the second frequency range, the frequency domain coefficient corresponding to the first maximum value is a position where the tone is located; That is, the first maximum value is the maximum extreme value finally determined.

さらに、
前記ソース周波数範囲コピー開始シリアルナンバー計算モジュールが周波数帯コピーを行う必要があるゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算す過程は、現在に周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数領域コピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、ソース周波数範囲開始シリアルナンバーをcopyband_offsetとし、fillband_start_freqの値を循環にcopy_periodを減りつづけ、該値がソース周波数範囲のシリアルナンバーの値区間に位置するまでにして、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとする。
further,
The process of calculating the source frequency range copy start serial number of the zero-bit encoded subband that the source frequency range copy start serial number calculation module needs to perform frequency band copy needs to reconstruct the current frequency domain coefficient. Get the serial number of the start frequency point of the zero bit encoding subband, fillband_start_freq, serial number of the frequency point corresponding to the tone is Tonal_pos, frequency domain copy period is copy_period, and the value is 1 to Tonal_pos Equal source frequency range start serial number is copyband_offset, fillband_start_freq value is cyclically reduced and copy_period is decreased until the value is located in the serial frequency range of the source frequency range, then the source frequency range copy starts Serial number, copy_pos_mod and To do.

さらに、
周波数帯コピーモジュールが周波数帯コピーを行う場合、ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達する後、再び第copyband_offset個の周波数点から開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数コピーを完成するまで行うことである。
further,
When the frequency band copy module performs frequency band copy, the frequency domain coefficient starting from the source frequency range copy start serial number is sequentially copied to the zero-bit encoded subband starting from fillband_start_freq, and the source frequency After the frequency point of the range copy reaches the Tonal_pos + copyband_offset frequency point, copy the frequency domain coefficients starting from the first copyband_offset frequency points again, and later copy to the encoded subband of zero bits, and so on. This is done until all frequency domain coefficient copies of the current zero-bit coded subband are complete.

以上の技術問題を解決するため、本発明はオーディオ復号化方法を提供し、該方法には、
A、復号化待ちビットストリームにおける各振幅エンベロープ符号化ビットに対して復号化逆量子化し、各符号化サブバンドの振幅エンベロープを得るステップと、
B、各符号化サブバンドに対してビットを分配し、非ゼロビットの符号化サブバンドに対し復号化と逆量子化を行い、非ゼロビットの符号化サブバンドの周波数領域係数を得るステップと、
C、MDCT周波数領域係数なかにおいてオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドを周波数帯コピーし、現在の符号化サブバンドの振幅エンベロープによりコピーして得られる周波数領域係数に対しエネルギー調整を行い、それにノイズ充填を結合して、再建のゼロビットの符号化サブバンドの周波数領域係数を得て、その中の前記オフセット量copyband_offsetが0より大きいまたは0と等しいであるステップと、
D、非ゼロビットの符号化サブバンドの周波数領域係数と再建されたゼロビットの符号化サブバンドの周波数領域係数に対して逆修正離散コサイン変換(IMDCT)を行い、最終のオーディオ信号を得るステップとを含む。
In order to solve the above technical problem, the present invention provides an audio decoding method, which includes:
A, decoding and dequantizing each amplitude envelope encoded bit in the decoding-waiting bitstream to obtain an amplitude envelope for each encoded subband;
B, distributing bits to each encoded subband, performing decoding and inverse quantization on the non-zero bit encoded subband to obtain a frequency domain coefficient of the non-zero bit encoded subband;
C, search for the location of the tone of the audio signal in the MDCT frequency domain coefficient, and use the bandwidth from the 0 frequency point to the frequency point of the tone location as the frequency band copy period, and the 0 frequency point is copyband_offset The frequency range from the offset of the frequency point to the frequency point of the tone position after the offset of the copyband_offset frequency points is used as the source frequency range, and the zero-bit encoded subband is frequency-band copied, and the current encoded subband The energy adjustment is performed on the frequency domain coefficient obtained by copying with the amplitude envelope, and noise filling is combined therewith to obtain the frequency domain coefficient of the reconstructed zero-bit encoded subband, in which the offset amount copyband_offset is A step that is greater than or equal to 0;
D, performing an inverse modified discrete cosine transform (IMDCT) on the frequency domain coefficients of the non-zero bit encoding subband and the reconstructed zero bit encoding subband to obtain a final audio signal; Including.

さらに、
ステップCにおいて、以下の方法を採用してある音調の位置を捜索し、
第1周波数範囲の周波数領域係数に対し絶対値或いは平方値を取得して、平滑化フィルタを行い、
平滑化フィルタの結果によって、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値の所在の位置をある音調の所在の位置とする。
further,
In Step C, search for the position of the tone using the following method,
Obtain the absolute value or square value for the frequency domain coefficient of the first frequency range, perform a smoothing filter,
Based on the result of the smoothing filter, the position of the maximum extreme value of the first frequency range filter output value is searched, and the position of the maximum extreme value is set as the position of a certain tone.

さらに、
該第1周波数範囲の周波数領域係数に対して絶対値を取得して、平滑化フィルタを行う計算式が
further,
A calculation formula for obtaining an absolute value for the frequency domain coefficient of the first frequency range and performing a smoothing filter is as follows:

Figure 0005416173
Figure 0005416173

であり、
或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタを行う計算式が
And
Alternatively, a calculation formula for performing a smoothing filter on the frequency domain coefficient square value of the first frequency range is

Figure 0005416173
Figure 0005416173

であり、
そのなか、
And
Among them,

Figure 0005416173
Figure 0005416173

が平滑化フィルタ係数であり、 Is the smoothing filter coefficient,

Figure 0005416173
Figure 0005416173

が第iフレームの第k個の周波数点のフィルタ出力値を表し、 Represents the filter output value of the kth frequency point of the i-th frame,

Figure 0005416173
Figure 0005416173

が第iフレームの第k個の周波数点の復号化された後のMDCT係数であり、且つi=0の場合、 Is the MDCT coefficient after decoding of the kth frequency points of the i-th frame, and i = 0,

Figure 0005416173
Figure 0005416173

であるこ。 That's it.

さらに、
前記第1周波数範囲は周波数スペクトルの統計特性によって確定されるエネルギーが比較的に集中する低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。
further,
The first frequency range is a low frequency range in which energy determined by statistical characteristics of the frequency spectrum is relatively concentrated. Among them, the low frequency is a frequency spectrum smaller than a half signal total bandwidth. It is an ingredient.

さらに、
直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値なかから最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とする方法によってフィルタ出力値の最大極値を確定する。
further,
The first maximum value is searched from the filter output value of the frequency domain coefficient corresponding to the first frequency range directly, and the maximum value is obtained by setting the maximum value as the maximum extreme value of the first frequency range filter output value. Determine the extreme value.

さらに、
以下の方法を採用してフィルタ出力値の最大極値を確定し、
該第1周波数範囲のその中の一段を第2周波数範囲とし、第2周波数範囲が対応する周波数領域係数のフィルタ出力値の中から最初の最大値を捜索し、該最初の最大値が対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数との間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
further,
The following method is adopted to determine the maximum extreme value of the filter output value,
One stage in the first frequency range is set as the second frequency range, the first maximum value is searched from the filter output values of the frequency domain coefficients corresponding to the second frequency range, and the first maximum value corresponds to the first frequency range. Different processing depending on the position of the frequency domain coefficient
a. If the first maximum value is the filter output value of the frequency domain coefficient of the lowest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the lowest frequency of the second frequency range is the previous one in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter output value of the previous frequency domain coefficient The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or continues to be compared, and the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is the next frequency. If it gets larger than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the lowest frequency of the first frequency range is the maximum extreme value finally determined,
b. If the first maximum value is the filter output value of the frequency domain coefficient of the highest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the highest frequency of the second frequency range is one step behind in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter frequency output value of the next frequency domain coefficient, The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or the comparison is continued, and the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the previous frequency. If you get greater than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the maximum extreme value that was finally determined,
c. When the first maximum value is a filter output value of a frequency domain coefficient between the lowest frequency and the highest frequency in the second frequency range, the corresponding frequency domain coefficient corresponding to the first maximum value is the position of the tone. That is, the first maximum value is the maximum extreme value finally determined.

さらに、
ステップCにおいて、ゼロビットの符号化サブバンドに対して周波数帯コピーする時、先ず、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算し、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数をゼロビットの符号化サブバンドに周期的にコピーする。
further,
In step C, when frequency band copying is performed for a zero bit encoding subband, first, the zero bit encoding subband is determined by the source frequency range and the starting serial number of the zero bit encoding subband that needs to be frequency band copied. Calculates the band source frequency range copy start serial number, uses the frequency band copy period as the period, and periodically copies the frequency domain coefficients of the source frequency range starting from the source frequency range copy start serial number to the zero-bit encoding subband. .

さらに、
ステップCにおいて該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する方法は、
周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始MDCT周波数領域係数の周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯のコピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、周波数帯コピーオフセットをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを減りつづけて、該値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとする。
further,
The method of calculating the source frequency range copy start serial number of the zero bit encoded subband in step C is:
Obtain the serial number of the frequency point of the start MDCT frequency domain coefficient of the zero bit coding subband that needs to be reconstructed, and fillband_start_freq, the serial number of the frequency point corresponding to the tone is Tonal_pos, The copy period is set to copy_period, the value is equal to adding 1 to Tonal_pos, the frequency band copy offset is set to copyband_offset, copy_period is continuously reduced to the value of fillband_start_freq, and the value is added to the serial number value interval of the source frequency range. If it is located, this value is the source frequency range copy start serial number, and is copy_pos_mod.

さらに、
ステップCにおいて、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数をゼロビットの符号化サブバンドに周期的にコピーする方法は、
ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達する後、再び第copyband_offset個の周波数点を開始とする周波数領域係数を後へ続けて該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数の周波数帯コピーを完成するまで行うことである。
further,
In step C, with the frequency band copy period as the period, the method of periodically copying the frequency domain coefficient of the source frequency range starting from the source frequency range copy start serial number to the zero-bit encoded subband is:
Source frequency range copy start The frequency domain coefficient starting from the serial number is sequentially copied back to the zero-bit encoded subband starting from fillband_start_freq, and the frequency point of the source frequency range copy is set to Tonal_pos + copyband_offset frequency point After that, the frequency domain coefficients starting again at the copyband_offset frequency points are copied back to the zero bit encoding subband, and so on, and all frequencies of the current zero bit encoding subband are followed. This is done until the frequency band copy of the region coefficient is completed.

さらに、
以上ような周波数帯コピー方法とノイズ充填を結合する方法を採用してすべてのゼロビットの符号化サブバンドに対して周波数スペクトル再建を行い、或いは、特定の周波数点の以下のゼロビットの符号化サブバンドに対してランダムノイズ充填方法を採用して周波数スペクトル再建を行い、特定の周波数点の以上のゼロビットの符号化サブバンドに対して、周波数領域係数コピーとノイズ充填を結合する方法を採用して周波数スペクトル再建を行う。
further,
Frequency band reconstruction is performed for all zero-bit coded subbands using the above-described frequency band copying method and noise filling method, or the following zero-bit coded subbands at specific frequency points are used. The frequency spectrum reconstruction is performed using a random noise filling method, and the frequency domain coefficient copy and the noise filling method are combined for zero-bit coded subbands at a specific frequency point or higher. Perform spectrum reconstruction.

以上の技術問題を解決するため、本発明はオーディオ復号化システムを提供し、該システムは、ビットストリームデマルチプレクサ(DeMUX)、振幅エンベロープ復号化ユニット、ビット分配ユニット、周波数領域係数復号化ユニット、周波数帯コピーユニット、ノイズ充填ユニット、逆修正離散コサイン変換(IMDCT)ユニットを含み、その中に、
前記DeMUXは、復号化待ちビットストリームの中から振幅エンベロープ符号化ビット、周波数領域係数符号化ビット及びノイズレベル符号化ビットを分離するためのものであり、
前記振幅エンベロープ復号化ユニットは、前記DeMUXと接続し、前記ビットストリームデマルチプレクサが出力した振幅エンベロープ符号化ビットに対して復号化逆量子化を行い、各符号化サブバンドの振幅エンベロープを得るためのものであり、
前記ビット分配ユニットは、前記振幅エンベロープ復号化ユニットと接続し、ビットの分配を行い、各符号化サブバンドにおける各の周波数領域係数に分配された符号化ビット数を得るためのものであり、
周波数領域係数復号化ユニットは、振幅エンベロープ復号化ユニット及びビット分配ユニットと接続し、符号化サブバンドに対して復号化、逆量子化及び逆正規化を行い、周波数領域係数を得るためのものであり、
前記周波数帯コピーユニットは、前記DeMUX、周波数領域係数復号化ユニット、振幅エンベロープ復号化ユニット及びビット分配ユニットと接続し、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドに対し周波数帯コピーを行い、その中、前記オフセット量copyband_offsetが0より大きいまたは0と等しいであるためのもので、さらに、現在の符号化サブバンドの振幅エンベロープによりコピーして得られる周波数領域係数に対してエネルギー調整を行うためのものであり、
ノイズ充填ユニットは、振幅エンベロープ復号化ユニット、ビット分配ユニット及び周波数帯コピーユニットと接続し、現在のゼロビットの符号化サブバンドの振幅エンベロープにより該符号化サブバンドにノイズを填充し、再建するゼロビットの符号化サブバンドの周波数領域係数を得るためのものであり、
IMDCTユニットは、前記ノイズ充填ユニットと接続し、ノイズ充填した後の周波数領域係数に対してIMDCTを行い、オーディオ信号を得るためのものである。
To solve the above technical problems, the present invention provides an audio decoding system, which includes a bitstream demultiplexer (DeMUX), an amplitude envelope decoding unit, a bit distribution unit, a frequency domain coefficient decoding unit, a frequency Includes band copy unit, noise filling unit, inverse modified discrete cosine transform (IMDCT) unit,
The DeMUX is for separating amplitude envelope encoded bits, frequency domain coefficient encoded bits and noise level encoded bits from the decoding-waiting bitstream,
The amplitude envelope decoding unit is connected to the DeMUX, performs decoding inverse quantization on the amplitude envelope encoded bits output from the bitstream demultiplexer, and obtains an amplitude envelope of each encoded subband. Is,
The bit distribution unit is connected to the amplitude envelope decoding unit, distributes bits, and obtains the number of encoded bits distributed to each frequency domain coefficient in each encoded subband;
The frequency domain coefficient decoding unit is connected to the amplitude envelope decoding unit and the bit distribution unit, and performs decoding, inverse quantization, and inverse normalization on the encoded subband to obtain a frequency domain coefficient. Yes,
The frequency band copy unit is connected to the DeMUX, the frequency domain coefficient decoding unit, the amplitude envelope decoding unit, and the bit distribution unit, and searches for the location of a tone having an audio signal in the MDCT frequency domain coefficient. The bandwidth from the point to the frequency point of the tone position is defined as the frequency band copy cycle, and the frequency point from the zero frequency point is later to the offset of the copyband_offset frequency points to the offset of the frequency point of the tone position is later to the offset of the copyband_offset frequency points. The frequency range is copied to a zero-bit encoded subband with the frequency range as the source frequency range, and the offset amount copyband_offset is greater than or equal to 0, and further the current encoding Energy for frequency domain coefficients obtained by copying with subband amplitude envelope Ghee adjustment,
The noise filling unit is connected to the amplitude envelope decoding unit, the bit distribution unit, and the frequency band copy unit, and fills the coding subband with noise by the amplitude envelope of the current zero bit coding subband and reconstructs the zero bit To obtain the frequency domain coefficients of the encoded subbands,
The IMDCT unit is connected to the noise filling unit to obtain an audio signal by performing IMDCT on the frequency domain coefficient after noise filling.

さらに、
前記周波数帯コピーユニットは、順次に接続する音調位置捜索モジュール、周期及びソース周波数範囲計算モジュール、ソース周波数範囲コピー開始シリアルナンバー計算モジュール及び周波数帯コピーモジュールを含み、その中に、
音調位置捜索モジュールは、MDCT周波数領域係数なかからオーディオ信号のある音調の所在位置を捜索するためのものであり、
周期及びソース周波数範囲計算モジュールは、音調の所在位置によりコピーに用いる周波数帯コピー周期及びソース周波数範囲を確定するためのもので、該周波数帯コピー周期は0周波数点から音調位置までの周波数点の帯域幅であり、前記ソース周波数範囲は、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲であり、
ソース周波数範囲コピー開始シリアルナンバー計算モジュールは、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算するためのものであり、
前記周波数帯コピーモジュールは、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数をゼロビットの符号化サブバンドに周期的にコピーするためのものである。
further,
The frequency band copy unit includes a tone position search module, a period and source frequency range calculation module, a source frequency range copy start serial number calculation module, and a frequency band copy module, which are sequentially connected.
The tone position search module is for searching the location of a tone having an audio signal from the MDCT frequency domain coefficients.
The period and source frequency range calculation module is for determining the frequency band copy period and source frequency range used for copying according to the position of the tone, and the frequency band copy period is a frequency point from the zero frequency point to the tone position. The source frequency range is a frequency range from zero frequency point offset from copyband_offset frequency point offset to tone position frequency point offset later to copyband_offset frequency point offset,
The source frequency range copy start serial number calculation module calculates the source frequency range copy start serial number of the zero bit encoded subband by the start serial number of the zero bit encoded subband that needs to be copied. For calculating,
The spectral band replication module, a spectral band replication period as the period, Ru der intended for periodically copying the frequency domain coefficients of the beginning source frequency range of the source frequency range copy start serial number zero bit encoding subband .

さらに、
前記音調捜索モジュールは、
第1周波数範囲のMDCT周波数領域係数に対して絶対値または平方値を取り得て、平滑化フィルタを行い、
平滑化フィルタの結果により、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値が所在している位置が、即ち、音調の所在位置である、
方法を採用して音調の所在位置を捜索する。
further,
The tone search module
The absolute value or square value can be taken for the MDCT frequency domain coefficient of the first frequency range, and a smoothing filter is performed.
The location of the maximum extreme value of the first frequency range filter output value is searched according to the result of the smoothing filter, and the location where the maximum extreme value is located, that is, the location of the tone.
Use the method to search the location of the tone.

さらに、
前記音調捜索モジュールが該第1周波数範囲のMDCT周波数領域係数に対して絶対値を取り得て、平滑化フィルタを行う計算式が
further,
The tone search module can take an absolute value for the MDCT frequency domain coefficient of the first frequency range, and a calculation formula for performing a smoothing filter is

Figure 0005416173
Figure 0005416173

であり、
或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタの計算が
And
Alternatively, a smoothing filter can be calculated for the frequency domain coefficient square value of the first frequency range.

Figure 0005416173
Figure 0005416173

であり、
そのなか、
And
Among them,

Figure 0005416173
Figure 0005416173

が平滑化フィルタ係数であり、 Is the smoothing filter coefficient,

Figure 0005416173
Figure 0005416173

が第iフレームの第k個の周波数点のフィルタ出力値であり、 Is the filter output value of the kth frequency point of the i-th frame,

Figure 0005416173
Figure 0005416173

が第iフレームの第k個の周波数点の復号化後のMDCT係数であり、且つi=0の場合、 Is the MDCT coefficient after decoding of the kth frequency point of the i-th frame, and i = 0,

Figure 0005416173
Figure 0005416173

である。 It is.

さらに、
前記第1周波数範囲は、周波数スペクトルの統計特性により確定されたエネルギーが比較的に集中している低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。
further,
The first frequency range is a low frequency range in which energy determined by statistical characteristics of the frequency spectrum is relatively concentrated. Among them, the low frequency is a signal bandwidth of 1/2. It is a small frequency spectrum component.

さらに、
前記音調捜索モジュールは、直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値なかから最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とする。
further,
The tone search module searches for the first maximum value directly from the filter output values of the frequency domain coefficients corresponding to the first frequency range, and sets the maximum value as the maximum extreme value of the first frequency range filter output value.

さらに、
前記音調捜索モジュールは、フィルタ出力値の最大極値を確定すると、該第1周波数範囲のその中の一段を第2周波数範囲として、先ず、第2周波数範囲が対応する周波数領域係数のフィルタ出力値なかから最初の最大値を捜索し、そして該最初の最大値に対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前のの周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
further,
When the tone search module determines the maximum extreme value of the filter output value, the first frequency range is defined as the second frequency range, and first, the filter output value of the frequency domain coefficient corresponding to the second frequency range Search for the first maximum value, and perform different processing depending on the position of the frequency domain coefficient corresponding to the first maximum value,
a. If the first maximum value is the filter output value of the frequency domain coefficient of the lowest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the lowest frequency of the second frequency range is the previous one in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter output value of the previous frequency domain coefficient The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or continues to be compared, and the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is the next frequency. If it gets larger than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the lowest frequency of the first frequency range is the maximum extreme value finally determined,
b. If the first maximum value is the filter output value of the frequency domain coefficient of the highest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the highest frequency of the second frequency range is one step behind in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter frequency output value of the next frequency domain coefficient, The filter output value of the current frequency domain coefficient is the finally determined maximum extreme value, or the comparison is continued, and the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the previous one. If you get greater than the filter output value of the frequency domain coefficient, the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the maximum extreme value that was finally determined,
c. When the first maximum value is a filter output value of a frequency domain coefficient between the lowest frequency and the highest frequency of the second frequency range, the frequency domain coefficient corresponding to the first maximum value is a position where the tone is located; That is, the first maximum value is the maximum extreme value finally determined.

さらに、
前記ソース周波数範囲コピー開始シリアルナンバー計算モジュールが周波数帯コピーを行う必要があるゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する過程は、現在に周波数領域係数を再建することが必要があるゼロビットの符号化サブバンドの開始周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯のコピー周期をcopy_periodとし、その値はTonal_posに1を加えることであり、ソース周波数範囲開始シリアルナンバーをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを減って、該値がソース周波数範囲のシリアルナンバーの値区間に位置するまでにして、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modであることを含む。
further,
The process of calculating the source frequency range copy start serial number of the zero-bit encoded subband that the source frequency range copy start serial number calculation module needs to perform frequency band copy needs to reconstruct the current frequency domain coefficient Get the serial number of the starting frequency point of a certain zero-bit coding subband, fillband_start_freq, the serial number of the frequency point to which the tone corresponds is Tonal_pos, the copy period of the frequency band is copy_period, and the value is 1 in Tonal_pos The source frequency range start serial number is set to copyband_offset, the copy_period is cyclically reduced to the value of fillband_start_freq, until the value is located in the value interval of the serial number in the source frequency range, and the value is Frequency range copy start serial number, copy_p Including os_mod.

さらに、
周波数帯コピーモジュールが周波数帯コピーを行う場合、ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけて、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達するまでにして、その後再び第copyband_offset個の周波数点を開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数コピーを完成するまで行うことである。
further,
When the frequency band copy module performs frequency band copy, the frequency domain coefficient starting with the source frequency range copy start serial number is sequentially copied to the zero-bit encoded subband with fillband_start_freq as the start position. Until the frequency point of the frequency range copy reaches the Tonal_pos + copyband_offset frequency point, and then copy the frequency domain coefficient starting from the copyband_offset frequency point again and copy it back to the zero-bit encoded subband, And so on until all frequency domain coefficient copies of the current zero bit coded subband have been completed.

さらに、
前記周波数帯コピーユニットが採用する周波数領域係数コピーとノイズ充填ユニットのノイズ充填結合の方法は、すべてのゼロビットの符号化サブバンドのために周波数スペクトル再建を行い、或いは、前記ノイズ充填ユニットが特定周波数点以下のゼロビットの符号化サブバンドに対してランダムノイズ充填方法を採用して周波数スペクトル再建を行い、周波数帯コピーユニットが採用する周波数領域係数コピーとノイズ充填ユニットノイズ充填結合の方法は特定周波数点以上のゼロビットの符号化サブバンドに対し周波数スペクトル再建を行う。
further,
The frequency domain coefficient copy employed by the frequency band copy unit and the noise filling unit method of noise filling unit perform frequency spectrum reconstruction for all zero-bit coding subbands, or the noise filling unit may be a specific frequency. The frequency spectrum reconstruction is performed by using a random noise filling method for zero-bit coded subbands below the point, and the frequency domain coefficient copy and noise filling unit adopted by the frequency band copy unit are used for a specific frequency point. It intends line the frequency spectrum reconstruction to the coding sub-band of more than zero bits.

本発明は、オーディオ符号化/復号化システムの復号化端で復号化した後得られるMDCT周波数領域係数からオーディオ信号のある音調の所在の位置を捜索し、さらに該音調の所在位置により周波数領域コピー周期を確定し、さらに、該周波数領域コピー周期により周波数帯コピーを行い、エネルギーレベル調整及びノイズ充填に結合して未符号化符号化サブバンドに対し周波数領域係数の再建を行い、その中、未符号化サブバンドの周波数スペクトルエンベロープ値によって、ノイズ充填及び周波数帯コピーのエネルギーレベルの調整を行う。該方法は、より良好的に未符号化符号化サブバンドの周波数スペクトルエンベロープ及び内部の音調情報を回復でき、良好的な主観的な聞く効果を得る。
The present invention searches for a location of a tone of an audio signal from MDCT frequency domain coefficients obtained after decoding at a decoding end of an audio encoding / decoding system, and further copies a frequency domain based on the location of the tone. to confirm the cycle, further, subjected to spectral band replication by the frequency domain copying cycle performs reconstruction of frequency domain coefficients to combine with uncoded encoding subband energy level adjustment and noise filling therein, Not The energy level of noise filling and frequency band copying is adjusted according to the frequency spectrum envelope value of the encoded subband. The method can better recover the frequency spectrum envelope and internal tone information of the uncoded encoded subbands and obtain a good subjective listening effect.

図1は、本発明の周波数帯コピー方法の模式図である。FIG. 1 is a schematic diagram of the frequency band copying method of the present invention. 図2は、本発明のオーディオ復号化方法の模式図である。FIG. 2 is a schematic diagram of the audio decoding method of the present invention. 図3は、本発明の周波数帯コピー装置のモジュール構造の模式図である。FIG. 3 is a schematic diagram of the module structure of the frequency band copying apparatus of the present invention. 図4は、本発明のオーディオ復号化システムの構造の模式図である。FIG. 4 is a schematic diagram of the structure of the audio decoding system of the present invention.

本発明の主旨は、オーディオ符号化/復号化システムの復号化端で復号化した後得られるMDCT周波数領域係数中においてオーディオ信号のある音調の所在の位置を捜索し、さらに該音調の所在位置により周波数領域コピー周期を確定し、さらに、該周波数領域コピー周期により周波数帯コピーを行い、エネルギーレベル調整及びノイズ充填に結合して未符号化の符号化サブバンドに対し周波数領域係数の再建を行い、その中、未符号化サブバンドの周波数スペクトルエンベロープ値によって、ノイズ充填及び周波数帯コピーのエネルギーレベルの調整を行う。該方法は、良好的に未符号化の符号化サブバンドの周波数スペクトルエンベロープ及び内部の音調情報を回復すること、良好的な主観的な聞く効果を得ることができる。
The gist of the present invention is to search for the location of a certain tone of the audio signal in the MDCT frequency domain coefficient obtained after decoding at the decoding end of the audio encoding / decoding system, and further to determine the location of the tone. Determine the frequency domain copy period, further perform frequency band copy according to the frequency domain copy period, combine with energy level adjustment and noise filling, reconstruct frequency domain coefficients for the uncoded encoded subbands, Among them, the energy level of noise filling and frequency band copying is adjusted by the frequency spectrum envelope value of the uncoded subband. The method includes restoring the frequency spectral envelope and internal tone information of the encoded subband good manner uncoded, it is possible to obtain an excellent specific subjective listening effects.

本発明に言及された周波数領域係数とは、MDCT周波数領域係数である。   The frequency domain coefficients mentioned in the present invention are MDCT frequency domain coefficients.

図1のように、本発明の周波数帯コピー方法は以下のステップを含み、
101:MDCT周波数領域係数においてオーディオ信号のある音調の所在位置を捜索すること、
本発明の好ましい音調の所在位置を捜索する方法は、MDCT周波数領域係数を平滑化フィルタすることで、以下のステップを含み、
a1、低周波数のある特定周波数範囲のMDCT周波数領域係数に対し絶対値或は平方値を取り、平滑化フィルタを行い、
ここでいう特定の周波数範囲は周波数スペクトルの統計特性によって確定されたエネルギーが比較的に集中する低周波数の周波数範囲でもよく、第1周波数範囲と言われる。ここの低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。
As shown in FIG. 1, the frequency band copying method of the present invention includes the following steps:
101: searching for the location of a tone with an audio signal in the MDCT frequency domain coefficients,
The method of searching for a preferred tone location according to the present invention includes the following steps by smoothing the MDCT frequency domain coefficient:
a1, Take absolute value or square value for MDCT frequency domain coefficient in a certain frequency range with low frequency, perform smoothing filter,
The specific frequency range here may be a low frequency range in which energy determined by statistical characteristics of the frequency spectrum is relatively concentrated, and is referred to as a first frequency range. Here, the low frequency is a frequency spectrum component smaller than a half signal total bandwidth.

ここで言うMDCT周波数領域係数とは、オーディオ符号化/復号化システムの復号化端の復号化した後得られるMDCT周波数領域係数であり、周波数により低から高まで配列し、第一個の周波数点のシリアルナンバーを0とし、後続の周波数点を周波数の順序シリアルナンバーにより順次に1を加える。   MDCT frequency domain coefficients here are MDCT frequency domain coefficients obtained after decoding at the decoding end of the audio encoding / decoding system, arranged from low to high according to frequency, and the first frequency point The serial number is set to 0, and the subsequent frequency points are sequentially added by the frequency order serial number.

該第1周波数範囲の周波数領域係数に対し絶対値を取り得て、平滑化フィルタを行なう計算式が以下のようであり、   An absolute value can be taken for the frequency domain coefficient of the first frequency range, and a calculation formula for performing the smoothing filter is as follows:

Figure 0005416173
Figure 0005416173

或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタを行なう計算式が以下のようであり、
Alternatively, formula for performing a smoothing filter to the frequency domain coefficient square value of the first frequency range is as follows,

Figure 0005416173
Figure 0005416173

そのなか、   Among them,

Figure 0005416173
Figure 0005416173

は平滑化フィルタ係数であり、その値の範囲が(0、1)であり、その値が0.125を取ってもよく、 Is the smoothing filter coefficient, its value range is (0, 1), its value may take 0.125,

Figure 0005416173
Figure 0005416173

は第iフレームの第k個の周波数点のフィルタ出力値を表し、 Represents the filter output value of the kth frequency point of the i-th frame,

Figure 0005416173
Figure 0005416173

は第iフレームの第k個の周波数点の復号化した後のMDCT係数であり、且つ、i=0の場合、 Is the MDCT coefficient after decoding the k-th frequency point of the i-th frame, and i = 0,

Figure 0005416173
Figure 0005416173

である。 It is.

a2、平滑化フィルタの結果によって、フィルタ出力値の最大極値の所在位置を捜索し、該最大極値の所在位置を音調の所在位置とする。   a2, the location of the maximum extreme value of the filter output value is searched based on the result of the smoothing filter, and the location of the maximum extreme value is set as the location of the tone.

本発明によるオーディオ信号の音調とは、オーディオ信号の基音或は基音のある倍音を意味している。   The tone of an audio signal according to the present invention means a fundamental tone of the audio signal or a harmonic overtone with a fundamental tone.

第1周波数範囲フィルタ出力値の最大極値の所在位置を捜索する方法は、以下のような2種類があり、
(1)直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値として、対応の周波数点のシリアルナンバーを最大極値(即ち音調)の位置とし、
(2)最大極値を捜索する際に、該第1周波数範囲のある一段を第2周波数範囲として、第2周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最初の最大値を第1周波数範囲フィルタ出力値の最大極値として、対応の周波数点のシリアルナンバーを最大極値(即ち音調)の位置とする。
There are two methods for searching for the location of the maximum extreme value of the first frequency range filter output value as follows:
(1) Search for the first maximum value directly from the filter output values of the frequency domain coefficients to which the first frequency range corresponds, and use the maximum value as the maximum extreme value of the first frequency range filter output value, and the corresponding frequency point The serial number is the position of the maximum extreme value (ie tone),
(2) When searching for the maximum extreme value, the first maximum value is searched from the filter output values of the frequency domain coefficients corresponding to the second frequency range, with one stage in the first frequency range as the second frequency range. The first maximum value is set as the maximum extreme value of the first frequency range filter output value, and the serial number of the corresponding frequency point is set as the position of the maximum extreme value (ie, tone).

第2周波数範囲の起点位置は第1周波数範囲の起点より大きい必要があり、第2周波数範囲の終点位置は第1周波数範囲の終点より小さい必要があり、好ましくは、第1周波数範囲と第2周波数範囲における周波数係数の数は8より小さくない。   The starting position of the second frequency range needs to be larger than the starting point of the first frequency range, the end position of the second frequency range needs to be smaller than the end point of the first frequency range, and preferably the first frequency range and the second frequency range The number of frequency coefficients in the frequency range is not less than 8.

捜索した最初の最大値が対応する周波数領域係数はオーディオ信号の音調の所在位置ではないことを防止するために、音調位置捜索を行なう際に、先ず、該第2周波数範囲のフィルタ出力値中から最初の最大値を捜索し、該最初の最大値が対応する周波数領域係数の位置により異なる処理を行い、
(a)該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値がひとつ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数が音調の所在位置であることと考えられ、即ち、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最低周波数の周波数領域係数が音調の所在位置であることと考えられ、即ち、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
(b)該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、現在の周波数領域係数が音調の所在位置であることと考えられ、即ち、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最高周波数の周波数領域係数が音調の所在の位置であることと考えられ、即ち、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
(c)該最初の最大値が第2周波数範囲の最低周波数と最高周波数との間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
In order to prevent that the frequency domain coefficient corresponding to the first maximum value searched is not the position of the tone of the audio signal, first, when performing the tone position search, the filter output value of the second frequency range is selected. Search for the first maximum value and perform different processing depending on the position of the frequency domain coefficient corresponding to the first maximum value,
(A) When the first maximum value is the filter output value of the frequency domain coefficient of the lowest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the lowest frequency of the second frequency range is set in the first frequency range. Compared with the filter output value of the frequency domain coefficient of the previous lower frequency, the comparison is continued sequentially, and the filter output value of the current frequency domain coefficient is larger than the filter output value of the previous frequency domain coefficient. The current frequency domain coefficient is considered to be the location of the tone, i.e., the filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or continues to be compared. If the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is greater than the filter output value of the next frequency domain coefficient, the frequency domain coefficient of the lowest frequency of the first frequency range It considered to be a location of the tone, i.e., a maximum extreme filtering output of the frequency domain coefficient of the lowest frequency of the first frequency range is finally determined,
(B) If the first maximum value is the filter output value of the frequency domain coefficient of the highest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the highest frequency of the second frequency range is Compared with the filter output value of the frequency domain coefficient of the next higher frequency, it continues to compare sequentially, and the filter output value of the current frequency domain coefficient is greater than the filter output value of the next frequency domain coefficient If it is large, it is considered that the current frequency domain coefficient is the location of the tone, i.e., the filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or continues to be compared. If the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is greater than the filter output value of the previous frequency domain coefficient, the frequency domain coefficient of the highest frequency of the first frequency range is the sound. It believed that the position of the location, i.e., a maximum extreme filtering output of the frequency domain coefficient of the highest frequency of the first frequency range is finally determined,
(C) If the first maximum value is a filter output value of a frequency domain coefficient between the lowest frequency and the highest frequency of the second frequency range, the frequency domain coefficient corresponding to the first maximum value is the location of the tone. Position, that is, the first maximum value is the maximum extreme value finally determined.

以下、第1周波数範囲の周波数領域係数が第24個から第64個までのMDCT周波数領域係数であり、第2周波数範囲の周波数領域係数が第33個から第56個までのMDCT周波数領域係数であることを例をとして、オーディオ信号位置を確定する方法を説明し、
第33から第56個までのMDCT周波数領域係数のフィルタ出力値中からその最大値を捜索し、最大値が第33個の周波数領域係数に対応すると、第32個の周波数領域係数の検波出力結果が第33個の周波数領域係数より大きいか否かを判断し、YESと、順次に前へ比較し続け、第31個の周波数領域係数の検波出力結果が第32個の周波数領域係数より大きいか否かを判断し、このような方法に従って、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前のものより大きい場合、或は、捜索しつづけて、第24個の周波数領域係数のフィルタ出力値が第25個の周波数領域係数のフィルタ出力値より大きい場合、現在の周波数領域係数或は第24個の周波数領域係数が音調の位置であり、
最大値が56であると、類似の方法によって、順次に後へ捜索しつづけて、現在の周波数領域係数のフィルタ出力値が一つ後のものより大きい場合、該現在の周波数領域係数が音調の位置であり、或は、捜索しつづけて、第64個の周波数領域係数のフィルタ出力値を見付け、且つその値は第63個の周波数領域係数のフィルタ出力値より大きい場合、該第64個の周波数領域係数が音調の位置であり、
最大値が33〜56の間にあると、該最大値が対応する周波数領域係数が音調の位置である。
Hereinafter, the frequency domain coefficients in the first frequency range are the 24th to 64th MDCT frequency domain coefficients, and the frequency domain coefficients in the second frequency range are the 33rd to 56th MDCT frequency domain coefficients. As an example, we will explain how to determine the audio signal position,
The maximum value is searched from the 33rd to 56th MDCT frequency domain coefficient filter output values, and if the maximum value corresponds to the 33rd frequency domain coefficient, the detection output result of the 32nd frequency domain coefficient Is greater than the thirty-third frequency domain coefficient, and if YES, the comparison is continued sequentially in order, and the detection output result of the thirty-first frequency domain coefficient is greater than the thirty-second frequency domain coefficient. If the current frequency domain coefficient filter output value is larger than the previous one, or if the search continues, the 24th frequency domain coefficients of the filter output value is the 25 frequency-domain coefficients of the filter output value is greater than field if a current frequency domain coefficient or the 24 frequency domain coefficients the tone position,
If the maximum value is 56, a similar method is used to continuously search backward, and if the filter output value of the current frequency domain coefficient is larger than the next one, the current frequency domain coefficient Position, or continue searching to find the filter output value of the 64th frequency domain coefficient, and if that value is greater than the filter output value of the 63rd frequency domain coefficient, the 64th frequency domain coefficient The frequency domain coefficient is the position of the tone,
When the maximum value is between 33 and 56, the frequency domain coefficient corresponding to the maximum value is the position of the tone.

該位置の値をTonal_posとし、即ち、最大極値が対応する周波数点のシリアルナンバーである。   The value of the position is Tonal_pos, that is, the serial number of the frequency point corresponding to the maximum extreme value.

102:音調の所在位置により周波数帯コピー周期を確定し、該周波数帯コピー周期は、0周波数点から音調位置の周波数点までの帯域幅であり、
周波数帯のコピー周期をcopy_periodとし、copy_periodがTonal_posに1を加えるものである。
102: The frequency band copy period is determined by the location of the tone, and the frequency band copy period is a bandwidth from the 0 frequency point to the frequency point of the tone position,
A copy cycle frequency band and copy_period, in which copy_period adds 1 to the Tonal_pos.

103:0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数範囲をソース周波数範囲とし、ゼロビットの符号化サブバンドに対し周波数帯コピーを行なう。   103: The frequency range from the copyband_offset frequency point offset from the 0th frequency point to the frequency point of the tone position later to the copyband_offset frequency point offset is defined as the source frequency range, and the zero-bit encoded subband Perform frequency band copy.

本発明で言うゼロビットの符号化サブバンドとは、ゼロビットを分配された符号化サブバンドであり、未符号化の符号化サブバンドとも言う。   The zero-bit encoded subband referred to in the present invention is an encoded subband in which zero bits are distributed, and is also referred to as an uncoded encoded subband.

即ち、ソース周波数範囲の周波数点の起始シリアルナンバーがcopyband_offsetであり、終了シリアルナンバーがcopyband_offset+Tonal_posである。   That is, the start serial number of the frequency point in the source frequency range is copyband_offset and the end serial number is copyband_offset + Tonal_pos.

本発明において、周波数帯コピーオフセット(copyband_offsetとし)の値が予め設定され、copyband_offset≧0であり、予め設定されたcopyband_offset=0である場合、ソース周波数範囲が、即ち、0周波数点から音調位置までの周波数点の周波数範囲であり、コピー周波数帯の周波数スペクトルホッピングを低下するために、copyband_offsetをゼロより大きく設定すると、ソース周波数範囲は、0周波数点が後へ1つの小範囲をオフセットする周波数点から最大極値の所在位置の周波数点が後へ1つの同様な小範囲をオフセットする周波数点までのMDCT周波数領域係数であり、ある周波数点の以上のゼロビットの符号化サブバンドに対する周波数スペクトル充填はいずれもソース周波数範囲中からコピーし、
周波数帯コピーを行なう際に、先ず、ソース周波数範囲と周波数帯コピーを行なう必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算し、次に、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからソース周波数範囲の周波数領域係を数周期的にゼロビットの符号化サブバンドにコピーする。
In the present invention, when the value of the frequency band copy offset (referred to as copyband_offset) is preset, copyband_offset ≧ 0, and the preset copyband_offset = 0, the source frequency range is from the frequency point 0 to the tone position. If you set copyband_offset to be greater than zero to reduce the frequency spectrum hopping of the copy frequency band, the source frequency range is the frequency point where the 0 frequency point offsets one small range later. Is the MDCT frequency domain coefficient from the frequency point at the location of the maximum extreme value to the frequency point that offsets one similar small range later, and the frequency spectrum filling for more than zero bit coded subbands at a frequency point is Both are copied from within the source frequency range,
When performing frequency band copy, first calculate the source frequency range copy start serial number of the zero bit encoded subband from the source frequency range and the start serial number of the zero bit encoded subband that needs to be frequency band copied. Next, the frequency band copy period is set as a period, and the frequency domain relation of the source frequency range is copied from the source frequency range copy start serial number to the zero-bit encoded subband several times periodically.

ソース周波数範囲コピー開始シリアルナンバーを確定する方法は、
まず、コピーする必要があるの第1個のゼロビットの符号化サブバンドから初め、周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始MDCT周波数領域係数の周波数点のシリアルナンバーを取得して、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、Tonal_posに1を加えてコピー周期copy_periodを得る。周波数帯コピーオフセットをcopyband_offsetとし、fillband_start_freqの値を循環にcopy_periodを減りつづけ、その値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとする。
To determine the source frequency range copy start serial number:
First, get the serial number of the frequency point of the starting MDCT frequency domain coefficient of the zero bit coding subband that needs to be reconstructed, starting with the first zero bit coding subband that needs to be copied to, a Fillband_start_freq, tone the serial number of the corresponding frequency points and Tonal_pos, to obtain a copy periodic c Opy_period by adding 1 to the Tonal_pos. If the frequency band copy offset is set to copyband_offset, and the value of fillband_start_freq is circulated and copy_period is continuously reduced, and the value is located in the value interval of the serial number of the source frequency range, this value is the source frequency range copy start serial number, and copy_pos_mod And

ソース周波数範囲コピー開始シリアルナンバーcopy_pos_modは以下の擬似コード計算方法によって得られ、
copy_pos_mod = fillband_start_freqとし、
copy_pos_modが(Tonal_pos+copyband_offset)より大きいと
{
copy_pos_mod = copy_pos_mod - copy_period;
}
計算を完成した後、copy_pos_modがソース周波数範囲コピー開始シリアルナンバーである。
Source frequency range copy start serial number copy_pos_mod is obtained by the following pseudo code calculation method,
copy_pos_mod = fillband_start_freq,
If copy_pos_mod is greater than (Tonal_pos + copyband_offset)
{
copy_pos_mod = copy_pos_mod-copy_period;
}
After completing the calculation, copy_pos_mod is the source frequency range copy start serial number.

コピーする際に、ソース周波数範囲コピー開始シリアルナンバーで開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーし、ソース周波数範囲コピーした周波数点がTonal_pos+copyband_offset周波数点に到達してから、再び第copyband_offset個の周波数点から始める周波数領域係数を順次に後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数の周波数帯コピーを完成するまで行う。   When copying, the frequency domain coefficient starting with the source frequency range copy start serial number is sequentially copied to the zero-bit encoded subband with fillband_start_freq as the starting position, and the frequency point copied to the source frequency range is Tonal_pos + Once the copyband_offset frequency point is reached, the frequency domain coefficients starting from the copyband_offset frequency points again are sequentially copied back to the zero bit encoding subband, and so on, followed by the current zero bit encoding subband. Repeat until all frequency domain coefficients are copied.

周波数帯コピーオフセットcopyband_ offsetを10とする際に、copy_pos_modから始める周波数帯を周波数低から高までによって配列してfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけて、Tonal_pos+10周波数点に到達する後、再び第10個の周波数領域係数からコピーし始め、そのように続け、該ゼロビットの符号化サブバンドのすべての信号がいずれも10からTonal_pos+10周波数領域係数中からコピーし、周波数点10からTonal_pos+10までの周波数領域係数は周波数帯コピーのソース周波数範囲である。   When the frequency band copy offset copyband_offset is set to 10, the frequency band starting from copy_pos_mod is arranged by frequency from low to high and copied to the zero-bit encoded subband with fillband_start_freq as the start position, Tonal_pos + 10 frequency After reaching the point, it starts to copy from the 10th frequency domain coefficient again, and so on, all the signals of the zero bit encoding subband are copied from 10 to the Tonal_pos + 10 frequency domain coefficient. The frequency domain coefficient from frequency point 10 to Tonal_pos + 10 is the source frequency range of the frequency band copy.

本発明の周波数帯コピー方法を採用し、すべてのゼロビットの符号化サブバンドのために周波数スペクトルのコピーができ、特定の周波数点以下のゼロビットの符号化サブバンドに対しランダムノイズ充填方法を採用して周波数スペクトル再建を行ってもよく、特定の周波数点以上のゼロビットの符号化サブバンドに対して、周波数領域係数コピーにノイズ充填を結合する方法を採用して周波数スペクトル再建を行う。   Adopting the frequency band copy method of the present invention, the frequency spectrum can be copied for all zero-bit coded subbands, and the random noise filling method is adopted for zero-bit coded subbands below a specific frequency point. Frequency spectrum reconstruction may be performed, and frequency spectrum reconstruction is performed using a method of combining noise filling with a frequency domain coefficient copy for a coded subband of zero bits above a specific frequency point.

図2は、本発明による実施例のオーディオ復号化方法の構造模式図である。図2のように、該方法は、以下のステップを含み、
201:復号化待ちビットストリームにおける各振幅エンベロープ符号化ビットに対し復号化逆量子化し、各符号化サブバンドの振幅エンベロープを得るステップ、
符号化端から送信した符号化ビットストリームの中に(即ちビットストリームデマルチプレクサDeMUXから)1フレームの符号化ビットを取り出し、符号化ビットを取り出した後、該フレームの中の各振幅エンベロープ符号化ビットを復号化して、各符号化サブバンドの振幅エンベロープ量子化指数Thq(j)、j=0,…,L−1を得る。振幅エンベロープ量子化指数に逆量子化して振幅エンベロープrms(r) ,r=0,…,L−1を得る。
FIG. 2 is a structural schematic diagram of an audio decoding method according to an embodiment of the present invention. As shown in FIG. 2, the method includes the following steps:
201: Decoding and dequantizing each amplitude envelope encoded bit in the decoding-waiting bitstream to obtain an amplitude envelope of each encoded subband;
Extract one encoded bit in the encoded bit stream transmitted from the encoding end (that is, from the bit stream demultiplexer DeMUX), extract the encoded bit, and then each amplitude envelope encoded bit in the frame To obtain the amplitude envelope quantization index Thq (j), j = 0,..., L−1 of each encoded subband. Inverse quantization is performed on the amplitude envelope quantization index to obtain amplitude envelopes rms (r), r = 0,..., L−1.

202:各符号化サブバンドに対しビットを分配するステップ、
各符号化サブバンドの振幅エンベロープ量子化指数によって各符号化サブバンドの重要性の初期値を算出し、符号化サブバンド重要性を利用して各符号化サブバンドに対しビットを分配し、符号化サブバンドのビット分配数を得て、復号化端のビット分配方法と符号化端のビット分配方法は完全に同様である。ビットを分配する過程に、ビット分配ステップサイズ及びビットを分配した後符号化サブバンド重要性が低下したステップサイズいずれも可変ステップサイズである
202: Distributing bits to each encoded subband;
The initial value of importance of each coding subband is calculated from the amplitude envelope quantization index of each coding subband, and bits are distributed to each coding subband using the coding subband importance. The bit distribution method at the decoding end and the bit distribution method at the encoding end are completely the same. In the process of distributing the bits, any step size encoding subband importance has decreased after distributing the bit allocation step size and the bit is a variable step size.

203:符号化サブバンドビット分配数により各非ゼロビットの符号化サブバンドに対し逆量子化し復号化して非ゼロビットの符号化サブバンドのMDCT周波数領域係数を得るステップ、
204:MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、且つ0周波数点が後へcopyband_offset個周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個周波数点のオフセットまでの周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドに対し周波数帯コピーするステップ、該ステップの詳しい過程は周波数帯コピー方法を参考して、ここで省略する、
205:現在の符号化サブバンドの振幅エンベロープによりコピーして得る周波数領域係数に対しエネルギー調整を行い、さらにノイズ充填を結合して、再建のゼロビットの符号化サブバンドの周波数領域係数を得るステップ、
符号化端から送信したノイズレベル符号化ビットにより、各のゼロビットの符号化サブバンド内部のコピーして得られる周波数領域係数に対してエネルギー調整を行い、
ゼロビットの符号化サブバンドrがコピーして得られる周波数領域係数の振幅エンベロープを計算して、
203: Decoding and decoding each non-zero bit coded subband according to the number of coded subband bit distributions to obtain MDCT frequency domain coefficients of the non-zero bit coded subband;
204: Search for the location of a tone with an audio signal in the MDCT frequency domain coefficient, and use the bandwidth from the frequency point 0 to the frequency point of the tone position as the frequency band copy period, and the 0 frequency point is copyband_offset frequency later A frequency band copy to a zero-bit encoded subband using the frequency range from the point offset to the frequency point of the tone position to the copyband_offset frequency point offset as the source frequency range, and the detailed process of this step is frequency Refer to the obi copy method and omit here.
205: performing energy adjustment on the frequency domain coefficients obtained by copying with the amplitude envelope of the current encoded subband, and further combining noise filling to obtain a frequency domain coefficient of the reconstructed zero-bit encoded subband;
The noise level encoded bits transmitted from the encoding end perform energy adjustment on the frequency domain coefficients obtained by copying inside the encoded subband of each zero bit,
Calculate the amplitude envelope of the frequency domain coefficient obtained by copying the encoded subband r of zero bits,

Figure 0005416173
Figure 0005416173

とする。 And

周波数領域係数に対してエネルギー調整を行う一般式が   The general formula for energy adjustment for frequency domain coefficients is

Figure 0005416173
Figure 0005416173

であり、
そのなか、
And
Among them,

Figure 0005416173
Figure 0005416173

はゼロビットの符号化サブバンドrのエネルギー調整された後の周波数領域係数を表し、 Represents the frequency domain coefficient after energy adjustment of the encoded subband r of zero bits,

Figure 0005416173
Figure 0005416173

はゼロビットの符号化サブバンドrのコピーして得られた周波数領域係数を表し、 Represents the frequency domain coefficient obtained by copying the zero-bit encoded subband r,

Figure 0005416173
Figure 0005416173

はゼロビットの符号化サブバンドrのコピーして得られた周波数領域係数 Is the frequency domain coefficient obtained by copying the zero-bit encoded subband r

Figure 0005416173
Figure 0005416173

の振幅エンベロープ(二乗平均平方根とも言う)であり、rms(r)はゼロビットの符号化サブバンドrの符号化された前の周波数領域係数の振幅エンベロープであり、 Rms (r) is the amplitude envelope of the previous encoded frequency domain coefficient of the zero bit encoding subband r,

Figure 0005416173
Figure 0005416173

は、ゼロビットの符号化サブバンドrの周波数帯コピーのエネルギーゲイン制御比例因子であり、その値範囲が(0,2)である。実際の聞く感じにより、各のサブバンドに対して同じ或いは異なる係数値を採用してもよい。 Is an energy gain control proportional factor of the frequency band copy of the zero-bit encoded subband r, and its value range is (0, 2). Depending on the actual listening feeling, the same or different coefficient values may be adopted for each subband.

周波数領域係数をコピーするエネルギー調整を完成してから、エネルギー調整した後の周波数領域係数にホワイトノイズを重ね合せ、最後の再建周波数領域係数   After completing the energy adjustment that copies the frequency domain coefficient, white noise is superimposed on the frequency domain coefficient after the energy adjustment, and the final reconstruction frequency domain coefficient

Figure 0005416173
Figure 0005416173

を形成し、 Form the

Figure 0005416173
Figure 0005416173

そのなか、   Among them,

Figure 0005416173
Figure 0005416173

はゼロビットの符号化サブバンドrの再建した周波数領域係数を表し、 Represents the reconstructed frequency domain coefficient of the zero-bit coded subband r,

Figure 0005416173
Figure 0005416173

はゼロビットの符号化サブバンドrのエネルギー調整した後の周波数領域係数を表し、rms(r) はゼロビットの符号化サブバンドrの符号化前の周波数領域係数の振幅エンベロープであり、 Represents the frequency domain coefficient after energy adjustment of the zero bit encoding subband r, rms (r) is the amplitude envelope of the frequency domain coefficient before encoding of the zero bit encoding subband r,

Figure 0005416173
Figure 0005416173

はランダム位相生成器により生成したランダム位相値であり、それはランダム戻り値+1または-1を生成し、 Is the random phase value generated by the random phase generator, which produces a random return value +1 or -1,

Figure 0005416173
Figure 0005416173

はゼロビットの符号化サブバンドrのノイズレベル制御比例因子であり、その値範囲が(0,2)である。実際の聞く感じにより、各のサブバンドに対して同じ或いは異なる係数値を採用してもよい。 Is a noise level control proportional factor of zero bit encoding subband r, and its value range is (0, 2). Depending on the actual listening feeling, the same or different coefficient values may be adopted for each subband.

最高周波数が搜索された音調の周波数より小さいゼロビットの符号化サブバンドの周波数領域係数に対してノイズ充填の方法を採用して再建を行う。   Reconstruction is performed by using a noise filling method for the frequency domain coefficient of the zero-bit coded subband whose maximum frequency is smaller than the frequency of the sought tone.

本発明の周波数帯コピー方法を採用して、すべてのゼロビットの符号化サブバンドに対し周波数スペクトル再建を行ってもよく、特定の周波数点の以下のゼロビットの符号化サブバンドに対してランダムノイズ充填方法を採用して周波数スペクトル再建を行ってもよく、特定の周波数点の以上のゼロビットの符号化サブバンドに対して、周波数領域係数コピーにノイズ充填に結合する方法を採用して周波数スペクトル再建を行ってもよい。   The frequency band copy method of the present invention may be used to perform frequency spectrum reconstruction for all zero-bit coded subbands, and random noise filling for the following zero-bit coded subbands at a specific frequency point The frequency spectrum reconstruction may be performed by using a method, and for a zero-bit encoded subband of a specific frequency point or more, the frequency spectrum reconstruction may be performed by combining the frequency domain coefficient copy with noise filling. You may go.

206:非ゼロビットの符号化サブバンドの周波数領域係数及び再建されたゼロビットの符号化サブバンドの周波数領域係数に対してIMDCT(Inverse Modified Discrete Cosine Transform,逆修正離散コサイン変換)を行い、最終のオーディオ出力信号を得るステップ。
206: The final audio is subjected to IMDCT (Inverse Modified Discrete Cosine Transform) for the frequency domain coefficients of the non-zero bit coding subband and the reconstructed zero bit coding subband. Obtaining an output signal;

以上の周波数帯コピー方法を実現するために、本発明はさらに周波数帯コピー装置を提供し、図3に示すように、前記周波数帯コピーユニットは、順次に接続する音調位置捜索モジュール、周期及びソース周波数範囲計算モジュール、ソース周波数範囲コピー開始シリアルナンバー計算モジュール、及び周波数帯コピーモジュールを含み、その中で、
音調位置捜索モジュールは、MDCT周波数領域係数においてオーディオ信号のある音調の所在位置を捜索するためのものであり、具体的に、第1周波数範囲のMDCT周波数領域係数に対し絶対値または平方値を取り得て、平滑化フィルタを行い、平滑化フィルタの結果によって、第1周波数範囲フィルタ出力値の最大極値の所在位置を捜索し、該最大極値の所在位置は、即ち音調所在位置である。
In order to realize the above-described frequency band copy method, the present invention further provides a frequency band copy apparatus, and as shown in FIG. 3, the frequency band copy unit includes a tone position search module, a period and a source connected in sequence. Including frequency range calculation module, source frequency range copy start serial number calculation module, and frequency band copy module,
The tone position search module is used to search for the location of a certain tone of an audio signal in the MDCT frequency domain coefficient. Specifically, the absolute position or square value can be obtained for the MDCT frequency domain coefficient of the first frequency range. Then, the smoothing filter is performed, and the location of the maximum extreme value of the first frequency range filter output value is searched based on the result of the smoothing filter, and the location of the maximum extreme value is the tone location.

周期及びソース周波数範囲計算モジュールは、音調の所在位置によりコピーに用いる周波数帯コピー周期及びソース周波数範囲を確定するためのもので、該周波数帯コピー周期が0周波数点から音調位置の周波数点までの帯域幅であり、前記ソース周波数範囲は、0周波数点が後へcopyband_offset個の周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個の周波数点のオフセットまでの周波数領域である。   The period and source frequency range calculation module is for determining the frequency band copy period and source frequency range to be used for copying according to the position of the tone, and the frequency band copy period is from 0 frequency point to the frequency point of the tone position. The source frequency range is a frequency region from an offset of 0 frequency points after the copyband_offset frequency points to a frequency point of the tone position after the offset of the copyband_offset frequency points.

音調位置の周波数点のシリアルナンバーをTonal_posとすると、周波数帯コピーオフセットを予め設定し、copyband_offsetとする場合、ソース周波数範囲の周波数領域係数の開始シリアルナンバーはcopyband_offset、終了シリアルナンバーはcopyband_offset+Tonal_posである。   When the serial number of the frequency point of the tone position is Tonal_pos, when the frequency band copy offset is preset and set to copyband_offset, the start serial number of the frequency domain coefficient in the source frequency range is copyband_offset and the end serial number is copyband_offset + Tonal_pos .

ソース周波数範囲コピー開始シリアルナンバー計算モジュールは、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピーシリアルナンバーを計算するためのものであり、
前記周波数帯コピーモジュールは、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーすることに用いられ、
さらに、
前記音調位置捜索モジュールが該第1周波数範囲のMDCT周波数領域係数に対して絶対値を取り得て、平滑化フィルタを行う計算式が以下のようであり
Source frequency range copy start serial number calculation module calculates the source frequency range copy serial number of the zero bit encoded subband from the start serial number of the zero bit encoded subband that needs to be copied. Is intended to
The frequency band copy module has a frequency band copy period as a period, and is used to periodically copy a frequency domain coefficient of a source frequency range starting from a source frequency range copy start serial number to an encoded subband of zero bits,
further,
The tone position search module can take an absolute value for the MDCT frequency domain coefficient of the first frequency range, and a calculation formula for performing a smoothing filter is as follows:

Figure 0005416173
Figure 0005416173

或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタの計算式が以下のようであり、   Alternatively, the smoothing filter calculation formula for the frequency domain coefficient square value of the first frequency range is as follows:

Figure 0005416173
Figure 0005416173

そのなか、   Among them,

Figure 0005416173
Figure 0005416173

は平滑化フィルタ係数であり、 Is the smoothing filter coefficient,

Figure 0005416173
Figure 0005416173

は第iフレームの第k個の周波数点のフィルタ出力値を表し、 Represents the filter output value of the kth frequency point of the i-th frame,

Figure 0005416173
Figure 0005416173

は第iフレームの第k個の周波数点のデータが復号化された後のMDCT係数であり、且つi=0の場合、
Is the MDCT coefficient after the data of the k-number of frequency points of the i-th frame is decoded, and if the i = 0,

Figure 0005416173
Figure 0005416173

である。 It is.

さらに、前記第1周波数範囲は、周波数スペクトルの統計特性により確定されたエネルギーが比較的に集中している低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分である。   Furthermore, the first frequency range is a low frequency range in which energy determined by statistical characteristics of the frequency spectrum is relatively concentrated. Among them, the low frequency is a signal total band of 1/2. The frequency spectrum component is smaller than the width.

さらに、前記音調位置捜索モジュールは、直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とする。   Further, the tone position search module directly searches for the first maximum value from the filter output value of the frequency domain coefficient corresponding to the first frequency range, and the maximum value is the maximum extreme value of the first frequency range filter output value. And

さらに、前記音調位置捜索モジュールは、フィルタ出力値の最大極値を確定すると、該第1周波数範囲における一段を第2周波数範囲として、先ず、第2周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、さらに該最初の最大値が対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値よりも大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である。
Further, when the tone position search module determines the maximum extreme value of the filter output value, first stage in the first frequency range is set as the second frequency range, and first, the filter output value of the frequency domain coefficient corresponding to the second frequency range Search for the first maximum value from within, and further perform different processing depending on the position of the frequency domain coefficient corresponding to the first maximum value,
a. If the first maximum value is the filter output value of the frequency domain coefficient of the lowest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the lowest frequency of the second frequency range is the previous one in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter output value of the previous frequency domain coefficient The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or continues to be compared, and the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is the next frequency. If it is greater than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the lowest frequency of the first frequency range is the maximum extreme value finally determined,
b. If the first maximum value is the filter output value of the frequency domain coefficient of the highest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the highest frequency of the second frequency range is one step behind in the first frequency range. Compared with the filter output value of the frequency domain coefficient of the higher frequency, the comparison is continued sequentially, and the filter output value of the current frequency domain coefficient is greater than the filter output value of the next frequency domain coefficient The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the previous one. If greater than the filter output value of the frequency domain coefficient, the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the maximum extreme value finally determined,
c. When the first maximum value is a filter output value of a frequency domain coefficient between the lowest frequency and the highest frequency of the second frequency range, the frequency domain coefficient corresponding to the first maximum value is a position where the tone is located; That is, the first maximum value is the maximum extreme value finally determined.

さらに、前記ソース周波数範囲コピー開始シリアルナンバー計算モジュールが周波数帯コピーを行う必要があるゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する過程は、現在に周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯コピー周期copy_periodをとし、その値はTonal_posに1を加えることであり、ソース周波数範囲開始シリアルナンバーをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを差し引きつづけて、該値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであることを含む。
Further, the process of calculating the source frequency range copy start serial number of the zero-bit encoded subband that the source frequency range copy start serial number calculation module needs to perform frequency band copy needs to reconstruct the frequency domain coefficient at present. Get the serial number of the start frequency point of a zero-bit coded subband, fillband_start_freq, the serial number of the frequency point to which the tone corresponds is Tonal_pos, the frequency band copy period copy_period, and the value is 1 in Tonal_pos If the source frequency range start serial number is set to copyband_offset, the value of fillband_start_freq is continuously subtracted from copy_period, and the value is located in the serial number value interval of the source frequency range, then the value is the source frequency range The copy start serial number Including.

さらに、前記周波数帯コピーモジュールは周波数帯コピーを行なう場合に、具体的に、
ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけて、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達する後、再び第copyband_offset個の周波数点を開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数コピーを完成するまで行うことを含む。
Further, when the frequency band copy module performs frequency band copy, specifically,
Source frequency range copy start The frequency domain coefficient starting from the serial number is sequentially copied back to the zero-bit encoded subband starting from fillband_start_freq, and the frequency point of the source frequency range copy is Tonal_pos + copyband_offset frequency point , The frequency domain coefficients starting again at the copyband_offset frequency points are subsequently copied to the zero-bit coded subband, and so on, all the current zero-bit coded subbands Including performing frequency domain coefficient copy to completion.

以上の復号化方法を実現するために、本発明は、さらにオーディオ復号化システムを提供し、図4のように、ビットストリームデマルチプレクサ(DeMUX)、振幅エンベロープ復号化ユニット、ビット分配ユニット、周波数領域係数復号化ユニット、周波数帯コピーユニット、ノイズ充填ユニット、逆修正離散コサイン変換(IMDCT)ユニットを含み、その中、
ビットストリームデマルチプレクサ(DeMUX)は、復号化待ちビットストリームの中か
ら振幅エンベロープ符号化ビット、周波数領域係数符号化ビット及びノイズレベル符号化ビットを分離することに用いられるものであり、
振幅エンベロープ復号化ユニットは、前記ビットストリームデマルチプレクサと接続し、前記ビットストリームデマルチプレクサが出力した振幅エンベロープの符号化ビットに対して復号化逆量子化を行い、各符号化サブバンドの振幅エンベロープを得ることに用いられるものであり、
ビット分配ユニットは、前記振幅エンベロープ復号化ユニットと接続し、ビットを分配し、各符号化サブバンドにおいて各の周波数領域係数に分配された符号化ビット数を得ることに用いられるものであり、
ビット分配ユニットは、重要性計算モジュール、ビット分配モジュール、及びビット分配修正モジュールを含み、その中で、
重要性計算モジュールは符号化サブバンド振幅エンベロープ量子化指数によって各符号化サブバンド重要性の最初値を計算することに用いられるものであり、
前記ビット分配モジュールは各符号化サブバンドの重要性の初期値によって、符号化サブバンドにおける各周波数領域係数に対しビット分配するためのものであり、且つビット分配する過程に、ビット分配ステップサイズ及びビット分配した後の重要性低下のステップサイズはともに変化するものであり、
ビット分配修正モジュールは、ビット分配を行なった後、符号化端のビット分配修正反復回数count値と各符号化サブバンドの重要性によって、符号化サブバンドに対し再びcount回ビット分配修正することに用いられる物である。
In order to realize the above decoding method, the present invention further provides an audio decoding system, and as shown in FIG. 4, a bitstream demultiplexer (DeMUX), an amplitude envelope decoding unit, a bit distribution unit, a frequency domain Including coefficient decoding unit, frequency band copy unit, noise filling unit, inverse modified discrete cosine transform (IMDCT) unit, among them,
A bitstream demultiplexer (DeMUX) is used to separate amplitude envelope coded bits, frequency domain coefficient coded bits and noise level coded bits from a decoding-waiting bitstream,
The amplitude envelope decoding unit is connected to the bitstream demultiplexer, performs decoding inverse quantization on the encoded bits of the amplitude envelope output from the bitstream demultiplexer, and outputs the amplitude envelope of each encoded subband. Used to obtain,
The bit distribution unit is used to connect to the amplitude envelope decoding unit, distribute bits, and obtain the number of encoded bits distributed to each frequency domain coefficient in each encoded subband;
The bit distribution unit includes an importance calculation module, a bit distribution module, and a bit distribution correction module, in which
The importance calculation module is used to calculate the initial value of each encoded subband importance according to the encoded subband amplitude envelope quantization index,
The bit distribution module is for distributing bits to each frequency domain coefficient in the encoded subband according to an initial value of importance of each encoded subband. In the process of distributing bits, the bit distribution step size and The step size of importance reduction after bit distribution changes together,
The bit distribution correction module performs bit distribution correction again for the encoded subbands after performing bit distribution, depending on the bit distribution correction iteration count value at the encoding end and the importance of each encoding subband. It is used.

前記ビット分配モジュールはビット分配する際に、低いビット符号化サブバンドのビット分配歩幅及びビット分配した後の重要性低下歩幅はゼロビットの符号化サブバンドと高いビット符号化サブバンドのビット分配歩幅及びビット分配した後の重要性低下歩幅より小さい。   When the bit distribution module distributes bits, the bit distribution stride of the low bit encoding subband and the reduced importance step after bit distribution are the bit distribution stride of the zero bit encoding subband and the high bit encoding subband and Less significant step after bit distribution.

前記ビット分配修正モジュールはビット修正する際に、低いビット符号化サブバンドのビット修正歩幅及びビット修正した後の重要性低下歩幅はゼロビットの符号化サブバンドと高いビット符号化サブバンドのビット修正歩幅及びビット修正した後の重要性低下歩幅より小さい。   When the bit distribution correction module corrects the bit, the bit correction step of the low bit encoding subband and the bit reduction step after the bit correction are the bit correction step of the zero bit encoding subband and the high bit encoding subband. And less significant step after bit correction.

周波数領域係数復号化ユニットは、振幅エンベロープ復号化ユニットとビット分配ユニットと接続し、符号化サブバンドを復号化、逆量子化、及び逆正規化を行ない、周波数領域係数が得られるためのものである。   The frequency domain coefficient decoding unit is connected to the amplitude envelope decoding unit and the bit distribution unit, and performs decoding, dequantization, and denormalization of the encoded subband to obtain frequency domain coefficients. is there.

周波数帯コピーユニットは、前記DeMUX、周波数領域係数復号化ユニット、振幅エンベロープ復号化ユニット及びビット分配ユニットと接続し、MDCT周波数領域係数中からオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、または0周波数点が後へcopyband_offset個周波数点のオフセットから音調位置の周波数点が後へ前記copyband_offset個周波数点のオフセットまでの周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドに対し周波数帯コピーすることに用いられ、さらに、現在のゼロビットの符号化サブバンドの振幅エンベロープによりコピーして得られる周波数領域係数に対してエネルギー調整を行うことに用いられる。
The frequency band copy unit is connected to the DeMUX, the frequency domain coefficient decoding unit, the amplitude envelope decoding unit, and the bit distribution unit, and searches the location of the tone of the audio signal from the MDCT frequency domain coefficient, The frequency from the point to the frequency point of the tone position is set as the frequency band copy period, or the frequency from the offset of the copyband_offset frequency point after the zero frequency point to the offset of the copyband_offset frequency point after the frequency point of the tone position Used as a frequency band copy for the zero-bit coded subband, with the range as the source frequency range, and also for the frequency domain coefficients obtained by copying with the amplitude envelope of the current zero-bit coded subband Used to make adjustments.

該周波数帯コピーユニットの具体的な実現は以上の周波数帯コピー装置と同じ、ここではその説明を省略する。
The specific implementation of the frequency band copy unit is the same as that of the above frequency band copy apparatus, and the description thereof is omitted here.

ノイズ充填ユニットは、振幅エンベロープ復号化ユニット、ビット分配ユニット及び周波数帯コピーユニットと接続し、現在のゼロビットの符号化サブバンドの振幅エンベロープにより該符号化サブバンドにノイズを填充し、再建されたゼロビットの符号化サブバンドの周波数領域係数を得ることに用いられる。   The noise filling unit is connected to the amplitude envelope decoding unit, the bit distribution unit, and the frequency band copy unit, and the coded zero subband is filled with noise by the amplitude envelope of the current zero bit coding subband, and the reconstructed zero bit Is used to obtain the frequency domain coefficients of the coding subbands of

記周波数帯コピーユニットが以上の周波数帯コピー方法を採用することと、ノイズ充填ユニットノイズ充填方を採用することとを結合してすべてのゼロビットの符号化サブバンドに周波数スペクトル再建を行い、或いは、前記ノイズ充填ユニットにより特定の周波数点以下のゼロビットの符号化サブバンドに対してランダムノイズ充填方法を採用して周波数スペクトル再建を行い、周波数帯コピーユニットが周波数領域係数コピーを採用することと、ノイズ充填ユニットノイズ充填方法を採用することとを結合して特定の周波数点以上のゼロビットの符号化サブバンドに対し周波数スペクトル再建を行う。
And that the previous SL spectral band replication unit employs a frequency band replication method on more than noise filling unit is a frequency spectrum rebuilt encoding subbands of all zero bits by combining the adopting noise charge Hamakata method Alternatively, the noise filling unit adopts a random noise filling method for zero-bit coded subbands below a specific frequency point to perform frequency spectrum reconstruction, and the frequency band copy unit adopts frequency domain coefficient copying. the method comprising, noise filling unit a frequency spectrum reconstruction to zero bit encoding subbands and combined with the above specific frequency points to adopt noise charge Hamakata method performed.

逆修正離散コサイン変換(IMDCT)ユニットは、前記ノイズ充填ユニットと接続し、ノイズ充填した後の周波数領域係数に対してIMDCTを行い、オーディオ信号を得ることに用いられる。   The inverse modified discrete cosine transform (IMDCT) unit is connected to the noise filling unit, and is used to obtain an audio signal by performing IMDCT on the frequency domain coefficients after noise filling.

Claims (25)

周波数帯コピー方法であって、
A、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索すること、
B、音調の所在位置により周波数帯コピー周期及びソース周波数範囲を確定し、該周波数帯コピー周期が0周波数点から音調位置の周波数点までの帯域幅であり、該ソース周波数範囲は、0周波数点から音調位置の周波数点までの間の周波数範囲を後へcopyband_offsetのオフセットをする周波数範囲であり、その中、前記オフセット量copyband_offsetが0より大きいまたは0と等しいであること、
C、周波数帯コピー周期によりゼロビットの符号化サブバンドに対し周波数帯コピーを行うことを含むことを特徴とする周波数帯コピー方法。
A frequency band copying method,
A, searching for the location of the tone of the audio signal in the MDCT frequency domain coefficient,
B, the frequency band copy period and the source frequency range are determined by the location of the tone, and the frequency band copy period is a bandwidth from the frequency point of the 0 tone point to the frequency point of the tone position. Is a frequency range for offsetting copyband_offset after the frequency range from to the frequency point of the tone position, in which the offset amount copyband_offset is greater than or equal to 0,
C. A frequency band copy method comprising performing frequency band copy for a zero-bit encoded subband according to a frequency band copy period.
ステップAにおいて、
第1周波数範囲の周波数領域係数に対し絶対値或いは平方値を取得して、平滑化フィルタを行い、
平滑化フィルタの結果によって、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値の所在の位置をある音調の所在の位置とする、
方法を採用して、ある音調の位置を搜索することを特徴とする請求項1に記載の方法。
In step A,
Obtain the absolute value or square value for the frequency domain coefficient of the first frequency range, perform a smoothing filter,
According to the result of the smoothing filter, the location of the maximum extreme value of the first frequency range filter output value is searched, and the location of the maximum extreme value is set as the location of a certain tone.
The method according to claim 1, wherein the method is used to search for a position of a certain tone.
該第1周波数範囲の周波数領域係数に対して絶対値を取得して、平滑化フィルタを行う計算式が
Figure 0005416173
であり、或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタを行う計算式が
Figure 0005416173
であり、そのなか、
Figure 0005416173
が平滑化フィルタ係数であり、
Figure 0005416173
が第iフレームの第k個の周波数点のフィルタ出力値を表し、
Figure 0005416173
が第iフレームの第k個の周波数点の復号化された後のMDCT係数であり、且つi=0の場合、
Figure 0005416173
であることを特徴とする請求項2に記載の方法。
A calculation formula for obtaining an absolute value for the frequency domain coefficient of the first frequency range and performing a smoothing filter is as follows:
Figure 0005416173
Or a calculation formula for performing a smoothing filter on the frequency domain coefficient square value of the first frequency range is
Figure 0005416173
And in that,
Figure 0005416173
Is the smoothing filter coefficient,
Figure 0005416173
Represents the filter output value of the kth frequency point of the i-th frame,
Figure 0005416173
Is the MDCT coefficient after decoding of the kth frequency points of the i-th frame, and i = 0,
Figure 0005416173
The method according to claim 2, wherein:
前記第1周波数範囲は周波数スペクトルの統計特性によって確定される、エネルギーが集中する低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分であることを特徴とする請求項2に記載の方法。   The first frequency range is a low-frequency range in which energy is concentrated, which is determined by statistical characteristics of the frequency spectrum. Among them, a low frequency is a frequency spectrum component smaller than a half signal total bandwidth. The method according to claim 2, wherein: 直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とし、或は、
該第1周波数範囲のその中の一段を第2周波数範囲とし、第2周波数範囲が対応する周波数領域係数のフィルタ出力値中から最初の最大値を捜索し、該最初の最大値が対応する周波数領域係数の位置によって異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得た場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値である場合、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である方法によってフィルタ出力値の最大極値を確定することを特徴とする請求項2に記載の方法。
The first maximum value is searched from among the filter output values of the frequency domain coefficients directly corresponding to the first frequency range, and the maximum value is set as the maximum extreme value of the first frequency range filter output value, or
One stage in the first frequency range is set as the second frequency range, the first maximum value is searched from the filter output value of the frequency domain coefficient corresponding to the second frequency range, and the frequency corresponding to the first maximum value corresponds to the first frequency range. Perform different processing depending on the position of the area coefficient,
a. If the first maximum value is the filter output value of the frequency domain coefficient of the lowest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the lowest frequency of the second frequency range is the previous one in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter output value of the previous frequency domain coefficient The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or continues to be compared, and the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is the next frequency. If you get greater than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is the maximum extreme value finally determined,
b. If the first maximum value is the filter output value of the frequency domain coefficient of the highest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the highest frequency of the second frequency range is incremented by one in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter frequency output value of the next frequency domain coefficient, The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or the comparison is continued, and the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the previous frequency. If it is greater than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the maximum extreme value finally determined,
c. When the first maximum value is a filter output value of a frequency domain coefficient between the lowest frequency and the highest frequency of the second frequency range, the frequency domain coefficient corresponding to the first maximum value is a position where the tone is located; 3. The method according to claim 2, wherein the maximum extreme value of the filter output value is determined by a method in which the first maximum value is the maximum extreme value finally determined.
ステップCにおいて、ゼロビットの符号化サブバンドに対して周波数帯コピーする場合、先ず、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算し、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーすることを特徴とする請求項1〜5のいずれかに記載の方法。   In Step C, when frequency band copying is performed for a zero bit encoding subband, first, the zero bit encoding subband is determined by the source frequency range and the starting serial number of the zero bit encoding subband that needs to be frequency band copied. Calculate the source frequency range copy start serial number of the band and periodically copy the frequency domain coefficients of the source frequency range starting from the source frequency range copy start serial number to the zero-bit coded subband, with the frequency band copy period as the period. 6. The method according to any one of claims 1 to 5, wherein ステップCにおける該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する方法は、
周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始MDCT周波数領域係数の周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯のコピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、周波数帯コピーオフセットをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを差し引きつづけ、該値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとすることであることを特徴とする請求項6に記載の方法。
The method of calculating the source frequency range copy start serial number of the zero bit encoded subband in step C is:
Obtain the serial number of the frequency point of the start MDCT frequency domain coefficient of the zero bit coding subband that needs to be reconstructed, and fillband_start_freq, the serial number of the frequency point corresponding to the tone is Tonal_pos, The copy period is set to copy_period, the value is equal to adding 1 to Tonal_pos, the frequency band copy offset is set to copyband_offset, the value of fillband_start_freq is continuously subtracted from copy_period in the cycle, and the value is located in the serial number value interval of the source frequency range 7. The method according to claim 6, wherein the value is a source frequency range copy start serial number and is copy_pos_mod.
ステップCにおいて、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーする方法は、
ソース周波数範囲コピー開始シリアルナンバーからはじめとする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達したあと、再び第copyband_offset個の周波数点から開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数の周波数帯コピーを完成するまで行うことであることを特徴とする請求項6に記載の方法。
In step C, with the frequency band copy period as the period, the method of periodically copying the frequency domain coefficient of the source frequency range starting from the source frequency range copy start serial number to the encoded subband of zero bits is as follows:
The frequency domain coefficients starting from the source frequency range copy start serial number are sequentially copied back to the zero-bit encoded subband starting from fillband_start_freq, and the frequency point of the source frequency range copy is changed to the Tonal_pos + copyband_offset frequency point. After that, the frequency domain coefficients starting again from the copyband_offset frequency points are continued and subsequently copied to the zero bit encoding subband, and so on, all the current zero bit encoding subbands are all copied. 7. The method according to claim 6, wherein the frequency band copy of the frequency domain coefficient is performed until completion.
周波数帯コピー装置であって、順次に接続する音調位置捜索モジュール、周期及びソース周波数範囲計算モジュール、ソース周波数範囲コピー開始シリアルナンバー計算モジュール及び周波数帯コピーモジュールを含み、その中、
音調位置捜索モジュールは、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索するためのものであり、
周期及びソース周波数範囲計算モジュールは、音調の所在位置によりコピーに用いる周波数帯コピー周期及びソース周波数範囲を確定するものでり、該周波数帯コピー周期が0周波数点から音調位置の周波数点までの帯域幅であり、前記ソース周波数範囲は、0周波数点から音調位置の周波数点までの間の周波数範囲を後へcopyband_offsetのオフセットをする周波数範囲であり、その中、前記オフセット量copyband_offsetが0より大きいまたは0と等しいであり、
ソース周波数範囲コピー開始シリアルナンバー計算モジュールは、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算するためのものであり、
前記周波数帯コピーモジュールは、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数を周期的にゼロビットの符号化サブバンドにコピーするためのものであることを特徴とする周波数帯コピー装置。
A frequency band copy apparatus, including a tone position search module, a period and source frequency range calculation module, a source frequency range copy start serial number calculation module, and a frequency band copy module, which are sequentially connected,
The tone position search module is for searching the location of a tone with an audio signal in the MDCT frequency domain coefficient,
The period and source frequency range calculation module determines the frequency band copy period and source frequency range used for copying according to the location of the tone, and the frequency band copy period is a band from the 0 frequency point to the frequency point of the tone position. The source frequency range is a frequency range in which the frequency range between the frequency point from the zero frequency point to the frequency point of the tone position is offset by copyband_offset, in which the offset amount copyband_offset is greater than 0 or Is equal to 0,
The source frequency range copy start serial number calculation module calculates the source frequency range copy start serial number of the zero bit encoded subband by the start serial number of the zero bit encoded subband that needs to be copied. For calculating,
The frequency band copy module is for copying a frequency domain coefficient of a source frequency range starting from a source frequency range copy start serial number to a zero-bit encoding subband periodically with a frequency band copy cycle as a period. A frequency band copying apparatus characterized by the above.
前記音調位置捜索モジュールが音調位置を捜索する方法は、
第1周波数範囲のMDCT周波数領域係数に対して絶対値または平方値を取り得て、平滑化フィルタを行い、
平滑化フィルタの結果により、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値が所在の位置が即ち音調の所在位置、
であることを特徴とする請求項9に記載の装置。
The method for searching the tone position by the tone position search module is as follows:
The absolute value or square value can be taken for the MDCT frequency domain coefficient of the first frequency range, and a smoothing filter is performed.
According to the result of the smoothing filter, the location of the maximum extreme value of the first frequency range filter output value is searched, and the location of the maximum extreme value is the position of the tone,
10. The device according to claim 9, wherein
前記音調位置捜索モジュールが該第1周波数範囲のMDCT周波数領域係数に対して絶対値を取り得て、平滑化フィルタを行う計算式が
Figure 0005416173
であり、
或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタを行う計算が
Figure 0005416173
であり、
そのなか、
Figure 0005416173
が平滑化フィルタ係数であり、
Figure 0005416173
が第iフレームの第k個の周波数点のフィルタ出力値であり、
Figure 0005416173
が第iフレームの第k個の周波数点の復号化後のMDCT係数であり、且つi=0の場合、
Figure 0005416173
であることを特徴とする請求項10に記載の装置。
The tone position search module can obtain an absolute value for the MDCT frequency domain coefficient of the first frequency range, and a calculation formula for performing a smoothing filter is provided.
Figure 0005416173
And
Alternatively, a calculation for performing a smoothing filter on the frequency domain coefficient square value of the first frequency range is performed.
Figure 0005416173
And
Among them,
Figure 0005416173
Is the smoothing filter coefficient,
Figure 0005416173
Is the filter output value of the kth frequency point of the i-th frame,
Figure 0005416173
Is the MDCT coefficient after decoding of the kth frequency point of the i-th frame, and i = 0,
Figure 0005416173
The apparatus according to claim 10, wherein:
前記第1周波数範囲は、周波数スペクトルの統計特性により確定されたエネルギーが集中している低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分であることを特徴とする請求項10に記載の装置。   The first frequency range is a low frequency range in which energy determined by statistical characteristics of the frequency spectrum is concentrated. Among them, the low frequency is a frequency spectrum smaller than a half signal total bandwidth. 11. The device according to claim 10, wherein the device is a component. 前記音調位置捜索モジュールは、直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とし、或は、
前記音調位置捜索モジュールは、フィルタ出力値の最大極値を確定する時、該第1周波数範囲の中の一段を第2周波数範囲として、先ず、第2周波数範囲が対応する周波数領域係数のフィルタ出力値から最初の最大値を捜索し、さらに該最初の最大値が対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数の間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値であることを特徴とする請求項10に記載の装置。
The tonal position search module directly searches for the first maximum value from the filter output value of the frequency domain coefficient corresponding to the first frequency range, and sets the maximum value as the maximum extreme value of the first frequency range filter output value; or Is
The tone position search module, when determining the maximum extreme value of the filter output value, first stage in the first frequency range as the second frequency range, first, the filter output of the frequency domain coefficient corresponding to the second frequency range Search for the first maximum value from the values, and perform different processing depending on the position of the frequency domain coefficient corresponding to the first maximum value,
a. If the first maximum value is the filter output value of the frequency domain coefficient of the lowest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the lowest frequency of the second frequency range is the previous one in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter output value of the previous frequency domain coefficient The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or continues to be compared, and the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is the next frequency. If it gets larger than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the lowest frequency of the first frequency range is the maximum extreme value finally determined,
b. If the first maximum value is the filter output value of the frequency domain coefficient of the highest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the highest frequency of the second frequency range is one step behind in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter frequency output value of the next frequency domain coefficient, The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or the comparison is continued, and the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the previous frequency. If you get greater than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the maximum extreme value that was finally determined,
c. When the first maximum value is a filter output value of a frequency domain coefficient between the lowest frequency and the highest frequency of the second frequency range, the frequency domain coefficient corresponding to the first maximum value is a position where the tone is located; 11. The apparatus of claim 10, wherein the first maximum value is a finally determined maximum extreme value.
前記ソース周波数範囲コピー開始シリアルナンバー計算モジュールが周波数帯コピーを行う必要があるゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算す過程は、再生しようとする周波数係数に関るゼロビットの符号化サブバンドの開始周波数点のシリアル番号を獲得し、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数領域コピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、ソース周波数範囲開始シリアルナンバーをcopyband_offsetとし、fillband_start_freqの値を循環にcopy_periodを差し引きつづけ、該値がソース周波数範囲のシリアルナンバーの値区間に位置するまでにして、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとすることを含むことを特徴とする請求項9〜13のいずれかに記載の装置。   The process of calculating the source frequency range copy start serial number of the encoded subband of the zero bit that the source frequency range copy start serial number calculation module needs to perform the frequency band copy includes the zero bit related to the frequency coefficient to be reproduced. Obtain the serial number of the start frequency point of the encoding subband, fillband_start_freq, serial number of the frequency point corresponding to the tone is Tonal_pos, frequency domain copy period is copy_period, the value is equal to adding 1 to Tonal_pos, The source frequency range start serial number is copyband_offset, the value of fillband_start_freq is circulated and copy_period is subtracted until the value is located in the value interval of the serial number of the source frequency range, and this value is the source frequency range copy start serial number And copy_pos_mod The apparatus according to claim 9, wherein the apparatus includes: 周波数帯コピーモジュールが周波数帯コピーを行う場合、ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達する後、再び第copyband_offset個の周波数点から開始とする周波数領域係数を続けて後へ該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数コピーを完成するまで行うことであることを特徴とする請求項9〜13中のいずれかに記載の装置。   When the frequency band copy module performs frequency band copy, the frequency domain coefficient starting from the source frequency range copy start serial number is sequentially copied to the zero-bit encoded subband starting from fillband_start_freq, and the source frequency After the frequency point of the range copy reaches the Tonal_pos + copyband_offset frequency point, copy the frequency domain coefficients starting from the first copyband_offset frequency points again, and later copy to the encoded subband of zero bits, and so on. 14. Apparatus according to any of claims 9 to 13, characterized in that all frequency domain coefficient copies of the current zero-bit coded subband are performed until completion. オーディオ復号化方法であって、
A、復号化待ちビットストリームにおける各振幅エンベロープ符号化ビットに対して復号化逆量子化し、各符号化サブバンドの振幅エンベロープを得るステップと、
B、各符号化サブバンドに対してビットを分配し、非ゼロビットの符号化サブバンドに対し復号化と逆量子化を行い、非ゼロビットの符号化サブバンドの周波数領域係数を得るステップと、
C、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、0周波数点から音調位置の周波数点までの間の周波数範囲を後へcopyband_offsetのオフセットをする周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドを周波数帯コピーし、現在の符号化サブバンドの振幅エンベロープによりコピーして得られる周波数領域係数に対しエネルギー調整を行い、それにノイズ充填を結合して、再建のゼロビットの符号化サブバンドの周波数領域係数を得て、その中の前記オフセット量copyband_offsetが0より大きいまたは0と等しいであるステップと、
D、非ゼロビットの符号化サブバンドの周波数領域係数と再建されたゼロビットの符号化サブバンドの周波数領域係数に対して逆修正離散コサイン変換(IMDCT)を行い、最終のオーディオ信号を得るステップとを含むことを特徴とするオーディオ復号化方法。
An audio decoding method comprising:
A, decoding and dequantizing each amplitude envelope encoded bit in the decoding-waiting bitstream to obtain an amplitude envelope for each encoded subband;
B, distributing bits to each encoded subband, performing decoding and inverse quantization on the non-zero bit encoded subband to obtain a frequency domain coefficient of the non-zero bit encoded subband;
C, MDCT frequency domain coefficients are searched for the location of the tone where the audio signal is located, and the bandwidth from the 0 frequency point to the tone location frequency point is the frequency band copy period, from the 0 frequency point to the tone location frequency point The frequency range obtained by copying the zero-bit encoded subband using the frequency envelope that is offset by copyband_offset after the frequency range between and using the amplitude envelope of the current encoded subband as the source frequency range. Performing energy adjustment on the coefficients and combining with noise filling to obtain the frequency domain coefficients of the reconstructed zero-bit coded subband, in which the offset amount copyband_offset is greater than or equal to zero When,
D, performing an inverse modified discrete cosine transform (IMDCT) on the frequency domain coefficients of the non-zero bit encoding subband and the reconstructed zero bit encoding subband to obtain a final audio signal; An audio decoding method comprising:
ステップCにおいて、
第1周波数範囲の周波数領域係数に対し絶対値或いは平方値を取得して、平滑化フィルタを行い、
平滑化フィルタの結果によって、第1周波数範囲フィルタ出力値の最大極値の所在の位置を捜索し、該最大極値の所在の位置をある音調の所在の位置とする方法を採用してある音調の位置を捜索することを特徴とする請求項16に記載の方法。
In step C,
Obtain the absolute value or square value for the frequency domain coefficient of the first frequency range, perform a smoothing filter,
Based on the result of the smoothing filter, the position of the maximum extreme value of the first frequency range filter output value is searched for, and the position of the maximum extreme value is set as the position of the position of a certain tone. 17. The method of claim 16, wherein the location of
該第1周波数範囲の周波数領域係数に対して絶対値を取得して、平滑化フィルタを行う計算式が
Figure 0005416173
であり、
或いは、該第1周波数範囲の周波数領域係数平方値に対して平滑化フィルタを行う計算式が
Figure 0005416173
であり、
そのなか、
Figure 0005416173
が平滑化フィルタ係数であり、
Figure 0005416173
が第iフレームの第k個の周波数点のフィルタ出力値を表し、
Figure 0005416173
が第iフレームの第k個の周波数点の復号化された後のMDCT係数であり、且つi=0の場合、
Figure 0005416173
であることを特徴とする請求項17に記載の方法。
A calculation formula for obtaining an absolute value for the frequency domain coefficient of the first frequency range and performing a smoothing filter is as follows:
Figure 0005416173
And
Alternatively, a calculation formula for performing a smoothing filter on the frequency domain coefficient square value of the first frequency range is
Figure 0005416173
And
Among them,
Figure 0005416173
Is the smoothing filter coefficient,
Figure 0005416173
Represents the filter output value of the kth frequency point of the i-th frame,
Figure 0005416173
Is the MDCT coefficient after decoding of the kth frequency points of the i-th frame, and i = 0,
Figure 0005416173
The method according to claim 17, wherein:
前記第1周波数範囲は周波数スペクトルの統計特性によって確定されるエネルギーが集中する低周波数の周波数範囲であり、その中、低周波数とは、1/2の信号総帯域幅より小さい周波数スペクトル成分であることを特徴とする請求項17に記載の方法。   The first frequency range is a frequency range of a low frequency where energy determined by statistical characteristics of the frequency spectrum is concentrated, and the low frequency is a frequency spectrum component smaller than a total signal bandwidth of 1/2. The method according to claim 17, wherein: 直接に第1周波数範囲が対応する周波数領域係数のフィルタ出力値の中から最初の最大値を捜索し、該最大値を第1周波数範囲フィルタ出力値の最大極値とし、或は、
該第1周波数範囲のその中の一段を第2周波数範囲とし、第2周波数範囲が対応する周波数領域係数のフィルタ出力値の中から最初の最大値を捜索し、該最初の最大値が対応する周波数領域係数の位置により異なる処理を行い、
a.該最初の最大値が第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最低周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ前のより低い周波数の周波数領域係数のフィルタ出力値と比較して、順次に前へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最低周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
b.該最初の最大値が第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値であると、該第2周波数範囲の最高周波数の周波数領域係数のフィルタ出力値を第1周波数範囲における一つ後のより高い周波数の周波数領域係数のフィルタ出力値と比較して、順次に後へ比較し続け、現在の周波数領域係数のフィルタ出力値が一つ後の周波数領域係数のフィルタ出力値より大きい場合、該現在の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、或いは、比較しつづけて、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が一つ前の周波数領域係数のフィルタ出力値より大きいことを得る場合、第1周波数範囲の最高周波数の周波数領域係数のフィルタ出力値が最終に確定された最大極値であり、
c.該最初の最大値が第2周波数範囲の最低周波数と最高周波数との間の周波数領域係数のフィルタ出力値であると、該最初の最大値が対応する周波数領域係数が音調の所在の位置であり、即ち、該最初の最大値が最終に確定された最大極値である方法によってフィルタ出力値の最大極値を確定することを特徴とする請求項17に記載の方法。
The first maximum value is searched from the filter output values of the frequency domain coefficients directly corresponding to the first frequency range, and the maximum value is set as the maximum extreme value of the first frequency range filter output value, or
One stage in the first frequency range is set as the second frequency range, the first maximum value is searched from the filter output values of the frequency domain coefficients corresponding to the second frequency range, and the first maximum value corresponds to the first frequency range. Different processing depending on the position of the frequency domain coefficient
a. If the first maximum value is the filter output value of the frequency domain coefficient of the lowest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the lowest frequency of the second frequency range is the previous one in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter output value of the previous frequency domain coefficient The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or continues to be compared, and the filter output value of the frequency domain coefficient of the lowest frequency in the first frequency range is the next frequency. If it gets larger than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the lowest frequency of the first frequency range is the maximum extreme value finally determined,
b. If the first maximum value is the filter output value of the frequency domain coefficient of the highest frequency in the second frequency range, the filter output value of the frequency domain coefficient of the highest frequency of the second frequency range is one step behind in the first frequency range. If the current frequency domain coefficient filter output value is greater than the filter frequency output value of the next frequency domain coefficient, The filter output value of the current frequency domain coefficient is the maximum extreme value finally determined, or the comparison is continued, and the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the previous frequency. If you get greater than the filter output value of the domain coefficient, the filter output value of the frequency domain coefficient of the highest frequency in the first frequency range is the maximum extreme value that was finally determined,
c. When the first maximum value is a filter output value of a frequency domain coefficient between the lowest frequency and the highest frequency in the second frequency range, the corresponding frequency domain coefficient corresponding to the first maximum value is the position of the tone. 18. The method of claim 17, wherein the maximum extreme value of the filter output value is determined by a method in which the first maximum value is a final maximum extreme value finally determined.
ステップCにおいて、ゼロビットの符号化サブバンドに対して周波数帯コピーする時、先ず、ソース周波数範囲及び周波数帯コピーを行う必要があるゼロビットの符号化サブバンドの開始シリアルナンバーにより該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算し、周波数帯コピー周期を周期とし、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数をゼロビットの符号化サブバンドに周期的にコピーすることを特徴とする請求項17〜20中のいずれかに記載の方法。   In step C, when frequency band copying is performed for a zero bit encoding subband, first, the zero bit encoding subband is determined by the source frequency range and the starting serial number of the zero bit encoding subband that needs to be frequency band copied. Calculates the band source frequency range copy start serial number, uses the frequency band copy period as the period, and periodically copies the frequency domain coefficients of the source frequency range starting from the source frequency range copy start serial number to the zero-bit encoding subband. 21. A method according to any of claims 17 to 20, characterized in that ステップCにおいて該ゼロビットの符号化サブバンドのソース周波数範囲コピー開始シリアルナンバーを計算する方法は、
周波数領域係数を再建する必要があるゼロビットの符号化サブバンドの開始MDCT周波数領域係数の周波数点のシリアルナンバーを得て、fillband_start_freqとし、音調が対応する周波数点のシリアルナンバーをTonal_posとし、周波数帯のコピー周期をcopy_periodとし、その値はTonal_posに1を加えると等しい、周波数帯コピーオフセットをcopyband_offsetとし、fillband_start_freqの値に循環にcopy_periodを差し引きつづけて、該値がソース周波数範囲のシリアルナンバーの値区間に位置する場合、該値がソース周波数範囲コピー開始シリアルナンバーであり、copy_pos_modとすることであることを特徴とする請求項21に記載の方法。
The method of calculating the source frequency range copy start serial number of the zero bit encoded subband in step C is:
Obtain the serial number of the frequency point of the start MDCT frequency domain coefficient of the zero bit coding subband that needs to be reconstructed, and fillband_start_freq, the serial number of the frequency point corresponding to the tone is Tonal_pos, The copy period is set to copy_period, and the value is equal to adding 1 to Tonal_pos. 22. The method of claim 21, wherein if located, the value is a source frequency range copy start serial number and is copy_pos_mod.
ステップCにおいて、周波数帯コピー周期を周期として、ソース周波数範囲コピー開始シリアルナンバーからはじめソース周波数範囲の周波数領域係数をゼロビットの符号化サブバンドに周期的にコピーする方法は、
ソース周波数範囲コピー開始シリアルナンバーを開始とする周波数領域係数を順次に後へfillband_start_freqを開始位置とするゼロビットの符号化サブバンドにコピーしつづけ、ソース周波数範囲コピーの周波数点がTonal_pos+copyband_offset周波数点に達する後、再び第copyband_offset個の周波数点を開始とする周波数領域係数を後へ続けて該ゼロビットの符号化サブバンドにコピーし、そのように続け、現在のゼロビットの符号化サブバンドのすべての周波数領域係数の周波数帯コピーを完成するまで行うことであることを特徴とする請求項21に記載の方法。
In step C, with the frequency band copy period as the period, the method of periodically copying the frequency domain coefficient of the source frequency range starting from the source frequency range copy start serial number to the zero-bit encoded subband is:
Source frequency range copy start The frequency domain coefficient starting from the serial number is sequentially copied back to the zero-bit encoded subband starting from fillband_start_freq, and the frequency point of the source frequency range copy is set to Tonal_pos + copyband_offset frequency point After that, the frequency domain coefficients starting again at the copyband_offset frequency points are copied back to the zero bit encoding subband, and so on, and all frequencies of the current zero bit encoding subband are followed. The method according to claim 21, characterized in that it is performed until the frequency band copy of the region coefficient is completed.
波数帯コピー方法とノイズ充填を結合する方法を採用してすべてのゼロビットの符号化サブバンドに対して周波数スペクトル再建を行い、或いは、特定の周波数点以下のゼロビットの符号化サブバンドに対してランダムノイズ充填方法を採用して周波数スペクトル再建を行い、特定の周波数点以上のゼロビットの符号化サブバンドに対して、周波数領域係数コピーとノイズ充填を結合する方法を採用して周波数スペクトル再建を行うことを特徴とする請求項16に記載の方法。 It performs frequency spectrum reconstruction on the coded sub-band of all zero bits by employing a method to combine copying method and a noise filling frequency band, or with respect to the zero bit encoding subband below a certain frequency point Frequency spectrum reconstruction is performed using a random noise filling method, and frequency spectrum reconstruction is performed using a method that combines frequency domain coefficient copying and noise filling for zero-bit coded subbands above a specific frequency point. The method according to claim 16 , wherein: オーディオ復号化システムであって、ビットストリームデマルチプレクサ(DeMUX)、振幅エンベロープ復号化ユニット、ビット分配ユニット、周波数領域係数復号化ユニット、ノイズ充填ユニット、逆修正離散コサイン変換(IMDCT)ユニット、及び請求項9〜15中のいずれかに記載の周波数帯コピー装置を含み、
前記DeMUXは、復号化待ちビットストリームの中から振幅エンベロープ符号化ビット、周波数領域係数符号化ビット及びノイズレベル符号化ビットを分離するためのものであり、
前記振幅エンベロープ復号化ユニットは、前記DeMUXと接続し、前記ビットストリームデマルチプレクサが出力した振幅エンベロープ符号化ビットに対して復号化逆量子化を行い、各符号化サブバンドの振幅エンベロープを得るためのものであり、
前記ビット分配ユニットは、前記振幅エンベロープ復号化ユニットと接続し、ビットの分配を行い、各符号化サブバンドにおける各の周波数領域係数に分配された符号化ビット数を得るためのものであり、
周波数領域係数復号化ユニットは、振幅エンベロープ復号化ユニット及びビット分配ユニットと接続し、符号化サブバンドに対して復号化、逆量子化及び逆正規化を行い、周波数領域係数を得るためのものであり、
前記周波数帯コピー装置は、前記DeMUX、周波数領域係数復号化ユニット、振幅エンベロープ復号化ユニット及びビット分配ユニットと接続し、MDCT周波数領域係数においてオーディオ信号のある音調の所在の位置を捜索し、0周波数点から音調位置の周波数点までの帯域幅を周波数帯コピー周期として、0周波数点から音調位置の周波数点までの間の周波数範囲を後へcopyband_offsetのオフセットをする周波数範囲をソース周波数範囲として、ゼロビットの符号化サブバンドに対し周波数帯コピーを行い、その中、前記オフセット量copyband_offsetが0より大きいまたは0と等しいであるためのもので、さらに、現在の符号化サブバンドの振幅エンベロープによりコピーして得られる周波数領域係数に対してエネルギー調整を行うためのものであり、
ノイズ充填ユニットは、振幅エンベロープ復号化ユニット、ビット分配ユニット及び周波数帯コピーユニットと接続し、現在のゼロビットの符号化サブバンドの振幅エンベロープにより該符号化サブバンドにノイズを填充し、再建するゼロビットの符号化サブバンドの周波数領域係数を得るためのものであり、
IMDCTユニットは、前記ノイズ充填ユニットと接続し、ノイズ充填した後の周波数領域係数に対してIMDCTを行い、オーディオ信号を得るためのものであることを特徴とするオーディオ復号化システム。
An audio decoding system comprising: a bitstream demultiplexer (DeMUX); an amplitude envelope decoding unit; a bit distribution unit; a frequency domain coefficient decoding unit; a noise filling unit; an inverse modified discrete cosine transform (IMDCT) unit; Including the frequency band copying apparatus according to any one of 9 to 15,
The DeMUX is for separating amplitude envelope encoded bits, frequency domain coefficient encoded bits and noise level encoded bits from the decoding-waiting bitstream,
The amplitude envelope decoding unit is connected to the DeMUX, performs decoding inverse quantization on the amplitude envelope encoded bits output from the bitstream demultiplexer, and obtains an amplitude envelope of each encoded subband. Is,
The bit distribution unit is connected to the amplitude envelope decoding unit, distributes bits, and obtains the number of encoded bits distributed to each frequency domain coefficient in each encoded subband;
The frequency domain coefficient decoding unit is connected to the amplitude envelope decoding unit and the bit distribution unit, and performs decoding, inverse quantization, and inverse normalization on the encoded subband to obtain a frequency domain coefficient. Yes,
The frequency band copying apparatus is connected to the DeMUX, the frequency domain coefficient decoding unit, the amplitude envelope decoding unit, and the bit distribution unit, and searches for the location of a tone having an audio signal in the MDCT frequency domain coefficient. Zero bit with the bandwidth from the point to the frequency point of the tone position as the frequency band copy cycle, the frequency range from the zero frequency point to the frequency point of the tone position as the source frequency range as the frequency range to offset the copyband_offset later The frequency band copy is performed on the encoded subband of the first subband, in which the offset amount copyband_offset is greater than or equal to 0, and further copied by the amplitude envelope of the current encoded subband. It is for performing energy adjustment for the obtained frequency domain coefficient,
The noise filling unit is connected to the amplitude envelope decoding unit, the bit distribution unit, and the frequency band copy unit, and fills the coding subband with noise by the amplitude envelope of the current zero bit coding subband and reconstructs the zero bit To obtain the frequency domain coefficients of the encoded subbands,
An audio decoding system characterized in that an IMDCT unit is connected to the noise filling unit and performs IMDCT on the frequency domain coefficients after noise filling to obtain an audio signal.
JP2011151189A 2011-07-07 2011-07-07 Frequency band copy method, apparatus, audio decoding method, and system Active JP5416173B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011151189A JP5416173B2 (en) 2011-07-07 2011-07-07 Frequency band copy method, apparatus, audio decoding method, and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011151189A JP5416173B2 (en) 2011-07-07 2011-07-07 Frequency band copy method, apparatus, audio decoding method, and system

Publications (2)

Publication Number Publication Date
JP2013019968A JP2013019968A (en) 2013-01-31
JP5416173B2 true JP5416173B2 (en) 2014-02-12

Family

ID=47691490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011151189A Active JP5416173B2 (en) 2011-07-07 2011-07-07 Frequency band copy method, apparatus, audio decoding method, and system

Country Status (1)

Country Link
JP (1) JP5416173B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11948865B2 (en) * 2018-02-22 2024-04-02 Lintec Corporation Film-shaped firing material and film-shaped firing material with a support sheet

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE320651T1 (en) * 2001-05-08 2006-04-15 Koninkl Philips Electronics Nv ENCODING AN AUDIO SIGNAL
JP3926726B2 (en) * 2001-11-14 2007-06-06 松下電器産業株式会社 Encoding device and decoding device
DK3401907T3 (en) * 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Method and apparatus for perceptual spectral decoding of an audio signal comprising filling in spectral holes
CN101939782B (en) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 Adaptive transition frequency between noise fill and bandwidth extension

Also Published As

Publication number Publication date
JP2013019968A (en) 2013-01-31

Similar Documents

Publication Publication Date Title
JP6773737B2 (en) Devices and methods for expanding the bandwidth of acoustic signals
CA2698031C (en) Method and device for noise filling
JP2013015598A (en) Audio coding/decoding method, system and noise level estimation method
JP4950210B2 (en) Audio compression
JP3579047B2 (en) Audio decoding device, decoding method, and program
KR101586317B1 (en) A method and an apparatus for processing a signal
JP6636574B2 (en) Noise signal processing method, noise signal generation method, encoder, and decoder
CN102194458B (en) Spectral band replication method and device and audio decoding method and system
JP2003216190A (en) Encoding device and decoding device
CN102194457A (en) Audio encoding and decoding method, system and noise level estimation method
CN103069484A (en) Time/frequency two dimension post-processing
US8838442B2 (en) Method and system for two-step spreading for tonal artifact avoidance in audio coding
WO2010130225A1 (en) Audio decoding method and audio decoder
MX2014000161A (en) Apparatus and method for generating bandwidth extension signal.
WO2010022661A1 (en) Method, apparatus and system for audio encoding and decoding
EP1782419A1 (en) Scalable audio coding
US20130006644A1 (en) Method and device for spectral band replication, and method and system for audio decoding
WO2008064577A1 (en) A method and an apparatus for adjusting quantization quality in encoder and decoder
CN103165134B (en) Coding and decoding device of audio signal high frequency parameter
JP5416173B2 (en) Frequency band copy method, apparatus, audio decoding method, and system
KR101387808B1 (en) Apparatus for high quality multiple audio object coding and decoding using residual coding with variable bitrate
KR101786863B1 (en) Frequency band table design for high frequency reconstruction algorithms
CN108630212B (en) Perception reconstruction method and device for high-frequency excitation signal in non-blind bandwidth extension
CN111210831A (en) Bandwidth extension audio coding and decoding method and device based on spectrum stretching
CN116189693A (en) Bandwidth expansion method, device, medium and equipment

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130806

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131114

R150 Certificate of patent or registration of utility model

Ref document number: 5416173

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250