JP6053145B2 - Encoding device, decoding device, method, program, and recording medium - Google Patents

Encoding device, decoding device, method, program, and recording medium Download PDF

Info

Publication number
JP6053145B2
JP6053145B2 JP2013034554A JP2013034554A JP6053145B2 JP 6053145 B2 JP6053145 B2 JP 6053145B2 JP 2013034554 A JP2013034554 A JP 2013034554A JP 2013034554 A JP2013034554 A JP 2013034554A JP 6053145 B2 JP6053145 B2 JP 6053145B2
Authority
JP
Japan
Prior art keywords
pitch
sharpening coefficient
coefficient
time interval
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013034554A
Other languages
Japanese (ja)
Other versions
JP2014164091A (en
Inventor
守谷 健弘
健弘 守谷
優 鎌本
優 鎌本
登 原田
登 原田
大将 千葉
大将 千葉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013034554A priority Critical patent/JP6053145B2/en
Publication of JP2014164091A publication Critical patent/JP2014164091A/en
Application granted granted Critical
Publication of JP6053145B2 publication Critical patent/JP6053145B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、音声、音楽等の音信号を符号化または復号する技術に関する。特に、CELP等の符号化技術において、パルス励振信号をピッチ周期で繰り返して合成するピッチシャープニング技術に関する。   The present invention relates to a technique for encoding or decoding sound signals such as voice and music. In particular, the present invention relates to a pitch sharpening technique in which a pulse excitation signal is repeatedly synthesized with a pitch period in an encoding technique such as CELP.

従来は、CELP(Code Excited Linear Prediction)の符号化および復号において、音声の周期性の表現力を強化するために、固定符号帳から出力されるパルス系列の一部または全部について、基本周期の長さ分を切り出し、切り出し部分をフレーム長に達するまで繰り返し配列することで得られる周期化済みパルス系列を、固定符号帳から出力されるサンプル列の代わりに用いることにより、符号化された信号の符号化歪みを小さくする(符号化品質を向上する)ピッチシャープニング技術がもちいられている(例えば、非特許文献1参照)。例えば、j番目のフレームを処理対象のフレームとしたときに固定符号帳から出力されるパルス系列をcfjとし、j番目のフレームの基本周期の長さをFとしたとき、周期化済みパルス系列cfj=cfn(n=1,・・・,D;Dはcfjのサンプル数)は

Figure 0006053145
と表せる。γは周期化の度合いを決める係数(ピッチシャープニング係数)であり、γの値が大きいほど周期性成分の影響が大きくなることを意味する。
非特許文献1では、γの値として、直前のサブフレームで量子化されたピッチ利得を利用していた(非特許文献1の式(48)参照)。 Conventionally, in encoding and decoding of CELP (Code Excited Linear Prediction), in order to enhance the expressive power of speech periodicity, the length of the basic period is set for some or all of the pulse sequences output from the fixed codebook. By using a periodic pulse sequence obtained by cutting out the portion and repeating the cut-out portion until the frame length is reached, instead of the sample sequence output from the fixed codebook, the code of the encoded signal A pitch sharpening technique that reduces the distortion (improves the encoding quality) is used (see Non-Patent Document 1, for example). For example, the pulse sequence output from the fixed codebook when the j-th frame of the processing target frame and c fj, when the length of the fundamental period of the j-th frame and F j, the period of pre-pulse The sequence c fj = c fn (n = 1,..., D j ; D j is the number of samples of c fj ) is
Figure 0006053145
It can be expressed. γ is a coefficient (pitch sharpening coefficient) that determines the degree of periodicity, and means that the larger the value of γ, the greater the influence of the periodic component.
In Non-Patent Document 1, the pitch gain quantized in the immediately preceding subframe is used as the value of γ (see Equation (48) of Non-Patent Document 1).

また、特許文献1では、現在のフレームのピッチ利得、または、入力音響信号のスペクトル包絡の傾き(1次の線形予測係数)とパワーを用いて入力音響信号の周期性の程度を推定し、その推定した周期性の程度に応じて周期性が高いほどγの値が大きくなるようにしていた。   In Patent Document 1, the degree of periodicity of an input acoustic signal is estimated using the pitch gain of the current frame or the slope (primary linear prediction coefficient) and power of the spectral envelope of the input acoustic signal, According to the estimated periodicity, the higher the periodicity, the larger the value of γ.

US Patent No. 5,396,576US Patent No. 5,396,576

ITU-T Recommendation G.729 Coding of Speech at 8kbits/s using Conjugate-Structure Algebraic-Code-Excited-Linear-Prediction (CS-ACELP), 1996.ITU-T Recommendation G.729 Coding of Speech at 8kbits / s using Conjugate-Structure Algebraic-Code-Excited-Linear-Prediction (CS-ACELP), 1996.

非特許文献1や特許文献1で用いられている現在もしくは過去のフレーム(サブフレーム)のピッチ利得のみ、または、入力音響信号スペクトル包絡の傾きとパワーのみを基準として周期性の高さを判断する方法では、周期化処理による品質向上効果の高さが精度よく判定できない場合があり、十分な品質改善ができないことがあった。   The height of periodicity is determined based on only the pitch gain of the current or past frame (subframe) used in Non-Patent Document 1 or Patent Document 1, or only the slope and power of the input acoustic signal spectrum envelope. In the method, the quality improvement effect by the periodic processing may not be accurately determined, and sufficient quality improvement may not be possible.

この発明の課題は、従来よりも符号化品質を改善できるピッチシャープニング技術を用いた符号化装置、復号装置、これらの方法、プログラムおよび記録媒体を提供することである。   An object of the present invention is to provide an encoding device, a decoding device, a method thereof, a program, and a recording medium using a pitch sharpening technique that can improve the encoding quality as compared with the prior art.

本発明では、ピッチシャープニング係数を、処理対象の時間区間と処理対象よりも前の時間区間との間のピッチ周期の差、あるいは、有声音時間区間である可能性の推定値、あるいは、予測利得に基づく値とする。   In the present invention, the pitch sharpening coefficient is calculated based on the difference in pitch period between the time interval to be processed and the time interval before the process target, or the estimated value or possibility of being a voiced sound time interval. The value is based on the gain.

本発明では、入力音響信号の周期性を従来よりも精度よく推定し、周期性をより反映したピッチシャープニング係数をもちいることができるので、従来よりも符号化品質を改善できる。   In the present invention, the periodicity of the input acoustic signal can be estimated with higher accuracy than before, and the pitch sharpening coefficient reflecting the periodicity can be used, so that the encoding quality can be improved as compared with the conventional case.

実施形態の符号化装置を説明するためのブロック図。The block diagram for demonstrating the encoding apparatus of embodiment. 実施形態の復号装置を説明するためのブロック図。The block diagram for demonstrating the decoding apparatus of embodiment.

以下、この発明の実施形態について、詳細に説明する。
[第一実施形態]
<構成>
図1に例示するように、第一実施形態の符号化装置11は、線形予測分析部111、適応符号帳112、固定符号帳113、周期化処理部114、周期化済み固定符号帳記憶部115、探索制御部116、合成フィルタ117、ピッチシャープニング係数決定部118、およびパラメータ符号化部119を有する。探索制御部116は、ピッチ分析部1161、探索部1162、聴覚重み付けフィルタ1163、および利得量子化部1164を含む。
Hereinafter, embodiments of the present invention will be described in detail.
[First embodiment]
<Configuration>
As illustrated in FIG. 1, the encoding device 11 according to the first embodiment includes a linear prediction analysis unit 111, an adaptive codebook 112, a fixed codebook 113, a periodic processing unit 114, and a periodic fixed codebook storage unit 115. A search control unit 116, a synthesis filter 117, a pitch sharpening coefficient determination unit 118, and a parameter encoding unit 119. Search control unit 116 includes a pitch analysis unit 1161, search unit 1162, perceptual weighting filter 1163, and gain quantization unit 1164.

図2に例示するように、第一実施形態の復号装置12は、適応符号帳122、固定符号帳123、選択部125、合成フィルタ127、パラメータ復号部129、周期化処理部124、およびピッチシャープニング係数決定部128を有する。   As illustrated in FIG. 2, the decoding device 12 of the first embodiment includes an adaptive codebook 122, a fixed codebook 123, a selection unit 125, a synthesis filter 127, a parameter decoding unit 129, a periodicization processing unit 124, and a pitch sharpening. And a ning factor determination unit 128.

本形態の符号化装置11および復号装置12は、例えば、CPU(central processing unit)、RAM(random-access memory)、ROM(read-only memory)等を備えた公知のコンピュータまたは専用のコンピュータにプログラムやデータが読み込まれることで構成された特別な装置である。また、符号化装置11および復号装置12の処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。   The encoding device 11 and the decoding device 12 according to the present embodiment are, for example, programmed in a known computer or a dedicated computer having a CPU (central processing unit), a RAM (random-access memory), a ROM (read-only memory), and the like. It is a special device constructed by reading data. Further, at least part of the processing units of the encoding device 11 and the decoding device 12 may be configured by hardware such as an integrated circuit.

<符号化>
符号化装置11には、デジタル化され、所定時間区間であるフレームの単位で区分された時系列信号である入力音響信号x(n)(n=0,...,L−1、Lは2以上の整数、各nを「サンプル点」と呼ぶ)が入力される。入力音響信号の例は、音声信号、音楽信号、雑音信号などである。符号化装置11は、入力音響信号x(n)(n=0,...,L−1)を以下のようにフレームごとに符号化する。
<Encoding>
In the encoding device 11, the input acoustic signals x (n) (n = 0,..., L−1, L are digital time-sequential time-series signals divided in units of frames). An integer greater than or equal to 2 and each n is called a “sample point”). Examples of the input acoustic signal are a voice signal, a music signal, a noise signal, and the like. The encoding device 11 encodes the input acoustic signal x (n) (n = 0,..., L−1) for each frame as follows.

≪線形予測分析部111≫
線形予測分析部111は、処理対象のフレーム(「現フレーム」と呼ぶ)に属する各サンプル点n=0,...,L−1での入力音響信号x(n)(n=0,...,L−1)の線形予測分析を行い、当該現フレームでの全極型の合成フィルタ117を特定するための係数の量子化値に対応する符号である線形予測情報LPC info(「予測パラメータ」に含まれる)を出力する。すなわち、線形予測分析部111は、フレームごとに、入力音響信号x(n)(n=0,...,L−1)に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報LPC infoを得て出力する。例えば、線形予測分析部111は、現フレームの入力音響信号x(n)(n=0,...,L−1)に対応する線形予測係数a(m)(m=1,...,P、Pは正の整数である線形予測次数)を算出し、線形予測係数a(m)(m=1,...,P)を線スペクトル対係数LSPに変換し、量子化した線スペクトル対係数LSPに対応する符号を線形予測情報LPC infoとして出力する。
≪Linear prediction analysis part 111≫
The linear prediction analysis unit 111 inputs the input acoustic signal x (n) (n = 0,...) At each sample point n = 0,..., L−1 belonging to the processing target frame (referred to as “current frame”). .., L−1) is performed, and linear prediction information LPC info (“prediction” is a code corresponding to a quantized value of a coefficient for specifying the all-pole synthesis filter 117 in the current frame. Included in "parameter". That is, the linear prediction analysis unit 111 is a code that specifies a linear prediction coefficient corresponding to the input acoustic signal x (n) (n = 0,..., L−1) or a coefficient compatible with this for each frame. A certain linear prediction information LPC info is obtained and output. For example, the linear prediction analysis unit 111 performs linear prediction coefficients a (m) (m = 1,...) Corresponding to the input sound signal x (n) (n = 0,..., L−1) of the current frame. , P, P are linear prediction orders that are positive integers), linear prediction coefficients a (m) (m = 1,..., P) are converted into line spectrum pair coefficients LSP, and quantized lines. A code corresponding to the spectrum pair coefficient LSP is output as linear prediction information LPC info.

≪固定符号帳113≫
固定符号帳113には、零でない単位パルスとその極性との組み合わせからなる値を持つ1個以上の信号と零値を持つ1個以上の信号とから構成される複数個のパルス系列(「サンプル列」に相当)を特定するための情報が格納される。ここでは1フレームが4個のサブフレームに等区分される例を示す。すなわち、L個のサンプル点0,...,L−1からなるフレームは、サンプル点Lf(0),...,Lf(1)−1からなる1番目のサブフレーム(第1サブフレーム)、サンプル点Lf(1),...,Lf(2)−1からなる2番目のサブフレーム(第2サブフレーム)、サンプル点Lf(2),...,Lf(3)−1からなる3番目のサブフレーム(第3サブフレーム)、およびサンプル点Lf(3),...,Lf(4)−1からなる4番目のサブフレーム(第4サブフレーム)に区分される。Lf(0),Lf(1),Lf(2),Lf(3),Lf(4)は、Lf(0)=0,Lf(4)=L,Lf(0)<Lf(1)<Lf(2)<Lf(3)<Lf(4)を満たす正整数である。第1−4サブフレームに対応するパルス系列cf1,cf2,cf3,cf4はそれぞれ以下のように表現される。
cf1=(cf1(Lf(0)),...,cf1(Lf(1)-1))
cf2=(cf2(Lf(1)),...,cf2(Lf(2)-1))
cf3=(cf3(Lf(2)),...,cf3(Lf(3)-1))
cf4=(cf4(Lf(3)),...,cf4(Lf(4)-1))
Fixed codebook 113≫
The fixed codebook 113 includes a plurality of pulse sequences (“sample”) composed of one or more signals having a value composed of a combination of a non-zero unit pulse and its polarity and one or more signals having a zero value. Information for identifying the column) is stored. Here, an example is shown in which one frame is equally divided into four subframes. That is, a frame composed of L sample points 0,..., L−1 is a first subframe (first frame ) composed of sample points L f (0) ,..., L f (1) −1. Sub-frame), sample points L f (1) ,..., L f (2) −1, the second sub-frame (second sub-frame), sample points L f (2) ,. The third subframe (third subframe) consisting of f (3) −1 and the fourth subframe (fourth fourth ) consisting of sample points L f (3) ,..., L f (4) −1 Subframes). L f (0) , L f (1) , L f (2) , L f (3) , L f (4) are L f (0) = 0, L f (4) = L, L f ( 0) <L f (1) <L f (2) <L f (3) <L f (4) . The pulse sequences c f1 , c f2 , c f3 , and c f4 corresponding to the 1-4th subframe are expressed as follows.
c f1 = (c f1 (L f (0) ), ..., c f1 (L f (1) -1))
c f2 = (c f2 (L f (1) ), ..., c f2 (L f (2) -1))
c f3 = (c f3 (L f (2) ), ..., c f3 (L f (3) -1))
c f4 = (c f4 (L f (3) ), ..., c f4 (L f (4) -1))

≪適応符号帳112≫
適応符号帳112には、過去の各時点で生成された励振信号が記憶されている。適応符号帳112は、第1−4サブフレームの各サブフレームで得られるピッチ周期T,T,T,Tに応じて励振信号を遅延させて得られる適応信号成分v(n)(n=0,...,L−1)を出力する。小数精度のピッチ周期を用いて適応信号成分v(n)を表現する場合には、ピッチ周期に応じて遅延させた複数の励振信号に重み付き平均操作を行う補間フィルタが用いられる。
≪Adaptive codebook 112≫
The adaptive codebook 112 stores excitation signals generated at each past time point. The adaptive codebook 112 has an adaptive signal component v (n) obtained by delaying the excitation signal according to the pitch periods T 1 , T 2 , T 3 , T 4 obtained in each subframe of the 1-4th subframe. (N = 0,..., L−1) is output. When the adaptive signal component v (n) is expressed using a pitch cycle with decimal precision, an interpolation filter that performs a weighted average operation on a plurality of excitation signals delayed according to the pitch cycle is used.

≪ピッチ分析部1161≫
ピッチ分析部1161は、サブフレームごとに、入力音響信号x(n)(n=0,...,L−1)に対応するピッチ周期T,T,T,Tを得て、当該ピッチ周期T,T,T,Tと、当該ピッチ周期T,T,T,Tを特定するピッチ符号(周期性成分符号)CT,CT,CT,CTと、を出力する。各サブフレームのピッチ符号CT,CT,CT,CTはそれぞれ均一長である。CT,CT,CT,CTそれぞれのビット数は、互いに同一であってもよいし、互いに異なっていてもよい。なお、ピッチ周期はピッチ符号を復号することにより得られるのでピッチ分析部1161が出力することは必須ではない。ピッチ周期は、サンプル点の間隔の整数倍のみで表現される場合(整数精度)のみならず、サンプル点の間隔の整数倍と小数値(分数値)とを用いて表現される場合(小数精度)もある。また、ピッチ分析部1161は、探索部1162で用いるために、サブフレームごとに、ピッチ利得gp1,gp2,gp3,gp4を求めて出力してもよい。
<< Pitch analysis unit 1161 >>
The pitch analysis unit 1161 obtains pitch periods T 1 , T 2 , T 3 , and T 4 corresponding to the input acoustic signal x (n) (n = 0,..., L−1) for each subframe. , Pitch periods T 1 , T 2 , T 3 , T 4 and pitch codes (periodic component codes) CT 1 , CT 2 , CT 3 for identifying the pitch periods T 1 , T 2 , T 3 , T 4. , CT 4 . The pitch codes CT 1 , CT 2 , CT 3 , and CT 4 of each subframe have a uniform length. The numbers of bits of CT 1 , CT 2 , CT 3 , and CT 4 may be the same or different from each other. Since the pitch period is obtained by decoding the pitch code, it is not essential for the pitch analysis unit 1161 to output it. The pitch period is not only expressed as an integer multiple of the sample point interval (integer precision), but is also expressed using an integer multiple of the sample point interval and a decimal value (fractional value) (decimal precision) There is also. In addition, the pitch analysis unit 1161 may obtain and output the pitch gains g p1 , g p2 , g p3 , and g p4 for each subframe for use in the search unit 1162.

入力音響信号x(n)(n=0,...,L−1)に対応するピッチ周期T,T,T,T、当該ピッチ周期T,T,T,Tを特定するピッチ符号CT,CT,CT,CTの探索は、例えば、サブフレームごとに、適応符号帳112に記憶されている過去の各時点で生成された励振信号をピッチ周期の候補で遅延させて得られる信号に線形予測情報LPC infoによって特定される全極型の合成フィルタ117を適用して得られる合成信号と、入力された入力音響信号との差分に、聴覚重み付けフィルタ1164を適用した値が最小となるように行われる。 Pitch periods T 1 , T 2 , T 3 , T 4 corresponding to the input acoustic signal x (n) (n = 0,..., L−1), the pitch periods T 1 , T 2 , T 3 , T The search for pitch codes CT 1 , CT 2 , CT 3 , and CT 4 that specify 4 is performed by, for example, pitch periods of excitation signals generated at each past time point stored in the adaptive codebook 112 for each subframe. The perceptual weighting filter is applied to the difference between the synthesized signal obtained by applying the all-pole synthesis filter 117 specified by the linear prediction information LPC info to the signal obtained by delaying the candidate and the input acoustic signal. It is performed so that the value to which 1164 is applied is minimized.

ピッチ利得gp1,gp2,gp3,gp4は、例えば、サブフレームごとに、探索された当該ピッチ周期T,T,T,Tに対応する合成信号と入力された入力音響信号との相互相関値を合成信号の自己相関値で除算した値として求められる。 The pitch gains g p1 , g p2 , g p3 , and g p4 are, for example, for each subframe, the input sound that is input with the synthesized signal corresponding to the searched pitch period T 1 , T 2 , T 3 , T 4. It is obtained as a value obtained by dividing the cross-correlation value with the signal by the autocorrelation value of the combined signal.

≪ピッチシャープニング係数決定部118≫
ピッチシャープニング係数決定部118は、ピッチ周期が安定している度合いの高いサブフレームのピッチシャープニング係数が、ピッチ周期が安定している度合いの低いサブフレームのピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。ピッチ周期が安定している度合いが高い場合は周期性が高いことが想定されるので、ピッチシャープニング係数を大きくし周期化の程度を大きくすることで、品質の向上が期待できる。例えば、処理対象のサブフレーム(現在のサブフレーム)のピッチ周期と処理対象よりも前のサブフレーム(過去のサブフレーム)のピッチ周期との差が小さいほど、ピッチ周期が安定している度合いが高いと言える。
<< Pitch Sharpening Coefficient Determination Unit 118 >>
The pitch sharpening coefficient determination unit 118 prevents the pitch sharpening coefficient of a subframe having a high degree of stable pitch period from being smaller than the pitch sharpening coefficient of a subframe having a low degree of stable pitch period. Next, a pitch sharpening coefficient is determined. If the pitch period is highly stable, it is assumed that the periodicity is high. Therefore, the quality can be improved by increasing the pitch sharpening coefficient and increasing the degree of periodicity. For example, the smaller the difference between the pitch period of the subframe to be processed (current subframe) and the pitch period of the subframe prior to the process target (past subframe), the more stable the pitch period is. It can be said that it is expensive.

そこで、ピッチシャープニング係数決定部118は、処理対象のサブフレームをi番目のサブフレームとしたとき、ピッチシャープニング係数の値が、i番目のサブフレームのピッチ周期Tと過去のサブフレームのピッチ周期Ti-τ(τは1以上の正整数)との差(T−Ti-τ)の絶対値|T−Ti-τ|に対して単調非増加の関係となるように、ピッチシャープニング係数を決定する。すなわち、|T−Ti−τ|<|T−Tj−τ|(i≠j)であれば、i番目のサブフレームに対するピッチシャープニング係数が、j番目のサブフレームに対するピッチシャープニング係数よりも大きいか同じ値になる。 Therefore, when the sub-frame to be processed is the i-th sub frame, the pitch sharpening coefficient determination unit 118 determines that the pitch sharpening coefficient value is the pitch period T i of the i-th sub frame and the past sub-frame. The absolute value | T i −T i−τ | of the difference (T i −T i−τ ) from the pitch period T i−τ (τ is a positive integer of 1 or more) is monotonically non-increasing. Next, a pitch sharpening coefficient is determined. That is, if | T i −T i−τ | <| T j −T j−τ | (i ≠ j), the pitch sharpening coefficient for the i th subframe is the pitch sharpness for the j th subframe. It is greater than or equal to the ning factor.

ピッチシャープニング係数の決定は、上記の関係を維持するように、予め取りうるピッチ周期の差に対応する値(もしくはその範囲)とピッチシャープニング係数との値を対応付けた対応表を用いて決定することができる。このような対応表を例示する。この例では、サブフレーム間のピッチ周期の差の絶対値とシャープニング係数とが対応付けられている。   The pitch sharpening coefficient is determined by using a correspondence table in which values (or ranges thereof) corresponding to differences in pitch period that can be taken in advance and values of pitch sharpening coefficients are associated with each other so as to maintain the above relationship. Can be determined. An example of such a correspondence table is shown below. In this example, the absolute value of the difference in pitch period between subframes is associated with the sharpening coefficient.

Figure 0006053145
Figure 0006053145

あるいは、ピッチシャープニング係数決定部118は、予め定めたピッチ周期の差に対応する値を引数とする単調非増加関数を用いてピッチシャープニング係数を決定してもよい。ここで、ピッチ周期の差に対応する値としては、例えば、上述のピッチ周期の差の絶対値(|T−Ti-τ|あるいは|Ti-τ−T|)や、絶対値|Ti-τ−T|あるいは|Ti-τ−T|に対して単調非減少の関係にある値などが例示できる。ピッチ周期の差の絶対値|T−Ti-τ|あるいは|Ti-τ−T|が小さい場合は、過去のサブフレームと現在のサブフレームとのピッチ周期が近く、つまり、ピッチ周期の差の絶対値|T−Ti-τ|あるいは|Ti-τ−T|が小さいほどピッチ周期が安定していることを示す。また、ピッチシャープニング係数決定部118が、現在のサブフレーム及び過去のサブフレームのピッチ周期の代わりに、現在のフレーム及び過去のフレームのピッチ周期を用いてピッチシャープニング係数を決定しても良い。 Alternatively, the pitch sharpening coefficient determination unit 118 may determine the pitch sharpening coefficient using a monotonous non-increasing function having a value corresponding to a predetermined difference in pitch period as an argument. Here, as a value corresponding to the difference in pitch period, for example, the absolute value of the difference in pitch period (| T i −T i−τ | or | T i−τ −T i |) or the absolute value is used. Examples are values that are monotonically non-decreasing with respect to | T i-τ −T i | or | T i−τ −T i |. When the absolute value | T i −T i−τ | or | T i−τ −T i | is small, the pitch period between the past subframe and the current subframe is close, that is, the pitch. The smaller the absolute value | T i −T i−τ | or | T i−τ −T i | of the period difference, the more stable the pitch period is. In addition, the pitch sharpening coefficient determination unit 118 may determine the pitch sharpening coefficient using the pitch periods of the current frame and the past frame instead of the pitch periods of the current subframe and the past subframe. .

なお、フレームの先頭のサブフレームについては、過去のフレームの最終サブフレームのピッチ周期を利用して差を計算することもできるし、フレームの先頭のサブフレームだけはピッチ周期の差に無関係に固定のシャープニング係数を設定することもできる。一般には、前のフレーム情報が復号装置12では入手できない場合に対応できるよう、過去のフレームに依存しない方法が好ましい。例えば、符号化装置11で符号化した情報をネットワーク等を介して復号装置12に送信し、復号する状況を考える。このとき、符号化装置11からは、フレーム毎に符号化された信号が逐次出力され、ネットワーク等を通して復号装置12に伝送される。復号装置12では、受け取ったフレームの信号を逐次復号するが、途中で通信が切断されたりすると、前のフレームと連続しているかどうかが分からない状況で、途中のフレームから復号処理を再開する状況も想定される。前のフレームの情報を用いずにフレームごとに独立して復号処理ができるようにすることで、このような状況でも復号装置12が入力された信号を正しく復号できる。   For the first subframe of the frame, the difference can be calculated using the pitch period of the last subframe of the past frame, or only the first subframe of the frame is fixed regardless of the difference in pitch period. You can also set the sharpening factor. In general, a method that does not depend on a past frame is preferable so that the case where the previous frame information is not available in the decoding device 12 can be handled. For example, consider a situation in which information encoded by the encoding device 11 is transmitted to the decoding device 12 via a network or the like and decoded. At this time, a signal encoded for each frame is sequentially output from the encoding device 11 and transmitted to the decoding device 12 through a network or the like. The decoding device 12 sequentially decodes the signal of the received frame, but when communication is cut off in the middle, it is not known whether it is continuous with the previous frame, and the decoding process is resumed from the middle frame Is also envisaged. By enabling the decoding process independently for each frame without using the information of the previous frame, the decoding device 12 can correctly decode the input signal even in such a situation.

なお、本発明については、符号化装置11ではフレームの先頭のサブフレームについては過去のフレームの最終サブフレームのピッチ周期を利用して差を計算する構成を採用し、復号装置12側ではフレームの先頭のサブフレームについては過去のフレームの情報を利用せず独立して復号する構成にすることも、原理的には可能である。この場合、符号化装置11が意図した係数(符号化装置で用いたピッチシャープニング係数)とは異なる値が復号装置12で用いられることになるが、これにより出力される最終的な合成波形と正しいピッチシャープニング係数を用いて復号したときの最終的な合成波形との歪みは非常に小さく、この構成でも従来技術よりも高い品質を実現することができる。   As for the present invention, the encoding device 11 employs a configuration in which the difference is calculated using the pitch period of the last subframe of the past frame for the first subframe of the frame, and the decoding device 12 side In principle, the first subframe can be decoded independently without using the information of the past frame. In this case, a value different from the coefficient intended by the encoding device 11 (pitch sharpening coefficient used in the encoding device) is used in the decoding device 12, but the final synthesized waveform output thereby Distortion from the final synthesized waveform when decoding using the correct pitch sharpening coefficient is very small, and even with this configuration, higher quality than the prior art can be realized.

≪周期化処理部114≫
周期化処理部114は、ピッチシャープニング係数決定部118で決定されたピッチシャープニング係数を用いて、固定符号帳113からのパルス系列cf1,cf2,cf3,cf4を適応プリフィルタP(z)に通すことによりピッチの高調波成分が強調されるように補正し、補正後のパルス系列を周期化済みパルス系列として出力する。つまり、固定符号帳113からのパルス系列cfjは以下に従って補正される。

Figure 0006053145
ここで、D+1はパルス系列cfjの次元数である。ここで、Fはj番目(j=1,2,3,4)のサブフレームの基本周期の長さであり、γはピッチシャープニング係数決定部118で決定されたピッチシャープニング係数である。なお、固定符号帳113からのパルス系列cfjが以下に従って補正されてもよい。ただし、以下の例ではピッチシャープニング係数γが0≦γ≦1となる。
Figure 0006053145
<Periodization processing unit 114>
The periodic processing unit 114 uses the pitch sharpening coefficient determined by the pitch sharpening coefficient determination unit 118 to apply the pulse sequences c f1 , c f2 , c f3 , and c f4 from the fixed codebook 113 to the adaptive prefilter P. By passing through (z), correction is performed so that the harmonic component of the pitch is emphasized, and the corrected pulse sequence is output as a periodic pulse sequence. That is, the pulse sequence cfj from the fixed codebook 113 is corrected according to the following.
Figure 0006053145
Here, D j +1 is the number of dimensions of the pulse sequence cfj . Here, F j is the length of the basic period of the j-th (j = 1, 2, 3, 4) subframe, and γ is the pitch sharpening coefficient determined by the pitch sharpening coefficient determination unit 118. . The pulse sequence cfj from the fixed codebook 113 may be corrected according to the following. However, in the following example, the pitch sharpening coefficient γ is 0 ≦ γ ≦ 1.
Figure 0006053145

すなわち、周期化処理部114は、固定符号帳113からのパルス系列cf1,cf2,cf3,cf4に対し、ピッチシャープニング係数決定部118で決定されたピッチシャープニング係数に対応する周期化を行って(ピッチシャープニング係数に対応する度合いの周期化を行って)周期化済みパルス系列を求めて出力する。具体的には、この例の周期化処理部114は、D+1次元のパルス系列(cfj(0),・・・,cfj(D))と、当該パルス系列(cfj(0),・・・,cfj(D))をF(処理対象の時間区間の基本周期Fに対応する長さ分)遅延させて得られるD+1次元の遅延系列(0,・・・,0,cfj(0),・・・,cfj(D−F))とを、ピッチシャープニング係数γに対応する重み係数で重み付け加算して得られる周期化済みパルス系列fjを求めて出力する。なお、遅延系列の先頭の要素からF番目の要素まではすべて0である。 That is, the periodic processing unit 114 performs the period corresponding to the pitch sharpening coefficient determined by the pitch sharpening coefficient determination unit 118 for the pulse sequences c f1 , c f2 , c f3 , and cf 4 from the fixed codebook 113. (Periodicization is performed to a degree corresponding to the pitch sharpening coefficient) to obtain and output a periodical pulse sequence. Specifically, the periodic processing unit 114 of this example includes a D j + 1-dimensional pulse sequence (c fj (0),..., C fj (D j )) and the pulse sequence (c fj (0 ),..., C fj (D j )) are delayed by F j (the length corresponding to the basic period F j of the time interval to be processed), D j + 1-dimensional delay sequence (0,. .., 0, c fj (0),..., C fj (D j −F j )) are weighted and added with a weighting factor corresponding to the pitch sharpening factor γ, ~ Cfj is obtained and output. Note that all elements from the first element of the delay sequence to the F jth element are zero.

このように、周期化処理部114は、固定符号帳113の1つのパルス系列cfjから、適応符号帳112において得られるサブフレームの基本周期の長さFを切り出し、切り出し分をサブフレーム長に達するまで繰り返し配列して得られる周期化済みパルス系列fjを求めて出力する。これを固定符号帳113から出力されるパルス系列の少なくとも一部のパルス系列について行い、周期化済みパルス系列の候補を出力する。なお、周期化しないパルス系列については、γ=0として得られる~cfj(周期化していないパルス系列そのもの)を周期化済みパルス系列の候補として用いてもよい。また、「c」の上付き添え字の「~」は本来「c」の真上に配置されるものであるが、表記上の制約から「~c」と表記する。 As described above, the periodic processing unit 114 cuts out the basic period length F j of the subframe obtained in the adaptive codebook 112 from one pulse sequence cfj of the fixed codebook 113, and subtracts the cut-out portion into the subframe length. To obtain and output a periodical pulse sequence ˜ c fj obtained by repeatedly arranging until reaching f. This is performed for at least a part of the pulse sequences output from the fixed codebook 113, and the candidates for the periodic pulse sequences are output. For a pulse sequence that is not periodic, ~ c fj obtained as γ = 0 (the pulse sequence itself that is not periodic) may be used as a candidate for a periodic pulse sequence. The superscript “~” of “c” is originally placed immediately above “c”, but is expressed as “~ c” due to notation restrictions.

なお、上述の説明では、適応符号帳112において得られる現サブフレームの基本周期の長さFを基準として周期化処理を行う例を示したが、過去のサブフレームの基本周期F(j≠k)や基本周期の定数倍(F/2,F/2,2F,2F等)のように、基本周期と対応した値を基準として周期化処理を行っても良い。なお、基本周期としては、例えば、ピッチ周期の整数部分を用いることができる。 In the above description, the example in which the periodic process is performed based on the basic period length F j of the current subframe obtained in the adaptive codebook 112 has been described, but the basic period F k (j of the past subframe is used. ≠ k) or a constant multiple of the basic period (F j / 2, F k / 2, 2F j , 2F k, etc.), the periodic processing may be performed based on a value corresponding to the basic period. In addition, as a fundamental period, the integer part of a pitch period can be used, for example.

≪周期化済み固定符号帳記憶部115≫
周期化済み固定符号帳記憶部115には、周期化処理部114から出力された周期化済みパルス系列(サンプル列)の候補と、当該周期化済みパルス系列の候補に対応する周期化前の固定符号帳中のパルス系列の候補を特定するための情報(コードインデックス)が格納される。
<< Periodized fixed codebook storage unit 115 >>
In the periodic fixed codebook storage unit 115, a candidate for a periodic pulse sequence (sample sequence) output from the periodic processing unit 114, and a fixed pre-periodic corresponding to the candidate for the periodic pulse sequence. Information (code index) for specifying pulse sequence candidates in the codebook is stored.

≪探索部1162≫
探索部1162は、サブフレームごとに、周期化済み固定符号帳記憶部115を探索し、入力音響信号x(n)(n=0,...,L−1)に対応する周期化済みパルス系列~cf1,~cf2,~cf3,~cf4(周期化済み固定符号帳記憶部115からのサンプル列)と、当該周期化済みパルス系列~cf1,~cf2,~cf3,~cf4に対応するコードインデックスCf1,Cf2,Cf3,Cf4(周期化済みパルス系列~cf1,~cf2,~cf3,~cf4に対応する周期化前の固定符号帳中のパルス系列を特定するためのコードインデックス)と、を得て出力する。
<< Search unit 1162 >>
Search unit 1162 searches periodic fixed codebook storage unit 115 for each subframe, and performs a periodic pulse corresponding to input acoustic signal x (n) (n = 0,..., L−1). The sequence ~ c f1 , ~ c f2 , ~ c f3 , ~ c f4 (sample sequence from the periodic fixed codebook storage unit 115) and the periodic pulse series ~ c f1 , ~ c f2 , ~ c f3 , ~ C f4 corresponding to code indexes C f1 , C f2 , C f3 , C f4 (periodic pulse sequences ~ c f1 , ~ c f2 , ~ c f3 , ~ c f4 , fixed codes before periodization And a code index for specifying the pulse sequence in the book.

言い換えると、第jサブフレーム(j=1,2,3,4)では、探索部1162は、周期化済み固定符号帳記憶部115から得られる複数のサンプル列のうち入力音響信号x(n)(n=Lf(j-1),...,Lf(j)−1)に対応する周期化済みパルス系列~cfjと当該周期化済みパルス系列~cfjに対応するコードインデックスCfjと、を得て出力する。 In other words, in the j-th subframe (j = 1, 2, 3, 4), search section 1162 receives input acoustic signal x (n) from among a plurality of sample sequences obtained from periodic fixed codebook storage section 115. (N = L f (j−1) ,..., L f (j) −1) corresponding to the periodic pulse sequence to c fj and the code index C corresponding to the periodic pulse sequence to c fj fj is obtained and output.

入力音響信号x(n)(n=0,...,L−1)に対応する周期化済みパルス系列~cf1,~cf2,~cf3,~cf4、および当該周期化済みパルス系列~cf1,~cf2,~cf3,~cf4に対応するコードインデックスCf1,Cf2,Cf3,Cf4の探索は、例えば、サブフレームごとに、適応信号成分の各サンプルにピッチ利得を乗算して得られるサンプル列と周期化済み固定符号帳記憶部115から得られる周期化済みパルス系列の候補とにより得られる励振信号の仮信号に線形予測情報LPC infoによって特定される全極型の合成フィルタ117を適用して得られる合成信号と、入力された入力音響信号との差に、聴覚重み付けフィルタ1164を適用した値が最小となるように行われる。 Periodic pulse sequence ~ c f1 , ~ c f2 , ~ c f3 , ~ c f4 corresponding to the input acoustic signal x (n) (n = 0, ..., L-1) and the periodic pulse search of sequence ~ c f1, ~ c f2, ~ c f3, code index corresponding to the ~ c f4 C f1, C f2 , C f3, C f4 , for example, for each sub-frame, each sample of the adaptive signal component All of the provisional signals of the excitation signals obtained by the sample train obtained by multiplying the pitch gain and the periodic pulse sequence candidates obtained from the periodic fixed codebook storage unit 115 are specified by the linear prediction information LPC info. This is performed so that the value obtained by applying the perceptual weighting filter 1164 to the difference between the synthesized signal obtained by applying the polar synthesis filter 117 and the input acoustic signal is minimized.

≪利得量子化部1164≫
利得量子化部1164には、ピッチ符号CT,CT,CT,CT、およびコードインデックスCf1,Cf2,Cf3,Cf4が入力される。利得量子化部1164は、これらを用いてベクトル量子化を行い、サブフレームごとに、量子化されたピッチ利得と量子化された固定符号帳利得との組に対応する符号を得て出力する。以下では、量子化されたピッチ利得を「量子化済ピッチ利得」と表現し、量子化された固定符号帳利得を「量子化済固定符号帳利得」と表現する。また量子化済ピッチ利得gp1^と量子化済固定符号帳利得gc1^の組に対応する符号、量子化済ピッチ利得gp2^と量子化済固定符号帳利得gc2^の組に対応する符号、量子化済ピッチ利得gp3^と量子化済固定符号帳利得gc3^の組に対応する符号、量子化済ピッチ利得gp4^と量子化済固定符号帳利得gc4^の組に対応する符号を「利得符号GAf1,GAf2,GAf3,GAf4」と表現する。すなわち、利得量子化部1164は、第1から第4のサブフレームのそれぞれ(第jサブフレーム)について、ピッチ利得gpjと固定符号帳利得gcjの組をベクトル量子化し、量子化済ピッチ利得gpj^と量子化済固定符号帳利得gcj^の組を特定する利得符号GAfjを得て出力する。
<< Gain quantization unit 1164 >>
Pitch codes CT 1 , CT 2 , CT 3 , CT 4 and code indexes C f1 , C f2 , C f3 , C f4 are input to gain quantization section 1164. Gain quantization section 1164 performs vector quantization using these, and obtains and outputs a code corresponding to a set of quantized pitch gain and quantized fixed codebook gain for each subframe. Hereinafter, the quantized pitch gain is expressed as “quantized pitch gain”, and the quantized fixed codebook gain is expressed as “quantized fixed codebook gain”. Also, a code corresponding to a set of quantized pitch gain g p1 ^ and quantized fixed codebook gain g c1 ^, and a set of quantized pitch gain g p2 ^ and quantized fixed codebook gain g c2 ^ A set corresponding to a set of code, quantized pitch gain g p3 ^ and quantized fixed codebook gain g c3 ^, a set of quantized pitch gain g p4 ^ and quantized fixed codebook gain g c4 ^ The codes corresponding to are expressed as “gain codes GA f1 , GA f2 , GA f3 , GA f4 ”. That is, gain quantization section 1164 vector-quantizes a set of pitch gain g pj and fixed codebook gain g cj for each of the first to fourth subframes (jth subframe), and obtains a quantized pitch gain. Gain code GA fj specifying a set of g pj ^ and quantized fixed codebook gain g cj ^ is obtained and output.

このようなベクトル量子化には、例えば、量子化済ピッチ利得と量子化済固定符号帳利得との組に対応する利得符号を特定するためのテーブルである利得符号帳が用いられる。利得符号帳の例は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスとの組が複数個格納されたテーブルである。なお、量子化済ピッチ利得に代えて量子化済ピッチ利得の関数値をベクトル量子化の対象としてもよいし、量子化済固定符号帳利得に代えて量子化済固定符号帳利得の関数値をベクトル量子化の対象としてもよいが、以下では量子化済ピッチ利得そのものと量子化済固定符号帳利得そのものをベクトル量子化の対象とする例について説明する。   For such vector quantization, for example, a gain codebook which is a table for specifying a gain code corresponding to a set of a quantized pitch gain and a quantized fixed codebook gain is used. An example of the gain codebook is a table in which a plurality of sets of quantized pitch gain candidates, quantized fixed codebook gain candidates, and indexes are stored. Note that the function value of the quantized pitch gain may be the target of vector quantization instead of the quantized pitch gain, or the function value of the quantized fixed codebook gain may be used instead of the quantized fixed codebook gain. Although it may be a target of vector quantization, an example in which the quantized pitch gain itself and the quantized fixed codebook gain itself are targets of vector quantization will be described below.

量子化済固定符号帳利得の関数値の一例は、過去または現在のサブフレーム(又はフレーム)での周期化済み固定符号帳記憶部115からの信号成分のエネルギーを基に予測された現在のサブフレーム(又はフレーム)での固定符号帳利得の推定値と、現在のサブフレーム(又はフレーム)での固定符号帳利得との比を表す補正係数(correction factor)などである。補正係数の例は、非特許文献1の「5.8.2 Quantization of codebook gains」の欄に記載されたγgcである。例えば、j(j=1,...,4)番目のサブフレームでの量子化済固定符号帳利得gcj^、補正係数γgcの量子化値γgc^、j(j=1,...,4)番目のサブフレームでの固定符号帳利得の推定値の量子化値pgcj^の間には、以下の関係が成り立つ。
gcj^=γgc^×pgcj^
An example of the function value of the quantized fixed codebook gain is the current sub-number predicted based on the energy of the signal component from the periodic fixed codebook storage unit 115 in the past or current sub-frame (or frame). For example, a correction factor indicating a ratio between the estimated value of the fixed codebook gain in the frame (or frame) and the fixed codebook gain in the current subframe (or frame). An example of the correction coefficient is γ gc described in “5.8.2 Quantization of codebook gains” in Non-Patent Document 1. For example, the quantized fixed codebook gain g cj ^ in the j (j = 1,..., 4) th subframe, the quantized value γ gc ^ of the correction coefficient γ gc , j (j = 1,. .., 4) The following relationship holds between the quantized values pg cj ^ of the estimated value of the fixed codebook gain in the fourth subframe.
g cj ^ = γ gc ^ × pg cj ^

<利得量子化部1164が行うベクトル量子化>
本発明の利得量子化部1164が行うベクトル量子化では、利得符号帳のインデックスとして可変長符号が割り当てられる。インデックスの選択は、例えば、従来技術と同じく符号化歪み(以下「歪み」という)を最小とする基準に基づいてなされる。つまり、利得量子化部1164は、入力されたピッチ周期Tまたはピッチ符号CTと、周期化済みパルス系列~cfjまたはコードインデックスCfjと、に対して、利得符号帳に格納された複数個の符号帳インデックスのうちの何れか1つを選択し、それを利得符号とする。
<Vector Quantization Performed by Gain Quantization Unit 1164>
In vector quantization performed by the gain quantization section 1164 of the present invention, a variable length code is assigned as an index of the gain codebook. The index is selected based on, for example, a standard that minimizes coding distortion (hereinafter referred to as “distortion”), as in the prior art. That is, gain quantization section 1164 performs a plurality of input pitch periods T j or pitch codes CT j and periodic pulse sequences to c fj or code indexes C fj stored in the gain codebook. Any one of the codebook indexes is selected and used as a gain code.

利得符号帳から符号帳インデックスを探す方法は、従来技術と同じでよい。例えば、利得量子化部1164は、N個(Nは所定の正整数)のサンプル点からなるサブフレーム(時間区間)ごとに、周期化済み固定符号帳記憶部115からの周期化済みパルス系列(周期化済みサンプル列)を合成フィルタ117に通して得られるサンプル列Zのそれぞれのサンプルに、量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、過去の励振信号を合成フィルタ117に通して得られるサンプル列Yのそれぞれのサンプルに、量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みを指標値Dとし、指標値Dが最も小さくなるインデックスを、利得符号として得て出力する。なお、合成フィルタ117に通してサンプル列Zを得るための「周期化済み固定符号帳記憶部からの周期化済みパルス系列」は、利得量子化部1164に入力されたコードインデックスに対応し、合成フィルタ117に通してサンプル列Yを得るための「過去の励振信号」は、利得量子化部1164に入力されたピッチ符号に対応するピッチ周期に対応するサンプル数だけ過去の励振信号である。各指標値Dに対応する量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補と符号帳インデックスとの組は、それぞれ、選択された利得符号帳に格納された量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補と符号帳インデックスとの組の何れかである。サンプル列Zに含まれるサンプルの個数、サンプル列Yに含まれるサンプルの個数、および合成信号サンプル列αY+βZに含まれるサンプルの個数は、すべてN個である。合成フィルタ117は、あるサンプル点nのサンプルυ(n)を、そのサンプル点nよりも過去のP個のサンプル点n−1,n−2,...,n−Pのサンプルχ(n−1),χ(n−2),...,χ(n−P)に線形予測係数a(n−1),a(n−2),...,a(n−P)を乗算した値a(n−1)×χ(n−1),a(n−2)×χ(n−2),...,a(n−P)×χ(n−P)の和で表す線形FIR(Finite Impulse Response)フィルタである。なお、Pは正の整数である予測次数である。以下に合成フィルタ117を表す。
υ(n)=a(1)×χ(n-1)+a(2)×χ(n-2)+...+a(P)×χ(n-P)
The method for searching the codebook index from the gain codebook may be the same as that of the conventional technique. For example, the gain quantization unit 1164 performs the periodic pulse sequence (from the periodic fixed codebook storage unit 115) for each subframe (time interval) including N (N is a predetermined positive integer) sample points. The sample sequence βZ obtained by multiplying each sample of the sample sequence Z obtained by passing the periodic sample sequence) through the synthesis filter 117 and the quantized fixed codebook gain candidate β, and the past excitation signal A synthesized signal sample obtained by adding each sample of the sample sequence Y obtained through the synthesis filter 117 to the sample sequence αY obtained by multiplying the quantized pitch gain candidate α by each corresponding sample. The distortion between the column αY + βZ and the input acoustic signal X is set as an index value D, and an index having the smallest index value D is obtained and output as a gain code. The “periodic pulse sequence from the periodic fixed codebook storage unit” for obtaining the sample sequence Z through the synthesis filter 117 corresponds to the code index input to the gain quantization unit 1164 and is synthesized. The “past excitation signal” for obtaining the sample string Y through the filter 117 is the past excitation signal by the number of samples corresponding to the pitch period corresponding to the pitch code input to the gain quantization unit 1164. A set of a quantized pitch gain candidate, a quantized fixed codebook gain candidate and a codebook index corresponding to each index value D is respectively a quantized pitch gain stored in the selected gain codebook. Or a quantized fixed codebook gain candidate and a codebook index. The number of samples included in the sample sequence Z, the number of samples included in the sample sequence Y, and the number of samples included in the combined signal sample sequence αY + βZ are all N. The synthesis filter 117 converts a sample ν (n) at a certain sample point n into samples χ (n) of P sample points n−1, n−2,..., NP past the sample point n. −1), χ (n−2),..., Χ (n−P) with linear prediction coefficients a (n−1), a (n−2),. Sum of multiplied values a (n−1) × χ (n−1), a (n−2) × χ (n−2),..., A (n−P) × χ (n−P) Is a linear FIR (Finite Impulse Response) filter. Note that P is a predicted order which is a positive integer. The synthesis filter 117 is shown below.
υ (n) = a (1) × χ (n-1) + a (2) × χ (n-2) + ... + a (P) × χ (nP)

例えば、サンプル列Aを合成フィルタ117に通してサンプル列Cが得られる場合、サンプル列Aに含まれるサンプルがχ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部となり、υ(n)がサンプル列Cのサンプル点nでのサンプルとなる。χ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部がサンプル列Aよりも過去のサンプル点に対応する場合、例えば、当該χ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部はサンプル列Aより過去のサンプル列に含まれるサンプルとされる。あるいは、サンプル列Aよりも過去のサンプル列が存在しない場合、当該当該χ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部は0などの定数とされる。   For example, when the sample string A is obtained by passing the sample string A through the synthesis filter 117, the samples included in the sample string A are χ (n−1), χ (n−2),. P) is at least a part, and ν (n) is a sample at the sample point n of the sample sequence C. When at least part of χ (n−1), χ (n−2),..., χ (n−P) corresponds to a sample point in the past of the sample sequence A, for example, χ (n− 1), χ (n−2),..., Χ (n−P) are at least a part of samples included in the sample sequence before the sample sequence A. Alternatively, when there is no sample sequence that is past the sample sequence A, at least a part of the χ (n−1), χ (n−2),. It is assumed to be a constant.

以下に指標値Dの具体例を示す。
サブフレームがN個のサンプル点S,...,S+N−1(Sは0以上の整数)からなり、サブフレームに属する入力音響信号XをベクトルX=(x(S),...,x(S+N−1))と表現し、サンプル列ZをベクトルZ=(z(S),...,z(S+N−1))と表現し、サンプル列YをベクトルY=(y(S),...,y(S+N−1))と表現し、サンプル列αY+βZと入力音響信号Xとの二乗誤差を指標値D(歪み)と定義すると、指標値Dは以下のように表される。ただし、σはσの転置を表す。

Figure 0006053145
Specific examples of the index value D are shown below.
A subframe is composed of N sampling points S,..., S + N−1 (S is an integer of 0 or more), and an input acoustic signal X belonging to the subframe is represented by a vector X = (x (S),. x (S + N−1)), the sample sequence Z is expressed as a vector Z = (z (S),..., z (S + N−1)), and the sample sequence Y is expressed as a vector Y = (y (S ),..., Y (S + N-1)), and a square error between the sample sequence αY + βZ and the input acoustic signal X is defined as an index value D (distortion), the index value D is expressed as follows: The However, σ T represents transposition of σ.
Figure 0006053145

例えば、前述した1フレームが4個のサブフレームに等区分される例の場合、第jサブフレーム(j=1,...,4)は、N=Lf(j)−Lf(j−1)個のサンプル点Lf(j−1),...,Lf(j)−1からなる。ここで、第jサブフレームでの入力音響信号XをベクトルX=(x(Lf(j−1)),...,x(Lf(j)−1))と表現する。また、第jサブフレームでの周期化済み固定符号帳記憶部115からの周期化済みパルス系列~cfj=(~cfj(Lf(j−1)),...,~cfj(Lf(j)−1))を合成フィルタ117に通して得られるサンプル列ZをZ=(z(Lf(j−1)),...,z(Lf(j)−1))と表現する。さらに、第jサブフレームでの適応信号成分(過去の励振信号)v(Lf(j−1)),...,v(Lf(j)−1)を合成フィルタ117に通して得られるサンプル列YをベクトルY=(y(Lf(j−1)),...,y(Lf(j)−1))と表現する。すると、第jサブフレームでの指標値Dは以下のように表される。

Figure 0006053145
ここでは、上述の指標値Dが最小となる量子化済ピッチ利得と量子化済固定符号帳利得を選択する例を示したが、他の尺度による歪みや別の方法を用いて量子化済ピッチ利得と量子化済固定符号帳利得を決定する構成としてもよい(<利得量子化部1164が行うベクトル量子化>の説明終わり)。 For example, in the example in which one frame described above is equally divided into four subframes, the jth subframe (j = 1,..., 4) is represented by N = L f (j) −L f (j -1) It consists of L sample points Lf (j-1) , ..., Lf (j) -1. Here, the input acoustic signal X in the j-th subframe is expressed as a vector X j = (x (L f (j−1) ),..., X (L f (j) −1)). Also, the periodic pulse sequence from the periodic fixed codebook storage unit 115 in the j-th subframe ~ c fj = (~ c fj (L f (j-1) ), ..., ~ c fj ( L f (j) -1)) is passed through the synthesis filter 117, and the sample sequence Z is obtained as Z j = (z (L f (j-1) ), ..., z (L f (j) -1 )). Further, the adaptive signal component (past excitation signal) v (L f (j−1) ),..., V (L f (j) −1) in the j-th subframe is obtained through the synthesis filter 117. The sample string Y to be obtained is expressed as a vector Y = (y (L f (j−1) ),..., Y (L f (j) −1)). Then, the index value D in the j-th subframe is expressed as follows.
Figure 0006053145
Here, an example in which the quantized pitch gain and the quantized fixed codebook gain at which the index value D is the minimum is shown, but the quantized pitch is obtained using distortion based on another scale or another method. The gain and the quantized fixed codebook gain may be determined (end of <vector quantization performed by the gain quantization unit 1164>).

≪適応符号帳112の記憶内容の更新≫
適応符号帳112は、利得量子化部1164で各サブフレームでの利得符号GAf1,GAf2,GAf3,GAf4が得られると、コードインデックスCf1,Cf2,Cf3,Cf4に対応する周期化済みパルス系列~cf1,~cf2,~cf3,~cf4(周期化済み固定符号帳記憶部115からのサンプル列)の各サンプルに量子化済固定符号帳利得gc1^,gc2^,gc3^,gc4^を乗算して得られるサンプル列と、サブフレームごとにピッチ周期T,T,T,Tに対応するサンプル数だけ過去の励振信号である適応信号成分v(n)(n=0,...,L−1)の各サンプルに量子化済ピッチ利得gp1^,gp2^,gp3^,gp4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u'(n)(n=0,...,L−1)を得て、適応符号帳112内に記憶する。
u'(n)=gp1^×v(n)+gc1^×~cf1(n)(n=Lf(0),...,Lf(1)-1)
u'(n)=gp2^×v(n)+gc2^×~cf2(n)(n=Lf(1),...,Lf(2)-1)
u'(n)=gp3^×v(n)+gc3^×~cf3(n)(n=Lf(2),...,Lf(3)-1)
u'(n)=gp4^×v(n)+gc4^×~cf4(n)(n=Lf(3),...,Lf(4)-1)
≪Update of stored contents of adaptive codebook 112≫
The adaptive codebook 112 corresponds to the code indexes C f1 , C f2 , C f3 , and C f4 when the gain code GA f1 , GA f2 , GA f3 , and GA f4 are obtained by the gain quantization unit 1164. Quantized fixed codebook gain g c1 ^ for each sample of the cycled pulse series ~ c f1 , ~ c f2 , ~ c f3 , ~ c f4 (sample sequence from the periodic fixed codebook storage unit 115) , G c2 ,, g c3 ,, g c4 乗 算 , and past excitation signals for the number of samples corresponding to the pitch periods T 1 , T 2 , T 3 , T 4 for each subframe. Obtained by multiplying each sample of a certain adaptive signal component v (n) (n = 0,..., L−1) by quantized pitch gains g p1 ^, g p2 ^, g p3 ^, g p4 ^ Corresponding sample columns The following excitation signal u ′ (n) (n = 0,..., L−1) added for each sample is obtained and stored in the adaptive codebook 112.
u '(n) = g p1 ^ × v (n) + g c1 ^ × ~ c f1 (n) (n = L f (0) , ..., L f (1) -1)
u '(n) = g p2 ^ × v (n) + g c2 ^ × ~ c f2 (n) (n = L f (1) , ..., L f (2) -1)
u '(n) = g p3 ^ × v (n) + g c3 ^ × ~ c f3 (n) (n = L f (2) , ..., L f (3) -1)
u '(n) = g p4 ^ × v (n) + g c4 ^ × ~ c f4 (n) (n = L f (3) , ..., L f (4) -1)

≪パラメータ符号化部119≫
また、線形予測情報LPC info、ピッチ周期符号CT,CT,CT,CT、コードインデックスCf1,Cf2,Cf3,Cf4、および利得符号GAf1,GAf2,GAf3,GAf4を含む「励振パラメータ」がパラメータ符号化部119に入力される。パラメータ符号化部119は、励振パラメータに対応する符号であるビットストリームBS(符号)を生成して出力する。
<< Parameter Encoding Unit 119 >>
Also, linear prediction information LPC info, pitch period codes CT 1 , CT 2 , CT 3 , CT 4 , code indexes C f1 , C f2 , C f3 , C f4 , and gain codes GA f1 , GA f2 , GA f3 , GA The “excitation parameter” including f4 is input to the parameter encoding unit 119. The parameter encoding unit 119 generates and outputs a bit stream BS (code) that is a code corresponding to the excitation parameter.

<復号装置12>
符号化装置11(図1)のパラメータ符号化部119から出力されたビットストリームBSは、入力符号として復号装置12(図2)のパラメータ復号部129に入力される。
<Decoding device 12>
The bit stream BS output from the parameter encoding unit 119 of the encoding device 11 (FIG. 1) is input as an input code to the parameter decoding unit 129 of the decoding device 12 (FIG. 2).

≪パラメータ復号部129≫
パラメータ復号部129は、図2に示すように、例えば、パラメータ復号部129a、ピッチ符号復号部129b、および利得符号復号部129cを含む。
<< Parameter Decoding Unit 129 >>
As illustrated in FIG. 2, the parameter decoding unit 129 includes, for example, a parameter decoding unit 129a, a pitch code decoding unit 129b, and a gain code decoding unit 129c.

≪パラメータ復号部129a≫
パラメータ復号部129aは、ビットストリームBSを入力とし、ビットストリームBSに含まれる線形予測情報LPC info、ピッチ符号CT,CT,CT,CT、コードインデックスCf1,Cf2,Cf3,Cf4、および利得符号GAf1,GAf2,GAf3,GAf4を得る。得られたLPC infoは合成フィルタ127に入力される。また、ピッチ符号CT,CT,CT,CTはピッチ符号復号部129bに入力される。コードインデックスCf1,Cf2,Cf3,Cf4は選択部125に入力される。利得符号GAf1,GAf2,GAf3,GAf4は、利得符号復号部129cに入力される。
<< Parameter Decoding Unit 129a >>
The parameter decoding unit 129a receives the bit stream BS, receives linear prediction information LPC info included in the bit stream BS, pitch codes CT 1 , CT 2 , CT 3 , CT 4 , code indexes C f1 , C f2 , C f3 , C f4 and gain codes GA f1 , GA f2 , GA f3 , GA f4 are obtained. The obtained LPC info is input to the synthesis filter 127. The pitch codes CT 1 , CT 2 , CT 3 , and CT 4 are input to the pitch code decoding unit 129b. The code indexes C f1 , C f2 , C f3 , and C f4 are input to the selection unit 125. The gain codes GA f1 , GA f2 , GA f3 , and GA f4 are input to the gain code decoding unit 129c.

≪ピッチ符号復号部129b≫
ピッチ符号復号部129bは、得られたピッチ符号(周期性成分符号)CT,CT,CT,CTを復号し、復号ピッチ周期T’,T’,T’,T’を出力する。復号ピッチ周期T’,T’,T’,T’は、適応符号帳122およびピッチシャープニング係数決定部128に入力される。
<< Pitch Code Decoding Unit 129b >>
The pitch code decoding unit 129b decodes the obtained pitch codes (periodic component codes) CT 1 , CT 2 , CT 3 , CT 4 and decodes pitch pitches T 1 ′, T 2 ′, T 3 ′, T 4. 'Is output. Decoding pitch periods T 1 ′, T 2 ′, T 3 ′, T 4 ′ are input to adaptive codebook 122 and pitch sharpening coefficient determination unit 128.

≪利得符号復号部129c≫
利得符号復号部129cは、入力された利得符号GAf1,GAf2,GAf3,GAf4を復号し、復号ピッチ利得gp1^,gp2^,gp3^,gp4^および復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を得て出力する。具体的には、利得符号復号部129cは、例えば、符号化装置11の利得量子化部1164が備えるのと同一の利得符号帳を備える。利得符号復号部129cは、利得符号帳を参照し、入力された利得符号(現在のサブフレームに対応する利得符号)に対応する量子化済ピッチ利得と量子化済固定符号帳利得を復号ピッチ利得gpj^および復号固定符号帳利得gcj^として出力する。
<< Gain Code Decoding Unit 129c >>
The gain code decoding unit 129c decodes the input gain codes GA f1 , GA f2 , GA f3 , GA f4 , and decodes pitch gains g p1 ^, g p2 ^, g p3 ^, g p4 ^ and the decoding fixed codebook Gain gc1 ^, gc2 ^, gc3 ^, gc4 ^ are obtained and output. Specifically, the gain code decoding unit 129c includes, for example, the same gain codebook as that included in the gain quantization unit 1164 of the encoding device 11. The gain code decoding unit 129c refers to the gain codebook and decodes the quantized pitch gain and the quantized fixed codebook gain corresponding to the input gain code (gain code corresponding to the current subframe). Output as g pj ^ and decoded fixed codebook gain g cj ^.

≪選択部125≫
選択部125には、コードインデックスCf1,Cf2,Cf3,Cf4が入力される。選択部125は、入力されたコードインデックスCf1,Cf2,Cf3,Cf4を用い、固定符号帳123に基づき、サブフレームごとに、コードインデックスCf1,Cf2,Cf3,Cf4を復号してパルス系列cf1,cf2,cf3,cf4を得て出力する。固定符号帳123は、符号化装置11が備える固定符号帳113と同一である。
≪Selection unit 125≫
Code indexes C f1 , C f2 , C f3 , and C f4 are input to the selection unit 125. Selection unit 125, using the code index C f1, C f2, C f3 , C f4 entered, based on the fixed codebook 123 for each subframe, the code index C f1, C f2, C f3 , C f4 Decoding is performed to obtain and output pulse sequences c f1 , c f2 , c f3 , and cf 4 . The fixed codebook 123 is the same as the fixed codebook 113 provided in the encoding device 11.

≪ピッチシャープニング係数決定部128≫
ピッチシャープニング係数決定部128は、符号化装置11のピッチシャープニング係数決定部118と同様の処理により、ピッチシャープニング係数の値を決定する。つまり、ピッチシャープニング係数決定部128は、符号化装置11で用いたものと同じ対応表、もしくは関数を用いてピッチシャープニング係数の値を決定する。ただし、ピッチ周期としては、復号装置12で得た復号ピッチ周期を用いる。その他は、ピッチシャープニング係数決定部118と同じである。
≪Pitch sharpening coefficient determination unit 128≫
The pitch sharpening coefficient determination unit 128 determines the value of the pitch sharpening coefficient by the same processing as the pitch sharpening coefficient determination unit 118 of the encoding device 11. That is, the pitch sharpening coefficient determination unit 128 determines the value of the pitch sharpening coefficient using the same correspondence table or function as that used in the encoding device 11. However, a decoding pitch period obtained by the decoding device 12 is used as the pitch period. Others are the same as the pitch sharpening coefficient determination unit 118.

≪周期化処理部124≫
周期化処理部124は、符号化装置11の周期化処理部114と同様の処理により、固定符号帳123からのパルス系列cf1,cf2,cf3,cf4を周期化した周期化済みパルス系列~c’f1,~c’f2,~c’f3,~c’f4を出力する。ただし、ピッチシャープニング係数としては、ピッチシャープニング係数決定部128で決定されたピッチシャープニング係数を用いる。なお、周期化の基準としては、符号化装置11で用いたものと同じ基準を用いるものとする。つまり、符号化装置11において現サブフレームのパルス周期Tの2倍の周期(2T)で周期化処理をした場合(2F=2Tで周期化処理をした場合)は、復号化装置12においても、ピッチ符号復号部129bで得られた復号ピッチ周期T’の2倍の周期(2T’)で周期化処理を行うものとする。
<Periodization processing unit 124>
The periodic processing unit 124 performs periodic pulses obtained by periodicizing the pulse sequences c f1 , c f2 , c f3 , and c f4 from the fixed codebook 123 by the same processing as the periodic processing unit 114 of the encoding device 11. sequence ~ c 'f1, ~ c' f2, ~ c 'f3, ~ c' and outputs the f4. However, the pitch sharpening coefficient determined by the pitch sharpening coefficient determination unit 128 is used as the pitch sharpening coefficient. It should be noted that the same standard as that used in the encoding device 11 is used as the standard for the period. That is, when the encoding device 11 performs a periodic process with a period (2T j ) that is twice the pulse period T j of the current subframe (when the periodic process is performed with 2F j = 2T j ), the decoding apparatus 12, the periodic processing is performed at a cycle (2T j ′) that is twice the decoding pitch cycle T j ′ obtained by the pitch code decoding unit 129b.

≪適応符号帳122≫
適応符号帳122は、入力された復号ピッチ周期T’,T’,T’,T’で特定される適応信号成分v’(n)(n=0,...,L−1)を出力する。
≪Adaptive codebook 122≫
The adaptive codebook 122 receives the adaptive signal component v ′ (n) (n = 0,..., L−) specified by the inputted decoding pitch periods T 1 ′, T 2 ′, T 3 ′, T 4 ′. 1) is output.

周期化処理部124から出力された周期化済みパルス系列~c’f1,~c’f2,~c’f3,~c’f4に復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を乗算して得られるサンプル列と、適応信号成分v’(n)(n=0,...,L−1)に復号ピッチ利得gp1^,gp2^,gp3^,gp4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u’(n)(n=0,...,L−1)が、適応符号帳122に追加される。
u'(n)=gp1^×v'(n)+gc1^×~c’f1(n)(n=Lf(0),...,Lf(1)-1)
u'(n)=gp2^×v'(n)+gc2^×~c’f2(n)(n=Lf(1),...,Lf(2)-1)
u'(n)=gp3^×v'(n)+gc3^×~c’f3(n)(n=Lf(2),...,Lf(3)-1)
u'(n)=gp4^×v'(n)+gc4^×~c’f4(n)(n=Lf(3),...,Lf(4)-1)
Period processing unit has been cycled output from 124 pulse sequence ~ c 'f1, ~ c' f2, ~ c 'f3, ~ c' f4 to decode the fixed codebook gain g c1 ^, g c2 ^, g c3 ^ , G c4 ^ and the sample signal sequence and the adaptive signal component v ′ (n) (n = 0,..., L−1) to the decoding pitch gains g p1 ^, g p2 ^, g p3 ^ , G p4 ^ and the following excitation signal u ′ (n) (n = 0,..., L−1) obtained by adding the sample sequence for each corresponding sample is an adaptive code. Added to the book 122.
u '(n) = g p1 ^ × v' (n) + g c1 ^ × ~ c ' f1 (n) (n = L f (0) , ..., L f (1) -1)
u '(n) = g p2 ^ × v' (n) + g c2 ^ × ~ c ' f2 (n) (n = L f (1) , ..., L f (2) -1)
u '(n) = g p3 ^ × v' (n) + g c3 ^ × ~ c ' f3 (n) (n = L f (2) , ..., L f (3) -1)
u '(n) = g p4 ^ × v' (n) + g c4 ^ × ~ c ' f4 (n) (n = L f (3) , ..., L f (4) -1)

≪合成フィルタ127≫
励振信号u’(n)(n=0,...,L−1)に、線形予測情報LPC infoによって特定される全極型の合成フィルタ127が適用され、それによって生成された合成信号x’(n)(n=0,...,L−1)が出力される。
<< Synthesis Filter 127 >>
An all-pole synthesis filter 127 specified by the linear prediction information LPC info is applied to the excitation signal u ′ (n) (n = 0,..., L−1), and the synthesized signal x generated thereby. '(N) (n = 0,..., L−1) is output.

[第二実施形態]
<構成>
図1に例示するように、第二実施形態の符号化装置21は、ピッチシャープニング係数決定部118に代えてピッチシャープニング係数決定部218を備え、ピッチシャープニング係数決定部218において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置11と同じである。
[Second Embodiment]
<Configuration>
As illustrated in FIG. 1, the encoding device 21 of the second embodiment includes a pitch sharpening coefficient determination unit 218 instead of the pitch sharpening coefficient determination unit 118, and in the pitch sharpening coefficient determination unit 218, the first The encoding apparatus 11 is the same as the encoding apparatus 11 of the first embodiment except that a process for determining a pitch sharpening coefficient is performed based on a different standard from the embodiment.

図2に例示するように、第二実施形態の復号装置22は、ピッチシャープニング係数決定部128に代えてピッチシャープニング係数決定部228を備え、ピッチシャープニング係数決定部228において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の復号装置12と同じである。   As illustrated in FIG. 2, the decoding device 22 of the second embodiment includes a pitch sharpening coefficient determination unit 228 instead of the pitch sharpening coefficient determination unit 128, and the pitch sharpening coefficient determination unit 228 performs the first implementation. This is the same as the decoding device 12 of the first embodiment, except that the process for determining the pitch sharpening coefficient is performed on a basis different from the form.

<符号化>
ピッチシャープニング係数決定部218の処理以外は、第一実施形態の符号化装置11と同じである。
<Encoding>
Except for the processing of the pitch sharpening coefficient determination unit 218, the processing is the same as that of the encoding device 11 of the first embodiment.

≪ピッチシャープニング係数決定部218≫
ピッチシャープニング係数決定部218は、現在のサブフレームの音声波形の振幅が大きい時のピッチシャープニング係数が、振幅が小さい時のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数の値を決定する。音声波形の振幅が大きい時は、入力音響信号の周期性が高く、周期化処理による品質向上効果が高くなることが期待される。音声波形の振幅が大きいか否かは、例えば、現在のサブフレームのピッチ周期と過去のサブフレームのピッチ周期との差の符号、すなわち、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも大きいか否かを用いて判断することができる。差の極性(正負の符号)が負(T−Ti−τ<0)の場合は、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも小さい、すなわち、ピッチ周期が次第に短くなることを示す。差の正負符号が正の場合(T−Ti−τ>0)は、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも大きい、すなわち、ピッチ周期が次第に長くなることを示す。ピッチ周期が次第に短くなるときは音声が高くなる時であり、音声波形の振幅もやや大きくなる傾向にある。反対に次第に長くなるときは音声が低くなる時であるので、音声波形の振幅も小さくなる場合が多い。この現象を反映して、ピッチシャープニング係数決定部は218、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期より短い場合のピッチシャープニング係数が、長い場合のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数の値を決定する。これにより、歪が小さくなり、品質の向上が期待できる。このようなピッチシャープニング係数の決定は、上記の関係を維持するように、予め取りうるピッチ周期の差に対応する値(もしくはその範囲)と、或るサブフレーム(例えば現在のサブフレーム)のピッチ周期の長さとそれよりも過去のサブフレームのピッチ周期の長さとの差に対応するピッチシャープニング係数との値を対応付けた対応表を用いて決定することができる。対応表の例を以下に示す。

Figure 0006053145
あるいは、ピッチシャープニング係数決定部218は、予め定めたピッチ周期の差に対応する値、および、或るサブフレームのピッチ周期の長さとそれよりも過去のサブフレームのピッチ周期の長さとの差に対応する値を引数としてピッチシャープニング係数を得る関数を用い、上記の関係を維持するピッチシャープニング係数を決定してもよい。 << Pitch Sharpening Factor Determination Unit 218 >>
The pitch sharpening coefficient determination unit 218 sets the value of the pitch sharpening coefficient so that the pitch sharpening coefficient when the amplitude of the speech waveform of the current subframe is large is not smaller than the pitch sharpening coefficient when the amplitude is small. To decide. When the amplitude of the speech waveform is large, the periodicity of the input acoustic signal is high, and it is expected that the quality improvement effect by the periodic processing will be high. Whether the amplitude of the speech waveform is large is, for example, the sign of the difference between the pitch period of the current subframe and the pitch period of the past subframe, that is, the pitch period of the current subframe is the pitch of the past subframe. Judgment can be made using whether or not the period is greater. If the polarity of the difference (positive or negative sign) is negative (T i −T i−τ <0), the pitch period of the current subframe is smaller than the pitch period of the past subframe, that is, the pitch period gradually increases. Indicates shortening. If the sign of the difference is positive (T i −T i−τ > 0), it means that the pitch period of the current subframe is larger than the pitch period of the past subframe, that is, the pitch period becomes gradually longer. Show. When the pitch period is gradually shortened, the voice becomes high, and the amplitude of the voice waveform tends to be slightly increased. On the contrary, since the time when the sound gradually becomes longer is when the sound becomes lower, the amplitude of the sound waveform is often reduced. Reflecting this phenomenon, the pitch sharpening coefficient determination unit 218 determines that the pitch sharpening coefficient when the current subframe pitch period is shorter than the past subframe pitch period is longer than the pitch sharpening coefficient when it is long. The value of the pitch sharpening coefficient is determined so as not to decrease. Thereby, distortion becomes small and improvement in quality can be expected. The pitch sharpening coefficient is determined by a value (or a range thereof) corresponding to a difference in pitch period that can be taken in advance and a certain subframe (for example, the current subframe) so as to maintain the above relationship. It can be determined using a correspondence table in which values of pitch sharpening coefficients corresponding to differences between pitch period lengths and pitch period lengths of past subframes are associated with each other. An example of the correspondence table is shown below.
Figure 0006053145
Alternatively, the pitch sharpening coefficient determination unit 218 determines a value corresponding to a predetermined pitch period difference and a difference between a pitch period length of a certain subframe and a pitch period length of a past subframe. A pitch sharpening coefficient that maintains the above relationship may be determined using a function that obtains a pitch sharpening coefficient using a value corresponding to as an argument.

<復号>
第二実施形態の復号装置22におけるピッチシャープニング係数決定部228は、第二実施形態の符号化装置21のピッチシャープニング係数決定部218と同じ基準(関数値、もしくは、対応表)を用いて、ピッチシャープニング係数を決定する。ただし、ピッチ周期としては、復号装置22で得た復号ピッチ周期を用いる。その他は、第一実施形態と同じである。
<Decryption>
The pitch sharpening coefficient determination unit 228 in the decoding device 22 of the second embodiment uses the same standard (function value or correspondence table) as the pitch sharpening coefficient determination unit 218 of the encoding device 21 of the second embodiment. Determine the pitch sharpening factor. However, a decoding pitch period obtained by the decoding device 22 is used as the pitch period. Others are the same as the first embodiment.

[第三実施形態]
<構成>
図1に例示するように、第三実施形態の符号化装置31は、ピッチシャープニング係数決定部118に代えてピッチシャープニング係数決定部318を備え、ピッチシャープニング係数決定部318において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置11と同じである。
[Third embodiment]
<Configuration>
As illustrated in FIG. 1, the encoding device 31 of the third embodiment includes a pitch sharpening coefficient determination unit 318 instead of the pitch sharpening coefficient determination unit 118, and the pitch sharpening coefficient determination unit 318 includes a first The encoding apparatus 11 is the same as the encoding apparatus 11 of the first embodiment except that a process for determining a pitch sharpening coefficient is performed based on a different standard from the embodiment.

図2に例示するように、第三実施形態の復号装置32は、ピッチシャープニング係数決定部128に代えてピッチシャープニング係数決定部328を備え、ピッチシャープニング係数決定部328において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の復号装置12と同じである。   As illustrated in FIG. 2, the decoding device 32 of the third embodiment includes a pitch sharpening coefficient determination unit 328 instead of the pitch sharpening coefficient determination unit 128, and the pitch sharpening coefficient determination unit 328 performs the first implementation. This is the same as the decoding device 12 of the first embodiment, except that the process for determining the pitch sharpening coefficient is performed on a basis different from the form.

<符号化>
第三実施形態の符号化装置31の処理は、ピッチシャープニング係数決定部318の処理以外、第一実施形態と同じである。
<Encoding>
The processing of the encoding device 31 of the third embodiment is the same as that of the first embodiment except for the processing of the pitch sharpening coefficient determination unit 318.

≪ピッチシャープニング係数決定部318≫
ピッチシャープニング係数決定部318は、有声音サブフレームである可能性の高いサブフレームのピッチシャープニング係数が、そうでないサブフレームのピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。人の声は周期性が高いので、有声サブフレームの方がそうでないサブフレームと比較して周期性成分が多く含まれる可能性が高い。そのため、人の声を符号化する場合には、周期化処理による品質向上効果が高いことが期待できる。有声サブフレームである可能性の高さは、例えば、線形予測分析部111で得た現在のフレームに対する線形予測係数から算出される予測利得により判断できる。入力音響信号が有声音の場合、波形の予測利得が大きくなる傾向が強い。予測利得gは、kを予測次数iでのPARCOR係数とし、pを最高予測次数として

Figure 0006053145
で与えられる。ACELPではp次の線形予測係数はパルス位置を探索する前にフレームごとに計算され、LSPパラメータなどによって量子化される。符号化装置31および復号装置32は、合成フィルタ117,127を構成するために用いる量子化後の線形予測係数から同じPARCOR係数を算出することができる。 << Pitch Sharpening Factor Determination Unit 318 >>
The pitch sharpening coefficient determination unit 318 determines the pitch sharpening coefficient so that the pitch sharpening coefficient of a subframe that is likely to be a voiced sound subframe does not become smaller than the pitch sharpening coefficient of a subframe that does not. To do. Since human voice has high periodicity, a voiced subframe is more likely to contain more periodic components than a subframe that does not. Therefore, when a human voice is encoded, it can be expected that the quality improvement effect by the periodic processing is high. The high possibility of being a voiced subframe can be determined by, for example, the prediction gain calculated from the linear prediction coefficient for the current frame obtained by the linear prediction analysis unit 111. When the input acoustic signal is a voiced sound, the waveform prediction gain tends to increase. The prediction gain g is defined as k i is the PARCOR coefficient at the prediction order i and p is the highest prediction order.
Figure 0006053145
Given in. In ACELP, a p-order linear prediction coefficient is calculated for each frame before searching for a pulse position, and is quantized by an LSP parameter or the like. The encoding device 31 and the decoding device 32 can calculate the same PARCOR coefficient from the quantized linear prediction coefficient used to configure the synthesis filters 117 and 127.

なお、予測利得gそのものではなく、予測利得の単調非減少関数値(例えばlog(g)や(g/(g+1))のように、予測利得に対応する値を用いても良い。また、予測利得に対応する値として、或る次数のPARCOR係数の大きさ(例えば、1次のPARCOR係数の絶対値|k|)やそれに対応する値(例えば|kやk )を用いてもよい。 Instead of the prediction gain g itself, a value corresponding to the prediction gain, such as a monotonous non-decreasing function value of the prediction gain (for example, log (g) or (g / (g + 1)) may be used. As the value corresponding to the prediction gain, the magnitude of a certain order PARCOR coefficient (for example, the absolute value of the first order PARCOR coefficient | k 1 |) or the corresponding value (for example, | k 1 | 2 or k 1 2 ) May be used.

ピッチシャープニング係数決定部318は、予測利得に対応する値が大きい場合のピッチシャープニング係数が、予測利得に対応する値が小さい場合のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。例えば、予測利得に対応する値に対して単調非減少の関係となるようにピッチシャープニング係数を決定すればよい。あるいは、上記の関係を維持するように、予め取りうる予測利得に対応する値(またはその範囲)とピッチシャープニング係数との値を対応付けた対応表を用いて決定しても良い。   The pitch sharpening coefficient determination unit 318 prevents the pitch sharpening coefficient when the value corresponding to the prediction gain is large from being smaller than the pitch sharpening coefficient when the value corresponding to the prediction gain is small. To decide. For example, the pitch sharpening coefficient may be determined so that the value corresponding to the predicted gain has a monotonous non-decreasing relationship. Or you may determine using the correspondence table which matched the value (or the range) corresponding to the prediction gain which can be taken beforehand, and the value of a pitch sharpening coefficient so that said relationship may be maintained.

<復号>
第三実施形態の復号装置32におけるピッチシャープニング係数決定部328は、第三実施形態の符号化装置31のピッチシャープニング係数決定部318と同じ基準(関数値、もしくは、対応表)を用いて、ピッチシャープニング係数を決定する。ただし、ピッチ周期としては、復号装置32で得た復号ピッチ周期を用いる。その他は、第一実施形態と同じである。
<Decryption>
The pitch sharpening coefficient determination unit 328 in the decoding device 32 of the third embodiment uses the same standard (function value or correspondence table) as the pitch sharpening coefficient determination unit 318 of the encoding device 31 of the third embodiment. Determine the pitch sharpening factor. However, the decoding pitch period obtained by the decoding device 32 is used as the pitch period. Others are the same as the first embodiment.

[第四実施形態]
<構成>
図1に例示するように、第四実施形態の符号化装置41は、ピッチシャープニング係数決定部118に代えてピッチシャープニング係数決定部418を備え、ピッチシャープニング係数決定部418において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置11と同じである。
[Fourth embodiment]
<Configuration>
As illustrated in FIG. 1, the encoding device 41 according to the fourth embodiment includes a pitch sharpening coefficient determination unit 418 instead of the pitch sharpening coefficient determination unit 118. In the pitch sharpening coefficient determination unit 418, the first The encoding apparatus 11 is the same as the encoding apparatus 11 of the first embodiment except that a process for determining a pitch sharpening coefficient is performed based on a different standard from the embodiment.

図2に例示するように、第四実施形態の復号装置42は、ピッチシャープニング係数決定部128に代えてピッチシャープニング係数決定部428を備え、ピッチシャープニング係数決定部428において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の復号装置12と同じである。   As illustrated in FIG. 2, the decoding device 42 of the fourth embodiment includes a pitch sharpening coefficient determination unit 428 instead of the pitch sharpening coefficient determination unit 128, and the pitch sharpening coefficient determination unit 428 performs the first implementation. This is the same as the decoding device 12 of the first embodiment, except that the process for determining the pitch sharpening coefficient is performed on a basis different from the form.

<符号化>
第四実施形態の符号化装置41のピッチシャープニング係数決定部418の処理は、第一実施形態から第三実施形態のピッチシャープニング係数決定部118〜318で用いた処理を組み合わせたものである。その他の処理は、第一実施形態と同じである。
<Encoding>
The processing of the pitch sharpening coefficient determination unit 418 of the encoding device 41 of the fourth embodiment is a combination of the processes used in the pitch sharpening coefficient determination units 118 to 318 of the first embodiment to the third embodiment. . Other processes are the same as those in the first embodiment.

≪ピッチシャープニング係数決定部418≫
ピッチシャープニング係数決定部418は、第1実施形態から第3実施形態を組み合わせた方法で、ピッチシャープニング係数を決定する。例えば、ピッチシャープニング係数決定部418は、現在のサブフレームのピッチ周期の安定している度合いが高いときのピッチシャープニング係数が、ピッチ周期の安定している度合いが低いときのピッチシャープニング係数より小さくならないように、かつ、有声音サブフレームである可能性が高いときのピッチシャープニング係数がそうでないサブフレームのピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数の値を決定する。例えば、ピッチシャープニング係数決定部418は、現在のサブフレームと過去のサブフレームとのピッチ周期の差の絶対値が小さく、かつ、線形予測分析部で得た予測利得の値に対して単調非減少の関係となる値をピッチシャープニング係数として決定する。対応表の例を表3に示す。予測利得は1以上で現実的には1000程度までの値を取りうる。(g/(g+1))は0.5から約1の値をとる。

Figure 0006053145
<< Pitch Sharpening Coefficient Determination Unit 418 >>
The pitch sharpening coefficient determination unit 418 determines the pitch sharpening coefficient by a method combining the first to third embodiments. For example, the pitch sharpening coefficient determination unit 418 performs a pitch sharpening coefficient when the degree of stability of the pitch period of the current subframe is high and a pitch sharpening coefficient when the degree of stability of the pitch period is low. The value of the pitch sharpening coefficient is determined so that the pitch sharpening coefficient when there is a high possibility of being a voiced sound subframe is not smaller than the pitch sharpening coefficient of a subframe that is not so. For example, the pitch sharpening coefficient determination unit 418 has a small absolute value of the difference between the pitch periods of the current subframe and the past subframe, and is monotonously non-monotonous with respect to the prediction gain value obtained by the linear prediction analysis unit. A value that is a decreasing relationship is determined as a pitch sharpening coefficient. An example of the correspondence table is shown in Table 3. The prediction gain is 1 or more and can actually take a value up to about 1000. (g / (g + 1)) takes a value from 0.5 to about 1.
Figure 0006053145

あるいは、予測利得の取りうる範囲毎に別の対応表を用意し、シャープニング係数決定部418が、予測利得の値に応じて対応表を選択し、選択した対応表に基づいてピッチシャープニング係数を決定しても良い。なお、各対応表は、或るサブフレーム(例えば現在のサブフレーム)と過去のサブフレームのピッチ周期の差に対応する値(もしくはその範囲)とピッチシャープニング係数とが対応付けられているものとする。対応表の例を示す。この例では、サブフレーム間のピッチ周期の差の絶対値と、典型的有声フレームでのシャープニング係数と、通常フレームでのシャープニング係数とが対応付けられている。

Figure 0006053145
Alternatively, another correspondence table is prepared for each possible range of the prediction gain, and the sharpening coefficient determination unit 418 selects the correspondence table according to the value of the prediction gain, and the pitch sharpening coefficient based on the selected correspondence table. May be determined. In each correspondence table, a value corresponding to a difference in pitch period between a certain subframe (for example, the current subframe) and a past subframe (or a range thereof) is associated with a pitch sharpening coefficient. And An example of a correspondence table is shown. In this example, an absolute value of a difference in pitch period between subframes, a sharpening coefficient in a typical voiced frame, and a sharpening coefficient in a normal frame are associated with each other.
Figure 0006053145

なお、上記の例では、典型的有声フレームと通常フレームの場合のピッチ周期の差の粒度(対応表の粒度)を同じにしているが、各対応表で粒度が異なっていても良い。また、或るサブフレーム(例えば現在のサブフレーム)と過去のサブフレームのピッチ周期の差の絶対値の取りうる範囲毎に別の対応表を用意し、ピッチ周期の差の絶対値に応じて対応表を選択し、選択した対応表に基づいてピッチシャープニング係数を決定しても良い。この場合、各対応表は、予測利得の取りうる値(またはその範囲)とピッチシャープニング係数とが対応付け有れているものとする。この場合も、各対応表で予測利得の分類の粒度を変えても良い。また、ピッチ周期の差の粒度に応じて、予測利得の分類の粒度を変えてもよい。たとえば差が0の場合のみ、予測利得の分類をさらに細かくして係数を変化させ、その他の差については予測利得と無関係に係数を設定することも可能である。   In the above example, the granularity of the difference in pitch period between the typical voiced frame and the normal frame (granularity of the correspondence table) is the same, but the granularity may be different for each correspondence table. Also, another correspondence table is prepared for each possible range of the absolute value of the difference in pitch period between a certain subframe (for example, the current subframe) and the past subframe, and according to the absolute value of the difference in pitch period. A correspondence table may be selected, and the pitch sharpening coefficient may be determined based on the selected correspondence table. In this case, it is assumed that each correspondence table associates a possible value (or range) of the predicted gain with a pitch sharpening coefficient. Also in this case, the granularity of classification of the prediction gain may be changed in each correspondence table. Further, the granularity of the classification of the prediction gain may be changed according to the granularity of the pitch period difference. For example, only when the difference is 0, the coefficient can be changed by further classifying the prediction gain, and the coefficient can be set regardless of the prediction gain for other differences.

また、上記の実施形態では、サブフレーム単位でピッチシャープニング係数を決定する構成としたが、フレーム単位でピッチシャープニング係数を決定してもよい。つまり、フレーム単位で、周期性に応じて決定されたピッチシャープニング係数を用いて、周期化済みパルス系列を得る構成としてもよい。すなわち、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定してもよい。また、有声音フレームである可能性の高いフレームのピッチシャープニング係数が、そうでないフレームのピッチシャープニング係数よりも小さくならないように、フレーム単位でピッチシャープニング係数を決定してもよい。すなわち、有声音時間区間である可能性の高いフレームのピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、時間区間単位でピッチシャープニング係数を決定してもよい。   In the above embodiment, the pitch sharpening coefficient is determined in units of subframes. However, the pitch sharpening coefficient may be determined in units of frames. That is, a configuration may be adopted in which a periodic pulse sequence is obtained using a pitch sharpening coefficient determined according to periodicity in units of frames. That is, the pitch sharpening coefficient may be determined based on the difference between the pitch period of the time interval to be processed and the pitch period of the time interval before the process target. Further, the pitch sharpening coefficient may be determined for each frame so that the pitch sharpening coefficient of a frame that is likely to be a voiced sound frame does not become smaller than the pitch sharpening coefficient of a frame that does not. That is, the pitch sharpening coefficient may be determined on a time interval basis so that the pitch sharpening coefficient of a frame that is likely to be a voiced sound time interval is not smaller than the pitch sharpening coefficient of a time interval that is not so. .

また、入力音響信号の周期性が高い場合にはその定常性も高いため、上述の各実施形態における「周期性」を「定常性」に置き換えてもよい。   Further, when the periodicity of the input acoustic signal is high, the stationarity is also high. Therefore, “periodicity” in each of the above-described embodiments may be replaced with “stationarity”.

また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。   In addition, the various processes described above are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Needless to say, other modifications are possible without departing from the spirit of the present invention.

また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。   Further, when the above-described configuration is realized by a computer, processing contents of functions that each device should have are described by a program. The processing functions are realized on the computer by executing the program on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。   The program describing the processing contents can be recorded on a computer-readable recording medium. An example of a computer-readable recording medium is a non-transitory recording medium. Examples of such a recording medium are a magnetic recording device, an optical disk, a magneto-optical recording medium, a semiconductor memory, and the like.

このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   This program is distributed, for example, by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, this computer reads the program stored in its own recording device and executes the process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially.

上記実施形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部がハードウェアで実現されてもよい。   In the above embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of the processing contents may be realized by hardware.

符号化装置 11〜41
復号装置 12〜42
Encoder 11-41
Decoding device 12-42

Claims (24)

所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
各時間区間について、前記周期化処理部で求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索部と、
を有することを特徴とする符号化装置。
For each predetermined time interval, a code index for specifying a sample string from a fixed codebook, a pitch code for specifying a pitch period, a quantized fixed codebook gain, and a quantized pitch gain corresponding to an input acoustic signal An encoding device for obtaining a corresponding gain code,
A pitch sharpening coefficient determination unit that determines a pitch sharpening coefficient based on a difference between a pitch period of a time interval to be processed and a pitch period of a time interval prior to the processing target;
For one or more pulse sequences from the fixed codebook, a periodic processing unit that performs periodic processing corresponding to the pitch sharpening coefficient to obtain a periodic pulse sequence;
For each time interval, a search unit that outputs, as the code index, a code index corresponding to a periodic pulse sequence corresponding to an input acoustic signal among a plurality of periodic pulse sequences obtained by the periodic processing unit;
An encoding device comprising:
前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項1記載の符号化装置。
The pitch sharpening coefficient determination unit determines that the pitch sharpening coefficient when the absolute value of the difference between the pitch period of the time interval to be processed and the pitch period of the time interval before the process target is small is the time interval to be processed. The pitch sharpening coefficient is determined so as not to be smaller than the pitch sharpening coefficient when the absolute value of the difference between the pitch period of the time period and the pitch period of the time interval before the processing target is large. Item 4. The encoding device according to Item 1.
前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項1記載の符号化装置。
The pitch sharpening coefficient determination unit processes the pitch sharpening coefficient when the pitch period of the time interval to be processed is shorter than the pitch period of the time interval before the process target, and the pitch cycle of the time interval to be processed. The encoding apparatus according to claim 1, wherein the pitch sharpening coefficient is determined so as not to be smaller than a pitch sharpening coefficient in a case where the pitch period is longer than a pitch period of a time section before the target.
所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列求める周期化処理部と、
各時間区間について、前記周期化処理部で求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索部と、
を有することを特徴とする符号化装置。
For each predetermined time interval, a code index for specifying a sample string from a fixed codebook, a pitch code for specifying a pitch period, a quantized fixed codebook gain, and a quantized pitch gain corresponding to an input acoustic signal An encoding device for obtaining a corresponding gain code,
Pitch sharpening that determines the pitch sharpening coefficient so that the pitch sharpening coefficient of the time section that is likely to be a voiced sound time section is not smaller than the pitch sharpening coefficient of the time section that is not so A coefficient determination unit;
For one or more pulse sequences from the fixed codebook, a periodic processing unit that performs periodic processing corresponding to the pitch sharpening coefficient to obtain a periodic pulse sequence;
For each time interval, a search unit that outputs, as the code index, a code index corresponding to a periodic pulse sequence corresponding to an input acoustic signal among a plurality of periodic pulse sequences obtained by the periodic processing unit;
An encoding device comprising:
処理対象の時間区間の入力音響信号を線形予測分析し、処理対象の時間区間の入力音響信号に対応する線形予測係数を算出する線形予測分析部をさらに有し、
前記ピッチシャープニング係数決定部は、前記線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項4記載の符号化装置。
A linear prediction analysis unit that performs linear prediction analysis of the input acoustic signal in the time interval to be processed and calculates a linear prediction coefficient corresponding to the input acoustic signal in the time interval to be processed;
The pitch sharpening coefficient determination unit is configured so that the pitch sharpening coefficient of a time interval having a large value corresponding to the prediction gain calculated from the linear prediction coefficient is not smaller than the pitch sharpening coefficient of a time interval that is not so. The encoding apparatus according to claim 4, wherein the pitch sharpening coefficient is determined.
所定時間区間ごとに、ピッチ符号を復号して復号ピッチ周期を得るピッチ符号復号部と、
処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
を有することを特徴とする復号装置。
A pitch code decoding unit that obtains a decoding pitch period by decoding a pitch code for each predetermined time interval;
A pitch sharpening coefficient determination unit that determines a pitch sharpening coefficient based on a difference between a decoding pitch period of a time section to be processed and a decoding pitch period of a time section before the processing target;
For one or more pulse sequences from the fixed codebook, a periodic processing unit that performs periodic processing corresponding to the pitch sharpening coefficient to obtain a periodic pulse sequence;
A decoding device comprising:
前記ピッチシャープニング係数決定部は、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項6記載の復号装置。
The pitch sharpening coefficient determination unit determines the pitch sharpening coefficient when the absolute value of the difference between the decoded pitch period of the time interval to be processed and the decoded pitch period of the time interval before the process target is small. Determining the pitch sharpening coefficient so that it is not smaller than the pitch sharpening coefficient when the absolute value of the difference between the decoded pitch period of the time interval and the decoded pitch period of the time interval before the processing target is large. The decoding device according to claim 6.
前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項6記載の復号装置。
The pitch sharpening coefficient determination unit processes the pitch sharpening coefficient when the pitch period of the time interval to be processed is shorter than the pitch period of the time interval before the process target, and the pitch cycle of the time interval to be processed. The decoding apparatus according to claim 6, wherein the pitch sharpening coefficient is determined so as not to be smaller than a pitch sharpening coefficient in a case where the pitch period is longer than a pitch period of a time section before the target.
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
を有することを特徴とする復号装置。
Pitch sharpening that determines the pitch sharpening coefficient so that the pitch sharpening coefficient of the time section that is likely to be a voiced sound time section is not smaller than the pitch sharpening coefficient of the time section that is not so A coefficient determination unit;
For one or more pulse sequences from the fixed codebook, a periodic processing unit that performs periodic processing corresponding to the pitch sharpening coefficient to obtain a periodic pulse sequence;
A decoding device comprising:
前記ピッチシャープニング係数決定部は、処理対象の時間区間の線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項9記載の復号装置。
The pitch sharpening coefficient determination unit is configured such that a pitch sharpening coefficient in a time section having a large value corresponding to a prediction gain calculated from a linear prediction coefficient in a time section to be processed is larger than a pitch sharpening coefficient in a time section other than that. The decoding apparatus according to claim 9, wherein the pitch sharpening coefficient is determined so as not to decrease.
所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理ステップと、
各時間区間について、前記周期化処理ステップで求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索ステップと、
を有することを特徴とする符号化方法。
For each predetermined time interval, a code index for specifying a sample string from a fixed codebook, a pitch code for specifying a pitch period, a quantized fixed codebook gain, and a quantized pitch gain corresponding to an input acoustic signal A coding method for obtaining a corresponding gain code,
A pitch sharpening coefficient determination step for determining a pitch sharpening coefficient based on a difference between a pitch period of a time section to be processed and a pitch period of a time section before the processing target;
For one or more pulse sequences from the fixed codebook, a periodic processing step for performing periodicization corresponding to the pitch sharpening coefficient to obtain a periodic pulse sequence;
For each time interval, a search step for outputting, as the code index, a code index corresponding to a periodic pulse sequence corresponding to an input acoustic signal among a plurality of periodic pulse sequences obtained in the periodic processing step;
An encoding method characterized by comprising:
前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項11記載の符号化方法。
In the pitch sharpening coefficient determination step, the pitch sharpening coefficient when the absolute value of the difference between the pitch period of the time interval to be processed and the pitch period of the time interval prior to the process is small is the time interval to be processed. The pitch sharpening coefficient is determined so as not to be smaller than the pitch sharpening coefficient when the absolute value of the difference between the pitch period of the time period and the pitch period of the time interval before the processing target is large. Item 12. The encoding method according to Item 11.
前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項11記載の符号化方法。
In the pitch sharpening coefficient determination step, the pitch sharpening coefficient when the pitch period of the time section to be processed is shorter than the pitch period of the time section before the process target is processed by the pitch period of the time section to be processed. The encoding method according to claim 11, wherein the pitch sharpening coefficient is determined so as not to be smaller than a pitch sharpening coefficient in a case where the pitch period is longer than a pitch period of a time section before the target.
所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理ステップと、
各時間区間について、前記周期化処理ステップで求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索ステップと、
を有することを特徴とする符号化方法。
For each predetermined time interval, a code index for specifying a sample string from a fixed codebook, a pitch code for specifying a pitch period, a quantized fixed codebook gain, and a quantized pitch gain corresponding to an input acoustic signal A coding method for obtaining a corresponding gain code,
Pitch sharpening that determines the pitch sharpening coefficient so that the pitch sharpening coefficient of the time section that is likely to be a voiced sound time section is not smaller than the pitch sharpening coefficient of the time section that is not so A coefficient determination step;
For one or more pulse sequences from the fixed codebook, a periodic processing step for performing periodicization corresponding to the pitch sharpening coefficient to obtain a periodic pulse sequence;
For each time interval, a search step for outputting, as the code index, a code index corresponding to a periodic pulse sequence corresponding to an input acoustic signal among a plurality of periodic pulse sequences obtained in the periodic processing step;
An encoding method characterized by comprising:
処理対象の時間区間の入力音響信号を線形予測分析し、処理対象の時間区間の入力音響信号に対応する線形予測係数を算出する線形予測分析ステップをさらに有し、
前記ピッチシャープニング係数決定ステップは、前記線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項14記載の符号化方法。
A linear prediction analysis step of linearly predicting and analyzing the input acoustic signal of the time interval to be processed and calculating a linear prediction coefficient corresponding to the input acoustic signal of the time interval to be processed;
The pitch sharpening coefficient determination step is performed so that the pitch sharpening coefficient in a time interval having a large value corresponding to the prediction gain calculated from the linear prediction coefficient is not smaller than the pitch sharpening coefficient in a time interval that is not so. The encoding method according to claim 14, wherein the pitch sharpening coefficient is determined.
所定時間区間ごとに、ピッチ符号を復号して復号ピッチ周期を得るピッチ符号復号ステップと、
処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理ステップと、
を有することを特徴とする復号方法。
A pitch code decoding step for decoding a pitch code to obtain a decoded pitch period for each predetermined time interval;
A pitch sharpening coefficient determination step for determining a pitch sharpening coefficient based on a difference between a decoding pitch period of a time interval to be processed and a decoding pitch period of a time interval before the processing target;
For one or more pulse sequences from the fixed codebook, a periodic processing step for performing periodicization corresponding to the pitch sharpening coefficient to obtain a periodic pulse sequence;
A decoding method characterized by comprising:
前記ピッチシャープニング係数決定ステップは、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項16記載の復号方法。
In the pitch sharpening coefficient determination step, the pitch sharpening coefficient in the case where the absolute value of the difference between the decoding pitch period of the time interval to be processed and the decoding pitch period of the time interval before the processing object is small is Determining the pitch sharpening coefficient so that it is not smaller than the pitch sharpening coefficient when the absolute value of the difference between the decoded pitch period of the time interval and the decoded pitch period of the time interval before the processing target is large. The decoding method according to claim 16, characterized in that:
前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項16記載の復号方法。
In the pitch sharpening coefficient determination step, the pitch sharpening coefficient when the pitch period of the time section to be processed is shorter than the pitch period of the time section before the process target is processed by the pitch period of the time section to be processed. The decoding method according to claim 16, wherein the pitch sharpening coefficient is determined so as not to be smaller than a pitch sharpening coefficient in a case where the pitch period is longer than a pitch period of a time section before the target.
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列求める周期化処理ステップと、
を有することを特徴とする復号方法。
Pitch sharpening that determines the pitch sharpening coefficient so that the pitch sharpening coefficient of the time section that is likely to be a voiced sound time section is not smaller than the pitch sharpening coefficient of the time section that is not so A coefficient determination step;
For one or more pulse sequences from a fixed codebook, a periodic processing step for performing periodic processing corresponding to the pitch sharpening coefficient to obtain a periodic pulse sequence;
A decoding method characterized by comprising:
前記ピッチシャープニング係数決定ステップは、処理対象の時間区間の線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項19記載の復号方法。
In the pitch sharpening coefficient determination step, the pitch sharpening coefficient in the time section having a large value corresponding to the prediction gain calculated from the linear prediction coefficient in the time section to be processed is larger than the pitch sharpening coefficient in the other time section. The decoding method according to claim 19, wherein the pitch sharpening coefficient is determined so as not to become smaller.
請求項11から15の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラム。   The program for making a computer perform each step of the encoding method in any one of Claim 11 to 15. 請求項16から20の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラム。   A program for causing a computer to execute each step of the decoding method according to any one of claims 16 to 20. 請求項11から15の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。   A computer-readable recording medium storing a program for causing a computer to execute each step of the encoding method according to claim 11. 請求項16から20の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。   21. A computer-readable recording medium storing a program for causing a computer to execute each step of the decoding method according to claim 16.
JP2013034554A 2013-02-25 2013-02-25 Encoding device, decoding device, method, program, and recording medium Active JP6053145B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013034554A JP6053145B2 (en) 2013-02-25 2013-02-25 Encoding device, decoding device, method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013034554A JP6053145B2 (en) 2013-02-25 2013-02-25 Encoding device, decoding device, method, program, and recording medium

Publications (2)

Publication Number Publication Date
JP2014164091A JP2014164091A (en) 2014-09-08
JP6053145B2 true JP6053145B2 (en) 2016-12-27

Family

ID=51614746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013034554A Active JP6053145B2 (en) 2013-02-25 2013-02-25 Encoding device, decoding device, method, program, and recording medium

Country Status (1)

Country Link
JP (1) JP6053145B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2613503B2 (en) * 1991-07-08 1997-05-28 日本電信電話株式会社 Speech excitation signal encoding / decoding method

Also Published As

Publication number Publication date
JP2014164091A (en) 2014-09-08

Similar Documents

Publication Publication Date Title
JP5511372B2 (en) Adaptive excitation vector quantization apparatus and adaptive excitation vector quantization method
KR101370017B1 (en) Improved coding/decoding of a digital audio signal, in celp technique
JP5613781B2 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
JP5627144B2 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
JP5230444B2 (en) Adaptive excitation vector quantization apparatus and adaptive excitation vector quantization method
KR20020090882A (en) Excitation codebook search method in a speech coding system
JP6423065B2 (en) Linear prediction analysis apparatus, method, program, and recording medium
US20100185442A1 (en) Adaptive sound source vector quantizing device and adaptive sound source vector quantizing method
JP6416363B2 (en) Linear prediction analysis apparatus, method, program, and recording medium
US8200483B2 (en) Adaptive sound source vector quantization device, adaptive sound source vector inverse quantization device, and method thereof
KR101629661B1 (en) Decoding method, decoding apparatus, program, and recording medium therefor
KR101996307B1 (en) Coding device, decoding device, method thereof, program and recording medium
JP6053145B2 (en) Encoding device, decoding device, method, program, and recording medium
JP5789816B2 (en) Encoding apparatus, method, program, and recording medium
JP5762636B2 (en) Encoding device, decoding device, method, program, and recording medium
JP5714172B2 (en) Encoding apparatus, method, program, and recording medium
JP2011133637A (en) Encoding method, decoding method, encoding device, decoding device, and program
JP2013101212A (en) Pitch analysis device, voice encoding device, pitch analysis method and voice encoding method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150602

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160614

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161128

R150 Certificate of patent or registration of utility model

Ref document number: 6053145

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150