JPS6155700A - Pitch extraction processing system - Google Patents

Pitch extraction processing system

Info

Publication number
JPS6155700A
JPS6155700A JP59177679A JP17767984A JPS6155700A JP S6155700 A JPS6155700 A JP S6155700A JP 59177679 A JP59177679 A JP 59177679A JP 17767984 A JP17767984 A JP 17767984A JP S6155700 A JPS6155700 A JP S6155700A
Authority
JP
Japan
Prior art keywords
frame
pitch
residual
divided
pitch period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59177679A
Other languages
Japanese (ja)
Other versions
JPH0448239B2 (en
Inventor
大山 隆之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59177679A priority Critical patent/JPS6155700A/en
Publication of JPS6155700A publication Critical patent/JPS6155700A/en
Publication of JPH0448239B2 publication Critical patent/JPH0448239B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)
  • Cyclones (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明はピッチ抽出処理方式、特に音声の有声区間を複
数のフレームに分割し、該分割した各フレームについて
夫〜求めた自己相関係数等を用いてピッチ周期を算出す
る際に、当該分割した複数のフレームを一体とした形で
連続性を保持しつつ前記算出した自己相関係数の累積値
が最大となる経路に対応する形でピッチ周期を高精度か
つ節華に算出するよう構成したピッチ抽出処理方式に関
するものである。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a pitch extraction processing method, in particular, to dividing a voiced section of speech into a plurality of frames, and determining an autocorrelation coefficient, etc. for each divided frame. When calculating the pitch period using The present invention relates to a pitch extraction processing method configured to calculate the period with high precision and in a seamless manner.

〔従来の技術と発明が解決しようとする問題点〕従来、
音声のを声区間の歿差波形等からピッチ周期(基本周波
数の周期)を算出する場合、当該残差波形を所定時間間
隔毎にフレームの形に分別し、各フレーム毎に算出した
自己相関係数の一番大きな値が得られた位置からピッチ
周期を夫々フレーム毎に独立にゴγ出していた。このよ
うに、該算出方式では各フレーム毎に独立にピッチ周期
を算出しているため、本来のピッチ周期の2倍、3倍・
・・・等の周期でとノチ周波数が検出される場合があっ
たり、また何等かの原因によって相関係数の値が大きく
なった位置に対応する形でピッチ周期が算出される場合
があったため、ピッチ周期を精度高く算出することが困
難となってしまうという問題点があった。
[Problems to be solved by conventional technology and invention] Conventionally,
When calculating the pitch period (period of the fundamental frequency) from the difference waveform of the voice interval of speech, the residual waveform is divided into frames at predetermined time intervals, and the self-correlation calculated for each frame is calculated. The pitch period was determined independently for each frame from the position where the largest value was obtained. In this way, in this calculation method, the pitch period is calculated independently for each frame, so the pitch period can be doubled, tripled, or tripled the original pitch period.
There were cases where the notch frequency was detected at a period such as ..., and there were cases where the pitch period was calculated in a form corresponding to a position where the value of the correlation coefficient became large due to some reason. However, there was a problem in that it was difficult to calculate the pitch period with high accuracy.

c問題点を解決するための手段〕 本発明は、前記問題点を解決するために、音声の有声区
間を複数のフレームに分割し、咳分割した各フレームに
ついて夫々求めた自己相関係数を用いてピッチ周期を算
出する際に、当該分割した複数のフレームを一体、とし
た形で連続性を保持しつつ前記算出した自己相関係数の
累積値が最大となる経路に対応する形でピッチ周期を算
出することにより、高精度かつ簡単な構成によってピッ
チ周期を算出している。そのため、本発明のピッチ抽出
処理方式は、音声の有声区間を抽出し、該抽出した有声
区間の音声信号に関する相関性を用いてピッチ周期を抽
出するピッチ抽出処理方式において、前記抽出したを声
区間を複数のフレームに分割し、該分割したフレーム毎
に夫々音声の時間的な相関性を抽出する相関性抽出部と
、該相関性抽出部によって抽出された各フレーム内の音
声の時間的な相関性が相pA接するフレーム間で所定範
囲内にあるような経路上で該相関性の累積値を前記分割
した全ての複数のフレームについて順次計算する累積値
計算部と、該累積値計算部によって計算された累積値が
最大となる経路に該当するピッチ周期を前記各フレーム
毎に順次抽出するピッチ抽出部とを備えることを特徴と
している。
Means for Solving Problem c] In order to solve the above problem, the present invention divides a voiced section of speech into a plurality of frames, and uses an autocorrelation coefficient calculated for each divided frame. When calculating the pitch period, the pitch period is calculated in a form corresponding to the path where the cumulative value of the calculated autocorrelation coefficient is maximum while maintaining continuity by integrating the plurality of divided frames. By calculating , the pitch period is calculated with high precision and a simple configuration. Therefore, the pitch extraction processing method of the present invention extracts a voiced section of speech and extracts a pitch period using the correlation regarding the audio signal of the extracted voiced section. a correlation extraction unit that divides the image into a plurality of frames and extracts the temporal correlation of audio for each divided frame; and a temporal correlation of audio within each frame extracted by the correlation extraction unit. a cumulative value calculation unit that sequentially calculates the cumulative value of the correlation for all the divided frames on a path such that the correlation is within a predetermined range between frames that are in contact with each other; and calculated by the cumulative value calculation unit. The present invention is characterized by comprising a pitch extracting section that sequentially extracts pitch periods corresponding to the path having the maximum accumulated value for each frame.

〔実施例〕〔Example〕

以下図面を参照しつつ本発明の1実施例を詳細に説明す
る。
An embodiment of the present invention will be described in detail below with reference to the drawings.

第1図は本発明の1実施例構成図、第2図ないし第4図
は第1図図示本発明の1実施例構成の動作を説明する動
作説明図、第5図は本発明の他の実施例構成を説明する
説明図を示す。
FIG. 1 is a configuration diagram of one embodiment of the present invention, FIGS. 2 to 4 are operation explanatory diagrams explaining the operation of the configuration of one embodiment of the present invention shown in FIG. 1, and FIG. 5 is an illustration of another embodiment of the present invention. An explanatory diagram illustrating the configuration of the embodiment is shown.

図中、1はスペクトル分析器(LPG) 、2は逆フィ
ルタ(INV) 、3はローパス・フィルタ(LPF)
 、4は残差相関計算器(Φ)、5は累積値計算部(g
IJ)、6はピッチ抽出部CP+ )、7はを声/無声
判定器(VUV) 、8は主制御部(CPIJ) 、9
.10はバッファ・メモリ (BF)、11はスイッチ
を表す。
In the figure, 1 is a spectrum analyzer (LPG), 2 is an inverse filter (INV), and 3 is a low-pass filter (LPF).
, 4 is a residual correlation calculator (Φ), 5 is a cumulative value calculation unit (g
IJ), 6 is the pitch extraction unit CP+), 7 is the voice/unvoiced determiner (VUV), 8 is the main control unit (CPIJ), 9
.. 10 represents a buffer memory (BF), and 11 represents a switch.

第1図は左端図示音声信号から右端図示ピッチ周期を算
出するための1実施例構成図を示す。
FIG. 1 shows a block diagram of an embodiment for calculating the right end indicated pitch period from the left end indicated audio signal.

図中スペクトル分析器(LPC)1は図示音声信号から
既知の方法でスペクトル情報を抽出するためのもの、例
えば線形予測法によってスペクトル・パラメータを抽出
するためのものである。該算出されたスペクトル情報は
逆フィルタ(I NV)2に通知され、該逆フィルタ2
は前記スペクトル・パラメータと標本化された音声信号
とから残差波形信号を生成する。該生成された残差波形
信号はローパス・フィルタ(LPF)3によって高域成
分を除′去して残差相関計算器(Φ) 4に供給される
。該残差相関計算器4はIA給された残差波形信号から
予め定めたフレーム周期毎に自己相関係数を算出し、有
声/無声判定器(VIJV)7に通知する。該算出した
自己相関係数の通知を受けた有声/無声判定器7は前記
スペクトル分析器1から通知されたスペクトル・パラメ
ータと残差相関計算器4から通知された残差自己相関係
数の最大値とから現在の当該フレームが有声であるか、
無声であるかを判別し、主制御部(CPU)8に通知す
る。主制御部8は判別結果が有声である旨の通知があっ
た場合、残差相関計算器4とバッファ・メモリ9との間
に設けたスイッチ11をオンにして当該残差相関計算器
4から出力された残差自己相関係数の値を順次バッファ
・メモリ (BF)9に記憶させる。一方、主制御部8
は判別結果が無声である旨の通知があった場合、当該ス
イッチ11をオフにして残差相関計算器4から出力され
た残差自己相関係数の値がバッファ・メモリ9に記憶さ
れないようにする。
A spectrum analyzer (LPC) 1 in the figure is for extracting spectral information from the illustrated audio signal by a known method, for example for extracting spectral parameters by a linear prediction method. The calculated spectrum information is notified to the inverse filter (INV) 2, and the inverse filter 2
generates a residual waveform signal from the spectral parameters and the sampled audio signal. The generated residual waveform signal is supplied to a residual correlation calculator (Φ) 4 after removing high-frequency components by a low-pass filter (LPF) 3. The residual correlation calculator 4 calculates an autocorrelation coefficient for each predetermined frame period from the IA-fed residual waveform signal, and notifies the voiced/unvoiced determiner (VIJV) 7. The voiced/unvoiced determiner 7, which has been notified of the calculated autocorrelation coefficient, calculates the maximum of the spectral parameters notified from the spectrum analyzer 1 and the residual autocorrelation coefficient notified from the residual correlation calculator 4. value and whether the current frame is voiced,
It is determined whether there is no voice or not, and the main control unit (CPU) 8 is notified. When the main control unit 8 receives a notification that the discrimination result is voiced, it turns on the switch 11 provided between the residual correlation calculator 4 and the buffer memory 9, so that the residual correlation calculator 4 The values of the output residual autocorrelation coefficients are sequentially stored in a buffer memory (BF) 9. On the other hand, the main control section 8
When there is a notification that the discrimination result is silent, the switch 11 is turned off so that the value of the residual autocorrelation coefficient output from the residual correlation calculator 4 is not stored in the buffer memory 9. do.

更に、主制御部8は累積値針X部(gij) 5に命令
を発して後述する式(2)、(4)および(6)等を計
算していわゆる累積値“glJ”を算出する。該算出さ
れた累積値@、、*は順次バッファ・メモリ (BF)
10に格納される。そして、王制種部8はピッチ抽出部
(Pi )6に対してバッファ・メモリ10に格納され
た内容等に基づいて後述する式(5)等を計算してピッ
チ周期を算出するよう制御する0以上の如く構成を採用
することにより、複数に分割されたフレームについて夫
々算出した残差自己相関係数に基づいて総合的に各フレ
ームに対するピッチ周期が算出されるため、極めて高精
度にピッチ周期を算出することができる。以下第2図な
いし第4図を用いて更に本実施例の構成および動作を詳
細に説明する。
Furthermore, the main control section 8 issues a command to the cumulative value hand X section (gij) 5 to calculate a so-called cumulative value "glJ" by calculating equations (2), (4), (6), etc. to be described later. The calculated cumulative value @,, * is sequential buffer memory (BF)
10. Then, the monarch type section 8 controls the pitch extraction section (Pi) 6 to calculate the pitch period by calculating equation (5), etc., which will be described later, based on the contents stored in the buffer memory 10. By adopting the above configuration, the pitch period for each frame is comprehensively calculated based on the residual autocorrelation coefficient calculated for each frame divided into multiple frames, so the pitch period can be calculated with extremely high accuracy. It can be calculated. The configuration and operation of this embodiment will be further explained in detail below with reference to FIGS. 2 to 4.

第2図(イ)は第1図図示逆フイルタ2によって生成さ
れた残差波形信号を示し、第2図(ロ)は第1II図示
残差相関計算器4によって算出された各残差自己相関係
数を示す。
FIG. 2(A) shows the residual waveform signal generated by the inverse filter 2 shown in FIG. 1, and FIG. Indicates the number of relationships.

第2図(イ)図中第1フレームないし第Mフレームは有
声/無声判定器7によって判別された有声区間に対応す
る図示残差波形信号を複数のフレームに分割したもので
ある。該各フレームは図示の如く複数のピッチ周期が含
まれるように分割されると共に、必要に応じて一部重複
する形で分割する。咳分割された第1フレームないし第
Mフレームに対応してピッチ周期を抽出する際に、後述
する如く当咳第1フレームないし第Mフレームを一体と
した形でピッチ周期を算出する処理を実行するため、高
精度にピッチ周期を抽出することが可能となる。
The first to Mth frames in FIG. 2(A) are obtained by dividing the illustrated residual waveform signal corresponding to the voiced section determined by the voiced/unvoiced determiner 7 into a plurality of frames. Each frame is divided so as to include a plurality of pitch periods as shown in the figure, and is also divided so as to partially overlap as necessary. When extracting the pitch period corresponding to the first to Mth frames that have been divided into coughs, a process is executed to calculate the pitch period by integrating the first to Mth frames of the cough, as described later. Therefore, it becomes possible to extract the pitch period with high accuracy.

第2図(ロ)図中例えば“φ、J″は添字の値で特定さ
れる残差自己相関係数を示す、添字の第2項“j”は第
2図(ロ)図示左端に示す「時間遅れ」の値を示し、第
1項“五”は第1U!J図示第iフレームを示す、詳細
に言えば時間遅れ”0・・N、・・J・・N2 “は第
2図(イ)図示残差波形信号をサンプリングしたサンプ
リング間隔の整数倍に対応する時間遅れを夫々示し、図
示“l、2・・i・・M”は第2図(イ)図示第1フレ
ーム、第2フレーム・・第iフレーム・・第Mフレーム
に対応するものを夫々示す、また、図中“φIo・φ■
゛φl・・φに0′は零次の残差自己相関係数を示す0
図中“ピッチ存在範囲”は音声のピッチ周期(基本周波
数の周期)が存在するであろう範囲を示したものであり
、該範囲内で後述するピッチ周期を抽出するようにする
。そして、第2図(ロ)は、例えば第iフレームの信号
について時間遅れN1自・、j・・・N、に対応する残
差自己相関計数φ1旧 ・・・φ直−・・・φ直、□を
列挙して示している。
For example, "φ, J" in Figure 2 (B) indicates the residual autocorrelation coefficient specified by the value of the subscript, and the second term "j" of the subscript is shown at the left end of the diagram in Figure 2 (B). Indicates the value of "time delay", and the first term "5" is the 1st U! In detail, the time delays "0...N,...J...N2" indicating the i-th frame shown in the diagram correspond to an integral multiple of the sampling interval at which the residual waveform signal shown in Figure 2 (a) was sampled. The time delays are shown respectively, and "l, 2...i...M" in the diagram corresponds to the first frame, the second frame, the i-th frame, the M-th frame shown in FIG. 2(a), respectively. , Also, in the figure “φIo・φ■
゛φl...0′ in φ is 0 indicating the zero-order residual autocorrelation coefficient
In the figure, the "pitch existence range" indicates the range in which the pitch period (period of the fundamental frequency) of the voice is expected to exist, and the pitch period described later is extracted within this range. FIG. 2 (b) shows, for example, the residual autocorrelation coefficients φ1 old ... φ direct - ... φ direct corresponding to the time delays N1 self, j...N, for the signal of the i-th frame, for example. , □ are listed and shown.

第211iJ(ロ)図示残差自己相関係数はここで、0
.7) は残差信号を表し、’1 (a*Jl は残差
自己相関係数を求めるための時間遅れ“j”をもつ残差
信号を示し、Nはフレーム長を表す。
No. 211iJ (b) The indicated residual autocorrelation coefficient is 0
.. 7) represents the residual signal, '1 (a*Jl represents the residual signal with time delay "j" for determining the residual autocorrelation coefficient, and N represents the frame length.

このようにして第2図(ロ)図示残差自己相関係数を夫
々求められる。
In this way, the residual autocorrelation coefficients shown in FIG. 2(b) can be obtained.

第3図は前記時間遅れ“joを示す、該時間遅れ“j”
はく図示残差信号e lal の元となる音声をサンプ
リングした周期の整数倍となる図示”1.2.3.4、
・・・・・”のいずれかに対応する値を持ち、前記式(
1)が最大となる“j”を求めることにより、当該フレ
ーム内に於ける繰り返し周期であるピッチ周期を算出す
ることが可能となる。
FIG. 3 shows the time delay "j".
1.2.3.4, which is an integer multiple of the period at which the audio that is the source of the residual signal e lal is sampled.
It has a value corresponding to one of ``...'' and the formula (
By finding "j" for which 1) is the maximum, it is possible to calculate the pitch period, which is the repetition period within the frame.

第4図は本発明に係わる累積値“grj”およびピッチ
周期“I)i  ”を算出するための動作を説明する動
作説明図を示す、以下ピッチ周期“p、”を算出するた
めの式を記述した後、該式を用いてピッチ周期を算出す
る手順を順次説明する。
FIG. 4 shows an operation explanatory diagram for explaining the operation for calculating the cumulative value "grj" and the pitch period "I)i" according to the present invention. After describing the equation, a procedure for calculating the pitch period using the equation will be sequentially explained.

まず、ピッチ周期“pt  ”は下記の如く式を用いて
算出される。
First, the pitch period "pt" is calculated using the following formula.

前記累積値“grJ″は下式によって与えられる。The cumulative value "grJ" is given by the following formula.

(i)  N、<怠j <−N茸の場合gIJm ma
x (w t*・g r−1,k)+φ1ノ・121但
し、k”N+、 Nl +l、・・Hz  1.Lgo
j= 0 一部は後述する如く連続制限に関するウェイトとする。
(i) If N, < laziness j <-N mushrooms gIJm ma
x (w t*・g r−1,k)+φ1ノ・121 However, k”N+, Nl +l,...Hz 1.Lgo
j=0 Part of the weight is the weight related to the continuity limit as described later.

(ii)  j<N、  or  j>N、の場合gi
4  ・−■  ・  ・ ・ ・ ・ ・ ・ ・ 
・ ・ ・ ・(3)また (iii ) V、IIK  ・ ・ ・ ・ ・ ・ ・ ・ ・ 
・ ・ ・ ・ ・ ・ ・(4)と定義する。ここで
KはInaX CHjk ’ g i−1+k )を与
える“k″とする。
(ii) If j<N, or j>N, gi
4 ・−■ ・ ・ ・ ・ ・ ・ ・ ・
・ ・ ・ ・(3) Also (iii) V, IIK ・ ・ ・ ・ ・ ・ ・ ・ ・
・ ・ ・ ・ ・ ・ ・(4) Define. Here, K is "k" which gives InaX CHjk' g i-1+k ).

従って、i=M、I’l−1,・・・弓に対応するピッ
チ周期P、は下式で与えられる。
Therefore, i=M, I'l-1, . . . The pitch period P corresponding to the bow is given by the following formula.

PL−1” V l  ・・・・・・・・・・・・・・
(5)但し、PMは最大のgwiを与えるj とする。
PL-1” V l ・・・・・・・・・・・・・・・
(5) However, PM is j that gives the maximum gwi.

また、前述したウェイト−Jkは下式で与えられる。な
お、下記n、はn!は時間範囲を与える値である。
Moreover, the weight -Jk mentioned above is given by the following formula. In addition, the following n is n! is a value that gives a time range.

(i )  4−n+<〜k〈・j+n暑の場合−□(
1) ・・・・・・・・・・・・+61(ii)  k
 < j−n+  Or  k > j+nzの場合−
1;−■・・・・・・・・・・・(7)次に、前述した
式を用いてビフチ周NAP、が算出される様子を第4図
を用いて説明する。
(i) 4-n+<~k〈・j+n in case of heat −□(
1) ・・・・・・・・・・・・+61(ii)k
< j−n+ Or k > In the case of j+nz −
1;-■ (7) Next, the manner in which the bifuchi circumference NAP is calculated using the above-mentioned formula will be explained with reference to FIG.

第1に式(1)を用いて第1図図示バッファ・メモリ9
に格納されている残差信号波形を用いて第4凹図示ピッ
チ存在範囲内の全ての残差自己相関係数を順次求め、第
1図図示バッファ・メモリlOに格納する。
First, using equation (1), the buffer memory 9 shown in FIG.
All the residual autocorrelation coefficients within the fourth concave illustrated pitch existing range are sequentially obtained using the residual signal waveform stored in , and are stored in the illustrated buffer memory IO in FIG.

第2に当1亥バッファ・メモリIOに格納した第4図図
示各残差自己相関係数を順次読み出し、式(2)、(4
)および(6)を用いて累積値“gij″を算出する。
Second, each residual autocorrelation coefficient shown in FIG.
) and (6) to calculate the cumulative value "gij".

即ち、 (i)   i−1の場合(第1フレームの場合)g 
14 llmax C” Jk ’ go、k )+φ
、J・ φ1J ここで、式中のgol、・0である(式(2)の但し書
き)、これは、第4図図中■に示す当該第1フフーム中
の最大の残差自己相関係数の値を与える時間遅れがjで
あるとしていることを示している。
That is, (i) In the case of i-1 (in the case of the first frame) g
14 llmax C” Jk ' go, k ) + φ
, J・φ1J Here, gol in the formula is ・0 (proviso to formula (2)), which is the maximum residual autocorrelation coefficient in the first fhum shown in ■ in Figure 4. This shows that the time delay that gives the value of is j.

(ii)   i=2の場合 g zJ” maX (W Jk ’ glr k)+
φ2J: φl+φzj ここで、−jkはウェイトを示し、第4図図中第1フレ
ーム中の最大の残差自己相関係数である図示φ1jを中
心に上方向(jの値が小さくなる方向)に図示n’、下
方向(jの値が大きくなる方向)に図示n、の範囲内に
第2フレーム内の最大となる残差自己相関係数が位置す
る場合、例えば図示■として示すφ!+j−31が最大
の残差自己相関係数であった場合には、式(6)に示す
ように重み“1”が乗算され、前述の値を得ている。
(ii) When i=2, g zJ” maX (W Jk 'glr k)+
φ2J: φl+φzz Here, -jk indicates the weight, and it increases upward (in the direction in which the value of j decreases) with the indicated φ1j, which is the largest residual autocorrelation coefficient in the first frame in FIG. 4, as the center. If the maximum residual autocorrelation coefficient in the second frame is located within the range n' shown in the figure, downward (in the direction in which the value of j increases), n is shown, for example, φ! shown as ■ in the figure! When +j-31 is the maximum residual autocorrelation coefficient, the weight "1" is multiplied as shown in equation (6) to obtain the above-mentioned value.

一方、範囲外の場合、例えば図示■として示すφ、j+
、が最大の残差自己関数である場合には、式(7)に示
すように重み“−(至)”を乗算し、累積値g、、−o
oとなり、当該■はピッチ周期を求める上で対象外とな
り、上記範囲内で最大の残差自己相関計数をもつ例えば
図示■のものが選ばれる。
On the other hand, if it is outside the range, for example, φ, j+ shown as ■ in the diagram
, is the maximum residual autofunction, multiply by the weight "-(to)" as shown in equation (7), and obtain the cumulative value g, , -o
o, and the corresponding item ``■'' is excluded from the calculation of the pitch period, and the item ``■'' shown in the figure, for example, which has the largest residual autocorrelation coefficient within the above range is selected.

このように、前のフレームで求めた所定の残差自己相関
係数を中心に式(7)で示される範囲のものは、ピッチ
周期を算出する対象外とすることにより、高精度にピッ
チ周期を抽出するよう構成されている。
In this way, by excluding the range shown by equation (7) around the predetermined residual autocorrelation coefficient obtained in the previous frame, the pitch period can be calculated with high precision. is configured to extract.

以下同様に有意な値が得られる式(6)で与えられるウ
ェイトを用いて式(2)に示す累積値g 2j−、g 
4J・・・grj・、・・g、ljを1頌次算出し、第
1図図中バッファ・メモリ10に格納する。そして、式
(51で示すように、各フレームについてのピッチff
UJIP、を算出する0例えば第4図よりP+−j、P
z−j−3・・・P+−j−2・・・・の形で算出する
0以上説明したようにいわばDP法(ダイナミック・プ
ログラム法ンの手法と同様な手法によって、残差波形信
号を複数のフレームに分割した上で、該分割した複数の
フレームの残差自己相関係数の累積値g(rを最大にす
るような経路に対応する形で残差自己相関係数を用いて
ピッチ周期を抽出する構成を採用しているため、高精度
にピッチ周期を抽出することが可能となる。
Similarly, the cumulative value g 2j−,g shown in equation (2) is calculated using the weight given by equation (6), which yields a significant value.
4J...grj...g, lj are calculated once and stored in the buffer memory 10 in FIG. Then, as shown in equation (51), the pitch ff for each frame
For example, from Figure 4, P+-j, P
As explained above, the residual waveform signal is calculated using the DP method (similar to the dynamic programming method). After dividing the frames into multiple frames, the pitch is calculated using the residual autocorrelation coefficients in a manner corresponding to the path that maximizes the cumulative value g (r) of the residual autocorrelation coefficients of the multiple divided frames. Since a configuration for extracting the period is adopted, it is possible to extract the pitch period with high accuracy.

第5図(イ)は長い有声区間を示し、第5図(ロ)は第
5図(イ)図示長い有声区間を1つのMフレームとして
ピッチ周期を算出する場合を示し、第5図(ハ)は第5
図(イ)図示長い有声区間を短い複数のLフレーム毎に
分割してピッチ周期を算出する場合を示す。
FIG. 5(a) shows a long voiced section, FIG. 5(b) shows a case where the pitch period is calculated using the long voiced section shown in FIG. ) is the fifth
Figure (A) shows a case where a pitch period is calculated by dividing a long voiced section into a plurality of short L frames.

第1図ないし第4図を用いて説明したいわゆるDP法(
動的計画法)を利用した形でピッチ周期の抽出を行う場
合、入力音声の連続する有声区間が終了した後でないと
、各フレームのと・7千周期を最終的に決定することが
できない。従って、ピッチ周期の抽出の遅れは、連続す
る有声区間の長さに依存するため、例えば実時間分析を
行う場合に、迅速にピッチ周期を抽出し得ないこととな
る。
The so-called DP method (
When extracting the pitch period using dynamic programming, the 7,000 periods of each frame cannot be finally determined until after the continuous voiced section of the input voice ends. Therefore, since the delay in extracting the pitch period depends on the length of consecutive voiced sections, it is not possible to extract the pitch period quickly when performing real-time analysis, for example.

そこで、本実施例では、一定のフレーム数(ブロック)
単位で長い有声区間を分割し、咳分割した区間毎にピッ
チ周期を抽出することにより、所定時間以内にピッチ周
期が検出できるように構成しである。この際、当該連続
するMフレームを分割したLフレームの全体に渡って、
当t1Mフレームの当初から連続した形で前述した累積
値glJを用いてピッチの抽出精度を高めるよう構成す
る。
Therefore, in this embodiment, a fixed number of frames (blocks)
By dividing a long voiced section into units and extracting the pitch period for each divided section, the pitch period can be detected within a predetermined time. At this time, over the entire L frame obtained by dividing the continuous M frames,
The above-mentioned cumulative value glJ is continuously used from the beginning of the current t1M frame to improve pitch extraction accuracy.

〔発明の効果〕〔Effect of the invention〕

以上説明した如く、本発明によれば、音声のを声区間を
複数のフレームに分割し、該分割した各フレームについ
て夫々求めた自己相関係数を用いてピッチ周期を算出す
る際に、当1亥分割した複数のフレームを5一体とした
形で連続性を保持しつつ前記算出した自己相関係数の累
積値が最大となる経路に対応する形で各フレームのピッ
チ周期を算出しているため、簡単な構成によって高精度
にピッチ周期を抽出することができる。
As explained above, according to the present invention, when a vocal interval of a voice is divided into a plurality of frames and a pitch period is calculated using an autocorrelation coefficient obtained for each divided frame, This is because the pitch period of each frame is calculated in a form corresponding to the path that maximizes the cumulative value of the calculated autocorrelation coefficient while maintaining continuity by combining multiple frames divided into 5 frames. , the pitch period can be extracted with high accuracy using a simple configuration.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の1実施例構成図、第2図ないし第4図
は第1図図示本発明の1実施例構成の動作を説明する動
作説明図、第5図は本発明の他の実施例構成を説明する
説明図を示す。 図中、1はスペク十ル分析器(LPC) 、2は逆フィ
ルタ (INV) 、3はローパス・フィルタ(LPF
) 、4は残差相関計算器(Φ)、5は累積値計算部(
gij) 、6はピッチ抽出部(P、)、7は有声/無
声判定器(VUV) 、8は主制御部(CPU) 、9
.10はバッファ・メモリ (BF)、11はスイフチ
を表す。
FIG. 1 is a configuration diagram of one embodiment of the present invention, FIGS. 2 to 4 are operation explanatory diagrams explaining the operation of the configuration of one embodiment of the present invention shown in FIG. 1, and FIG. 5 is an illustration of another embodiment of the present invention. An explanatory diagram illustrating the configuration of the embodiment is shown. In the figure, 1 is a spectral analyzer (LPC), 2 is an inverse filter (INV), and 3 is a low-pass filter (LPF).
), 4 is a residual correlation calculator (Φ), and 5 is a cumulative value calculation unit (
gij), 6 is a pitch extractor (P,), 7 is a voiced/unvoiced determiner (VUV), 8 is a main control unit (CPU), 9
.. 10 represents a buffer memory (BF), and 11 represents a swift.

Claims (2)

【特許請求の範囲】[Claims] (1)音声の有声区間を抽出し、該抽出した有声区間の
音声信号に関する相関性を用いてピッチ周期を抽出する
ピッチ抽出処理方式において、前記抽出した有声区間を
複数のフレームに分割し、該分割したフレーム毎に夫々
音声の時間的な相関性を抽出する相関性抽出部と、該相
関性抽出部によって抽出された各フレーム内の音声の時
間的な相関性が相隣接するフレーム間で所定範囲内にあ
るような経路上で該相関性の累積値を前記分割した全て
の複数のフレームについて順次計算する累積値計算部と
、該累積値計算部によって計算された累積値が最大とな
る経路に該当するピッチ周期を前記各フレーム毎に順次
抽出するピッチ抽出部とを備えることを特徴とするピッ
チ抽出処理方式。
(1) In a pitch extraction processing method that extracts a voiced section of speech and extracts a pitch period using the correlation regarding the audio signal of the extracted voiced section, the extracted voiced section is divided into a plurality of frames, and A correlation extraction unit that extracts the temporal correlation of audio for each divided frame, and a correlation extraction unit that extracts the temporal correlation of audio in each frame for each divided frame; and a cumulative value calculation unit that sequentially calculates the cumulative value of the correlation for all the divided frames on a route that is within the range; and a route where the cumulative value calculated by the cumulative value calculation unit is maximum. A pitch extraction processing method, comprising: a pitch extraction unit that sequentially extracts a pitch period corresponding to each frame.
(2)前記抽出した有声区間を所定の長さの区間毎に分
割し、累積値は有声区間の先頭からの値を使用して該分
割した各区間毎に夫々ピッチ抽出処理を行うことを特徴
とする特許請求の範囲第(1)項記載のピッチ抽出処理
方式。
(2) The extracted voiced section is divided into sections of a predetermined length, and pitch extraction processing is performed for each of the divided sections using the accumulated value from the beginning of the voiced section. A pitch extraction processing method according to claim (1).
JP59177679A 1984-08-27 1984-08-27 Pitch extraction processing system Granted JPS6155700A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59177679A JPS6155700A (en) 1984-08-27 1984-08-27 Pitch extraction processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59177679A JPS6155700A (en) 1984-08-27 1984-08-27 Pitch extraction processing system

Publications (2)

Publication Number Publication Date
JPS6155700A true JPS6155700A (en) 1986-03-20
JPH0448239B2 JPH0448239B2 (en) 1992-08-06

Family

ID=16035207

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59177679A Granted JPS6155700A (en) 1984-08-27 1984-08-27 Pitch extraction processing system

Country Status (1)

Country Link
JP (1) JPS6155700A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008089651A (en) * 2006-09-29 2008-04-17 Casio Comput Co Ltd Speech encoding device, speech decoding device, speech encoding method, speech decoding method, and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4108317B2 (en) * 2001-11-13 2008-06-25 日本電気株式会社 Code conversion method and apparatus, program, and storage medium

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56126895A (en) * 1980-03-10 1981-10-05 Nippon Electric Co Voice analyzer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56126895A (en) * 1980-03-10 1981-10-05 Nippon Electric Co Voice analyzer

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008089651A (en) * 2006-09-29 2008-04-17 Casio Comput Co Ltd Speech encoding device, speech decoding device, speech encoding method, speech decoding method, and program

Also Published As

Publication number Publication date
JPH0448239B2 (en) 1992-08-06

Similar Documents

Publication Publication Date Title
EP1308928B1 (en) System and method for speech synthesis using a smoothing filter
JP2782147B2 (en) Waveform editing type speech synthesizer
JPS62160495A (en) Voice synthesization system
US8942977B2 (en) System and method for speech recognition using pitch-synchronous spectral parameters
JP2636685B2 (en) Music event index creation device
JP2612868B2 (en) Voice utterance speed conversion method
JPS6155700A (en) Pitch extraction processing system
JPH11259066A (en) Musical acoustic signal separation method, device therefor and program recording medium therefor
JP3266124B2 (en) Apparatus for detecting similar waveform in analog signal and time-base expansion / compression device for the same signal
JP2612867B2 (en) Voice pitch conversion method
US6590946B1 (en) Method and apparatus for time-warping a digitized waveform to have an approximately fixed period
US20050171777A1 (en) Generation of synthetic speech
WO2017164216A1 (en) Acoustic processing method and acoustic processing device
KR100359988B1 (en) real-time speaking rate conversion system
JPH0122639B2 (en)
JPH0736119B2 (en) Piecewise optimal function approximation method
JPH0883095A (en) Method and device for speech speed conversion
JPH0754438B2 (en) Voice processor
JPH0122638B2 (en)
JPS63231397A (en) Evaluation system of parameter for voice synthesization
JPH0635494A (en) Speech recognizing device
JPS597399A (en) Monosyllable voice recognition equipment
JPS6228800A (en) Drive signal generation for regular voice synthesization
JPS6265098A (en) Music vocoder
JPH0225520B2 (en)