JPH09198098A - 音声信号のピッチ検出方法および装置 - Google Patents
音声信号のピッチ検出方法および装置Info
- Publication number
- JPH09198098A JPH09198098A JP2624296A JP2624296A JPH09198098A JP H09198098 A JPH09198098 A JP H09198098A JP 2624296 A JP2624296 A JP 2624296A JP 2624296 A JP2624296 A JP 2624296A JP H09198098 A JPH09198098 A JP H09198098A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- value
- prediction residual
- sound
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
ッチ周期が長いとき、分析フレーム内にピッチ波形が1
しか現れないとき、分析フレーム内で電力包絡変動があ
るときでも確実にピッチを検出できるようにする。 【解決手段】LPC分析器1と逆フィルタ2によって得
られた現フレームの予測残差信号と予測残差バッファ
4,5に格納されている直前フレームの予測残差信号と
の相互相関r(i)を求め、次に、0次の相互相関値r
(0)で正規化した後重み付けを施し、次にi=0以外
の最大値を検出して判定閾値θと比較し、r(τ)≦θ
なら無声音と判定してピッチ周期T=0とし、r(τ)
≧θなら有声音と判定してT=τを出力するようにし
た。
Description
タル信号の形式に変換して伝送する音声符号化方式に関
し、特に、情報量を削減することによって伝送速度を低
速化して狭帯域化を図り伝送帯域の有効利用を図る音声
符号化通信の一つである分析合成音声符号化方式におけ
る音声信号の基本周波数(ピッチ周期)を検出する方法
及び装置に関するものである。
は、スペクトル包絡パラメータの抽出と並行して、音源
パラメータ、すなわち声帯振動の有無(有声/無声)、
有声音のときの基本周波数(ピッチ周期)及び音源振幅
の推定が必要である。具体的なピッチ周期の推定方法を
LPC(線形予測符号化)方式で説明する。
3に示す。図3から分かるように、入力音声信号を線形
予測分析して得られたLPC係数と、有声音のピッチ分
析によって得られたピッチ周期,有声/無声(V/U
V)フラグ,パワーとを符号化した後、多重化して伝送
し、受信側でその逆処理によって再生音声を出力する。
すなわち、線形予測分析によってスペクトル包絡パラメ
ータを推定し、逆フィルタによってスペクトル包絡を取
り除いた予測残差信号を算出する。予測が完全に行われ
れば、残差波形は全くランダムな誤差を表す波形のみと
なり、平坦なパワースペクトルを持つ。
声帯の振動によるほぼ周期的なパルス列と考えられる。
音声波形の線形予測分析では、外から観測することので
きない入力(音源)を1個のインパルスまたは白色ラン
ダム雑音と仮定してシステムを同定している。従って、
1個のインパルス入力による出力の範囲では残差波形は
小さなランダムな予測誤差と考えられるが、入力として
新しいインパルスが入力されると予測は大幅に狂い、振
幅の大きな残差波形を生ずる。しかし、いったん入力が
印加され、系の出力がそのインパルス入力に対する応答
とみられる区間にはいると、また残差波形は本来の予測
誤差となり、振幅の小さなランダムな波形となる。入力
として新しいインパルス(声帯の振動によるピッチパル
ス)が加わる毎にこの変化を繰り返す。、その結果、残
差波形にピッチパルスと同じ周期でパルス的波形が現れ
ることになる。
を図4に示す。(A)は入力音声波形(有声音)を示
し、(B)は予測残差波形を示す。一方、入力音源が白
色ランダム雑音で近似できる無声子音部の区間では、残
差波形はほぼ白色ランダム雑音となる。このように残差
波形は励振音源波形の近似となっている。
ッチ周期の検出は、残差信号の自己相関関数によって求
められる。自己相関r(τ)を次の(1)式に表す。
長
次の自己相関値r(0)で自己相関r(i)を正規化す
る。正規化された自己相関の中からi=0以外の正の最
大値を探し、その時のiの値をτとする。そこで有声/
無声の判定閾値θとr(τ)を比較し、r(τ)≦θな
らば無声音と判定してピッチ周期T=0とする。逆にr
(τ)≧θならば有声音と判定してピッチ周期T=τと
する。通常の判定閾値θは0.2〜0.25程度に設定
される。
合、自己相関関数は高次になるに従って積和算の回数が
減ることから、ピッチ周期が長い場合、有声音であるに
も関わらず自己相関関数が判定閾値θを下回り無声音と
判定される場合や、ピッチ周期が長く分析フレーム内に
ピッチ波形が一つしか現れない場合や、フレーム内で電
力包絡変動がある場合などには有声音であっても自己相
関のピークが立たず無声音と判定され、誤判定が発生し
ていた。
で、ピッチ周期が長い場合や、分析フレーム内にピッチ
波形が一つしか現れない場合、分析フレーム内で電力包
絡変動がある場合であっても正確にピッチを検出するこ
とのできるピッチ検出方法及び装置を提供することを目
的とする。
に、従来は予測残差信号の自己相関関数値からピッチを
推定していたものを、本発明では、予測残差信号の相互
相関関数から推定することにより正確に検出できるよう
にしたことを要旨とする。
ず、離散化されフレーム化された音声信号を入力とし一
連の線形予測分析によって予測残差信号すなわち音源信
号を算出し、次に、この予測残差信号と時間軸上で連接
している直前のフレームの予測残差信号との相互相関関
数r(i)を求め、次に、0次の相互相関値r(0)で
r(i)を正規化し、i=0以外の正の最大値を探して
その時のiの値をτとし、音声/無声の判定閾値θとr
(τ)を比較し、r(τ)≦θならば無声音と判定して
ピッチ周期T=0とし、逆にr(τ)≧θならば有声音
と判定してピッチ周期T=τとすることで正確にピッチ
検出を行うことができるようにしたことを特徴とするも
のである。
ック図である。図において、1はLPCパラメータ分析
器、2は逆フィルタ、3,4,5は予測残差バッファ、
6は相互相関器、7は相関値バッファ、8は正規化器、
9は重み付け器、10は最大値検出器、11は判定器で
ある。図1に従って本発明を説明する。まず本実施例で
は、スペクトルパラメータ分析にLPC分析を用いるこ
ととした。まず、離散化しフレーム化された音声信号を
入力し、LPC分析器1によって、音声信号からLPC
パラメータを取り出す。次に、逆フィルタ2によって、
音声信号からLPCパラメータ分析器1により求めたL
PCパラメータを取り除いた予測残差信号を算出し予測
誤差バッファ3及び4に格納する。
定,ピッチ周期検出を行う。そこで相互相関器6によっ
て図2に示すように、予測残差信号バッファ3を時間軸
を後ろ向きにずらし予測残差信号バッファ4から直前の
フレームの予測残差信号バッファ5に向かって相互相関
関数を求め相関バッファ7に格納する。
に格納されている最初のデータ、即ち0次の相互相関値
r(0)で相関バッファ7内のすべての相関値r(i)
を正規化する。自己相関の場合は0次の相関値が最も高
く、高次になるに従って積和算の回数が減少するため相
関値も小さくなるが、相互相関の場合は、常に積和算の
回数は一定のため、振幅変動によっては高次の方が0次
よりも高くなる場合がある。そこで重み付け器9で正規
化された相関値r(i)を(2)式によって重み付けす
る。
ム
以外の正の最大値を検出し、さらにその時のiの値を検
出する。次に、判定器11によって、予め設定した有声
/無声の判定閾値θとr(τ)を比較し、r(τ)≦θ
ならば無声音と判定してピッチ周期T=0とし、逆にr
(τ)≧θならば有声音と判定してピッチ周期T=τと
して出力する。以上の手順によってピッチ周期の推定お
よび有声音/無声音の判定を行う。最後に現フレームの
予測残差信号を直前フレームの予測残差信号バッファ5
に移動する。
信号をディジタル信号の形式に変換して伝送する場合に
おいて、分析合成型の音声符号化方式の音源分析におい
て、ピッチ周期が長い場合や、分析フレーム内にピッチ
波形が一つしか現れない場合、分析フレーム内で電力包
絡変動がある場合であっても正確にピッチを検出できる
ので実用上の効果は大きい。
ある。
Claims (2)
- 【請求項1】 離散化されフレーム化された音声信号を
入力とし一連の線形予測分析によって予測残差信号すな
わち音源信号を算出し、現フレームの予測残差信号と直
前のフレームの予測残差信号との自己相関関数r(i)
(但し、i=0,1,2,…,N−1、N=フレーム
長)を求め、次に0次の相互相関値r(0)で前記自己
相関関数r(i)を正規化し、次に正規化された相互相
関値に重み付けを施し、次に相互相関値のi=0以外の
正の最大値を探してその時のiの値をτとし、該最大値
r(τ)と有声/無声の判定閾値θとを比較し、r
(τ)≦θならば無声音と判定してピッチ周期T=0と
し、逆にr(τ)≧θならば有声音と判定してピッチ周
期T=τとして出力することを特徴とする音声信号のピ
ッチ検出方法。 - 【請求項2】 A/D変換されフレーム化された音声信
号の予測残差信号を算出する線形予測分析手段と、 該線形予測分析手段によって得られた現フレームの予測
残差信号と直前のフレームの予測残差信号との相互相関
関数r(i)(但し、i=0,1,2,…,N−1、N
=フレーム長)を求める相互相関器と、 0次の相互相関値r(0)で前記相互相関関数r(i)
を正規化する正規化器と、 該正規化器の出力に重み付けをする重み付け器と、 該重み付け器の出力の中からi=0以外の正の最大値を
探してその時のiの値をτとして最大値r(τ)を出力
する最大値検出器と、 前記最大値r(τ)と有声/無声の判定閾値θとを比較
し、r(τ)≦θならば無声音と判定してピッチ周期T
=0の情報を出力し、逆にr(τ)≧θならば有声音と
判定してピッチ周期T=τの情報を出力する判定器とを
備えたことを特徴とする音声信号のピッチ検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2624296A JP3571448B2 (ja) | 1996-01-22 | 1996-01-22 | 音声信号のピッチ検出方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2624296A JP3571448B2 (ja) | 1996-01-22 | 1996-01-22 | 音声信号のピッチ検出方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09198098A true JPH09198098A (ja) | 1997-07-31 |
JP3571448B2 JP3571448B2 (ja) | 2004-09-29 |
Family
ID=12187842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2624296A Expired - Fee Related JP3571448B2 (ja) | 1996-01-22 | 1996-01-22 | 音声信号のピッチ検出方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3571448B2 (ja) |
-
1996
- 1996-01-22 JP JP2624296A patent/JP3571448B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP3571448B2 (ja) | 2004-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0235181B1 (en) | A parallel processing pitch detector | |
EP0335521B1 (en) | Voice activity detection | |
US6865529B2 (en) | Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor | |
US20050159942A1 (en) | Classification of speech and music using linear predictive coding coefficients | |
SE470577B (sv) | Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud | |
US6954726B2 (en) | Method and device for estimating the pitch of a speech signal using a binary signal | |
US4845753A (en) | Pitch detecting device | |
US5812966A (en) | Pitch searching time reducing method for code excited linear prediction vocoder using line spectral pair | |
KR20090080777A (ko) | 신호 검출 방법 및 장치 | |
JPH0844395A (ja) | 音声ピッチ検出装置 | |
JP3571448B2 (ja) | 音声信号のピッチ検出方法および装置 | |
JP2564821B2 (ja) | 音声判定検出装置 | |
US8306828B2 (en) | Method and apparatus for audio signal expansion and compression | |
CN1971707A (zh) | 一种进行基音周期估计和清浊判决的方法及装置 | |
US20010029447A1 (en) | Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor | |
JP3520430B2 (ja) | 左右音像方向抽出方法 | |
JP2656069B2 (ja) | 音声検出装置 | |
JPH04100099A (ja) | 音声検出装置 | |
KR0171004B1 (ko) | Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법 | |
EP1143414A1 (en) | Estimating the pitch of a speech signal using previous estimates | |
KR0138878B1 (ko) | 보코더용 피치검색 처리시간 단축법 | |
JPH05224698A (ja) | ピッチサイクル波形を平滑化する方法及び装置 | |
EP1143412A1 (en) | Estimating the pitch of a speech signal using an intermediate binary signal | |
JPS63237100A (ja) | 音声検出器 | |
EP1143413A1 (en) | Estimating the pitch of a speech signal using an average distance between peaks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040414 |
|
A131 | Notification of reasons for refusal |
Effective date: 20040427 Free format text: JAPANESE INTERMEDIATE CODE: A131 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040524 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040622 |
|
A61 | First payment of annual fees (during grant procedure) |
Effective date: 20040624 Free format text: JAPANESE INTERMEDIATE CODE: A61 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 5 Free format text: PAYMENT UNTIL: 20090702 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100702 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 7 Free format text: PAYMENT UNTIL: 20110702 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 8 Free format text: PAYMENT UNTIL: 20120702 |
|
LAPS | Cancellation because of no payment of annual fees |