JPH09198098A - 音声信号のピッチ検出方法および装置 - Google Patents

音声信号のピッチ検出方法および装置

Info

Publication number
JPH09198098A
JPH09198098A JP2624296A JP2624296A JPH09198098A JP H09198098 A JPH09198098 A JP H09198098A JP 2624296 A JP2624296 A JP 2624296A JP 2624296 A JP2624296 A JP 2624296A JP H09198098 A JPH09198098 A JP H09198098A
Authority
JP
Japan
Prior art keywords
pitch
value
prediction residual
sound
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2624296A
Other languages
English (en)
Other versions
JP3571448B2 (ja
Inventor
Isao Tejima
功 手嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kokusai Electric Corp
Original Assignee
Kokusai Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Electric Corp filed Critical Kokusai Electric Corp
Priority to JP2624296A priority Critical patent/JP3571448B2/ja
Publication of JPH09198098A publication Critical patent/JPH09198098A/ja
Application granted granted Critical
Publication of JP3571448B2 publication Critical patent/JP3571448B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】分析合成系音声符号化方式における有声音のピ
ッチ周期が長いとき、分析フレーム内にピッチ波形が1
しか現れないとき、分析フレーム内で電力包絡変動があ
るときでも確実にピッチを検出できるようにする。 【解決手段】LPC分析器1と逆フィルタ2によって得
られた現フレームの予測残差信号と予測残差バッファ
4,5に格納されている直前フレームの予測残差信号と
の相互相関r(i)を求め、次に、0次の相互相関値r
(0)で正規化した後重み付けを施し、次にi=0以外
の最大値を検出して判定閾値θと比較し、r(τ)≦θ
なら無声音と判定してピッチ周期T=0とし、r(τ)
≧θなら有声音と判定してT=τを出力するようにし
た。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号をディジ
タル信号の形式に変換して伝送する音声符号化方式に関
し、特に、情報量を削減することによって伝送速度を低
速化して狭帯域化を図り伝送帯域の有効利用を図る音声
符号化通信の一つである分析合成音声符号化方式におけ
る音声信号の基本周波数(ピッチ周期)を検出する方法
及び装置に関するものである。
【0002】
【従来の技術】分析合成系の音声符号化方式において
は、スペクトル包絡パラメータの抽出と並行して、音源
パラメータ、すなわち声帯振動の有無(有声/無声)、
有声音のときの基本周波数(ピッチ周期)及び音源振幅
の推定が必要である。具体的なピッチ周期の推定方法を
LPC(線形予測符号化)方式で説明する。
【0003】LPC方式の送受信回路のブロック図を図
3に示す。図3から分かるように、入力音声信号を線形
予測分析して得られたLPC係数と、有声音のピッチ分
析によって得られたピッチ周期,有声/無声(V/U
V)フラグ,パワーとを符号化した後、多重化して伝送
し、受信側でその逆処理によって再生音声を出力する。
すなわち、線形予測分析によってスペクトル包絡パラメ
ータを推定し、逆フィルタによってスペクトル包絡を取
り除いた予測残差信号を算出する。予測が完全に行われ
れば、残差波形は全くランダムな誤差を表す波形のみと
なり、平坦なパワースペクトルを持つ。
【0004】音声波形において、有声音部では、音源は
声帯の振動によるほぼ周期的なパルス列と考えられる。
音声波形の線形予測分析では、外から観測することので
きない入力(音源)を1個のインパルスまたは白色ラン
ダム雑音と仮定してシステムを同定している。従って、
1個のインパルス入力による出力の範囲では残差波形は
小さなランダムな予測誤差と考えられるが、入力として
新しいインパルスが入力されると予測は大幅に狂い、振
幅の大きな残差波形を生ずる。しかし、いったん入力が
印加され、系の出力がそのインパルス入力に対する応答
とみられる区間にはいると、また残差波形は本来の予測
誤差となり、振幅の小さなランダムな波形となる。入力
として新しいインパルス(声帯の振動によるピッチパル
ス)が加わる毎にこの変化を繰り返す。、その結果、残
差波形にピッチパルスと同じ周期でパルス的波形が現れ
ることになる。
【0005】その入力信号波形と予測残差信号波形の例
を図4に示す。(A)は入力音声波形(有声音)を示
し、(B)は予測残差波形を示す。一方、入力音源が白
色ランダム雑音で近似できる無声子音部の区間では、残
差波形はほぼ白色ランダム雑音となる。このように残差
波形は励振音源波形の近似となっている。
【0006】有声音/無声音の判定、有声音の場合のピ
ッチ周期の検出は、残差信号の自己相関関数によって求
められる。自己相関r(τ)を次の(1)式に表す。
【0007】
【数1】 但し、i=0,1,2,3,…,N−1、N=フレーム
【0008】自己相関関数の例を図5に示す。次に、0
次の自己相関値r(0)で自己相関r(i)を正規化す
る。正規化された自己相関の中からi=0以外の正の最
大値を探し、その時のiの値をτとする。そこで有声/
無声の判定閾値θとr(τ)を比較し、r(τ)≦θな
らば無声音と判定してピッチ周期T=0とする。逆にr
(τ)≧θならば有声音と判定してピッチ周期T=τと
する。通常の判定閾値θは0.2〜0.25程度に設定
される。
【0009】
【発明が解決しようとする課題】しかしこの方法の場
合、自己相関関数は高次になるに従って積和算の回数が
減ることから、ピッチ周期が長い場合、有声音であるに
も関わらず自己相関関数が判定閾値θを下回り無声音と
判定される場合や、ピッチ周期が長く分析フレーム内に
ピッチ波形が一つしか現れない場合や、フレーム内で電
力包絡変動がある場合などには有声音であっても自己相
関のピークが立たず無声音と判定され、誤判定が発生し
ていた。
【0010】本発明は上記の事情に鑑みてなされたもの
で、ピッチ周期が長い場合や、分析フレーム内にピッチ
波形が一つしか現れない場合、分析フレーム内で電力包
絡変動がある場合であっても正確にピッチを検出するこ
とのできるピッチ検出方法及び装置を提供することを目
的とする。
【0011】
【課題を解決するための手段】上記課題を解決するため
に、従来は予測残差信号の自己相関関数値からピッチを
推定していたものを、本発明では、予測残差信号の相互
相関関数から推定することにより正確に検出できるよう
にしたことを要旨とする。
【0012】すなわち、本発明のピッチ検出方法は、ま
ず、離散化されフレーム化された音声信号を入力とし一
連の線形予測分析によって予測残差信号すなわち音源信
号を算出し、次に、この予測残差信号と時間軸上で連接
している直前のフレームの予測残差信号との相互相関関
数r(i)を求め、次に、0次の相互相関値r(0)で
r(i)を正規化し、i=0以外の正の最大値を探して
その時のiの値をτとし、音声/無声の判定閾値θとr
(τ)を比較し、r(τ)≦θならば無声音と判定して
ピッチ周期T=0とし、逆にr(τ)≧θならば有声音
と判定してピッチ周期T=τとすることで正確にピッチ
検出を行うことができるようにしたことを特徴とするも
のである。
【0013】
【発明の実施の形態】図1は本発明の実施例を示すブロ
ック図である。図において、1はLPCパラメータ分析
器、2は逆フィルタ、3,4,5は予測残差バッファ、
6は相互相関器、7は相関値バッファ、8は正規化器、
9は重み付け器、10は最大値検出器、11は判定器で
ある。図1に従って本発明を説明する。まず本実施例で
は、スペクトルパラメータ分析にLPC分析を用いるこ
ととした。まず、離散化しフレーム化された音声信号を
入力し、LPC分析器1によって、音声信号からLPC
パラメータを取り出す。次に、逆フィルタ2によって、
音声信号からLPCパラメータ分析器1により求めたL
PCパラメータを取り除いた予測残差信号を算出し予測
誤差バッファ3及び4に格納する。
【0014】次に、予測残差信号を分析し有声/無声判
定,ピッチ周期検出を行う。そこで相互相関器6によっ
て図2に示すように、予測残差信号バッファ3を時間軸
を後ろ向きにずらし予測残差信号バッファ4から直前の
フレームの予測残差信号バッファ5に向かって相互相関
関数を求め相関バッファ7に格納する。
【0015】次に、正規化器8によって相関バッファ7
に格納されている最初のデータ、即ち0次の相互相関値
r(0)で相関バッファ7内のすべての相関値r(i)
を正規化する。自己相関の場合は0次の相関値が最も高
く、高次になるに従って積和算の回数が減少するため相
関値も小さくなるが、相互相関の場合は、常に積和算の
回数は一定のため、振幅変動によっては高次の方が0次
よりも高くなる場合がある。そこで重み付け器9で正規
化された相関値r(i)を(2)式によって重み付けす
る。
【0016】
【数2】 但し、i=0,1,2,3…,N−1、N=分析フレー
【0017】次に、最大検出器10でr(i)のi=0
以外の正の最大値を検出し、さらにその時のiの値を検
出する。次に、判定器11によって、予め設定した有声
/無声の判定閾値θとr(τ)を比較し、r(τ)≦θ
ならば無声音と判定してピッチ周期T=0とし、逆にr
(τ)≧θならば有声音と判定してピッチ周期T=τと
して出力する。以上の手順によってピッチ周期の推定お
よび有声音/無声音の判定を行う。最後に現フレームの
予測残差信号を直前フレームの予測残差信号バッファ5
に移動する。
【0018】
【発明の効果】以上述べたように本発明によれば、音声
信号をディジタル信号の形式に変換して伝送する場合に
おいて、分析合成型の音声符号化方式の音源分析におい
て、ピッチ周期が長い場合や、分析フレーム内にピッチ
波形が一つしか現れない場合、分析フレーム内で電力包
絡変動がある場合であっても正確にピッチを検出できる
ので実用上の効果は大きい。
【図面の簡単な説明】
【図1】本発明の実施例を示すブロック図である。
【図2】本発明の相互相関値算出法の説明図である。
【図3】LPC方式の送受信回路のブロック図である。
【図4】入力音声波形(有声音)と予測残差波形例図で
ある。
【図5】自己相関関数の説明図である。
【符号の説明】
1 LSPパラメータ分析器 2 逆フィルタ 3 予測残差バッファ 4 予測残差バッファ 5 前フレームの予測残差バッファ 6 相互相関器 7 相関値バッファ 8 正規化器 9 重み付け器 10 最大値検出器 11 判定器

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 離散化されフレーム化された音声信号を
    入力とし一連の線形予測分析によって予測残差信号すな
    わち音源信号を算出し、現フレームの予測残差信号と直
    前のフレームの予測残差信号との自己相関関数r(i)
    (但し、i=0,1,2,…,N−1、N=フレーム
    長)を求め、次に0次の相互相関値r(0)で前記自己
    相関関数r(i)を正規化し、次に正規化された相互相
    関値に重み付けを施し、次に相互相関値のi=0以外の
    正の最大値を探してその時のiの値をτとし、該最大値
    r(τ)と有声/無声の判定閾値θとを比較し、r
    (τ)≦θならば無声音と判定してピッチ周期T=0と
    し、逆にr(τ)≧θならば有声音と判定してピッチ周
    期T=τとして出力することを特徴とする音声信号のピ
    ッチ検出方法。
  2. 【請求項2】 A/D変換されフレーム化された音声信
    号の予測残差信号を算出する線形予測分析手段と、 該線形予測分析手段によって得られた現フレームの予測
    残差信号と直前のフレームの予測残差信号との相互相関
    関数r(i)(但し、i=0,1,2,…,N−1、N
    =フレーム長)を求める相互相関器と、 0次の相互相関値r(0)で前記相互相関関数r(i)
    を正規化する正規化器と、 該正規化器の出力に重み付けをする重み付け器と、 該重み付け器の出力の中からi=0以外の正の最大値を
    探してその時のiの値をτとして最大値r(τ)を出力
    する最大値検出器と、 前記最大値r(τ)と有声/無声の判定閾値θとを比較
    し、r(τ)≦θならば無声音と判定してピッチ周期T
    =0の情報を出力し、逆にr(τ)≧θならば有声音と
    判定してピッチ周期T=τの情報を出力する判定器とを
    備えたことを特徴とする音声信号のピッチ検出装置。
JP2624296A 1996-01-22 1996-01-22 音声信号のピッチ検出方法および装置 Expired - Fee Related JP3571448B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2624296A JP3571448B2 (ja) 1996-01-22 1996-01-22 音声信号のピッチ検出方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2624296A JP3571448B2 (ja) 1996-01-22 1996-01-22 音声信号のピッチ検出方法および装置

Publications (2)

Publication Number Publication Date
JPH09198098A true JPH09198098A (ja) 1997-07-31
JP3571448B2 JP3571448B2 (ja) 2004-09-29

Family

ID=12187842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2624296A Expired - Fee Related JP3571448B2 (ja) 1996-01-22 1996-01-22 音声信号のピッチ検出方法および装置

Country Status (1)

Country Link
JP (1) JP3571448B2 (ja)

Also Published As

Publication number Publication date
JP3571448B2 (ja) 2004-09-29

Similar Documents

Publication Publication Date Title
EP0235181B1 (en) A parallel processing pitch detector
EP0335521B1 (en) Voice activity detection
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
US20050159942A1 (en) Classification of speech and music using linear predictive coding coefficients
SE470577B (sv) Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
US6954726B2 (en) Method and device for estimating the pitch of a speech signal using a binary signal
US4845753A (en) Pitch detecting device
US5812966A (en) Pitch searching time reducing method for code excited linear prediction vocoder using line spectral pair
KR20090080777A (ko) 신호 검출 방법 및 장치
JPH0844395A (ja) 音声ピッチ検出装置
JP3571448B2 (ja) 音声信号のピッチ検出方法および装置
JP2564821B2 (ja) 音声判定検出装置
US8306828B2 (en) Method and apparatus for audio signal expansion and compression
CN1971707A (zh) 一种进行基音周期估计和清浊判决的方法及装置
US20010029447A1 (en) Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor
JP3520430B2 (ja) 左右音像方向抽出方法
JP2656069B2 (ja) 音声検出装置
JPH04100099A (ja) 音声検出装置
KR0171004B1 (ko) Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법
EP1143414A1 (en) Estimating the pitch of a speech signal using previous estimates
KR0138878B1 (ko) 보코더용 피치검색 처리시간 단축법
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
EP1143412A1 (en) Estimating the pitch of a speech signal using an intermediate binary signal
JPS63237100A (ja) 音声検出器
EP1143413A1 (en) Estimating the pitch of a speech signal using an average distance between peaks

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040414

A131 Notification of reasons for refusal

Effective date: 20040427

Free format text: JAPANESE INTERMEDIATE CODE: A131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040622

A61 First payment of annual fees (during grant procedure)

Effective date: 20040624

Free format text: JAPANESE INTERMEDIATE CODE: A61

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 5

Free format text: PAYMENT UNTIL: 20090702

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100702

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 7

Free format text: PAYMENT UNTIL: 20110702

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 8

Free format text: PAYMENT UNTIL: 20120702

LAPS Cancellation because of no payment of annual fees