JPS6051720B2 - 音声の基本周期抽出装置 - Google Patents

音声の基本周期抽出装置

Info

Publication number
JPS6051720B2
JPS6051720B2 JP50102473A JP10247375A JPS6051720B2 JP S6051720 B2 JPS6051720 B2 JP S6051720B2 JP 50102473 A JP50102473 A JP 50102473A JP 10247375 A JP10247375 A JP 10247375A JP S6051720 B2 JPS6051720 B2 JP S6051720B2
Authority
JP
Japan
Prior art keywords
speech
residual signal
signal
fundamental period
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP50102473A
Other languages
English (en)
Other versions
JPS5226107A (en
Inventor
信彦 北脇
新一郎 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP50102473A priority Critical patent/JPS6051720B2/ja
Priority to DE2636032A priority patent/DE2636032C3/de
Priority to CA258,894A priority patent/CA1061906A/en
Priority to FR7624788A priority patent/FR2321738A1/fr
Priority to US05/715,399 priority patent/US4081605A/en
Priority to GB34670/76A priority patent/GB1555254A/en
Publication of JPS5226107A publication Critical patent/JPS5226107A/ja
Publication of JPS6051720B2 publication Critical patent/JPS6051720B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Television Receiver Circuits (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 本発明は、音声分析装置を経済的に構成するための音声
基本周期抽出装置に関するものである。
従来、音声分析合成方式として、帯域フィルタ群による
短時間スペクトル分析、あるいは零交差法によるホルマ
ント周波数軌跡等、種々の方式が提案されているが、そ
れらの中で、例えば部分自己相関方式は情報圧縮率、合
成音声の品質、音声の特徴パラメータの自動抽出等の点
で最も優れた方式の一つであることが知られている。第
1図は、部分自己相関方式を用いた従来の装置の一例を
示すブロック構成図である。
図中、1は音声入力端子、2はA−D変換器、3は部分
自己相関係数抽出装置、4は部分自己相関器、5は部分
自己相関係数出力端子、6は残置端子、7は音源情報抽
出装置、8は音声の基本周期抽出装置、9は音声期本周
期出力端子、10は音声の振幅算出器、11は音声の振
幅出力端子、12は有声無声判定器、13は有声音係数
、無声音係数出力端子である。
入力端子1に加えられた音声信号(x、)は、A−D変
換器2よりたとえは標本化周波数8KH2)量子化ビッ
ト数符号+11ビットの条件でディジタル信号に変換さ
れ、部分自己相関係数抽出装置3に入力される。
部分自己相関係数抽出装置は、縦続接続された約10段
程度の部分自己相関器4によつて構成される。
部分自己相関器4では、音声信号の近接標本値開の相関
が部分自己相関係数に、として出力端J子5に取出され
る。抽出された近接標本値開の相関成分は、音声信号か
ら除去され、次の段に入る。このような処理を重ねるに
つれて、音声信号の近接標本値開の相関は部分自己相関
係数として除・去しつくされ、最終段の出力6には音声
の音源情報に関する比較的遠い波形の相関のみが残され
る。
残差端子6における部分自己相関係数抽出装置の出力を
、残差(ε,)と呼ぶ。同じように、一般に音声波の近
似スペクトルの逆特性を有するフィルタに音声波を通し
たときに得られる出力波を残差と呼ぶが、以下の説明で
は、部分自己相関係数を用いる方法を例にとつて説明す
る。音声の振幅算出器10によつて音声の振幅Lが、ま
た有声・無声判定器12によつて有声音係数V1無声音
係数UVが抽出され、それぞれ9,11,13の端子に
出力される。
このようにして抽出された音声の特徴パラメータKl,
i=1〜10..T,■,UV,Lは量子化して5ミリ
〜15ミリ秒程度のフレーム周期で伝送される。
受信側では、これらのパラメータにより制御される部分
自己相関係音声合成器によつて、もとの音声を復元する
ことができる。つぎに、従来の音声基本周期抽出装置8
の詳細な構成例を第2図に示す。
図中、14は記憶装置、22は同じく記憶装置、15は
自己相関器、16は最大値抽出器、17は残差の相関係
数の出力端子、18は最大値の出力端子である。残差信
号から音声の基本周期の2〜3倍の短区間(約20〜4
0ミリ秒)が切り出され、記憶装置14に蓄えられる。
次に、1フレーム分の標本値が記憶装置22に格納され
る。周期信号の相関関数は位相が無視される結果、もと
の信号では必らずしも明瞭でない基本周期が最大値の周
期的なくり返しとして明らかになることから、残差の相
関関数を自己相関器15によつて算出する。つぎに残差
の相関関数の最大値を基本周期の探索範囲(2ミリ秒〜
20ミリ秒)を設けて最大値抽出回路16で検出する。
検出した最大値の位置が音声の基本周期として9に出力
され、その値が18のに出力される。上記の装置では、
残差信号が音声スペクトルの.微細構造のみを表現する
信号であるため、インパルス状の波形をしていて、標本
化周期を非常に細かくしないと、誤まつて倍周期、半周
期を抽出しやずいという欠点をもつていた。また残差信
号を低ビットで表現すると特にこの傾向が著るしく、。
残査の低ビット量子化が困難であるという欠点があつた
。したがつて、残差信号を表現する演算精度は12ビッ
ト程度必要て、このとき自己相関器15では12ビット
Xl2ビットの積和を約10ミリ秒程度の短時間内に約
2〜3万回算出することが必要で、非常に高速の素子を
必要とする欠点があつた。第3図に短区間の残差波形を
、第4図に残差波形を12ビットで表現したときの相関
係数を示す。音声の基本周期1Tは上記の理由で倍周期
丁に誤つている。本発明は上記の事情に埠みてなされた
もので、残差信号に含まれる不要な高周波成分を低域洒
波器によつて遮断することによつて低ビット量子化・を
可能にし、音声基本周期抽出装置を低速素子で構成可能
とすることを目的としたもので、残差信号に含まれる不
要な高周波成分を遮断する第1の装置と、この装置から
出力された信号を正負の符号のみの情報を用いて残差信
号の零交差波に変換する第2の装置と、該残差信号の零
交差波形から一定区間毎に一定区間長だけ切り出す第3
の装置と、これを1フレーム分だけ蓄積しておく第4の
装置と、自己相関係数を算出する第5の装置と、算出さ
れた相関係数の最大値の位置と大きさを検゜出する第6
の装置とを有し、その特徴とするところは、低速素子に
よる構成で音声基本周期を実時間で抽出できるところに
ある。
以下図面について詳細に説明する。本発明の一実施例を
第5図に示す。
6は残差信号の入力端子、19は低域戸波器、20は符
号器、21は符号器出力端子、14は現フレームの残差
零交差波を記憶しておく記憶装置、22は前フレームの
残差零交差波を記憶しておく記憶装置、15は残差零交
差波の相関係数を計算する自己相関器、17は自己相関
器出力端子、16は最大値抽出器、9は音声の基本周波
出力端子、18は相関係数の最大値出力端子てある。
音声の基本周期抽出においては、普通基本周期の2〜3
倍の区間20〜40ミリ秒を分析対象とし、分析区間を
5〜15ミリ秒づつずらしながら行なわれる。
ここでは一実施例として、標本化周波数8KHZ1量子
化ビット数符号+11ビットでディジタル信号に変換さ
れた残差信号から、基本周期を抽出する場合について説
明する。また1回の分析において対象とする音声区間(
フレーム)の長さを20ミリ秒、標本数にして160標
本値であるとし、このフレームを10ミリ秒、標本数で
は8(EIづつずらしながら基本周期を抽出することと
する。入力端子6に125μSec毎の間隔で入力され
た残差信号は、低域沖波器19によつて不要な高周波成
分が除去され、符号器20に入力される。符号器では信
号をピーククリップあるいは量子化等の操作によつて低
ビットで表現される。最も極端な場合が残差信号の正負
の符号のみの情報から作られた零交差波である。符号化
された信号は8蕉本値分が記憶装置14に蓄えられる。
記憶装置14にはシフトレジスタなどが用いられ、その
大きさは本実施例では1ビット×a語である。記憶装置
14に8咋の標本値が書きこまれると、次の標本値が到
達する以前、すなわち125μSec経過する以前に記
憶装置14の内容は次の記憶装置22に移され、新らし
い標本値は記憶装置14に蓄えられはじめる。記憶装置
−2−2は1フレーム分の標本値を収容する大きさを有
し、本実施例では1ビット×160語である。直前のフ
レームの標本値80個と新らたに記憶装置14から移さ
れた標本値80個と、合計160標本値で1フレームを
なす。記憶装置22には、シフトレジスタなどが用いら
れる。次に、自己相関器15において、遅れ10欧程度
までの自己相関係数が算出される。音声の基本周期は最
大値抽出器16で、遅れ20から100までの探索範囲
における最大の自己相関係数の位置として求められ、音
声の期本周期出力端子9に出力される。そのときの値が
18に出力される。上述した本発明による音声基本周期
抽出装置は、残差信号に含まれる不要な高周波成分を低
域淵波器によつて遮断する構造になつているため、その
相関係数の最大値が非常に明確に検出できる効果がある
したがつて、この結果を利用して、低域沖波器出力の残
差信号を正負の符号のみからなる零交差波で表現するこ
とによつて、演算規模を著るしく減少させることができ
る。第6図は、残差信号をCutOff5OOHZ2次
CR形低域淵波器に通したときに波形の一例である。第
7図は、第6図の波形を12ビットで表現したときの相
関係数、第8図は1ビット量子化(符号のみ)したとき
の相関係数である。音声の基本周期Tは倍周期丁に誤る
ことなく正しく抽出されており、低域戸波器に通すこと
の効果は明らかである。つぎに、符号器20に必要な演
算精度を求めるために、女性3名の発声による約3.醗
の文章音声から、本発明による装置によつて音声の基本
周期を求めた、演算精度を12ビットから1ビットまで
かえて、文章音声中の有声音区間における基本周期の抽
出誤まりを、有声音区間の全フレーム数で規格化(%)
したものを第9図に示す。
従来の基本周期抽出装置では、誤まりが約10(%)程
度あつたものが、本発明の装置では1(%)以下になつ
ていることがわかる。特に1ビット量子化(符号のみ)
相関でも十分な精度が得られる。上記説明は、部分自己
相関係数をパラメータとして音声波形を表現する場合の
音声分析方式に例を取つて行なつたものであるが、一般
に音声波の近似スペクトルを求め、この逆特性をもつフ
ィルタを通過した音声波の残差に対しても同様に適用で
きることは明白である。以上説明したように、本発明に
おいては、残差信号を低域沖波器に通すことによつてそ
の相関係数の最大値が明確に検出できることから、音声
の基本周期を正確かつ安定に抽出できる利点がある。
特に残差信号の正負の符号のみからなる零交差波の相関
で十分であるところから、従来積和の演算が必要であつ
たものが和だけで良く、回路構成が非常に簡単化される
利点がある。上記のように音声の基本周期の抽出精度が
改善できることから、音声の帯域圧縮伝送、あるいは音
声応答装置における合成音声の品質を著るしく改善でき
る利点がある。
【図面の簡単な説明】
第1図は部分自己相関方式による音声分析の構成図、第
2甲は従来の音声基本周期抽出装置の構成図、第3図は
残差信号の波形図、第4図は残差J信号を12ビットで
表現したときの相関係数の波形図、第5図は本発明によ
る音声基本周期抽出装置の構成図、第6図は低域沖波後
の残差信号波形図、第7図は低域沖波後の残差波形を1
2ビットて表現したときの相関係数の波形図、第8図は
低域7淵波後の残差波形の符号のみの相関係数の波形図
、第9図は残差波形を表現する精度(ビット数)と基本
周期の抽出誤りを示す説明図である。 8は本発明による音声基本周期抽出装置、6は残差信号
入力端子、19は低域炉波器、20は符フ号器、21は
符号器出力端子、14は記憶装置、22は記憶装置、1
5は自己相関器、17は自己相関器出力端子、16は最
大値抽出器、9は基本周期出力端子、18は最大値出力
端子である。

Claims (1)

    【特許請求の範囲】
  1. 1 音声信号の近似スペクトルの逆特性を有するフィル
    タに通した音声波の残差信号から、該残差信号に含まれ
    る不要な高周波成分を遮断する第1の装置と、該第1の
    装置から出力された信号を正負の符号のみの情報を用い
    て残差信号の零交差波に変換する第2の装置と、該残差
    信号の零交差波形から一定間隔ごとに一定区間長のみ切
    出す第3の装置と、該一定区間長のみ切出された信号を
    1フレーム分のみ蓄積しておく第4の装置と、自己相関
    係数を算出する第5の装置と、算出された相関係数の最
    大値の位置と大きさを検出する第6の装置とを設け、残
    差信号に含まれる不要な高周波成分を低域濾波器によつ
    て遮断し、残差信号の零交差波形の相関係数から音声の
    基本周期を抽出することを特徴とする音声の基本周期抽
    出装置。
JP50102473A 1975-08-22 1975-08-22 音声の基本周期抽出装置 Expired JPS6051720B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP50102473A JPS6051720B2 (ja) 1975-08-22 1975-08-22 音声の基本周期抽出装置
DE2636032A DE2636032C3 (de) 1975-08-22 1976-08-11 Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal
CA258,894A CA1061906A (en) 1975-08-22 1976-08-11 Speech signal fundamental period extractor
FR7624788A FR2321738A1 (fr) 1975-08-22 1976-08-13 Circuit de determination de la periode fondamentale d'un signal de parole pour analyseur de parole
US05/715,399 US4081605A (en) 1975-08-22 1976-08-18 Speech signal fundamental period extractor
GB34670/76A GB1555254A (en) 1975-08-22 1976-08-19 Speech analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP50102473A JPS6051720B2 (ja) 1975-08-22 1975-08-22 音声の基本周期抽出装置

Publications (2)

Publication Number Publication Date
JPS5226107A JPS5226107A (en) 1977-02-26
JPS6051720B2 true JPS6051720B2 (ja) 1985-11-15

Family

ID=14328408

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50102473A Expired JPS6051720B2 (ja) 1975-08-22 1975-08-22 音声の基本周期抽出装置

Country Status (6)

Country Link
US (1) US4081605A (ja)
JP (1) JPS6051720B2 (ja)
CA (1) CA1061906A (ja)
DE (1) DE2636032C3 (ja)
FR (1) FR2321738A1 (ja)
GB (1) GB1555254A (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS597120B2 (ja) * 1978-11-24 1984-02-16 日本電気株式会社 音声分析装置
US4220819A (en) * 1979-03-30 1980-09-02 Bell Telephone Laboratories, Incorporated Residual excited predictive speech coding system
JPS5857758B2 (ja) * 1979-09-28 1983-12-21 株式会社日立製作所 音声ピッチ周期抽出装置
JPS58143394A (ja) * 1982-02-19 1983-08-25 株式会社日立製作所 音声区間の検出・分類方式
US4486900A (en) * 1982-03-30 1984-12-04 At&T Bell Laboratories Real time pitch detection by stream processing
US4561102A (en) * 1982-09-20 1985-12-24 At&T Bell Laboratories Pitch detector for speech analysis
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
JPS61134000A (ja) * 1984-12-05 1986-06-21 株式会社日立製作所 音声分析合成方式
JPH0690638B2 (ja) * 1986-06-25 1994-11-14 松下電工株式会社 音声分析方式
US4980917A (en) * 1987-11-18 1990-12-25 Emerson & Stern Associates, Inc. Method and apparatus for determining articulatory parameters from speech data
FR2670313A1 (fr) * 1990-12-11 1992-06-12 Thomson Csf Procede et dispositif pour l'evaluation de la periodicite et du voisement du signal de parole dans les vocodeurs a tres bas debit.
US5715365A (en) * 1994-04-04 1998-02-03 Digital Voice Systems, Inc. Estimation of excitation parameters
DE19616103A1 (de) * 1996-04-23 1997-10-30 Philips Patentverwaltung Verfahren zum Ableiten charakteristischer Werte aus einem Sprachsignal
WO2001077635A1 (en) * 2000-04-06 2001-10-18 Telefonaktiebolaget Lm Ericsson (Publ) Estimating the pitch of a speech signal using a binary signal
AU2001258298A1 (en) * 2000-04-06 2001-10-23 Telefonaktiebolaget Lm Ericsson (Publ) Pitch estimation in speech signal
JP3827317B2 (ja) * 2004-06-03 2006-09-27 任天堂株式会社 コマンド処理装置
JP4935280B2 (ja) * 2006-09-29 2012-05-23 カシオ計算機株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
TWI728632B (zh) * 2019-12-31 2021-05-21 財團法人工業技術研究院 特定音源的定位方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1318985A (en) * 1970-02-07 1973-05-31 Nippon Telegraph & Telephone Audio response apparatus
US3740476A (en) * 1971-07-09 1973-06-19 Bell Telephone Labor Inc Speech signal pitch detector using prediction error data
US3975587A (en) * 1974-09-13 1976-08-17 International Telephone And Telegraph Corporation Digital vocoder

Also Published As

Publication number Publication date
FR2321738B1 (ja) 1979-09-28
GB1555254A (en) 1979-11-07
DE2636032B2 (de) 1979-05-10
JPS5226107A (en) 1977-02-26
US4081605A (en) 1978-03-28
CA1061906A (en) 1979-09-04
DE2636032A1 (de) 1977-02-24
FR2321738A1 (fr) 1977-03-18
DE2636032C3 (de) 1984-07-19

Similar Documents

Publication Publication Date Title
JPS6051720B2 (ja) 音声の基本周期抽出装置
Kleijn Encoding speech using prototype waveforms
Schroeder Vocoders: Analysis and synthesis of speech
JPH04270398A (ja) 音声符号化方式
JPS5918717B2 (ja) 適応形ピツチ抽出方式
Robinson Speech analysis
JPH05281996A (ja) ピッチ抽出装置
Maksym Real-time pitch extraction by adaptive prediction of the speech waveform
JPS62229200A (ja) ピツチ検出器
Samad et al. Pitch detection of speech signals using the cross-correlation technique
Burnett et al. A mixed prototype waveform/CELP coder for sub 3 kbit/s
Vogten et al. The Formator: a speech analysis-synthesis system based on formant extraction from linear prediction coefficients
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
JPS6220560B2 (ja)
JPS61128300A (ja) ピツチ抽出装置
Fushikida A formant extraction method using autocorrelation domain inverse filtering and focusing method.
JP2615991B2 (ja) 線形予測型音声分析合成装置
JP3233543B2 (ja) インパルス駆動点抽出方法およびピッチ波形抽出方法とその装置
EP0119033B1 (en) Speech encoder
KR100322704B1 (ko) 음성신호의지속시간변경방법
JPH06202695A (ja) 音声信号処理装置
JPS62278598A (ja) 帯域分割型ボコ−ダ
JPS60254200A (ja) 音声基本周波数抽出装置
JP3571448B2 (ja) 音声信号のピッチ検出方法および装置
JPH05281995A (ja) 音声符号化方法