JPH0731519B2 - フオルマント抽出器 - Google Patents

フオルマント抽出器

Info

Publication number
JPH0731519B2
JPH0731519B2 JP61122695A JP12269586A JPH0731519B2 JP H0731519 B2 JPH0731519 B2 JP H0731519B2 JP 61122695 A JP61122695 A JP 61122695A JP 12269586 A JP12269586 A JP 12269586A JP H0731519 B2 JPH0731519 B2 JP H0731519B2
Authority
JP
Japan
Prior art keywords
frequency
calculator
data
band
formant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61122695A
Other languages
English (en)
Other versions
JPS6254300A (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPS6254300A publication Critical patent/JPS6254300A/ja
Publication of JPH0731519B2 publication Critical patent/JPH0731519B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はフォルマント抽出器に関し、特に帯域分割を利
用して実時間で安定にフォルマント抽出を行なう帯域分
割型のフォルマント抽出器に関する。
〔従来の技術〕
LPC係数を定数とする高次方程式をニュートン・ラプソ
ンの手法等で解き、その解からフォルマントを抽出する
方法は公知でありその抽出精度も良好であることが知ら
れている。
しかしながらこのような従来のフォルマント抽出手段に
おける高次方程式の求解処理においてはこれを代数的に
解く方法はなく、また次数が高くなるほど飛躍的に難か
しくなる。このため通常は莫大な演算量を要しつつ数値
計算的にその解を見出していたが実時間でかつ安定して
解を得ることは不可能であった。
これに対し入力音声信号を複数の周波数帯域に分割し、
各分割周波数帯域ごとにLPC分析して得たLPC係数にもと
づいてフォルマントを抽出する、いわゆる帯域分割型フ
ォルマント抽出器が提唱されつつある。
この帯域分割型フォルマント抽出器は分割帯域数に応じ
て高次方程式の次数を著しく低減したものとして実時間
で精度よく、安定したフォルマント抽出を行ないうるも
のとして着目されている。
たとえば、12次のLPC係数を利用する場合、帯域分割し
て2帯域でそれぞれ6次のLPC係数を抽出してこれを利
用した高次方程式を解くものとすると、この場合高次方
程式はたかだか6次の次数となり元来求解すべき12次に
比してはるかに容易に解を求めることができるようにな
る。
〔発明が解決しようとする問題点〕
しかしながら、このような帯域分割型のフォルマント抽
出器にも次の如き基本的問題点が存在する。
すなわち、複数の各周波数帯域間の帯域分割点もしくは
その近傍にフォルマント周波数が存在する場合には当該
フォルマントに関する全音声エネルギーが利用されない
状態でフォルマント抽出が行なわれるため、当然その抽
出精度が劣化してしまうという欠点がある。
本発明の目的は上述した欠点を除去し、帯域間の境界周
波数を入力音声信号のスペクトル包絡形状に対応して可
変するという手段を備えて抽出精度の大幅な改善を図っ
たフォルマント抽出器を提供することにある。
〔問題点を解決するための手段〕
本発明の装置は、入力音声信号を複数の周波数帯域に分
割してそれぞれの周波数帯域ごとにLPC(Linear Predic
tion Coding,線形予測符号化)分析する手段を有して構
成されるフォルマント抽出器であって、フォルマント抽
出周波数帯域を含む前記複数の周波数帯域の境界周波数
を入力音声信号のスペクトル包絡形状に対応して可変す
る手段を備えて構成される。
〔実施例〕
次に図面を参照して本発明を詳細に説明する。第1図は
本発明の一実施例の構成を示すブロツク図である。
入力ライン101を介して入力した入力音声信号はA/D変換
器1に供給され、A/D変換器1に内蔵されたLow Pass Fi
lterで3.4kHz以上の周波数成分を除去したのち、8kHz,1
2bitsで標本化,量子化され窓処理器2へ出力される。
窓処理器2は標本化された音声信号を一旦内部メモリに
一定時間長分たとえば32mSEC分すなわち256サンプル分
ずつ格納し、これにハミング関数等の窓関数を乗算する
窓関数処理を基本分析フレーム周期の10mSECごとに実施
してその出力をパワースペクトル算出器3へ出力する。
パワースペクトル算出器3は供給された256サンプルの
音声信号をFET等の手法によりDFTを実施し、算出された
複素スペクトルから公知の手法で電力スペクトルP
(k),(k=0,1,2,…128)を求め出力ライン301を介
して帯域決定器4、自己相関算出器5−1,…5−Iへ出
力する。
帯域決定器4は入力音声信号のスペクトル包絡形状に対
応して帯域間の境界周波数を決定するものである。本実
施例では帯域分割数2とし、スペクトル包絡の極小点を
検出して境界周波数を決定している。
帯域決定器4は供給された電力スペクトルP(k)を下
記(1)式を用いてフーリェCOSINE変換する。
求められたφτは自己相関係数である。帯域決定器4は
更にこのφτから公知の手段、例えばL.R.Rabiner,R.W.
Schafer“Digital Processing of Speech Signals"PREN
TICE−HALL,pp.401−403に記述されている“The autoco
rre lation method"を利用してLPC分析し、12次のαパ
ラメータαi(i=1,2,…12)を算出する。更に帯域決
定器4はこのαパラメータよりスペクトル包絡の極小点
を以下のように検出する。
αパラメータよりスペクトル包絡は下記(2)式で求め
られる事が知られている。
αi;αパラメータ,αο=1 でありSは定数、又、ωは角周波数であり4kHzをπとし
ている。又、P(ω)は角周波数ωに於けるスペクトル
包絡であり、Nは線形予測係数の次数、即ち12である。
(2)式に示すスペクトル包絡P(ω)は右辺の分母が
極大となる角周波数で極小となる。(2)式右辺の分母
の極大点は下記(4)式に示すこれの導関数が零をとる
角周波数より求められる。
Q(ω)=0となるωは数値計算により容易に決定され
る。本実施例ではωの分布範囲0〜π(rad)を128分割
し、各分割点即ち、 に於けるQ(ω)の値を算出する。
次に“0"をはさむ2つの正負のデータより補間法を用い
てQ(ω)=0となるω(複数)を決定する。
さてQ(ω)=0となる各周波数は(3)式右辺の分母
を極大とするもの以外に、この分母を極小とするものが
含まれている。本実施例では(4)式の導関数Q′
(ω)に決定した各周波数ωq(q=1,2…M)を代入
し、これが負となる各周波数θr(r=1,2,…L),L<
M,を(3)式右辺の分母が極大となる。即ち(3)式が
極小となる角周波数としている。尚、Q′(ω)は下記
(5)式で表現される。
求められたスペクトル包絡の極小点に対応する角周波数
θr(r=1,2…L),L<M,から、帯域境界周波数θ
は下記(6)式により選択される。
θ=min{|θr−θs|} ………(6) ここでθsは基準帯域境界周波数であり、本実施例の場
合は0.325π(=1300Hz)である。なおθsは比較的に
スペクトル包絡の極小点に対応する角周波数の分布の中
心に選択することが望ましく、本実施例では経験的に0.
325πに決められている。
帯域決定器4は求めたθを出力ライン401を介して自
己相関算出器5−1〜5−I,フォルマント決定器9へ出
力する。
自己相関算出器5−1,〜5−Iはパワースペクトル算出
器3より供給されるパワースペクトルP(k)より出力
ライン401を介して供給されるθsを帯域間の境界周波
数として、帯域毎の自己相関係数をパワースペクトルの
周波数区間を限定してフーリェCOSINE変換する方法で算
出する。本実施例では自己相関算出器5−1は角周波数
0.03125π〜θの範囲の電力スペクトルを用いて、同
5−Iはθ〜0.78125πの範囲の電力スペクトルを用
いて各々6次の自己相関係数をφτ (1)(τ=0,1,…
6),φτ (1)(τ=0,1,…6)を後述する方法で算出
している。算出された自己相関係数は各々LPC分析器6
−1〜6−Iでαパラメータに変換され、方程式求解器
7−1〜7−Iへ供給される。
上述のように自己相関算出器5−1〜5−Iが各々利用
する周波数帯域はスペクトル包絡の極小点に対応するθ
で分割されており、帯域間の境界周波数を固定とした
従来の方法で発生する問題、即ち、境界周波数もしくは
その近傍にフォルマント周波数が存在した場合の問題の
回避を図っている。
このようにしてLPC分析器6−1〜6−Iから出力され
るαパラメータは、もしそれぞれ同次数のものとして抽
出されるときには元来単一周波数帯域の場合はn次のも
のが帯域数Iに対応してそれぞれn/I次と大幅に低次化
される。たとえば単一周波数帯域の場合に12次のαパラ
メータを抽出するとすれば、わづか2帯域でもそれぞれ
6次のαパラメータと大幅に低次化される。
なお、帯域分割型のLPC係数分析に関しては、たとえば
特開昭58−211797,「帯域分割型ボコーダ」もしくは特
開昭58−220199,「帯域分割型ボコーダ」等に詳述され
ている。
方程式求解器7−1〜7−Iは供給されたαパラメータ
より公知の手法、即ち高次方程式を数値的に解く方法で
各々3組の複素共役解を求め極算出器8−1〜8−Iへ
出力する。極算出器8−1〜8−Iはこれらの複素共役
解から公知の方法たとえば斉藤収三,中田和男,“音声
情報処理の基礎,"オーム社,その他の文献に詳述されて
いる手法により極周波数とその帯域幅を求める。
ただし 0.03125π<F1<F2……<FNF1NFI <0.78125π …………(8) フォルマント算出器9は(7)式で求めた極周波数とそ
の帯域幅から経験的に知られるフォルマントに対応する
条件に一致するものを選択し出力ライン901を介してフ
ォルマントデータとして出力する。
求められた各帯域の極周波数は被分析範囲を0〜πに拡
大写影したものである。
帯域1より求められた極周波数の個数をNF1(NF1
3),帯域Iより求められた極周波数の個数をNFI(NFI
≦3)と定義すると、帯域1から抽出された極の中心周
波数と帯域幅から成るデータの集合{f1 (1),f2 (1)……f
(1) NF1,b(1) 1,b(1) 2,b(1) NF1}および帯域Iの同様のデ
ータの集合{f1 (I),f2 (I)……f(I) NFI,b1 (I),b2 (I),b
(I) NFI}はフォルマント決定器9へ出力される。但し、
f(1) L1とB(1) L1(L1=1,…NF1)、およびf(I) LIとb(I)
LI,(LI=1,−NFI)、とは各々、同一の極の中心周波数
と帯域幅を示す。又、f(1) L1およびf(I) LIは各々下記
(6)式の関係を有している。
フォルマント決定器9はこれらの周波数,帯域幅,およ
び出力ライン401より供給されるθを利用して全帯域
に於ける極周波数Fi,帯域幅Biを計算する。
次に自己相関算出器5−1を図面を用いて詳細に説明す
る。第2図は自己相関算出器5−1の構成を説明するた
めのブロック図である。第2図に示す自己相関算出器5
−1はRAM1,601,RAM2,602,カウンタ1,603,カウンタ2,60
4,乗算器1,605,乗算器2,606,マルチプレクサ1,607,マル
チプレクサ2,608,レジスタ1,609,レジスタ2,610,カウン
タ3,611,加算器1,612,加算器2,613,係数算出器614,補数
算出器615,制御器616,モジュール算出器617および境界
周波数丸め器618を含んで構成される。
帯域決定器4より出力ライン401を介して前記θが境
界周波数丸め器618へ供給される。
境界周波数丸め器618は下記(9)式を利用してθ
り整数KBを求める。
(9)式で算出されるKBは周波数範囲0〜πを128分割
した場合の周波数標本番号0,1,…,128のどれかであり、
前述のごとくθは0.325π付近のスペクトル包絡の極
小点から選択されているため、大むね“42"の近傍の整
数,経験的には23〜63程度の範囲の整数である。
境界周波数丸め器608はデータKBを制御器616とモジュー
ル算出器617とへ出力する。
自己相関算出器5−1は制御器616により制御される。
制御器616は初めにカウンタ1,603,カウンタ2,604および
カウンタ3、611に“0"を書込ませる。パワースペクト
ル算出器4よりP(4),P(5),……,P(63)の順序
で入力されるデータはRAM1,601の“0"番地より"59"番地
に記憶される。尚、RAM1は64ワードのランダムアクセス
メモリであり、カウンタ1,603より番地データが供給さ
れる。カウンタ1は制御器616の指示により、前記入力
されるデータに同期してインクリメントされる。又、入
力されるデータの範囲P(4)〜P(63)の最小値“4"
は前記周波数区間0.03125π〜θに対応して決められ
ている。
最初にφ0 (1)が次のように算出される。レジスタ1,609
とレジスタ2,610とがクリアされ“0"に設定される。カ
ウンタ1,603が再び“0"に設定される。カウンタ1,603よ
り供給される番地データ“0"に対応したデータP(4)
がRAM1,601より出力され、マルチプレクサ1,607を介し
てレジスタ1,609へ供給される。レジスタ1,609はP
(4)を一時的に記憶する。
係数算出器614はモジュール算出器617より供給される16
bits語長で表現される0〜2πに対応した角度データよ
り、その角度に対応する余弦を算出し乗算器1へ出力す
る。なお、この16bitsデータは0(=0rad)〜65535
(=1.99997π rad)の範囲データである。又、係数算
出器614の構成の詳細は後述する。
係数算出器614はモジュール算出器617を介して加算器2,
613より供給される角度データを余弦に変換し、乗算器
1,605へ出力する。
モジュール算出器617は加算器2,613より供給される整数
データに対する前記KBのモジュール、即ちこの整数デー
タをKB−4で割って得られる余りを求め、更にこの余り
とKB−4の比を2π倍し16bitsデータとして係数算出器
614へ出力する。
加算器2,613とレジスタ2,610とはカウンタ3,611の内容
をアキュムレートする。φ0 (1)算出の場合、カウンタ3,
611の内容は“0"であり、アキュームレート結果は常に
“0"となる。従って乗算器1,605へは“0"radに相等する
余弦データCOS(0)=1.0が係数算出器614から供給さ
れ続ける。
一方、カウンタ1,603はインクリメントされRAM1,601の
“1"番地のデータP(5)が乗算器1,605へ出力され
る。乗算器1,605は2つの入力P(5)とCOS(0)との
積、P(5)COS(0)を算出し、乗算器2,606へ出力す
る。乗算器2,606はこの積と定数“2"の積、即ち2P
(5)COS(0)を算出し、マルチプレクサ2,608を介し
て加算器1,612へ出力する。
加算器1,612はレジスタ1,609の内容P(4)と2P(5)
COS(0)との和P(4)+2P(5)COS(0)を算出
し、マルチプレクサ1,607を介してレジスタ1,609へ出力
する。レジスタ1,609は和P(4)+2P(5)COS(0)
を一時的に記憶する。
次にカウンタ1,603がインクリメントされRAM1,601の
“2"番地のデータが読出され、“1"番地のデータと同様
に処理される。この処理の終了後レジスタ1,609には が一時的に記憶されている。
こうして、次々とカウンタ1,603はKB−5までインクリ
メントされ、レジスタ1,609には が記憶される。更にカウンタ1,603がインクリメントさ
れRAM1,601のKB−4番地に記憶されているP(KB)が読
出され、補数算出器615へ供給される。補数算出器615は
P(KB)の補数、即ち−P(KB)を算出し、マルチプレ
クサ2,608を介して加算器1,612へ出力する。加算器1,61
2はこのデータとレジスタ1,609に記憶されているデータ
の和、即ち を計算しRAM2,602へ出力する。この出力は下記(10)式
で求められるφ0 (1)である。
求められたφ0 (1)はカウンタ2,604に指定されるRAM2,60
2の番地“0"に書込まれる。
このφ0 (1)の書込みに引続いてカウンタ2,604とカウン
タ3,611とがインクリメントされる。
次にφ1 (1)が算出される。φ1 (1)の算出時の動作は余弦
を発生する係数制御器614〜に関する部分も除きφ0 (1)
の場合と同様である。
カウンタ3,611の内容は“1"であり、加算器2,613とレジ
スタ2,610とを用いて生成される番地データは1,2,…,KB
−5となる。番地データの供給を受けたモジュール算出
器617は番地データのKB−4に対するモジュールを算出
しこれを角度データに変換して係数算出器614へ出力す
る。この場合、係数算出器614へ供給される角度データ
となる。
従って最終的な加算器1,612の出力は でありφ1 (1)である。φ1 (1)はRAM2,602の“1"番地に書
込まれる。
次にφ2 (1)が算出さる。この場合、カウンタ3,611の内
容は“2"であり、加算器2,613の出力として生成される
番地データは2,4,6……となる。
番地データはモジュール算出器617へ供給される。モジ
ュール算出器617は番地データのKB−4に対するモジュ
ールを算出し、この余りとKB−4の比を2π倍し係数算
出器614へ出力する。従って最終的な加算器1,612の出力
でありφ2 (1)である。φ2 (1)はRAM2,602の“2"番地に書
込まれる。
以下、次々にφ3 (1)〜φ6 (1)が算出され、RAM2,602の
“3"〜“6"番地に書込まれる。
RAM2,602の0〜6番地のデータは連続的に読出されLPC
分析器6−1へ出力される。
自己相関算出器5−Iは自己相関算出器5−1を当業者
が容易に類推し得る範囲で変更することにより構成し得
る事は明らかである。
次に係数算出器614の構成を図を用いて詳細に説明す
る。第3図は係数算出器614の構成を示すブロック図で
ある。第3図に示す係数算出器614はROM41,ROM42,乗算
器43および加算器44を含んで構成される。
モジュール算出器617より供給される16bitsの整数デー
タ上位8bitsはROM41,42へ下位8bitsは乗算器43へ分配さ
れる。ROM41は256語のROMであり0番地〜255番地に が予じめ書込まれている。ROM41の出力は0〜2πを示
す16bitsの整数データを8bits切捨たときの余弦であり
加算器44へ供給される。
ROM42も256語のROMであり補間係数が書込まれている、
この補間係数は0番地へ255番地に の順に書込まれている。ROM42の出力は乗算器43へ供給
される。乗算器43はROM42の出力と前記下位データを乗
算し補間データを生成する。この補間データは加算器44
へ供給される。加算器44の出力は明らかに余弦データで
あり、乗算器1へ出力される。
〔発明の効果〕
以上述べた様に本発明は入力音声信号を複数の周波数帯
域に分割してそれぞれの周波数帯域ごとにLPC分析する
手段を有して構成されるフォルマント抽出器に於いて、
帯域の境界周波数を入力音声信号のスペクトル包絡形状
に適応させることによりフォルマントの位置に関係なく
正確なフォルマント周波数の抽出が可能となるという効
果がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図に示す自己相関算出器5−1の構成を示すブロッ
ク図、第3図は第2図に示す係数算出器614の構成を示
すブロック図である。 1……A/D変換器、2……窓処理器、3……パワースペ
クトル算出器、4……帯域決定器、5−1〜5−I……
自己相関算出器、b−1〜b−I……LPC分析器、7−
1〜7−I……方程式求解器、8−1〜8−I……極算
出器、9……フォルマント決定器、601……RAM1、602…
…RAM2、603……カウンタ1、604……カウンタ2、605
……乗算器1、606……乗算器2、607……マルチプレク
サ1、608……マルチプレクサ2、609……レジスタ1、
610……レジスタ2、611……カウンタ3、612……加算
器1、613……加算器2、614……係数算出器、615……
補数算出器、616……制御器、617……モジュール算出
器、618……境界周波数丸め器、41,42……ROM、43……
乗算器、44……加算器。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力音声信号を複数の周波数帯域に分割し
    てそれぞれの周波数帯域ごとにLPC(Linear Prediction
    Coding,線形予測符号化)分析する手段を有して構成さ
    れるフォルマント抽出器であって、帯域間の境界周波数
    を入力音声信号のスペクトル包絡形状に対応して可変す
    る手段を備えて成ることを特徴とするフォルマント抽出
    器。
JP61122695A 1985-05-28 1986-05-27 フオルマント抽出器 Expired - Lifetime JPH0731519B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP60-114527 1985-05-28
JP11452785 1985-05-28

Publications (2)

Publication Number Publication Date
JPS6254300A JPS6254300A (ja) 1987-03-09
JPH0731519B2 true JPH0731519B2 (ja) 1995-04-10

Family

ID=14639981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61122695A Expired - Lifetime JPH0731519B2 (ja) 1985-05-28 1986-05-27 フオルマント抽出器

Country Status (1)

Country Link
JP (1) JPH0731519B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5780351A (en) * 1980-11-06 1982-05-19 Hodogaya Chem Co Ltd Benzamide derivative and herbicide containing the same
CA1250368A (en) * 1985-05-28 1989-02-21 Tetsu Taguchi Formant extractor
WO2014129233A1 (ja) * 2013-02-22 2014-08-28 三菱電機株式会社 音声強調装置

Also Published As

Publication number Publication date
JPS6254300A (ja) 1987-03-09

Similar Documents

Publication Publication Date Title
US7035791B2 (en) Feature-domain concatenative speech synthesis
JP3114975B2 (ja) 音素推定を用いた音声認識回路
US5305421A (en) Low bit rate speech coding system and compression
US5832437A (en) Continuous and discontinuous sine wave synthesis of speech signals from harmonic data of different pitch periods
EP2109096B1 (en) Speech synthesis with dynamic constraints
US6047254A (en) System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
US6314393B1 (en) Parallel/pipeline VLSI architecture for a low-delay CELP coder/decoder
CA1250368A (en) Formant extractor
Matsumoto et al. Evaluation of Mel-LPC cepstrum in a large vocabulary continuous speech recognition
JPH0731519B2 (ja) フオルマント抽出器
McAulay Maximum likelihood spectral estimation and its application to narrow-band speech coding
Eyben et al. Acoustic features and modelling
EP2519944B1 (en) Pitch period segmentation of speech signals
Sueur et al. Mel-frequency cepstral and linear predictive coefficients
Umesh et al. Frequency-warping and speaker-normalization
Chowdhury et al. Formant estimation from speech signal using the magnitude spectrum modified with group delay spectrum
US5911170A (en) Synthesis of acoustic waveforms based on parametric modeling
JPH0731511B2 (ja) フオルマント抽出器
JPH0731513B2 (ja) フオルマント抽出器
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
JP2539351B2 (ja) 音声合成方法
JPH0731512B2 (ja) フオルマント抽出器
Cook Word verification in a speech understanding system
Makhoul Methods for nonlinear spectral distortion of speech signals