JP2747292B2

JP2747292B2 - 音声信号の音声パラメータの時間的変化決定方法および装置

Info

Publication number: JP2747292B2
Application number: JP62296255A
Authority: JP
Inventors: ハーマン・ネイ
Original assignee: Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 1986-11-26
Filing date: 1987-11-26
Publication date: 1998-05-06
Anticipated expiration: 2013-05-06
Also published as: EP0272723B1; US4813075A; EP0272723A1; DE3782324D1; JPS63144400A; DE3640355A1

Description

【発明の詳細な説明】本発明は、音声信号の音声パラメータの時間に対する
変化を決定する方法であって、前記の音声パラメータで
は、この音声パラメータの所定の値範囲の各値に対し、
不連続の時間点に個々の値が存在し、時間に対する変化
が、斜めに隣接する場合を含む隣接の音声信号パラメー
タ値の列を表しており、このパラメータ値の列の個々の
値を個々の時間点に対し個々の値の極値に少なくとも接
近させ、このパラメータ値の列の個々の値の加算値が他
の列と比較される極値の加算値を形成するようにする方
法に関するものである。音声パラメータは例えば検査すべき音声信号の基本周
波数或いはフォルマントとすることができる。他の音声
パラメータは例えばLPC（線形予測符号）係数である。例えば基本音声周波数の個々の値はAMDF（平均値差分
関数;Average Magnitude Difference Function）を用い
て決定しうる。この目的の為に、音声信号が例えば10KH
zのサンプリング速度でサンプリングされ、従って全体
で音声信号区分を表わす特定の個数のサンプルが音声信
号に比べてサンプリング点の数だけ１ステップずつシフ
トされ、シフトされない信号とシフトされた信号とのサ
ンプル値の差が個々のシフトステップに対し互いに加算
される。この加算値が最小となるシフトが一般に基本音
声周波数の周期を表わす。しかし、これらの値は必ずし
も完全に明瞭であるとは限らず、高調波或いはフォルマ
ントの周期の場合に小さいな加算値が生じるおそれがあ
り、基本音声周波数の正しい決定を誤らせる他の影響が
ある。しかし、異なるシフトの場合、AMDFが、音声信号
に対しシフトされた順次の音声区分の各々に対し、関連
のシフトが音声信号の基本周期を特定する為のある確実
性或いはより正確には不確実性を特定する値を生じる。種々の検査、例えば音声認識や話者認識の場合、基本
音声周波数のような１つ或いは数個の音声パラメータの
時間に対するコヒーレント変化を得てこの変化とサンプ
ル変化とを比較しうるようにする必要がある。従って、
決定されたAMDF値はフリーク（freak）値がないように
するか、さもなければ平滑化する必要がある。しかし、
例えば線形フィルタにより平滑化を行うと、最適なすな
わち最も生じる可能性のある変化分をあまりにも大きく
偏移すなわち誤らせてしまう。このような変化分は、音
声パラメータ値の列の個々の音声パラメータ値が関連の
時間的な点で最小値に少なくとも近似しており、これら
個々のパラメータ値の全体の合計が他の音声パラメータ
値の列に比べて最小値を形成する場合にこれらの音声パ
ラメータ値の列により最も良好に表される。本発明の目的は、音声パラメータをこの最も生じる可
能性のある変化にできるだけ良好に近似させる前述した
種類の方法を提供せんとするにある。本発明は、音声信号の音声パラメータの時間に対する
変化を決定する方法であって、前記の音声パラメータで
は、この音声パラメータの所定の値範囲の各値に対し、
不連続の時間点に個々の値が存在し、時間に対する変化
が、斜めに隣接する場合を含む隣接の音声信号パラメー
タ値の列を表しており、このパラメータ値の列の個々の
値を個々の時間点に対し個々の値の極値に少なくとも接
近させ、このパラメータ値の列の個々の値の加算値が他
の列と比較される極値の加算値を形成するようにする方
法において、個々の値の極値および各時間点（ｉ）にお
ける極値の加算値を最小値とし、第１ステップにおい
て、一方の方向で互いに追従するすべての音声パラメー
タ値（ｋ）に対し順次に、個々の値に関連する値ｄ（k,
i）と以下の値、すなわちＤ（k,i−１）Ｄ（l,i−１）＋ａ〔ｄ（k,i）＋Ａ〕Ｄ′（l,i）＋ｂ〔ｄ（k,i）＋Ａ〕の最小値との和としての第１方向値Ｄ′（k,i）と、前
記の最小値を生じる個々の値を指示する指示値ｈ′（k,
i）とを形成して記憶し、ここに、Ｄ（k,i−１）およびＤ（l,i−１）はそれぞ
れ前の時間点ｉ−１およびそれぞれ同じ音声パラメータ
値ｋ或いは前の音声パラメータ値ｌで発生せしめ且つ記
憶させた加算値とし、Ｄ（l,i）は直前の音声パラメータ値ｌで形成された
方向値とし、 a,b,Aは予め決定した一定量とし、その後、第２のステップで、他方の方向で互いに追従
するすべての音声パラメータ値ｋに対し同じ時間点ｉで
前記の第１のステップと対応する方法で第２方向値Ｄ″
（k,i）と指示値ｈ″（k,i）とを形成し、各音声パラメータ値ｋに対し、２つの方向値Ｄ′,D″
の最小値とこの方向値に属する指示値ｈ′,h″とをそれ
ぞれ新たな加算値Ｄおよび全体の指示値Ｈとして記憶
し、直前の音声パラメータ値を、遅くとも音声信号の終了
時に、最後の時間点Ｉにおける極値の加算値を有する音
声パラメータ値ｋに属する全体の指示値Ｈ（k,I）から
形成し、関連の全体の指示値を読出し、以下同様にし
て、この処理中に生ぜしめられた音声パラメータ値の列
を出力して記憶することを特徴とする。本発明の方法によれば、音声パラメータ値の列（シー
ケンス）がいわゆるダイナミックプログラミングにより
決定され、これによれば、音声信号の終了時に個々の値
の加算値が種々の値となり、音声信号の終了時に加算値
の最小値となる列を最も生じる可能性のある列とみなす
ことができる。この列は各時間点における各音声パラメ
ータに対する全体の指示（ポインティング）値を記憶さ
せることによりトレースバックさせることができる。加算値を音声パラメータ値の個々の値の列に対し形成
する場合、予め決定した一定量を用いるも、これらの量
のうち量ａおよびｂが、斜めおよび垂直方向の変化が生
じる可能性が水平方向の変化が生じる可能性よりも小さ
いという点で変化の平滑性に優勢的に影響を及ぼす為、
この目的の為にこれら２つの量ａおよびｂを0.5および
2.0間の値にするのが好ましい。量Ａは、AMDFが無声音
声区分およびポーズ区分において呈する値にほぼ相当
し、これらの区分における音声パラメータの主として水
平方向変化を強調する。２つの方向値、すなわち一方が上昇方向で他方が下降
方向或いはその逆を決定するには少なくとも２つのステ
ップが必要である。その理由は、垂直方向で生じる可能
性のある変化に対する各方向値に対し、関連の方向での
直前の方向値をも考慮する必要があり、従ってこれを予
め決定しておく必要がある為である。本発明による方法で形成される種々の値は記憶する必
要がある。その理由は、これらの値を後に更に用いる為
である。しかし、本発明による方法のシーケンスを正確
に検査することにより、これらの種々の値は比較的短い
時間中に必要となるだけとすることができる。従って本
発明の実施例では方向値Ｄ′,D″、指示値ｈ′,h″およ
び新たな加算値Ｄを各場合において１つの時間点ｉに対
してのみ記憶させ、その後に再びオーバーライトするよ
うにする。従って、すべての時間点のすべての音声パラ
メータに対し、全体の指示値のみを記憶する必要があ
る。その理由は、これらの全体の指示値のみが、最適な
ものとして最終的に決定されたパラメータ値の列をトレ
ースバックするのに必要である為である。一方他の値は
各場合に１つの時間点に対してのみ記憶する。その理由
は、これらの他の値はその後最早や必要とならない為で
ある。特に、決定中前の時間点に対してはすべての音声
パラメータの加算値のみが必要となり、一方現在の時間
点に対しては決定した方向値のみが必要となる。このよ
うにして多量の記憶容量を節約しうる。２つの方向値の最小値からの各場合の新たな加算値の
決定は、１つの時間点の各音声パラメータに対する双方
の方向値を決定した後に他のステップで行いうる。しか
し、多くの場合には、各場合の１つの音声パラメータに
対する第２方向値の決定の直後に各場合の新たな加算値
を決定し、従って古い加算値をオーバーライトすること
ができる。その理由は、この場合この古い加算値は最早
や必要としない為である。従って、本発明の他の実施例
では、方向値Ｄ′,D″と指示値ｈ′,h″とを一方の方向
で互いに追従する音声パラメータ値ｋに対してのみ記憶
させ、各方向値Ｄ″,D′を他方の方向で互いに追従する
音声パラメータ値ｋに対し形成した後に新たな加算値Ｄ
および全体の指示値Ｈを直ちに形成し且つ記憶させる。
このようにすることにより、必要とする記憶容量を更に
減少せしめることができる。また、本発明の音声信号の音声パラメータの時間的変
化決定装置は、少なくとも各場合１つの時間点ｉのすべての音声パラ
メータ値ｋの個々の値ｄ（k,i）に対する第１メモリ
と、少なくとも各場合１つの時間点ｉの各音声パラメータ
値ｋに対する各場合１つの加算値Ｄ（k,i）に対する第
２メモリと、少なくとも各場合１つの時間点ｉの各音声メラメータ
値ｋに対する各場合１つの第１方向値Ｄ′（k,i）およ
び１つの指示値ｈ′（k,i）に対する第３メモリと、この第３メモリにおける値と同じ時間点ｉに対する少
なくとも１つの音声パラメータ値ｋの第２方向値および
これに関連する指示値ｈ″（k,i）に対する第４メモリ
と、すべての音声パラメータ値ｋおよびすべての時間点ｉ
に対する全体の指示値Ｈ（k,i）に対する第５メモリ
と、前記の第１、第２および第３或いは第４メモリのデー
タ出力端にそれぞれ結合された入力端と、前記の第３メ
モリのデータ入力端に結合され各場合に１つの方向値
Ｄ′（k,i）、Ｄ″（k,i）と関連の指示値ｈ′（k,
i）、ｈ″（k,i）を生ぜしめる出力端とを有する処理回
路と、各場合に第３メモリのデータ出力端から１つの第１方
向値Ｄ′（k,i）を受ける入力端と、関連の第２方向値
Ｄ′（k,i）を受ける入力端と、２つの方向値のうちの
小さい方の方向値を第２メモリのデータ入力端に供給す
る切換スイッチを制御する出力端とを有する比較器と、少なくとも第1,第2,第３および第５メモリに対しすべ
ての音声パラメータ値ｋのアドレスをアドレスシーケン
スの一方の方向で、次にアドレスシーケンスの他方の方
向で循環的に発生し、更に少なくとも第５メモリに対し
時間点ｉに対するアドレス選択を行うアドレス発生器
と、少なくとも第2,第３および第５メモリのローディン
グおよび読出しを制御するシーケンス制御器とを有する
制御回路とを具えたことを特徴とする。このようにすることにより、本発明による方法を比較
的廉価に実施しうる。図面につき本発明を説明する。第１図は、時間に対する音声パラメータの変化を２次
元的な表示で線図的に示してある。一例として音声パラ
メータは基本音声周波数であるものとする。従って、縦
座標軸にプロットされ、１からＫまである音声パラメー
タ値ｋは種々の別々の周波数値を表わし、一方時間は１
から音声信号の終了時におけるＩまで、ある時間ｉの個
々の点の形態で横座標軸に沿ってプロットされている。
これら両座標軸方向の値の数は実際には可成り多数であ
ること明らかである。時間ｉにおけるいかなる点でも、各音声パラメータ値
ｋに対し、すなわち小円で示す２つの座標軸上の値の交
点に対し個々の値ｄ（k,i）が存在する。この値は例え
ば音声信号を10KHzのような高速度でサンプリングする
ことにより得ることができる。例えば100〜200の多数の
サンプルはそれぞれ10〜20ミリ秒の持続時間を有する音
声セグメンメトを生じる。音声信号のサンプルはｓ（i,
j）によって示される。ここにｉは音声セグメントを表
わし、ｊは音声セグメント中のサンプルを表わす。AMDF
（平均値差分関数:Average Magnitude Difference Func
tion）を用いることにより、個々の値はとなる。すなわち、音声セグメントは音声信号に対して
ｋ個のサンプルだけシフトされ、音声信号内の対応する
サンプル間の差の値は互いに加算される。従って、各シ
フト量ｋが特定の周波数に対応する。このようにして、
実際に生じる基本音声周波数に対応する所定の値の範囲
内でｋの各値に対し個々の値ｄ（k,i）が生ぜしめられ
る。これらの個々の値は、音声パラメータｋにより特定
された周波数が実際にこの音声セグメント中の音声信号
の基本周波数であるというある種の確実性或いは不確実
性とみなすことができ、従って実際の基本周波数に相当
する音声パラメータ値ｋに対する個々の値が最小値とな
る。第１図では、それぞれ個々の値に対応する２つの座標
軸上の値ｋおよびｉの特定の交点をラインにより互いに
結んで基本音声周波数の時間に対する可能な変化の一例
を示している。このラインは上述した一連の個々の値を
連結している為、このように連結された個々の値の加算
値はいかなる他の連結のものに比べて最小となる。この
連結ラインは水平に或いは斜めに或いは垂直に延在させ
ることができるだけである。基本音声周波数の垂直方向
の変化は実際には生じえないが、これらは時間的に不連
続な値である為に、第１図の不連続モデルにおいて２つ
の順次の時間点ｉ間での基本音声周波数の急激な変化は
垂直方向の変化により近似させる必要がある。水平、斜
め或いは垂直方向の変化のみが許容されるという、すな
わちラインはすぐ隣の個々の値を互いに連結するだけで
あるという制限の為に、このラインは平滑な曲線となる
も、このラインが各時間点ｉの個々の値の最小値を正確
に互いに連結しなくなる場合が生じる。しかし、最小の
個々の値からの偏移、すなわち誤差を最小にする連結が
形成される。この処理によれば、音声信号が複雑な形態
をしているということおよびその他の影響により生じる
おそれのある、個々の時間点における個々の値のフリー
ク（freak）値がなくなる。最終的に個々の値の加算値を最小にする音声パラメー
タの変化の決定を第２図を用いて詳細に説明する。垂直
方向の変化は第１図から明らかなように上方から下方と
下方から上方との双方で可能である為、これら双方向の
それぞれの個々の値の加算値は双方向に対し別々に決定
され、処理は得られた加算値のうち小さい方の加算値で
継続される。これら加算値を以下方向値と称する。この点をより一層容易に説明しうるようにする為に、
現在処理されている点k,i、すなわち時間ｉにおける音
声パラメータ値ｋを第２図に二重に示す。従って、時間
ｉ−１における前の点の同一の音声パラメータ値ｋへの
水平連結ラインは図面上の理由でのみわずかに傾斜して
延在する。まず最初、方向値D⁺（k,i）を上昇方向に対し決定す
る。この目的の為に、この方向に対し３つの隣接点の各
々から形成した加算値すなわち方向値を用い、この値を
関連の点における個々の値ｄ（k,i）だけ増大させる。
傾斜方向変化或いは特に垂直方向変化よりも水平方向変
化が生じる可能性がある為、斜め方向に隣接する点の値
Ｄ（ｋ−1,i−１）および垂直方向で下に隣接する点の
値D⁺（ｋ−1,i）は直接用いずに、これらの値を後に詳
細に説明するように特定の値だけ増大させて用いる。垂
直方向で下側の点の値D⁺（ｋ−1,i）をまず最初に決定
する必要があり、この目的の為には、次の下側の点の値
を決定する必要があり、以下同様に最も下側の点の値を
決定する必要がある。従って、方向値D⁺（k,i）はｋ＝
１から開始して決定する必要がある。しかし、このこと
は降下方向に対する方向値D^-（k,i）にも当てはまり、
この場合、斜め上の点の値Ｄ（ｋ＋1,i−１）と垂直方
向で上側の点の方向値D^-（ｋ＋1,i）との加算値を必要
とし、後者の値をまず最初に決定する必要がある為、こ
の方向での処理は値ｋ＝Ｋで開始する必要がある。従っ
て、まず最初に一方の方向値、例えば方向値D⁺のすべて
を決定しこれらを瞬時的に記憶し、次に他方の方向値、
すなわちこの場合方向値D^-を決定して瞬時的に記憶し、
次にこれら２種類の方向値のうちの最小値を新たな加算
値Ｄとして決定する。一方の方向のみのすべての方向
値、例えばD⁺を決定して瞬時的に記憶させる方法は後に
説明する。双方向の方向値D⁺およびD^-は各々の場合時間点ｉに対
するすべての音声パラメータ値に対して決定され、これ
から各々の場合の最小値が新たな加算値として決定さ
れ、第２図につき説明したように記憶させる。時間中の
最後の点Ｉでは、当該加算値Ｄがこの時間点での他のす
べての加算値のうちで最小である音声パラメータ値ｋが
音声パラメータの列の終了を表わす。従って、音声パラ
メータの列の変化をこの終了点から開始してトレースバ
ックしうるようるする為には、当該方向値或いは加算値
を得た前の開始点の各方向値および加算値を記憶する必
要がある。これにより、最後の時間点Ｉにおける最小加
算値Ｄで、この値に到達せしめるもとの点、すなわち前
の点である点を決定することができ、この点に対し記憶
した値からこの点に先行する点を決定でき、以下同様に
して最後に時間中の最後の点Ｉでの最小の加算値となっ
た音声パラメータ値の列全体を得る。現在の点から次の
点に到達させる方向を指示（pointing）する値は指示値
或いは全体の指示値により表わされ、当然に各時間点ｉ
における各音声パラメータに対し記憶せしめる必要があ
る。しかし、５つの方向しかない為、方向指示値に対し
ては３ビットのみで足りる。記憶する必要のある他のす
べての値は多くとも時間点ｉ或いはｉ−１のすべての音
声パラメータ値ｋに対するものだけである。時には２つの方向値D⁺およびD^-の各々が水平方向を含
んでいる為、この水平方向が最小の方向値を生じる場合
にはこれら双方の方向値は等しい。従って、水平方向は
一方の方向値に対して省略することができる。第３図は音声パラメータ値の時間に対する変化を決定
する個々の処理のシーケンス全体を線図的に示す。ブロ
ック101はカウンタのリセット化や個別に特定されてい
ないメモリ領域のクリヤ化のような初期状態の通常の調
整を表わす。ここでは第１時間点ｉ＝１に対する加算値
Ｄ（k,1）に対する記憶位置への、対応の個々の値ｄ
（k,1）の充填のみが特定される。これに続くブロック102で瞬時時間点ｉを特定するカ
ウンタが次の時間点ｉ＋１に切換わる。その後、上昇方
向値D⁺（ｋ）がブロック103において以下の式のように
して決定される。 D⁺（k,i）＝ｄ（k,i）＋min｛Ｄ（k,i−１）,D（ｋ−1,
i−１）＋ａ〔ｄ（k,i）＋Ａ〕，D⁺（ｋ−1,i）＋ｂ〔ｄ（k,i）＋Ａ〕｝ …（１）第２図によれば、この式は、個々の値ｄ（k,i）が３
つの隣接点の加算値の最小値に加算されるということを
意味し、加算値Ｄ（k,i−１）は水平方向に対し直接用
いられ、一方他の値の場合には現在考慮している点の個
々の値と固定量ａ或いはｂおよびＡとに依存する項が加
算される。量Ａは無声音声信号セグメントおよびポーズ
セグメントにおける個々の値に対応するものであり、こ
れらの区域で実際上常に水平である変化に先行する。量
ａおよびｂは変化の平滑さに影響を及ぼす。すなわち、
ａおよびｂが大きくなければなる程、斜めおよび垂直方
向に及ぼす悪影響が強くなる。従って、これらの量は実
験的に得られた量であり、一般に音声信号の場合0.5〜
2.0である。ブロック103では更に、方向指示値h⁺（k,
i）が決定され、この方向指示値により、現在の点に到
達せしめられた前の点を、すなわち、方向値D⁺（k,i）
の場合に最小値を決定せしめる３つの項のうちのどの項
がこの最小値となったかを決定する。更に、音声パラメ
ータ値ｋに対するカウンタを１〜ｋ＋１だけ増大せしめ
る。従って、ブロック103の処理は特定の時間点ｉのすべ
ての音声パラメータ値ｋに対し順次に実行される。方向値および方向指示値がすべての値ｋに対し、すな
わちｋ＝Ｋとなるまで決定され且つ一時的に記憶される
と、他の方向に対する他の方向値D^-（k,i）がブロック1
04で次式により決定される。 D^-（k,i）＝ｄ（k,i）＋min｛Ｄ（k,i−１）,D（ｋ＋1,
i−１）＋ａ〔ｄ（k,i）＋Ａ〕，D^-（ｋ＋1,i）＋ａ〔ｄ（k,i）＋Ａ〕｝ …（２）この式に対してはブロック103の計算に対する場合と
同じことがいえるが、この場合他方の方向で先行する点
を考慮するという点で、すなわちｋ−１の代わりにｋ＋
１が用いられているという点でブロック103と相違して
いる。また方向指示値h^-（k,1）も同様にして決定され
る。これらは降下方向に対する方向値であり、計算は最
大の音声パラメータ値Ｋで開始される為、音声パラメー
タｋに対するカウンタは、方向値および方向指示値の決
定後にそれぞれ１〜ｋ−１だけ減少せしめられる。前記の他方の方向のすべての方向値および方向指示値
が決定されると、すなわち第１音声パラメータ値ｋ＝１
に対しても決定されると、すべての音声パラメータｋの
２つの方向値D⁺（k,i）およびD^-（k,i）の最小値がそれ
ぞれの場合にブロック105に応じて決定され、加算値Ｄ
（k,i）として記憶され、更に、それぞれの場合に関連
の方向指示値h⁺（k,i）およびh^-（k,i）が全体の方向指
示値Ｈ（k,i）として記憶される。この処理がすべての
音声パラメータ値ｋに対し行われると、すなわちｋ＝Ｋ
に対してまで行われると、処理がブロック102に戻り、
時間点ｉに対するカウンタが次の値ｉ＋１にセットさ
れ、上述した処理が繰返される。ブロック104および105に別々に示した処理は組合せて
行うことができる。すなわち、音声パラメータ値ｋに対
する方向値D^-（k,i）の各決定後に方向値D⁺（k,i）すな
わち前の処理で決定された方向値が小さいか否かを直ち
に決定し、これら２つの方向値のうち小さい方の方向値
を新たな加算値Ｄ（k,i）として記憶するようにするこ
とができる。しかし、この構成の場合、前の加算値Ｄ
（k,i−１）を一時的に記憶しておく必要がある。その
理由は、この前の加算値を次に続く方向値D^-（ｋ−1,
i）に対しても必要とする為である。更に、この場合、
各音声パラメータ値ｋに対するステップ数を一層大きく
する必要がある。加算値Ｄ（k,i）、特に方向指示値Ｈ（k,i）がすべて
の時間点ｉに対して、すなわち最後の時間点ｉ＝Ｉに達
するまで決定されると、ブロック106による処理がトリ
ガされる。このブロックによれば、まず最初に、最後の
時間点Ｉにおけるすべての加算値Ｄ（k,I）の最小値を
表わす第１加算値Ｄ（m,I）が決定される。その後、こ
の最小加算値Ｄ（m,I）に属する全体の方向指示値Ｈ
（m,I）が読出され、これから点m,Iに先行する点k₁，i₁
が決定される。次に、この点に記憶された方向指示値Ｈ
（k₁，i₁）が読出され、この値に先行する点が決定さ
れ、以下同様にして決定された音声パラメータの変化の
開始点に達するまで処理が行われる。座標、すなわち時
間点ｉおよび音声パラメータ値ｋの形態で上述したトレ
ースバックにより生ぜしめられる点の列が求めている音
声パラメータの列を表わす。第４図は、第３図に示した処理工程を実効する装置を
示すブロック線図である。ブロック10はすべての個々の
値ｄ（k,i）を含むメモリとするのが好ましく、このメ
モリは音声パラメータ値ｋおよび時間点ｉに相当する値
によってアドレスされる。ブロック10は少なくとも時間
点ｉのすべての音声パラメータ値ｋに対する個々の値を
含む必要がある。その理由は、これらの個々の値は各々
の場合に、すなわち２つの方向D⁺およびD^-に対し２度必
要となる為である。ブロック10には個々の値を発生させ
る装置を含めることができるも、この装置は本発明の一
部を成すものではない為、その詳細な説明は省略する。ブロック20は、各々の場合に新たな時間点ｉの開始時
に先行する時間点ｉ−１の加算値Ｄ（k,i−１）を含む
とともにこの新たな時間点の終了時に新たな加算値Ｄ
（k,i）を含むメモリを示す。これらの加算値の発生お
よびローディングは後に説明する。メモリ20は音声パラ
メータ値ｋによりアドレスされ、入力端に信号ｄを受け
ることにより接続線35を経て供給される値をローディン
グするようにスイッチングされる。このメモリ20のデー
タ出力端21は２つのレジスタ22および24の直列回路に接
続され、レジスタ22が出力端21からの値を受け、これと
同時にその前の内容を他方のレジスタ24に転送する。従
って、各々の場合にレジスタ22が加算値Ｄ（k,i−１）
を含み、レジスタ24がその時計算された方向値に依存し
て前の加算値Ｄ（ｋ−1,i−１）或いはＤ（ｋ＋1,i−
１）を含む。他のレジスタ26は、決定し終えた方向値D⁺
（ｋ−1,i）或いはD^-（ｋ＋ ,i）を接続線13を経て受
け、この値が各々の場合に後続する方向値の決定中に出
力端27に得られるようにする。メモリ10の出力ライン11とレジスタ22,24および26の
それぞれの出力ライン23,25および27とは処理回路12に
接続されており、この処理回路が第３図のブロック103
および104に示した計算を行い、前述したように各々の
場合に出力ライン13に新たな方向値D⁺（k,i）或いはD^-
（k,i）を発生し、出力ライン19に関連の方向指示値h^-
（k,i）或いはh⁺（k,i）を発生する。これらの値は同じ
く音声パラメータ値ｋによってアドレスされるメモリ30
に供給され、このメモリ30は第１ステップですべての音
声パラメータ値ｋに対する一方の方向値D⁺（k,i）とこ
れに関連する方向指示値h⁺（k,i）とが生ぜしめられる
新たな各時間点の開始時に追加の入力端における信号ｃ
による書込みに切換えられ、これによりこの第１ステッ
プですべての方向値および方向指示値を受けるようにな
る。すべての方向値と一方向の方向指示値とが生ぜしめら
れると、メモリ10および20のアドレスは音声パラメータ
ｋの逆の順序で、すなわち前のアドレスが音声パラメー
タの最小値から開始して最大値に向けて実行された場合
には最大値ｋ＝Ｋから開始して最小値に向けて実行され
る。この第２のステップ中に、接続線13に発生せしめら
れた方向値D^-（k,i）と、接続線19に発生せしめられた
方向指示値h^-（k,i）とは、同じく音声パラメータｋに
よりアドレスされ且つ他の入力端における信号ｄにより
書込み状態に設定される他のメモリ40に供給される。双方の方向値と方向指示値とが１つの時間点のすべて
の音声パラメータ値ｋに対し発生せしめられ、これらの
値がメモリ30および40内にローディングされた後、すべ
ての音声パラメータ値ｋが再び順次に発生せしめられ、
これらメモリ30および40の内容が各値ｋに対して読出さ
れる。２つの方向値D⁺（k,i）およびD^-（k,i）は接続線
29および39をそれぞれ経て比較器14に供給され、この比
較器はこれら２つの方向値のいずれが小さいかに依存し
て対応する信号を出力ライン15に出力せしめる。接続線
29における方向値が接続線39における方向値よりも小さ
い場合には、比較器14は出力ライン15に、２つの切換ス
イッチ32および34を第４図で左側の位置に切換える信号
を発生する為、２つの方向値のうちの小さい方の方向値
が切換スイッチ34および接続線35を経てメモリ20に新た
な加算値として供給され、このメモリ20内にローディン
グされ、同時に接続線31における関連の方向指示値出力
が全体の方向指示値としてスイッチ32を経てメモリ50に
供給され、このメモリ50に記憶される。メモリ50に対す
るメモリアドレスは、信号ｅにより最初下側位置に保持
されている切換スイッチ36を経て供給され、従ってこの
アドレスは音声パラメータ値ｋとそれぞれの時間点に対
する値ｉとによって形成される。接続線39における方向値が接続線29における方向値よ
りも小さい場合には、比較器14は出力ライン15に、２つ
の切換スイッチ32および34を上述した場合とは逆の位置
に切換える信号を生ぜしめる為、この場合も小さい方の
方向値が接続線35を経てメモリ20に供給され、接続線41
における関連の全体の方向指示値出力が切換スイッチ32
を経てメモリ50に供給される。メモリ20では、接続線35
を経て供給され新たな加算値Ｄ（k,i）を表わす最小方
向値が、同じ音声パラメータ値ｋの、対応する前に記憶
された加算値をオーバーライトする為、メモリ20はＫ個
のワードの容量を有する必要があるだけである。このこ
とはメモリ30および40にもいえることである。メモリ50
のみが全体の方向指示値に対する記憶位置を有する必要
があり、この値は、各時間点ｉの各音声パラメータ値ｋ
に対し５つの異なる方向が可能である為に３ビット長と
する必要がある。このようにして最後の音声セグメントが処理され時間
点Ｉに到達すると、比較器38およびレジスタ48の回路は
この最後の時間点Ｉにおける最小加算値Ｄ（m,I）とこ
の最小加算値の関連の音声パラメータｋ＝ｍとを決定す
る状態にする。この目的の為に、例えば、レジスタ48の
内容をその最大値に保持し、最後の時間点Ｉに達した際
にのみ、このレジスタの内容を出力させる。時間点Ｉで切換スイッチ34の出力端から接続線35に現
われる第１加算値Ｄ（k,I）が比較器38の一方の入力端
およびレジスタ48のデータ入力端に供給され、このレジ
スタ48の出力ライン49は比較器38の他方の入力端に接続
されている。接続線35に生じる加算値が、レジスタ38が
その前に保持しており接続線49に依然として存在してい
る最大値よりも小さい場合には、比較器38はその出力ラ
イン37に信号を生じ、接続線35上の現在の加算値をレジ
スタ48内にローディングするとともに現在の音声パラメ
ータ値ｋおよび現在の時間点の値Ｉが他のレジスタ42内
にローディングされる。スイッチ34の出力端に生じる次
の加算値が前の値よりも小さい場合には、比較器38が再
び出力ライン37に信号を生じ、この小さい方の加算値が
レジスタ48内にローディングされ、対応する値ｋおよび
Ｉはレジスタ42内にローディングされる。この処理は、
スイッチ34の出力端に現われる加算値が最早や前の加算
値よりも小さくならなくなるまで行われる為、レジスタ
48は最小の加算値を有しており、レジスタ42がこれに関
連する値ｋおよびｉを有している。この処理は時間点Ｉ
における最後の加算値まで行われる為、メモリ50はすべ
ての全体の方向指示値Ｈ（k,i）を含み、レジスタ48は
時間点Ｉにおけるすべての加算値の最小値を含み、レジ
スタ42は対応する値ｋおよびＩを含んでいる。これによ
り探索している音声パラメータの列の終了を表わす。次に切換スイッチ36が信号ｅにより切換えられ、メモ
リ50がアドレスカルキュレータ44の出力ライン45に生じ
る出力によりアドレスされる。このアドレスカルキュレ
ータにはレジスタ42から接続線43を経て、このレジスタ
中に含まれている最小加算値に対応する値ｍおよびＩが
供給され、メモリ50中のこのアドレスに含まれている全
体の方向指示値Ｈ（m,I）が読出され、接続線51を経て
アドレスカルキュレータ44に供給される。このアドレス
カルキュレータはこの方向指示値を用いて接続線43から
供給される値を変更し、前の点の値k₁およびi₁を出力ラ
イン45に生ぜしめる。これらの値はレジスタ42内にロー
ディングされると同時にメモリ50をアドレスし、関連の
方向指示値Ｈ（k₁およびi₁）を読出し、接続線51を経て
アドレスカルキュレータ44に供給する。このカルキュレ
ータが再びこの値を用いて次の前の点の値を接続線45に
発生させ、この値を再びレジスタ42に記憶させると同時
にメモリ50をアドレスし、以下同様にして最終的に探索
している値ｋおよびｉの列を出力端46に逆の順序で生ぜ
しめる。これらの値は一時的に記憶せしめたり或いは直
接処理したりすることもできるが、この点は本発明の一
部を成すものではない為にその詳細な説明は省略する。メモリ40を省略することもでき、この場合には、ブロ
ック104および105を組合せた場合の第３図に関する説明
に応じて、接続線13を接続線39に直接結合し、接続線19
を接続線41に直接結合する。この場合、一方の方向に対
する方向値、例えば方向値D⁺（k,i）とこれに関連する
すべての音声パラメータ値ｋに対する方向指示値h⁺（k,
i）が発生せしめられ且つメモリ30に記憶せしめられる
と、処理回路12により接続線13に発生せしめられた各方
向値D^-（k,i）は比較器14に直接供給され、これと同時
にメモリ30から接続線29を経て比較器14に他方の方向値
D⁺（k,i）が供給され、これら２つの方向値のうちの小
さい方の方向値が切換スイッチ34および接続線35を経て
メモリ20に供給されてこのメモリにローディングされ
る。これと同時に関連の方向指示値がスイッチ32を経て
メモリ50内に全体の方向指示値Ｈ（k,i）としてローデ
ィングされる。この回路構成では、各時間点ｉに対しす
べての音声パラメータ値ｋの２つのステップしか必要と
しない。これに必要とする値ｋおよびｉと、制御信号c,dおよ
びｅとを生じる制御回路を破線ブロック16で示す。この
制御回路16はカウンタ54を駆動するクロックパルス発生
器52を有しており、このカウンタ54のとりうる各位置が
音声パラメータｋの種々の異なる値を表わす。このカウ
ンタ54が１で計数を開始するものとすると、このカウン
タが最後の音声パラメータ値ｋ＝Ｋに達した場合に、こ
のカウンタはライン55に双安定フリップフロップ段56を
切換える信号を生じ、これにより、メモリ30中へのロー
ディングを制御していた信号ｃを消滅させ、加算値Ｄ
（k,i）をメモリ20内にローディングするとともに全体
の方向指示値Ｈ（k,i）をメモリ50内にローディングす
る信号ｄを開始せしめる。これと同時に、カウンタ54の
計数方向を反転させてカウントダウンの計数を行わし
め、その出力端における値ｋをＫから１に減少させる。
これが、他方の方向値と新たな加算値と全体の方向指示
値とが発生せしめられ且つ記憶せしめられる第２のステ
ップである。カウンタ54がその初期位置に復帰すると、ライン55に
再び信号が発生せしめられ、双安定フリップフロップ段
56が再び切換わり、信号ｄが消滅し、信号ｃが再び開始
し、これと同時にカウンタ58が１位置だけ計数し、その
出力端に値ｉを生ぜしめる。カウンタ58がこのようにして最終的にすべての位置を
通過し、最終の時間点Ｉに達すると、これに続いてこの
カウンタが例えば桁上げ出力端に信号ｅを生じ、この信
号により前述したように切換スイッチ36を切換え、決定
された音声パラメータの列のトレースバックを開始しう
るようにする。メモリ20,30等やレジスタ22,24等や処理回路12に必要
とするクロック制御装置は図面を簡単とする為に第４図
に図示していないが、これらに必要とするクロックパル
スはクロックパルス発生器52から発生させることもでき
る。第５図は第４図における処理回路12の一実施例を示
す。個々の値ｄ（k,i）は接続線11を経て加算器60の一
方の入力端に供給され、この加算器の他方の入力端に
は、例えばハードウェア結線により予め決定した一定値
Ａが供給される。この加算器60で形成され、接続線61に
現われる加算値は乗算器62に供給され、この乗算器でこ
の加算値に一定値ａが乗じられる。この量ａは正確な値
はそれほど臨界的なものではない為、この量ａは、それ
ぞれが２の負の整数の累乗である小数の個々の被加数を
以って形成でき、従って乗算器62は縦続接続した少数の
加算器を以って構成しうる。接続線63に生じる積は加算器64に供給され、この積が
レジスタ24の出力ライン25に得られる値に加算される。
出力ライン25に得られるこの値は、音声パラメータ値ｋ
が互いに上昇順序で追従する場合には加算値Ｄ（ｋ−1,
i−１）である。加算器64で形成され接続線65に生じる値は比較器66の
一方の入力端に供給され、この値がレジスタ22の出力ラ
イン23を経て供給される値、すなわち加算値Ｄ（ｋ、ｉ
−１）と比較される。この比較器66は比較の結果に依存
して切換スイッチ68を制御し、このスイッチが比較器66
に供給される値のうち小さい方の値を接続線69を経て他
の比較器76の一方の入力端に供給するようにする。比較器76の他方の入力端は他の加算器74の出力ライン
75に接続されており、この加算器74はレジスタ26からの
出力ライン27に生じる値を、接続線61における加算値に
乗算器72で量ｂを乗じた値に加算する。比較器76は、こ
の比較器に供給される値のうち小さい方の値が他の加算
器70の一方の入力端に供給されるように切換スイッチ78
を制御し、加算器70の他方に入力端には接続線11を経て
個々の値ｄ（k,i）が供給される。この加算器70の出力
ライン13に生じる加算値は方向値D⁺（k,i）である。反
対方向に対する方向値D^-（k,i）は、音声パラメータｋ
が大きい値から小さい値に進む場合に出力ライン13に上
述したのと同様にして生ぜしめられる。比較器66の出力信号は切換スイッチ68と並列に切換ス
イッチ82を動作させ、このスイッチが接続線83に論理値
“0"或いは“1"のいずれかを供給する。後者の論理値
“1"は少なくとも前の点が斜め下にあるということ、す
なわち、次の値をアドレスする為に第４図のアドレスカ
ルキュレータ44において音声パラメータｋで１単位減算
する必要があるということを意味する。接続線83は他の切換スイッチ84の一方の入力ラインを
構成し、このスイッチ84は切換スイッチ78と並列で比較
器76の出力信号により制御される。切換スイッチ84の他
方の入力ラインには絶えず論理値“1"が供給されてい
る。またこの切換スイッチ84と並列に他の切換スイッチ
86が制御され、この切換スイッチ86は左側の位置にある
際に論理値“1"を、右側の位置にある際に論理値“0"を
出力ライン87に絶えず供給し、後者の値“0"は前の点が
同じ時間点に属するということ、すなわち前の点が垂直
方向で下方に位置するということを意味し、従って第４
図のアドレスカルキュレータ44はメモリ50をアドレスす
るのにそれぞれ前のアドレスの場合と同じアドレス区分
ｉを生じる。切換スイッチ84および86の２つの出力ライ
ン85および87が相俟って接続線19を構成し、この接続線
19が第４図におけるメモリ30および40や切換スイッチ32
に接続されている。この切換スイッチは例えば値が切換
えられる第３ビットにより、前の点が現在考慮している
点の上にあるか下にあるかを、またアドレスカルキュレ
ータ44において現在の値ｋに１単位を加えるか或いは１
単位を減じるかを決定することができる。第４および５図に示す回路配置は一例にすぎず、特
に、幾つかの或いはすべての区分は適切にプログラミン
グしたマイクロプロセッサを以って実現しうるものであ
る。

【図面の簡単な説明】第１図は、音声信号の順次の時間点に亘る音声パラメー
タの可能な変化の一例を示す説明図、第２図は、個々の方向値がいかに決定されるかを示す説
明図、第３図は、本発明による方法のシーケンスを説明する為
の線図、第４図は、本発明による方法を実行する回路を示すブロ
ック線図、第５図は、第４図における処理回路の一具体例を示す回
路図である。 10,20,30,40,50……メモリ 12……処理回路 14,38,66,76……比較器 16……制御回路 22,24,26,42,48……レジスタ 44……アドレスカルキュレータ 52……クロックパルス発生器 54,58……カウンタ 56……双安定フリップフロップ段 60,64,70,74……加算器 62,72……乗算器

Claims

(57)【特許請求の範囲】１．音声信号の音声パラメータの時間に対する変化を決
定する方法であって、前記の音声パラメータでは、この
音声パラメータの所定の値範囲の各値に対し、不連続の
時間点に個々の値が存在し、時間に対する変化が、斜め
に隣接する場合を含む隣接の音声信号パラメータ値の列
を表しており、このパラメータ値の列の個々の値を個々
の時間点に対し個々の値の極値に少なくとも接近させ、
このパラメータ値の列の個々の値の加算値が他の列と比
較される極値の加算値を形成するようにする方法におい
て、個々の値の極値および各時間点（ｉ）における極値
の加算値を最小値とし、第１ステップにおいて、一方の
方向で互いに追従するすべての音声パラメータ値（ｋ）
に対し順次に、個々の値に関連する値ｄ（k,i）と以下
の値、すなわちＤ（k,i−１）Ｄ（l,i−１）＋ａ〔ｄ（k,i）＋Ａ〕Ｄ′（l,i）＋ｂ〔ｄ（k,i）＋Ａ〕の最小値との和としての第１方向値Ｄ′（k,i）と、前
記の最小値を生じる個々の値を指示する指示値ｈ′（k,
i）とを形成して記憶し、ここに、Ｄ（k,i−１）およびＤ（l,i−１）はそれぞれ
前の時間点ｉ−１およびそれぞれ同じ音声パラメータ値
ｋ或いは前の音声パラメータ値ｌで発生せしめ且つ記憶
させた加算値とし、Ｄ（l,i）は直前の音声パラメータ値ｌで形成された方
向値とし、 a,b,Aは予め決定した一定量とし、その後、第２のステ
ップで、他方の方向で互いに追従するすべての音声パラ
メータ値ｋに対し同じ時間点ｉで前記の第１のステップ
と対応する方法で第２方向値Ｄ″（k,i）と指示値ｈ″
（k,i）とを形成し、各音声パラメータ値ｋに対し、２つの方向値Ｄ′,D″の
最小値とこの方向値に属する指示値ｈ′,h″とをそれぞ
れ新たな加算値Ｄおよび全体の指示値Ｈとして記憶し、直前の音声パラメータ値を、遅くとも音声信号の終了時
に、最後の時間点Ｉにおける極値の加算値を有する音声
パラメータ値ｋに属する全体の指示値Ｈ（k,I）から形
成し、関連の全体の指示値を読出し、以下同様にして、
この処理中に生ぜしめられた音声パラメータ値の列を出
力して記憶することを特徴とする音声信号の音声パラメ
ータの時間的変化決定方法。２．特許請求の範囲第１項に記載の音声信号の音声パラ
メータの時間的変化決定方法において、方向値Ｄ′,
D″、指示値ｈ′,h″および新たな加算値Ｄを各場合に
おいて１つの時間点ｉに対してのみ記憶させ、その後に
再びオーバーライトすることを特徴とする音声信号の音
声パラメータの時間的変化決定方法。３．特許請求の範囲第２項に記載の音声信号の音声パラ
メータの時間的変化決定方法において、方向値Ｄ′,D″
と指示値ｈ′,h″とを一方の方向で互いに追従する音声
パラメータ値ｋに対してのみ記憶させ、各方向値Ｄ″,
D′を他方の方向で互いに追従する音声パラメータ値ｋ
に対し形成した後に新たな加算値Ｄおよび全体の指示値
Ｈを直ちに形成し且つ記憶させることを特徴とする音声
信号の音声パラメータの時間的変化決定方法。４．音声信号の音声パラメータの時間的変化決定装置に
おいて、少なくとも各場合１つの時間点ｉのすべての音声パラメ
ータ値ｋの個々の値ｄ（k,i）に対する第１メモリ（1
0）と、少なくとも各場合１つの時間点ｉの各音声パラメータ値
ｋに対する各場合１つの加算値Ｄ（k,i）に対する第２
メモリ（20）と、少なくとも各場合１つの時間点ｉの各音声メラメータ値
ｋに対する各場合１つの第１方向値Ｄ′（k,i）および
１つの指示値ｈ′（k,i）に対する第３メモリ（30）
と、この第３メモリ（30）における値と同じ時間点ｉに対す
る少なくとも１つの音声パラメータ値ｋの第２方向値お
よびこれに関連する指示値ｈ″（k,i）に対する第４メ
モリ（26;40）と、すべての音声パラメータ値ｋおよびすべての時間点ｉに
対する全体の指示値Ｈ（k,i）に対する第５メモリ（5
0）と、前記の第１、第２および第３或いは第４メモリ（10,20,
30,26;40）のデータ出力端にそれぞれ結合された入力端
と、前記の第３メモリ（30）のデータ入力端に結合され
各場合に１つの方向値Ｄ′（k,i）、Ｄ″（k,i）と関連
の指示値ｈ′（k,i）、ｈ″（k,i）を生ぜしめる出力端
とを有する処理回路（12）と、各場合に第３メモリ（30）のデータ出力端から１つの第
１方向値Ｄ′（k,i）を受ける入力端と、関連の第２方
向値Ｄ′（k,i）を受ける入力端と、２つの方向値のう
ちの小さい方の方向値を第２メモリ（20）のデータ入力
端に供給する切換スイッチ（32）を制御する出力端とを
有する比較器（14）と、少なくとも第1,第2,第３および第５メモリ（10,20,30,5
0）に対しすべての音声パラメータ値ｋのアドレスをア
ドレスシーケンスの一方の方向で、次にアドレスシーケ
ンスの他方の方向で循環的に発生し、更に少なくとも第
５メモリ（50）に対し時間点ｉに対するアドレス選択を
行うアドレス発生器（54,58）と、少なくとも第2,第３
および第５メモリ（20,30,50）のローディングおよび読
出しを制御するシーケンス制御器（56）とを有する制御
回路とを具えたことを特徴とする音声信号の音声パラメータの
時間的変化決定装置。