JP2747292B2 - 音声信号の音声パラメータの時間的変化決定方法および装置 - Google Patents

音声信号の音声パラメータの時間的変化決定方法および装置

Info

Publication number
JP2747292B2
JP2747292B2 JP62296255A JP29625587A JP2747292B2 JP 2747292 B2 JP2747292 B2 JP 2747292B2 JP 62296255 A JP62296255 A JP 62296255A JP 29625587 A JP29625587 A JP 29625587A JP 2747292 B2 JP2747292 B2 JP 2747292B2
Authority
JP
Japan
Prior art keywords
value
values
parameter
voice
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62296255A
Other languages
English (en)
Other versions
JPS63144400A (ja
Inventor
ハーマン・ネイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JPS63144400A publication Critical patent/JPS63144400A/ja
Application granted granted Critical
Publication of JP2747292B2 publication Critical patent/JP2747292B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Television Systems (AREA)

Description

【発明の詳細な説明】 本発明は、音声信号の音声パラメータの時間に対する
変化を決定する方法であって、前記の音声パラメータで
は、この音声パラメータの所定の値範囲の各値に対し、
不連続の時間点に個々の値が存在し、時間に対する変化
が、斜めに隣接する場合を含む隣接の音声信号パラメー
タ値の列を表しており、このパラメータ値の列の個々の
値を個々の時間点に対し個々の値の極値に少なくとも接
近させ、このパラメータ値の列の個々の値の加算値が他
の列と比較される極値の加算値を形成するようにする方
法に関するものである。 音声パラメータは例えば検査すべき音声信号の基本周
波数或いはフォルマントとすることができる。他の音声
パラメータは例えばLPC(線形予測符号)係数である。 例えば基本音声周波数の個々の値はAMDF(平均値差分
関数;Average Magnitude Difference Function)を用い
て決定しうる。この目的の為に、音声信号が例えば10KH
zのサンプリング速度でサンプリングされ、従って全体
で音声信号区分を表わす特定の個数のサンプルが音声信
号に比べてサンプリング点の数だけ1ステップずつシフ
トされ、シフトされない信号とシフトされた信号とのサ
ンプル値の差が個々のシフトステップに対し互いに加算
される。この加算値が最小となるシフトが一般に基本音
声周波数の周期を表わす。しかし、これらの値は必ずし
も完全に明瞭であるとは限らず、高調波或いはフォルマ
ントの周期の場合に小さいな加算値が生じるおそれがあ
り、基本音声周波数の正しい決定を誤らせる他の影響が
ある。しかし、異なるシフトの場合、AMDFが、音声信号
に対しシフトされた順次の音声区分の各々に対し、関連
のシフトが音声信号の基本周期を特定する為のある確実
性或いはより正確には不確実性を特定する値を生じる。 種々の検査、例えば音声認識や話者認識の場合、基本
音声周波数のような1つ或いは数個の音声パラメータの
時間に対するコヒーレント変化を得てこの変化とサンプ
ル変化とを比較しうるようにする必要がある。従って、
決定されたAMDF値はフリーク(freak)値がないように
するか、さもなければ平滑化する必要がある。しかし、
例えば線形フィルタにより平滑化を行うと、最適なすな
わち最も生じる可能性のある変化分をあまりにも大きく
偏移すなわち誤らせてしまう。このような変化分は、音
声パラメータ値の列の個々の音声パラメータ値が関連の
時間的な点で最小値に少なくとも近似しており、これら
個々のパラメータ値の全体の合計が他の音声パラメータ
値の列に比べて最小値を形成する場合にこれらの音声パ
ラメータ値の列により最も良好に表される。 本発明の目的は、音声パラメータをこの最も生じる可
能性のある変化にできるだけ良好に近似させる前述した
種類の方法を提供せんとするにある。 本発明は、音声信号の音声パラメータの時間に対する
変化を決定する方法であって、前記の音声パラメータで
は、この音声パラメータの所定の値範囲の各値に対し、
不連続の時間点に個々の値が存在し、時間に対する変化
が、斜めに隣接する場合を含む隣接の音声信号パラメー
タ値の列を表しており、このパラメータ値の列の個々の
値を個々の時間点に対し個々の値の極値に少なくとも接
近させ、このパラメータ値の列の個々の値の加算値が他
の列と比較される極値の加算値を形成するようにする方
法において、個々の値の極値および各時間点(i)にお
ける極値の加算値を最小値とし、第1ステップにおい
て、一方の方向で互いに追従するすべての音声パラメー
タ値(k)に対し順次に、個々の値に関連する値d(k,
i)と以下の値、すなわち D(k,i−1) D(l,i−1)+a〔d(k,i)+A〕 D′(l,i)+b〔d(k,i)+A〕 の最小値との和としての第1方向値D′(k,i)と、前
記の最小値を生じる個々の値を指示する指示値h′(k,
i)とを形成して記憶し、 ここに、D(k,i−1)およびD(l,i−1)はそれぞ
れ前の時間点i−1およびそれぞれ同じ音声パラメータ
値k或いは前の音声パラメータ値lで発生せしめ且つ記
憶させた加算値とし、 D(l,i)は直前の音声パラメータ値lで形成された
方向値とし、 a,b,Aは予め決定した一定量とし、 その後、第2のステップで、他方の方向で互いに追従
するすべての音声パラメータ値kに対し同じ時間点iで
前記の第1のステップと対応する方法で第2方向値D″
(k,i)と指示値h″(k,i)とを形成し、 各音声パラメータ値kに対し、2つの方向値D′,D″
の最小値とこの方向値に属する指示値h′,h″とをそれ
ぞれ新たな加算値Dおよび全体の指示値Hとして記憶
し、 直前の音声パラメータ値を、遅くとも音声信号の終了
時に、最後の時間点Iにおける極値の加算値を有する音
声パラメータ値kに属する全体の指示値H(k,I)から
形成し、関連の全体の指示値を読出し、以下同様にし
て、この処理中に生ぜしめられた音声パラメータ値の列
を出力して記憶することを特徴とする。 本発明の方法によれば、音声パラメータ値の列(シー
ケンス)がいわゆるダイナミックプログラミングにより
決定され、これによれば、音声信号の終了時に個々の値
の加算値が種々の値となり、音声信号の終了時に加算値
の最小値となる列を最も生じる可能性のある列とみなす
ことができる。この列は各時間点における各音声パラメ
ータに対する全体の指示(ポインティング)値を記憶さ
せることによりトレースバックさせることができる。 加算値を音声パラメータ値の個々の値の列に対し形成
する場合、予め決定した一定量を用いるも、これらの量
のうち量aおよびbが、斜めおよび垂直方向の変化が生
じる可能性が水平方向の変化が生じる可能性よりも小さ
いという点で変化の平滑性に優勢的に影響を及ぼす為、
この目的の為にこれら2つの量aおよびbを0.5および
2.0間の値にするのが好ましい。量Aは、AMDFが無声音
声区分およびポーズ区分において呈する値にほぼ相当
し、これらの区分における音声パラメータの主として水
平方向変化を強調する。 2つの方向値、すなわち一方が上昇方向で他方が下降
方向或いはその逆を決定するには少なくとも2つのステ
ップが必要である。その理由は、垂直方向で生じる可能
性のある変化に対する各方向値に対し、関連の方向での
直前の方向値をも考慮する必要があり、従ってこれを予
め決定しておく必要がある為である。 本発明による方法で形成される種々の値は記憶する必
要がある。その理由は、これらの値を後に更に用いる為
である。しかし、本発明による方法のシーケンスを正確
に検査することにより、これらの種々の値は比較的短い
時間中に必要となるだけとすることができる。従って本
発明の実施例では方向値D′,D″、指示値h′,h″およ
び新たな加算値Dを各場合において1つの時間点iに対
してのみ記憶させ、その後に再びオーバーライトするよ
うにする。従って、すべての時間点のすべての音声パラ
メータに対し、全体の指示値のみを記憶する必要があ
る。その理由は、これらの全体の指示値のみが、最適な
ものとして最終的に決定されたパラメータ値の列をトレ
ースバックするのに必要である為である。一方他の値は
各場合に1つの時間点に対してのみ記憶する。その理由
は、これらの他の値はその後最早や必要とならない為で
ある。特に、決定中前の時間点に対してはすべての音声
パラメータの加算値のみが必要となり、一方現在の時間
点に対しては決定した方向値のみが必要となる。このよ
うにして多量の記憶容量を節約しうる。 2つの方向値の最小値からの各場合の新たな加算値の
決定は、1つの時間点の各音声パラメータに対する双方
の方向値を決定した後に他のステップで行いうる。しか
し、多くの場合には、各場合の1つの音声パラメータに
対する第2方向値の決定の直後に各場合の新たな加算値
を決定し、従って古い加算値をオーバーライトすること
ができる。その理由は、この場合この古い加算値は最早
や必要としない為である。従って、本発明の他の実施例
では、方向値D′,D″と指示値h′,h″とを一方の方向
で互いに追従する音声パラメータ値kに対してのみ記憶
させ、各方向値D″,D′を他方の方向で互いに追従する
音声パラメータ値kに対し形成した後に新たな加算値D
および全体の指示値Hを直ちに形成し且つ記憶させる。
このようにすることにより、必要とする記憶容量を更に
減少せしめることができる。 また、本発明の音声信号の音声パラメータの時間的変
化決定装置は、 少なくとも各場合1つの時間点iのすべての音声パラ
メータ値kの個々の値d(k,i)に対する第1メモリ
と、 少なくとも各場合1つの時間点iの各音声パラメータ
値kに対する各場合1つの加算値D(k,i)に対する第
2メモリと、 少なくとも各場合1つの時間点iの各音声メラメータ
値kに対する各場合1つの第1方向値D′(k,i)およ
び1つの指示値h′(k,i)に対する第3メモリと、 この第3メモリにおける値と同じ時間点iに対する少
なくとも1つの音声パラメータ値kの第2方向値および
これに関連する指示値h″(k,i)に対する第4メモリ
と、 すべての音声パラメータ値kおよびすべての時間点i
に対する全体の指示値H(k,i)に対する第5メモリ
と、 前記の第1、第2および第3或いは第4メモリのデー
タ出力端にそれぞれ結合された入力端と、前記の第3メ
モリのデータ入力端に結合され各場合に1つの方向値
D′(k,i)、D″(k,i)と関連の指示値h′(k,
i)、h″(k,i)を生ぜしめる出力端とを有する処理回
路と、 各場合に第3メモリのデータ出力端から1つの第1方
向値D′(k,i)を受ける入力端と、関連の第2方向値
D′(k,i)を受ける入力端と、2つの方向値のうちの
小さい方の方向値を第2メモリのデータ入力端に供給す
る切換スイッチを制御する出力端とを有する比較器と、 少なくとも第1,第2,第3および第5メモリに対しすべ
ての音声パラメータ値kのアドレスをアドレスシーケン
スの一方の方向で、次にアドレスシーケンスの他方の方
向で循環的に発生し、更に少なくとも第5メモリに対し
時間点iに対するアドレス選択を行うアドレス発生器
と、少なくとも第2,第3および第5メモリのローディン
グおよび読出しを制御するシーケンス制御器とを有する
制御回路と を具えたことを特徴とする。 このようにすることにより、本発明による方法を比較
的廉価に実施しうる。 図面につき本発明を説明する。 第1図は、時間に対する音声パラメータの変化を2次
元的な表示で線図的に示してある。一例として音声パラ
メータは基本音声周波数であるものとする。従って、縦
座標軸にプロットされ、1からKまである音声パラメー
タ値kは種々の別々の周波数値を表わし、一方時間は1
から音声信号の終了時におけるIまで、ある時間iの個
々の点の形態で横座標軸に沿ってプロットされている。
これら両座標軸方向の値の数は実際には可成り多数であ
ること明らかである。 時間iにおけるいかなる点でも、各音声パラメータ値
kに対し、すなわち小円で示す2つの座標軸上の値の交
点に対し個々の値d(k,i)が存在する。この値は例え
ば音声信号を10KHzのような高速度でサンプリングする
ことにより得ることができる。例えば100〜200の多数の
サンプルはそれぞれ10〜20ミリ秒の持続時間を有する音
声セグメンメトを生じる。音声信号のサンプルはs(i,
j)によって示される。ここにiは音声セグメントを表
わし、jは音声セグメント中のサンプルを表わす。AMDF
(平均値差分関数:Average Magnitude Difference Func
tion)を用いることにより、個々の値は となる。すなわち、音声セグメントは音声信号に対して
k個のサンプルだけシフトされ、音声信号内の対応する
サンプル間の差の値は互いに加算される。従って、各シ
フト量kが特定の周波数に対応する。このようにして、
実際に生じる基本音声周波数に対応する所定の値の範囲
内でkの各値に対し個々の値d(k,i)が生ぜしめられ
る。これらの個々の値は、音声パラメータkにより特定
された周波数が実際にこの音声セグメント中の音声信号
の基本周波数であるというある種の確実性或いは不確実
性とみなすことができ、従って実際の基本周波数に相当
する音声パラメータ値kに対する個々の値が最小値とな
る。 第1図では、それぞれ個々の値に対応する2つの座標
軸上の値kおよびiの特定の交点をラインにより互いに
結んで基本音声周波数の時間に対する可能な変化の一例
を示している。このラインは上述した一連の個々の値を
連結している為、このように連結された個々の値の加算
値はいかなる他の連結のものに比べて最小となる。この
連結ラインは水平に或いは斜めに或いは垂直に延在させ
ることができるだけである。基本音声周波数の垂直方向
の変化は実際には生じえないが、これらは時間的に不連
続な値である為に、第1図の不連続モデルにおいて2つ
の順次の時間点i間での基本音声周波数の急激な変化は
垂直方向の変化により近似させる必要がある。水平、斜
め或いは垂直方向の変化のみが許容されるという、すな
わちラインはすぐ隣の個々の値を互いに連結するだけで
あるという制限の為に、このラインは平滑な曲線となる
も、このラインが各時間点iの個々の値の最小値を正確
に互いに連結しなくなる場合が生じる。しかし、最小の
個々の値からの偏移、すなわち誤差を最小にする連結が
形成される。この処理によれば、音声信号が複雑な形態
をしているということおよびその他の影響により生じる
おそれのある、個々の時間点における個々の値のフリー
ク(freak)値がなくなる。 最終的に個々の値の加算値を最小にする音声パラメー
タの変化の決定を第2図を用いて詳細に説明する。垂直
方向の変化は第1図から明らかなように上方から下方と
下方から上方との双方で可能である為、これら双方向の
それぞれの個々の値の加算値は双方向に対し別々に決定
され、処理は得られた加算値のうち小さい方の加算値で
継続される。これら加算値を以下方向値と称する。 この点をより一層容易に説明しうるようにする為に、
現在処理されている点k,i、すなわち時間iにおける音
声パラメータ値kを第2図に二重に示す。従って、時間
i−1における前の点の同一の音声パラメータ値kへの
水平連結ラインは図面上の理由でのみわずかに傾斜して
延在する。 まず最初、方向値D+(k,i)を上昇方向に対し決定す
る。この目的の為に、この方向に対し3つの隣接点の各
々から形成した加算値すなわち方向値を用い、この値を
関連の点における個々の値d(k,i)だけ増大させる。
傾斜方向変化或いは特に垂直方向変化よりも水平方向変
化が生じる可能性がある為、斜め方向に隣接する点の値
D(k−1,i−1)および垂直方向で下に隣接する点の
値D+(k−1,i)は直接用いずに、これらの値を後に詳
細に説明するように特定の値だけ増大させて用いる。垂
直方向で下側の点の値D+(k−1,i)をまず最初に決定
する必要があり、この目的の為には、次の下側の点の値
を決定する必要があり、以下同様に最も下側の点の値を
決定する必要がある。従って、方向値D+(k,i)はk=
1から開始して決定する必要がある。しかし、このこと
は降下方向に対する方向値D-(k,i)にも当てはまり、
この場合、斜め上の点の値D(k+1,i−1)と垂直方
向で上側の点の方向値D-(k+1,i)との加算値を必要
とし、後者の値をまず最初に決定する必要がある為、こ
の方向での処理は値k=Kで開始する必要がある。従っ
て、まず最初に一方の方向値、例えば方向値D+のすべて
を決定しこれらを瞬時的に記憶し、次に他方の方向値、
すなわちこの場合方向値D-を決定して瞬時的に記憶し、
次にこれら2種類の方向値のうちの最小値を新たな加算
値Dとして決定する。一方の方向のみのすべての方向
値、例えばD+を決定して瞬時的に記憶させる方法は後に
説明する。 双方向の方向値D+およびD-は各々の場合時間点iに対
するすべての音声パラメータ値に対して決定され、これ
から各々の場合の最小値が新たな加算値として決定さ
れ、第2図につき説明したように記憶させる。時間中の
最後の点Iでは、当該加算値Dがこの時間点での他のす
べての加算値のうちで最小である音声パラメータ値kが
音声パラメータの列の終了を表わす。従って、音声パラ
メータの列の変化をこの終了点から開始してトレースバ
ックしうるようるする為には、当該方向値或いは加算値
を得た前の開始点の各方向値および加算値を記憶する必
要がある。これにより、最後の時間点Iにおける最小加
算値Dで、この値に到達せしめるもとの点、すなわち前
の点である点を決定することができ、この点に対し記憶
した値からこの点に先行する点を決定でき、以下同様に
して最後に時間中の最後の点Iでの最小の加算値となっ
た音声パラメータ値の列全体を得る。現在の点から次の
点に到達させる方向を指示(pointing)する値は指示値
或いは全体の指示値により表わされ、当然に各時間点i
における各音声パラメータに対し記憶せしめる必要があ
る。しかし、5つの方向しかない為、方向指示値に対し
ては3ビットのみで足りる。記憶する必要のある他のす
べての値は多くとも時間点i或いはi−1のすべての音
声パラメータ値kに対するものだけである。 時には2つの方向値D+およびD-の各々が水平方向を含
んでいる為、この水平方向が最小の方向値を生じる場合
にはこれら双方の方向値は等しい。従って、水平方向は
一方の方向値に対して省略することができる。 第3図は音声パラメータ値の時間に対する変化を決定
する個々の処理のシーケンス全体を線図的に示す。ブロ
ック101はカウンタのリセット化や個別に特定されてい
ないメモリ領域のクリヤ化のような初期状態の通常の調
整を表わす。ここでは第1時間点i=1に対する加算値
D(k,1)に対する記憶位置への、対応の個々の値d
(k,1)の充填のみが特定される。 これに続くブロック102で瞬時時間点iを特定するカ
ウンタが次の時間点i+1に切換わる。その後、上昇方
向値D+(k)がブロック103において以下の式のように
して決定される。 D+(k,i)=d(k,i)+min{D(k,i−1),D(k−1,
i−1) +a〔d(k,i)+A〕,D+(k−1,i) +b〔d(k,i)+A〕} …(1) 第2図によれば、この式は、個々の値d(k,i)が3
つの隣接点の加算値の最小値に加算されるということを
意味し、加算値D(k,i−1)は水平方向に対し直接用
いられ、一方他の値の場合には現在考慮している点の個
々の値と固定量a或いはbおよびAとに依存する項が加
算される。量Aは無声音声信号セグメントおよびポーズ
セグメントにおける個々の値に対応するものであり、こ
れらの区域で実際上常に水平である変化に先行する。量
aおよびbは変化の平滑さに影響を及ぼす。すなわち、
aおよびbが大きくなければなる程、斜めおよび垂直方
向に及ぼす悪影響が強くなる。従って、これらの量は実
験的に得られた量であり、一般に音声信号の場合0.5〜
2.0である。ブロック103では更に、方向指示値h+(k,
i)が決定され、この方向指示値により、現在の点に到
達せしめられた前の点を、すなわち、方向値D+(k,i)
の場合に最小値を決定せしめる3つの項のうちのどの項
がこの最小値となったかを決定する。更に、音声パラメ
ータ値kに対するカウンタを1〜k+1だけ増大せしめ
る。 従って、ブロック103の処理は特定の時間点iのすべ
ての音声パラメータ値kに対し順次に実行される。 方向値および方向指示値がすべての値kに対し、すな
わちk=Kとなるまで決定され且つ一時的に記憶される
と、他の方向に対する他の方向値D-(k,i)がブロック1
04で次式により決定される。 D-(k,i)=d(k,i)+min{D(k,i−1),D(k+1,
i−1) +a〔d(k,i)+A〕,D-(k+1,i) +a〔d(k,i)+A〕} …(2) この式に対してはブロック103の計算に対する場合と
同じことがいえるが、この場合他方の方向で先行する点
を考慮するという点で、すなわちk−1の代わりにk+
1が用いられているという点でブロック103と相違して
いる。また方向指示値h-(k,1)も同様にして決定され
る。これらは降下方向に対する方向値であり、計算は最
大の音声パラメータ値Kで開始される為、音声パラメー
タkに対するカウンタは、方向値および方向指示値の決
定後にそれぞれ1〜k−1だけ減少せしめられる。 前記の他方の方向のすべての方向値および方向指示値
が決定されると、すなわち第1音声パラメータ値k=1
に対しても決定されると、すべての音声パラメータkの
2つの方向値D+(k,i)およびD-(k,i)の最小値がそれ
ぞれの場合にブロック105に応じて決定され、加算値D
(k,i)として記憶され、更に、それぞれの場合に関連
の方向指示値h+(k,i)およびh-(k,i)が全体の方向指
示値H(k,i)として記憶される。この処理がすべての
音声パラメータ値kに対し行われると、すなわちk=K
に対してまで行われると、処理がブロック102に戻り、
時間点iに対するカウンタが次の値i+1にセットさ
れ、上述した処理が繰返される。 ブロック104および105に別々に示した処理は組合せて
行うことができる。すなわち、音声パラメータ値kに対
する方向値D-(k,i)の各決定後に方向値D+(k,i)すな
わち前の処理で決定された方向値が小さいか否かを直ち
に決定し、これら2つの方向値のうち小さい方の方向値
を新たな加算値D(k,i)として記憶するようにするこ
とができる。しかし、この構成の場合、前の加算値D
(k,i−1)を一時的に記憶しておく必要がある。その
理由は、この前の加算値を次に続く方向値D-(k−1,
i)に対しても必要とする為である。更に、この場合、
各音声パラメータ値kに対するステップ数を一層大きく
する必要がある。 加算値D(k,i)、特に方向指示値H(k,i)がすべて
の時間点iに対して、すなわち最後の時間点i=Iに達
するまで決定されると、ブロック106による処理がトリ
ガされる。このブロックによれば、まず最初に、最後の
時間点Iにおけるすべての加算値D(k,I)の最小値を
表わす第1加算値D(m,I)が決定される。その後、こ
の最小加算値D(m,I)に属する全体の方向指示値H
(m,I)が読出され、これから点m,Iに先行する点k1,i1
が決定される。次に、この点に記憶された方向指示値H
(k1,i1)が読出され、この値に先行する点が決定さ
れ、以下同様にして決定された音声パラメータの変化の
開始点に達するまで処理が行われる。座標、すなわち時
間点iおよび音声パラメータ値kの形態で上述したトレ
ースバックにより生ぜしめられる点の列が求めている音
声パラメータの列を表わす。 第4図は、第3図に示した処理工程を実効する装置を
示すブロック線図である。ブロック10はすべての個々の
値d(k,i)を含むメモリとするのが好ましく、このメ
モリは音声パラメータ値kおよび時間点iに相当する値
によってアドレスされる。ブロック10は少なくとも時間
点iのすべての音声パラメータ値kに対する個々の値を
含む必要がある。その理由は、これらの個々の値は各々
の場合に、すなわち2つの方向D+およびD-に対し2度必
要となる為である。ブロック10には個々の値を発生させ
る装置を含めることができるも、この装置は本発明の一
部を成すものではない為、その詳細な説明は省略する。 ブロック20は、各々の場合に新たな時間点iの開始時
に先行する時間点i−1の加算値D(k,i−1)を含む
とともにこの新たな時間点の終了時に新たな加算値D
(k,i)を含むメモリを示す。これらの加算値の発生お
よびローディングは後に説明する。メモリ20は音声パラ
メータ値kによりアドレスされ、入力端に信号dを受け
ることにより接続線35を経て供給される値をローディン
グするようにスイッチングされる。このメモリ20のデー
タ出力端21は2つのレジスタ22および24の直列回路に接
続され、レジスタ22が出力端21からの値を受け、これと
同時にその前の内容を他方のレジスタ24に転送する。従
って、各々の場合にレジスタ22が加算値D(k,i−1)
を含み、レジスタ24がその時計算された方向値に依存し
て前の加算値D(k−1,i−1)或いはD(k+1,i−
1)を含む。他のレジスタ26は、決定し終えた方向値D+
(k−1,i)或いはD-(k+ ,i)を接続線13を経て受
け、この値が各々の場合に後続する方向値の決定中に出
力端27に得られるようにする。 メモリ10の出力ライン11とレジスタ22,24および26の
それぞれの出力ライン23,25および27とは処理回路12に
接続されており、この処理回路が第3図のブロック103
および104に示した計算を行い、前述したように各々の
場合に出力ライン13に新たな方向値D+(k,i)或いはD-
(k,i)を発生し、出力ライン19に関連の方向指示値h-
(k,i)或いはh+(k,i)を発生する。これらの値は同じ
く音声パラメータ値kによってアドレスされるメモリ30
に供給され、このメモリ30は第1ステップですべての音
声パラメータ値kに対する一方の方向値D+(k,i)とこ
れに関連する方向指示値h+(k,i)とが生ぜしめられる
新たな各時間点の開始時に追加の入力端における信号c
による書込みに切換えられ、これによりこの第1ステッ
プですべての方向値および方向指示値を受けるようにな
る。 すべての方向値と一方向の方向指示値とが生ぜしめら
れると、メモリ10および20のアドレスは音声パラメータ
kの逆の順序で、すなわち前のアドレスが音声パラメー
タの最小値から開始して最大値に向けて実行された場合
には最大値k=Kから開始して最小値に向けて実行され
る。この第2のステップ中に、接続線13に発生せしめら
れた方向値D-(k,i)と、接続線19に発生せしめられた
方向指示値h-(k,i)とは、同じく音声パラメータkに
よりアドレスされ且つ他の入力端における信号dにより
書込み状態に設定される他のメモリ40に供給される。 双方の方向値と方向指示値とが1つの時間点のすべて
の音声パラメータ値kに対し発生せしめられ、これらの
値がメモリ30および40内にローディングされた後、すべ
ての音声パラメータ値kが再び順次に発生せしめられ、
これらメモリ30および40の内容が各値kに対して読出さ
れる。2つの方向値D+(k,i)およびD-(k,i)は接続線
29および39をそれぞれ経て比較器14に供給され、この比
較器はこれら2つの方向値のいずれが小さいかに依存し
て対応する信号を出力ライン15に出力せしめる。接続線
29における方向値が接続線39における方向値よりも小さ
い場合には、比較器14は出力ライン15に、2つの切換ス
イッチ32および34を第4図で左側の位置に切換える信号
を発生する為、2つの方向値のうちの小さい方の方向値
が切換スイッチ34および接続線35を経てメモリ20に新た
な加算値として供給され、このメモリ20内にローディン
グされ、同時に接続線31における関連の方向指示値出力
が全体の方向指示値としてスイッチ32を経てメモリ50に
供給され、このメモリ50に記憶される。メモリ50に対す
るメモリアドレスは、信号eにより最初下側位置に保持
されている切換スイッチ36を経て供給され、従ってこの
アドレスは音声パラメータ値kとそれぞれの時間点に対
する値iとによって形成される。 接続線39における方向値が接続線29における方向値よ
りも小さい場合には、比較器14は出力ライン15に、2つ
の切換スイッチ32および34を上述した場合とは逆の位置
に切換える信号を生ぜしめる為、この場合も小さい方の
方向値が接続線35を経てメモリ20に供給され、接続線41
における関連の全体の方向指示値出力が切換スイッチ32
を経てメモリ50に供給される。メモリ20では、接続線35
を経て供給され新たな加算値D(k,i)を表わす最小方
向値が、同じ音声パラメータ値kの、対応する前に記憶
された加算値をオーバーライトする為、メモリ20はK個
のワードの容量を有する必要があるだけである。このこ
とはメモリ30および40にもいえることである。メモリ50
のみが全体の方向指示値に対する記憶位置を有する必要
があり、この値は、各時間点iの各音声パラメータ値k
に対し5つの異なる方向が可能である為に3ビット長と
する必要がある。 このようにして最後の音声セグメントが処理され時間
点Iに到達すると、比較器38およびレジスタ48の回路は
この最後の時間点Iにおける最小加算値D(m,I)とこ
の最小加算値の関連の音声パラメータk=mとを決定す
る状態にする。この目的の為に、例えば、レジスタ48の
内容をその最大値に保持し、最後の時間点Iに達した際
にのみ、このレジスタの内容を出力させる。 時間点Iで切換スイッチ34の出力端から接続線35に現
われる第1加算値D(k,I)が比較器38の一方の入力端
およびレジスタ48のデータ入力端に供給され、このレジ
スタ48の出力ライン49は比較器38の他方の入力端に接続
されている。接続線35に生じる加算値が、レジスタ38が
その前に保持しており接続線49に依然として存在してい
る最大値よりも小さい場合には、比較器38はその出力ラ
イン37に信号を生じ、接続線35上の現在の加算値をレジ
スタ48内にローディングするとともに現在の音声パラメ
ータ値kおよび現在の時間点の値Iが他のレジスタ42内
にローディングされる。スイッチ34の出力端に生じる次
の加算値が前の値よりも小さい場合には、比較器38が再
び出力ライン37に信号を生じ、この小さい方の加算値が
レジスタ48内にローディングされ、対応する値kおよび
Iはレジスタ42内にローディングされる。この処理は、
スイッチ34の出力端に現われる加算値が最早や前の加算
値よりも小さくならなくなるまで行われる為、レジスタ
48は最小の加算値を有しており、レジスタ42がこれに関
連する値kおよびiを有している。この処理は時間点I
における最後の加算値まで行われる為、メモリ50はすべ
ての全体の方向指示値H(k,i)を含み、レジスタ48は
時間点Iにおけるすべての加算値の最小値を含み、レジ
スタ42は対応する値kおよびIを含んでいる。これによ
り探索している音声パラメータの列の終了を表わす。 次に切換スイッチ36が信号eにより切換えられ、メモ
リ50がアドレスカルキュレータ44の出力ライン45に生じ
る出力によりアドレスされる。このアドレスカルキュレ
ータにはレジスタ42から接続線43を経て、このレジスタ
中に含まれている最小加算値に対応する値mおよびIが
供給され、メモリ50中のこのアドレスに含まれている全
体の方向指示値H(m,I)が読出され、接続線51を経て
アドレスカルキュレータ44に供給される。このアドレス
カルキュレータはこの方向指示値を用いて接続線43から
供給される値を変更し、前の点の値k1およびi1を出力ラ
イン45に生ぜしめる。これらの値はレジスタ42内にロー
ディングされると同時にメモリ50をアドレスし、関連の
方向指示値H(k1およびi1)を読出し、接続線51を経て
アドレスカルキュレータ44に供給する。このカルキュレ
ータが再びこの値を用いて次の前の点の値を接続線45に
発生させ、この値を再びレジスタ42に記憶させると同時
にメモリ50をアドレスし、以下同様にして最終的に探索
している値kおよびiの列を出力端46に逆の順序で生ぜ
しめる。これらの値は一時的に記憶せしめたり或いは直
接処理したりすることもできるが、この点は本発明の一
部を成すものではない為にその詳細な説明は省略する。 メモリ40を省略することもでき、この場合には、ブロ
ック104および105を組合せた場合の第3図に関する説明
に応じて、接続線13を接続線39に直接結合し、接続線19
を接続線41に直接結合する。この場合、一方の方向に対
する方向値、例えば方向値D+(k,i)とこれに関連する
すべての音声パラメータ値kに対する方向指示値h+(k,
i)が発生せしめられ且つメモリ30に記憶せしめられる
と、処理回路12により接続線13に発生せしめられた各方
向値D-(k,i)は比較器14に直接供給され、これと同時
にメモリ30から接続線29を経て比較器14に他方の方向値
D+(k,i)が供給され、これら2つの方向値のうちの小
さい方の方向値が切換スイッチ34および接続線35を経て
メモリ20に供給されてこのメモリにローディングされ
る。これと同時に関連の方向指示値がスイッチ32を経て
メモリ50内に全体の方向指示値H(k,i)としてローデ
ィングされる。この回路構成では、各時間点iに対しす
べての音声パラメータ値kの2つのステップしか必要と
しない。 これに必要とする値kおよびiと、制御信号c,dおよ
びeとを生じる制御回路を破線ブロック16で示す。この
制御回路16はカウンタ54を駆動するクロックパルス発生
器52を有しており、このカウンタ54のとりうる各位置が
音声パラメータkの種々の異なる値を表わす。このカウ
ンタ54が1で計数を開始するものとすると、このカウン
タが最後の音声パラメータ値k=Kに達した場合に、こ
のカウンタはライン55に双安定フリップフロップ段56を
切換える信号を生じ、これにより、メモリ30中へのロー
ディングを制御していた信号cを消滅させ、加算値D
(k,i)をメモリ20内にローディングするとともに全体
の方向指示値H(k,i)をメモリ50内にローディングす
る信号dを開始せしめる。これと同時に、カウンタ54の
計数方向を反転させてカウントダウンの計数を行わし
め、その出力端における値kをKから1に減少させる。
これが、他方の方向値と新たな加算値と全体の方向指示
値とが発生せしめられ且つ記憶せしめられる第2のステ
ップである。 カウンタ54がその初期位置に復帰すると、ライン55に
再び信号が発生せしめられ、双安定フリップフロップ段
56が再び切換わり、信号dが消滅し、信号cが再び開始
し、これと同時にカウンタ58が1位置だけ計数し、その
出力端に値iを生ぜしめる。 カウンタ58がこのようにして最終的にすべての位置を
通過し、最終の時間点Iに達すると、これに続いてこの
カウンタが例えば桁上げ出力端に信号eを生じ、この信
号により前述したように切換スイッチ36を切換え、決定
された音声パラメータの列のトレースバックを開始しう
るようにする。 メモリ20,30等やレジスタ22,24等や処理回路12に必要
とするクロック制御装置は図面を簡単とする為に第4図
に図示していないが、これらに必要とするクロックパル
スはクロックパルス発生器52から発生させることもでき
る。 第5図は第4図における処理回路12の一実施例を示
す。個々の値d(k,i)は接続線11を経て加算器60の一
方の入力端に供給され、この加算器の他方の入力端に
は、例えばハードウェア結線により予め決定した一定値
Aが供給される。この加算器60で形成され、接続線61に
現われる加算値は乗算器62に供給され、この乗算器でこ
の加算値に一定値aが乗じられる。この量aは正確な値
はそれほど臨界的なものではない為、この量aは、それ
ぞれが2の負の整数の累乗である小数の個々の被加数を
以って形成でき、従って乗算器62は縦続接続した少数の
加算器を以って構成しうる。 接続線63に生じる積は加算器64に供給され、この積が
レジスタ24の出力ライン25に得られる値に加算される。
出力ライン25に得られるこの値は、音声パラメータ値k
が互いに上昇順序で追従する場合には加算値D(k−1,
i−1)である。 加算器64で形成され接続線65に生じる値は比較器66の
一方の入力端に供給され、この値がレジスタ22の出力ラ
イン23を経て供給される値、すなわち加算値D(k、i
−1)と比較される。この比較器66は比較の結果に依存
して切換スイッチ68を制御し、このスイッチが比較器66
に供給される値のうち小さい方の値を接続線69を経て他
の比較器76の一方の入力端に供給するようにする。 比較器76の他方の入力端は他の加算器74の出力ライン
75に接続されており、この加算器74はレジスタ26からの
出力ライン27に生じる値を、接続線61における加算値に
乗算器72で量bを乗じた値に加算する。比較器76は、こ
の比較器に供給される値のうち小さい方の値が他の加算
器70の一方の入力端に供給されるように切換スイッチ78
を制御し、加算器70の他方に入力端には接続線11を経て
個々の値d(k,i)が供給される。この加算器70の出力
ライン13に生じる加算値は方向値D+(k,i)である。反
対方向に対する方向値D-(k,i)は、音声パラメータk
が大きい値から小さい値に進む場合に出力ライン13に上
述したのと同様にして生ぜしめられる。 比較器66の出力信号は切換スイッチ68と並列に切換ス
イッチ82を動作させ、このスイッチが接続線83に論理値
“0"或いは“1"のいずれかを供給する。後者の論理値
“1"は少なくとも前の点が斜め下にあるということ、す
なわち、次の値をアドレスする為に第4図のアドレスカ
ルキュレータ44において音声パラメータkで1単位減算
する必要があるということを意味する。 接続線83は他の切換スイッチ84の一方の入力ラインを
構成し、このスイッチ84は切換スイッチ78と並列で比較
器76の出力信号により制御される。切換スイッチ84の他
方の入力ラインには絶えず論理値“1"が供給されてい
る。またこの切換スイッチ84と並列に他の切換スイッチ
86が制御され、この切換スイッチ86は左側の位置にある
際に論理値“1"を、右側の位置にある際に論理値“0"を
出力ライン87に絶えず供給し、後者の値“0"は前の点が
同じ時間点に属するということ、すなわち前の点が垂直
方向で下方に位置するということを意味し、従って第4
図のアドレスカルキュレータ44はメモリ50をアドレスす
るのにそれぞれ前のアドレスの場合と同じアドレス区分
iを生じる。切換スイッチ84および86の2つの出力ライ
ン85および87が相俟って接続線19を構成し、この接続線
19が第4図におけるメモリ30および40や切換スイッチ32
に接続されている。この切換スイッチは例えば値が切換
えられる第3ビットにより、前の点が現在考慮している
点の上にあるか下にあるかを、またアドレスカルキュレ
ータ44において現在の値kに1単位を加えるか或いは1
単位を減じるかを決定することができる。 第4および5図に示す回路配置は一例にすぎず、特
に、幾つかの或いはすべての区分は適切にプログラミン
グしたマイクロプロセッサを以って実現しうるものであ
る。
【図面の簡単な説明】 第1図は、音声信号の順次の時間点に亘る音声パラメー
タの可能な変化の一例を示す説明図、 第2図は、個々の方向値がいかに決定されるかを示す説
明図、 第3図は、本発明による方法のシーケンスを説明する為
の線図、 第4図は、本発明による方法を実行する回路を示すブロ
ック線図、 第5図は、第4図における処理回路の一具体例を示す回
路図である。 10,20,30,40,50……メモリ 12……処理回路 14,38,66,76……比較器 16……制御回路 22,24,26,42,48……レジスタ 44……アドレスカルキュレータ 52……クロックパルス発生器 54,58……カウンタ 56……双安定フリップフロップ段 60,64,70,74……加算器 62,72……乗算器

Claims (1)

  1. (57)【特許請求の範囲】 1.音声信号の音声パラメータの時間に対する変化を決
    定する方法であって、前記の音声パラメータでは、この
    音声パラメータの所定の値範囲の各値に対し、不連続の
    時間点に個々の値が存在し、時間に対する変化が、斜め
    に隣接する場合を含む隣接の音声信号パラメータ値の列
    を表しており、このパラメータ値の列の個々の値を個々
    の時間点に対し個々の値の極値に少なくとも接近させ、
    このパラメータ値の列の個々の値の加算値が他の列と比
    較される極値の加算値を形成するようにする方法におい
    て、個々の値の極値および各時間点(i)における極値
    の加算値を最小値とし、第1ステップにおいて、一方の
    方向で互いに追従するすべての音声パラメータ値(k)
    に対し順次に、個々の値に関連する値d(k,i)と以下
    の値、すなわち D(k,i−1) D(l,i−1)+a〔d(k,i)+A〕 D′(l,i)+b〔d(k,i)+A〕 の最小値との和としての第1方向値D′(k,i)と、前
    記の最小値を生じる個々の値を指示する指示値h′(k,
    i)とを形成して記憶し、 ここに、D(k,i−1)およびD(l,i−1)はそれぞれ
    前の時間点i−1およびそれぞれ同じ音声パラメータ値
    k或いは前の音声パラメータ値lで発生せしめ且つ記憶
    させた加算値とし、 D(l,i)は直前の音声パラメータ値lで形成された方
    向値とし、 a,b,Aは予め決定した一定量とし、その後、第2のステ
    ップで、他方の方向で互いに追従するすべての音声パラ
    メータ値kに対し同じ時間点iで前記の第1のステップ
    と対応する方法で第2方向値D″(k,i)と指示値h″
    (k,i)とを形成し、 各音声パラメータ値kに対し、2つの方向値D′,D″の
    最小値とこの方向値に属する指示値h′,h″とをそれぞ
    れ新たな加算値Dおよび全体の指示値Hとして記憶し、 直前の音声パラメータ値を、遅くとも音声信号の終了時
    に、最後の時間点Iにおける極値の加算値を有する音声
    パラメータ値kに属する全体の指示値H(k,I)から形
    成し、関連の全体の指示値を読出し、以下同様にして、
    この処理中に生ぜしめられた音声パラメータ値の列を出
    力して記憶することを特徴とする音声信号の音声パラメ
    ータの時間的変化決定方法。 2.特許請求の範囲第1項に記載の音声信号の音声パラ
    メータの時間的変化決定方法において、方向値D′,
    D″、指示値h′,h″および新たな加算値Dを各場合に
    おいて1つの時間点iに対してのみ記憶させ、その後に
    再びオーバーライトすることを特徴とする音声信号の音
    声パラメータの時間的変化決定方法。 3.特許請求の範囲第2項に記載の音声信号の音声パラ
    メータの時間的変化決定方法において、方向値D′,D″
    と指示値h′,h″とを一方の方向で互いに追従する音声
    パラメータ値kに対してのみ記憶させ、各方向値D″,
    D′を他方の方向で互いに追従する音声パラメータ値k
    に対し形成した後に新たな加算値Dおよび全体の指示値
    Hを直ちに形成し且つ記憶させることを特徴とする音声
    信号の音声パラメータの時間的変化決定方法。 4.音声信号の音声パラメータの時間的変化決定装置に
    おいて、 少なくとも各場合1つの時間点iのすべての音声パラメ
    ータ値kの個々の値d(k,i)に対する第1メモリ(1
    0)と、 少なくとも各場合1つの時間点iの各音声パラメータ値
    kに対する各場合1つの加算値D(k,i)に対する第2
    メモリ(20)と、 少なくとも各場合1つの時間点iの各音声メラメータ値
    kに対する各場合1つの第1方向値D′(k,i)および
    1つの指示値h′(k,i)に対する第3メモリ(30)
    と、 この第3メモリ(30)における値と同じ時間点iに対す
    る少なくとも1つの音声パラメータ値kの第2方向値お
    よびこれに関連する指示値h″(k,i)に対する第4メ
    モリ(26;40)と、 すべての音声パラメータ値kおよびすべての時間点iに
    対する全体の指示値H(k,i)に対する第5メモリ(5
    0)と、 前記の第1、第2および第3或いは第4メモリ(10,20,
    30,26;40)のデータ出力端にそれぞれ結合された入力端
    と、前記の第3メモリ(30)のデータ入力端に結合され
    各場合に1つの方向値D′(k,i)、D″(k,i)と関連
    の指示値h′(k,i)、h″(k,i)を生ぜしめる出力端
    とを有する処理回路(12)と、 各場合に第3メモリ(30)のデータ出力端から1つの第
    1方向値D′(k,i)を受ける入力端と、関連の第2方
    向値D′(k,i)を受ける入力端と、2つの方向値のう
    ちの小さい方の方向値を第2メモリ(20)のデータ入力
    端に供給する切換スイッチ(32)を制御する出力端とを
    有する比較器(14)と、 少なくとも第1,第2,第3および第5メモリ(10,20,30,5
    0)に対しすべての音声パラメータ値kのアドレスをア
    ドレスシーケンスの一方の方向で、次にアドレスシーケ
    ンスの他方の方向で循環的に発生し、更に少なくとも第
    5メモリ(50)に対し時間点iに対するアドレス選択を
    行うアドレス発生器(54,58)と、少なくとも第2,第3
    および第5メモリ(20,30,50)のローディングおよび読
    出しを制御するシーケンス制御器(56)とを有する制御
    回路と を具えたことを特徴とする音声信号の音声パラメータの
    時間的変化決定装置。
JP62296255A 1986-11-26 1987-11-26 音声信号の音声パラメータの時間的変化決定方法および装置 Expired - Lifetime JP2747292B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE3640355.5 1986-11-26
DE19863640355 DE3640355A1 (de) 1986-11-26 1986-11-26 Verfahren zur bestimmung des zeitlichen verlaufs eines sprachparameters und anordnung zur durchfuehrung des verfahrens

Publications (2)

Publication Number Publication Date
JPS63144400A JPS63144400A (ja) 1988-06-16
JP2747292B2 true JP2747292B2 (ja) 1998-05-06

Family

ID=6314791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62296255A Expired - Lifetime JP2747292B2 (ja) 1986-11-26 1987-11-26 音声信号の音声パラメータの時間的変化決定方法および装置

Country Status (4)

Country Link
US (1) US4813075A (ja)
EP (1) EP0272723B1 (ja)
JP (1) JP2747292B2 (ja)
DE (2) DE3640355A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8701798A (nl) * 1987-07-30 1989-02-16 Philips Nv Werkwijze en inrichting voor het bepalen van het verloop van een spraakparameter, bijvoorbeeld de toonhoogte, in een spraaksignaal.
US5226108A (en) * 1990-09-20 1993-07-06 Digital Voice Systems, Inc. Processing a speech signal with estimated pitch
EP0703569B1 (de) * 1994-09-20 2000-03-01 Philips Patentverwaltung GmbH System zum Ermitteln von Wörtern aus einem Sprachsignal
WO1996010248A1 (en) * 1994-09-29 1996-04-04 Apple Computer, Inc. A system and method for determining the tone of a syllable of mandarin chinese speech
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
US5754974A (en) * 1995-02-22 1998-05-19 Digital Voice Systems, Inc Spectral magnitude representation for multi-band excitation speech coders
US6505152B1 (en) * 1999-09-03 2003-01-07 Microsoft Corporation Method and apparatus for using formant models in speech systems

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5885499A (ja) * 1981-11-18 1983-05-21 株式会社デンソー 連続音声認識装置
JPS58100195A (ja) * 1981-12-10 1983-06-14 日本電気株式会社 連続音声認識装置
JPH0731504B2 (ja) * 1985-05-28 1995-04-10 日本電気株式会社 ピツチ抽出装置
US4751737A (en) * 1985-11-06 1988-06-14 Motorola Inc. Template generation method in a speech recognition system
JPH0731504A (ja) * 1993-07-19 1995-02-03 Naito Seisakusho:Kk 盲人用杖

Also Published As

Publication number Publication date
EP0272723B1 (de) 1992-10-21
US4813075A (en) 1989-03-14
EP0272723A1 (de) 1988-06-29
DE3782324D1 (de) 1992-11-26
JPS63144400A (ja) 1988-06-16
DE3640355A1 (de) 1988-06-09

Similar Documents

Publication Publication Date Title
US10878803B2 (en) Speech conversion method, computer device, and storage medium
US8977551B2 (en) Parametric speech synthesis method and system
US6249761B1 (en) Assigning and processing states and arcs of a speech recognition model in parallel processors
US4700391A (en) Method and apparatus for pitch controlled voice signal processing
US5073939A (en) Dynamic time warping (DTW) apparatus for use in speech recognition systems
US10192541B2 (en) Systems and methods for generating speech of multiple styles from text
JP2747292B2 (ja) 音声信号の音声パラメータの時間的変化決定方法および装置
US6393398B1 (en) Continuous speech recognizing apparatus and a recording medium thereof
CN104900231B (zh) 语音检索装置以及语音检索方法
US9424831B2 (en) Voice synthesizing having vocalization according to user manipulation
JPS62118399A (ja) 有限状態マシン内での遷移解析装置及び方法
US3947638A (en) Pitch analyzer using log-tapped delay line
CN108962286B (zh) 音频识别方法、装置及存储介质
JPS5852696A (ja) 音声認識装置
CN111489739A (zh) 音素识别方法、装置及计算机可读存储介质
CN115512698B (zh) 一种语音语义分析方法
JPS60105044A (ja) マイクロプログラム制御方式
Ackenhusen et al. Microprocessor implementation of an LPC-based isolated word recognizer
CA1211569A (en) Method and apparatus for pitch period controlled voice signal processing
CN1124863A (zh) 字序列的识别方法
JPS599945B2 (ja) 演算装置
CN115497450A (zh) 一种语音合成方法和装置
JP2001014162A (ja) 分岐予測方法およびデータ処理装置
CN113658593A (zh) 基于语音识别的唤醒实现方法及装置
JP2721341B2 (ja) 音声認識方法