JPS6147999A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6147999A
JPS6147999A JP59169569A JP16956984A JPS6147999A JP S6147999 A JPS6147999 A JP S6147999A JP 59169569 A JP59169569 A JP 59169569A JP 16956984 A JP16956984 A JP 16956984A JP S6147999 A JPS6147999 A JP S6147999A
Authority
JP
Japan
Prior art keywords
syllable
candidate
interval
speech
reliability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59169569A
Other languages
English (en)
Other versions
JPH067346B2 (ja
Inventor
外川 文雄
伸 神谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP59169569A priority Critical patent/JPH067346B2/ja
Publication of JPS6147999A publication Critical patent/JPS6147999A/ja
Publication of JPH067346B2 publication Critical patent/JPH067346B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
〈産業上の利用分野〉 本発明は、音声入力式の文書処理装置等に用いられる音
声入力装置における音声B織方式の改良に関するもので
ある。 〈従来技術〉 人力音声をより細分化された音節単位に分解(以下、音
節セグメンテーションという比で抽出した音節区間系列
について、各音節毎に識別した複数個の音節候補からな
る音節候補の時系列(以下、音節ラティスという)に基
づいて識別確度の高い組み合わせによって得られる候補
音節列を辞書と照合して得た候補を入力音声に対する認
識結果とする場合、従来は、上記の音節セグメンテーシ
ョンの際の音節境界を一意に決定することが一般に行な
われている。しかし、このような処理では、入力音声が
より連続的になり会話音声に近くなると、音節境界が不
明確になる為検出が困難となり、認識率が悪くなるとい
う問題点がある。 発明者らは、この点に着目し、音節境界の検出精度を上
げる為に、音節セグメンテーションのアルゴリズムによ
って音節境界を一意に決定せず、発声速度を推定し、こ
の推定値を活用して認識率を向上することを提案してい
るが、これによってもなお音節セグメンテーシヨンの誤
りが生じている。 〈発明が解決しようとする問題、α〉 本発明は、発声速度を活用してもなお音節セグメンテ−
シコンの誤1)が生ずる点を解決し、認識率の良好な音
声認識方式を提供することを目的としてなされたもので
ある。 く問題点を解決する為の手段〉 上述の目的を達する為に、本発明は、各音節の識別距離
と発声速度に基づいた信頼度の両者を用いて候補音節列
の識別確度を決定するようにしたことを特徴としている
。 く作用〉 本発明の方式では、音節境界を一意に決定せず、音節の
識別距離と発声速度に基づく信頼度の二つの要素を用い
ており、音節境界を複数の候補として検出し、同時刻に
競合した複数の音節区間の存在を許した音節セグメンテ
ーションを行なう。そして、各音節区間候補について音
節を識別して得られる競合のある音節候補ラティスを用
いて、音節区間検出の信頼度の高い音節区間を優先して
候補音節列が作成される。 〈実施例〉 以下、図面の一実施例について、本発明を具体的に説明
する。 第1図は、本発明を実施した音声入力装置の溝威を示す
図である。 入力された音声は、先ず、音声分析部1で音響分析され
、無声区間検出部に送られて無音区間が検出され、更に
文節境界検出部5で文節境界としての無音区間かどうか
の検出が行なわれる。一方、有声区間検出部3では、有
音部、即ち音のかたまりが検出され、音節境界候補検出
部6でパワー変化、スペクトル変化、音韻変化等、及び
発声速度記憶部4に記憶されている発声速度情報を用い
て音節境界候補が与えられる0以上の結果は、音声  
 −分析部1で得られた明らかな音節境界情報とともに
音節区間候補検出部7で統合され、妥当な音節区間候補
を信頼度の高い順に得る。 これらの音節区間候補は、パターンメモリ12に予め記
憶させである音節標準パターンとのパターンマツチング
などを、音節識別部8で行なって識別され、後述するよ
うに、識別距離の小さい順に候補音節が出力される。こ
うして出力された識別距離を持つ音節候補の時系列が音
節候補ラティス(b)である。一方、音節区間候補の信
it算出部□9で、発声速度記憶部4に記憶された発声
速度情報を用いて、゛後述する(1)式に従って音節区
間候補の信頼度が算出され、最適な音節区間系列が推定
される。 候補音節列作成部10では、この最適音節区間系列に基
づいて、その他の音節区間系列に対して各音節区間の荷
重係数Kを決定し、後述する(2)式に従って識別距離
と区間検出の信頼度を用いて信頼度Sの小さい順に候補
音節列を順次作成する。 候補音節列は、言語処理部11で辞書13を用いて順次
辞書照合を含む言語処理が行なわれ、解釈が可能な候補
列が認識結果(c)として出力される。そして、話者(
或はオペレータ)によって確定された候補列を構成する
音節区’fJJ系列の各音節長は、発声速度情報として
以前の平均音節長の値とともに発声速度記憶部4に記憶
され、以後の処理に利眉される。 次に、音節区間の決定処理について述べる゛。
【1】 音節区間の信頼度の算出 発声速度に基づいた音節区間候補の信頼度は、音節長の
平均値からの偏差で求められる。この為、音声入力装置
を使用する際には、先ず、音節数が既知である標準文章
を使用者が音声入力し、平均音節長りが推定される。平
均音節長りは、音節数nの文章の1番目の有音区間の1
1続時間をL(i)とすると、 1;] で求められる。 そこで、同時間内に複数の音節区間系列に対する信頼度
DIID21・・・・・・*Dx*・・・は次の(1)
式に上って求められる。 但し、X(i):音節区間系列Xの第1番目の音節長X
:音節区間系列Xの音節区間数 L:平均音節長 d(’X (i)、 L ):X (i )のLからの
偏差であり、通常d(X(i)、L)= l X(i)
−L I /Lで与えられる。− DX:音節区間系列Xの信頼度 この(1)式で求められた信頼度の最小の音節区間が最
適音節区間系列ということになる。
【2】候補音節列の作成 同時間内に複数個の音節区間候補が検出されて競合状態
にある音節候補ラティスは、音節の識別距離と上述した
音節区間の信頼度の両者を用いて評価値Sを求め、この
値の小さい順に候補音節列を作成する。音節の識別距離
は、上述の最適音節区間系列を基準にして次のようにし
て求められる。 今、第2図に示すような音節区間候補が検出され、B−
C系列とD系列とが競合しているとする。 ここで、 La1aj:音節区間候補Aの音節長と第i音節候補の
識別距離 Lb、bj:音節区間候補Bの音節長と第j音節候補の
識別距離 LC+Ck:音節区間候補Cの音節長と第に音節候補の
識別距離 Ld、dl:音節区間候補りの音節長と第1音節候補の
識別距離 L:平均音節長 とすると、競合する系列の信頼度は、 B−C系列の信頼度 Dbc= id(Lb、 L )+d(Lc、 L )
l/ 2D系列の信頼度 Dd=dCLd、L) となり、競合部の評価値は、 5bc=(bi+ck)X Kbc+ DbcScl=
dlXKd+Dd で求められる。但し、Kbj、Kdは、最適音節区間系
列を基準にした識別距離に対する荷重係数で、B−Cが
最適系列の場合(即ち、Dbc<Ddの場合)は、Kb
c”1.Kd=2であり、Dが最適系列の場合(Dd<
Dbc)は、Kd=1−Kbc=1/2である。 以上の結果から、全体の評価値は、 であり、S abc、 S adのうち小さいものを評
価値Sとし、この値の小さい組み合わせ順に候補音節列
が作成される。 以上の手順を「家を」という入力音声を例として具体的
に説明する。 第3因は、「家」と入力された場合の音節境界の状態を
示す図である。即ち、A、B、C,Dの4個の音節区間
候補があり、競合する部分の各候補B。 C,Dの音節長が夫々Lb=12. Lc=27. L
d=39、平均音節長U=23であるとする。音節区間
の各信頼度は、 Bについて:  d(Lb、U)=0.48Cについて
:  d(LcJ:)=0.17Dについて:  d(
Ld、]:)=0.70である。従って、音節区間系列
の各信頼度は、B−C系列: Dbc=(d(Lb、U)+d(Lc、 t、)、/ 
2 =0.32D系列: Dd=d(Ld、’L:)        =0.70
となり、B−CilS列が最適音節区間系列であると推
定される。このB−C系列について信頼度を正規化すれ
ば、 D’bc”O D’d =Q、38 となる。 第4図は、各候補青筋の識別距離を示す音節候補ラティ
スであり、これらの各識別距離と上述の信頼度(正規化
後)とを用い、各候補音節列の評価値を(2)式に従っ
て 5abc=ai+(bj+ck+D’bc)Sacl 
=ai+(dlX 2 +D ’d)によって求め、小
さい値を与える組合せの順に候補列を順次作成して行く
、。 こうして作成された候補音節列に言語処理を施し、認識
結果が別表のように出力される。 この結果によれば、第1候補はABC系列の「いえお」
となっており、正しい結果が出ていることがわかる。 〈発明の効果〉 上述の説明から明らかなように、本発明によれば1、各
音節の識別距離と発声速度の両者を用いて音節セグメン
テーションが行なわれる為、セグメンテーションの誤り
が少なくなり、後の言語処理によって正しく修正される
確率を高くすることができるのである。
【図面の簡単な説明】
$1図は、本発明を実施した音声入力装置の構成を示す
ブロック図、 第2図は、同上、音節候補ラティスを示す図、第3図は
、同上、入力音声の音節境界の1例を示す図、 第4図は、同上、具体例の音節候補ラティスを示す図で
ある。 1・・・音声分析部 4・・・発声速度記憶部 7・・・音部区間候補検出部 8・・・音節識別部 9・・・音節区間候補の信頼度算出部 10・・・候補音節列作成部 11・・・言語処理部

Claims (1)

    【特許請求の範囲】
  1. 入力音声を音節単位に分解し、各音節を識別して複数個
    の音節候補の時系列をもとに識別確度の高い順に単語や
    文節に相当する候補音節列を逐次作成して単語音声や文
    節音声などを認識する音声入力装置において、各音節の
    識別距離と発声速度に基づいた信頼度の両者を用いて候
    補音節列の識別確度を決定するようにしたことを特徴と
    する音声認識方式。
JP59169569A 1984-08-14 1984-08-14 音声認識装置 Expired - Lifetime JPH067346B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59169569A JPH067346B2 (ja) 1984-08-14 1984-08-14 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59169569A JPH067346B2 (ja) 1984-08-14 1984-08-14 音声認識装置

Publications (2)

Publication Number Publication Date
JPS6147999A true JPS6147999A (ja) 1986-03-08
JPH067346B2 JPH067346B2 (ja) 1994-01-26

Family

ID=15888899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59169569A Expired - Lifetime JPH067346B2 (ja) 1984-08-14 1984-08-14 音声認識装置

Country Status (1)

Country Link
JP (1) JPH067346B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63161499A (ja) * 1986-12-24 1988-07-05 松下電器産業株式会社 音声認識装置
JP2001100790A (ja) * 1999-08-30 2001-04-13 Koninkl Philips Electronics Nv 音声認識用の方法及び装置
JP2008242082A (ja) * 2007-03-27 2008-10-09 Konami Digital Entertainment:Kk 音声処理装置、音声処理方法、ならびに、プログラム
JP2011053425A (ja) * 2009-09-01 2011-03-17 Nippon Telegr & Teleph Corp <Ntt> 音素分割装置、方法及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63161499A (ja) * 1986-12-24 1988-07-05 松下電器産業株式会社 音声認識装置
JP2001100790A (ja) * 1999-08-30 2001-04-13 Koninkl Philips Electronics Nv 音声認識用の方法及び装置
JP2008242082A (ja) * 2007-03-27 2008-10-09 Konami Digital Entertainment:Kk 音声処理装置、音声処理方法、ならびに、プログラム
JP4563418B2 (ja) * 2007-03-27 2010-10-13 株式会社コナミデジタルエンタテインメント 音声処理装置、音声処理方法、ならびに、プログラム
JP2011053425A (ja) * 2009-09-01 2011-03-17 Nippon Telegr & Teleph Corp <Ntt> 音素分割装置、方法及びプログラム

Also Published As

Publication number Publication date
JPH067346B2 (ja) 1994-01-26

Similar Documents

Publication Publication Date Title
JPS62217295A (ja) 音声認識方式
Ravinder Comparison of hmm and dtw for isolated word recognition system of punjabi language
JPS61219099A (ja) 音声認識装置
JPH07219579A (ja) 音声認識装置
JPS6147999A (ja) 音声認識装置
JP2002278579A (ja) 音声データ検索装置
JP3104900B2 (ja) 音声認識方法
JP2000099084A (ja) 音声認識方法及びその装置
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JP3031081B2 (ja) 音声認識装置
JPS6325366B2 (ja)
JPH049320B2 (ja)
Mary et al. Keyword spotting techniques
JPH0554678B2 (ja)
Kalinli et al. Continuous speech recognition using attention shift decoding with soft decision.
JP2655637B2 (ja) 音声パターン照合方式
JPH05303391A (ja) 音声認識装置
JPH0455518B2 (ja)
JPS62111295A (ja) 音声認識装置
JPH0242238B2 (ja)
JPH09212190A (ja) 音声認識装置及び文認識装置
JPS6155680B2 (ja)
JPS60147797A (ja) 音声認識装置
JP2000137495A (ja) 音声認識装置および音声認識方法
JPS6346499A (ja) 大語▲い▼単語音声認識方式