JPS58108590A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS58108590A
JPS58108590A JP20830581A JP20830581A JPS58108590A JP S58108590 A JPS58108590 A JP S58108590A JP 20830581 A JP20830581 A JP 20830581A JP 20830581 A JP20830581 A JP 20830581A JP S58108590 A JPS58108590 A JP S58108590A
Authority
JP
Japan
Prior art keywords
vowel
similarity
consonant
section
turn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP20830581A
Other languages
English (en)
Inventor
恒雄 新田
村田 敏健
義幸 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP20830581A priority Critical patent/JPS58108590A/ja
Publication of JPS58108590A publication Critical patent/JPS58108590A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 本発明は入力された音声信号の音韻をその特徴・母うメ
ータから認識する音声認識装置に関する。
〈従来技術〉 近時、情報入力の一つの手段として、音声入力が注目さ
れている。例えば数十単語を対象として学習を行い、入
力された音声を一旦音韻系列に変換して認識処理を行う
所i+11 r特定話者限定単語認識装置」ではかな9
高い認識率が得られ、従来のキー人力装置に代る情報入
力装置として期待されている。
しかして従来装置では数100語程度の大語業を対象と
する場合、入力された音声信号を一旦音韻系列に置き換
えて認識をする方式が採られておシ、この場合は子音と
母音との分離と共に母音を精度良く識別することが要求
されている。母音識別の方法としては入力音声から音響
パラメータを求め、この音@ a’l?ラメータの時間
的に安定な点とその前後若しくは一方の音響zlラメー
タとの類似度を検討することによって音韻を分離し、そ
の音韻単位の母音候補ノ母ターン中からその差分が小さ
な即ち時間的に安定な複数点のノ譬うメータを平均して
これを母音ノ母ターンとして抽出して母音を認識するこ
とが行われている。
〈従来の問題点〉 ところがこのような従来の音韻分割して音声認識を行う
装置にあっては、例えば半母音を含む音韻のようK /
lワースベクトルの変化がなだらかなものでは、その音
節中の母音Aワースベクトルの変化が小さく、この結果
母音ノ4ターンの切出し位置に誤シが生じ易いと云う不
具合があった。この為、信頼性の高い確実な音韻認識が
できず、実用性の点で問題が残されていた。
〈発明の目的〉 本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、半母音を含む音節のように/譬
ワース(クトルの変化の少ない音節に対しても正確に信
頼性良く母音認識を行い、かつ子音区間との分離も安定
に行い得る実用性の高い音声認識装置を提供することに
ある。
〈発明の要約〉 本発明は入力された音声信号を音韻単位に分割して認識
するに際し、上記音声信号の音響/彎うメータと母音辞
書・母ターンとの類似度を逐次計算して母音を認識する
と共に、母音類似度から求められる母音定常・母ターン
と入力・臂ターンとの類似度から子音候補区間を分離し
て上記母音類似度結果に従りてその段(ア段、イ段、つ
段、二段、オ段)に属する子音候補区間中の子音を認識
することによって上述した目的を効果的に達成したもの
である。
つまシ母音認識に供した母音類似度結果を有効に利用し
て子音候補区間を分離して子音認識することKよってそ
の音韻を信頼性良く正確に認識し得るようにしたもので
ある。
〈発明の実施例〉 以下、図面を参照して本発明の一実施例につき説明する
第1図は実施例装置の概略構成を示す図である。第1図
において、広帯域マイクロホン等ヲ通じて入力される音
声信号は音声入力部1にて例えばディジタル化されて取
込まれ、音響パラメータ抽出部2に送られる。音響パラ
メータ抽出部2では上記入力音声信号の特徴を示す音響
パラメータを、例えばノ譬ワースベクトルや相関値、更
にはケグス)ラム等から求めて時系列に出力している。
しかして、この音響ノ#2メータの時系列からなる入力
音声信号の特徴ノ母ターン系列は一方においてノ母ワー
計算部3に送られると共に1他方において母音類似度計
算部4に送られる。この母音類似度計算部4では、母音
辞書・譬ターン部jK予め登侮された[te・、1゜o
、u)および(N)なる撥音を含む母音辞書ノ奢ターン
と上記入力された音声信号の入カッ譬ターンとの類似度
を個々に逐次計算しておシ、その母音類似度結果を母音
認識部6に与えている。
母音認識部eでは、各母音辞書パターンに対するWA供
度が成る閾値を越えて連続するものを抽出すると共に後
述するノ母ワー計算部1からの区間指定に従うて、その
区間内の最大類似度を有する母音を抽出することによシ
母音を認識し、その認識結果と共に上記の如く計算して
求められた母音類似度の情報をCV境界検出部1に送シ
出している。
また前記・やワー計算部3は、前記音声信号の特徴ノ9
ラメータの1つである・臂ワー特性を計算し、一定の閾
値を越えた時点t、、一定の閾値よシ下りた時点t、l
さらに音声パワーの大きい区間でパワーが最大となる時
点1mを求めて、(t@*tv)を母音認識部へ、また
( t、 、 tm )をcv境界検出部へ転送してい
る。この区間情報と前記母音認識部6にて求められた母
音類似度の情報がCV境界検出部7に与えられ、入力音
声/母メーンに対する子音候補区間Cと子音候補区間V
との境界分離に供されている。そしてCv境界検出部1
では母音認識結果の母音の最大類似度から母音定常ノ母
ターンを抽出し、これと入カッfターンとの類似度を逐
次計算することから、音声入力Iり一ン中の子音候補区
間Cと母音候補区間Vを分離している。
子音類似度計算部9は、前記母音類似度の計算結果に従
い、Cv境界検出部1にて分離された子音候補区間中の
子音を、子音辞書ノ臂ターン部9に予め登録された子音
辞書、p4ターンとの照合によシ認識している。この子
音認識は、c■単位あるいHvcv単位で予め用意され
た子音辞書パターンと子音候補区間の入カッ中ターンと
の類似度を計算し、その最大の類似度を与える子音辞書
ノ母ターンのカテf 17−を子音(Dg識結果として
得る。
このようKして得られた子音認識結果と母音認識結果か
ら入力された音声信号の音節が認識され、認識結果出力
部11f介してグリントアウトされる等して出力される
尚、このような装置における音声認識の処理フローは、
例えば第2図の如く示される。
このように構成された本装置に対して、今、例えば「東
京」なる音声を入力した場合、その音韻r Tokj・
」が入力部1にてディジタル化されて第3図(a)に、
示す時系列データとして取込まれる。この信号を受けて
、音響ノやラメータ抽出部2は、そのノ譬ワースベクト
ル・9ターンを第3図(b)に示すように抽出している
。このノ4ワースベクトルノ母ターンは、音声入力信号
の各周波数成分の・母ワーの時間的な変化を示すもので
、入力音声の一つの特徴・母うメータを示すものである
。第3図(、)に示す音声信号のパワー特性は、音響ノ
量うメータ抽出部2でノ母ワースペクトルノ譬ターンと
共に抽出することもできる。このような特徴ノ奢うメー
タからなる特徴ノ母ターン系列は前述したように、パワ
ースイクトルや入力音声の相関値を計算する等して求め
られるものである。
このような特徴ノ4ラメータ系列に対して母音類似度計
算部4は、母音辞書パターン部に登録された複数の母音
辞書ノ臂ターンと個々に逐次比較してその類似度を第3
図(d)〜(%)にそれぞれ示すように求めている=こ
れらの類似度は、母音パターン(11・$190Iu)
および(N)に対する入力/母ターンの類似度計算結果
である。
しかしてこれらの類似度結果のうち、所定の閾値を越え
る類似度値が一定期間以上継続し、かつ最大の類似度を
有する母音辞書・ぐターンのカテゴリーが、入力音声ノ
fターン中に含まれる母音として認識される。従りてこ
の例では前半部の母音(o)と後半部における母音(、
)とがそれぞれ認識される0次に母音認識部では〔o〕
の類似&(第3図(g))中の最大値(図中矢印で示し
た)を与える時刻tp、tp′の母音定常・母ターンを
CV墳外界検出部転送する。なお母音定常ノ譬ターンの
抽出時刻は、ノ母ワーの最大位置tm、 tm’を基準
として定めたり、さらK tpと組み合わせて決定する
など他の手段を用いることも考えられる。しかるのちC
V墳外界検出部1は、この母音定常パターンと音声信号
の入力−4ターンとの類似度を相関値などを用いて計算
し、その類似度が一定の閾値V!を横切る時刻を基準と
して子音候補区間および母音候補区間を分離する(第3
図(j))と同時に、子音候補区間に対応する子音・々
ターン(周波数一時間パターン)を子音類似度計算部r
へ転送する。子音類似度計算部1では上記母音類似度結
果と対応させ乍ら入カッ臂ターンを子音辞書ノ臂ターン
と照合して子音を認識し、こζにrToJ−rkJo」
なる音韻認識結果を得る。
このように本装置によれば、入力された音声信号の特徴
・譬うメータを苺音辞書・リーンと逐次比較し、その類
似度から母音をmRし、この認識された母音の類似度計
算結果から求められる母音定常パターンと音声信号の入
カッ青ターンとの類似度に従って音声信号の子音候補区
間Cと母音候補区間とを分離している。そして、母音類
似度の計算結果に対応させて子音候補区間中の子音を認
識して上記音声信号の音韻を認識している。従って、母
音辞書/4ターンとの逐次照合を行って入力/母ターン
中の母音を認識したのち、そのmaill’結果に従っ
て子音候補区間を分離するので、例え音韻のI?ワース
ベクトルがなだらかに変化するものであっても正確にそ
の認識が可能となる。故に「東京」等、半母音を含む音
韻をも信頼性良く、効果的に且つ正確に認識することが
可能となる。このように音韻認識率の向上を図ることが
できるため、実用的利点は極めて大きい。また上述した
ように認識の処理グロセスが簡単であシ、その信頼性が
高い等の効果を奏する。
尚、本発明は上記実施例に限定されるものではない0例
えば類似度計算のアルがリズムは縁形子側残差ノ譬ワー
を用いる等その目的に応じて種々変形することができる
。また抽出する特徴パラメータも、他の種類のものであ
ってもよい。
要するに本発明はその要旨を逸脱しない範囲で種々変形
して実施することができる。
〈発明の効果〉 以上説明したように本発明によれば入力音声信号の特徴
・母2メータと母音辞書・り一ンとの類似度を逐次計算
し、その類似度結果から母音を認識したのち、この認識
された母音の定常t4ターンの音声信号の入カバターン
との類似度から子音候補区間を分離して子音を認識する
ので、音!!!s号の・fワースイクトルの変化がなだ
らかな半母音を含む音韻であってもい信頼性良く正確に
認拳することができる。故に認識率の向上を図シ得、実
用的利点が極めて大きい。
【図面の簡単な説明】
第1図は本発明の一実施例を示す装置の概略構成図、第
2図は音声認識の処理70−の一例を示す図、第3図(
、)〜(j)は実施例装置の作用を示す図である。 2・・・音響ノ母2メータ抽出部、3・・・ノヤワー針
算部、4・・・母音類似度計算部、5・・・母音辞書パ
ターン部、6・・・母音認識部、1・・・CV境界検出
部、8・・・子音類似度計算部、9・・・子音辞書・譬
ターン部。 出願人代理人  弁理士 鈴 江 武 彦第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. 入力され九音声信号の音響/臂うメータを抽出する手段
    と、上記音響パラメータと母音辞書に予め登録された母
    音辞書パターンとの類似度を逐次計算してその計算結果
    から母音を認識する手段と、この認識結果のカテゴリー
    の母音類似度から求められる前記入力音声/臂ターン中
    の母音定常ノ臂り−ンと入力音声パターンとの類似度を
    求め、その類似度に従って上記音声信号の子音候補区間
    を母音候補区間から分離する手段と、前記母音類似度の
    計算結果を用いて上記子音候補区間中の子音をmisす
    る手段とを具備し九ことを特徴とする音声認識装置。
JP20830581A 1981-12-23 1981-12-23 音声認識装置 Pending JPS58108590A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20830581A JPS58108590A (ja) 1981-12-23 1981-12-23 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20830581A JPS58108590A (ja) 1981-12-23 1981-12-23 音声認識装置

Publications (1)

Publication Number Publication Date
JPS58108590A true JPS58108590A (ja) 1983-06-28

Family

ID=16554046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20830581A Pending JPS58108590A (ja) 1981-12-23 1981-12-23 音声認識装置

Country Status (1)

Country Link
JP (1) JPS58108590A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5059577A (en) * 1986-09-12 1991-10-22 Hatton John H Fluid absorbent composition
JPH067527A (ja) * 1993-04-30 1994-01-18 Daiichi Shokai Co Ltd パチンコ機の管理装置
JPH067525A (ja) * 1993-04-30 1994-01-18 Daiichi Shokai Co Ltd パチンコ機の管理装置
JPH067524A (ja) * 1993-04-30 1994-01-18 Daiichi Shokai Co Ltd パチンコ機の管理装置
JPH067526A (ja) * 1993-04-30 1994-01-18 Daiichi Shokai Co Ltd パチンコ機の管理装置
JPH0639123A (ja) * 1993-04-30 1994-02-15 Daiichi Shokai Co Ltd パチンコ機の管理装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5059577A (en) * 1986-09-12 1991-10-22 Hatton John H Fluid absorbent composition
JPH067527A (ja) * 1993-04-30 1994-01-18 Daiichi Shokai Co Ltd パチンコ機の管理装置
JPH067525A (ja) * 1993-04-30 1994-01-18 Daiichi Shokai Co Ltd パチンコ機の管理装置
JPH067524A (ja) * 1993-04-30 1994-01-18 Daiichi Shokai Co Ltd パチンコ機の管理装置
JPH067526A (ja) * 1993-04-30 1994-01-18 Daiichi Shokai Co Ltd パチンコ機の管理装置
JPH0639123A (ja) * 1993-04-30 1994-02-15 Daiichi Shokai Co Ltd パチンコ機の管理装置

Similar Documents

Publication Publication Date Title
NL192701C (nl) Werkwijze en inrichting voor het herkennen van een foneem in een stemsignaal.
JPS58130393A (ja) 音声認識装置
JPH036517B2 (ja)
JPS5972496A (ja) 単音識別装置
JPS58108590A (ja) 音声認識装置
JPS6138479B2 (ja)
JPS5939760B2 (ja) 音声認識装置
Bansod et al. Speaker Recognition using Marathi (Varhadi) Language
JP2813209B2 (ja) 大語彙音声認識装置
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
Fatima et al. Speaker recognition using lower formants
JP2760096B2 (ja) 音声認識方式
JPS5936759B2 (ja) 音声認識方法
JPH0441357B2 (ja)
JPH0682275B2 (ja) 音声認識装置
JPS60164800A (ja) 音声認識装置
JPS6120998A (ja) 音声認識装置
JPS60115996A (ja) 音声認識装置
JPH0376475B2 (ja)
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPS59219799A (ja) 音声認識装置
JPS6011898A (ja) 音声認識装置
JPS6225797A (ja) 音声認識装置
JPS6317498A (ja) 単語音声認識方式
JPS6355599A (ja) 音声認識装置