JPS6225797A

JPS6225797A - 音声認識装置

Info

Publication number: JPS6225797A
Application number: JP60165119A
Authority: JP
Inventors: 紀代原; 喜一長谷川; 入路　友明
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1985-07-26
Filing date: 1985-07-26
Publication date: 1987-02-03

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は音声認識装置の改良に関し、特に認識率の向上
に関する。

従来の技術音声認識技術はワードプロセッサや計算機への入力等マ
ン・マシンインターフェイスとして実用化が期待されて
いる分野である。

音声認識装置には、人力音声を認識する単位として単音
節（ＣＶ％　ｃは子音、■は母音を表わす）を用いるも
の、ｃｖおよびｖｃｖを用いるもの、音素（ＣおよびＶ
）を用いるもの等が考えられる。また、使用者があらか
じめ＋Ｍ’Ｅ、！−なる音声を発声、登録してから認識
処理をはじめる登録型と、たくさんの発声データをもと
に統計処理を施し普遍的なパターンを準備しておき使用
者の登録を必要としない不特定型がある。また特徴抽出
の方法としては線形予測分析やフィルタバンクを用いた
ものが主流となっている。ここでは従来例、実施例とと
もに認識単位としてｃｖおよびｖｃｖ、特徴抽出法とし
て線形予測分析を用いた不特定型音声認識装置について
説明する。以下図面を用いて、従来の音声認識装置の一
例を説明する。

第３図は不特定型音声認識装置の構成を示すブロック図
である。音声入力端２１から入力された音声は特徴抽出
部２２に於て、窓長２０ｍ５ｅｃ、フレームシフト５　
ｍ５ｅｃ１５次の自己相関法を用いた線形予測分析がな
されて、１５個のケプストラム係数および残差パワーの
計１６個のパラメータの組たして出力される。（線形予
測分析については、マーケル・グレイ著鈴木久喜訳：音
声の線形予測１９８０年コロナ社参照）。次に無音検出
部２３に於て、残差パワーを利用して語頭・語尾および
語中の無音部が決定される。母音認識部２４においては
、あらかじめたくさんの発声データを統計処理して得ら
れた母音識別関数（安田三部著社会統計学、２章７節参
照、１９６９年丸善）の係数を格納した識別関数記憶部
２５より係数を読み込み、無音検出部２３において検出
された無音部以外の部分について、各フレーム毎母音認
識を行なう。２６は定常点検出部で母音認識部２４で得
られた各フレーム毎の母音認識結果より支点なものを取
りだして母音定常点列として出力する。２７は音韻認識
部であらかじめ作成された標準パターン記憶部２８から
標準パターンを読みだし入カバターンとＤＰマツチング
を行ない、その結果距離が最小となる標準パターンを認
識音曲列として出力する。２９は単語認識部で９で得ら
れた音韻認識結果と記号列表記されて記憶されている単
語辞１３０との内容を比較し最終的な単語としてのＬを
、識結果を認識結果出力端１２に得る。

（例えば、三船他：電子通信学会、ＰＲＬ８３−４０、
この論文は、特徴抽出手段として線形予測分析ではなく
フィルタバンクを、母音定常点検出手段として各フレー
ムの母音認識結果を用いるかわりに各フレーム間の分散
を用いたものであるが、従来例の一例としてあげる事が
できる。）発明が解決しようとする問題点この様な従来の音声認識装置では定常点における母音認
識結果が最終的な認識率に影響を与えてしまうという問
題点がある。言いかえれば、母音の誤認識は復旧される
事がない、そこで母音認識率を向上さ＝Ｃる為に母音認
識結果の第１候補、第２候補をともに用いる事が考えら
れるが、これでは処理量が倍増してしまうという問題点
がある。

問題点を解決するための手段本発明は上記問題点を解消するためなされたもので、定
常点の母音第１候補に対し信頼度を定義し、（８頼度の
低いときのみ母音第１候補、第２候補をあわせて用いる
事により、処理量を大幅に増加させる事なく認識率の向
上を計ることを目的としたものである。

作用本手段の作用は次のようになる。すなわち母音定常点に
おける母音認識結果の第１候補に対し何らかの形で信頼
度を定義し、信頼度の低いときのみ第２候補以下をあわ
せて用いる事により、すべての定常点に対して母音第１
候補および第２候補を用いた場合に比べて少ない処理量
で同程度の効果をあげる事が可能となる。

実施例以下、本発明の一実施例について説明する。第１図は本
発明の一実施例について示したブロック図である。音声
入力端１から入力された音声は特徴抽出部２に於て、窓
長２０ｍ５ｅｃ、フレームシフト５　ｍ５ｅｃ、１５次
の自己相関法を用いて線形予測分析され、１５次のケプ
ストラム係数および残差パワーの計１６個のパラメータ
の組として出力される。次に無音検出部３において、残
差パワーを利用して語頭・語尾および語中の無音部が決
定される。母音認識部４においては、あらかじめたくさ
んの発声データを統計処理して得られた識別関数の係数
を格納した識別関数記憶部５より係数を読み込み、無音
検出部３において検出された無音部以外の部分について
、各フレーム毎母音認識を行なう。６は定常点検出部で
母音認識部４で得られた各フレーム毎の母音認識結果列
より安定なものを取り出して定常点列として出力する。

７は母音信頼度検討部で、定常点検出部で得られた各定
常点の母音認識結果の信頼度を定義し、信頼度が低いと
きのみその定常点に対して母音第１候補と第２候補の２
つの結果を採用する事とする。母音信頼度検討部７にお
ける詳細なアルゴリズムと母音信頼度検討部７ａと平均
母音重心記憶部７ｂについては後に説明する。８は音韻
認識部であらかじめ作成された標（１！パタ一ン記憶部
８から標準パターンを読みだし入カバターンとＤＰマ、
チングを行ないその結果距離が最小となる標準パターン
の音韻を認識結果音韻列として出力する。１０は単語認
識部で７で得られた音韻認識結果と記号列表記されて記
憶されている単語辞書１１との内容を比較して最終曲な
単語としての認識結果を認識結果出力端１２に得る。

次に母音信頼度検討部７におけるアルゴリズムについて
詳細に説明する。まず信頼度を計算するためのリファレ
ンスとして、母音識別関数を作成したときに用いたあら
かじめ準備されたたくさんの母音発声データから、各母
音毎の平均値−平均母音重心を求める。数式で表現すれ
ば、仮にａの発声データの集団をＵ、、その元をｕｎｉ
とするし、Ｕｌの元の個数をｎ、とすると、ａの平均母
音重心８つは、ただし、ｇａ　、ｕｓ　ともに１５次のケプストラム係
数からなるベクトルである。平均母音重心記憶部７ｂは
上記の式で求められた各母音毎の平均母音重心ｇａ、ｇ
８、ｇｕ、ｇ、、ｇｏ、ｇ８を格納しである。今、ある
定常点Ｓにおける母音認識結果の第１候補がＶｌ、第２
候補がＶ２と仮定すると、母音信頼度検討部において、
平均母音重心との距離ｄ　ｖ　＋、ｄｖ２、を次の式で
求める。

ｄｖ＋＝　ｌ　Ｓ　　ｇｖ＋　ｌ−Σ　（Ｓ、　　ｇ　
Ｖｌ＋　＋）　”ｄｖｚ−ｌ　Ｓ　　ｇｖｚ　ｌ−Σ　
（Ｓ、　　ｇｖｚ、；）ｚ即ちこれは定常点Ｓにおける
特徴パラメータ列と平均母音重心とのユークリッド距離
である。信頼度ｒをｄＶｌ、ｄｖ□を用いてｒ　＝ｄ　ｖｚ／　ｄ　ｖ＋と定義し、ｒ〉２のときは、定常点Ｓにおける母音認識
結果第１候補の信頼度が高いと判断して、第１候補ｖ１
だけを採用し、ｒ−≦−２のときは信頼度が低いと判断
してＶ、　、Ｖ、ともに採用する。

以上の様に、母音認識結果に対して何らかの形で信頼度
を定義し、信頼度の低いときのみ母音第１候補、第２候
補の２つの候補を利用する事により、処理量を大幅に増
加させる事なく認識率の向上を計る事ができる。

実施例では、リファレンスとして平均母音重心を、距離
としてニークリット距離を、信頼度として距離の比をま
た信頼度の閾値として２を用いているが、これは本発明
を何ら制限するものではない。

発明の効果以上のように本発明によると、母音認識結果の信頼度を
定義して、信頼度の低いときのみ母音第１、第２の両候
補を用いる事により、信頼度を用いずにすべての定常点
について母音第１、第２候補を採用した場合に比べより
少ない処理量で同様の効果（認識率の向上）を計る事が
できる。

【図面の簡単な説明】

第１図は本発明の一実施例の音声認識装置のブロック図
、第２図は従来例の音声認識装置のブロック図である。１・・・・・・特徴抽出部、３・・・・・・無音部検出
部、４・・・・・・母音認識部、５・・・・・・識別関
数記憶部、６・・・・・・定常点検出部、７・・・・・
・母音信頼度検討部、８・・・・・・音韻認識部、９・
・・・・・標準パターン記憶部、１０・・・・・・単語
認識部、１１・・・・・・単語辞書記憶部。

Claims

【特許請求の範囲】

音声入力手段、前記音声入力手段から入力された音声に
対し一定時間毎に特徴抽出を行ない特徴パラメータ列を
抽出する特徴抽出手段、前記特徴パラメータ列に対し母
音認識を行なう母音認識手段、前記母音認識結果から安
定部を検出して母音定常点列として出力する定常点検出
手段、認識すべき各音韻に対してあらかじめ準備されて
いる標準パターンを格納しておく標準パターン格納手段
、前記特徴パラメータ列と前記標準パターンの各々を比
較して前記特徴パラメータ列を音韻系列に変換する音韻
認識手段を有し、前記定常点検出手段に於て検出された
母音定常点の母音第１候補に対し信頼度を定義し、信頼
度が低いときには母音第２候補もともに利用することを
特徴とした音声認識装置。