JPH0555039B2

JPH0555039B2 -

Info

Publication number: JPH0555039B2
Application number: JP60250551A
Authority: JP
Inventors: Jakatsudaa Puryadaashan; Dadei Muura Hoshan
Original assignee: Alcatel NV
Current assignee: Alcatel Lucent NV
Priority date: 1984-11-09
Filing date: 1985-11-08
Publication date: 1993-08-16
Also published as: EP0181167B1; DE3576233D1; CN85108165A; JPS61120200A; US4852171A; ATE50658T1; EP0181167A2; AU584130B2; AU4908585A; EP0181167A3; MX159615A

Description

【発明の詳細な説明】［発明の技術分野］この発明は音声の認識装置に関するものであ
り、特に、任意の広さのシステムのバイアスに対
して補償され、登録期間中に発生された全ての情
報を含む基準テンプレートを使用するそのような
装置に関するものである。

［発明の技術的背景］音声の電子的識別は多年に亙り多くの研究の目
標であつた。共通的な方法の一つには時間的に振
幅の変化する信号の電子的な結果である“音声印
刷”またはパターンの発生が含まれている。パタ
ーンは予め発生され蓄積されているワードパター
ンと比較される。そのような方法は多くの困難な
問題に遭遇した。すなわち、それは話す人に依存
し、および、或いは、種々のワードパターンを再
生し比較するために膨大なアナログ回路を必要と
する。

最近ではテンプレート整合と呼ばれるワード認
識に多くの努力が払われている。テンプレート整
合では任意の音声ワードの特徴を表わす２進数ア
レーが発生される。発音テンプレートと呼ばれる
これらのテンプレートは次いで基準テンプレート
の蓄積された辞書と比較され、すなわち評価され
る。通常基準テンプレートは、特定のワードまた
はワードリストが繰返される登録段で生成され、
所定のワードに対する結果的なテンプレートはそ
のワードの全ての繰返しに共通の特徴から導出さ
れる。全体の登録を通して認識された結果が一定
でないアレー位置は評価には使用されない。その
ような基準テンプレート発生に対する合理的な方
法においては、正確な比較のために基準テンプレ
ートのフオーマツトおよび内容が解析されている
発音テンプレートのフオーマツトおよび内容と同
一でなければならないと一般に信じられている。

例えば、通常の基準テンプレートは、登録中の
所定の繰返しにおいて、もしも特定のビツト位置
に対する２進値がその位置にたいする全ての以前
の２進値と同一であれば、更新された位置がその
２進値に割当てられるように形成される。しかし
ながら、もしも任意の繰返しにおいて、もしも、
そのビツト位置がその位置にたいする全ての以前
の２進値と異なつていれば、そのビツト位置は空
きになる。すなわち未知になる。それにもかかわ
らず、もしもビツト位置が登録の全繰返しにおい
て特定の値でなければ、登録中そのワードに対す
る音声信号から抽出された全情報より少ないもの
がワード認識プロセス中使用される。

通常の評価中、識別されるべきワードの音声信
号の抽出された特徴を表わす発音テンプレートは
辞書中の全ての基準テンプレートと比較される。
発音テンプレート中の各ビツト位置と基準テンプ
レート中の対応するビツト位置との比較後、評価
が基準テンプレートに対して行われる。発音テン
プレートは辞書中の各基準に対して評価される。
そのようにして行われた評価は次いで解析され、
評価された基準テンプレートが発音テンプレート
により表わされるワードの識別に充分高いものか
否かが決定される。しかしながら、上記の基準テ
ンプレートビツト維持技術に基づくと、各基準テ
ンプレートは未知の多数のビツト位置を含むこと
になる。さらに未知の数は基準テンプレート間で
変化する。結論として任意の与えられた基準テン
プレートと解析されるべき発音テンプレートとの
間の比較は不明瞭である。

通常のシステムの不明瞭性を生じる別の困難な
問題は、システムの広さのバイアスが登録中に存
在することである。このようなバイアスは、話さ
れたワードに対する発音テンプレートのビツト位
置または１ワードの多数倍が登録される２進値に
関係なく特定の２進値が割当てられた全ての基準
テンプレートのビツト位置に生じる。

さらに、いくつかの現在のテンプレートスコア
方法はスコアの計算のために可成り多くの乗算お
よび加算を必要とするようなアルゴリズムに基づ
いて評価を行なう。したがつて、可なり多くの計
算ステツプが必要なために発音されたワードの認
識が新しい高い速度マイクロプロセツサを使用し
てもなお遅いものである。これは演算用のマイク
ロプロセツサが行なう速度の遅い作業の中でも特
に乗算は最も遅い動作の一つであるから固有的な
ものである。

［発明が解決しようとする課題］本発明の目的は、前記のようなシステムの不明
瞭性を減少させ、特にシステムのバイアスの広さ
の影響が補正された正確で高速の音声認識装置を
提供することである。

［課題解決のための手段］本発明は、認識されるべき音声のスペクトルの
特徴を表わす２進値をそれぞれ蓄積された複数の
位置を有する発音テンプレートと、この発音テン
プレートの前記複数の位置に対応する複数の位置
を有する複数の基準テンプレートと、基準テンプ
レートと発音テンプレートとの間の相対的整合を
示す第１のスコアの基準テンプレートに対して設
定して発音テンプレートにより表わされる音声が
認識できるようにする手段とを具備し、基準テン
プレートにおける各位置には発音テンプレートの
前記対応する位置で発生する特定の２進値の確率
を表わす値が蓄積されている音声認識装置におい
て、発音テンプレートの複数の位置に対応する複
数の位置を有するバイアステンプレートを備え、
このバイアステンプレートの複数の各位置はいず
れかの発音テンプレートの対応する位置で発生す
る特定の２進値の確率を表わす値を蓄積してお
り、さらにバイアステンプレートと発音テンプレ
ートとの間の相対的整合を示す第２のスコアを設
定する手段を具備していることを特徴とする。本
発明では、発音テンプレートの特定の位置に蓄積
されている周波数対時間過程から導出された２進
値の発生の確率を基準テンプレートの対応する特
定の位置に蓄積しており、その整合により音声を
認識することによつて不明瞭性を低くすることが
できる。さらにバイアステンプレートが使用さ
れ、このバイアステンプテートにはいずれかの発
音テンプレートの対応する位置で発生する特定の
２進値の確率、例えばその特定の位置において全
ての発音テンプレートのいずれかのものが対応す
る位置で以前に発生した特定の２進値の全体数が
蓄積されている。このうなバイアステンプレート
の使用によつて登録中または使用中の個人差によ
る差異ならびに特定の装置に基づく差異は除去す
ることができる。

この発明のその他の目的および特徴は添附図面
を参照にした以下の説明により明らかになるであ
ろう。

［発明の実施例］第１図のブロツク図に示された音声認識装置は
全体を10で示され、複数の基準テンプレートを生
成し蓄積する手段１２、システムバイアステンプ
レートを生成し蓄積する手段１４、発音テンプレ
ートにアクセスする手段１６、および複数の蓄積
された基準テンプレートおよびシステムバイアス
テンプレートを変形する手段１８を備えている。
さらに装置１０は変形された基準テンプレートお
よびシステムバイアステンプレートを蓄積する手
段２０、アクセスされた発音テンプレートに関す
る変形されたテンプレートのためのスコアを設定
する手段２２およびスコアを受けるか拒否するか
するための手段２４を備え、それによつてスコア
が受入れられたときそれに対応する基準テンプレ
ートがアクセルされた発音テンプレートにより表
わされる発音を表わす。

好ましい実施例では、複数の基準テンプレート
を生成し蓄積する手段１２は、蓄積媒体２６、シ
フトレジスタ２８、出力３２および第１および第
２の入力３４，３６を有する加算器３０、特定の
基準テンプレートをアドレスする手段３８および
シフトレジスタ２８の対応する位置によつてアド
レスされた特定の基準テンプレートの特定の位置
を同時にアドレスする手段４０を備えている。

システムバイアステンプレートを生成し蓄積す
る手段１４は、蓄積媒体４２、シフトレジスタ４
４、出力４８と第１および第２の入力５０，５２
を有する加算器４６、蓄積媒体４２およびシフト
レジスタ４４の両方の特定の位置を同時にアドレ
スする手段５４を備えている。以下さらに詳細に
説明するようにテンプレートを生成し蓄積する手
段１２および１４は登録中は付勢され、認識中は
付勢されない。

発音テンプレートにアクセスする手段１６は、
発音テンプレート形成装置５８から出力された発
音テンプレートを受信するように構成されたシフ
トレジスタ５６を備えている。シフトレジスタ５
６はスイツチング手段６０によつて基準テンプレ
ート生成蓄積手段１２およびシステムバイアステ
ンプレート生成蓄積手段１４に接続される。装置
１０と共に使用するように構成された発音テンプ
レート形成装置５８については本出願人の別出願
に詳細に記載されている。

基準テンプテート生成蓄積手段１２の蓄積媒体
２６は少なくとも（テンプレート当りのビツト
数）×（蓄積されるべきテンプレート数）に等しい
容量を有する。例えば256バイトを有するテンプ
レートを使用し、例えば各テンプレートが一つの
話されたワードを表わしている200の異なつたテ
ンプレートを登録するには512キロバイトの容量
が必要である。アドレス手段３８によつてアドレ
スされた基準テンプレートの蓄積媒体２６の内容
はシフトレジスタ２８に出力される。シフトレジ
スタ２８はこの例では256、すなわち１基準テン
プレート分のバイトを含んでいる。シフトレジス
タ２８の出力は加算器３０へ例えばその第１の入
力３４を介して接続されている。加算器３０の第
２の入力３６はスイツチング手段６０を介して発
音シフトレジスタ５６に接続されている。加算器
３０の出力は各ワードに対してシフトレジスタ２
８中のその位置で発生した選択された２進値（例
えば２進値の１）プラス発音シフトレジスタ５６
中にその値の発生の回数を表わしている。したが
つて加算器３０の出力は各位置に対する選択され
た２進値の発生の更新された全体である。したが
つて、この装置によつて各蓄積された基準テンプ
レートは、各基準テンプレートに対する各位置に
対する選択された２進値の発生のランニング状態
の和を保持する。その結果として以下さらに詳細
に説明するように、発音テンプレート形成装置５
８によつて与えられた全てのデータは保持され
る。

バイアステンプレート生成蓄積手段１４の蓄積
媒体４２は少なくとも発音テンプレート中アドレ
ス可能な位置の数に等しい容量を有する。好まし
い実施例ではこの容量は256バイトである。バイ
アステンプレートの内容は登録中加算器５６の第
１の入力５０に接続されたシフトレジスタ４４中
へ書込まれる。加算器５６の第２の入力５２はア
クセスされた発音テンプレートを有するシフトレ
ジスタ５６中の対応する位置からのビツト情報を
受ける。それ故、加算器４６の出力４８は蓄積媒
体４２に対する各位置のために選択された２進値
の連続的に更新された全体の発生を出力する。

例えば、任意所定の発音テンプレートに対し
て、そこにあるビツトは１または０、すなわち２
進の“高”または“低”である。しかしながらシ
フトレジスタ４４の対応する位置における情報
は、関係する発音テンプレートまたは基準テンプ
レートの繰返し数に関係なくその位置に以前に発
生した選択された値の発生の全体の数を表わす。
その代わりに加算器５６は各位置における２進０
の発生のみをカウントするように構成することも
できる。それにもかかわらず、以下さらに詳細に
後述するように、全登録を通して形成され、使用
された全ての発音テンプレートからの全ての情報
はバイアステンプレート蓄積媒体４２中に保持さ
れ、未知の発音テンプレートの次のスコア中で使
用される。

実施例においては、未知のワードを表わす発音
テンプレートが識別されるべきであるとき、蓄積
媒体２６および４２の内容は手段１８により変形
された後手段２０に負荷される。本質的に複数の
基準テンプレートおよびシステムバイアステンプ
レートを変形する手段１８は各位置に対して２進
１および２進０の位置における発生の数の対数値
を表わす１対の出力を与える。

特定の実施例では、手段１８は１バイトづつの
ベースで蓄積媒体４２からシステムバイアステン
プレートを受信するように構成された第１の対数
コンバータ６２を備えている。さらに対数コンバ
ータ６２は補数２進バイト対数形成装置６４と並
列に接続されている。対数形成装置６４は第２の
対数コンバータ６８と直列に接続された減算手段
６６を備えている。減算手段６６は以下に詳細に
説明するように登録された発音テンプレートの全
体の数を与えられ、それから各位置における数が
１バイトづつのベースで減算される。すなわち、
もしも蓄積媒体４２中の位置が２進１の発生を表
わすならば、減算手段６６の出力はそれらの同じ
位置に対する２進０の発生数を表わしている。し
たがつて、第１および第２の対数コンバータ６２
および６８はそれぞれ登録中に設定されたそのビ
ツト位置に対する全てのデータの対数値を表わ
す。対数コンバータ６２および６８の出力はそれ
ぞれ蓄積手段２０中の拡張された蓄積媒体７０お
よび７２中に蓄積される。

手段１８はまた蓄積された各基準テンプレート
に対して基準テンプレート当りベースおよびバイ
トづつのベースの両者により蓄積媒体２６から複
数の基準テンプレートを受信するように構成され
た同様の装置を備えている。特に第３の対数コン
バータ７４が基準テンプレート補数対数形成装置
７６と並列に接続されている。対数形成装置７６
は直列に接続された減算手段７８および第４の対
数コンバータ８０を備えている。この実施例では
減算手段７８に蓄積された被減数は特定の基準テ
ンプレートにより表わされるワードが登録された
回数である。したがつて、第３および第４の対数
コンバータ７４および８０の出力はそれぞれ登録
中に設定された各ワードの位置に対する全てのデ
ータの対数値を表わしている。第３および第４の
対数コンバータ７４および８０の出力はそれぞれ
蓄積手段２０中に拡張された蓄積媒体８２および
８４中に蓄積される。

その結果、変形された複数の基準テンプレート
および変形されたシステムバイアステンプレート
の蓄積する手段２０は256バイト、すなわち１テ
ンプレートアレイをそれぞれ有する蓄積媒体６２
および６４、および蓄積された各ワードに対する
256バイトアレイの補数対としてフオーマツトさ
れた複数の基準テンプレートを含む蓄積媒体７４
および８０を備えている。

発音テンプレートに関する変形されたテンプレ
ートのためのスコアを設定するための手段２２
は、蓄積媒体７０または７２からの１バイトおよ
び各基準テンプレートに対する蓄積媒体８２また
は８４からの１バイトを選択するための手段８
６、システムバイアステンプレートおよび各基準
テンプレートに対する選択手段８６からの全ての
バイトを加算する手段８８、およびこの手段８８
の加算値を蓄積する手段９０を備えている。

実施例では、手段８６は、所定の基準テンプレ
ートのために蓄積媒体８２および８４中に蓄積さ
れたデータを受けるようにそれぞれ構成された第
１および第２のシフトレジスタ９２および９４を
有している。手段８６はさらに、システムバイア
ステンプレートバイト選択手段１００および基準
バイアステンプレートバイト選択手段１０２を有
している。バイト選択手段１００および１０２は
発音シフトレジスタ５６中のその位置における対
応するビツトの２進値によつて与えられるビツト
に従つて相互に位置せしめられる。例えば、もし
もシフトレジスタ５６中の特定のビツト位置の２
進値が２進の１であれば、シフトレジスタ９２お
よび９６が選択される。前述のように、シフトレ
ジスタ９２および９６はそこに２進１の発生の値
を有する蓄積媒体７０および８２に対応してい
る。反応に、もしもシフトレジスタ５６中の２進
値０であれば、シフトレジスタ９４および９８が
選択される。

選択されたシフトレジスタ、すなわち９２およ
び９６、または９４および９８は加算手段８８Ａ
および８８Ｂにより別々に加算され、それらはそ
れぞれ各256バイトすなわち各基準テンプレート
に対する選択されたシフトレジスタ９２および９
６、または９４および９８の全ての値に対する単
一のランニング合計を保持している。以下にさら
に詳細に説明するように、各256バイトすなわち
各基準テンプレートが加算手段８８Ａおよび８８
Ｂから累算された和は重みが付けられる。

システムバイアス加算器からの重みを付けられ
た加算値は第１のバツフア１０４に蓄積され、加
算器１０６によりワード蓄積媒体８２および８４
からの各重みを付けられた加算値から減算され
る。各基準テンプレートに対する加算器１０６の
出力は第２のバツフア１０８に蓄積される。第２
のバツフア１０８はそこに蓄積された最高の値を
選択し出力させる手段１１０を備えていることが
好ましい。第１および第２のバツフア１０４およ
び１０８からの出力はスコアを受信または拒否す
るための手段２４に入力される。

実施例では、手段２４は第１および第２の比較
器１１２および１１４および論理アンドゲート１
１６を備えている。第１の比較器１１２はその入
力としてバツフア１０４からシステムバイアスス
コアを受け、そのスコアを予め選択せれた値、す
なわちしきい値と比較する。もしもバツフア１０
４からの加算値がしきい値を超えたならば、後え
ば２進１がアンドゲート１１６の一方の入力に出
力される。第２の比較器１１４はその入力として
バツフア１０８中の最高の値を受け、それをそこ
に蓄積された予め選択された値、すなわちしきい
値と比較する。もしもバツフア１０８からの値が
きしい値を超えたならば、例えば２進１がアンド
ゲート１１６の他方の入力に出力される。もしも
アンドゲート１１６の両方の入力が２進１であれ
ば、その場合にのみ受信許容信号、すなわち特定
の２進値がアンドゲート１１６から出力される。
このようにして出力された信号は周知の技術によ
つて例えばコンピユータ内の予め選択された命令
を実行するような任意の目的に使用することがで
きる。

装置１０はさらにビツトクロツク発生装置１１
８を備え、それはデータ流の調整およびデータス
コアの同期を確保するために規則的な、予め選択
された周波数のパルスを出力する。ビツトクロツ
ク発生装置１１８の出力パルスは第１図では
BCLKとして示されている。図示のように登録中
の各シフトレジスタ２８および４４および認識中
の各シフトレジスタ５６，９２，９４，９６，９
８の付勢位置はBCLKによるポインターによつて
制御される。さらに、登録中の加算器手段８８お
よび蓄積媒体２６および４２ならびに認識中の各
蓄積媒体７０，７２，８２，８４はBCLKによつ
てステツプされる。クロツク発生装置１１８から
のパルス数はカウンタ１２０によつて監視され、
このカウンタ１２０は256BCLKクロツクパルス、
すなわち１テンプレートが動作した後、出力信号
リセツトＢを出力する。

リセツトＢ信号は蓄積媒体２６，８２、および
８４によつて歌えられた基準テンプレートを制御
する。さらにリセツトＢ信号は、加算手段８８に
対してそこに累積された加算値がそれ故に出力さ
れるように制御する。バイアステンプレートカウ
ンタ１２２は登録された発音テンプレートの全数
をカウントし、減算手段６６中にその加算値を保
持する。基準テンプレートカウンタ１２４は特製
のワードが登録される回数のカウントを行なう。
基準テンプレートカウンタ１２４の出力は減算手
段７８へ供給される。

登録中、256ビツトカウンタ１２０からの出力
はスイツチ手段１２６を介してプロンプタへ結合
され、訓練者に次のワードを挙げるように支持す
る。認識中、カウンタ１２０からの出力はシフト
レジスタ９２，９４，９６，９８およびビツト加
算手段８８に結合される。

第２図には例示的に変形された対数スケール１
２８が示されており、その対数スケール１２８は
対数コンバータでその出力を決定するために使用
されることが好ましい。最も注目すべきことは、
入力が０に等しければ出力は０に設定されること
である。もちろん、通常は０の対数値は負の無限
大に等しい。しかしながら、そのような値はこの
装置、或いはその内部で行われる計算においては
実際上何の意味もない。さらに本質的には検索表
である全対数コンバータがメモリの１バイトセグ
メント内にあることを確実にするためには出力の
最大は255に設定される。この対数表は、前述の
ように入力＝０のとき出力が０に設定されること
以外は経験式出力＝14＋100×log（入力）を使用
して導出される。したがつて所望の拘束が与えら
え、通常の音声認識装置において通常被乗数であ
るそれらの値が今や合算される。

前述のように加算手段８８からの合計のアレイ
加算値は重みを付けられることが好ましい。その
ための１装置では重み付けの機構は加算器１３０
ＡおよびＢを備え、その１入力に定数、例えば連
想メモリ１３２ＡおよびＢに蓄積された定数が供
給される。これらの定数は加算器１３０Ａおよび
Ｂによつて加算手段８８からの出力から減算され
る。システムバイアスの合算のために重み付けさ
れた値はlog(T)の256倍に等しい。一方基準テンプ
レート合算のための重み付けされた値はlog(N)の
256倍に等しい。

重み付けされた値は、実際上各ワードが登録さ
れる回数とは無関係に結果のスコアを可能にする
標準化定数である。その結果比較器１１２および
１１４に対して選択されたしきい値は登録回数に
無関係に一定である。しかし、この標準化に対し
て、スコアに使用されたしきい値は特定のワード
が登録される回数に応じて変化するように構成さ
れなければならないであろう。これはスコアを行
なう構成を複雑にし、残りのもの以上の全体のボ
キヤボラリの限定された部分を登録することを使
用者に止めさせる。そのような特定のワードの選
択された、増加された登録は例えば互いに類似し
た発音のワードを有する任意の言語の固有の性質
によるものであろう。

第３Ａ図乃至第３Ｃ図を参照すると、この発明
の装置１０と従来の音声認識システムとの主要な
相違の一つが発音テンプレート１３４および登録
されたテンプレート１３６および１３８に対する
フオーマツトによつて示されている。図示のよう
な発音テンプレート１３４は音声信号から抽出さ
れた特徴を表わす複数の２進値よりなる。しかし
ながら、登録されたテンプレート１３６および１
３８はその各位置に登録中に任意の発音テンプレ
ート中の例えば２進１の発生全部の数を表わす値
を有している。したがつて、全ての発音テンプレ
ートからの全ての特徴は認識期間にスコアのため
に使用される。最後に、蓄積された発音フオーマ
ツト基準テンプレート中に残つているそれのビツ
トにあるよりも特定の２進ビツトの発生の実際の
確率が各発音テンプレートをスコアするために使
用される。そのような方法は明らかにテンプレー
ト整合過程の正確さを増加させる。実際にテンプ
レートスコアの正確さとはテンプレートスコアの
ための手段２４が受信許容信号または拒否信号の
いずれかのみを出力するようにすることである。
これはさらに情報を要求するか、ワード繰返しを
要求するか、或いは使用者に対して質問されたワ
ードのスコアまたは認識のためには不充分な情報
であることを通告するかする従来の通常のシステ
ムと明白に相違している。

したがつて、この発明の装置１０を使用するこ
とによつてテンプレート整合を使用して話された
ワードの探知および認識を行なうすぐれた方法が
提供される。第４図に示すように、その方法は最
初に、複数のワードを登録し、それに関する全て
の抽出された特徴を維持する過程を有している。
登録されたデータは前記のように対数スケールに
よつて拡張され、拡張されたメモリ手段中に蓄積
される。

認識中選択されたメモリからの出力は合算さ
れ、重みを付けられて話されたワードを拒否する
か受けるかを決定するスコアを生じる。

バツフア１０８に蓄積された情報はさらにスコ
アされる特定の基準テンプレートに関する位置情
報を含んでいることを理解すべきである。結論と
して、一度最高のスコアが設定されたならば、拡
張されたメモリ中の位置は知られ、アンドゲート
により発生された受信許容信号の正確に意図され
た結果を確かめるためにアクセスすることが可能
である。

別の実施例では、蓄積された登録されたテンプ
レートを変形する手段が拡張されたメモリと各シ
フトレジスタとの間に挿入されることができる。
しかしながら、これは実際の合算時間を増加させ
るから、変形手段は登録メモリと変形メモリの間
に位置させることが好ましい。

ここで説明した装置１０は、実際には通常の
64kビツトダイナミツクRAMと関連した例えば
インテル社で製造販売されているiAPx8088マイ
クロプロセツサチツプ上に構成することができ
る。

この装置１０は従来の装置と比較して種々の利
点を有している。まず、バイアステンプレートを
使用しているから、登録中または使用中の個人差
による差異および特定の装置による差異は消去さ
れる。さらに、発生された全てのデータは保持さ
れ、使用されるから、正確さは増大する。さら
に、全体のスコア過程は、全ての計算動作が乗算
ではなく加算であるために非常に速くなる。さら
に、基準テンプレートの内容はスコアされる発音
テンプレートのそれよりも著しく異なつている。
もつと詳しく説明すれば、発音テンプレート中の
データは２進であり、周波数対時間過程から導出
され、一方基準テンプテート中のデータはその特
定の位置における特定の２進値の発生の確率に基
づいている。

以上、この発明を実施例を参照にして説明して
来たが、特許請求の範囲に記載されたこの発明の
技術的範囲を逸脱することなく他の形態が採用で
きることは明白である。したがつて、この発明の
技術的範囲はその特許請求の範囲の記載によつて
のみ限定されるべきものである。

【図面の簡単な説明】

第１図は、この発明の原理を使用した音声認識
装置のブロツク図であり、第２図はこの発明で使
用するために変形された対数スケールの１例であ
り、第３Ａ図乃至第３Ｃ図はこの発明に有用な
種々のテンプレートのフオーマツトであり、第４
図は、第１図に示した装置で使用される音声認識
方法のフロー図である。１２……複数の基準テンプレート生成および蓄
積手段、１４……システムバイアステンプレート
生成および蓄積手段、１６……発音テンプレート
アクセス手段、１８……蓄積された基準テンプレ
ートおよびシステムバイアステンプレート変形手
段、２０……変形された基準テンプレートおよび
システムバイアステンプレート蓄積手段、２２…
…アクセスされた発音テンプレートに対する変形
されたテンプレートのためのスコアの設定手段、
２４……スコアの受信容認および拒否手段。

Claims

【特許請求の範囲】１認識されるべき音声のスペクトルの特徴を表
わす２進値をそれぞれ蓄積された複数の位置を有
する発音テンプレートと、この発音テンプレートの前記複数の位置に対応
する複数の位置を有する複数の基準テンプレート
と、基準テンプレートと発音テンプレートとの間の
相対的整合を示す第１のスコアを基準テンプレー
トに対して設定して発音テンプレートにより表わ
される音声が認識できるようにする手段とを具備
し、基準テンプレートにおける各位置には発音テン
プレートの対応する位置で発生する特定の２進値
の確率を表わす値が蓄積されている音声認識装置
において、発音テンプレートの複数の位置に対応する複数
の位置を有するバイアステンプレートを備え、こ
のバイアステンプレートの複数の位置はそれぞれ
いずれかの発音テンプレートの対応する位置で発
生する特定の２進値の確率を表わす値を蓄積して
おり、さらに前記バイアステンプレートと前記発音テ
ンプレートとの間の相対的整合を示す第２のスコ
アを設定する手段を具備していることを特徴とす
る音声認識装置。２前記第１のスコアを設定する手段は、基準テ
ンプレートからの出力を合算する手段を備え、そ
れら各出力は基準テンプレートの複数の位置の１
つ対応し、そこに蓄積された値から決定される特
許請求の範囲第１項記載の装置。３前記第２のスコアを設定する手段は、バイア
ステンプレートからの出力を合算する手段を備
え、それら各出力は前記バイアステンプレートの
複数の位置の１つに対応し、そこに蓄積された値
から決定される特許請求の範囲第１項または第２
項記載の装置。４各基準テンプレートを第１の拡張された基準
テンプレートおよび第２の拡張された基準テンプ
レートに拡張する手段を備え、第１の拡張された
基準テンプレートの値は発音テンプレートの対応
する位置で発生する２進値１の確率を表わし、第
２の拡張された基準テンプレートの値は発音テン
プレートの対応する位置で発生する２進値０の確
率を表わし、さらに、バイアステンプレートを第
１の拡張されたバイアステンプレートおよび第２
の拡張されたバイアステンプレートに拡張する手
段を備え、第１の拡張されたバイアステンプレー
トの値はいずれかの発音テンプレートの対応する
位置で発生する２進値１の確率を表わし、第２の
拡張されたバイアステンプレートの値はいずれか
の発音テンプレートの対応する位置で発生する２
進値０の確率を表わしている特許請求の範囲第１
項乃至第３項のいずれか１項記載の装置。５前記第１のスコアを設定する手段は、各位置
のスコアのために第１の拡張された基準テンプレ
ート中の値と第２の拡張された基準テンプレート
中の値のいずれかの値を選択する手段を備えてい
る特許請求の範囲第４項記載の装置。６前記第２のスコアを設定する手段は、各位置
のスコアのために第１の拡張されたバイアステン
プレート中の値と第２の拡張されたバイアステン
プレート中の値のいずれかの値を選択する手段を
備えている特許請求の範囲第４項または第５項記
載の装置。７前記拡張する手段は、複数の基準テンプレー
ト中の値およびバイアステンプレート中の値を対
数変換する手段を備え、それにより前記第１およ
び第２のスコアを設定する手段は加算を行うだけ
である特許請求の範囲第１項乃至第６項のいずれ
か１項記載の装置。８前記第１のスコアの最高のものをしきい値と
比較する手段と、その最高のスコアがしきい値を
越えたときに認識容認信号を発生し、最高のスコ
アがしきい値より小さいとき拒否信号を発生する
手段を具備している特許請求の範囲第４項乃至第
７項のいずれか１項記載の装置。９前記第２のスコアを第２のしきい値と比較す
る手段と、その最高のスコアがしきい値を越え、
かつ第２のスコアが第２のしきい値しきい値を越
えたときにのみ認識容認信号を発生する手段とを
具備している特許請求の範囲第１項記載の装置。１０前記複数の基準テンプレートを登録する手
段を備え、各基準テンプレートは複数の発音テン
プレートから登録され、各複数の発音テンプレー
トは同じ音声の異なつた例を表わすスペクトル特
徴により構成されている特許請求の範囲第１項記
載の装置。１１バイアステンプレートを登録する手段を備
え、バイアステンプレートは基準テンプレートの
登録に使用された発音テンプレートの全てから登
録される特許請求の範囲第１０項記載の装置。