JPS60169900A - 単語登録方式 - Google Patents

単語登録方式

Info

Publication number
JPS60169900A
JPS60169900A JP59025341A JP2534184A JPS60169900A JP S60169900 A JPS60169900 A JP S60169900A JP 59025341 A JP59025341 A JP 59025341A JP 2534184 A JP2534184 A JP 2534184A JP S60169900 A JPS60169900 A JP S60169900A
Authority
JP
Japan
Prior art keywords
word
similarity
words
registered
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59025341A
Other languages
English (en)
Inventor
寺尾 修
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59025341A priority Critical patent/JPS60169900A/ja
Publication of JPS60169900A publication Critical patent/JPS60169900A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (al 発明の技術分野 本発明は、特定話者による限定単語を認識対象とする単
語音声認識装置における単語登録方式(bl 技術の背
景 近来、音声認識技術はデータ処理技術の発達と、音声認
識アルゴリズムのための複雑高度な論理回路、及び高速
大容量を要する手段等が1半導体集積化技術の進展によ
る小型化・低コストの高集積回路素子(LSI)の実現
によって支えられ。
各種の認識方式による音声認識装置が市場に出現し、各
産業分野に普及しつつある。
特に、特定話者による音声を認識する音声認識装置につ
いては、音声認識率が向上し各分野で使用されているが
、この特定話者による限定!1′!語を認識する単語登
録方法について、更に簡便で、然も認識率を向上させる
ための各種の登録方式について検討されている。
tc+ 従来技術と問題点 従来の、この種の特定話者による音声認識装置について
説明する。第1図は従来の特定話者による音声認識装置
のブロック図を示す。特定話者による単語を登録する場
合は、入力端子1からある単語を指定し、その単語の表
記と特定話者による単語音声を人力し、音声分析特徴抽
出部2で入力音声を複数の帯域フィルター群に印加して
tlたスペクトル出力を、スペクトル出力毎に数ms程
度のフレーム同期で標本化し、線形時間正規化により単
語の特徴バラタ−り時系列として抽出し、抽出された特
徴パラメータ時系列を特徴パラメータバッファ3に一旦
格納する。この特徴パラメータバッファ3に格納された
特徴パラメータ時系列を。
モード切替スイッチ4の実線側をJす、ff1語セ・ノ
ドファイル群5の単語セットメモリ5aに指定単語標準
パターンとして書き込まれる。この単語セットファイル
群5の単語セ・ノドメモリへは、登録する限定単語相当
数の用語セ・ノドメモリ5a−5nのn個分が備えら□
れており、順次その他の単語を指定してその単語音声を
入力し、上記同様径路で単語ファイル群5の単語セット
メモリ5a−5nに指定単語の単語標準パターンとして
書き込まれる。n(IIi1分 5の単語が登録されて
登録完了となり特定話者の単語セント辞書ができあがる
次に、特定話者の未知人力音声を認識する場合は、モー
ド切替スイッチ4を認識モート側(点線側)に切り替え
1音声入力端子1から人力した認識したい未知の単語人
力音声は、上記同様の径路で特徴バ′ラメータ時系列と
して特徴パラメータノ飄ノファ3に格納し、モード切替
スイッチ4を介して入カバターンバッファ6のメモリに
入カバターンとして一時格納される。この入力パターン
ノパノファ6のメモリは音声が入力する都度更新し、書
き替えられる。単語セントファイル群5の単語上ソトメ
モリ5a−5nのn1tlilの単語標準パターンは。
入カバターンバッファ6の入カバターンと認識比較部7
で順次比較され9両者間の類似度が次々とめられ請求め
られた類似度を認識結果選択部8に入力し、入カバクー
ンと最大の類似度を持った単語標準パターンが選択され
、認識結果が出力端子9より出力する。しかし、認識結
果選択部8は誤認識を避けるため、類似度を監視する監
視機能を持っており、類似度がある闇値を越えた時のみ
認識結果を出力し、闇値以下の時は出力端子9より認識
結果が出力されない。即ち1例えば、類似度「100」
を完全一致とし、闇値を「90」と設定した場合、ある
未知入力音声の類似度が認識比較部7で「85」とめら
れれば、認識結果選択部8の判定出力は棄却される。従
って、棄却された単語を数回発声してチェックが行われ
る。
以上が従来の音声認識装置におりる特定話者による限定
単語の登録と認識手順であるが、この従来の方式におい
て、登録単語中に極めて類似度の高い単語が登録される
可能性もあり、認識モード時に数回発声する学習チェッ
クが11われても1実際の使用する時に誤認識が多発す
れば、認識動作に混乱を生ずるため、再度特定単語の登
録やり直しが必要となる。この間は認識動作を中断する
ため、装置の稼働率を著しく低下させる欠点を有して 
いノこ。
(d+ 発明の目的 本発明は、従来の単語音声認識装置においては、単語を
登録してもそのml八を数回発声しないと誤りやすいか
どうかをチェ・ツクできない欠点があるので、実際の使
用する時は、ノイズ等の影響以外には誤認識しない多く
の認識しやすい単語セ・ノドを登録するため1発声チェ
ックすることなく誤りやすい単語のチェックを事前にシ
ステムで行うことを目的としている。
(e) 発明の構成 上記目的は、特定話者による複数個の単語入力音声を入
カバターンに変換して複数個の単語セ・シト辞書に単語
標準パターンとして登録し、前記複数個の単語セント辞
書に登録された単語標準パターン相互間の音響的に近い
パターンを選択する選択手段と、前記選択手段により選
択された単語標準バクーン同志の単音節の数と時間長に
より単語標準パターンの類似度を判定する類似度判定手
段と、前記頬イ以度比較手段により判定されたli語標
準パターンの単語を通知する通知手段とを有し。
該特定話者の未知入力音声を前記複数個の単語セント辞
書に登録された単語標準パターンと照合して認識する限
定単語音声認識装置において、該特定話者の単語を単語
標準パターンとして前記複数個の単語セント辞書に登録
した後に、 r’+ii記選択手段により音響的に近い
単語標準パターンを選択し。
選択された単語標準パターン同志を前記類似度判定手段
により類似度を:[す定し5判定した結果の単語を前記
通知手段により該特定話者に通知するよう構成した本発
明によって達成される。
即ち、特定話者の未知入力音声を複数個の単語セント辞
書に登録された単語標準パターンと照合して認識する限
定単語音声認識装置において、複数個の単語七ソ(・辞
書に登録した後に9選択手段により音響的に近い単語標
準バク−ンを選択し。
類(尺度判定手段により類似度を判定してその結果の単
語を通知手段により該特定話者に通知するよう構成する
ことにより、各単語標準パターン同志の比較を行って、
その類似度がある程度以内になるものに対しては、誤認
識の確率が高いものとして、他の読みに変更するように
通知する機能を持ち、単語セント辞書に登録するり1語
七ソ1−内の近い単語(誤認識しやすい)をシステム内
で事前にチェックすることができ、誤認識しやすい単語
は棄却され、実際に使用する時は、ノイス等の影響以外
には誤認識しない多くの認識しやすい単語セットのみが
登録されるため、認識率と稼働率が向上する単語登録方
式を提供するものである。
(「)発明の実施例 以下本発明の一実施例について説明する。具体的には、
まず、各単語の読みに対して、統δ1的に作成された近
い単音節のグループ名に置き換えて、その置き換えたラ
ヘルが一致する単語についてのみ、各小音節毎に、統計
的に作成された各小音節との類似度をもとに単語間の類
似度をめ。
その値がある程度の値よりも小さいときには2誤認識し
やすい単語セントであるとして、単語壺録オペレータに
単語セント完了後に通知し、事前に誤認識しやすい単語
を登録しないようにした方式第2図は本発明による登録
された単語の類似単語選択の構成ブロック図を示し、同
一対象物は第1図と同一符号で示す。11は対応統計テ
ーブル。
12は文字列作成部、13は文字列抽出部、14は類似
度続開チーフル、15は類似度比較部、16は類似度判
定部、17はディスプレイ装置を示す。
対応統計テーブル11は単語の単音節とそのグループ名
との対応した統計テーブルであり、単語の単音節単位の
文字列から、各文字列の文字同志で対応し、単音節文字
列による対応について統計的に作成する。例えば、「市
川」、1石川」では「いちかわ」と「いしかわ」の文字
列では同じグループになる。文字列作成部12は単語セ
ット単位に各単語の文字列をグループ名に置き換えた文
字列を作成する回路部2文字列抽出部13はグループ名
文字列で一致する文字列を抽出する回路部、類似度統計
テーブル14は統計的に作成された単音節間の類似度、
及び単音節間による時間長の続開テーブル、類似度比較
部15は一致した単語に対して用語間の類似度をめる計
数回路、類似度判定部16は中音節の数と時間長に基づ
いて類似度を判定しある値以内の単語を出力する判定回
路部、ディスプレイ17はメツセージを表示する装置で
ある。
第2図において、単語セントファイル群5の単語セット
メモリ5a −5nに単語を登録するまでの構成ブロッ
ク図とその手順は、前記述と同様なので省略する。登録
オペレータにより単語上ノド毎に単語セントメモリ5a
−5nに単語登録が完了すると。
文字列作成部12で各単語の読みを単音節単位の文字列
から各文字列の文字をその認識方式で、統計的に作成さ
れた対応統計チーフル11よりグループの該当するグル
ープ名を呼び出し置き換える。文字列、作成部12で置
き換えられたグループ名の文字列を文字列抽出部13に
入力し2文字列抽出部13で入力されたグループ名文字
列中から1文字列の一致している単語のみ抽出する。抽
出された単語を類似度比較部15に人力し、類似度比較
部15で更に類似度統計テーブル14で統計的に作成さ
れた各単音節間の類似度テーブルを利用して、その単語
間の類似度をめる。例えば、上記の例で、「い−い」の
類似度、「ち−し」の類似度、「か−か」の[(1]度
、「わ−わ」の類似度の総計をめて類イ以度判定部16
に入力する。類似度判定部16では単音節の数と時間長
の関係に基づいて判定する。この判定は類イ以度比較部
15でめた結果がある程度中さな値の類似度であるなら
ば、そのClj語間では誤認識が起きる可能性が1所い
ものとする。従って。
類似度判定部16より類似度がある値以内の単語をディ
スプレイ17に表示する。この時、同時にその単語の読
みの文字列から、他の単音節に置き換えられる単音節の
候補をその位置と共に羅列する。
誤認識しやすい単語をディスプレイI7に羅列表示して
登録オペレータに通知する。ディスプレイ17に表示さ
れた単語を登tP、−,4ペレ−りは息味ある読みを再
入力し、それに基づいて再チェックを行い。
誤認識しない多くの認識しやずい単語セットが認識モー
トに切替える前に登録される。
以上のように、予め、統計的に単音節の類似度テーブル
を作成し、各単語の読みからそのチーフルを参照して、
各単語同志の比較を行っていき。
その類似度がある程度以内になるものに対しては。
誤認識の確率が高いものとして、他の読みに変更するよ
うに通知する機能を持った単語登録方式である。
4gl 発明の詳細 な説明したように、特定話者の未知入力音声を複数個の
単語上ノド辞書に登録された単語標準パターンと照合し
て認識する限定単語音声認識装置において、複数個の単
語上ノド辞書に登録した後に5選択手段により音響的に
近い単語椋準パターンを選択し、類似度判定手段により
類似度を判定してその結果の単語を通知手段により該特
定話者に通知するよう構成した本発明により、各単語標
準パターン同志の比較を行っ乙その類似度がある程度以
内になるものに対しては、誤認識の確率が高いものとし
て、他の読みに変更するように通知することで、単語セ
ント辞書に登録する単語セント内の近い単語(誤認識し
やすい)を事前にチェックすることができ、実際に使用
する時は。
ノイズ等の影響以外には誤認識しない多くの認識しやす
い単語セントのみが登録されるため、認識率と装置の稼
働率が向上する効果がある。
【図面の簡単な説明】
第1図は従来の特定話者による音声認識装置のブロック
図、第2図は本発明による登録された単語の類似flt
語選択の構成ブ1:Jツク図を示す。 図面において、5は単語上ノドファイル群、 11ば対
応統計テーブル、12は文字列作成部、13は文字列抽
出部、14は類似度統計テーブル、及び単音節間による
時間長統計テーブル、15ば類似度比較部、16は類似
度判定部、17はディスプレイをそれぞれ示す。 茅 1 堕 秦 2 口

Claims (1)

    【特許請求の範囲】
  1. 特定話者による複数個の単語入力音声を入カバターンに
    変換して複数個の単語セット辞利に単語標準パターンと
    し°ζ登録し、前記複数個の単語セント辞書に登録され
    た単語標準パターン相互間の音響的に近いパターンを選
    択する選択手段と、前記選択手段により選択された単語
    標準パターン同志の単音節の数と時間長により単語標l
    (へパターンの類似度を判定する類似度判定手段と、前
    記In(以度比較手段により判定された単語標準パター
    ンの単語を通知する通知手段とを有し、該特定話者の未
    知入力音声を前記複数個の単語セント辞書に登録された
    単語標準パターンと照合して認識する限定単語音声認識
    装置において、該特定話者の単語を単語標準パターンと
    して前記複数個の単語セント辞舊に登録した後に、前記
    選択手段により音響的に近い単語標準パターンを選択し
    9選択された単語標準パターン同志を前記類似度判定手
    段により類似度を判定し1判定した結果の単語を前記通
    知手段により該特定話者に通知するよう構成したことを
    特徴とする単語登録方式。
JP59025341A 1984-02-13 1984-02-13 単語登録方式 Pending JPS60169900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59025341A JPS60169900A (ja) 1984-02-13 1984-02-13 単語登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59025341A JPS60169900A (ja) 1984-02-13 1984-02-13 単語登録方式

Publications (1)

Publication Number Publication Date
JPS60169900A true JPS60169900A (ja) 1985-09-03

Family

ID=12163199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59025341A Pending JPS60169900A (ja) 1984-02-13 1984-02-13 単語登録方式

Country Status (1)

Country Link
JP (1) JPS60169900A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6370296A (ja) * 1986-09-11 1988-03-30 富士通株式会社 単語登録方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6370296A (ja) * 1986-09-11 1988-03-30 富士通株式会社 単語登録方法

Similar Documents

Publication Publication Date Title
US4653097A (en) Individual verification apparatus
US4403114A (en) Speaker recognizer in which a significant part of a preselected one of input and reference patterns is pattern matched to a time normalized part of the other
JPH0422276B2 (ja)
US6230128B1 (en) Path link passing speech recognition with vocabulary node being capable of simultaneously processing plural path links
CN116110370A (zh) 基于人机语音交互的语音合成***及相关设备
JPS60169900A (ja) 単語登録方式
JPS63179398A (ja) 音声認識方法
JPS6361300A (ja) 音声認識方式
JP3039453B2 (ja) 音声認識装置
JP3108121B2 (ja) 音声認識装置の辞書制御方式
JPH05347664A (ja) 音声ダイヤル認識方法
JPS60170899A (ja) 単語音声登録方式
JPS60118894A (ja) 音声認識装置
JPH096379A (ja) 音声合成装置及び方法
JPS5961893A (ja) 標準パタ−ン更新機能付音声入力装置
JPS62111295A (ja) 音声認識装置
JPS63121099A (ja) 音声認識装置
JPS6017498A (ja) 音声認識装置
JPH04199198A (ja) 音声認識装置
JPS59195299A (ja) 特定話者音声認識装置
JPS60201396A (ja) 音声辞書の学習方式
JPS60118892A (ja) 音声認識装置
JPS63155195A (ja) 音声認識装置
JP2000242292A (ja) 音声認識方法、この方法を実施する装置およびこの方法を実行するプログラムを記憶した記憶媒体
JPH0535441A (ja) 文書自動作成装置