JPH09244691A - 入力音声リジェクト方法およびこの方法を実施する装置 - Google Patents

入力音声リジェクト方法およびこの方法を実施する装置

Info

Publication number
JPH09244691A
JPH09244691A JP8049842A JP4984296A JPH09244691A JP H09244691 A JPH09244691 A JP H09244691A JP 8049842 A JP8049842 A JP 8049842A JP 4984296 A JP4984296 A JP 4984296A JP H09244691 A JPH09244691 A JP H09244691A
Authority
JP
Japan
Prior art keywords
character string
reject
storage unit
syllable
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8049842A
Other languages
English (en)
Inventor
Mikio Kitai
幹雄 北井
Kazuhiro Arai
和博 荒井
Shigeki Sagayama
茂樹 嵯峨山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8049842A priority Critical patent/JPH09244691A/ja
Publication of JPH09244691A publication Critical patent/JPH09244691A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 認識対象語彙に音響的に類似していない発声
がなされた場合、これを的確にリジェクトすると共に、
認識対象語彙を多少曖昧に発声入力した様な場合もこれ
をリジェクトしない入力音声リジェクト方法および装置
を提供する。 【解決手段】 認識対象文字列(1)を記憶しておき、
これに音響的に類似する類似文字列(3)を作成する
(2)と共に認識対象文字列および類似文字列に音響的
に類似しないリジェクト文字列(5)を作成し(4)、
入力音声(6)に対して認識対象文字列と類似文字列と
リジェクト用文字列との間において音声認識処理を施し
(9)、認識尤度の高い順の予め決められた上位数個の
認識結果の内にリジェクト用文字列が予め定められた確
度以上で存在した場合、認識対象文字列以外の発声であ
ると判断(10)する入力音声リジェクト方法および装
置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、入力音声リジェ
クト方法およびこの方法を実施する装置に関し、特に、
発声入力された語彙が認識対象語彙であるか否かを判定
して認識対象語彙以外の語彙をリジェクトする入力音声
リジェクト方法およびこの方法を実施する装置に関す
る。
【0002】
【従来の技術】ユーザが認識対象語彙を発声したか否か
を判別するに際して、入力音声認識の結果得られた認識
対象語彙の尤度を予め設定した閾値と比較して、これが
閾値より小さい場合は認識対象語彙以外の発声であると
判定していた。しかし、この認識対象語彙に対する尤度
は、雑音、話者の相違その他の条件の影響を受けてその
値は変動する。従って、話者の相違する不特定話者の認
識を雑音環境下において実施することを考慮した場合、
雑音或は話者の相違その他の条件の影響を受けて変動す
る尤度のみに依存して認識対象語彙を発声したか否かを
安定に判別することは困難なことである。
【0003】そこで、この認識対象語彙に対する尤度を
正規化する方法が考えられた。これは、予め決められた
特定の認識対象語彙に対して尤度が高くなるモデルとは
異なり、すべての音節或は音素の環境に対して或る程度
確からしい尤度を出力する尤度正規化モデルを使用する
方法であり、この正規化モデルにより認識対象語彙に対
する尤度を正規化し、この正規化されたモデルと閾値と
の間の大小比較をして認識対象語彙を発声したか否かを
判別するものである。なお、正規化された尤度として
は、認識対象語彙とは異なる音声により構築した認識モ
デルであるガーベージモデルを使用して正規化された尤
度、或は音声タイプライタから出力される尤度が一例と
して使用される。
【0004】
【発明が解決しようとする課題】以上の通り、不特定話
者を認識し或は電話環境下において音声認識を実施する
に際して安定して尤度を正規化するモデルを必要とす
る。例えば、上述のガーベージモデルを使用する場合、
これを作成しなければならないが、その作成には多数の
話者が様々な地域から電話して発声した大量の音声デー
タを用意しなければならない。ところが、この様な音声
データを収集用意し、改良するには多大の費用および時
間を必要とする。
【0005】そして、正規化モデルを使用して安定して
尤度を正規化しても、本来的に認識対象語彙ではないが
認識対象語彙に類似した音節列が発声された場合、これ
を認識対象語彙であるものと誤判別する可能性は依然と
して高い。この発明は、上述の問題を解消した入力音声
リジェクト方法およびこの方法を実施する装置を提供す
るものである。
【0006】
【課題を解決するための手段】認識対象文字列を予め記
憶しておき、認識対象文字列に音響的に類似する類似文
字列を作成すると共に認識対象文字列および類似文字列
に音響的に類似しないリジェクト文字列を作成し、入力
された音声に対して認識対象文字列と類似文字列とリジ
ェクト用文字列との間において音声認識処理を施し、認
識尤度の高い順の予め決められた上位数個の認識結果の
内にリジェクト用文字列が予め定められた確度以上で存
在した場合、認識対象文字列以外の発声であると判断す
る入力音声リジェクト方法を構成した。
【0007】そして、認識対象文字列を音節表記し、各
音節の一部或はすべてをその音節に音響的に類似する他
の音節に置き換えて類似文字列を作成する入力音声リジ
ェクト方法を構成した。また、子音を持つ各音節の一部
またはすべてをその母音に置き換える入力音声リジェク
ト方法を構成した。
【0008】更に、リジェクト用の文字列を作成する音
節を記憶しておき、この記憶される音節の内から複数個
をランダムに選択してリジェクト用文字列候補を作成
し、リジェクト用文字列候補の内から禁止文字列を排除
すると共に認識対象文字列および類似文字列と連続して
音節の重なりを持つ文字列を排除してリジェクト用文字
列を作成する入力音声リジェクト方法を構成した。
【0009】また、認識対象文字列の各音節の一部また
はすべてを予め決められた複数の音節に置き換えてリジ
ェクト用文字列候補を作成し、生成された各文字列候補
の内の認識対象文字列および類似文字列と共通する文字
列を除いてリジェクト用文字列とする入力音声リジェク
ト方法を構成した。ここで、認識対象文字列記憶部1を
具備し、認識対象文字列記憶部1に予め記憶される各文
字列に音響的に類似する文字列を生成する類似文字列作
成部2を具備し、類似文字列作成部2により作成した文
字列を記憶する類似文字列記憶部3を具備し、認識対象
文字列および類似文字列に音響的に類似していない文字
列を作成するリジェクト用文字列作成部4を具備し、リ
ジェクト用文字列作成部4により作成した文字列を記憶
するリジェクト用文字列記憶部5を具備し、認識対象文
字列記憶部1、類似文字列記憶部3およびリジェクト用
文字列記憶部5に記憶される文字列から音声認識に使用
する辞書を作成する認識辞書作成部7を具備し、認識辞
書記憶部8を具備し、音声の入力を受け付ける音声入力
部6を具備し、音声入力部6に入力された音声を認識辞
書記憶部8に記憶される認識辞書に基づいて音声認識処
理し、尤度の高い順に予め定められた上位N個の文字列
とその尤度を出力する音声認識部9を具備し、上位N個
の認識結果の内にリジェクト用文字列が予め定められた
確度以上で存在した場合、認識対象外の発声であると判
断するリジェクト判断部10を具備する入力音声リジェ
クト装置を構成した。
【0010】そして、類似文字列作成部2は、各音節に
対して置き換え可能な音節を記述した音節変換規則記憶
部21、および音節変換規則記憶部21に記憶される音
節に基づいて認識対象文字列の各音節の一部またはすべ
てを置き換える類似文字列生成部22より成る入力音声
リジェクト装置を構成した。また、音節変換規則記憶部
21の書き換え規則は子音を持つ各音節をその母音に置
き換える規則である入力音声リジェクト装置を構成し
た。
【0011】更に、リジェクト用文字列作成部2は、す
べての音節を記憶した音節記憶部41を具備し、音節記
憶部41に記憶される音節をランダムに出力するランダ
ム音節出力部42を具備し、ランダム音節出力部42か
ら出力される音節を使用して予め決められた長さの文字
列を生成するリジェクト用文字列候補生成部43を具備
し、予め定められた許されない音節の並びを記憶する禁
止部分文字列記憶部44を具備し、リジェクト用文字列
候補生成部43により生成される文字列が禁止部分文字
列記憶部44に記憶された文字列を含んでおらず、且つ
認識対象文字列記憶部1および類似文字列記憶部3に記
憶された文字列と音節表記上において予め決められた長
さ以上一致した部分を持たなければ、この文字列をリジ
ェクト用文字列記憶部5に書き込むリジェクト用文字列
選択部45を具備し、リジェクト用文字列記憶部5に記
憶される文字列が予め定められた数になるまで新たなリ
ジェクト用文字列候補の生成を予め定められた有限回数
繰り返す入力音声リジェクト装置を構成した。
【0012】また、リジェクト用文字列作成部4は、各
音節に対して置き換え可能な音節を記述したリジェクト
用音節変換規則記憶部4−1を具備し、リジェクト用音
節変換規則記憶部4−1に記憶される音節に基づいて認
識対象文字列記憶部1に記憶される文字列の各音節の一
部またはすべてを置き換えた文字列を生成するリジェク
ト用文字列候補生成選択部4−2を具備し、リジェクト
用文字列候補生成選択部4−2により生成された文字列
が、認識対象文字列記憶部1および類似文字列記憶部3
に記憶されない文字列であれば、この文字列をリジェク
ト用文字列記憶部5に書き込む入力音声リジェクト装置
を構成した。
【0013】
【発明の実施の形態】この発明の実施の形態を図1の実
施例を参照して説明する。1は認識対象となる文字列の
集合Aを予め記憶しておく認識対象文字列記憶部であ
る。2は認識対象文字列記憶部1に記憶される文字列に
音響的に類似した文字列を作成する類似文字列作成部で
ある。
【0014】3は類似文字列生成部2により生成した文
字列の集合Bを記憶する類似文字列記憶部である。4は
認識対象文字列記憶部1に記憶される文字列および類似
文字列記憶部3に記憶される文字列の双方に音響的に類
似していない文字列を生成するリジェクト用文字列作成
部である。
【0015】5はリジェクト用文字列作成部4により生
成した文字列の集合Cを記憶するリジェクト用文字列記
憶部である。6は音声認識の際に音声の入力を受け付け
る音声入力部である。7は認識対象文字列記憶部1、類
似文字列記憶部3、およびリジェクト用文字列記憶部5
に記憶される文字列から音声認識に使用される辞書を作
成する認識辞書作成部である。
【0016】8は認識辞書作成部7により作成された辞
書を記憶する認識辞書記憶部である。 9は音声入力部
6に入力される音声を認識辞書記憶部8に記憶される認
識辞書に基づいて音声認識処理を行ない、尤度の高い順
に、予め定めた上位N個の文字列とその尤度を出力する
音声認識部である。10はリジェクト判断部であり、認
識結果として与えられた上位N個の認識結果の内に、リ
ジェクト用文字列記憶部5に記憶される集合Cに属する
文字列が予め定めた確度L以上で存在したならば、入力
音声は認識対象以外のものであると判断し、そうでなけ
れば認識対象内のものであると判断する判断部である。
【0017】以上の類似文字列作成部2は、各音節に対
して置き換え可能な音節を記述した音節変換規則記憶部
21と、音節変換規則記憶部21に従って認識対象語彙
記憶部1に記憶される文字列の各音節の一部或はすべて
を置き換える類似文字列生成部22より成る。そして、
リジェクト用文字列作成部4は、すべての音節を記憶し
た音節記憶部41、音節記憶部41に記憶される音節を
ランダムに出力するランダム音節出力部42、ランダム
音節出力部42から出力される音節を使用して予め決め
られた長さの文字列を生成するリジェクト用文字列候補
生成部43、予め決められ許されない音節の並びを記憶
する禁止部分文字列記憶部44、リジェクト用文字列候
補生成部43により作成された文字列が禁止部分文字列
記憶部44に記憶される文字列を含んでおらず、且つ認
識対象文字列記憶部1および類似文字列記憶部3に記憶
される文字列と音節表記上において予め決められた長さ
以上一致した部分を持たなければこの文字列をリジェク
ト用文字列記憶部5に書き込み、そうでなければ書き込
まないリジェクト用文字列選択部45より成る。
【0018】ここで、上述した各部の処理内容、動作を
更に具体的に説明する。認識対象語彙は「はい」、「い
いえ」、「そーです」、「ちがいます」の4単語である
ものとする。この場合、認識対象文字列記憶部1の内容
のイメージは図2となる。各音節に対して置き換え可能
な音節を記述した音節変換規則記憶部21の内容のイメ
ージは、その規則が子音を持つ各音節を、その母音のみ
に置き換えるものであるものとすると、図3となる。即
ち、これを1行目についてみると「か」、「さ」、
「た」、「な」、「は」、「ま」、「や」、「ら」、
「わ」、「が」、「ざ」、「だ」、「ば」、「ぱ」は、
その母音「あ」のみに書き換えることを意味する。な
お、外来語をも考慮すると、図3の規則は不足している
が、この点は説明を簡単化するために省略している。
【0019】音節変換規則記憶部21が図3であるもの
とすると、類似文字列生成部22は認識対象文字列記憶
部1に記憶される図2の文字列の各音節の一部或はすべ
てをこの記憶部21の変換規則に基づいて置き換える。
その結果は、図4に示される通りの文字列として類似文
字列記憶部3に書き込まれる。図4には「いいえ」に対
応する類似文字列はない。また、この例において、各認
識対象文字列に対して得られる類似文字列には全く同じ
文字列はないが、同じ文字列がある場合は一つだけを残
す処理が必要になる。
【0020】図2および図4が決まったので、今度はリ
ジェクト用文字列の生成の仕方について説明する。先
ず、リジェクト用の文字列を作成する音節を記憶した音
節記憶部41のイメージは図5に示されるものとする。
なお、図5に示される音節は通常の意味の音節とは異な
るが、各音の長さが通常の1文字程度で且つ全体で現れ
得る音の並びの大部分を表現しているものでありさえす
れば何れであっても差し支えない。例えば、“一”,
“っ”,“ぁ”,“ぃ”,“ぇ”,“ぉ”を入れている
のもこのためである。
【0021】ここで、図5には117の音節が記述され
ているが、この音節記憶部41に記憶される音節4個を
ランダムに出力させて31個のリジェクト用の文字列候
補を作成すると、図6の様な結果が得られる。この結果
は、音節記憶部41に書かれている音節の並びの影響を
受ける。なお、図6の「禁止文字列の是非」の欄は、後
述される禁止文字列であるか否かを示している。禁止文
字列ではない場合に×を付し、禁止文字列である場合に
○を付している。また、「重なりの是非」の欄は、図2
の認識対象文字列および図4の類似文字列と連続して2
音節以上の重なりを持っているか否かを表している。重
なりを持つ場合は○が、持たない場合は×が付されてい
る。
【0022】一方、許されない音節の並びを記憶する禁
止部分文字列記憶部44のイメージは例えば図7とな
る。図7において、*は任意の文字列を表わし、例えば
規則1は「ん」で始まる文字列が禁止されていること、
規則2は同じく「っ」で始まる文字列が禁止されている
こと、規則3は「んー」という並びを含む文字列が許さ
れないことを示している。この図7の規則に従えば、図
6の文字列の内の28番目の文字列だけが禁止されてい
ることになる。ここで、予め必要と決めたリジェクト用
文字列の数が30であったとし、且つ認識対象文字列、
類似文字列との間の連続した音節の重なりが2以上であ
る場合は許されないとすると、図6の文字列はすべて重
なりに関しては問題がないので、28番目の文字列を除
いた30個の文字列が、リジェクト用文字列としてリジ
ェクト用文字列記憶部5に書き込まれることになる。
【0023】実際のリジェクト処理においては、図6の
文字列が、リジェクト用文字列候補生成部43により1
個づつ生成され、リジェクト用文字列選択部45により
図6の第3欄の禁止文字列か否か、第4欄の認識対象文
字列および類似文字列と2以上の連続した音素列の重な
りがないか否かをチェックされて、リジェクト用文字列
記憶部5に書き込むか否かの判断が行われる。この処理
は、リジェクト用文字列記憶部5に記憶される文字列が
予め定めた数になるか、この繰り返し回数が予め定めた
回数になるまで実施される。
【0024】次いで、認識対象文字列記憶部1、類似文
字列記憶部3、およびリジェクト用文字列記憶部5の文
字列に基づいて、認識辞書作成部7により音声認識に使
用する辞書が作成され、この辞書は認識辞書記憶部8に
記憶される。以上で入力音声を認識する準備は完了す
る。ここで、認識対象文字列記憶部1に含まれていない
言葉「まるちめでぃあ」が入力された場合を例として説
明する。下記の文献に記載される音声認識装置に、「ま
るちめでぃあ」なる文字列を発声入力した場合の上位3
位までの認識結果を図8に示す。3回ともに上位2位ま
での候補は、リジェクト用文字列であった。これら3回
の発声は、1位の認識結果がリジェクト用文字列である
ので何れもリジェクトされることになる。ここで、上位
数個例えば上位3位までの候補を対象とし、この内に予
め定められた確度以上、例えば1位候補との間の尤度差
が2000以下と小さいリジェクト用文字列があった場
合、この入力音声を認識対象以外の発声であると判断す
るものとすると、この3回の発声「まるちめでぃあ」は
確実にリジェクトされることになる。1位の認識結果が
認識対象文字列であっても、同様に、1位候補との間の
尤度差が2000以下と小さいリジェクト用文字列があ
った場合、入力音声を認識対象以外の発声であると判断
する(参照文献山田、野田、井本、嵯峨山:“クライア
ント・サーバ構成のHMM−LR連続音声認識システム
とその応用”、情報処理学会 研究技術報告SIG−S
LP94−5,pp.39−46,1995.2.)。
【0025】なお、この発明を実施する場合、上述の手
順により作成したリジェクト用文字列の他に、これに加
えて話者がその使用する場面において誤って発声する可
能性の高い語彙をもリジェクト用文字列として登録する
ことにより、リジェクトの効果は向上するものと考えら
れる。この発明を例えば電話に適用する場合、冒頭にお
ける音声認識には「もしもし」の様な通常の電話で使わ
れる慣用句を追加しておくと良いと考えられる。
【0026】図9を参照してこの発明の他の実施例を説
明する。図9の実施例と図1の実施例とは、リジェクト
用文字列作成部4が相違しているが、その他の構成はす
べて共通している。リジェクト用文字列作成部4は、各
音節をそれとは異なる他の音節に置き換える予め定めら
れた規則を記憶するリジェクト用音節変換規則記憶部4
−1と、この規則に従って認識対象文字列記憶部1に予
め記憶される文字列の各音節の一部またはすべてを置き
換えたリジェクト用文字列を生成し、生成された各文字
列についてその文字列が認識対象文字列記憶部1および
類似文字列記憶部3に記憶されていない場合のみ、リジ
ェクト用文字列記憶部5に書き込む操作をするリジェク
ト用文字列候補生成選択部4−2より成る。
【0027】ここにおいては、認識対象文字列は先の実
施例の4個の内の「はい」および「いいえ」の2個のみ
とする。この場合、認識対象文字列記憶部1のイメージ
は図10となり、類似文字列記憶部3のイメージは図1
1となる。以下、リジェクト用音節変換規則記憶部4−
1とリジェクト用文字列候補生成選択部4−2の動き
と、認識させた場合の例について説明する。
【0028】リジェクト用音節変換規則記憶部4−1の
内容は、簡単のために、図12に示されるものあると考
える。この場合、リジェクト用文字列候補生成選択部4
−2は図13に示されるリジェクト用文字列候補が生成
される。この例においては、図13の文字列は、何れ
も、図10の文字列および図11の文字列とは異なるの
で、そのままジェクト用文字列記憶部5の内容とされ
る。なお、「えい」、「おう」という母音が続く場合、
そのまま母音を正確に発音するのか「えー」、「おー」
の様に長音化させるのか、或は双方を許すのかを考える
必要があるが、この例においてはそのまま正確に発音す
るものとして考えている。
【0029】次いで、認識対象文字列記憶部1、類似文
字列記憶部3、およびリジェクト用文字列記憶部5の文
字列から音声認識に使用する辞書が認識辞書作成部7に
より作成され、辞書は認識辞書記憶部8に記憶され、入
力音声を認識する準備が完了する。ここで、先の実施例
と同じく認識対象文字列にない言葉として「まるちめで
ぃあ」が入力された場合を例として説明する。先の文献
に記載される音声認識装置にこの文字列を力した場合の
上位3位までの認識結果を図14に示す。3回ともに上
位3位までの候補はすべてリジェクト用文字列であっ
た。上位3位までの候補を対象とし、その内に1位候補
との間の差が2000以下であるリジェクト用文字列が
あった場合、入力音声を認識対象以外の発声と判断する
ものとした場合は、この3回の発声「まるちめでぃあ」
は正しくリジェクトされることになる。
【0030】なお、この発明を実施する場合、上述の手
順により作成したリジェクト用文字列の他に、これに加
えて話者がその使用する場面において誤って発声する可
能性の高い語彙をもリジェクト用文字列として登録する
ことにより、リジェクトの効果は向上するものと考えら
れる。この発明を例えば電話に適用する場合、冒頭にお
ける音声認識には「もしもし」の様な通常の電話で使わ
れる慣用句を追加しておくと良いと考えられる。
【0031】
【発明の効果】以上の通りであって、この発明は、認識
対象文字列に音響的に類似する類似文字列を作成すると
共に認識対象文字列および類似文字列に音響的に類似し
ないリジェクト文字列を作成し、入力された音声に対し
て認識対象文字列と類似文字列とリジェクト用文字列と
の間において音声認識処理を施し、認識結果の内にリジ
ェクト用文字列が存在した場合認識対象文字列以外の発
声であるとするものである。この様に認識対象文字列お
よび類似文字列とは音響的に類似しないリジェクト文字
列が認識されたことを根拠として当該発声をリジェクト
するので、認識対象語彙に音響的に類似していない発声
がなされた場合、これを的確にリジェクトすることがで
き、この発明を話者認識装置その他の認識装置に使用し
た場合にその誤動作を防止することができる。
【0032】そして、認識対象語彙に音響的に類似する
語彙をも認識対象語彙と共に予め記憶しておいてこれを
認識対象語彙としているので、認識対象語彙を多少曖昧
に発声入力した様な場合もこれをリジェクトすることを
回避することができる。
【図面の簡単な説明】
【図1】実施例を説明する図。
【図2】認識対象文字列のイメージを示す図。
【図3】音節変換規則記憶部のイメージを示す図。
【図4】類似文字列記憶部のイメージを示す図。
【図5】音節記憶部のイメージを示す図。
【図6】リジェクト用文字列の候補を示す図。
【図7】禁止部分文字列記憶部のイメージを示す図。
【図8】認識結果を示す図。
【図9】他の実施例を説明する図。
【図10】認識対象文字列のイメージを示す図。
【図11】類似文字列記憶部のイメージを示す図。
【図12】音節変換規則記憶部のイメージを示す図。
【図13】リジェクト用文字列候補を示す図。
【図14】認識結果を示す図。
【符号の説明】
1 認識対象文字列記憶部 2 類似文字列作成部 3 類似文字列記憶部 4 リジェクト用文字列作成部 5 リジェクト用文字列記憶部 6 音声入力部 7 認識辞書作成部 8 認識辞書記憶部 9 音声認識部 10 リジェクト判断部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 認識対象文字列を予め記憶しておき、認
    識対象文字列に音響的に類似する類似文字列を作成する
    と共に認識対象文字列および類似文字列に音響的に類似
    しないリジェクト文字列を作成し、入力された音声に対
    して認識対象文字列と類似文字列とリジェクト用文字列
    との間において音声認識処理を施し、認識尤度の高い順
    の予め決められた上位数個の認識結果の内にリジェクト
    用文字列が予め定められた確度以上で存在した場合、認
    識対象文字列以外の発声であると判断することを特徴と
    する入力音声リジェクト方法。
  2. 【請求項2】 請求項1に記載される入力音声リジェク
    ト方法において、 認識対象文字列を音節表記し、各音節の一部或はすべて
    をその音節に音響的に類似する他の音節に置き換えて類
    似文字列を作成することを特徴とする入力音声リジェク
    ト方法。
  3. 【請求項3】 請求項2に記載される入力音声リジェク
    ト方法において、 子音を持つ各音節の一部またはすべてをその母音に置き
    換えることを特徴とする入力音声リジェクト方法。
  4. 【請求項4】 請求項1ないし請求項3の内の何れかに
    記載される入力音声リジェクト方法において、 リジェクト用の文字列を作成する音節を記憶しておき、
    この記憶される音節の内から複数個をランダムに選択し
    てリジェクト用文字列候補を作成し、リジェクト用文字
    列候補の内から禁止文字列を排除すると共に認識対象文
    字列および類似文字列と連続して音節の重なりを持つ文
    字列を排除してリジェクト用文字列を作成することを特
    徴とする入力音声リジェクト方法。
  5. 【請求項5】 請求項1ないし請求項3の内の何れかに
    記載される入力音声リジェクト方法において、 認識対象文字列の各音節の一部またはすべてを予め決め
    られた複数の音節に置き換えてリジェクト用文字列候補
    を作成し、生成された各文字列候補の内の認識対象文字
    列および類似文字列と共通する文字列を除いてリジェク
    ト用文字列とすることを特徴とする入力音声リジェクト
    方法。
  6. 【請求項6】認識対象文字列記憶部を具備し、 認識対象文字列記憶部に予め記憶される各文字列に音響
    的に類似する文字列を生成する類似文字列作成部を具備
    し、 類似文字列作成部により作成した文字列を記憶する類似
    文字列記憶部を具備し、 認識対象文字列および類似文字列に音響的に類似してい
    ない文字列を作成するリジェクト用文字列作成部を具備
    し、 リジェクト用文字列作成部により作成した文字列を記憶
    するリジェクト用文字列記憶部を具備し、 認識対象文字列記憶部、類似文字列記憶部およびリジェ
    クト用文字列記憶部に記憶される文字列から音声認識に
    使用する辞書を作成する認識辞書作成部を具備し、 認識辞書記憶部を具備し、 音声の入力を受け付ける音声入力部を具備し、 音声入力部に入力された音声を認識辞書記憶部に記憶さ
    れる認識辞書に基づいて音声認識処理し、尤度の高い順
    に予め定められた上位N個の文字列とその尤度を出力す
    る音声認識部を具備し、 上位N個の認識結果の内にリジェクト用文字列が予め定
    められた確度以上で存在した場合、認識対象外の発声で
    あると判断するリジェクト判断部を具備することを特徴
    とする入力音声リジェクト装置。
  7. 【請求項7】 請求項6に記載される入力音声リジェク
    ト装置において、 類似文字列作成部は、各音節に対して置き換え可能な音
    節を記述した音節変換規則記憶部、および音節変換規則
    記憶部に記憶される音節に基づいて認識対象文字列の各
    音節の一部またはすべてを置き換える類似文字列生成部
    より成ることを特徴とする入力音声リジェクト装置。
  8. 【請求項8】 請求項7に記載される入力音声リジェク
    ト装置において、 音節変換規則記憶部の書き換え規則は子音を持つ各音節
    をその母音に置き換える規則であることを特徴とする入
    力音声リジェクト装置。
  9. 【請求項9】 請求項6ないし請求項8の内の何れかに
    記載される入力音声リジェクト装置において、 リジェクト用文字列作成部は、すべての音節を記憶した
    音節記憶部を具備し、音節記憶部に記憶される音節をラ
    ンダムに出力するランダム音節出力部を具備し、ランダ
    ム音節出力部から出力される音節を使用して予め決めら
    れた長さの文字列を生成するリジェクト用文字列候補生
    成部を具備し、予め定められた許されない音節の並びを
    記憶する禁止部分文字列記憶部を具備し、リジェクト用
    文字列候補生成部により生成される文字列が禁止部分文
    字列記憶部に記憶された文字列を含んでおらず、且つ認
    識対象文字列記憶部および類似文字列記憶部に記憶され
    る文字列と音節表記上において予め決められた長さ以上
    一致した部分を持たなければこの文字列をリジェクト用
    文字列記憶部に書き込むリジェクト用文字列選択部を具
    備し、リジェクト用文字列記憶部に記憶される文字列が
    予め定められた数になるまで新たなリジェクト用文字列
    候補の生成を予め定められた有限回数繰り返すことを特
    徴とする入力音声リジェクト装置。
  10. 【請求項10】 請求項6ないし請求項8の内の何れか
    に記載される入力音声リジェクト装置において、 リジェクト用文字列作成部は、各音節に対して置き換え
    可能な音節を記述したリジェクト用音節変換規則記憶部
    を具備し、リジェクト用音節変換規則記憶部に記憶され
    る音節に基づいて認識対象文字列記憶部に記憶される文
    字列の各音節の一部またはすべてを置き換えた文字列を
    生成するリジェクト用文字列候補生成選択部を具備し、
    リジェクト用文字列候補生成選択部により生成された文
    字列が、認識対象文字列記憶部および類似文字列記憶部
    に記憶されない文字列であれば、この文字列をリジェク
    ト用文字列記憶部に書き込むことを特徴とする入力音声
    リジェクト装置。
JP8049842A 1996-03-07 1996-03-07 入力音声リジェクト方法およびこの方法を実施する装置 Pending JPH09244691A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8049842A JPH09244691A (ja) 1996-03-07 1996-03-07 入力音声リジェクト方法およびこの方法を実施する装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8049842A JPH09244691A (ja) 1996-03-07 1996-03-07 入力音声リジェクト方法およびこの方法を実施する装置

Publications (1)

Publication Number Publication Date
JPH09244691A true JPH09244691A (ja) 1997-09-19

Family

ID=12842338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8049842A Pending JPH09244691A (ja) 1996-03-07 1996-03-07 入力音声リジェクト方法およびこの方法を実施する装置

Country Status (1)

Country Link
JP (1) JPH09244691A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6937982B2 (en) 2000-07-21 2005-08-30 Denso Corporation Speech recognition apparatus and method using two opposite words
JP2005292346A (ja) * 2004-03-31 2005-10-20 Nec Corp 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム
JP2010230852A (ja) * 2009-03-26 2010-10-14 Yamaha Corp コマンド認識装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6937982B2 (en) 2000-07-21 2005-08-30 Denso Corporation Speech recognition apparatus and method using two opposite words
DE10134908B4 (de) * 2000-07-21 2013-05-08 Denso Corporation Spracherkennungsvorrichtung und Verfahren, welche zwei gegenteilige Wörter verwenden
JP2005292346A (ja) * 2004-03-31 2005-10-20 Nec Corp 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム
JP2010230852A (ja) * 2009-03-26 2010-10-14 Yamaha Corp コマンド認識装置

Similar Documents

Publication Publication Date Title
US5333275A (en) System and method for time aligning speech
US6912499B1 (en) Method and apparatus for training a multilingual speech model set
US7299178B2 (en) Continuous speech recognition method and system using inter-word phonetic information
US6067514A (en) Method for automatically punctuating a speech utterance in a continuous speech recognition system
JP4301102B2 (ja) 音声処理装置および音声処理方法、プログラム、並びに記録媒体
US5949961A (en) Word syllabification in speech synthesis system
KR20210150497A (ko) 음성 인식을 위한 컨텍스트 바이어싱
JPWO2009078256A1 (ja) 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム
US20050203737A1 (en) Speech recognition device
US6546369B1 (en) Text-based speech synthesis method containing synthetic speech comparisons and updates
US11615786B2 (en) System to convert phonemes into phonetics-based words
Keating Word-level phonetic variation in large speech corpora
Rabiner et al. Speech recognition: Statistical methods
Lee et al. Improved acoustic modeling for continuous speech recognition
US20010002465A1 (en) Speech recognition device implementing a syntactic permutation rule
Tombaloğlu et al. Deep Learning Based Automatic Speech Recognition for Turkish
JPH09244691A (ja) 入力音声リジェクト方法およびこの方法を実施する装置
JPH08123470A (ja) 音声認識装置
JP2003162524A (ja) 言語処理装置
JPH09292899A (ja) 音声認識装置
Lecorvé et al. Adaptive statistical utterance phonetization for French
JP2002372988A (ja) 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法
Downey et al. A decision tree approach to task-independent speech recognition
Zhang et al. Application of pronunciation knowledge on phoneme recognition by lstm neural network
JPH1097275A (ja) 大語彙音声認識装置