JP2019184631A - 音声認識システム及びコンピュータプログラム - Google Patents
音声認識システム及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2019184631A JP2019184631A JP2018070589A JP2018070589A JP2019184631A JP 2019184631 A JP2019184631 A JP 2019184631A JP 2018070589 A JP2018070589 A JP 2018070589A JP 2018070589 A JP2018070589 A JP 2018070589A JP 2019184631 A JP2019184631 A JP 2019184631A
- Authority
- JP
- Japan
- Prior art keywords
- word
- recognition
- preliminary
- reference value
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Navigation (AREA)
Abstract
Description
また、以上の音声認識システムは、自動車に搭載された情報処理システムにおいて音声入力に用いられる音声認識システムであってもよい。
以上のような音声認識システムでは、音声認識システムでは、ワードの認識の直前の期間に、当該認識したワードを発声した音声と類似した音声が複数回入力されている場合にのみ、当該ワードの基準値のより低い整合の度合を表す値への変更、または、当該変更の提案を行う。ここで、このようなワードの認識の直前の期間に、当該認識したワードを発声した音声と類似した音声が複数回入力されている状況は、ユーザが同じワードを認識されるまで繰り返し発声した状況、すなわち、誤棄却(False Rejection;FR)が発生したワードの再発声に対して、当該ワードを正しく認識できた状況である蓋然性が大きい。なお、ワードの認識の直前の期間に、当該認識したワードを発声した音声と類似した音声が3回以上の入力されている状況は、認識したワードを発声した音声と類似した音声が3回以上入力した状況であるので、特に、当該蓋然性が大きい。
図示するように、情報処理システムは、データ処理部1、マイクロフォン2、音声入力部3、入力装置4、表示装置5、カメラやオーディオ機器やGPS受信器等のその他の周辺装置6を備えている。
そして、データ処理部1は、カーナビゲーション機能やミュージックプレイヤ機能やカメラ撮影画像の表示機能などの各種機能を備えており、音声入力部3から入力する認識結果に応じた処理を行う。
ここで、このような情報処理システムは、CPUやメモリや周辺デバイスなどを備えたコンピュータを用いて構成されるものであってよく、この場合、上述したデータ処理部1や音声入力部3は、CPUがコンピュータプログラムを実行することにより実現されるものであってよい。
また、しきい値テーブル33には、音声認識エンジン31において認識の対象とする各ワードについて、そのワードの識別番号(No.)と、そのワードのしきい値Thと、そのワードのしきい値の調整を行うか否かを示す調整有無が登録されている。
音声認識エンジン31は、マイクロフォン2から入力する音声である認識対象音声の入力と並行して、認識対象音声に対する音声認識辞書32に格納された各ワードのスコアを算定する。
次に、音声入力制御部34が誤棄却率(FRR;False Rejection Rate)を低減するために行うFR対応しきい値調整処理について説明する。
図示するように、音声入力制御部34は、FR対応しきい値調整処理において、音声認識エンジン31からの予備認識ワードの出力の発生と(ステップ402)、後述するタイマのタイムアウトの発生と(ステップ404)、音声認識エンジン31からの認識ワードの出力の発生と(ステップ406)を監視する。
一方、予備認識されたワードのワードのしきい値テーブル33に登録されている調整有無が調整有りとなっている場合には(ステップ412)、予備認識されたワードに対してフラグをセットし(ステップ414)、セットしたフラグに対応づけたタイマをスタートし(ステップ416)、ステップ402、404、406の監視に戻る。ここで、ステップ416でスタートするタイマは、所定時間(たとえば、10秒)がタイムアウト時間として設定されている。ただし、タイマのタイムアウト時間は、予備認識されたワードの長さ(文字数)に応じて、長さが長いワードほどタイムアウト時間長が大きくなるように設定するようにしてもよい。
以上、音声入力制御部34が行うFR対応しきい値調整処理について説明した。
なお、以上のFR対応しきい値調整処理において、各ワードのフラグは、フラグ数がカウント値を表す当該ワードのカウンタとして機能しており、以上のFR対応しきい値調整処理は、ステップ414で予備認識されたワードのカウンタを1増加する処理とし、ステップ416を、予備認識されたワードに対応づけたタイマをスタートする処理とし、ステップ422を、タイムアウトが発生したタイマに対応づけられているワードのカウンタをクリアする処理とし、ステップ438を、全てのワードのカウンタをクリアする処理とすると共に、認識されたワードのカウンタのカウンタ値が、当該ワードのフラグ数を表すものとしてステップ434を行うようにしても等価である。
図示した例は、ユーザが「ちずかくだい」と発話しても何のワードも認識されないため、再度、「ちずかくだい」と発話することを繰り返した結果、ユーザの3度目の「ちずかくだい」との発話に対してワード「ちずかくだい」が認識された場合についてのものである。
この場合、図示するように、「ちずかくだい」をユーザが発話した音声がマイクロフォン2から、認識対象音声として、音声認識エンジン31に3度繰り返し入力する。
この場合、音声認識エンジン31は、1度目の認識対象音声「ちずかくだい」と2度目の認識対象音声「ちずかくだい」については、いずれのワードのスコアとしても、当該ワードのしきい値Th以下となるスコアを算出せず、認識ワードを出力しない。そして、その後、音声認識エンジン31は、3度目の認識対象音声「ちずかくだい」については、音声認識辞書32に登録された各ワードのうちのワード「ちずかくだい」に対して、最初に、ワードのしきい値Th以下となるスコアを算出し、認識ワード「ちずかくだい」を出力する(t4)。
そして、以上に説明してきたようにFR対応しきい値調整処理では、認識ワードの認識の直前の期間に、当該認識ワードを発話した音声と類似した音声(予備認識ワードが検出された音声)が複数回入力されている場合にのみ、当該ワードのしきい値Thの増加を行う。また、このような認識ワードの認識の直前の期間に、当該認識したワードを発話した音声と類似した音声が複数回入力されている状況は、ユーザが同じワードを認識されるまで繰り返し発話した状況、すなわち、誤棄却(FR;False Rejection)が発生したワードの再発話に対して、当該ワードを正しく認識ワードとして認識できた状況である蓋然性が大きい。なお、認識ワードの認識の直前の期間に、当該認識ワードを発話した音声と類似した音声が3回以上の入力されている状況は、認識ワードを発話した音声と類似した音声が3回以上入力した状況であるので、特に、当該蓋然性が大きい。
Claims (8)
- ワードを音声認識する音声認識システムであって、
マイクロフォンと、
整合の度合いを表す基準値が各々設定された複数のワードが登録された音声認識辞書と、
前記音声認識辞書に登録されたワードであって、前記マイクロフォンがピックアップした音声に、当該ワードに設定されている前記基準値よりも低い整合の度合いを表すように設定した予備基準値が表す度合以上高い度合で整合するワードを予備認識ワードとして検出すると共に、前記音声認識辞書に登録されたワードであって、前記マイクロフォンがピックアップした音声に、当該ワードに設定されている前記基準値が表す度合以上高い度合で整合するワードを認識結果として出力する音声認識手段と、
前記音声認識手段が、前記予備認識ワードを検出したときに、当該予備認識ワードとして検出されたワードの予備認識計数値を1増加し、その後、所定期間経過したならば、当該ワードの前記予備認識計数値を1減少する予備認識計数手段と、
前記音声認識手段が、前記認識結果を出力したときに、当該認識結果として出力されたワードの前記予備認識計数値が所定値以上(ただし、所定値は2以上の整数)である場合に、当該認識結果として出力されたワードの前記基準値を、より低い整合の度合いを表すように変更する基準値変更手段とを有することを特徴とする音声認識システム。 - 請求項1記載の音声認識システムであって、
前記基準値変更手段は、認識結果として出力されたワードの前記基準値を、より低い整合の度合いを表すように変更する際に、各ワードの前記予備認識計数値をクリアすることを特徴とする音声認識システム。 - ワードを音声認識する音声認識システムであって、
マイクロフォンと、
整合の度合いを表す基準値が各々設定された複数のワードが登録された音声認識辞書と、
前記音声認識辞書に登録されたワードであって、前記マイクロフォンがピックアップした音声に、当該ワードに設定されている前記基準値よりも低い整合の度合いを表すように設定した予備基準値が表す度合以上高い度合で整合するワードを予備認識ワードとして検出すると共に、前記音声認識辞書に登録されたワードであって、前記マイクロフォンがピックアップした音声に、当該ワードに設定されている前記基準値が表す度合以上高い度合で整合するワードを認識結果として出力する音声認識手段と、
前記音声認識手段が、前記予備認識ワードを検出したときに、当該予備認識ワードとして検出されたワードの予備認識計数値を1増加し、その後、所定期間経過したならば、当該ワードの前記予備認識計数値を1減少する予備認識計数手段と、
前記音声認識手段が、前記認識結果を出力したときに、当該認識結果として出力されたワードの前記予備認識計数値が所定値以上(ただし、所定値は2以上の整数)である場合に、ユーザに対して、当該認識結果として出力された当該ワードの前記基準値を、より低い整合の度合いを表すように変更することを提案する基準値変更提案手段と、
ユーザの操作に応じて、前記ワードの前記基準値を変更する基準値編集手段とを有することを特徴とする音声認識システム。 - 請求項3記載の音声認識システムであって、
前記基準値変更提案手段は、認識結果として出力されたワードの前記基準値を、より低い整合の度合いを表すように変更することを提案する際に、各ワードの前記予備認識計数値をクリアすることを特徴とする音声認識システム。 - 請求項1、2、3または4記載の音声認識システムであって、
前記所定値は3以上の整数であることを特徴とする音声認識システム。 - 請求項1、2、3、4または5記載の音声認識システムであって、
当該音声認識システムは、自動車に搭載された情報処理システムにおいて音声入力に用いられる音声認識システムであることを特徴とする音声認識システム。 - マイクロフォンを備えたコンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは前記コンピュータを、
整合の度合いを表す基準値が各々設定された複数のワードが登録された音声認識辞書と、
前記音声認識辞書に登録されたワードであって、前記マイクロフォンがピックアップした音声に、当該ワードに設定されている前記基準値よりも低い整合の度合いを表すように設定した予備基準値が表す度合以上高い度合で整合するワードを予備認識ワードとして検出すると共に、前記音声認識辞書に登録されたワードであって、前記マイクロフォンがピックアップした音声に、当該ワードに設定されている前記基準値が表す度合以上高い度合で整合するワードを認識結果として出力する音声認識手段と、
前記音声認識手段が、前記予備認識ワードを検出したときに、当該予備認識ワードとして検出されたワードの前記予備認識計数値を1増加し、その後、所定期間経過したならば、当該ワードの予備認識計数値を1減少する予備認識計数手段と、
前記音声認識手段が、前記認識結果を出力したときに、当該認識結果として出力されたワードの前記予備認識計数値が所定値以上(ただし、所定値は2以上の整数)である場合に、当該認識結果として出力されたワードの前記基準値を、より低い整合の度合いを表すように変更する基準値変更手段として機能させることを特徴とするコンピュータプログラム。 - マイクロフォンを備えたコンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは前記コンピュータを、
整合の度合いを表す基準値が各々設定された複数のワードが登録された音声認識辞書と、
前記音声認識辞書に登録されたワードであって、前記マイクロフォンがピックアップした音声に、当該ワードに設定されている前記基準値よりも低い整合の度合いを表すように設定した予備基準値が表す度合以上高い度合で整合するワードを予備認識ワードとして検出すると共に、前記音声認識辞書に登録されたワードであって、前記マイクロフォンがピックアップした音声に、当該ワードに設定されている前記基準値が表す度合以上高い度合で整合するワードを認識結果として出力する音声認識手段と、
前記音声認識手段が、前記予備認識ワードを検出したときに、当該予備認識ワードとして検出されたワードの前記予備認識計数値を1増加し、その後、所定期間経過したならば、当該ワードの予備認識計数値を1減少する予備認識計数手段と、
前記音声認識手段が、前記認識結果を出力したときに、当該認識結果として出力されたワードの前記予備認識計数値が所定値以上(ただし、所定値は2以上の整数)である場合に、当該認識結果として出力された当該ワードの前記基準値を、より低い整合の度合いを表すように変更することを提案する基準値変更提案手段と、
ユーザの操作に応じて、前記ワードの前記基準値を変更する基準値編集手段として機能させることを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018070589A JP6966374B2 (ja) | 2018-04-02 | 2018-04-02 | 音声認識システム及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018070589A JP6966374B2 (ja) | 2018-04-02 | 2018-04-02 | 音声認識システム及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019184631A true JP2019184631A (ja) | 2019-10-24 |
JP6966374B2 JP6966374B2 (ja) | 2021-11-17 |
Family
ID=68340136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018070589A Active JP6966374B2 (ja) | 2018-04-02 | 2018-04-02 | 音声認識システム及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6966374B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021134551A1 (zh) * | 2019-12-31 | 2021-07-08 | 李庆远 | 多个机器翻译输出的人类合并和训练 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04152397A (ja) * | 1990-10-16 | 1992-05-26 | Sanyo Electric Co Ltd | 音声認識装置 |
JPH04155399A (ja) * | 1990-10-18 | 1992-05-28 | Ricoh Co Ltd | 音声認識装置 |
JPH09212187A (ja) * | 1996-02-02 | 1997-08-15 | Ricoh Elemex Corp | 音声認識方法及び装置 |
JP2003091299A (ja) * | 2001-07-13 | 2003-03-28 | Honda Motor Co Ltd | 車載用音声認識装置 |
JP2007041319A (ja) * | 2005-08-03 | 2007-02-15 | Matsushita Electric Ind Co Ltd | 音声認識装置および音声認識方法 |
-
2018
- 2018-04-02 JP JP2018070589A patent/JP6966374B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04152397A (ja) * | 1990-10-16 | 1992-05-26 | Sanyo Electric Co Ltd | 音声認識装置 |
JPH04155399A (ja) * | 1990-10-18 | 1992-05-28 | Ricoh Co Ltd | 音声認識装置 |
JPH09212187A (ja) * | 1996-02-02 | 1997-08-15 | Ricoh Elemex Corp | 音声認識方法及び装置 |
JP2003091299A (ja) * | 2001-07-13 | 2003-03-28 | Honda Motor Co Ltd | 車載用音声認識装置 |
JP2007041319A (ja) * | 2005-08-03 | 2007-02-15 | Matsushita Electric Ind Co Ltd | 音声認識装置および音声認識方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021134551A1 (zh) * | 2019-12-31 | 2021-07-08 | 李庆远 | 多个机器翻译输出的人类合并和训练 |
Also Published As
Publication number | Publication date |
---|---|
JP6966374B2 (ja) | 2021-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10332513B1 (en) | Voice enablement and disablement of speech processing functionality | |
US7228275B1 (en) | Speech recognition system having multiple speech recognizers | |
US9373321B2 (en) | Generation of wake-up words | |
US20160266910A1 (en) | Methods And Apparatus For Unsupervised Wakeup With Time-Correlated Acoustic Events | |
JP3920097B2 (ja) | 車載機器用音声認識装置 | |
US9418653B2 (en) | Operation assisting method and operation assisting device | |
US10176806B2 (en) | Motor vehicle operating device with a correction strategy for voice recognition | |
US20200075028A1 (en) | Speaker recognition and speaker change detection | |
JP6350903B2 (ja) | 操作補助装置および操作補助方法 | |
WO2020153109A1 (ja) | 発言禁止用語に対し注意を喚起するためのプレゼンテーション支援装置 | |
KR20230002690A (ko) | 발화의 음성 인식 오류 교정 | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
JP2006208486A (ja) | 音声入力装置 | |
CN105632500B (zh) | 语音识别装置及其控制方法 | |
JP4491438B2 (ja) | 音声対話装置、音声対話方法、およびプログラム | |
JP6966374B2 (ja) | 音声認識システム及びコンピュータプログラム | |
JP2018116206A (ja) | 音声認識装置、音声認識方法及び音声認識システム | |
JP6716968B2 (ja) | 音声認識装置、音声認識プログラム | |
JP2019184633A (ja) | 音声認識システム | |
JP2006039382A (ja) | 音声認識装置 | |
JP4498906B2 (ja) | 音声認識装置 | |
JP2009251019A (ja) | 音声認識装置 | |
JP2016191739A (ja) | 発音誤り検出装置、方法およびプログラム | |
JP2009003205A (ja) | 音声認識装置、および音声認識方法 | |
US9858918B2 (en) | Root cause analysis and recovery systems and methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211006 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211019 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211021 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6966374 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |