JP2009003205A - 音声認識装置、および音声認識方法 - Google Patents
音声認識装置、および音声認識方法 Download PDFInfo
- Publication number
- JP2009003205A JP2009003205A JP2007164538A JP2007164538A JP2009003205A JP 2009003205 A JP2009003205 A JP 2009003205A JP 2007164538 A JP2007164538 A JP 2007164538A JP 2007164538 A JP2007164538 A JP 2007164538A JP 2009003205 A JP2009003205 A JP 2009003205A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- recognition result
- user
- target vocabulary
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 13
- 239000000284 extract Substances 0.000 claims abstract 2
- 230000004044 response Effects 0.000 claims description 16
- 238000003780 insertion Methods 0.000 claims description 5
- 230000037431 insertion Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000452 restraining effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Landscapes
- Navigation (AREA)
- Traffic Control Systems (AREA)
Abstract
【解決手段】CPU1034aは、使用者の発話内容を拘束する拘束性のレベルが異なる複数の言語モデルで表される語彙を、音声認識実行時の認識対象語彙として記憶し、使用者による発話音声を入力し、記憶した認識対象語彙と、入力した発話音声との一致度を演算し、一致度の演算結果に基づいて、認識対象語彙から認識結果候補を抽出し、抽出したそれぞれの認識結果候補の一致度、およびその認識結果候補を含む言語モデルの拘束性のレベルの少なくともいずれか一方に基づいて、認識結果候補の中から認識結果を特定する。
【選択図】図1
Description
認識結果N−bestの中から「登録地表示」を認識結果として特定する。そして、CPU1034aは、使用者に対してさらに下位の階層のコマンドの発話を促すためのシステムメッセージEとして「登録地表示の番号をどうぞ」をスピーカ102から出力し、使用者からの発話を待ち受ける。同時に、CPU1034aは、ディスプレイ105に、図9(c)に示した拘束性の高レベルの言語モデルの第三階層Cに含まれるコマンドを表示したメニュー画面を表示する。使用者は、これに対応して、登録地の中から登録地の番号を選択するためのユーザ発話Fとして「3番」を発話する。
認識結果N−bestの中から「登録地表示」を認識結果として特定する。そして、CPU1034aは、使用者に対してさらに下位の階層のコマンドの発話を促すためのシステムメッセージEとして「登録地表示の番号をどうぞ」をスピーカ102から出力し、使用者からの発話を待ち受ける。同時に、CPU1034aは、ディスプレイ105に、図9(c)に示した拘束性の高レベルの言語モデルの第三階層Cに含まれるコマンドを表示したメニュー画面を表示する。使用者は、これに対応して、登録地の中から登録地の番号を選択するためのユーザ発話Fとして「3番」を発話する。
(1)使用者の発話内容を拘束する拘束性のレベルが異なる複数の言語モデルで表される語彙を音声認識実行時の認識対象語彙として待ち受け、使用者による発話音声と認識対象語彙との一致度を演算して、認識結果候補として認識結果N−bestを抽出する。そして、認識結果N−bestに含まれる認識対象語彙の一致度、およびその認識結果候補を含む言語モデルの拘束性のレベルに基づいて、認識結果N−bestの中から認識結果を特定するようにした。これによって、使用者が規定コマンドを表現を変更して、拘束性の低い語彙を発話した場合でも、誤認識が生じる可能性を低減することができる。
なお、上述した実施の形態の音声認識装置は、以下のように変形することもできる。
(1)上述した実施の形態では、CPU1034aは、認識結果N−bestの中から、より拘束性のレベルが高い言語モデルの認識対象語彙であって、かつその認識対象語彙の一致度と、最も一致度が高い認識対象語彙とスコア差が所定の閾値より小さい場合に、その認識対象語彙を優先して認識結果として特定するようにした。しかしながら、CPU1034aは、認識結果N−bestに含まれる認識対象語彙の一致度、およびその認識対象語彙を含む言語モデルの拘束性のレベルの少なくともいずれか一方に基づいて、認識結果を特定するようにしてもよい。例えば、認識結果N−bestの中から、より拘束性のレベルが高い言語モデルの認識対象語彙を優先して認識結果として特定するようにしてもよい。
Claims (8)
- 使用者の発話内容を拘束する拘束性のレベルが異なる複数の言語モデルで表される語彙を、音声認識実行時の認識対象語彙として記憶する記憶手段と、
使用者による発話音声を入力する音声入力手段と、
前記記憶手段に記憶した前記認識対象語彙と、前記音声入力手段で入力した前記発話音声との一致度を演算する一致度演算手段と、
前記一致度演算手段による演算結果に基づいて、前記認識対象語彙から認識結果候補を抽出する候補抽出手段と、
前記候補抽出手段で抽出した前記認識結果候補に含まれる各認識対象語彙の一致度、および各認識対象語彙の言語モデルの拘束性のレベルの少なくともいずれか一方に基づいて、前記認識結果候補の中から認識結果を特定する認識結果特定手段とを備えることを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記拘束性のレベルが異なる複数の言語モデルは、認識対象語彙を構成する単語列の中に任意の音素列の挿入を許容しない拘束性の高レベルの言語モデル、認識対象語彙を構成する単語列の中に任意の音素列の挿入を許容し、かつ認識可能な単語列が確定している拘束性の中レベルの言語モデル、および認識対象語彙を構成する単語列の中に任意の音素列の挿入を許容し、かつ認識可能な単語列が確定していない拘束性の低レベルの言語モデルを含むことを特徴とする音声認識装置。 - 請求項2に記載の音声認識装置において、
前記認識結果特定手段は、前記認識結果候補の中から、より拘束性のレベルが高い前記言語モデルの前記認識対象語彙を優先して前記認識結果として特定することを特徴とする音声認識装置。 - 請求項2に記載の音声認識装置において、
前記認識結果特定手段は、前記認識結果候補の中から、より拘束性のレベルが高い前記言語モデルの前記認識対象語彙であって、かつその認識対象語彙の一致度と、最も一致度が高い認識対象語彙との差が所定値より小さい前記認識対象語彙を優先して前記認識結果として特定することを特徴とする音声認識装置。 - 請求項1〜4のいずれか一項に記載の音声認識装置において、
使用者が発話可能な前記認識対象語彙を表示装置に表示する表示制御手段をさらに備えることを特徴とする音声認識装置。 - 請求項1〜5のいずれか一項に記載の音声認識装置において、
前記認識結果特定手段で特定した前記認識結果に基づいて、使用者に対する応答文を生成して出力する応答文出力手段をさらに備えることを特徴とする音声認識装置。 - 請求項1〜6のいずれか一項に記載の音声認識装置において、
前記候補抽出手段は、前記一致度演算手段による演算の結果、前記一致度が所定値以上となる所定数の前記認識対象語彙を前記認識結果候補として抽出することを特徴とする音声認識装置。 - 使用者の発話内容を拘束する拘束性のレベルが異なる複数の言語モデルで表される語彙を、音声認識実行時の認識対象語彙として記憶し、
使用者による発話音声を入力し、
記憶した前記認識対象語彙と、入力した前記発話音声との一致度を演算し、
前記一致度の演算結果に基づいて、前記認識対象語彙から認識結果候補を抽出し、
抽出した前記認識結果候補に含まれる各認識対象語彙の一致度、および各認識対象語彙の言語モデルの拘束性のレベルの少なくともいずれか一方に基づいて、前記認識結果候補の中から認識結果を特定することを特徴とする音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007164538A JP4951422B2 (ja) | 2007-06-22 | 2007-06-22 | 音声認識装置、および音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007164538A JP4951422B2 (ja) | 2007-06-22 | 2007-06-22 | 音声認識装置、および音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009003205A true JP2009003205A (ja) | 2009-01-08 |
JP4951422B2 JP4951422B2 (ja) | 2012-06-13 |
Family
ID=40319653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007164538A Expired - Fee Related JP4951422B2 (ja) | 2007-06-22 | 2007-06-22 | 音声認識装置、および音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4951422B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009081895A1 (ja) * | 2007-12-25 | 2009-07-02 | Nec Corporation | 音声認識システム、音声認識方法、および音声認識用プログラム |
JP2019078463A (ja) * | 2017-10-25 | 2019-05-23 | 株式会社パロマ | 加熱調理器 |
JP7489928B2 (ja) | 2021-02-04 | 2024-05-24 | Toa株式会社 | 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08211893A (ja) * | 1994-12-08 | 1996-08-20 | Toshiba Corp | 音声認識装置 |
JPH117292A (ja) * | 1997-06-16 | 1999-01-12 | Nec Corp | 音声認識装置 |
JP2003345383A (ja) * | 2002-05-27 | 2003-12-03 | Pioneer Electronic Corp | 音声認識装置、音声認識方法および音声認識プログラム |
JP2005208198A (ja) * | 2004-01-21 | 2005-08-04 | Nissan Motor Co Ltd | 音声認識装置、および音声認識方法 |
JP2005534983A (ja) * | 2002-08-01 | 2005-11-17 | テレフォンアクチーボラゲット エル エム エリクソン(パブル) | 自動音声認識の方法 |
-
2007
- 2007-06-22 JP JP2007164538A patent/JP4951422B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08211893A (ja) * | 1994-12-08 | 1996-08-20 | Toshiba Corp | 音声認識装置 |
JPH117292A (ja) * | 1997-06-16 | 1999-01-12 | Nec Corp | 音声認識装置 |
JP2003345383A (ja) * | 2002-05-27 | 2003-12-03 | Pioneer Electronic Corp | 音声認識装置、音声認識方法および音声認識プログラム |
JP2005534983A (ja) * | 2002-08-01 | 2005-11-17 | テレフォンアクチーボラゲット エル エム エリクソン(パブル) | 自動音声認識の方法 |
JP2005208198A (ja) * | 2004-01-21 | 2005-08-04 | Nissan Motor Co Ltd | 音声認識装置、および音声認識方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009081895A1 (ja) * | 2007-12-25 | 2009-07-02 | Nec Corporation | 音声認識システム、音声認識方法、および音声認識用プログラム |
JP5310563B2 (ja) * | 2007-12-25 | 2013-10-09 | 日本電気株式会社 | 音声認識システム、音声認識方法、および音声認識用プログラム |
US8639507B2 (en) | 2007-12-25 | 2014-01-28 | Nec Corporation | Voice recognition system, voice recognition method, and program for voice recognition |
JP2019078463A (ja) * | 2017-10-25 | 2019-05-23 | 株式会社パロマ | 加熱調理器 |
JP7489928B2 (ja) | 2021-02-04 | 2024-05-24 | Toa株式会社 | 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4951422B2 (ja) | 2012-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2015151157A1 (ja) | 意図理解装置および方法 | |
US20020123894A1 (en) | Processing speech recognition errors in an embedded speech recognition system | |
JP4845118B2 (ja) | 音声認識装置、音声認識方法、および、音声認識プログラム | |
JP4867622B2 (ja) | 音声認識装置、および音声認識方法 | |
US8185400B1 (en) | System and method for isolating and processing common dialog cues | |
JP2008009153A (ja) | 音声対話システム | |
JP2021105736A (ja) | 情報処理装置、方法及びプログラム | |
WO2006083020A1 (ja) | 抽出された音声データを用いて応答音声を生成する音声認識システム | |
JP5189858B2 (ja) | 音声認識装置 | |
JP2003114696A (ja) | 音声認識装置、プログラム及びナビゲーションシステム | |
JP2008033198A (ja) | 音声対話システム、音声対話方法、音声入力装置、プログラム | |
JP2006208486A (ja) | 音声入力装置 | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
JP4951422B2 (ja) | 音声認識装置、および音声認識方法 | |
KR101283271B1 (ko) | 어학 학습 장치 및 어학 학습 방법 | |
JP4639094B2 (ja) | 音声認識システム、音声認識装置及び音声認識プログラム | |
CN111145748A (zh) | 音频识别置信度确定方法、装置、设备及存储介质 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP4930014B2 (ja) | 音声認識装置、および音声認識方法 | |
JP6966374B2 (ja) | 音声認識システム及びコンピュータプログラム | |
JP2007183516A (ja) | 音声対話装置及び音声認識方法 | |
JP2012255867A (ja) | 音声認識装置 | |
WO2019142447A1 (ja) | 情報処理装置および情報処理方法 | |
JP4736423B2 (ja) | 音声認識装置および音声認識方法 | |
JP2006172110A (ja) | 応答データ出力装置、応答データ出力方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100215 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100426 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120312 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4951422 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |