JP6759058B2 - 音声認識装置および音声認識方法 - Google Patents
音声認識装置および音声認識方法 Download PDFInfo
- Publication number
- JP6759058B2 JP6759058B2 JP2016213052A JP2016213052A JP6759058B2 JP 6759058 B2 JP6759058 B2 JP 6759058B2 JP 2016213052 A JP2016213052 A JP 2016213052A JP 2016213052 A JP2016213052 A JP 2016213052A JP 6759058 B2 JP6759058 B2 JP 6759058B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- threshold value
- voice recognition
- index
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Navigation (AREA)
Description
以下、本発明による第1の実施形態を図面に基づいて説明する。図1は、第1の実施形態による音声認識装置100の構成例を示す機能ブロック図である。本実施形態の音声認識装置100は、マイク200より入力されるユーザの発話音声(特定の単語や熟語、簡単な命令文などのワード)を発話コマンドとして認識し、ナビゲーション装置300に対して発話コマンドを実行するものである。なお、ここでは制御対象の電子機器をナビゲーション装置300としているが、オーディオ装置400、エアコンディショナ、その他の電子機器であってもよい。
次に、本発明による第2の実施形態を図面に基づいて説明する。図5は、第2の実施形態による音声認識装置100Aの構成例を示す機能ブロック図である。なお、この図5において、図1に示した符号と同一の符号を付したものは同一の機能を有するものであるので、ここでは重複する説明を省略する。
次に、本発明による第3の実施形態を図面に基づいて説明する。図7は、第3の実施形態による音声認識装置100Bの構成例を示す機能ブロック図である。なお、この図7において、図5に示した符号と同一の符号を付したものは同一の機能を有するものであるので、ここでは重複する説明を省略する。
12 音声認識部
13 確認部
14 ソース判定部
15,15A,15B 閾値設定部
16 キャンセル回数カウント部
17 近接回数カウント部
Claims (5)
- 認識対象とするワードとその音声パターンとを対応付けるとともに、音声認識の指標と比較される閾値が設定されて成る音声認識辞書を記憶する認識辞書記憶部と、
上記音声認識辞書に登録されているワードの音声パターンと、マイクより入力された発話音声との類似度を示す上記指標を算出し、当該算出した上記指標が上記閾値に対して所定の条件を満たす場合に、上記発話音声が上記所定の条件を満たすワードであると認識する音声認識部と、
車両内で再生されているオーディオ音声のソース種別を判定するソース判定部と、
上記ソース判定部により判定された上記ソース種別に応じて、上記閾値を可変設定する閾値設定部と、
上記発話音声について算出された上記指標が上記閾値に対して上記所定の条件を満たしたワードをユーザに提示した後、所定時間以内にユーザがキャンセルを指示した回数であるキャンセル回数をカウントするキャンセル回数カウント部とを備え、
上記閾値設定部は、上記キャンセル回数が所定回数に達した場合、上記発話音声について算出される上記指標が上記所定の条件を満たしにくくなる方向に上記閾値を変更する
ことを特徴とする音声認識装置。 - 認識対象とするワードとその音声パターンとを対応付けるとともに、音声認識の指標と比較される閾値が設定されて成る音声認識辞書を記憶する認識辞書記憶部と、
上記音声認識辞書に登録されているワードの音声パターンと、マイクより入力された発話音声との類似度を示す上記指標を算出し、当該算出した上記指標が上記閾値に対して所定の条件を満たす場合に、上記発話音声が上記所定の条件を満たすワードであると認識する音声認識部と、
車両内で再生されているオーディオ音声のソース種別を判定するソース判定部と、
上記ソース判定部により判定された上記ソース種別に応じて、上記閾値を可変設定する閾値設定部と、
上記指標が上記閾値に対して上記所定の条件を満たさないワードについて、上記指標と上記閾値との差分が所定値より小さくなる回数である近接回数をカウントする近接回数カウント部とを備え、
上記閾値設定部は、上記近接回数が所定回数に達した場合、上記発話音声について算出される上記指標が上記所定の条件を満たしやすくなる方向に上記閾値を変更する
ことを特徴とする音声認識装置。 - 上記ソース判定部は、会話が多く含まれる可能性の高さに応じて上記ソース種別を区分し、上記車両内で再生されているオーディオ音声が、当該区分したソース種別のどれに該当するかを判定することを特徴とする請求項1または2に記載の音声認識装置。
- 音声認識装置のソース判定部が、車両内で再生されているオーディオ音声のソース種別を判定する第1のステップと、
上記音声認識装置の閾値設定部が、上記ソース判定部により判定された上記ソース種別に応じて、音声認識の指標と比較される閾値を可変設定する第2のステップと、
上記音声認識装置の音声認識部が、上記閾値設定部により設定された上記閾値を用いて、音声認識辞書に登録されているワードの音声パターンと、マイクより入力された発話音声との類似度を示す上記指標を算出し、当該算出した上記指標が上記閾値に対して所定の条件を満たす場合に、上記発話音声が上記所定の条件を満たすワードであると認識する第3のステップと、
上記音声認識装置のキャンセル回数カウント部が、上記発話音声について算出された上記指標が上記閾値に対して上記所定の条件を満たしたワードをユーザに提示した後、所定時間以内にユーザがキャンセルを指示した回数であるキャンセル回数をカウントする第4のステップとを有し、
上記第2のステップにおいて上記閾値設定部は、上記キャンセル回数が所定回数に達した場合、上記発話音声について算出される上記指標が上記所定の条件を満たしにくくなる方向に上記閾値を変更する
ことを特徴とする音声認識方法。 - 音声認識装置のソース判定部が、車両内で再生されているオーディオ音声のソース種別を判定する第1のステップと、
上記音声認識装置の閾値設定部が、上記ソース判定部により判定された上記ソース種別に応じて、音声認識の指標と比較される閾値を可変設定する第2のステップと、
上記音声認識装置の音声認識部が、上記閾値設定部により設定された上記閾値を用いて、音声認識辞書に登録されているワードの音声パターンと、マイクより入力された発話音声との類似度を示す上記指標を算出し、当該算出した上記指標が上記閾値に対して所定の条件を満たす場合に、上記発話音声が上記所定の条件を満たすワードであると認識する第3のステップと、
上記音声認識装置の近接回数カウント部が、上記指標が上記閾値に対して上記所定の条件を満たさないワードについて、上記指標と上記閾値との差分が所定値より小さくなる回数である近接回数をカウントする第4のステップとを有し、
上記第2のステップにおいて上記閾値設定部は、上記近接回数が所定回数に達した場合、上記発話音声について算出される上記指標が上記所定の条件を満たしやすくなる方向に上記閾値を変更する
ことを特徴とする音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016213052A JP6759058B2 (ja) | 2016-10-31 | 2016-10-31 | 音声認識装置および音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016213052A JP6759058B2 (ja) | 2016-10-31 | 2016-10-31 | 音声認識装置および音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018072599A JP2018072599A (ja) | 2018-05-10 |
JP6759058B2 true JP6759058B2 (ja) | 2020-09-23 |
Family
ID=62112913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016213052A Active JP6759058B2 (ja) | 2016-10-31 | 2016-10-31 | 音声認識装置および音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6759058B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019176252A1 (ja) * | 2018-03-13 | 2019-09-19 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
JP7242873B2 (ja) * | 2019-09-05 | 2023-03-20 | 三菱電機株式会社 | 音声認識補助装置および音声認識補助方法 |
CN110942772B (zh) * | 2019-11-21 | 2022-11-25 | 新华三大数据技术有限公司 | 一种语音样本收集方法及装置 |
CN113963683B (zh) * | 2020-07-01 | 2024-06-18 | 广州汽车集团股份有限公司 | 一种后备箱开启控制方法及后备箱开启控制*** |
-
2016
- 2016-10-31 JP JP2016213052A patent/JP6759058B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018072599A (ja) | 2018-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11842730B2 (en) | Modification of electronic system operation based on acoustic ambience classification | |
JP6759058B2 (ja) | 音声認識装置および音声認識方法 | |
WO2017081960A1 (ja) | 音声認識制御システム | |
US9230538B2 (en) | Voice recognition device and navigation device | |
WO2017145373A1 (ja) | 音声認識装置 | |
JP4260788B2 (ja) | 音声認識機器制御装置 | |
US20050216271A1 (en) | Speech dialogue system for controlling an electronic device | |
JP2005195895A (ja) | 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置 | |
US10431221B2 (en) | Apparatus for selecting at least one task based on voice command, vehicle including the same, and method thereof | |
US11158316B2 (en) | In-vehicle device and speech recognition method | |
US10540985B2 (en) | In-vehicle media vocal suppression | |
JP2018116130A (ja) | 車内音声処理装置および車内音声処理方法 | |
JP2006208486A (ja) | 音声入力装置 | |
WO2017154358A1 (ja) | 音声認識装置、音声認識プログラム | |
JP2008250236A (ja) | 音声認識装置および音声認識方法 | |
JPWO2020079733A1 (ja) | 音声認識装置、音声認識システム、及び音声認識方法 | |
KR20180005828A (ko) | 사운드 크기를 직관적으로 조정하기 위한 방법 및 차량 제어기 | |
JP2019176431A (ja) | 音声認識装置 | |
JP5173895B2 (ja) | 音声認識装置 | |
JPS59180600A (ja) | 車載用音声認識制御装置 | |
JP2009251019A (ja) | 音声認識装置 | |
JP4608670B2 (ja) | 音声認識装置および音声認識方法 | |
WO2024009465A1 (ja) | 音声認識装置、プログラム、音声認識方法、及び音声認識システム | |
JP2003029785A (ja) | 音声認識装置 | |
JP2010271452A (ja) | 音声認識装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190627 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200407 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200901 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200902 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6759058 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |