JP2019039965A - 音声認識システム - Google Patents
音声認識システム Download PDFInfo
- Publication number
- JP2019039965A JP2019039965A JP2017159823A JP2017159823A JP2019039965A JP 2019039965 A JP2019039965 A JP 2019039965A JP 2017159823 A JP2017159823 A JP 2017159823A JP 2017159823 A JP2017159823 A JP 2017159823A JP 2019039965 A JP2019039965 A JP 2019039965A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- voice
- word
- speech
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Navigation (AREA)
Abstract
Description
そこで、本発明は、複数の認識候補について音声認識を行う際に、発音が類似している認識候補が存在する場合にも、より適正に音声認識を行えるようにすることを課題とする。
第2音声認識手段によって用いられる第2音声認識辞書と、認識手段とを設けたものである。ここで、当該音声認識システムは、第1の認識モードを含む単一または複数の認識モードを有し、前記第1の認識モードにおいて第2音声認識手段によって用いられる前記第2音声認識辞書には、前記第1音声認識辞書に第1認識候補として登録されている部分的に発音が共通する複数のワードの他のワードと発音が共通していない部分であるワード抜粋部分が各々第2認識候補として登録されており、前記第1の認識モードにおいて、前記第2音声認識手段は、前記マイクロフォンがピックアップした音声を入力し、前記第2音声認識辞書に登録された複数の第2認識候補のうちから、入力した音声に所定レベルより良好に整合する第2認識候補を対象候補として検出し、前記第1の認識モードにおいて、前記認識手段は、前記第1音声認識辞書に第1認識候補として登録されている各ワードについて、前記第1音声認識手段と前記第2音声認識手段とによって前記対象候補として検出された、当該ワードである第1認識候補と当該ワードの抜粋部分である第2認識候補の数を算定し、算定した数が最大のワードを、ユーザの発話したワードとして認識する。
図1に、本実施形態に係る情報処理システムの構成を示す。
図示するように、情報処理システムは、データ処理部1、辞書DB2、マイクロフォン3、音声入力部4、スピーカ5、オーディオソース6、表示装置7、GPS受信器等のその他の周辺装置8を備えている。
そして、データ処理部1は、音声入力部4をコマンド等の音声入力に、表示装置7を画面の表示に用いながら、各種処理を行う。
また、音声入力部4は、第1音声認識エンジン41、第1音声認識辞書42、第2音声認識エンジン43、第2音声認識辞書44、認識調整部45を備えている。
次に、辞書DB2には、図2に示すように、第1階層認識データから第3階層認識データまでの複数階層の認識データが格納されている。
主音声認識辞書は、音声認識用の辞書であり、複数のワードのそれぞれについて、番号(No.)と、ワードと、しきい値Thが登録されている。
さて、第1階層認識データの認識モードは、オーディオキャンセルモードに設定されており、第1階層認識データの主音声認識辞書は、初期状態において音声入力部4における音声認識の認識候補とする複数のワードとその番号(No.)としきい値Thが登録されている。
なお、以上では、辞書DB2に登録する認識データとして、第1階層認識データから第3階層認識データまでの3階層の認識データを設ける場合について示したが、辞書DB2に登録する認識データは、2以上の任意の数の階層の認識データとしてよい。
また、データ処理部1は、音声入力の受け付けに関して以下の処理を行う。
すなわち、データ処理部1は、起動したならば、音声入力設定処理を開始し、第1階層認識データを現用認識データに設定し、音声入力部4からの認識結果の入力を待つ待受状態となる。そして、待受状態において、音声入力部4から認識結果が出力されたならば、認識結果の入力を受け付けてシーケンス実行状態に遷移し、シーケンス実行状態において、入力を受け付けた認識結果のワードに応じた処理と、現用認識データの入力を受け付けた認識結果のワードに対応する、現用認識データの一つ下の階層の認識データを現用認識データに設定することによる現用認識データの切り替えとを行いながら、音声入力部4から認識結果の入力を所定回数受け付けるシーケンスを実行する。そして、当該シーケンスが終了したならば、第1階層認識データを現用認識データに設定し、待受状態に復帰する。
図3に、この音声入力設定処理の手順を示す。
図示するように、音声入力設定処理においてデータ処理部1は、上述のように行われる現用認識データの設定の発生を監視する(ステップ302)。
そして、現用認識データの設定が発生したならば(ステップ302)、現用認識データの認識モードがオーディオキャンセルモードであるかどうかを調べる(ステップ304)。
一方、現用認識データの認識モードが、オーディオキャンセルモードでなく、類似ワード強識別モードである場合には(ステップ304)、類似ワード強識別モードを認識調整部45に設定し(ステップ312)、現用認識データの主音声認識辞書を第1音声認識辞書42に設定し、現用認識データの副音声認識辞書を第2音声認識辞書44に設定する(ステップ308)。
以上、データ処理部1が行う音声入力設定処理について説明した。
次に、第1音声認識エンジン41と第2音声認識エンジン43において行う音声認識の動作について説明する。
第1音声認識エンジン41と第2音声認識エンジン43は、認識対象音声の入力と並行して、認識対象音声に対する音声認識辞書に格納された各認識候補のワードのスコアを算定する。
次に、音声入力部4の認識調整部45の動作について説明する。
認識調整部45は、データ処理部1から図3に示した音声入力設定処理によって音声認識開始を指示されたならば、オーディオキャンセルモードが設定されているときには、オーディオキャンセルモード認識処理を実行し、類似ワード強識別モードが設定されているときには、類似ワード強識別モード認識処理を実行する。
図5に、この示すオーディオキャンセルモード認識処理の手順を示す。
図示するように、このオーディオキャンセルモード認識処理では、まず、第2音声認識エンジン43の認識対象音声をオーディオソース6から入力する音声に設定する(ステップ502)。
ここで、このようなオーディオキャンセルモード認識処理によれば、第2音声認識エンジン43がオーディオソース6から入力する音声に対してヒットを検出したワードは、その後、一定期間、第1音声認識エンジン41でヒットが検出されても認識結果とはしない。
図6に、この類似ワード強識別モード認識処理の手順を示す。
図示するように、類似ワード強識別モード認識処理において認識調整部45は、まず、第2音声認識エンジン43の認識対象音声をマイクロフォン3から入力する音声に設定する(ステップ602)。
そして、第1音声認識エンジン41もしくは第2音声認識エンジン43からのヒットデータの通知が発生したならば(ステップ604)、通知されたヒットデータを通知元の音声認識エンジンと対応づけて保存し(ステップ606)、所定のタイムアウト時間(たとえば、500ms)を設定したタイマをスタートする(ステップ608)。
すなわち、まず、通知元の音声認識エンジンと対応づけて保存されている各ヒットデータについて、ヒットデータが表すワードの番号(No.)と通知元の音声認識エンジンより、第1音声認識エンジン41でヒットが検出された第1音声認識辞書42に登録されているワードと、第2音声認識エンジン43でヒットが検出された第2音声認識辞書44に登録されているワードとを識別する。
すなわち、たとえば、図2の第3階層認識データが現用認識データであり、第3階層認識データの主音声認識辞書が第1音声認識辞書42に設定されており、第3階層認識データの副音声認識辞書が第2音声認識辞書44に設定されているときに、第1音声認識エンジン41でヒットが検出された第1音声認識辞書42に登録されているワードが番号(No.)が1の「ひとつめにいく」と番号(No.)が5の「いつつめにいく」であり、第2音声認識エンジン43でヒットが検出された第2音声認識辞書44に登録されていたワードが参照番号(ref)が1の「ひと」と参照番号(ref)が1の「ひとつめにいく」であれば、値1の出現回数が3、値5の出現回数が1となって、値1が最も多く出現する値となるので、1を番号(No.)として持つ、第1音声認識辞書42に登録されているワード「ひとつめにいく」を認識結果とするワードとして算定する。
以上、類似ワード強識別モードが設定されているときに認識調整部45が行う類似ワード強識別モード認識処理について説明した。
さて、ここで、以上のような情報処理装置の動作例を図7に示す。
まず、起動したデータ処理部1は、表示装置7にカーナビゲーション用の案内地図を表示する情報処理や、オーディオソース6から音楽を出力する情報処理を開始する。
また、データ処理部1は、起動したならば、音声入力設定処理を開始し、第1階層認識データを現用認識データに設定することにより、図7a2に示すように第1階層認識データの主音声認識データを第1音声認識辞書42に設定し、図7a3に示すように第1階層認識データの副音声認識データを第2音声認識辞書44に設定すると共に、認識調整部45に、第1階層認識データに認識モードとして登録されているオーディオキャンセルモードを設定する。
なお、以上の実施形態では、認識モードを類似ワード強識別モードに設定した認識データの副音声認識辞書には、その認識データの主音声認識辞書に登録されている、当該主音声認識辞書に登録されている他のワードと発音が類似する各ワードに一致する語句や、当該ワードの他のワードと発音が類似していない部分をワードとして登録したが、認識モードを類似ワード強識別モードに設定した認識データの副音声認識辞書には、その認識データの主音声認識辞書に登録されている、当該主音声認識辞書に登録されている他のワードと発音が類似する各ワードに一致する語句のみを登録したり、当該主音声認識辞書に登録されている他のワードと発音が類似する各ワードの他のワードと発音が類似していない部分のみを登録するようにしてもよい。
Claims (10)
- ユーザの発話した音声を音声認識する音声認識システムであって、
マイクロフォンと、
ワードである第1認識候補が複数登録された第1音声認識辞書と、
前記マイクロフォンがピックアップした音声を入力し、前記第1音声認識辞書に登録された複数の第1認識候補のうちから、入力した音声に所定レベルより良好に整合する第1認識候補を対象候補として検出する第1音声認識手段と、
第2音声認識手段と、
第2音声認識手段によって用いられる第2音声認識辞書と、
認識手段とを有し、
当該音声認識システムは、第1の認識モードを含む単一または複数の認識モードを有し、
前記第1の認識モードにおいて第2音声認識手段によって用いられる前記第2音声認識辞書には、前記第1音声認識辞書に第1認識候補として登録されている部分的に発音が共通する複数のワードの他のワードと発音が共通していない部分であるワード抜粋部分が各々第2認識候補として登録されており、
前記第1の認識モードにおいて、前記第2音声認識手段は、前記マイクロフォンがピックアップした音声を入力し、前記第2音声認識辞書に登録された複数の第2認識候補のうちから、入力した音声に所定レベルより良好に整合する第2認識候補を対象候補として検出し、
前記第1の認識モードにおいて、前記認識手段は、前記第1音声認識辞書に第1認識候補として登録されている各ワードについて、前記第1音声認識手段と前記第2音声認識手段とによって前記対象候補として検出された、当該ワードである第1認識候補と当該ワードの抜粋部分である第2認識候補の数を算定し、算定した数が最大のワードを、ユーザの発話したワードとして認識することを特徴とする音声認識システム。 - ユーザの発話した音声を音声認識する音声認識システムであって、
マイクロフォンと、
ワードである第1認識候補が複数、各第1認識候補に各々対応する複数の第1しきい値と共に登録された第1音声認識辞書と、
前記マイクロフォンがピックアップした音声を入力し、前記第1音声認識辞書に登録された複数の第1認識候補のうちから、対応する第1しきい値が示すレベルより良好に入力した音声に整合する第1認識候補を対象候補として検出する第1音声認識手段と、
第2音声認識手段と、
第2音声認識手段によって用いられる第2音声認識辞書と、
認識手段とを有し、
当該音声認識システムは、第1の認識モードを含む単一または複数の認識モードを有し、
前記第1の認識モードにおいて第2音声認識手段によって用いられる前記第2音声認識辞書には、前記第1音声認識辞書に第1認識候補として登録されている複数のワードと同じワードが各々第2認識候補として、当該各第2認識候補に各々対応する複数の第2しきい値と共に登録されており、
前記第1の認識モードにおいて、前記第2音声認識辞書に登録された各第2認識候補に対応する第2しきい値は、当該第2認識候補として登録されたワードと同じワードである第1認識候補に対応する第1しきい値より良好な整合のレベルを示しており、
前記第1の認識モードにおいて、前記第2音声認識手段は、前記マイクロフォンがピックアップした音声を入力し、前記第2音声認識辞書に登録された複数の第2認識候補のうちから、対応する第2しきい値が示すレベルより良好に入力した音声に整合する第2認識候補を対象候補として検出し、
前記第1の認識モードにおいて、前記認識手段は、前記第1音声認識辞書に第1認識候補として登録されている各ワードについて、前記第1音声認識手段と前記第2音声認識手段とによって前記対象候補として検出された、当該ワードである第1認識候補と第2認識候補の数を算定し、算定した数が最大のワードを、ユーザの発話したワードとして認識することを特徴とする音声認識システム。 - ユーザの発話した音声を音声認識する音声認識システムであって、
マイクロフォンと、
ワードである第1認識候補が複数、各第1認識候補に各々対応する複数の第1しきい値と共に登録された第1音声認識辞書と、
前記マイクロフォンがピックアップした音声を入力し、前記第1音声認識辞書に登録された複数の第1認識候補のうちから、対応する第1しきい値が示すレベルより良好に入力した音声に整合する第1認識候補を対象候補として検出する第1音声認識手段と、
第2音声認識手段と、
前記第2音声認識手段によって用いられる第2音声認識辞書と、
認識手段とを有し、
当該音声認識システムは、第1の認識モードを含む単一または複数の認識モードを有し、
前記第1の認識モードにおいて第2音声認識手段によって用いられる第2音声認識辞書には、前記第1音声認識辞書に第1認識候補として登録されている部分的に発音が共通する複数のワードの他のワードと発音が共通していない部分であるワード抜粋部分と、前記第1音声認識辞書に第1認識候補として登録されている複数のワードと同じワードとが各々第2認識候補として、当該各第2認識候補に各々対応する複数の第2しきい値と共に登録されており、
前記第1の認識モードにおいて、前記第2音声認識辞書に登録された、前記第1認識候補として登録されているワードと同じワードである第2認識候補に対応する第2しきい値は、当該第2認識候補として登録されたワードと同じワードである第1認識候補に対応する第1しきい値より良好な整合のレベルを示しており、
前記第1の認識モードにおいて、前記第2音声認識手段は、前記マイクロフォンがピックアップした音声を入力し、前記第2音声認識辞書に登録された複数の第2認識候補のうちから、対応する第2しきい値が示すレベルより良好に入力した音声に整合する第2認識候補を対象候補として検出し、
前記第1の認識モードにおいて、前記認識手段は、前記第1音声認識辞書に第1認識候補として登録されている各ワードについて、前記第1音声認識手段と前記第2音声認識手段とによって前記対象候補として検出された、当該ワードである第1認識候補と当該ワードである第2認識候補と当該ワードの抜粋部分である第2認識候補の数を算定し、算定した数が最大のワードを、ユーザの発話したワードとして認識することを特徴とする音声認識システム。 - 請求項3記載の音声認識システムであって、
前記第1の認識モードにおいて、前記認識手段は、前記算定した数が最大のワードが複数存在する場合には、前記算定した数が最大のワードのうちの、当該ワードの抜粋部分である第2認識候補が前記対象候補として検出されたワードをユーザの発話したワードとして認識することを特徴とする音声認識システム。 - 請求項4記載の音声認識システムであって、
前記第1の認識モードにおいて、前記認識手段は、前記算定した数が最大のワードが複数存在し、前記算定した数が最大のワードのうちの、当該ワードの抜粋部分である第2認識候補が前記対象候補として検出されたワードが複数存在する場合には、前記算定した数が最大のワードであって、当該ワードの抜粋部分である第2認識候補が前記対象候補として検出されたワードのうちの、前記対象候補として検出された当該ワードである第1認識候補に対応する第1しきい値と、前記対象候補として検出された当該ワードである第2認識候補に対応する第2しきい値と、前記対象候補として検出された当該ワードの抜粋部分である第2認識候補に対応する第2しきい値との最小値が、最小であるワードをユーザの発話したワードとして認識することを特徴とする音声認識システム。 - ユーザの発話した音声を音声認識する音声認識システムであって、
マイクロフォンと、
ワードである第1認識候補が複数登録された第1音声認識辞書と、
前記マイクロフォンがピックアップした音声を入力し、前記第1音声認識辞書に登録された複数の第1認識候補のうちから、入力した音声に所定レベルより良好に整合する第1認識候補を対象候補として検出する第1音声認識手段と、
第2音声認識手段と、
第2音声認識手段によって用いられる第2音声認識辞書と、
認識手段とを有し、
当該音声認識システムは、第1の認識モードを含む単一または複数の認識モードを有し、
前記第1の認識モードにおいて第2音声認識手段によって用いられる前記第2音声認識辞書には、前記第1音声認識辞書に第1認識候補として登録されている部分的に発音が共通する複数のワードの他のワードと発音が共通していない部分であるワード抜粋部分が各々第2認識候補として登録されており、
前記第1の認識モードにおいて、前記第2音声認識手段は、前記マイクロフォンがピックアップした音声を入力し、前記第2音声認識辞書に登録された複数の第2認識候補のうちから、入力した音声に所定レベルより良好に整合する第2認識候補を対象候補として検出し、
前記第1の認識モードにおいて、前記認識手段は、前記第1音声認識手段によって前記対象候補として検出された第1認識候補であるワードが複数存在する場合には、当該複数のワードのうちの、当該ワードの抜粋部分である第2認識候補が前記第2音声認識手段によって前記対象候補として検出されたワードをユーザの発話したワードとして認識することを特徴とする音声認識システム。 - 請求項1、2、3、4、5または6記載の音声認識システムであって、
前記マイクロフォンは、スピーカから、当該スピーカにオーディオソース機器から出力された音が放射される空間中に配置されており、
当該音声認識モードは前記第1の認識モードと第2の認識モードを含む複数の認識モードを有し、
前記第2の認識モードにおいて第2音声認識手段によって用いられる前記第2音声認識辞書には、前記第1音声認識辞書に第1認識候補として登録されている複数のワードと同じワードが各々第2認識候補として登録されており、
前記第2の認識モードにおいて、前記第2音声認識手段は、前記オーディオソース機器がスピーカに出力する音声を入力し、前記第2音声認識辞書に登録された複数の第2認識候補のうちから、入力した音声に所定レベルより良好に整合する第2認識候補を対象候補として検出し、
前記第2の認識モードにおいて、前記認識手段は、前記第2音声認識手段によって第2認識候補が前記対象候補として検出された後の所定期間中は、当該対象候補として検出された第2認識候補と同じワードである第1認識候補が前記第1音声認識手段によって前記対象候補として検出されても、当該対象候補として検出された第1認識候補であるワードをーザの発話したワードとして認識することを抑止しつつ、前記第1音声認識手段によって前記対象候補として検出された第1認識候補であるワードをユーザの発話したワードとして認識することを特徴とする音声認識システム。 - 請求項7記載の音声認識システムであって、
前記第1音声認識辞書と第2音声認識辞書を表す複数の音声認識データを記憶した記憶手段と、
ユーザの音声入力を受け付ける音声入力受付手段と、
前記認識モードを制御する認識モード制御手段とを有し、
当該音声入力受付手段は、予め定めた音声認識データが表す前記第1音声認識辞書と第2音声認識辞書を設定し、前記認識手段が認識したワードを音声入力として受け付ける待ち受け状態と、前記第1音声認識辞書と第2音声認識辞書を前回音声入力として受け付けたワードに応じて定まる音声認識データが表す前記第1音声認識辞書と第2音声認識辞書に更新しながら、前記認識手段が認識したワードを音声入力として1回もしくは複数回受け付けるシーケンスを実行する音声入力シーケンス実行中状態とを有すると共に、前記待ち受け状態においてワードを音声入力として受け付けたならば前記音声入力シーケンス実行中状態に遷移し、前記音声入力シーケンス実行中状態における前記シーケンスの実行を終了したならば前記待ち受け状態に遷移し、
前記認識モード制御手段は、前記音声入力受付手段が前記待ち受け状態にあるときには、前記認識モードとして前記第2の認識モードを設定し、前記音声入力受付手段が前記音声入力シーケンス実行中状態にあるときには、前記認識モードを、前記第1の認識モードと前記第2の認識モードの間で、前記前回音声入力として受け付けたワードに応じて定まる音声認識データに応じて切り替えることを特徴とする音声認識システム。 - 請求項7記載の音声認識システムであって、
前記第1音声認識辞書と第2音声認識辞書を表す複数の音声認識データを記憶した記憶手段と、
ユーザの音声入力を受け付ける音声入力受付手段と、
前記認識モードを制御する認識モード制御手段とを有し、
当該音声入力受付手段は、予め定めた音声認識データが表す前記第1音声認識辞書と第2音声認識辞書を設定し、前記認識手段が認識したワードを音声入力として受け付ける待ち受け状態と、前記第1音声認識辞書と第2音声認識辞書を前回音声入力として受け付けたワードに応じて定まる音声認識データが表す前記第1音声認識辞書と第2音声認識辞書に更新しながら、前記認識手段が認識したワードを音声入力として1回もしくは複数回受け付けるシーケンスを実行する音声入力シーケンス実行中状態とを有すると共に、前記待ち受け状態においてワードを音声入力として受け付けたならば前記音声入力シーケンス実行中状態に遷移し、前記音声入力シーケンス実行中状態における前記シーケンスの実行を終了したならば前記待ち受け状態に遷移し、
前記認識モード制御手段は、前記音声入力受付手段が前記待ち受け状態にあるときには、前記認識モードとして前記第2の認識モードを設定し、前記音声入力受付手段が前記音声入力シーケンス実行中状態にあるときには、前記認識モードとして前記第1の認識モードを設定することを特徴とする音声認識システム。 - 請求項1、2、3、4、5、6、7、8または9記載の音声認識システムであって、
当該音声認識システムは、自動車に搭載された車載システムにおいて音声入力に用いられる音声認識システムであることを特徴とする音声認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017159823A JP6824554B2 (ja) | 2017-08-22 | 2017-08-22 | 音声認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017159823A JP6824554B2 (ja) | 2017-08-22 | 2017-08-22 | 音声認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019039965A true JP2019039965A (ja) | 2019-03-14 |
JP6824554B2 JP6824554B2 (ja) | 2021-02-03 |
Family
ID=65725720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017159823A Active JP6824554B2 (ja) | 2017-08-22 | 2017-08-22 | 音声認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6824554B2 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH096387A (ja) * | 1995-06-19 | 1997-01-10 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2005091709A (ja) * | 2003-09-17 | 2005-04-07 | Renesas Technology Corp | 音声認識装置 |
JP2010020102A (ja) * | 2008-07-10 | 2010-01-28 | Fujitsu Ltd | 音声認識装置、音声認識方法及びコンピュータプログラム |
JP2011022476A (ja) * | 2009-07-17 | 2011-02-03 | Fujitsu Ltd | 音声認識用の閾値管理プログラム、音声認識用の閾値管理方法、音声認識装置 |
JP2011170087A (ja) * | 2010-02-18 | 2011-09-01 | Fujitsu Ltd | 音声認識装置 |
WO2014103099A1 (ja) * | 2012-12-28 | 2014-07-03 | パナソニック株式会社 | 音声認識付き機器及び音声認識方法 |
JP2014206642A (ja) * | 2013-04-12 | 2014-10-30 | 株式会社レイトロン | 音声認識装置および音声認識プログラム |
-
2017
- 2017-08-22 JP JP2017159823A patent/JP6824554B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH096387A (ja) * | 1995-06-19 | 1997-01-10 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2005091709A (ja) * | 2003-09-17 | 2005-04-07 | Renesas Technology Corp | 音声認識装置 |
JP2010020102A (ja) * | 2008-07-10 | 2010-01-28 | Fujitsu Ltd | 音声認識装置、音声認識方法及びコンピュータプログラム |
JP2011022476A (ja) * | 2009-07-17 | 2011-02-03 | Fujitsu Ltd | 音声認識用の閾値管理プログラム、音声認識用の閾値管理方法、音声認識装置 |
JP2011170087A (ja) * | 2010-02-18 | 2011-09-01 | Fujitsu Ltd | 音声認識装置 |
WO2014103099A1 (ja) * | 2012-12-28 | 2014-07-03 | パナソニック株式会社 | 音声認識付き機器及び音声認識方法 |
JP2014206642A (ja) * | 2013-04-12 | 2014-10-30 | 株式会社レイトロン | 音声認識装置および音声認識プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6824554B2 (ja) | 2021-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5089955B2 (ja) | 音声対話装置 | |
US10269346B2 (en) | Multiple speech locale-specific hotword classifiers for selection of a speech locale | |
CN111145733B (zh) | 语音识别方法、装置、计算机设备和计算机可读存储介质 | |
CN111159364B (zh) | 对话***、对话装置、对话方法以及存储介质 | |
JP2018159788A (ja) | 情報処理装置、方法及びプログラム | |
JP2019015838A (ja) | 音声認識システム、端末装置、及び辞書管理方法 | |
US20170140752A1 (en) | Voice recognition apparatus and voice recognition method | |
JP2010078877A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP2006189730A (ja) | 音声対話方法および音声対話装置 | |
JP2006208486A (ja) | 音声入力装置 | |
KR20180063341A (ko) | 음성 인식 장치, 음성 강조 장치, 음성 인식 방법, 음성 강조 방법 및 네비게이션 시스템 | |
US10629197B2 (en) | Voice processing system and voice processing method for predicting and executing an ask-again request corresponding to a received request | |
JP2018116206A (ja) | 音声認識装置、音声認識方法及び音声認識システム | |
JP4661239B2 (ja) | 音声対話装置及び音声対話方法 | |
US11164578B2 (en) | Voice recognition apparatus, voice recognition method, and non-transitory computer-readable storage medium storing program | |
JP2019039965A (ja) | 音声認識システム | |
JP2009025579A (ja) | 音声認識装置および音声認識方法 | |
JP2007101892A (ja) | 音声認識装置 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP6912985B2 (ja) | 音声認識システム及びコンピュータプログラム | |
JP6966374B2 (ja) | 音声認識システム及びコンピュータプログラム | |
US20200320981A1 (en) | Dialogue system and dialogue processing method | |
JP5201973B2 (ja) | 音声検索装置 | |
JP2017054038A (ja) | 学習支援装置及びその学習支援装置用のプログラム | |
JP4635743B2 (ja) | 音声対話装置及び音声理解結果生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6824554 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |