JP2013064777A - 端末装置、音声認識プログラム、音声認識方法および音声認識システム - Google Patents
端末装置、音声認識プログラム、音声認識方法および音声認識システム Download PDFInfo
- Publication number
- JP2013064777A JP2013064777A JP2011202064A JP2011202064A JP2013064777A JP 2013064777 A JP2013064777 A JP 2013064777A JP 2011202064 A JP2011202064 A JP 2011202064A JP 2011202064 A JP2011202064 A JP 2011202064A JP 2013064777 A JP2013064777 A JP 2013064777A
- Authority
- JP
- Japan
- Prior art keywords
- command
- speech recognition
- voice
- recognition result
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 48
- 230000005540 biological transmission Effects 0.000 claims abstract description 52
- 238000012795 verification Methods 0.000 claims description 64
- 230000005236 sound signal Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 description 183
- 230000008569 process Effects 0.000 description 38
- 238000004364 calculation method Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Images
Abstract
【解決手段】本発明に係る端末装置1は、音声信号の入力を受け付ける音声入力部11と、音声信号に対する音声認識を行う音声認識部12と、音声信号を音声認識サーバ2に送信する音声送信部14と、サーバ音声認識結果を受信するサーバ音声認識結果受信部15と、複数のコマンドが登録されたコマンド辞書17と、端末内音声認識結果をコマンド辞書17と照合して、端末内音声認識結果およびサーバ音声認識結果のうちいずれの音声認識結果を利用するか決定し、決定された音声認識結果に基づいて音声信号によって示されるコマンドを特定するコマンド照合部16と、コマンド照合部16によって特定されたコマンドを実行するコマンド実行部18と、を備えることを特徴とする。
【選択図】図1
Description
ここで、コマンド照合部16は、各機能に対して取得したスコアの合計を機能ごとに算出し、そのうち最大の値を、その最大の値を有する機能の実行を指示するコマンドの確信度とする。図4の例では、電話機能のスコアの合計が0.5+2.0+0.5=3.0、メール機能のスコアの合計が0.5であるから、電話機能の実行を指示するためのコマンドの確信度が、3.0と算出される。
コマンド照合部16は、各機能に対して取得したスコアの合計を機能ごとに算出し、最大の値と2番目に大きい値の差を、最大の値を有する機能の実行を指示するコマンドの確信度とする。図4の例では、電話機能のスコアの合計が3.0、メール機能のスコアの合計が0.5であるから、電話機能の実行を指示するためのコマンドの確信度が、3.0−0.5=2.5と算出される。
<第3の確信度算出方法>
コマンド照合部16は、各機能に対して取得したスコアと、単語ごとの音声認識結果の信頼度とに基づいて、確信度を算出する。例えば、音声認識部12によって認識された「山田 さん に 電話 を かける」の各単語について、「山田」の信頼度が0.9、「さん」の信頼度が0.8、「に」の信頼度が0.8、「電話」の信頼度が1.0、「を」の信頼度が0.5、「かける」の信頼度が0.5であったとする。なお、この信頼度は、音声認識部12により取得された端末内音声認識結果に含まれる。この場合、コマンド照合部16は、端末内音声認識結果の単語がキーワードリストに登録されたキーワードに一致すると判断すると、そのキーワードに対応付けられた機能に割り当てられたスコアに、その単語の信頼度を加える。そして、コマンド照合部16は、信頼度を加えたスコアの合計を機能ごとに算出し、そのうちの最大の値を、その最大の値を有する機能の実行を指示するコマンドの確信度とする。図4の例では、電話機能に対する信頼度を加えたスコアの合計が0.5+0.9+2.0+1.0+0.5+0.5=5.4、メール機能に対する信頼度を加えたスコアの合計が0.5+0.9=1.4であるから、電話機能の実行を指示するためのコマンドの確信度が、5.4と算出される。
コマンド照合部16は、端末内音声認識結果の単語がキーワードリストに登録されたキーワードに一致した場合に、そのキーワードに割り当てられたスコアに、その単語の信頼度を掛ける。そして、コマンド照合部16は、信頼度を掛けたスコアの合計を機能ごとに算出し、そのうちの最大値を、その最大の値を有する機能の実行を指示するコマンドの確信度とする。端末内音声認識結果の各単語の信頼度が第3の確信度算出方法において説明したものと同じとすると、図4の例では、電話機能に対する信頼度を掛けたスコアの合計が0.5×0.9+2.0×1.0+0.5×0.5=2.7、メール機能に対する信頼度を掛けたスコアの合計が0.5×0.9=0.45であるから、電話機能の実行を指示するためのコマンドの確信度が、2.7と算出される。
図5は、端末装置1のコマンド判別実行処理の一例を示すフローチャートである。本処理は、端末装置1のユーザが音声入力装置106を介して音声入力することにより開始される。
図6は、端末装置1のコマンド判別実行処理の他の例を示すフローチャートである。本処理は、端末装置1のユーザが音声入力装置106を介して音声入力することにより開始される。なお、本処理におけるS21〜S29の各ステップはそれぞれ、図5のS01〜S09の各ステップと同様であるため、S21〜S29の説明を省略する。
図7は、端末装置1のコマンド判別実行処理の他の例を示すフローチャートである。本処理は、端末装置1のユーザが音声入力装置106を介して音声入力することにより開始される。なお、本処理におけるS41〜S47の各ステップはそれぞれ、図5のS01〜S07の各ステップと同様であるため、S41〜S47の説明を省略する。
Claims (16)
- 音声信号の入力を受け付ける音声入力手段と、
前記音声入力手段によって受け付けられた音声信号に対する音声認識を行う音声認識手段と、
前記音声信号を音声認識サーバに送信する音声送信手段と、
前記音声認識サーバによる前記音声信号に対する音声認識結果であるサーバ音声認識結果を受信するサーバ音声認識結果受信手段と、
複数のコマンドが登録されたコマンド辞書と、
前記音声認識手段によって認識された音声認識結果である端末内音声認識結果を前記コマンド辞書と照合して、前記端末内音声認識結果および前記サーバ音声認識結果のうちいずれの音声認識結果を利用するか決定し、決定された前記音声認識結果に基づいて前記音声信号によって示されるコマンドを特定するコマンド照合手段と、
前記コマンド照合手段によって特定された前記コマンドを実行するコマンド実行手段と、
を備えることを特徴とする端末装置。 - 前記コマンド照合手段は、前記端末内音声認識結果を前記コマンド辞書と照合して、コマンドに該当する可能性を示す確信度を算出し、前記確信度が所定の閾値以上である場合に、前記端末内音声認識結果の利用を決定し、前記閾値以上の前記確信度の前記コマンドを前記音声信号によって示されるコマンドとして特定することを特徴とする請求項1に記載の端末装置。
- 前記コマンド辞書は、前記複数のコマンドの各々に対して、複数のキーワードと、前記複数のキーワードに対応付けられたスコアとが登録されたキーワードリストを記憶し、
前記コマンド照合手段は、前記端末内音声認識結果に含まれる単語の各々について、前記キーワードリストに登録された前記複数のキーワードのいずれかに該当するか否かを判定し、該当するキーワードに対応付けられたコマンドおよびスコアに基づいて前記確信度を算出することを特徴とする請求項2に記載の端末装置。 - 前記コマンド照合手段は、前記端末内音声認識結果に含まれる単語の各々について、前記キーワードリストに登録された前記複数のキーワードのいずれかに該当するか否かを判定し、該当するキーワードに対応付けられたコマンドおよびスコア並びに前記単語の音声認識の信頼度に基づいて、前記確信度を算出することを特徴とする請求項3に記載の端末装置。
- 前記コマンド照合手段は、前記閾値以上の前記確信度の前記コマンドが、端末内機能の実行を指示するコマンドである場合には、前記端末内音声認識結果の利用を決定し、前記閾値以上の前記確信度の前記コマンドが、端末内機能の実行を指示するコマンド以外のコマンドである場合には、前記サーバ音声認識結果の利用を決定することを特徴とする請求項2〜4のいずれか一項に記載の端末装置。
- 前記音声送信手段は、前記音声認識手段によって前記端末内音声認識結果が得られる前に、前記音声信号を前記音声認識サーバに送信することを特徴とする請求項1〜5のいずれか一項に記載の端末装置。
- 前記サーバ音声認識結果受信手段は、前記コマンド照合手段によって前記端末内音声認識結果に基づいてコマンドが特定された後に前記サーバ音声認識結果を受信した場合、前記サーバ音声認識結果を破棄することを特徴とする請求項6に記載の端末装置。
- 音声信号の入力を受け付ける音声入力モジュール、
前記音声入力モジュールによって受け付けられた音声信号に対する音声認識を行う音声認識モジュール、
前記音声信号を音声認識サーバに送信する音声送信モジュールと、
前記音声認識サーバによる前記音声信号に対する音声認識結果であるサーバ音声認識結果を受信するサーバ音声認識結果受信モジュールと、
前記音声認識モジュールによって認識された音声認識結果である端末内音声認識結果を複数のコマンドが登録されたコマンド辞書と照合して、前記端末内音声認識結果および前記サーバ音声認識結果のうちいずれの音声認識結果を利用するか決定し、決定された前記音声認識結果に基づいて前記音声信号によって示されるコマンドを特定するコマンド照合モジュールと、
前記コマンド照合モジュールによって特定された前記コマンドを実行するコマンド実行モジュールと、
を備えることを特徴とする音声認識プログラム。 - 前記コマンド照合モジュールは、前記端末内音声認識結果を前記コマンド辞書と照合して、コマンドに該当する可能性を示す確信度を算出し、前記確信度が所定の閾値以上である場合に、前記端末内音声認識結果の利用を決定し、前記閾値以上の前記確信度の前記コマンドを前記音声信号によって示されるコマンドとして特定することを特徴とする請求項8に記載の音声認識プログラム。
- 前記コマンド辞書は、前記複数のコマンドの各々に対して、複数のキーワードと、前記複数のキーワードの各々に対応付けられたスコアとが登録されたキーワードリストを記憶し、
前記コマンド照合モジュールは、前記端末内音声認識結果に含まれる単語の各々について、前記キーワードリストに登録された前記複数のキーワードのいずれかに該当するか否かを判定し、該当するキーワードに対応付けられたコマンドおよびスコアに基づいて前記確信度を算出することを特徴とする請求項9に記載の音声認識プログラム。 - 前記コマンド照合モジュールは、前記端末内音声認識結果に含まれる単語の各々について、前記キーワードリストに登録された前記複数のキーワードのいずれかに該当するか否かを判定し、該当するキーワードに対応付けられたコマンドおよびスコア並びに前記単語の音声認識の信頼度に基づいて、前記確信度を算出することを特徴とする請求項10に記載の音声認識プログラム。
- 前記コマンド照合モジュールは、前記閾値以上の前記確信度の前記コマンドが、端末内機能の実行を指示するコマンドである場合には、前記端末内音声認識結果の利用を決定し、前記閾値以上の前記確信度の前記コマンドが、端末内機能の実行を指示するコマンド以外のコマンドである場合には、前記サーバ音声認識結果の利用を決定することを特徴とする請求項9〜11のいずれか一項に記載の音声認識プログラム。
- 前記音声送信モジュールは、前記音声認識モジュールによって前記端末内音声認識結果が得られる前に、前記音声信号を前記音声認識サーバに送信することを特徴とする請求項8〜12のいずれか一項に記載の音声認識プログラム。
- 前記サーバ音声認識結果受信モジュールは、前記コマンド照合モジュールによって前記端末内音声認識結果に基づいてコマンドが特定された後に前記サーバ音声認識結果を受信した場合、前記サーバ音声認識結果を破棄することを特徴とする請求項13に記載の音声認識プログラム。
- 音声信号の入力を受け付ける音声入力ステップと、
前記音声入力ステップにおいて受け付けられた音声信号に対する音声認識を行う音声認識ステップと、
前記音声信号を音声認識サーバに送信する音声送信ステップと、
前記音声認識サーバによる前記音声信号に対する音声認識結果であるサーバ音声認識結果を受信するサーバ音声認識結果受信ステップと、
前記音声認識ステップにおいて認識された音声認識結果である端末内音声認識結果を複数のコマンドが登録されたコマンド辞書と照合して、前記端末内音声認識結果および前記サーバ音声認識結果のうちいずれの音声認識結果を利用するか決定し、決定された前記音声認識結果に基づいて前記音声信号によって示されるコマンドを特定するコマンド照合ステップと、
前記コマンド照合ステップにおいて特定された前記コマンドを実行するコマンド実行ステップと、
を備えることを特徴とする音声認識方法。 - 端末装置と、音声認識サーバと、を含む音声認識システムであって、
前記端末装置は、
音声信号の入力を受け付ける音声入力手段と、
前記音声入力手段によって受け付けられた音声信号に対する音声認識を行う音声認識手段と、
複数のコマンドが登録されたコマンド辞書と、
前記音声信号を前記音声認識サーバに送信する音声送信手段と、
前記音声認識サーバによる前記音声信号に対する音声認識結果であるサーバ音声認識結果を受信するサーバ音声認識結果受信手段と、
前記音声認識手段によって認識された音声認識結果である端末内音声認識結果を前記コマンド辞書と照合して、前記端末内音声認識結果および前記サーバ音声認識結果のうちいずれの音声認識結果を利用するか決定し、決定された前記音声認識結果に基づいて前記音声信号によって示されるコマンドを特定するコマンド照合手段と、
前記コマンド照合手段によって特定された前記コマンドを実行するコマンド実行手段と、
を備え、
前記音声認識サーバは、
前記音声送信手段から送信された前記音声信号を受信する音声受信手段と、
前記端末装置よりも多くの語彙を含むサーバ辞書と、
前記音声受信手段によって受信された前記音声信号を、前記サーバ辞書に基づいて音声認識するサーバ音声認識手段と、
前記サーバ音声認識結果を前記端末装置に送信するサーバ音声認識結果送信手段と、
を備えることを特徴とする音声認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011202064A JP5658641B2 (ja) | 2011-09-15 | 2011-09-15 | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011202064A JP5658641B2 (ja) | 2011-09-15 | 2011-09-15 | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013064777A true JP2013064777A (ja) | 2013-04-11 |
JP5658641B2 JP5658641B2 (ja) | 2015-01-28 |
Family
ID=48188360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011202064A Active JP5658641B2 (ja) | 2011-09-15 | 2011-09-15 | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5658641B2 (ja) |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103474068A (zh) * | 2013-08-19 | 2013-12-25 | 安徽科大讯飞信息科技股份有限公司 | 实现语音命令控制的方法、设备及*** |
JP2014134791A (ja) * | 2012-12-31 | 2014-07-24 | Samsung Electronics Co Ltd | ディスプレイ装置及び制御方法 |
JP2014182307A (ja) * | 2013-03-19 | 2014-09-29 | Sharp Corp | 音声認識システム、および発話システム |
JP2015028566A (ja) * | 2013-07-30 | 2015-02-12 | 株式会社デンソー | 応答制御システム、車載器、およびセンター |
CN104681026A (zh) * | 2013-11-27 | 2015-06-03 | 夏普株式会社 | 语音识别终端及***、服务器及其控制方法、非易失性存储介质 |
JP2015141226A (ja) * | 2014-01-27 | 2015-08-03 | パイオニア株式会社 | 情報処理装置 |
WO2015118578A1 (ja) * | 2014-02-10 | 2015-08-13 | 三菱電機株式会社 | マルチモーダル入力装置、端末装置およびマルチモーダル入力装置のタイムアウト制御方法 |
JP2015232868A (ja) * | 2014-05-13 | 2015-12-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声認識機能を用いた情報提供方法および機器の制御方法 |
KR20160059026A (ko) * | 2014-11-17 | 2016-05-26 | 주식회사 엘지유플러스 | 이동통신단말기의 음성메모에 기초한 이벤트실행 시스템, 그 단말기 제어서버 및 이동통신단말기 제어방법, 이동통신단말기 및 어플리케이션 실행방법 |
CN105741836A (zh) * | 2014-12-26 | 2016-07-06 | 松下电器(美国)知识产权公司 | 声音识别装置以及声音识别方法 |
CN105793923A (zh) * | 2013-09-20 | 2016-07-20 | 亚马逊技术股份有限公司 | 本地和远程语音处理 |
KR101700099B1 (ko) * | 2016-10-11 | 2017-01-31 | 미디어젠(주) | 하이브리드 음성인식 복합 성능 자동 평가시스템 |
US9640183B2 (en) | 2014-04-07 | 2017-05-02 | Samsung Electronics Co., Ltd. | Speech recognition using electronic device and server |
WO2017154282A1 (ja) * | 2016-03-10 | 2017-09-14 | ソニー株式会社 | 音声処理装置および音声処理方法 |
JP2018081185A (ja) * | 2016-11-15 | 2018-05-24 | クラリオン株式会社 | 音声認識装置、音声認識システム |
JP2018174403A (ja) * | 2017-03-31 | 2018-11-08 | サクサ株式会社 | 電話制御装置、電話システム、およびプログラム |
JP2018190436A (ja) * | 2013-04-19 | 2018-11-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器の制御方法、機器、及びプログラム |
JP2018194849A (ja) * | 2018-07-12 | 2018-12-06 | パイオニア株式会社 | 情報処理装置 |
JP2018537734A (ja) * | 2016-08-26 | 2018-12-20 | 三菱電機株式会社 | ファクトリーオートメーションシステムおよびリモートサーバ |
WO2019026314A1 (ja) * | 2017-08-02 | 2019-02-07 | パナソニックIpマネジメント株式会社 | 情報処理装置、音声認識システム、及び、情報処理方法 |
JP2019056913A (ja) * | 2014-05-13 | 2019-04-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識機能を用いた情報提供方法および機器の制御方法 |
JPWO2018047421A1 (ja) * | 2016-09-09 | 2019-06-24 | ソニー株式会社 | 音声処理装置、情報処理装置、音声処理方法および情報処理方法 |
JP2019124855A (ja) * | 2018-01-18 | 2019-07-25 | 株式会社ユピテル | 装置及びプログラム等 |
JP2019523907A (ja) * | 2016-06-07 | 2019-08-29 | グーグル エルエルシー | パーソナルアシスタントモジュールによる非決定的なタスク開始 |
KR102026479B1 (ko) * | 2019-03-06 | 2019-09-30 | 주식회사 다이얼로그디자인에이전시 | 병렬처리 플랫폼 기반 인공지능 음성인식 서비스 제공 시스템 |
US10515637B1 (en) | 2017-09-19 | 2019-12-24 | Amazon Technologies, Inc. | Dynamic speech processing |
JP2020129130A (ja) * | 2020-04-27 | 2020-08-27 | パイオニア株式会社 | 情報処理装置 |
JP2020134903A (ja) * | 2019-02-26 | 2020-08-31 | コニカミノルタ株式会社 | システム、画像形成装置、方法およびプログラム |
US10950230B2 (en) | 2016-10-28 | 2021-03-16 | Panasonic Intellectual Property Corporation Of America | Information processing device and information processing method |
JP2021073567A (ja) * | 2018-04-11 | 2021-05-13 | 百度在線網絡技術(北京)有限公司 | 音声制御方法、端末機器、クラウドサーバ及びシステム |
WO2023241482A1 (zh) * | 2022-06-13 | 2023-12-21 | 华为技术有限公司 | 一种人机对话方法、设备及*** |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10222337A (ja) * | 1997-02-13 | 1998-08-21 | Meidensha Corp | コンピュータシステム |
JP2003115929A (ja) * | 2001-10-02 | 2003-04-18 | Hitachi Ltd | 音声入力システムおよび音声ポータルサーバおよび音声入力端末 |
JP2005524859A (ja) * | 2001-12-29 | 2005-08-18 | モトローラ・インコーポレイテッド | 多重レベル分散型音声認識のための方法および装置 |
JP2005249829A (ja) * | 2004-03-01 | 2005-09-15 | Advanced Media Inc | 音声認識を行うコンピュータネットワークシステム |
JP2009237439A (ja) * | 2008-03-28 | 2009-10-15 | Kddi Corp | 携帯端末の音声認識装置、音声認識方法、音声認識プログラム |
JP2009288630A (ja) * | 2008-05-30 | 2009-12-10 | Denso Corp | 車両用音声認識システム |
US20100057450A1 (en) * | 2008-08-29 | 2010-03-04 | Detlef Koll | Hybrid Speech Recognition |
JP2010085536A (ja) * | 2008-09-30 | 2010-04-15 | Fyuutorekku:Kk | 音声認識システム、音声認識方法、音声認識クライアントおよびプログラム |
-
2011
- 2011-09-15 JP JP2011202064A patent/JP5658641B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10222337A (ja) * | 1997-02-13 | 1998-08-21 | Meidensha Corp | コンピュータシステム |
JP2003115929A (ja) * | 2001-10-02 | 2003-04-18 | Hitachi Ltd | 音声入力システムおよび音声ポータルサーバおよび音声入力端末 |
JP2005524859A (ja) * | 2001-12-29 | 2005-08-18 | モトローラ・インコーポレイテッド | 多重レベル分散型音声認識のための方法および装置 |
JP2005249829A (ja) * | 2004-03-01 | 2005-09-15 | Advanced Media Inc | 音声認識を行うコンピュータネットワークシステム |
JP2009237439A (ja) * | 2008-03-28 | 2009-10-15 | Kddi Corp | 携帯端末の音声認識装置、音声認識方法、音声認識プログラム |
JP2009288630A (ja) * | 2008-05-30 | 2009-12-10 | Denso Corp | 車両用音声認識システム |
US20100057450A1 (en) * | 2008-08-29 | 2010-03-04 | Detlef Koll | Hybrid Speech Recognition |
JP2010085536A (ja) * | 2008-09-30 | 2010-04-15 | Fyuutorekku:Kk | 音声認識システム、音声認識方法、音声認識クライアントおよびプログラム |
Cited By (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014134791A (ja) * | 2012-12-31 | 2014-07-24 | Samsung Electronics Co Ltd | ディスプレイ装置及び制御方法 |
JP2014182307A (ja) * | 2013-03-19 | 2014-09-29 | Sharp Corp | 音声認識システム、および発話システム |
JP2019115047A (ja) * | 2013-04-19 | 2019-07-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | システムの制御方法、システム、及びプログラム |
USRE48569E1 (en) | 2013-04-19 | 2021-05-25 | Panasonic Intellectual Property Corporation Of America | Control method for household electrical appliance, household electrical appliance control system, and gateway |
JP2018190436A (ja) * | 2013-04-19 | 2018-11-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器の制御方法、機器、及びプログラム |
JP2015028566A (ja) * | 2013-07-30 | 2015-02-12 | 株式会社デンソー | 応答制御システム、車載器、およびセンター |
CN103474068A (zh) * | 2013-08-19 | 2013-12-25 | 安徽科大讯飞信息科技股份有限公司 | 实现语音命令控制的方法、设备及*** |
CN103474068B (zh) * | 2013-08-19 | 2016-08-10 | 科大讯飞股份有限公司 | 实现语音命令控制的方法、设备及*** |
JP2016531375A (ja) * | 2013-09-20 | 2016-10-06 | アマゾン テクノロジーズ インコーポレイテッド | ローカルとリモートのスピーチ処理 |
CN105793923A (zh) * | 2013-09-20 | 2016-07-20 | 亚马逊技术股份有限公司 | 本地和远程语音处理 |
JP2015102795A (ja) * | 2013-11-27 | 2015-06-04 | シャープ株式会社 | 音声認識端末、サーバ、サーバの制御方法、音声認識システム、音声認識端末の制御プログラムおよびサーバの制御プログラム |
CN104681026A (zh) * | 2013-11-27 | 2015-06-03 | 夏普株式会社 | 语音识别终端及***、服务器及其控制方法、非易失性存储介质 |
US9626964B2 (en) | 2013-11-27 | 2017-04-18 | Sharp Kabushiki Kaisha | Voice recognition terminal, server, method of controlling server, voice recognition system, non-transitory storage medium storing program for controlling voice recognition terminal, and non-transitory storage medium storing program for controlling server |
JP2015141226A (ja) * | 2014-01-27 | 2015-08-03 | パイオニア株式会社 | 情報処理装置 |
WO2015118578A1 (ja) * | 2014-02-10 | 2015-08-13 | 三菱電機株式会社 | マルチモーダル入力装置、端末装置およびマルチモーダル入力装置のタイムアウト制御方法 |
US9640183B2 (en) | 2014-04-07 | 2017-05-02 | Samsung Electronics Co., Ltd. | Speech recognition using electronic device and server |
US10643621B2 (en) | 2014-04-07 | 2020-05-05 | Samsung Electronics Co., Ltd. | Speech recognition using electronic device and server |
US10074372B2 (en) | 2014-04-07 | 2018-09-11 | Samsung Electronics Co., Ltd. | Speech recognition using electronic device and server |
JP2015232868A (ja) * | 2014-05-13 | 2015-12-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声認識機能を用いた情報提供方法および機器の制御方法 |
JP2020101822A (ja) * | 2014-05-13 | 2020-07-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識機能を用いた情報提供方法および機器の制御方法 |
JP2019056913A (ja) * | 2014-05-13 | 2019-04-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識機能を用いた情報提供方法および機器の制御方法 |
KR102300415B1 (ko) | 2014-11-17 | 2021-09-13 | 주식회사 엘지유플러스 | 이동통신단말기의 음성메모에 기초한 이벤트실행 시스템, 그 단말기 제어서버 및 이동통신단말기 제어방법, 이동통신단말기 및 어플리케이션 실행방법 |
KR20160059026A (ko) * | 2014-11-17 | 2016-05-26 | 주식회사 엘지유플러스 | 이동통신단말기의 음성메모에 기초한 이벤트실행 시스템, 그 단말기 제어서버 및 이동통신단말기 제어방법, 이동통신단말기 및 어플리케이션 실행방법 |
JP2016126330A (ja) * | 2014-12-26 | 2016-07-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識装置及び音声認識方法 |
CN105741836A (zh) * | 2014-12-26 | 2016-07-06 | 松下电器(美国)知识产权公司 | 声音识别装置以及声音识别方法 |
US9966077B2 (en) | 2014-12-26 | 2018-05-08 | Panasonic Intellectual Property Corporation Of America | Speech recognition device and method |
WO2017154282A1 (ja) * | 2016-03-10 | 2017-09-14 | ソニー株式会社 | 音声処理装置および音声処理方法 |
JP2019523907A (ja) * | 2016-06-07 | 2019-08-29 | グーグル エルエルシー | パーソナルアシスタントモジュールによる非決定的なタスク開始 |
JP2018537734A (ja) * | 2016-08-26 | 2018-12-20 | 三菱電機株式会社 | ファクトリーオートメーションシステムおよびリモートサーバ |
JP7040449B2 (ja) | 2016-09-09 | 2022-03-23 | ソニーグループ株式会社 | 音声処理装置、情報処理装置、音声処理方法および情報処理方法 |
JPWO2018047421A1 (ja) * | 2016-09-09 | 2019-06-24 | ソニー株式会社 | 音声処理装置、情報処理装置、音声処理方法および情報処理方法 |
KR101700099B1 (ko) * | 2016-10-11 | 2017-01-31 | 미디어젠(주) | 하이브리드 음성인식 복합 성능 자동 평가시스템 |
WO2018070668A1 (ko) * | 2016-10-11 | 2018-04-19 | 미디어젠 주식회사 | 하이브리드 음성인식 복합 성능 자동 평가시스템 |
JP2019535044A (ja) * | 2016-10-11 | 2019-12-05 | メディアゼン インコーポレイテッド | ハイブリッド音声認識複合性能自動評価システム |
US10643605B2 (en) | 2016-10-11 | 2020-05-05 | Mediazen, Inc. | Automatic multi-performance evaluation system for hybrid speech recognition |
US10950230B2 (en) | 2016-10-28 | 2021-03-16 | Panasonic Intellectual Property Corporation Of America | Information processing device and information processing method |
US11087764B2 (en) | 2016-11-15 | 2021-08-10 | Clarion Co., Ltd. | Speech recognition apparatus and speech recognition system |
JP2018081185A (ja) * | 2016-11-15 | 2018-05-24 | クラリオン株式会社 | 音声認識装置、音声認識システム |
WO2018092786A1 (ja) * | 2016-11-15 | 2018-05-24 | クラリオン株式会社 | 音声認識装置、音声認識システム |
JP2018174403A (ja) * | 2017-03-31 | 2018-11-08 | サクサ株式会社 | 電話制御装置、電話システム、およびプログラム |
WO2019026314A1 (ja) * | 2017-08-02 | 2019-02-07 | パナソニックIpマネジメント株式会社 | 情報処理装置、音声認識システム、及び、情報処理方法 |
JPWO2019026314A1 (ja) * | 2017-08-02 | 2020-06-18 | パナソニックIpマネジメント株式会社 | 情報処理装置、音声認識システム、及び、情報処理方法 |
JP7033713B2 (ja) | 2017-08-02 | 2022-03-11 | パナソニックIpマネジメント株式会社 | 情報処理装置、音声認識システム、及び、情報処理方法 |
US10515637B1 (en) | 2017-09-19 | 2019-12-24 | Amazon Technologies, Inc. | Dynamic speech processing |
JP7130201B2 (ja) | 2018-01-18 | 2022-09-05 | 株式会社ユピテル | 装置及びプログラム等 |
JP2019124855A (ja) * | 2018-01-18 | 2019-07-25 | 株式会社ユピテル | 装置及びプログラム等 |
JP2021073567A (ja) * | 2018-04-11 | 2021-05-13 | 百度在線網絡技術(北京)有限公司 | 音声制御方法、端末機器、クラウドサーバ及びシステム |
JP2018194849A (ja) * | 2018-07-12 | 2018-12-06 | パイオニア株式会社 | 情報処理装置 |
JP2020134903A (ja) * | 2019-02-26 | 2020-08-31 | コニカミノルタ株式会社 | システム、画像形成装置、方法およびプログラム |
KR102026479B1 (ko) * | 2019-03-06 | 2019-09-30 | 주식회사 다이얼로그디자인에이전시 | 병렬처리 플랫폼 기반 인공지능 음성인식 서비스 제공 시스템 |
JP2022071159A (ja) * | 2020-04-27 | 2022-05-13 | パイオニア株式会社 | 情報処理装置 |
JP2020129130A (ja) * | 2020-04-27 | 2020-08-27 | パイオニア株式会社 | 情報処理装置 |
WO2023241482A1 (zh) * | 2022-06-13 | 2023-12-21 | 华为技术有限公司 | 一种人机对话方法、设备及*** |
Also Published As
Publication number | Publication date |
---|---|
JP5658641B2 (ja) | 2015-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5658641B2 (ja) | 端末装置、音声認識プログラム、音声認識方法および音声認識システム | |
US10553216B2 (en) | System and method for an integrated, multi-modal, multi-device natural language voice services environment | |
US20210166699A1 (en) | Methods and apparatus for hybrid speech recognition processing | |
US8589161B2 (en) | System and method for an integrated, multi-modal, multi-device natural language voice services environment | |
US9619572B2 (en) | Multiple web-based content category searching in mobile search application | |
US9959863B2 (en) | Keyword detection using speaker-independent keyword models for user-designated keywords | |
US9171541B2 (en) | System and method for hybrid processing in a natural language voice services environment | |
US8762156B2 (en) | Speech recognition repair using contextual information | |
US20150073802A1 (en) | Dealing with switch latency in speech recognition | |
US20110060587A1 (en) | Command and control utilizing ancillary information in a mobile voice-to-speech application | |
US10628483B1 (en) | Entity resolution with ranking | |
US20110054894A1 (en) | Speech recognition through the collection of contact information in mobile dictation application | |
US20110054895A1 (en) | Utilizing user transmitted text to improve language model in mobile dictation application | |
US20110066634A1 (en) | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search in mobile search application | |
US20110054898A1 (en) | Multiple web-based content search user interface in mobile search application | |
US20110054899A1 (en) | Command and control utilizing content information in a mobile voice-to-speech application | |
US20110054896A1 (en) | Sending a communications header with voice recording to send metadata for use in speech recognition and formatting in mobile dictation application | |
JP2016095383A (ja) | 音声認識クライアント装置及びサーバ型音声認識装置 | |
KR20180064504A (ko) | 개인화된 엔티티 발음 학습 | |
CN116888663A (zh) | 基于部分假设的流式动作实施 | |
US10861453B1 (en) | Resource scheduling with voice controlled devices | |
US11756538B1 (en) | Lower latency speech processing | |
CN110809796B (zh) | 具有解耦唤醒短语的语音识别***和方法 | |
US11450325B1 (en) | Natural language processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141015 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5658641 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |