JP2006189730A5 - - Google Patents

Download PDF

Info

Publication number
JP2006189730A5
JP2006189730A5 JP2005003119A JP2005003119A JP2006189730A5 JP 2006189730 A5 JP2006189730 A5 JP 2006189730A5 JP 2005003119 A JP2005003119 A JP 2005003119A JP 2005003119 A JP2005003119 A JP 2005003119A JP 2006189730 A5 JP2006189730 A5 JP 2006189730A5
Authority
JP
Japan
Prior art keywords
dialog
recognition
known degree
vocabulary
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005003119A
Other languages
English (en)
Other versions
JP2006189730A (ja
JP4634156B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2005003119A priority Critical patent/JP4634156B2/ja
Priority claimed from JP2005003119A external-priority patent/JP4634156B2/ja
Publication of JP2006189730A publication Critical patent/JP2006189730A/ja
Publication of JP2006189730A5 publication Critical patent/JP2006189730A5/ja
Application granted granted Critical
Publication of JP4634156B2 publication Critical patent/JP4634156B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (15)

  1. 複数の対話状態を提示しながら、ユーザと対話を行う音声対話装置による音声対話方法であって、
    前記音声対話装置が、入力された音声認識結果を出力する音声認識ステップと、
    前記音声対話装置が有する認識語彙既知度合記憶部に記憶されている、前記複数の対話状態のそれぞれの状態において前記音声対話装置が認識できる語彙をユーザがどの程度把握しているのかを示す認識語彙既知度合を用いて、現在の対話状態における認識語彙既知度合を決定する認識語彙既知度合決定ステップと、
    前記音声認識ステップにおいて認識された前記認識結果と前記認識語彙既知度合決定ステップにおいて決定された、現在の対話状態における認識語彙既知度合とに基づいて、次の対話状態および当該対話状態における対話内容を決定する対話決定ステップと、
    前記対話決定ステップにおいて決定された対話内容を出力する出力ステップと
    を含むことを特徴とする音声対話方法。
  2. 前記対話決定ステップは、さらに、
    前記音声対話装置が、入力された音声を認識していないという認識結果であったとき、
    前記現在の対話状態における認識語彙既知度合が、所定値を満たすかどうかを判定する認識語彙既知度合判定ステップと、
    前記認識語彙既知度合判定ステップにより、前記現在の対話状態における認識語彙既知度合が所定値を満たしていると判定されるときは、音声による再入力を促すことを決定し、前記現在の対話状態における認識語彙既知度合が所定値を満たしていないと判定されるときは、前記現在の対話状態における認識語彙既知度合に基づく対話を行うことを決定する対話状態決定ステップと
    を含むことを特徴とする請求項1記載の音声対話方法。
  3. 前記認識語彙既知度合決定ステップでは、
    対象の対話状態における入力モード毎の前記認識語彙既知度合をあらかじめ格納した既知度合テーブルを用いて、前記認識語彙既知度合を決定する
    ことを特徴とする請求項1記載の音声対話方法。
  4. 前記認識語彙既知度合決定ステップでは、
    対象の対話状態における入力モード、認識語彙の変動に関する認識語彙変動情報、認識語彙の属性を示す認識語彙属性情報、全認識対象語彙数、表示認識対象語彙数、ユーザ自身の情報、ユーザのシステム使用履歴、対話進行状態、画面や応答音声による認識語彙に関する情報量の少なくとも一つを用いて、前記認識語彙既知度合を算出する
    ことを特徴とする請求項1記載の音声対話方法。
  5. 前記対話決定ステップでは、前記対話内容として対話の画面または音声応答の少なくとも1つを決定し、
    前記出力ステップでは、前記対話決定ステップにおいて決定された前記対話の画面または音声応答の少なくとも1つを出力する
    ことを特徴とする請求項1記載の音声対話方法。
  6. 前記対話決定ステップでは、前記認識語彙既知度合を示すための表示または音声応答の少なくとも1つを作成し、
    前記出力ステップでは、前記対話決定ステップにより作成された前記認識語彙既知度合を示す表示または音声応答の少なくとも1つを出力する
    ことを特徴とする請求項1記載の音声対話方法。
  7. 前記対話決定ステップでは、前記対話内容に前記音声認識ステップにおける認識対象語彙に関する説明を含めるか否かを前記認識語彙既知度合に基づいて決定する
    ことを特徴とする請求項1記載の音声対話方法。
  8. 前記対話決定ステップでは、前記音声認識ステップにおいて認識された前記認識結果を未知語と判定した場合、前記対話内容を再度入力を促す対話内容とするか、または詳細な対話内容とするかを前記認識語彙既知度合に基づいて決定する
    ことを特徴とする請求項1記載の音声対話方法。
  9. 前記対話決定ステップでは、前記再度入力を促す対話内容と決定した際、再入力回数に応じて前記音声認識ステップにおける音声認識用パラメータを変更する
    ことを特徴とする請求項記載の音声対話方法。
  10. 前記対話決定ステップでは、前記詳細な対話内容と決定した際、さらに前記認識語彙既知度合に基づいて対話内容を変更する
    ことを特徴とする請求項記載の音声対話方法。
  11. 複数の対話状態を提示しながら、情報を検索する情報検索装置による情報検索方法であって、
    前記情報検索装置が、入力された音声認識結果を出力する音声認識ステップと、
    前記情報検索装置が有する認識語彙既知度合記憶部に記憶されている、前記複数の対話状態のそれぞれの状態において前記情報検索装置が認識できる語彙をユーザがどの程度把握しているのかを示す認識語彙既知度合を用いて、現在の対話状態における認識語彙既知度合を決定する認識語彙既知度合決定ステップと、
    前記音声認識ステップにおいて認識された前記認識結果と前記認識語彙既知度合決定ステップにおいて決定された、現在の対話状態における前記認識語彙既知度合とに基づいて、次の対話状態および当該対話状態における対話内容を決定する対話決定ステップと、
    前記対話決定ステップにおいて決定された対話内容を出力する出力ステップと、
    前記出力ステップにおいて出力されている前記対話内容が情報検索を受け付ける内容である場合に、前記音声認識ステップにおいて認識された前記認識結果に基づいて情報を検索する情報検索ステップと
    を含むことを特徴とする情報検索方法。
  12. 複数の対話状態を提示しながら、ユーザと対話を行う音声対話装置であって、
    入力された音声認識結果を出力する音声認識手段と、
    前記複数の対話状態のそれぞれの状態において前記音声対話装置が認識できる語彙をユーザがどの程度把握しているのかを示す認識語彙既知度合を記憶している認識語彙既知度合記憶手段と、
    前記認識語彙既知度合記憶部に記憶されている前記認識語彙既知度合を用いて、現在の対話状態における認識語彙既知度合を決定する認識語彙既知度合決定手段と、
    前記音声認識手段で認識された前記認識結果と前記認識語彙既知度合決定手段で決定された、現在の対話状態における認識語彙既知度合とに基づいて、次の対話状態および当該対話状態における対話内容を決定する対話決定手段と、
    前記対話決定手段で決定された対話内容を出力する出力手段と
    を備えることを特徴とする音声対話装置。
  13. 複数の対話状態を提示しながら、情報を検索する情報検索装置であって、
    入力された音声認識結果を出力する音声認識手段と、
    前記複数の対話状態のそれぞれの状態において前記情報検索装置が認識できる語彙をユーザがどの程度把握しているのかを示す認識語彙既知度合を記憶している認識語彙既知度合記憶手段と、
    前記認識語彙既知度合記憶部に記憶されている前記認識語彙既知度合を用いて、現在の対話状態における認識語彙既知度合を決定する認識語彙既知度合決定手段と、
    前記音声認識手段で認識された前記認識結果と前記認識語彙既知度合決定手段で決定された、現在の対話状態における前記認識語彙既知度合とに基づいて、次の対話状態および当該対話状態における対話内容を決定する対話決定手段と、
    前記対話決定手段で決定された対話内容を出力する出力手段と、
    前記出力手段で出力されている前記対話内容が情報検索を受け付ける内容である場合に、前記音声認識手段で認識された前記認識結果に基づいて情報を検索する情報検索手段と
    を備えることを特徴とする情報検索装置。
  14. 複数の対話状態を提示しながら、ユーザと対話を行う音声対話装置のためのプログラムであって、
    前記音声対話装置が、入力された音声認識結果を出力する音声認識ステップと、
    前記音声対話装置が有する認識語彙既知度合記憶部に記憶されている、前記複数の対話状態のそれぞれの状態において前記音声対話装置が認識できる語彙をユーザがどの程度把握しているのかを示す認識語彙既知度合を用いて、現在の対話状態における認識語彙既知度合を決定する認識語彙既知度合決定ステップと、
    前記音声認識ステップにおいて認識された前記認識結果と前記認識語彙既知度合決定ステップにおいて決定された、現在の対話状態における認識語彙既知度合とに基づいて、次の対話状態および当該対話状態における対話内容を決定する対話決定ステップと、
    前記対話決定ステップにおいて決定された対話内容を出力する出力ステップとを前記音声対話装置に実行させる
    ことを特徴とするプログラム。
  15. 複数の対話状態を提示しながら、情報を検索する情報検索装置のためのプログラムであって、
    前記情報検索装置が、入力された音声認識結果を出力する音声認識ステップと、
    前記情報検索装置が有する認識語彙既知度合記憶部に記憶されている、前記複数の対話状態のそれぞれの状態において前記情報検索装置が認識できる語彙をユーザがどの程度把握しているのかを示す認識語彙既知度合を用いて、現在の対話状態における認識語彙既知度合を決定する認識語彙既知度合決定ステップと、
    前記音声認識ステップにおいて認識された前記認識結果と前記認識語彙既知度合決定ステップにおいて決定された、現在の対話状態における前記認識語彙既知度合とに基づいて、次の対話状態および当該対話状態における対話内容を決定する対話決定ステップと、
    前記対話決定ステップにおいて決定された対話内容を出力する出力ステップと、
    前記出力ステップにおいて出力されている前記対話内容が情報検索を受け付ける内容である場合に、前記音声認識ステップにおいて認識された前記認識結果に基づいて情報を検索する情報検索ステップとを前記情報検索装置に実行させる
    ことを特徴とするプログラム。
JP2005003119A 2005-01-07 2005-01-07 音声対話方法および音声対話装置 Expired - Fee Related JP4634156B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005003119A JP4634156B2 (ja) 2005-01-07 2005-01-07 音声対話方法および音声対話装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005003119A JP4634156B2 (ja) 2005-01-07 2005-01-07 音声対話方法および音声対話装置

Publications (3)

Publication Number Publication Date
JP2006189730A JP2006189730A (ja) 2006-07-20
JP2006189730A5 true JP2006189730A5 (ja) 2008-02-14
JP4634156B2 JP4634156B2 (ja) 2011-02-16

Family

ID=36796996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005003119A Expired - Fee Related JP4634156B2 (ja) 2005-01-07 2005-01-07 音声対話方法および音声対話装置

Country Status (1)

Country Link
JP (1) JP4634156B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5137853B2 (ja) * 2006-12-28 2013-02-06 三菱電機株式会社 車載用音声認識装置
JP4915665B2 (ja) * 2007-04-18 2012-04-11 パナソニック株式会社 音声認識機能付き操作器
JP2013092823A (ja) * 2011-10-24 2013-05-16 Nifty Corp 情報処理装置、プログラム及び情報検索システム
JP2016206960A (ja) * 2015-04-23 2016-12-08 日本電信電話株式会社 音声映像入出力装置
JP2017167366A (ja) * 2016-03-16 2017-09-21 Kddi株式会社 通信端末、通信方法及びプログラム
JP6628853B2 (ja) * 2018-10-09 2020-01-15 日本電信電話株式会社 音声映像追跡装置
CN110450789B (zh) * 2019-08-13 2020-12-15 广州小鹏汽车科技有限公司 一种信息处理方法和装置
CN112652301B (zh) * 2019-10-12 2023-05-12 阿里巴巴集团控股有限公司 语音处理方法和分布式***、及语音交互设备和方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001296890A (ja) * 2000-04-12 2001-10-26 Auto Network Gijutsu Kenkyusho:Kk 車載機器習熟度判定装置および車載音声出力装置
JP2003177788A (ja) * 2001-12-12 2003-06-27 Fujitsu Ltd 音声対話システムおよびその方法
JP4223832B2 (ja) * 2003-02-25 2009-02-12 富士通株式会社 適応型音声対話システム及び方法
JP4166616B2 (ja) * 2003-04-21 2008-10-15 松下電器産業株式会社 嗜好情報利用型データ検索装置
JP2004333543A (ja) * 2003-04-30 2004-11-25 Matsushita Electric Ind Co Ltd 音声対話システム及び音声対話方法

Similar Documents

Publication Publication Date Title
US11817085B2 (en) Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface
US11398236B2 (en) Intent-specific automatic speech recognition result generation
JP2006189730A5 (ja)
US10037758B2 (en) Device and method for understanding user intent
Schalkwyk et al. “Your word is my command”: Google search by voice: A case study
EP3640938B1 (en) Incremental speech input interface with real time feedback
US8731927B2 (en) Speech recognition on large lists using fragments
JP6285914B2 (ja) ユーザ定義可能な制約条件を有する省スペースの音声認識を構築する為の埋め込みシステム
JP5111607B2 (ja) 音声ベースのユーザインタフェースを介してユーザと対話するための、コンピュータによって実現される方法および装置
US8165886B1 (en) Speech interface system and method for control and interaction with applications on a computing system
WO2018000278A1 (zh) 一种基于状态机上下文敏感多轮对话管理***及方法
US9298811B2 (en) Automated confirmation and disambiguation modules in voice applications
US20160078773A1 (en) System and method of providing task-based solicitation of request related user inputs
JP2001034293A (ja) 音声を転写するための方法及び装置
US8909528B2 (en) Method and system for prompt construction for selection from a list of acoustically confusable items in spoken dialog systems
US9922650B1 (en) Intent-specific automatic speech recognition result generation
EP3593346A1 (en) Graphical data selection and presentation of digital content
JP2016001242A (ja) 質問文生成方法、装置、及びプログラム
JP4634156B2 (ja) 音声対話方法および音声対話装置
CN112346697A (zh) 一种对设备进行控制的方法、装置和存储介质
JP2006243673A5 (ja)
US10140981B1 (en) Dynamic arc weights in speech recognition models
JP6772916B2 (ja) 対話装置および対話方法
JP6746886B2 (ja) 学習支援装置及びその学習支援装置用のプログラム
Kessens et al. A bottom-up method for obtaining information about pronunciation variation