JP6526399B2 - 音声対話装置、音声対話装置の制御方法、および制御プログラム - Google Patents
音声対話装置、音声対話装置の制御方法、および制御プログラム Download PDFInfo
- Publication number
- JP6526399B2 JP6526399B2 JP2014184561A JP2014184561A JP6526399B2 JP 6526399 B2 JP6526399 B2 JP 6526399B2 JP 2014184561 A JP2014184561 A JP 2014184561A JP 2014184561 A JP2014184561 A JP 2014184561A JP 6526399 B2 JP6526399 B2 JP 6526399B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- answer
- option
- options
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Description
(音声対話装置1の構成)
図1は、本発明の一実施形態に係る音声対話装置の要部構成を示すブロック図である。音声対話装置1(音声対話システム)は、制御部2、音声入力部3、音声出力部4、および記憶部5を備える。ここでは、音声対話装置1は、ユーザと音声によってコミュニケーションを行うロボットである。このロボットは、ユーザに対して質問をし、質問に対する回答を蓄積することで、ユーザの嗜好等を学習する。これにより、ロボットは、学習した内容に応じた動作または音声対話を行うことができる。
図2は、音声対話装置1における音声対話の処理フローを示す図である。ここでは、音声対話装置1が、複数の選択肢から1つの選択肢をユーザに選択させる質問を行う場合について説明する。ここでは、1つの発話内容に含まれる選択肢の数の上限は「3」と設定されているとする。また、質問に対する選択肢は8個あるとする。もちろん、上記上限は任意の数でよい。
図3は、音声対話装置1とユーザとの対話例を示す図である。本図では、選択肢の読み上げに関する対話例が示されている。
図4は、音声対話装置1とユーザとの対話例(ユーザの回答例)を示す図である。
図7は、音声対話装置1とユーザとの対話例を示す図である。ここでは簡単のために選択肢の総数は3個としており、残りの選択肢の個数は0個であるので、ユーザへの通知を省略している。もちろん、上述の例のように、選択肢の総数が上限の3個を超えていてもよい。本図では、質問としてクイズが出題されている。
図8は、音声対話装置1とユーザとの対話例を示す図である。ある選択肢の内容「キャンセル」は、質問の中止を指示するコマンドに対応するキーワード「キャンセル」と一致している。このように選択肢の内容とコマンドを表すキーワードとが一致または類似している場合、ユーザがいずれを回答したのか判断が難しい。(A)このような場合、音声対話装置1は、「選択肢1の『キャンセル』」か、「回答をキャンセルする」(音声コマンドが指定された)か、ユーザがいずれを意図したのかを質問する。
図9は、音声対話装置1とユーザとの対話例を示す図である。音声対話装置1は、ユーザの回答「よん」が選択肢群のいずれかに対応するかを判定する。ここでは、ユーザの回答「よん」は、選択肢群のいずれの選択肢にも対応しない。ユーザの回答「よん」は「4番目」と解釈することができるが、提示した選択肢は1〜3番目までであり、未読の選択肢をユーザが順番で指定することは考えにくい。また、ユーザの回答「よん」はコマンドを意味するいずれのキーワードにも対応しない。
上述したように、音声入力部3、音声出力部4、音声認識部11、回答解釈部12、発話内容生成部13および記憶部5のそれぞれは、互いに通信を行う異なる複数の装置に搭載されていてもよい。例えば、電話の自動音声応答装置は、実際に音の入出力を行うのはユーザ側の電話機であり、自動音声応答装置は、電話機と電話回線で接続される。本発明の一態様に係る自動音声応答装置は、ユーザの電話機に対して、発話内容および回答に関する音声信号を送受信する。音声入力部3および音声出力部4は、外部に対して音声信号を入出力するものであってもよい。
音声対話装置1の制御ブロック(特に音声入力部3、音声出力部4、音声認識部11、回答解釈部12、発話内容生成部13)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
本発明の態様1に係る音声対話装置(1)は、質問に対してユーザに選択させる複数の選択肢を含む選択肢群のうち、一部の選択肢を発話内容に含ませ、さらに上記選択肢群のうちの残りの選択肢の個数を上記発話内容に含ませる発話内容生成手段(発話内容生成部13)と、音声によるユーザの回答から、いずれの選択肢が選択されたのかを判定する回答判定手段(回答解釈部12)とを備える。
2 制御部
3 音声入力部
4 音声出力部
5 記憶部
11 音声認識部
12 回答解釈部(回答判定手段)
13 発話内容生成部(発話内容生成手段)
Claims (10)
- 質問に対してユーザに選択させる複数の選択肢を含む選択肢群のうち、一部の選択肢を発話内容に含ませ、さらに上記選択肢群のうちの残りの選択肢の個数を上記発話内容に含ませる発話内容生成手段と、
音声によるユーザの回答から、いずれの選択肢が選択されたのかを判定する回答判定手段とを備え、
上記回答判定手段は、所定のキーワードを示すユーザの回答を、所定のコマンドを指定する回答であると判定し、
上記発話内容生成手段は、上記所定のコマンドに対応した所定の処理を行い、
ユーザの回答が選択肢の内容および上記所定のコマンドの両方を示しうる言葉である場合、上記発話内容生成手段は、ユーザの回答が上記所定のコマンドを示していたのか、上記選択肢の内容を示していたのかを質問する発話内容を生成することを特徴とする音声対話装置。 - 質問に対してユーザに選択させる複数の選択肢を含む選択肢群のうち、一部の選択肢を発話内容に含ませ、さらに上記選択肢群のうちの残りの選択肢の個数を上記発話内容に含ませる発話内容生成手段と、
音声によるユーザの回答から、いずれの選択肢が選択されたのかを判定する回答判定手段とを備え、
上記回答判定手段は、ユーザの回答が既に提示された選択肢を示す場合だけでなく未だ提示されていない選択肢を示す場合であっても、該ユーザの回答は未だ提示されていない上記選択肢を指定する回答であると判定することを特徴とする音声対話装置。 - 上記回答判定手段は、ユーザの回答が順番を示す言葉である場合、該ユーザの回答は該順番の選択肢を指定する回答であると判定することを特徴とする請求項1または2に記載の音声対話装置。
- ユーザの回答が順番および選択肢の内容の両方を示す言葉である場合、上記発話内容生成手段は、ユーザの回答が上記順番を示していたのか、上記選択肢の内容を示していたのかを問い合わせる発話内容を生成することを特徴とする請求項3に記載の音声対話装置。
- 上記発話内容生成手段は、上記所定のコマンドに応じて、ユーザへの質問を中止する、または、残りの選択肢のうちの一部の選択肢を次の発話内容に含ませることを特徴とする請求項1に記載の音声対話装置。
- 上記発話内容生成手段は、一度に提示する選択肢の言葉の長さが所定の長さ以下に収まるように、1つの上記発話内容に含まれる選択肢の数を変更することを特徴とする請求項1から5のいずれか一項に記載の音声対話装置。
- 請求項1から6のいずれか一項に記載の音声対話装置としてコンピュータを機能させるための制御プログラムであって、コンピュータを上記各手段として機能させるための制御プログラム。
- 音声出力される発話内容を自動で生成する発話内容生成ステップであって、質問に対してユーザに選択させる複数の選択肢を含む選択肢群のうち、一部の選択肢を上記発話内容に含ませ、さらに上記選択肢群のうちの残りの選択肢の個数を上記発話内容に含ませる発話内容生成ステップと、
音声によるユーザの回答から、いずれの選択肢が選択されたのかを判定する回答判定ステップとを含み、
上記回答判定ステップにおいて、所定のキーワードを示すユーザの回答を、所定のコマンドを指定する回答であると判定し、
上記所定のコマンドに対応した所定の処理を行う、処理ステップをさらに含み、
ユーザの回答が選択肢の内容および上記所定のコマンドの両方を示しうる言葉である場合、上記処理ステップにおいて、ユーザの回答が上記所定のコマンドを示していたのか、上記選択肢の内容を示していたのかを質問する発話内容を生成することを特徴とする音声対話装置の制御方法。 - 上記処理ステップにおいて、上記所定のコマンドに応じて、ユーザへの質問を中止する、または、残りの選択肢のうちの一部の選択肢を次の発話内容に含ませることを特徴とする請求項8に記載の音声対話装置の制御方法。
- 音声出力される発話内容を自動で生成する発話内容生成ステップであって、質問に対してユーザに選択させる複数の選択肢を含む選択肢群のうち、一部の選択肢を上記発話内容に含ませ、さらに上記選択肢群のうちの残りの選択肢の個数を上記発話内容に含ませる発話内容生成ステップと、
音声によるユーザの回答から、いずれの選択肢が選択されたのかを判定する回答判定ステップとを含み、
上記回答判定ステップにおいて、ユーザの回答が既に提示された選択肢を示す場合だけでなく未だ提示されていない選択肢を示す場合であっても、該ユーザの回答は未だ提示されていない上記選択肢を指定する回答であると判定することを特徴とする音声対話装置の制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014184561A JP6526399B2 (ja) | 2014-09-10 | 2014-09-10 | 音声対話装置、音声対話装置の制御方法、および制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014184561A JP6526399B2 (ja) | 2014-09-10 | 2014-09-10 | 音声対話装置、音声対話装置の制御方法、および制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016057508A JP2016057508A (ja) | 2016-04-21 |
JP6526399B2 true JP6526399B2 (ja) | 2019-06-05 |
Family
ID=55758362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014184561A Active JP6526399B2 (ja) | 2014-09-10 | 2014-09-10 | 音声対話装置、音声対話装置の制御方法、および制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6526399B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6748510B2 (ja) * | 2016-08-04 | 2020-09-02 | 株式会社三菱Ufj銀行 | 情報提供システム、情報提供方法、および情報提供プログラム |
JP2019086903A (ja) | 2017-11-02 | 2019-06-06 | 東芝映像ソリューション株式会社 | 音声対話端末、および音声対話端末制御方法 |
CN109561225A (zh) * | 2018-12-04 | 2019-04-02 | 合肥天骋电子商务有限公司 | 一种智能语音导航集中*** |
JP7319504B2 (ja) * | 2019-01-30 | 2023-08-02 | 株式会社東芝 | 対話システム、対話方法、プログラム、及び記憶媒体 |
CN111590610A (zh) * | 2020-04-30 | 2020-08-28 | 南京智音云数字科技有限公司 | 一种新型智能对话机器人控制***及其方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0792987A (ja) * | 1993-09-21 | 1995-04-07 | Nippon Telegr & Teleph Corp <Ntt> | 質問文内容構成方式 |
JPH11153998A (ja) * | 1997-11-19 | 1999-06-08 | Canon Inc | 音声応答装置及びその方法、コンピュータ可読メモリ |
JPH11265196A (ja) * | 1998-03-16 | 1999-09-28 | Ricoh Co Ltd | 音声出力装置 |
JP3818352B2 (ja) * | 1998-12-25 | 2006-09-06 | アイシン・エィ・ダブリュ株式会社 | ナビゲーション装置及び記憶媒体 |
JP2001215995A (ja) * | 2000-02-04 | 2001-08-10 | Toyota Motor Corp | 音声認識装置 |
JP4137399B2 (ja) * | 2001-03-30 | 2008-08-20 | アルパイン株式会社 | 音声検索装置 |
JP4004839B2 (ja) * | 2002-04-15 | 2007-11-07 | 株式会社東芝 | 通信装置及びネットワークシステム |
JP4012143B2 (ja) * | 2003-12-16 | 2007-11-21 | キヤノン株式会社 | 情報処理装置およびデータ入力方法 |
JP2009282835A (ja) * | 2008-05-23 | 2009-12-03 | Toshiba Corp | 音声検索装置及びその方法 |
JP5378907B2 (ja) * | 2009-08-07 | 2013-12-25 | 株式会社豊田中央研究所 | 音声対話装置及び音声対話プログラム |
JP2011253304A (ja) * | 2010-06-01 | 2011-12-15 | Aisin Aw Co Ltd | 入力装置、入力方法、及び入力プログラム |
-
2014
- 2014-09-10 JP JP2014184561A patent/JP6526399B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016057508A (ja) | 2016-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6526399B2 (ja) | 音声対話装置、音声対話装置の制御方法、および制御プログラム | |
US10991374B2 (en) | Request-response procedure based voice control method, voice control device and computer readable storage medium | |
US9619202B1 (en) | Voice command-driven database | |
JP5753869B2 (ja) | 音声認識端末およびコンピュータ端末を用いる音声認識方法 | |
CN111933108B (zh) | 一种智能网联终端智能语音交互***自动化测试方法 | |
KR20190046631A (ko) | 자연어 프로세싱을 위한 시스템 및 방법 | |
US20080033724A1 (en) | Method for generating a context-based voice dialogue output in a voice dialog system | |
US20180033427A1 (en) | Speech recognition transformation system | |
CN109712610A (zh) | 用于识别语音的方法和装置 | |
US20190333514A1 (en) | Method and apparatus for dialoguing based on a mood of a user | |
KR102483833B1 (ko) | 등록된 사용자에 의한 인증을 통해 새로운 사용자를 등록하기 위한 전자 장치 및 방법 | |
JP4491438B2 (ja) | 音声対話装置、音声対話方法、およびプログラム | |
CN110660393B (zh) | 语音交互方法、装置、设备及存储介质 | |
KR20210066651A (ko) | 전자 장치 및 이의 제어 방법 | |
JP2017211610A (ja) | 出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム | |
JP6929960B2 (ja) | 情報処理装置及び情報処理方法 | |
JP7448240B2 (ja) | 効率的な対話構成 | |
US20220319516A1 (en) | Conversation method, conversation system, conversation apparatus, and program | |
KR20210054246A (ko) | 전자장치 및 그 제어방법 | |
JP6359327B2 (ja) | 情報処理装置および制御プログラム | |
KR20210059367A (ko) | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 | |
US10505879B2 (en) | Communication support device, communication support method, and computer program product | |
EP3839719B1 (en) | Computing device and method of operating the same | |
CN109597657A (zh) | 针对目标应用的操作方法、装置及计算设备 | |
KR20210044606A (ko) | 웨이크업 모델 생성 방법 및 이를 위한 전자 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180227 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180925 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190508 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6526399 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |