JPWO2017212689A1 - 応答装置および応答装置の制御方法、制御プログラム - Google Patents

応答装置および応答装置の制御方法、制御プログラム Download PDF

Info

Publication number
JPWO2017212689A1
JPWO2017212689A1 JP2018522313A JP2018522313A JPWO2017212689A1 JP WO2017212689 A1 JPWO2017212689 A1 JP WO2017212689A1 JP 2018522313 A JP2018522313 A JP 2018522313A JP 2018522313 A JP2018522313 A JP 2018522313A JP WO2017212689 A1 JPWO2017212689 A1 JP WO2017212689A1
Authority
JP
Japan
Prior art keywords
phrase
word
response message
input
concept
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018522313A
Other languages
English (en)
Other versions
JP6644141B2 (ja
Inventor
慎哉 佐藤
慎哉 佐藤
和典 森下
和典 森下
弘康 伊神
弘康 伊神
直起 江角
直起 江角
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPWO2017212689A1 publication Critical patent/JPWO2017212689A1/ja
Application granted granted Critical
Publication of JP6644141B2 publication Critical patent/JP6644141B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Manipulator (AREA)
  • Toys (AREA)

Abstract

適合する会話シナリオが見つからない場合であっても、入力内容に含まれる語句に基づいて応答メッセージを生成する。応答装置(1)は、第1語句と第1関連語句、および第2語句と第2関連語句の関連を記憶している記憶部(13)と、上記第1語句または上記第2語句が入力内容に含まれている場合、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成する応答メッセージ生成部(26)とを備える。

Description

本発明は入力内容を認識し、認識した内容に基づいて応答する応答装置に関する。
ユーザの発話を受けると、該発話から入力内容を認識し、認識した結果に応じて応答する応答装置が従来技術として知られている。例えば、下記の特許文献1には、ユーザとの会話を成立させることが可能な装置である自動会話装置に用いられる会話シナリオを生成及び編集する会話シナリオ編集装置が開示されている。
日本国公開特許公報「特開2010−73192号」(2010年4月2日公開)
しかしながら、上述のような従来技術は、認識した結果について、予め用意していた会話シナリオに基づいて応答する構成であるが、シナリオの数には限りがある。そのため、認識した結果に適合する会話シナリオが見つからない場合は、予め<その他>に規定された内容しか応答できない。さらに、シナリオの数が少ないと、応答内容が似通ってしまい、退屈な会話になるという問題がある。
本発明は、前記の問題点に鑑みてなされたものであり、その目的は、入力内容に適合する会話シナリオが見つからないような場合であっても、入力内容に含まれる語句に基づいて応答メッセージを生成する応答装置を実現することにある。
上記の課題を解決するために、本発明の一態様に係る応答装置は、ユーザが入力した入力内容について応答メッセージを出力する応答装置であって、第1語句と第1関連語句とが互いに関連していること、および、第2語句と第2関連語句とが互いに関連していることを記憶している記憶部と、上記入力内容に対する応答メッセージを生成する応答メッセージ生成部とを備え、上記第1語句または上記第2語句が上記入力内容に含まれており、上記記憶部が、上記第2語句と上記第1関連語句とが互いに関連していること、または、上記第1語句と上記第2語句とが同じ概念に属することを記憶している場合、上記応答メッセージ生成部は、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成する。
また、上記の課題を解決するために、本発明の一態様に係る応答装置の制御方法は、ユーザが入力した入力内容について応答メッセージを出力する応答装置の制御方法であって、上記応答装置は、第1語句と第1関連語句とが互いに関連していること、および、第2語句と第2関連語句とが互いに関連していることを記憶している記憶部を備え、上記入力内容に含まれている上記第1語句または上記第2語句に関する記憶を上記記憶部から探す探索ステップと、上記入力内容に対する応答メッセージを生成する応答メッセージ生成ステップとを含み、上記第1語句または上記第2語句が上記入力内容に含まれており、上記記憶部が、上記第2語句と上記第1関連語句とが互いに関連していること、または、上記第1語句と上記第2語句とが同じ概念に属することを記憶している場合、上記応答メッセージ生成ステップでは、上記第1語句と上記第2関連語句とを互いに関連付けた内容の応答メッセージを生成する。
本発明の一態様によれば、入力内容に適合する会話シナリオが見つからないような場合であっても、入力内容に含まれる語句に基づいて応答メッセージを生成する応答装置を実現するという効果を奏する。
本発明の実施形態1に係るロボット1の要部構成の一例を示すブロック図である。 本発明の実施形態1に係るロボット1が記憶部に備える語句情報の一例である。 本発明の実施形態1に係るロボット1が記憶部に備える入出力履歴の一例を示す図である。 本発明の実施形態1に係るロボット1が記憶部に備える応答メッセージのテンプレートの一例およびテンプレートを用いた例文を示す。 本発明の実施形態1に係るロボット1が推論によって応答メッセージを生成するイメージを示す図である。 本発明の実施形態1に係るロボット1が推論によって応答メッセージを生成する別のイメージを示す図である。 本発明の実施形態1に係るロボット1が実行する処理の一例を示すフローチャートである。 本発明の実施形態2に係るロボット1が推論によって応答メッセージを生成する別のイメージを示す図である。 本発明の実施形態2に係るロボット1が推論によって応答メッセージを生成する別のイメージを示す図である。
〔実施形態1〕
以下、本発明の実施の形態について、図1〜7を用いて詳細に説明する。
<ロボットの構成>
図1に基づいて本実施形態に係るロボット1の概要を説明する。なお、本実施形態に係るロボット1は、ユーザが発話によって入力した入力内容について応答メッセージを出力する応答装置である。図1は、本実施形態に係るロボット1の要部構成の一例を示すブロック図である。図1に示すように、ロボット1は、音声入力部11、音声出力部12、記憶部13、および制御部20を備えている。音声入力部11は、ユーザの発話を検出するものである。音声入力部11は具体的には、マイク等の集音装置であればよい。音声入力部11は検出したユーザの発話を音声データとして後述する音声認識部21に送る。なお、音声入力部11は、ユーザの発話の間(音声を発していない時間)などから1回の発話(1まとまりの文または文章となる発話)を特定し、当該1回の発話毎の音声データを音声認識部21に送信することが望ましい。音声出力部12は、後述する音声合成部27から受信した音声データを音声として外部に出力する出力部として機能する。音声出力部12は具体的にはロボット1に備えられたスピーカ等で実現される。なお、図1の例では音声出力部12はロボット1に内蔵されているが、音声出力部12はロボット1に取付けられた外部装置であっても構わない。記憶部13は、ロボット1にて扱われる各種データを記憶する。本実施形態に係る記憶部13は、後述する語句情報、入出力履歴、応答メッセージのテンプレートを少なくとも記憶している。
<記憶部が記憶するデータの例>
本実施形態において記憶部13が記憶するデータの一例を、図2〜4に基づいて説明する。図2は、本実施形態に係るロボット1が記憶部13に記憶している語句情報の一例であり、図3は、本実施形態に係るロボット1が記憶部13に記憶している入出力履歴の一例である。図4は、本発明の実施形態1に係るロボット1が記憶部13に記憶している応答メッセージのテンプレートの一例およびテンプレートを用いた例文を示す。
図2の例において、記憶部13が記憶している語句情報は語句が属する属性および他の語句との関連性を管理するものであり、語句、概念、関連語句の項目を備え、概念はさらに、品詞、分類、利用状況を備えている。図示の例において、語句は「リンゴ」、「大阪」等の名詞だけでなく、「甘い」、「丸い」等の形容詞や、「買う」という動詞を含む、単体で意味を備える言葉を示し、助詞等その語句のみでは意味をなさない語句は含まれない。品詞は、「名詞」、「形容詞」、「動詞」等の、各語句が属する品詞の種類を示す。分類は、「果物」、「国内地域」等の、各語句が属するより広いカテゴリーを示す。利用状況は、「What(何が)」、「Where(どこが)」等の、各語句が用いられるべき状況を示す。つまり、応答メッセージ生成部26は、複数の語句について、概念(品詞、分類、利用状況)の組み合わせが同一である場合、それらの語句は同じ概念に属すると判断できる。関連語句は、各語句について、該語句と互いに関連しており、該語句および応答メッセージのテンプレートの少なくともいずれかと組み合わせて応答メッセージを構成することができる別の語句を示す。すなわち、記憶部13は、それぞれの語句は、関連語句を介して、語句同士が互いに関連していることを記憶している。図示の例では、「リンゴ」の関連語句は「甘い」であるため、これらを組み合わせて応答メッセージ「リンゴは甘い」を構成することができる。
図3の例において、記憶部13が備える入出力履歴はロボット1の入出力に関する履歴情報を管理するものであり、番号、日時、入出力、内容、使用語句の項目を備えている。番号はユーザの入力内容およびロボット1の出力内容を時系列に沿って管理するものであり、日時はユーザまたはロボット1による入出力がなされた日時を記録する。入出力は、該履歴情報がユーザまたはロボット1のいずれによるものかを示し、図示の例では「入力」がユーザの入力を、「出力」がロボットの出力をそれぞれ示す。内容は、ユーザまたはロボット1による入出力内容を示す。使用語句は、ユーザまたはロボット1による入出力内容に含まれていた語句を示す。なお、図示の例では使用語句1〜3の3つまで語句を記録する構成となっているが、これに限定される必要はない。
図4は、記憶部13が備える応答メッセージのテンプレートとその概要、そしてテンプレートを用いた例文を示す。なお、図示の例において、記憶部13は少なくともテンプレートの項目のみを記憶すればよく、概要および例文の項目は記憶しなくてもよい。テンプレートは、ロボット1が選択し、語句と組み合わせて応答メッセージを構成するための文章の雛形であり、図示の例において、語句を組み込む箇所は[A]および[B]として記載されている。例えば、1つ目のテンプレートである「[A]は[B]よね ってなんでやねん」では、[A]および[B]がそれぞれ語句に置換されることによって、応答メッセージが構成される。概要は、テンプレートが対応する、応答メッセージの内容を示す。図示の例では、テンプレート「[A]は[B]よね ってなんでやねん」の概要は「ジョーク」である。例文は、ユーザの入力内容から取得した語句を、それぞれのテンプレートに組み合わせた場合の応答メッセージの例を示す。なお、図示の例において、[A]に置換される語句は「金閣寺」であり、[B]に置換される語句は「甘い」である。このとき、図示の例からわかるように、テンプレートは、[A]に置換される語句と[B]に置換される語句とがどのような関連性で関連しているかという情報を含む。例えば、関連性は、語順または助詞等によって表される。また、複数のテンプレートの中に当てはまる定型文がなければ、ロボット1は図の末尾に記載されている「ボクの聞き方が悪かったのかな」という文言を応答メッセージとして生成してもよい。
制御部20は、ロボット1の各部を統括して制御するものであり、音声認識部21、語句・概念取得部22、シナリオ部23、概念判定部24、関連語句取得部25、応答メッセージ生成部26、および音声合成部27を備えている。
音声認識部21は、音声入力部11から受信した、1回の発話の音声データについて音声認識を行う。なお、本発明において「音声認識」とは、発話の音声データから発話内容(入力内容)を示すテキストデータを得る処理を示す。音声認識部21の音声認識の方法は特に限定されず、従来あるいずれの方法を用いて音声認識を行ってもよい。
語句・概念取得部22は、音声認識部21が音声認識により得たテキストデータを受け付けると、該テキストデータを語句に区切り、区切られた各語句の概念を記憶部13より取得する。また、語句・概念取得部22は、区切られた語句の中から後述する第1語句(または第2語句)と、第1関連語句(または第2関連語句)を設定する。さらに、語句・概念取得部22は、区切られた各語句が、図2の語句情報の中に存在しない場合は、該語句を新たに語句情報に登録してもよい。そして、区切られた語句の1つが区切られた別の語句の関連語句として登録されていない場合は、該語句を別の語句の関連語句として登録してもよい。
シナリオ部23は、記憶部13に記憶されたシナリオ情報のうち、語句・概念取得部22が取得した語句および語句の概念に対応するシナリオ情報を取得する。
概念判定部24は、語句・概念取得部22が取得した語句の概念について、記憶部13より取得した、ロボット1の直前の出力内容に含まれていた語句の概念と同じであるか否かを判定する。すなわち、概念判定部24は、ユーザによる入力内容が、入力される直前に出力された応答メッセージに応じた内容であるか否かを判定する。
関連語句取得部25は、語句・概念取得部22が取得した語句および語句の概念に基づいて、該語句と関連性があり、該語句とは別の語句である関連語句を図2の語句情報から取得する。また、関連語句取得部25は、取得した関連語句を、後述する推論に用いるための語句に設定する。ここで、関連語句取得部25が関連語句を取得するための条件はどのようなものであってもよい。例えば、特定の語句について、図2の語句情報において関連語句として登録されている語句をすべて取得してもよいし、入力内容に含まれていない語句のみを取得してもよいし、語句の概念(品詞)が「名詞」である語句を優先して取得してもよい。
応答メッセージ生成部26は、各部からの指示内容に基づいて、ユーザの入力内容に応じてロボット1が出力する応答メッセージとなるテキストデータを生成する。具体的には、語句・概念取得部22が取得した語句、および関連語句取得部25が取得した関連語句の少なくともいずれかと、記憶部13が記憶するテンプレート、履歴情報、およびシナリオ部23が取得したシナリオ情報のいずれかとを必要に応じて組み合わせて、テキストデータを生成する。ここで、応答メッセージ生成部26は、関連語句取得部25が取得した関連語句が複数であった場合は、所定の条件にしたがって特定の関連語句を抽出する構成であってもよい。たとえば、応答メッセージ生成部26は、語句・概念取得部22が取得した語句と同じ概念に属する関連語句を優先的に抽出し、これらの語句を互いに関連付けた内容の応答メッセージを生成する構成であってもよい。なお、応答メッセージ生成部26は応答メッセージとなるテキストデータを生成する構成であればどのようなものであってもよい。例えば、語句・概念取得部22のように、上記応答メッセージ生成部26は、ユーザの入力内容に含まれる複数の語句について、各語句が属する概念および各語句の前後の語句を含む文脈情報に基づいて上記入力語句を選択する構成をさらに備えてもよい。ここで、文脈情報とは、語句が入力内容における主語、述語、その他のいずれに分類されるかを示す情報である。例えば、応答メッセージ生成部26は、概念(分類)が固有名詞に属する語句、および入力内容において述語である語句を入力語句として優先的に選択する構成であってもよい。
音声合成部27は、応答メッセージ生成部26から受信した応答メッセージのテキストデータを音声データに変換する。音声合成部27は、変換した音声データを音声出力部12に出力する。
<ロボットの動作>
図5に基づいて、本実施形態に係るロボット1の動作の概要について説明する。図5は、本実施形態に係るロボット1が推論によって応答メッセージを生成するイメージを示す。なお、以下の説明において、ユーザはロボット1に対して「リンゴは甘い」と発話による入力を行ったものとする。
まず、ユーザがロボット1に対して「リンゴは甘い」と発話すると、ロボット1は該発話を音声認識によってテキストデータに変換し、該テキストデータを語句に区切る。すなわち、「リンゴは甘い」であれば、「リンゴ」、「は」、および「甘い」の3つの語句に区切られる。このとき、ロボット1は、区切られた各語句について、図2の語句情報に登録または更新してもよい。
次に、ロボット1は、区切られた語句の中から、推論の起点となる語句を選択し、第1語句(または第2語句)に設定する。ここで、第1語句(または第2語句)は、ユーザの入力内容を特徴づける語句である、入力語句である。なお、第1語句(または第2語句)は、図2で示した語句情報と同じように、単体で意味を備える言葉であれば、どの語句を設定してもよく、所定の優先度にしたがって設定することが好適である。例えば、述語である語句が名詞を含む場合は、これを第1語句(または第2語句)に設定し、含まない場合は主語である名詞を第1語句(または第2語句)に設定する構成であってもよい。また、主語にも述語にも名詞が含まれない場合は、適当な語句を第1語句(または第2語句)に設定する構成であってもよい。上述の例によれば、「リンゴ」、「は」、および「甘い」のうち、述語である「甘い」は形容詞であり、主語である「リンゴ」は名詞であるため、この場合、「リンゴ」を第1語句(または第2語句)に設定する。さらに、第1語句(または第2語句)に設定されなかった語句の中から、第1語句(または第2語句)と互いに関連していると認められる語句について、第1関連語句(または第2関連語句)に設定する。上述の例によれば、「甘い」を第1関連語句(または第2関連語句)に設定する。
第1語句(または第2語句)および第1関連語句(または第2関連語句)を設定した後、ロボット1は、図2の語句情報にしたがって、第1関連語句(または第2関連語句)の関連語句である、第2語句(または第1語句)を取得し、設定する。上述の例によれば、第1関連語句(または第2関連語句)である「甘い」の関連語句は、「リンゴ」、および「メロン」であり、「リンゴ」は第1語句(または第2語句)に設定済みである。したがって、ここでは「メロン」を第2語句(または第1語句)に設定する。
第2語句(または第1語句)を設定すると、ロボット1は、図2の語句情報にしたがって、第2語句(または第1語句)の関連語句である、第2関連語句(または第1関連語句)を取得し、設定する。なお、第2関連語句(または第1関連語句)は、その概念(利用状況)が「How(どのように)」であることが好適である。なぜならば、第2関連語句(または第1関連語句)の概念が「How(どのように)」でない場合、第2語句(または第1語句)と組み合わせたときに自然な文章とならないことが多いためである。上述の例によれば、第2語句(または第1語句)である「メロン」の関連語句は、「甘い」、「丸い」、および「買う」である。ここで、「甘い」は第1関連語句(または第2関連語句)に設定済みであるため、残る「丸い」、または「買う」が第2関連語句(または第1関連語句)として設定可能である。このとき、図2の語句情報を用いて「丸い」および「買う」を比較すると、「丸い」の概念(利用状況)が「How(どのように)」であり、「買うの」の概念(利用状況)は「−」である。この場合、ロボット1は、「丸い」を第2関連語句(または第1関連語句)に設定する。
そして、ロボット1(応答メッセージ生成部26)は、後述する図7のS23のように、これまでの処理によって取得した、第1語句(または第2語句)および第2関連語句(または第1関連語句)から応答メッセージを生成する。
応答メッセージを生成する方法の一例について以下に説明する。以下の例において、図2の語句情報は、助詞等その語句のみでは意味をなさない語句も記憶する。具体的には、図2の語句情報は、「は」という語句を記憶している。このとき、「は」という語句の概念(品詞、分類、利用状況)の組み合わせは(助詞、−、−)であり、関連語句は「リンゴ」、「メロン」、「甘い」、および「丸い」である。上述の例において、第1語句(または第2語句)は「リンゴ」であり、第2関連語句(または第1関連語句)は「丸い」である。また、第2語句(または第1語句)は「メロン」である。したがって、ロボット1は、「リンゴ」および「丸い」を用い、さらに「リンゴ」と「メロン」の両方を関連語句に持つ助詞「は」と組み合わせて「リンゴは丸い」を応答メッセージとして生成する。このようにして、ロボット1は、入力内容に含まれる語句に基づいて、推論によって応答メッセージを生成することができる。
なお、応答メッセージを生成する構成は、上記の内容に限定されることはない。応答メッセージを生成する構成の別の例について以下に説明する。まず、ロボット1は、第2語句(または第1語句)および第2関連語句(または第1関連語句)を取得すると、図3で示した入出力履歴の中から、これらの語句を含む履歴情報を取得する。履歴情報は、第2語句(または第1語句)と第2関連語句(または第1関連語句)とがどのような関連性で関連しているかという情報を含む。例えば、関連性は、語順または助詞等によって表される。上述の例によれば、「内容」が「メロンは丸いです」である履歴情報を取得する。そして、ロボット1(応答メッセージ生成部26)は、履歴情報の「内容」に含まれる第2語句(または第1語句)を、第1語句(または第2語句)に置換することにより、応答メッセージを生成する。すなわち、上述の例では、「リンゴは丸いです」を応答メッセージとして生成する。入出力履歴の「内容」を用いることにより、ロボット1は、応答メッセージにおける各語句の語順を適切に決定し、助詞等その語句のみでは意味をなさない語句を適切に組み合わせることができる。なお、記憶部13は、複数の語句の間の関連性(複数の語句の間の語順および/または助詞等)の情報を履歴情報とは別に記憶していてもよい。
なお、第2語句(または第1語句)が見つからない場合、ロボット1(応答メッセージ生成部26)は、後述する図7のS24のように、第1関連語句(または第2関連語句)、および図4のテンプレートから応答メッセージを生成する構成であってもよい。上述の例において、例えば、テンプレートが「[A]と言えば他に何があるのかな」である場合、第1関連語句(または第2関連語句)である「甘い」と組み合わせた「甘いと言えば他に何があるのかな」を応答メッセージとして生成する。このとき、応答メッセージに対するユーザの入力内容には、第1関連語句(または第2関連語句)に関連付けられた第2語句(または第1語句)が含まれることが期待される。したがって、ロボット1は、応答メッセージに対するユーザの入力内容から取得した語句について、応答メッセージに用いた第1関連語句(または第2関連語句)の関連語句として、図2の語句情報に登録する構成であってもよい。上記の構成によれば、応答メッセージに対するユーザの入力内容から関連語句を取得することが可能となるため、ロボット1の利便性を向上させることができる。
さらに、ロボット1は、ユーザの入力内容が対話の流れを無視したものである場合は、後述する図7のS26のように、第1語句および図4のテンプレートから別の応答メッセージを生成する構成であってもよい。このとき、ロボット1は、ユーザの入力内容と対話の流れとを比較できるのであればどのような構成を備えてもよい。例えば、ロボット1(概念判定部24)は、ユーザの入力の直前にロボット1が出力した内容を図3の入出力履歴より取得し、該履歴に含まれる語句を第3語句とする。このとき、ロボット1は、図2で示した語句情報を用いて第3語句が属する概念と第1語句(または第2語句)が属する概念とが同じであるか否かを判定し、異なる場合は対話の流れを無視した入力が行われたと判定してもよい。このとき、ロボット1は、例えば第1語句(または第2語句)を、第3語句に関連するテンプレートに組み合わせた別の応答メッセージを生成してもよい。ロボット1が「リンゴは甘いです」と発話した後にユーザが「京都と言えば金閣寺だね」と発話した場合、第1語句(または第2語句)である「金閣寺」の概念(分類)は「国内地域」である一方、第3語句である「リンゴ」は「果物」であり、概念(分類)が異なる。
このとき、ロボット1は、第1語句(または第2語句)「金閣寺」を第3語句「リンゴ」概念(分類)である「果物(食べ物)」に関連するテンプレート「[A]は食べ物じゃないでしょ」または「[A]は食べられないよ」に組み合わせた別の応答メッセージを生成する。すなわち、例文によれば、「金閣寺は食べ物じゃないでしょ」、「金閣寺は食べられないよ」のいずれかを応答メッセージとして出力する。
なお、別の応答メッセージを生成する方法は上記に限定されることはない。例えば、ロボット1は、ユーザの入力内容に含まれる、第1語句(または第2語句)とは別の語句を第4語句として、第1語句(または第2語句)と、第4語句とを、テンプレートに組み合わせて別の応答メッセージを生成してもよい。ロボット1が「リンゴは甘いです」と発話した後にユーザが「金閣寺も甘いね」と発話した場合、第1語句(または第2語句)「金閣寺」と第3語句「リンゴ」の概念(分類)が異なるものの、「甘い」の語句が共通している。このとき、ロボット1は、ユーザの入力内容に含まれる、第1語句(または第2語句)「金閣寺」とは別の語句「甘い」を第4語句とする。そして、ロボット1は、第1語句(または第2語句)と、第4語句とを、テンプレート「[A]は[B]よね ってなんでやねん」、「[A]は[B]なんだ 今度食べに連れて行ってよね」、および「[A]は[B]よね」のいずれかに組み合わせて別の応答メッセージを生成する。すなわち、例文によれば、「金閣寺は甘いよね ってなんでやねん」、「金閣寺って甘いんだね 今度食べに連れて行ってよね」、および「金閣寺は甘いよね」のいずれかを出力する。
また、推論は上述の方法に限定されることはなく、第1語句(または第2語句)、およびテンプレートと組み合わせて応答メッセージを生成するために必要な第2関連語句(または第1関連語句)を取得できるのであれば、どのような方法であってもよい。推論の別の例について、図6を用いて説明する。図6は、本実施形態に係るロボット1が推論によって応答メッセージを生成する別のイメージを示す。
図6の(a)は、「リンゴは甘い」と、「メロンは丸い」という2つの文章を示している。2つの文章のうち一方が入力内容であり、他方が記憶部13に記憶されている過去の入出力内容である。例えば、「リンゴは甘い」が入力内容であり、「メロンは丸い」が過去の入出力内容であるものとする。具体的には、ロボット1はユーザの入力内容「リンゴは甘い」を受け付け、「リンゴ」を第1語句に設定する。その後、ロボット1は、第1語句「リンゴ」と概念(品詞、分類、利用状況)の組み合わせが(名詞、果物、What(何が))であり、同一概念である第2語句「メロン」を含む履歴情報「メロンは丸い」を記憶部から検索し、第2語句「メロン」を取得する。第1語句「リンゴ」と第2語句「メロン」は同一概念であるため、この場合、ロボット1は、図6の(b)のように、概念が同一の語句で2つの文章をまとめた地図を生成する。そして、(名詞、果物、What(何が))が設定されている領域には、「リンゴ」および「メロン」のいずれかを設定する。
このとき、図6の(b)からは、「リンゴは甘い」、「リンゴは丸い」、「メロンは甘い」、および「メロンは丸い」の4つの文章を取得することができる。結果として、ロボット1は、記憶部13において互いに関連付けられていない2つの語句の組み合わせを含む文章「リンゴは丸い」、および「メロンは甘い」を推論の結果として取得し、応答メッセージを生成することができる。
そして、上述の推論は、従来技術である会話シナリオに基づく応答メッセージの生成と組み合わせて用いる構成であってもよい。このとき、記憶部13はシナリオ情報をさらに記憶していることが好適である。この場合、ロボット1は、ユーザの入力内容に関連付けられたシナリオ情報が記憶部13に存在する場合は、後述する図7のS25のように、入力内容に含まれる第1語句(または第2語句)と会話シナリオから応答メッセージを生成する構成であってもよい。また、シナリオ情報が記憶部13に存在しない場合は推論による応答メッセージの生成を行う構成であってもよい。
<処理の流れ>
次に、本実施形態のロボット1が実行する処理の流れについて、図7に基づいて説明する。図7は、本実施形態のロボット1が実行する処理の流れの一例を示すフローチャートである。なお、以下の説明において、ユーザの入力内容には第1語句および第1関連語句が含まれ、ユーザが入力する直前にロボット1が出力した応答メッセージには第3語句が含まれるものとする。
まず、音声認識部21は、音声入力部11が受け付けたユーザの入力について、入力内容の音声認識を行い、テキストデータを生成する(S11)。次に、語句・概念取得部22は、S11で生成されたテキストデータを受け付け、該テキストデータおよび記憶部13が記憶している語句情報から第1語句、第1関連語句、および第1語句の概念を取得する(S12)。そして、シナリオ部23は、S12で取得した第1語句または第1語句の概念に対応するシナリオ情報を記憶部13の中から検索し(S13)、対応するシナリオ情報が見つかったか否かを判定する(S14)。対応するシナリオ情報が見つからなかったと判定した場合(S14でNO)、概念判定部24は、ユーザの入力直前にロボット1が応答(発話)したか否かを判定する(S15)。一方、対応するシナリオ情報が見つかったと判定した場合(S14でYES)、処理は後述のS25へ進む。
S15の処理において、ロボット1が応答したと判定した場合(S15でYES)、概念判定部24はさらに、第1語句と第3語句の概念は同一であるか否かを判定する(S16)。そして、概念は同一であると判定した場合(S16でYES)、関連語句取得部25は、記憶部13が記憶している語句情報の第1関連語句の関連語句から第2語句を検索する(S17:探索ステップ)。一方、ロボット1が応答していなかったと判定した場合(S15でNO)、処理はS17へ直接進む。
S17の後、関連語句取得部25は、第2語句が見つかったか否か(第1関連語句の関連語句が語句情報にあるか否か)を判定する(S18)。第2語句が見つからなかったと判定した場合(S18でNO)、関連語句取得部25は、第1語句と同一概念である第2語句を記憶部13が記憶している語句情報から検索する(S19)。そして、関連語句取得部25は、S19の処理において第2語句が見つかったか否かを判定する(S20)。第2語句が見つかったと判定した場合(S20でYES)、またはS18において第2語句が見つかったと判定した場合(S18でYES)、関連語句取得部25は、記憶部13の語句情報において、第2語句の関連語句から第2関連語句を検索する(S21)。
その後、関連語句取得部25は、S21の処理において第2関連語句が見つかったか否か(第2語句の関連語句が語句情報にあるか否か)を判定する(S22)。第2関連語句が見つかったと判定した場合(S22でYES)、応答メッセージ生成部26は、第1語句および第2関連語句から応答メッセージを生成し(S23:応答メッセージ生成ステップ)、処理はS27へ進む。このようにして、応答メッセージ生成部26は、第1語句と第2関連語句とを互いに関連付けた内容の応答メッセージを生成する。一方、S20の処理で第2語句が見つからなかった場合(S20でNO)、またはS22の処理で第2関連語句が見つからなかった場合(S22でNO)、応答メッセージ生成部26は、第1関連語句、およびテンプレートから応答メッセージを生成する(S24)。その後、処理はS27へ進む。また、S14において対応するシナリオ情報が見つかったと判定した場合(S14でYES)、応答メッセージ生成部26は、第1語句とシナリオ情報から応答メッセージを生成し(S25)、処理はS27へ進む。そして、S16において第1語句と第3語句の概念は同一ではないと判定した場合(S16でNO)、応答メッセージ生成部26は、第1語句およびテンプレートから応答メッセージを生成し(S26)、処理はS27へ進む。
S27において、音声合成部27は応答メッセージを音声データに変換し、音声出力部12を介して音声出力する(S27)。
以上の処理により、本実施形態に係るロボット1は、適合する会話シナリオが見つからない場合であっても、入力内容に含まれる語句に基づいて応答メッセージを生成することが可能となる。
〔実施形態2〕
本発明の他の実施形態について、図7〜図9に基づいて説明する。本実施形態のロボット1は、ユーザの入力内容が3つ以上の語句を含む場合、3つ以上の語句を含む応答メッセージを生成する点で前記実施形態と異なる。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。本実施形態に係るロボット1は、ユーザの入力内容に含まれる3つ以上の語句について、前記実施形態と同様にして第1語句(または第2語句)および第1関連語句(または第2関連語句)を設定する。また、語句・概念取得部22は、第1関連語句(または第2関連語句)の関連語句であり、第1語句(または第2語句)とは異なる別の語句について、第1付随語句(または第2付随語句)に設定する。ここで、入力内容から第1付随語句(または第2付随語句)を設定する基準はどのようなものであってもよい。例えば、前記実施形態と同様にして第1語句を設定した後、残る語句のうち、概念(品詞)が「品詞」であり、かつ概念(分類)が「その他」以外である語句を第1付随語句(または第2付随語句)に設定してもよい。また、第1関連語句(または第2関連語句)と第1付随語句(または第2付随語句)を設定する順番は特に限定されないが、語句の概念(品詞)が「名詞」である語句を第1付随語句(または第2付随語句)に優先して設定することが好適である。そして、第1語句(または第2語句)および第1付随語句(または第2付随語句)を、推論によって取得された第2関連語句(または第1関連語句)と互いに関連付けた応答メッセージを生成する。
<ロボットの動作>
図8および図9に基づいて、本実施形態に係るロボット1の動作の概要について説明する。図8および図9は、本実施形態に係るロボット1が推論によって応答メッセージを生成するイメージを示す図である。
図8の(a)は、「大阪の名物はお好み焼き」、および「広島は牡蠣がおいしい」の2つの文章について推論を適用するイメージを示す。例えば、「広島は牡蠣がおいしい」は過去の入出力として予め記憶部13に記憶されており、「大阪の名物はお好み焼き」がユーザによって入力されたとする。このとき、ロボット1(語句・概念取得部22)は、「お好み焼き」を第1語句(または第2語句)、「名物」を第1関連語句(または第2関連語句)、および「大阪」を第1付随語句(または第2付随語句)に設定する。そして、ロボット1(関連語句取得部25)は、第1語句(または第2語句)「お好み焼き」と概念(品詞、分類、利用状況)の組み合わせが同一である語句「牡蠣」を含み、第1付随語句(または第2付随語句)「大阪」と同一概念である語句「広島」を含む履歴情報「広島は牡蠣がおいしい」を図3の入出力履歴から取得する。ここで、「お好み焼き」と「牡蠣」は、分類が「食べ物/お好み焼き/たこ焼き」と「食べ物/海産物」という点で異なるが、「食べ物」という部分は一致している。そのため、「お好み焼き」と「牡蠣」は、同じように用いることができる語句(下位概念は異なるが上位概念が一致する語句)であると判定している。このとき、ロボット1(応答メッセージ生成部26)は、図6の(b)と同様にして、図8の(b)のように、概念が同一の語句で2つの文章をまとめた地図を生成する。そして、(名詞、国内地域、Where(どこが))の領域には「大阪」および「広島」のいずれかを設定し、(名詞、食べ物、What(何が))の領域には「お好み焼き」および「牡蠣」のいずれかを設定する。ただし、設定される語句の組み合わせには意味があることが多いため、同一の発話で用いられた語句の組み合わせを維持しつつ、設定する必要がある。例えば、第1付随語句(または第2付随語句)「大阪」は第1語句(または第2語句)「お好み焼き」と組み合わせて設定し、同様に、「牡蠣」は「広島」と組み合わせて設定する必要がある。
したがって、図8の(b)からは、「大阪の名物はお好み焼き」、「大阪はお好み焼きがおいしい」、「広島の名物は牡蠣」、および「広島は牡蠣がおいしい」の4つの文章を取得することができる。結果として、ロボット1は、「大阪はお好み焼きがおいしい」、または「広島の名物は牡蠣」を推論の結果として取得し、応答メッセージを生成することができる。
図9の(a)は、「大阪の名物はお好み焼き」、および「広島のおみやげはもみじ饅頭」の2つの文章について推論を適用するイメージを示す。例えば、「広島のおみやげはもみじ饅頭」は過去の入出力として予め記憶部13に記憶されており、「大阪の名物はお好み焼き」がユーザによって入力されたとする。このとき、ロボット1(語句・概念取得部22)は、図8の場合と同様にして、「お好み焼き」を第1語句(または第2語句)、「名物」を第1関連語句(または第2関連語句)、および「大阪」を第1付随語句(または第2付随語句)に設定する。そして、ロボット1(関連語句取得部25)は、第1語句(または第2語句)「お好み焼き」と概念(品詞、分類、利用状況)の組み合わせが同一である語句「もみじ饅頭」を含み、第1付随語句(または第2付随語句)「大阪」と同一概念である語句「広島」を含む履歴情報「広島のおみやげはもみじ饅頭」を図3の入出力履歴から取得する。このとき、ロボット1(応答メッセージ生成部26)は、図9の(b)のように概念が同一の語句で2つの文章をまとめた地図を生成する。ここで、「名物」と「おみやげ」は、概念(品詞、分類)の組み合わせが(名詞、その他)で一致している。しかし、概念(品詞、分類)の組み合わせが(名詞、その他)である語句は、該語句が示す特徴が他の語句に対して少ないため、まとめずに用いる。この場合、図9の(b)からは、図8の(b)と同様にして、(名詞、国内地域、Where(どこが))の領域には「大阪」および「広島」のいずれかを設定する。そして、(名詞、食べ物、What(何が))の領域には「お好み焼き」および「もみじ饅頭」のいずれかを設定する。
これにより、ロボット1は、「大阪の名物はお好み焼き」、「大阪のおみやげはお好み焼き」、「広島の名物は牡蠣」、および「広島のおみやげは牡蠣」の4つの文章を取得することができる。結果として、ロボット1は、「大阪のおみやげはお好み焼き」、および「広島の名物は牡蠣」のを推論の結果として取得し、応答メッセージを生成することができる。
<処理の流れ>
次に、本実施形態のロボット1が実行する処理の流れについて、図7に基づいて説明する。図7は、本実施形態のロボット1が実行する処理の流れの一例を示すフローチャートである。なお、以下の説明において、ユーザの入力内容には第1語句および第1関連語句が含まれ、ユーザが入力する直前にロボット1が出力した応答メッセージには第3語句が含まれるものとする。ここで、ユーザの入力内容が「大阪の名物はお好み焼き」である場合、第1語句および第1関連語句は、それぞれ「お好み焼き」および「名物」であり、「大阪」は、第1付随語句である。
S11〜S22の処理は、実施形態1と同一である。S22でYESの場合、応答メッセージ生成部26は、第1語句、第1付随語句および第2関連語句から応答メッセージを生成し(S23)、処理はS27へ進む。具体的には、応答メッセージ生成部26は、第1語句、第1付随語句、および第2関連語句を互いに関連付けた応答メッセージ「大阪のおみやげはお好み焼き」または「広島の名物は牡蠣」を生成する。また、S20の処理で第2語句が見つからなかった場合(S20でNO)、またはS22の処理で第2関連語句が見つからなかった場合(S22でNO)、応答メッセージ生成部26は、第1関連語句、およびテンプレートから応答メッセージを生成する(S24)。その後、処理はS27へ進む。また、S14において対応するシナリオ情報が見つかったと判定した場合(S14でYES)、応答メッセージ生成部26は、第1語句、第1付随語句、およびシナリオ情報から応答メッセージを生成し(S25)、処理はS27へ進む。そして、S16において第1語句と第3語句の概念は同一ではないと判定した場合(S16でNO)、応答メッセージ生成部26は、第1語句、第1付随語句、およびテンプレートから応答メッセージを生成し(S26)、処理はS27へ進む。S27の処理は、実施形態1と同一である。
以上の処理により、本実施形態に係るロボット1は、ユーザの入力内容が3語以上の語句を含む場合に適合する会話シナリオが見つからない場合であっても、入力内容に含まれる語句に基づいて応答メッセージを生成することが可能となる。
〔変形例〕
前記各実施形態では、ロボット1がユーザに対して音声で対話する構成について説明したがこれに限らない。例えば制御部20は、ユーザに対してテキストを用いて対話する応答装置に備えられていてもよい。また、ユーザおよび応答装置間の音声データまたはテキストによる対話は、ネットワークを介して行われてもよい。
〔ソフトウェアによる実現例〕
ロボット1の制御部20(特に応答メッセージ生成部26および概念判定部24)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、制御部20は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る応答装置(1)は、ユーザが入力した入力内容について応答メッセージを出力する応答装置(1)であって、第1語句と第1関連語句とが互いに関連していること、および、第2語句と第2関連語句とが互いに関連していることを記憶している記憶部(13)と、上記入力内容に対する応答メッセージを生成する応答メッセージ生成部(26)とを備え、上記第1語句または上記第2語句が上記入力内容に含まれており、上記記憶部(13)が、上記第2語句と上記第1関連語句とが互いに関連していること、または、上記第1語句と上記第2語句とが同じ概念に属することを記憶している場合、上記応答メッセージ生成部(26)は、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成する。
上記の構成によれば、応答装置は、ユーザが入力した入力内容に含まれる第1語句または第2語句、および記憶部が記憶している第1語句と互いに関連している第1関連語句および第2語句と互いに関連している第2関連語句に基づいて、第2語句と第1関連語句とが互いに関連していること、または、第1語句と第2語句とが同じ概念に属することを記憶している場合、第1語句と第2関連語句とを互いに関連付けた内容の応答メッセージを生成することが可能となる。したがって、適合する会話シナリオが見つからない場合であっても、入力内容に含まれる語句に基づいて応答メッセージを生成する応答装置を実現するという効果を奏する。
本発明の態様2に係る応答装置(1)は、上記態様1において、上記記憶部(13)は、上記第2語句と上記第2関連語句とがどのような関連性で関連しているかを記憶しており、上記応答メッセージ生成部(26)は、上記第1語句と上記第2関連語句とを上記関連性で関連付けた内容の上記応答メッセージを生成する。
上記の構成によれば、応答装置は、第2語句と第2関連語句との間の関連性に基づいて、第1語句と第2関連語句とを互いに関連付けた内容の応答メッセージを生成することが可能となる。したがって、適合する会話シナリオが見つからない場合であっても、入力内容に含まれる語句および第2語句と第2関連語句との間の関連性に基づいて応答メッセージを生成する応答装置を実現するという効果を奏する。
本発明の態様3に係る応答装置(1)は、上記態様1または2のいずれかにおいて、上記記憶部(13)が、上記第2語句と上記第1関連語句とが互いに関連していることを記憶している場合、上記応答メッセージ生成部(26)は、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成する。
上記の構成によれば、応答装置は、記憶部が第2語句と第1関連語句とが互いに関連していることを記憶している場合、第1語句と第2関連語句とを互いに関連付けた内容の応答メッセージを生成することが可能となる。したがって、適合する会話シナリオが見つからない場合であっても、第2語句と第1関連語句とが互いに関連していることに基づいて、第1語句と第2関連語句とを互いに関連付けた内容の応答メッセージを生成する応答装置を実現するという効果を奏する。
本発明の態様4に係る応答装置(1)は、上記態様1または2のいずれかにおいて、上記記憶部(13)が、上記第1語句と上記第2語句とが同じ概念に属することを記憶している場合、上記応答メッセージ生成部(26)は、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成する。
上記の構成によれば、応答装置は、記憶部が第1語句と第2語句とが同じ概念に属することを記憶している場合、第1語句と第2関連語句とを互いに関連付けた内容の応答メッセージを生成することが可能となる。したがって、適合する会話シナリオが見つからない場合であっても、第1語句と第2語句とが同じ概念に属することに基づいて、第1語句と第2関連語句とを互いに関連付けた内容の応答メッセージを生成する応答装置を実現するという効果を奏する。
本発明の態様5に係る応答装置(1)は、上記態様1〜4のいずれかにおいて、上記記憶部(13)が、上記第2語句と複数の関連語句とが互いに関連していることを記憶している場合、上記応答メッセージ生成部(26)は、上記複数の関連語句のうち上記第1関連語句と同じ概念に属する関連語句を優先的に上記第2関連語句として抽出し、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成する。
上記の構成によれば、応答装置は、記憶部が第2語句と複数の関連語句とが互いに関連していることを記憶している場合、複数の関連語句のうち第1関連語句と同じ概念に属する関連語句を優先的に第2関連語句として抽出し、第1語句と第2関連語句とを互いに関連付けた内容の応答メッセージを生成するという効果を奏する。したがって、適合する会話シナリオが見つからない場合であっても、第2語句と複数の関連語句とが互いに関連していることを記憶している場合、複数の関連語句のうち第1関連語句と同じ概念に属する関連語句を優先的に第2関連語句として抽出し、第1語句と第2関連語句とを互いに関連付けた内容の応答メッセージを生成する応答装置を実現するという効果を奏する。
本発明の態様6に係る応答装置(1)は、上記態様1〜5のいずれかにおいて、上記応答メッセージを外部に出力する出力部(12)と、上記入力内容が入力される直前に上記出力部(12)から出力された応答メッセージに含まれる第3語句が属する概念と、該入力内容に含まれる入力語句が属する概念とが同じであるか否かを判定する概念判定部(24)とを備え、上記記憶部(13)は、上記応答メッセージのテンプレートを記憶しており、上記応答メッセージ生成部(26)は、上記第3語句が属する概念と上記入力語句が属する概念とが同じである場合、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成し、上記第3語句が属する概念と上記入力語句が属する概念とが異なる場合、テンプレートを用いて別の応答メッセージを生成する。
上記の構成によれば、応答装置は、該応答装置が入力内容が入力される直前に出力した応答メッセージに含まれる第3語句が属する概念と、該入力内容に含まれる入力語句が属する概念とが同じである場合、第1語句と第2関連語句とを互いに関連付けた内容の応答メッセージを生成し、第3語句が属する概念と入力語句が属する概念とが異なる場合、テンプレートを用いて応答メッセージを生成することが可能となる。したがって、適合する会話シナリオが見つからない場合であっても、第3語句が属する概念および入力語句が属する概念に基づいて応答メッセージを生成する応答装置を実現するという効果を奏する。
本発明の態様7に係る応答装置(1)は、上記態様6において、上記第3語句が属する概念と上記入力語句が属する概念とが異なる場合、上記応答メッセージ生成部(26)は、上記入力語句を、上記第3語句に関連するテンプレートに組み合わせて上記別の応答メッセージを生成する。
上記の構成によれば、応答装置は、第3語句が属する概念と入力語句が属する概念とが異なる場合、該入力語句を、第3語句に関連するテンプレートに組み合わせて別の応答メッセージを生成することが可能となる。したがって、適合する会話シナリオが見つからない場合であっても、第3語句が属する概念と入力語句が属する概念とが異なる場合、該入力語句を、第3語句に関連するテンプレートに組み合わせて別の応答メッセージを生成する応答装置を実現するという効果を奏する。
本発明の態様8に係る応答装置(1)は、上記態様6において、上記第3語句が属する概念と上記入力語句が属する概念とが異なる場合、上記応答メッセージ生成部(26)は、上記入力語句と、上記入力内容に含まれる第4語句とを、テンプレートに組み合わせて上記別の応答メッセージを生成する。
上記の構成によれば、応答装置は、第3語句が属する概念と入力語句が属する概念とが異なる場合、該入力語句と、入力内容に含まれる第4語句とを、テンプレートに組み合わせて別の応答メッセージを生成することが可能となる。したがって、適合する会話シナリオが見つからない場合であっても、第3語句が属する概念と入力語句が属する概念とが異なる場合、該入力語句と、入力内容に含まれる第4語句とを、テンプレートに組み合わせて別の応答メッセージを生成する応答装置を実現するという効果を奏する。
本発明の態様9に係る応答装置(1)は、上記態様7または8において、上記応答メッセージ生成部(26)は、上記入力内容に含まれる複数の語句について、各語句が属する概念および各語句の前後の語句を含む文脈情報に基づいて上記入力語句を選択する。
上記の構成によれば、応答装置は、各語句が属する属性および各語句の前後の語句を含む文脈情報に基づいて入力語句を選択することが可能となる。したがって、適合する会話シナリオが見つからない場合であっても、各語句が属する属性および各語句の前後の語句を含む文脈情報から入力語句を選択し、第3語句に関連するテンプレートに組み合わせて別の応答メッセージを生成する応答装置を実現するという効果を奏する。
本発明の態様10に係る応答装置(1)の制御方法は、ユーザが入力した入力内容について応答メッセージを出力する応答装置(1)の制御方法であって、上記応答装置(1)は、第1語句と第1関連語句とが互いに関連していること、および、第2語句と第2関連語句とが互いに関連していることを記憶している記憶部を備え、上記入力内容に含まれている上記第1語句または上記第2語句に関する記憶を上記記憶部から探す探索ステップ(S17)と、上記入力内容に対する応答メッセージを生成する応答メッセージ生成ステップ(S23)とを含み、上記第1語句または上記第2語句が上記入力内容に含まれており、上記記憶部が、上記第2語句と上記第1関連語句とが互いに関連していること、または、上記第1語句と上記第2語句とが同じ概念に属することを記憶している場合、上記応答メッセージ生成ステップ(S23)では、上記第1語句と上記第2関連語句とを互いに関連付けた内容の応答メッセージを生成する。上記の構成によれば、態様1と同様の作用効果を奏する。
本発明の各態様に係る応答装置(1)は、コンピュータによって実現してもよく、この場合には、コンピュータを上記応答装置(1)が備える各部(ソフトウェア要素)として動作させることにより上記応答装置(1)をコンピュータにて実現させる応答装置(1)の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
1 ロボット(応答装置) 11 音声入力部 12 音声出力部(出力部)
13 記憶部 20 制御部 21 音声認識部 22 語句・概念取得部
23 シナリオ部 24 概念判定部
25 関連語句取得部 26 応答メッセージ生成部 27 音声合成部

Claims (11)

  1. ユーザが入力した入力内容について応答メッセージを出力する応答装置であって、
    第1語句と第1関連語句とが互いに関連していること、および、第2語句と第2関連語句とが互いに関連していることを記憶している記憶部と、
    上記入力内容に対する応答メッセージを生成する応答メッセージ生成部とを備え、
    上記第1語句または上記第2語句が上記入力内容に含まれており、上記記憶部が、上記第2語句と上記第1関連語句とが互いに関連していること、または、上記第1語句と上記第2語句とが同じ概念に属することを記憶している場合、
    上記応答メッセージ生成部は、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成することを特徴とする応答装置。
  2. 上記記憶部は、上記第2語句と上記第2関連語句とがどのような関連性で関連しているかを記憶しており、
    上記応答メッセージ生成部は、上記第1語句と上記第2関連語句とを上記関連性で関連付けた内容の上記応答メッセージを生成することを特徴とする請求項1に記載の応答装置。
  3. 上記記憶部が、上記第2語句と上記第1関連語句とが互いに関連していることを記憶している場合、
    上記応答メッセージ生成部は、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成することを特徴とする請求項1または2に記載の応答装置。
  4. 上記記憶部が、上記第1語句と上記第2語句とが同じ概念に属することを記憶している場合、
    上記応答メッセージ生成部は、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成することを特徴とする請求項1または2に記載の応答装置。
  5. 上記記憶部が、上記第2語句と複数の関連語句とが互いに関連していることを記憶している場合、
    上記応答メッセージ生成部は、上記複数の関連語句のうち上記第1関連語句と同じ概念に属する関連語句を優先的に上記第2関連語句として抽出し、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成することを特徴とする請求項1から4のいずれか一項に記載の応答装置。
  6. 上記応答メッセージを外部に出力する出力部と、
    上記入力内容が入力される直前に上記出力部から出力された応答メッセージに含まれる第3語句が属する概念と、該入力内容に含まれる入力語句が属する概念とが同じであるか否かを判定する概念判定部とを備え、
    上記記憶部は、上記応答メッセージのテンプレートを記憶しており、
    上記応答メッセージ生成部は、
    上記第3語句が属する概念と上記入力語句が属する概念とが同じである場合、上記第1語句と上記第2関連語句とを互いに関連付けた内容の上記応答メッセージを生成し、
    上記第3語句が属する概念と上記入力語句が属する概念とが異なる場合、テンプレートを用いて別の応答メッセージを生成することを特徴とする請求項1から5のいずれか一項に記載の応答装置。
  7. 上記第3語句が属する概念と上記入力語句が属する概念とが異なる場合、上記応答メッセージ生成部は、上記入力語句を、上記第3語句に関連するテンプレートに組み合わせて上記別の応答メッセージを生成することを特徴とする請求項6に記載の応答装置。
  8. 上記第3語句が属する概念と上記入力語句が属する概念とが異なる場合、上記応答メッセージ生成部は、上記入力語句と、上記入力内容に含まれる第4語句とを、テンプレートに組み合わせて上記別の応答メッセージを生成することを特徴とする請求項6に記載の応答装置。
  9. 上記応答メッセージ生成部は、上記入力内容に含まれる複数の語句について、各語句が属する概念および各語句の前後の語句を含む文脈情報に基づいて上記入力語句を選択することを特徴とする請求項7または8に記載の応答装置。
  10. ユーザが入力した入力内容について応答メッセージを出力する応答装置の制御方法であって、
    上記応答装置は、第1語句と第1関連語句とが互いに関連していること、および、第2語句と第2関連語句とが互いに関連していることを記憶している記憶部を備え、
    上記入力内容に含まれている上記第1語句または上記第2語句に関する記憶を上記記憶部から探す探索ステップと、
    上記入力内容に対する応答メッセージを生成する応答メッセージ生成ステップとを含み、
    上記第1語句または上記第2語句が上記入力内容に含まれており、上記記憶部が、上記第2語句と上記第1関連語句とが互いに関連していること、または、上記第1語句と上記第2語句とが同じ概念に属することを記憶している場合、
    上記応答メッセージ生成ステップでは、上記第1語句と上記第2関連語句とを互いに関連付けた内容の応答メッセージを生成することを特徴とする応答装置の制御方法。
  11. 請求項1に記載の応答装置としてコンピュータを機能させるための制御プログラムであって、上記応答メッセージ生成部としてコンピュータを機能させるための制御プログラム。
JP2018522313A 2016-06-08 2017-02-21 応答装置および応答装置の制御方法、制御プログラム Active JP6644141B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016114838 2016-06-08
JP2016114838 2016-06-08
PCT/JP2017/006333 WO2017212689A1 (ja) 2016-06-08 2017-02-21 応答装置および応答装置の制御方法、制御プログラム

Publications (2)

Publication Number Publication Date
JPWO2017212689A1 true JPWO2017212689A1 (ja) 2019-02-14
JP6644141B2 JP6644141B2 (ja) 2020-02-12

Family

ID=60578456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018522313A Active JP6644141B2 (ja) 2016-06-08 2017-02-21 応答装置および応答装置の制御方法、制御プログラム

Country Status (3)

Country Link
JP (1) JP6644141B2 (ja)
CN (1) CN109313899A (ja)
WO (1) WO2017212689A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7166350B2 (ja) * 2018-09-13 2022-11-07 株式会社Nttドコモ 対話装置
TWI725577B (zh) * 2019-10-17 2021-04-21 中國信託商業銀行股份有限公司 智能語音資訊質檢方法及系統

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007328283A (ja) * 2006-06-09 2007-12-20 Kenwood Corp 対話装置、プログラム、及び対話方法
JP2013072887A (ja) * 2011-09-26 2013-04-22 Toshiba Corp 対話装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8914885B2 (en) * 2006-11-03 2014-12-16 Alcatel Lucent Methods and apparatus for delivering control messages during a malicious attack in one or more packet networks
JP5087590B2 (ja) * 2009-05-22 2012-12-05 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像形成装置
JP2011018178A (ja) * 2009-07-08 2011-01-27 Sony Corp 情報処理装置、情報処理方法およびプログラム
JP6150282B2 (ja) * 2013-06-27 2017-06-21 国立研究開発法人情報通信研究機構 ノン・ファクトイド型質問応答システム及びコンピュータプログラム
CN104834704A (zh) * 2015-04-29 2015-08-12 深圳市梦网科技股份有限公司 应答方法及***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007328283A (ja) * 2006-06-09 2007-12-20 Kenwood Corp 対話装置、プログラム、及び対話方法
JP2013072887A (ja) * 2011-09-26 2013-04-22 Toshiba Corp 対話装置

Also Published As

Publication number Publication date
WO2017212689A1 (ja) 2017-12-14
CN109313899A (zh) 2019-02-05
JP6644141B2 (ja) 2020-02-12

Similar Documents

Publication Publication Date Title
US11264030B2 (en) Indicator for voice-based communications
US11740863B2 (en) Search and knowledge base question answering for a voice user interface
US10726833B2 (en) System and method for rapid customization of speech recognition models
US10056078B1 (en) Output of content based on speech-based searching and browsing requests
US11823678B2 (en) Proactive command framework
US10453449B2 (en) Indicator for voice-based communications
US10134388B1 (en) Word generation for speech recognition
US9154629B2 (en) System and method for generating personalized tag recommendations for tagging audio content
US10366690B1 (en) Speech recognition entity resolution
US9922650B1 (en) Intent-specific automatic speech recognition result generation
JP6715943B2 (ja) 対話装置、対話装置の制御方法、および制御プログラム
US10593319B1 (en) Parallelization of instruction steps
US20240221726A1 (en) Systems and methods for improving content discovery in response to a voice query
WO2017212689A1 (ja) 応答装置および応答装置の制御方法、制御プログラム
WO2015040751A1 (ja) 音声選択支援装置、音声選択方法、およびプログラム
US11676597B2 (en) Word selection for natural language interface
JP2019101619A (ja) 対話ログ群からコンテキストを決定可能な対話シナリオ生成装置、プログラム及び方法
JP2017211610A (ja) 出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム
JPWO2003025787A1 (ja) 文章生成装置及び生成方法
JP2010145873A (ja) テキスト置換装置、テキスト音声合成装置、テキスト置換方法、及び、テキスト置換プログラム
JP5381211B2 (ja) 音声対話装置及びプログラム
JP2014110002A (ja) カテゴリ決定装置及びカテゴリ決定方法
JP2011053851A (ja) 分類処理装置
JP2002221983A (ja) 音声合成用韻律制御規則生成装置および記録媒体
JPWO2009050809A1 (ja) 音声出力装置、音声出力方法、音声出力プログラム及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200107

R150 Certificate of patent or registration of utility model

Ref document number: 6644141

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150