JP5718406B2 - 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム - Google Patents

発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム Download PDF

Info

Publication number
JP5718406B2
JP5718406B2 JP2013101380A JP2013101380A JP5718406B2 JP 5718406 B2 JP5718406 B2 JP 5718406B2 JP 2013101380 A JP2013101380 A JP 2013101380A JP 2013101380 A JP2013101380 A JP 2013101380A JP 5718406 B2 JP5718406 B2 JP 5718406B2
Authority
JP
Japan
Prior art keywords
word
utterance
sentence
user
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013101380A
Other languages
English (en)
Other versions
JP2014222400A (ja
Inventor
東中 竜一郎
竜一郎 東中
松尾 義博
義博 松尾
牧野 俊朗
俊朗 牧野
のぞみ 小林
のぞみ 小林
平野 徹
徹 平野
豊美 目黒
豊美 目黒
千明 宮崎
千明 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013101380A priority Critical patent/JP5718406B2/ja
Publication of JP2014222400A publication Critical patent/JP2014222400A/ja
Application granted granted Critical
Publication of JP5718406B2 publication Critical patent/JP5718406B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラムにかかり、特に、ユーザ発話に対応したシステム発話を行うための発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラムに関する。
一般に、雑多な話題についてユーザの発話に対する発話文を提示することにより、ユーザと対話を行う対話システムが知られている。このような対話システムでは、現在の対話における話題を把握し、その話題について応答することが重要である。そのために、対話に出現しうる話題のそれぞれについてユーザに提示するための発話文を手作業によって予め準備しておき、その中から現在の話題に即したものを選択してユーザに提示することにより、ユーザに対して発話を行う対話システムがある(例えば、非特許文献1参照)。
また、ユーザとの対話における現在の話題について、インターネットを利用してウェブ検索エンジンを用いて関連する文を抽出し、抽出した文の中から一つ以上の文を発話として用いて応答を行う対話システムがある(例えば、非特許文献2参照)。
R. S. Wallace, "The Anatomy of A.L.I.C.E.", A.L.I.C.E. Artificial_Intelligence Foundation, Inc., 2004. Shibata, M., Nishiguchi, T., and Tomiura, Y. (2009)."Dialog system for open-ended conversation using web documents." Informatica, 33 (3), pp. 277-284.
現在の話題についての発話を対話システムが行うための手法として、非特許文献1では手作業によって発話文を事前に準備しておくため、コストが高くなる場合がある。また、非特許文献2の手法では、雑多な情報が含まれたインターネットを利用して発話文を抜粋するため、必ずしも対話における現在の話題について適切な文を取得できるとは限らず、質の低い応答になってしまう場合がある。
本発明は上記問題点を考慮してなされたものであり、対話システムにおいてユーザ発話に応じて適切なシステム発話を自動的に生成することができる発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラムを提供することを目的とする。
上記目的を達成するために、本発明の発話文生成装置は、ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成装置であって、テキストデータに含まれる文から、予め定められた見出し語について、当該見出し語と共に予め定めた単語および品詞の列からなる言語パターンに基づいて当該見出し語に関連する関連語を取得し、関連語辞書に格納する関連語作成部と、前記見出し語と前記見出し語に関する関連語とが対応付けられて格納された前記関連語辞書から、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に関連する関連語を取得する関連語取得部と、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記関連語と、単語と該単語に関連する関連語とを用いて発話文を生成するための雛形となる予め定められたテンプレートと、に基づいて、発話文を生成する発話文生成部と、を備える。
また、本発明の発話文生成装置の前記関連語取得部は、前記関連語辞書から、前記入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に関連する関連語を取得すると共に、見出し語が属するカテゴリの情報とが対応付けられて格納されたカテゴリ辞書、及び見出し語と該見出し語が属する拡張固有表現タイプとが対応付けられて格納された拡張固有表現辞書の少なくとも一方から、前記入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に応じた前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方を取得し、前記発話文生成部は、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記関連語と、前記テンプレートと、に基づいて、発話文を生成すると共に、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、単語と該単語が属するカテゴリの情報を用いて発話文を生成するための雛形となる予め定められたテンプレート及び該単語が属する拡張固有表現タイプを用いて発話文を生成するための雛形となる予め定められたテンプレートの少なくとも一方と、に基づいて、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、を含む発話文を生成する、ようにしてもよい。
本発明の発話文生成装置は、ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成装置であって、見出し語と該見出し語が属するカテゴリの情報とが対応付けられて格納されたカテゴリ辞書、及び見出し語と該見出し語が属する拡張固有表現タイプとが対応付けられて格納された拡張固有表現辞書の少なくとも一方から、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に応じた前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方を取得する取得部と、前記ユーザ発話に含まれる前記単語と、前記取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、単語と該単語が属するカテゴリの情報を用いて発話文を生成するための雛形となる予め定められたテンプレート及び該単語が属する拡張固有表現タイプを用いて発話文を生成するための雛形となる予め定められたテンプレートの少なくとも一方と、に基づいて、前記ユーザ発話に含まれる前記単語と、前記取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、を含む発話文を生成する発話文生成部と、を備える。
また、本発明の対話装置は、ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成装置であって、テキストデータに含まれる文から、予め定められた見出し語について、当該見出し語と共に予め定めた単語および品詞の列からなる言語パターンに基づいて当該見出し語に関連する関連語を取得し、関連語辞書に格納する関連語作成部、前記見出し語と前記見出し語に関する関連語とが対応付けられて格納された前記関連語辞書、見出し語と該見出し語が属するカテゴリの情報とが対応付けられて格納されたカテゴリ辞書、及び見出し語と該見出し語が属する拡張固有表現タイプとが対応付けられて格納された拡張固有表現辞書の少なくとも一つから、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に関連する前記関連語、当該単語に応じた前記カテゴリの情報、及び当該単語に応じた前記拡張固有表現タイプの少なくとも一つを取得する関連語取得部、及び前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記関連語、前記カテゴリの情報、及び前記拡張固有表現タイプの少なくとも一つと、単語と該単語に関連する関連語とを用いて発話文を生成するための雛形となる予め定められたテンプレート、単語と該単語が属するカテゴリの情報を用いて発話文を生成するための雛形となる予め定められたテンプレート、及び該単語が属する拡張固有表現タイプを用いて発話文を生成するための雛形となる予め定められたテンプレートの少なくとも一つと、に基づいて、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、を含む発話文を生成する発話文生成部を備えた発話文生成装置を用いて、ユーザ発話に対してシステム発話を行う対話装置であって、入力されたユーザ発話に対する形態素解析の結果に基づいて、前記ユーザとの対話における話題を表す単語を抽出し、前記発話文生成装置に、前記抽出された単語を入力する単語抽出部と、前記発話文生成装置により前記抽出された単語の入力に対して生成された発話文を用いて、前記ユーザ発話に対してシステム発話を提示する提示部と、を備える。
本発明の発話文生成方法は、ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成方法であって、関連語作成部により、テキストデータに含まれる文から、予め定められた見出し語について、当該見出し語と共に予め定めた単語および品詞の列からなる言語パターンに基づいて当該見出し語に関連する関連語を取得し、関連語辞書に格納するステップと、関連語取得部により、前記見出し語と前記見出し語に関する関連語とが対応付けられて格納された前記関連語辞書から、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に関連する関連語を取得するステップと、発話文生成部により、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記関連語と、単語と該単語に関連する関連語とを用いて発話文を生成するための雛形となる予め定められたテンプレートと、に基づいて、発話文を生成するステップと、を備える。
本発明の発話文生成方法は、ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成方法であって、取得部により、見出し語と該見出し語が属するカテゴリの情報とが対応付けられて格納されたカテゴリ辞書、及び見出し語と該見出し語が属する拡張固有表現タイプとが対応付けられて格納された拡張固有表現辞書の少なくとも一方から、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に応じた前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方を取得するステップと、発話文生成部により、前記ユーザ発話に含まれる前記単語と、前記取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、単語と該単語が属するカテゴリの情報を用いて発話文を生成するための雛形となる予め定められたテンプレート及び該単語が属する拡張固有表現タイプを用いて発話文を生成するための雛形となる予め定められたテンプレートの少なくとも一方と、に基づいて、前記ユーザ発話に含まれる前記単語と、前記取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、を含む発話文を生成するステップと、を備える。
本発明の対話方法は、ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成装置であって、テキストデータに含まれる文から、予め定められた見出し語について、当該見出し語と共に予め定めた単語および品詞の列からなる言語パターンに基づいて当該見出し語に関連する関連語を取得し、関連語辞書に格納する関連語作成部、前記見出し語と前記見出し語に関する関連語とが対応付けられて格納された前記関連語辞書、見出し語と該見出し語が属するカテゴリの情報とが対応付けられて格納されたカテゴリ辞書、及び見出し語と該見出し語が属する拡張固有表現タイプとが対応付けられて格納された拡張固有表現辞書の少なくとも一つから、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に関連する前記関連語、当該単語に応じた前記カテゴリの情報、及び当該単語に応じた前記拡張固有表現タイプの少なくとも一つを取得する関連語取得部、及び前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記関連語、前記カテゴリの情報、及び前記拡張固有表現タイプの少なくとも一つと、単語と該単語に関連する関連語とを用いて発話文を生成するための雛形となる予め定められたテンプレート、単語と該単語が属するカテゴリの情報を用いて発話文を生成するための雛形となる予め定められたテンプレート、及び該単語が属する拡張固有表現タイプを用いて発話文を生成するための雛形となる予め定められたテンプレートの少なくとも一つと、に基づいて、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、を含む発話文を生成する発話文生成部を備えた発話文生成装置を用いて、ユーザ発話に対してシステム発話を行う対話方法であって、単語抽出部により、入力されたユーザ発話に対する形態素解析の結果に基づいて、前記ユーザとの対話における話題を表す単語を抽出し、前記発話文生成装置に、前記抽出された単語を入力するステップと、提示部により、前記発話文生成装置により前記抽出された単語の入力に対して生成された発話文を用いて、前記ユーザ発話に対してシステム発話を提示するステップと、を備える。
本発明の発話文生成プログラムは、コンピュータに、本発明の発話文生成装置の各部として機能させるためのものである。
本発明の対話プログラムは、コンピュータに、本発明の対話装置の各部として機能させるためのものである。
本発明の発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラムによれば、対話システムにおいてユーザ発話に応じて適切なシステム発話を自動的に生成することができる、という効果が得られる。
本実施の形態の対話システムの概略構成の一例を示す概略構成図である。 本実施の形態の発話文生成装置の関連語取得部で実行される関連語辞書構築処理の一例のフローチャートである。 本実施の形態の発話文生成装置の関連語取得部における関連語辞書の生成を説明するためのテーブル示した説明図である。 本実施の形態の発話文生成装置の関連語取得部における関連語辞書の生成を説明するための説明図である。 本実施の形態の発話文生成装置で実行される発話文生成処理の一例のフローチャートである。 本実施の形態の対話システムとユーザとの対話の具体的な一例を説明するための説明図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態は本発明を限定するものではない。
本実施の形態の対話システム10は、ユーザの発話に対してシステムが発話を行うことによりユーザと雑談等の対話を行う対話システムであって、ユーザが発話した発話文から単語を抽出し、抽出した単語に応じた発話文を生成して、生成した発話文をユーザに提示することによりシステムの発話を行う機能を有している。
以下では、ユーザの発話を「ユーザ発話」という。また、当該ユーザ発話における発話文を「ユーザ発話文」という。また、システムの発話を「システム発話」という。なお、発話文生成装置20が生成するシステム発話に用いる発話文は、記載が煩雑になるのを避けるため、単に「発話文」という。
まず、本実施の形態の対話システム10の構成について説明する。図1には、本実施の形態の対話システム10の概略構成の一例を表した構成図を示す。本実施の形態の対話システム10は、単語抽出部12、発話文生成装置20、及びユーザ提示部16を備える。
単語抽出部12は、形態素解析器14を備えており、形態素解析器14によりユーザ発話文から単語を抽出する機能を有する。単語抽出部12は、ユーザ発話が入力されると、ユーザ発話文に対して形態素解析器14により形態素解析を行い、ユーザ発話文に含まれる単語を抽出する。本実施の形態では、ユーザとの対話における話題を示す単語として、単語抽出部12により単語を抽出している。一例として、単語抽出部12は、一例として、ユーザ発話文に含まれる名詞の単語を、話題を示す単語として抽出する。
形態素解析器14は、詳細を後述する関連語取得部24に備えられた形態素解析器26と同様のものであってもよいし、異なるものであってもよく、特に限定されるものではない。単語抽出部12は、複数の単語を抽出した場合は、抽出した中から選択した一つの単語を発話文生成装置20に出力する。なお、単語抽出部12は、選択した一つの単語のみを発話文生成装置20に出力してもよいし、選択を繰り返して、選択した単語を順次発話文生成装置20に出力するようにしてもよい。
ユーザ提示部16は、単語抽出部12から入力された単語に基づいて発話文生成装置20が生成した発話文の中から一つ以上を選択し、選択した発話文をユーザに提示することでシステム発話を行う機能を有する。このようにユーザ提示部16は、対話の話題を示す単語に基づいて生成された発話文をユーザに提示することにより、話題に即したシステム発話を行う。
なお、本実施の形態のユーザ提示部16は、発話文生成装置20から発話文が得られなかった場合は、別途に設けられた発話文候補のリストを参照して、当該リストから選択した発話文をユーザに提示するようにしている。このような場合に用いられる発話文候補のリストは、予め手作業等により用意しておけばよい。
なお、単語抽出部12及びユーザ提示部16は、発話文生成装置20と同一の装置に備えられていてもよいし、発話文生成装置20とは別個の装置に備えられていてもよい。
本実施の形態の発話文生成装置20は、単語抽出部12から入力された単語と、単語に応じた関連語、カテゴリ情報、及び拡張固有表現タイプの少なくとも一つと、発話文を生成するための雛形となる所定のテンプレート40とに基づいて発話文を生成し、ユーザ提示部16に出力する機能を有する。
本実施の形態の発話文生成装置20は、単語入力部22、関連語取得部24、関連語作成部25、関連語辞書28、大規模テキストデータ30、言語パターン32、発話文生成部34、カテゴリ辞書36、拡張固有表現辞書38、及びテンプレート40を備える。
なお、発話文生成装置20におけるこれら各処理部、及び上記各処理部(単語抽出部12及びユーザ提示部16)は、CPU(Central Processing Unit)、RAM(Random Access Memory)、及びROM(Read Only Memory)等を備えたコンピュータにより実現されており、CPUが、ROMに記憶されているプログラムを実行することにより、各処理部における詳細を後述する処理が実行される。
関連語作成部25は、予め与えられた各単語に関連する関連語を大規模テキストデータ30から取得し、当該単語及び関連語を関連語辞書28に登録する機能を有する。関連語作成部25は、関連語を取得するために、形態素解析器26及び固有表現抽出器27を備えている。形態素解析器26としては、本実施の形態では、具体的な一例として、出願人の形態素解析器JTAGを用いており、固有表現抽出器27としては、出願人のNameListerを用いている。関連語の取得に用いる形態素解析器26や固有表現抽出器27は特に限定されず、フリーソフトとして提供されている、ChaSen、Mecab、及びCaboCha等を用いてもよい。
本実施の形態では、具体的な一例として、関連語作成部25は、単語に関連する関連語として、名詞、動詞、形容詞、及び疑問詞を、本発明者らが手作業で定義した言語パターンを用いて取得する。また、本実施の形態では、当該言語パターンと大規模テキストデータ30中の文書のマッチには、パターンマッチの手法で一般的な正規表現によるマッチを用いている。なお、本実施の形態では、大規模テキストデータ30の具体的な一例として、本発明者らが独自にクロールしたブログデータ約一年分を用いているが、特に限定されるものではなく、新聞記事や一般的なウェブ文書等を用いてもよい。また、大規模テキストデータ30の「大規模」とは、データ量が多いほど、関連度が高い関連語を取得できるようになることから用いている呼称であり、具体的な大きさを示すものではない。
なお、単語入力部22から単語が与えられる度に関連語作成部25を用いて関連語を取得するとコストが高くなる等の問題が生じる懸念がある。特に、大規模テキストデータ30のデータ量が大量であれば関連語を取得するための処理に非常に時間がかかる。そこで、本実施の形態では、予め関連語作成部25が、大規模テキストデータ30から関連語辞書28を構築しておく。具体的には、関連語作成部25は、ブログデータに出現する予め定められた単語(固有表現、もしくは名詞・未知語の連続)について、関連する名詞、動詞、形容詞、及び疑問詞を抽出し、単語に応じた関連語として関連語辞書28に格納する。
関連語作成部25による関連語辞書28の構築について説明する。図2には、関連語作成部25による関連語辞書構築処理の一例のフローチャートを示す。
ステップS100では、大規模テキストデータ30から一つの文を取得する。次のステップS102では、形態素解析器26により取得した文の形態素解析を行う。さらに次のステップS104では、上記ステップS102の文の形態素解析結果に基づいて、言語パターン32を参照して、予め定められた単語Aの各々について、単語Aの関連語Bを取得する。
以下に、単語Aの関連語Bが、名詞、動詞、形容詞、及び疑問詞のそれぞれの場合について、言語パターン32を参照して、どのように関連語Bを取得するかについて述べる。
まず、名詞である関連語Bの取得方法について説明する。本実施の形態では、言語パターン32のうち、以下に示す「AのB」を表す言語パターン(1)及び言語パターン(2)を用いて、単語Aについての関連語として単語Bを獲得する。
「A(固有表現)」の「B(名詞|未知語)」+ (が|は|も|を|に|から|まで|より|で|へ) ・・・言語パターン(1)
「A(名詞|未知語)」+ の「B(名詞|未知語)」+ (が|は|も|を|に|から|まで|より|で|へ) ・・・言語パターン(2)
ここで、各言語パターン中の固有表現、名詞、及び未知語は単語の種別を表しており、「( )」はグループを、「+」は一度以上の繰り返しを表している。それ以外(例えば、「の」や「が」「は」等)は単語の表記を表している。また、「|」はグループ中の選択を表す。これらの表記は、いわゆる正規表現の記法を用いている。また、空白は、単語区切りを表している。なお、名詞及び未知語は形態素解析器26が単語について出力する品詞である。また、本実施の形態において固有表現とは、形態素解析器26の結果から固有表現抽出器27が一つ以上の単語列に付与した固有表現であることを示すラベルである。
言語パターン(1)及び言語パターン(2)において、「A( )」や「B( )」としたところが「AのB」のAとBに該当する。例えば、大規模テキストデータ30から、「ラーメンのスープが美味しい」という文を取得した場合について説明する。当該文は、形態素解析器26により形態素解析を行うと「ラーメン/名詞 の/助詞 スープ/名詞 が/助詞 美味しい/形容詞」のようになる。当該文は、言語パターン(1)に合致するため、「ラーメン」という単語Aに関連する名詞である「スープ」を関連語Bとして取得することができる。また例えば、「○○○大統領の選挙が近い」という文を取得した場合は、固有表現抽出器27により「○○○大統領」が人名を指す固有表現であることがわかる。そして、形態素解析器26により「選挙」が名詞であるとわかるため、「○○○大統領」という単語Aに関連する関連語Bとして「選挙」が取得される。
このように大規模テキストデータ30から、予め定められた単語Aの各々について、関連語Bとなる名詞を取得する。
次に、動詞である関連語Bの取得方法について説明する。本実施の形態では、言語パターン32のうち、以下に示す「AをB」を表す言語パターン(3)及び言語パターン(4)を用いて、単語Aについての関連語として単語Bを取得する。
「A(固有表現)」 を「B(動詞)」 ・・・言語パターン(3)
「A(名詞|未知語)」+ を「B(動詞)」 ・・・言語パターン(4)
言語パターン(3)及び言語パターン(4)を用いることで、例えば、大規模テキストデータ30から取得した「ラーメンを食べる」や「○○○大統領を見かける」といった文から、「ラーメン」という単語Aに関連する動詞である「食べる」、及び「○○○大統領」という単語Aに関連する動詞である「見かける」を関連語Bとして取得することができる。
このように大規模テキストデータ30から、予め定められた単語Aの各々について、関連語Bとなる動詞を取得する。
次に、形容詞である関連語Bの取得方法について説明する。本実施の形態では、言語パターン32のうち、以下に示す「AがB」、及び「AはB」を表す言語パターン(5)及び言語パターン(6)を用いて、単語Aについての関連語として単語Bを取得する。
「A(固有表現)」(が|は)「B(形容詞)」 ・・・言語パターン(5)
「A(名詞|未知語)」+(が|は)「B(形容詞)」 ・・・言語パターン(6)
言語パターン(5)及び言語パターン(6)を用いることで、例えば、大規模テキストデータ30から取得した「ラーメンは美味しい」や「○○○大統領がかっこいい」といった文から、「ラーメン」という単語Aに関連する形容詞である「美味しい」、及び「○○○大統領」という単語Aに関連する形容詞である「かっこいい」を関連語Bとして取得することができる。
このように大規模テキストデータ30から、予め定められた単語Aの各々について、関連語Bとなる形容詞を取得する。
次に、疑問詞である関連語Bの取得方法について説明する。本実施の形態では、言語パターン32のうち、以下に示す言語パターン(7)〜言語パターン(10)を用いて、単語Aについての関連語として単語Bを取得する。
「A(どんな)」 「B(固有表現)」+ ・・・言語パターン(7)
「A(何|どこ|いつ|誰)」 の「B(固有表現)」+ ・・・言語パターン(8)
「A(どんな)」 「B(名詞|未知語)」+ ・・・言語パターン(9)
「A(何|どこ|いつ|誰)」 の「B(名詞|未知語)」+ ・・・言語パターン(10)
言語パターン(7)〜言語パターン(10)を用いることで、例えば、大規模テキストデータ30から取得した「どんなラーメンでも食べる」や「いつのライブに行きますか」といった文から、「ラーメン」という単語Aに関連する疑問詞である「どんな」、及び「ライブ」という単語Aに関連する疑問詞である「いつ」を関連語Bとして取得することができる。
このように大規模テキストデータ30から、予め定められた単語Aの各々について、関連語Bとなる疑問詞を取得する。
このようにしてステップS100〜ステップS104の処理により、予め定められた単語Aの各々について、関連語Bを取得すると、ステップS106において、大規模テキストデータ30のすべての文について、ステップS100〜ステップS104の処理を実行したか否かを判定する。ステップS100〜ステップS104の処理を実行していない文が存在する場合には、上記ステップS100へ戻り、当該文を取得する。一方、すべての文についてステップS100〜ステップS104の処理を実行した場合には、ステップS108へ移行する。
ステップS108では、フィルタリング処理を行う。
関連語辞書28には、単語Aを見出し語として、関連語Bを対応付けて格納する。本実施の形態では、見出し語(単語A)となる名詞について特に関連する関連語Bのみを関連語辞書28に収録するための工夫として、本実施の形態では、対数尤度比を用いた関連語Bのフィルタリングを行い、関連語辞書28に格納する見出し語と関連語とのペアを選択する。
ある見出し語wについて関連語rがあるとき、当該wにrがどの程度関連しているかについては、一般に、図3に示したテーブルに従って計算することができる。
図3に示したテーブルにおけるNは、上記の関連語の抽出結果における、見出し語wと関連語rのペアの総数(出現回数の総数)である。c12は、上記の関連語の抽出結果における、見出し語がwで関連語がrのペアの総数である。c1は、上記の関連語の抽出結果における、見出し語がwのペアの数であり、c2は、上記の関連語の抽出結果における、関連語がrのペアの数である。ここから、c12がどれほど偏った値かを対数尤度比を用いて計算する。対数尤度比は以下の(1)式により算出する。
Figure 0005718406
・・・・(1)
(1)式においてOは、図3に記したテーブル中の各セルの値で、すなわち{c12,c1−c12,c2−c12,N−c2−c1+c12}のことである。Eは、Oの期待値である。例えば、c12の期待値はc1×(c2/N)のように求めればよい。
次のステップS110では、フィルタリング処理の結果に基づいて、見出し語Aと関連語Bのペアを関連語辞書28に格納する。本実施の形態では、上述の(1)式により算出した対数尤度比を関連度として用いる。対数尤度比が10.83以上であれば、統計的に有意(p<0.001)に共起していると考えられる。そのため、ステップS110では、各見出し語について、対数尤度比が10.83以上の関連語については、関連語辞書28に格納する。一方、対数尤度比が10.83未満の関連語については、関連語辞書28に格納しない。なお、対数尤度比以外にも共起を表す尺度であれば特に限定されず、カイ二乗値、Tスコア、及び相互情報量等を用いてもよい。
図4には、具体的な一例として、関連語辞書28に収録された見出し語「ラーメン」についての関連語辞書28の項目に対応する各品詞における関連語を示す。対数尤度比によるフィルタリングを行っているため、ラーメンに特に関連している関連語のみから構成されていることが図4に示した項目から分かる。本実施の形態では、このようにフィルタリングを行うことにより、単語(見出し語)に関連度が低い関連語を関連語辞書28に格納するのを抑制することができる。
本実施の形態のカテゴリ辞書36とは、見出し語が属するカテゴリの情報が格納された辞書のことをいう。具体的な一例として、市中のカテゴリ情報が付与された辞書としてWikipediaがある。Wikipediaでは、見出し語について、ユーザによってカテゴリ情報が付与されている。例えば、Wikipediaには、「ラーメン」という見出し語について、「日本の麺料理」というカテゴリが付与されている。本実施の形態では、Wikipediaから見出し語と、その記事に付与されたカテゴリ情報とを抽出して対応付け、カテゴリ辞書36に格納した。
また、本実施の形態の拡張固有表現辞書38とは、見出し語に応じた拡張固有表現タイプを格納した辞書のことをいう。具体的な一例として、本実施の形態では、Wikipediaの見出し語に拡張固有表現タイプを付与した辞書を拡張固有表現辞書38として使用している。なお、拡張固有表現辞書38は、予め作成しておけばよく、具体的な作成方法は、既存の手法を用いればよい(例えば、R. Higashinaka,K. Sadamitsu,K. Saito,T. Makino,and Y. Matsuo:Creating an Extended Named Entity Dictionary from Wikipedia,In Proc. COLING,pp.1163-1178,2012.参照)。なお、本実施の形態において、拡張固有表現タイプとは固有表現を200種類に類型化した場合のタイプをいう。例えば、本実施の形態の拡張固有表現辞書38では、見出し語が「ラーメン」であれば、「Food_Other」という拡張固有表現タイプが付与されている。
単語入力部22は、単語抽出部12から、単語を入力として受け取り、関連語取得部24に所与する機能を有している。
関連語取得部24は、単語入力部22から所与された単語の関連語を、関連語辞書28を参照して取得すると、当該単語及び取得した関連語を発話文生成部34に所与する。また、関連語取得部24は、単語入力部22から所与された単語に応じたカテゴリ情報を、カテゴリ辞書36を参照して取得すると、当該単語及び取得したカテゴリ情報を発話文生成部34に所与する。また、関連語取得部24は、単語入力部22から所与された単語に応じた拡張固有表現タイプを、拡張固有表現辞書38を参照して取得すると、当該単語及び取得した拡張固有表現タイプを発話文生成部34に所与する。
発話文生成部34は、所与された単語、関連語、カテゴリ情報、及び拡張固有表現タイプと、発話文を生成するための雛形となる所定のテンプレート40と、を用いて発話文を生成する機能を有している。
関連語取得部24から所与された関連語を用いて発話文を生成するための雛形となるテンプレート40の具体的な一例として、以下にテンプレート(1)〜テンプレート(6)を示す。
XはQNですか?(例:ラーメンはどんなスープですか?) ・・・テンプレート(1)
XのNはどうですか?(例:ラーメンのスープはどうですか?) ・・・テンプレート(2)
XはVますか?(例:ラーメンは食しますか?) ・・・テンプレート(3)
XはVましたか?(例:ラーメンは食しましたか?) ・・・テンプレート(4)
XはAですか?(例:ラーメンは美味しいですか?) ・・・テンプレート(5)
XはAですね(例:ラーメンは美味しいですね) ・・・テンプレート(6)
テンプレート(1)〜テンプレート(6)において、Xは、所与された単語(例えば「ラーメン」)である。また、Nは、名詞の関連語であり、Aは、形容詞の関連語であり、Vは、動詞の関連語である。また、Qは、Nの疑問詞の関連語である。括弧内は、生成される発話文の例を示している。
なお、Vを用いた発話文を生成する場合には、Vを後続の「ますか?」及び「ましたか?」と接続されるように、連用形に活用して用いる。
関連語取得部24から所与されたカテゴリ情報を用いて発話文を生成するための雛形となるテンプレート40の具体的な一例として、以下にテンプレート(7)を示す。また、関連語取得部24から所与された拡張固有表現タイプを用いて発話文を生成するための雛形となるテンプレート40の具体的な一例として、以下にテンプレート(8)を示す。
EはCですね。(例:織田信長は武将ですね。) ・・・テンプレート(7)
EはTですね。(例:織田信長は人名ですね。) ・・・テンプレート(8)
テンプレート(7)及びテンプレート(8)において、Eは、カテゴリ辞書36の見出し語であり、所与された単語に対応する。また、Cは、Eのカテゴリである。また、Tは、見出し語Eに対して割り当てられた固有表現タイプの日本語のタイプ名(拡張固有表現タイプのそれぞれには日本語のタイプ名が定義されている)である。括弧内は、生成される発話文の例を示している。
本実施の形態の発話文生成部34は、このようにして生成した発話文を全てユーザ提示部16に出力する。
次に、本実施の形態の発話文生成装置20の動作の流れについて図5を参照して説明する。図5には、発話文生成装置20における発話文生成処理の流れの一例のフローチャートを示す。
ステップS200では、単語入力部22が、単語抽出部12から単語が入力されたか否かを判断し、入力されるまで待機状態となり、入力された場合は、入力された単語を関連語取得部24に所与し、ステップS202へ進む。
ステップS202では、関連語取得部24は、関連語辞書28を参照して、所与された単語を見出し語とした関連語を取得し、取得した関連語と単語を発話文生成部34に所与する。また、関連語取得部24は、カテゴリ辞書36を参照して、所与された単語を見出し語としたカテゴリ情報を取得し、取得したカテゴリ情報と単語を発話文生成部34に所与する。また、関連語取得部24は、拡張固有表現辞書38を参照して、所与された単語を見出し語とした拡張固有表現タイプを取得し、取得した拡張固有表現タイプと単語を発話文生成部34に所与する。
次のステップS204では、発話文生成部34が、所与された単語、関連語、及びテンプレート40から発話文を生成する。また、次のステップS206では、所与された単語、カテゴリ情報、及びテンプレート40から発話文を生成する。さらに、次のステップS208では、所与された単語、拡張固有表現タイプ、及びテンプレート40から発話文を生成する。
次のステップS210では、発話文生成部34が、上記ステップS204〜ステップS208の処理により作成した発話文を全て含む発話文リストをユーザ提示部16へ出力した後、本処理を終了する。
ユーザ提示部16は、発話文生成部34から出力された発話文リストから発話文を選択し、選択した発話文をユーザに提示する。図6に示した対話例のような対話が行われる。図6には、ユーザと対話システム10との間で実現できる対話の具体例を示す。
図6に示した対話例では、まず、対話システム10(system)が、システムのプロンプト(初期発話)である、「こんにちは」をユーザに提示する。
当該提示に応じて、ユーザ(you)が、「ラーメンが好きなんです。」とユーザ発話を行うと、単語抽出部12が、ユーザ発話文を形態素解析器14により解析し、対話における話題を表す単語として「ラーメン」を抽出し、発話文生成装置20に出力する。
発話文生成装置20の単語入力部22は、入力された単語である「ラーメン」を関連語取得部24に所与する。関連語取得部24は、関連語辞書28を参照して、「ラーメン」を見出し語とした関連語を取得し、取得した関連語及び単語「ラーメン」を発話文生成部34に出力する。また、関連語取得部24は、カテゴリ辞書36を参照して、「ラーメン」を見出し語としたカテゴリ情報を取得し、取得したカテゴリ情報及び単語「ラーメン」を発話文生成部34に出力する。また、関連語取得部24は、拡張固有表現辞書38を参照して、「ラーメン」を見出し語とした拡張固有表現タイプを取得し、取得した拡張固有表現タイプ及び単語「ラーメン」を発話文生成部34に出力する。
発話文生成部34は、単語と、関連語と、テンプレート40とを用いて発話文を生成する。また、単語と、カテゴリ情報と、テンプレート40とを用いて発話文を生成し、単語と、拡張固有表現タイプと、テンプレート40とを用いて発話文を生成する。図6に示した対話例では、「ラーメンは美味しいですね」、「どんなスープが好きですか?」、及び「ラーメンを食べましたか.ラーメンはどんな麺ですか?」等の発話文を生成し、これら発話文を含む発話文リストをユーザ提示部16に出力する。
上記図6では、ユーザ提示部16は、ユーザとの対話における所定のタイミング(例えば、話題が変わったとみなせるタイミング)まで、発話文生成装置20が生成した発話文リストから発話を繰り返し選択してユーザに提示する。なお、ユーザ提示部16は、ユーザ発話が行われるたびに、単語抽出部12によりユーザ発話文から単語を抽出して発話文生成装置20により生成された発話文をユーザに提示するようにしてもよい。
以上説明したように、本実施の形態の対話システム10では、ユーザとの対話において、単語抽出部12がユーザ発話文から対話における話題を表す単語を抽出する。発話文生成装置20の単語入力部22は、単語抽出部12から入力された単語を関連語取得部24に所与する。関連語取得部24は、関連語辞書28を参照して、所与された単語に関連する関連語を取得し、関連語及び単語を発話文生成部34に所与し、カテゴリ辞書36を参照して、所与された単語に関連するカテゴリ情報を取得し、カテゴリ情報及び単語を発話文生成部34に所与し、拡張固有表現辞書38を参照して、所与された単語に関連する拡張固有表現タイプを取得し、拡張固有表現タイプ及び単語を発話文生成部34に所与する。発話文生成部34は、単語と、関連語と、発話文を生成するための雛形となる所定のテンプレート40と、を用いて、発話文を生成する。また、発話文生成部34は、単語と、カテゴリ情報と、テンプレート40とを用いて発話文を生成する。また、発話文生成部34は、単語と、拡張固有表現タイプと、テンプレート40とを用いて発話文を生成する。生成したこれらの発話文を含む発話文リストが、発話文生成部34からユーザ提示部16へ出力される。ユーザ提示部16は、発話文リストから一つ以上の発話文を選択し、ユーザに提示することにより、システム発話を行う。
このように本実施の形態の対話システム10では、単語抽出部12がユーザ発話文から対話における話題を表す単語を抽出し、当該単語を用いて発話文生成装置20が自動的に発話文を生成するため、ユーザ発話に応じた話題に対応する適切なシステム発話を自動的に生成することができる。
これにより、種々の話題について、低コストで質の高いシステム発話を行う対話システムを実現することができる。雑談等の対話は人間同士では会話の潤滑油として用いられる。質の高い対話を実現可能にすることによって、人間と対話システムとのやりとりがより円滑になり、コンピュータとユーザの共同作業の効率を高めることができる。
なお、本実施の形態では、関連語辞書28、カテゴリ辞書36、及び拡張固有表現辞書38を自動的に構築する場合について説明したが、これらの辞書は、手作業で作成してもよい。また、関連語辞書28、カテゴリ辞書36、及び拡張固有表現辞書38は、発話文生成装置20の外部に備えられていてもよい。同様に、大規模テキストデータ30、言語パターン32、及びテンプレート40も発話文生成装置20の外部に備えられていてもよい。
また、本実施の形態の発話文生成装置20では、発話文生成部34が、関連語を用いて発話文を生成し、カテゴリ情報を用いて発話文を生成し、さらに拡張固有表現タイプを用いて発話文を生成しているが、必ずしも全ての方法で発話文を生成しなくてよい。発話文生成部34は、これらのうち少なくとも一つの方法により発話文を生成すればよい。
また、本実施の形態は一例であり、具体的な構成は本実施の形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれ、状況に応じて変更可能であることは言うまでもない。
10 対話システム
12 単語抽出部
16 ユーザ提示部
20 発話文生成装置
22 単語入力部
24 関連語取得部
25 関連語作成部
26 形態素解析器
28 関連語辞書
36 カテゴリ辞書
38 拡張固有表現辞書
40 テンプレート

Claims (9)

  1. ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成装置であって、
    テキストデータに含まれる文から、予め定められた見出し語について、当該見出し語と共に予め定めた単語および品詞の列からなる言語パターンに基づいて当該見出し語に関連する関連語を取得し、関連語辞書に格納する関連語作成部と、
    前記見出し語と前記見出し語に関する関連語とが対応付けられて格納された前記関連語辞書から、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に関連する関連語を取得する関連語取得部と、
    前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記関連語と、単語と該単語に関連する関連語とを用いて発話文を生成するための雛形となる予め定められたテンプレートと、に基づいて、発話文を生成する発話文生成部と、
    を備えた、発話文生成装置。
  2. ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成装置であって、
    見出し語と該見出し語が属するカテゴリの情報とが対応付けられて格納されたカテゴリ辞書、及び見出し語と該見出し語が属する拡張固有表現タイプとが対応付けられて格納された拡張固有表現辞書の少なくとも一方から、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に応じた前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方を取得する取得部と、
    前記ユーザ発話に含まれる前記単語と、前記取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、単語と該単語が属するカテゴリの情報を用いて発話文を生成するための雛形となる予め定められたテンプレート及び該単語が属する拡張固有表現タイプを用いて発話文を生成するための雛形となる予め定められたテンプレートの少なくとも一方と、に基づいて、前記ユーザ発話に含まれる前記単語と、前記取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、を含む発話文を生成する発話文生成部と、
    を備えた、発話文生成装置。
  3. 前記関連語取得部は、前記関連語辞書から、前記入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に関連する関連語を取得すると共に、見出し語が属するカテゴリの情報とが対応付けられて格納されたカテゴリ辞書、及び見出し語と該見出し語が属する拡張固有表現タイプとが対応付けられて格納された拡張固有表現辞書の少なくとも一方から、前記入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に応じた前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方を取得し、
    前記発話文生成部は、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記関連語と、前記テンプレートと、に基づいて、発話文を生成すると共に、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、単語と該単語が属するカテゴリの情報を用いて発話文を生成するための雛形となる予め定められたテンプレート及び該単語が属する拡張固有表現タイプを用いて発話文を生成するための雛形となる予め定められたテンプレートの少なくとも一方と、に基づいて、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、を含む発話文を生成する、
    請求項1に記載の発話文生成装置。
  4. ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成装置であって、
    テキストデータに含まれる文から、予め定められた見出し語について、当該見出し語と共に予め定めた単語および品詞の列からなる言語パターンに基づいて当該見出し語に関連する関連語を取得し、関連語辞書に格納する関連語作成部、前記見出し語と前記見出し語に関する関連語とが対応付けられて格納された前記関連語辞書、見出し語と該見出し語が属するカテゴリの情報とが対応付けられて格納されたカテゴリ辞書、及び見出し語と該見出し語が属する拡張固有表現タイプとが対応付けられて格納された拡張固有表現辞書の少なくとも一つから、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に関連する前記関連語、当該単語に応じた前記カテゴリの情報、及び当該単語に応じた前記拡張固有表現タイプの少なくとも一つを取得する関連語取得部、及び前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記関連語、前記カテゴリの情報、及び前記拡張固有表現タイプの少なくとも一つと、単語と該単語に関連する関連語とを用いて発話文を生成するための雛形となる予め定められたテンプレート、単語と該単語が属するカテゴリの情報を用いて発話文を生成するための雛形となる予め定められたテンプレート、及び該単語が属する拡張固有表現タイプを用いて発話文を生成するための雛形となる予め定められたテンプレートの少なくとも一つと、に基づいて、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、を含む発話文を生成する発話文生成部を備えた発話文生成装置を用いて、ユーザ発話に対してシステム発話を行う対話装置であって、
    入力されたユーザ発話に対する形態素解析の結果に基づいて、前記ユーザとの対話における話題を表す単語を抽出し、前記発話文生成装置に、前記抽出された単語を入力する単語抽出部と、
    前記発話文生成装置により前記抽出された単語の入力に対して生成された発話文を用いて、前記ユーザ発話に対してシステム発話を提示する提示部と、
    を備えた、対話装置。
  5. ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成方法であって、
    関連語作成部により、テキストデータに含まれる文から、予め定められた見出し語について、当該見出し語と共に予め定めた単語および品詞の列からなる言語パターンに基づいて当該見出し語に関連する関連語を取得し、関連語辞書に格納するステップと、
    関連語取得部により、前記見出し語と前記見出し語に関する関連語とが対応付けられて格納された前記関連語辞書から、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に関連する関連語を取得するステップと、
    発話文生成部により、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記関連語と、単語と該単語に関連する関連語とを用いて発話文を生成するための雛形となる予め定められたテンプレートと、に基づいて、発話文を生成するステップと、
    を備えた、発話文生成方法。
  6. ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成方法であって、
    取得部により、見出し語と該見出し語が属するカテゴリの情報とが対応付けられて格納されたカテゴリ辞書、及び見出し語と該見出し語が属する拡張固有表現タイプとが対応付けられて格納された拡張固有表現辞書の少なくとも一方から、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に応じた前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方を取得するステップと、
    発話文生成部により、前記ユーザ発話に含まれる前記単語と、前記取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、単語と該単語が属するカテゴリの情報を用いて発話文を生成するための雛形となる予め定められたテンプレート及び該単語が属する拡張固有表現タイプを用いて発話文を生成するための雛形となる予め定められたテンプレートの少なくとも一方と、に基づいて、前記ユーザ発話に含まれる前記単語と、前記取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、を含む発話文を生成するステップと、
    を備えた、発話文生成方法。
  7. ユーザ発話に対してシステム発話を行うことによりユーザと対話を行う対話システムにおけるシステム発話に用いる発話文を生成する発話文生成装置であって、
    テキストデータに含まれる文から、予め定められた見出し語について、当該見出し語と共に予め定めた単語および品詞の列からなる言語パターンに基づいて当該見出し語に関連する関連語を取得し、関連語辞書に格納する関連語作成部、前記見出し語と前記見出し語に関する関連語とが対応付けられて格納された前記関連語辞書、見出し語と該見出し語が属するカテゴリの情報とが対応付けられて格納されたカテゴリ辞書、及び見出し語と該見出し語が属する拡張固有表現タイプとが対応付けられて格納された拡張固有表現辞書の少なくとも一つから、入力されたユーザ発話に含まれる単語を前記見出し語として、当該単語に関連する前記関連語、当該単語に応じた前記カテゴリの情報、及び当該単語に応じた前記拡張固有表現タイプの少なくとも一つを取得する関連語取得部、及び
    前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記関連語、前記カテゴリの情報、及び前記拡張固有表現タイプの少なくとも一つと、単語と該単語に関連する関連語とを用いて発話文を生成するための雛形となる予め定められたテンプレート、単語と該単語が属するカテゴリの情報を用いて発話文を生成するための雛形となる予め定められたテンプレート、及び該単語が属する拡張固有表現タイプを用いて発話文を生成するための雛形となる予め定められたテンプレートの少なくとも一つと、に基づいて、前記ユーザ発話に含まれる前記単語と、前記関連語取得部で取得した前記カテゴリの情報及び前記拡張固有表現タイプの少なくとも一方と、を含む発話文を生成する発話文生成部を備えた発話文生成装置を用いて、ユーザ発話に対してシステム発話を行う対話方法であって、
    単語抽出部により、入力されたユーザ発話に対する形態素解析の結果に基づいて、前記ユーザとの対話における話題を表す単語を抽出し、前記発話文生成装置に、前記抽出された単語を入力するステップと、
    提示部により、前記発話文生成装置により前記抽出された単語の入力に対して生成された発話文を用いて、前記ユーザ発話に対してシステム発話を提示するステップと、
    を備えた、対話方法。
  8. コンピュータに、請求項1または請求項2に記載の発話文生成装置の各部として機能させるための発話文生成プログラム。
  9. コンピュータに、請求項4に記載の対話装置の各部として機能させるための対話プログラム。
JP2013101380A 2013-05-13 2013-05-13 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム Active JP5718406B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013101380A JP5718406B2 (ja) 2013-05-13 2013-05-13 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013101380A JP5718406B2 (ja) 2013-05-13 2013-05-13 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム

Publications (2)

Publication Number Publication Date
JP2014222400A JP2014222400A (ja) 2014-11-27
JP5718406B2 true JP5718406B2 (ja) 2015-05-13

Family

ID=52121902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013101380A Active JP5718406B2 (ja) 2013-05-13 2013-05-13 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム

Country Status (1)

Country Link
JP (1) JP5718406B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102509821B1 (ko) * 2017-09-18 2023-03-14 삼성전자주식회사 Oos 문장을 생성하는 방법 및 이를 수행하는 장치
JP7350384B1 (ja) 2022-05-30 2023-09-26 真由美 稲場 対話システム、及び対話方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5073024B2 (ja) * 2010-08-10 2012-11-14 株式会社東芝 音声対話装置
JP5620349B2 (ja) * 2011-07-22 2014-11-05 株式会社東芝 対話装置、対話方法および対話プログラム
JP2013072887A (ja) * 2011-09-26 2013-04-22 Toshiba Corp 対話装置

Also Published As

Publication number Publication date
JP2014222400A (ja) 2014-11-27

Similar Documents

Publication Publication Date Title
CN108874937B (zh) 一种基于词性结合和特征选择的情感分类方法
WO2018034118A1 (ja) 対話システム及びそのためのコンピュータプログラム
JP5403696B2 (ja) 言語モデル生成装置、その方法及びそのプログラム
JP5728527B2 (ja) 発話候補生成装置、発話候補生成方法、及び発話候補生成プログラム
JP6225012B2 (ja) 発話文生成装置とその方法とプログラム
JP2009223463A (ja) 同義性判定装置、その方法、プログラム及び記録媒体
JP5625827B2 (ja) 形態素解析装置、音声合成装置、形態素解析方法及び形態素解析プログラム
CN112016320A (zh) 基于数据增强的英文标点符号添加方法和***及设备
JP5718405B2 (ja) 発話選択装置、方法、及びプログラム、対話装置及び方法
JP2013105436A (ja) 対話モデル構築装置、方法、及びプログラム
CN111339772B (zh) 俄语文本情感分析方法、电子设备和存储介质
JP6649318B2 (ja) 言語情報分析装置および方法
JP2020027548A (ja) キャラクタ属性に応じた対話シナリオを作成するプログラム、装置及び方法
CN106776557B (zh) 情感机器人的情感状态记忆识别方法及装置
KR101333485B1 (ko) 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치
CN110555091A (zh) 一种基于词向量的联想词生成方法及装置
Malandrakis et al. Sail: Sentiment analysis using semantic similarity and contrast features
JP5718406B2 (ja) 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム
JP5964924B2 (ja) 対話装置、方法、及びプログラム
JP2017091368A (ja) 言い換え装置、方法、及びプログラム
JP6126965B2 (ja) 発話生成装置、方法、及びプログラム
JP5722375B2 (ja) 文末表現変換装置、方法、及びプログラム
Simeon et al. Word segmentation algorithms with lexical resources for hashtag classification
JP5744150B2 (ja) 発話生成装置、方法、及びプログラム
JP5506482B2 (ja) 固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141009

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150318

R150 Certificate of patent or registration of utility model

Ref document number: 5718406

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150