JP2018190170A - 発話生成装置、発話生成方法、及び発話生成プログラム - Google Patents

発話生成装置、発話生成方法、及び発話生成プログラム Download PDF

Info

Publication number
JP2018190170A
JP2018190170A JP2017091927A JP2017091927A JP2018190170A JP 2018190170 A JP2018190170 A JP 2018190170A JP 2017091927 A JP2017091927 A JP 2017091927A JP 2017091927 A JP2017091927 A JP 2017091927A JP 2018190170 A JP2018190170 A JP 2018190170A
Authority
JP
Japan
Prior art keywords
information
utterance
unit
user
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017091927A
Other languages
English (en)
Other versions
JP6674411B2 (ja
Inventor
航 光田
Wataru Mitsuta
航 光田
東中 竜一郎
Ryuichiro Higashinaka
竜一郎 東中
松尾 義博
Yoshihiro Matsuo
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017091927A priority Critical patent/JP6674411B2/ja
Publication of JP2018190170A publication Critical patent/JP2018190170A/ja
Application granted granted Critical
Publication of JP6674411B2 publication Critical patent/JP6674411B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】雑談対話システムにおいてユーザ発話に直接含まれない言外の情報を得ることができる発話生成装置、発話生成方法、及び発話生成プログラムを提供する。【解決手段】ユーザ発話と言外の情報との組の集合である用例データ、又はコーパス文書内で共起する述語項構造の組に基づいて、入力部40により入力されたユーザ発話に対応する言外の情報、又はユーザ発話に対応する述語項構造から、言外の情報の候補を生成し、入力部40により入力されたユーザ発話と、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを算出するためのランキングモデルとに基づいて、生成された言外の情報の候補の各々に対して、スコアを算出する。【選択図】図3

Description

本発明は、発話生成装置、発話生成方法、及び発話生成プログラムに関する。
対話システムは、大きく分けて2種類あり、タスク指向型対話システムと非タスク指向型対話システム(雑談対話システム)とに分けられる。近年は、そのエンターテイメント性、ロボットとの日常会話等が注目されていることもあり、雑談対話システムの研究が盛んに行われている。
対話において会話を進めるために、システムの理解をユーザに伝える応答発話は重要である。例えば、ホテル予約を行うタスク指向型対話システムであれば、ユーザ発話を理解した結果を「〜に〜日に泊まりたいのですね」と伝えることで、ユーザはシステムの理解を確認することができる。雑談対話システムであれば、ユーザが発話した内容を繰り返すことで、ユーザの話を理解しているということを示すことができる。
雑談対話システムでは、ユーザ発話からキーワードを抽出し、テンプレートに当てはめることで応答発話を生成することが多い。例えば、「富士山に行きました」という発話から「富士山」というキーワードを抽出し、「〜ですね」というパタンに当てはめることで、「富士山ですね」という応答発話を生成することができる。
本手法の具体的な説明は、非特許文献1に開示されている。
また、近年では、非特許文献2に開示されているように、ユーザ発話から述語項構造と呼ばれる意味構造(述語及びその項からなる構造)を抽出し、抽出した述語項構造を元に応答発話を生成する手法も研究されている。例えば、「富士山に行きました」というユーザ発話から「ユーザ ガ 富士山 ニ 行く」という述語項構造を抽出し、末尾の表現を変えることで、「富士山に行ったんですね」という応答発話を生成することができる。
J. Weizenbaum, "ELIZA-a computer program for the study of natural language communication between man and machine", Communications of the ACM, vol. 9, pp. 36-45, 1966. Ryuichiro Higashinaka, Kenji Imamura, Toyomi Meguro, Chiaki Miyazaki, Nozomi Kobayashi, Hiroaki Sugiyama, Toru Hirano, Hoshiro Makino, Yoshihiro Matsuo, "Towards an open domain conversational system fully based on natural language processing, In Proc. COLING, pp. 928-939, 2014.
既存の雑談対話システムが生成可能な応答発話は、ユーザ発話中の単語、述語項構造等から生成されるため、ユーザ発話中で表層的に表れたものしか生成することができない。そのため、ユーザ発話を単に繰り返して生成しているだけという印象をユーザに与えてしまい、より深く話を聞いていると示すことができない。
本発明は、雑談対話システムにおいてユーザ発話に直接含まれない言外の情報を得ることができる発話生成装置、発話生成方法、及び発話生成プログラムを提供することを目的とする。
上記目的を達成するために、本発明の発話生成装置は、ユーザ発話を入力する入力部と、ユーザ発話と言外の情報との組の集合である用例データ、又はコーパス文書内で共起する述語項構造の組に基づいて、前記入力部により入力された前記ユーザ発話に対応する言外の情報、又は前記ユーザ発話に対応する述語項構造から、前記言外の情報の候補を生成する検索部と、前記入力部により入力された前記ユーザ発話と、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを算出するためのランキングモデルとに基づいて、前記検索部により生成された前記言外の情報の候補の各々に対して、前記スコアを算出する言外の情報ランキング部と、を含む。
なお、前記言外の情報のタイプを識別するためのタイプ識別モデルに基づいて、前記言外の情報の各々に対して前記タイプを識別して付与するタイプ識別部と、前記タイプが付与された前記言外の情報から、前記タイプに関する予め定めた条件を満たす前記言外の情報を出力するタイプフィルタ部と、を更に含むようにしても良い。
また、予め前記タイプが付与された前記言外の情報の集合を収録したデータに基づいて、前記タイプ識別モデルを作成するタイプ識別モデル作成部を更に備え、前記タイプ識別部は、前記タイプ識別モデル作成部により作成された前記タイプ識別モデルに基づいて、前記各々の言外の情報に対して前記タイプを識別して付与するようにしても良い。
また、前記スコアが算出された前記言外の情報の候補のうち、前記スコアが予め定めた条件を満たす前記言外の情報を応答発話として出力する出力部を更に含むようにしても良い。
また、前記出力部により出力される前記言外の情報の各々を発話文に変換する表現変換部を更に含むようにしても良い。
また、ユーザ発話と正例の前記言外の情報との組、及びユーザ発話と負例の前記言外の情報との組に基づいて、前記ユーザ発話及び前記言外の情報の各々を形態素解析し、得られた形態素のうちの語幹同士の組み合わせ、及び前記語幹同士の組み合わせが、正例の組及び負例の組の何れから得られたものであるかに基づいて、前記ランキングモデルを作成するランキングモデル作成部を更に備え、言外の情報ランキング部は、前記入力部により入力された前記ユーザ発話と、前記検索部により生成された前記言外の情報の候補との各々を形態素解析し、得られた形態素のうちの語幹同士の組み合わせと、前記ランキングモデル作成部により作成された前記ランキングモデルとに基づいて、前記言外の情報の候補について前記スコアを算出するようにしても良い。
上記目的を達成するために、本発明の発話生成方法は、入力部、検索部、及び言外の情報ランキング部を含む発話生成装置における発話生成方法であって、前記入力部が、ユーザ発話を入力するステップと、前記検索部が、ユーザ発話と言外の情報との組の集合である用例データ、又はコーパス文書内で共起する述語項構造の組に基づいて、前記入力部により入力された前記ユーザ発話に対応する言外の情報、又は前記ユーザ発話に対応する述語項構造から、前記言外の情報の候補を生成するステップと、前記言外の情報ランキング部が、前記入力部により入力された前記ユーザ発話と、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを算出するためのランキングモデルとに基づいて、前記検索部により生成された前記言外の情報の候補の各々に対して、前記スコアを算出するステップと、を含む。
上記目的を達成するために、本発明の発話生成プログラムは、コンピュータを、上記発話生成装置の各部として機能させるためのプログラムである。
本発明によれば、雑談対話システムにおいてユーザ発話に直接含まれない言外の情報を得ることが可能となる。
実施形態に係る発話生成装置の全体の構成を示すブロック図である。 実施形態に係る学習部の機能的な構成を示すブロック図である。 実施形態に係る発話生成部の機能的な構成を示すブロック図である。 実施形態に係る発話生成処理の流れを示すフローチャートである。
以下、本実施形態について図面を用いて説明する。
本実施形態に係る発話生成装置は、ユーザ発話から推定が可能な情報をもとに、応答発話を生成することで、ユーザ発話に限定されない発話を生成する。本実施形態では、ユーザ発話から推定が可能な情報を「言外の情報」と呼び、当該「言外の情報」を「発話に明示的に表れていなかったとしても、人間が一般に理解することができる情報」と定義する。
具体的には、本実施形態に係る発話生成装置は、ユーザ発話を入力とし、言外の情報を推定した上で、その言外の情報を用いて応答発話を生成する。また、本実施形態に係る発話生成装置は、特に、言外の情報を確認したり質問したりする発話を生成することで、応答発話を生成する。言外の情報の推定では、以下に示す(方法1)及び(方法2)で言外の情報の候補を列挙し、ユーザ発話と各々の言外の情報との候補ペアの尤もらしさを表すスコアを算出し、言外の情報の候補をランキングすることで、言外の情報を推定する。
(方法1)ユーザ発話と言外の情報との組の集合を収録したデータを用意し、入力されたユーザ発話を用いて、データ中のユーザ発話を検索することで、言外の情報の候補を列挙する。
(方法2)文書内で共起する述語項構造の組の集合のデータ(例:<雨が降る、洗濯物が濡れる>)を用意し、ユーザ発話と類似する述語項構造を検索し、データ中で、検索された述語項構造と組み合わせられた述語項構造を言外の情報とみなすことで、言外の情報の候補を列挙する。
(方法1)及び(方法2)の方法で、ユーザ発話に対する言外の情報の候補を列挙し、列挙した候補をランキングすることで、言外の情報の推定を行う。具体的には、ユーザ発話と正しい言外の情報(正例の言外の情報)の組、及び、ユーザ発話と誤った言外の情報(負例の言外の情報)の組を収録したデータをもとに、ユーザ発話に対して言外の情報の尤もらしさを推定する回帰モデルを学習する。学習した回帰モデルを用いて、発話に対する言外の情報の候補の尤もらしさをスコアとして推定した上でランキングを行い、スコアが予め定めた閾値以上の言外の情報を、ユーザ発話に対する言外の情報として推定する。
ユーザ発話に対する言外の情報として推定した言外の情報の中には、様々な種類の情報が含まれ得るため、推定した言外の情報の全てを応答発話として出力してしまうと、ユーザが不快に思う場合がある。例えば、「テストで1番になりました」というユーザ発話に対して、「ユーザは褒められたい」という言外の情報を推定したとき、「あなたは褒められたいんですね」と応答すると、ユーザが不快に思う可能性がある。そのため、予め定義した言外の情報のタイプに基づいて、推定された言外の情報のタイプを推定した後、特定のタイプの言外の情報のみを応答発話として出力する。
推定した言外の情報に対して、言外の情報をそのままの形(例えば、平叙文)、もしくは、末尾を確認の形式(例:「〜なんですね」)、質問の形式(例:「〜なんですか?」)等に変換した形で発話として使用することで、応答発話を出力する。
図1は、本実施形態に係る発話生成装置10の全体の構成を示すブロック図である。図1に示すように、本実施形態に係る発話生成装置10は、学習部12、及び、発話生成部14を備えている。学習部12は、発話生成部14で必要とされるデータ及びモデルを作成する。また、発話生成部14は、学習部12で作成されたデータ及びモデルを元に、ユーザ発話に対する複数の応答発話の集合を、その尤もらしさのスコアを付与した状態で生成する。
図2は、本実施形態に係る発話生成装置10の学習部12の機能的な構成を示すブロック図である。学習部12は、コーパス文書共起データ作成部20、コーパス文書共起データ記憶部22、ランキングモデル作成部24、ランキングモデル記憶部26、タイプ識別モデル作成部28、及び、タイプ識別モデル記憶部30を備えている。
図3は、本実施形態に係る発話生成装置10の発話生成部14の機能的な構成を示すブロック図である。発話生成部14は、入力部40、用例データ記憶部42、検索部44、言外の情報ランキング部46、タイプ識別部48、タイプフィルタ部50、表現変換部52、及び、出力部54を備えている。また、検索部44は、用例検索部44a、及び、共起検索部44bを備えている。
なお、図1中及び図2中の矢印は、各部の入出力関係を表す。また、破線は、各部がそのモデル又はデータを利用することを表す。
コーパス文書共起データ作成部20は、コーパス文書内で共起する述語項構造の組に基づいて、入力部40により入力したユーザ発話に対応する言外の情報から、前記言外の情報の候補を生成し、コーパス文書共起データ記憶部22に記憶させる。
具体的には、まず、入力された文書コーパスからイベントを抽出するために、各文書に対して述語項構造解析を行う。述語項構造解析には、述語及び項が抽出できるツールを利用すると良い。述語及び項が抽出できるツールとしては、例えば、下記非特許文献3に開示されている、出願人が開発したJDEPが挙げられる。
[非特許文献3]Kenji Imamura, Genichiro Kikui, and Norihito Yasuda, "Japanese dependency parsing using scquential labeling for semi-spoken language.", In Proc ACL, 2007.
例えば、以下のように、3つの文書が含まれたブログ文書コーパスを入力として受け付ける。
文書A:「車を運転して、富士山に行った。やはり山が好きだと思った。」
文書B:「富士山に行って、山に登った。景色が綺麗だった。」
文書C:「山が好きなので、富士山に行った。移動するために、車を運転した。」
これに対し、述語項構造解析を行った結果が以下である。なお、「I」(一人称を表す記号)は、ブログの著者を表す。また、述語は動詞で表され、項は名詞として表される。助詞の「ガ」、「ヲ」、及び「二」は項の種類を表し、それぞれ主語、直接目的語、及び間接目的語を表す。
文書A:「Iガ車ヲ運転する」、「Iガ富士山ニ行く」、「Iガ山ガ好き」、「Iガ思う」
文書B:「Iガ富士山ニ行く」、「Iガ山ニ登る」、「景色ガ綺麗」
文書C:「Iガ山ガ好き」、「Iガ富士山ニ行く」、「Iガ移動する」、「Iガ車ヲ運転する」
次に、同一の文書から抽出された述語項構造の全ての組み合わせについて組として抽出し、抽出した組が文書内において共起する共起回数をカウントすることで、下記表1に示す結果が得られる。
最後に、各々の述語項構造の組に対して付与された共起回数に基づいて、共起回数が予め定めた閾値以上の述語項構造の組を共起データとしてコーパス文書共起データ記憶部22に出力する。
上述した例では、例えば、閾値を2とした場合、共起回数が2回以上の述語項構造の組を抽出し、下記表2に示す述語項構造の組が共起データとして出力される。
コーパス文書共起データ記憶部22には、コーパス文書共起データ作成部20により作成されたコーパス文書共起データが記憶される。
ランキングモデル作成部24は、ユーザ発話と正例の言外の情報との組、及びユーザ発話と負例の言外の情報との組に基づいて、ユーザ発話及び言外の情報の各々を形態素解析し、得られた形態素のうちの語幹同士の組み合わせ、及び語幹同士の組み合わせが正例の組及び負例の組の何れから得られたものであるかに基づいて、ランキングモデルを作成し、ランキングモデル記憶部26に記憶させる。ランキングモデルは、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを算出するためのモデルである。
ランキングモデルの作成には、下記表3に示すような、予め人手で作成された、ユーザ発話と正例の言外の情報との組、及びユーザ発話と負例の言外の情報との組のデータを用いる。なお、下記表3におけるフラグは、1が正例を表し、0が負例を表す。また、「I」は、言外の情報が付与されたユーザ発話の話者を表す。
このようなデータを元にランキングモデルの学習を行うために、素性として、ユーザ発話に含まれる形態素と、言外の情報に含まれる形態素との組を用いる。
ここでは、一例として、下記表4に示すユーザ発話と言外の情報とを例に挙げて説明する。ただし、Sは、話者を表す記号である。
下記非特許文献4で開示されている、出願人が開発したJTAG等の形態素解析機を用いて、ユーザ発話と言外の情報との形態素解析を行う。
[非特許文献4]Takeshi Fuchi, and Shinichiro Takagi, "Japanese morphological analyzer using word co-occurrence: JTAG", Proceedings of the 17th international conference on Computational linguistics-Volume 1, Association for Computational Linguistics, 1998.
形態素解析を行うことにより、下記表5に示すような結果を得る。なお、下記表5において、左側の列は表記を表し、中央の列は品詞を表し、右側の列は語幹を表す。
次に、形態素解析の結果を利用して、内容語(文法的な意味を持たず、意味を表す単語)を抽出し、ユーザ発話から抽出した内容語と、言外の情報から抽出した内容語との組を作成する。具体的には、ユーザ発話と言外の情報のそれぞれから、品詞が名詞、動詞語幹、又は形容詞語幹である形態素を抽出し、ユーザ発話から抽出した形態素の各々と、言外の情報から抽出した形態素の各々とを組み合わせることで、下記表6に示すような、内容語の組を作成する。なお、下記表6では、各々の内容語の組を、(ユーザ発話から抽出した形態素,言外の情報から抽出した形態素)として示している。
このようにして内容語の組を作成し、作成した内容語の組と、内容語の組が正例の組及び負例の組の何れから得られたものであるかに基づいて、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを算出するためのランキングモデルを学習する。
学習アルゴリズムには、例えば、ロジスティック回帰を用いれば良い。ロジスティック回帰の詳細は、下記非特許文献5に開示されている。また、ロジスティック回帰以外のアルゴリズムとしては、例えばランキングSVM(Support Vector Machine)等が挙げられる。
[非特許文献5]高村大也,言語処理のための機械学習入門,コロナ社,2010.
最終的に、学習の結果として得られた、内容語の組毎の、ユーザ発話に対する言外の情報の尤もらしさを表す重みの情報を、ランキングモデルとしてランキングモデル記憶部26に記憶させる。
ランキングモデル記憶部26には、ランキングモデル作成部24により作成されたランキングモデルが記憶される。
タイプ識別モデル作成部28は、予めタイプが付与された言外の情報の集合を収録したデータに基づいて、言外の情報のタイプを識別するタイプ識別モデルを作成し、タイプ識別モデル記憶部30に記憶させる。
タイプの種類は、下記表7に示す9種類である。
これらの9種類のタイプは、言外の情報がどのような情報を表しているかという観点で作成されている。各タイプの作成方法、及び詳細な説明は、下記非特許文献6に開示されている。
[非特許文献6]光田 航,東中 竜一郎,松尾 義博,「複数の作業者グループを用いた対話における言外の情報の類型化」,電子情報通信学会技術研究報告 Vol. 116 No. 379 言語理解とコミュニケーション, pp. 13-18, 2016.
本実施形態では、予めタイプが各々の言外の情報に付与されたデータを用いて、言外の情報に対してタイプを識別するためのタイプ識別モデルを学習する。
下記表8に示す言外の情報を例とし、素性の抽出方法を説明する。なお、下記表8で例示されている言外の情報は、「信念1」というタイプに分類される言外の情報である。
言外の情報に対して形態素解析を行うと、下記表9に示すような結果が得られる。下記表9の結果は、出願人が開発したJTAG等の形態素解析機を用いて形態素解析を行った場合の出力結果である。下記表9における左側の列は表記を表し、中央左側の列は品詞を表し、中央右側の列は語幹を表し、右側の列は日本語語彙大系のカテゴリ番号を表す。また、日本語語彙大系のカテゴリ番号[][][]は、左側から順番に、一般名詞意味属性、固有名詞意味属性、用言意味属性を表す。これらの各々の属性については、非特許文献7に開示されている。ただし、Sは、話者を表す記号である。
[非特許文献7]池原 悟,宮崎 正弘,白井 諭,横尾 昭男,中岩 浩巳,小倉 健太郎,大山 芳史,林 良彦,日本語語彙大系,岩波書店,1997.
このような形態素解析の結果から、以下のような素性が得られる。なお、ユニグラムは系列の要素1つずつのことを表し、バイグラムは系列の隣接する要素2つずつを順序付きで組にしたものを表す。また、形態素は、形態素解析の結果として得られた各形態素の語幹を表す。
形態素ユニグラム:「S」、「は」、「富士山」、「が」、「好き」、「だ」
形態素バイグラム:「S-は」、「は-富士山」、「富士山-が」、「が-好き」、「好き-だ」
一般名詞意味属性ユニグラム:「471」、「1300」
一般名詞意味属性バイグラム:「471−1300」
用言意味属性ユニグラム:「11」
用言意味属性バイグラム:なし
一般名詞意味属性と用言意味属性とのカテゴリ番号が複数存在する場合には、最も左側のカテゴリ番号が、上記JTAGが最も適切と判定したカテゴリ番号であることを考慮し、最も左側のカテゴリ番号のみを用いる。
これらの素性を用いて、言外の情報を入力として、そのタイプを出力するモデルを学習する。学習アルゴリズムには、多クラス分類が可能なSVMを利用すれば良い。多クラス分類については、上記非特許文献5に詳しく開示されている。
タイプ識別モデル記憶部30には、タイプ識別モデル作成部28により作成されたタイプ識別モデルが記憶される。
入力部40は、1つのユーザ発話を入力し、入力したユーザ発話を、用例検索部44a、共起検索部44b、及び言外の情報ランキング部46に出力する。例えば、ユーザ発話として下記表10に示すユーザ発話が入力され、入力されたユーザ発話が、用例検索部44a、共起検索部44b、及び言外の情報ランキング部46に出力される。
なお、入力部40は、ユーザ発話の他に、当該ユーザ発話の前までの対話文脈(発話が系列になったもの)を入力として受け付けても良い。
用例データ記憶部42には、ユーザ発話と言外の情報との組の集合である用例データが記憶されている。
用例検索部44aは、用例データ記憶部42に記憶されている用例データに基づいて、入力部40により入力されたユーザ発話に対応する言外の情報から、言外の情報の候補を生成する。
具体的には、まず、入力部40により入力されたユーザ発話、及び、用例データ中のユーザ発話を、word2vecを用いてベクトルに変換する。word2vecは、テキストコーパスを用いて学習を行うことで、任意のテキストを固定長のベクトルに変換する一般的な手法である。
word2vecの学習には、Wikipedia(登録商標)等のコーパス文書を用いる。この際、コーパス文書共起データ作成部で用いたコーパス文書と同じコーパス文書を用いても良い。具体的な学習方法は、下記非特許文献8に開示されている。
[非特許文献8]Tomas Mikolov, Kai Chen, and Jeffrey Dean, "Efficient estimation of word representation in vector space", CoRR, Vol. abs/1301.3781, 2013.
word2vecを用いてベクトルに変換した、入力部40により入力されたユーザ発話と、用例データ中のユーザ発話との類似度の計算には、コサイン類似度を用いれば良い。コサイン類似度は、ベクトル間の類似度を測るために用いられる一般的な尺度であり、下記(1)式で表される。なお、下記(1)式における



とはベクトルを表し、

はコサイン類似度を表す。

・・・(1)
入力部40により入力されたユーザ発話と、用例データ中のユーザ発話との類似度を計算し、用例データ中で、コサイン類似度が閾値以上であるユーザ発話と組になっている言外の情報を、言外の情報の候補として出力する。
ユーザ発話として「紅葉を見に富士山に行きました」というユーザ発話に対する処理の一例を以下に示す。下記表11に、用例データの一例を示す。
下記表12は、入力部40により入力されたユーザ発話と、用例データ中のユーザ発話とをベクトル化し、類似度を計算した結果を示す。
上記表12において、類似度の閾値を0.8とすると、下記表13に示すように、類似度が閾値以上のであるユーザ発話と組になっている言外の情報を、言外の情報の候補として言外の情報ランキング部46に出力する。
共起検索部44bは、コーパス文書共起データ記憶部22にコーパス文書共起データとして記憶されている、コーパス文書内で共起する述語項構造の組に基づいて、ユーザ発話に対応する述語項構造から、言外の情報の候補を生成する。
言外の情報の候補を検索する際には、コーパス文書共起データ記憶部22に記憶されているコーパス文書共起データを読み出し、読み出したコーパス文書共起データに対して、入力部40により入力されたユーザ発話と類似した述語項構造を検索する。そして、述語項構造の組において、検索された述語項構造と組み合わせている述語項構造を言外の情報の候補として言外の情報ランキング部46に出力する。
なお、入力部40により入力されたユーザ発話と類似した述語項構造を検索する方法としては、上述した用例検索部44aと同様にベクトル間の類似度を用いた方法が挙げられる。
言外の情報ランキング部46は、入力部40により入力されたユーザ発話と、ランキングモデル記憶部26に記憶されているランキングモデルとに基づいて、用例検索部44a又は共起検索部44bにより生成された言外の情報の候補の各々に対して、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを算出する。
下記表14に、入力部40により入力されたユーザ発話を示し、下記表15に、言外の情報の候補を示す。
下記表16に、このような例において算出された、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを示す。
下記表17に示すように、算出したスコアが閾値(例えば、0.2)以上の言外の情報を、スコアを昇順に並べたランキング形式で、タイプ識別部48に出力する。
タイプ識別部48は、タイプ識別モデル記憶部30に記憶されているタイプ識別モデルに基づいて、言外の情報の各々に対してタイプを識別して付与する。
例えば、下記表18に示される言外の情報を入力したとする。
このような場合には、下記表19に示されるように、各々の言外の情報にタイプが付与される。
タイプフィルタ部50は、タイプが付与された言外の情報から、タイプに関する予め定めた条件を満たす言外の情報を、表現変換部52に出力する。
予め定めた条件を満たす言外の情報の選択方法としては、例えば、出力する言外の情報のタイプを予め列挙した設定ファイルを記憶させておき、この設定ファイルに含まれるタイプの言外の情報のみを選択する方法が挙げられる。
例えば、設定ファイルに「事実1」のタイプ、及び「事実2」のタイプのみが列挙されているとする。この場合に、下記表20に示す、タイプが付与された言外の情報が入力された場合、上記設定ファイルを用いて、下記表21に示す言外の情報が選択される。
このように、タイプが付与された言外の情報を、タイプに基づいてフィルタリングすることで、例えば「Sは褒められたい」というように、ユーザに発話すべきでない可能性がある言外の情報を、出力対象の言外の情報から除外することができる。なお、予め定めた条件を満たす言外の情報の選択方法としては、例えば、出力すべきでない言外の情報のタイプを予め列挙した設定ファイルを記憶させておいてもよい。
表現変換部52は、タイプフィルタ部50により出力された言外の情報の各々を、発話文に変換し、出力部54に出力する。
言外の情報の表現を変換する際には、言外の情報の末尾を「〜ですね」と変換することで、確認の形式に変換する。変換方法はこれに限らず、言外の情報の末尾を「〜なんですか?」と変換することで質問の形式にしても良い。また、変換を行わず、言外の情報をそのまま応答発話として出力しても良い。
下記表22に示すような言外の情報を入力した場合には、各々の言外の情報は、下記表23に示すような表現に変換される。なお、下記表22では、言外の情報のみを示している。
出力部54は、スコアが算出された言外の情報のうち、スコアが予め定めた条件を満たす言外の情報を、スコアを付与した状態で、応答発話として出力する。出力方法としては、応答発話を示すデータをディスプレイ等の表示手段に表示させたり、応答発話を示すデータを外部装置に送信したり、応答発話を示す音声を音声出力手段により出力させたりする方法が挙げられる。
下記表24に示すような、スコアが付与された言外の情報を入力した場合には、スコアに基づき、下記表25に示すような、スコアが予め定めた閾値(例えば、0.5)以上の言外の情報が、スコアが付与された状態で、応答発話として出力される。
なお、本実施形態に係る発話生成装置10は、例えば、CPU(Central Processing Unit)、RAM(Random Access Memory)、各種プログラムを記憶するROM(Read Only Memory)を備えたコンピュータ装置で構成される。また、発話生成装置10を構成するコンピュータは、ハードディスクドライブ、不揮発性メモリ等の記憶部を備えていても良い。本実施形態では、CPUがROM、ハードディスク等の記憶部に記憶されているプログラムを読み出して実行することにより、上記のハードウェア資源とプログラムとが協働し、上述した機能が実現される。
次に、本実施形態に係る発話生成装置10による発話生成処理の流れを、図4に示すフローチャートを用いて説明する。本実施形態では、発話生成装置10に、発話生成処理の実行を開始するための予め定めたデータが入力されたタイミングで発話生成処理が開始されるが、発話生成処理が開始されるタイミングはこれに限らず、例えば、対話ルールを示すデータが入力されたタイミングで発話生成処理が開始されても良い。
ステップS101では、入力部40が、ユーザ発話を入力する。
ステップS103では、用例検索部44aが、ユーザ発話と言外の情報との組の集合である用例データに基づいて、入力部40により入力されたユーザ発話に対応する言外の情報から、言外の情報の候補を生成する。
ステップS105では、共起検索部44bが、コーパス文書共起データである、コーパス文書内で共起する述語項構造の組に基づいて、入力部40により入力されたユーザ発話に対応する述語項構造から、言外の情報の候補を生成する。
ステップS107では、言外の情報ランキング部46が、入力部40により入力されたユーザ発話と、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを算出するためのランキングモデルとに基づいて、用例検索部44a又は共起検索部44bにより生成された言外の情報の候補の各々に対して、スコアを算出する。
ステップS109では、タイプ識別部48が、言外の情報のタイプを識別するためのタイプ識別モデルに基づいて、言外の情報の各々に対してタイプを識別して付与する。
ステップS111では、タイプフィルタ部50が、タイプが付与された言外の情報から、タイプに基づいてフィルタリングし、タイプに関する予め定めた条件を満たす言外の情報のみを出力する。
ステップS113では、表現変換部52が、言外の情報の各々を、表現を変換することにより発話文に変換する。
ステップS115では、出力部54が、スコアが算出された言外の情報の候補のうち、スコアが予め定めた条件を満たす言外の情報を応答発話として出力し、本発話生成処理のプログラムの実行を終了する。
このように、本実施形態では、入力されたユーザ発話と言外の情報との組の集合である用例データ、又はコーパス文書内で共起する述語項構造の組に基づいて、入力されたユーザ発話に対応する言外の情報、又はユーザ発話に対応する述語項構造から、言外の情報の候補を生成する。また、入力されたユーザ発話と、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを算出するためのランキングモデルとに基づいて、生成された言外の情報の候補の各々に対して、スコアを算出する。また、スコアが算出された言外の情報の候補のうち、スコアが予め定めた条件を満たす言外の情報を応答発話として出力する
これにより、言外の情報を用いた応答発話を生成することにより、雑談対話システムがユーザの発話内容に限定されない、様々な内容を応答することができる。話をしっかり理解しているとユーザに伝えることができるため、より長く使ってもらえる対話システムが実現される。
なお、本実施形態では、図1乃至図3に示す機能の構成要素の動作をプログラムとして構築し、発話生成装置10として利用されるコンピュータにインストールして実行させるが、これに限らず、ネットワークを介して流通させても良い。
また、構築されたプログラムをハードディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールしたり、配布したりしても良い。
10 発話生成装置
12 学習部
14 発話生成部
20 コーパス文書共起データ作成部
22 コーパス文書共起データ記憶部
24 ランキングモデル作成部
26 ランキングモデル記憶部
28 タイプ識別モデル作成部
30 タイプ識別モデル記憶部
40 入力部
42 用例データ記憶部
44 検索部
44a 用例検索部
44b 共起検索部
46 言外の情報ランキング部
48 タイプ識別部
50 タイプフィルタ部
52 表現変換部
54 出力部

Claims (8)

  1. ユーザ発話を入力する入力部と、
    ユーザ発話と言外の情報との組の集合である用例データ、又はコーパス文書内で共起する述語項構造の組に基づいて、前記入力部により入力された前記ユーザ発話に対応する言外の情報、又は前記ユーザ発話に対応する述語項構造から、前記言外の情報の候補を生成する検索部と、
    前記入力部により入力された前記ユーザ発話と、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを算出するためのランキングモデルとに基づいて、前記検索部により生成された前記言外の情報の候補の各々に対して、前記スコアを算出する言外の情報ランキング部と、
    を含む発話生成装置。
  2. 前記言外の情報のタイプを識別するためのタイプ識別モデルに基づいて、前記言外の情報の各々に対して前記タイプを識別して付与するタイプ識別部と、
    前記タイプが付与された前記言外の情報から、前記タイプに関する予め定めた条件を満たす前記言外の情報を出力するタイプフィルタ部と、を更に含む
    請求項1記載の発話生成装置。
  3. 予め前記タイプが付与された前記言外の情報の集合を収録したデータに基づいて、前記タイプ識別モデルを作成するタイプ識別モデル作成部を更に備え、
    前記タイプ識別部は、前記タイプ識別モデル作成部により作成された前記タイプ識別モデルに基づいて、前記各々の言外の情報に対して前記タイプを識別して付与する
    請求項2記載の発話生成装置。
  4. 前記スコアが算出された前記言外の情報の候補のうち、前記スコアが予め定めた条件を満たす前記言外の情報を応答発話として出力する出力部を更に含む
    請求項1〜3の何れか1項記載の発話生成装置。
  5. 前記出力部により出力される前記言外の情報の各々を発話文に変換する表現変換部を更に含む
    請求項4記載の発話生成装置。
  6. ユーザ発話と正例の前記言外の情報との組、及びユーザ発話と負例の前記言外の情報との組に基づいて、前記ユーザ発話及び前記言外の情報の各々を形態素解析し、得られた形態素のうちの語幹同士の組み合わせ、及び前記語幹同士の組み合わせが、正例の組及び負例の組の何れから得られたものであるかに基づいて、前記ランキングモデルを作成するランキングモデル作成部を更に備え、
    言外の情報ランキング部は、前記入力部により入力された前記ユーザ発話と、前記検索部により生成された前記言外の情報の候補との各々を形態素解析し、得られた形態素のうちの語幹同士の組み合わせと、前記ランキングモデル作成部により作成された前記ランキングモデルとに基づいて、前記言外の情報の候補について前記スコアを算出する
    請求項1〜5の何れか1項記載の発話生成装置。
  7. 入力部、検索部、及び言外の情報ランキング部を含む発話生成装置における発話生成方法であって、
    前記入力部が、ユーザ発話を入力するステップと、
    前記検索部が、ユーザ発話と言外の情報との組の集合である用例データ、又はコーパス文書内で共起する述語項構造の組に基づいて、前記入力部により入力された前記ユーザ発話に対応する言外の情報、又は前記ユーザ発話に対応する述語項構造から、前記言外の情報の候補を生成するステップと、
    前記言外の情報ランキング部が、前記入力部により入力された前記ユーザ発話と、ユーザ発話に対する言外の情報の尤もらしさを表すスコアを算出するためのランキングモデルとに基づいて、前記検索部により生成された前記言外の情報の候補の各々に対して、前記スコアを算出するステップと、
    を含む発話生成方法。
  8. コンピュータを、請求項1〜6の何れか1項記載の発話生成装置の各部として機能させるための発話生成プログラム。
JP2017091927A 2017-05-02 2017-05-02 発話生成装置、発話生成方法、及び発話生成プログラム Active JP6674411B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017091927A JP6674411B2 (ja) 2017-05-02 2017-05-02 発話生成装置、発話生成方法、及び発話生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017091927A JP6674411B2 (ja) 2017-05-02 2017-05-02 発話生成装置、発話生成方法、及び発話生成プログラム

Publications (2)

Publication Number Publication Date
JP2018190170A true JP2018190170A (ja) 2018-11-29
JP6674411B2 JP6674411B2 (ja) 2020-04-01

Family

ID=64478489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017091927A Active JP6674411B2 (ja) 2017-05-02 2017-05-02 発話生成装置、発話生成方法、及び発話生成プログラム

Country Status (1)

Country Link
JP (1) JP6674411B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006039120A (ja) * 2004-07-26 2006-02-09 Sony Corp 対話装置および対話方法、並びにプログラムおよび記録媒体
JP2014238726A (ja) * 2013-06-07 2014-12-18 日本電信電話株式会社 反義分類モデル学習装置、反義分類装置、方法、及びプログラム
JP2015075952A (ja) * 2013-10-09 2015-04-20 日本電信電話株式会社 発話生成装置、方法、及びプログラム
US20150228276A1 (en) * 2006-10-16 2015-08-13 Voicebox Technologies Corporation System and method for a cooperative conversational voice user interface
JP2015225416A (ja) * 2014-05-26 2015-12-14 日本電信電話株式会社 モデル学習装置、ランキング装置、方法、及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006039120A (ja) * 2004-07-26 2006-02-09 Sony Corp 対話装置および対話方法、並びにプログラムおよび記録媒体
US20150228276A1 (en) * 2006-10-16 2015-08-13 Voicebox Technologies Corporation System and method for a cooperative conversational voice user interface
JP2014238726A (ja) * 2013-06-07 2014-12-18 日本電信電話株式会社 反義分類モデル学習装置、反義分類装置、方法、及びプログラム
JP2015075952A (ja) * 2013-10-09 2015-04-20 日本電信電話株式会社 発話生成装置、方法、及びプログラム
JP2015225416A (ja) * 2014-05-26 2015-12-14 日本電信電話株式会社 モデル学習装置、ランキング装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP6674411B2 (ja) 2020-04-01

Similar Documents

Publication Publication Date Title
US10936664B2 (en) Dialogue system and computer program therefor
JP4745094B2 (ja) クラスタリングシステム、クラスタリング方法、クラスタリングプログラムおよびクラスタリングシステムを用いた属性推定システム
JP6310150B2 (ja) 意図理解装置、方法およびプログラム
Rasooli et al. Joint parsing and disfluency detection in linear time
WO2016067418A1 (ja) 対話制御装置および対話制御方法
US20080059190A1 (en) Speech unit selection using HMM acoustic models
US12001465B2 (en) Response selecting apparatus, response selecting method, and response selecting program
JP2019101064A (ja) 応答文生成装置、方法及びプログラム並びに音声対話システム
US10403271B2 (en) System and method for automatic language model selection
Adel et al. Features for factored language models for code-Switching speech.
Le Zhang et al. Enhancing low resource keyword spotting with automatically retrieved web documents
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
JP4755478B2 (ja) 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体
JP2017125921A (ja) 発話選択装置、方法、及びプログラム
Ahmad et al. Urdu speech and text based sentiment analyzer
Chennoufi et al. Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization
JP5158022B2 (ja) 対話処理装置、対話処理方法、及び対話処理プログラム
JP6126965B2 (ja) 発話生成装置、方法、及びプログラム
JP5722375B2 (ja) 文末表現変換装置、方法、及びプログラム
JP6674411B2 (ja) 発話生成装置、発話生成方法、及び発話生成プログラム
JP6067616B2 (ja) 発話生成手法学習装置、発話生成手法選択装置、発話生成手法学習方法、発話生成手法選択方法、プログラム
JP2013109738A (ja) 意味ラベル付与モデル学習装置、意味ラベル付与装置、意味ラベル付与モデル学習方法、及びプログラム
Tran SentiVoice-a system for querying hotel service reviews via phone
JP2020064630A (ja) 文章記号挿入装置及びその方法
Abdulhameed Cross Language Information Transfer Between Modern Standard Arabic and Its Dialects–a Framework for Automatic Speech Recognition System Language Model

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200306

R150 Certificate of patent or registration of utility model

Ref document number: 6674411

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150