JP7124565B2 - 対話方法、対話プログラム及び情報処理装置 - Google Patents

対話方法、対話プログラム及び情報処理装置 Download PDF

Info

Publication number
JP7124565B2
JP7124565B2 JP2018160641A JP2018160641A JP7124565B2 JP 7124565 B2 JP7124565 B2 JP 7124565B2 JP 2018160641 A JP2018160641 A JP 2018160641A JP 2018160641 A JP2018160641 A JP 2018160641A JP 7124565 B2 JP7124565 B2 JP 7124565B2
Authority
JP
Japan
Prior art keywords
information
answer
related information
sentence
utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018160641A
Other languages
English (en)
Other versions
JP2020034694A (ja
Inventor
哲朗 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018160641A priority Critical patent/JP7124565B2/ja
Publication of JP2020034694A publication Critical patent/JP2020034694A/ja
Application granted granted Critical
Publication of JP7124565B2 publication Critical patent/JP7124565B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、対話方法、対話プログラム及び情報処理装置に関する。
近年では、ユーザとシステムとがテキストデータによって対話を行う対話システムが普及しつつある。この対話システムの1つとして、スロットフィリング形式の対話を行うものが知られている。
スロットフィリング形式の対話を行う対話システムでは、予め用意された項目について、各項目の値を埋めるための質問文を順番にユーザに提示し、ユーザが回答を入力すると、この回答を項目の値として取得し、特定の処理を実行する。また、この対話システムでは、ユーザに対し、自身の回答の内容を提示することで、対話システムに回答が伝わったか否かを確認させるものもある。
特開2016-71050号公報
上述した対話システムでは、入力された回答を繰り返し提示する機械的な手法で、対話システムに回答が伝わったか否かをユーザに確認させる。このため、上述した対話システムでは、ユーザが回答する回数が増えるにつれて、ユーザに違和感や不自然さを感じさせることになり、自然な対話の継続に支障をきたす可能性がある。
1つの側面では、本発明は、ユーザとの自然な対話を継続させることを目的としている。
一つ態様では、コンピュータによる対話方法であって、前記コンピュータが、ユーザの発話情報を取得し、取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、抽出した関連情報を出力する。
上記各手順は、上記各手順を実現する機能部、各手順を実現する処理としても良く、各処理をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体とすることもできる。
ユーザとの自然な対話を継続させることができる。
対話システムの概要を説明する図である。 対話システムのシステム構成の一例を説明する図である。 対話装置のハードウェア構成の一例を示す図である。 テーブル記憶部に保持されたスロットテーブルの一例を示す図である。 対話処理部の機能について説明する図である。 関連情報テーブルの一例を示す図である。 固有表現抽出学習部の処理を説明するフローチャートである。 対話処理部の処理を説明する第一のフローチャートである。 対話処理部の処理を説明する第二のフローチャートである。 対話処理部の処理を説明する第三のフローチャートである。
以下に、図面を参照して、本実施形態について説明する。図1は、対話システムの概要を説明する図である。
本実施形態の対話システム100は、対話装置200と、端末装置300とを含み、対話装置200と端末装置300とは、ネットワークを介して接続される。
本実施形態の対話システム100において、対話装置200は、特定の目的を持った対話を実現するアルゴリズムの一つである、スロットフィリング形式の対話を行う対話装置である。
具体的には、対話装置200は、端末装置300に対して、予め用意された項目の値を入力させる質問文を出力する(ステップS1)。そして、対話装置200は、端末装置300において、質問文に対する回答が入力され、端末装置300から回答を示す情報を受信すると、この回答を示す情報を、質問文に含まれる項目の値として取得し、特定の目的に応じた処理を実行する(ステップS2)。
また、本実施形態の対話装置200は、回答を示す情報を受信すると、回答と関連する関連情報を取得する。そして、対話装置200は、取得した関連情報の中から、回答の属性を示す関連情報を選択し、回答に対する応答として、端末装置300に表示させる(ステップS3)。以下の説明では、回答に対する応答を、回答に対する相槌、回答に対する相槌文等と表現する場合がある。
図1の例では、対話装置200は、「行き先(目的地)と人数に応じた移動ルートを提示する」という目的を持った対話を実現するものである。
本実施形態の対話装置200は、端末装置300のユーザPに対して、予め用意された項目の1つである「行き先」の回答を入力させるための質問文Q1を生成し、端末装置300の画面301に表示させる。
尚、画面301は、端末装置300において、対話装置200との対話の開始を指示する操作が行われると、端末装置300に表示される画面の一例である。
本実施形態の端末装置300は、画面301において、入力欄302に回答文(発話文)A1が入力されると、回答文A1を質問文Q1と対応付けて表示させ、回答文A1を示す情報を対話装置200に送信する。
以下の説明では、質問文を示す情報を質問情報と呼び、回答文(発話文)を示す情報を、発話情報と呼ぶ場合がある。また、以下の説明では、発話情報に含まれる文字列であって、質問文に含まれる項目の値となる文字列を、回答、又は、回答となる文字列と呼ぶ場合がある。
本実施形態の対話装置200は、端末装置300から回答文A1を示す発話情報を受信すると、発話情報から、項目「行き先」の値を示す文字列を、回答として抽出する。図1の例では、項目「行き先」の値となる文字列(回答)は、「シカゴ」であるため、文字列「シカゴ」が、回答として抽出される。
本実施形態の対話装置200は、発話情報から回答を抽出すると、外部の情報源を検索して回答の関連情報を取得し、取得した回答情報の中から、回答の属性を示す関連情報を選択する。
そして、対話装置200は、選択した関連情報を含む相槌文を、端末装置300に表示させる。
また、対話装置200は、相槌文を表示させた後に、次の項目の値を入力させるための質問文を端末装置300に表示させる。
図1の例では、質問文Q1に含まれる項目は「行き先」であり、この項目の属性は、「場所」である。したがって、項目「行き先」の値である回答の属性も、「場所」である。
よって、対話装置200は、回答「シカゴ」に基づき取得した関連情報の中から、「シカゴ」が「場所」を示している関連情報R1を選択し、関連情報R1を含む相槌文H1を生成して、端末装置300の画面301に表示させる。
図1の例では、相槌文H1として、「シカゴは、ボブ・○○さんの出身地で有名です。」というテキストデータが表示されており、この中に含まれる関連情報R1である「シカゴは、ボブ・デービッドソンの出身地で有名」は、「シカゴ」という場所を示していることがわかる。また、相槌文H1において、関連情報R1には、回答となる文字列「シカゴ」が含まれることがわかる。
また、相槌文H1は、回答文A1を受けた応答として表示されており、相槌文H1が回答文A1と対応付けられていることがわかる。
本実施形態では、対話装置200は、相槌文H1を画面301に表示させると、次に、項目「同行者」の値を入力させるための質問文Q2を端末装置300の画面301に表示させる。
このように、本実施形態の対話装置200は、回答に関連する関連情報の中から、回答の属性を示す関連情報を選択し、選択された関連情報を、回答を受け付けたことを確認させる相槌文として、端末装置300に表示させる。
言い換えれば、対話装置200は、ユーザに対する質問文を表示させ、質問文に対する回答を含む発話文の入力を受け付けると、回答と、回答と関連する関連情報と、を含む応答文(相槌文)を生成し、発話文と対応付けて表示させる。以下の説明では、応答文(相槌文)を示す情報を応答情報と表現する場合がある。
したがって、本実施形態によれば、対話装置200から出力される相槌文は、回答の属性に応じて異なるものとなり、ユーザの回答に対して、変化に富んだ相槌文を出力することができる。
また、本実施形態によれば、相槌文に、回答と、回答の属性に基づき選択された関連情報とを含めるため、ユーザに対し、対話装置200による回答の内容の理解の度合いを提示することができる。したがって、本実施形態では、ユーザに対し、対話装置200が回答を正しく理解しているか否かを確認させることができる。
これらのことから、本実施形態によれば、ユーザとの自然な対話を継続させることに貢献できる。
以下に、本実施形態の対話システム100について、さらに説明する。図2は、対話システムのシステム構成の一例を説明する図である。
本実施形態の対話システム100の対話装置200は、対話処理部210、固有表現抽出学習部220、モデル記憶部230、テーブル記憶部240を有する。
また、本実施形態の対話装置200は、端末装置300以外に、例えば、情報源400と、固有表現タグ付きコーパス500と、ネットワークを介して接続される。
情報源400は、例えば、ネットワーク上に構築されたデータベース群であり、様々な情報が格納されている。情報源400は、対話処理部210により参照される。
固有表現タグ付きコーパス500は、人名、場所、組織名、製品名等の固有名詞に対して、その範囲を示す構造が予めメタデータとして付与されている文書集合である。
尚、図2の例では、情報源400と固有表現タグ付きコーパス500は、対話システム100の外部に設けられるものとしたが、これに限定されない。情報源400と固有表現タグ付きコーパス500は、対話システム100に含まれていても良い。また、情報源400と固有表現タグ付きコーパス500は、それぞれが対話装置200に設けられていても良い。
本実施形態の対話処理部210は、端末装置300のユーザとの対話を実現するための対話処理を実行する。具体的には、対話処理部210は、テーブル記憶部240が保持しているスロットテーブル241を参照して、質問情報を生成する。
また、本実施形態の対話処理部210は、モデル記憶部230が保持している固有表現抽出モデル231に、回答に関連する関連情報を入力して得られた結果に基づき、関連情報の中から、回答の属性を示す関連情報を選択し、応答情報を生成する。対話処理部210の詳細は後述する。
固有表現抽出学習部220は、対話処理部210による対話処理を実行する前の事前処理として、固有表現タグ付きコーパス500を用いて固有表現抽出モデル231を生成し、モデル記憶部230に格納する。固有表現抽出モデル231は、対話処理部210による応答情報の生成の際に用いられる。
本実施形態の固有表現抽出学習部220は、固有表現タグ付きコーパス500に含まれる文脈情報のみの学習によって、固有表現抽出モデル231を生成する。
本実施形態の固有表現抽出モデル231は、関連情報が入力されると、関連情報の文脈に基づき、関連情報が回答の属性を示す確率を示すスコアを出力する。固有表現抽出学習部220の処理の詳細は後述する。
モデル記憶部230は、固有表現抽出モデル231を保持するための記憶領域である。テーブル記憶部240は、対話処理部210により参照されるスロットテーブル241を保持するための記憶領域である。
次に、図3を参照して、本実施形態の対話装置200のハードウェア構成について説明する。図3は、対話装置のハードウェア構成の一例を示す図である。
本実施形態の対話装置200は、それぞれバスBで相互に接続されている入力装置21、出力装置22、ドライブ装置23、補助記憶装置24、メモリ装置25、演算処理装置26及びインターフェース装置27を含む情報処理装置である。
入力装置21は、各種の情報の入力を行うための装置であり、例えばキーボードやポインティングデバイス等により実現される。出力装置22は、各種の情報の出力を行うためものであり、例えばディスプレイ等により実現される。インターフェース装置27は、LANカード等を含み、ネットワークに接続する為に用いられる。
本実施形態の対話処理部210、固有表現抽出学習部220を実現する対話プログラムは、対話装置200を制御する各種プログラムの少なくとも一部である。対話プログラムは例えば記憶媒体28の配布やネットワークからのダウンロード等によって提供される。対話プログラムを記録した記憶媒体28は、CD-ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記憶媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記憶媒体を用いることができる。
また、対話プログラムは、対話プログラムを記録した記憶媒体28がドライブ装置23にセットされると、記憶媒体28からドライブ装置23を介して補助記憶装置24にインストールされる。ネットワークからダウンロードされた対話プログラムは、インターフェース装置27を介して補助記憶装置24にインストールされる。
補助記憶装置24は、インストールされた対話プログラムを格納すると共に、上述した固有表現抽出モデル231やスロットテーブル241等の必要なファイル、データ等を格納する。メモリ装置25は、対話装置200の起動時に補助記憶装置24から対話プログラムを読み出して格納する。そして、演算処理装置26はメモリ装置25に格納された対話プログラムに従って、後述するような各種処理を実現している。
次に、図4を参照して、本実施形態のスロットテーブル241について説明する。図4は、テーブル記憶部に保持されたスロットテーブルの一例を示す図である。
本実施形態のスロットテーブル241は、対話システム100毎に予め用意されて、テーブル記憶部240に保持されている。
本実施形態のスロットテーブル241は、情報の項目として、スロット名と、タイプと、スロット値とを有する。
項目「スロット名」の値は、対話装置200から端末装置300に送信される質問情報に含まれる項目の名称を示す。言い換えれば、項目「スロット名」の値は、端末装置300に表示される質問文に含まれる項目であり、端末装置300のユーザに値を入力させる項目である。
項目「タイプ」の値は、対応するスロット名の属性を示す。言い換えれば、項目「タイプ」の値は、質問文に含まれる項目の属性(発話文に含まれる回答の属性)を示す。
項目「スロット値」の値は、発話情報から抽出された、質問情報に含まれる項目の値を示す。言い換えれば、項目「スロット値」の値は、質問文に対する発話文に含まれる回答である。
図4の例では、スロット名「行き先」と、タイプ「場所」とが対応付けられている。したがって、質問文に含まれる項目が「行き先」である場合、質問文の回答となるスロット値「シカゴ」の属性は「場所」であり、スロット値「シカゴ」は、場所を示す文字列として扱われる。
また、図4の例では、スロット名「期間」と、タイプ「日付」とが対応付けられている。したがって、質問文に含まれる項目が「期間」である場合、質問文の回答となるスロット値は、日付を示す文字列として扱われる。
次に、図5を参照して、本実施形態の対話処理部210の機能について説明する。図5は、対話処理部の機能について説明する図である。
本実施形態の対話処理部210は、質問文生成部211、発話受付部212、回答抽出部213、回答登録部214、相槌文生成部215、出力部216を有する。
質問文生成部211は、端末装置300から、対話の開始の指示を受け付けると、スロットテーブル241の項目「スロット値」の値を初期化し、項目「スロット名」の値を、回答させる項目として含む質問文を生成する。言い換えれば、質問文生成部211は、スロットテーブル241の項目「スロット名」の値を含む質問情報を生成する。
発話受付部212は、端末装置300から受信した発話情報の入力を受け付ける。回答抽出部213は、発話受付部212が受け付けた発話情報から、質問に対する回答を抽出する。言い換えれば、回答抽出部213は、発話情報が示す発話文から、スロット値を抽出する。具体的には、回答抽出部213は、発話情報を解析し、発話情報に含まれる単語から、スロット値と対応付けられたタイプ(属性)の単語を、スロット値として抽出する。
回答登録部214は、回答抽出部213が抽出したスロット値をスロットテーブル241に格納する。
相槌文生成部215は、発話受付部212が受け付けた発話情報と、情報源400とから、回答に対する相槌文を示す応答情報を生成する。相槌文生成部215の詳細は後述する。
出力部216は、質問文生成部211が生成した質問情報や、相槌文生成部215が生成した応答情報を端末装置300に出力する。
以下に、相槌文生成部215について説明する。本実施形態の相槌文生成部215は、関連情報取得部251、スコア取得部252、相槌文選択部253を有する。
関連情報取得部251は、発話情報に含まれる回答と関連する関連情報を取得する。尚、本実施形態の関連情報とは、回答と関連する様々な情報を含む。
具体的には、関連情報取得部251は、回答抽出部213により抽出されたスロット値(回答)により、情報源400を検索する。そして、関連情報取得部251は、検索結果として抽出された情報を、回答と関連する関連情報として、関連情報テーブル254に保持する。つまり、本実施形態の関連情報テーブル254は、応答情報(相槌文)を生成する度に作成される。
本実施形態では、関連情報テーブル254に格納された関連情報は、相槌文の一部となり得る相槌候補となる。また、関連情報テーブル254に格納される関連情報には、スロット値(回答)と同一の文字列が含まれる。以下の説明では、関連情報に含まれる、スロット値と同一の文字列を、関連情報における同一文字列と表現する場合がある。関連情報テーブル254の詳細は後述する。
スコア取得部252は、関連情報テーブル254に格納された関連情報を固有表現抽出モデル231に適用した結果と、スロット値のタイプとに基づき、関連情報と対応付けられるスコアを取得する。
スコア取得部252が取得するスコアとは、関連情報における同一文字列が、スロット値と同じタイプの文字列として扱われている確率を示す値である。スコア取得部252によって、関連情報毎に取得されたスコアは、関連情報テーブル254において、関連情報と対応付けられて保持される。
相槌文選択部253は、スコア取得部252によって取得されたスコアが最も大きい関連情報を、相槌文に含める関連情報に選択し、相槌文を示す応答情報を生成する。
以下に、図6を参照して、本実施形態の関連情報テーブル254について説明する。図6は、関連情報テーブルの一例を示す図である。
本実施形態の関連情報テーブル254では、関連情報と、スコアとが対応付けられている。以下の説明では、関連情報テーブル254において、関連情報とスコアとを対応付けた情報をスコア付き関連情報と呼ぶ。
図6の例では、質問文に含まれるスロット名(項目)が「行き先」であり、発話文に含まれるスロット値(回答)が「シカゴ」であり、スロット名と対応付けられたタイプ(属性)が「場所」である場合に、生成された関連情報テーブル254の例を示している。
関連情報テーブル254において、スコア付き関連情報61では、「シカゴの曲最高」という関連情報に対して、スコア「0.07」が対応付けられている。
つまり、スコア付き関連情報61に含まれる関連情報では、この関連情報における同一文字列「シカゴ」が、スロット値「シカゴ」と同じ属性である「場所」として扱われている確率が、7%であることを示している。
同様に、スコア付き関連情報62では、関連情報に対して、スコア「0.75」が対応付けられており、スコア付き関連情報63では、関連情報に対して、スコア「0.91」が対応付けられている。
したがって、関連情報テーブル254に格納された関連情報のうち、関連情報「シカゴは、ボブ・○○さんの出身地で有名」は、同一文字列「シカゴ」を、回答の属性である「場所」を示す文字列として扱っている確率が最も高いことがわかる。
次に、図7を参照して、本実施形態の固有表現抽出学習部220の処理について説明する。図7は、固有表現抽出学習部の処理を説明するフローチャートである。図7の処理は、対話処理部210による処理の事前処理として行われる。
本実施形態の固有表現抽出学習部220は、固有表現タグ付きコーパス500から、文脈情報を学習し、固有表現抽出モデル231を生成し(ステップS701)、モデル記憶部230に、固有表現抽出モデル231を格納して(ステップS702)、処理を終了する。
ここで、固有表現抽出モデル231の生成について説明する。
本実施形態の固有表現抽出学習部220は、予めタグが付与された文書集合である固有表現タグ付きコーパス500に含まれる文書データの文脈情報を学習データに用いた機械学習によって、固有表現抽出モデル231を生成する。
文脈情報とは、各単語がどのような文脈で使用されたかを示す情報であり、単語前後の任意範囲の文字列や、単語間の共起関係等を示す情報である。
以下に、文脈情報について具体的に説明する。例えば、固有表現タグ付きコーパス500に含まれる学習データとして、「今日は<地名>川崎</地名>に行く」という文書データと、「<人名>川崎</人名>君から本を借りた」という文書データが存在したとする。
この学習データの文脈情報は、「「に行く」の前に出る語は地名になりやすい」、「「君」の前に出る語は人名になりやすい」である。
本実施形態の固有表現抽出学習部220は、このような文脈情報のみを特徴量として用いて学習することで、固有表現抽出モデル231を生成する。
本実施形態では、このようにして固有表現抽出モデル231を生成することで、固有表現抽出モデル231に関連情報を適用した場合に、対象となる語(回答)が、例えば、地名である確率、人名である確率等が、スコアとして出力させることができる。
次に、図8乃至図10を参照して、本実施形態の対話処理部210の処理を説明する。図8は、対話処理部の処理を説明する第一のフローチャートである。
図8では、端末装置300のユーザとの対話を開始する際の対話処理部210の初期動作を示している。
本実施形態の対話処理部210は、端末装置300から、対話の開始指示を受け付けると、質問文生成部211により、スロットテーブル241スロット値を初期化する(ステップS801)。具体的には、質問文生成部211は、スロットテーブル241の項目「スロット値」の値を空にする。
続いて、対話処理部210は、質問文生成部211は、スロットテーブル241を参照し、値が空となっているスロット値と対応するスロット名を含む質問文を生成する(ステップS802)。
続いて、対話処理部210は、出力部216により、質問文を出力し、端末装置300に表示させ(ステップS803)、初期動作を終了する。
図9は、対話処理部の処理を説明する第二のフローチャートである。図9では、ユーザの回答に対して応答する処理を示している。
本実施形態の対話処理部210は、発話受付部212により、発話情報の入力を受け付けると(ステップS901)、回答抽出部213により、発話情報から、スロット値(回答)を抽出する(ステップS902)。
続いて、対話処理部210は、回答登録部214により、発話情報からスロット値が抽出されているか否かを判定する(ステップS903)。言い換えれば、回答登録部214は、発話情報に、テーブル記憶部240のスロットテーブル241に登録される対象となる回答が含まれるか否かを判定している。
ステップS903において、スロット値が抽出されていない場合、後述するステップS906へ進む。
尚、スロット値が抽出されていない場合とは、例えば、質問文について、ユーザが回答を入力しなかった場合である。具体的には、例えば、質問文が「同行者は誰ですか?」であった場合に、発話文が「まだ決まっていない」という内容であった場合等である。
ステップS903において、スロット値が抽出されていた場合、対話処理部210は、回答登録部214により、抽出されたスロット値をスロットテーブル241に登録する(ステップS904)。
続いて、対話処理部210は、相槌文生成部215により、相槌を生成する(ステップS905)。ステップS905の詳細は後述する。
続いて、対話処理部210は、質問文生成部211により、値が空となっているスロット値と対応するスロット名を含む質問文を生成する(ステップS906)。
続いて、対話処理部210は、出力部216により、生成した相槌文と質問文とを、端末装置300へ出力し(ステップS907)、処理を終了する。
尚、図9の例では、回答に対する相槌文と次の質問文のそれぞれを生成してから、相槌文と次の質問文とを共に出力するものとしたが、これに限定されない。
相槌文と次の質問文とは、それぞれが別々に出力されても良い。具体的には、例えば、相槌文が生成された後に、相槌文のみが端末装置300に出力され、相槌文が出力された後に、次の質問文が生成されて端末装置300に出力されても良い。
この場合、端末装置300では、画面301に示すように(図1参照)、相槌文H1と次の質問文Q2とが、一つの吹き出しの中に表示されなくても良く、相槌文H1と質問文Q2とが、それぞれ独立した吹き出しの中に表示されても良い。
また、本実施形態では、相槌文と質問文とを続けて出力させるものとしたが、これに限定されない。本実施形態では、例えば、相槌文を出力した後に、端末装置300のユーザから、回答の内容を確認したことを示す返答を受けてから、次の質問文を生成して出力しても良い。
図10は、対話処理部の処理を説明する第三のフローチャートである。図10では、ステップS915における相槌文生成部215の処理の詳細を示している。
本実施形態の相槌文生成部215は、関連情報取得部251により、回答の関連情報を取得する(ステップS1001)。具体的には、相槌文生成部215は、スロットテーブル241に登録されたスロット値を検索キーとして、情報源400の検索を行い、検索結果を関連情報群として取得し、関連情報テーブル254に各関連情報を格納する。
続いて、相槌文生成部215は、スコア取得部252により、関連情報テーブル254に格納された各関連情報に固有表現抽出モデル231を適用し、関連情報毎のスコアを取得する(ステップS1002)。
以下に、スコア取得部252による関連情報毎のスコアの取得について説明する。以下では、図6に示す関連情報テーブル254に格納された各関連情報のスコアを取得する場合について説明する。
図6の関連情報テーブル254では、抽出されたスロット値「シカゴ」を検索キーとして取得した関連情報「シカゴの曲最高」、「シカゴと言えば、ボブ・○○さん」、「シカゴは、ボブ・○○さんの出身地で有名」が格納されている。
関連情報「シカゴの曲最高」を固有表現抽出モデル231の入力とした場合、固有表現抽出モデル231は、同一文字列「シカゴ」が人名として扱われている確率を示すスコアと、同一文字列「シカゴ」が場所として扱われている確率を示すスコアと、を出力する。
言い換えれば、固有表現抽出モデル231は、関連情報「シカゴの曲最高」において、同一文字列「シカゴ」の属性が「人名」である確率を示すスコアと、同一文字列「シカゴ」の属性が「場所」である確率を示すスコアとを出力する。
ここでは、同一文字列「シカゴ」の属性が「人名」である確率を示すスコアが0.82であり、同一文字列「シカゴ」の属性が「場所」である確率を示すスコアが0.07であったとする。
また、固有表現抽出モデル231は、関連情報「シカゴと言えば、ボブ・○○さん」が入力されると、同一文字列「シカゴ」の属性が「人名」である確率を示すスコア0.32と、同一文字列「シカゴ」の属性が「場所」である確率を示すスコア0.75を出力する。また、固有表現抽出モデル231は、文字列「ボブ・○○」の属性が「場所」である確率を示すスコア0.48を出力する。
また、固有表現抽出モデル231は、関連情報「シカゴと言えば、ボブ・○○さん」、「シカゴは、ボブ・○○さんの出身地で有名」が入力されると、同一文字列「シカゴ」の属性が「人名」である確率を示すスコア0.09と、同一文字列「シカゴ」の属性が「場所」である確率を示すスコア0.91を出力する。
このように、本実施形態の固有表現抽出モデル231は、関連情報に含まれる単語について、ある属性の単語として扱われている確率を示すスコアを出力する。
本実施形態のスコア取得部252は、各関連情報について、同一文字列の属性毎のスコアが出力されると、各関連情報について、スロット値「シカゴ」の属性「場所」と対応するスコアを、関連情報に対応付けられるスコアとして取得する。
具体的には、スコア取得部252は、関連情報「シカゴの曲最高」に対応付けられるスコアとして、同一文字列「シカゴ」の属性が「場所」である確率を示すスコア「0.07」を取得し、関連情報テーブル254に、関連情報「シカゴの曲最高」と対応付けて格納する。
また、スコア取得部252は、関連情報「シカゴと言えば、ボブ・○○さん」に対応付けられるスコアとして、同一文字列「シカゴ」の属性が「場所」である確率を示すスコア「0.75」を取得する。
尚、文字列「ボブ・○○」は、属性が「場所」であるが、文字列「ボブ・○○」が同一文字列ではないため、除外される。
同様に、スコア取得部252は、関連情報「シカゴは、ボブ・○○さんの出身地で有名」と対応付けられるスコアとして、同一文字列「シカゴ」の属性が「場所」である確率を示すスコア「0.91」を取得する。
ステップS1002のスコア取得部252の処理に続いて、相槌文生成部215は、相槌文選択部253により、ステップS1002で取得されたスコアが最も大きい関連情報を選択する(ステップS1003)。つまり、本実施形態の相槌文選択部253は、関連情報取得部251により取得された複数の関連情報から、回答の属性を示す関連情報を抽出する抽出部の一例となる。
ここでは、スコア0.91と対応付けられた関連情報「シカゴは、ボブ・○○さんの出身地で有名」が選択される。
続いて、相槌文生成部215は、選択された関連情報を含む相槌文を生成し(ステップS1004)、処理を終了する。
本実施形態では、以上の処理により、ユーザの回答に対して、回答が意味しているカテゴリの関連情報を相槌文として提示することができる。このため、本実施形態によれば、ユーザに対して、ユーザの発話の意味をシステムが理解していることを示すことができ、対話における不自然さを軽減させることができる。
開示の技術では、以下に記載する付記のような形態が考えられる。
(付記1)
コンピュータによる対話方法であって、前記コンピュータが、
ユーザの発話情報を取得し、
取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、
前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、
抽出した関連情報を出力する、対話方法。
(付記2)
前記関連情報を含む相槌文を示す応答情報を生成し、
前記応答情報を、前記発話情報と対応付けて出力する、付記1記載の対話方法。
(付記3)
文書集合に含まれる文脈情報を学習データとした固有表現抽出モデルを生成し、
前記複数の関連情報を前記固有表現抽出モデルの入力として、前記複数の関連情報毎に、関連情報が前記回答の属性を示す関連情報である確率を示すスコアを取得し、
前記スコアが最も大きい関連情報を、前記回答の属性を示す関連情報として抽出する、付記1又は2記載の対話方法。
(付記4)
前記関連情報は、前記回答を示す文字列と同様の文字列を含む、付記1乃至3の何れか一項に記載の対話方法。
(付記5)
コンピュータによる対話方法であって、前記コンピュータが、
ユーザに対する質問文を端末装置に表示させ、
前記質問文に対する回答を含む発話文の入力を受け付けて、前記回答を含み且つ前記回答と関連する関連情報を含む相槌文を前記発話文と対応付けて前記端末装置に表示させる、対話方法。
(付記6)
ユーザの発話情報を取得し、
取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、
前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、
抽出した関連情報を出力する、処理をコンピュータに実行させる対話プログラム。
(付記7)
ユーザの発話情報を取得する発話受付部と、
取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得する関連情報取得部と、
前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出する抽出部と、
抽出した関連情報を出力する出力部と、を有する情報処理装置。
本発明は、具体的に開示された実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
100 対話システム
200 対話装置
210 対話処理部
211 質問文生成部
212 発話受付部
213 回答抽出部
214 回答登録部
215 相槌文生成部
216 出力部
220 固有表現抽出学習部
230 モデル記憶部
231 固有表現抽出モデル
240 テーブル記憶部
241 スロットテーブル
251 関連情報取得部
252 スコア取得部
253 相槌文選択部
300 端末装置
400 情報源
500 固有表現タグ付きコーパス


Claims (6)

  1. コンピュータによる対話方法であって、前記コンピュータが、
    ユーザの発話情報を取得し、
    取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、
    前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、
    抽出した関連情報を出力する、対話方法。
  2. 前記関連情報を含む相槌文を示す応答情報を生成し、
    前記応答情報を、前記発話情報と対応付けて出力する、請求項1記載の対話方法。
  3. 文書集合に含まれる文脈情報を学習データとした固有表現抽出モデルを生成し、
    前記複数の関連情報を前記固有表現抽出モデルの入力として、前記複数の関連情報毎に、関連情報が前記回答の属性を示す関連情報である確率を示すスコアを取得し、
    前記スコアが最も大きい関連情報を、前記回答の属性を示す関連情報として抽出する、請求項1又は2記載の対話方法。
  4. コンピュータによる対話方法であって、前記コンピュータが、
    ユーザに対する質問文を端末装置に表示させ、
    前記質問文に対する回答を含む発話文の入力を受け付けて、前記回答と、前記回答に基づき取得された複数種類の属性を示す関連情報のうちの前記回答の属性を示す関連情報と、を含む相槌文を前記発話文と対応付けて前記端末装置に表示させる、対話方法。
  5. ユーザの発話情報を取得し、
    取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得し、
    前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出し、
    抽出した関連情報を出力する、処理をコンピュータに実行させる対話プログラム。
  6. ユーザの発話情報を取得する発話受付部と、
    取得した発話情報が記憶部に登録される対象となる回答を含む場合に、前記発話情報を基にして、回答に関する複数の関連情報を取得する関連情報取得部と、
    前記複数の関連情報の中から、前記回答の属性を示す関連情報を抽出する抽出部と、
    抽出した関連情報を出力する出力部と、を有する情報処理装置。
JP2018160641A 2018-08-29 2018-08-29 対話方法、対話プログラム及び情報処理装置 Active JP7124565B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018160641A JP7124565B2 (ja) 2018-08-29 2018-08-29 対話方法、対話プログラム及び情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018160641A JP7124565B2 (ja) 2018-08-29 2018-08-29 対話方法、対話プログラム及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2020034694A JP2020034694A (ja) 2020-03-05
JP7124565B2 true JP7124565B2 (ja) 2022-08-24

Family

ID=69668001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018160641A Active JP7124565B2 (ja) 2018-08-29 2018-08-29 対話方法、対話プログラム及び情報処理装置

Country Status (1)

Country Link
JP (1) JP7124565B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008198132A (ja) 2007-02-15 2008-08-28 Fujitsu Ltd 固有表現抽出プログラム、固有表現抽出方法および固有表現抽出装置
WO2017200080A1 (ja) 2016-05-20 2017-11-23 日本電信電話株式会社 対話方法、対話装置、及びプログラム
JP2018054790A (ja) 2016-09-28 2018-04-05 トヨタ自動車株式会社 音声対話システムおよび音声対話方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008198132A (ja) 2007-02-15 2008-08-28 Fujitsu Ltd 固有表現抽出プログラム、固有表現抽出方法および固有表現抽出装置
WO2017200080A1 (ja) 2016-05-20 2017-11-23 日本電信電話株式会社 対話方法、対話装置、及びプログラム
JP2018054790A (ja) 2016-09-28 2018-04-05 トヨタ自動車株式会社 音声対話システムおよび音声対話方法

Also Published As

Publication number Publication date
JP2020034694A (ja) 2020-03-05

Similar Documents

Publication Publication Date Title
JP4559946B2 (ja) 入力装置、入力方法および入力プログラム
KR101929509B1 (ko) 형태소 합성 장치 및 방법
JP2015219582A (ja) 対話方法、対話装置、対話プログラム及び記録媒体
CN112966479A (zh) 基于语言模型的辅助写作方法、装置和***
JP7124565B2 (ja) 対話方法、対話プログラム及び情報処理装置
JP4200874B2 (ja) 感性情報推定方法および文字アニメーション作成方法、これらの方法を用いたプログラム、記憶媒体、感性情報推定装置、文字アニメーション作成装置
CN109683727A (zh) 一种数据处理方法及装置
CN112905835B (zh) 一种多模态乐曲标题生成方法、装置及存储介质
CN110399605A (zh) 信息处理装置及存储程序的计算机可读介质
JP7327647B2 (ja) 発話生成装置、発話生成方法、プログラム
JP7044245B2 (ja) 対話システム補強装置及びコンピュータプログラム
WO2022069929A1 (en) System and method for creative learning
KR102072708B1 (ko) 텍스트 콘텐츠의 장르를 추론하는 방법 및 컴퓨터 프로그램
CN112307181A (zh) 基于特定语料库的提取语料的方法及语料提取器
JP4858285B2 (ja) 情報表示装置および情報表示処理プログラム
WO2023073886A1 (ja) 情報処理システム、情報処理装置、情報処理方法、及び記録媒体
US11935425B2 (en) Electronic device, pronunciation learning method, server apparatus, pronunciation learning processing system, and storage medium
JP7359196B2 (ja) 情報処理装置、情報処理方法、及び、情報処理プログラム
Nanda et al. Story Visualization: Generation of Scenes sequentially for a given fable using NLP and Image Processing
KR20130137367A (ko) 이미지 기반 도서 관련 서비스 제공 시스템 및 방법
JP4023371B2 (ja) 固有名認識装置および方法
Sicilia et al. ISABEL: An Inclusive and Collaborative Task-Oriented Dialogue System
WO2024004184A1 (ja) 生成装置、生成方法、及びプログラム
JP2003173335A (ja) 自然言語対話装置及び方法並びに記憶媒体
Onufriyuk et al. EDUCATIONAL SUMMARY AS A TOOL FOR DEVELOPING CRITICAL READING SKILLS WHEN LEARNING A FOREIGN LANGUAGE

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220725

R150 Certificate of patent or registration of utility model

Ref document number: 7124565

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150