JP7047380B2 - 生成プログラム、生成方法及び情報処理装置 - Google Patents

生成プログラム、生成方法及び情報処理装置 Download PDF

Info

Publication number
JP7047380B2
JP7047380B2 JP2017254324A JP2017254324A JP7047380B2 JP 7047380 B2 JP7047380 B2 JP 7047380B2 JP 2017254324 A JP2017254324 A JP 2017254324A JP 2017254324 A JP2017254324 A JP 2017254324A JP 7047380 B2 JP7047380 B2 JP 7047380B2
Authority
JP
Japan
Prior art keywords
word
documents
answer
unit
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017254324A
Other languages
English (en)
Other versions
JP2019121060A (ja
Inventor
貢 大瀧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017254324A priority Critical patent/JP7047380B2/ja
Priority to US16/213,219 priority patent/US20190205388A1/en
Publication of JP2019121060A publication Critical patent/JP2019121060A/ja
Application granted granted Critical
Publication of JP7047380B2 publication Critical patent/JP7047380B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明は、生成プログラム、生成方法及び情報処理装置に関する。
質問者の質問に対して回答者が回答を行う作業において、回答者が、少ない専門知識や労力でも、質問者を適切な回答に導く作業を効率よく行えるようにする技術が知られている。例えば、入力した検索条件を形態素解析して単語を抽出し、単語に対する語幹と検索条件式から初期検索条件式を生成する文書検索装置が知られている。当該装置は、検索条件式から抽出した単語の形態素解析結果を用いて、該単語に対する変化形と検索条件式から絞込検索条件式を生成し、初期検索条件式に対して文書DBの1次検索を行って中間結果を作成する。当該装置は、中間結果の文書に対して絞込検索条件式を適用して全文検索を行う。
また、ユーザによって指定された検索文に基づき全文検索を行い、検索結果として得られた各文書から有効単語を抽出し、抽出された有効単語を用いて検索結果文書の信頼度を決定し、信頼度に基づいて検索結果を提示する装置も知られている。さらに、検索基準画像データに係る類似画像を、メタデータを利用したキーワード検索により検索するシステムも知られている。当該システムでは、診療情報DB内の構造化DBに格納されている複数の単一レポート構造化データ、画像データに関する詳細な情報が記載されている読影レポートを構成する文字情報が、画像データに対して検索用のメタデータとして付与されている。当該システムは、ユーザである読影医が読影中に読影対象の画像データを検索の基準となる検索基準画像データとして指定すると、検索基準画像データに対して既に付与されている文字情報をキーワードとする。
特開2005-4606号公報 特開2002-366582号公報 特開2008-52544号公報
しかし、上記技術においては、回答者の熟練度が低い場合、質問者を適切な回答に導くことが難しい。例えば、FAQなどの複数の文章を格納したデータベースを用いて、質問に対する回答を検索する場合において、複数の回答候補の中から、最適な回答を特定するために、回答者が質問者に対して追加の質問を行う場合がある。この場合において、上記技術では、追加の質問が生成されないので、追加の質問の内容は、回答者の熟練度に依存する。回答者の熟練度が低いと、追加の質問が適切ではないために、最適な回答を特定できない場合がある。
一つの側面では、的確な質問を生成できる生成プログラム、生成方法及び情報処理装置を提供することを目的とする。
一つの態様において、情報処理装置は、文書データを取得する。情報処理装置は、取得した文書データに複数の文書が含まれる場合、複数の文書のうち、何れかの文書に含まれる各単語の何れかの文書での出現頻度と、当該各単語の複数の文書に含まれる他の文書での出現頻度とに基づき、各単語のうち、何れかの単語を特定する。また、情報処理装置は、特定した何れかの単語に関する質問文を生成する。
一つの態様によれば、的確な質問を生成できる。
図1は、実施例1における全体構成の一例を示す図である。 図2は、実施例1における生成処理の一例を示す図である。 図3は、実施例1における生成装置の一例を示す図である。 図4は、実施例1における事例DBの一例を示す図である。 図5は、実施例1における概念DBの一例を示す図である。 図6は、実施例1における生成処理の一例を示すフローチャートである。 図7は、実施例2における生成装置の一例を示す図である。 図8は、実施例2における意味ネットワークDBの一例を示す図である。 図9は、実施例2における生成処理の一例を示す図である。 図10は、実施例2における生成処理の一例を示すフローチャートである。 図11は、ハードウェア構成例を示す図である。
以下に、本願の開示する生成プログラム、生成方法及び情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、以下に示す各実施例は、矛盾を起こさない範囲で適宜組み合わせても良い。
まず、本実施例における処理の流れについて、図1を用いて説明する。図1は、実施例1における全体構成の一例を示す図である。図1に示すように、本実施例における、後に説明する生成装置100は、例えば顧客CSからの問い合わせを受け付けるオペレータOPにより操作される。なお、生成装置100は、情報処理装置の一例であり、顧客CSは、ユーザの一例である。
まず、オペレータOPは、顧客CSからの問い合わせM1を受け付けると、生成装置100にアクセスする。生成装置100は、後に説明する事例DB121に記憶された各種の事例の中から、問い合わせM1に対応する複数の事例を含む検索結果R1を抽出する。生成装置100は、検索結果R1を用いて質問文M2を生成し、オペレータOPに出力する。
オペレータOPは、質問文M2を顧客CSに提示し、顧客CSから回答M3を受け付ける。オペレータOPは、回答M3を用いて、さらに生成装置100にアクセスする。
生成装置100は、事例DB121から、回答M3に対応する単一の事例である検索結果R2を抽出する。そして、オペレータOPは、検索結果R2を含む回答M4を、顧客CSに提示する。
一般技術においては、検索結果R1に含まれる複数の事例のうち、単一の事例に絞り込むための質問文M2は、オペレータOPにより作成されている。この場合、質問文M2の内容は、オペレータOPの熟練度により左右される。オペレータOPの熟練度が低い場合、質問文M2の内容が的確ではなく、検索結果R2を特定するために必要な情報を、顧客CSから引き出すことが難しい場合がある。
一方、本実施例における生成装置100は、質問文M2を生成する際に、検索結果R1に含まれる複数の事例に含まれる単語を用いて、いずれかの単語を特定する。図2は、実施例1における生成処理の一例を示す図である。例えば、生成装置100は、顧客CSから受け付けた、「HDMI(登録商標)ケーブルを挿入する場所がわかりません」という内容の問い合わせM1の入力を受け付ける。生成装置100は、問い合わせM1を用いて事例DB121を参照し、複数の事例1001乃至1004を含む、検索結果R1を抽出する。
次に、生成装置100は、検索結果R1に含まれる事例1001乃至1003にそれぞれ含まれる単語1101乃至1103を抽出する。図2に示すように、例えば単語1101は「FJ2016JJJJ」という機種名を示す単語である。同様に、例えば単語1102は「FJ2016JJJZ」、単語1103は「FJ2017GGG」という、それぞれ機種名を示す単語である。なお、生成装置100は、事例1004には、機種名を示す単語が含まれないことを特定する。
そして、生成装置100は、抽出した単語1101乃至1103に共通する「概念」である「機種名」を確認するための質問文M2として、「Q. 機種名を、教えてください」という文言を生成して出力する。その際、生成装置100は、質問文M2に対応する選択肢2101乃至2103も合わせて生成する。
そして、生成装置100は、例えば、質問文M2に対して顧客CSから受け付けた回答M3が「FJ2016JJJJ」であった場合、当該単語1101を含む事例1001を、検索結果R2として出力する。
このように、本実施例における生成装置100は、相互に類似する複数の文書に含まれる単語の出現頻度に基づいていずれかの単語を特定し、特定した単語の意味ネットワークに基づいて質問文を生成する。これにより、熟練度に依存せず的確な質問を生成できる。
[機能ブロック]
次に、本実施例における生成装置100の一例について、図3を用いて説明する。図3は、実施例1における生成装置の一例を示す図である。図3に示すように、本実施例における生成装置100は、外部I/F110と、記憶部120と、制御部130とを有する。
外部I/F110は、有線又は無線を問わず、オペレータOPの端末(不図示)などのその他のコンピュータや、オペレータOPなどのユーザとの通信を制御する。外部I/F110は、例えばNIC(Network Interface Card)等の通信インタフェース等であるが、これに限られず、入力デバイスや表示装置等のユーザインタフェースであってもよい。
記憶部120は、プログラムやデータを記憶する記憶装置の一例であり、例えばメモリやプロセッサなどである。記憶部120は、事例DB121及び概念DB122を有する。なお、以下の説明では、データベース(Database)を「DB」と表記する場合がある。
事例DB121は、問い合わせ内容と、それに対する回答の内容とを対応付けて記憶する。なお、事例DB121に記憶される情報は、例えば過去に受け付けた問い合わせの内容及びそれに対する回答の内容であり、オペレータOPにより入力される。事例DB121に記憶される情報は、例えば外部の応答履歴ログ等から取得されてもよい。事例DB121は、例えば、事例1つごとに1レコードとして記憶する。なお、事例は、文書の一例であり、事例DB121は回答データベースの一例である。
図4は、実施例1における事例DBの一例を示す図である。図4に示すように、事例DB121は、例えば、「事例ID(Identifer)」に対応付けて、「質問」と、「回答」と、「タグ」とを記憶する。図4において、「事例ID」は、質問と回答との組み合わせを一意に識別する識別子である。「質問」及び「回答」は、過去に受け付けたユーザによる問い合わせ内容と、それに対する回答の内容とをそれぞれ記憶する。「タグ」は、質問及び回答の内容に対応するキーワード等を記憶する。なお、問い合わせ内容は「質問内容」の一例であり、回答の内容は「回答内容」の一例である。
例えば、図4において、事例ID「0001」の事例は、「HDMIケーブルを挿入する場所がわかりません」という問い合わせに対して、「FJ2016JJJJには、HDMIケーブルを挿入する場所はありません」と回答されたことを示す。また、事例ID「0001」の事例に対して付与されたタグは、「HDMI」及び「場所」である。
次に、概念DB122は、単語と、それに対応する上位概念とを対応付けて記憶する。図5は、実施例1における概念DBの一例を示す図である。図5に示すように、概念DB122は、例えば、「概念ID」に対応付けて、「上位概念」と、「下位概念1」乃至「下位概念3」とを記憶する。なお、概念DB122に記憶される情報は、例えば外部の類義語データベースや、メーカーの機種データベース等から取得された情報である。外部の類義語データベースは、例えばWord NetやWord2Vecなどの公知の技術により特定された類義語を記憶する。概念DB122は、例えば、概念1つごとに1レコードとして記憶する。
図5において、「概念ID」は、上位概念と下位概念との組み合わせを一意に識別する識別子である。「上位概念」は、「下位概念1」乃至「下位概念3」に示す各単語を包括する上位概念を記憶する。「下位概念1」乃至「下位概念3」は、共通の上位概念に従属する各単語を記憶する。
例えば、図5において、概念ID「C001」は、上位概念「機種」に対して、下位概念「FJ2016JJJJ」と「FJ2016JJJZ」と「FJ2017GGG」とが従属することを記憶する。
なお、図5においては下位概念が3つである場合を示したが、下位概念の数はこれに限られない。また、上位概念に記憶される単語が、他の単語の下位概念としてさらに記憶されていてもよく、一つの単語が、複数の上位概念の単語に従属するような構成であってもよい。
図3に戻って、制御部130は、生成装置100全体を司る処理部であり、例えばプロセッサなどである。制御部130は、受付部131、回答検索部132、単語特定部133及び出力部134を有する。なお、受付部131、回答検索部132、単語特定部133及び出力部134は、プロセッサが有する電子回路の一例やプロセッサが実行するプロセスの一例である。
受付部131は、顧客CSによる問い合わせを受け付ける。受付部131は、外部I/F110を通じて、例えば顧客CSの端末(不図示)から問い合わせを受け付けると、受け付けた問い合わせに関する情報を、回答検索部132に出力する。
また、受付部131は、外部I/F110を通じて、生成された質問文に対する回答をさらに受け付ける。受付部131は、例えば顧客CSが、生成された質問文に対応するいずれかの選択肢を選択したことを受け付けた場合、選択された選択肢に関する情報を、回答検索部132に出力する。
回答検索部132は、事例DB121を参照して、問い合わせ又は回答に対応する事例を検索する。回答検索部132は、受付部131から問い合わせに関する情報の入力を受けると、事例DB121を参照し、問い合わせに関する情報に対応する事例を検索する。この際、回答検索部132は、事例DB121に記憶された「質問」、「回答」及び「タグ」のうち、少なくともいずれかを検索する。なお、回答検索部132は、取得部の一例である。
また、回答検索部132は、受付部131から質問文に対する回答の入力を受けた場合、事例DB121を参照し、回答に対応する事例を検索する。
回答検索部132は、事例DB121を参照した結果、検索された事例の候補が1件だけである場合、当該事例の候補を出力部134に出力する。一方、回答検索部132は、検索された事例の候補が2件以上ある場合、当該事例の候補を単語特定部133に出力する。なお、回答検索部132は、事例の候補が1件も検索されなかった場合、該当する事例がないことを示す情報を単語特定部133又は出力部134に出力してもよい。
単語特定部133は、事例の候補に含まれる単語を用いて、顧客CSに対する質問文に含む単語を特定する。単語特定部133は、回答検索部132から事例の候補を取得した場合、当該複数の事例の候補のうち、事例間の類似度が所定の基準を満たす複数の事例の候補を特定する。なお、事例間の類似度は、例えばDoc2Vecなどの公知の手法を用いて特定することができる。また、単語特定部133は、特定部の一例である。
次に、単語特定部133は、特定された類似度が所定の基準を満たす複数の事例の候補のそれぞれについて、各事例を特徴づける単語を抽出する。事例を特徴づける単語は、例えば特定された複数の事例の候補のうち、当該事例にしか登場しない単語である。なお、事例を特徴づける単語は、例えばTF-IDFなどの公知の手法を用いて特定することができる。なお、以下において、事例を特徴づける単語を、「特徴語」と表記する場合がある。
次に、単語特定部133は、概念DB122を参照し、抽出した各特徴語に対応する上位概念を抽出する。例えば、単語特定部133は、各特徴語が「FJ2016JJJJ」と「FJ2016JJJZ」と「FJ2017GGG」とであった場合、対応する上位概念として、「機種」を抽出する。そして、単語特定部133は、抽出した上位概念を示す単語を、出力部134に出力する。なお、以下において、上位概念を示す単語を、「上位語」と表記する場合がある。
また、単語特定部133は、生成した質問文に対する応答を受け、回答検索部132からさらに複数の事例の候補の出力を受けた場合、新たな質問文に含まれる単語を特定する処理を繰り返す。
なお、単語特定部133は、例えば回答検索部132から、該当する事例がないことを示す情報の出力を受けた場合、例えば以前の質問文を生成する処理において、事例間の類似度が所定の基準を満たさないために抽出されなかった事例を再度抽出して、質問文を生成してもよい。
出力部134は、特定された上位語を用いた質問文を生成して出力する。なお、出力部134は、生成部の一例である。
出力部134は、例えば、単語特定部133から「機種名」という単語の出力を受けると、図2に示すように、「Q. 機種名を、教えてください」というような質問文を生成する。そして、出力部134は、例えば外部I/F110を通じて、オペレータOPの端末等に出力する。なお、出力部134は、事例の候補が1件も検索されなかった場合において、該当する事例がないことを示す情報を回答検索部132又は単語特定部133から出力された場合、検索結果を示す情報を出力してもよい。
また、出力部134は、例えば上位語が「機種」である場合、図2に示す「機種名を、教えてください」のように、上位語を用いた文章を、自然文に近い表現に変換して出力する。
[処理の流れ]
次に、本実施例における処理について、図6を用いて説明する。図6は、実施例1における生成処理の一例を示すフローチャートである。図6に示すように、生成装置100の受付部131は、例えば外部I/F110を通じて問い合わせ内容の入力を受け付けるまで待機する(S10:No)。
受付部131は、入力を受け付けたと判定した場合(S10:Yes)、入力された問合せの内容を回答検索部132に出力する。回答検索部132は、問い合わせの内容を用いて事例DB121を検索し、複数の回答候補を抽出し、単語特定部133に出力する(S11)。
単語特定部133は、抽出された複数の回答候補の中から、相互に類似する回答候補を特定する(S12)。次に、単語特定部133は、特定された各回答候補の特徴語を抽出する(S13)。次に、単語特定部133は、概念DB122を参照し、各特徴語の上位語を特定し、出力部134に出力する(S14)。
そして、出力部134は、特定された上位語を用いて質問文を生成し、例えば外部I/F110を通じて質問文を出力する(S20)。出力部134は、その後、応答を取得するまで待機する(S30:No)。
受付部131は、応答を取得したと判定した場合(S30:Yes)、応答を回答検索部132に出力する。回答検索部132は、事例DB121を検索し、回答候補の中から回答を特定できたか否かを判定する(S31)。
回答検索部132は、回答を特定できていないと判定した場合(S31:No)、S11に戻って処理を繰り返す。一方、回答検索部132は、回答を特定できたと判定した場合(S31:Yes)、出力部134に特定した回答を出力する。出力部134は、特定した回答を出力し(S32)、処理を終了する。
[効果]
以上説明したように、本実施例における生成装置100は、文書データを取得し、取得した文書データに複数の文書が含まれる場合、複数の文書のうち、何れかの文書に含まれる各単語の何れかの文書での出現頻度と、当該各単語の複数の文書に含まれる他の文書での出現頻度とに基づき、各単語のうち、何れかの単語を特定する。また、本実施例における生成装置100は、特定した何れかの単語に関する質問文を生成する。これにより、的確な質問を生成できる。
生成装置100は、取得した文書データに含まれる複数の文書のうち、文書間の類似度が基準を満たす複数の文書を特定し、特定した複数の文書から何れかの文書及び他の文書を選択してもよい。これにより、回答の候補を絞り込んでから、さらに回答を絞りこむための質問を生成できる。
また、生成装置100は、文書間の類似度が基準を満たす複数の文書において、各文書を特徴づける単語を特定してもよい。なお、生成装置100は、各文書を特徴づける単語として、例えばいずれか1つの文書にしか登場しない単語を特定する。そして、生成装置100は、特定された各文書を特徴づける単語に共通する上位概念を示す単語を用いて、質問文を生成してもよい。これにより、選択肢となる各文書の内容に即した質問を生成できる。
さらに、生成装置100は、質問内容と回答内容とを含む複数の文書を含む文書データを取得し、複数の文書に含まれる質問内容における各単語の出現頻度と回答内容における各単語の出現頻度とに基づき、いずれかの単語を特定してもよい。これにより、過去の問い合わせ履歴等のデータベースを用いて、ユーザの問い合わせに合致する回答を検索するための質問を生成できる。
また、生成装置100は、ユーザからの問い合わせの入力を受け付け、ユーザからの問い合わせに対する応答文書の候補である複数の文書を含む文書データを回答データベースから抽出する。生成装置100は、抽出された複数の文書の中から、応答文書を特定するための質問文を生成してもよい。さらに、生成装置100は、生成した質問文に対するユーザによる回答を受け付け、受け付けた回答に対する応答文書の候補である複数の文書を含む文書データをさらに取得してもよい。これにより、ユーザとの対話形式の中で、ユーザの問い合わせに合致する回答を検索するための質問を生成できる。
ところで、生成装置100が質問文を生成する際、顧客CSに確認しようとしている内容が「機種名」等であれば、「機種名は何ですか?」のように、「何であるか」を単純に問い合わせればよい。しかし、例えば確認しようとしている内容が「画面の状態」である場合、画面が表示されているか否か、何色になっているか、表示速度は正常か遅くなっているか等、確認したい内容が多岐にわたる場合がある。このような場合、質問の内容が確認したい内容に即していないと、最適な回答を特定することが難しい。
そこで、本実施例においては、生成装置が、顧客CSに対して確認したい内容に応じて質問内容の表現を変更する構成について説明する。
[機能ブロック]
図7は、実施例2における生成装置の一例を示す図である。なお、以下の実施例において、先に説明した図面に示す部位と同一の部位には同一の符号を付し、重複する説明は省略する。本実施例における生成装置200は、外部I/F110と、記憶部220と、制御部230とを有する。
記憶部220は、プログラムやデータを記憶する記憶装置の一例であり、例えばメモリやプロセッサなどである。記憶部220は、事例DB121及び概念DB122に加えて、さらに意味ネットワークDB223を有する。
意味ネットワークDB223は、対象となる単語と、対応する状態や動作などとを対応付けて記憶する、図8は、実施例2における意味ネットワークDBの一例を示す図である。図8に示すように、意味ネットワークDB223は、「対象ID」に対応付けて、「対象」と、「属性1」乃至「属性3」とを記憶する。なお、意味ネットワークDB223に記憶される情報は、例えば外部の類義語データベース等から取得された情報である。意味ネットワークDB223は、例えば、対象1つごとに1レコードとして記憶する。
図8において、「対象ID」は、対象と属性との組み合わせを一意に識別する識別子である。「対象」は、例えばコンピュータの部品や装置など、確認の対象とするものを記憶する。「属性1」乃至「属性3」は、当該対象に関係する動作や、当該対象がとりうる状態等を含む属性を記憶する。
例えば、図8において、対象ID「N001」は、対象「電源」に対して、属性「入っている」と「切れている」とが対応することを記憶する。なお、図5においては下位概念が3つである場合を示したが、下位概念の数はこれに限られず、「N001」のように2つだけであっても、または4つ以上であってもよい。また、例えば、対象ID「N004」に示されるように、対象についての属性を定めず、対象が何であるかが特定できればよい場合などは、属性1に「N/A」が記憶される。
図7に戻って、制御部230は、生成装置200全体を司る処理部であり、例えばプロセッサなどである。制御部230は、受付部131、回答検索部132、単語特定部233及び出力部234を有する。なお、単語特定部233及び出力部234も、プロセッサが有する電子回路の一例やプロセッサが実行するプロセスの一例である。
単語特定部233は、事例の候補に含まれる単語から特定される上位語に加えて、当該単語に対応する属性をさらに特定し、出力部234に出力する。単語特定部233は、各特徴語と、上位語とに基づいて、意味ネットワークDB223を参照し、上位語に対応する属性を特定する。
単語特定部233及び出力部234による処理について、図9を用いて説明する。図9は、実施例2における生成処理の一例を示す図である。図9に示すように、例えば顧客CSから、「画面が動きません」という質問M21を受け付けた場合、回答検索部132は、質問M21を用いて事例DB121を参照し、複数の事例3001乃至3004を含む、検索結果R21を抽出する。
この場合において、単語特定部233は、検索結果R1に含まれる事例3001乃至3004に共通して含まれる単語「画面」を、対象として抽出する。また、単語特定部233は、例えば事例3001においては、画面が「白く」なったことを示す部分3101を特定する。同様に、単語特定部233は、事例3002においては、画面が「暗く」なったことを示す部分3102を特定し、事例3003においては、画面が「青く」なったことを示す部分3103を特定する。なお、単語特定部233は、事例3004においては、画面の「動きが遅くなった」ことを示す部分3201を特定する。
そして、単語特定部233は、意味ネットワークDB223を参照し、対象「画面」について、特定した部分3101乃至3103に対応する属性が、「色が変わった」であることを特定する。同様、単語特定部233は、意味ネットワークDB223を参照し、対象「画面」について、特定した部分3201に対応する属性が、「反応が遅い」であることを特定する。
この場合において、単語特定部233は、特定された2つの属性のうち、例えば対応する事例の数が多い属性「色が変わった」を、出力部234に出力する。
出力部234は、特定された上位語及び属性を用いた質問文を生成して出力する。出力部234は、例えば、単語特定部233から「画面」という上位語と、「色が変わった」という属性の出力を受けた場合、図9に示すように、質問文M22として、「Q.画面の色は変わりましたか?」という文言を生成する。その際、出力部234は、質問文M22に対応する選択肢4101乃至4104も合わせて生成する。
なお、出力部234は、例えば上位語が「画面」であり、属性が「色が変わった」である場合、図9に示す「画面の色が変わりましたか?」のように、属性や上位語を用いた文章を、自然文に近い表現に変換して出力する。
なお、回答検索部132は、質問文M22に対して顧客CSから受け付けた回答が、選択肢4101乃至4103のいずれかである場合、回答として、選択肢4101乃至4103のいずれかに対応する事例3001乃至3003のうちのいずれかを特定する。一方、回答検索部132は、顧客CSから受け付けた回答が選択肢4104である場合、回答として、選択肢4104に対応する事例3004を特定する。
[処理の流れ]
次に、本実施例における処理について、図10は、実施例2における生成処理の一例を示すフローチャートである。なお、以下の説明において、図6に示すステップと同じ符号については同様のステップであるため、詳細な説明を省略する。
図10に示すように、生成装置200の単語特定部233は、各特徴語の上位語を特定すると(S14)、意味ネットワークDB223を参照し、特定した上位語及び各特徴語に対応する属性を特定し、出力部234に出力する(S15)。そして、出力部234は、特定した上位語及び属性を用いて質問文を生成する(S21)。
[効果]
以上説明したように、本実施例における生成装置200は、各文書を特徴づける単語に対応する意味ネットワークに基づき抽出される動作又は属性に関する単語を特定し、当該動作又は属性に関する単語を疑問文に変換することにより、質問文を生成する。これにより、確認したい内容に即した表現の質問を生成できる。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。例えば、生成装置100又は200は、顧客CSによる、質問文に対する回答に応じて、次に同様の問い合わせが来た場合の質問文を変更してもよい。例えば、生成装置200は、図9に示すように、質問文M22に対して、属性「色が変わった」ではなく属性「反応が遅い」に対応する選択肢4104を受け付けることが多い場合、次に同様の問い合わせが来た場合、当該属性を用いて質問文を生成してもよい。これにより、過去に生成した質問文に対する応答結果を、次の質問文の生成にフィードバックさせ、より精度よく質問を生成することができる。
また、各DBが記憶する情報は一例であり、例えば図4に示す事例DB121は、「タグ」を含まないような構成であってもよい。また、各DBのデータ構造はテーブル形式に限られず、木構造やネットワーク構造であってもよい。
また、事例DB121が、各事例の回答を提示した場合における顧客CSによる問い合わせが解決した割合を示す「解決率」をさらに記憶してもよい。この場合において、単語特定部133は、回答検索部132から出力された各事例に含まれる複数の特徴語から、それぞれ複数の上位概念が抽出される場合、最も解決率が高い事例に含まれる特徴語の上位概念を特定してもよい。同様に、単語特定部233は、回答検索部132から出力された各事例に含まれる複数の特徴語から、それぞれ複数の属性が抽出される場合、最も解決率が高い事例に含まれる特徴語の属性を特定してもよい。また、単語特定部133又は233は、最も解決率が高い事例に含まれる特徴語の代わりに、各上位概念又は各属性に対応する特徴語を含む各事例の解決率の累計を算出してもよい。これにより、より問い合わせの解決率の高い質問を生成することができる。
また、各実施例においては、例えばコンピュータのヘルプデスクにおける顧客CSとオペレータOPとの対話を例として説明したが、実施の形態はこれに限られない。例えば、料理の作り方に関するコールセンターに応用する場合、生成装置200は、「人参」や「キャベツ」に対応する上位語として「野菜」を記憶し、属性として「切る」や「炒める」等を記憶してもよい。また、例えばチケット予約センターのコールセンターにおいては、生成装置200は、「スポーツ」の属性として、「観戦する」や「プレイする」などの属性を記憶してもよい。
また、オペレータOPが、顧客CSによる問い合わせを生成装置100又は200に入力し、出力された質問文を顧客CSに再質問する例について説明したが、実施の形態はこれに限られない。例えば、生成装置100又は200が、操作部(不図示)を通じて顧客CSによる問い合わせを直接受け付け、表示部(不図示)を通じて質問文を出力するような構成であってもよい。
[システム]
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、図3に示す受付部131と回答検索部132とを統合し、又は受付部131と出力部134とを統合してもよい。また、図7に示す単語特定部233を、上位語を特定する処理部と属性を特定する処理部とに分散してもよい。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
[ハードウェア構成]
図11は、ハードウェア構成例を示す図である。図11に示すように、コンピュータ10は、通信インタフェース10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。なお、以下においては実施例1における生成装置100について説明するが、その他の実施例における生成装置も、同様の構成により実現できる。
通信インタフェース10aは、他の装置の通信を制御するネットワークインタフェースカードなどである。HDD10bは、プログラムやデータなどを記憶する記憶装置の一例である。
メモリ10cの一例としては、SDRAM(Synchronous Dynamic Random Access Memory)等のRAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ等が挙げられる。プロセッサ10dの一例としては、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、PLD(Programmable Logic Device)等が挙げられる。
また、コンピュータ10は、プログラムを読み出して実行することで学習方法を実行する情報処理装置として動作する。つまり、コンピュータ10は、受付部131、回答検索部132、単語特定部133及び出力部134と同様の機能を実行するプログラムを実行する。この結果、コンピュータ10は、受付部131、回答検索部132、単語特定部133及び出力部134と同様の機能を実行するプロセスを実行することができる。なお、この他の実施例でいうプログラムは、コンピュータ10によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。
100、200 生成装置
110 外部I/F
120、220 記憶部
121 事例DB
122 概念DB
223 意味ネットワークDB
130、230 制御部
131 受付部
132 回答検索部
133、233 単語特定部
134、234 出力部

Claims (8)

  1. 文書データを取得し、
    取得した前記文書データに含まれる複数の文書のうち、文書間の類似度が基準を満たす複数の文書に含まれる単語の上位概念となる単語を特定し、
    特定した前記上位概念となる単語に関する質問文を生成する
    処理をコンピュータに実行させることを特徴とする生成プログラム。
  2. 前記特定する処理は、文書間の類似度が基準を満たす複数の文書から何れかの文書及び他の文書を選択することを特徴とする請求項1に記載の生成プログラム。
  3. 前記生成する処理は、前記文書を特徴づける単語に対応する意味ネットワークに基づき抽出される動作又は属性に関する単語を特定し、当該動作又は属性に関する単語を疑問文に変換することにより、前記質問文を生成することを特徴とする請求項に記載の生成プログラム。
  4. 前記取得する処理は、質問内容と回答内容とを含む複数の文書を含む前記文書データを取得し、
    前記特定する処理は、前記複数の文書に含まれる前記質問内容と、前記回答内容とのうち、少なくともいずれかに基づき、前記上位概念となる単語を特定することを特徴とする請求項1乃至のいずれか1つに記載の生成プログラム。
  5. ユーザからの問い合わせの入力を受け付ける処理をさらに前記コンピュータに実行させ、
    前記取得する処理は、前記ユーザからの問い合わせに対する応答文書の候補である複数の文書を含む前記文書データを回答データベースから抽出し、
    前記生成する処理は、抽出された前記複数の文書の中から、前記応答文書を特定するための質問文を生成することを特徴とする請求項1乃至のいずれか1つに記載の生成プログラム。
  6. 生成した前記質問文に対するユーザによる回答を受け付け、
    受け付けた前記回答に対する応答文書の候補である複数の文書を含む文書データをさらに取得する処理をさらに前記コンピュータに実行させることを特徴とする請求項1乃至のいずれか1つに記載の生成プログラム。
  7. 文書データを取得し、
    取得した前記文書データに含まれる複数の文書のうち、文書間の類似度が基準を満たす複数の文書に含まれる単語の上位概念となる単語を特定し、
    特定した前記上位概念となる単語に関する質問文を生成する
    処理をコンピュータが実行することを特徴とする生成方法。
  8. 文書データを取得する取得部と、
    取得した前記文書データに含まれる複数の文書のうち、文書間の類似度が基準を満たす複数の文書に含まれる単語の上位概念となる単語を特定する特定部と、
    特定した前記上位概念となる単語に関する質問文を生成する生成部と
    を有することを特徴とする情報処理装置。
JP2017254324A 2017-12-28 2017-12-28 生成プログラム、生成方法及び情報処理装置 Active JP7047380B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017254324A JP7047380B2 (ja) 2017-12-28 2017-12-28 生成プログラム、生成方法及び情報処理装置
US16/213,219 US20190205388A1 (en) 2017-12-28 2018-12-07 Generation method, information processing apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017254324A JP7047380B2 (ja) 2017-12-28 2017-12-28 生成プログラム、生成方法及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2019121060A JP2019121060A (ja) 2019-07-22
JP7047380B2 true JP7047380B2 (ja) 2022-04-05

Family

ID=67058245

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017254324A Active JP7047380B2 (ja) 2017-12-28 2017-12-28 生成プログラム、生成方法及び情報処理装置

Country Status (2)

Country Link
US (1) US20190205388A1 (ja)
JP (1) JP7047380B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11343377B1 (en) 2018-01-18 2022-05-24 United Services Automobile Association (Usaa) Virtual assistant interface for call routing
US11526674B2 (en) * 2019-03-01 2022-12-13 Rakuten Group, Inc. Sentence extraction system, sentence extraction method, and information storage medium
JP2021022070A (ja) * 2019-07-25 2021-02-18 東京電力ホールディングス株式会社 情報処理方法、情報処理装置及びプログラム
US20240127003A1 (en) * 2021-02-26 2024-04-18 Nec Solution Innovators, Ltd. Information processing apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024765A (ja) 2014-07-24 2016-02-08 ソフトバンク株式会社 情報検索装置及び情報検索プログラム
US20170091312A1 (en) 2015-09-24 2017-03-30 International Business Machines Corporation Generating natural language dialog using a questions corpus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024765A (ja) 2014-07-24 2016-02-08 ソフトバンク株式会社 情報検索装置及び情報検索プログラム
US20170091312A1 (en) 2015-09-24 2017-03-30 International Business Machines Corporation Generating natural language dialog using a questions corpus

Also Published As

Publication number Publication date
JP2019121060A (ja) 2019-07-22
US20190205388A1 (en) 2019-07-04

Similar Documents

Publication Publication Date Title
US10824658B2 (en) Implicit dialog approach for creating conversational access to web content
US11036774B2 (en) Knowledge-based question answering system for the DIY domain
US10915588B2 (en) Implicit dialog approach operating a conversational access interface to web content
US10936821B2 (en) Testing and training a question-answering system
US8935148B2 (en) Computer-assisted natural language translation
JP7047380B2 (ja) 生成プログラム、生成方法及び情報処理装置
US20170017635A1 (en) Natural language processing system and method
US20160260033A1 (en) Systems and Methods for Similarity and Context Measures for Trademark and Service Mark Analysis and Repository Searchess
US20150324469A1 (en) System and Methods for Automating Trademark and Service Mark Searches
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
Diefenbach et al. Qanswer KG: designing a portable question answering system over RDF data
KR20110039233A (ko) 입력 문자 시퀀스로부터의 리소스 로케이터 제안들
US11699034B2 (en) Hybrid artificial intelligence system for semi-automatic patent infringement analysis
US20230267152A1 (en) Systems and methods for providing personalized answers with learned user vocabulary for user queries
US11875240B1 (en) Tuning a generative artificial intelligence model
JP6388212B2 (ja) タグ付与方法、タグ付与装置、プログラム及び質問回答検索方法
JP6305630B2 (ja) 文書検索装置、方法及びプログラム
EP3617970A1 (en) Automatic answer generation for customer inquiries
US10474726B2 (en) Generation of digital documents
US11017172B2 (en) Proposition identification in natural language and usage thereof for search and retrieval
US20220101094A1 (en) System and method of configuring a smart assistant for domain specific self-service smart faq agents
US11615126B2 (en) Analyzing apparatus, analyzing method, and computer program product
JP2012243130A (ja) 情報検索装置、方法、及びプログラム
CN118069786A (zh) 信息意图识别方法、装置、电子设备及存储介质
JP2023174053A (ja) 登録プログラム、登録方法、及び、情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220307

R150 Certificate of patent or registration of utility model

Ref document number: 7047380

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150