JP3981734B2 - 質問応答システムおよび質問応答処理方法 - Google Patents

質問応答システムおよび質問応答処理方法 Download PDF

Info

Publication number
JP3981734B2
JP3981734B2 JP2003391938A JP2003391938A JP3981734B2 JP 3981734 B2 JP3981734 B2 JP 3981734B2 JP 2003391938 A JP2003391938 A JP 2003391938A JP 2003391938 A JP2003391938 A JP 2003391938A JP 3981734 B2 JP3981734 B2 JP 3981734B2
Authority
JP
Japan
Prior art keywords
answer
type
question
data
question sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003391938A
Other languages
English (en)
Other versions
JP2005157524A (ja
Inventor
忠彦 熊本
真樹 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2003391938A priority Critical patent/JP3981734B2/ja
Priority to US10/989,485 priority patent/US20050114327A1/en
Publication of JP2005157524A publication Critical patent/JP2005157524A/ja
Application granted granted Critical
Publication of JP3981734B2 publication Critical patent/JP3981734B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、コンピュータによる自然言語処理システムとして、自然言語で表現された質問文に対する解答を出力する質問応答システムに関する。
質問応答システムとは、自然言語による質問文を入力すると、その解答そのものを出力するシステムである。例えば、「パーキンソン病の兆候は脳のどの部分にある細胞の死が関係していますか。」という質問を入力すると、Web、新聞記事、事典などのデータを含む大量の電子化テキストから「パーキンソン病は、中脳の黒質にあるメラニン細胞が変性し、黒質細胞内で作られる神経伝達物質のドーパミンがなくなり発病する、とされている。」といった文を探し出し、「黒質」と的確に解答を出力する。
質問応答システムは、論理式やデータベースからではなく、自然言語で記述された普通の文(テキストデータ)から解答を取り出すことができるため、大量の既存の文書データを利用することができる。また、質問応答システムは、キーワードで検索された記事から使用者自らが解答を探す必要がある情報検索システムなどと異なり、解答自体を出力する。そのため、使用者は、より早く解答の情報を得ることができる。このように質問応答システムは有用であるため、より使いやすい実用的なシステムの実現が期待されている。
一般的な質問応答システムは、おおまかに、解答表現推定処理、文書検索処理、解答抽出処理という3つの処理手段で構成されている(非特許文献1および非特許文献2参照)。
解答表現推定処理は、入力した質問文中の疑問代名詞の表現などにもとづいて解答表現を推定する処理である。解答表現とは、所望される解答の言語表現の類型であって、解答となる言語表現の意味にもとづいた類型(解答タイプ)、解答となる言語表現の表記にもとづいた類型(解答表現タイプ)などがある。質問応答システムは、どのような質問文の言語表現がどのような解答表現を要求しているかという対応関係を参照して、入力した質問文の解答の解答タイプを推定する。質問応答システムは、例えば、入力した質問文が「日本の面積はどのくらいですか」である場合には、所定の対応関係を参照して、質問文中の「どのくらい」という表現から解答タイプは「数値表現」であると推定する。また、質問文が「日本の首相はだれですか」という場合には、質問文中の「だれ」という表現から、解答タイプは「固有名詞(人名)」であると推定する。
文書検索処理は、質問文からキーワードを取り出し、このキーワードを用いて解答を検索する対象となっている文書データ群を検索し、解答が記述されていると考えられる文書データを抽出する処理である。質問応答システムは、例えば、入力の質問文が「日本の首都はどこですか」である場合に、質問文から「日本」および「首都」をキーワードとして抽出し、検索対象の文書データ群から、キーワード「日本」および「首都」を含む文書データを検索する。
解答抽出処理は、文書検索処理で抽出されたキーワードを含む文書データから、推定した解答タイプに適合する言語表現を抽出し、解答として出力する処理である。質問応答システムは、例えば、文書検索処理において検索されたキーワード「日本」および「首都」を含む文書データから、解答表現推定処理において推定した解答タイプ「固有名詞(地名)」に適合する言語表現「東京」を抽出して解答とする。
前記のような処理を行うことにより、質問応答システムは、質問文「日本の首都はどこですか」に対して解答「東京」を出力する。
前田英作、「パターン認識/統計的学習からみた質問応答」、言語理解とコミュニケーション研究会 講習会資料、電子情報通信学会 言語理解とコミュニケーション研究会(NLC)、2003年1月27日、p.29−64 Masaki Murata,Masao Utiyama,and Hitoshi Isahara、"A Question−Answering System Using Unit Estimation and Probabilistic Near−Terms IR"、National Institute of Informatics NTCIR Workshop3 Meeting QAC1、2002年10月8日
上記のように、従来の質問応答システムでは、検索された文書データから解答となりうる言語表現を解答候補として抽出し、抽出した解答候補それぞれの解答タイプを判定する。そして、質問文から推定した解答タイプと同じか類似する解答タイプと判定した解答候補の評価を高くし、原則的には、解答タイプが同じ解答候補であって所定の評価を得たものを解答として出力する。
しかし、解答表現推定処理で推定された解答タイプが常に正しいものであるとは限らない。そのため、解答タイプが誤って推定された場合には、解答抽出処理において解答候補を評価する際の基準に誤りを含むことになり、結果的に解答抽出処理の精度を低下させてしまう。
また、質問応答システムの使用者にとって、質問応答システムが出力した解答タイプが正しくない場合に、別の解答タイプと判定された解答候補を参照することができるような形態で解答が出力されると便利である。特に実際の使用を考慮すると、複数の解答タイプの解答候補が出力される質問応答システムは使用者にとって使いやすい。
本発明の目的は、使用者が質問応答システムが出力した解答を解答タイプごとに見比べることができるように、解答タイプごとに分類した解答を表形式で出力することができる質問応答処理システムおよびその処理方法を提供することである。
上記の目的を達成するため、本発明は、自然言語で表現された質問文データを入力し、解答の検索対象である文書データ群から質問文データに対する解答を出力する質問応答システムにおいて、所定の解答タイプをもとに分類した解答を解答タイプを見出し項目とした表形式のデータで出力することを特徴とするものである。
本発明は、自然言語で表現された質問文データを入力し、解答の検索対象である文書データ群から質問文データに対する解答を出力する質問応答システムにおいて以下の処理を行う。入力された質問文データからキーワードを抽出し、前記文書データ群から前記キーワードを含む文書データを検索抽出する。さらに、前記文書データから解答となりうる言語表現を解答候補として抽出する。そして、解答候補の言語表現についての表記的または意味的な類型を示す2以上の解答タイプを記憶しておき、前記質問文データに対する解答の解答タイプとしてユーザによって選択入力された解答タイプを取得する。解答候補各々が、前記2以上の解答タイプのどの解答タイプであるかを判定し、前記判定された解答タイプをもとに前記解答候補を分類し、前記解答タイプごとに分類された解答候補の全部または一部を、前記2以上の解答タイプを見出し項目として構成し、かつ前記入力された解答タイプの見出しを先頭項目として配置した表形式データとして出力することを特徴とする
これにより、解答表データではユーザが入力した解答タイプの項目が先頭に配置されることになるため、使用者は、解答表の先頭の解答タイプの項目をみて解答を知ることができるとともに、他の解答タイプの解答をも参照することができる。
また、本発明は、入力された質問文データからキーワードを抽出し、前記文書データ群から前記キーワードを含む文書データを検索抽出する。前記文書データから解答となりうる言語表現を解答候補として抽出する。そして、解答候補の言語表現についての表記的または意味的な類型を示す2以上の解答タイプを記憶しておき、前記質問文データの言語表現を解析し、確率にもとづいた機械学習法であって順位付けが可能な数値を算出できるアルゴリズムを用いて、前記質問文データに対する解答が前記解答タイプであることの確信度を推定する。前記解答候補各々が、前記2以上の解答タイプのどの解答タイプであるかを判定する。前記判定された解答タイプをもとに前記解答候補を分類し、前記解答タイプごとに分類された解答候補の全部または一部を、前記2以上の解答タイプを見出し項目として構成し、かつ前記解答タイプ推定手段で算出された確信度の高い順に対応する解答タイプの見出し項目を配置した表形式データとして出力することを特徴とする。
これにより、解答表データでは最もなりやすいと推定された解答タイプの項目が先頭に配置されることになるため、使用者は、解答表の先頭の解答タイプの項目をみて解答を知ることができるとともに、他の解答タイプの解答をも参照することができる。
さらに、本発明は、前記解答タイプを判定する場合に、解答候補の言語表現と前記2以上の解答タイプとの対応関係を示す学習データが与えられた機械学習法によるアルゴリズムを用いて、前記解答候補各々が前記2以上の解答タイプのどの解答タイプになりやすいかを判定する
さらに、本発明は、前記解答表データを出力する場合に、前記解答タイプ推定手段によって推定された確信度が高い順に前記2以上の解答タイプを配置した前記表形式データを作成する。
もしくは、本発明は、前記解答表データを出力する場合に、前記解答タイプごとに前記解答タイプ推定手段によって推定された確信度を表示した前記表形式データを作成する。
本発明は、文書検索処理で検索された文書データから抽出した解答候補の解答タイプを
所定の規則などをもとに判定し、解答候補を解答タイプごとに分類し、所定の順番で配置した解答タイプごとに解答候補の一覧を表形式で示す解答表を出力する。
これにより、解答タイプの推定処理を行わないような質問応答システムにおいても、使用者は、質問文に対する解答を解答タイプごとに把握することができ、正しい解答を容易に得ることができる。
また、質問応答システムにある事項に関して複数の質問文を与える必要がある場合に、一つの質問文を質問応答システムに与えるだけで複数の解答タイプの解答が出力されるため、使用者は、質問文に対応する解答タイプを見て、その解答タイプごとに解答を得ることができ、複数の質問文を与えることによる作業労力および処理負担を軽減することができる。
また、本発明は、質問文に対する解答の解答タイプを推定する質問応答システムにおいて、所定の解答タイプについて、解答候補がその解答タイプである確信度を算出し、解答候補を解答タイプごとに分類し、解答タイプの確信度が高い順に解答タイプを配置して、解答タイプごとの解答候補の一覧を表形式で示す解答表を出力する。
これにより、質問応答システムでは解答として確からしい解答タイプの順で解答を見やすい状態で出力することができる。よって、使用者は、最も確信度が高い解答タイプの解答を直ちに得ることができ、さらに他の解答タイプの解答を容易に参照することができる。
また、本発明は、ユーザが指定した解答タイプを入力する質問応答システムにおいて、解答候補を解答タイプごとに分類し、入力された解答タイプを先頭項目として配置して、さらに所定の順番で配置した解答タイプごとに解答候補の一覧を表形式で示す解答表を出力する。
これにより、質問応答システムでは入力された解答タイプを先頭項目とし解答を見やすい状態で出力することができる。よって、使用者は、指定した解答タイプの解答を簡単に得ることができ、さらに他の解答タイプの解答を容易に参照することができる。
以下に、本発明を実施するための形態を図を用いて説明する。
〔第1の実施例〕
第1の実施例として、本発明を、解答の解答タイプを推定しない質問応答システムに適用する場合を説明する。
図1に、第1の実施例における本発明の構成例を示す。質問応答システム1は、質問文入力部11、文書検索部13、解答候補抽出部14、解答タイプ判定部15、解答表出力部16、および文書データベース20を備える。
質問文入力部11は、自然言語で表現された質問文データ(質問文)を入力する手段である。
文書検索部13は、質問文入力部11によって入力された質問文から抽出したキーワードを用いて、解答探索の対象である文書データベース20から、キーワードを含む文書データを検索・抽出する手段である。文書検索部13は、既知の一般的な文書検索手法により検索処理を行う。なお、文書データベース20として、新聞記事、百科事典、英和辞書、Webページなどの文書データを利用する。
解答候補抽出部14は、文書検索部13によって検索された文書データから解答となりうる言語表現を抽出して解答候補とし、解答候補に評価点を付与する手段である。例えば、解答候補抽出部14は、文書検索部13によって検索された文書データから解答となりうる言語表現(解答候補)を抽出し、抽出元の文書データ内における解答候補とキーワードとの近接性を確率的に評価し、近接性にもとづく評価点を解答候補に付与する。
解答タイプ判定部15は、固有表現抽出処理により解答候補の固有表現を特定し、所定の解答タイプ判定規則を参照して解答候補の解答タイプを判定する手段である。
固有表現抽出処理は、人名、地名、組織名、人工名(小説の題名、賞の名称など)などの固有名詞や、時間、距離、金額などの数値表現のように特定の事物・数量を意味する言語表現を特定する処理である。解答タイプ判定規則は、固有表現抽出処理により抽出された言語表現(解答候補)に対応する解答タイプが何であるかを判定するヒューリスティックな規則である。
解答表出力部16は、解答候補抽出部14によって抽出された解答候補を解答タイプをもとに分類し、解答タイプごとの解答候補の中から所定の評価の解答候補を解答として抽出し、抽出した解答を解答タイプごとに項目分けして表形式で示す表データ(解答表)を作成して出力する手段である。
図2に、第1の実施例における本発明の処理の流れを示す。
質問応答システム1の質問文入力部11は、質問文を入力する(ステップS10)。そして、文書検索部13は、質問文からキーワードを抽出し(ステップS11)、抽出したキーワードを用いて文書データベース20を検索し、キーワードを含む文書データを抽出する(ステップS12)。具体的には、文書検索部13は、入力された質問文「日本の首都はどこですか」である場合に、質問文を形態素解析して質問文から「日本、首都」という名詞を切り出してキーワードとする。そして、キーワード「日本、首都」を用いて文書データベース20を検索し、キーワード「日本、首都」を含む文書データを抽出する。検索の結果、以下のような文書データが抽出され、質問文に対する解答を抽出する対象となる。
「1999年に初めて日本の首都東京で国際会議AがB学会のもとで開催される。約800人の参加が見込まれている。前会長のC氏は現会長のD氏の苦労をねぎらった。」
次に、解答候補抽出部14は、抽出された文書データから解答となりうる言語表現(解答候補)を抽出する(ステップS13)。解答候補抽出部14は、抽出された文書データからn−gramの文字列を切り出して生成した名詞、名詞句などの言語表現を解答候補として抽出する。
「1999年、東京、国際会議A、B学会、約800人、参加、前会長、C氏、現会長、D氏、苦労」
さらに、解答候補抽出部14は、各解答候補に評価点を付与する(ステップS14)。解答候補抽出部14は、抽出された文書データにおいて抽出した解答候補とキーワードとの出現箇所の近接性を判定し、解答候補がキーワードと近接して出現するほど良い評価となるような所定の式を用いて評価点を算出する。ここでは、文書データにおいて解答候補とキーワードとが狭い範囲内に出現するほど、解答候補とキーワードとは相互に関連性が高く、キーワードと関連性が高い解答候補が質問文に対する解答としてより良いものであることを前提としている。
解答タイプ判定部15は、解答タイプ判定規則を参照して、解答候補の解答タイプを判定する(ステップS15)。解答タイプ判定部15は、固有表現抽出処理により、人名、
地名、数値表現などの名詞、名詞句の固有表現を特定し、さらに特定した固有表現をもとに、以下のような解答タイプ判定規則を参照して解答候補の解答タイプを判定する。
(1) 解答候補の固有表現が「人名」であれば、解答タイプは「人名」である、
(2) 解答候補の固有表現が「地名」であれば、解答タイプは「地名」である、
(3) 解答候補の固有表現が「人工的に命名されたもの」であれば、解答タイプは「人工名」である、
(4) 解答候補の固有表現が「時間を示すもの」であれば、解答タイプは「時間」である、
(5) 解答候補の固有表現が「数値を示すもの」であれば、解答タイプは「数値表現」である、
(6) 解答候補の固有表現が上記の(1) 〜(5) のいずれにも該当しないものであれば、解答タイプは「その他」である。
例えば、解答候補「1999年」の固有表現が「時間」であると特定された場合に、解答タイプ判定規則(4) により、解答タイプは「時間、数値表現」であると判定される。また、解答候補「東京」の固有表現が「地名」であると特定された場合に、解答タイプ判定規則(2) により、解答タイプは「地名」であると判定される。
なお、解答タイプ判定部15は、固有表現抽出処理として、名詞句以外の品詞句(動詞句、形容詞句など)を抽出することも可能である。
次に、解答表出力部16は、解答候補を解答タイプごとに分類し、所定の値以上の評価点が付与された解答候補を解答とし、解答タイプごとに解答を示す解答表を作成して出力する(ステップS16)。解答表出力部16は、見出し項目として解答タイプを所定の順序で配置し、解答タイプの項目ごとに解答を評価のよい順に並べた一覧を示す解答表を作成する。
以下に示すように、解答候補は解答タイプごとに分類され、所定の評価点を得て選択された解答は、各解答タイプにおいて評価点の高い順に並び替えられる。
人名:C氏,D氏、
地名:東京、
組織名:B学会、
時間:1999年、
人工名:国際会議A、
数値表現:1999年,約800人
その他:参加,前会長,現会長,苦労
図3に、出力される解答表の例を示す。図3に示す解答表において、解答タイプの項目は所定の順序で配置され、解答は各解答タイプ内で評価点の高い順に先頭から配置される。使用者は、解答タイプが「地名」であることを知っているから、図3の解答表の解答タイプ「地名」の項目を見て、解答が「東京」であることがすぐにわかる。
本実施例に示すように、本発明によれば、質問文から解答タイプを推定する処理を行わないような質問応答システムにおいても、解答を解答タイプごとに示す表形式で出力できる。これにより、使用者は、解答表から該当する解答タイプの項目を参照して容易に正しい解答を得ることができる。
また、使用者が、関連する事項に関する複数の解答タイプの解答を得たいと考える場合に、一つの質問文を質問応答システムに与えるだけで複数の解答タイプの解答を一時に取
得することができる。例えば、使用者が、以下のような質問文を続けて入力して解答を得たいとする。
質問文Q1:「国際会議Aは、どこで開催されましたか。」
質問文Q2:「国際会議Aは、いつ開催されましたか。」
質問文Q3:「国際会議Aは、どの学会によって開催されましたか。」
本発明によれば、質問応答システム1は、質問文Q1を入力すると、上記の処理を行って、その質問文Q1に対する解答と共に同時に取得した他の解答タイプの解答も併せて取得し、図3に示すような解答表を出力する。使用者は質問文Q1〜Q3の解答タイプを知っているから、図3の解答表を見て、質問文Q1の解答「東京」、質問文Q2の解答「1999年」、質問文Q3の解答「B学会」のように、複数の質問文それぞれに対応する解答を知ることができる。
〔第2の実施例〕
第2の実施例として、本発明を、解答の解答タイプを推定する質問応答システムに適用する場合を説明する。
図4に、第2の実施例における本発明の構成例を示す。質問応答システム2は、質問文入力部21、解答タイプ推定部22、文書検索部23、解答候補抽出部24、解答タイプ判定部25、解答表出力部26、および文書データベース20を備える。
質問文入力部21、文書検索部23、解答候補抽出部24、解答タイプ判定部25および解答表出力部26は、それぞれ、質問応答システム1の質問文入力部11、文書検索部13、解答候補抽出部14、解答タイプ判定部15、解答表出力部16と同じ処理を行う処理手段である。
解答タイプ推定部22は、入力された質問文から、確率にもとづいた機械学習法であって順位付けが可能な数値を算出できるものを用いて、所定の解答タイプについて、解答がその解答タイプであることの確かさ(確信度)を推定する手段である。
解答タイプ推定部22は、確率にもとづいた機械学習法として、最大エントロピー法などの手法を用いる。最大エントロピー法は、学習データにおける推定に用いられる情報の細かい単位である素性の出現の期待値と、未知データにおける素性の出現の期待値とが等しいという条件で確率分布のエントロピーが最大となる場合の確率分布を求め、求めた確率分布にもとづき素性の各出現パターンに対して各分類になる確率を求め、最大の確率を持つ分類先を求める分類とする処理手法である。
最大エントロピー法によれば、所定の解答タイプの確からしさを確率値で算出することができるので、算出した確率値をもとに解答タイプの表示の順序を決定することができる。
図5に、第2の実施例における本発明の処理の流れを示す。
質問応答システム2の質問文入力部21は、質問文を入力し(ステップS20)、解答タイプ推定部22は、機械学習法を用いた推定処理により、質問文の表現から解答タイプの確信度を推定する(ステップS21)。解答タイプ推定部22は、入力された質問文を形態素解析し、解析した疑問代名詞などの表現を手がかりに、最大エントロピー法などの機械学習法を用いて質問文に対する解答の解答タイプを推定する。例えば、入力した質問文が「日本の首都はどこですか」である場合に、質問文の「どこ」という表現などを手がかりに解答タイプは「地名」であると推定する。
そして、文書検索部23は、質問文からキーワードを抽出し(ステップS22)、抽出したキーワードを用いて文書データベース20を検索し、キーワードを含む文書データを抽出する(ステップS23)。解答候補抽出部24は、固有表現抽出処理により、抽出された文書データから解答となりうる言語表現(解答候補)を抽出する(ステップS24)。さらに、解答候補抽出部24は、抽出された文書データにおける抽出した解答候補とキーワードとの出現箇所の近接性を判定し、その解答候補に評価点を付与する(ステップS25)。そして、解答タイプ判定部25は、所定の解答タイプ判定規則を参照して解答候補の解答タイプを判定する(ステップS26)。
その後、解答表出力部26は、解答候補を解答タイプごとに分類し、所定の評価以上の解答候補を解答として、解答タイプごとに解答を示す解答表を作成して出力する(ステップS27)。解答表出力部26は、見出し項目として解答タイプを確信度の高い順に配置し、解答タイプの項目ごとに解答を評価のよい順に並べた一覧を示す解答表を作成する。
図6および図7に、出力される解答表の例を示す。図6に示す解答表において、解答タイプの項目は、ステップS21の処理において推定された確信度の高い順に先頭(左)から「地名、組織名、その他、人工名、…」のように配置される。また解答タイプごとに分類された解答は、それぞれの解答タイプ内で評価点の高い順に先頭から配置される。
また、図7に示すように、解答タイプの項目が、図6と同様に推定された確信度の高い順に先頭(上)から「地名、組織名、その他、人工名、…」のように配置される。
また、解答表出力部26は、図6および図7の解答表の解答タイプの項目内に、解答タイプ推定部22で算出した確信度を「X%」のように表示してもよい。
本実施例において、使用者は、質問応答システムが出力した解答表で解答タイプの確からしさが高い順に並べられた項目をみて正しい解答を見つけることができる。さらに、質問応答システムが解答タイプの推定を誤った場合でも、解答表には全ての解答タイプの解答が表示されているため、使用者は、解答表から正しい解答を選択することができる。
〔第3の実施例〕
第3の実施例として、本発明を、解答の解答タイプを入力する質問応答システムに適用する場合を説明する。
図8に、第3の実施例における本発明の構成例を示す。質問応答システム3は、質問文入力部31、解答タイプ入力部32、文書検索部33、解答候補抽出部34、解答タイプ判定部35、解答表出力部36、および文書データベース20を備える。
質問文入力部31、文書検索部33、解答候補抽出部34、解答タイプ判定部35、および解答表出力部36は、それぞれ、質問応答システム1の質問文入力部11、文書検索部13、解答候補抽出部14、解答タイプ判定部15、解答表出力部16と同様の処理を行う処理手段である。
解答タイプ入力部32は、使用者が選択または入力の指示をした解答タイプを入力する手段である。
図9に、第3の実施例における本発明の処理の流れを示す。
質問応答システム3の質問文入力部31は、質問文を入力し(ステップS30)、解答タイプ入力部32は、解答タイプを入力する(ステップS31)。ここで、入力された解答タイプが「地名」であるとする。
そして、文書検索部33は、質問文からキーワードを抽出し(ステップS32)、抽出したキーワードを用いて文書データベース20を検索し、キーワードを含む文書データを抽出する(ステップS33)。解答候補抽出部34は、固有表現抽出処理により、抽出された文書データから解答となりうる言語表現(解答候補)を抽出する(ステップS34)。さらに、解答候補抽出部34は、抽出された文書データにおける抽出した解答候補とキーワードとの出現箇所の近接性を判定し、その解答候補に評価点を付与する(ステップS35)。また、解答タイプ判定部35は、所定の解答タイプ判定規則を参照して、解答候補の解答タイプを判定する(ステップS36)。
次に、解答表出力部36は、解答候補を解答タイプごとに分類し、所定の評価以上の解答候補を解答として、解答タイプごとに解答を示す解答表を作成して出力する(ステップS37)。解答表出力部36は、見出し項目として入力された解答タイプを先頭項目として配置し、続いて入力された解答タイプ以外の解答タイプを所定の順に配置し、解答タイプの項目ごとに解答を評価のよい順に並べた一覧を示す解答表を作成する。
図10に、出力される解答表の例を示す。図10に示す解答表において、入力された解答タイプ「地名」が先頭(最左側)に配置され、続いて入力された解答タイプ以外の解答タイプが、所定の順序で配置される。また解答タイプごとに分類された解答は、それぞれの解答タイプ内で評価点の高い順に先頭から配置される。
これにより、使用者は、質問応答システムが出力した解答表で入力した解答タイプの解答を確実に見つけることができるうえ、他の解答タイプの解答を容易に参照することができる。また、質問応答システム3では解答タイプの推定処理を行わないため、解答タイプの推定処理を行う質問応答システムに比べて高い精度の処理を行うことができる。
上記の第1の実施例〜第3の実施例では、解答となりうる言語表現の類型として、地名、人名、人工名などの言語表現の意味にもとづく類型(解答タイプ)を用いたが、解答タイプの代わりに解答表現タイプを用いてもよい。解答表現タイプは、解答となる言語表現の表記にもとづく類型である。「ひらがなのみからなる表現、カタカナのみからなる表現、漢字のみからなる表現、英文字のみからなる表現、英語記号・数字のみからなる表現、漢字カタカナのみからなる表現、数字表現を含む表現」などの解答表現タイプを予め定義しておく。
この場合、解答候補抽出部14、24、34は、検索した文書データ内の文字列の字種(ひらがな、カタカナ、漢字、英字など)を利用して解答候補を抽出する。そして、解答タイプ判定部15、25、35は、解答候補の字種から解答表現タイプを判定する。
図11に、出力される解答表の例を示す。図11に示す解答表では、所定の順として解答表現タイプ「漢字のみ、数値表現を含む、…」が配置される。また解答タイプごとに分類された解答は、それぞれの解答タイプ内で評価点の高い順に先頭から配置される。なお、解答表現タイプの確信度が推定される場合には、推定された確信度の順に解答表現タイプが配置される。
また、第1の実施例〜第3の実施例では、解答表出力部16、26、36は、解答候補が存在しない解答タイプの項目を省略した解答表を作成するようにしてもよい。
特に第2の実施例では、解答表出力部26は、解答タイプ推定部22で算出された解答タイプの確信度が所定の評価以上のもののみを項目として示す解答表、または解答タイプの確信度が高い順に所定の数以内のもののみを項目として示す解答表を作成するようにし
てもよい。
以上、本発明を実施例にもとづいて説明したが、本発明はその主旨の範囲において種々の変形が可能であることは当然である。
例えば、第1の実施例〜第3の実施例において、質問応答システム1、2、3は、所定のヒューリスティックな解答タイプ判定規則を参照して解答タイプを判定する解答タイプ判定部15、25、35で構成されるものとして説明した。
しかし、質問応答システム1、2、3は、ヒューリスティックな規則を用いて処理を行う代わりに、最大エントロピー法、サポートベクトルマシン法などの教師あり機械学習法を利用して解答タイプを推定もしくは判定する解答タイプ判定部15’、25’、35’で構成されるものであってもよい。
この場合に、解答タイプ判定部15’、25’、35’は、問題ごとに正しい入力(言語表現)と出力(判定する解答タイプ)の対のパターンをあらかじめ学習データとして人手で作成して、どのような言語表現の場合にどのような解答タイプとなりやすいかを学習しておく。そして、抽出した言語表現(解答候補)が、どういう解答タイプになりやすいかを判定する。
なお、サポートベクトルマシン法は、空間を超平面で分割することにより2つの分類からなるデータを分類する手法であって、学習データにおける2つの分類の事例群と超平面との間隔(マージン) が大きいものほど未知データにおいて誤った分類をする可能性が低いとの考え方を前提にして、このマージンを最大にする超平面を求め、それを用いて分類を行なう。3つ以上の分類からなるデータを分類する場合には、複数のサポートベクトルマシンを組み合わせて処理する。
また、質問応答システム2において、解答タイプ推定部22は、質問文とその解答の解答タイプとの対応関係を定義したヒューリスティックな解答タイプ推定規則を用いた処理を行う処理手段であってもよい。この場合、解答タイプ推定規則に、質問文と解答の解答タイプとの対応関係と共に、”if then”規則などを用いて、どのような質問文に対してどの解答タイプであるかの確信度を定義しておく。
また、本発明は、コンピュータにより読み取られ実行される処理プログラムとして実施することができる。本発明を実現する処理プログラムは、コンピュータが読み取り可能な、可搬媒体メモリ、半導体メモリ、ハードディスクなどの適当な記録媒体に格納することができ、これらの記録媒体に記録して提供され、または、通信インタフェースを介して種々の通信網を利用した送受信により提供されるものである。
第1の実施例における本発明の構成例を示す図である。 第1の実施例における本発明の処理の流れを示す図である。 出力される解答表の例を示す図である。 第2の実施例における本発明の構成例を示す図である。 第2の実施例における本発明の処理の流れを示す図である。 出力される解答表の例を示す図である。 出力される解答表の例を示す図である。 第3の実施例における本発明の構成例を示す図である。 第3の実施例における本発明の処理の流れを示す図である。 出力される解答表の例を示す図である。 出力される解答表の例を示す図である。
符号の説明
1、2、3 質問応答システム
11、21、31 質問文入力部
13、23、33 文書検索部
14、24、34 解答候補抽出部
15、25、35 解答タイプ判定部
16、26、36 解答表出力部
20 文書データベース
22 解答タイプ推定部
32 解答タイプ入力部

Claims (8)

  1. 自然言語で表現された質問文データを入力し、解答の検索対象である文書データ群から質問文データに対する解答を出力する質問応答システムにおいて、
    入力された質問文データからキーワードを抽出し、前記文書データ群から前記キーワードを含む文書データを検索抽出する文書検索手段と、
    前記文書データから解答となりうる言語表現を解答候補として抽出する解答候補抽出手段と、
    解答候補の言語表現についての表記的または意味的な類型を示す2以上の解答タイプを記憶しておき、前記質問文データに対する解答の解答タイプとしてユーザによって選択入力された解答タイプを取得する解答タイプ入力手段と、
    前記解答候補各々が、前記2以上の解答タイプのどの解答タイプであるかを判定する解答タイプ判定手段と、
    前記判定された解答タイプをもとに前記解答候補を分類し、前記解答タイプごとに分類された解答候補の全部または一部を、前記2以上の解答タイプを見出し項目として構成し、かつ前記入力された解答タイプの見出しを先頭項目として配置した表形式データとして出力する解答表出力手段とを備える
    ことを特徴とする質問応答システム。
  2. 自然言語で表現された質問文データを入力し、解答の検索対象である文書データ群から質問文データに対する解答を出力する質問応答システムにおいて、
    入力された質問文データからキーワードを抽出し、前記文書データ群から前記キーワードを含む文書データを検索抽出する文書検索手段と、
    前記文書データから解答となりうる言語表現を解答候補として抽出する解答候補抽出手段と、
    解答候補の言語表現についての表記的または意味的な類型を示す2以上の解答タイプを記憶しておき、前記質問文データの言語表現を解析し、確率にもとづいた機械学習法であって順位付けが可能な数値を算出できるアルゴリズムを用いて、前記質問文データに対する解答が前記解答タイプであることの確信度を推定する解答タイプ推定手段と、
    前記解答候補各々が、前記2以上の解答タイプのどの解答タイプであるかを判定する解答タイプ判定手段と、
    前記判定された解答タイプをもとに前記解答候補を分類し、前記解答タイプごとに分類された解答候補の全部または一部を、前記2以上の解答タイプを見出し項目として構成し、かつ前記解答タイプ推定手段で算出された確信度の高い順に対応する解答タイプの見出し項目を配置した表形式データとして出力する解答表出力手段とを備える
    ことを特徴とする質問応答システム。
  3. 前記解答タイプ判定手段は、解答候補の言語表現と前記2以上の解答タイプとの対応関係を示す学習データが与えられた機械学習法によるアルゴリズムを用いて、前記解答候補各々が前記2以上の解答タイプのどの解答タイプになりやすいかを判定する
    ことを特徴とする請求項1または請求項2のいずれか一項に記載の質問応答システム。
  4. 前記解答表出力手段は、前記解答タイプごとに前記解答タイプ推定手段によって推定された確信度を表示した前記表形式データを作成する
    ことを特徴とする請求項2に記載の質問応答システム。
  5. 文書検索手段、解答候補抽出手段、解答タイプ入力手段、解答タイプ判定手段、および解答表出力手段を備えるコンピュータが、自然言語で表現された質問文データを入力し、解答の検索対象である文書データ群から質問文データに対する解答を出力する質問応答処理方法において、
    前記文書検索手段が、入力された質問文データからキーワードを抽出し、前記文書データ群から前記キーワードを含む文書データを検索抽出する処理過程と、
    前記解答候補抽出手段が、前記文書データから解答となりうる言語表現を解答候補として抽出する処理過程と、
    前記解答タイプ入力手段が、解答候補の言語表現についての表記的または意味的な類型を示す2以上の解答タイプを記憶しておき、前記質問文データに対する解答の解答タイプとしてユーザによって選択入力された解答タイプを取得する処理過程と、
    前記解答タイプ判定手段が、前記解答候補各々が前記2以上の解答タイプのどの解答タイプであるかを判定する処理過程と、
    前記解答表出力手段が、前記判定された解答タイプをもとに前記解答候補を分類し、前記解答タイプごとに分類された解答候補の全部または一部を、前記2以上の解答タイプを見出し項目として構成し、かつ前記入力された解答タイプの見出しを先頭項目として配置する表形式データとして出力する処理過程とを備える
    ことを特徴とする質問応答処理方法。
  6. 文書検索手段、解答候補抽出手段、解答タイプ推定手段、解答タイプ判定手段、および解答表出力手段を備えるコンピュータが、自然言語で表現された質問文データを入力し、解答の検索対象である文書データ群から質問文データに対する解答を出力する質問応答処理方法において、
    前記文書検索手段が、入力された質問文データからキーワードを抽出し、前記文書データ群から前記キーワードを含む文書データを検索抽出する処理過程と、
    前記解答候補抽出手段が、前記文書データから解答となりうる言語表現を解答候補として抽出する処理過程と、
    前記解答タイプ推定手段が、解答候補の言語表現についての表記的または意味的な類型を示す2以上の解答タイプを記憶しておき、前記質問文データの言語表現を解析し、確率にもとづいた機械学習法によるアルゴリズムを用いて、前記質問文データに対する解答が前記解答タイプであることの確信度を推定する処理過程と、
    前記解答タイプ判定手段が、前記解答候補各々が前記2以上の解答タイプのどの解答タイプであるかを判定する処理過程と、
    前記解答表出力手段が、前記判定された解答タイプをもとに前記解答候補を分類し、前記解答タイプごとに分類された解答候補の全部または一部を、前記2以上の解答タイプを見出し項目として構成し、かつ前記解答タイプ推定手段によって算出された確信度の高い順に対応する解答タイプの見出し項目を配置した表形式データとして出力する処理過程とを備える
    ことを特徴とする質問応答処理方法。
  7. 前記コンピュータは、解答タイプ判定手段を備え、
    前記解答タイプ判定手段は、解答候補の言語表現と前記2以上の解答タイプとの対応関係を示す学習データが与えられた機械学習法によるアルゴリズムを用いて、前記解答候補各々が前記2以上の解答タイプのどの解答タイプになりやすいかを判定する
    ことを特徴とする請求項または請求項のいずれか一項に記載の質問応答処理方法。
  8. 前記解答表出力手段が行う処理過程では、
    前記解答タイプごとに前記解答タイプ推定手段によって推定された確信度を表示した前記表形式データを作成する
    ことを特徴とする請求項6に記載の質問応答処理方法。
JP2003391938A 2003-11-21 2003-11-21 質問応答システムおよび質問応答処理方法 Expired - Lifetime JP3981734B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003391938A JP3981734B2 (ja) 2003-11-21 2003-11-21 質問応答システムおよび質問応答処理方法
US10/989,485 US20050114327A1 (en) 2003-11-21 2004-11-17 Question-answering system and question-answering processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003391938A JP3981734B2 (ja) 2003-11-21 2003-11-21 質問応答システムおよび質問応答処理方法

Publications (2)

Publication Number Publication Date
JP2005157524A JP2005157524A (ja) 2005-06-16
JP3981734B2 true JP3981734B2 (ja) 2007-09-26

Family

ID=34587504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003391938A Expired - Lifetime JP3981734B2 (ja) 2003-11-21 2003-11-21 質問応答システムおよび質問応答処理方法

Country Status (2)

Country Link
US (1) US20050114327A1 (ja)
JP (1) JP3981734B2 (ja)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252382A (ja) * 2005-03-14 2006-09-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US7509184B2 (en) * 2005-04-04 2009-03-24 Taiwan Semiconductor Manufacturing Co., Ltd. Tape-out form generation methods and systems
US20060259462A1 (en) 2005-05-12 2006-11-16 Sybase, Inc. System and Methodology for Real-time Content Aggregation and Syndication
JP4565106B2 (ja) * 2005-06-23 2010-10-20 独立行政法人情報通信研究機構 二項関係抽出装置,二項関係抽出処理を用いた情報検索装置,二項関係抽出処理方法,二項関係抽出処理を用いた情報検索処理方法,二項関係抽出処理プログラム,および二項関係抽出処理を用いた情報検索処理プログラム
JP4849596B2 (ja) * 2005-12-08 2012-01-11 独立行政法人情報通信研究機構 質問応答装置、質問応答方法および質問応答プログラム
JP2007219955A (ja) * 2006-02-17 2007-08-30 Fuji Xerox Co Ltd 質問応答システム、質問応答処理方法及び質問応答プログラム
US8983977B2 (en) 2006-03-01 2015-03-17 Nec Corporation Question answering device, question answering method, and question answering program
US20080040339A1 (en) * 2006-08-07 2008-02-14 Microsoft Corporation Learning question paraphrases from log data
US7856350B2 (en) * 2006-08-11 2010-12-21 Microsoft Corporation Reranking QA answers using language modeling
US8275803B2 (en) * 2008-05-14 2012-09-25 International Business Machines Corporation System and method for providing answers to questions
US8332394B2 (en) 2008-05-23 2012-12-11 International Business Machines Corporation System and method for providing question and answers with deferred type evaluation
WO2010105216A2 (en) * 2009-03-13 2010-09-16 Invention Machine Corporation System and method for automatic semantic labeling of natural language texts
US20110125734A1 (en) * 2009-11-23 2011-05-26 International Business Machines Corporation Questions and answers generation
US8626691B2 (en) * 2009-12-19 2014-01-07 At&T Intellectual Property I, L.P. Methods, systems, and products for estimating answers to questions
US8892550B2 (en) 2010-09-24 2014-11-18 International Business Machines Corporation Source expansion for information retrieval and information extraction
WO2012040356A1 (en) 2010-09-24 2012-03-29 International Business Machines Corporation Providing question and answers with deferred type evaluation using text with limited structure
CN103221915B (zh) 2010-09-24 2017-02-08 国际商业机器公司 在开域类型强制中使用本体信息
US8943051B2 (en) 2010-09-24 2015-01-27 International Business Machines Corporation Lexical answer type confidence estimation and application
CA2812338C (en) 2010-09-24 2019-08-13 International Business Machines Corporation Lexical answer type confidence estimation and application
US9002773B2 (en) 2010-09-24 2015-04-07 International Business Machines Corporation Decision-support application and system for problem solving using a question-answering system
US9189541B2 (en) 2010-09-24 2015-11-17 International Business Machines Corporation Evidence profiling
CN103229168B (zh) * 2010-09-28 2016-10-19 国际商业机器公司 在问答期间在多个候选答案之间证据扩散的方法和***
WO2012047541A1 (en) 2010-09-28 2012-04-12 International Business Machines Corporation Providing answers to questions using multiple models to score candidate answers
EP2622428A4 (en) 2010-09-28 2017-01-04 International Business Machines Corporation Providing answers to questions using hypothesis pruning
EP2622510A4 (en) 2010-09-28 2017-04-05 International Business Machines Corporation Providing answers to questions using logical synthesis of candidate answers
US9020805B2 (en) 2010-09-29 2015-04-28 International Business Machines Corporation Context-based disambiguation of acronyms and abbreviations
US9116996B1 (en) * 2011-07-25 2015-08-25 Google Inc. Reverse question answering
US10614725B2 (en) 2012-09-11 2020-04-07 International Business Machines Corporation Generating secondary questions in an introspective question answering system
JP6464604B2 (ja) * 2014-08-08 2019-02-06 富士通株式会社 検索支援プログラム、検索支援方法および検索支援装置
JP6414956B2 (ja) * 2014-08-21 2018-10-31 国立研究開発法人情報通信研究機構 質問文生成装置及びコンピュータプログラム
US10475043B2 (en) 2015-01-28 2019-11-12 Intuit Inc. Method and system for pro-active detection and correction of low quality questions in a question and answer based customer support system
US10083213B1 (en) * 2015-04-27 2018-09-25 Intuit Inc. Method and system for routing a question based on analysis of the question content and predicted user satisfaction with answer content before the answer content is generated
US10755294B1 (en) 2015-04-28 2020-08-25 Intuit Inc. Method and system for increasing use of mobile devices to provide answer content in a question and answer based customer support system
US10134050B1 (en) 2015-04-29 2018-11-20 Intuit Inc. Method and system for facilitating the production of answer content from a mobile device for a question and answer based customer support system
US10447777B1 (en) 2015-06-30 2019-10-15 Intuit Inc. Method and system for providing a dynamically updated expertise and context based peer-to-peer customer support system within a software application
US10147037B1 (en) 2015-07-28 2018-12-04 Intuit Inc. Method and system for determining a level of popularity of submission content, prior to publicizing the submission content with a question and answer support system
US10475044B1 (en) 2015-07-29 2019-11-12 Intuit Inc. Method and system for question prioritization based on analysis of the question content and predicted asker engagement before answer content is generated
US10268956B2 (en) 2015-07-31 2019-04-23 Intuit Inc. Method and system for applying probabilistic topic models to content in a tax environment to improve user satisfaction with a question and answer customer support system
US10394804B1 (en) 2015-10-08 2019-08-27 Intuit Inc. Method and system for increasing internet traffic to a question and answer customer support system
US10242093B2 (en) 2015-10-29 2019-03-26 Intuit Inc. Method and system for performing a probabilistic topic analysis of search queries for a customer support system
US10599699B1 (en) 2016-04-08 2020-03-24 Intuit, Inc. Processing unstructured voice of customer feedback for improving content rankings in customer support systems
US10162734B1 (en) 2016-07-20 2018-12-25 Intuit Inc. Method and system for crowdsourcing software quality testing and error detection in a tax return preparation system
US10467541B2 (en) 2016-07-27 2019-11-05 Intuit Inc. Method and system for improving content searching in a question and answer customer support system by using a crowd-machine learning hybrid predictive model
US10460398B1 (en) 2016-07-27 2019-10-29 Intuit Inc. Method and system for crowdsourcing the detection of usability issues in a tax return preparation system
US10445332B2 (en) 2016-09-28 2019-10-15 Intuit Inc. Method and system for providing domain-specific incremental search results with a customer self-service system for a financial management system
US10572954B2 (en) 2016-10-14 2020-02-25 Intuit Inc. Method and system for searching for and navigating to user content and other user experience pages in a financial management system with a customer self-service system for the financial management system
US10733677B2 (en) 2016-10-18 2020-08-04 Intuit Inc. Method and system for providing domain-specific and dynamic type ahead suggestions for search query terms with a customer self-service system for a tax return preparation system
US10552843B1 (en) 2016-12-05 2020-02-04 Intuit Inc. Method and system for improving search results by recency boosting customer support content for a customer self-help system associated with one or more financial management systems
US10748157B1 (en) 2017-01-12 2020-08-18 Intuit Inc. Method and system for determining levels of search sophistication for users of a customer self-help system to personalize a content search user experience provided to the users and to increase a likelihood of user satisfaction with the search experience
US10922367B2 (en) 2017-07-14 2021-02-16 Intuit Inc. Method and system for providing real time search preview personalization in data management systems
US11093951B1 (en) 2017-09-25 2021-08-17 Intuit Inc. System and method for responding to search queries using customer self-help systems associated with a plurality of data management systems
US11436642B1 (en) 2018-01-29 2022-09-06 Intuit Inc. Method and system for generating real-time personalized advertisements in data management self-help systems
US11269665B1 (en) 2018-03-28 2022-03-08 Intuit Inc. Method and system for user experience personalization in data management systems using machine learning
JP7159778B2 (ja) * 2018-10-16 2022-10-25 日本電信電話株式会社 発話生成装置、方法、及びプログラム
CN112015875B (zh) * 2020-08-24 2022-09-02 北京智齿博创科技有限公司 在线客服助手的构建方法
CN114547282B (zh) * 2022-02-25 2022-09-09 广州中医药大学(广州中医药研究院) 一种植物分类动态检索方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5404295A (en) * 1990-08-16 1995-04-04 Katz; Boris Method and apparatus for utilizing annotations to facilitate computer retrieval of database material
US5715444A (en) * 1994-10-14 1998-02-03 Danish; Mohamed Sherif Method and system for executing a guided parametric search
CA2372867A1 (en) * 1999-05-07 2000-11-16 Carlos Cardona System and method for database retrieval, indexing and statistical analysis
US7177798B2 (en) * 2000-04-07 2007-02-13 Rensselaer Polytechnic Institute Natural language interface using constrained intermediate dictionary of results

Also Published As

Publication number Publication date
JP2005157524A (ja) 2005-06-16
US20050114327A1 (en) 2005-05-26

Similar Documents

Publication Publication Date Title
JP3981734B2 (ja) 質問応答システムおよび質問応答処理方法
CN109196496B (zh) 未知词预测器和内容整合的翻译器
CN106663125B (zh) 提问句生成装置以及记录介质
US7234942B2 (en) Summarisation representation apparatus
JP3882048B2 (ja) 質問応答システムおよび質問応答処理方法
Pedler Computer correction of real-word spelling errors in dyslexic text
CN107748784B (zh) 一种通过自然语言实现结构化数据搜索的方法
JP2007141059A (ja) 読書支援システム及びプログラム
JP4778474B2 (ja) 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体
JP2003248676A (ja) 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法
CN102663129A (zh) 医疗领域深度问答方法及医学检索***
KR20080021017A (ko) 텍스트 기반의 문서 비교
JP2008287517A (ja) 強調表示装置及びプログラム
Boros et al. Assessing the impact of OCR noise on multilingual event detection over digitised documents
Jain et al. “UTTAM” An Efficient Spelling Correction System for Hindi Language Based on Supervised Learning
CN110781300B (zh) 基于百度百科知识图谱的旅游资源文化特色评分算法
US20200285324A1 (en) Character inputting device, and non-transitory computer readable recording medium storing character inputting program
JP2013250925A (ja) 回答タイプ推定装置、方法、及びプログラム
JP5213098B2 (ja) 質問応答方法及びシステム
JP4931114B2 (ja) データ表示装置、データ表示方法及びデータ表示プログラム
KR20120042562A (ko) 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치
Vicedo et al. Question answering in Spanish
Malhar et al. Deep learning based Answering Questions using T5 and Structured Question Generation System’
Lahbari et al. A rule-based method for Arabic question classification
Helmy et al. Towards building a standard dataset for arabic keyphrase extraction evaluation

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070522

R150 Certificate of patent or registration of utility model

Ref document number: 3981734

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term