JP4512826B2

JP4512826B2 - 質問応答システム

Info

Publication number: JP4512826B2
Application number: JP2005058390A
Authority: JP
Inventors: 敦藤井; 徹也石川; 英理三原
Original assignee: 国立大学法人筑波大学
Priority date: 2005-03-03
Filing date: 2005-03-03
Publication date: 2010-07-28
Anticipated expiration: 2025-03-03
Also published as: JP2006244102A

Description

本発明は、何らかの困った状況にあるユーザからの質問に対して、解決手段となる行動を回答する質問応答システムに関するものである。

インターネットの普及により、Ｗｅｂ（ウェブ）〔ＷｏｒｌｄＷｉｄｅＷｅｂの略〕上には多種多様かつ膨大な情報が存在する。そのため、日常的な疑問に対し、検索エンジンを用いてウェブ上の情報から回答を探す機会が増えている。しかし、既存の検索エンジンを使うためには、質問の内容をキーワードで的確に表現する必要がある。さらに、検索された膨大なページから回答となる語句や文章をユーザ自身が探さなければならない。

ところで、自然言語による質問文に対して回答するために、質問応答システムが研究されている。既存の研究は、限定された領域に関する知識や規則によって推論を行うもの（推論型システム）と、組織化されていない文書集合から回答を抽出するもの（抽出型システム）との２種類に大別される。近年は後者の抽出型システムが主に研究されている。
以下、上記した従来技術について詳細に説明する。

人工知能分野における質問応答の研究は１９６０年代に遡る。具体的には、エキスパート・システムや対話システムであり、推論によって回答する「推論型システム」である。これらは、システムとユーザとの対話を通して質問・回答を洗練させたり、推論によって複数の事実から回答を導き出したりするという特長がある。しかし、領域知識や推論規則を人手で構築する必要があるため、回答できる分野が限定され、拡張性に乏しいといった問題があった。

一方、自然言語処理や情報検索分野では、１９９０年代後半からＴＲＥＣ（ＴｅｘｔＲＥｔｒｉｅｖａｌＣｏｎｆｅｒｅｎｃｅ：ｈｔｔｐ：／／ｔｒｅｃ．ｎｉｓｔ．ｇｏｖ／）やＮＴＣＩＲ（情報検索システム評価用テストコレクション構築プロジェクト）で質問応答の研究が盛んになった。人工知能分野における推論型システムと異なり、ここでは、「抽出型システム」が主な研究対象である。組織化されていない文書集合を情報源として用いるため、領域知識や推論規則の構築が不要な点で推論型システムとは異なる。

このようなＴＲＥＣやＮＴＣＩＲにおける質問応答システムの回答対象は客観的事実（ｆａｃｔｏｉｄ）である。ユーザが入力した、ｗｈｏ、ｗｈｅｎ、ｗｈｅｒｅ、ｗｈａｔを中心とするＷＨ疑問文に対し、名詞で回答する。客観的事実を回答とするシステムとしては、ｇｏｏラボ日本語自然文検索（ｈｔｔｐ：／／ｌａｂｓ．ｎｔｔｒｄ．ｃｏｍ／）やＭＵＲＡＸ（下記非特許文献１参照）がある。ＭＵＲＡＸは入力された質問文を解析することで、何についての質問で、回答はどのようなものかという仮説を立てる。その仮説に基づいてクエリ構築や検索を行い、文書集合から該当箇所を探して回答する。

また、下記非特許文献２では、行動を問う「ｈｏｗ型質問」への回答を目的とし、知識獲得手法が提案されている。ｌｉｎｕｘユーザのメーリングリストに投稿された質問メール・回答メールの本文から、重要文を抽出することで、方法や対処法を問う質問に回答するための知識を得ている。しかし、本手法では対象となる領域が限定されている。
ＪｕｌｉａｎＫｕｐｉｅｃ．ＭＵＲＡＸ：ＦｉｎｄｉｎｇａｎｄＯｒｇａｎｉｚｉｎｇＡｎｓｗｅｒｓｆｒｏｍＴｅｘｔＳｅａｒｃｈ．ＩｎＴ．Ｓｔｒｚａｌｋｏｗｓｋｙ，ｅｄｉｔｏｒ，ＮａｔｕｒａｌＬａｎｇｕａｇｅＩｎｆｏｒｍａｔｉｏｎＲｅｔｒｉｅｖａｌ，ｐｐ．３１１−３３２．ＫｌｕｗｅｒＡｖａｄｅｍｉｃＰｕｂｌｉｓｈｅｒｓ，１９９９．渡辺靖彦，園和也，岡田至弘．「メーリングリストを利用した質問応答システムのための知識獲得」，情報処理学会研究報告，２００４−ＮＬ−１６２，ｐｐ．１３１−１３８，２００４．徳永健伸，岩山真，乾健太郎，田中穂積．「日本語語順の推定モデルとその応用」，情報処理学会研究報告，９１−ＮＬ−８１，ｐｐ．９−１６，１９９１．

上記抽出型システムは、ｗｈｏ、ｗｈｅｎ、ｗｈｅｒｅ、ｗｈａｔを中心とするＷＨ疑問文に対し、名詞で回答するものが主流であるため、必ずしもユーザが知りたい回答（特に行動を表す表現）と一致するとは限らない。また、行動を問うｈｏｗ型質問に対応した研究は、コンピュータの利用法などに対象領域が限定されている。
本発明は、上記状況に鑑みて、抽出型の質問応答システムをウェブに応用し、行動を問うｈｏｗ型質問に領域を限定することなく回答することができる質問応答システムを提供する。つまり、何らかの困った状況にあるユーザからの質問に対して、取るべき行動を示唆するヘルプデスク指向の質問応答システムを提供する。

本発明は、上記目的を達成するために、
〔１〕質問応答システムにおいて、ウェブに接続され、ウェブページを検索し頻出する質問表現をよくある質問として抽出する質問抽出部と、この質問抽出部に接続されるとともに、ウェブに接続され、検索エンジンを用いて前記質問抽出部で抽出されたよくある質問に関連するページを網羅的に検索する検索部と、この検索部に接続され、前記検索されたページから前記よくある質問に対する回答となる行動を表す表現と、この行動を表す表現を含む複数の段落を抽出する回答抽出部と、この回答抽出部に接続され、前記回答抽出部で抽出された複数の段落を、同じ行動を表す表現を含むグループごとに分類する回答組織化部と、前記質問抽出部で抽出されたよくある質問と前記回答組織化部で分類された回答とを対にして予め記憶しておくＦＡＱデータベース部と、質問を入力し、回答が出力されるユーザインタフェース装置と、前記ＦＡＱデータベース部及び前記ユーザインタフェース装置に接続され、前記ＦＡＱデータベース部に記憶されたよくある質問に、前記ユーザインタフェース装置に入力された質問と同じ質問があるかを判別する判別部とを具備し、前記判別部で同じ質問があると判定された場合、前記ユーザインタフェース装置に入力された質問に対応する回答を、前記行動を表す表現又はこの行動を表す表現を含む段落を回答の単位として前記ＦＡＱデータベース部から提示し、前記判別部で同じ質問がないと判定された場合、前記ユーザインタフェース装置に入力された質問に対して前記検索・回答抽出・回答組織化を行って回答を生成し提示することを特徴とする。

〔２〕上記〔１〕記載の質問応答システムにおいて、前記段落の抽出には文字数に関する閾値を併用し、１２０文字以上２００文字以下を段落として抽出することを特徴とする。
〔３〕上記〔１〕記載の質問応答システムにおいて、前記回答抽出部は、前記抽出された複数の段落に含まれる前記行動を表す表現にスコアを付け、各段落に含まれる前記行動を表す表現のスコアを総和することで、前記各段落のスコア付けを行うことを特徴とする。

〔４〕上記〔３〕記載の質問応答システムにおいて、前記行動を表す表現のスコアは、回答として適切な行動を表す表現を選択するため、（ａ）係り受けの距離が近い、（ｂ）推奨表現と禁止表現を伴っている、（ｃ）抽出元ページの検索における順位が高い、（ｄ）質問に含まれる行動を表す表現との距離が近い、（ｅ）質問者（ユーザ）がすべき行動である、上記５つの基準を用いてスコア付けすることを特徴とする。

本発明によれば、以下のような効果を奏することができる。
（ａ）領域を限定することなく、ｈｏｗ型質問に回答することができる。つまり、何らかの困った状況にあるユーザに対して、取るべき行動を示唆するヘルプデスク指向の質問応答システムを提供する。
（ｂ）よくある質問とそれに対する回答を事前に記憶するＦＡＱデータベース部を有するため、よくある質問に対しては迅速なる回答を提示することができる。

本発明の質問応答システムは、ウェブに接続され、ウェブページを検索し頻出する質問表現をよくある質問として抽出する質問抽出部と、この質問抽出部に接続されるとともに、ウェブに接続され、検索エンジンを用いて前記質問抽出部で抽出されたよくある質問に関連するページを網羅的に検索する検索部と、この検索部に接続され、前記検索されたページから前記よくある質問に対する回答となる行動を表す表現と、この行動を表す表現を含む複数の段落を抽出する回答抽出部と、この回答抽出部に接続され、前記回答抽出部で抽出された複数の段落を、同じ行動を表す表現を含むグループごとに分類する回答組織化部と、前記質問抽出部で抽出されたよくある質問と前記回答組織化部で分類された回答とを対にして予め記憶しておくＦＡＱデータベース部と、質問を入力し、回答が出力されるユーザインタフェース装置と、前記ＦＡＱデータベース部及び前記ユーザインタフェース装置に接続され、前記ＦＡＱデータベース部に記憶されたよくある質問に、前記ユーザインタフェース装置に入力された質問と同じ質問があるかを判別する判別部とを具備し、前記判別部で同じ質問があると判定された場合、前記ユーザインタフェース装置に入力された質問に対応する回答を、前記行動を表す表現又はこの行動を表す表現を含む段落を回答の単位として前記ＦＡＱデータベース部から提示し、前記判別部で同じ質問がないと判定された場合、前記ユーザインタフェース装置に入力された質問に対して前記検索・回答抽出・回答組織化を行って回答を生成し提示する。

以下、本発明の実施の形態について詳細に説明する。
本発明のシステムは、入力された質問文に関連するウェブページを検索し、抽出した回答を分類して提示する。対象とするのは、ｗｈａｔ−ｉｆ、ｗｈａｔ−ｔｏ−ｄｏ、ｈｏｗ−ｔｏ−ｄｏ型の行動を問う質問である。これらの質問に回答するため、名詞句と動詞からなる「行動を表す表現（以下、単に行動表現と記す）」に着目する。例えば、「蜂に刺されたらどうすればよい？」という質問には「針を抜く」、「流水で洗う」、「軟膏を塗る」などの行動表現と、その行動表現を含む段落を回答する。

図１は本発明の質問応答システムの構成図である。
この図において、１はユーザインタフェース装置、２は質問（質問文：質問情報）、３は回答（回答文：回答情報）、１０は事前処理部、１１は回答部、１２はＦＡＱデータベース部、１３はウェブ、１４は質問抽出部、１５はよくある質問か否かを判別する判別部、１６は検索部、１７は回答抽出部、１８は回答組織化部である。

本システムでは、検索されたページを解析して回答を抽出することになるため、通常のウェブ検索よりも応答に時間がかかる。そこで、本発明では、聞かれそうな質問とそれに対する回答を事前にＦＡＱ（ＦｒｅｑｕｅｎｔｌｙＡｓｋｅｄＱｕｅｓｔｉｏｎｓ：頻繁に尋ねられる質問）としてデータベース化することで、迅速な回答を可能にする。
まず、ＦＡＱデータベースを構築する事前処理（オフライン処理）について説明する。ここでは、質問抽出部１４による「質問抽出」、検索部１６による「検索」、回答抽出部１７による「回答抽出」、回答組織化部１８による「回答組織化」の処理を段階的に行う。

まず、質問抽出部１４は、ウェブ１３上に頻出する質問を抽出する。次に、検索部１６は、既存の検索エンジンを用いて、質問抽出部１４により抽出された質問に関連するページを網羅的に検索する。次に、回答抽出部１７は、検索部１６によって検索されたページから行動表現を含む段落を抽出する。次に、回答組織化部１８は、含まれる行動表現によってこの抽出された段落を分類し、分類された回答と質問を対にしてＦＡＱデータベース部１２に蓄積する。

次に、ユーザがシステムを利用する場合のオンライン処理について説明する。ユーザがユーザインタフェース装置１に質問２を入力すると、ＦＡＱデータベース部１２内に同じ質問がないか判別部１５で検索する。同じ質問があれば、それに対応する回答をＦＡＱデータベース部１２より取り出し提示する。同じ質問がなければ、事前処理と同様に、検索部１６で検索、回答抽出部１７で回答抽出、回答組織化部１８で回答組織化を行い、動的に作成された回答を回答部１１に生成して提示する。

図２はその回答を示す画面例である。
その回答は、図２に示すような画面で提示する。これは「蜂に刺されたらどうすればいい？」という質問に対する回答画面例である。「病院へ行く」という見出し表現は組織化後のグループを代表する行動表現で、その下の「針を抜く」、「診察を受ける」などは、このグループに含まれる他の行動表現である。それらの行動表現を含む段落と、抽出元のページへのリンクを併記し、詳細情報を取得しやすくしている。

すなわち、本システムの「回答」とは、「病院へ行く」のような行動表現の句であり、また同時に、行動表現を含む段落のような文章でもある。ユーザは利用環境などによって、行動表現のグループ一覧やグループ内の段落一覧など、表示内容を選択することができる。
以下、質問抽出、検索、回答抽出、回答組織化の各処理について説明する。

（１）質問抽出
ウェブ１３上には、ＦＡＱサイトに用意された質問や、個人の日記サイトやウェブログに書かれた素朴な疑問まで、様々な質問表現が潜在するため、これらを収集する。
「○○が△△したら、どうする？」、「○○を△△したら？」のような表現を単語や品詞で規則化し、該当するフレーズや文を抽出する。具体的には『名詞の後に助詞（が・に・を）、動詞（〜したら）、と続き、さらに疑問符や「（、）どうする」が続く』という規則を満たす表現を抽出する。

このとき、形態素も用いるため、表層表現に一致しない語句も抽出することができる。他方において、質問以外の表現（ノイズ）が検出される可能性がある。しかし、仮にＦＡＱにノイズが含まれても、ユーザが当該ノイズを含む同様の質問をしなければ実害はない。そこで、質問抽出では精度（ｐｒｅｃｉｓｉｏｎ）よりも再現率（ｒｅｃａｌｌ）を重視する。

抽出元データにはＮＴＣＩＲ（ｈｔｔｐ：／／ｒｅｓｅａｒｃｈ．ｎｉｉ．ａｃ．ｊｐ／ｎｔｃｉｒ／ｉｎｄｅｘ−ｊａ．ｈｔｍｌ）のウェブコレクションを使用した。これはＪＰドメインから１１，０３８，７２０のページ（約１００ＧＢ）を収集したコレクションである。その結果、６９６１のフレーズが抽出された。
（２）検索
ウェブ１３検索には検索サイトＧｏｏｇｌｅを利用し、入力された質問文をそのままクエリとして用いる。しかし、実験の規模を拡張するためには、質問応答に適した検索エンジンを独自に開発する必要がある。

（３）回答抽出
回答抽出部１７は、検索部１６で検索されたページ群から行動表現を含む回答となる段落を抽出し、スコア付けを行う。実際のウェブ１３上にはＰＤＦファイルなども存在するが、本発明では本文のレイアウト解析を行う必要があるためＨＴＭＬファイルのみを対象とする。

以下、詳しい抽出手順を説明する。
まず、検索された各ページから、一定の長さを持つ段落を抽出する。これは、単語や文の単位で抽出した回答では、行動を説明するための情報が少なく、逆にページ単位では不要な情報が含まれやすいためである。段落の判別には、ＨＴＭＬタグの中でも＜Ｐ＞と＜ＢＲ＞を用いた。

タグの使い方はページ作成者によって様々であり、タグを判別に用いるだけでは段落の長さにばらつきが出てしまう。例えば、段落を示す＜Ｐ＞を改行代わりに用いているページでは、各文が段落となってしまい情報が不足する。逆に、非常に長い段落を読むことはユーザの負担が大きい。そこで、文字数に関する閾値を併用し、１２０文字以上２００文字以下を段落とした。

次に、回答としての適切さによって段落にスコア付けを行う。本発明のシステムでは行動表現が回答の最小単位となるため、行動表現がより多く含まれている段落が回答として重要である。そのため、行動表現を形式化し、スコア付けに用いた。
段落のスコア付けでは、まず、検索されたページに出現する個々の行動表現にスコアを付け、段落内に含まれる行動表現の各スコアを総和する。

ここで、行動表現について説明する。

を用いて、検索されたページのテキスト部分について係り受け解析を行う。そこから「名詞＋助詞＋動詞」という係り受け構造を抽出し、行動表現の最小単位とする。例えば「薬を患部に塗る。」という文の場合は「薬＋を＋塗る」と「患部＋に＋塗る」の２フレーズが得られる。ここで「薬を塗る」ならば「薬：塗る」のように助詞を省き、これを行動表現とする。

助詞を省くのは「蜂に人が刺される」と「蜂が人を刺す」のように、格交代により助詞が変化しても「誰が何をどうする」という行動内容は変わらず、同じ行動表現とみなすためである。
本手法は、「薬を患部に塗る」のように複数の名詞句（名詞＋助詞）が動詞に係った表現を行動表現として扱うこともできる。しかし、名詞句が複数あった場合「薬を塗る」と「薬を患部に塗る」が別の行動表現とみなされるという問題が生じる。そこで、実験では名詞句をひとつに限定した。

行動表現のスコア付けでは、回答として適切な行動表現を選択するため、次の５つの基準を用いる。
（ａ）係り受けの距離が近い。
係り受けの距離とは、名詞句と動詞の間にある形態素数のことである。日本語の場合、文末に近い要素ほど動詞の意味を限定する性質がある（上記非特許文献３参照）。また、距離が近いほど係り受け解析の誤りが少ないという利点もある。

（ｂ）「〜すること」、「〜しましょう」といった推奨表現と、「〜してはいけない」といった禁止表現を伴っている。
推奨表現は問題解決に有効な対処法を述べる時に用いられる。また、禁止表現は行ってはならない対処法を述べる時に用いられるため、推奨表現と同等に有用である。例えば、「蜂に刺されたら？」の質問例では「薬を塗りましょう」、「病院へ行くこと」などが推奨表現であり、「アンモニアをかけてはいけない」、「毒袋をつぶさないでください」などが禁止表現である。このような表現を正規表現によって照合し、検出する。

（ｃ）抽出元ページの検索における順位が高い。
抽出元ページとは、行動表現が抽出されたページである。現在、検索にはＧｏｏｇｌｅを用いているため、抽出元ページの順位とはＧｏｏｇｌｅの検索順位を意味する。ＧｏｏｇｌｅはＰａｇｅＲａｎｋにより、他ページから多くリンクされているページは高順位とする。そのため、信頼性を部分的に取り入れることができる。なお、このスコアは以下の式で計算する。

（検索ページ数−順位）／検索ページ数
（ｄ）段落内で質問に含まれる行動表現との距離が近い。
これは行動表現中の動詞と質問中の動詞の間にある形態素数から判断する。行動表現中の動詞が質問中の動詞に近いほど質問との関連性が強く、対処法として重要な行動表現が出現しやすい。

（ｅ）質問者（ユーザ）がすべき行動である。
質問者が動作主となる行動を取り出すため、格助詞「ガ」（以下、ガ格）によって主語が明示されている行動表現はスコアを下げる。例えば「蜂が巣を守る。」という文であれば動作主は「蜂」である。この文に出現する行動表現「蜂が守る」、「巣を守る」はともに蜂が行う行動表現であり、質問者への回答として適切でない。

各行動表現のスコアは、上記（ａ）〜（ｅ）の基準を下記式（１）によって結合し、計算する。

ここで、ｘは段落に出現する行動表現である。ａｘは係り受けの距離、ｄｘは質問との距離である。ｂｘは推奨・禁止表現の有無によって１か０を取る。ｃｘは上記（ｃ）で計算される値である。ｅｘはガ格の有無によって１か０を取る。

また、段落Ｐのスコアは下記式（２）により、Ｐに含まれる行動表現のスコアを総和して求める。

（４）回答組織化
回答組織化部１８は、上記の回答抽出の手法で抽出された複数の段落を分類する。ここでは、同じ行動表現を含む段落を同じグループにまとめる。ただし、スコアの低い行動表現はノイズになるので、事前に削除する。現在は経験的に、スコアが２以上の行動表現を使用して分類を行っている。ユーザに回答を提示する際に、グループごとに最も高いスコアの段落と行動表現を提示することで、類似した複数の段落を読む手間を省くことができ、どのような回答グループがあるのかを概観しやすくなる。

また、同一グループに含まれる行動表現は依存関係にあり、逆に、同じグループに属さない行動表現は排他的な関係にある。このような行動表現同士の関係は、行動の順序関係や依存関係を抽出するための手がかりになる。
（評価実験）
以下、本発明の質問応答システムの評価実験を行ったので説明する。

ｈｏｗ型の質問応答システムはほとんど研究されていないため、評価方法が確立されていない。そこで、人手でテストコレクションを作成し、本発明のシステムで最も重要な機能といえる回答抽出の機能、中でも行動表現のスコア付けに焦点を絞って評価を行った。
これは、本発明のシステムが、高スコアの行動表現を元に段落をグループ化し、グループ内で最高スコアの行動表現を代表（すなわち、図２における「病院へ行く」としてユーザに提示するため、回答として適切な行動表現のスコアが他よりも高くなることが重要となるからである。そこで、行動表現のスコア付けについて、先に提案した（ａ）〜（ｅ）の５つの基準が有効であるかという観点で評価を行った。

質問は、質問抽出で抽出されたフレーズのうち、質問頻度が高い以下の１３フレーズを使用した。
（１）パスワードを忘れたら、（２）事故にあったら、（３）迷子になったら、（４）急病にかかったら、（５）盗難にあったら、（６）蜂に刺されたら、（７）怪我をしたら、（８）ニキビができたら、（９）発作がおきたら、（１０）パスポートを紛失したら、（１１）セクハラを受けたら、（１２）やけどをしたら、（１３）火事になったら
これらの質問に対して、抽出された行動表現の適否を人手で判定した。さらに、適切な表現については、禁止表現かどうかも判定し、正解として扱った。

スコアによって順位付けた行動表現について、以下に示す精度と再現率を用い、Ｆ値を計算した。
ここで、Ｆ値（Ｆ−ｍｅａｓｕｒｅ）とは、再現率（ｒｅｃａｌｌ）と精度（ｐｒｅｃｉｓｉｏｎ）の調和平均である。再現率と精度の両方を考慮した評価尺度であり、再現率と精度が大きいほど、Ｆ値も大きくなる。

今、ある質問に対する全ての可能な行動表現に対して、
「システムが回答として出力した行動表現かどうか？」、「その質問に対する正しい行動表現かどうか？」という観点で分類すると、以下のような分割表（ｃｏｎｔｉｎｇｅｎｃｙｔａｂｌｅ）を作ることができる。

ここで、Ａ〜Ｄは該当するセルの行動表現件数であり、Ａ＋Ｂ＋Ｃ＋Ｄは全行動表現数になる。また、Ａ〜Ｃのセルは以下のケースに対応する。
Ａ：成功、Ｂ：失敗（抽出漏れ）、Ｃ：失敗（抽出誤り）
上記の分割表に基づいて、再現率と精度はそれぞれ以下の式で計算される。

再現率＝Ａ／（Ａ＋Ｂ）
精度＝Ａ／（Ａ＋Ｃ）
Ｆ値は再現率（Ｒ）と精度（Ｐ）の調和平均なので、以下で計算される。
まず、ＲとＰの逆数に対して算術平均を計算する。

さらに、逆数を取ると、Ｆ値＝２Ａ／（２Ａ＋Ｂ＋Ｃ）
すなわち、Ｆ値は、「成功と失敗（抽出漏れ、抽出誤り）」に対する「成功」の比率を表す。

まとめると、
精度＝出力した正解数／出力した全行動表現数
再現率＝出力した正解数／全行動表現中の正解数
Ｆ値＝２×再現率×精度／（再現率＋精度）
（結果と考察）
回答数によるＦ値の推移を調べるため、行動表現を段階的に増やしていき、上位２００件までの行動表現についてＦ値を計算した。評価に用いた全質問について、行動表現数を変化させた各点におけるＦ値を計算し、その平均値を用いて比較評価した。

結果を図３に示す。グラフの縦軸は平均Ｆ値、横軸は行動表現数を表す。それぞれの系列は以下の条件で評価した値を用い、全質問の平均を取っている。
ａｌｌ：基準（ａ）〜（ｅ）をすべて用いたスコアによる順位付け
Ｐａ：基準（ａ）「係り受けの距離」を使用したスコアによる順位付け
Ｐｂ：基準（ｂ）「推奨・禁止表現の有無」を使用したスコアによる順位付け
Ｐｃ：基準（ｃ）「検索における順位」を使用したスコアによる順位付け
Ｐｄ：基準（ｄ）「質問に含まれる行動表現との距離」を使用したスコアによる順位付け
Ｐｅ：基準（ｅ）「ガ格の名詞がかかる行動表現」を使用したスコアによる順位付け
また、比較のために、
ｆｒｅｑ：出現頻度による順位付け
という条件で評価した結果も示す。

まず、ｆｒｅｑとその他を比較すると、基準（ｄ）以外に関しては、いずれかの基準を用いることで平均Ｆ値が上がり結果が良くなっており、基準（ｄ）以外は単独で用いても有効な基準といえる。
また、ａｌｌとＰａ〜Ｐｅを比較すると、出力する行動表現の数によらず、ａｌｌの方が良い結果であった。すなわち、基準の組み合わせによる相乗効果があることが分かった。

上記評価実験ではｈｏｗ型質問についての調査を示したが、本発明によれば、原理的にはｗｈｅｒｅ−ｔｏ−ｄｏ質問やｗｈｅｎ−ｔｏ−ｄｏ質問にも応用可能であり、「行動を問う質問」に対して幅広い観点から回答することができる。
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨に基づき種々の変形が可能であり、これらを本発明の範囲から排除するものではない。

本発明の質問応答システムは、行動を問う質問に対して、領域を限定することなく回答することができる質問応答システムとして利用可能である。

本発明の実施例を示す質問応答システムの構成図である。本発明の実施例を示す質問応答システムにおける回答画面例を示す図である。本発明の実験例における各条件によるＦ値グラフである。

１ユーザインタフェース装置
２質問（質問文：質問情報）
３回答（回答文：回答情報）
１０事前処理部
１１回答部
１２ＦＡＱデータベース部
１３ウェブ
１４質問抽出部
１５判別部
１６検索部
１７回答抽出部
１８回答組織化部

Claims

（ａ）ウェブに接続され、ウェブページを検索し頻出する質問表現をよくある質問として抽出する質問抽出部と、
（ｂ）該質問抽出部に接続されるとともに、ウェブに接続され、検索エンジンを用いて前記質問抽出部で抽出されたよくある質問に関連するページを網羅的に検索する検索部と、
（ｃ）該検索部に接続され、前記検索されたページから前記よくある質問に対する回答となる行動を表す表現と、該行動を表す表現を含む複数の段落を抽出する回答抽出部と、
（ｄ）該回答抽出部に接続され、前記回答抽出部で抽出された複数の段落を、同じ行動を表す表現を含むグループごとに分類する回答組織化部と、
（ｅ）前記質問抽出部で抽出されたよくある質問と前記回答組織化部で分類された回答とを対にして予め記憶しておくＦＡＱデータベース部と、
（ｆ）質問を入力し、回答が出力されるユーザインタフェース装置と、
（ｇ）前記ＦＡＱデータベース部及び前記ユーザインタフェース装置に接続され、前記ＦＡＱデータベース部に記憶されたよくある質問に、前記ユーザインタフェース装置に入力された質問と同じ質問があるかを判別する判別部とを具備し、
（ｈ）前記判別部で同じ質問があると判定された場合、前記ユーザインタフェース装置に入力された質問に対応する回答を、前記行動を表す表現又は該行動を表す表現を含む段落を回答の単位として前記ＦＡＱデータベース部から提示し、前記判別部で同じ質問がないと判定された場合、前記ユーザインタフェース装置に入力された質問に対して前記検索・回答抽出・回答組織化を行って回答を生成し提示することを特徴とする質問応答システム。
請求項１記載の質問応答システムにおいて、前記段落の抽出には文字数に関する閾値を併用し、１２０文字以上２００文字以下を段落として抽出することを特徴とする質問応答システム。
請求項１記載の質問応答システムにおいて、前記回答抽出部は、前記抽出された複数の段落に含まれる前記行動を表す表現にスコアを付け、各段落に含まれる前記行動を表す表現のスコアを総和することで、前記各段階のスコア付けを行うことを特徴とする質問応答システム。
請求項３記載の質問応答システムにおいて、前記行動を表す表現のスコアは、回答として適切な行動を表す表現を選択するため、
（ａ）係り受けの距離が近い
（ｂ）推奨表現と禁止表現を伴っている
（ｃ）抽出元ページの検索における順位が高い
（ｄ）質問に含まれる行動を表す表現との距離が近い
（ｅ）質問者（ユーザ）がすべき行動である
上記５つの基準を用いてスコア付けすることを特徴とする質問応答システム。