JP2015164066A - 情報検索装置、情報検索方法およびそのプログラム - Google Patents

情報検索装置、情報検索方法およびそのプログラム Download PDF

Info

Publication number
JP2015164066A
JP2015164066A JP2015095131A JP2015095131A JP2015164066A JP 2015164066 A JP2015164066 A JP 2015164066A JP 2015095131 A JP2015095131 A JP 2015095131A JP 2015095131 A JP2015095131 A JP 2015095131A JP 2015164066 A JP2015164066 A JP 2015164066A
Authority
JP
Japan
Prior art keywords
document
search
keyword
information
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015095131A
Other languages
English (en)
Other versions
JP6131983B2 (ja
Inventor
憲彦 坂本
Norihiko Sakamoto
憲彦 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015095131A priority Critical patent/JP6131983B2/ja
Publication of JP2015164066A publication Critical patent/JP2015164066A/ja
Application granted granted Critical
Publication of JP6131983B2 publication Critical patent/JP6131983B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】質問内容から最適な情報を検索可能とする。
【解決手段】コンピュータに、学習対象の文書に関する質問文を読取るステップS11と、質問文を形態素解析し、キーワードを取出すステップS12と、取出したキーワードと学習対象の文書の重要キーワードとを組合せて検索式を生成するステップS13と、生成した検索式で検索を実行し、質問に対する回答を得るための文書情報を学習者に出力するステップS14と、を実行させる。
【選択図】図6

Description

本発明は、情報検索装置、情報検索方法およびそのプログラムに関し、特に、電子化された教材を用いて学習を行うWEBベースの学習システムにおいて、学習者の質問内容からその教材の学習に最適な情報、すなわち質問に対する回答を得るための情報を検索可能にする情報検索装置、情報検索方法およびそのプログラムに関する。
今日、コンピュータネットワークの拡大とその進歩に伴い、情報を入手したい時、インターネットで公開されている情報の中から所望の情報をキーワードなどを使って検索可能にするサーチエンジンが広く利用されている。サーチエンジンは、WWWなどで公開されている情報の全文を貯えておき、キーワードによって検索する全文検索型と、カテゴリー別に分類されているディレクトリ型の2種類に大別できる。最近では、ディレクトリ型のサーチエンジンにも検索機能が搭載されるようになってきている。
電子化された教材を用いて学習を行うWEBベースの学習システムにおいても、情報の入手にキーワードによる検索が必須である。WEBベースの学習システムは、学習者からの質問を受け付ける機能を持つものが一般的であるが、質問に対する回答は講師が手作業により作成する必要がある。このため、コストが掛かり、またその回答を得るまでに時間が掛かる。講師が回答を作成する代わりに、学習者自身がWEB上のサーチエンジンを用いて検索し回答を得ることはできるものの、所望の情報を得るためサーチエンジンに入力する、キーワードから構成される検索式を適切に作成して回答を得ることは困難である。
また、WEBベースの学習システムにおいて、学習者の意欲を保つためには、疑問点に対して即座のレスポンスが必要であり、メールや掲示版では遅い。チャットを利用することで即時性は保てるが、チャット利用者に即座に対応するため常に講師が待機する必要があり、コストが掛かる。学習者は、疑問点の解決のため、サーチエンジンを用いて、ファイルやWEBページを検索することはできるが、一般的にサーチエンジンの利用者にとって、所望の情報を得るためサーチエンジンに入力するのに適したキーワードから構成される検索式を作成することは難しく、1つの検索キーワードだけ入力して検索する場合が多い。この場合、一度に大量のWEBページが検索され、有効な関連WEBページを得るのは困難である。
また、従来のWEBベースの学習システムにおいて、利用者の入力したテキスト文(文書)から、カテゴリーを判別し、検索結果を絞り込む技術はあるが、事前の準備が必要であり、コストが掛かる。
しかるに、特許文献1に記載の情報検索システムは、情報ネットワーク上の情報を検索する検索装置と、原文と該原文に関するユーザからの質問とに基づいて検索装置に対する検索要求を行う検索要求装置と、を含む情報検索システムにおいて、検索装置は、原文を指定する原文指定部と、学習者の質問文から検索キーワードを抽出するキーワード抽出部と、その検索キーワードに基づいて質問の質問属性を指定する質問属性指定部と、指定された質問属性に基づいて検索装置による検索対象となる範囲を絞り込むことに利用できる単語の単語属性を指定し、原文からその単語属性に属する単語を抽出し、抽出した単語を検索キーワードへの追加キーとする追加キー抽出部と、追加キーが抽出された場合にその追加キーを検索キーワードに追加し、検索装置に対し質問に基づいた検索要求を作成し、検索要求を原文から抽出された追加キーに関連付ける関連付け部とを有する。
端的に言えば、特許文献1は、質問文から抽出された検索キーワードに基づいて指定された質問属性に基づき検索範囲を絞り込むための単語属性を指定し、原文から該単語属性に属する単語を抽出し、抽出した単語を検索キーワードに加えて検索を行う技術を開示したものである。
特開2005−11149号公報(明細書の[請求項1]、段落番号[0002]、[0004]、[0007]〜[0009]、[0014]、[00015]および図面の[図1]参照)。
しかしながら、上記特許文献1に開示の情報検索システムおよび検索要求装置は、原文から単語属性に属する単語を抽出し、抽出した単語を検索キーワードに加えて検索式を求めているので、学習者の質問文および/または原文の記載によっては重要でない検索キーワードが求められてしまい、所望のキーワードを抽出できず、十分な絞込みができないという問題がある。
また、上記特許文献1に記載の発明では、学習者に何等の操作、意識をさせることなく、すなわち自動的に、質問に対する回答を得ることはできないという問題がある。
本発明は、上記問題を解決するためになされたものであり、情報に関する質問内容からその質問に回答するのに最適な情報を検索する情報検索装置、情報検索方法およびそのプログラムの提供、より具体的には、教材に関する学習者の質問内容からその教材の学習に最適な十分に絞り込んだ情報を自動的に検索する情報検索装置、情報検索方法およびそのプログラムの提供を目的とする。
上記目的を達成する本発明による情報検索プログラムは、学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索プログラムであって、コンピュータ装置を、複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力手段と、学習者からの質問文の入力を受け付ける質問文受付手段と、前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出手段と、前記出力手段から出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出手段と、前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索手段と、して機能させることを特徴とする。
上記情報検索プログラムは、さらに、前記コンピュータ装置を、前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成手段、として機能させることを特徴とする。
上記目的を達成する本発明による情報検索方法は、学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索方法であって、コンピュータ装置が、複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力ステップと、学習者からの質問文の入力を受け付ける質問文受付ステップと、前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出ステップと、前記出力ステップで出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出ステップと、前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索ステップと、を行うことを特徴とする。
上記情報検索方法は、さらに、前記コンピュータ装置が、前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成ステップ、を行うこと特徴とする。
上記目的を達成する本発明による情報検索装置は、学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索装置であって、複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力手段と、学習者からの質問文の入力を受け付ける質問文受付手段と、前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出手段と、前記出力ステップで出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出手段と、前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索手段と、を備えることを特徴とする。
上記情報検索装置は、さらに、前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成手段、を備えること特徴とする。
本発明の情報検索装置、情報検索方法およびそのプログラムによれば、学習者は検索式を意識せずに教材の学習内容についての質問文を入力することが可能となり、かつ教材の学習内容に沿った学習者が真に必要とする最適な情報を自動的に検索することが可能となる。
本発明の情報検索装置のブロック構成図である。 学習対象の文書に関する質問の回答を得るのに適切な文書を提示する基本手順を示すフローチャートである。 教材の主文書の記載内容を上段に表示し取出された重要キーワードを下段に表示するディスプレイ画面30の具体例を示す図である。 教材の主文書の関連文書の記載内容を上段に表示し取出された重要キーワードを下段に表示するディスプレイ画面40の具体例を示す図である。 キーワードテーブルを示す図であり、(A)は図3に示す教材の主文書におけるキーワードテーブルを示す図であり、(B)は図4に示す教材の主文書の関連文書におけるキーワードテーブルを示す図である。 学習対象の文書に関する質問の回答を得るのに適切な重要キーワードを加味した文書を提示する手順を示すフローチャートである。 学習者が学習対象の文書に関連する文書を参照中に質問文を入力し、質問文の形態素解析を行っている所の画面を示す図である。 質問文から取出されたキーワードを用いて検索した検索結果を示す図である。 本発明により学習者が学習対象の文書に関する質問内容からその学習に最適な文書を取得している所の画面を示す図である。 学習者が入力した質問文から取出されたキーワードと質問文の入力時に開いていた教材の文書に対応する重要キーワードとを組合わせたキーワードを用いて検索した検索結果を示す図である。 図1に示す情報検索装置を用いて、複数の文書における各重要キーワードを取得する処理を示すフローチャートである。
図1は本発明の情報検索装置のブロック構成図である。図1の一点鎖線の上側に示す本発明の情報検索装置1は、サーバであり、図1の一点鎖線の下側に示す、検索エンジンとしてのサーバ18および学習者側のパーソナルコンピュータ(学習者PC)19とネットワーク17を介して通信可能に接続され、学習者と情報検索装置1との間でWEBベースの学習を行う装置である。情報検索装置1は、相互にバスライン10を介して接続されるCPU11、学習者からの質問文の入力を受け付ける質問文受付手段であるマウスやキーボード等の入力装置12、メモリ13、ハードディスク14、ディスプレイ15およびネットワーク17を介してサーバ18および学習者PC19と通信する通信ユニット16を有する。
メモリ13には、CPU11を第1キーワード抽出手段131、第2キーワード抽出手段132、検索手段133および重要語定義テーブル生成手段134として機能させるためのプログラムが格納されている。
通信ユニット16は、複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末(学習者PC)19に出力する出力手段としての機能も有する。
第1キーワード抽出手段は、質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する。
第2キーワード抽出手段は、出力手段から出力された第1学習領域におけるキーワードのうち、質問文に関する情報の検索のために第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して重要キーワードを検索のための第2キーワードとして抽出する。
検索手段は、第1キーワードと第2キーワードの双方を用いて質問文に関する情報の検索を行う。
重要語定義テーブル生成手段は、教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを重要キーワードとして重要語定義テーブルを生成する。
ハードディスク14には、学習者が質問する学習対象の教材の文書を格納する教材用テキストファイル群141および文書を自立語(名詞、代名詞、動詞、形容詞、形容動詞、副詞、接続詞および感動詞)に分けるために用いる形態素解析辞書ファイル142が格納される。
情報検索装置1は、通信ユニット16、ネットワーク17を介して学習対象となる主文書を含む複数の文書をサーバ18から受信し、教材用テキストファイル群141に格納する。サーバ18から受信した複数の文書は、受信後、直接メモリ13に書込んでもよい。
本発明の実施形態では、学習対象となる主文書を含む複数の文書はサーバ18に格納されサーバ18から情報検索装置1に送信されるが、他の実施形態として複数の文書はサーバ18以外のコンピュータから送信された情報あるいは自身で作成した情報を情報検索装置1内に格納してもよい。
次いで、情報検索装置1は、形態素解析辞書ファイル142を用いて各文書をそれぞれ形態素解析し自立語を取出し、各文書をそれぞれ解析し自立語の重要度を算出し、各文書における自立語の重要度の中から少なくとも一つの自立語を重要キーワードとして選択する。
図2は学習対象の文書に関する質問の回答を得るのに適切な文書を提示する基本手順を示すフローチャートである。
ステップS1で、学習者PC19から通信ユニット16を介して入力された図3に示す学習対象の文書に関する質問文を読取る。
ステップS2で、ステップS1で入力した質問文を形態素解析し質問文内のキーワードを取出す。
ステップS3で、学習者が現在参照中の文書を形態素解析し該文書内のキーワードを取出す。現在参照中の文書は、学習者PC19と通信して得るか、質問文の読取り時に読取る。
ステップS4で、ステップS2で質問文から取出したキーワードとステップS3で参照中の文書から取出したキーワードとを組合わせて、所望の情報を得るためサーチエンジンに入力するキーワードで構成される検索式を生成する。
ステップS5で、ステップS4で生成した検索式で検索を実行し、質問に対する回答を得るための文書情報(WEBページ)を学習者に出力する。
図3は教材の主文書の記載内容を上段に表示し取出された重要キーワードを下段に表示するディスプレイ画面30の具体例を示す図であり、図4は教材の主文書の関連文書の記載内容を上段に表示し取出された重要キーワードを下段に表示するディスプレイ画面40の具体例を示す図である。図3および図4の上段に示す文書は、法律入門の教材に関するものであり、学習者による学習者PC19の操作によりサーバ18から受信され情報検索装置1のハードディスク14内の教材用テキストファイル群141に格納される。主文書は知的財産権に関し、関連文書は独占禁止法に関する。各文書はそれぞれ別の記載内容を有する。以下、各文書中に………で示す部分は、記載内容を省略していることを示す。
図3および図4において、上段に示すディスプレイ画面30および40は、下段左側に、各文書を形態素解析して取出した自立語のうち名詞を抜き出した結果のキーワード(名詞)および各キーワードの重み(重要度)の算出結果を示し、下段右側に、算出したキーワードの重要度の中から選択した重要度の高い重要キーワードを示す。
図3および図4は、それぞれ法律入門の教材であり、主文書および関連文書の記載内容と、形態素解析結果、すなわちキーワード(名詞、重み)および重要キーワードの取出し結果をそれぞれ示す。重みは、図3に示す文書31と図4に示す文書41とに出現するキーワード(ここでは名詞類)に対して、tf/idf値など統計処理で一般に用いられる重みの値を算出して用いる。重みの値が高いキーワードを重要キーワードとしてメモリ13に記憶する。
なお、図3および図4に示す重みは、主文書と関連文書とに出現するキーワード(ここでは名詞)に対して、tf/idf値など統計処理で一般に用いられる重みを算出して求めたものである。
図5はキーワードテーブルを示す図であり、(A)は図3に示す教材の主文書におけるキーワードテーブルを示す図であり、(B)は図4に示す教材の主文書の関連文書におけるキーワードテーブルを示す図である。図5の(A)および(B)に示す例では、キーワードの重みが6.0以上のキーワードが重要キーワードに設定されている。この重要キーワードは、図中値1で示され、重要キーワードとみなされないものは値0で示される。それゆえ、このキーワードテーブルは重要語定義テーブルと称する。
この重要キーワードは、通信ユニット16から学習者PC19に出力された現在参照中の文書(第1学習領域)におけるキーワードのうち、質問文に関する情報の検索のために第1キーワードに加えるべき重要キーワードである。第2キーワード抽出手段は、重要語定義テーブルを参照して重要キーワードを検索のための第2キーワードとして抽出する。
重要語定義テーブル生成手段は、教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して重要度の値の高いキーワードを重要キーワードとして抽出可能にする重要語定義テーブルを生成する。
図6は学習対象の文書に関する質問の回答を得るのに適切な重要キーワードを加味した文書を提示する手順を示すフローチャートである。ここで、適切な文書とは所定の学習対象の文書に関する質問に対する回答を得るためのWEBページを意味する。
ステップS11で、学習者PC19から通信ユニット16を介して入力された図3に示す学習対象の文書に関する質問文を読取る。
ステップS12で、ステップS11で入力した質問文を形態素解析し質問文内のキーワードを取出す。
ステップS13で、ステップS12で取出したキーワードと学習対象の文書の重要キーワードであって、学習対象の文書に関連する学習者が現在参照中の図4に示す文書とを組合わせて、所望の情報を得るためサーチエンジンに入力するキーワードで構成される検索式を生成する。現在参照中の文書は、学習者PC19と通信して得るか、質問文の読取り時に読取る。
ステップS14で、ステップS13で生成した検索式で検索を実行し、質問に対する回答を得るための文書(WEBページ)を学習者に出力する。
図7は、学習者が学習対象の文書に関連する文書を参照中に質問文を入力し、質問文の形態素解析を行っている所の画面70を示す図である。図7において、図6のステップS11で学習者が図4に示す文書を参照中に入力した質問文を図7の上段に示し、図6のステップS12で質問文の形態素解析した結果を図7の下段左側に示し、キーワードを取出した結果を図7の下段右側に示す。
学習者は図4に示す独占禁止法の文書を参照しており、独占禁止法の違反摘発事例を知りたいのであるが、質問文から取出されたキーワードは、「違反」、「摘発」および「事例」の3語だけである。これら3語を検索キーワードとして用いても、独占禁止法の違反または摘発の事例を検索することは困難である。
図8は質問文から取出されたキーワードを用いて検索した検索結果を示す図である。図8に示す検索結果の画面80は、質問文から取出されたキーワード、「違反」、「摘発」および「事例」の3語による検索結果は独占禁止法の違反または摘発の事例を含む文書情報(WEBページ)として不十分であることが示される。
図9は、本発明により学習者が学習対象の文書に関する質問内容からその学習に最適な文書を取得している所の画面90を示す図である。図9において、学習者が入力した質問文から取出されたキーワードを左上に示し、質問文の入力時に開いていた教材の文書、すなわち図4に示す文書に対応して予めメモリ13に格納された重要キーワードを右上に示し、質問文から取出されたキーワードと重要キーワードとを組合わせた例を下段に示す。
図9に示されるように、図6のステップS13で、「違反」、「摘発」、「事例」、「メーカ」、「値段」、「競争」および「独占」をAND条件で検索式を生成することにより、独占禁止法の違反または摘発の事例を含む文書を検索結果の上位に得ることができることが判る。
図10は学習者が入力した質問文から取出されたキーワードと質問文の入力時に開いていた教材の文書に対応する重要キーワードとを組合わせたキーワードを用いて検索した検索結果を示す図である。図10に示す検索結果の画面100は、独占禁止法の違反または摘発の事例を含む文書情報(WEBページ)として十分であることが示される。
図11は図1に示す情報検索装置を用いて、複数の文書における各重要キーワードを取得する処理を示すフローチャートである。本フローチャートにおける処理は、学習者が質問文を入力しその回答を得る前に行う事前の準備段階における処理である。この処理を事前に行うことで、質問文の入力後における処理の時間を短縮できる。
ステップS101で、教材を構成する複数の文書を登録する。すなわち、学習者PC19からの入力操作により学習対象となる主文書と主文書の関連文書を含む複数の文書を通信ユニット16を介して受信し、ハードディスク14内のテキストファイル群141に格納する。主文書は質問文から抽出されたキーワードを元に検索された文書であることが好ましい。また、主文書の関連文書は質問文から抽出されたキーワードを元に検索された文書であることが好ましい。
ステップS102で、ステップS101で格納した各文書を形態素解析しキーワードを取出す。
ステップS310で、キーワードテーブルを参照する。図5を用いて先に説明したキーワードテーブル(重要語定義テーブル)は、キーワード(本実施形態では名詞のキーワードと各キーワードの重み)および各キーワードが重要キーワードであるか否かの判定値を一覧表示するものである。
キーワードテーブルの作成に際し、各文書に出現するキーワードに対しそれぞれtf/idf値など統計処理し、キーワードの重み(重要度)を算出する。より詳しくは、主文書と主文書の関連文書とを比較し、出現する名詞に対し重みを示す尺度である情報利得(Information Gain)や tf-idf 値を計算する。情報利得や tf-idf 値は、他の文書には出現せずにその文書にだけ出現する語(キーワード)ほど大きい。tf-idf 値とは、キーワード抽出対象の文書から文書を代表するキーワードを抽出したときのキーワードの出現頻度を示す指標である。本実施形態では、一般的に用いられる tf-idf 値を算出して重要度を示す指標とする。
ステップS104で、文書毎に重要度の高いキーワードを選択し、重要キーワードとしてメモリ13に保存する。
以上説明した本発明の実施形態は、図2に示すフローチャートのステップS1〜S5の処理および図6に示すフローチャートのステップS11〜S14の処理を実行する手順を例に挙げて説明したが、他の実施形態として、例えば図11に示すフローチャートのステップS101〜S104の処理を予め実行しておくことにより、ステップS101〜S104の処理を予め実行するので事前の準備は必要であるが、学習対象の文書の形態素解析およびキーワードの抽出が事前に実行されるので、図6に示すフローチャートのステップS13の処理時間を短縮できる。
(付記1)
学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索プログラムであって、
コンピュータ装置を、
複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力手段と、
学習者からの質問文の入力を受け付ける質問文受付手段と、
前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出手段と、
前記出力手段から出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出手段と、
前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索手段と、
して機能させることを特徴とする情報検索プログラム。
(付記2)
前記コンピュータ装置を、
前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成手段、
として機能させることを特徴とする付記1に記載の情報検索プログラム。
(付記3)
学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索方法であって、
コンピュータ装置が、
複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力ステップと、
学習者からの質問文の入力を受け付ける質問文受付ステップと、
前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出ステップと、
前記出力ステップで出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出ステップと、
前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索ステップと、
を行うことを特徴とする情報検索方法。
(付記4)
前記コンピュータ装置が、
前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成ステップ、
を行うこと特徴とする付記3に記載の情報検索方法。
(付記5)
学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索装置であって、
コンピュータ装置が、
複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力手段と、
学習者からの質問文の入力を受け付ける質問文受付手段と、
前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出手段と、
前記出力ステップで出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出手段と、
前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索手段と、
を備えたことを特徴とする情報検索装置。
(付記6)
前記コンピュータ装置が、
前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成手段、
を備えたこと特徴とする付記5に記載の情報検索装置。
(付記7)
種々の情報を格納するサーバに接続され、該サーバから取得した所定の第1情報に関する質問文から質問に対する回答を得るための情報を検索する情報検索装置であって、
学習者側のコンピュータから受信した前記質問文を読取り、形態素解析して第1キーワードを抽出する第1抽出手段と、
前記第1情報および該第1情報に関連する第2情報の各文書をそれぞれ読取り、形態素解析して第2キーワードを抽出する第2抽出手段と、
前記各文書に出現する前記第2キーワードについて重み付け処理を行い、各第2キーワードの重要度を示す重み値を求め、該重み値から重要度の高いキーワードを選択し、選択したキーワードを前記各文書に対する重要キーワードにそれぞれ設定する設定手段と、
前記第1キーワードと前記第2情報の文書に対する重要キーワードの組合せから検索式を生成する検索式生成手段と、
を備えることを特徴とする情報検索装置。
(付記8)
前記第2情報の文書は、前記第1キーワードを元に検索された文書である、
付記7に記載の情報検索装置。
(付記9)
前記第1情報の文書は、前記第1キーワードを元に検索された文書である、
付記7に記載の情報検索装置。
(付記10)
種々の情報を格納するサーバから取得した所定の第1情報に関する質問文から質問に対する回答を得るための情報を検索する情報検索方法であって、
学習者側のコンピュータから受信した前記質問文を読取り、形態素解析して第1キーワードを抽出する第1抽出ステップと、
前記第1情報および該第1情報に関連する第2情報の各文書をそれぞれ読取り、形態素解析して第2キーワードを抽出する第2抽出ステップと、
前記各文書に出現する前記第2キーワードについて重み付け処理を行い、各第2キーワードの重要度を示す重み値を求め、該重み値から重要度の高いキーワードを選択し、選択したキーワードを前記各文書に対する重要キーワードにそれぞれ設定する設定ステップと、
前記第1キーワードと前記第2情報の文書に対する重要キーワードの組合せから検索式を生成する検索式生成ステップと、
備えたことを特徴とする情報検索方法。
(付記11)
種々の情報を格納するサーバから取得した所定の第1情報に関する質問文から質問に対する回答を得るための情報を検索するための情報検索プログラムであって、
コンピュータに、
学習者側のコンピュータから受信した前記質問文を読取り、形態素解析して第1キーワードを抽出する第1抽出ステップと、
前記第1情報および該第1情報に関連する第2情報の各文書をそれぞれ読取り、形態素解析して第2キーワードを抽出する第2抽出ステップと、
前記各文書に出現する前記第2キーワードについて重み付け処理を行い、各第2キーワードの重要度を示す重み値を求め、該重み値から重要度の高いキーワードを選択し、選択したキーワードを前記各文書に対する重要キーワードにそれぞれ設定する設定ステップと、
前記第1キーワードと前記第2情報の文書に対する重要キーワードの組合せから検索式を生成する検索式生成ステップと、
を実行させることを特徴とする情報検索プログラム。
1 情報検索装置
10 バスライン
11 CPU
12 入力装置
13 メモリ
14 ハードディスク
15 ディスプレイ
16 通信ユニット
17 ネットワーク
18 サーバ
30、40、70、80、90、100 ディスプレイ画面(画面)
131 第1キーワード抽出手段
132 第2キーワード抽出手段
133 検索手段
134 重要語定義テーブル生成手段
141 教材用テキストファイル群
142 形態素解析辞書ファイル

Claims (7)

  1. コンピュータに、
    文書と文書から抽出されたキーワードとを対応づけて双方表示可能な複数の文書のうち、いずれの文書から抽出されたキーワードを検索処理に用いるかを特定する情報を検索依頼を行う他のコンピュータから取得すると、該特定する情報によって特定される文書から抽出されたキーワードを検索処理に用いる、
    ことを実行させることを特徴とする情報検索プログラム。
  2. コンピュータが、
    文書と文書から抽出されたキーワードとを対応づけて双方表示可能な複数の文書のうち、いずれの文書から抽出されたキーワードを検索処理に用いるかを特定する情報を検索依頼を行う他のコンピュータから取得すると、該特定する情報によって特定される文書から抽出されたキーワードを検索処理に用いる、
    ことを実行することを特徴とする情報検索プログラム。
  3. 文書と文書から抽出されたキーワードとを対応づけて双方表示可能な複数の文書のうち、いずれの文書から抽出されたキーワードを検索処理に用いるかを特定する情報を検索依頼を行う他のコンピュータから取得すると、該特定する情報によって特定される文書から抽出されたキーワードを検索処理に用いる制御部、
    を備えることを特徴とする情報検索装置。
  4. コンピュータに、
    文書の検索処理を行う際に、検索依頼を行う他のコンピュータから取得された、文書と文書から抽出されたキーワードとを対応づけて双方表示可能な複数の文書のうちのいずれかの文書を特定する情報に基づいて特定される文書から抽出されたキーワードを用いて、前記検索処理を行う、
    ことを実行させることを特徴とする情報検索プログラム。
  5. 前記特定される文書は、前記特定される文書から抽出されたキーワードと関連付けて前記他のコンピュータの表示部に表示された文書である
    ことを特徴とする請求項4記載の情報検索プログラム。
  6. コンピュータが、
    文書の検索処理を行う際に、検索依頼を行う他のコンピュータから取得された、文書と文書から抽出されたキーワードとを対応づけて双方表示可能な複数の文書のうちのいずれかの文書を特定する情報に基づいて特定される文書から抽出されたキーワードを用いて、前記検索処理を行う、
    ことを特徴とする情報検索方法。
  7. 文書の検索処理を行う際に、検索依頼を行う他のコンピュータから取得された、文書と文書から抽出されたキーワードとを対応づけて双方表示可能な複数の文書のうちのいずれかの文書を特定する情報に基づいて特定される文書から抽出されたキーワードを用いて、前記検索処理を行う制御部、
    を備えることを特徴とする情報検索装置。
JP2015095131A 2015-05-07 2015-05-07 情報検索装置、情報検索方法およびそのプログラム Expired - Fee Related JP6131983B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015095131A JP6131983B2 (ja) 2015-05-07 2015-05-07 情報検索装置、情報検索方法およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015095131A JP6131983B2 (ja) 2015-05-07 2015-05-07 情報検索装置、情報検索方法およびそのプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013100838A Division JP2013178808A (ja) 2013-05-13 2013-05-13 情報検索装置、情報検索方法およびそのプログラム

Publications (2)

Publication Number Publication Date
JP2015164066A true JP2015164066A (ja) 2015-09-10
JP6131983B2 JP6131983B2 (ja) 2017-05-24

Family

ID=54186930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015095131A Expired - Fee Related JP6131983B2 (ja) 2015-05-07 2015-05-07 情報検索装置、情報検索方法およびそのプログラム

Country Status (1)

Country Link
JP (1) JP6131983B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074210A (ja) * 1996-07-05 1998-03-17 Hitachi Ltd 文献検索支援方法及び装置およびこれを用いた文献検索サービス
JPH1173415A (ja) * 1997-08-27 1999-03-16 Toshiba Corp 類似文書検索装置及び類似文書検索方法
JP2000207404A (ja) * 1999-01-11 2000-07-28 Sumitomo Metal Ind Ltd 文書検索方法及び装置並びに記録媒体
JP2004348768A (ja) * 2004-08-24 2004-12-09 Hitachi Ltd 文書検索方法
JP2005301855A (ja) * 2004-04-15 2005-10-27 Hitachi Ltd 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
US20060026013A1 (en) * 2004-07-29 2006-02-02 Yahoo! Inc. Search systems and methods using in-line contextual queries
JP2006338114A (ja) * 2005-05-31 2006-12-14 Canon Inc データ管理装置およびデータ管理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074210A (ja) * 1996-07-05 1998-03-17 Hitachi Ltd 文献検索支援方法及び装置およびこれを用いた文献検索サービス
JPH1173415A (ja) * 1997-08-27 1999-03-16 Toshiba Corp 類似文書検索装置及び類似文書検索方法
JP2000207404A (ja) * 1999-01-11 2000-07-28 Sumitomo Metal Ind Ltd 文書検索方法及び装置並びに記録媒体
JP2005301855A (ja) * 2004-04-15 2005-10-27 Hitachi Ltd 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
US20060026013A1 (en) * 2004-07-29 2006-02-02 Yahoo! Inc. Search systems and methods using in-line contextual queries
JP2004348768A (ja) * 2004-08-24 2004-12-09 Hitachi Ltd 文書検索方法
JP2006338114A (ja) * 2005-05-31 2006-12-14 Canon Inc データ管理装置およびデータ管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
河重 貴洋 外3名: ""質問修正と再ランキングを用いた文脈依存Web検索"", DEWS2006論文集 [ONLINE], JPN6013044791, 30 June 2006 (2006-06-30), JP, pages 1 - 7, ISSN: 0003290147 *

Also Published As

Publication number Publication date
JP6131983B2 (ja) 2017-05-24

Similar Documents

Publication Publication Date Title
US10635679B2 (en) Systems and methods for providing feedback for natural language queries
US10140368B2 (en) Method and apparatus for generating a recommendation page
US9348872B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US9582486B2 (en) Apparatus and method for classifying and analyzing documents including text
US20050028156A1 (en) Automatic method and system for formulating and transforming representations of context used by information services
JP2010055159A (ja) 情報検索装置、情報検索方法、およびプログラム
US6668251B1 (en) Rendering discriminator members from an initial set of result data
JP2017134787A (ja) 複数地域でのトピックの評価を分析する装置、プログラム及び方法
JP4640554B2 (ja) サーバ装置、情報処理方法およびプログラム
JP6025487B2 (ja) フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム
US9152698B1 (en) Substitute term identification based on over-represented terms identification
JP5332128B2 (ja) 情報検索装置、情報検索方法およびそのプログラム
US20170293683A1 (en) Method and system for providing contextual information
JP5179564B2 (ja) クエリセグメント位置決定装置
Bakar The development of an integrated corpus for Malay language
JP6131983B2 (ja) 情報検索装置、情報検索方法およびそのプログラム
JP5364529B2 (ja) 辞書登録装置、文書ラベル判定システムおよび辞書登録プログラム
JP2013178808A (ja) 情報検索装置、情報検索方法およびそのプログラム
JP2020113048A (ja) 情報処理装置及びプログラム
US20240004909A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP5843235B2 (ja) Web情報処理装置、web情報処理方法、およびプログラム
JP2012243130A (ja) 情報検索装置、方法、及びプログラム
JP6904092B2 (ja) 理解支援方法、理解支援装置及びプログラム
JP2008033386A (ja) 情報処理提供システム
Bakar International Islamic University Malaysia, Kuala Lumpur, Malaysia nsham@ iium. edu. my

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160606

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170118

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170321

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170403

R150 Certificate of patent or registration of utility model

Ref document number: 6131983

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees