JP2005316590A - 情報検索装置 - Google Patents

情報検索装置 Download PDF

Info

Publication number
JP2005316590A
JP2005316590A JP2004131494A JP2004131494A JP2005316590A JP 2005316590 A JP2005316590 A JP 2005316590A JP 2004131494 A JP2004131494 A JP 2004131494A JP 2004131494 A JP2004131494 A JP 2004131494A JP 2005316590 A JP2005316590 A JP 2005316590A
Authority
JP
Japan
Prior art keywords
search
screen
information
range
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004131494A
Other languages
English (en)
Inventor
Shino Hirao
詩乃 平尾
Kosuke Sasai
浩介 笹井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2004131494A priority Critical patent/JP2005316590A/ja
Publication of JP2005316590A publication Critical patent/JP2005316590A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数の検索エンジンに検索処理を実行させ、適切な検索結果を得ることが容易な情報検索装置を提供する。
【解決手段】クエリ解析器12は、ユーザが入力したクエリを解析して、出力先の検索エンジンSE(i)(i=1,2,・・・,n)の検索特性に適した検索キーワードKW(i)を抽出する。検索エンジン群10は、検索特性の異なる検索エンジンを含むので、クエリ解析器12が出力する検索キーワードKW(i)は、出力先の検索エンジンSE(i)の検索特性によって変化する。
【選択図】図1

Description

本発明は、情報検索装置に関する。
従来より、複数の検索エンジンを備える情報検索装置が知られている。
例えば、特許文献1の情報検索装置では、共通の検索条件を複数の検索エンジンの全部または一部に入力して検索処理を行い、得られた検索結果を統合して表示している。また、特許文献2の情報検索装置では、事例文と検索エンジンとを関連づけ、クエリにマッチングする事例文に関連づけられた検索エンジンに当該クエリを与えて検索を行い、検索結果を表示している。
特開2002−24265号公報 特開2003−132060号公報
しかし、特許文献1の情報検索装置は、使用する検索エンジンをユーザが選択し、選択した検索エンジンに入力する検索条件をユーザが決定する必要がある。このため、検索エンジンの検索特性を熟知していないユーザは、複数の検索エンジンに検索処理を実行させ、適切な検索結果を得ることが困難であった。また、特許文献2の情報検索装置は、複数の検索エンジンにより検索を行う場合でも共通のクエリを用いるので、適切な検索結果を得ることが困難であった。
本発明は、これらの問題を解決するためになされたもので、複数の検索エンジンに検索処理を実行させ、適切な検索結果を得ることが容易な情報検索装置を提供することを目的とする。
上記課題を解決するため、請求項1の発明は、情報検索装置であって、検索キーワードを用いて検索対象データ群に対する検索処理を実行する複数の検索エンジンを含む検索エンジン群と、ユーザが入力したクエリから前記検索キーワードを抽出し、前記複数の検索エンジンのうち検索特性が互いに異なるものを含んだ2個以上の検索エンジンへ出力する抽出手段とを備え、前記抽出手段が、出力先の検索エンジンの検索特性に基づいて前記検索キーワードを変化させることを特徴とする。
請求項2の発明は、請求項1に記載の情報検索装置において、前記検索エンジン群が、検索範囲を指定した検索処理を実行する検索エンジンを含み、前記抽出手段が、前記検索範囲を前記クエリに基づいて決定することを特徴とする。
請求項3の発明は、請求項1または請求項2に記載の情報検索装置において、前記検索処理により得られる検索結果をユーザに提示するユーザインターフェース画面を生成する画面生成手段をさらに備えることを特徴とする。
請求項4の発明は、請求項3に記載の情報検索装置において、前記画面生成手段が、前記2個以上の検索エンジンが実行した検索処理により得られた検索結果を統合して提示する第1ユーザインターフェース画面を生成することを特徴とする。
請求項5の発明は、請求項4に記載の情報検索装置において、前記画面生成手段が、さらに、前記2個以上の検索エンジンが実行した検索処理により得られた検索結果の各々を個別に提示する第2ユーザインターフェース画面を生成するとともに、ユーザから与えられた所定の操作に応答して、表示手段に表示されるユーザインターフェース画面が前記第1ユーザインターフェース画面および前記第2ユーザインターフェース画面の間で切り替わることを特徴とする。
請求項6の発明は、請求項3に記載の情報検索装置において、前記画面生成手段が、前記2個以上の検索エンジンが実行した検索処理により得られた検索結果を分離して提示する第1ユーザインターフェース画面を生成することを特徴とする。
請求項7の発明は、請求項6に記載の情報検索装置において、前記画面生成手段が、さらに、前記2個以上の検索エンジンが実行した検索処理により得られた検索結果の各々を個別に提示する第2ユーザインターフェース画面を生成するとともに、ユーザから与えられた所定の操作に応答して、表示手段に表示されるユーザインターフェース画面が前記第1ユーザインターフェース画面および前記第2ユーザインターフェース画面の間で切り替わることを特徴とする。
請求項8の発明は、請求項1ないし請求項7のいずれかに記載の情報検索装置において、前記2個以上の検索エンジンが、メタデータ検索エンジンおよび全文検索エンジンを含むことを特徴とする。
請求項9の発明は、請求項1ないし請求項8のいずれかに記載の情報検索装置において、前記抽出手段が、形態素解析または係り受け解析を用いて前記検索キーワードを抽出することを特徴とする。
請求項10の発明は、情報検索装置であって、第1検索特性を有する第1検索エンジンと、前記第1検索特性とは異なる第2検索特性を有する第2検索エンジンと、前記第1検索特性に適した第1検索キーワード群と前記第2検索特性に適した第2検索キーワード群とをユーザが入力したクエリから抽出する抽出手段とを備え、前記第1検索キーワードと前記第2検索キーワードとが、それぞれ、前記第1検索エンジンおよび前記第2検索エンジンにおける検索対象データ群に対する検索処理に用いられることを特徴とする。
請求項1ないし請求項10の発明によれば、2個以上の検索エンジンが実行する検索処理に用いられる検索キーワードが1個のクエリから抽出されるので、2個以上の検索エンジンに検索処理を実行させることが容易になる。また、検索キーワードに検索特性が反映されるので、適切な検索結果を得ることが容易になる。
請求項2の発明によれば、検索範囲をクエリとは別に指定する必要がないので、検索操作が容易になる。
請求項4または請求項5の発明によれば、2個以上の検索エンジンが実行した検索処理により得られた検索結果を総合的に確認可能となるので、検索もれを防止可能である。
請求項5の発明によれば、実際に提示される検索結果をユーザの意志により切り替え可能であるので、検索結果の閲覧が容易になる。
請求項6または請求項7の発明によれば、2個以上の検索エンジンが実行した検索処理により得られた検索結果を同時に確認可能となるので、検索もれを防止可能である。
請求項7の発明によれば、実際に提示される検索結果をユーザの意志により切り替え可能であるので、検索結果の閲覧が容易になる。
請求項9の発明によれば、ユーザが自然文のクエリを入力するだけでも情報検索装置に検索処理を実行させることができるので、検索キーワードの決定に熟練していないユーザでも情報検索装置に検索処理を実行させることができる。
本実施形態の情報検索装置1は、検索キーワードに適合する適合データ群を検索対象データ群から抽出してユーザに提示する。情報検索装置1の検索対象データ群となるデータ群は制限されない。例えば、情報検索装置1は、学術分野、産業分野および生活分野の情報を電子化したデータ群を検索対象データ群とすることができる。学術分野の情報としては、技術報告書や論文や特許情報等を例示可能である。産業分野の情報としては、商品情報や営業店舗情報等を例示可能である。生活分野の情報としては、地域情報や食品情報等を例示可能である。
検索対象データ群のデータ形式は制限されないが、タグによってマークアップされたタグ付文書が好ましい。タグ付文書の記述に用いる記述言語としては、SGML(Standard Generalized Markup Language)、XML(eXtensible Markup Language)、HTML(HyperText Markup Language)およびXHTML(eXtensible HyperText Markup Language)等を採用可能である。データベースの構造は、リレーショナル構造、上述の記述言語で記述された文書をリレーショナルに格納した構造およびネイティブXML構造のいずれも採用可能である。
図1は、情報検索装置1の概略構成を示すブロック図である。
情報検索装置1は、データベース11に格納された検索対象データ群11aに対する検索処理を実行する検索エンジン群10を備える。検索エンジン群10は、n個の検索エンジンSE(1)〜SE(n)を含む。検索エンジンSE(1)〜SE(n)の各々は、検索キーワードKW(1)〜KW(n)を用いて検索対象データ群11aに対する検索処理を実行し、検索結果SR(1)〜SR(n)を出力する。
情報検索装置1は、ユーザの検索操作を支援するために、検索エンジン群10に入力される検索キーワードKW(1)〜KW(n)および検索エンジン群10から出力される検索結果SR(1)〜SR(n)に係る拡張機能を有する。
検索キーワードKW(1)〜KW(n)に係る拡張機能は、クエリ解析器12によって提供される。クエリ解析器12は、ユーザが入力したクエリを解析して、出力先の検索エンジンSE(i)(i=1,2,・・・,n)の検索特性に適した検索キーワードKW(i)を抽出する。検索エンジン群10は、検索特性の異なる検索エンジンを含むので、クエリ解析器12が出力する検索キーワードKW(i)は、出力先の検索エンジンSE(i)の検索特性によって変化する。これにより、2個以上の検索エンジンにおける検索処理に用いられる検索キーワードを1個のクエリから抽出可能となるので、2個以上の検索エンジンに検索処理を実行させることが容易になる。また、検索キーワードKW(i)に検索エンジンSE(i)の検索特性が反映されるので、適切な検索結果を得ることが容易になる。検索特性に適した検索キーワードをクエリから抽出できない検索エンジンがある場合は、当該検索エンジン以外の検索エンジンにおいてのみ検索処理を実行するようにしてもよい。なお、ここでいう「検索特性」とは、検索エンジンが要求する検索キーワードの特性である。検索特性の具体例は、第1実施形態および第2実施形態で示される。
クエリ解析器12の解析には、係り受け解析や形態素解析等の言語解析が用いられる。係り受け解析とは、文を文節に分解し、分解された文節間の係り受けの関係を特定する解析である。形態素解析とは、文を単語に分割する解析である。情報検索装置1がクエリ解析器12を備えることにより、ユーザが自然文のクエリを入力するだけでも情報検索装置1に検索処理を実行させることができるので、検索キーワードの決定に熟練していないユーザでも情報検索装置1に検索処理を実行させることができる。
一方、検索結果SR(1)〜SR(n)に係る拡張機能は、ユーザ表示部13によって提供される。ユーザ表示部13は、検索結果SR(1)〜SR(n)をユーザに提示するユーザインターフェース画面を生成する。図2〜図4は、当該ユーザインターフェース画面を模式的に例示す図である。
ユーザ表示部13は、検索結果SR(1)〜SR(n)を統合して一画面内に表示するユーザインターフェース画面101(図2)、検索結果SR(1)〜SR(n)を分離して一画面内に表示するユーザインターフェース画面102(図3)、1個の検索エンジンSE(i)が出力した検索結果SR(i)を一画面内に表示するユーザインターフェース画面103(図4)等を生成可能である。これらのユーザインターフェース画面は、例えば、HTMLで記述される。
第1実施形態および第2実施形態では、医学分野の論文を電子化した論文データ群を検索対象データ群とした情報検索装置に、上述の情報検索装置1を適用した例について説明する。
<<第1実施形態>>
第1実施形態の情報検索装置(情報検索システム)2における検索対象データ群である論文データ群を構成する個々の論文データは、論文を電子化したXML文書である。図5は論文P2を例示する図である。図6および図7は、図5の論文P2を電子化して得られたXML文書X2を例示する図である。XML文書X2は、RDF(Resource Description Framework)のステートメントをXML構文で表現したものとなっている。
XML文書X2の冒頭部分X21には、XML宣言および名前空間接頭辞宣言が含まれる。XML文書X2は、出版社、抄録、タイトル、キーワード、本文および著者の情報を記述するための要素E21〜E26を有する。要素E25には、本文のパラグラフごとの内容を記述するための要素E251〜E254が子要素として含まれる。要素E251〜E254の各々には、パラグラフのタイトルを記述するための要素E251t〜E254tおよびパラグラフの内容を記述するための要素E251c〜E254cが子要素として含まれる。
<構成>
○ハードウエア構成;
図8は、情報検索装置2のハードウエア構成を示す図である。
情報検索装置2は、データベースサーバ21を備える。データベースサーバ21には、ウェブサーバも実装される。これにより、データベースサーバ21は、データベースサービスをネットワーク22に公開可能である。もちろん、データベースサーバ21と物理的に分離されたホストにウェブサーバを実装してもよい。データベースサービスが公開されるネットワーク22は、イントラネットおよびインターネットのいずれでもよい。
ネットワーク22に公開されたデータベースサービスは、ネットワーク22に接続されたクライアント23から利用可能である。クライアント23には、例えば、携帯情報端末23a、携帯電話機23bおよびコンピュータ23c等が含まれる。クライアント23にはウェブブラウザが実装される。情報検索装置2では、クライアント23からデータベースサーバ21へのクエリの送信は、ウェブブラウザからデータベースサーバ21へ送信されるHTTPリクエストによって行われる。一方、情報検索装置2では、データベースサーバ21からクライアント23への検索結果の送信は、データベースサーバ21からウェブブラウザへ送信されるHTTPレスポンスによって行われる。
○全体機能構成;
図9は、情報検索装置2の全体機能構成を示すブロック図である。
データベースサーバ21は、検索エンジン群210、HTML文書生成部211、クエリ解析器212およびウェブサーバ213等の機能ブロックを備える。これらの機能ブロックは、データベースサーバ21を構成するコンピュータにプログロラムを実行させることにより実現される機能の表現である。
検索エンジン群210は、クエリ解析器212から入力される検索キーワードを用いて、データベース214に格納された論文データ群214aに対する検索処理を実行する。検索エンジン群210は、全文検索エンジン210aおよびメタデータ検索エンジン210bの少なくとも2つの検索エンジンを備える。
全文検索エンジン210aは、論文データの全文(XML文書X2の要素内容の全体)を検索対象としている。したがって、全文検索エンジン210aは、文書特定能力を有する任意の文字列を検索キーワードとして用いることができる。全文検索エンジン210aは、入力された検索キーワード(以下では「全文検索キーワード」とも称する)を用いて論文データ群214aに対する検索処理を実行し、全文検索キーワードに適合する適合論文データ群の情報を検索結果(以下では「全文検索結果」とも称する)としてHTML文書生成部211へ出力する。さらに、全文検索エンジン210aは、適合論文データと全文検索キーワードとの適合性の高さの指標である一致度C1を算出し、HTML文書生成部211へ出力する。一致度C1は、例えば、索引語頻度(TF;Term Frequency)と文書頻度の逆数(IDF;Inverse Document Frequency)との積であるTF*IDF値等に基づいて決定される。
一方、メタデータ検索エンジン210bは、論文データの指定範囲(XML文書X2の指定要素の要素内容)を検索対象としている。したがって、メタデータ検索エンジン210bの検索処理には、指定範囲を特定するための検索キーワードが必要となる。メタデータ検索エンジン210bは、入力された検索キーワード(以下では「範囲指定検索キーワード」とも称する)を用いて論文データ群214aに対する検索処理を実行し、範囲指定検索キーワードに適合する適合論文データ群の情報を検索結果(以下では「範囲指定検索結果」とも称する)としてHTML文書生成部211へ出力する。さらに、メタデータ検索エンジン210bは、適合論文データと範囲指定検索キーワードとの適合性の高さの指標である一致度C2を算出し、HTML文書生成部211へ出力する。
上述の説明より明らかなように、全文検索エンジン210aおよびメタデータ検索エンジン210bとは検索特性が異なり、検索処理に用いることのできる検索キーワードも異なる。
ウェブサーバ213は、クライアント23からHTTPリクエストとして与えられたクエリをクエリ解析器212へ転送する。また、ウェブサーバ213は、HTTPリクエストに応答してHTML文書生成部211が生成したHTML文書をクライアント23へ返信する。
クエリ解析器212は、ウェブサーバ213から転送されてきたクエリから検索キーワードを抽出し、全文検索エンジン210aおよびメタデータ検索エンジン210bへ出力する。クエリ解析器212は、出力先の検索エンジンの検索特性に基づいて検索キーワードを変化させる。具体的には、クエリ解析器212は、全文検索キーワードを全文検索エンジン210aへ出力し、範囲指定検索キーワードをメタデータ検索エンジン210bへ出力する。ここで、クエリ解析器212は、範囲指定検索キーワードに含まれるべき指定範囲を特定するための検索キーワードをクエリに基づいて決定する。これにより、範囲指定検索の検索範囲をクエリとは別に指定する必要がないので、検索操作が容易になる。
先述のユーザ表示部13の具体的態様であるHTML文書生成部211は、全文検索結果および範囲指定検索結果をユーザに提示するGUI(Graphical User Interface)画面をHTMLで記述したHTML文書を生成する。GUI画面の具体例は後述する。
以上の構成により、データベースサーバ21は、クライアント23からクエリが与えられるのに応答して、検索処理を実行し、検索結果をHTMLで記述してクライアント23へ返信可能となる。
クライアント23に実装されるウェブブラウザ231は、入力部232を用いてユーザが入力したクエリを所定のメソッドのHTTPリクエストに変換してデータベースサーバ21へ送信する。入力部232は、キーボードやポインティングデバイス等の入力デバイスを含む。入力部232は、GUI画面上での各種GUI操作にも用いられる。また、ウェブブラウザ231は、データベースサーバ21からHTTPレスポンスとして返信されたHTML文書をレンダリングする。これにより、HTML文書は、視認可能なGUI画面として表示装置233に表示される。
○クエリ解析器;
図10は、クエリ解析器212の機能構成を示すブロック図である。なお、自然文「抄録に電子カルテを含む論文」がクエリとして入力された場合を例としてあげて以下の説明を行う。
クエリ解析器212に入力されたクエリは、形態素解析部241に与えられる。形態素解析部241は、自然文の形態素解析を実行するとともに、辞書244を参照して自然文を単語(「抄録」「に」「電子カルテ」「を」「含む」「論文」の6単語)に分解する。続いて、不要語削除部242が、不要語削除ルール245を参照して、分解された単語から検索キーワードとして不適当な不要語(助詞である「に」「を」や文書特定能力の低い「含む」「論文」)を削除し、残る単語(「抄録」「電子カルテ」の2単語)を検索キーワード抽出部243へ出力する。
検索キーワード抽出部243は、入力された単語から全文検索キーワードおよび範囲指定検索キーワードを生成する。全論文で使用されている単語(「抄録」)を全文検索エンジン210aにおける検索処理に用いることは無意味であるので、検索キーワード抽出部243は、全論文で使用されている単語を入力された単語から除去して全文検索キーワード(「電子カルテ」)として出力する。一方、検索キーワード抽出部243は、検索範囲を指定する単語(「抄録」)が入力された単語に含まれている場合には、入力された単語を範囲指定検索キーワードとして出力する。このとき、検索範囲を指定する検索キーワードを指定するための情報もあわせて出力される。この検索範囲を指定する検索キーワードは、メタデータ検索エンジン210bにおいて、検索対象の要素(「抄録」の場合は要素E22)を特定するために用いられる。
<GUI画面>
HTML文書生成部211は、検索画面、検索結果総合表示画面、範囲限定検索結果表示画面および範囲指定解除検索結果表示画面をHTMLで記述したHTML文書を生成する。以下では、個々のGUI画面について最初に説明し、しかる後にGUI画面間の遷移について説明する。
○検索画面;
図11は、検索画面201を例示する図である。検索画面201は、左側の検索条件入力画面201Lと右側のヘルプ画面201Rとからなる複合画面である。このような複合画面は、HTML文書中でフレームを定義することによって実現される。この点は、後述する検索結果総合表示画面、範囲限定検索結果表示画面および範囲指定解除検索結果表示画面も同様である。
検索条件入力画面201Lは、自然文のクエリの入力支援機能を有する。検索条件入力画面201Lには、検索条件選択ボタンBT1およびBT2が表示される。検索条件選択ボタンBT1およびBT2は、択一的に選択可能なラジオボタンである。検索条件選択ボタンBT1が選択された場合、データベースサーバ21は、複数の個別クエリの論理積によりクエリを作成する。一方、検索条件選択ボタンBT2が選択された場合、データベースサーバ21は、複数の個別クエリの論理和によりクエリを生成する。
検索条件選択ボタンBT1およびBT2の下方には、クエリ入力エリアAR1が表示される。クエリ入力エリアAR1には、個別クエリ入力用のプルダウン(リスト)PD1〜PD4が設けられる。プルダウンPD1〜PD4の各々では、「論文中に」「タイトルに」「著者に」「キーワードに」「抄録に」および「本文中に」という選択肢からひとつを選択可能である。各選択肢は、範囲指定検索の検索範囲に対応している。すなわち、情報検索装置2では、「論文中に」「タイトルに」「著者に」「キーワードに」「抄録に」および「本文中に」の各選択肢がプルダウンPD1〜PD4で選択されると、それぞれ、論文の全体、論文のタイトル欄、論文の著者欄、論文のキーワード欄、論文の抄録欄および論文の本文欄が検索範囲として指定されたことになる。換言すれば、情報検索装置2では、「論文中に」「タイトルに」「著者に」「キーワードに」「抄録に」および「本文中に」の各選択肢がプルダウンPD1〜PD4で選択されると、それぞれ、XML文書X2の全要素内容、要素E23の要素内容、要素E26の要素内容、要素E24の要素内容、要素E22の要素内容および要素E25の要素内容が検索対象となる。
プルダウンPD1〜PD4の右方には、それぞれ、テキストフィールドTF1〜TF4が表示される。テキストフィールドTF1〜TF4には、任意の文字列を入力可能である。ユーザは、一のプルダウンの選択肢を選択し、当該プルダウンの右方のテキストフィールドに文字列を入力することにより、個別クエリを生成可能である。例えば、プルダウンPD1で「抄録に」という選択肢を選択し、テキストフィールドTF1に「電子カルテ」を入力すると、「抄録に電子カルテを含む論文」という個別クエリが生成される。図11の検索条件入力画面201Lでは、4つの個別クエリを生成可能となっている。
クエリ入力エリアAR1の下方には、検索ボタンBT3が表示される。情報検索装置2は、検索ボタンBT3が押下されたことを検出すると、個別クエリからクエリを生成して検索処理を開始する。しかる後に、次に説明する検索結果総合表示画面が表示装置233に表示される。
なお、ヘルプ画面201Rは、情報検索装置2の使用方法を説明するために使用される。
○検索結果総合表示画面(総合画面);
図12は、検索結果総合表示画面(以下では「総合画面」とも称する)202を例示する図である。総合画面202は、左側の検索条件総合一覧表示画面(以下では「総合一覧画面」とも称する)202Lと右側の詳細情報表示画面202Rとからなる複合画面である。ただし、総合画面202が表示された直後には、詳細情報表示画面202Rは空欄となっている。
総合一覧画面202Lには、検索結果総合表示テーブルTA11が表示される。検索結果総合表示テーブルTA11には、全文検索結果および範囲指定検索結果の両方の検索結果が統合されて一覧表示される。すなわち、検索結果総合表示テーブルTA11には、全文検索結果および範囲指定検索結果の和集合が一覧表示される。
検索結果総合表示テーブルTA11の2行目以下の各行には、タイトル表示セルCE11、一致度表示セルCE12および検索方法表示セルCE13が設けられる。
タイトル表示セルCE11には、検索処理により抽出された論文のタイトルが表示される。表示されたタイトルには、ハイパーリンクが埋め込まれる。当該ハイパーリンクが選択されると、詳細情報表示画面202Rには、選択されたハイパーリンクに対応する論文の詳細情報が表示される(図13参照)。詳細情報には、論文のタイトル、著者、キーワードおよび抄録が含まれる。
一致度表示セルCE12には、一致度C1および一致度C2に基づいて算出される総合的な一致度Cが表示される。一致度Cは、一致度C1および一致度C2を所定の重み付けを行って加算することによって得られる(C=αC1+βC2;αおよびβは定数)。ここで、範囲指定検索結果の方がユーザの検索意図をより忠実に反映しているので、一致度Cにおける一致度C2の相対的な寄与を一致度C1よりも大きくすることが望ましい。これにより、ユーザの検索意図にあった論文へ相対的に大きな一致度Cが与えられる。
検索方法表示セルCE13には、「全文検索」および「範囲指定検索」という文字列の両方または一方が表示される。「全文検索」は全文検索結果に含まれる論文であることを意味しており、「範囲指定検索」は範囲指定検索結果に含まれる論文であることを意味している。
検索結果総合表示テーブルTA11においては、抽出された論文データは一致度Cの降順にソートされて表示される。これにより、ユーザの検索意図にあった論文が一覧の上方に表示される。
このように全文検索結果および範囲指定検索結果を統合して表示することにより、2個以上の検索エンジンで実行された検索処理によって得られた検索結果を総合的に確認可能となるので、検索もれを防止可能である。例えば、抄録が英語で記載されているために、「電子カルテ」に関する論文が範囲指定検索結果からもれた場合でも、当該論文は全文検索結果には含まれる可能性が高いので、検索もれを防止可能になる。
検索結果総合表示テーブルTA11の上方の範囲指定限定ボタンBT11および範囲指定解除ボタンBT12は、それぞれ、次以降で説明する範囲限定画面203および範囲指定解除画面204へ画面表示を遷移させるために用いられる。
○範囲限定検索結果表示画面(範囲限定画面);
図14は、範囲限定検索結果表示画面(以下では「範囲限定画面」とも称する)を例示する図である。範囲限定画面203は、左側の範囲限定検索結果一覧表示画面(以下では「範囲限定一覧画面」とも称する)203Lと右側の詳細情報表示画面203Rとからなる複合画面である。なお、範囲限定画面203が表示された直後には詳細情報表示画面203Rは空欄であるが、総合画面202の詳細情報表示画面202Rと同様の詳細情報表示画面203Rが表示された状態が図14には示されている。
範囲限定一覧画面203Lには、範囲限定検索結果表示テーブルTA21が表示される。範囲限定検索結果表示テーブルTA21には、範囲指定検索結果が一致度C2の降順にソートされて一覧表示される。範囲限定検索結果表示テーブルTA21の2行目以降の各行には、検索結果総合表示テーブルTA11と同様に、タイトル表示セルCE21、一致度表示セルCE22および検索方法表示セルCE23が設けられる。一致度表示セルCE22には、一致度C2が表示される。検索方法表示セルCE23には、範囲指定検索結果に含まれる論文であることを意味する「範囲指定検索」という文字列が表示される。
範囲限定検索結果表示テーブルTA21の上方の総合表示ボタンBT21および範囲指定解除ボタンBT22は、それぞれ、総合画面202および次に説明する範囲指定解除画面204へ画面表示を遷移させるために用いられる。
○範囲指定解除検索結果表示画面(範囲指定解除画面);
図15は、範囲指定解除検索結果表示画面(以下では「範囲指定解除画面」とも称する)204を例示する図である。範囲指定解除画面204は、左側の範囲指定解除検索結果一覧表示画面(以下では「範囲指定解除一覧画面」とも称する)204Lと右側の詳細情報表示画面204Rとからなる複合画面である。なお、範囲指定解除画面204が表示された直後には詳細情報表示画面204Rは空欄であるが、総合画面202の詳細情報表示画面202Rと同様の詳細情報表示画面204Rが表示された状態が図15には示されている。
範囲指定解除一覧画面204Lには、範囲指定解除検索結果表示テーブルTA31が表示される。範囲指定解除検索結果表示テーブルTA31には、全文検索結果が一致度C1の降順にソートされて一覧表示される。範囲指定解除検索結果表示テーブルTA31の2行目以降の各行には、検索結果総合表示テーブルTA11と同様に、タイトル表示セルCE31、一致度表示セルCE32および検索方法表示セルCE33が設けられる。一致度表示セルCE32には、一致度C1が表示される。検索方法表示セルCE23には、全文検索結果に含まれる論文であることを意味する「全文検索」という文字列が表示される。
範囲指定解除検索結果表示テーブルTA31の上方の総合表示ボタンBT31および範囲指定限定ボタンBT32は、それぞれ、総合画面202および範囲指定解除画面203へ画面表示を遷移させるために用いられる。
○画面遷移;
図16は、検索画面201、総合画面202、範囲限定画面203および範囲指定解除画面204の間の遷移を示す図である。
検索画面201において検索ボタンBT3の押下が行われると、画面表示は総合画面202へ切り替わる。すなわち、情報検索装置2においては、デフォルトの検索結果表示画面が総合画面202となっている。
総合画面202において範囲指定限定ボタンBT11または範囲指定解除ボタンBT12の押下が行われると、画面表示は、それぞれ、範囲限定画面203または範囲指定解除画面204へ切り替わる。
範囲限定画面203において、総合表示ボタンBT22または範囲指定解除ボタンBT21の押下が行われると、画面表示は、それぞれ、総合画面202または範囲指定解除画面204に切り替わる。一方、範囲指定解除画面204において、総合表示ボタンBT31または範囲指定限定ボタンBT32の押下が行われると、画面表示は、それぞれ、総合画面202または範囲限定画面203に切り替わる。
このような画面遷移により、全文検索結果および範囲指定検索結果を統合して提示する総合画面202と、全文検索結果または範囲指定検索結果を個別に提示する範囲限定画面203または範囲指定解除画面204とが、ユーザから与えられた所定の操作に応答して切り替えられることになる。これにより、実際に提示される検索結果をユーザの意志により切り替え可能であるので、検索結果の閲覧が容易になる。
<動作>
情報検索装置2の動作を図17および図18のフローチャートを参照しながら説明する。
最初に、クライアント23からのHTTPリクエスト(検索操作の開始要求)に応答して、検索画面201を記述したHTML文書をHTML文書生成部211が生成する。当該HTML文書は、ウェブサーバ213およびネットワーク22を経由してクライアント23へ返信される。クライアント23のウェブブラウザ231は、当該HTML文書をレンダリングして、検索画面201を表示装置233に視認可能に表示させる(ステップS1)。これにより、ユーザは、検索画面201上で入力部232を用いたGUI操作を行うことにより、クエリの入力を行うことが可能になる。なお、HTML文書で記述されたGUI画面を表示装置233に視認可能に表示させるための動作は、総合画面202(ステップS6)、範囲限定画面203(ステップS9)および範囲指定解除画面204(ステップS12)についても同様であるので、以下の説明では詳細な説明は省略する。
続いて、検索画面201上の検索ボタンBT3の押下の検出が行われる(ステップS2)。ステップS2で検索ボタンBT3の押下が検出された場合、動作フローはステップS3へ移行する。一方、ステップS2で検索ボタンBTの押下が検出されない場合、動作フローはステップS2へ戻り、検索ボタンBT3の押下の待機状態が継続される。したがって、情報検索装置2では、検索ボタンBT3の押下に応答してステップS3移行のステップが実行される。
さらに、検索画面201上の検索条件選択ボタンBT1およびBT2の選択内容と、プルダウンPD1〜PD4の選択内容と、テキストフィールドTF1〜TF4へ記入された文字列とに基づいたクエリがウェブブラウザ231によって生成され、クライアント23からデータベースサーバ21へHTTPリクエストとして送信される。当該クエリは、ウェブサーバ213からクエリ解析器212へ転送される(ステップS3)。クエリ解析器212は、転送されてきたクエリから、全文検索キーワードおよび範囲指定検索キーワードを抽出し、全文検索エンジン210aおよびメタデータ検索エンジン210bへ出力する(ステップS4)。全文検索エンジン210aおよびメタデータ検索エンジン210bは、それぞれ、全文検索キーワードおよび範囲指定検索キーワードを用いて検索処理を実行し、全文検索結果および範囲指定検索結果をHTML文書生成部211へ出力する(ステップS5)。ステップS6では、全文検索結果および範囲指定検索結果に基づいて、HTML文書生成部211が総合画面202を記述したHTML文書を生成しクライアント23へ返信する。これにより、クライアント23の表示装置233には総合画面202が表示される。
ステップS7〜S14は、検索画面201、総合画面202、範囲限定画面203および範囲指定解除画面204の間の遷移を実現するためのステップ群である。
ステップS7では、総合画面202の範囲限定ボタンBT11の押下の検出が行われる。ステップS7で範囲限定ボタンBT11の押下が検出された場合、動作フローはステップS9へ移行する。一方、ステップS7で範囲限定ボタンBT11の押下が検出されない場合、動作フローはステップS8へ移行する。ステップS8では、総合画面202の範囲限定解除ボタンBT12の押下の検出が行われる。ステップS8で範囲限定解除ボタンBT12の押下が検出された場合、動作フローはステップS12へ移行する。一方、ステップS8で範囲限定解除ボタンBT12の押下が検出されない場合、動作フローはステップS7へ移行する。ステップS7およびS8により、総合画面202の範囲限定ボタンBT11または範囲限定解除ボタンBT12の押下が検出されるまで、表示装置233へは総合画面202の表示が継続される。
ステップS9では、範囲限定ボタンBT11に埋め込まれたハイパーリンクに対応するHTTPリクエストがクライアント23からデータベースサーバ21へ送信される。HTML文書生成部211は、当該HTTPリクエストに応答して、範囲限定画面203を記述したHTML文書を生成しクライアント23へ返信する。これにより、クライアント23の表示装置233には範囲限定画面203が表示される。
ステップS12では、範囲限定解除ボタンBT12に埋め込まれたハイパーリンクに対応するHTTPリクエストがクライアント23からデータベースサーバ21へ送信される。HTML文書生成部211は、当該HTTPリクエストに応答して、範囲指定解除画面204を記述したHTML文書を生成しクライアント23へ返信する。これにより、クライアント23の表示装置233には範囲指定解除画面204が表示される。
ステップS9に続くステップS10では、範囲限定画面203の総合表示ボタンBT21の押下の検出が行われる。ステップS10で総合表示ボタンBT21の押下が検出された場合、動作フローはステップS6へ移行する。一方、ステップS10で総合表示ボタンBT21の押下が検出されない場合、動作フローはステップS11へ移行する。ステップS11では、範囲限定画面203の範囲限定解除ボタンBT22の押下の検出が行われる。ステップS11で範囲限定解除ボタンBT22の押下が検出された場合、動作フローはステップS12へ移行する。一方、ステップS11で範囲限定解除ボタンBT22の押下が検出されない場合、動作フローはステップS10へ移行する。ステップS10およびS11により、範囲限定画面203の総合表示ボタンBT21または範囲限定解除ボタンBT22の押下が検出されるまで、表示装置233へは範囲限定画面203の表示が継続される。 ステップS12に続くステップS13では、範囲指定解除画面204の総合表示ボタンBT31の押下の検出が行われる。ステップS13で総合表示ボタンBT31の押下が検出された場合、動作フローはステップS6へ移行する。一方、ステップS13で総合表示ボタンBT31の押下が検出されない場合、動作フローはステップS14へ移行する。ステップS14では、範囲指定解除画面204の範囲限定ボタンBT32の押下の検出が行われる。ステップS14で範囲限定ボタンBT32の押下が検出された場合、動作フローはステップS9へ移行する。一方、ステップS14で範囲限定ボタンBT32の押下が検出されない場合、動作フローはステップS13へ移行する。ステップS13およびS14により、範囲指定解除画面204の総合表示ボタンBT31または範囲限定ボタンBT32の押下が検出されるまで、表示装置233へは範囲指定解除画面204の表示が継続される。
<<第2実施形態>>
第2実施形態の情報検索装置3は、第1実施形態の情報検索装置2と類似の構成を有する。したがって、図5〜図9および図16〜図18に関する説明は、情報検索装置3についても当てはまる。しかし、情報検索装置3においては、クエリ解析器の機能構成と、HTML文書生成部211が生成するGUI画面の具体的態様とが情報検索装置2とは異なる。以下では、この相違点について説明する。なお、以下の説明では、情報検索装置2と同等の構成には同じ参照符号を使用して重複説明を省略する。
<構成>
○クエリ解析器;
図19は、クエリ解析器312の機能構成を示すブロック図である。なお、クエリとして自然文「田中さんの書いた論文」が入力された場合を例としてあげて以下の説明を行う。第3実施形態のクエリ解析器312は、第2実施形態のクエリ解析器212と同様に、ユーザが入力したクエリから検索処理に用いられる全文検索キーワードおよび範囲指定検索キーワードを抽出して検索エンジン群210へ出力する。ただし、クエリ解析器312においては、クエリ解析器212の形態素解析部241が係り受け解析部341に置き換えられている。係り受け解析部341は、自然文の係り受け解析および形態素解析を実行するとともに、辞書244を参照して自然文を文節(「田中さんが」「書いた」「論文」の3文節)および単語(「田中」「さん」「が」「書く(「書い」の終止形)」「た」「論文」の6単語)に分解する。このとき、動詞である「書く」は名詞である「著者」に変換される。しかる後に、クエリ解析器312は、不要語除去ルール245を参照して分解された単語のうち検索キーワードとして不適当な不要語(助詞である「が」や文書特定能力の低い「さん」「論文」)を削除し、残る単語(「著者」「田中」の2単語)を検索キーワード抽出部243へ出力する。
検索キーワード抽出部243は、入力された単語から全文検索キーワードおよび範囲指定検索キーワードを生成する。全論文で使用されている単語(「著者」)を全文検索エンジン210aにおける検索処理に用いることは無意味であるので、検索キーワード抽出部243は、全論文で使用されている単語を入力された単語から除去して全文検索キーワード(「田中」)として出力する。一方、検索キーワード抽出部243は、検索範囲を指定する単語(「著者」)が入力された単語に含まれている場合には、入力された単語を範囲指定検索キーワードとして出力する。このとき、検索範囲を指定する検索キーワードを指定するための情報もあわせて出力される。この検索範囲を指定する検索キーワードは、メタデータ検索エンジン210bにおいて、検索対象の要素(「著者」の場合は要素E26)を特定するために用いられる。これにより、著者欄には「田中」が含まれないが、参考文献欄で引用された論文の著者が「田中」である論文等も全文検索結果に含まれることになるので、検索もれを防止可能である。なお、情報検索装置3では、クエリ解析器312で抽出された係り受けの情報もメタデータ検索エンジン210bへ出力され、検索範囲を指定する検索キーワードと係り受けの関係にある単語を用いて、当該検索範囲内の検索が実行される。
<GUI画面>
○検索画面;
図20は、HTML文書生成部211が生成する検索画面301を例示する図である。検索画面301には、自然文のクエリを直接入力するためのクエリ入力エリアAR41が表示される。クエリ入力エリアAR41には、任意の文字列を入力可能である。クエリ入力エリアAR41に文字列を入力後に検索ボタンBT41の押下が行われると、当該文字列がクエリとしてクエリ解析部312へ与えられる。
○検索結果総合表示画面(総合画面);
図21は、検索結果総合表示画面(総合画面)302を例示する図である。
総合画面302には、検索結果総合表示テーブルTA51が表示される。検索結果総合表示テーブルTA51には、全文検索結果および範囲指定検索結果の両方の検索結果が統合されて一覧表示される。検索結果表示テーブルTA51の2行目以降の各行には、タイトル表示セルCE51および著者表示セルCE52が設けられる。
タイトル表示セルCE51には、検索処理により抽出された論文のタイトルが表示される。著者表示セルCE52には、検索処理により抽出された論文の著者が表示される。
検索結果一覧表示テーブルTA51の下方の範囲指定限定ボタンBT51および範囲指定解除ボタンBT52は、それぞれ、範囲指定限定ボタンBT11および範囲指定解除ボタンBT12と同様に、範囲限定検索結果表示画面および範囲指定解除検索結果表示画面へ画面表示を遷移させるために用いられる。
このよう総合画面302によっても、2個以上の検索エンジンで実行された検索処理によって得られた検索結果を総合的に確認可能となるので、検索もれを防止可能である。
○範囲限定検索結果表示画面(範囲限定画面)および範囲指定解除検索結果表示画面(範囲指定解除画面);
第2実施形態の範囲限定検索結果表示画面(範囲限定画面)および範囲指定解除検索結果表示画面(範囲指定解除画面)は、総合画面302と同様の表示レイアウトを有する。ただし、範囲限定画面および範囲指定解除画面で一覧表示される検索結果は、それぞれ、範囲指定検索結果および全文検索結果である。また、表示される画面遷移用のボタンは、グラフィカルな形状は総合画面と類似しているが、その機能は第1実施形態の範囲限定画面および範囲指定解除画面と同等になっている。
情報検索装置1の概略構成を示すブロック図である。 GUI画面101を模式的に例示する図である。 GUI画面102を模式的に例示する図である。 GUI画面103を模式的に例示する図である。 論文P2を例示する図である。 論文P2を電子化して得られたXML文書X2を例示する図である。 論文P2を電子化して得られたXML文書X2を例示する図である。 情報検索装置2のハードウエア構成を示す図である。 情報検索装置2の全体機能構成を示すブロック図である。 クエリ解析器212の機能構成を示すブロック図である。 検索画面201を例示する図である。 検索結果総合表示画面(総合画面)202を例示する図である。 詳細情報表示画面202Lに論文の詳細情報が表示された状態を示す図である。 範囲限定検索結果表示画面(範囲限定画面)203を例示する図である。 範囲指定解除検索結果表示画面(範囲指定解除画面)204を例示する図である。 検索画面201、総合画面202、範囲限定画面203および範囲指定解除画面204の間の遷移を示す図である。 情報検索装置2の動作を示すフローチャートである。 情報検索装置2の動作を示すフローチャートである。 クエリ解析器312の機能構成を示すブロック図である。 検索画面301を例示する図である。 検索結果総合表示画面(総合画面)302を例示する図である。
符号の説明
1〜3 情報検索装置
21 データベースサーバ
22 ネットワーク
1 クライアント
101〜103 ユーザインターフェース画面
201,301 検索画面
202,302 検索結果総合表示画面(総合画面)
203 範囲限定検索結果表示画面(範囲限定画面)
204 範囲指定解除検索結果表示画面(範囲指定解除画面)
X2 XML文書

Claims (10)

  1. 情報検索装置であって、
    検索キーワードを用いて検索対象データ群に対する検索処理を実行する複数の検索エンジンを含む検索エンジン群と、
    ユーザが入力したクエリから前記検索キーワードを抽出し、
    前記複数の検索エンジンのうち検索特性が互いに異なるものを含んだ2個以上の検索エンジンへ出力する抽出手段と、
    を備え、
    前記抽出手段が、出力先の検索エンジンの検索特性に基づいて前記検索キーワードを変化させることを特徴とする情報検索装置。
  2. 請求項1に記載の情報検索装置において、
    前記検索エンジン群が、検索範囲を指定した検索処理を実行する検索エンジンを含み、
    前記抽出手段が、前記検索範囲を前記クエリに基づいて決定することを特徴とする情報検索装置。
  3. 請求項1または請求項2に記載の情報検索装置において、
    前記検索処理により得られる検索結果をユーザに提示するユーザインターフェース画面を生成する画面生成手段をさらに備えることを特徴とする情報検索装置。
  4. 請求項3に記載の情報検索装置において、
    前記画面生成手段が、前記2個以上の検索エンジンが実行した検索処理により得られた検索結果を統合して提示する第1ユーザインターフェース画面を生成することを特徴とする情報検索装置。
  5. 請求項4に記載の情報検索装置において、
    前記画面生成手段が、さらに、
    前記2個以上の検索エンジンが実行した検索処理により得られた検索結果の各々を個別に提示する第2ユーザインターフェース画面を生成するとともに、
    ユーザから与えられた所定の操作に応答して、表示手段に表示されるユーザインターフェース画面が前記第1ユーザインターフェース画面および前記第2ユーザインターフェース画面の間で切り替わることを特徴とする情報検索装置。
  6. 請求項3に記載の情報検索装置において、
    前記画面生成手段が、前記2個以上の検索エンジンが実行した検索処理により得られた検索結果を分離して提示する第1ユーザインターフェース画面を生成することを特徴とする情報検索装置。
  7. 請求項6に記載の情報検索装置において、
    前記画面生成手段が、さらに、
    前記2個以上の検索エンジンが実行した検索処理により得られた検索結果の各々を個別に提示する第2ユーザインターフェース画面を生成するとともに、
    ユーザから与えられた所定の操作に応答して、表示手段に表示されるユーザインターフェース画面が前記第1ユーザインターフェース画面および前記第2ユーザインターフェース画面の間で切り替わることを特徴とする情報検索装置。
  8. 請求項1ないし請求項7のいずれかに記載の情報検索装置において、
    前記2個以上の検索エンジンが、メタデータ検索エンジンおよび全文検索エンジンを含むことを特徴とする情報検索装置。
  9. 請求項1ないし請求項8のいずれかに記載の情報検索装置において、
    前記抽出手段が、形態素解析または係り受け解析を用いて前記検索キーワードを抽出することを特徴とする情報検索装置。
  10. 情報検索装置であって、
    第1検索特性を有する第1検索エンジンと、
    前記第1検索特性とは異なる第2検索特性を有する第2検索エンジンと、
    前記第1検索特性に適した第1検索キーワード群と前記第2検索特性に適した第2検索キーワード群とをユーザが入力したクエリから抽出する抽出手段と、
    を備え、
    前記第1検索キーワードと前記第2検索キーワードとが、それぞれ、前記第1検索エンジンおよび前記第2検索エンジンにおける検索対象データ群に対する検索処理に用いられることを特徴とする情報検索装置。
JP2004131494A 2004-04-27 2004-04-27 情報検索装置 Pending JP2005316590A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004131494A JP2005316590A (ja) 2004-04-27 2004-04-27 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004131494A JP2005316590A (ja) 2004-04-27 2004-04-27 情報検索装置

Publications (1)

Publication Number Publication Date
JP2005316590A true JP2005316590A (ja) 2005-11-10

Family

ID=35443975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004131494A Pending JP2005316590A (ja) 2004-04-27 2004-04-27 情報検索装置

Country Status (1)

Country Link
JP (1) JP2005316590A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007086125A1 (ja) * 2006-01-26 2007-08-02 Itochu Techno-Science Corporation ネットワークシステムおよびコンピュータプログラム
JP2008021031A (ja) * 2006-07-11 2008-01-31 Canon Inc 検索サーバ装置及びその制御方法、情報処理装置及びその制御方法、情報処理システム、情報検索装置及びその制御方法、プログラム、記憶媒体
JP2009146181A (ja) * 2007-12-14 2009-07-02 Pioneer Electronic Corp サーバ装置及びプログラム
JP2013250996A (ja) * 2013-08-14 2013-12-12 Fujitsu Ltd 情報検索方法、プログラム及び装置
JP2016042213A (ja) * 2014-08-13 2016-03-31 ヤフー株式会社 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム
JP2017120613A (ja) * 2015-12-28 2017-07-06 株式会社リコー 情報処理装置、情報処理方法、情報処理プログラムおよび情報処理システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007086125A1 (ja) * 2006-01-26 2007-08-02 Itochu Techno-Science Corporation ネットワークシステムおよびコンピュータプログラム
JP2008021031A (ja) * 2006-07-11 2008-01-31 Canon Inc 検索サーバ装置及びその制御方法、情報処理装置及びその制御方法、情報処理システム、情報検索装置及びその制御方法、プログラム、記憶媒体
JP2009146181A (ja) * 2007-12-14 2009-07-02 Pioneer Electronic Corp サーバ装置及びプログラム
JP2013250996A (ja) * 2013-08-14 2013-12-12 Fujitsu Ltd 情報検索方法、プログラム及び装置
JP2016042213A (ja) * 2014-08-13 2016-03-31 ヤフー株式会社 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム
US10467305B2 (en) 2014-08-13 2019-11-05 Yahoo Japan Corporation Extraction device, search server, information processing device, extraction system, extraction method, and non-transitory computer readable storage medium
JP2017120613A (ja) * 2015-12-28 2017-07-06 株式会社リコー 情報処理装置、情報処理方法、情報処理プログラムおよび情報処理システム

Similar Documents

Publication Publication Date Title
US7730013B2 (en) System and method for searching dates efficiently in a collection of web documents
JP5744873B2 (ja) トラステッドクエリのシステムおよび方法
JP4767694B2 (ja) 不正ハイパーリンク検出装置及びその方法
US8321396B2 (en) Automatically extracting by-line information
US20140149393A1 (en) System and method for refining search results
JPH07325827A (ja) ハイパーテキスト自動生成装置
JP2007072646A (ja) 検索装置、検索方法およびプログラム
KR100403947B1 (ko) 개인용 전자문서를 생성하는 방법, 시스템 및 컴퓨터프로그램 제조물
US20110307497A1 (en) Synthewiser (TM): Document-synthesizing search method
KR20020075359A (ko) 디지털 소스로부터 정보를 포착하고 관리하기 위한 시스템및 방법
JP2007193697A (ja) 情報収集装置,情報収集方法およびプログラム
US8612431B2 (en) Multi-part record searches
JP2005316590A (ja) 情報検索装置
JP2010211438A (ja) 文書検索装置及び文書検索方法
JP3683687B2 (ja) 情報フィルタリング装置および情報フィルタリング方法
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
JPH11134341A (ja) ハイパーメデイア記述言語による記述情報の抜粋表示シ ステム
JP2004157965A (ja) 検索支援装置、検索支援方法、プログラムおよび記録媒体
JP2002183175A (ja) テキストマイニング方法
JP5746912B2 (ja) テキストパターン抽出を用いてWeb文書をリファインするための方法、システム及びコンピュータ読み出し可能記録媒体
JP4980604B2 (ja) 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体
JP5187187B2 (ja) 体験情報検索システム
Tsapatsoulis Web image indexing using WICE and a learning-free language model
JP2000105769A (ja) 文書表示方法
JP2004030021A (ja) 文書処理装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080703

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080812

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080916