JPH09146968A - 文書検索方法 - Google Patents

文書検索方法

Info

Publication number
JPH09146968A
JPH09146968A JP7302463A JP30246395A JPH09146968A JP H09146968 A JPH09146968 A JP H09146968A JP 7302463 A JP7302463 A JP 7302463A JP 30246395 A JP30246395 A JP 30246395A JP H09146968 A JPH09146968 A JP H09146968A
Authority
JP
Japan
Prior art keywords
document
registered
registration
storage area
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7302463A
Other languages
English (en)
Inventor
Katsumi Tada
勝己 多田
Kanji Kato
寛次 加藤
Satoshi Asakawa
悟志 浅川
Akio Azuma
秋夫 東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7302463A priority Critical patent/JPH09146968A/ja
Priority to US08/746,905 priority patent/US5832476A/en
Publication of JPH09146968A publication Critical patent/JPH09146968A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 (修正有) 【課題】ユーザが指定した文書と同じ文書を参考文献と
して参照している別の文書を検索することにより、ユー
ザの指定した文書に関連する最新の文献を検索する。 【解決手段】文書情報をテキスト格納領域100に登録
し、参考文献テーブル120及び関連文献テーブル13
0を作成し、作成されたテーブルを用いて関連のある参
照文献を検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書データベース
からユーザが指定した文書と関連性の高い文書を検索す
る文書検索方法に関する。データベース、文書管理シス
テム、文書ファイリングシステムおよび電子図書館シス
テムなどに適用されるものである。
【0002】
【従来の技術】論文などの技術文書を読み関心のある技
術の調査を行う場合、その論文の中に引用されている参
考文献を順次叉引きしていく方法がよく用いられる。こ
の方法では、図2に示すように引用元の文献1の中で参
照されている参考文献1および参考文献2を検索し、そ
の内容を読む。もし、その文書だけでは不十分な場合に
は,さらにその文書中で参照されている参考文献a,b
を調べる。そして、所望の文書が得られるまで順次参考
文献の叉引きを繰り返す。
【0003】
【発明が解決しようとする課題】しかし、このような参
考文献を叉引きしていく方法では、最初に閲読した文献
より新しい文献を見つけることができない。すなわち、
最新の関連文献を見つけることができないという問題が
ある。
【0004】図2に示す例で説明すると、文献1の中で
参照されている参考文献1および参考文献2は文献1よ
りも古い文献である。また、に参考文献1の中で参照さ
れている参考文献aおよび参考文献bは、参考文献1よ
りもさらに古い文献である。このように、叉引きを繰り
返す度に得られる文献は古い文献となるため、元の文書
より新しい文献を得ることができず最新の文献を得るこ
とができないという問題がある。
【0005】本発明が解決しようとする課題は、対象と
する文献に関連する最新の文献を得ることのできる文書
検索システムを提供することにある。
【0006】
【課題を解決するための手段】上記の課題を解決するた
めに本発明は、以下の構成を採用する。 (1)登録文書をそのままテキストデータとして登録す
るテキスト登録ステップと、(2)該登録文書中で参照
されている参考文献に対する該登録文書からのリンク情
報を登録した参考文献テーブルを作成し登録する参考文
献テーブル作成登録ステップと、(3)該登録文書に対
する該登録文書を参照している文書からのリンク情報を
登録した関連文献テーブルを作成し登録する関連文献テ
ーブル作成登録ステップと、(4)関連文献の検索時に
は、該参考文献テーブル作成登録ステップで作成された
参考文献テーブルを参照することにより、ユーザが指定
した文書の中で参照されている参考文献を抽出する参考
文献抽出ステップと、(5)該参考文献抽出ステップで
抽出された参考文献に対し、該関連文献テーブル作成登
録ステップで作成された関連文献テーブルを参照するこ
とにより得られた文書を、関連文献として抽出する関連
文献抽出ステップを有する文書検索方法である。
【0007】以上の構成である文書検索方法を用いるこ
とにより、ユーザが指定した文書と同じ文書を参考文献
として参照している別の文書を検索することができる。
一般に、参考文献としては各分野を代表する文献が挙げ
られることが多く、最新の文書についても古い文書と同
じ文書を参考文献として挙げる可能性が高いため、参考
文献をキーとしてユーザが指定した文書と関連性の高い
最新の文書を検索することができることになる。
【0008】以下、図3を用いて本発明の概要について
説明する。
【0009】文書の登録時には、まずテキスト登録ステ
ップで文書1、文書2、文書3および文書4をテキスト
データとして登録する。
【0010】次に、参考文献テーブル作成登録ステップ
では,各登録文書中で参照されている参考文献の番号を
登録した参考文献テーブルを作成し登録する。すなわ
ち、図3に示す例では、文書1で参考文献として文書2
を参照しているため文書1から文書2に参照先リンクを
生成する。文書2についても同様に文書5を参照している
ため、文書2から文書5に参照先リンクを生成する。以
下、文書3および文書4についても同様の処理を繰り返す
ことにより図4に示す参照先リンク情報を生成する。そ
して、参照先リンク情報をもとに、各登録文書中で参照
されている参考文献の番号を登録した参考文献テーブル
を作成する。
【0011】さらに、関連文献テーブル作成登録ステッ
プでは、各登録文書についてその文書を参照している参
照元文書からのリンク情報を登録した関連文献テーブル
を作成し登録する。例えば、図4において参照先リンク
情報を逆向きに参照する。すなわち、参照先リンク情報
の参照元エントリと参照先エントリを入れ替え、その結
果を参照先文書番号でソーティングすることにより、各
文書を参照している参照元文書に対する参照元リンク情
報を生成する。そして、参照元リンク情報をもとに各登
録文書について、その文書を参照している参照元文書の
番号を登録した関連文献テーブルを作成する。
【0012】以上が登録時の処理である。
【0013】次に検索時には、以下の処理を施す。
【0014】参考文献抽出ステップで指定された文書に
対し参考文献テーブルを参照することにより、ーザが指
定した文書の中で参照している参考文献の文書番号を取
得する。すなわち、図5に示す例ではユーザが指定した
文書1に対して参考文献テーブルを参照することにより
文書2が参考文献として得られる。
【0015】そして、関連文献抽出ステップでは参考文
献抽出ステップで得られた参考文献に対し関連文献テー
ブルを参照することにより、ユーザが指定したと関連性
の高い文書を抽出する。すなわち、図5に示す例では参
考文献抽出ステップで得られた文書2に対し関連文献テ
ーブルを参照することによって、文献2を参照している
文書として文書1、文書3および文書4を得る。
【0016】以上の処理によって、文書1と関連性の高
い文書として文書3と文書4を得ることができる。
【0017】このように本発明では、従来の方法では得
られなかった元の文書よりも新しい文書が得ることがで
きる。このため、指定された文書と関連性の高い最新の
文書の検索が可能になる。
【0018】
【発明の実施の形態】本発明の文書検索方法を実現する
1構成である検索システムを図1に示す。本図に示す検
索システムは、検索結果を表示するディスプレイ1、登
録および検索のコマンドを入力するキーボード2、登録
処理および検索処理を実行する中央演算処理装置CPU
3、フロッピディスクからデータを読み出すフロッピデ
ィスクドライバFDD4、データベースへ登録する文書
データを格納したフロッピディスク5、登録および検索
用のプログラムならびにデータなどを一時的に格納する
主メモリ6、検索用データを格納する磁気ディスク7お
よびこれらを接続するバス8で構成される。
【0019】主メモリ6には、システム制御プログラム
10、文書登録制御プログラム20、関連文献検索制御
プログラム30、テキスト登録プログラム40、参考文
献テーブル作成登録プログラム50、関連文献テーブル
作成登録プログラム60、参考文献抽出プログラム70
および関連文献検索プログラム80が磁気ディスク7か
ら読み出されるとともにワークエリア90が確保され
る。
【0020】また、磁気ディスク7にはテキスト格納領
域100、文書管理情報格納領域110、参考文献テー
ブル格納領域120、関連文献テーブル格納領域13
0、各種プログラム格納領域140が確保されている。
なお、本実施例ではこれらの格納領域を磁気ディスク7
上に確保したが、光磁気ディスク装置など他の二次記憶
装置であっても構わない。以上が本検索システムの構成
である。
【0021】次に、本実施例に示す文書検索方法の文書
登録時の処理と検索時の処理について説明する。
【0022】始めに、キーボード2から入力される登録
コマンドによりシステム制御プログラム10は、文書登
録制御プログラム20を起動して、文書の登録処理を開
始する。この文書登録時の処理の概略を図6に示すPAD
図を用いて説明する。
【0023】始めに、文書登録制御プログラム20はス
テップ1000でテキスト登録プログラム40を起動す
る。テキスト登録プログラム40では、登録文書のテキ
ストデータを磁気ディスク7内のテキスト格納領域10
0に格納するとともに、登録文書に対し文書管理情報を
作成しこれを磁気ディスク内のテキスト格納領域110
に格納する。
【0024】次に、テキスト登録制御プログラム20
は、ステップ1001で参考文献テーブル作成登録プロ
グラム50を起動する。参考文献テーブル作成登録プロ
グラム50では、各登録文書の参考文献の文書番号を登
録することにより参考文献テーブルを作成する。作成さ
れた参考文献テーブルを磁気ディスク7上の参考文献テ
ーブル格納領域120に格納する。
【0025】最後に、テキスト登録制御プログラム20
は、ステップ1002で関連文献テーブル作成登録プロ
グラム60を起動する。関連文献テーブル作成登録プロ
グラム60では、各登録文書について、以下の処理を行
う。登録文書を参照している参照元文書の番号を登録す
ることにより関連文献テーブルを作成して、磁気ディス
ク7上の関連文献テーブル格納領域に格納する。以上
が,登録時処理の概要である。
【0026】次に、上記登録プログラムの処理内容につ
いて、図3に示す文書が登録された場合を例に説明す
る。
【0027】始めに、テキスト登録プログラム40で、
フロッピディスクフロッピディスクドライブ4に挿入さ
れたフロッピディスク5から文書1、文書2、文書3、文
書4および文書5のテキストデータをワークエリア90に
読み込む。このことは、図7のステップ1100に示す
通りである。そして、ステップ1101で、ワークエリ
ア90に読み込まれたテキストデータを磁気ディスク7
内のテキスト格納領域100へ格納する。
【0028】さらに、ステップ1102で、磁気ディス
ク7内の文書管理情報格納領域110から文書管理情報
を主メモリ6上のワークエリア90に読み込む。なお、
本実施例では、登録文書を管理する情報として図8に示
す対応表を用いる。
【0029】そして、ステップ1103で、キーボード
から登録文書のタイトルを入力させる。
【0030】そして、ステップ1104で、入力された
タイトルを以下のものと併せて格納する。併せて格納す
るものは、登録文書の文書番号および該当文書を格納す
るファイル名である。このことにより、文書管理情報を
追加登録する。
【0031】そして、以上の処理が終了するとステップ
1105で、文書管理情報を磁気ディスク7内の文書管
理情報格納領域110に格納し、テキスト登録プログラ
ム20の処理を終了する。
【0032】なお、登録文書はフロッピディスクを用い
て入力するだけでなく通信回線(図1に示していない)
等を用いて他の装置から入力されるような構成をとって
もかまわない。この場合、通信制御装置等を用いてバス
8を通して入力させる。
【0033】次に、参考文献テーブル作成登録プログラ
ム50で、まずステップ1200において各登録文書内
で参照している参考文献のタイトルをキーボード2から
入力する。このことは、図9に示す。例えば文書番号1
の文書については、参考文献の文書名として「通信会議
システム××の開発」が入力される。
【0034】そしてステップ1201で、参考文献のタ
イトルで文書管理情報内のタイトルを検索する。このこ
とにより各参考文献の文書番号を取得する。すなわち、
文書番号1の文書については、参考文献のタイトルであ
る「通信会議システム××の開発」で文書管理情報内の
タイトルを検索することにより参考文献の文書番号とし
て文書番号2を得る。
【0035】さらに、ステップ1202で、各登録文書
と参考文書の文書番号をリンク情報を登録することによ
り、参照先リンクを生成する。すなわち、文書番号1の
文書からは参照先リンクとして文書番号2が生成され
る。このため、図3に示す文書に対して図4に示す参照
元リンク情報が、生成されることになる。
【0036】そして、ステップ1203で、ステップ1
202において生成された参照先リンク情報をもとに、
各登録文書中で参照されている参考文献の番号を登録す
る。このことにより図4に示す参考文献テーブルを作成
する。
【0037】そして、以上の処理が終了すると以下の処
理を行う。ステップ1204で、参考文献テーブルと参
照先リンク情報を磁気ディスク7内の参考文献テーブル
格納領域120に格納する。こうして、参考文献テーブ
ル作成登録プログラム50を終了する。
【0038】最後に、関連文献テーブル作成登録プログ
ラムでは、図10に示す通り以下の処理を行う。まずス
テップ1300で、参照先リンク情報を磁気ディスク7
内の参考文献テーブル格納領域120から主メモリ6上
のワークエリア90に読み込む。
【0039】そしてステップ1301で、参照先リンク
情報の参照先のエントリと参照元のエントリを入れ替え
る。さらに、参照元文書番号でソーティングすることに
より参照元リンク情報を生成する。このことは、図4に
示す通りである。また、参照元リンク情報をもとに、各
登録文書中で参照されている参考文献の番号を登録す
る。このことにより参考文献テーブルをステップ130
2で作成する。
【0040】そして、以上の処理が終了するとステップ
1303で、関連文献テーブルと参照元リンク情報を磁
気ディスク7内の関連文献テーブル格納領域130に格
納する。こうして、関連文献テーブル作成登録プログラ
ム60を終了する。以上が、登録時処理の具体的な処理
内容である。
【0041】次に、検索時の処理手順を図11に示す。
以下、図5に示す文書に対して文書番号1に関連した文
書を検索する場合を例に検索時の処理を説明する。
【0042】始めに、キーボード2から入力される検索
コマンドによりシステム制御プログラム10は、関連文
献検索制御プログラム30を起動して、関連文献検索処
理を開始する。
【0043】そして、関連文献検索制御プログラム30
は、ステップ2000で参考文献抽出プログラム70を
起動する。参考文献抽出プログラム70では、参考文献
テーブルを参照することによりユーザが指定した文書の
中で参照している参考文献の文書番号を取得する。すな
わち、図5の例ではユーザが指定した文書番号1に対
し、参考文献テーブルを参照する。このことにより、文
書番号1の中で参照している参考文献の番号として文書
番号2を得る。
【0044】次に、関連文献検索制御プログラム30
は、ステップ2001で関連文献抽出プログラム80を
起動する。関連文献抽出プログラム80では、参考文献
抽出プログラム70で抽出された参考文献の文書番号を
もとに関連文献テーブルを参照する。このことにより、
ユーザが指定した文書中の参考文献を参照している文書
の番号を取得する。すなわち、図5に示す例では、ユー
ザの指定した文書番号1の文書に対する参考文献として
得られた文書番号2で関連文献テーブルを参照する。こ
のことにより、文書番号1、3および4を得る。以上の処
理によって、文書1と関連性の高い文書として文書3と文
書4を得ることができる。以上が、検索時処理の具体的
な内容である。
【0045】以上示したように、本発明によればユーザ
が指定した文書と同じ文書を参考文献として参照してい
る別の文書を検索する。したがって、従来の関連文書検
索方法では検索することのできなかった最新の関連文献
の検索を実現することができる。
【0046】
【発明の効果】本発明によれば、ユーザが指定した文書
と同じ文書を参考文献として参照している別の文書を検
索することにより、従来の関連文書検索方法では検索す
ることのできなかった最新の関連文献の検索を実現する
ことが可能となる。
【図面の簡単な説明】
【図1】本発明における関連文書検索システムの構成を
示した図である。
【図2】従来の関連文書検索を説明する図である。
【図3】本発明の実施例における登録文書を示す図であ
る。
【図4】参考文献テーブルと関連文献テーブルの作成処
理例を示す図である。
【図5】本発明における関連文献検索の処理例を示す図
である。
【図6】本発明における登録処理手順を示す図である。
【図7】テキスト登録プログラムの処理内容を示す図で
ある。
【図8】本発明における文書管理情報の例を示す図であ
る。
【図9】参考文献テーブル作成登録プログラムの処理手
順を示す図である。
【図10】関連文献テーブル作成登録プログラムの処理
手順を示す図である。
【図11】本発明における検索処理手順を示す図であ
る。
【符号の説明】
1…ディスプレイ、2…キーボード、3…中央演算処理
装置CPU、4…フロッピディスクドライバFDD、5
…フロッピディスク、6…主メモリ、7…磁気ディス
ク、8…バス、10…システム制御プログラム、20…
文書登録制御プログラム、30…関連文献検索制御プロ
グラム、40…テキスト登録プログラム、50…参考文
献テーブル作成登録プログラム、60…関連文献テーブ
ル作成登録プログラム、70…参考文献抽出プログラム
80…関連文献検索プログラム、90…ワークエリア、
100…テキスト格納領域、110…文書管理情報格納
領域、120…参考文献テーブル格納領域、130…関
連文献テーブル格納領域、140…各種プログラム格納
領域
───────────────────────────────────────────────────── フロントページの続き (72)発明者 東 秋夫 東京都江東区新砂一丁目6番27号 株式会 社日立製作所公共情報事業部内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文書データベースに登録された複数の登録
    文書を検索する文書検索方法において、 前記登録文書中で参照されている参考文献に対する当該
    登録文書からの第1のリンク情報を作成するとともに、
    前記登録文書に対する当該登録文書を参照している他の
    登録文書からの第2のリンク情報を作成しておき、 使用者から登録文書が指定された場合、前記第1のリン
    ク情報を用いて前記指定された登録文書の参考文献を前
    記文書データベースから抽出し、 前記第2のリンク情報を用いて、前記抽出された参考文
    献に関連する文書を抽出することを特徴とする文書検索
    方法。
JP7302463A 1994-06-29 1995-11-21 文書検索方法 Pending JPH09146968A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7302463A JPH09146968A (ja) 1995-11-21 1995-11-21 文書検索方法
US08/746,905 US5832476A (en) 1994-06-29 1996-11-19 Document searching method using forward and backward citation tables

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7302463A JPH09146968A (ja) 1995-11-21 1995-11-21 文書検索方法

Publications (1)

Publication Number Publication Date
JPH09146968A true JPH09146968A (ja) 1997-06-06

Family

ID=17909251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7302463A Pending JPH09146968A (ja) 1994-06-29 1995-11-21 文書検索方法

Country Status (1)

Country Link
JP (1) JPH09146968A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11195018A (ja) * 1998-01-05 1999-07-21 Nec Corp 文書編集装置、方法及び記録媒体
JP2004348771A (ja) * 2004-09-13 2004-12-09 Matsushita Electric Ind Co Ltd 技術文書検索装置
US7197697B1 (en) 1999-06-15 2007-03-27 Fujitsu Limited Apparatus for retrieving information using reference reason of document
JP2012099126A (ja) * 2005-10-04 2012-05-24 Thomson Reuters Global Resources 関連法律文書を特定するためのシステム、方法およびソフトウェア

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11195018A (ja) * 1998-01-05 1999-07-21 Nec Corp 文書編集装置、方法及び記録媒体
US7197697B1 (en) 1999-06-15 2007-03-27 Fujitsu Limited Apparatus for retrieving information using reference reason of document
JP2004348771A (ja) * 2004-09-13 2004-12-09 Matsushita Electric Ind Co Ltd 技術文書検索装置
JP2012099126A (ja) * 2005-10-04 2012-05-24 Thomson Reuters Global Resources 関連法律文書を特定するためのシステム、方法およびソフトウェア
JP2014238868A (ja) * 2005-10-04 2014-12-18 トムソン ルーターズ グローバル リソーシーズ 関連法律文書を特定するためのシステム、方法およびソフトウェア

Similar Documents

Publication Publication Date Title
US5832476A (en) Document searching method using forward and backward citation tables
JP2770715B2 (ja) 構造化文書検索装置
US20020059297A1 (en) Search formulation user interface
JP2001075969A (ja) 画像管理検索装置、画像管理検索方法及び記憶媒体
JPH09146968A (ja) 文書検索方法
JP2000003366A (ja) 文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体
JP2000163445A (ja) データベース管理システム
JPH1091766A (ja) 電子ファイリング方法及び装置並びに記憶媒体
JP3825829B2 (ja) 登録情報検索装置及びその方法
JPS634334A (ja) 文書イメ−ジ電子フアイル装置
JPH0991305A (ja) 情報処理方法及び装置
JP3666066B2 (ja) 多言語文書登録検索装置
JP2001147922A (ja) 文書管理装置、文書管理方法および記憶媒体
JP3787384B2 (ja) 文書検索装置及びその方法
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
JP3239845B2 (ja) 全文検索装置および方法
JP2001028007A (ja) ファイル管理装置及び記録媒体
JP3193249B2 (ja) キーワード検索方法
JP2888458B2 (ja) ファイル格納装置
JP2601139B2 (ja) 文字列検索装置
JP2004178180A (ja) 全文検索情報の登録及び検索方式
JPH09269952A (ja) 文書検索装置及びその方法
JPH0237466A (ja) 情報処理システム
Kapidakis Issues in the Development and Operation of a Digital Library
JPH11161666A (ja) ドキュメントデータ検索方法および装置、並びにドキュメント編集装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040824

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041221