JPH11161666A - ドキュメントデータ検索方法および装置、並びにドキュメント編集装置 - Google Patents

ドキュメントデータ検索方法および装置、並びにドキュメント編集装置

Info

Publication number
JPH11161666A
JPH11161666A JP9328915A JP32891597A JPH11161666A JP H11161666 A JPH11161666 A JP H11161666A JP 9328915 A JP9328915 A JP 9328915A JP 32891597 A JP32891597 A JP 32891597A JP H11161666 A JPH11161666 A JP H11161666A
Authority
JP
Japan
Prior art keywords
data
data file
key
document
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9328915A
Other languages
English (en)
Inventor
Shinichiro Ie
伸一郎 家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9328915A priority Critical patent/JPH11161666A/ja
Publication of JPH11161666A publication Critical patent/JPH11161666A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ワードプロセッサやCADなどで作成された
データファイルを汎用的に検索可能な装置を提供する。 【解決手段】 ドキュメントデータ検索装置1は、入力
されたキーワードを記憶する検索条件入力手段15と、
データファイル記憶装置2からキーデータファイルを抽
出し読込み記憶するキーデータファイル検索手段17
と、キーデータファイル検索手段が読込んだデータをも
とに、対応するデータファイルからキーデータを読込み
記憶し、検索キーワードとの一致を検査し一致するキー
データを有するデータファイルの情報をバッファに記憶
するキーワード検索手段16と、キーワード検索手段の
バッファに保持するデータを表示する表示手段10とで
構成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、記憶装置から目的
とするドキュメントのデータファイルを抽出するときに
用いられるドキュメントデータ検索方法およびその装
置、並びにドキュメント編集装置、データファイル生成
装置に関わる。
【0002】
【従来の技術】ワードプロセッサやCAD等を利用して
作成されたドキュメントを再度、印刷あるいは表示する
ために必要となるデータファイルを記憶装置から抽出す
るときに、利用者がそのデータファイルにつけられたフ
ァイル名だけを手がかりにして目的とするファイルを見
つけ出すことは困難である。このような、目的とするデ
ータファイルを見つけ出す作業を支援する方法として、
特開昭61−198332号公報にて開示されるよう
な、データファイルの先頭部分にそのドキュメントの検
索に使用するキーワード等を記憶する文書ヘッダー情報
を追加し、この文書ヘッダー情報と、利用者が入力する
検索条件との比較を行うことにより、利用者が要求する
データファイルを検索する方式がある。
【0003】また、この方式以外にも、データファイル
を全てASCIIコードのような文字コードの形のデータ
(以下テキストデータと称す)の形式で保存し、このテ
キストデータと、目的とする検索条件とを比較すること
により、利用者が要求するデータファイルを検索する方
式も従来使用されている。
【0004】
【発明が解決しようとする課題】上記の文書ヘッダー情
報による方式によれば、文書ヘッダー情報として、その
データファイルに関連するキーワードを予め登録し記憶
装置に保存すれば、データファイルを検索するときに比
較的容易に目的とするデータファイルを見つけることが
可能となる。しかしながら、データファイルのフォーマ
ットは通常ワードプロセッサやCADなどのツールに強
く依存しており、このことから、文書ヘッダー情報もツ
ールに依存したフォーマットとならざるを得ない。した
がって、目的とするドキュメントを作成したツールを特
定しないで、そのデータファイルを検索するためには、
ツール毎のデータファイルのフォーマットの情報をすべ
て把握する必要がある。それぞれのツールは、バージョ
ンアップなどによりデータファイルのフォーマットを変
更する可能性が有ることから、常時、全てのツールの全
ファイルフォーマットの情報を管理するためには多大な
労力を要することとなる。つまり、不特定のツールで作
成されたデータファイルを対象として、目的とするドキ
ュメントを検索することは困難である。
【0005】また、前記従来の第二の方式によれば、デ
ータファイルをすべてテキストデータとして保存するこ
とにより、ドキュメントを作成するツールに依存しない
で、目的とするデータファイルを検索することが可能と
なる。しかしながら、ドキュメントを作成するツールに
より作成されるデータファイルには、文字列のデータと
ともに、図形などのデータも含まれる。特にCAD等の
機械やソフトウエアの設計に関連して利用するものの場
合、図形などのデータの割合が大きくなる。通常、図形
などのデータは、その属性を示す数値データとして保持
されるが、これをテキストデータ(数字)としてファイ
ルに出力すると、データ量が元の数値データよりも多く
なるという欠点がある。また、データファイルを全てテ
キストデータとして、これを検索に用いた場合、検索条
件とはなり難い数字のデータまでもが検索対象となり、
検索時間が余計にかかるという問題があった。
【0006】本発明の目的は、上記の問題点を解決しド
キュメントを作成したツールに依存しないで、かつ、デ
ータファイルのデータ量の増加を最小限にし、利用者が
意図するキーワードだけを検索の対象とすることを可能
とするドキュメントデータの検索方法とそれに関わる装
置を提供することにある。
【0007】
【課題を解決するための手段】上記の目的は、ドキュメ
ントのデータファイルを記憶装置に出力するときに、既
出力のデータのサイズを計数し記憶するデータサイズ測
定手段と、データファイルとは異なる別のファイルに前
記データサイズ測定手段が保持する既出力のデータサイ
ズのデータと、キーワードの文字列の位置のデータを出
力するキーデータファイル出力手段とを設け、そのドキ
ュメントのキーワードとなるデータをデータファイル記
憶装置に出力するときに、前記キーデータファイル出力
手段がそのキーワードのデータファイル内部での位置と
大きさをキーワードファイルに出力する処理を行う構成
としたことによって達成される。
【0008】また、上記の目的は、ドキュメントを表示
する表示手段と、利用者によりドキュメントに対する操
作入力を読込むデータ入力手段と、該データ入力手段を
介して入力される情報に応じて、ドキュメントのデータ
を処理し、その結果を表示手段に表示するドキュメント
編集手段とを設け、該ドキュメント編集手段が、ドキュ
メントの中の文字列のデータについて、それがキーワー
ドかそうでないかを識別する情報を保持し、キーワード
か否かにより表示装置上で区別可能とする機能を有する
構成としたことによって達成される。
【0009】さらに、上記の目的は、データファイル毎
のキーデータファイルのデータを利用者が指定する記憶
装置の領域について逐次読込み格納されるキーデータフ
ァイル読込みバッファと、キーデータファイル読込みバ
ッファの情報に応じてキーデータファイルからキーワー
ドを抽出した情報が格納されるキーデータ読込みバッフ
ァとを設け、前記入力手段を介して入力される検索キー
ワードに応じて、前記キーデータ読込みバッファ内のキ
ーワードとの比較を行い、一致するキーデータがあれ
ば、その一致するキーデータを有するデータファイルに
関する情報を一時記憶バッファにスタックし、利用者が
指定する記憶装置の領域に対する検索を終え検索結果を
表示装置に表示する構成としたことによって達成され
る。
【0010】さらに、上記のの目的は、ドキュメントの
データを保持するデータファイルを読込み、予め定めら
れた文字列の系列(キーワード識別記号)を検索し、そ
の文字列のデータのデータファイル中の相対位置を測定
し記憶するキーワード判定処理手段と、データファイル
に応じたファイル名称を有するファイルに、前記キーワ
ード判定処理手段に記憶する相対位置の情報を出力する
キーデータファイル出力処理手段とを設け、ドキュメン
ト中のキーワードとなる文字列に対して前記のキーワー
ド識別記号を附したデータファイルを読込み、該ファイ
ル中のキーワードの位置に応じてキーワードファイルを
生成する処理を行う構成としたことによって達成され
る。
【0011】以上の構成手段を用いることにより、ドキ
ュメントのデータファイルのフォーマットに依存しない
で、かつ、新規に追加するキーデータファイルのサイズ
を小さくした上で、ドキュメントを作成したツールによ
らず目的とするドキュメントのデータファイルを見出す
ことが可能となる。
【0012】
【発明の実施の形態】以下、本発明の実施の形態を図面
を用いて詳細に説明する。
【0013】図1は本発明の一実施形態を示すブロック
図である。本実施形態は、ドキュメントデータ検索装置
を組み込んだドキュメント編集装置1を示し、利用者に
より編集されたドキュメントのデータをデータファイル
記憶装置2に保存する毎に、同時にデータファイル中の
キーワードデータの位置の情報をもつキーデータファイ
ルを生成し、データファイル記憶装置2に出力する編集
機能と、および、利用者により設定される検索キーワー
ドなどの検索条件をもとに、目的とするデータファイル
をデータファイル記憶装置2から検索する機能を有する
ものである。
【0014】図1において、表示手段10は、検索結果
および、編集対象のドキュメントを表示する。データ入
力手段11は、キーボードやマウスにより構成されるデ
ータ入力手段であり、このデータ入力手段11を介して
データファイルの検索キーワードと検索条件の設定入
力、および、編集対象のドキュメントに対する操作入力
が行われる。
【0015】ドキュメント編集手段12は、編集対象の
ドキュメントのデータを一時的に記憶し、データ入力手
段11を介して利用者が入力するデータに応じてドキュ
メントの図形の配置やその属性の設定などの編集処理を
行うとともに、ドキュメントデータに応じてそのドキュ
メントの内容を表示装置10に表示する機能を有する。
また、このドキュメント編集手段12は、ドキュメント
中の文字列の一部に対して、データ入力手段11を介し
て入力されたデータに基づき、キーワードとしての属性
設定を行うものである。また、ドキュメントデータ中の
キーワード属性が設定された文字列を表示装置10に表
示するときに、他のキーワード属性が設定されていない
文字列と区別できるよう強調表示する機能も有する。な
おドキュメント編集手段12のその他の一般的な編集処
理機能は本発明とは直接関係しないため説明を省略す
る。
【0016】データサイズ測定手段13は、ドキュメン
ト編集手段12から入力されたドキュメントのデータを
解析し、逐次そのデータサイズを計数、記憶するもので
ある。また入力されたドキュメントのデータを、本実施
形態の編集装置1に接続するデータファイル記憶装置2
に、データファイルとして出力する。また、ドキュメン
ト編集手段からキーワードであるデータの入力を受けた
ときに、データサイズの累計値、すなわち、データファ
イルにおけるキーワードデータへのポインタと、および
キーワードデータのデータサイズを、キーデータファイ
ル出力手段14に渡す。
【0017】キーデータファイル出力手段14は、上記
データサイズ測定手段13から入力された、キーワード
のポインタとデータサイズをデータファイル記憶装置2
にデータファイル毎に作成するキーデータファイルに出
力する。
【0018】ここで、本実施形態のドキュメント編集装
置1は、ドキュメントのデータファイルのファイル名の
拡張子として「DOC」、キーデータファイルの拡張子
として「IND」を用いる。
【0019】検索条件入出力処理手段15は、データ入
力手段11を介して入力された検索キーワードや検索条
件を解析し記憶するもので、その結果はキーワード検索
手段16とキーデータファイル検索手段17に渡され
る。また、検索条件入出力手段15は、キーワード検索
手段16からの検索結果の入力に応じて、検索結果を表
示手段10に表示する。
【0020】キーワード検索手段16は、キーデータフ
ァイルから読込んだ、検索対象データファイル中のキー
ワードデータの位置とサイズの情報を一時的に記憶する
キーデータバッファと、ファイル毎に抽出されるキーワ
ードのリストを一時的に記憶するキーワードバッファ
と、検索結果の情報を記憶する結果バッファを使用して
検索を実行する。すなわち、キーデータファイル検索手
段17から入力されるキーデータファイルの情報によ
り、キーデータファイルをキーデータバッファに読込
み、このデータをもとにドキュメントのデータファイル
からキーワードを抽出しキーワードバッファに記憶す
る。また、このキーワードと検索条件入出力手段15か
ら入力される検索キーワードとを比較し、検索条件に一
致するキーワードのデータファイルの情報を結果バッフ
ァに記憶する。
【0021】キーデータファイル検索手段17は、検索
条件入出力手段15から入力される検索対象記憶装置の
データに従い、ファイル名の拡張子が「IND」である
ファイルを検索し、見つかったキーデータファイルをキ
ーワード検索手段16に渡す。
【0022】図2は、本実施形態のドキュメント編集装
置1が、データファイル記憶装置2に対して出力するデ
ータファイルおよびキーデータファイルの構造を概念的
に示すものである。図3〜図5は、本実施形態の動作を
わかりやすく説明するために利用した図であり、表示手
段10に表示する画面図である。図6、図7は、本実施
形態の動作を示すフローチャートである。
【0023】以下、本発明の実施形態の動作につき詳細
に説明する。本発明による特有の動作は、大まかに言っ
てドキュメントデータに対応するキーデータファイルを
保存するキーデータ保存動作と、保存されたドキュメン
トデータを検索するデータファイル検索動作の二つに大
別される。
【0024】まず、キーデータ保存動作について図6を
用いて説明する。キーデータ保存動作は、ドキュメント
編集装置1のドキュメントデータの保存動作に同期して
起動される。ステップ101では、データサイズ測定手
段13が保持する積算データ量のデータをゼロにセット
する。次に、ステップ102で、ドキュメント編集手段
12から出力されるドキュメントのデータファイルの名
称データを読込む。ステップ103では、ステップ10
2で読込んだデータをもとに、データファイル記憶装置
2のデータファイルを開く。ステップ104では、ドキ
ュメント編集手段12から出力されるドキュメントのデ
ータを一つ読込む。
【0025】ステップ105では、ステップ104また
はステップ110で読込んだデータのサイズ、すなわ
ち、データのバイト数を評価する。データのサイズは、
データの属性(整数、実数、文字列など)に対応した一
定の値となることを利用し評価する。
【0026】ステップ106では、ステップ105で評
価したデータがキーワードであるかどうかを評価する。
これは、すなわち、ドキュメント編集手段12でドキュ
メントを編集するときに、ドキュメント中の文字列のデ
ータに関連付けて保持する、それがキーワードであるか
否かを示す属性値により判定を行う。このときの、利用
者によりキーワードとする文字列のキーワード属性設定
時に表示する画面の実施例を図3に示す。図3で画面の
実施例では、文字列「キーワード2」に対してキーワー
ド属性を設定しようとしている。また、この図で文字列
「キーワード3」は、既にキーワード属性が設定済みで
あり、このことを示すために、他の文字列とは区別でき
るようアンダーラインを付して表示している。
【0027】ステップ107では、ステップ106で評
価したデータがキーワードであった場合に、積算のデー
タ量の値、およびステップ104で評価したデータのサ
イズをキーデータファイル出力手段14に出力する。
【0028】ステップ109では、積算データ量の値を
更新する。すなわち、積算データ量の値に、ステップ1
05で評価したデータサイズの値を加え、この値を新た
に積算データ量とする。
【0029】ステップ110では、ドキュメント編集手
段12が出力する次のデータを読込む。このとき、次の
データが有れば、次にステップ105に戻り。データが
なければステップ112に進み、データファイルを閉じ
る。
【0030】また、このときキーデータファイル出力手
段14は、データサイズ測定手段13から出力されるキ
ーワードのデータまでの積算データ量と、キーワードの
サイズのデータを読込み、キーデータファイルを、デー
タファイル記憶装置2の処理の対象とするデータファイ
ルと同一のディレクトリに書き込む。また、このときデ
ータファイルの名称の拡張子として使用する文字列(本
実施例では「DOC」)をキーデータファイルの先頭部
分に書き込む。さらに、このときのキーデータファイル
の名称をデータファイルの名称と同じで拡張子の部分を
「IND」として保存する。
【0031】以上の処理により、ドキュメントのデータ
ファイル毎のキーデータファイルを生成する。
【0032】つぎに、データファイル検索動作について
説明する。データファイル検索動作が起動されることに
より検索条件入出力手段15は、検索キーワードと検索
条件の入力を利用者に促すための画面を表示手段10に
表示する。この表示画面は図4に示すような形式となっ
ており、利用者はこの画面に従い、目的とするキーワー
ドおよび検索対象とする記憶装置をデータ入力手段11
を介して入力する。入力されたデータは、検索条件入出
力手段15により解析され、検索キーワードと検索対象
記憶装置のデータをそれぞれ記憶するとともに、キーワ
ード検索手段16、および、キーデータファイル検索手
段17にそれぞれのデータを渡す。
【0033】検索条件の入力処理が終わると、キーデー
タファイル検索手段17が検索条件入出力手段15から
入力される検索対象記憶装置のデータにより、検索対象
の記憶装置で、ファイル名の拡張子が「IND」である
ファイルを検索し、その結果、すなわち、ファイル名と
ファイルが保存されるディレクトリ名をキーワード検索
手段16に渡す。キーワード検索手段16は、検索条件
入出力手段15から入力される検索キーワードと、キー
データファイル検索手段17から入力される検索対象キ
ーデータファイルのデータをもとに、検索キーワードと
それぞれのデータファイルが持つキーワードとを比較
し、一致するキーワードを持つデータファイルの情報を
結果バッファにスタックする。検索が終了すると、結果
バッファの情報を表示手段10に表示する。この表示画
面の実施例を図5に示す。キーワード検索手段16によ
る検索処理は、図7に示すフローチャートに基づき行わ
れる。
【0034】図7のフローチャートに基づき検索処理の
詳細について説明する。まず、ステップ201では、キ
ーデータファイル検索手段17からの検索対象キーデー
タファイルと、検索条件入出力手段15からの検索キー
ワードの情報を読み込み記憶する。次に、ステップ20
2では、まだ検索処理を行っていないキーデータファイ
ルが有るかどうかを評価し、有ればステップ203に進
む。なければステップ215に進み結果バッファのデー
タを検索結果表示画面に表示し、検索処理を終了する。
図5は、このとき表示手段10に表示する画面の実施例
を示す。
【0035】ステップ203では、検索の対象とするキ
ーデータファイルを更新する。ステップ204では、検
索の対象とするキーデータファイルを開き、キーデータ
バッファに読込む。次にステップ205では、キーデー
タファイルの情報に基づきデータファイルを開く。すな
わち、キーデータファイルのファイル名の拡張子の部分
を、キーデータファイルの情報に基づき変更し、そのフ
ァイル名のファイルを開く。
【0036】ステップ206では、キーデータバッファ
に未処理のデータ、すなわち、対応するキーワードの文
字列をデータファイルから読込んでいないデータが有る
かどうかを評価し、データが有れば次にステップ207
に進む。なければ次にステップ210に進む。
【0037】ステップ207では、データファイルをデ
ータバッファのデータにしたがい読み飛ばす。そして、
ステップ208でデータバッファのデータに応じたサイ
ズの文字列のテキストデータを読込みキーワードバッフ
ァにスタックする。ステップ209では、キーデータバ
ッファの処理対象データを次のデータに置き換える。キ
ーデータバッファの全てのデータについて処理を完了す
るまでステップ207〜209を繰り返す。
【0038】ステップ210では、キーワードバッファ
に記憶するデータファイルのキーワードと検索対象のキ
ーワードを比較する。そして、ステップ211で検索キ
ーワードが含まれるかどうかを判定し、キーワードが含
まれる場合には、ステップ212でキーワードバッファ
のデータと、処理対象のデータファイルの情報を結果バ
ッファにスタックする。
【0039】ステップ213では、処理対象のデータフ
ァイルを閉じ、ステップ214では、キーワードバッフ
ァのデータをすべて削除する。
【0040】以上のステップ202〜214の処理を、
ステップ201で読込んだ全てのキーデータファイルに
ついて実行する。
【0041】なお、以上の実施形態では、検索の結果抽
出されたデータファイルを、編集装置で開き編集処理を
行うところまでは述べていないが、データファイルのフ
ァイル名の拡張子の情報から、そのデータファイルを作
成した編集装置の種類を判別し、その編集装置にデータ
ーファイルを送ることにより、容易に編集を行うことが
可能である。
【0042】また、利用者がドキュメント内でキーワー
ドとして登録する文字列を指定可能な構成としたが、ド
キュメント中の全ての文字列をキーワードとして登録す
ることも可能である。更に、ドキュメントを表示する上
での文字の大きさや、フォントなどの文字の属性によ
り、キーワードとして登録するか否かの判断を自動的に
行うことも可能である。
【0043】次に本発明の第二の実施形態について、図
面を使用して詳細に説明する。第二の実施形態は、任意
のドキュメントの編集ツールで作成されたデータファイ
ルを入力し、本発明のドキュメントデータ検索装置にて
使用するキーデータファイルを出力する機能を有するキ
ーデータファイル生成装置である。
【0044】図8は、この実施形態を示すブロック図で
ある。図において、3はキーデータファイル生成装置
で、ドキュメントのデータファイル、および、キーデー
タファイルを記憶するデータファイル記憶装置2に接続
する。データ入力手段25は、キーボードとマウスで構
成され、これを介して処理の対象とするデータファイル
のファイル名の入力が行われる。キーワード区切り記号
記憶手段26は、予め定められた、ドキュメントのデー
タファイルの中で、キーワードを識別するための区切り
記号を記憶する。本実施形態では、データファイル中で
のキーワードの開始を意味する区切り記号として、文字
列のデータ「[[」を、また、キーワードの終わりを意味
する区切り記号として「]]」を使用する。キーワード区
切り記号記憶手段26に記憶するデータは、外部の記憶
装置から読込んだり、データ入力手段25を介して利用
者が入力することも可能である。また、キーワード区切
り記号は、単一の記号の系列のみではなく、複数のもの
を使用することが可能である。
【0045】データファイル名入力処理部21は、デー
タ入力手段25を介して入力された処理対象データファ
イル名を解析するもので、その結果は、データファイル
名バッファ27に記憶される。データファイル読込み処
理部22は、データファイル名バッファ27に記憶する
名前のファイルを、データファイル記憶装置2から読み
込み、読込んだデータをデータバッファ28に書き込
む。
【0046】キーワード判定処理部23は、データバッ
ファ28に記憶するデータのデータサイズを計数し、デ
ータの先頭からの積算データ量を積算データ量バッファ
29に逐次書き込む。また、キーワード判定処理部23
は、キーワード区切り記号記憶手段26に記憶するデー
タをもとにデータバッファ28から入力するデータか
ら、キーワードとなるデータを抽出し、そのキーワード
のデータのデータサイズをキーワードデータサイズバッ
ファ30に書き込む。また、このとき同時に、キーデー
タファイル出力処理部24によりデータファイル記憶装
置2のキーデータファイルへの書き込み処理を行う。
【0047】キーデータファイル出力処理部24は、デ
ータファイル名バッファ27に記憶するファイル名のデ
ータを読込み、そのファイル名の拡張子を予め定めるキ
ーデータファイルの拡張子に置き換えたファイル名のキ
ーデータファイルを、データファイル記憶装置2に作成
する。本実施形態では、キーデータファイルの拡張子を
「IND」とする。また、キーデータファイル出力処理
部24は、キーワード判定処理部23からの指令によ
り、キーワードデータサイズバッファ30に新たなデー
タが書込まれたときに、積算データ量バッファ29とキ
ーワードデータサイズバッファ30のデータを、キーデ
ータファイルに書き込む処理を行う。
【0048】図9は、本実施形態で処理対象として扱う
データファイルとキーデータファイルの構造を概念的に
示した図である。図10は、本発明の第二の実施形態の
動作を示すフローチャートである。
【0049】以下、本発明の第二の実施形態の動作につ
き図10のフローチャートを用い詳細に説明する。始め
にキーデータファイル生成装置3が起動し、利用者がデ
ータ入力手段25を介して処理対象のデータファイル名
を入力すると、データファイル名入力処理部21が、処
理対象データファイル名をデータファイル名バッファ2
7に書き込み、データファイル読込み処理部22に制御
を渡す(ステップ301)。
【0050】データファイル読込み処理部22は、積算
データ量バッファの値を0にセットし(ステップ30
2)、データファイル名バッファ27のデータにしたが
い、データファイル記憶装置2のデータファイルを開
き、読込んだデータをデータバッファ28に書き込む
(ステップ303)。
【0051】次に、ステップ304では、キーデータフ
ァイル出力処理部24がキーデータファイルを作成し、
データファイル名バッファ27のデータの拡張子部分を
書き込む。
【0052】ステップ305では、キーワード判定処理
部23がデータバッファ28から、予め定めたサイズ分
のデータを読込み、データの先頭からの積算データ量を
積算データ量バッファ29に書込む。そして、ステップ
305で読込んだデータがキーワード区切り記号に一致
するかどうかを評価する(ステップ306)。この結
果、区切り記号に一致すると判定された場合(ステップ
307)、ステップ308で、キーワードのデータサイ
ズをキーワードデータサイズバッファ30に書きこみ、
キーデータファイル出力処理部24に、キーデータの書
き込み指令を出す。キーデータファイル出力処理部24
は、この指令により積算データ量バッファ29と、キー
ワードデータサイズバッファ30の値をキーデータファ
イルに出力する。ステップ307でキーデータ以外の場
合は、ステップ308をスキップして、ステップ309
に進む。
【0053】ステップ309では、キーワード判定処理
部23が、積算データ量バッファ29のデータを更新す
る。次にステップ310では、キーワード判定処理部2
3がデータバッファ28から、予め定めたサイズ分のデ
ータを読込む。以上のステップ305〜310の処理を
データバッファ28の全てのデータにつき繰り返す。全
てのデータにつき処理が完了したら(ステップ311)
でデータファイルを閉じ(ステップ312)、ステップ
313でキーデータファイルを閉じる。以上の処理によ
りデータファイルから、キーデータファイルを生成する
ことができる。
【0054】上記のように、第二の実施形態にて生成す
るキーデータファイルは、前記第一の実施形態のドキュ
メント編集装置に組み込まれたデータファイル検索手段
にて検索処理可能である。
【0055】なお、上記の第二の実施形態では、キーワ
ード区切り記号にてキーワードデータを識別したが、キ
ーワード区切り記号ではなく、キーワードとして使用可
能な単語を予め記憶し、処理対象ドキュメントのデータ
ファイル内に、この単語が見つかった場合に、これをキ
ーワードとして処理することも可能である。
【0056】
【発明の効果】以上説明したように本発明によれば、ド
キュメントのデータファイル中のキーワードのデータ位
置およびサイズのデータを保持するキーデータファイル
を利用することが可能となる。これにより、任意のデー
タファイルについてキーデータのみを抽出できることか
ら、そのドキュメントを作成したツールによらず汎用的
に目的とするドキュメントのデータファイルを検索する
ことが可能となる。よって、利用者はいちいち複数のツ
ールでドキュメントを検索する必要がなくなり、そのた
めの時間を節約することができる。
【0057】また、本発明では、ドキュメントを作成し
たツールによるデータフォーマットをそのまま利用で
き、検索のために利用するキーデータファイルには、デ
ータファイルのファイル名の拡張子と、キーワードのデ
ータへのポインタおよびそのサイズのデータしか保持し
ないことから、データファイルをテキストデータとして
保持する場合と比べ、大幅にデータ量を軽減できるとと
もに、検索に関係ないデータまで検索対象とすることを
防止できる。これにより、より記憶容量の小さいデータ
ファイル記憶装置でも、データファイルを記憶すること
が可能であり、また、より短い検索処理時間で検索を行
うことが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態のドキュメント編集装置の
構成を示すブロック図。
【図2】処理の対象とするデータファイル及びキーデー
タファイルの構造を示す概念図。
【図3】表示画面の実施形態を示す図。
【図4】表示画面の実施形態を示す図。
【図5】表示画面の実施形態を示す図。
【図6】本発明の一実施形態のドキュメント編集装置の
処理の流れを示すフローチャート。
【図7】本発明の一実施形態のドキュメント編集装置の
処理の流れを示すフローチャート。
【図8】本発明の他の実施形態のキーデータファイル生
成装置の構成を示すブロック図。
【図9】処理の対象とするデータファイル及びキーデー
タファイルの構造を示す概念図。
【図10】本発明の他の実施形態のキーデータファイル
生成装置の処理の流れを示すフローチャート。
【符号の説明】
1…ドキュメント編集装置、2…データファイル記憶装
置、3…キーデータファイル生成装置、10…表示手
段、11…データ入力手段、12…ドキュメント編集手
段、13…データサイズ測定手段、14…キーデータフ
ァイル出力手段、15…検索条件入力手段、16…キー
ワード検索手段、17…キーデータファイル検索手段、
21…データファイル名入力処理部、22…データファ
イル読込み処理部、23…キーワード判定処理部、24
…キーデータファイル出力処理部、25…データ入力手
段、26…キーワード区切り記号記憶手段、27…デー
タファイル名バッファ、28…データバッファ、29…
積算データ量バッファ、30…キーワードサイズバッフ
ァ。

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 データファイルと、データファイルの中
    の検索キーとなるデータの抽出に必要な情報を保持する
    キーデータファイルを有するデータファイル記憶装置か
    ら目的とするデータファイルを抽出するドキュメントデ
    ータ検索装置であって、 外部から入力される検索キーワードを記憶する検索条件
    入力手段と、前記データファイル記憶装置から全てのキ
    ーデータファイルを抽出し読込み記憶するキーデータフ
    ァイル検索手段と、該キーデータファイル検索手段が読
    込んだキーデータファイルからキーデータを読込み記憶
    し、該読込んだキーデータと前記検索キーワードとの一
    致を検査し、一致するキーデータを有するデータファイ
    ルの情報をバッファに記憶するキーワード検索手段と、
    該キーワード検索手段のバッファに保持するデータを表
    示する表示手段とを具備することを特徴とするドキュメ
    ントデータ検索装置。
  2. 【請求項2】 データファイルと、データファイル中の
    検索キーとなるデータの抽出に必要な情報を保持するキ
    ーデータファイルを有するデータファイル記憶装置から
    目的とするデータファイルを抽出するドキュメントデー
    タ検索方法であって、 検索キーワードの入力情報に応じて検索キーワードのデ
    ータを解析し、該解析結果に基づいて前記データファイ
    ル記憶装置から全てのキーデータファイルを読込み、該
    読込んだキーデータファイルからキーデータを抽出し、
    該抽出したキーデータと前記検索キーワードのデータと
    の比較を行うことにより一致するキーデータがあれば、
    そのキーデータを保持するデータファイルを検索し、該
    検索したデータファイルのファイル名を表示することを
    特徴とするドキュメントデータ検索方法。
  3. 【請求項3】 データファイルと、データファイル中の
    検索キーとなるデータの抽出に必要な情報を保持するデ
    ータファイルを有するデータファイル記憶装置から目的
    とするデータファイルを抽出するドキュメントデータ検
    索方法であって、 検索キーワードと検索対象記憶装置のデータの入力情報
    に応じて検索キーワードのデータを解析し、該解析結果
    に基づき前記データファイル記憶装置の検索対象記憶装
    置から全てのキーデータファイルを読込み、該読込んだ
    キーデータファイルからキーデータを抽出し、該抽出し
    たキーデータと前記検索キーワードのデータとの比較を
    行うことにより一致するキーデータがあれば、そのキー
    データを保持するデータファイルを検索し、該検索した
    データファイルのファイル名を表示することを特徴とす
    るドキュメントデータ検索方法。
  4. 【請求項4】 編集対象ドキュメントに対する利用者に
    よる操作を入力するデータ入力手段と、該データ入力手
    段を介して入力されたデータに基づき、ドキュメントに
    記述する文字や図形のデータに対する編集処理を実行
    し、処理の結果をバッファに記憶するドキュメント編集
    手段と、該ドキュメント編集手段が記憶するドキュメン
    トのデータをもとにドキュメントを表示する表示手段と
    を備え、前記ドキュメント編集手段が保持するドキュメ
    ントのデータをファイルの形で保持するデータファイル
    記憶装置に接続されるドキュメント編集装置であって、 前記ドキュメント編集手段として編集対象のドキュメン
    ト中のデータについて前記入力手段を介して入力された
    データに基づき検索で使用するキーデータとするか否か
    の属性データの設定をする編集処理を実行するドキュメ
    ント編集手段と、該ドキュメント編集手段のバッファが
    保持するドキュメントのデータを前記データファイル記
    憶装置にデータファイルとして書込むと共に、そのとき
    のキーデータの位置とその大きさを解析して記憶するデ
    ータサイズ測定手段と、該データサイズ測定手段が保持
    するキーデータの位置と大きさの情報を、前記データフ
    ァイル記憶装置のキーデータファイルに書込むキーデー
    タファイル出力手段とを具備することを特徴とするドキ
    ュメント編集装置。
  5. 【請求項5】 前記請求項4記載のドキュメント編集装
    置であって、前記ドキュメント編集手段は、バッファに
    保持する検索で使用するキーデータとするか否かの属性
    データの値を前記データ入力手段を介して入力される情
    報に応じて変更する機能を有することを特徴とするドキ
    ュメント編集装置。
  6. 【請求項6】 前記請求項4記載のドキュメント編集装
    置であって、前記ドキュメント編集手段は、バッファに
    保持する検索で使用するキーデータとするか否かの属性
    データの値に応じて、前記表示手段に表示する対応項目
    が区別できるようにドキュメントの内容を表示する機能
    を有することを特徴とするドキュメント編集装置。
  7. 【請求項7】 利用者により編集されたドキュメントの
    データをデータファイル記憶装置に保存し、利用者によ
    り設定される検索キーワードのデータにより目的とする
    データファイルを前記データファイル記憶装置から検索
    するドキュメント編集装置であって、 前記請求項4記載のドキュメント編集装置と、前記請求
    項1記載のドキュメントデータ検索装置とを具備するこ
    とを特徴とするドキュメント編集装置。
  8. 【請求項8】 利用者からの入力情報を処理するデータ
    入力手段と、データファイルのデータの中で、検索用の
    キーデータを識別するためのデータを記憶するキーワー
    ド区切り記号記憶手段と、作業用の内部データを一時的
    に記憶するデータファイル名バッファと、データバッフ
    ァと、積算データ量バッファと、および、キーワードデ
    ータサイズバッファとを備え、ワードプロセッサやCA
    Dなどで作成された処理対象のドキュメントのデータフ
    ァイルを保持するデータファイル記憶装置に接続し、該
    データファイル記憶装置に保持するデータファイルの検
    索用のキーデータファイルを生成するキーデータファイ
    ル生成装置であって、 データ入力手段を介して入力されるデータファイルのフ
    ァイル名のデータを解析しデータファイル名バッファに
    書き込むデータファイル名入力処理部と、データファイ
    ル名バッファのデータにしたがい処理対象のデータファ
    イルをデータファイル記憶装置から読込みデータバッフ
    ァに書き込むデータファイル読込み処理部と、前記デー
    タバッファのデータを読込み、読込んだデータのデータ
    サイズを評価して、データの先頭からの積算データ量を
    積算データ量バッファに書き込むとともに、キーワード
    区切り記号記憶手段に保持するデータをもとに処理対象
    のデータがキーデータであるかどうかを判定して、キー
    データであると判定したときにキーワードデータサイズ
    バッファにそのデータサイズの値を書込むキーワード判
    定処置部と、前記データファイル記憶装置にキーデータ
    ファイルを作成し、キーワードデータサイズバッファに
    新たなデータが書き込まれたときに積算データ量バッフ
    ァの値とキーワードデータサイズバッファの値をキーデ
    ータファイルに出力するキーデータファイル出力処理部
    とを具備することを特徴とするキーデータファイル生成
    装置。
  9. 【請求項9】 前記請求項8記載のキーデータファイル
    生成装置であって、前記キーデータファイル出力処理部
    は、前記データファイル名バッファに記憶するファイル
    名の拡張子であるドキュメントデータ拡張子の部分を予
    め定める別の拡張子に置き換えたファイル名のキーデー
    タファイルを生成し、該キーデータファイルにドキュメ
    ントデータ拡張子のデータを書込む機能を有することを
    特徴とするキーデータファイル生成装置。
  10. 【請求項10】 前記請求項8記載のキーデータファイ
    ル生成装置であって、前記キーワード区切り記号記憶手
    段は、データファイル中のキーデータの前後に連続して
    書込まれるデータの系列を保持することを特徴とするキ
    ーデータファイル生成装置。
  11. 【請求項11】 前記請求項8記載のキーデータファイ
    ル生成装置であって、前記キーワード区切り記号記憶手
    段は、キーデータとして使用するデータのリストを記憶
    することを特徴とするキーデータファイル生成装置。
  12. 【請求項12】 データファイルから検索用のデータフ
    ァイルを生成するデータファイル生成方法であって、 ワードプロセッサやCADなどで作成された処理対象の
    ドキュメントのデータファイルのファイル名の入力を解
    析し、その拡張子とそれ以外のデータに分離して記憶
    し、該記憶した拡張子のデータをデータファイルに書込
    み、前記処理対象のデータファイルを読込み、予め定め
    られたキーデータ区切り記号によりキーデータを抽出
    し、該抽出したキーデータのサイズと、該データのデー
    タファイル中の相対位置のデータを記憶し、該記憶した
    キーデータの相対位置とそのデータサイズのデータをキ
    ーデータファイルに書込むことを特徴とするキーデータ
    ファイル生成方法。
  13. 【請求項13】 ワードプロセッサやCADなどで作成
    されたドキュメントのデータファイルを保持するデータ
    ファイル記憶装置から目的とするデータファイルを抽出
    するドキュメントデータ検索方法であって、 請求項8記載のキーデータファイル生成装置によって、
    データファイル記憶装置にデータファイル中の検索キー
    となるキーデータの抽出に必要な情報を保持するキーデ
    ータファイルを作成し、請求項1記載のドキュメントデ
    ータ検索装置によって、前記データファイル記憶装置か
    ら目的とするデータファイルを抽出することを特徴とす
    るドキュメントデータ検索方法。
JP9328915A 1997-11-28 1997-11-28 ドキュメントデータ検索方法および装置、並びにドキュメント編集装置 Pending JPH11161666A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9328915A JPH11161666A (ja) 1997-11-28 1997-11-28 ドキュメントデータ検索方法および装置、並びにドキュメント編集装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9328915A JPH11161666A (ja) 1997-11-28 1997-11-28 ドキュメントデータ検索方法および装置、並びにドキュメント編集装置

Publications (1)

Publication Number Publication Date
JPH11161666A true JPH11161666A (ja) 1999-06-18

Family

ID=18215524

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9328915A Pending JPH11161666A (ja) 1997-11-28 1997-11-28 ドキュメントデータ検索方法および装置、並びにドキュメント編集装置

Country Status (1)

Country Link
JP (1) JPH11161666A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040002157A (ko) * 2002-06-29 2004-01-07 인벤텍 코오포레이션 역동적 데이터베이스 조정 기능을 구비한 입력 시스템 및방법
JP2012069071A (ja) * 2010-09-27 2012-04-05 Casio Comput Co Ltd Nグラム検索のための転置インデックスの生成方法および生成装置、当該転置インデックスを用いた検索方法および検索装置、ならびに、コンピュータプログラム
JP2012073718A (ja) * 2010-09-28 2012-04-12 Casio Comput Co Ltd Nグラム検索のための転置インデックスの生成方法および生成装置、当該転置インデックスを用いた検索方法および検索装置、ならびに、コンピュータプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040002157A (ko) * 2002-06-29 2004-01-07 인벤텍 코오포레이션 역동적 데이터베이스 조정 기능을 구비한 입력 시스템 및방법
JP2012069071A (ja) * 2010-09-27 2012-04-05 Casio Comput Co Ltd Nグラム検索のための転置インデックスの生成方法および生成装置、当該転置インデックスを用いた検索方法および検索装置、ならびに、コンピュータプログラム
JP2012073718A (ja) * 2010-09-28 2012-04-12 Casio Comput Co Ltd Nグラム検索のための転置インデックスの生成方法および生成装置、当該転置インデックスを用いた検索方法および検索装置、ならびに、コンピュータプログラム

Similar Documents

Publication Publication Date Title
US20050005239A1 (en) System and method for automatic insertion of cross references in a document
WO1998018090A1 (en) Method and apparatus for data processing with ambiguous data structures
JP4160548B2 (ja) 文書要約作成システム、方法、及びプログラム
JP3828379B2 (ja) テスト仕様生成支援装置、方法、プログラム及び記録媒体
JPH08147320A (ja) 情報検索方法及びシステム
JP2693914B2 (ja) 検索システム
JPH11161666A (ja) ドキュメントデータ検索方法および装置、並びにドキュメント編集装置
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JPH06309365A (ja) 文書処理装置
JPH0877196A (ja) 文書情報抽出装置
JPH05158984A (ja) 文字列抽出装置
JPH1115826A (ja) 文書解析装置及び方法
JP3239845B2 (ja) 全文検索装置および方法
JPH07239861A (ja) 文書検索装置
JPH09146968A (ja) 文書検索方法
JP3237709B2 (ja) 文書処理装置及び文書処理方法
JPH09223111A (ja) データ処理装置のコマンド実行方法
JPH07319890A (ja) 文書登録検索システム
JPH09293085A (ja) 設計支援装置
JPH05298368A (ja) 電子ファイリングシステムの検索語入力方法
JP2838972B2 (ja) 自動索引作成装置
JPH07281879A (ja) アプリケーションプログラム編集装置
JP2967995B2 (ja) 文書処理装置および文書処理方法
JPH0667870A (ja) ソフトウエア分析装置
JPS62282364A (ja) 文字列検索方式