JPH04340163A - Keyword retrieval system - Google Patents

Keyword retrieval system

Info

Publication number
JPH04340163A
JPH04340163A JP3008718A JP871891A JPH04340163A JP H04340163 A JPH04340163 A JP H04340163A JP 3008718 A JP3008718 A JP 3008718A JP 871891 A JP871891 A JP 871891A JP H04340163 A JPH04340163 A JP H04340163A
Authority
JP
Japan
Prior art keywords
keyword
data records
data
storage means
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3008718A
Other languages
Japanese (ja)
Other versions
JPH081642B2 (en
Inventor
Osamu Kitaoka
北岡 理
Noboru Shigematsu
重松 昇
Hideyuki Shimakata
島方 英行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP3008718A priority Critical patent/JPH081642B2/en
Publication of JPH04340163A publication Critical patent/JPH04340163A/en
Publication of JPH081642B2 publication Critical patent/JPH081642B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To automatically add unregistered keyword information in accordance with a user's access. CONSTITUTION:This keyword retrieval system is provided with the 1st storage means 11 for storing keyword information and a keyword retrieval means 13 for retrieving the means 11 by an inputted keyword and extracting a corresponding data record is characteristically provided with the 2nd storage means 15 for storing the number of data records having an inputted keyword in each input keyword and a keyword information processing part 17 for comparing the number of data records corresponding to each keyword with a prescribed value, retrieved character strings in all data records in the keyword retrieval system about the keyword having the number of data records less than the prescribed value and additionally storing the management information of data records having the keyword in the 1st storage means 11 correspondingly to the keyword.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は、文字情報を含むデータ
ファイルをキーワードで検索するキーワード検索方式に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a keyword search method for searching data files containing character information using keywords.

【0002】0002

【従来の技術】図4は、キーワード検索システムの構成
例を示すブロック図である。図において、キーワード検
索システムは、主処理装置41に、入力装置42、出力
装置43および記憶装置44が接続される構成である。 記憶装置44には、データファイル,キーワードファイ
ルその他が記憶され、主処理装置41のもとで各ファイ
ルに対して所定のデータ登録処理およびキーワード登録
処理が実行され、さらにそれらを用いたキーワード検索
処理が行われる。
2. Description of the Related Art FIG. 4 is a block diagram showing an example of the configuration of a keyword search system. In the figure, the keyword search system has a configuration in which an input device 42, an output device 43, and a storage device 44 are connected to a main processing device 41. The storage device 44 stores data files, keyword files, and the like, and the main processing device 41 executes predetermined data registration processing and keyword registration processing for each file, as well as keyword search processing using them. will be held.

【0003】データ登録処理は、図5に示すように、入
力装置42から入力されるデータレコードを記憶装置4
4のデータファイルに登録するものであり、表1に示す
形式のデータファイルが形成される。   また、キーワード登録処理は、図6に示すように、
入力装置42から入力されるキーワードとそのキーワー
ドに関するデータレコードの管理番号(本明細書ではそ
れらを含めてキーワード情報という。)を記憶装置44
のキーワードファイルに登録するものであり、表2に示
す形式のキーワードファイルが形成される。
[0003] In the data registration process, as shown in FIG.
4, and a data file in the format shown in Table 1 is created. In addition, the keyword registration process is as shown in FIG.
Keywords input from the input device 42 and management numbers of data records related to the keywords (hereinafter referred to as keyword information) are stored in the storage device 44.
The keyword file of the format shown in Table 2 is created.

【0004】 以下、図7を参照して従来のキーワード検索処理手順に
ついて説明する。
[0004]Hereinafter, a conventional keyword search processing procedure will be described with reference to FIG.

【0005】データファイルをキーワードで検索する場
合には、入力装置42からキーワードを入力し、まずキ
ーワードファイル(表2)からキーワードについての検
索を行う。ここで、キーワードに該当するデータがあれ
ばそのデータレコードの管理番号に基づいて、該当する
すべてのデータレコードをデータファイルから読み込み
、出力装置43にそのデータレコードを出力する。たと
えば、キーワードとして「インタフェース」が入力され
た場合には、キーワードファイル(表2)から該当デー
タレコードの管理番号が「001」であるので、データ
ファイル(表1)から対応する「マンマシンインタフェ
ースについての・・・」が読み込まれ、出力される。
[0005] When searching a data file using a keyword, the keyword is inputted from the input device 42, and the keyword file (Table 2) is first searched for the keyword. Here, if there is data corresponding to the keyword, all the corresponding data records are read from the data file based on the management number of the data record, and the data records are output to the output device 43. For example, if "interface" is entered as a keyword, the management number of the corresponding data record from the keyword file (Table 2) is "001", so the corresponding "About man-machine interface" is entered from the data file (Table 1). '...' is read and output.

【0006】[0006]

【発明が解決しようとする課題】このように従来のキー
ワード検索方式では、キーワードファイルに登録されて
いるキーワード情報(キーワードおよび対応するデータ
レコードの管理番号)についてのみ、図7に示すフロー
チャートに従ってデータ抽出が可能であった。すなわち
、キーワードでの検索はそのキーワードおよび管理番号
がキーワードファイルに登録されていることが前提であ
り、仮に未登録であればそのキーワードを有するデータ
レコードがシステム内に登録されていても、抽出するこ
とはできなかった。また、キーワードの登録者が設定し
たキーワード以外での検索は不可能であった。
[Problems to be Solved by the Invention] As described above, in the conventional keyword search method, data is extracted only for keyword information (keywords and management numbers of corresponding data records) registered in the keyword file according to the flowchart shown in FIG. was possible. In other words, a keyword search requires that the keyword and management number are registered in the keyword file, and if they are not registered, even if a data record with that keyword is registered in the system, it will not be extracted. I couldn't do that. Furthermore, it was impossible to search using keywords other than those set by the keyword registrant.

【0007】本発明は、キーワード検索システムを利用
する一般のユーザのアクセスに応じて、未登録のキーワ
ード情報を自動的に追加することができるキーワード検
索方式を提供することを目的とする。
SUMMARY OF THE INVENTION An object of the present invention is to provide a keyword search method that can automatically add unregistered keyword information in response to access by general users of the keyword search system.

【0008】[0008]

【課題を解決するための手段】図1は、本発明の原理構
成を示すブロック図である。図において、請求項1に記
載の発明は、キーワードと該キーワードを有するデータ
レコードの管理情報とを対応付けたキーワード情報を記
憶する第1の記憶手段11と、入力されたキーワードを
用いて第1の記憶手段11を検索し、対応するデータレ
コードを抽出するキーワード検索手段13とを備えたキ
ーワード検索システムにおいて、キーワード検索手段1
3における検索処理で入力されたキーワードを有するデ
ータレコードの件数を各入力キーワードごとに記憶する
第2の記憶手段15と、第2の記憶手段15に記憶され
た各キーワード対応のデータレコード件数と所定値とを
比較し、該データレコード件数が所定値以下のキーワー
ドについて、キーワード検索システム内のすべてのデー
タレコード中の文字列を検索し、該キーワードを有する
データレコードの管理情報を該キーワードと対応付けて
第1の記憶手段11に追加記憶するキーワード情報処理
手段17とを備えたことを特徴とする。
[Means for Solving the Problems] FIG. 1 is a block diagram showing the basic configuration of the present invention. In the figure, the invention according to claim 1 includes a first storage means 11 for storing keyword information in which a keyword is associated with management information of a data record having the keyword; In a keyword search system comprising a keyword search means 13 for searching a storage means 11 of and extracting a corresponding data record, the keyword search means 1
A second storage means 15 stores the number of data records having the keyword input in the search process in step 3 for each input keyword, and a predetermined number of data records corresponding to each keyword stored in the second storage means 15. Search for character strings in all data records in the keyword search system for keywords for which the number of data records is less than a predetermined value, and associate the management information of data records that have the keyword with the keyword. The keyword information processing means 17 additionally stores keyword information in the first storage means 11.

【0009】請求項2に記載の発明は、請求項1に記載
のキーワード検索方式において、キーワード情報処理手
段17は、第2の記憶手段15に記憶されたキーワード
の記録数を検出し、該記録数が所定値を越えかつ対応す
るデータレコード件数が所定値以下のキーワードについ
て、キーワード情報の追加処理を行う構成であることを
特徴とする。
The invention according to claim 2 is the keyword search method according to claim 1, in which the keyword information processing means 17 detects the number of keyword records stored in the second storage means 15, and The present invention is characterized in that keyword information is added to keywords for which the number exceeds a predetermined value and the number of corresponding data records is less than or equal to a predetermined value.

【0010】0010

【作用】請求項1に記載の発明では、キーワード検索シ
ステムの利用者が検索のために入力したキーワードにつ
いて、このキーワードと該当するデータレコードの件数
とを第2の記憶手段15に別途記憶しておく。キーワー
ド情報処理手段17は、この第2の記憶手段15に記憶
されている各キーワード対応のデータレコード件数が所
定値以下のものについて、改めてキーワード検索システ
ム内のすべてのデータレコードを検索して対応するキー
ワード情報を追加することにより、利用者の検索状況に
応じてキーワード情報の更新を行うことが可能になる。
[Operation] In the invention as set forth in claim 1, for a keyword input by a user of the keyword search system for a search, this keyword and the number of corresponding data records are separately stored in the second storage means 15. put. The keyword information processing means 17 searches all the data records in the keyword search system again for the data records stored in the second storage means 15 for which the number of data records corresponding to each keyword is less than a predetermined value. By adding keyword information, it becomes possible to update the keyword information according to the user's search status.

【0011】なお、データレコード件数が0のものにつ
いては第1の記憶手段11に未登録のキーワードであり
、新たなキーワードの追加についても自動的に対応する
ことができる。請求項2に記載の発明では、第2の記憶
手段15に記憶される各キーワードの記録数をキーワー
ド情報の追加処理の基準に加えることにより、そのキー
ワードに対する利用者のアクセス頻度を加味することが
できる。すなわち、アクセス頻度の低いキーワード(例
えば誤ったキーワード)について不用意にキーワード情
報の追加が行われることがなく、キーワード情報の追加
によるキーワード検索の利用価値の増大と、キーワード
検索のスループット低下のトレードオフを調整すること
ができる。
[0011] Note that keywords for which the number of data records is 0 are unregistered keywords in the first storage means 11, and the addition of new keywords can be automatically handled. In the invention described in claim 2, by adding the number of records of each keyword stored in the second storage means 15 to the criteria for keyword information addition processing, it is possible to take into account the frequency of access by the user to the keyword. can. In other words, keyword information is not added inadvertently for keywords that are accessed infrequently (for example, incorrect keywords), and there is a trade-off between increasing the utility value of keyword searches by adding keyword information and decreasing the throughput of keyword searches. can be adjusted.

【0012】0012

【実施例】図2は、本発明によるキーワード検索処理手
順の一例を示すフローチャートである。図2および図4
において、データファイルをキーワードで検索する場合
には入力装置42からキーワードを入力し、まずキーワ
ードファイル(表2)からキーワードについての検索を
行う。ここで、ログファイル(第2の記憶手段15)に
そのキーワードおよび表2に記憶されている該当するデ
ータレコード件数を登録(ロギング)する。なお、ログ
ファイルの一例について表3に示す。
Embodiment FIG. 2 is a flowchart showing an example of a keyword search processing procedure according to the present invention. Figures 2 and 4
When searching a data file using a keyword, the keyword is input from the input device 42, and the keyword file (Table 2) is first searched for the keyword. Here, the keyword and the number of corresponding data records stored in Table 2 are registered (logged) in the log file (second storage means 15). Note that Table 3 shows an example of the log file.

【0013】   以下同様に、キーワードに該当するデータがあれば
そのデータレコードの管理番号に基づいて、該当するす
べてのデータレコードをデータファイルから読み込み、
出力装置43から出力する。なお、データファイル,キ
ーワードファイルおよびログファイルは記憶装置44に
設けられる。
[0013] Similarly, if there is data corresponding to the keyword, all corresponding data records are read from the data file based on the management number of the data record, and
It is output from the output device 43. Note that the data file, keyword file, and log file are provided in the storage device 44.

【0014】図3は、本発明によるキーワード情報の追
加登録処理手順の一例を示すフローチャートである。図
3および図4において、ログファイルからキーワードお
よび該当するデータレコード件数を読み込み、その件数
が所定値以下となった場合にデータファイルの最初から
検索するようにポインタを先頭に設定する。そこで、デ
ータファイルの最初のデータレコードについて、そのキ
ーワード文字列がそのデータレコード中にあるか否かを
検索し、あればキーワードファイルにそのキーワード情
報(キーワードおよびデータレコードの管理番号)を追
加登録する。以下、データファイルの各データレコード
について順次同様の処理を繰り返す。
FIG. 3 is a flowchart showing an example of the procedure for additionally registering keyword information according to the present invention. In FIGS. 3 and 4, a keyword and the number of corresponding data records are read from the log file, and a pointer is set at the beginning to search from the beginning of the data file when the number of records falls below a predetermined value. Therefore, the first data record of the data file is searched to see if the keyword character string exists in the data record, and if so, the keyword information (keyword and data record management number) is additionally registered in the keyword file. . Thereafter, the same process is repeated for each data record of the data file.

【0015】ここで、最初にログファイルから読み込ん
だキーワードに対して全データレコードについての処理
が終了したとき、あるいはそのキーワードに該当するデ
ータレコード件数が所定値を越えていたときには、ログ
ファイルから次のキーワードを読み込んで同様の処理を
繰り返し、ログファイル内のすべてのキーワードについ
ての処理が終了した時点でログファイルを初期化し、一
連のキーワード情報の追加処理を終了する。
[0015] Here, when all data records have been processed for the keyword read from the log file for the first time, or when the number of data records corresponding to that keyword exceeds a predetermined value, the next one is read from the log file. This keyword is read and the same process is repeated, and when all the keywords in the log file have been processed, the log file is initialized and the series of keyword information addition processes is completed.

【0016】また、ログファイルからキーワードおよび
該当するデータレコード件数を読み込みその件数と所定
値とを比較する処理において、さらにログファイル内に
そのキーワードの記録数を調べ、その記録数が所定値を
越えたものについては利用者のアクセス回数が多かった
ものとして、図3に示すそれ以下のキーワード情報の追
加処理を行うことにより、無駄なキーワードの追加を回
避することができる。
[0016] In addition, in the process of reading a keyword and the number of corresponding data records from the log file and comparing the number with a predetermined value, the number of records of the keyword in the log file is also checked and if the number of records exceeds the predetermined value. It is possible to avoid unnecessary addition of keywords by performing the process of adding keyword information below that shown in FIG. 3, assuming that the keyword has been accessed many times by the user.

【0017】[0017]

【発明の効果】以上説明したように本発明は、キーワー
ド検索システムの利用者の検索状況に応じて、必要なキ
ーワード情報を自動的に追加することができるので、キ
ーワード検索をさらに効率よく実行できるシステムを構
築することができる。
[Effects of the Invention] As explained above, the present invention can automatically add necessary keyword information according to the search status of the user of the keyword search system, so that the keyword search can be executed more efficiently. A system can be constructed.

【図面の簡単な説明】[Brief explanation of drawings]

【図1】本発明の原理構成を示すブロック図である。FIG. 1 is a block diagram showing the principle configuration of the present invention.

【図2】本発明によるキーワード検索処理手順の一例を
示すフローチャートである。
FIG. 2 is a flowchart showing an example of a keyword search processing procedure according to the present invention.

【図3】本発明によるキーワード情報の追加登録処理手
順の一例を示すフローチャートである。
FIG. 3 is a flowchart illustrating an example of a procedure for additionally registering keyword information according to the present invention.

【図4】キーワード検索システムの構成例を示すブロッ
ク図である。
FIG. 4 is a block diagram showing a configuration example of a keyword search system.

【図5】データ登録処理手順を示すフローチャートであ
る。
FIG. 5 is a flowchart showing a data registration processing procedure.

【図6】キーワード情報の登録処理手順を示すフローチ
ャートである。
FIG. 6 is a flowchart showing a procedure for registering keyword information.

【図7】従来のキーワード検索処理手順を示すフローチ
ャートである。
FIG. 7 is a flowchart showing a conventional keyword search processing procedure.

【符号の説明】[Explanation of symbols]

11  第1の記憶手段 13  キーワード検索手段 15  第2の記憶手段 17  キーワード情報処理手段 41  主処理装置 42  入力装置 43  出力装置 44  記憶装置 11 First storage means 13 Keyword search means 15 Second storage means 17 Keyword information processing means 41 Main processing unit 42 Input device 43 Output device 44 Storage device

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】  キーワードと該キーワードを有するデ
ータレコードの管理情報とを対応付けたキーワード情報
を記憶する第1の記憶手段(11)と、入力されたキー
ワードを用いて前記第1の記憶手段(11)を検索し、
対応するデータレコードを抽出するキーワード検索手段
(13)とを備えたキーワード検索システムにおいて、
前記キーワード検索手段(13)における検索処理で入
力されたキーワードを有するデータレコードの件数を各
入力キーワードごとに記憶する第2の記憶手段(15)
と、前記第2の記憶手段(15)に記憶された各キーワ
ード対応のデータレコード件数と所定値とを比較し、該
データレコード件数が所定値以下のキーワードについて
、キーワード検索システム内のすべてのデータレコード
中の文字列を検索し、該キーワードを有するデータレコ
ードの管理情報を該キーワードと対応付けて前記第1の
記憶手段(11)に追加記憶するキーワード情報処理手
段(17)とを備えたことを特徴とするキーワード検索
方式。
1. A first storage means (11) for storing keyword information in which a keyword is associated with management information of a data record having the keyword; 11) Search for
In a keyword search system comprising a keyword search means (13) for extracting a corresponding data record,
a second storage means (15) for storing, for each input keyword, the number of data records having the keyword input in the search process in the keyword search means (13);
The number of data records corresponding to each keyword stored in the second storage means (15) is compared with a predetermined value, and for keywords for which the number of data records is less than or equal to the predetermined value, all data in the keyword search system are keyword information processing means (17) for searching a character string in a record and additionally storing management information of a data record having the keyword in association with the keyword in the first storage means (11); A keyword search method featuring:
【請求項2】  請求項1に記載のキーワード検索方式
において、キーワード情報処理手段(17)は、第2の
記憶手段(15)に記憶されたキーワードの記録数を検
出し、該記録数が所定値を越えかつ対応するデータレコ
ード件数が所定値以下のキーワードについて、キーワー
ド情報の追加処理を行う構成であることを特徴とするキ
ーワード検索方式。
2. In the keyword search method according to claim 1, the keyword information processing means (17) detects the number of records of the keyword stored in the second storage means (15), and when the number of records is a predetermined number. 1. A keyword search method, characterized in that keyword information is added to keywords for which the number of data records exceeds a predetermined value and the number of corresponding data records is less than or equal to a predetermined value.
JP3008718A 1991-01-28 1991-01-28 Keyword search method Expired - Lifetime JPH081642B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3008718A JPH081642B2 (en) 1991-01-28 1991-01-28 Keyword search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3008718A JPH081642B2 (en) 1991-01-28 1991-01-28 Keyword search method

Publications (2)

Publication Number Publication Date
JPH04340163A true JPH04340163A (en) 1992-11-26
JPH081642B2 JPH081642B2 (en) 1996-01-10

Family

ID=11700726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3008718A Expired - Lifetime JPH081642B2 (en) 1991-01-28 1991-01-28 Keyword search method

Country Status (1)

Country Link
JP (1) JPH081642B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06325102A (en) * 1993-05-17 1994-11-25 Nec Corp Data base retrieval system
JPH08249355A (en) * 1995-03-15 1996-09-27 Fujitsu Ltd Method and device for file management and computer system
JPH09237281A (en) * 1996-03-01 1997-09-09 Omron Corp Text data retrieving device and its method
JPH103481A (en) * 1996-06-18 1998-01-06 Fuji Xerox Co Ltd Document retrieval device
JP2002140330A (en) * 2001-09-12 2002-05-17 Matsushita Electric Ind Co Ltd Document retrieval system
JP2005251206A (en) * 2004-03-03 2005-09-15 Microsoft Corp Word collection method and system for use in word segmentation

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06325102A (en) * 1993-05-17 1994-11-25 Nec Corp Data base retrieval system
JPH08249355A (en) * 1995-03-15 1996-09-27 Fujitsu Ltd Method and device for file management and computer system
JPH09237281A (en) * 1996-03-01 1997-09-09 Omron Corp Text data retrieving device and its method
JPH103481A (en) * 1996-06-18 1998-01-06 Fuji Xerox Co Ltd Document retrieval device
JP2002140330A (en) * 2001-09-12 2002-05-17 Matsushita Electric Ind Co Ltd Document retrieval system
JP2005251206A (en) * 2004-03-03 2005-09-15 Microsoft Corp Word collection method and system for use in word segmentation

Also Published As

Publication number Publication date
JPH081642B2 (en) 1996-01-10

Similar Documents

Publication Publication Date Title
US6266660B1 (en) Secondary index search
US6343286B1 (en) Efficient technique to defer large object access with intermediate results
CN111400323A (en) Data retrieval method, system, device and storage medium
JPH04340163A (en) Keyword retrieval system
US7039646B2 (en) Method and system for compressing varying-length columns during index high key generation
JPH09198396A (en) Document retrieval device
JPH09305622A (en) Method and system for managing data base having document retrieval function
JP2535629B2 (en) Input string normalization method of search system
JPH05250416A (en) Registering and retrieving device for data base
JP2001147923A (en) Device and method for retrieving similar document and recording medium
KR20000041817A (en) Method for partly retrieving characters column using pattern tables composing syllable patterns
JPH06139280A (en) File management system
JPH05204978A (en) Information retrieving device
KR100741283B1 (en) Apparatus and method for searching pattern matching information in information searching system
JP2002117043A (en) Device and method for document retrieval, and recording medium with recorded program for implementing the same method
JPH08305710A (en) Method for extracting key word of document and document retrieving device
JPH0225974A (en) Retrieving system for updating of data base
JPH02153474A (en) Unnecessary word dictionary generating device
JP3508842B2 (en) Database search system and recording medium storing database search program
JPH04205173A (en) Information retrieval system
JPH05165891A (en) Data registration/retrieval system of data base
JPH06161995A (en) Method and device for shaping name data
JPH04230576A (en) Method for retrieving record
JPH04195588A (en) Back coincidence retrieving processing system for data base
JPH05225016A (en) Computer use support system