JP2011044086A - Retrieval device, retrieval method, and program - Google Patents

Retrieval device, retrieval method, and program Download PDF

Info

Publication number
JP2011044086A
JP2011044086A JP2009193234A JP2009193234A JP2011044086A JP 2011044086 A JP2011044086 A JP 2011044086A JP 2009193234 A JP2009193234 A JP 2009193234A JP 2009193234 A JP2009193234 A JP 2009193234A JP 2011044086 A JP2011044086 A JP 2011044086A
Authority
JP
Japan
Prior art keywords
keyword
search
target file
time
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009193234A
Other languages
Japanese (ja)
Inventor
Akiichiro Toyoda
秋一郎 豊田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009193234A priority Critical patent/JP2011044086A/en
Publication of JP2011044086A publication Critical patent/JP2011044086A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a retrieval device for allowing a user to find a target file through the use of one's own memory regarding a period of accessing the file, and to provide a retrieval method and a program. <P>SOLUTION: The retrieval device 1 includes a history collecting section 2 for collecting an access time, when the user performs access to the object file and the storage place as an access history; a keyword extracting section 3 for obtaining the appearance frequency of a keyword extracted from the object file in the object file, and generating keyword data which includes the keyword and the appearance frequency and where the keyword and the frequency are associated with the object file of an extraction source; an index generating section 4 for adding a weight, whose value is changed in response to the access time of the object file and the appearance frequency of the keyword, to the keyword through the use of the access history and the keyword data, and generating index data including the keyword and the weight; and a retrieval performing section 5 for performing retrieval and reflecting the content of the index data on the retrieval result. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、電子ファイルのアクセス履歴に基づいてその検索を実行する、検索装置、検索方法、及びプログラムに関する。   The present invention relates to a search device, a search method, and a program for executing a search based on an access history of an electronic file.

近年、コンピュータ技術の発展により、コンピュータシステムにおいては、大量の電子ファイル(以下、単に「ファイル」とする)の作成、更新、及び使用が行われている。そして、このような状況においては、大量のファイルの中から利用者が目的とするファイルを効率良く見つけ出すことができるようにするため、検索技術が重要となっている。   In recent years, with the development of computer technology, a large number of electronic files (hereinafter simply referred to as “files”) are created, updated, and used in computer systems. In such a situation, search technology is important in order to enable a user to efficiently find a target file from a large number of files.

従来からの検索技術では、利用者が検索条件となるキーワード(検索キーワード)を入力すると、検索キーワードと一致するキーワードを含むファイルが特定され、特定されたファイルの格納場所が検索結果として表示される。利用者は、検索結果の中から、求めるファイルを見つけ出すこととなる。   In the conventional search technology, when a user inputs a keyword (search keyword) as a search condition, a file including a keyword that matches the search keyword is specified, and the storage location of the specified file is displayed as a search result. . The user finds the desired file from the search results.

また、従来から、利用者が、目的のファイルを効率良く検索できるようにするため、種々の技術が提案されている。例えば、利用者が以前にアクセスしたファイルの名称と格納場所とを記録したアクセス履歴を作成する技術が知られている。この技術によれば、利用者は、アクセス履歴に基づいて検索条件を設定できる。この結果、検索結果の精度が高まり、利用者は、目的のファイルを効率良く見つけ出すことができると考えられる。   Conventionally, various techniques have been proposed to enable a user to efficiently search for a target file. For example, a technique for creating an access history in which the name and storage location of a file previously accessed by a user is recorded is known. According to this technique, the user can set search conditions based on the access history. As a result, the accuracy of the search result is improved, and it is considered that the user can efficiently find the target file.

但し、上記の技術には、利用者がファイルの名称と格納場所とを知らない場合に対処できないという問題がある。また、ファイルの格納場所が特定できない場合は、記憶装置の記憶領域全てを検索対象として検索を行えば良いが、このような検索では、長時間がかかってしまう。   However, the above technique has a problem that it cannot cope with the case where the user does not know the name and storage location of the file. If the storage location of the file cannot be specified, a search may be performed using the entire storage area of the storage device as a search target. However, such a search takes a long time.

このような問題に対処するため、特許文献1は、収集したアクセス履歴からキーワードを抽出し、更に、抽出したキーワードに、設定されたルールに基づいて重みを付加し、キーワードと重みとが登録されたインデックスデータを作成する技術を開示している。設定されたルールとしては、キーワードを含む電子ファイルのアクセス回数が一定値以上である場合に重みを増加させるといったルールや、アクセス回数が2以上の電子ファイルのキーワードについては重みを増加させるといったルール等が挙げられる。   In order to cope with such a problem, Patent Literature 1 extracts keywords from the collected access history, adds a weight to the extracted keywords based on a set rule, and registers the keywords and weights. Discloses a technique for creating index data. As a set rule, a rule such as increasing the weight when the number of accesses of an electronic file including a keyword is a certain value or more, a rule such as increasing the weight for a keyword of an electronic file with an access count of 2 or more, etc. Is mentioned.

よって、特許文献1に開示の技術を用いた場合は、利用者は、インデックスデータから、重要なキーワードを特定でき、これを用いて検索を行うことができる。この結果、利用者は、ファイルの格納場所を知らない場合であっても、簡単に目的のファイルを見つけることができると考えられる。   Therefore, when the technique disclosed in Patent Document 1 is used, the user can specify an important keyword from the index data, and can perform a search using the keyword. As a result, it is considered that the user can easily find the target file even when the user does not know the storage location of the file.

また、特許文献2も、アクセス履歴から抽出された複数のキーワードに対して重みを付加する技術を開示している。特許文献2に開示の技術において、重みの付加は、電子ファイルの利用の態様(閲覧、送信、更新等)、キーワードの頻度等に応じて行われる。そして、重みに基づいて、複数のキーワードの中から、優先順位の高い(重みの高い)特定のキーワードが抽出される。   Patent Document 2 also discloses a technique for adding weights to a plurality of keywords extracted from an access history. In the technique disclosed in Patent Document 2, weighting is performed according to the usage mode (viewing, transmission, updating, etc.) of electronic files, the frequency of keywords, and the like. Then, based on the weight, a specific keyword having a high priority (high weight) is extracted from the plurality of keywords.

このようにして抽出されたキーワードは、アクセス履歴を特徴付けるキーワードとなる。よって、利用者は、この特定のキーワードからアクセス履歴で特定される過去の処理の内容を認識できるので、この特定のキーワードを用いることで効率的な検索を行うことが
できると考えられる。
The keywords extracted in this way are keywords that characterize the access history. Therefore, the user can recognize the contents of the past processing specified by the access history from the specific keyword, so that it is considered that an efficient search can be performed by using the specific keyword.

特開2005−18530号公報JP 2005-18530 A 特開2006−120126号公報JP 2006-120126 A

ところで、利用者は、利用したファイルの内容だけでなく、そのファイルに以前にアクセスした時期を記憶している場合があり、このような利用者の記憶を生かすことができれば、利用者は更に効率良く求めるファイルを見つけることができると考えられる。しかしながら、特許文献1及び2に開示の技術では、キーワードへの重みの付加は、利用者が電子ファイルを利用した時期を考慮することは無く行われている。このため、特許文献1及び2に開示の技術では、利用者のアクセス時期に関する記憶を活用できず、検索効率の向上には限度がある。   By the way, the user may remember not only the contents of the file used but also the time when the file was previously accessed. If the user's memory can be utilized, the user will be more efficient. It seems that you can find the file you want most often. However, in the techniques disclosed in Patent Documents 1 and 2, the weight is added to the keyword without considering the time when the user uses the electronic file. For this reason, the techniques disclosed in Patent Documents 1 and 2 cannot utilize the memory related to the access time of the user, and there is a limit to improving the search efficiency.

なお、従来からの技術として、ファイルの更新日時をキーとして検索を行う技術がある。しかしながら、この技術を特許文献1及び2に開示の技術に組み合わせただけでは、利用者が最終的にファイルを選択する際に考慮する情報が単に増えるだけにすぎず、却って利用者を混乱させる可能性がある。   As a conventional technique, there is a technique for performing a search using a file update date as a key. However, simply combining this technique with the techniques disclosed in Patent Documents 1 and 2 merely increases information to be considered when the user finally selects a file, and may confuse the user. There is sex.

本発明の目的は、上記問題を解消し、利用者が自身のファイルへのアクセス時期についての記憶を利用して目的のファイルを見つけることができるようにし得る、検索装置、検索方法、及びプログラムを提供することにある。   An object of the present invention is to provide a search device, a search method, and a program capable of solving the above-described problems and enabling a user to find a target file by using a memory about access time of the user's own file. It is to provide.

上記目的を達成するため、本発明における検索装置は、検索要求が行われた場合にその検索条件に応じて検索を実行する検索装置であって、
利用者から対象ファイルにアクセスが行われた時刻及び前記対象ファイルの格納場所をアクセス履歴として収集する履歴収集部と、
前記アクセスが行われた前記対象ファイルからキーワードを抽出し、抽出した前記キーワードの前記対象ファイルにおける出現頻度を求め、そして、抽出した前記キーワード及びその前記出現頻度を含み、且つ、これらが抽出元の前記対象ファイルに紐付けられている、キーワードデータを作成するキーワード抽出部と、
前記アクセス履歴と前記キーワードデータとを用いて、前記キーワードに対して、当該キーワードを含む前記対象ファイルの前記時刻及び当該キーワードの前記出現頻度によって値が変動する重みを付加し、前記キーワード及びそれに付加した前記重みを含むインデックスデータを作成するインデックス作成部と、
前記検索条件に応じた検索を実行し、検索結果に、前記インデックスデータの内容を反映させる検索実行部と、を備えていることを特徴とする。
In order to achieve the above object, a search device according to the present invention is a search device that executes a search according to a search condition when a search request is made,
A history collection unit that collects, as an access history, the time when the target file was accessed from the user and the storage location of the target file;
A keyword is extracted from the accessed target file, an appearance frequency of the extracted keyword in the target file is obtained, and the extracted keyword and its appearance frequency are included, and these are extracted from A keyword extraction unit that creates keyword data associated with the target file;
Using the access history and the keyword data, a weight whose value varies depending on the time of the target file including the keyword and the appearance frequency of the keyword is added to the keyword, and the keyword and the keyword are added thereto. An index creation unit for creating index data including the weights;
A search execution unit that executes a search according to the search condition and reflects the contents of the index data in a search result.

また、上記目的を達成するため、本発明における検索方法は、検索要求が行われた場合にその検索条件に応じて検索を実行するための検索方法であって、
(a)利用者から対象ファイルにアクセスが行われた時刻及び前記対象ファイルの格納場所をアクセス履歴として収集するステップと、
(b)前記アクセスが行われた前記対象ファイルからキーワードを抽出し、抽出した前記キーワードの前記対象ファイルにおける出現頻度を求め、そして、抽出した前記キーワード及びその前記出現頻度を含み、且つ、これらが抽出元の前記対象ファイルに紐付けられている、キーワードデータを作成するステップと、
(c)前記アクセス履歴と前記キーワードデータとを用いて、前記キーワードに対して、当該キーワードを含む前記対象ファイルの前記時刻及び当該キーワードの前記出現頻度によって値が変動する重みを付加し、前記キーワード及びそれに付加した前記重みを含むインデックスデータを作成するステップと、
(d)前記検索条件に応じた検索を実行し、検索結果に、前記インデックスデータの内容を反映させるステップと、を有することを特徴とする。
In order to achieve the above object, a search method in the present invention is a search method for executing a search according to a search condition when a search request is made,
(A) collecting the time when the target file was accessed by the user and the storage location of the target file as an access history;
(B) extracting a keyword from the target file to which the access has been performed, obtaining an appearance frequency of the extracted keyword in the target file, and including the extracted keyword and the appearance frequency thereof, and Creating keyword data associated with the target file of the extraction source;
(C) Using the access history and the keyword data, a weight whose value varies depending on the time of the target file including the keyword and the appearance frequency of the keyword is added to the keyword, and the keyword And creating index data including the weight added thereto,
(D) performing a search according to the search condition, and reflecting the contents of the index data in the search result.

更に、上記目的を達成するため、本発明におけるプログラムは、検索要求が行われた場合に、その検索条件に応じた検索を、コンピュータによって実行するためのプログラムであって、
前記コンピュータに、
(a)利用者から対象ファイルにアクセスが行われた時刻及び前記対象ファイルの格納場所をアクセス履歴として収集するステップと、
(b)前記アクセスが行われた前記対象ファイルからキーワードを抽出し、抽出した前記キーワードの前記対象ファイルにおける出現頻度を求め、そして、抽出した前記キーワード及びその前記出現頻度を含み、且つ、これらが抽出元の前記対象ファイルに紐付けられている、キーワードデータを作成するステップと、
(c)前記アクセス履歴と前記キーワードデータとを用いて、前記キーワードに対して、当該キーワードを含む前記対象ファイルの前記時刻及び当該キーワードの前記出現頻度によって値が変動する重みを付加し、前記キーワード及びそれに付加した前記重みを含むインデックスデータを作成するステップと、
(d)前記検索条件に応じた検索を実行し、検索結果に、前記インデックスデータの内容を反映させるステップとを実行させる、ことを特徴とする。
Furthermore, in order to achieve the above object, the program according to the present invention is a program for executing a search according to a search condition by a computer when a search request is made,
In the computer,
(A) collecting the time when the target file was accessed by the user and the storage location of the target file as an access history;
(B) extracting a keyword from the target file to which the access has been performed, obtaining an appearance frequency of the extracted keyword in the target file, and including the extracted keyword and the appearance frequency thereof, and Creating keyword data associated with the target file of the extraction source;
(C) Using the access history and the keyword data, a weight whose value varies depending on the time of the target file including the keyword and the appearance frequency of the keyword is added to the keyword. And creating index data including the weight added thereto,
(D) A search according to the search condition is executed, and a step of reflecting the contents of the index data in the search result is executed.

以上の特徴により、本発明における検索装置、検索方法、及びプログラムによれば、利用者は、自身のファイルへのアクセス時期についての記憶を利用して目的のファイルを見つけることができる。   With the above features, according to the search device, search method, and program of the present invention, the user can find the target file by using the storage about the access time of the user's own file.

図1は、本発明の実施の形態における検索装置の構成を示すブロック図である。FIG. 1 is a block diagram showing a configuration of a search device according to an embodiment of the present invention. 図2は、本発明の実施の形態で作成される履歴データの一例を示す図である。FIG. 2 is a diagram showing an example of history data created in the embodiment of the present invention. 図3は、本発明の実施の形態で作成されるキーワードデータの一例を示す図である。FIG. 3 is a diagram showing an example of keyword data created in the embodiment of the present invention. 図4は、本発明の実施の形態で作成されるインデックスデータの一例を示す図である。FIG. 4 is a diagram showing an example of index data created in the embodiment of the present invention. 図5は、本発明の実施の形態における検索装置の動作を示すフロー図である。FIG. 5 is a flowchart showing the operation of the search device according to the embodiment of the present invention. 図6は、本発明の実施の形態における検索装置で行われる処理を示すシーケンス図である。FIG. 6 is a sequence diagram showing processing performed by the search device according to the embodiment of the present invention. 図7は、本発明の実施の形態における検索装置の他の例の構成を示すブロック図である。FIG. 7 is a block diagram showing a configuration of another example of the search device according to the embodiment of the present invention. 図8は、本発明の実施の形態における検索装置の他の例の構成を示すブロック図である。FIG. 8 is a block diagram showing a configuration of another example of the search device according to the embodiment of the present invention.

(実施の形態)
以下、本発明の実施の形態における検索装置、検索方法、及びプログラムについて、図1〜図6を参照しながら説明する。最初に、本実施の形態における検索装置の構成について図1を用いて説明する。図1は、本発明の実施の形態における検索装置の構成を示すブ
ロック図である。
(Embodiment)
Hereinafter, a search device, a search method, and a program according to an embodiment of the present invention will be described with reference to FIGS. First, the configuration of the search device in this embodiment will be described with reference to FIG. FIG. 1 is a block diagram showing a configuration of a search device according to an embodiment of the present invention.

図1に示す本実施の形態における検索装置1は、検索要求が行われた場合にその検索条件に応じて検索を実行する装置である。本実施の形態では、検索装置1は、検索条件となっているキーワードを含むファイルとその格納場所とを特定し、これらを検索結果として出力する。   The search device 1 in the present embodiment shown in FIG. 1 is a device that executes a search according to a search condition when a search request is made. In the present embodiment, the search device 1 specifies a file including a keyword that is a search condition and its storage location, and outputs these as search results.

また、本実施の形態では、検索装置1は、後述するようにコンピュータ20にインストールされた本実施の形態におけるプログラムによって実現されている。更に、このプログラムは、コンピュータ20のオペレーティングシステム(OS)10上で動作する。よって、本実施の形態においては、検索装置1への検索要求は、OS10を介して行われる。   Further, in the present embodiment, the search device 1 is realized by a program in the present embodiment installed in the computer 20 as will be described later. Further, this program runs on the operating system (OS) 10 of the computer 20. Therefore, in the present embodiment, a search request to the search device 1 is made via the OS 10.

図1に示すように、検索装置1は、履歴収集部2と、キーワード抽出部3と、インデックス作成部4と、検索実行部5とを備えている。履歴収集部2は、利用者から対象ファイルにアクセスが行われた時刻(アクセス時刻)及び対象ファイルの格納場所をアクセス履歴として収集する。   As shown in FIG. 1, the search device 1 includes a history collection unit 2, a keyword extraction unit 3, an index creation unit 4, and a search execution unit 5. The history collection unit 2 collects, as an access history, the time (access time) when the target file was accessed by the user and the storage location of the target file.

キーワード抽出部3は、アクセスが行われた対象ファイルからキーワードを抽出し、抽出したキーワードの対象ファイルにおける出現頻度を求め、そして、抽出したキーワード及びその出現頻度を含むキーワードデータ8を作成する。また、キーワードデータ8において、抽出されたキーワード及びその出現頻度は、抽出元の対象ファイルに紐付けられている。   The keyword extraction unit 3 extracts a keyword from the accessed target file, obtains the appearance frequency of the extracted keyword in the target file, and creates keyword data 8 including the extracted keyword and its appearance frequency. Further, in the keyword data 8, the extracted keywords and their appearance frequencies are linked to the extraction target file.

また、インデックス作成部4は、アクセス履歴とキーワードデータ8とを用いて、キーワードに対して重みを付加する。このとき付加される重みは、各キーワードを含む対象ファイルのアクセス時刻と、各キーワードの出現頻度とによって値が変動するパラメータである。そして、インデックス作成部4は、キーワードと、それに付加した重みとを含むインデックスデータ9を作成する。   Further, the index creation unit 4 adds weights to the keywords using the access history and the keyword data 8. The weight added at this time is a parameter whose value varies depending on the access time of the target file including each keyword and the appearance frequency of each keyword. Then, the index creation unit 4 creates index data 9 including the keyword and the weight added thereto.

検索実行部5は、検索要求における検索条件に応じた検索を実行する。そして、検索実行部5は、得られた検索結果に、インデックス作成部4によって作成されたインデックスデータの内容を反映させる。   The search execution unit 5 executes a search according to the search condition in the search request. Then, the search execution unit 5 reflects the contents of the index data created by the index creation unit 4 in the obtained search results.

このような構成により、検索条件に含まれるキーワード(検索キーワード)が、インデックスデータに含まれるキーワードと一致した場合、検索結果には、検索キーワードに対応する重みが含まれる。この重みは、検索キーワードと同一のキーワードが、どの程度の過去において、どのような頻度で出現していたかを表しており、利用者は重みから自己のファイルへのアクセスについての記憶を呼び出すことができる。   With such a configuration, when a keyword (search keyword) included in the search condition matches a keyword included in the index data, the search result includes a weight corresponding to the search keyword. This weight indicates how often the same keyword as the search keyword has appeared in the past, and the user can call the memory about access to his file from the weight. it can.

つまり、利用者は、この重みをキーとすることで、自身のアクセス時期についての記憶を利用して、目的のファイルを特定することができる。検索装置1によれば、利用者は、自身の記憶を利用して効率の良い検索を行うことができる。   In other words, the user can specify the target file by using the memory about his / her access time by using this weight as a key. According to the search device 1, a user can perform an efficient search using his / her memory.

ここで、本実施の形態における検索装置1の構成を図2〜図4を用いて更に具体的に説明する。図2は、本発明の実施の形態で作成される履歴データの一例を示す図である。図3は、本発明の実施の形態で作成されるキーワードデータの一例を示す図である。図4は、本発明の実施の形態で作成されるインデックスデータの一例を示す図である。   Here, the configuration of the search device 1 according to the present embodiment will be described more specifically with reference to FIGS. FIG. 2 is a diagram showing an example of history data created in the embodiment of the present invention. FIG. 3 is a diagram showing an example of keyword data created in the embodiment of the present invention. FIG. 4 is a diagram showing an example of index data created in the embodiment of the present invention.

図1に示すように、本実施の形態では、利用者は、コンピュータシステム20を介して、外部リソース30に格納されている各種ファイルにアクセスを行う。具体的には、利用
者は、キーボードやマウスといった各種入力機器を用いて、OS10が提供するグラフィカルユーザインタフェース(GUI)を介して、アクセス要求を行う。
As shown in FIG. 1, in the present embodiment, a user accesses various files stored in an external resource 30 via a computer system 20. Specifically, the user makes an access request via a graphical user interface (GUI) provided by the OS 10 using various input devices such as a keyboard and a mouse.

アクセス要求が行われると、OS10では、それを受け取り、アクセス要求を特定する情報(アクセス要求情報)をイベント記憶部11に格納する。イベント記憶部11は、OS10によって構築されており、OS10でイベントが発生すると、それに伴う情報をイベントの発生順に格納する。本実施の形態では、イベント記憶部11は、データ構造としてキューを採用している。   When an access request is made, the OS 10 receives it and stores information (access request information) specifying the access request in the event storage unit 11. The event storage unit 11 is constructed by the OS 10, and when an event occurs in the OS 10, information associated therewith is stored in the order in which the events occur. In the present embodiment, the event storage unit 11 employs a queue as a data structure.

また、イベント記憶部11にアクセス要求情報が格納されると、アクセス処理部12は、アクセス要求に従って、外部リソース30が蓄積するファイルにアクセスする。そして、アクセス処理部12は、コンピュータシステム20に接続された表示装置等にアクセス結果を表示させる。なお、外部リソース30としては、ドキュメントファイルや画像ファイル等の各種ファイルを蓄積しているデータベース、Webサイトを提供するWebサーバ等が挙げられる。   When the access request information is stored in the event storage unit 11, the access processing unit 12 accesses a file stored in the external resource 30 in accordance with the access request. The access processing unit 12 displays the access result on a display device or the like connected to the computer system 20. Examples of the external resource 30 include a database that stores various files such as document files and image files, a Web server that provides a Web site, and the like.

また、本実施の形態において、検索装置1は、記憶部6を備えている。記憶部6は、後述する履歴データ7、キーワードデータ8、インデックスデータ9は、それぞれ作成された後、記憶部6に格納される。   In the present embodiment, the search device 1 includes a storage unit 6. In the storage unit 6, history data 7, keyword data 8, and index data 9, which will be described later, are created and stored in the storage unit 6.

履歴収集部2は、本実施の形態では、OS10にて発生したイベントをフックし、利用者がアクセスした対象ファイルの格納場所及びアクセス時刻を取得する。具体的には、履歴収集部2は、イベント記憶部11から、アクセス要求が行われた時刻と、アクセス要求が対象としているファイルの格納場所とをアクセス履歴として収集する。また、履歴収集部2は、収集した各アクセス履歴に識別番号(履歴ID)を付与して、図2に示す履歴データ7を作成し、履歴データ7を記憶部6に格納させる。   In the present embodiment, the history collection unit 2 hooks an event that has occurred in the OS 10 and acquires the storage location and access time of the target file accessed by the user. Specifically, the history collection unit 2 collects, from the event storage unit 11, the time when the access request is made and the storage location of the file targeted by the access request as the access history. Further, the history collection unit 2 assigns an identification number (history ID) to each collected access history, creates the history data 7 shown in FIG. 2, and stores the history data 7 in the storage unit 6.

具体的には、履歴収集部2は、利用者がアクセスした対象ファイルの格納場所が、履歴データ7に存在していないことを条件に、アクセス履歴に履歴IDを付与し、そして、履歴データ7に新規のレコードを追加する。一方、履歴収集部2は、利用者がアクセスした対象ファイルの格納場所が、既に履歴データ7に存在する場合は、対象のレコードのアクセス時刻の更新のみを行う。また、履歴収集部2は、履歴データのレコードの更新及び追加を行った後は、更新又は追加した履歴IDを特定する情報をキーワード抽出部3に送信する。   Specifically, the history collection unit 2 assigns a history ID to the access history on the condition that the storage location of the target file accessed by the user does not exist in the history data 7, and the history data 7 Add a new record to On the other hand, when the storage location of the target file accessed by the user already exists in the history data 7, the history collection unit 2 only updates the access time of the target record. Further, after updating and adding a record of history data, the history collection unit 2 transmits information specifying the updated or added history ID to the keyword extraction unit 3.

また、履歴収集部2は、収集してから一定期間を過ぎたアクセス履歴のレコードを履歴データ7から削除することができる。具体的には、履歴収集部2は、先ず、利用者から検索要求が行われると、その時点(検索時刻)から設定された時間(設定時間)だけ遡った時点を基準時刻に設定する。   Further, the history collection unit 2 can delete, from the history data 7, an access history record that has passed a certain period after collection. Specifically, when a search request is made from the user, the history collection unit 2 first sets a time point that is set back from the time point (search time) by a set time (set time) as the reference time.

そして、履歴収集部2は、格納されている履歴データの中から、アクセス時刻が基準時刻よりも過去となったアクセス履歴を特定し、該当するレコード(履歴ID、アクセス時刻、格納場所)を削除する。なお、設定時間は、記憶部6の記憶容量や検索要求の頻度等を考慮して適宜設定される。また、「基準時刻」は、削除されないで残置される履歴データの限界を示す値に相当する。   Then, the history collection unit 2 identifies an access history whose access time is past the reference time from the stored history data, and deletes the corresponding record (history ID, access time, storage location). To do. The set time is appropriately set in consideration of the storage capacity of the storage unit 6 and the frequency of search requests. The “reference time” corresponds to a value indicating the limit of history data that is left without being deleted.

更に、履歴収集部2は、アクセス履歴を履歴データから削除した場合は、削除されたアクセス履歴の履歴IDをキーワード抽出部3及びインデックス作成部4にも通知する。この場合、キーワード抽出部3は、通知された履歴IDに対応するキーワードデータを削除し、インデックス作成部4は、通知された履歴IDに対応するインデックスデータを削除
する。
Furthermore, when the access history is deleted from the history data, the history collection unit 2 also notifies the keyword extraction unit 3 and the index creation unit 4 of the history ID of the deleted access history. In this case, the keyword extraction unit 3 deletes the keyword data corresponding to the notified history ID, and the index creation unit 4 deletes the index data corresponding to the notified history ID.

この結果、データサイズが大きくなりやすいインデックスデータ4の拡大が抑制されるので、インデックスデータの拡大による記憶部6の記憶容量の逼迫が抑えられる。よって、記憶部6に求められる記憶容量を少なくすることができる。また、インデックスデータのサイズが一定に抑制されるので、インデックスデータから必要な情報を取り出す際の速度の低下も抑制される。   As a result, since the expansion of the index data 4 that tends to increase in data size is suppressed, the storage capacity of the storage unit 6 due to the expansion of the index data can be suppressed. Therefore, the storage capacity required for the storage unit 6 can be reduced. In addition, since the size of the index data is suppressed to be constant, a decrease in speed when extracting necessary information from the index data is also suppressed.

キーワード抽出部3は、本実施の形態では、履歴収集部2から受け取った履歴IDに基づいて、履歴データ7の中から対象ファイルの格納場所を特定し、特定した格納場所にある対象ファイルにアクセスする。そして、キーワード抽出部3は、対象ファイルの全体(全文)からキーワードを抽出し、更にそのキーワードの出現頻度(出現数)をカウントする。そして、キーワード抽出部3は、抽出したキーワード、出現頻度、履歴IDを用いてキーワードデータ8を作成し、更に、インデックス作成部4に履歴IDを送信する。   In this embodiment, the keyword extraction unit 3 specifies the storage location of the target file from the history data 7 based on the history ID received from the history collection unit 2, and accesses the target file in the specified storage location. To do. Then, the keyword extraction unit 3 extracts keywords from the entire target file (full text), and further counts the appearance frequency (number of appearances) of the keywords. Then, the keyword extraction unit 3 creates keyword data 8 using the extracted keyword, appearance frequency, and history ID, and further transmits the history ID to the index creation unit 4.

また、キーワード抽出部3は、本実施の形態では、図3に示すキーワードデータを作成する。図3に示すように、キーワードデータは、キーワード、履歴ID、及び出現頻度によって構成されている。また、同一の複数のキーワードであっても、履歴IDが異なる場合は、異なるレコードとされる。各キーワード及びその出現頻度は、履歴IDによって抽出元の対象ファイルに紐付けられている。   Moreover, the keyword extraction part 3 produces the keyword data shown in FIG. 3 in this Embodiment. As shown in FIG. 3, the keyword data includes a keyword, a history ID, and an appearance frequency. Moreover, even if it is the same several keyword, when log | history ID differs, it is set as a different record. Each keyword and its appearance frequency are linked to the target file of the extraction source by the history ID.

インデックス作成部4は、本実施の形態では、キーワード抽出部3から受け取った履歴IDに基づいて、履歴データ7からアクセス時刻を取得し、更に、キーワードデータ8から各キーワードの出現頻度を取得し、重みを算出する。そして、インデックス作成部4は、図4に示すインデックスデータ9を作成する。図4に示すように、インデックスデータ9は、キーワード、重み、及び履歴IDによって構成されている。   In the present embodiment, the index creation unit 4 acquires the access time from the history data 7 based on the history ID received from the keyword extraction unit 3, further acquires the appearance frequency of each keyword from the keyword data 8, Calculate the weight. Then, the index creation unit 4 creates the index data 9 shown in FIG. As shown in FIG. 4, the index data 9 is composed of keywords, weights, and history IDs.

なお、上述したように、履歴収集部2が、アクセス履歴を履歴データから削除した場合は、インデックス作成部4は、通知された履歴IDに対応するインデックスデータを削除する。具体的には、削除されたアクセス履歴の履歴IDが対応している、キーワードと重みとが削除される。この削除される重みは、削除されたアクセス履歴を用いて付加されているからである。   As described above, when the history collection unit 2 deletes the access history from the history data, the index creation unit 4 deletes the index data corresponding to the notified history ID. Specifically, the keyword and the weight corresponding to the history ID of the deleted access history are deleted. This is because the weight to be deleted is added using the deleted access history.

また、インデックス作成部4は、各キーワードに対して、当該キーワードを含む対象ファイルのアクセス時刻から検索時刻までの経過時間が少ない程、及び当該キーワードの出現頻度が高い程、値が大きくなる重みを付加するのが良い。具体的には、インデックス作成部4は、下記の式(1)を用いて、重みを作成するのが好ましい。   In addition, the index creation unit 4 gives each keyword a weight that increases as the elapsed time from the access time of the target file including the keyword to the search time decreases, and as the appearance frequency of the keyword increases. It is good to add. Specifically, it is preferable that the index creating unit 4 creates weights using the following formula (1).

下記の式(1)において、「Ta」は、利用者が対象ファイルにアクセスした時刻、即ち、アクセス時刻である。「Ts」は、上述した基準時刻である。また、「F」は、当該対象ファイルから抽出されたキーワードの出現頻度である。更に、「α」は任意の係数であり、αの値を変えることで、重みにおいて、アクセス時刻を重視するのか、又はキーワードの出現頻度を重視するのかを設定することができる。   In the following formula (1), “Ta” is the time when the user accesses the target file, that is, the access time. “Ts” is the reference time described above. “F” is the appearance frequency of the keyword extracted from the target file. Furthermore, “α” is an arbitrary coefficient, and by changing the value of α, it is possible to set whether to place importance on the access time or on the appearance frequency of the keyword in the weight.

(数1)
重み=(Ta−Ts)×α+F ・・・(1)
(Equation 1)
Weight = (Ta−Ts) × α + F (1)

例えば、アクセス時刻が2009年4月1日の10:00、キーワードの出現頻度が2、基準時刻が2009年4月1日の0:00、係数αが1であるとする。この場合、重みは、下記の式(2)より、12となる。   For example, assume that the access time is 10:00 on April 1, 2009, the keyword appearance frequency is 2, the reference time is 0:00 on April 1, 2009, and the coefficient α is 1. In this case, the weight is 12 from the following equation (2).

(数2)
重み=(10:00−0:00)×1+2=10×1+2=12
(Equation 2)
Weight = (10: 00−0: 00) × 1 + 2 = 10 × 1 + 2 = 12

検索実行部5は、本実施の形態では、利用者から検索が要求されると、検索条件に含まれるキーワードに基づいて、先ず、インデックスデータ9を検索する。そして、検索実行部5は、インデックスデータ9の中から、検索条件に含まれるキーワードと一致するキーワードの特定を行う。一致するキーワードが特定できたときは、検索実行部5は、特定したキーワードの重みと履歴IDとを取得する。   In the present embodiment, when a search is requested by the user, the search execution unit 5 first searches the index data 9 based on the keyword included in the search condition. Then, the search execution unit 5 specifies a keyword that matches the keyword included in the search condition from the index data 9. When the matching keyword can be identified, the search execution unit 5 acquires the weight and history ID of the identified keyword.

更に、検索実行部5は、取得した履歴IDに基づいて、履歴データ7から、当該履歴IDに対応するファイルの格納場所を特定する。この特定された格納場所に格納されているファイルは、特定したキーワードの抽出元となった対象ファイルである。続いて、検索実行部5は、検索結果に、特定したキーワード、特定したキーワードに付加された重み、及び特定した格納場所を含む検索結果を利用者に通知する。   Further, the search execution unit 5 specifies the storage location of the file corresponding to the history ID from the history data 7 based on the acquired history ID. The file stored in the specified storage location is the target file from which the specified keyword is extracted. Subsequently, the search execution unit 5 notifies the user of the search result including the specified keyword, the weight added to the specified keyword, and the specified storage location in the search result.

このとき、検索結果においては、特定されたキーワードは、重みの順に配置されているのが好ましい。これにより、利用者は、アクセス時刻が近く、出現頻度が高いファイルを簡単に特定できる。なお、検索結果においては、同一のキーワードであっても、格納場所が異なる場合は、別々に表示される。   At this time, in the search result, it is preferable that the identified keywords are arranged in order of weight. As a result, the user can easily specify a file having a close access time and a high appearance frequency. In the search result, even if the keyword is the same, it is displayed separately if the storage location is different.

次に、本実施の形態における検索装置1の動作について図5及び図6を用いて説明する。図5は、本発明の実施の形態における検索装置の動作を示すフロー図である。図6は、本発明の実施の形態における検索装置で行われる処理を示すシーケンス図である。   Next, the operation of the search device 1 in the present embodiment will be described with reference to FIGS. FIG. 5 is a flowchart showing the operation of the search device according to the embodiment of the present invention. FIG. 6 is a sequence diagram showing processing performed by the search device according to the embodiment of the present invention.

また、本実施の形態では、検索装置1を動作させることによって、本実施の形態における検索方法が実施される。よって、本実施の形態における検索方法の説明は、以下の検索装置1の動作及び処理の説明に代える。また、以下の説明においては、適宜図1〜図4を参酌する。   Moreover, in this Embodiment, the search method in this Embodiment is implemented by operating the search apparatus 1. FIG. Therefore, the description of the search method in the present embodiment is replaced with the following description of the operation and processing of the search device 1. Moreover, in the following description, FIGS. 1-4 are referred to suitably.

図5及び図6に示すように、先ず、利用者が、外部リソース30に格納されている各種ファイルへのアクセス要求を行うと、OS10では、それに応じてイベントが発生する。そして、履歴収集部2は、利用者が対象ファイルにアクセスした際にOS10で発生したイベントをフックする(ステップS1)。具体的には、履歴収集部2は、OS10でイベントが発生すると、イベント記憶部11に格納されているアクセス要求情報にアクセスする。   As shown in FIGS. 5 and 6, first, when the user makes an access request to various files stored in the external resource 30, an event occurs in the OS 10 accordingly. Then, the history collection unit 2 hooks an event that occurs in the OS 10 when the user accesses the target file (step S1). Specifically, when an event occurs in the OS 10, the history collection unit 2 accesses access request information stored in the event storage unit 11.

次に、履歴収集部2は、アクセス要求情報から、利用者がアクセスした対象ファイルの格納場所とアクセス時刻とをアクセス履歴として収集し(ステップS2)、更に、このとき収集した格納場所が、既に履歴データ7(図2参照)に存在しているかどうかを判定する(ステップS3)。   Next, the history collection unit 2 collects the storage location and access time of the target file accessed by the user from the access request information as an access history (step S2), and the storage location collected at this time is already stored. It is determined whether or not it exists in the history data 7 (see FIG. 2) (step S3).

ステップS3の判定の結果、ステップS2で収集した格納場所が、既に履歴データ7に存在している場合は、履歴収集部2は、履歴データ7の該当するレコードのアクセス時刻を更新する(ステップS4)。   As a result of the determination in step S3, if the storage location collected in step S2 already exists in the history data 7, the history collection unit 2 updates the access time of the corresponding record in the history data 7 (step S4). ).

一方、ステップS3の判定の結果、ステップS2で収集した格納場所が、未だ履歴データ7に存在していない場合は、履歴収集部2は、新たな履歴IDを発行し、履歴データ7に新規のレコードを追加する(ステップS5)。   On the other hand, as a result of the determination in step S3, if the storage location collected in step S2 does not yet exist in the history data 7, the history collection unit 2 issues a new history ID and adds a new history ID to the history data 7. A record is added (step S5).

次に、ステップS4又はS5の終了後、履歴収集部2は、収集してから一定期間を過ぎたアクセス履歴のレコードを履歴データ7から削除する(ステップS6)。次に、履歴収集部2は、キーワード抽出部3に更新、追加、又は削除された履歴IDを送信して、キーワード抽出部3を呼び出し、これを起動する(ステップS7)。   Next, after the end of step S4 or S5, the history collection unit 2 deletes, from the history data 7, an access history record that has passed a certain period after collection (step S6). Next, the history collection unit 2 sends the updated, added, or deleted history ID to the keyword extraction unit 3, calls the keyword extraction unit 3, and activates it (step S7).

次に、キーワード抽出部3は、履歴収集部2から受け取った履歴IDに基づいて、履歴データ7を検索し、その中から対象ファイルの格納場所を特定する(ステップS8)。次に、キーワード抽出部3は、対象ファイルにアクセスし、この対象ファイルの全体からキーワードを抽出し、更に、そのキーワードの出現頻度(出現数)をカウントする(ステップS9)。   Next, the keyword extraction unit 3 searches the history data 7 based on the history ID received from the history collection unit 2, and specifies the storage location of the target file from the history data 7 (step S8). Next, the keyword extraction unit 3 accesses the target file, extracts keywords from the entire target file, and further counts the appearance frequency (number of appearances) of the keyword (step S9).

そして、キーワード抽出部3は、ステップS9で抽出したキーワードと、ステップS9で取得した出現頻度と、履歴IDとを用いて、キーワードデータ8(図3参照)を作成する(ステップS10)。また、キーワード抽出部3は、ステップS10の実行後、インデックス作成部4に履歴IDを送信して、インデックス作成部4を呼び出し、これを起動する(ステップS11)。   And the keyword extraction part 3 produces the keyword data 8 (refer FIG. 3) using the keyword extracted by step S9, the appearance frequency acquired by step S9, and log | history ID (step S10). Moreover, the keyword extraction part 3 transmits history ID to the index creation part 4 after execution of step S10, calls the index creation part 4, and starts this (step S11).

次に、インデックス作成部4は、キーワード抽出部3から受け取った履歴IDに基づいて、履歴データ7及びキーワードデータ8を検索する(ステップS12)。ステップS12により、インデックス作成部4は、履歴データ7から履歴IDのアクセス時刻を取得し、キーワードデータ8から履歴IDの各キーワードの出現頻度を取得する。   Next, the index creation unit 4 searches the history data 7 and the keyword data 8 based on the history ID received from the keyword extraction unit 3 (step S12). In step S 12, the index creation unit 4 acquires the access time of the history ID from the history data 7, and acquires the appearance frequency of each keyword of the history ID from the keyword data 8.

次に、インデックス作成部4は、ステップS12で取得したアクセス時刻と各キーワードの出現頻度とから、各キーワードの重みを算出し(ステップS13)、算出した重みを用いてインデックスデータ9(図4参照)を作成する(ステップS14)。具体的には、ステップS12において、インデックス作成部4は、上記の式(1)を用いて重みを作成する。   Next, the index creation unit 4 calculates the weight of each keyword from the access time acquired in step S12 and the appearance frequency of each keyword (step S13), and uses the calculated weight to index data 9 (see FIG. 4). ) Is created (step S14). Specifically, in step S12, the index creation unit 4 creates a weight using the above equation (1).

次に、検索実行部5は、利用者からキーワードによる検索要求を受けると、利用者から受け取ったキーワードに基づいて、インデックスデータ9を検索し、受け取ったキーワードと一致する全てのキーワードの重みと履歴IDとを取得する(ステップS15)。   Next, upon receiving a search request by keyword from the user, the search execution unit 5 searches the index data 9 based on the keyword received from the user, and the weights and history of all keywords that match the received keyword. ID is acquired (step S15).

次に、検索実行部5は、取得した履歴IDに基づいて、履歴データ7を検索し、当該履歴IDに対応するファイルの格納場所を特定する(ステップS16)。そして、検索実行部5は、ステップS15で取得した重みの値が大きい順に、その重みが付与されたキーワードの抽出元のファイルの格納場所が配置された検索結果を作成し、これを利用者に通知する(ステップS17)。ステップS17において、利用者への検索結果の通知は、具体的には、コンピュータ20の表示装置の表示画面に、検索結果を表示することによって行われている。   Next, the search execution unit 5 searches the history data 7 based on the acquired history ID, and specifies the storage location of the file corresponding to the history ID (step S16). Then, the search execution unit 5 creates a search result in which the storage locations of the extraction source files of the keywords to which the weights are assigned are arranged in descending order of the weight values acquired in step S15, and this is sent to the user. Notification is made (step S17). In step S17, the user is notified of the search result, specifically, by displaying the search result on the display screen of the display device of the computer 20.

本実施の形態において、上述したステップS1〜S17のうち、ステップS1〜S14と、ステップS15〜S17とは、連続して実行される必要はない。ステップS1〜S14は、利用者がファイルにアクセスする度に実行される。一方、ステップS15〜S17は、利用者が検索を要求する度に実行される。   In the present embodiment, among steps S1 to S17 described above, steps S1 to S14 and steps S15 to S17 do not need to be executed continuously. Steps S1 to S14 are executed every time the user accesses the file. On the other hand, steps S15 to S17 are executed every time the user requests a search.

また、本発明の実施の形態におけるプログラムは、コンピュータ20に、図5及び図6に示すステップS1〜S17を実行させるプログラムであれば良い。このプログラムをコンピュータ20にインストールし、実行することによって、本実施の形態における検索装置1と検索方法とを実現することができる。この場合、コンピュータのCPU(Central Processing Unit)は、履歴収集部2、キーワード抽出部3、インデックス作成部4、及
び検索実行部5として機能し、処理を行なう。また、記憶部5は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現できる。
Further, the program in the embodiment of the present invention may be a program that causes the computer 20 to execute steps S1 to S17 shown in FIGS. By installing and executing this program in the computer 20, the search device 1 and the search method in the present embodiment can be realized. In this case, a CPU (Central Processing Unit) of the computer functions as the history collection unit 2, the keyword extraction unit 3, the index creation unit 4, and the search execution unit 5, and performs processing. The storage unit 5 can be realized by storing data files constituting these in a storage device such as a hard disk provided in the computer.

以上の説明により、本実施の形態によれば、利用者は、特に、特定の内容を含むファイルに最近アクセスしたが、それの場所がわからないといった状況で、キーワードに付加された重みにより、目的のファイルを簡単に見つけることができる。これは、キーワードに付加されている重みは、利用者の過去のアクセス時刻と、ファイルの内容を把握する鍵となるキーワードの出現頻度とに連動して数値が変動するためである。また、重みにより、利用者の短期記憶又は中期記憶が刺激されるので、利用者は自己の記憶を利用しやすくなる。   As described above, according to the present embodiment, the user has recently accessed a file including specific contents, but the user does not know the location of the file. Find files easily. This is because the numerical value of the weight added to the keyword fluctuates in conjunction with the user's past access time and the appearance frequency of the keyword that is a key to grasp the contents of the file. In addition, since the user's short-term memory or medium-term memory is stimulated by the weight, the user can easily use his / her memory.

また、本実施の形態では、上述した重みがキーワードに付加されるので、利用者は、特定の内容についての検索を行った後に、ファイルの更新日時に基づいた検索を行う必要がない。つまり、本実施の形態では、検索によって全く関係のないファイルまでが抽出されてしまい、余計な時間がかかってしまう事態が発生しにくくなっている。よって、本実施の形態によれば、利用者が目的のファイルを見つけるまでにかかる時間の短縮化が図られることとなる。   In the present embodiment, since the above-described weight is added to the keyword, the user does not need to perform a search based on the file update date and time after performing a search for specific contents. In other words, in the present embodiment, it is difficult to generate a situation in which even a irrelevant file is extracted by the search, and extra time is required. Therefore, according to the present embodiment, it is possible to shorten the time required for the user to find the target file.

ここで、本実施の形態における検索装置1の他の例について、図7及び図8を用いて説明する。図7及び図8は、本発明の実施の形態における検索装置の他の例の構成を示すブロック図である。   Here, another example of the search device 1 in the present embodiment will be described with reference to FIGS. 7 and 8 are block diagrams showing the configuration of another example of the search device according to the embodiment of the present invention.

図7の例では、検索装置1は、キーワード収集部31を備えている。キーワード収集部31は、利用者が入力機器を介してコンピュータ10に入力したキーワード、OS10が管理するクリップボード(図示せず)に保存されたキーワード等を取得する。具体的には、利用者がコンピュータ10に対して行った操作入力は、OS10に構築された操作入力記憶部13に記憶される。操作入力記憶部13は、利用者が入力したキーワード、クリップボードに保存されているキーワード等を記憶している。キーワード収集部31は、操作入力記憶部13にアクセスして、キーワードの取得を行っている。   In the example of FIG. 7, the search device 1 includes a keyword collection unit 31. The keyword collection unit 31 acquires keywords input to the computer 10 by the user via the input device, keywords stored in a clipboard (not shown) managed by the OS 10, and the like. Specifically, the operation input made by the user to the computer 10 is stored in the operation input storage unit 13 constructed in the OS 10. The operation input storage unit 13 stores keywords input by the user, keywords stored in the clipboard, and the like. The keyword collection unit 31 accesses the operation input storage unit 13 and acquires keywords.

また、キーワード収集部31は、取得したキーワードから、利用者が行っている作業を分析する。そして、キーワード収集部31は、取得したキーワードと、得られた分析結果とを分析データ32として、記憶部6に格納させる。そして、図7の例では、インデックス作成部4は、分析データを用いて、インデックスに付加する重みの値を補正し、重みの精度の向上を図っている。   Moreover, the keyword collection part 31 analyzes the operation | work which the user is performing from the acquired keyword. Then, the keyword collection unit 31 stores the acquired keyword and the obtained analysis result as analysis data 32 in the storage unit 6. In the example of FIG. 7, the index creation unit 4 corrects the weight value added to the index using the analysis data to improve the accuracy of the weight.

更に、図8の例では、検索装置1は、キーワード一覧表示部33を備えている。キーワード一覧表示部33は、利用者からキーワードの一覧表示が要求されると、分析データ32に含まれるキーワードを取得し、これらの一覧表を作成し、これを利用者に通知する。また、キーワード一覧表示部33は、一覧表の作成に際して、キーワードデータ8からキーワードの出現頻度を取得し、出現頻度の順にキーワードを配置することもできる。   Further, in the example of FIG. 8, the search device 1 includes a keyword list display unit 33. When a keyword list display is requested by the user, the keyword list display unit 33 acquires the keywords included in the analysis data 32, creates these lists, and notifies the user of these. Further, the keyword list display unit 33 can acquire the appearance frequency of keywords from the keyword data 8 when creating the list, and can arrange the keywords in the order of appearance frequency.

図8の例では、利用されているキーワードの一覧が表示されるため、利用者は、検索のためのキーワードを思いつけない場合であっても、今までに頻繁に使用したキーワードを見つけることができる。   In the example of FIG. 8, since a list of keywords that are used is displayed, even if the user cannot come up with a keyword for search, the user can find keywords that have been frequently used so far. it can.

以上のように、本発明によれば、利用者は、自身のファイルへのアクセス時期についての記憶を利用して目的のファイルを見つけることができるようになる。本発明は、利用者
のファイルへのアクセス履歴を用いて検索を実行する検索装置に有用である。
As described above, according to the present invention, the user can find the target file by using the memory about the access time of the user's own file. The present invention is useful for a search device that executes a search using a user's access history to a file.

1 検索装置
2 履歴収集部
3 キーワード抽出部
4 インデックス作成部
5 検索実行部
6 記憶部
7 履歴データ
8 キーワードデータ
9 インデックスデータ
10 オペレーティングシステム(OS)
11 イベント記憶部
12 アクセス処理部
13 操作入力記憶部
20 コンピュータ
30 外部リソース
31 キーワード収集部
32 分析データ
33 キーワード一覧表示部
DESCRIPTION OF SYMBOLS 1 Search apparatus 2 History collection part 3 Keyword extraction part 4 Index creation part 5 Search execution part 6 Storage part 7 History data 8 Keyword data 9 Index data 10 Operating system (OS)
DESCRIPTION OF SYMBOLS 11 Event memory | storage part 12 Access processing part 13 Operation input memory | storage part 20 Computer 30 External resource 31 Keyword collection part 32 Analysis data 33 Keyword list display part

Claims (15)

検索要求が行われた場合にその検索条件に応じて検索を実行する検索装置であって、
利用者から対象ファイルにアクセスが行われた時刻及び前記対象ファイルの格納場所をアクセス履歴として収集する履歴収集部と、
前記アクセスが行われた前記対象ファイルからキーワードを抽出し、抽出した前記キーワードの前記対象ファイルにおける出現頻度を求め、そして、抽出した前記キーワード及びその前記出現頻度を含み、且つ、これらが抽出元の前記対象ファイルに紐付けられている、キーワードデータを作成するキーワード抽出部と、
前記アクセス履歴と前記キーワードデータとを用いて、前記キーワードに対して、当該キーワードを含む前記対象ファイルの前記時刻及び当該キーワードの前記出現頻度によって値が変動する重みを付加し、前記キーワード及びそれに付加した前記重みを含むインデックスデータを作成するインデックス作成部と、
前記検索条件に応じた検索を実行し、検索結果に、前記インデックスデータの内容を反映させる検索実行部と、を備えていることを特徴とする検索装置。
A search device that executes a search according to a search condition when a search request is made,
A history collection unit that collects, as an access history, the time when the target file was accessed from the user and the storage location of the target file;
A keyword is extracted from the accessed target file, an appearance frequency of the extracted keyword in the target file is obtained, and the extracted keyword and its appearance frequency are included, and these are extracted from A keyword extraction unit that creates keyword data associated with the target file;
Using the access history and the keyword data, a weight whose value varies depending on the time of the target file including the keyword and the appearance frequency of the keyword is added to the keyword, and the keyword and the keyword are added thereto. An index creation unit for creating index data including the weights;
And a search execution unit that executes a search according to the search condition and reflects the contents of the index data in a search result.
前記インデックス作成部が、前記キーワードに対して、当該キーワードを含むファイルの前記時刻から前記検索要求が行われた時点までの経過時間が少ない程、及び当該キーワードの前記出現頻度が高い程、値が大きくなる重みを付加する、請求項1に記載の検索装置。   When the index creation unit has less time elapsed from the time of the file including the keyword to the time when the search request is made and the frequency of occurrence of the keyword is higher, The search device according to claim 1, wherein a weight that increases is added. 前記履歴収集部が、前記検索要求が行われた時点から設定された時間だけ遡った時点を基準時刻に設定し、更に、収集した前記アクセス履歴を記憶装置に格納し、そして、格納した前記アクセス履歴のうち、前記基準時刻よりも前記時刻が過去となったアクセス履歴を削除し、
前記インデックス作成部が、前記インデックスデータから、削除されたアクセス履歴を用いて付加された重みと当該重みが付加されたキーワードとに関する情報を削除する、
請求項1または2に記載の検索装置。
The history collection unit sets a time point that is set back from the time when the search request is made as a reference time, stores the collected access history in a storage device, and stores the stored access In the history, delete the access history in which the time is past the reference time,
The index creation unit deletes information about the weight added using the deleted access history and the keyword to which the weight is added from the index data.
The search device according to claim 1 or 2.
前記利用者が前記対象ファイルにアクセスした前記時刻をTa、前記基準時刻をTs、当該対象ファイルから抽出された前記キーワードの前記出現頻度をF、αを任意の係数としたときに、前記インデックス作成部が、前記重みを下記の式(1)から算出する、請求項3に記載の検索装置。
重み=(Ta−Ts)×α+F ・・・(1)
The index is created when the time when the user accesses the target file is Ta, the reference time is Ts, the appearance frequency of the keyword extracted from the target file is F, and α is an arbitrary coefficient. The search device according to claim 3, wherein the unit calculates the weight from the following equation (1).
Weight = (Ta−Ts) × α + F (1)
前記インデックス作成部が、前記キーワード及びそれに付加した前記重みを抽出元の前記対象ファイルに紐付けて、前記インデックスデータを作成し、
前記検索実行部が、前記インデックスデータの中から、前記検索条件に含まれるキーワードと一致するキーワードを特定し、前記検索結果に、特定したキーワード、前記特定したキーワードに付加された重み、及び前記特定したキーワードの抽出元の対象ファイルの格納場所を含ませる、請求項1〜4のいずれかに記載の検索装置。
The index creating unit creates the index data by associating the keyword and the weight added thereto with the target file of the extraction source,
The search execution unit specifies a keyword that matches the keyword included in the search condition from the index data, and specifies the specified keyword, the weight added to the specified keyword, and the specification in the search result. The search device according to claim 1, further comprising a storage location of the target file from which the extracted keyword is extracted.
検索要求が行われた場合にその検索条件に応じて検索を実行するための検索方法であって、
(a)利用者から対象ファイルにアクセスが行われた時刻及び前記対象ファイルの格納場所をアクセス履歴として収集するステップと、
(b)前記アクセスが行われた前記対象ファイルからキーワードを抽出し、抽出した前記キーワードの前記対象ファイルにおける出現頻度を求め、そして、抽出した前記キーワード及びその前記出現頻度を含み、且つ、これらが抽出元の前記対象ファイルに紐付けられている、キーワードデータを作成するステップと、
(c)前記アクセス履歴と前記キーワードデータとを用いて、前記キーワードに対して、当該キーワードを含む前記対象ファイルの前記時刻及び当該キーワードの前記出現頻度によって値が変動する重みを付加し、前記キーワード及びそれに付加した前記重みを含むインデックスデータを作成するステップと、
(d)前記検索条件に応じた検索を実行し、検索結果に、前記インデックスデータの内容を反映させるステップと、を有することを特徴とする検索方法。
A search method for executing a search according to a search condition when a search request is made,
(A) collecting the time when the target file was accessed by the user and the storage location of the target file as an access history;
(B) extracting a keyword from the target file to which the access has been performed, obtaining an appearance frequency of the extracted keyword in the target file, and including the extracted keyword and the appearance frequency thereof, and Creating keyword data associated with the target file of the extraction source;
(C) Using the access history and the keyword data, a weight whose value varies depending on the time of the target file including the keyword and the appearance frequency of the keyword is added to the keyword. And creating index data including the weight added thereto,
(D) performing a search according to the search condition, and reflecting the contents of the index data in the search result.
前記(c)のステップで、前記キーワードに対して、当該キーワードを含むファイルの前記時刻から前記検索要求が行われた時点までの経過時間が少ない程、及び当該キーワードの前記出現頻度が高い程、値が大きくなる重みを付加する、請求項6に記載の検索方法。   In the step of (c), as the elapsed time from the time of the file containing the keyword to the time when the search request is made is smaller for the keyword and the appearance frequency of the keyword is higher, The search method according to claim 6, wherein a weight that increases the value is added. 前記(a)のステップで、前記検索要求が行われた時点から設定された時間だけ遡った時点を基準時刻に設定し、更に、収集した前記アクセス履歴を記憶装置に格納し、そして、格納した前記アクセス履歴のうち、前記基準時刻よりも前記時刻が過去となったアクセス履歴を削除し、
前記(c)のステップで、前記インデックスデータから、削除されたアクセス履歴を用いて付加された重みと当該重みが付加されたキーワードとに関する情報を削除する、
請求項6または7に記載の検索方法。
In the step (a), a time point that is set back from the time point when the search request is made is set as a reference time, and further, the collected access history is stored in a storage device and stored. Of the access history, delete the access history in which the time is past than the reference time,
In the step (c), information about the weight added using the deleted access history and the keyword to which the weight is added is deleted from the index data.
The search method according to claim 6 or 7.
前記利用者が前記対象ファイルにアクセスした前記時刻をTa、前記基準時刻をTs、当該対象ファイルから抽出された前記キーワードの前記出現頻度をF、αを任意の係数としたときに、前記(c)のステップで、前記重みを下記の式(1)から算出する、請求項8に記載の検索方法。
重み=(Ta−Ts)×α+F ・・・(1)
When the time when the user accesses the target file is Ta, the reference time is Ts, the appearance frequency of the keyword extracted from the target file is F, and α is an arbitrary coefficient, (c The search method according to claim 8, wherein the weight is calculated from the following equation (1) in the step of:
Weight = (Ta−Ts) × α + F (1)
前記(c)のステップで、前記キーワード及びそれに付加した前記重みを抽出元の前記対象ファイルに紐付けて、前記インデックスデータを作成し、
前記(d)のステップで、前記インデックスデータの中から、前記検索条件に含まれるキーワードと一致するキーワードを特定し、前記検索結果に、特定したキーワード、前記特定したキーワードに付加された重み、及び前記特定したキーワードの抽出元の対象ファイルの格納場所を含ませる、請求項6〜9のいずれかに記載の検索方法。
In the step (c), the index data is created by associating the keyword and the weight added thereto with the target file of the extraction source,
In the step (d), a keyword that matches the keyword included in the search condition is identified from the index data, and the identified keyword, the weight added to the identified keyword, and The search method according to claim 6, further comprising a storage location of the target file from which the identified keyword is extracted.
検索要求が行われた場合に、その検索条件に応じた検索を、コンピュータによって実行するためのプログラムであって、
前記コンピュータに、
(a)利用者から対象ファイルにアクセスが行われた時刻及び前記対象ファイルの格納場所をアクセス履歴として収集するステップと、
(b)前記アクセスが行われた前記対象ファイルからキーワードを抽出し、抽出した前記キーワードの前記対象ファイルにおける出現頻度を求め、そして、抽出した前記キーワード及びその前記出現頻度を含み、且つ、これらが抽出元の前記対象ファイルに紐付けられている、キーワードデータを作成するステップと、
(c)前記アクセス履歴と前記キーワードデータとを用いて、前記キーワードに対して、当該キーワードを含む前記対象ファイルの前記時刻及び当該キーワードの前記出現頻度によって値が変動する重みを付加し、前記キーワード及びそれに付加した前記重みを含むインデックスデータを作成するステップと、
(d)前記検索条件に応じた検索を実行し、検索結果に、前記インデックスデータの内容を反映させるステップとを実行させる、ことを特徴とするプログラム。
When a search request is made, a program for executing a search according to the search condition by a computer,
In the computer,
(A) collecting the time when the target file was accessed by the user and the storage location of the target file as an access history;
(B) extracting a keyword from the target file to which the access has been performed, obtaining an appearance frequency of the extracted keyword in the target file, and including the extracted keyword and the appearance frequency thereof, and Creating keyword data associated with the target file of the extraction source;
(C) Using the access history and the keyword data, a weight whose value varies depending on the time of the target file including the keyword and the appearance frequency of the keyword is added to the keyword. And creating index data including the weight added thereto,
(D) A program that executes a search according to the search condition, and causes the search result to reflect the contents of the index data.
前記(c)のステップで、前記キーワードに対して、当該キーワードを含むファイルの
前記時刻から前記検索要求が行われた時点までの経過時間が少ない程、及び当該キーワードの前記出現頻度が高い程、値が大きくなる重みを付加する、請求項11に記載のプログラム。
In the step of (c), as the elapsed time from the time of the file containing the keyword to the time when the search request is made is smaller for the keyword and the appearance frequency of the keyword is higher, The program according to claim 11, wherein a weight for increasing the value is added.
前記(a)のステップで、前記検索要求が行われた時点から設定された時間だけ遡った時点を基準時刻に設定し、更に、収集した前記アクセス履歴を記憶装置に格納し、そして、格納した前記アクセス履歴のうち、前記基準時刻よりも前記時刻が過去となったアクセス履歴を削除し、
前記(c)のステップで、前記インデックスデータから、削除されたアクセス履歴を用いて付加された重みと当該重みが付加されたキーワードとに関する情報を削除する、
請求項11または12に記載のプログラム。
In the step (a), a time point that is set back from the time point when the search request is made is set as a reference time, and further, the collected access history is stored in a storage device and stored. Of the access history, delete the access history in which the time is past than the reference time,
In the step (c), information about the weight added using the deleted access history and the keyword to which the weight is added is deleted from the index data.
The program according to claim 11 or 12.
前記利用者が前記対象ファイルにアクセスした前記時刻をTa、前記基準時刻をTs、当該対象ファイルから抽出された前記キーワードの前記出現頻度をF、αを任意の係数としたときに、前記(c)のステップで、前記重みを下記の式(1)から算出する、請求項13に記載のプログラム。
重み=(Ta−Ts)×α+F ・・・(1)
When the time when the user accesses the target file is Ta, the reference time is Ts, the appearance frequency of the keyword extracted from the target file is F, and α is an arbitrary coefficient, (c The program according to claim 13, wherein the weight is calculated from the following equation (1) in the step of:
Weight = (Ta−Ts) × α + F (1)
前記(c)のステップで、前記キーワード及びそれに付加した前記重みを抽出元の前記対象ファイルに紐付けて、前記インデックスデータを作成し、
前記(d)のステップで、前記インデックスデータの中から、前記検索条件に含まれるキーワードと一致するキーワードを特定し、前記検索結果に、特定したキーワード、前記特定したキーワードに付加された重み、及び前記特定したキーワードの抽出元の対象ファイルの格納場所を含ませる、請求項11〜14のいずれかに記載のプログラム。
In the step (c), the index data is created by associating the keyword and the weight added thereto with the target file of the extraction source,
In the step (d), a keyword that matches the keyword included in the search condition is identified from the index data, and the identified keyword, the weight added to the identified keyword, and The program according to any one of claims 11 to 14, which includes a storage location of a target file from which the specified keyword is extracted.
JP2009193234A 2009-08-24 2009-08-24 Retrieval device, retrieval method, and program Pending JP2011044086A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009193234A JP2011044086A (en) 2009-08-24 2009-08-24 Retrieval device, retrieval method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009193234A JP2011044086A (en) 2009-08-24 2009-08-24 Retrieval device, retrieval method, and program

Publications (1)

Publication Number Publication Date
JP2011044086A true JP2011044086A (en) 2011-03-03

Family

ID=43831459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009193234A Pending JP2011044086A (en) 2009-08-24 2009-08-24 Retrieval device, retrieval method, and program

Country Status (1)

Country Link
JP (1) JP2011044086A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365535A (en) * 2012-03-28 2013-10-23 佳能株式会社 Information processing apparatus and information processing method
CN105512144A (en) * 2014-09-26 2016-04-20 可牛网络技术(北京)有限公司 Method and device for file access and intelligent file system
JP2016526218A (en) * 2013-05-21 2016-09-01 フェイスブック,インク. Database sharding with an update layer
CN111046141A (en) * 2019-12-03 2020-04-21 新华智云科技有限公司 Text library keyword refining method based on historical time characteristics

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365535A (en) * 2012-03-28 2013-10-23 佳能株式会社 Information processing apparatus and information processing method
JP2016526218A (en) * 2013-05-21 2016-09-01 フェイスブック,インク. Database sharding with an update layer
US10977229B2 (en) 2013-05-21 2021-04-13 Facebook, Inc. Database sharding with update layer
CN105512144A (en) * 2014-09-26 2016-04-20 可牛网络技术(北京)有限公司 Method and device for file access and intelligent file system
CN111046141A (en) * 2019-12-03 2020-04-21 新华智云科技有限公司 Text library keyword refining method based on historical time characteristics
CN111046141B (en) * 2019-12-03 2023-07-18 新华智云科技有限公司 Text library keyword refining method based on historical time characteristics

Similar Documents

Publication Publication Date Title
US11782989B1 (en) Correlating data based on user-specified search criteria
US10877986B2 (en) Obtaining performance data via an application programming interface (API) for correlation with log data
US10614132B2 (en) GUI-triggered processing of performance data and log data from an information technology environment
US10019496B2 (en) Processing of performance data and log data from an information technology environment by using diverse data stores
US11119982B2 (en) Correlation of performance data and structure data from an information technology environment
RU2629448C2 (en) System and method of controlling and organizing web-browser cash
JP5423596B2 (en) Information processing apparatus and information processing method
US10320877B2 (en) Systems and methods for indicating deployment of application features
US8244704B2 (en) Recording medium recording object contents search support program, object contents search support method, and object contents search support apparatus
JP5228584B2 (en) Interest information identification system, interest information identification method, and interest information identification program
JPWO2009107628A1 (en) Search system, search method and program
JP2011044086A (en) Retrieval device, retrieval method, and program
JP2007140603A (en) Early adapter extraction method and device and program and topic word prediction method and device and program
JP2019527398A (en) Information processing method and apparatus, and method and apparatus for displaying dynamic information
US20150205798A1 (en) Information search support method and apparatus
US20160055203A1 (en) Method for record selection to avoid negatively impacting latency
JP4528203B2 (en) File search method, file search device, and file search program
JP2006092023A (en) Document control computer program, document control device and method
US20120239662A1 (en) Document management apparatus and document management method
JP5757187B2 (en) File storage location candidate determination device, file storage location candidate determination method, file storage location determination support system, and computer program
JP2012043018A (en) Life-log display controlling device, method and program
JP2011028453A (en) System, method and program for retrieving electronic document
JP2009080598A (en) Information providing system, method, and program
JP2019021228A (en) Retrieval device, retrieval system and program
JP2013196315A (en) Information processing apparatus and method