WO2011004846A1 - 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体 - Google Patents

情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体 Download PDF

Info

Publication number
WO2011004846A1
WO2011004846A1 PCT/JP2010/061547 JP2010061547W WO2011004846A1 WO 2011004846 A1 WO2011004846 A1 WO 2011004846A1 JP 2010061547 W JP2010061547 W JP 2010061547W WO 2011004846 A1 WO2011004846 A1 WO 2011004846A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
attribute
hash
registration
attribute information
Prior art date
Application number
PCT/JP2010/061547
Other languages
English (en)
French (fr)
Inventor
健太郎 山崎
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US13/382,565 priority Critical patent/US20120109990A1/en
Priority to CN201080030727.4A priority patent/CN102473185B/zh
Priority to JP2011521945A priority patent/JP5267670B2/ja
Publication of WO2011004846A1 publication Critical patent/WO2011004846A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables

Definitions

  • the present invention relates to an information search system, an information management device, an information search method, an information management method, and a recording medium, and more particularly, an information search system, an information management device, and an information search that search for registered information using a hash.
  • the present invention relates to a method, an information management method, and a recording medium.
  • Patent Document 1 is a document in which an information search system (apparatus) is described.
  • the search device described in Patent Literature 1 includes a storage unit, a key hash calculation unit, and a search unit.
  • the storage unit has an original data area and an index area.
  • the data area is an area for storing the original data group.
  • the index area is an area for storing information indicating the storage location of the original data. Information indicating the storage location of each original data in the original data area is stored in a location corresponding to the hash value of the original data in the index area.
  • the key hash calculation unit calculates the hash of the search key.
  • the search unit refers to a location corresponding to the hash value of the search key in the index area, and extracts the storage location of the original data. Thereafter, the search unit extracts necessary original data from the location indicated by the storage location of the extracted original data in the original data area.
  • the time required for retrieval increases as the information to be retrieved increases.
  • Patent Document 1 uses a hash to extract data that matches a search key, and has an effect that a search can be performed at high speed even if the amount of information increases.
  • Patent Document 2 is a document describing a data analysis method.
  • network packet information such as a sender address, a recipient address, and a port number is input, and combinations of addresses and ports that frequently appear on the network are extracted.
  • a cache for item number 1, a cache for item number 2, and a cache for item number 3 are used for data of three items.
  • the item number 1 cache stores a hash of one item data and the number of appearances of the data.
  • the item number 2 cache stores a hash of two item data and the number of appearances of a combination of the two data.
  • the cache for the number of items 3 stores the hash of the three item data and the number of appearances of the combination of the three data.
  • the analysis apparatus selects two of the three item data in the cache table for the number of items 2, and the hash of “192.168.0.1” and the hash of “192.168.1.1” Whether the combination of the hash of “192.168.0.1” and the hash of “25”, and the combination of the hash of “192.168.1.1” and the hash of “25” have been stored. Check for no. When the analysis device has already been stored, the analysis device increments the number of appearances of the corresponding combination. Further, the analysis apparatus stores the combination of the hash of “192.168.0.1”, the hash of “192.168.1.1”, and the hash of “25” in the cache table for the number of items 3. If it is not stored, the number of appearances of the combination is incremented.
  • JP 2007-241378 A (FIG. 1) JP 2005-285048 A
  • registration information including one or more attribute information is managed using a hash table and information is searched. For example, assuming that there are N types of attribute information that can be included, it is not necessary for all N types of attribute information to have data (attribute values), and some of the attribute information can be omitted.
  • the registration information may include all attribute information such as ⁇ (age, 20s), (gender, M), (location, Tokyo) ⁇ , or the attribute name: location is omitted ⁇ (Age, 20s), (gender, M) ⁇ .
  • the omitted attribute information is assumed to be arbitrary.
  • Registration information of ⁇ (age, 20s), (sex, M) ⁇ is registered in the system, and ⁇ (age, 20s), (sex, M), (location, Tokyo) ⁇ is the evaluation target information.
  • the registration information ⁇ (age, 20s), (sex, M) ⁇ may be arbitrary for attribute information other than age and sex, so ⁇ (age, 20s), (sex, M), (Location, Tokyo) ⁇ matches the evaluation target information.
  • ⁇ (age, 20s), (sex, M) ⁇ and ⁇ (age, 20s), (gender, M), (location, Tokyo) ⁇ are different information, so they are based on each other. The hashes created in are very different.
  • the system manages registration information with a hash table, even if the hash table is searched based on a hash created based on ⁇ (age, 20s), (gender, M), (location, Tokyo) ⁇ .
  • the hash does not match the created hash created based on ⁇ (age, 20s), (sex, M) ⁇ , and an entry including the registration information cannot be extracted.
  • Patent Document 2 simply searches for whether or not the number of appearances for a combination of data has been stored in the cache table using a combination of hashes. Therefore, the analysis method described in Patent Document 2 cannot solve the problem in the information search using the hash table.
  • the present invention in the information search using the hash table, even if the registration information includes the wild card that the attribute value may be arbitrary, the registration information that matches the evaluation target information that does not include the wild card It is an object to provide an information search system, an information management device, an information search method, an information management method, and a recording medium.
  • the present invention provides an evaluation target information processing means for inputting evaluation target information having M pieces of attribute information including attribute values (M is an integer of 1 or more), and the evaluation target information processing means.
  • a combination generation unit that generates a combination of 1 to M pieces of attribute information extracted from the input evaluation target information, and an attribute value of attribute information included in each combination for each combination generated by the combination generation unit.
  • Attribute information linking means for generating a linked attribute value obtained by linking the attribute information
  • hash generating means for converting the linked attribute value generated by the attribute information linking means into a hash, and registration information having one or more of the attribute information
  • Search the hash table to be stored in association with the hash of the concatenated attribute value converted concatenated attribute values of the attribute information included in the registration information.
  • Providing information retrieval system and an information retrieval means for extracting registration information hash generation means is registered in association with the hash that matches one of the converted hash.
  • the present invention refers to registration information processing means for inputting registration information having one or more attribute information including attribute values, and a pattern storage unit for storing attribute values of attribute information that can be handled as registration information.
  • attribute information that can be handled as a complementary attribute that generates a complementary pattern composed of a combination of attribute values of attribute information not included in the registration information input to the registered information processing means, and adds the complementary pattern to the registered information
  • Combination generating means for generating information
  • attribute information linking means for generating linked attribute values obtained by linking attribute values of included attribute information for each of the registration information and the complementary attribute information, and the attribute information linking means
  • a hash generation means for converting the linked attribute value generated in step 1 into a hash; and a hash obtained by converting the registration information by the hash generation means.
  • Information registration means for registering in the hash table in association with the evaluation object information including one or more of the attribute information is input, and attribute values included in the input evaluation object information are connected using the attribute information connection means
  • An evaluation target information processing unit that generates an information search request including a hash obtained by converting the connected attribute value using the hash generation unit, and a hash that searches the hash table and matches the hash included in the information search request
  • an information search system having information search means for extracting registered information registered in association with.
  • the present invention refers to registration information processing means for inputting registration information having one or more attribute information including attribute values, and a pattern storage unit for storing attribute values of attribute information that can be handled as registration information.
  • attribute information that can be handled as a complementary attribute that generates a complementary pattern composed of a combination of attribute values of attribute information not included in the registration information input to the registered information processing means, and adds the complementary pattern to the registered information
  • Combination generating means for generating information
  • attribute information linking means for generating linked attribute values obtained by linking attribute values of included attribute information for each of the registration information and the complementary attribute information, and the attribute information linking means
  • a hash generation means for converting the linked attribute value generated in step 1 into a hash; and a hash obtained by converting the registration information by the hash generation means.
  • Association provides information management apparatus and an information registering means for registering in the hash table.
  • the present invention provides a combination generation step in which a computer generates a combination of 1 to M pieces of attribute information extracted from evaluation target information having M pieces of attribute information including attribute values (M is an integer of 1 or more); For each of the generated combinations, the computer generates an attribute information concatenation step that concatenates attribute values of attribute information included in each combination, and the computer generates the concatenation generated in the attribute information concatenation step.
  • a hash table that is stored in association with the hash table is searched and converted in the hash conversion step. Providing information retrieval method and an information retrieval step of extracting the registration information registered in association with the hash matches any of.
  • the present invention refers to a pattern storage unit in which a computer inputs registration information having one or more attribute information including attribute values and stores attribute values of attribute information that can be handled as the registration information.
  • a complementary pattern generation step of generating a complementary pattern consisting of a combination of attribute values of attribute information not included in the input registration information; and the computer includes the registration information and the registration information in the registration information.
  • An attribute information concatenation step for generating a concatenated attribute value obtained by concatenating the attribute values of the included attribute information for each of the complementary attribute information to which the complementary pattern is added, and the concatenated attribute generated by the computer in the attribute information concatenation step A hash conversion step of converting a value into a hash; and the computer converts the registration information into the hash
  • an information search method including an information search step for extracting registered information registered in this way.
  • the present invention refers to a pattern storage unit in which a computer inputs registration information having one or more attribute information including attribute values and stores attribute values of attribute information that can be handled as the registration information.
  • a complementary pattern generation step of generating a complementary pattern consisting of a combination of attribute values of attribute information not included in the input registration information; and the computer includes the registration information and the registration information in the registration information.
  • An attribute information concatenation step for generating a concatenated attribute value obtained by concatenating the attribute values of the included attribute information for each of the complementary attribute information to which the complementary pattern is added, and the concatenated attribute generated by the computer in the attribute information concatenation step A hash conversion step of converting a value into a hash; and the computer converts the registration information into the hash In association with the hash converted in conversion step provides information management method and an information registration step of registering in the hash table.
  • the present invention relates to a combination generation process for generating a combination by extracting 1 to M pieces of attribute information from evaluation target information having M pieces of attribute information including attribute values (M is an integer equal to or greater than 1). For each of the generated combinations, an attribute information concatenation process that generates a concatenated attribute value concatenating attribute values of attribute information included in each combination, and the concatenated attribute value generated by the attribute information concatenation process is converted into a hash.
  • the program for executing the information retrieval process that provides a computer-readable recording medium having recorded.
  • the present invention inputs, to a computer, registration information having one or more attribute information including attribute values, and refers to a pattern storage unit that stores attribute values of attribute information that can be handled as the registration information.
  • a complementary pattern generation process for generating a complementary pattern composed of a combination of attribute values of attribute information not included in the input registration information, the registration information, and the complementary pattern in the registration information.
  • an attribute information continuous process for generating a linked attribute value obtained by concatenating the attribute values of the included attribute information, and the linked attribute value generated in the attribute information link process is converted into a hash.
  • Hash conversion processing and information registration for registering the registration information in the hash table in association with the hash converted by the hash conversion processing
  • evaluation object information hash conversion processing for inputting evaluation object information including one or more of the attribute information, and converting a connected attribute value obtained by concatenating attribute values included in the input evaluation object information into a hash
  • a computer-readable record that records a program that searches a hash table and executes an information search process that extracts registered information that is registered in association with a hash that matches the hash generated by the evaluation target information hash conversion process Provide media.
  • the present invention inputs, to a computer, registration information having one or more attribute information including attribute values, and refers to a pattern storage unit that stores attribute values of attribute information that can be handled as the registration information.
  • a complementary pattern generation process for generating a complementary pattern composed of a combination of attribute values of attribute information not included in the input registration information, the registration information, and the complementary pattern in the registration information.
  • an attribute information continuous process for generating a linked attribute value obtained by concatenating the attribute values of the included attribute information, and the linked attribute value generated in the attribute information link process is converted into a hash.
  • Hash conversion processing and information registration for registering the registration information in the hash table in association with the hash converted by the hash conversion processing
  • a computer-readable recording medium recording a program for executing the management.
  • the information search system, information management device, information search method, information management method, and recording medium of the present invention include a wild card that the registered information may have any attribute value in the information search using the hash table. However, it is possible to search for registration information that matches the evaluation target information that does not include a wild card.
  • FIG. 1 shows an information retrieval system according to a first embodiment of the present invention.
  • the information search system includes a registered information processing unit 11, an attribute information connecting unit 12, a hash generating unit 13, a combination generating unit 14, an evaluation target information processing unit 15, and a registered information management unit 16.
  • the function of each means in the information search system can be realized by executing a predetermined program on the computer system.
  • the registration information processing means 11 receives registration information including one or more attribute information.
  • the registration information processing means 11 sends an information registration request to the registration information management means 16 to request storage of registration information.
  • the evaluation target information processing means 15 receives evaluation target information including one or more attribute information.
  • the evaluation target information represents a search condition when searching for registration information.
  • the evaluation target information processing means 15 sends a search request to the registered information management means 16 and requests a search for information based on the evaluation target information.
  • the registered information management unit 16 registers information and searches for registered information.
  • FIG. 2 shows the data structure of registration information and evaluation target information.
  • the registration information and the evaluation target information are composed of one or more attribute information.
  • Each attribute information includes an attribute name and an attribute value. Assuming that there are a total of N types of attribute information (N is an integer of 2 or more) handled by the information search system, the registration information need not have attribute values for all N types of attribute information. Some attribute information may be omitted. The omitted attribute information is interpreted as having an arbitrary value. The same applies to the evaluation target information.
  • the attribute information linking unit 12 generates a linked attribute value obtained by linking the attribute information included in the registration information and the evaluation target information. At that time, the attribute information connecting means 12 connects the attribute values after rearranging the attribute information in a predetermined order. Here, the attribute information connecting unit 12 links the attribute values of the attribute information included in each combination generated by the combination generating unit 14 for the evaluation target information.
  • the hash generation unit 13 converts the registration information or the evaluation target information (combination) in which the attribute information is connected by the attribute information connection unit 12 into a hash. For the hash conversion in the hash generation means 13, for example, a general hash function represented by MD5 or SHA can be used.
  • the registered information management unit 16 includes an information registration unit 17 and an information search unit 18.
  • the registered information management means 16 performs information management using the hash table 19.
  • the hash table 19 stores registration information in association with a hash generated based on a concatenated attribute value obtained by concatenating attribute values included in the registration information.
  • the information registration unit 17 receives an information registration request from the registration information processing unit 11.
  • the information registration unit 17 records the registration information and the hash of the registration information converted by the hash generation unit 13 in association with each other in the hash table 19. More specifically, when receiving the information registration request, the information registration unit 17 creates an entry with the hash as a key and the registration information as a value in the hash table 19 and records the registration information in the hash table 19.
  • the information search means 18 receives an information search request from the evaluation target information processing means 15. Upon receipt of the information search request, the information search means 18 searches the hash table 19 and either one of the hashes of the evaluation target information generated by the hash generation means 13 (hash corresponding to the combination generated by the combination generation means 14). The registration information registered in association with the hash that matches is extracted.
  • the operation of the information search system can be broadly divided into an information registration flow for registering information and an information evaluation flow for searching for registered information that matches the evaluation target information.
  • FIG. 3 shows an operation procedure at the time of information registration.
  • a description will be given with reference to FIG.
  • the registration information processing means 11 receives registration information including one or more attribute information (step S101). When the registration information processing means 11 receives the registration information, it passes the received registration information to the attribute information connection means 12.
  • the attribute registration information processing means 11 may receive registration information including all N types of attribute information, or may receive registration information including only three types of attribute information of age, sex, and location.
  • the attribute information not included in the registration information is treated as a wild card indicating that any value may be used.
  • the information retrieval system does not need to know in advance the N types of attribute information that may be received.
  • the arrangement order of the attribute information in the registration information may be arbitrary.
  • the attribute information connection unit 12 extracts the attribute information from the registration information, and generates a connection attribute value obtained by connecting the attribute information in a predetermined order (step S102).
  • the attribute information connecting unit 12 rearranges the attribute information based on the attribute name.
  • Arrangement order may be alphabetical order, Japanese syllabary order, numerical ascending / descending order.
  • a setting file for determining the arrangement order may be prepared in the attribute information linking unit 12 and rearrangement may be performed according to the setting file.
  • the attribute information linking means 12 sorts the attribute names in the alphabetical order for the registered information ⁇ (age, 20), (gender, F), (location, Tokyo) ⁇ and calls it “F20 Tokyo”. Generate concatenated attribute values.
  • the attribute information connection unit 12 passes the connection attribute value to the hash generation unit 13.
  • the hash generation unit 13 When the hash generation unit 13 receives the connection attribute information from the attribute information connection unit 12, the hash generation unit 13 performs hash conversion on the received connection attribute value (step S103).
  • the hash generated in step S103 corresponds to the hash of the registration information.
  • the hash generation unit 13 passes the converted hash of the registration information to the registration information processing unit 11.
  • the registration information processing unit 11 receives the hash obtained by converting the registration information
  • the registration information processing unit 11 sends an information registration request including the received hash and registration information to the registration information management unit 16.
  • the information registration unit 17 of the registration information management unit 16 Upon receiving the information registration request, the information registration unit 17 of the registration information management unit 16 creates an entry in the hash table 19 with the hash included in the information registration request as a key and the value as registration information (step S104).
  • the information registration unit 17 When registering an entry in the hash table 19, the information registration unit 17 checks whether there is already an entry having the same hash as a key. When there is an entry with the same hash key, the information registration unit 17 manages the list as an entry having the same hash key. In the information retrieval system, by performing information registration according to the procedure shown in FIG. 3, one hash is created for registration information including a wild card that can be any value in the attribute information. Managed by a hash table 19.
  • FIG. 4 shows an operation procedure of information evaluation.
  • Evaluation target information processing means 15 receives evaluation target information including one or more attribute information (step S201). The evaluation target information processing unit 15 passes the received evaluation target information to the combination generation unit 14.
  • the combination generation unit 14 Upon receiving the evaluation target information from the evaluation target information processing unit 15, the combination generation unit 14 extracts the attribute information from the evaluation target information and generates a combination of attribute information included in the evaluation target information (step S202). In step S202, the combination generation unit 14 generates a combination of attribute information in which 1 to M pieces of attribute information are selected from the extracted M pieces of attribute information, and sets them as new evaluation target information.
  • FIG. 5 shows a combination example of attribute information.
  • the evaluation target information received by the evaluation target information processing means 15 includes three pieces of attribute information (attribute information 1 (attribute name: age, attribute value 20), attribute information 2 (attribute name: gender, attribute value), attribute information 3 ( Attribute name: location, attribute value: Tokyo)).
  • the combination generation unit 14 sets three combinations ⁇ (age: 20) ⁇ , ⁇ (gender: M) ⁇ , and ⁇ (location: Tokyo) ⁇ selected from the three attribute information as new evaluation target information. 1 to 3.
  • the combination generation unit 14 selects three combinations of three pieces of attribute information ⁇ (age: 20), (sex: M) ⁇ , ⁇ (age: 20), (location: Tokyo) ⁇ , ⁇ (Gender: M), (Place: Tokyo) ⁇ is the new evaluation target information 4-6, one combination of three extracted from the three attribute information ⁇ (Age: 20), (Gender: M) , (Place: Tokyo) ⁇ is the new evaluation object information 7.
  • the combination generation unit 14 selects one of the combinations of attribute information generated in step S202 (new evaluation target information), and sends the selected evaluation target information to the attribute information connection unit 12 (step S203).
  • the attribute information linking unit 12 extracts attribute information from the evaluation target information received from the combination generating unit 14, and generates a linked attribute value obtained by rearranging the linked attribute information in a predetermined order (step S204). For example, the attribute information linking unit 12 receives the new evaluation object information 7 ⁇ (age: 20), (gender: M), (location: Tokyo) ⁇ in FIG. Sorting is performed in the order of ten characters, and a concatenated attribute value “M20 Tokyo” is generated by concatenating the attribute values in the order of “sex”, “age”, and “location”.
  • the combination generation unit 14 determines whether all the new evaluation target information generated in step S202 has been selected (step S205). If the combination generation unit 14 determines that not all the evaluation target information has been selected (step S205; N), the process returns to step S203, selects one from the unselected new evaluation target information, and selects the selected new information. Information to be evaluated is sent to the attribute information linking means 12. By repeatedly performing steps S203 to S205, the attribute information linking unit 12 generates a linked attribute value by linking attribute values in a predetermined order for all the new evaluation target information generated in step S202.
  • the attribute information connection unit 12 sends the generated connection attribute value to the hash generation unit 13.
  • the hash generation means 13 selects one of the received linked attribute values and converts the linked attribute value into a hash (step S206).
  • the hash generation unit 13 determines whether or not all the received connection attribute values have been selected (step S207). When there is an unselected linked attribute value (step S207; N), the hash generation unit 13 returns to step S206, selects one of the unselected linked attribute values, and generates a hash. The hash generation unit 13 repeats steps S206 and S207 to convert the connection attribute values into hashes for all of the connection attribute values corresponding to the new evaluation target information generated in step S202.
  • the hash generation unit 13 sends the hash obtained by converting the connection attribute value, that is, the hash corresponding to the new evaluation target information generated in step S202, to the evaluation target information processing unit 15.
  • the evaluation target information processing unit 15 selects one of the received hashes and sends an information search request including the selected hash to the registered information management unit 16.
  • the information search means 18 of the registered information management means 16 searches the hash table 19 and receives the received information search request.
  • An entry with the hash included in the key as a key is extracted (step S208).
  • the information search unit 18 passes the extracted entry registration information to the evaluation target information processing unit 15.
  • the evaluation target information processing means 15 determines whether or not all hashes received from the attribute information linking means 12 have been selected (step S209). When all the hashes have not been selected (step S209; N), the evaluation target information processing means 15 returns to step S208, selects one of the unselected hashes, and retrieves information including the selected hashes The request is sent to the registration information management means 16.
  • the evaluation target information processing unit 15 repeatedly performs steps S208 and S209 to send an information search request including a hash corresponding to the new evaluation target information generated in step S202 to the registered information management unit 16 to search for information. I do. On the other hand, when all hashes have been searched (step S209; Y), this flow ends.
  • the combination generation unit 14 generates a combination of 1 to M pieces of attribute information extracted from the evaluation target information having M pieces of attribute information.
  • the attribute information connection unit 12 For each combination generated by the combination generation unit 14, the attribute information connection unit 12 generates a connection attribute value obtained by connecting the attribute values of the attribute information included in each combination.
  • the hash generation unit 13 generates a hash based on the connection attribute value generated by the attribute information connection unit 12.
  • the information search means 18 searches the hash table 19 and extracts registration information registered in association with a hash that matches any of the hashes generated by the hash generation means 13.
  • 1 to M pieces of attribute information included in the evaluation target information are extracted and combined to generate a combination, and attribute values of the attribute information included in the combination are concatenated and converted to a hash.
  • attribute values of the attribute information included in the combination are concatenated and converted to a hash.
  • registration information including a wild card indicating that the attribute value may be arbitrary A hash identical to the hash of the registration information can be obtained.
  • all the hashes that are keys of registration information that should match the evaluation target information are created from the evaluation target information, and the hash table 19 is searched.
  • the hash of the registration information and the evaluation target information is the order of the attribute information even if the content of the included attribute information itself is the same. Depending on, it becomes a different value.
  • registration information is ⁇ (age: 20s), (sex: M) ⁇ , and ⁇ (sex: M), (age: 20s) ⁇ is given as evaluation target information. It can be said that the registration information and the evaluation target information are the same in the content of the information, except that the arrangement order of the attribute information is different.
  • the registration information ⁇ (age: 20s), (sex: M) ⁇ matches the evaluation target information ⁇ (sex: M), (age: 20s) ⁇ .
  • a hash (Hash (20's M)) generated based on the registration information ⁇ (age: 20s), (sex: M) ⁇ and evaluation object information ⁇ (gender: M), (age: 20s) ⁇
  • the hash table is searched using the hash of the evaluation target information ⁇ (gender: M), (age: 20s) ⁇ .
  • registration information ⁇ (age: 20s), (gender: M) ⁇ that should be searched is not searched.
  • the attribute information included in the registration information and the evaluation target information is rearranged in a predetermined order in the attribute information connection unit 12 with respect to the above problem.
  • the hash generation unit 13 generates a hash based on the attribute values of the attribute information concatenated in a predetermined order. In this way, if the contents of the attribute information are the same, the hash registered together with the registration information in the hash table 19 and the hash generated from the evaluation target information at the time of information search without depending on the order of arrangement. Can be set to the same value.
  • the hash table 19 is registered in association with the registration information ⁇ (age: 20s), (gender: M) ⁇ , and the evaluation target information ⁇ (gender: M) in the information search. , (Age: 20s) ⁇ can be made the same value. Therefore, in this embodiment, even if the alignment of the attribute information in the registration information and the evaluation target information does not match, the information search using the hash table can be performed.
  • a second embodiment of the present invention will be described.
  • the configuration of the information search system of this embodiment is the same as the configuration of the information search system of the first embodiment shown in FIG.
  • attribute selection information that specifies attribute information to be used when the combination generation unit 14 generates a combination is introduced.
  • the evaluation target information processing means 15 receives the evaluation target information and the attribute selection information.
  • the attribute selection information is information that is input as necessary.
  • the evaluation target information processing unit 15 sends the evaluation target information and the attribute selection information to the combination generation unit 14.
  • the combination generation unit 14 extracts 1 to M pieces of attribute information from the evaluation target information and generates a combination, as in the first embodiment.
  • the combination generation unit 14 generates a combination including the attribute information specified by the attribute selection information from combinations obtained by extracting 1 to M pieces of attribute information from the evaluation target information. To do. In other words, the combination generation unit 14 generates 1 to M combinations including the attribute information specified by the attribute selection information from the evaluation target information including M pieces of attribute information.
  • FIG. 6 shows information received by the evaluation target information processing means 15.
  • the attribute selection information is changed attribute information indicating attribute information that has been changed from the evaluation target information used in the previous information search.
  • the changed attribute information is attribute name: location. That is, when the evaluation object information shown in FIG. 6 is compared with the previous evaluation object information, the attribute information that is different is the part of (place: Kanagawa). The other part (attribute name: gender, age) has the same attribute value as the attribute information in the previous evaluation target information.
  • the changed attribute information may be attribute information (attribute name and attribute value) of a changed part used for generating a combination, or only the attribute name of attribute information used for generating a combination.
  • FIG. 7 shows a specific example of the combination generated by the combination generation means 14.
  • the combination generation unit 14 generates a combination including “attribute name: location” indicated by the change attribute information from the evaluation target information illustrated in FIG. 6. These are set as new evaluation target information.
  • FIG. 5 as a result of using all combinations as new evaluation target information, there are seven new evaluation target information (number of combinations).
  • the number of new evaluation targets is four.
  • the operation procedure of information registration is the same as the procedure in the first embodiment shown in FIG.
  • the operation procedure for information evaluation is also the same as the procedure in the first embodiment shown in FIG.
  • the attribute selection information is input together with the evaluation target information to the evaluation target information processing means 15
  • the operation of the combination of attribute information generated by the generation of the combination performed in step S202 is different from the first embodiment. Hereinafter, this difference will be described.
  • the evaluation target information processing unit 15 sends the evaluation target information and the change attribute information to the combination generation unit 14.
  • the combination generation unit 14 receives the evaluation target information and the change attribute information from the evaluation target information processing unit 15, the combination generation unit 14 extracts the attribute information from the evaluation target information.
  • the combination generation unit 14 generates a combination for selecting 1 to M pieces of attribute information including the attribute information indicated by the changed attribute information from the M pieces of attribute information, where the number of pieces of attribute information included in the evaluation target information is M. To do.
  • the combination generation unit 14 receives the evaluation target information ⁇ (age: 20), (gender: M), (location: Kanagawa) ⁇ and the change attribute information ⁇ location ⁇ shown in FIG.
  • a combination ⁇ (place: Kanagawa) ⁇ that extracts one including attribute name: location attribute information from the three attribute information included in the information
  • the combination generation unit 14 passes these combinations to the attribute information connection unit 12 as new evaluation target information.
  • the attribute information linking unit 12 determines the attribute value for the combination including the attribute information indicated by the changed attribute information among the attribute information combinations included in the evaluation target information created in step S202. A concatenated attribute value obtained by concatenating is generated.
  • the hash generation unit 13 generates a hash based on the linked attribute value generated by the attribute information coupling unit 12. Since the attribute information linking means 12 generates a linked attribute value for a combination including the attribute information indicated by the changed attribute information among the combinations of attribute information included in the evaluation target information, the hash generation means 13 is included in the evaluation target information. Among the combinations of attribute information to be generated, a hash corresponding to the combination of attribute information indicated by the changed attribute information is generated.
  • the information search means 18 searches the hash table 19 using the hash generated by the hash generation means 13.
  • the combination generation unit 14 generates a combination including the attribute information designated by the attribute designation information among the combinations of attribute information included in the evaluation target information.
  • the attribute information connecting unit 12 connects the attribute information included in the combination generated by the combination generating unit 14 in a predetermined order.
  • the hash generation unit 13 generates a hash from the connected attribute values connected by the attribute information connection unit 12.
  • the evaluation target information processing unit 15 sends an information search request including the hash generated by the hash generation unit 13 to the registered information management unit 16.
  • the information search means 18 searches the hash table 19, extracts an entry using a hash that matches the hash included in the information search request as a key, and sends it to the evaluation target information processing means 15.
  • the number of combinations generated by the combination generation unit 14 is reduced as compared to the first embodiment, and the number of generated hash and the number of hash table searches are reduced as compared with the first embodiment. Since the number is reduced, processing of the entire system can be reduced.
  • an information search is performed with a certain evaluation target information 1 and then an information search is performed with another evaluation target information 2.
  • the information search system extracts registration information that matches the combination of attribute information included in the evaluation target information with respect to the evaluation target information 1 according to the procedure described in the first embodiment.
  • the changed attribute information (attribute designation information) indicating the attribute information different between the evaluation target information 1 and the evaluation target information 2 together with the evaluation target information 2 in the evaluation target information processing means 15. Enter.
  • the information search system performs an information search using a combination hash including the change attribute information.
  • the combination generated by the information search of the evaluation target information 2 does not include a combination of attribute information that does not include the attribute information indicated by the changed attribute information.
  • attribute information other than the attribute information indicated by the change attribute information is included in the evaluation target information 1, and therefore does not include the attribute information indicated by the change attribute information.
  • a combination of attribute information has already been created at the time of information retrieval of the evaluation target information 1. Therefore, it is guaranteed that registration information that matches a combination of attribute information common to the evaluation target information 1 and the evaluation target information 2 is extracted at the time of information search of the evaluation target information 1. For this reason, there is no problem even if it is not extracted by the information search of the evaluation target information 2.
  • the hash table 19 there are entries including registration information ⁇ (age: 20s), (sex: M) ⁇ and ⁇ (age: 20s), (sex: M), (location: Kanagawa) ⁇ .
  • evaluation target information ⁇ (age: 20s), (gender: M), (location: Tokyo) ⁇ is input to the evaluation target information processing unit 15, the combination generation unit 14 displays 7 in FIG. Create one combination.
  • the information search system converts the seven combinations (new evaluation target information 1 to 7) shown in FIG. 5 into a hash and performs an information search to register information ⁇ (age: 20s), (gender: M) ⁇ Is extracted.
  • the information search for the evaluation target information 2 is performed following the information search for the evaluation target information 1.
  • the evaluation target information processing means 15 indicates the changed part from the evaluation target information 1.
  • Change attribute information ⁇ (place: Kanagawa) ⁇ is input (FIG. 6).
  • the combination generation unit 14 generates a combination including (location: Kanagawa) among the combinations of attribute information included in the evaluation target information 2 (FIG. 7).
  • the information search system converts the four combinations (new evaluation target information 1 to 4) shown in FIG.
  • the information search system does not extract ⁇ (age: 20s), (sex: M) ⁇ in the information search for the evaluation target information 2.
  • the number of pieces of attribute information included in the evaluation target information is M, and the combination generation unit 14 Generate street combinations. In the first embodiment, a hash is generated for these combinations, and the hash table 19 is searched.
  • combinations generated by the combination generation unit 14 are limited to combinations including the attribute information indicated by the attribute designation information among the combinations of attribute information included in the evaluation target information. Yes.
  • the combinations generated by the combination generation unit 14 By limiting the combinations generated by the combination generation unit 14 to the combinations including the attribute information indicated by the attribute designation information, the information search for the evaluation target information that has already been performed does not match, but the information search for the current evaluation target information is performed. Registration information that matches as a result can be extracted.
  • This embodiment has an effect of reducing the number of times of hash generation and hash table search compared to the first embodiment in which all combinations are generated, and has an effect of reducing the processing amount of the entire system. .
  • FIG. 8 shows an information search system according to the third embodiment of the present invention.
  • the information search system of this embodiment includes a registered information processing unit 21, a combination generating unit 24, a hash generating unit 23, an attribute information linking unit 22, an evaluation target information processing unit 25, and a registered information management unit 26.
  • the registered information management unit 26 includes an information registration unit 27 and an information search unit 28.
  • the registered information processing means 21, the combination generating means 24, the hash generating means 23, the attribute information linking means 22, and the information registering means 27 correspond to an information management device.
  • a combination of evaluation target information is generated using the combination generation unit 14 (FIG. 1), and the connection attribute value is hash-transformed.
  • a combination of registration information is generated using the combination generation unit 24, and the connection attribute value is hash-converted. This is the main difference between the first embodiment and the third embodiment.
  • the registration information processing means 21 receives registration information including one or more attribute information.
  • the evaluation target information processing means 25 receives evaluation target information including one or more attribute information.
  • the registration information and the evaluation target information are the same as those shown in FIG.
  • the registered information management means 26 registers information and searches for registered information.
  • the combination generation unit 24 includes a pattern storage unit 30 that stores attribute information handled by the information search system.
  • the pattern storage unit 30 stores attribute values of attribute information that can be handled as registration information in advance.
  • the combination generation unit 24 receives registration information from the registration information processing unit 21.
  • the combination generation unit 24 identifies which attribute name attribute information is not included in the received registration information among the attribute information that can be input.
  • the combination generation unit 24 refers to the pattern storage unit 30 and generates a complementary pattern composed of combinations of attribute values of attribute information not included in the registration information.
  • the combination generation unit 24 adds registration information to the generated complementary pattern and uses this as complementary attribute information.
  • the combination generation unit 24 sets the generated complementary attribute information as new registration information.
  • Attribute information linking means 22 links attribute values of attribute information included in registration information and evaluation target information. At that time, the attribute information connecting unit 22 rearranges the attribute information in a predetermined order and then generates a connected attribute value. For the registration information, the attribute information linking unit 22 rearranges and links the attribute values for the input registration information and the new registration information generated by the combination generation unit 24. That is, the attribute information linking means 22 is a linked attribute obtained by linking attribute values of included attribute information for the registration information input to the registration information processing means 21 and the complementary attribute information obtained by adding a complementary pattern to the registered information. Generate a value.
  • the order in which the attribute information is rearranged in the attribute information connection unit 22 may be the same as the order in which the attribute information is rearranged in the attribute information connection unit 12 in the first embodiment.
  • the hash generation unit 23 performs hash conversion on the linked attribute value generated by the attribute information coupling unit 22.
  • hash conversion for example, a general hash function represented by MD5 or SHA can be used.
  • the registered information management means 26 performs information management using the hash table 29.
  • the information registration unit 27 of the registration information management unit 26 receives an information registration request from the registration information processing unit 21.
  • the information registration unit 27 records the registration information and the hash converted by the hash generation unit 23 in the hash table 29 in association with each other. More specifically, the information registration unit 27 uses each hash corresponding to the input registration information and the new registration information generated by the combination generation unit 24 as a key in the hash table 29, and uses the registration information as a value. An entry is created and registration information is recorded in the hash table 29.
  • the information search means 28 receives an information search request from the evaluation target information processing means 25.
  • the information search unit 28 searches the hash table 29 and extracts the registered information registered in association with the hash that matches the hash of the evaluation target information generated by the hash generation unit 23.
  • FIG. 9 shows a data example of the pattern storage unit 30 and a data example of the complementary pattern generated by the combination generation means 24.
  • the pattern storage unit 30 stores an attribute value: M and an attribute value: F for the attribute name: gender.
  • the pattern storage unit 30 stores, for the attribute name: age, the attribute value: 20s, the attribute value: 30s, and the attribute value: 40s.
  • the pattern storage unit 30 stores, for the attribute name: location, the attribute value: Tokyo and the attribute value: Kanagawa.
  • the combination generation unit 24 compares the attribute name of the attribute information included in the registration information with the attribute name stored in the pattern storage unit 30.
  • the combination generation unit 24 specifies an attribute name that does not match the attribute name of the attribute information included in the registration information among the attribute names of the attribute information stored in the pattern storage unit 30.
  • the combination generation unit 24 identifies the attribute name of the attribute information that is missing from the received registration information among all the attribute information that can be included in the registration information.
  • the combination generation unit 24 specifies attribute name: gender and attribute name: location attribute information as missing attribute information.
  • the combination generation unit 24 refers to the pattern storage unit 30 and creates a combination (complement pattern) of the identified missing attribute information.
  • a combination complementary pattern
  • the combination generation unit 24 sets the complementary attribute information obtained by adding the attribute information included in the complementary pattern to the registration information as new registration information (new registration information 1 to 8).
  • FIG. 10 shows an operation procedure of information registration.
  • the registration information processing means 21 receives registration information including one or more attribute information (step S301).
  • the registration information processing unit 21 passes the received registration information to the combination generation unit 24.
  • the types of attribute information that can be input are N types of age, gender, location,...
  • the registration information may include all N types of attribute information, and the age, gender, and location information. Only three types of attribute information may be included.
  • the attribute information not included is treated as a wild card that can be any value.
  • the combination generation unit 24 receives the registration information from the registration information processing unit 21, generates a complementary pattern with reference to the pattern storage unit 30, and combines the registration pattern with the registration information (step S 302).
  • the combination generation unit 24 first extracts attribute information from the registration information, and compares the attribute name of the extracted attribute information with the attribute name of the attribute information stored in the pattern storage unit 30.
  • the combination generation unit 24 specifies attribute names that are not included in the registration information among the attribute names of the attribute information stored in the pattern storage unit 30.
  • the combination generation unit 24 selects attribute information of attribute names not included in the registration information one by one for each attribute name, and generates a complementary pattern combining the attribute information.
  • the combination generation unit 24 generates complementary attribute information obtained by adding the attribute information of the registration information to the complementary pattern as new registration information.
  • the combination generation unit 24 selects one of the registration information (original registration information) received from the registration information processing unit 21 and the new registration information generated in step S302, and sends it to the attribute information connection unit 22 (step S303). .
  • the attribute information linking unit 22 extracts attribute information from the registration information received from the combination generation unit 24, and generates a linked attribute value by linking the attribute information in a predetermined order (step S304).
  • the combination generation unit 24 determines whether all registration information has been selected (step S305). When unselected registration information remains (step S305; N), the combination generation unit 24 returns to step S303, selects one of the unselected registration information, and sends it to the attribute information connection unit 22. . By repeatedly performing steps S303 to S305, the attribute information linking unit 22 generates a linked attribute value by linking attribute values in a predetermined order for the original registration information and the new registration information generated in step S302. To do.
  • the attribute information connection unit 22 sends the generated connection attribute information to the hash generation unit 23.
  • the hash generation unit 23 selects one of the received linked attribute values and performs hash conversion on the linked attribute value (step S306).
  • the hash generation unit 23 determines whether or not all of the received connection attribute values have been selected (step S307). If there is an unselected connection attribute value (step S307; N), the process returns to step S306, where no selection is made. One of the connected attribute values is selected, and a hash is generated.
  • the hash generation means 23 repeats steps S306 and S307, thereby converting the linked attribute value corresponding to the original registration information and the new registration information generated in step S302 into a hash.
  • the attribute information linking unit 22 sends the hash obtained by converting the linked attribute value, that is, the hash corresponding to the original registration information and the new registration information generated in step S302, to the registration information processing unit 21.
  • the registration information processing unit 21 selects one of the received hashes and sends an information registration request including the selected hash and registration information to the registration information management unit 26.
  • the information registration unit 27 of the registration information management unit 26 registers values in the hash table 29 using the hash included in the information registration request as a key. An entry is created as information, and registration information is managed using a hash (step S308).
  • the information registering means 27 checks whether or not there is already an entry having the same hash as a key, and if it exists, manages the list as an entry having the same hash key.
  • the registered information processing means 21 determines whether or not all hashes received from the attribute information linking means 22 have been selected (step S309). If all the hashes have not been selected (step S309; N), the registration information processing means 21 returns to step S308, selects one of the unselected hashes, and an information registration request including the selected hashes Is sent to the registration information management means 26.
  • the information registration unit 27 of the registration information management unit 26 repeatedly performs steps S208 and S309 to obtain a hash corresponding to the original registration information and a hash corresponding to the new registration information generated in step S302. Register in table 29. By performing information registration according to the procedure illustrated in FIG. 10, registration information can be associated with the hash of all the evaluation target information patterns that match the registration information and managed by the hash table 29. On the other hand, when all hashes are registered (step S309; Y), this flow ends.
  • FIG. 11 shows an operation procedure of information evaluation.
  • a description will be given with reference to FIG. 11
  • Evaluation target information processing means 25 receives evaluation target information including one or more attribute information (step S401). The evaluation target information processing unit 25 sends the evaluation target information to the attribute information connection unit 22.
  • the attribute information linking unit 22 extracts attribute information from the evaluation target information received from the evaluation target information processing unit 25, rearranges the attribute information in a predetermined order, and generates a linked attribute value by connecting the attribute values (step S402). ).
  • the attribute information connection unit 22 sends the generated connection attribute value to the hash generation unit 23.
  • the hash generation unit 23 receives the linked attribute value from the attribute information coupling unit 22.
  • the hash generation unit 23 performs hash conversion on the connection attribute value of the evaluation target information received from the attribute information connection unit 22 (step S403).
  • the hash generation unit 23 sends the converted hash to the evaluation target information processing unit 25.
  • the evaluation target information processing unit 25 receives the hash corresponding to the evaluation target information
  • the evaluation target information processing unit 25 sends an information search request including the received hash to the registered information management unit 26.
  • the registered information management unit 26 When the registered information management unit 26 receives the information search request from the evaluation target information processing unit 25, the registered information management unit 26 acquires an entry using the hash included in the information search request as a key from the hash table 29 (step S404). The registration information management unit 26 passes the acquired registration information of the entry to the evaluation target information processing unit 25.
  • the hash table 29 In the hash table 29, not only the hash generated from the registration information itself at the time of information registration, but also a hash generated from complementary attribute information obtained by adding a complementary pattern to the registration information is registered. Therefore, by performing an information search according to the procedure shown in FIG. 11, even when the registration information includes a wild card, registration information that matches the evaluation target information can be extracted from the evaluation target information.
  • the combination generation unit 24 refers to the pattern storage unit 30, and among the attribute information that can be handled as registration information, from the combination of attribute information that is not included in the registration information input to the registration information processing unit 21.
  • a complementary pattern is generated, and complementary attribute information obtained by adding registration information to the complementary pattern is used as new registration information.
  • the attribute information connection unit 22 generates a connection attribute value obtained by connecting attribute values for the registration information and the complementary attribute information obtained by adding a complementary pattern to the registration information.
  • the hash generation means 23 performs a hash transform on the connection attribute value generated by the attribute information connection means 22.
  • the information registration unit 27 registers the registration information in the hash table 29 in association with the hash converted by the hash generation unit 23.
  • the new registration information obtained by adding the registration information to the complementary pattern generated by the combination generation unit 24 matches the pattern of the evaluation target information to be matched in the information search.
  • the information registration unit 27 registers the hash corresponding to the registration information and the hash corresponding to the new registration information generated by the combination generation unit 24 in the hash table 29 in association with the registration information. By performing such information registration, it is possible to extract not only registered information that completely matches the evaluation target information but also registration information including a wild card by using the hash of the evaluation target information when searching for information.
  • the effect obtained by the attribute information linking unit 22 linking the attribute values of the registration information and the evaluation target information in a predetermined order is the same as that of the first embodiment.
  • the third embodiment Comparing the third embodiment with the first and second embodiments, in the third embodiment, it is necessary to input attribute values of attribute information that can be handled as registration information to the pattern storage unit 30 in advance. However, in the third embodiment, unlike the first and second embodiments, it is not necessary to generate a combination of evaluation target information at the time of information retrieval, so that the processing time for information evaluation is reduced to the first and second embodiments. There is an effect that can be shortened as compared with the form. From this, it can be said that this embodiment is effective for the system which performs the stream process which processes evaluation object information in real time.
  • the information search system of this invention an information management apparatus, the information search method, the information management method, and a recording medium are limited only to the said embodiment.
  • the present invention includes various modifications and changes made from the configuration of the above embodiment.
  • the information search system of the present invention includes, as a minimum configuration, an evaluation target information processing unit, a combination generation unit, an attribute information connection unit, a hash generation unit, and an information search unit.
  • the evaluation target information processing means inputs evaluation target information having M pieces of attribute information (M is an integer of 1 or more) including attribute values.
  • the combination unit generates 1 to M pieces of attribute information from the evaluation target information and combines them.
  • the attribute information linking unit generates a linked attribute value obtained by linking attribute values of attribute information included in each combination for each combination.
  • the hash conversion means converts the concatenated attribute value into a hash.
  • An information search means searches a hash table for storing registration information having one or more attribute information in association with a hash obtained by converting a concatenated attribute value obtained by concatenating attribute values of attribute information included in the registration information, and generating a hash Registration information registered in association with a hash that matches one of the hashes converted by the means is extracted.
  • the minimum configuration of the information search method of the present invention is to generate a combination of 1 to M pieces of attribute information extracted from evaluation target information having M pieces of attribute information including attribute values (M is an integer of 1 or more). For each of the generated combinations, a step of generating a linked attribute value obtained by concatenating attribute values of attribute information included in each combination, a step of converting the linked attribute value generated in the attribute information linking step into a hash, and attribute information A hash table that stores one or more pieces of registered information in association with a hash obtained by converting a concatenated attribute value obtained by concatenating attribute values of attribute information included in the registered information, and stores the hash information converted in the step of converting into a hash. And a step of extracting registration information registered in association with a hash that matches any one of them.
  • the minimum configuration of a computer-readable recording medium on which the program of the present invention is recorded is 1 to M pieces of attribute information from evaluation target information having M pieces of attribute information including attribute values (M is an integer of 1 or more). Processing to generate combinations that are extracted and combined, processing for generating linked attribute values obtained by concatenating attribute values of attribute information included in each combination, and conversion of the linked attribute values into hashes
  • a hash table that stores processing and registration information having one or more attribute information in association with a hash obtained by converting a concatenated attribute value obtained by concatenating attribute values of attribute information included in the registration information; Processing to extract registered information associated with a hash that matches one of the converted hashes It is formed.
  • a combination of attribute information included in the evaluation target information is generated, and the attribute information included in the generated combination is linked.
  • the hash table is searched using the hash corresponding to the combination, and the registration information is extracted.
  • the combination generated by extracting the attribute information from the evaluation target information matches the registration information to be matched with the evaluation target information. Therefore, by searching the hash table using the hash corresponding to the generated combination, not only the registration information that completely matches the evaluation target information but also the number of attribute information is smaller than the evaluation target information, that is, the wild card is included. Registration information can be extracted.
  • the information search system of the present invention includes, as a minimum configuration, a registered information processing unit, a combination generating unit, an attribute information connecting unit, a hash generating unit, an information registering unit, an evaluation target information processing unit, an information searching unit, Have
  • the registration information processing means inputs registration information having one or more attribute information including attribute values.
  • the combination generation means refers to a pattern storage unit that stores attribute values of attribute information that can be handled as registration information, and from among attribute information that can be handled as registration information, from combinations of attribute values of attribute information that are not included in registration information A complementary pattern consisting of The combination generation unit generates complementary attribute information obtained by adding a complementary pattern to the registration information.
  • the attribute information linking means generates a linked attribute value obtained by linking the attribute values of the included attribute information for each of the registration information and the complementary attribute information.
  • the hash generation means converts the concatenated attribute value into a hash.
  • the information registration unit registers the registration information in the hash table in association with the hash converted by the hash generation unit.
  • the evaluation target information processing means inputs evaluation target information including one or more attribute information, and uses attribute information linking means to generate a hash of the concatenated attribute values concatenating the attribute values included in the input evaluation target information.
  • An information retrieval request including a hash converted by means is generated.
  • the information search means searches the hash table and extracts registration information registered in association with a hash that matches the hash included in the information search request.
  • the minimum configuration of the information search method of the present invention is to input registration information having at least one attribute information including attribute values, and register a pattern by storing an attribute value of attribute information that can be handled as registration information.
  • attribute information that can be handled as information each of the step of generating a complementary pattern composed of combinations of attribute values of attribute information not included in the registered information, each of the registered information and the complementary attribute information obtained by adding the complementary pattern to the registered information And generating a linked attribute value obtained by concatenating the attribute values of the included attribute information, converting the linked attribute value into a hash, and hashing the registered information in association with the hash converted in the step of converting into a hash.
  • Step to be registered in the table and evaluation target information including one or more attribute information are input, and the attribute value included in the input evaluation target information Converting the linked linked attribute values to the hash to search the hash table, a structure and a step of extracting the registered information registered associated with the hash that matches the hash converts the evaluation information.
  • the minimum configuration of a computer-readable recording medium that records the program of the present invention inputs registration information having one or more attribute information including attribute values to the computer and stores attribute values of attribute information that can be handled as registration information.
  • a process for generating a complementary pattern composed of a combination of attribute values of attribute information not included in the registration information, registration information, and complement to the registration information For each of the complemented attribute information with the added pattern, a process for generating a linked attribute value obtained by concatenating the attribute values of the included attribute information, a process for converting the linked attribute value into a hash, and a process for converting the registration information into a hash.
  • the evaluation target information including one or more attribute information and the process of registering in the hash table in association with the hash converted by the process Processing to convert the concatenated attribute value that concatenates the attribute values included in the input evaluation target information into a hash, and registration registered by associating the hash table with the hash that matches the hash that converted the evaluation target information And a process for extracting information.
  • a pattern storage unit is used to obtain a combination of attribute values of attribute information not included in the registration information.
  • a complementary pattern consisting of In the registration to the hash table not only the hash corresponding to the registration information but also the hash corresponding to the complementary attribute information obtained by adding the complementary pattern to the registration information is associated with the registration information and registered in the hash table.
  • the complementary attribute information obtained by adding the complementary pattern to the registered information matches the pattern of the evaluation target information that should match the registered information. Therefore, by searching the hash table using the hash corresponding to the evaluation target information, not only the registration information that completely matches the evaluation target information but also the number of attribute information is smaller than the evaluation target information, that is, the wild card is included. Registration information can be extracted.
  • the information management apparatus includes a registered information processing unit, a combination generation unit, an attribute information connection unit, a hash generation unit, and an information registration unit as a minimum configuration.
  • the registration information processing means inputs registration information having one or more attribute information including attribute values.
  • the combination generation means refers to a pattern storage unit that stores attribute values of attribute information that can be handled as registration information, and from among attribute information that can be handled as registration information, from combinations of attribute values of attribute information that are not included in registration information A complementary pattern consisting of The combination generation unit generates complementary attribute information obtained by adding a complementary pattern to the registration information.
  • the attribute information linking means generates a linked attribute value obtained by linking the attribute values of the included attribute information for each of the registration information and the complementary attribute information.
  • the hash generation means converts the concatenated attribute value into a hash.
  • the information registration unit registers the registration information in the hash table in association with the hash converted by the hash generation unit.
  • the minimum configuration of the information management method of the present invention is to input registration information having at least one attribute information including attribute values, and register a pattern storage unit that stores attribute values of attribute information that can be handled as registration information.
  • attribute information that can be handled as information each of the step of generating a complementary pattern composed of combinations of attribute values of attribute information not included in the registered information, each of the registered information and the complementary attribute information obtained by adding the complementary pattern to the registered information And generating a linked attribute value obtained by concatenating the attribute values of the included attribute information, converting the linked attribute value into a hash, and hashing the registered information in association with the hash converted in the step of converting into a hash. And a step of registering in the table.
  • the minimum configuration of a computer-readable recording medium that records the program of the present invention inputs registration information having one or more attribute information including attribute values to the computer and stores attribute values of attribute information that can be handled as registration information.
  • a process for generating a complementary pattern composed of a combination of attribute values of attribute information not included in the registration information, registration information, and complement to the registration information For each of the complemented attribute information with the added pattern, a process for generating a linked attribute value by concatenating the attribute values of the included attribute information, a process for converting the linked attribute value to a hash, and a process for converting the registration information to a hash
  • a process of registering in the hash table in association with the hash converted by the process is executed.
  • the pattern storage unit when registering information, the pattern storage unit is used to combine attribute values of attribute information not included in the registration information.
  • a complementary pattern consisting of In the registration to the hash table not only the hash corresponding to the registration information but also the hash corresponding to the complementary attribute information obtained by adding the complementary pattern to the registration information is associated with the registration information and registered in the hash table.
  • the complementary attribute information obtained by adding the complementary pattern to the registered information matches the pattern of the evaluation target information that should match the registered information.
  • the present invention can be applied to a system that executes specific processing at high speed for input evaluation target information such as grouping processing, stream processing, and rule matching. Further, the present invention can also be applied to a use such as a similar search for searching for information that does not completely match but includes a lot of matching information.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 評価対象情報処理手段(15)は、属性情報をM個有する評価対象情報を入力する。組み合わせ生成手段(14)は、評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成する。属性情報連結手段(12)は、組み合わせのそれぞれについて、属性情報の属性値を連結した連結属性値を生成する。ハッシュ生成手段(13)は、連結属性値をハッシュに変換する。ハッシュテーブル(19)は、登録情報を、その登録情報に対応するハッシュと対応付けて記憶している。情報検索手段(18)は、ハッシュテーブル(19)を検索し、ハッシュ生成手段(13)が変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する。

Description

情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体
 本発明は、情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体に関し、更に詳しくは、ハッシュを用いて登録情報の検索を行う情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体に関する。
 情報検索システムは、登録された情報の中から、所望の条件にマッチする情報を抽出するシステムである。特許文献1は、情報検索システム(装置)が記載された文献である。特許文献1に記載の検索装置は、記憶部と、キーハッシュ算出部と、検索部とを有する。記憶部は、原データ領域と、インデックス領域とを有する。データ領域は、原データ群を格納する領域である。インデックス領域は、原データの格納場所を示す情報を格納する領域である。各原データの原データ領域のおける格納場所を示す情報は、インデックス領域における当該原データのハッシュ値に対応する場所に格納されている。
 検索に際して、キーハッシュ算出部は、検索キーのハッシュを算出する。検索部は、インデックス領域における、検索キーのハッシュ値に対応する場所を参照して、原データの格納場所を抽出する。その後、検索部は、原データ領域における、抽出した原データの格納場所で示される場所から、所要の原データを抽出する。一般に、情報検索では、検索対象の情報が多くなるほど、検索に要する時間が長くなる。特許文献1は、ハッシュを用いて、検索キーに一致するデータを抽出しており、情報量が増加しても、検索を高速に行うことができる効果がある。
 ここで、特許文献2は、データ解析方法が記載された文献である。特許文献2では、発信者アドレス、受信者アドレス、ポート番号などのネットワークパケットの情報を入力して、ネットワーク上に頻出するアドレスやポートの組み合わせを抽出する。特許文献2では、例えば、3つの項目のデータに対して、項目数1用のキャッシュ、項目数2用のキャッシュ、項目数3用のキャッシュを用いる。項目数1用のキャッシュは、1つの項目データのハッシュと、そのデータの出現回数とを記憶する。項目数2用のキャッシュは、2つの項目データのハッシュと、2つのデータの組み合わせの出現回数とを記憶する。項目数3用のキャッシュは、3つの項目データのハッシュと、3つのデータの組み合わせの出現回数とを記憶する。
 例えば、特許文献2に記載の解析装置に、192.168.0.1(発信者アドレス)、192.168.1.1(受信者アドレス)、25(ポート番号)というデータが入力されたとする。解析装置は、“192.168.0.1”、“192.168.1.1”、“25”をそれぞれハッシュに変換する。解析装置は、“192.168.0.1”のハッシュ、“192.168.1.1”のハッシュ、“25”のハッシュが、それぞれ項目1用のキャッシュテーブルに記憶済みか否かを調べる。解析装置は、対応するハッシュが記憶されていなければ、出現回数1としてその項目データのハッシュを新たにキャッシュテーブルに登録する。解析装置は、記憶済みのときは、該当する項目データのハッシュの出現回数をインクリメントする。
 また、解析装置は、項目数2用のキャッシュテーブルに、3つの項目データから2つを選択した、“192.168.0.1”のハッシュと“192.168.1.1”のハッシュとの組み合わせ、“192.168.0.1”のハッシュと“25”のハッシュとの組み合わせ、“192.168.1.1”のハッシュと“25”のハッシュとの組み合わせが、それぞれ記憶済みか否かを調べる。解析装置は、記憶済みのときは、該当する組み合わせの出現回数をインクリメントする。更に、解析装置は、項目数3用のキャッシュテーブルに、“192.168.0.1”のハッシュと“192.168.1.1”のハッシュと“25”のハッシュとの組み合わせが記憶済みであるか否を調べ、記憶済みでないときは、その組み合わせの出現回数をインクリメントする。
特開2007-241378号公報(図1) 特開2005-285048号公報
 ここで、1以上の属性情報を含む登録情報を、ハッシュテーブルを用いて管理し、情報検索を行うことを考える。登録情報は、例えば、含み得る属性情報の種類が全部でN種類あったとして、N種類全ての属性情報がデータ(属性値)を持っている必要はなく、一部の属性情報は省略可能であるとする。例えば、属性名:年齢、属性名:性別、属性名:場所の属性情報を含み得る登録情報を考える。登録情報は、{(年齢,20代)、(性別,M)、(場所,東京)}というように、全ての属性情報を含んでいてもよく、或いは、属性名:場所が省略された{(年齢,20代)、(性別,M)}でもよい。省略された属性情報は、任意でよいものとして処理するものとする。
 {(年齢,20代),(性別,M)}という登録情報がシステムに登録されており、評価対象情報として{(年齢,20代),(性別,M),(場所,東京)}が与えられた場合を考える。この場合、{(年齢,20代),(性別,M)}という登録情報は、年齢、性別以外の属性情報については任意でよいので、{(年齢,20代),(性別,M),(場所,東京)}という評価対象情報に対してマッチする。しかし、{(年齢,20代),(性別,M)}と、{(年齢,20代),(性別,M),(場所,東京)}とは、異なる情報であるので、互いを基に作成したハッシュは大きく異なる。そのため、システムが登録情報をハッシュテーブルで管理する場合、{(年齢,20代),(性別,M),(場所,東京)}を基に作成したハッシュに基づいてハッシュテーブルを検索しても、そのハッシュは、{(年齢,20代),(性別,M)}を基に作成した作成されたハッシュと一致せず、その登録情報を含むエントリを抽出することはできない。
 上記のように、評価対象情報に含まれる属性情報の数と、登録情報の属性情報の数とが一致しない場合、それらを基に作成したハッシュが大きく異なる。このため、そのような評価対象情報を用いて、ハッシュテーブルから、属性値が任意でよいことを示すワイルドカードを含む登録情報を検索することができない。一般に、ハッシュテーブルを用いた情報検索は、完全一致検索を行う場合は、高速で動作し、有効であると言える。しかし、ハッシュを用いた情報検索は、情報をハッシュ変換することで、情報の意味や、連続性などが失われることから、完全一致検索ではない、連続関係や包含関係にある複数の情報の検索を、高速に行うことが困難である。
 特許文献2に記載の解析方法は、単に、ハッシュの組み合わせを用いて、キャッシュテーブルに、データの組み合わせに対する出現回数が記憶済みであるか否かを検索しているに過ぎない。従って、特許文献2に記載の解析方法は、上記ハッシュテーブルを用いた情報検索における問題点を解消することはできない。
 本発明は、上記に鑑み、ハッシュテーブルを用いた情報検索にて、登録情報が、属性値が任意でよいというワイルドカードを含んでいても、ワイルドカードを含まない評価対象情報にマッチする登録情報を検索できる情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体を提供することを目的とする。
 本発明は、上記目的を達成するために、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報を入力する評価対象情報処理手段と、前記評価対象情報処理手段に入力された評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成手段と、前記組み合わせ生成手段が生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、前記属性情報連結手段が生成した前記連結属性値をハッシュに変換するハッシュ生成手段と、前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ生成手段が変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索手段とを有する情報検索システムを提供する。
 本発明は、属性値を含む属性情報を1つ以上有する登録情報を入力する登録情報処理手段と、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記登録情報処理手段に入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成し、前記登録情報に前記補完パタンを加えた補完属性情報を生成する組み合わせ生成手段と、前記登録情報と、前記補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、前記属性情報連結手段で生成された前記連結属性値をハッシュに変換するハッシュ生成手段と、前記登録情報を、前記ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録手段と、前記属性情報を1つ以上含む評価対象情報を入力し、前記属性情報連結手段を用いて、入力された評価対象情報に含まれる属性値を連結した連結属性値を、前記ハッシュ生成手段を用いて変換したハッシュを含む情報検索要求を発生する評価対象情報処理手段と、前記ハッシュテーブルを検索し、前記情報検索要求に含まれるハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索手段とを有する情報検索システムを提供する。
 本発明は、属性値を含む属性情報を1つ以上有する登録情報を入力する登録情報処理手段と、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記登録情報処理手段に入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成し、前記登録情報に前記補完パタンを加えた補完属性情報を生成する組み合わせ生成手段と、前記登録情報と、前記補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、前記属性情報連結手段で生成された前記連結属性値をハッシュに変換するハッシュ生成手段と、前記登録情報を、前記ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録手段とを有する情報管理装置を提供する。
 本発明は、コンピュータが、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成ステップと、前記コンピュータが、前記生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、前記コンピュータが、属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、前記コンピュータが、前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ変換ステップで変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索ステップとを有する情報検索方法を提供する。
 本発明は、コンピュータが、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力した登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成ステップと、前記コンピュータが、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、前記コンピュータが、前記属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、前記コンピュータが、前記登録情報を、前記ハッシュ変換ステップで変換したハッシュに対応付けてハッシュテーブルに登録する情報登録ステップと、前記コンピュータが、前記属性情報を1つ以上含む評価対象情報を入力し、該入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換する評価対象情報ハッシュ変換ステップと、前記コンピュータが、前記ハッシュテーブルを検索し、前記評価対象情報ハッシュ変換ステップで生成されたハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索ステップとを有する情報検索方法を提供する。
 本発明は、コンピュータが、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力した登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成ステップと、前記コンピュータが、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、前記コンピュータが、前記属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、前記コンピュータが、前記登録情報を、前記ハッシュ変換ステップで変換したハッシュに対応付けてハッシュテーブルに登録する情報登録ステップとを有する情報管理方法を提供する。
 本発明は、コンピュータに、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成処理と、前記生成された組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結処理と、属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値をハッシュ変換した補完属性情報と対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ変換処理で変換されたハッシュの何れかと一致するハッシュと対応付けて登録された登録情報を抽出する情報検索処理とを実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
 本発明は、コンピュータに、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成処理と、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連処理と、前記属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、前記登録情報を、前記ハッシュ変換処理で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録処理と、前記属性情報を1つ以上含む評価対象情報を入力し、該入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換する評価対象情報ハッシュ変換処理と、前記ハッシュテーブルを検索し、前記評価対象情報ハッシュ変換処理で生成されたハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索処理とを実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
 本発明は、コンピュータに、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成処理と、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連処理と、前記属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、前記登録情報を、前記ハッシュ変換処理で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録処理とを実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
 本発明の情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体は、ハッシュテーブルを用いた情報検索にて、登録情報が、属性値が任意でよいというワイルドカードを含んでいても、ワイルドカードを含まない評価対象情報にマッチする登録情報を検索することができる。
本発明の第1実施形態の情報検索システムを示すブロック図である。 登録情報及び評価対象情報のデータ構造を示す図である。 情報登録の動作手順を示すフローチャートである。 情報評価の動作手順を示すフローチャートである。 属性情報の組み合わせの具体例を示す図である。 本発明の第2実施形態の情報検索システムが受信する評価対象情報を示す図である。 第2実施形態の情報検索システムで生成される評価対象情報の組み合わせを示す図である。 本発明の第3実施形態の情報検索システムを示すブロック図である。 パタン記憶部のデータ例、及び、組み合わせ生成手段で生成される補完パタンのデータ例を示す図である。 第3実施形態における情報登録の動作手順を示すフローチャートである。 第3実施形態における情報評価の動作手順を示すフローチャートである。
 以下、図面を参照し、本発明の実施の形態を詳細に説明する。図1は、本発明の第1実施形態の情報検索システムを示している。情報検索システムは、登録情報処理手段11、属性情報連結手段12、ハッシュ生成手段13、組み合わせ生成手段14、評価対象情報処理手段15、及び、登録情報管理手段16を有する。情報検索システム内の各手段の機能は、コンピュータシステム上で、所定のプログラムを実行することで実現できる。
 登録情報処理手段11は、1以上の属性情報を含む登録情報を受信する。登録情報処理手段11は、登録情報管理手段16に情報登録要求を送り、登録情報の記憶を要求する。
 評価対象情報処理手段15は、1以上の属性情報を含む評価対象情報を受信する。評価対象情報は、登録情報を検索する際の検索条件を表している。評価対象情報処理手段15は、登録情報管理手段16に検索要求を送り、評価対象情報に基づく情報の検索を要求する。
 登録情報管理手段16は、情報の登録、及び、登録された情報の検索を行う。
 図2は、登録情報及び評価対象情報のデータ構造を示している。登録情報及び評価対象情報は、1以上の属性情報で構成される。各属性情報は、属性名と属性値とを含む。情報検索システムで取り扱う属性情報が全部でN種類(Nは2以上の整数)あるとして、登録情報は、N種類全ての属性情報について属性値を持っている必要はない。一部の属性情報は、省略されていてもよい。省略された属性情報は、任意の値を持つと解釈される。評価対象情報についても同様である。
 組み合わせ生成手段14は、評価対象情報処理手段15から評価対象情報を受け取り、評価対象情報に含まれるM個(Mは1以上N以下の整数)の属性情報から、1~M個を取り出した組み合わせを生成する。組み合わせ生成手段14は、例えばM=3であれば、評価対象情報に含まれる3つの属性情報から1つ取り出した組み合わせ(3通り)、3つの属性情報から2つの属性情報を取り出して組み合わせた組み合わせ(3通り)、3つの属性情報から3つの属性情報を取り出して組み合わせた組み合わせ(1通り)の計10通りの組み合わせを生成する。これら組み合わせは、情報検索を行う際の評価対象情報として用いられる。
 属性情報連結手段12は、登録情報及び評価対象情報に含まれる属性情報を連結した連結属性値を生成する。その際、属性情報連結手段12は、属性情報を、所定の順序に並び替えた上で、属性値を連結する。ここで、属性情報連結手段12は、評価対象情報については、組み合わせ生成手段14で生成された各組み合わせに含まれる属性情報の属性値を連結する。
 ハッシュ生成手段13は、属性情報連結手段12にて属性情報が連結された登録情報又は評価対象情報(組み合わせ)を、ハッシュに変換する。ハッシュ生成手段13におけるハッシュ変換には、例えばMD5やSHAに代表されるような一般的なハッシュ関数を用いることができる。
 登録情報管理手段16は、情報登録手段17と情報検索手段18とを有する。登録情報管理手段16は、ハッシュテーブル19を用いて、情報管理を行う。
 ハッシュテーブル19は、登録情報を、登録情報に含まれる属性値を連結した連結属性値に基づいて生成されたハッシュに対応付けて記憶している。
 情報登録手段17は、登録情報処理手段11から情報登録要求を受ける。情報登録手段17は、登録情報と、ハッシュ生成手段13で変換された登録情報のハッシュとを対応付けてハッシュテーブル19に記録する。より詳細には、情報登録手段17は、情報登録要求を受けると、ハッシュテーブル19に、ハッシュをキーとし、登録情報を値とするエントリを作成し、登録情報をハッシュテーブル19に記録する。
 情報検索手段18は、評価対象情報処理手段15から、情報検索要求を受ける。情報検索手段18は、情報検索要求を受けると、ハッシュテーブル19を検索し、ハッシュ生成手段13が生成した評価対象情報のハッシュの何れか(組み合わせ生成手段14で生成された組み合わせに対応するハッシュ)と一致するハッシュに対応付けて登録された登録情報を抽出する。
 情報検索システムの動作は、大きく分けると、情報の登録を行う情報登録フローと、評価対象情報に対してマッチする登録情報を検索する情報評価フローとに分けることができる。
 まず、情報登録フローについて説明する。図3は、情報登録の際の動作手順を示している。以下、本図を参照して説明する。
 登録情報処理手段11は、1以上の属性情報を含む登録情報を受信する(ステップS101)。登録情報処理手段11は、登録情報を受信すると、属性情報連結手段12に受信した登録情報を渡す。
 例えば、情報検索システムで扱う属性情報の種類が、年齢、性別、場所を含むN種類あったとする。属性登録情報処理手段11は、N種類すべての属性情報を含む登録情報を受信してもよいし、年齢、性別、場所の3種類の属性情報のみを含む登録情報を受信してもよい。N種類の属性情報のうち、登録情報に含まれない属性情報は、どのような値であってもよいことを示すワイルドカードとして扱う。情報検索システムは、受信する可能性があるN種類の属性情報を、あらかじめ知っておく必要はない。また、登録情報における属性情報の並び順は任意でよい。
 属性情報連結手段12は、登録情報処理手段11から登録情報を受け取ると、登録情報から属性情報を抽出し、属性情報を所定の順番で連結した連結属性値を生成する(ステップS102)。属性情報連結手段12は、例えば、属性名に基づいて、属性情報を並び替える。並び順は、アルファベット順や、五十音順、数値の昇順/降順などが考えられる。或いは、属性情報連結手段12に、並び順を決定する設定ファイルを用意しておき、その設定ファイルに従って並び替えを行ってもよい。属性情報連結手段12は、例えば、{(年齢,20),(性別,F),(場所,東京)}という登録情報に対して、五十音順に属性名をソートし、「F20東京」という連結属性値を生成する。属性情報連結手段12は、連結属性値を、ハッシュ生成手段13に渡す。
 ハッシュ生成手段13は、属性情報連結手段12から連結属性情報を受け取ると、受け取った連結属性値をハッシュ変換する(ステップS103)。ステップS103で生成されたハッシュは、登録情報のハッシュに対応する。ハッシュ生成手段13は、変換した登録情報のハッシュを、登録情報処理手段11に渡す。登録情報処理手段11は、登録情報を変換したハッシュを受け取ると、受け取ったハッシュと登録情報とを含む情報登録要求を、登録情報管理手段16に送る。登録情報管理手段16の情報登録手段17は、情報登録要求を受け取ると、ハッシュテーブル19に、情報登録要求に含まれるハッシュをキーとし、値を登録情報とするエントリを作成する(ステップS104)。
 情報登録手段17は、ハッシュテーブル19へのエントリの登録を行う際に、既に同一のハッシュをキーに持つエントリが存在しているか否かを調べる。情報登録手段17は、同一ハッシュキーのエントリが存在するときは、同一のハッシュキーを持つエントリとしてリスト管理する。情報検索システムでは、図3に示す手順で情報登録を行うことで、属性情報にどのような値でもよいというワイルドカードを含んでいる登録情報に対して、1つのハッシュが作成され、登録情報がハッシュテーブル19で管理される。
 次いで、情報評価フローについて説明する。図4は、情報評価の動作手順を示している。以下、本図を参照して説明する。
 評価対象情報処理手段15は、1以上の属性情報を含む評価対象情報を受信する(ステップS201)。評価対象情報処理手段15は、受信した評価対象情報を組み合わせ生成手段14に渡す。
 組み合わせ生成手段14は、評価対象情報処理手段15から評価対象情報を受け取ると、評価対象情報から属性情報を抽出し、評価対象情報に含まれる属性情報の組み合わせを生成する(ステップS202)。組み合わせ生成手段14は、ステップS202では、抽出したM個の属性情報から、1~M個を選択した属性情報の組み合わせを生成し、それらを新たな評価対象情報とする。
 図5は、属性情報の組み合わせ例を示している。評価対象情報処理手段15が受信した評価対象情報は、3つの属性情報(属性情報1(属性名:年齢、属性値20)、属性情報2(属性名:性別、属性値)、属性情報3(属性名:場所、属性値:東京))を含んでいたとする。組み合わせ生成手段14は、それら3つの属性情報から1つを選択した3通りの組み合わせ{(年齢:20)}、{(性別:M)}、{(場所:東京)}を新たな評価対象情報1~3とする。また、組み合わせ生成手段14は、3つの属性情報から2つを選択した3通りの組み合わせ{(年齢:20),(性別:M)}、{(年齢:20),(場所:東京)}、{(性別:M),(場所:東京)}を新たな評価対象情報4~6とし、3つの属性情報から3つを取り出した1通りの組み合わせ{(年齢:20),(性別:M),(場所:東京)}を新たな評価対象情報7とする。
 組み合わせ生成手段14は、ステップS202で生成した属性情報の組み合わせ(新たな評価対象情報)のうちの1つを選択し、選択した評価対象情報を属性情報連結手段12に送る(ステップS203)。
 属性情報連結手段12は、組み合わせ生成手段14から受け取った評価対象情報から属性情報を抽出し、抽出した属性情報を所定の順番に並び替えて連結した連結属性値を生成する(ステップS204)。例えば、属性情報連結手段12は、組み合わせ生成手段14から、図5の新たな評価対象情報7{(年齢:20),(性別:M),(場所:東京)}を受け取り、属性名を五十音順にソートし、“性別”、“年齢”、“場所”の順番で属性値を連結した「M20東京」という連結属性値を生成する。
 組み合わせ生成手段14は、ステップS202で生成した新たな評価対象情報を全て選択したか否かを判断する(ステップS205)。組み合わせ生成手段14は、全ての評価対象情報を選択していないと判断すると(ステップS205;N)、ステップS203に戻って、未選択の新たな評価対象情報から1つを選択し、選択した新たな評価対象情報を属性情報連結手段12に送る。ステップS203~ステップS205を繰り返し行うことで、属性情報連結手段12は、ステップS202で生成された新たな評価対象情報の全てについて、所定の順番で属性値を連結した連結属性値を生成する。
 全ての評価対象情報について処理が行われた場合(ステップS205;Y)、属性情報連結手段12は、生成した連結属性値を、ハッシュ生成手段13に送る。ハッシュ生成手段13は、受け取った連結属性値のうちの1つを選択し、連結属性値をハッシュに変換する(ステップS206)。
 ハッシュ生成手段13は、受け取った連結属性値を全て選択した否かを判断する(ステップS207)。ハッシュ生成手段13は、未選択の連結属性値があるときは(ステップS207;N)、ステップS206に戻り、未選択の連結属性値の中から1つを選択して、ハッシュを生成する。ハッシュ生成手段13は、ステップS206、S207を繰り返し行うことで、ステップS202で生成された新たな評価対象情報に対応する連結属性値の全てについて、連結属性値をハッシュに変換する。
 ハッシュ生成手段13は、連結属性値を変換したハッシュ、つまり、ステップS202で生成された新たな評価対象情報に対応するハッシュを、評価対象情報処理手段15に送る。評価対象情報処理手段15は、ハッシュを受け取ると、受け取ったハッシュのうちの1つを選択し、選択したハッシュを含む情報検索要求を、登録情報管理手段16に送る。全ての連結属性値についてハッシュが作成された場合(ステップS207;Y)、登録情報管理手段16の情報検索手段18は、情報検索要求を受け取ると、ハッシュテーブル19を検索し、受け取った情報検索要求に含まれるハッシュをキーとするエントリを抽出する(ステップS208)。情報検索手段18は、抽出したエントリの登録情報を、評価対象情報処理手段15に渡す。
 評価対象情報処理手段15は、属性情報連結手段12から受け取ったハッシュを全て選択したか否かを判断する(ステップS209)。評価対象情報処理手段15は、全てのハッシュを選択していないときは(ステップS209;N)、ステップS208に戻り、未選択のハッシュの中から1つを選択し、選択したハッシュを含む情報検索要求を、登録情報管理手段16に送る。評価対象情報処理手段15は、ステップS208、S209を繰り返し行うことで、ステップS202で生成された新たな評価対象情報に対応するハッシュを含む情報検索要求を、登録情報管理手段16に送り、情報検索を行う。一方、全てのハッシュが検索された場合(ステップS209;Y)、本フローは終了する。
 本実施形態では、組み合わせ生成手段14は、属性情報をM個有する評価対象情報から、1~M個の属性情報を取り出して組み合わせた組み合わせを生成する。属性情報連結手段12は、組み合わせ生成手段14が生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する。ハッシュ生成手段13は、属性情報連結手段12が生成した連結属性値に基づいて、ハッシュを生成する。情報検索手段18は、ハッシュテーブル19を検索し、ハッシュ生成手段13が生成したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する。
 本実施形態では、評価対象情報に含まれる属性情報を1~M個取り出して組み合わせた組み合わせを生成し、その組み合わせに含まれる属性情報の属性値を連結した上で、ハッシュに変換している。評価対象情報そのもののハッシュだけでなく、評価対象情報に含まれる属性情報の組み合わせに対してもハッシュを生成することで、属性値が任意でよいことを示すワイルドカードを含む登録情報に対して、その登録情報のハッシュと同一のハッシュを得ることができる。このようなハッシュを用いて、ハッシュテーブル19を検索することで、評価対象情報と完全一致する登録情報だけでなく、評価対象情報に含まれる属性情報の数よりも少ない数の属性情報を有する登録情報を抽出可能である。
 本実施形態では、評価対象情報から、その評価対象情報にマッチすべき登録情報のキーとなっているハッシュを全て作成し、ハッシュテーブル19の検索を行っている。このようにすることで、ハッシュテーブル19を用いた情報検索にて、登録情報が、属性値が任意でよいというワイルドカードを含んでいても、ワイルドカードを含まない評価対象情報にマッチする登録情報を検索することができる。
 ここで、登録情報及び評価対象情報に含まれる属性情報の順序が一定でないと、含まれる属性情報自体の内容は同じ内容であっても、登録情報及び評価対象情報のハッシュは、属性情報の順序に依存して異なる値になる。例えば、登録情報が{(年齢:20代),(性別:M)}であり、評価対象情報として、{(性別:M),(年齢:20代)}が与えられたとする。この登録情報と評価対象情報とは、属性情報の並び順が異なるだけで、情報の内容は同一であると言える。従って、{(年齢:20代),(性別:M)}という登録情報は、{(性別:M),(年齢:20代)}という評価対象情報に対してマッチする。しかし、登録情報{(年齢:20代),(性別:M)}を基に生成するハッシュ(Hash(20代M))と、評価対象情報{(性別:M),(年齢:20代)}を基に生成するハッシュ(Hash(M20代)とは、値が異なる。このため、評価対象情報{(性別:M),(年齢:20代)}のハッシュを用いてハッシュテーブルを検索しても、本来であれば検索されるべき登録情報{(年齢:20代),(性別:M)}が検索されない。
 本実施形態では、上記問題に対し、属性情報連結手段12にて、登録情報及び評価対象情報に含まれる属性情報を所定の順序に並び替えている。ハッシュ生成手段13は、所定の順序で連結された属性情報の属性値に基づいてハッシュを生成する。このようにすることで、属性情報の内容が同じであれば、その並び順に依存せずに、ハッシュテーブル19に登録情報と共に登録されるハッシュと、情報検索の際に評価対象情報から生成するハッシュとを、同じ値にすることができる。上記の例では、ハッシュテーブル19にて登録情報{(年齢:20代),(性別:M)}と対応付けて登録されるハッシュと、情報検索の際に評価対象情報{(性別:M),(年齢:20代)}から生成されるハッシュとを同一の値にすることができる。従って、本実施形態では、登録情報及び評価対象情報における属性情報の並びが不一致であっても、ハッシュテーブルを用いた情報検索が可能になる。
 本発明の第2実施形態について説明する。本実施形態の情報検索システムの構成は、図1に示す第1実施形態の情報検索システムの構成と同様である。本実施形態では、評価対象情報に含まれる属性情報のうちに、組み合わせ生成手段14にて組み合わせを生成する際に利用する属性情報を指定する属性選択情報を導入する。評価対象情報処理手段15は、評価対象情報と、属性選択情報とを受信する。属性選択情報は、必要に応じて入力される情報である。評価対象情報処理手段15は、評価対象情報と属性選択情報とを組み合わせ生成手段14に送る。
 組み合わせ生成手段14は、属性選択情報の入力がないときは、第1実施形態と同様に、評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成する。組み合わせ生成手段14は、属性選択情報が入力されたときは、評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせのうち、属性選択情報で指定された属性情報を含む組み合わせを生成する。言い換えれば、組み合わせ生成手段14は、M個の属性情報を含む評価対象情報から、属性選択情報で指定された属性情報を含む1~M個を選択して組み合わせた組み合わせを生成する。
 図6は、評価対象情報処理手段15が受信する情報を示している。ここでは、属性選択情報を、前回の情報検索で用いた評価対象情報から変更があった属性情報を示す変更属性情報としている。図6の例では、変更があった属性情報は、属性名:場所である。つまり、図6に示す評価対象情報と、前回の評価対象情報とを比較したとき、異なっている属性情報は、(場所:神奈川)の部分である。その他の部分(属性名:性別、年齢)は、前回の評価対象情報における属性情報と同じ属性値である。変更属性情報は、組み合わせ生成に利用する変更部分の属性情報(属性名及び属性値)でもよいし、組み合わせ生成に利用する属性情報の属性名だけでもよい。
 図7は、組み合わせ生成手段14で生成される組み合わせの具体例を示している。評価対象情報及び変更属性情報として、図6に示す情報が与えられているとする。組み合わせ生成手段14は、図6に示す評価対象情報から、変更属性情報が示す“属性名:場所”を含む組み合わせを生成する。これらを、新たな評価対象情報とする。図5では、全ての組み合わせを新たな評価対象情報とした結果、新たな評価対象情報の数(組み合わせの数)は、7つある。これに対し、図7では、全ての組み合わせのうち、変更属性情報が示す属性名の属性情報を含む組み合わせを新たな評価対象情報とするので、新たな評価対象の数は4つとなる。
 動作手順について説明する。情報登録の動作手順は、図3に示す第1実施形態における手順と同様である。また、情報評価の動作手順も、図4に示す第1実施形態における手順と同様である。ただし、評価対象情報処理手段15に評価対象情報と共に属性選択情報が入力されたときに、ステップS202で行う組み合わせの生成で生成する属性情報の組み合わせの動作が、第1実施形態とは相違する。以下、この相違点について説明する。
 評価対象情報処理手段15は、ステップS201で、評価対象情報と属性選択情報(変更属性情報)を受信すると、評価対象情報と変更属性情報とを組み合わせ生成手段14に送る。組み合わせ生成手段14は、評価対象情報処理手段15から、評価対象情報と変更属性情報とを受け取ると、評価対象情報から属性情報を抽出する。組み合わせ生成手段14は、評価対象情報に含まれる属性情報の数をM個として、M個の属性情報から、変更属性情報が示す属性情報を含む1~M個の属性情報を選択する組み合わせを生成する。
 例えば、組み合わせ生成手段14は、図6の示す評価対象情報{(年齢:20),(性別:M),(場所:神奈川)}と、変更属性情報{場所}とを受け取った場合、評価対象情報に含まれる3つの属性情報から、属性名:場所の属性情報を含む1つを取り出した組み合わせ{(場所:神奈川)}と、属性名:場所の属性情報を含む2つを取り出した組み合わせ{(年齢:20),(場所:神奈川)}、{(性別:M),(場所:神奈川)}と、属性名:場所の属性情報を含む3つを取り出した組み合わせ{(年齢:20),(性別:M),(場所:神奈川)}とを生成する(図7)。組み合わせ生成手段14は、これら組み合わせを、新たな評価対象情報として、属性情報連結手段12に渡す。
 変更属性情報の入力がある場合、属性情報連結手段12は、ステップS202で作成された、評価対象情報に含まれる属性情報の組み合わせのうち、変更属性情報が示す属性情報を含む組み合わせについて、属性値を連結した連結属性値を生成する。ハッシュ生成手段13は、ステップS206で、属性情報連結手段12が生成した連結属性値に基づいてハッシュを生成する。属性情報連結手段12は、評価対象情報に含まれる属性情報の組み合わせのうち、変更属性情報が示す属性情報を含む組み合わせについて連結属性値を生成するので、ハッシュ生成手段13は、評価対象情報に含まれる属性情報の組み合わせのうち、変更属性情報が示す属性情報の組み合わせに対応するハッシュを生成することになる。情報検索手段18は、ステップS208で、ハッシュ生成手段13が生成したハッシュを用いて、ハッシュテーブル19内を検索する。
 本実施形態では、組み合わせ生成手段14は、評価対象情報に含まれる属性情報の組み合わせのうち、属性指定情報で指定された属性情報を含む組み合わせを生成する。属性情報連結手段12は、組み合わせ生成手段14で生成された組み合わせに含まれる属性情報を所定の順序に並べて連結する。ハッシュ生成手段13は、属性情報連結手段12で連結された連結属性値からハッシュを生成する。評価対象情報処理手段15は、ハッシュ生成手段13が生成したハッシュを含む情報検索要求を登録情報管理手段16に送る。情報検索手段18は、ハッシュテーブル19を検索して、情報検索要求に含まれるハッシュに一致するハッシュをキーとするエントリを抽出し、評価対象情報処理手段15に送る。本実施形態では、組み合わせ生成手段14で生成する組み合わせの数を第1実施形態に比して削減しており、ハッシュの生成数、及び、ハッシュテーブルの検索回数を第1実施形態に比して減少させているため、システム全体の処理を削減することができる。
 例えば、ある評価対象情報1で情報検索を行い、その後、別の評価対象情報2で情報検索を行う場合を考える。情報検索システムは、評価対象情報1に対して、第1実施形態で説明した手順で、評価対象情報に含まれる属性情報の組み合わせにマッチする登録情報を抽出する。その後に行う評価対象情報2の情報検索では、評価対象情報処理手段15に、評価対象情報2と共に、評価対象情報1と評価対象情報2とで異なる属性情報を示す変更属性情報(属性指定情報)を入力する。情報検索システムは、評価対象情報2の情報検索では、変更属性情報を含む組み合わせのハッシュを用いて、情報検索を行う。
 ここで、評価対象情報2の情報検索で生成する組み合わせには、変更属性情報で示される属性情報を含まない属性情報の組み合わせが含まれない。しかし、評価対象情報2に含まれる属性情報のうち、変更属性情報で示される属性情報以外の属性情報は、評価対象情報1に含まれているため、変更属性情報で示される属性情報を含まない属性情報の組み合わせは、評価対象情報1の情報検索の際に既に作成されている。従って、評価対象情報1と評価対象情報2とで共通の属性情報の組み合わせにマッチする登録情報は、評価対象情報1の情報検索のときに抽出されていることが保証される。このため、評価対象情報2の情報検索で抽出されなくても問題がない。
 具体例を用いて説明する。ハッシュテーブル19には、{(年齢:20代),(性別:M)}、及び、{(年齢:20代),(性別:M),(場所:神奈川)}という登録情報を含むエントリが登録されているとする。評価対象情報処理手段15に対して、評価対象情報{(年齢:20代),(性別:M),(場所:東京)}が入力されると、組み合わせ生成手段14は、図5に示す7つの組み合わせを作成する。情報検索システムは、図5に示す7つの組み合わせ(新たな評価対象情報1~7)をハッシュに変換して情報検索を行うことで、登録情報{(年齢:20代),(性別:M)}を抽出する。
 上記評価対象情報1に対する情報検索に後続して、評価対象情報2に対する情報検索を行う。このとき、評価対象情報処理手段15には、評価対象情報2{(年齢:20代),(性別:M),(場所:神奈川)}に加えて、評価対象情報1からの変更箇所を示す変更属性情報{(場所:神奈川)}が入力される(図6)。組み合わせ生成手段14は、評価対象情報2に含まれる属性情報の組み合わせのうち、(場所:神奈川)を含む組み合わせを生成する(図7)。情報検索システムは、図7に示す4つの組み合わせ(新たな評価対象情報1~4)をハッシュに変換して情報検索を行うことで、{(年齢:20代),(性別:M),(場所:神奈川)}を抽出する。情報検索システムは、評価対象情報2に対する情報検索では、{(年齢:20代),(性別:M)}は抽出しない。
 第1実施形態では、評価対象情報に含まれる属性情報の数をMとして、組み合わせ生成手段14は、
Figure JPOXMLDOC01-appb-M000001
通りの組み合わせを生成する。第1実施形態では、それら組み合わせに対してハッシュを生成し、ハッシュテーブル19の検索を行う。本実施形態では、属性指定情報を用いて、組み合わせ生成手段14で生成する組み合わせを、評価対象情報に含まれる属性情報の組み合わせのうち、属性指定情報で示される属性情報を含む組み合わせに限定している。組み合わせ生成手段14で生成する組み合わせを、属性指定情報で示される属性情報を含み組み合わせに限定することで、既に行った評価対象情報に対する情報検索ではマッチしないが、今回の評価対象情報に対する情報検索を行った結果マッチする登録情報を抽出できる。本実施形態は、ハッシュの生成、及び、ハッシュテーブルの検索の回数を、全ての組み合わせを生成する第1実施形態に比して削減できる効果があり、システム全体の処理量を削減できる効果がある。
 本発明の第3実施形態について説明する。図8は、本発明の第3実施形態の情報検索システムを示している。本実施形態の情報検索システムは、登録情報処理手段21、組み合わせ生成手段24、ハッシュ生成手段23、属性情報連結手段22、評価対象情報処理手段25、及び、登録情報管理手段26を備える。登録情報管理手段26は、情報登録手段27と情報検索手段28とを有する。登録情報処理手段21、組み合わせ生成手段24、ハッシュ生成手段23、属性情報連結手段22、及び、情報登録手段27は、情報管理装置に相当する。
 第1実施形態では、組み合わせ生成手段14(図1)を用いて評価対象情報の組み合わせを生成し、その連結属性値をハッシュ変換した。これに対し、本実施形態では、組み合わせ生成手段24を用いて登録情報の組み合わせを生成し、その連結属性値をハッシュ変換する。この点が、第1実施形態と第3実施形態との主な相違点である。
 登録情報処理手段21は、1以上の属性情報を含む登録情報を受信する。評価対象情報処理手段25は、1以上の属性情報を含む評価対象情報を受信する。登録情報及び評価対象情報は、図2に示すものと同様である。登録情報管理手段26は、情報の登録、及び、登録された情報の検索を行う。
 組み合わせ生成手段24は、情報検索システムで扱う属性情報を記憶するパタン記憶部30を有する。パタン記憶部30には、事前に、登録情報として取り扱い得る属性情報の属性値が記憶されている。組み合わせ生成手段24は、登録情報処理手段21から、登録情報を受け取る。組み合わせ生成手段24は、入力され得る属性情報のうち、受け取った登録情報にどの属性名の属性情報が含まれていないかを特定する。組み合わせ生成手段24は、パタン記憶部30を参照して、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する。組み合わせ生成手段24は、生成した補完パタンに登録情報を加え、これを補完属性情報とする。組み合わせ生成手段24は、生成した補完属性情報を、新たな登録情報とする。
 属性情報連結手段22は、登録情報及び評価対象情報に含まれる属性情報の属性値を連結する。その際、属性情報連結手段22は、属性情報を所定の順序に並び替えた上で、連結属性値を生成する。属性情報連結手段22は、登録情報については、入力された登録情報と、組み合わせ生成手段24が生成した新たな登録情報とに対して、並び替えと属性値の連結とを行う。すなわち、属性情報連結手段22は、登録情報処理手段21に入力された登録情報と、登録情報に補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する。属性情報連結手段22における属性情報の並び替えの順序は、第1実施形態における属性情報連結手段12における属性情報の並び替えの順序と同じでよい。ハッシュ生成手段23は、属性情報連結手段22で生成された連結属性値をハッシュ変換する。ハッシュ変換には、例えばMD5やSHAに代表されるような一般的なハッシュ関数を用いることができる。
 登録情報管理手段26は、ハッシュテーブル29を用いて、情報管理を行う。登録情報管理手段26の情報登録手段27は、登録情報処理手段21から情報登録要求を受ける。情報登録手段27は、ハッシュテーブル29に、登録情報と、ハッシュ生成手段23で変換されたハッシュとを対応付けて記録する。より詳細には、情報登録手段27は、ハッシュテーブル29に、入力された登録情報と組み合わせ生成手段24で生成された新たな登録情報とに対応する各ハッシュをキーとし、登録情報を値とするエントリを作成し、登録情報をハッシュテーブル29に記録する。
 情報検索手段28は、評価対象情報処理手段25から情報検索要求を受ける。情報検索手段28は、情報検索要求を受けると、ハッシュテーブル29を検索し、ハッシュ生成手段23が生成した評価対象情報のハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する。
 図9は、パタン記憶部30のデータ例、及び、組み合わせ生成手段24で生成される補完パタンのデータ例を示している。ここでは、システムで取り扱う属性値として、性別、年齢、場所の3つの属性情報を考える。パタン記憶部30は、属性名:性別について、属性値:Mと、属性値:Fとを記憶している。また、パタン記憶部30は、属性名:年齢について、属性値:20代と、属性値:30代、属性値:40代を記憶している。パタン記憶部30は、属性名:場所については、属性値:東京と、属性値:神奈川とを記憶している。
 登録情報処理手段21が受信した登録情報が、{(年齢:20代)}であったとする。組み合わせ生成手段24は、登録情報に含まれる属性情報の属性名と、パタン記憶部30が記憶する属性名とを比較する。組み合わせ生成手段24は、パタン記憶部30が記憶している属性情報の属性名のうち、登録情報に含まれる属性情報の属性名と一致しない属性名を特定する。言い換えれば、組み合わせ生成手段24は、登録情報に含まれ得る全ての属性情報のうち、受信された登録情報に欠落している属性情報の属性名を特定する。上記のケースでは、組み合わせ生成手段24は、属性名:性別、及び、属性名:場所の属性情報を、欠落している属性情報として特定する。
 組み合わせ生成手段24は、パタン記憶部30を参照して、上記特定した欠落している属性情報の組み合わせ(補完パタン)を作成する。図9のケースでは、欠落している属性情報は属性名:性別と属性名:場所の2つであり、これらはそれぞれ2通りの属性値を持つことから、属性名ごとに1つの属性値を選ぶ組み合わせを作成すると、計8通りの組み合わせができる。組み合わせ生成手段24は、登録情報に補完パタンに含まれる属性情報を加えた補完属性情報を、新たな登録情報(新たな登録情報1~8)とする。
 図10は、情報登録の動作手順を示している。以下、本図を参照して説明する。
 登録情報処理手段21は、1以上の属性情報を含む登録情報を受信する(ステップS301)。登録情報処理手段21は、受信した登録情報を、組み合わせ生成手段24に渡す。入力され得る属性情報の種類が、年齢、性別、場所、・・・のN種類であったとき、登録情報は、N種類全ての属性情報を含んでいてもよいし、年齢、性別、場所の3種類の属性情報のみを含んでいてもよい。含まれない属性情報は、どのような値であってもよいというワイルドカードとして扱われる。
 組み合わせ生成手段24は、登録情報処理手段21から登録情報を受け取ると、パタン記憶部30を参照して補完パタンを生成し、登録情報に補完パタンとを組み合わせる(ステップS302)。組み合わせ生成手段24は、ステップS302では、まず、登録情報から属性情報を抽出し、抽出した属性情報の属性名と、パタン記憶部30が記憶する属性情報の属性名とを比較する。次いで、組み合わせ生成手段24は、パタン記憶部30に記憶される属性情報の属性名のうち、登録情報に含まれない属性名を特定する。組み合わせ生成手段24は、登録情報に含まれない属性名の属性情報を、属性名ごとに1つずつ選択し、属性情報を組み合わせた補完パタンを生成する。組み合わせ生成手段24は、補完パタンに登録情報の属性情報を加えた補完属性情報を新たな登録情報として生成する。
 組み合わせ生成手段24は、登録情報処理手段21から受け取った登録情報(オリジナルの登録情報)及びステップS302で生成した新たな登録情報から1つを選択し、属性情報連結手段22に送る(ステップS303)。
 属性情報連結手段22は、組み合わせ生成手段24から受け取った登録情報から属性情報を抽出し、属性情報を所定の順番に並び替えて連結した連結属性値を生成する(ステップS304)。
 組み合わせ生成手段24は、全ての登録情報を選択したか否かを判断する(ステップS305)。組み合わせ生成手段24は、未選択の登録情報が残っているときは(ステップS305;N)、ステップS303に戻り、未選択の登録情報の中から1つを選択し、属性情報連結手段22に送る。ステップS303からステップS305を繰り返し行うことで、属性情報連結手段22は、オリジナルの登録情報とステップS302で生成された新たな登録情報とについて、所定の順番で属性値を連結した連結属性値を生成する。
 属性情報連結手段22は、生成した連結属性情報をハッシュ生成手段23に送る。全ての登録情報について処理が行われた場合(ステップS305;Y)、ハッシュ生成手段23は、受け取った連結属性値のうちの1つを選択し、連結属性値をハッシュ変換する(ステップS306)。
 ハッシュ生成手段23は、受け取った連結属性値を全て選択したか否かを判断し(ステップS307)、未選択の連結属性値があるときは(ステップS307;N)、ステップS306に戻り、未選択の連結属性値の中から1つを選択し、ハッシュを生成する。ハッシュ生成手段23は、ステップS306、S307を繰り返し行うことで、オリジナルの登録情報及びステップS302で生成された新たな登録情報に対応する連結属性値をハッシュに変換する。
 属性情報連結手段22は、連結属性値を変換したハッシュ、つまり、オリジナルの登録情報及びステップS302で生成された新たな登録情報に対応するハッシュを、登録情報処理手段21に送る。登録情報処理手段21は、ハッシュを受け取ると、受け取ったハッシュのうちの1つを選択し、選択したハッシュと登録情報とを含む情報登録要求を、登録情報管理手段26に送る。全ての連結属性値についてハッシュが作成された場合(ステップS307;Y)、登録情報管理手段26の情報登録手段27は、ハッシュテーブル29に、情報登録要求に含まれるハッシュをキーとし、値を登録情報とするエントリを作成し、登録情報をハッシュを用いて管理する(ステップS308)。その際、情報登録手段27は、既に同一のハッシュをキーに持つエントリが存在しているか否かを調べ、存在するときは、同一のハッシュキーを持つエントリとしてリスト管理する。
 登録情報処理手段21は、属性情報連結手段22から受け取ったハッシュを全て選択したか否かを判断する(ステップS309)。登録情報処理手段21は、全てのハッシュを選択していないときは(ステップS309;N)、ステップS308へ戻り、未選択のハッシュの中から1つを選択し、選択したハッシュを含む情報登録要求を、登録情報管理手段26に送る。登録情報管理手段26の情報登録手段27は、ステップS208、S309を繰り返し行うことで、オリジナルの登録情報に対応するハッシュ、及び、ステップS302で生成された新たな登録情報に対応するハッシュを、ハッシュテーブル29に登録する。図10に示す手順で情報登録を行うことで、登録情報にマッチする全ての評価対象情報のパタンのハッシュに対して、登録情報を関連付けてハッシュテーブル29で管理することができる。一方、全てのハッシュが登録された場合(ステップS309;Y)、本フローは終了する。
 図11は、情報評価の動作手順を示している。以下、本図を参照して説明する。
 評価対象情報処理手段25は、1以上の属性情報を含む評価対象情報を受信する(ステップS401)。評価対象情報処理手段25は、評価対象情報を、属性情報連結手段22に送る。
 属性情報連結手段22は、評価対象情報処理手段25から受け取った評価対象情報から属性情報を抽出し、属性情報を所定の順番に並び替え、属性値を連結した連結属性値を生成する(ステップS402)。属性情報連結手段22は、生成した連結属性値を、ハッシュ生成手段23に送る。
 ハッシュ生成手段23は、属性情報連結手段22から連結属性値を受け取る。ハッシュ生成手段23は、属性情報連結手段22から受け取った評価対象情報の連結属性値をハッシュ変換する(ステップS403)。ハッシュ生成手段23は、変換したハッシュを、評価対象情報処理手段25に送る。評価対象情報処理手段25は、評価対象情報に対応するハッシュを受け取ると、受け取ったハッシュを含む情報検索要求を、登録情報管理手段26に送る。
 登録情報管理手段26は、評価対象情報処理手段25から情報検索要求を受け取ると、ハッシュテーブル29から、情報検索要求に含まれるハッシュをキーとするエントリを取得する(ステップS404)。登録情報管理手段26は、取得したエントリの登録情報を、評価対象情報処理手段25に渡す。ハッシュテーブル29には、情報登録時に、登録情報そのものから生成したハッシュだけでなく、登録情報に補完パタンを加えた補完属性情報から生成したハッシュも登録されている。従って、図11に示す手順で情報検索を行うことで、登録情報がワイルドカードを含むときでも、評価対象情報から、その評価対象情報にマッチする登録情報を抽出できる。
 本実施形態では、組み合わせ生成手段24は、パタン記憶部30を参照して、登録情報として扱い得る属性情報のうち、登録情報処理手段21に入力された登録情報に含まれない属性情報の組み合わせから成る補完パタンを生成し、補完パタンに登録情報を加えた補完属性情報を新たな登録情報とする。属性情報連結手段22は、登録情報と、登録情報に補完パタンを加えた補完属性情報とについて、属性値を連結した連結属性値を生成する。ハッシュ生成手段23は、属性情報連結手段22が生成した連結属性値をハッシュ変換する。情報登録手段27は、登録情報を、ハッシュ生成手段23で変換されたハッシュに対応付けてハッシュテーブル29に登録する。
 組み合わせ生成手段24が生成する、補完パタンに登録情報を加えた新たな登録情報は、情報検索の際にマッチすべき評価対象情報のパタンと一致する。情報登録手段27は、登録情報に対応するハッシュと、組み合わせ生成手段24が生成した新たな登録情報に対応するハッシュとを、登録情報に対応付けてハッシュテーブル29に登録する。このような情報登録を行うことで、情報検索に際し、評価対象情報のハッシュを用いて、評価対象情報に完全一致する登録情報だけでなく、ワイルドカードを含む登録情報の抽出が可能になる。属性情報連結手段22が登録情報及び評価対象情報の属性値を所定の順序で連結することで得られる効果は、第1実施形態と同様である。
 第3実施形態と第1及び第2実施形態とを比較すると、第3実施形態では、事前に、登録情報として取り扱い得る属性情報の属性値をパタン記憶部30に入力しておく必要がある。しかし、第3実施形態では、第1及び第2実施形態と異なり、情報検索時に、評価対象情報の組み合わせを生成する必要がないため、情報評価の際の処理時間を、第1及び第2実施形態に比して短縮できる効果がある。このことから、本実施形態は、評価対象情報をリアルタイムに処理するストリーム処理を行うシステムに有効であると言える。
 以上、本発明をその好適な実施形態に基づいて説明したが、本発明の情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体は、上記実施形態にのみ限定されるものではなく、上記実施形態の構成から種々の修正及び変更を施したものも、本発明の範囲に含まれる。
 最後に、本発明の最小構成について説明する。本発明の情報検索システムは、最小構成として、評価対象情報処理手段と、組み合わせ生成手段と、属性情報連結手段と、ハッシュ生成手段と、情報検索手段とを有する。評価対象情報処理手段は、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報を入力する。組み合わせ手段は、評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成する。属性情報連結手段は、組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する。ハッシュ変換手段は、連結属性値をハッシュに変換する。情報検索手段は、属性情報を1つ以上有する登録情報を、登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、ハッシュ生成手段が変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する。
 本発明の情報検索方法の最小構成は、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成すると、生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成するステップと、属性情報連結ステップで生成した連結属性値をハッシュに変換するステップと、属性情報を1つ以上有する登録情報を、登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、ハッシュに変換するステップで変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出するステップとで構成される。
 本発明のプログラムを記録したコンピュータ読み取り可能な記録媒体の最小構成は、コンピュータに、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成する処理と、生成された組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する処理と、連結属性値をハッシュに変換する処理と、属性情報を1つ以上有する登録情報を、登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、ハッシュ変換処理で変換されたハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する処理とを実行させるという構成である。
 本発明の情報検索システム、情報検索方法、及び、プログラムを記録したコンピュータ読み取り可能な記録媒体では、評価対象情報に含まれる属性情報の組み合わせを生成し、生成した組み合わせに含まれる属性情報を連結してハッシュに変換する。その後、組み合わせに対応するハッシュを用いて、ハッシュテーブルを検索し、登録情報の抽出を行う。評価対象情報から属性情報を取り出して生成した組み合わせは、当該評価対象情報に対してマッチすべき登録情報と一致する。従って、生成した組み合わせに対応するハッシュを用いてハッシュテーブルを検索することで、評価対象情報に完全一致する登録情報だけでなく、評価対象情報よりも属性情報の数が少ない、すなわちワイルドカードを含む登録情報を抽出できる。
 本発明の情報検索システムは、最小構成として、登録情報処理手段と、組み合わせ生成手段と、属性情報連結手段と、ハッシュ生成手段と、情報登録手段と、評価対象情報処理手段と、情報検索手段とを有する。登録情報処理手段は、属性値を含む属性情報を1つ以上有する登録情報を入力する。組み合わせ生成手段は、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する。組み合わせ生成手段は、登録情報に補完パタンを加えた補完属性情報を生成する。属性情報連結手段は、登録情報と、補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する。ハッシュ生成手段は、連結属性値をハッシュに変換する。情報登録手段は、登録情報を、ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する。評価対象情報処理手段は、属性情報を1つ以上含む評価対象情報を入力し、属性情報連結手段を用いて、入力された評価対象情報に含まれる属性値を連結した連結属性値を、ハッシュ生成手段を用いて変換したハッシュを含む情報検索要求を発生する。情報検索手段は、ハッシュテーブルを検索し、情報検索要求に含まれるハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する。
 本発明の情報検索方法の最小構成は、属性値を含む属性情報を1つ以上有する登録情報を入力し、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成するステップと、登録情報と、登録情報に補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成するステップと、連結属性値をハッシュに変換するステップと、登録情報を、ハッシュに変換するステップで変換したハッシュに対応付けてハッシュテーブルに登録するステップと、属性情報を1つ以上含む評価対象情報を入力し、入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換するステップと、ハッシュテーブルを検索し、評価対象情報を変換したハッシュと一致するハッシュに対応付け登録された登録情報を抽出するステップとを有する構成である。
 本発明のプログラムを記録したコンピュータ読み取り可能な記録媒体の最小構成は、コンピュータに、属性値を含む属性情報を1つ以上有する登録情報を入力し、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する処理と、登録情報と、登録情報に補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する処理と、連結属性値をハッシュに変換する処理と、登録情報を、ハッシュを変換する処理で変換されたハッシュに対応付けてハッシュテーブルに登録する処理と、属性情報を1つ以上含む評価対象情報を入力し、入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換する処理と、ハッシュテーブルを検索し、評価対象情報を変換したハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する処理とを実行させるという構成である。
 本発明の情報検索システム、情報検索方法、及び、プログラムを記録したコンピュータ読み取り可能な記録媒体では、情報登録時に、パタン記憶部を用いて、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する。ハッシュテーブルへの登録では、登録情報に対し、登録情報に対応するハッシュだけでなく、登録情報に補完パタンを加えた補完属性情報に対応するハッシュも対応付けてハッシュテーブルに登録する。登録情報に補完パタンを加えた補完属性情報は、登録情報に対してマッチすべき評価対象情報のパタンと一致する。従って、評価対象情報に対応するハッシュを用いてハッシュテーブルを検索することで、評価対象情報に完全一致する登録情報だけでなく、評価対象情報よりも属性情報の数が少ない、すなわちワイルドカードを含む登録情報を抽出できる。
 本発明の情報管理装置は、最小構成として、登録情報処理手段と、組み合わせ生成手段と、属性情報連結手段と、ハッシュ生成手段と、情報登録手段とを有する。登録情報処理手段は、属性値を含む属性情報を1つ以上有する登録情報を入力する。組み合わせ生成手段は、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する。組み合わせ生成手段は、登録情報に補完パタンを加えた補完属性情報を生成する。属性情報連結手段は、登録情報と、補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する。ハッシュ生成手段は、連結属性値をハッシュに変換する。情報登録手段は、登録情報を、ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する。
 本発明の情報管理方法の最小構成は、属性値を含む属性情報を1つ以上有する登録情報を入力し、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成するステップと、登録情報と、登録情報に補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成するステップと、連結属性値をハッシュに変換するステップと、登録情報を、ハッシュに変換するステップで変換したハッシュに対応付けてハッシュテーブルに登録するステップとを有する構成である。
 本発明のプログラムを記録したコンピュータ読み取り可能な記録媒体の最小構成は、コンピュータに、属性値を含む属性情報を1つ以上有する登録情報を入力し、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する処理と、登録情報と、登録情報に補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する処理と、連結属性値をハッシュに変換する処理と、登録情報を、ハッシュを変換する処理で変換されたハッシュに対応付けてハッシュテーブルに登録する処理とを実行させるという構成である。
 本発明の情報管理装置、情報管理方法、及び、プログラムを記録したコンピュータ読み取り可能な記録媒体では、情報登録時に、パタン記憶部を用いて、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する。ハッシュテーブルへの登録では、登録情報に対し、登録情報に対応するハッシュだけでなく、登録情報に補完パタンを加えた補完属性情報に対応するハッシュも対応付けてハッシュテーブルに登録する。登録情報に補完パタンを加えた補完属性情報は、登録情報に対してマッチすべき評価対象情報のパタンと一致する。従って、このような情報登録を行うことで、情報検索に際して、評価対象情報に対応するハッシュを用いてハッシュテーブルを検索したとき、評価対象情報に完全一致する登録情報だけでなく、評価対象情報よりも属性情報の数が少ない、すなわちワイルドカードを含む登録情報を抽出できる。
 なお、本願については、日本国特許出願2009-160642号を基礎とする優先権を主張し、本明細書中に日本国特許出願2009-160642号の明細書、特許請求の範囲、図面全体を参照として取り込むものとする。
 本発明は、グルーピング処理やストリーム処理、ルールマッチングといった入力された評価対象情報に対して高速に特定の処理を実行するシステムに適用できる。また、完全には一致しないが、一致する情報を多く含んでいる情報を探すという類似検索といった用途にも適用できる。
11、21:登録情報処理手段
12、22:属性情報連結手段
13、23:ハッシュ生成手段
14、24:組み合わせ生成手段
15、25:評価対象情報処理手段
16、26:登録情報管理手段
17、27:情報登録手段
18、28:情報検索手段
19、29:ハッシュテーブル
30:パタン記憶部

Claims (21)

  1.  属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報を入力する評価対象情報処理手段と、
     前記評価対象情報処理手段に入力された評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成手段と、
     前記組み合わせ生成手段が生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、
     前記属性情報連結手段が生成した前記連結属性値をハッシュに変換するハッシュ生成手段と、
     前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ生成手段が変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索手段と
     を有する情報検索システム。
  2.  前記組み合わせ生成手段は、前記評価対象情報に含まれる属性情報のうち、組み合わせを作成する際に利用する属性情報を指定する属性選択情報を入力し、前記評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせのうち、前記属性選択情報で指定された属性情報を含む組み合わせを生成する、請求項1に記載の情報検索システム。
  3.  前記属性選択情報が、過去に情報検索に用いた評価対象情報から変更があった属性情報を示す変更属性情報である、請求項2に記載の情報検索システム。
  4.  前記登録情報を入力し、前記属性情報連結手段を用いて、入力された登録情報に含まれる属性値を連結した連結属性値を、前記ハッシュ生成手段を用いて変換したハッシュと、前記入力された登録情報とを含む情報登録要求を発生する登録情報処理手段と、
     前記情報登録要求を受けて、前記情報登録要求に含まれる登録情報と、前記情報登録要求に含まれるハッシュとを対応付けて前記ハッシュテーブルに登録する情報登録手段とを更に有する、請求項3に記載の情報検索システム。
  5.  前記属性情報連結手段は、属性情報を所定の順序で並び替えた上で、前記属性値を連結する、請求項4に記載の情報検索システム。
  6.  前記属性情報が属性名を更に含み、前記属性情報連結手段は、前記属性名に基づいて、前記属性情報を並び替える、請求項5に記載の情報検索システム。
  7.  属性値を含む属性情報を1つ以上有する登録情報を入力する登録情報処理手段と、
     登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記登録情報処理手段に入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成し、前記登録情報に前記補完パタンを加えた補完属性情報を生成する組み合わせ生成手段と、
     前記登録情報と、前記補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、
     前記属性情報連結手段で生成された前記連結属性値をハッシュに変換するハッシュ生成手段と、
     前記登録情報を、前記ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録手段と、
     前記属性情報を1つ以上含む評価対象情報を入力し、前記属性情報連結手段を用いて、入力された評価対象情報に含まれる属性値を連結した連結属性値を、前記ハッシュ生成手段を用いて変換したハッシュを含む情報検索要求を発生する評価対象情報処理手段と、
     前記ハッシュテーブルを検索し、前記情報検索要求に含まれるハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索手段と
     を有する情報検索システム。
  8.  前記属性情報連結手段は、属性情報を所定の順序で並び替えた上で、前記属性値を連結する、請求項7に記載の情報検索システム。
  9.  属性値を含む属性情報を1つ以上有する登録情報を入力する登録情報処理手段と、
     登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記登録情報処理手段に入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成し、前記登録情報に前記補完パタンを加えた補完属性情報を生成する組み合わせ生成手段と、
     前記登録情報と、前記補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、
     前記属性情報連結手段で生成された前記連結属性値をハッシュに変換するハッシュ生成手段と、
     前記登録情報を、前記ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録手段と
     を有する情報管理装置。
  10.  コンピュータが、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成ステップと、
     前記コンピュータが、前記生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、
     前記コンピュータが、属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、
     前記コンピュータが、前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ変換ステップで変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索ステップと
     を有する情報検索方法。
  11.  前記コンピュータは、前記組み合わせ生成ステップでは、前記評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせのうち、前記評価対象情報に含まれる属性情報中で組み合わせを作成する際に利用する属性情報を指定する属性選択情報で指定された属性情報を含む組み合わせを生成する、請求項10に記載の情報検索方法。
  12.  前記属性選択情報が、過去に情報検索に用いた評価対象情報から変更があった属性情報を示す変更属性情報である、請求項11に記載の情報検索方法。
  13.  前記コンピュータが、前記登録情報を入力し、該入力した登録情報に含まれる属性値を連結した連結属性値を生成する登録情報属性連結ステップと、
     前記コンピュータが、前記生成した登録情報に対応する連結属性値をハッシュに変換する登録情報ハッシュ変換ステップと、
     前記コンピュータが、前記入力した登録情報と、前記登録情報ハッシュ変換ステップで変換したハッシュとを対応付けて前記ハッシュテーブルに登録する情報登録ステップとを更に有する、請求項12に記載の情報検索方法。
  14.  前記コンピュータは、前記属性情報連結ステップでは、属性情報を所定の順序で並び替えた上で、前記属性値を連結する、請求項13に記載の情報検索方法。
  15.  前記属性情報が属性名を更に含み、前記コンピュータは、前記属性情報連結ステップでは、前記属性名に基づいて、前記属性情報を並び替える、請求項14に記載の情報検索方法。
  16.  コンピュータが、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力した登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成ステップと、
     前記コンピュータが、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、
     前記コンピュータが、前記属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、
     前記コンピュータが、前記登録情報を、前記ハッシュ変換ステップで変換したハッシュに対応付けてハッシュテーブルに登録する情報登録ステップと、
     前記コンピュータが、前記属性情報を1つ以上含む評価対象情報を入力し、該入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換する評価対象情報ハッシュ変換ステップと、
     前記コンピュータが、前記ハッシュテーブルを検索し、前記評価対象情報ハッシュ変換ステップで生成されたハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索ステップと
     を有する情報検索方法。
  17.  前記コンピュータは、前記属性情報連結ステップ及び評価対象情報ハッシュ変換ステップでは、属性情報を所定の順序で並び替えた上で前記属性値を連結する、請求項16に記載の情報検索方法。
  18.  コンピュータが、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力した登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成ステップと、
     前記コンピュータが、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、
     前記コンピュータが、前記属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、
     前記コンピュータが、前記登録情報を、前記ハッシュ変換ステップで変換したハッシュに対応付けてハッシュテーブルに登録する情報登録ステップと
     を有する情報管理方法。
  19.  コンピュータに、
     属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1~M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成処理と、
     前記生成された組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結処理と、
     属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、
     前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値をハッシュ変換した補完属性情報と対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ変換処理で変換されたハッシュの何れかと一致するハッシュと対応付けて登録された登録情報を抽出する情報検索処理と
     を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
  20.  コンピュータに、
     属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成処理と、
     前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連処理と、
     前記属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、
     前記登録情報を、前記ハッシュ変換処理で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録処理と、
     前記属性情報を1つ以上含む評価対象情報を入力し、該入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換する評価対象情報ハッシュ変換処理と、
     前記ハッシュテーブルを検索し、前記評価対象情報ハッシュ変換処理で生成されたハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索処理と
     を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
  21.  コンピュータに、
     属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成処理と、
     前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連処理と、
     前記属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、
     前記登録情報を、前記ハッシュ変換処理で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録処理と
     を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
PCT/JP2010/061547 2009-07-07 2010-07-07 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体 WO2011004846A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US13/382,565 US20120109990A1 (en) 2009-07-07 2010-07-07 Information search system, information management device, information search method, information management method, and recording medium
CN201080030727.4A CN102473185B (zh) 2009-07-07 2010-07-07 信息搜索***、信息管理设备、信息搜索方法、信息管理方法、以及记录介质
JP2011521945A JP5267670B2 (ja) 2009-07-07 2010-07-07 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009160642 2009-07-07
JP2009-160642 2009-07-07

Publications (1)

Publication Number Publication Date
WO2011004846A1 true WO2011004846A1 (ja) 2011-01-13

Family

ID=43429270

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/061547 WO2011004846A1 (ja) 2009-07-07 2010-07-07 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体

Country Status (4)

Country Link
US (1) US20120109990A1 (ja)
JP (1) JP5267670B2 (ja)
CN (1) CN102473185B (ja)
WO (1) WO2011004846A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011227656A (ja) * 2010-04-19 2011-11-10 Nec Corp 情報検索システム、情報検索方法およびプログラム
WO2012127986A1 (ja) * 2011-03-18 2012-09-27 日本電気株式会社 情報検索システム、情報検索方法および情報検索プログラム
WO2015001740A1 (ja) * 2013-07-01 2015-01-08 日本電気株式会社 情報処理装置、及び、検索方法
JP2015507293A (ja) * 2012-02-07 2015-03-05 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited ウェブページ検索の方法及び装置
CN104765829A (zh) * 2015-04-13 2015-07-08 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
CN104765834A (zh) * 2015-04-13 2015-07-08 天脉聚源(北京)传媒科技有限公司 一种信息搜索方法及装置

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8285656B1 (en) 2007-03-30 2012-10-09 Consumerinfo.Com, Inc. Systems and methods for data verification
US8312033B1 (en) 2008-06-26 2012-11-13 Experian Marketing Solutions, Inc. Systems and methods for providing an integrated identifier
US9256904B1 (en) 2008-08-14 2016-02-09 Experian Information Solutions, Inc. Multi-bureau credit file freeze and unfreeze
CN103581224B (zh) * 2012-07-25 2018-05-22 腾讯科技(深圳)有限公司 推送信息的方法和装置
CN102855302A (zh) * 2012-08-17 2013-01-02 东方钢铁电子商务有限公司 适用于信息链的数据信息处理方法
US9407642B2 (en) 2013-03-13 2016-08-02 Samsung Electronics Co., Ltd. Application access control method and electronic apparatus implementing the same
US10262362B1 (en) 2014-02-14 2019-04-16 Experian Information Solutions, Inc. Automatic generation of code for attributes
CN104765827B (zh) * 2015-04-13 2018-01-05 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
US10757154B1 (en) 2015-11-24 2020-08-25 Experian Information Solutions, Inc. Real-time event-based notification system
CN106294573A (zh) * 2016-07-28 2017-01-04 Tcl集团股份有限公司 一种海量数据实时查询方法及***
BR112019015920A8 (pt) * 2017-01-31 2020-04-28 Experian Inf Solutions Inc ingestão de dados heterogêneos em escala massiva e resolução de usuário
EP3364314B1 (en) * 2017-02-15 2022-10-19 QlikTech International AB Methods and systems for indexing using indexlets
US10735183B1 (en) 2017-06-30 2020-08-04 Experian Information Solutions, Inc. Symmetric encryption for private smart contracts among multiple parties in a private peer-to-peer network
US10963434B1 (en) 2018-09-07 2021-03-30 Experian Information Solutions, Inc. Data architecture for supporting multiple search models
CN110046155B (zh) * 2018-12-07 2023-06-20 创新先进技术有限公司 特征数据库的更新、数据特征的确定方法、装置及设备
US20200193426A1 (en) * 2018-12-18 2020-06-18 Secude Ag Method and system for creating and updating an authentic log file for a computer system and transactions
WO2020146667A1 (en) 2019-01-11 2020-07-16 Experian Information Solutions, Inc. Systems and methods for secure data aggregation and computation
US11941065B1 (en) 2019-09-13 2024-03-26 Experian Information Solutions, Inc. Single identifier platform for storing entity data
US11880377B1 (en) 2021-03-26 2024-01-23 Experian Information Solutions, Inc. Systems and methods for entity resolution

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190970A (ja) * 1989-01-19 1990-07-26 Hitachi Ltd インデクスの構造およびこれを用いるサーチ処理方法
JP2001229060A (ja) * 2000-02-17 2001-08-24 Nec Corp ディレクトリ検索システム及び方法、ディレクトリ検索プログラムを記録したコンピュータ読取可能な記録媒体

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6073129A (en) * 1997-12-29 2000-06-06 Bull Hn Information Systems Inc. Method and apparatus for improving the performance of a database management system through a central cache mechanism
US6983288B1 (en) * 2000-11-20 2006-01-03 Cisco Technology, Inc. Multiple layer information object repository
WO2004010335A1 (en) * 2002-07-23 2004-01-29 Samsung Electronics Co., Ltd. Index structure of metadata, method for providing indices of metadata, and metadata searching method and apparatus using the indices of metadata
PT1490801E (pt) * 2002-07-23 2007-12-21 Samsung Electronics Co Ltd Estrutura de índices de metadados, método para fornecimento de índices de metadados e aparelho e método para pesquisa de metadados através da utilização dos índices de metadados
JP2004264895A (ja) * 2003-02-05 2004-09-24 Sony Corp 情報処理装置および方法、並びにプログラム
CN1829980A (zh) * 2003-07-28 2006-09-06 松下电器产业株式会社 内容广播分配***、该***中使用的发送装置和接收装置及内容广播分配方法
US8190597B1 (en) * 2009-12-21 2012-05-29 Perfect Search Corporation Multistage pipeline for feeding joined tables to a search system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190970A (ja) * 1989-01-19 1990-07-26 Hitachi Ltd インデクスの構造およびこれを用いるサーチ処理方法
JP2001229060A (ja) * 2000-02-17 2001-08-24 Nec Corp ディレクトリ検索システム及び方法、ディレクトリ検索プログラムを記録したコンピュータ読取可能な記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011227656A (ja) * 2010-04-19 2011-11-10 Nec Corp 情報検索システム、情報検索方法およびプログラム
WO2012127986A1 (ja) * 2011-03-18 2012-09-27 日本電気株式会社 情報検索システム、情報検索方法および情報検索プログラム
JP5928446B2 (ja) * 2011-03-18 2016-06-01 日本電気株式会社 情報検索システム、情報検索方法および情報検索プログラム
JP2015507293A (ja) * 2012-02-07 2015-03-05 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited ウェブページ検索の方法及び装置
WO2015001740A1 (ja) * 2013-07-01 2015-01-08 日本電気株式会社 情報処理装置、及び、検索方法
CN104765829A (zh) * 2015-04-13 2015-07-08 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
CN104765834A (zh) * 2015-04-13 2015-07-08 天脉聚源(北京)传媒科技有限公司 一种信息搜索方法及装置
CN104765834B (zh) * 2015-04-13 2019-01-18 天脉聚源(北京)传媒科技有限公司 一种信息搜索方法及装置

Also Published As

Publication number Publication date
CN102473185B (zh) 2014-02-26
JPWO2011004846A1 (ja) 2012-12-20
US20120109990A1 (en) 2012-05-03
JP5267670B2 (ja) 2013-08-21
CN102473185A (zh) 2012-05-23

Similar Documents

Publication Publication Date Title
JP5267670B2 (ja) 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体
JP5138046B2 (ja) 検索システム、検索方法およびプログラム
US9465860B2 (en) Storage medium, trie tree generation method, and trie tree generation device
US8914316B2 (en) Information similarity and related statistical techniques for use in distributed computing environments
WO2012132395A1 (ja) 検索装置、検索システム、方法およびプログラム
JP2009003541A (ja) データベースのインデックス作成システム、方法及びプログラム
US10496648B2 (en) Systems and methods for searching multiple related tables
Wang et al. Memory-based architecture for multicharacter Aho–Corasick string matching
CN105404677A (zh) 一种基于树形结构的检索方法
CN110362560A (zh) 一种无业务主键数据在存储数据库时去重的方法
CN111953609B (zh) 基于ovs的数据包处理方法及相关设备
JP2005284608A (ja) データ検索システム、データ検索方法
He et al. A fast and memory-efficient approach to NDN name lookup
KR20200094673A (ko) Ra 트리를 이용한 rdf 트리플 데이터 압축 방법 및 장치
US20170242880A1 (en) B-tree index structure with grouped index leaf pages and computer-implemented method for modifying the same
JPWO2012049883A1 (ja) データ構造、インデックス作成装置、データ検索装置、インデックス作成方法、データ検索方法、インデックス作成プログラムおよびデータ検索プログラム
US20170169104A1 (en) Search Index
JPWO2012127986A1 (ja) 情報検索システム、情報検索方法および情報検索プログラム
JP2001022766A (ja) 多次元データベースの高速処理方法および装置
JP6291435B2 (ja) プログラムおよびクラスタシステム
JP2011227655A (ja) 情報検索システム、情報検索方法およびプログラム
US9996621B2 (en) System and method for retrieving internet pages using page partitions
JP5477139B2 (ja) 情報検索システム、情報検索方法およびプログラム
JP6160427B2 (ja) 差分抽出システム及びプログラム
Butakov et al. Detecting text similarity on a scalable no-SQL database platform

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201080030727.4

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10797157

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 13382565

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2011521945

Country of ref document: JP

122 Ep: pct application non-entry in european phase

Ref document number: 10797157

Country of ref document: EP

Kind code of ref document: A1