JPWO2011004846A1 - 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体 - Google Patents

情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体 Download PDF

Info

Publication number
JPWO2011004846A1
JPWO2011004846A1 JP2011521945A JP2011521945A JPWO2011004846A1 JP WO2011004846 A1 JPWO2011004846 A1 JP WO2011004846A1 JP 2011521945 A JP2011521945 A JP 2011521945A JP 2011521945 A JP2011521945 A JP 2011521945A JP WO2011004846 A1 JPWO2011004846 A1 JP WO2011004846A1
Authority
JP
Japan
Prior art keywords
information
attribute
hash
registration
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011521945A
Other languages
English (en)
Other versions
JP5267670B2 (ja
Inventor
健太郎 山崎
健太郎 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011521945A priority Critical patent/JP5267670B2/ja
Publication of JPWO2011004846A1 publication Critical patent/JPWO2011004846A1/ja
Application granted granted Critical
Publication of JP5267670B2 publication Critical patent/JP5267670B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

評価対象情報処理手段(15)は、属性情報をM個有する評価対象情報を入力する。組み合わせ生成手段(14)は、評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する。属性情報連結手段(12)は、組み合わせのそれぞれについて、属性情報の属性値を連結した連結属性値を生成する。ハッシュ生成手段(13)は、連結属性値をハッシュに変換する。ハッシュテーブル(19)は、登録情報を、その登録情報に対応するハッシュと対応付けて記憶している。情報検索手段(18)は、ハッシュテーブル(19)を検索し、ハッシュ生成手段(13)が変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する。

Description

本発明は、情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体に関し、更に詳しくは、ハッシュを用いて登録情報の検索を行う情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体に関する。
情報検索システムは、登録された情報の中から、所望の条件にマッチする情報を抽出するシステムである。特許文献1は、情報検索システム(装置)が記載された文献である。特許文献1に記載の検索装置は、記憶部と、キーハッシュ算出部と、検索部とを有する。記憶部は、原データ領域と、インデックス領域とを有する。データ領域は、原データ群を格納する領域である。インデックス領域は、原データの格納場所を示す情報を格納する領域である。各原データの原データ領域のおける格納場所を示す情報は、インデックス領域における当該原データのハッシュ値に対応する場所に格納されている。
検索に際して、キーハッシュ算出部は、検索キーのハッシュを算出する。検索部は、インデックス領域における、検索キーのハッシュ値に対応する場所を参照して、原データの格納場所を抽出する。その後、検索部は、原データ領域における、抽出した原データの格納場所で示される場所から、所要の原データを抽出する。一般に、情報検索では、検索対象の情報が多くなるほど、検索に要する時間が長くなる。特許文献1は、ハッシュを用いて、検索キーに一致するデータを抽出しており、情報量が増加しても、検索を高速に行うことができる効果がある。
ここで、特許文献2は、データ解析方法が記載された文献である。特許文献2では、発信者アドレス、受信者アドレス、ポート番号などのネットワークパケットの情報を入力して、ネットワーク上に頻出するアドレスやポートの組み合わせを抽出する。特許文献2では、例えば、3つの項目のデータに対して、項目数1用のキャッシュ、項目数2用のキャッシュ、項目数3用のキャッシュを用いる。項目数1用のキャッシュは、1つの項目データのハッシュと、そのデータの出現回数とを記憶する。項目数2用のキャッシュは、2つの項目データのハッシュと、2つのデータの組み合わせの出現回数とを記憶する。項目数3用のキャッシュは、3つの項目データのハッシュと、3つのデータの組み合わせの出現回数とを記憶する。
例えば、特許文献2に記載の解析装置に、192.168.0.1(発信者アドレス)、192.168.1.1(受信者アドレス)、25(ポート番号)というデータが入力されたとする。解析装置は、“192.168.0.1”、“192.168.1.1”、“25”をそれぞれハッシュに変換する。解析装置は、“192.168.0.1”のハッシュ、“192.168.1.1”のハッシュ、“25”のハッシュが、それぞれ項目1用のキャッシュテーブルに記憶済みか否かを調べる。解析装置は、対応するハッシュが記憶されていなければ、出現回数1としてその項目データのハッシュを新たにキャッシュテーブルに登録する。解析装置は、記憶済みのときは、該当する項目データのハッシュの出現回数をインクリメントする。
また、解析装置は、項目数2用のキャッシュテーブルに、3つの項目データから2つを選択した、“192.168.0.1”のハッシュと“192.168.1.1”のハッシュとの組み合わせ、“192.168.0.1”のハッシュと“25”のハッシュとの組み合わせ、“192.168.1.1”のハッシュと“25”のハッシュとの組み合わせが、それぞれ記憶済みか否かを調べる。解析装置は、記憶済みのときは、該当する組み合わせの出現回数をインクリメントする。更に、解析装置は、項目数3用のキャッシュテーブルに、“192.168.0.1”のハッシュと“192.168.1.1”のハッシュと“25”のハッシュとの組み合わせが記憶済みであるか否を調べ、記憶済みでないときは、その組み合わせの出現回数をインクリメントする。
特開2007−241378号公報(図1) 特開2005−285048号公報
ここで、1以上の属性情報を含む登録情報を、ハッシュテーブルを用いて管理し、情報検索を行うことを考える。登録情報は、例えば、含み得る属性情報の種類が全部でN種類あったとして、N種類全ての属性情報がデータ(属性値)を持っている必要はなく、一部の属性情報は省略可能であるとする。例えば、属性名:年齢、属性名:性別、属性名:場所の属性情報を含み得る登録情報を考える。登録情報は、{(年齢,20代)、(性別,M)、(場所,東京)}というように、全ての属性情報を含んでいてもよく、或いは、属性名:場所が省略された{(年齢,20代)、(性別,M)}でもよい。省略された属性情報は、任意でよいものとして処理するものとする。
{(年齢,20代),(性別,M)}という登録情報がシステムに登録されており、評価対象情報として{(年齢,20代),(性別,M),(場所,東京)}が与えられた場合を考える。この場合、{(年齢,20代),(性別,M)}という登録情報は、年齢、性別以外の属性情報については任意でよいので、{(年齢,20代),(性別,M),(場所,東京)}という評価対象情報に対してマッチする。しかし、{(年齢,20代),(性別,M)}と、{(年齢,20代),(性別,M),(場所,東京)}とは、異なる情報であるので、互いを基に作成したハッシュは大きく異なる。そのため、システムが登録情報をハッシュテーブルで管理する場合、{(年齢,20代),(性別,M),(場所,東京)}を基に作成したハッシュに基づいてハッシュテーブルを検索しても、そのハッシュは、{(年齢,20代),(性別,M)}を基に作成した作成されたハッシュと一致せず、その登録情報を含むエントリを抽出することはできない。
上記のように、評価対象情報に含まれる属性情報の数と、登録情報の属性情報の数とが一致しない場合、それらを基に作成したハッシュが大きく異なる。このため、そのような評価対象情報を用いて、ハッシュテーブルから、属性値が任意でよいことを示すワイルドカードを含む登録情報を検索することができない。一般に、ハッシュテーブルを用いた情報検索は、完全一致検索を行う場合は、高速で動作し、有効であると言える。しかし、ハッシュを用いた情報検索は、情報をハッシュ変換することで、情報の意味や、連続性などが失われることから、完全一致検索ではない、連続関係や包含関係にある複数の情報の検索を、高速に行うことが困難である。
特許文献2に記載の解析方法は、単に、ハッシュの組み合わせを用いて、キャッシュテーブルに、データの組み合わせに対する出現回数が記憶済みであるか否かを検索しているに過ぎない。従って、特許文献2に記載の解析方法は、上記ハッシュテーブルを用いた情報検索における問題点を解消することはできない。
本発明は、上記に鑑み、ハッシュテーブルを用いた情報検索にて、登録情報が、属性値が任意でよいというワイルドカードを含んでいても、ワイルドカードを含まない評価対象情報にマッチする登録情報を検索できる情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体を提供することを目的とする。
本発明は、上記目的を達成するために、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報を入力する評価対象情報処理手段と、前記評価対象情報処理手段に入力された評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成手段と、前記組み合わせ生成手段が生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、前記属性情報連結手段が生成した前記連結属性値をハッシュに変換するハッシュ生成手段と、前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ生成手段が変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索手段とを有する情報検索システムを提供する。
本発明は、属性値を含む属性情報を1つ以上有する登録情報を入力する登録情報処理手段と、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記登録情報処理手段に入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成し、前記登録情報に前記補完パタンを加えた補完属性情報を生成する組み合わせ生成手段と、前記登録情報と、前記補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、前記属性情報連結手段で生成された前記連結属性値をハッシュに変換するハッシュ生成手段と、前記登録情報を、前記ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録手段と、前記属性情報を1つ以上含む評価対象情報を入力し、前記属性情報連結手段を用いて、入力された評価対象情報に含まれる属性値を連結した連結属性値を、前記ハッシュ生成手段を用いて変換したハッシュを含む情報検索要求を発生する評価対象情報処理手段と、前記ハッシュテーブルを検索し、前記情報検索要求に含まれるハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索手段とを有する情報検索システムを提供する。
本発明は、属性値を含む属性情報を1つ以上有する登録情報を入力する登録情報処理手段と、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記登録情報処理手段に入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成し、前記登録情報に前記補完パタンを加えた補完属性情報を生成する組み合わせ生成手段と、前記登録情報と、前記補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、前記属性情報連結手段で生成された前記連結属性値をハッシュに変換するハッシュ生成手段と、前記登録情報を、前記ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録手段とを有する情報管理装置を提供する。
本発明は、コンピュータが、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成ステップと、前記コンピュータが、前記生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、前記コンピュータが、属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、前記コンピュータが、前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ変換ステップで変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索ステップとを有する情報検索方法を提供する。
本発明は、コンピュータが、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力した登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成ステップと、前記コンピュータが、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、前記コンピュータが、前記属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、前記コンピュータが、前記登録情報を、前記ハッシュ変換ステップで変換したハッシュに対応付けてハッシュテーブルに登録する情報登録ステップと、前記コンピュータが、前記属性情報を1つ以上含む評価対象情報を入力し、該入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換する評価対象情報ハッシュ変換ステップと、前記コンピュータが、前記ハッシュテーブルを検索し、前記評価対象情報ハッシュ変換ステップで生成されたハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索ステップとを有する情報検索方法を提供する。
本発明は、コンピュータが、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力した登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成ステップと、前記コンピュータが、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、前記コンピュータが、前記属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、前記コンピュータが、前記登録情報を、前記ハッシュ変換ステップで変換したハッシュに対応付けてハッシュテーブルに登録する情報登録ステップとを有する情報管理方法を提供する。
本発明は、コンピュータに、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成処理と、前記生成された組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結処理と、属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値をハッシュ変換した補完属性情報と対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ変換処理で変換されたハッシュの何れかと一致するハッシュと対応付けて登録された登録情報を抽出する情報検索処理とを実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
本発明は、コンピュータに、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成処理と、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連処理と、前記属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、前記登録情報を、前記ハッシュ変換処理で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録処理と、前記属性情報を1つ以上含む評価対象情報を入力し、該入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換する評価対象情報ハッシュ変換処理と、前記ハッシュテーブルを検索し、前記評価対象情報ハッシュ変換処理で生成されたハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索処理とを実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
本発明は、コンピュータに、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成処理と、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連処理と、前記属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、前記登録情報を、前記ハッシュ変換処理で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録処理とを実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
本発明の情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体は、ハッシュテーブルを用いた情報検索にて、登録情報が、属性値が任意でよいというワイルドカードを含んでいても、ワイルドカードを含まない評価対象情報にマッチする登録情報を検索することができる。
本発明の第1実施形態の情報検索システムを示すブロック図である。 登録情報及び評価対象情報のデータ構造を示す図である。 情報登録の動作手順を示すフローチャートである。 情報評価の動作手順を示すフローチャートである。 属性情報の組み合わせの具体例を示す図である。 本発明の第2実施形態の情報検索システムが受信する評価対象情報を示す図である。 第2実施形態の情報検索システムで生成される評価対象情報の組み合わせを示す図である。 本発明の第3実施形態の情報検索システムを示すブロック図である。 パタン記憶部のデータ例、及び、組み合わせ生成手段で生成される補完パタンのデータ例を示す図である。 第3実施形態における情報登録の動作手順を示すフローチャートである。 第3実施形態における情報評価の動作手順を示すフローチャートである。
以下、図面を参照し、本発明の実施の形態を詳細に説明する。図1は、本発明の第1実施形態の情報検索システムを示している。情報検索システムは、登録情報処理手段11、属性情報連結手段12、ハッシュ生成手段13、組み合わせ生成手段14、評価対象情報処理手段15、及び、登録情報管理手段16を有する。情報検索システム内の各手段の機能は、コンピュータシステム上で、所定のプログラムを実行することで実現できる。
登録情報処理手段11は、1以上の属性情報を含む登録情報を受信する。登録情報処理手段11は、登録情報管理手段16に情報登録要求を送り、登録情報の記憶を要求する。
評価対象情報処理手段15は、1以上の属性情報を含む評価対象情報を受信する。評価対象情報は、登録情報を検索する際の検索条件を表している。評価対象情報処理手段15は、登録情報管理手段16に検索要求を送り、評価対象情報に基づく情報の検索を要求する。
登録情報管理手段16は、情報の登録、及び、登録された情報の検索を行う。
図2は、登録情報及び評価対象情報のデータ構造を示している。登録情報及び評価対象情報は、1以上の属性情報で構成される。各属性情報は、属性名と属性値とを含む。情報検索システムで取り扱う属性情報が全部でN種類(Nは2以上の整数)あるとして、登録情報は、N種類全ての属性情報について属性値を持っている必要はない。一部の属性情報は、省略されていてもよい。省略された属性情報は、任意の値を持つと解釈される。評価対象情報についても同様である。
組み合わせ生成手段14は、評価対象情報処理手段15から評価対象情報を受け取り、評価対象情報に含まれるM個(Mは1以上N以下の整数)の属性情報から、1〜M個を取り出した組み合わせを生成する。組み合わせ生成手段14は、例えばM=3であれば、評価対象情報に含まれる3つの属性情報から1つ取り出した組み合わせ(3通り)、3つの属性情報から2つの属性情報を取り出して組み合わせた組み合わせ(3通り)、3つの属性情報から3つの属性情報を取り出して組み合わせた組み合わせ(1通り)の計10通りの組み合わせを生成する。これら組み合わせは、情報検索を行う際の評価対象情報として用いられる。
属性情報連結手段12は、登録情報及び評価対象情報に含まれる属性情報を連結した連結属性値を生成する。その際、属性情報連結手段12は、属性情報を、所定の順序に並び替えた上で、属性値を連結する。ここで、属性情報連結手段12は、評価対象情報については、組み合わせ生成手段14で生成された各組み合わせに含まれる属性情報の属性値を連結する。
ハッシュ生成手段13は、属性情報連結手段12にて属性情報が連結された登録情報又は評価対象情報(組み合わせ)を、ハッシュに変換する。ハッシュ生成手段13におけるハッシュ変換には、例えばMD5やSHAに代表されるような一般的なハッシュ関数を用いることができる。
登録情報管理手段16は、情報登録手段17と情報検索手段18とを有する。登録情報管理手段16は、ハッシュテーブル19を用いて、情報管理を行う。
ハッシュテーブル19は、登録情報を、登録情報に含まれる属性値を連結した連結属性値に基づいて生成されたハッシュに対応付けて記憶している。
情報登録手段17は、登録情報処理手段11から情報登録要求を受ける。情報登録手段17は、登録情報と、ハッシュ生成手段13で変換された登録情報のハッシュとを対応付けてハッシュテーブル19に記録する。より詳細には、情報登録手段17は、情報登録要求を受けると、ハッシュテーブル19に、ハッシュをキーとし、登録情報を値とするエントリを作成し、登録情報をハッシュテーブル19に記録する。
情報検索手段18は、評価対象情報処理手段15から、情報検索要求を受ける。情報検索手段18は、情報検索要求を受けると、ハッシュテーブル19を検索し、ハッシュ生成手段13が生成した評価対象情報のハッシュの何れか(組み合わせ生成手段14で生成された組み合わせに対応するハッシュ)と一致するハッシュに対応付けて登録された登録情報を抽出する。
情報検索システムの動作は、大きく分けると、情報の登録を行う情報登録フローと、評価対象情報に対してマッチする登録情報を検索する情報評価フローとに分けることができる。
まず、情報登録フローについて説明する。図3は、情報登録の際の動作手順を示している。以下、本図を参照して説明する。
登録情報処理手段11は、1以上の属性情報を含む登録情報を受信する(ステップS101)。登録情報処理手段11は、登録情報を受信すると、属性情報連結手段12に受信した登録情報を渡す。
例えば、情報検索システムで扱う属性情報の種類が、年齢、性別、場所を含むN種類あったとする。属性登録情報処理手段11は、N種類すべての属性情報を含む登録情報を受信してもよいし、年齢、性別、場所の3種類の属性情報のみを含む登録情報を受信してもよい。N種類の属性情報のうち、登録情報に含まれない属性情報は、どのような値であってもよいことを示すワイルドカードとして扱う。情報検索システムは、受信する可能性があるN種類の属性情報を、あらかじめ知っておく必要はない。また、登録情報における属性情報の並び順は任意でよい。
属性情報連結手段12は、登録情報処理手段11から登録情報を受け取ると、登録情報から属性情報を抽出し、属性情報を所定の順番で連結した連結属性値を生成する(ステップS102)。属性情報連結手段12は、例えば、属性名に基づいて、属性情報を並び替える。並び順は、アルファベット順や、五十音順、数値の昇順/降順などが考えられる。或いは、属性情報連結手段12に、並び順を決定する設定ファイルを用意しておき、その設定ファイルに従って並び替えを行ってもよい。属性情報連結手段12は、例えば、{(年齢,20),(性別,F),(場所,東京)}という登録情報に対して、五十音順に属性名をソートし、「F20東京」という連結属性値を生成する。属性情報連結手段12は、連結属性値を、ハッシュ生成手段13に渡す。
ハッシュ生成手段13は、属性情報連結手段12から連結属性情報を受け取ると、受け取った連結属性値をハッシュ変換する(ステップS103)。ステップS103で生成されたハッシュは、登録情報のハッシュに対応する。ハッシュ生成手段13は、変換した登録情報のハッシュを、登録情報処理手段11に渡す。登録情報処理手段11は、登録情報を変換したハッシュを受け取ると、受け取ったハッシュと登録情報とを含む情報登録要求を、登録情報管理手段16に送る。登録情報管理手段16の情報登録手段17は、情報登録要求を受け取ると、ハッシュテーブル19に、情報登録要求に含まれるハッシュをキーとし、値を登録情報とするエントリを作成する(ステップS104)。
情報登録手段17は、ハッシュテーブル19へのエントリの登録を行う際に、既に同一のハッシュをキーに持つエントリが存在しているか否かを調べる。情報登録手段17は、同一ハッシュキーのエントリが存在するときは、同一のハッシュキーを持つエントリとしてリスト管理する。情報検索システムでは、図3に示す手順で情報登録を行うことで、属性情報にどのような値でもよいというワイルドカードを含んでいる登録情報に対して、1つのハッシュが作成され、登録情報がハッシュテーブル19で管理される。
次いで、情報評価フローについて説明する。図4は、情報評価の動作手順を示している。以下、本図を参照して説明する。
評価対象情報処理手段15は、1以上の属性情報を含む評価対象情報を受信する(ステップS201)。評価対象情報処理手段15は、受信した評価対象情報を組み合わせ生成手段14に渡す。
組み合わせ生成手段14は、評価対象情報処理手段15から評価対象情報を受け取ると、評価対象情報から属性情報を抽出し、評価対象情報に含まれる属性情報の組み合わせを生成する(ステップS202)。組み合わせ生成手段14は、ステップS202では、抽出したM個の属性情報から、1〜M個を選択した属性情報の組み合わせを生成し、それらを新たな評価対象情報とする。
図5は、属性情報の組み合わせ例を示している。評価対象情報処理手段15が受信した評価対象情報は、3つの属性情報(属性情報1(属性名:年齢、属性値20)、属性情報2(属性名:性別、属性値)、属性情報3(属性名:場所、属性値:東京))を含んでいたとする。組み合わせ生成手段14は、それら3つの属性情報から1つを選択した3通りの組み合わせ{(年齢:20)}、{(性別:M)}、{(場所:東京)}を新たな評価対象情報1〜3とする。また、組み合わせ生成手段14は、3つの属性情報から2つを選択した3通りの組み合わせ{(年齢:20),(性別:M)}、{(年齢:20),(場所:東京)}、{(性別:M),(場所:東京)}を新たな評価対象情報4〜6とし、3つの属性情報から3つを取り出した1通りの組み合わせ{(年齢:20),(性別:M),(場所:東京)}を新たな評価対象情報7とする。
組み合わせ生成手段14は、ステップS202で生成した属性情報の組み合わせ(新たな評価対象情報)のうちの1つを選択し、選択した評価対象情報を属性情報連結手段12に送る(ステップS203)。
属性情報連結手段12は、組み合わせ生成手段14から受け取った評価対象情報から属性情報を抽出し、抽出した属性情報を所定の順番に並び替えて連結した連結属性値を生成する(ステップS204)。例えば、属性情報連結手段12は、組み合わせ生成手段14から、図5の新たな評価対象情報7{(年齢:20),(性別:M),(場所:東京)}を受け取り、属性名を五十音順にソートし、“性別”、“年齢”、“場所”の順番で属性値を連結した「M20東京」という連結属性値を生成する。
組み合わせ生成手段14は、ステップS202で生成した新たな評価対象情報を全て選択したか否かを判断する(ステップS205)。組み合わせ生成手段14は、全ての評価対象情報を選択していないと判断すると(ステップS205;N)、ステップS203に戻って、未選択の新たな評価対象情報から1つを選択し、選択した新たな評価対象情報を属性情報連結手段12に送る。ステップS203〜ステップS205を繰り返し行うことで、属性情報連結手段12は、ステップS202で生成された新たな評価対象情報の全てについて、所定の順番で属性値を連結した連結属性値を生成する。
全ての評価対象情報について処理が行われた場合(ステップS205;Y)、属性情報連結手段12は、生成した連結属性値を、ハッシュ生成手段13に送る。ハッシュ生成手段13は、受け取った連結属性値のうちの1つを選択し、連結属性値をハッシュに変換する(ステップS206)。
ハッシュ生成手段13は、受け取った連結属性値を全て選択した否かを判断する(ステップS207)。ハッシュ生成手段13は、未選択の連結属性値があるときは(ステップS207;N)、ステップS206に戻り、未選択の連結属性値の中から1つを選択して、ハッシュを生成する。ハッシュ生成手段13は、ステップS206、S207を繰り返し行うことで、ステップS202で生成された新たな評価対象情報に対応する連結属性値の全てについて、連結属性値をハッシュに変換する。
ハッシュ生成手段13は、連結属性値を変換したハッシュ、つまり、ステップS202で生成された新たな評価対象情報に対応するハッシュを、評価対象情報処理手段15に送る。評価対象情報処理手段15は、ハッシュを受け取ると、受け取ったハッシュのうちの1つを選択し、選択したハッシュを含む情報検索要求を、登録情報管理手段16に送る。全ての連結属性値についてハッシュが作成された場合(ステップS207;Y)、登録情報管理手段16の情報検索手段18は、情報検索要求を受け取ると、ハッシュテーブル19を検索し、受け取った情報検索要求に含まれるハッシュをキーとするエントリを抽出する(ステップS208)。情報検索手段18は、抽出したエントリの登録情報を、評価対象情報処理手段15に渡す。
評価対象情報処理手段15は、属性情報連結手段12から受け取ったハッシュを全て選択したか否かを判断する(ステップS209)。評価対象情報処理手段15は、全てのハッシュを選択していないときは(ステップS209;N)、ステップS208に戻り、未選択のハッシュの中から1つを選択し、選択したハッシュを含む情報検索要求を、登録情報管理手段16に送る。評価対象情報処理手段15は、ステップS208、S209を繰り返し行うことで、ステップS202で生成された新たな評価対象情報に対応するハッシュを含む情報検索要求を、登録情報管理手段16に送り、情報検索を行う。一方、全てのハッシュが検索された場合(ステップS209;Y)、本フローは終了する。
本実施形態では、組み合わせ生成手段14は、属性情報をM個有する評価対象情報から、1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する。属性情報連結手段12は、組み合わせ生成手段14が生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する。ハッシュ生成手段13は、属性情報連結手段12が生成した連結属性値に基づいて、ハッシュを生成する。情報検索手段18は、ハッシュテーブル19を検索し、ハッシュ生成手段13が生成したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する。
本実施形態では、評価対象情報に含まれる属性情報を1〜M個取り出して組み合わせた組み合わせを生成し、その組み合わせに含まれる属性情報の属性値を連結した上で、ハッシュに変換している。評価対象情報そのもののハッシュだけでなく、評価対象情報に含まれる属性情報の組み合わせに対してもハッシュを生成することで、属性値が任意でよいことを示すワイルドカードを含む登録情報に対して、その登録情報のハッシュと同一のハッシュを得ることができる。このようなハッシュを用いて、ハッシュテーブル19を検索することで、評価対象情報と完全一致する登録情報だけでなく、評価対象情報に含まれる属性情報の数よりも少ない数の属性情報を有する登録情報を抽出可能である。
本実施形態では、評価対象情報から、その評価対象情報にマッチすべき登録情報のキーとなっているハッシュを全て作成し、ハッシュテーブル19の検索を行っている。このようにすることで、ハッシュテーブル19を用いた情報検索にて、登録情報が、属性値が任意でよいというワイルドカードを含んでいても、ワイルドカードを含まない評価対象情報にマッチする登録情報を検索することができる。
ここで、登録情報及び評価対象情報に含まれる属性情報の順序が一定でないと、含まれる属性情報自体の内容は同じ内容であっても、登録情報及び評価対象情報のハッシュは、属性情報の順序に依存して異なる値になる。例えば、登録情報が{(年齢:20代),(性別:M)}であり、評価対象情報として、{(性別:M),(年齢:20代)}が与えられたとする。この登録情報と評価対象情報とは、属性情報の並び順が異なるだけで、情報の内容は同一であると言える。従って、{(年齢:20代),(性別:M)}という登録情報は、{(性別:M),(年齢:20代)}という評価対象情報に対してマッチする。しかし、登録情報{(年齢:20代),(性別:M)}を基に生成するハッシュ(Hash(20代M))と、評価対象情報{(性別:M),(年齢:20代)}を基に生成するハッシュ(Hash(M20代)とは、値が異なる。このため、評価対象情報{(性別:M),(年齢:20代)}のハッシュを用いてハッシュテーブルを検索しても、本来であれば検索されるべき登録情報{(年齢:20代),(性別:M)}が検索されない。
本実施形態では、上記問題に対し、属性情報連結手段12にて、登録情報及び評価対象情報に含まれる属性情報を所定の順序に並び替えている。ハッシュ生成手段13は、所定の順序で連結された属性情報の属性値に基づいてハッシュを生成する。このようにすることで、属性情報の内容が同じであれば、その並び順に依存せずに、ハッシュテーブル19に登録情報と共に登録されるハッシュと、情報検索の際に評価対象情報から生成するハッシュとを、同じ値にすることができる。上記の例では、ハッシュテーブル19にて登録情報{(年齢:20代),(性別:M)}と対応付けて登録されるハッシュと、情報検索の際に評価対象情報{(性別:M),(年齢:20代)}から生成されるハッシュとを同一の値にすることができる。従って、本実施形態では、登録情報及び評価対象情報における属性情報の並びが不一致であっても、ハッシュテーブルを用いた情報検索が可能になる。
本発明の第2実施形態について説明する。本実施形態の情報検索システムの構成は、図1に示す第1実施形態の情報検索システムの構成と同様である。本実施形態では、評価対象情報に含まれる属性情報のうちに、組み合わせ生成手段14にて組み合わせを生成する際に利用する属性情報を指定する属性選択情報を導入する。評価対象情報処理手段15は、評価対象情報と、属性選択情報とを受信する。属性選択情報は、必要に応じて入力される情報である。評価対象情報処理手段15は、評価対象情報と属性選択情報とを組み合わせ生成手段14に送る。
組み合わせ生成手段14は、属性選択情報の入力がないときは、第1実施形態と同様に、評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する。組み合わせ生成手段14は、属性選択情報が入力されたときは、評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせのうち、属性選択情報で指定された属性情報を含む組み合わせを生成する。言い換えれば、組み合わせ生成手段14は、M個の属性情報を含む評価対象情報から、属性選択情報で指定された属性情報を含む1〜M個を選択して組み合わせた組み合わせを生成する。
図6は、評価対象情報処理手段15が受信する情報を示している。ここでは、属性選択情報を、前回の情報検索で用いた評価対象情報から変更があった属性情報を示す変更属性情報としている。図6の例では、変更があった属性情報は、属性名:場所である。つまり、図6に示す評価対象情報と、前回の評価対象情報とを比較したとき、異なっている属性情報は、(場所:神奈川)の部分である。その他の部分(属性名:性別、年齢)は、前回の評価対象情報における属性情報と同じ属性値である。変更属性情報は、組み合わせ生成に利用する変更部分の属性情報(属性名及び属性値)でもよいし、組み合わせ生成に利用する属性情報の属性名だけでもよい。
図7は、組み合わせ生成手段14で生成される組み合わせの具体例を示している。評価対象情報及び変更属性情報として、図6に示す情報が与えられているとする。組み合わせ生成手段14は、図6に示す評価対象情報から、変更属性情報が示す“属性名:場所”を含む組み合わせを生成する。これらを、新たな評価対象情報とする。図5では、全ての組み合わせを新たな評価対象情報とした結果、新たな評価対象情報の数(組み合わせの数)は、7つある。これに対し、図7では、全ての組み合わせのうち、変更属性情報が示す属性名の属性情報を含む組み合わせを新たな評価対象情報とするので、新たな評価対象の数は4つとなる。
動作手順について説明する。情報登録の動作手順は、図3に示す第1実施形態における手順と同様である。また、情報評価の動作手順も、図4に示す第1実施形態における手順と同様である。ただし、評価対象情報処理手段15に評価対象情報と共に属性選択情報が入力されたときに、ステップS202で行う組み合わせの生成で生成する属性情報の組み合わせの動作が、第1実施形態とは相違する。以下、この相違点について説明する。
評価対象情報処理手段15は、ステップS201で、評価対象情報と属性選択情報(変更属性情報)を受信すると、評価対象情報と変更属性情報とを組み合わせ生成手段14に送る。組み合わせ生成手段14は、評価対象情報処理手段15から、評価対象情報と変更属性情報とを受け取ると、評価対象情報から属性情報を抽出する。組み合わせ生成手段14は、評価対象情報に含まれる属性情報の数をM個として、M個の属性情報から、変更属性情報が示す属性情報を含む1〜M個の属性情報を選択する組み合わせを生成する。
例えば、組み合わせ生成手段14は、図6の示す評価対象情報{(年齢:20),(性別:M),(場所:神奈川)}と、変更属性情報{場所}とを受け取った場合、評価対象情報に含まれる3つの属性情報から、属性名:場所の属性情報を含む1つを取り出した組み合わせ{(場所:神奈川)}と、属性名:場所の属性情報を含む2つを取り出した組み合わせ{(年齢:20),(場所:神奈川)}、{(性別:M),(場所:神奈川)}と、属性名:場所の属性情報を含む3つを取り出した組み合わせ{(年齢:20),(性別:M),(場所:神奈川)}とを生成する(図7)。組み合わせ生成手段14は、これら組み合わせを、新たな評価対象情報として、属性情報連結手段12に渡す。
変更属性情報の入力がある場合、属性情報連結手段12は、ステップS202で作成された、評価対象情報に含まれる属性情報の組み合わせのうち、変更属性情報が示す属性情報を含む組み合わせについて、属性値を連結した連結属性値を生成する。ハッシュ生成手段13は、ステップS206で、属性情報連結手段12が生成した連結属性値に基づいてハッシュを生成する。属性情報連結手段12は、評価対象情報に含まれる属性情報の組み合わせのうち、変更属性情報が示す属性情報を含む組み合わせについて連結属性値を生成するので、ハッシュ生成手段13は、評価対象情報に含まれる属性情報の組み合わせのうち、変更属性情報が示す属性情報の組み合わせに対応するハッシュを生成することになる。情報検索手段18は、ステップS208で、ハッシュ生成手段13が生成したハッシュを用いて、ハッシュテーブル19内を検索する。
本実施形態では、組み合わせ生成手段14は、評価対象情報に含まれる属性情報の組み合わせのうち、属性指定情報で指定された属性情報を含む組み合わせを生成する。属性情報連結手段12は、組み合わせ生成手段14で生成された組み合わせに含まれる属性情報を所定の順序に並べて連結する。ハッシュ生成手段13は、属性情報連結手段12で連結された連結属性値からハッシュを生成する。評価対象情報処理手段15は、ハッシュ生成手段13が生成したハッシュを含む情報検索要求を登録情報管理手段16に送る。情報検索手段18は、ハッシュテーブル19を検索して、情報検索要求に含まれるハッシュに一致するハッシュをキーとするエントリを抽出し、評価対象情報処理手段15に送る。本実施形態では、組み合わせ生成手段14で生成する組み合わせの数を第1実施形態に比して削減しており、ハッシュの生成数、及び、ハッシュテーブルの検索回数を第1実施形態に比して減少させているため、システム全体の処理を削減することができる。
例えば、ある評価対象情報1で情報検索を行い、その後、別の評価対象情報2で情報検索を行う場合を考える。情報検索システムは、評価対象情報1に対して、第1実施形態で説明した手順で、評価対象情報に含まれる属性情報の組み合わせにマッチする登録情報を抽出する。その後に行う評価対象情報2の情報検索では、評価対象情報処理手段15に、評価対象情報2と共に、評価対象情報1と評価対象情報2とで異なる属性情報を示す変更属性情報(属性指定情報)を入力する。情報検索システムは、評価対象情報2の情報検索では、変更属性情報を含む組み合わせのハッシュを用いて、情報検索を行う。
ここで、評価対象情報2の情報検索で生成する組み合わせには、変更属性情報で示される属性情報を含まない属性情報の組み合わせが含まれない。しかし、評価対象情報2に含まれる属性情報のうち、変更属性情報で示される属性情報以外の属性情報は、評価対象情報1に含まれているため、変更属性情報で示される属性情報を含まない属性情報の組み合わせは、評価対象情報1の情報検索の際に既に作成されている。従って、評価対象情報1と評価対象情報2とで共通の属性情報の組み合わせにマッチする登録情報は、評価対象情報1の情報検索のときに抽出されていることが保証される。このため、評価対象情報2の情報検索で抽出されなくても問題がない。
具体例を用いて説明する。ハッシュテーブル19には、{(年齢:20代),(性別:M)}、及び、{(年齢:20代),(性別:M),(場所:神奈川)}という登録情報を含むエントリが登録されているとする。評価対象情報処理手段15に対して、評価対象情報{(年齢:20代),(性別:M),(場所:東京)}が入力されると、組み合わせ生成手段14は、図5に示す7つの組み合わせを作成する。情報検索システムは、図5に示す7つの組み合わせ(新たな評価対象情報1〜7)をハッシュに変換して情報検索を行うことで、登録情報{(年齢:20代),(性別:M)}を抽出する。
上記評価対象情報1に対する情報検索に後続して、評価対象情報2に対する情報検索を行う。このとき、評価対象情報処理手段15には、評価対象情報2{(年齢:20代),(性別:M),(場所:神奈川)}に加えて、評価対象情報1からの変更箇所を示す変更属性情報{(場所:神奈川)}が入力される(図6)。組み合わせ生成手段14は、評価対象情報2に含まれる属性情報の組み合わせのうち、(場所:神奈川)を含む組み合わせを生成する(図7)。情報検索システムは、図7に示す4つの組み合わせ(新たな評価対象情報1〜4)をハッシュに変換して情報検索を行うことで、{(年齢:20代),(性別:M),(場所:神奈川)}を抽出する。情報検索システムは、評価対象情報2に対する情報検索では、{(年齢:20代),(性別:M)}は抽出しない。
第1実施形態では、評価対象情報に含まれる属性情報の数をMとして、組み合わせ生成手段14は、
Figure 2011004846
通りの組み合わせを生成する。第1実施形態では、それら組み合わせに対してハッシュを生成し、ハッシュテーブル19の検索を行う。本実施形態では、属性指定情報を用いて、組み合わせ生成手段14で生成する組み合わせを、評価対象情報に含まれる属性情報の組み合わせのうち、属性指定情報で示される属性情報を含む組み合わせに限定している。組み合わせ生成手段14で生成する組み合わせを、属性指定情報で示される属性情報を含み組み合わせに限定することで、既に行った評価対象情報に対する情報検索ではマッチしないが、今回の評価対象情報に対する情報検索を行った結果マッチする登録情報を抽出できる。本実施形態は、ハッシュの生成、及び、ハッシュテーブルの検索の回数を、全ての組み合わせを生成する第1実施形態に比して削減できる効果があり、システム全体の処理量を削減できる効果がある。
本発明の第3実施形態について説明する。図8は、本発明の第3実施形態の情報検索システムを示している。本実施形態の情報検索システムは、登録情報処理手段21、組み合わせ生成手段24、ハッシュ生成手段23、属性情報連結手段22、評価対象情報処理手段25、及び、登録情報管理手段26を備える。登録情報管理手段26は、情報登録手段27と情報検索手段28とを有する。登録情報処理手段21、組み合わせ生成手段24、ハッシュ生成手段23、属性情報連結手段22、及び、情報登録手段27は、情報管理装置に相当する。
第1実施形態では、組み合わせ生成手段14(図1)を用いて評価対象情報の組み合わせを生成し、その連結属性値をハッシュ変換した。これに対し、本実施形態では、組み合わせ生成手段24を用いて登録情報の組み合わせを生成し、その連結属性値をハッシュ変換する。この点が、第1実施形態と第3実施形態との主な相違点である。
登録情報処理手段21は、1以上の属性情報を含む登録情報を受信する。評価対象情報処理手段25は、1以上の属性情報を含む評価対象情報を受信する。登録情報及び評価対象情報は、図2に示すものと同様である。登録情報管理手段26は、情報の登録、及び、登録された情報の検索を行う。
組み合わせ生成手段24は、情報検索システムで扱う属性情報を記憶するパタン記憶部30を有する。パタン記憶部30には、事前に、登録情報として取り扱い得る属性情報の属性値が記憶されている。組み合わせ生成手段24は、登録情報処理手段21から、登録情報を受け取る。組み合わせ生成手段24は、入力され得る属性情報のうち、受け取った登録情報にどの属性名の属性情報が含まれていないかを特定する。組み合わせ生成手段24は、パタン記憶部30を参照して、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する。組み合わせ生成手段24は、生成した補完パタンに登録情報を加え、これを補完属性情報とする。組み合わせ生成手段24は、生成した補完属性情報を、新たな登録情報とする。
属性情報連結手段22は、登録情報及び評価対象情報に含まれる属性情報の属性値を連結する。その際、属性情報連結手段22は、属性情報を所定の順序に並び替えた上で、連結属性値を生成する。属性情報連結手段22は、登録情報については、入力された登録情報と、組み合わせ生成手段24が生成した新たな登録情報とに対して、並び替えと属性値の連結とを行う。すなわち、属性情報連結手段22は、登録情報処理手段21に入力された登録情報と、登録情報に補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する。属性情報連結手段22における属性情報の並び替えの順序は、第1実施形態における属性情報連結手段12における属性情報の並び替えの順序と同じでよい。ハッシュ生成手段23は、属性情報連結手段22で生成された連結属性値をハッシュ変換する。ハッシュ変換には、例えばMD5やSHAに代表されるような一般的なハッシュ関数を用いることができる。
登録情報管理手段26は、ハッシュテーブル29を用いて、情報管理を行う。登録情報管理手段26の情報登録手段27は、登録情報処理手段21から情報登録要求を受ける。情報登録手段27は、ハッシュテーブル29に、登録情報と、ハッシュ生成手段23で変換されたハッシュとを対応付けて記録する。より詳細には、情報登録手段27は、ハッシュテーブル29に、入力された登録情報と組み合わせ生成手段24で生成された新たな登録情報とに対応する各ハッシュをキーとし、登録情報を値とするエントリを作成し、登録情報をハッシュテーブル29に記録する。
情報検索手段28は、評価対象情報処理手段25から情報検索要求を受ける。情報検索手段28は、情報検索要求を受けると、ハッシュテーブル29を検索し、ハッシュ生成手段23が生成した評価対象情報のハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する。
図9は、パタン記憶部30のデータ例、及び、組み合わせ生成手段24で生成される補完パタンのデータ例を示している。ここでは、システムで取り扱う属性値として、性別、年齢、場所の3つの属性情報を考える。パタン記憶部30は、属性名:性別について、属性値:Mと、属性値:Fとを記憶している。また、パタン記憶部30は、属性名:年齢について、属性値:20代と、属性値:30代、属性値:40代を記憶している。パタン記憶部30は、属性名:場所については、属性値:東京と、属性値:神奈川とを記憶している。
登録情報処理手段21が受信した登録情報が、{(年齢:20代)}であったとする。組み合わせ生成手段24は、登録情報に含まれる属性情報の属性名と、パタン記憶部30が記憶する属性名とを比較する。組み合わせ生成手段24は、パタン記憶部30が記憶している属性情報の属性名のうち、登録情報に含まれる属性情報の属性名と一致しない属性名を特定する。言い換えれば、組み合わせ生成手段24は、登録情報に含まれ得る全ての属性情報のうち、受信された登録情報に欠落している属性情報の属性名を特定する。上記のケースでは、組み合わせ生成手段24は、属性名:性別、及び、属性名:場所の属性情報を、欠落している属性情報として特定する。
組み合わせ生成手段24は、パタン記憶部30を参照して、上記特定した欠落している属性情報の組み合わせ(補完パタン)を作成する。図9のケースでは、欠落している属性情報は属性名:性別と属性名:場所の2つであり、これらはそれぞれ2通りの属性値を持つことから、属性名ごとに1つの属性値を選ぶ組み合わせを作成すると、計8通りの組み合わせができる。組み合わせ生成手段24は、登録情報に補完パタンに含まれる属性情報を加えた補完属性情報を、新たな登録情報(新たな登録情報1〜8)とする。
図10は、情報登録の動作手順を示している。以下、本図を参照して説明する。
登録情報処理手段21は、1以上の属性情報を含む登録情報を受信する(ステップS301)。登録情報処理手段21は、受信した登録情報を、組み合わせ生成手段24に渡す。入力され得る属性情報の種類が、年齢、性別、場所、・・・のN種類であったとき、登録情報は、N種類全ての属性情報を含んでいてもよいし、年齢、性別、場所の3種類の属性情報のみを含んでいてもよい。含まれない属性情報は、どのような値であってもよいというワイルドカードとして扱われる。
組み合わせ生成手段24は、登録情報処理手段21から登録情報を受け取ると、パタン記憶部30を参照して補完パタンを生成し、登録情報に補完パタンとを組み合わせる(ステップS302)。組み合わせ生成手段24は、ステップS302では、まず、登録情報から属性情報を抽出し、抽出した属性情報の属性名と、パタン記憶部30が記憶する属性情報の属性名とを比較する。次いで、組み合わせ生成手段24は、パタン記憶部30に記憶される属性情報の属性名のうち、登録情報に含まれない属性名を特定する。組み合わせ生成手段24は、登録情報に含まれない属性名の属性情報を、属性名ごとに1つずつ選択し、属性情報を組み合わせた補完パタンを生成する。組み合わせ生成手段24は、補完パタンに登録情報の属性情報を加えた補完属性情報を新たな登録情報として生成する。
組み合わせ生成手段24は、登録情報処理手段21から受け取った登録情報(オリジナルの登録情報)及びステップS302で生成した新たな登録情報から1つを選択し、属性情報連結手段22に送る(ステップS303)。
属性情報連結手段22は、組み合わせ生成手段24から受け取った登録情報から属性情報を抽出し、属性情報を所定の順番に並び替えて連結した連結属性値を生成する(ステップS304)。
組み合わせ生成手段24は、全ての登録情報を選択したか否かを判断する(ステップS305)。組み合わせ生成手段24は、未選択の登録情報が残っているときは(ステップS305;N)、ステップS303に戻り、未選択の登録情報の中から1つを選択し、属性情報連結手段22に送る。ステップS303からステップS305を繰り返し行うことで、属性情報連結手段22は、オリジナルの登録情報とステップS302で生成された新たな登録情報とについて、所定の順番で属性値を連結した連結属性値を生成する。
属性情報連結手段22は、生成した連結属性情報をハッシュ生成手段23に送る。全ての登録情報について処理が行われた場合(ステップS305;Y)、ハッシュ生成手段23は、受け取った連結属性値のうちの1つを選択し、連結属性値をハッシュ変換する(ステップS306)。
ハッシュ生成手段23は、受け取った連結属性値を全て選択したか否かを判断し(ステップS307)、未選択の連結属性値があるときは(ステップS307;N)、ステップS306に戻り、未選択の連結属性値の中から1つを選択し、ハッシュを生成する。ハッシュ生成手段23は、ステップS306、S307を繰り返し行うことで、オリジナルの登録情報及びステップS302で生成された新たな登録情報に対応する連結属性値をハッシュに変換する。
属性情報連結手段22は、連結属性値を変換したハッシュ、つまり、オリジナルの登録情報及びステップS302で生成された新たな登録情報に対応するハッシュを、登録情報処理手段21に送る。登録情報処理手段21は、ハッシュを受け取ると、受け取ったハッシュのうちの1つを選択し、選択したハッシュと登録情報とを含む情報登録要求を、登録情報管理手段26に送る。全ての連結属性値についてハッシュが作成された場合(ステップS307;Y)、登録情報管理手段26の情報登録手段27は、ハッシュテーブル29に、情報登録要求に含まれるハッシュをキーとし、値を登録情報とするエントリを作成し、登録情報をハッシュを用いて管理する(ステップS308)。その際、情報登録手段27は、既に同一のハッシュをキーに持つエントリが存在しているか否かを調べ、存在するときは、同一のハッシュキーを持つエントリとしてリスト管理する。
登録情報処理手段21は、属性情報連結手段22から受け取ったハッシュを全て選択したか否かを判断する(ステップS309)。登録情報処理手段21は、全てのハッシュを選択していないときは(ステップS309;N)、ステップS308へ戻り、未選択のハッシュの中から1つを選択し、選択したハッシュを含む情報登録要求を、登録情報管理手段26に送る。登録情報管理手段26の情報登録手段27は、ステップS208、S309を繰り返し行うことで、オリジナルの登録情報に対応するハッシュ、及び、ステップS302で生成された新たな登録情報に対応するハッシュを、ハッシュテーブル29に登録する。図10に示す手順で情報登録を行うことで、登録情報にマッチする全ての評価対象情報のパタンのハッシュに対して、登録情報を関連付けてハッシュテーブル29で管理することができる。一方、全てのハッシュが登録された場合(ステップS309;Y)、本フローは終了する。
図11は、情報評価の動作手順を示している。以下、本図を参照して説明する。
評価対象情報処理手段25は、1以上の属性情報を含む評価対象情報を受信する(ステップS401)。評価対象情報処理手段25は、評価対象情報を、属性情報連結手段22に送る。
属性情報連結手段22は、評価対象情報処理手段25から受け取った評価対象情報から属性情報を抽出し、属性情報を所定の順番に並び替え、属性値を連結した連結属性値を生成する(ステップS402)。属性情報連結手段22は、生成した連結属性値を、ハッシュ生成手段23に送る。
ハッシュ生成手段23は、属性情報連結手段22から連結属性値を受け取る。ハッシュ生成手段23は、属性情報連結手段22から受け取った評価対象情報の連結属性値をハッシュ変換する(ステップS403)。ハッシュ生成手段23は、変換したハッシュを、評価対象情報処理手段25に送る。評価対象情報処理手段25は、評価対象情報に対応するハッシュを受け取ると、受け取ったハッシュを含む情報検索要求を、登録情報管理手段26に送る。
登録情報管理手段26は、評価対象情報処理手段25から情報検索要求を受け取ると、ハッシュテーブル29から、情報検索要求に含まれるハッシュをキーとするエントリを取得する(ステップS404)。登録情報管理手段26は、取得したエントリの登録情報を、評価対象情報処理手段25に渡す。ハッシュテーブル29には、情報登録時に、登録情報そのものから生成したハッシュだけでなく、登録情報に補完パタンを加えた補完属性情報から生成したハッシュも登録されている。従って、図11に示す手順で情報検索を行うことで、登録情報がワイルドカードを含むときでも、評価対象情報から、その評価対象情報にマッチする登録情報を抽出できる。
本実施形態では、組み合わせ生成手段24は、パタン記憶部30を参照して、登録情報として扱い得る属性情報のうち、登録情報処理手段21に入力された登録情報に含まれない属性情報の組み合わせから成る補完パタンを生成し、補完パタンに登録情報を加えた補完属性情報を新たな登録情報とする。属性情報連結手段22は、登録情報と、登録情報に補完パタンを加えた補完属性情報とについて、属性値を連結した連結属性値を生成する。ハッシュ生成手段23は、属性情報連結手段22が生成した連結属性値をハッシュ変換する。情報登録手段27は、登録情報を、ハッシュ生成手段23で変換されたハッシュに対応付けてハッシュテーブル29に登録する。
組み合わせ生成手段24が生成する、補完パタンに登録情報を加えた新たな登録情報は、情報検索の際にマッチすべき評価対象情報のパタンと一致する。情報登録手段27は、登録情報に対応するハッシュと、組み合わせ生成手段24が生成した新たな登録情報に対応するハッシュとを、登録情報に対応付けてハッシュテーブル29に登録する。このような情報登録を行うことで、情報検索に際し、評価対象情報のハッシュを用いて、評価対象情報に完全一致する登録情報だけでなく、ワイルドカードを含む登録情報の抽出が可能になる。属性情報連結手段22が登録情報及び評価対象情報の属性値を所定の順序で連結することで得られる効果は、第1実施形態と同様である。
第3実施形態と第1及び第2実施形態とを比較すると、第3実施形態では、事前に、登録情報として取り扱い得る属性情報の属性値をパタン記憶部30に入力しておく必要がある。しかし、第3実施形態では、第1及び第2実施形態と異なり、情報検索時に、評価対象情報の組み合わせを生成する必要がないため、情報評価の際の処理時間を、第1及び第2実施形態に比して短縮できる効果がある。このことから、本実施形態は、評価対象情報をリアルタイムに処理するストリーム処理を行うシステムに有効であると言える。
以上、本発明をその好適な実施形態に基づいて説明したが、本発明の情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体は、上記実施形態にのみ限定されるものではなく、上記実施形態の構成から種々の修正及び変更を施したものも、本発明の範囲に含まれる。
最後に、本発明の最小構成について説明する。本発明の情報検索システムは、最小構成として、評価対象情報処理手段と、組み合わせ生成手段と、属性情報連結手段と、ハッシュ生成手段と、情報検索手段とを有する。評価対象情報処理手段は、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報を入力する。組み合わせ手段は、評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する。属性情報連結手段は、組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する。ハッシュ変換手段は、連結属性値をハッシュに変換する。情報検索手段は、属性情報を1つ以上有する登録情報を、登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、ハッシュ生成手段が変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する。
本発明の情報検索方法の最小構成は、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成すると、生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成するステップと、属性情報連結ステップで生成した連結属性値をハッシュに変換するステップと、属性情報を1つ以上有する登録情報を、登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、ハッシュに変換するステップで変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出するステップとで構成される。
本発明のプログラムを記録したコンピュータ読み取り可能な記録媒体の最小構成は、コンピュータに、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する処理と、生成された組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する処理と、連結属性値をハッシュに変換する処理と、属性情報を1つ以上有する登録情報を、登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、ハッシュ変換処理で変換されたハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する処理とを実行させるという構成である。
本発明の情報検索システム、情報検索方法、及び、プログラムを記録したコンピュータ読み取り可能な記録媒体では、評価対象情報に含まれる属性情報の組み合わせを生成し、生成した組み合わせに含まれる属性情報を連結してハッシュに変換する。その後、組み合わせに対応するハッシュを用いて、ハッシュテーブルを検索し、登録情報の抽出を行う。評価対象情報から属性情報を取り出して生成した組み合わせは、当該評価対象情報に対してマッチすべき登録情報と一致する。従って、生成した組み合わせに対応するハッシュを用いてハッシュテーブルを検索することで、評価対象情報に完全一致する登録情報だけでなく、評価対象情報よりも属性情報の数が少ない、すなわちワイルドカードを含む登録情報を抽出できる。
本発明の情報検索システムは、最小構成として、登録情報処理手段と、組み合わせ生成手段と、属性情報連結手段と、ハッシュ生成手段と、情報登録手段と、評価対象情報処理手段と、情報検索手段とを有する。登録情報処理手段は、属性値を含む属性情報を1つ以上有する登録情報を入力する。組み合わせ生成手段は、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する。組み合わせ生成手段は、登録情報に補完パタンを加えた補完属性情報を生成する。属性情報連結手段は、登録情報と、補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する。ハッシュ生成手段は、連結属性値をハッシュに変換する。情報登録手段は、登録情報を、ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する。評価対象情報処理手段は、属性情報を1つ以上含む評価対象情報を入力し、属性情報連結手段を用いて、入力された評価対象情報に含まれる属性値を連結した連結属性値を、ハッシュ生成手段を用いて変換したハッシュを含む情報検索要求を発生する。情報検索手段は、ハッシュテーブルを検索し、情報検索要求に含まれるハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する。
本発明の情報検索方法の最小構成は、属性値を含む属性情報を1つ以上有する登録情報を入力し、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成するステップと、登録情報と、登録情報に補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成するステップと、連結属性値をハッシュに変換するステップと、登録情報を、ハッシュに変換するステップで変換したハッシュに対応付けてハッシュテーブルに登録するステップと、属性情報を1つ以上含む評価対象情報を入力し、入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換するステップと、ハッシュテーブルを検索し、評価対象情報を変換したハッシュと一致するハッシュに対応付け登録された登録情報を抽出するステップとを有する構成である。
本発明のプログラムを記録したコンピュータ読み取り可能な記録媒体の最小構成は、コンピュータに、属性値を含む属性情報を1つ以上有する登録情報を入力し、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する処理と、登録情報と、登録情報に補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する処理と、連結属性値をハッシュに変換する処理と、登録情報を、ハッシュを変換する処理で変換されたハッシュに対応付けてハッシュテーブルに登録する処理と、属性情報を1つ以上含む評価対象情報を入力し、入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換する処理と、ハッシュテーブルを検索し、評価対象情報を変換したハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する処理とを実行させるという構成である。
本発明の情報検索システム、情報検索方法、及び、プログラムを記録したコンピュータ読み取り可能な記録媒体では、情報登録時に、パタン記憶部を用いて、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する。ハッシュテーブルへの登録では、登録情報に対し、登録情報に対応するハッシュだけでなく、登録情報に補完パタンを加えた補完属性情報に対応するハッシュも対応付けてハッシュテーブルに登録する。登録情報に補完パタンを加えた補完属性情報は、登録情報に対してマッチすべき評価対象情報のパタンと一致する。従って、評価対象情報に対応するハッシュを用いてハッシュテーブルを検索することで、評価対象情報に完全一致する登録情報だけでなく、評価対象情報よりも属性情報の数が少ない、すなわちワイルドカードを含む登録情報を抽出できる。
本発明の情報管理装置は、最小構成として、登録情報処理手段と、組み合わせ生成手段と、属性情報連結手段と、ハッシュ生成手段と、情報登録手段とを有する。登録情報処理手段は、属性値を含む属性情報を1つ以上有する登録情報を入力する。組み合わせ生成手段は、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する。組み合わせ生成手段は、登録情報に補完パタンを加えた補完属性情報を生成する。属性情報連結手段は、登録情報と、補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する。ハッシュ生成手段は、連結属性値をハッシュに変換する。情報登録手段は、登録情報を、ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する。
本発明の情報管理方法の最小構成は、属性値を含む属性情報を1つ以上有する登録情報を入力し、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成するステップと、登録情報と、登録情報に補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成するステップと、連結属性値をハッシュに変換するステップと、登録情報を、ハッシュに変換するステップで変換したハッシュに対応付けてハッシュテーブルに登録するステップとを有する構成である。
本発明のプログラムを記録したコンピュータ読み取り可能な記録媒体の最小構成は、コンピュータに、属性値を含む属性情報を1つ以上有する登録情報を入力し、登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、登録情報として取り扱い得る属性情報のうち、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する処理と、登録情報と、登録情報に補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する処理と、連結属性値をハッシュに変換する処理と、登録情報を、ハッシュを変換する処理で変換されたハッシュに対応付けてハッシュテーブルに登録する処理とを実行させるという構成である。
本発明の情報管理装置、情報管理方法、及び、プログラムを記録したコンピュータ読み取り可能な記録媒体では、情報登録時に、パタン記憶部を用いて、登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する。ハッシュテーブルへの登録では、登録情報に対し、登録情報に対応するハッシュだけでなく、登録情報に補完パタンを加えた補完属性情報に対応するハッシュも対応付けてハッシュテーブルに登録する。登録情報に補完パタンを加えた補完属性情報は、登録情報に対してマッチすべき評価対象情報のパタンと一致する。従って、このような情報登録を行うことで、情報検索に際して、評価対象情報に対応するハッシュを用いてハッシュテーブルを検索したとき、評価対象情報に完全一致する登録情報だけでなく、評価対象情報よりも属性情報の数が少ない、すなわちワイルドカードを含む登録情報を抽出できる。
なお、本願については、日本国特許出願2009−160642号を基礎とする優先権を主張し、本明細書中に日本国特許出願2009−160642号の明細書、特許請求の範囲、図面全体を参照として取り込むものとする。
本発明は、グルーピング処理やストリーム処理、ルールマッチングといった入力された評価対象情報に対して高速に特定の処理を実行するシステムに適用できる。また、完全には一致しないが、一致する情報を多く含んでいる情報を探すという類似検索といった用途にも適用できる。
11、21:登録情報処理手段
12、22:属性情報連結手段
13、23:ハッシュ生成手段
14、24:組み合わせ生成手段
15、25:評価対象情報処理手段
16、26:登録情報管理手段
17、27:情報登録手段
18、28:情報検索手段
19、29:ハッシュテーブル
30:パタン記憶部

Claims (21)

  1. 属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報を入力する評価対象情報処理手段と、
    前記評価対象情報処理手段に入力された評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成手段と、
    前記組み合わせ生成手段が生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、
    前記属性情報連結手段が生成した前記連結属性値をハッシュに変換するハッシュ生成手段と、
    前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ生成手段が変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索手段と
    を有する情報検索システム。
  2. 前記組み合わせ生成手段は、前記評価対象情報に含まれる属性情報のうち、組み合わせを作成する際に利用する属性情報を指定する属性選択情報を入力し、前記評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせのうち、前記属性選択情報で指定された属性情報を含む組み合わせを生成する、請求項1に記載の情報検索システム。
  3. 前記属性選択情報が、過去に情報検索に用いた評価対象情報から変更があった属性情報を示す変更属性情報である、請求項2に記載の情報検索システム。
  4. 前記登録情報を入力し、前記属性情報連結手段を用いて、入力された登録情報に含まれる属性値を連結した連結属性値を、前記ハッシュ生成手段を用いて変換したハッシュと、前記入力された登録情報とを含む情報登録要求を発生する登録情報処理手段と、
    前記情報登録要求を受けて、前記情報登録要求に含まれる登録情報と、前記情報登録要求に含まれるハッシュとを対応付けて前記ハッシュテーブルに登録する情報登録手段とを更に有する、請求項3に記載の情報検索システム。
  5. 前記属性情報連結手段は、属性情報を所定の順序で並び替えた上で、前記属性値を連結する、請求項4に記載の情報検索システム。
  6. 前記属性情報が属性名を更に含み、前記属性情報連結手段は、前記属性名に基づいて、前記属性情報を並び替える、請求項5に記載の情報検索システム。
  7. 属性値を含む属性情報を1つ以上有する登録情報を入力する登録情報処理手段と、
    登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記登録情報処理手段に入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成し、前記登録情報に前記補完パタンを加えた補完属性情報を生成する組み合わせ生成手段と、
    前記登録情報と、前記補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、
    前記属性情報連結手段で生成された前記連結属性値をハッシュに変換するハッシュ生成手段と、
    前記登録情報を、前記ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録手段と、
    前記属性情報を1つ以上含む評価対象情報を入力し、前記属性情報連結手段を用いて、入力された評価対象情報に含まれる属性値を連結した連結属性値を、前記ハッシュ生成手段を用いて変換したハッシュを含む情報検索要求を発生する評価対象情報処理手段と、
    前記ハッシュテーブルを検索し、前記情報検索要求に含まれるハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索手段と
    を有する情報検索システム。
  8. 前記属性情報連結手段は、属性情報を所定の順序で並び替えた上で、前記属性値を連結する、請求項7に記載の情報検索システム。
  9. 属性値を含む属性情報を1つ以上有する登録情報を入力する登録情報処理手段と、
    登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記登録情報処理手段に入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成し、前記登録情報に前記補完パタンを加えた補完属性情報を生成する組み合わせ生成手段と、
    前記登録情報と、前記補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結手段と、
    前記属性情報連結手段で生成された前記連結属性値をハッシュに変換するハッシュ生成手段と、
    前記登録情報を、前記ハッシュ生成手段で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録手段と
    を有する情報管理装置。
  10. コンピュータが、属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成ステップと、
    前記コンピュータが、前記生成した組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、
    前記コンピュータが、属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、
    前記コンピュータが、前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値を変換したハッシュと対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ変換ステップで変換したハッシュの何れかと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索ステップと
    を有する情報検索方法。
  11. 前記コンピュータは、前記組み合わせ生成ステップでは、前記評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせのうち、前記評価対象情報に含まれる属性情報中で組み合わせを作成する際に利用する属性情報を指定する属性選択情報で指定された属性情報を含む組み合わせを生成する、請求項10に記載の情報検索方法。
  12. 前記属性選択情報が、過去に情報検索に用いた評価対象情報から変更があった属性情報を示す変更属性情報である、請求項11に記載の情報検索方法。
  13. 前記コンピュータが、前記登録情報を入力し、該入力した登録情報に含まれる属性値を連結した連結属性値を生成する登録情報属性連結ステップと、
    前記コンピュータが、前記生成した登録情報に対応する連結属性値をハッシュに変換する登録情報ハッシュ変換ステップと、
    前記コンピュータが、前記入力した登録情報と、前記登録情報ハッシュ変換ステップで変換したハッシュとを対応付けて前記ハッシュテーブルに登録する情報登録ステップとを更に有する、請求項12に記載の情報検索方法。
  14. 前記コンピュータは、前記属性情報連結ステップでは、属性情報を所定の順序で並び替えた上で、前記属性値を連結する、請求項13に記載の情報検索方法。
  15. 前記属性情報が属性名を更に含み、前記コンピュータは、前記属性情報連結ステップでは、前記属性名に基づいて、前記属性情報を並び替える、請求項14に記載の情報検索方法。
  16. コンピュータが、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力した登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成ステップと、
    前記コンピュータが、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、
    前記コンピュータが、前記属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、
    前記コンピュータが、前記登録情報を、前記ハッシュ変換ステップで変換したハッシュに対応付けてハッシュテーブルに登録する情報登録ステップと、
    前記コンピュータが、前記属性情報を1つ以上含む評価対象情報を入力し、該入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換する評価対象情報ハッシュ変換ステップと、
    前記コンピュータが、前記ハッシュテーブルを検索し、前記評価対象情報ハッシュ変換ステップで生成されたハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索ステップと
    を有する情報検索方法。
  17. 前記コンピュータは、前記属性情報連結ステップ及び評価対象情報ハッシュ変換ステップでは、属性情報を所定の順序で並び替えた上で前記属性値を連結する、請求項16に記載の情報検索方法。
  18. コンピュータが、属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力した登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成ステップと、
    前記コンピュータが、前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結ステップと、
    前記コンピュータが、前記属性情報連結ステップで生成した前記連結属性値をハッシュに変換するハッシュ変換ステップと、
    前記コンピュータが、前記登録情報を、前記ハッシュ変換ステップで変換したハッシュに対応付けてハッシュテーブルに登録する情報登録ステップと
    を有する情報管理方法。
  19. コンピュータに、
    属性値を含む属性情報をM個(Mは1以上の整数)有する評価対象情報から1〜M個の属性情報を取り出して組み合わせた組み合わせを生成する組み合わせ生成処理と、
    前記生成された組み合わせのそれぞれについて、各組み合わせに含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連結処理と、
    属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、
    前記属性情報を1つ以上有する登録情報を、該登録情報に含まれる属性情報の属性値を連結した連結属性値をハッシュ変換した補完属性情報と対応付けて記憶するハッシュテーブルを検索し、前記ハッシュ変換処理で変換されたハッシュの何れかと一致するハッシュと対応付けて登録された登録情報を抽出する情報検索処理と
    を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
  20. コンピュータに、
    属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成処理と、
    前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連処理と、
    前記属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、
    前記登録情報を、前記ハッシュ変換処理で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録処理と、
    前記属性情報を1つ以上含む評価対象情報を入力し、該入力された評価対象情報に含まれる属性値を連結した連結属性値をハッシュに変換する評価対象情報ハッシュ変換処理と、
    前記ハッシュテーブルを検索し、前記評価対象情報ハッシュ変換処理で生成されたハッシュと一致するハッシュに対応付けて登録された登録情報を抽出する情報検索処理と
    を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
  21. コンピュータに、
    属性値を含む属性情報を1つ以上有する登録情報を入力し、前記登録情報として取り扱い得る属性情報の属性値を記憶するパタン記憶部を参照して、前記登録情報として取り扱い得る属性情報のうち、前記入力された登録情報に含まれない属性情報の属性値の組み合わせから成る補完パタンを生成する補完パタン生成処理と、
    前記登録情報と、前記登録情報に前記補完パタンを加えた補完属性情報とのそれぞれについて、含まれる属性情報の属性値を連結した連結属性値を生成する属性情報連処理と、
    前記属性情報連結処理で生成された前記連結属性値をハッシュに変換するハッシュ変換処理と、
    前記登録情報を、前記ハッシュ変換処理で変換されたハッシュに対応付けてハッシュテーブルに登録する情報登録処理と
    を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2011521945A 2009-07-07 2010-07-07 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体 Expired - Fee Related JP5267670B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011521945A JP5267670B2 (ja) 2009-07-07 2010-07-07 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009160642 2009-07-07
JP2009160642 2009-07-07
PCT/JP2010/061547 WO2011004846A1 (ja) 2009-07-07 2010-07-07 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体
JP2011521945A JP5267670B2 (ja) 2009-07-07 2010-07-07 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体

Publications (2)

Publication Number Publication Date
JPWO2011004846A1 true JPWO2011004846A1 (ja) 2012-12-20
JP5267670B2 JP5267670B2 (ja) 2013-08-21

Family

ID=43429270

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011521945A Expired - Fee Related JP5267670B2 (ja) 2009-07-07 2010-07-07 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体

Country Status (4)

Country Link
US (1) US20120109990A1 (ja)
JP (1) JP5267670B2 (ja)
CN (1) CN102473185B (ja)
WO (1) WO2011004846A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8285656B1 (en) 2007-03-30 2012-10-09 Consumerinfo.Com, Inc. Systems and methods for data verification
US8312033B1 (en) 2008-06-26 2012-11-13 Experian Marketing Solutions, Inc. Systems and methods for providing an integrated identifier
US9256904B1 (en) 2008-08-14 2016-02-09 Experian Information Solutions, Inc. Multi-bureau credit file freeze and unfreeze
JP5477139B2 (ja) * 2010-04-19 2014-04-23 日本電気株式会社 情報検索システム、情報検索方法およびプログラム
WO2012127986A1 (ja) * 2011-03-18 2012-09-27 日本電気株式会社 情報検索システム、情報検索方法および情報検索プログラム
CN103246664B (zh) 2012-02-07 2016-05-25 阿里巴巴集团控股有限公司 网页检索方法和装置
CN103581224B (zh) * 2012-07-25 2018-05-22 腾讯科技(深圳)有限公司 推送信息的方法和装置
CN102855302A (zh) * 2012-08-17 2013-01-02 东方钢铁电子商务有限公司 适用于信息链的数据信息处理方法
US9407642B2 (en) * 2013-03-13 2016-08-02 Samsung Electronics Co., Ltd. Application access control method and electronic apparatus implementing the same
WO2015001740A1 (ja) * 2013-07-01 2015-01-08 日本電気株式会社 情報処理装置、及び、検索方法
US10262362B1 (en) 2014-02-14 2019-04-16 Experian Information Solutions, Inc. Automatic generation of code for attributes
CN104765829B (zh) * 2015-04-13 2018-06-19 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
CN104765827B (zh) * 2015-04-13 2018-01-05 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
CN104765834B (zh) * 2015-04-13 2019-01-18 天脉聚源(北京)传媒科技有限公司 一种信息搜索方法及装置
US10757154B1 (en) 2015-11-24 2020-08-25 Experian Information Solutions, Inc. Real-time event-based notification system
CN106294573A (zh) * 2016-07-28 2017-01-04 Tcl集团股份有限公司 一种海量数据实时查询方法及***
CN116205724A (zh) * 2017-01-31 2023-06-02 益百利信息解决方案公司 大规模异构数据摄取和用户解析
EP3364314B1 (en) * 2017-02-15 2022-10-19 QlikTech International AB Methods and systems for indexing using indexlets
US10735183B1 (en) 2017-06-30 2020-08-04 Experian Information Solutions, Inc. Symmetric encryption for private smart contracts among multiple parties in a private peer-to-peer network
US10963434B1 (en) 2018-09-07 2021-03-30 Experian Information Solutions, Inc. Data architecture for supporting multiple search models
CN110046155B (zh) * 2018-12-07 2023-06-20 创新先进技术有限公司 特征数据库的更新、数据特征的确定方法、装置及设备
US20200193426A1 (en) * 2018-12-18 2020-06-18 Secude Ag Method and system for creating and updating an authentic log file for a computer system and transactions
WO2020146667A1 (en) 2019-01-11 2020-07-16 Experian Information Solutions, Inc. Systems and methods for secure data aggregation and computation
US11941065B1 (en) 2019-09-13 2024-03-26 Experian Information Solutions, Inc. Single identifier platform for storing entity data
US11880377B1 (en) 2021-03-26 2024-01-23 Experian Information Solutions, Inc. Systems and methods for entity resolution

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190970A (ja) * 1989-01-19 1990-07-26 Hitachi Ltd インデクスの構造およびこれを用いるサーチ処理方法
US6073129A (en) * 1997-12-29 2000-06-06 Bull Hn Information Systems Inc. Method and apparatus for improving the performance of a database management system through a central cache mechanism
JP3752945B2 (ja) * 2000-02-17 2006-03-08 日本電気株式会社 ディレクトリ検索システム及び方法、ディレクトリ検索プログラムを記録したコンピュータ読取可能な記録媒体
US6983288B1 (en) * 2000-11-20 2006-01-03 Cisco Technology, Inc. Multiple layer information object repository
GB2397406B (en) * 2002-07-23 2005-02-09 Samsung Electronics Co Ltd Index structure of metadata, method for providing indices of metadata, and metadata searching method and apparatus using the indices of metadata
BR0306986A (pt) * 2002-07-23 2005-06-28 Samsung Electronics Co Ltd Estrutura de ìndice de meta-dados divididos em fragmentos e mìdia para leitura em computador
JP2004264895A (ja) * 2003-02-05 2004-09-24 Sony Corp 情報処理装置および方法、並びにプログラム
CN1829980A (zh) * 2003-07-28 2006-09-06 松下电器产业株式会社 内容广播分配***、该***中使用的发送装置和接收装置及内容广播分配方法
US8190597B1 (en) * 2009-12-21 2012-05-29 Perfect Search Corporation Multistage pipeline for feeding joined tables to a search system

Also Published As

Publication number Publication date
CN102473185A (zh) 2012-05-23
US20120109990A1 (en) 2012-05-03
WO2011004846A1 (ja) 2011-01-13
CN102473185B (zh) 2014-02-26
JP5267670B2 (ja) 2013-08-21

Similar Documents

Publication Publication Date Title
JP5267670B2 (ja) 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体
JP4848317B2 (ja) データベースのインデックス作成システム、方法及びプログラム
JP5138046B2 (ja) 検索システム、検索方法およびプログラム
JP5492814B2 (ja) 検索装置、検索システム、方法およびプログラム
US8914316B2 (en) Information similarity and related statistical techniques for use in distributed computing environments
US20120005234A1 (en) Storage medium, trie tree generation method, and trie tree generation device
CN106156357A (zh) 文本数据定向搜索方法
CN103036697A (zh) 一种多维度数据去重方法及***
JP2019204246A (ja) 学習データ作成方法及び学習データ作成装置
CN110362560A (zh) 一种无业务主键数据在存储数据库时去重的方法
CN111953609B (zh) 基于ovs的数据包处理方法及相关设备
JP2005284608A (ja) データ検索システム、データ検索方法
CN108182209A (zh) 一种数据索引方法、及设备
JP2011028379A (ja) データ構造変換プログラムおよびデータ構造変換装置
JP5928446B2 (ja) 情報検索システム、情報検索方法および情報検索プログラム
JP2001022766A (ja) 多次元データベースの高速処理方法および装置
JP2011227655A (ja) 情報検索システム、情報検索方法およびプログラム
JP5477139B2 (ja) 情報検索システム、情報検索方法およびプログラム
JP6160427B2 (ja) 差分抽出システム及びプログラム
JP6291435B2 (ja) プログラムおよびクラスタシステム
Butakov et al. Detecting text similarity on a scalable no-SQL database platform
CN111367966B (zh) 对数据进行多维度统计的方法、装置和集群***
JP2011170509A (ja) 機密度学習装置、機密度学習システム、機密度学習方法および機密度学習プログラム
JP6300982B2 (ja) 検索データ管理装置、検索データ管理方法、および検索データ管理プログラム
JP2009093405A (ja) データ検索のためのシステム、方法及びコンピュータプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130422

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees