JP5589837B2 - 情報再構成システム、情報再構成方法及び情報再構成用プログラム - Google Patents

情報再構成システム、情報再構成方法及び情報再構成用プログラム Download PDF

Info

Publication number
JP5589837B2
JP5589837B2 JP2010505841A JP2010505841A JP5589837B2 JP 5589837 B2 JP5589837 B2 JP 5589837B2 JP 2010505841 A JP2010505841 A JP 2010505841A JP 2010505841 A JP2010505841 A JP 2010505841A JP 5589837 B2 JP5589837 B2 JP 5589837B2
Authority
JP
Japan
Prior art keywords
information
counter
reconstruction
information reconstruction
reconfiguration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010505841A
Other languages
English (en)
Other versions
JPWO2009119811A1 (ja
Inventor
真樹 菅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010505841A priority Critical patent/JP5589837B2/ja
Publication of JPWO2009119811A1 publication Critical patent/JPWO2009119811A1/ja
Application granted granted Critical
Publication of JP5589837B2 publication Critical patent/JP5589837B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

[関連出願の記載]
本発明は、日本国特許出願:特願2008−087240号(2008年 3月28日出願)の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
本発明は、情報再構成システム、情報再構成方法及び情報再構成用プログラムに関し、特に、任意の記憶手段に格納された情報を所定の目的に即して再構成する処理を行う情報再構成システム、情報再構成方法及び情報再構成用プログラムに関する。
膨大な文書から目的とする文字列を持つ部分を網羅的に検索する全文検索の方法として、UNIX(登録商標)におけるgrepコマンドに代表されるgrep型検索(逐次検索)と、転置インデックスに代表されるインデックス(索引)を用いるインデックス型検索(索引検索)とが知られている。
前者のgrep型検索は、検索対象とするファイルを次々に走査していくため、検索対象ファイルの数が大量になった場合に応答性能が低下してしまうため、膨大な情報を対象とした検索機能を実現する場合にはインデックス型検索が用いられる。非特許文献1には、上記転置ファイルを用いたインデックス型検索の原理が説明されている。
近年では、上記インデックス型検索は、インターネットのサーチエンジン以外の分野にも幅広く取り入れられるようになっている。特許文献1は、インデックスによる全文検索機能を備えた電子メールシステムを開示する文献である。
上記のような電子メールシステムにおいては、基本的には、ユーザ毎に別々のインデックスを作成、保持する必要がある。その理由は、複数ユーザ間で単一のインデックスを用いるとアクセスコントロールを実現する仕組み等が必要になり、性能が劣化する等の問題があるためである。また、TF−IDF法などを用いて検索結果の重み付け表示(ランキング)を行う場合には、あるユーザのメールに出現するキーワードが、別のユーザの重み付けに反映されないようにする仕組みが別途必要になってしまう(非特許文献2参照)。
データベースのインデックスを更新する技術としては以下のようなものが挙げられる。特許文献2には、文書の格納と同期を取って検索用のインデックスを作成するのではなく、非同期に行なうようにした文書格納検索システムが開示されている。特許文献3には、インデックスを介して検索するデータベースシステムにおいて、検索すべきデータの各属性(キー)についてのアクセス頻度に基づいて、インデックスの生成又は削除を行うインデックス自動更新システムが開示されている。
特開2001−036568号公報 特開平3−276368号公報 特開平6−215037号公報 北研二、津田和彦、獅々堀正幹著、「情報検索アルゴリズム」共立出版、2002年1月1日、pp.6、pp.160〜179 Stefan Buettcher and Charles L.A.Clarke、"A Security Model for Full-text File System Search in Multi-User Environments"、In Proceedings of the 4th Conference on USENIX Conference on File and Storage Technologies (FAST'05) - Volume 4 (San Francisco, CA, December 13-16, 2005)、USENIX Association Berkeley CA、13-13.
以上の特許文献1〜3、非特許文献1、2の全開示内容は、本書に引用をもって繰り込み記載されているものとする。
以下の分析は、本発明の観点から与えられる。
上記電子メールシステムにおけるインデックスの作成や、メールボックス内のメール群に対する事前処理のように、任意の記憶手段に格納された情報についてある処理を高速に行うためや管理上の必要性等から、当該情報から別のデータを作成したり、情報のデータ構造の変換や並び替えを行なう必要が生じることがある。これら任意の記憶手段に格納された情報を基に、特定の目的に適したデータ構造のデータを作成(あるいは変換)することを、本明細書では「情報再構成」と呼ぶ。情報再構成には、上記で述べた検索インデックスの作成の他に、データウェアハウス(DWH)のようなデータ分析用のデータベース作成、構造劣化を起こしたデータベースの再構成等が含まれるものとする。
特許文献2に記載されているように、インデックスの更新等の情報再構成処理は時間が掛かるものであり、これをリアルタイムに行うことはシステムの応答性に大きな影響を与える。例えば、電子メールの送受信や操作の毎に電子メールの検索用のインデックスを更新するようにした場合、当該処理のオーバーヘッドがシステムの応答性・使用感に表れてしまう。
特許文献3は、記憶装置の容量制限のほか、上記観点から、むやみにインデックスが増えてしまうことを避けるための技術と位置づけられる。
全文検索に用いるインデックスの作成においても、非特許文献1に示されているように、電子ファイルの文字列を読み出し、出現単語を抽出し、出現した単語のインデックスをすべて更新する必要があるため、更新データ量も多く、電子ファイル数に比例して読み出し処理や抽出処理は増大する。
このような事情から、情報再構成処理は、夜間等の実働システムに与える影響が少ない時間に一括して行われることも多い。この場合、情報再構成処理が完了するまでの間、検索処理結果(あるいは、分析処理結果)に、最新の情報が含まれないことになる。特に、電子メールの全文検索機能の場合には、最近受信したメールが検索結果に反映されないといった現象が生じてしまう。
また、上記のように夜間に実行したとしても、夜間中に再構成処理が完了するとは限らないという問題点もある。実働システムの利用前に再構成処理を行う場合も同様であり、再構成処理が終了する時間がわからないために、ユーザに一定時間内の応答を保証することができないという問題点がある。
また、任意の記憶手段に対する更新内容を再構成対象毎(電子メールの場合にはユーザ毎)にバッファリングしておく方法を採ることがあるが、この場合特に、再構成対象(電子メールの場合にはユーザ)が多い場合には、膨大な記憶容量を必要とする、といった問題点もある。
本発明は、上記した事情に鑑みてなされたものであって、任意の記憶手段に対する情報更新と非同期に、情報再構成を実行する場合における、情報再構成処理の所要時間や必要な計算機資源をコントロールすることのできる情報再構成システム、情報再構成方法及び情報再構成用プログラムを提供することを目的とする。
本発明の第1の視点によれば、電子メールのアカウントと対応付けられた複数のカウンタと、電子メールの受信によりメールボックスに格納された情報が更新された場合に、該更新内容に基づいて、前記複数のカウンタのうち、該電子メールのアカウントに対応するカウンタを特定する手段と、前記特定されたカウンタの値を更新する手段と、前記カウンタの値または前記カウンタの2以上の組み合わせが、予め定める情報再構成条件のうちのいずれか一つ以上を満たした場合に、前記情報再構成条件に対応する情報再構成処理として、前記メールボックスから該当アカウントのメールデータを所定数読み出し、検索インデックスを作成する手段と、を備え、前記検索インデックスを用いて、前記メールサーバに保持された電子メールの検索サービスを提供する情報再構成システムが提供される。
本発明の第2の視点によれば、コンピュータに、電子メールのアカウントと対応付けられた複数のカウンタを保持させておくステップと、前記コンピュータが、電子メールの受信によりメールボックスに格納された情報が更新された場合に、該更新内容に基づいて、前記複数のカウンタのうち、該電子メールに対応するカウンタを特定するステップと、前記特定されたカウンタの値を更新するステップと、前記コンピュータが、前記カウンタの値または前記カウンタの値の2以上の組み合わせが予め定める情報再構成条件のうちのいずれか一つ以上を満たした場合に、前記情報再構成条件に対応する情報再構成処理として、前記メールボックスから該当アカウントのメールデータを所定数読み出し、検索インデックスを作成するステップと、を含み、前記検索インデックスを用いて、前記メールサーバに保持された電子メールの検索サービスを提供するステップと、を含む電子メールの検索サービスの提供方法が提供される。
本発明の第3の視点によれば、コンピュータのメモリに、電子メールのアカウントと対応付けられた複数のカウンタを設ける処理と、電子メールの受信によりメールボックスに格納された情報が更新された場合に、該更新内容に基づいて、前記複数のカウンタのうち、該電子メールに対応するカウンタを特定する処理と、前記特定されたカウンタの値を更新する処理と、前記カウンタの値または前記カウンタの値の2以上の組み合わせが予め定める情報再構成条件のうちのいずれか一つ以上を満たした場合に、前記情報再構成条件に対応する情報再構成処理として、前記メールボックスから該当アカウントのメールデータを所定数読み出し、検索インデックスを作成する処理と、前記検索インデックスを用いて、前記メールサーバに保持された電子メールの検索サービスを提供する処理と、をコンピュータに実行させる電子メールの検索サービス提供用プログラムが提供される。
本発明によれば、情報再構成の内容や処理時間を目安としてそれぞれ設定した実行条件(情報再構成条件)に従って、情報再構成の実行時間を見積もって情報再構成の実行を制御することが可能となる。その理由は、情報再構成に要する時間や計算機資源量は、情報更新量に概ね比例するとの知見に基づき、情報更新量を示すカウンタの値に基づいて情報再構成を実行する構成を採用したことにある。
本発明に係る情報再構成システムの概略構成を表したブロック図である。 本発明の第1の実施形態の情報再構成システムの構成を表したブロック図である。 本発明の第1の実施形態の情報再構成システムの再構成カウンタの概要を説明するための図である。 本発明の第1の実施形態の情報再構成システムの再構成カウンタが更新されるまでの動作の流れを表したフローチャートである。 本発明の第1の実施形態の情報再構成システムの動作を表したフローチャートである。 本発明の第2の実施形態の情報再構成システムの構成を表したブロック図である。 本発明の第5の実施形態の情報再構成システムの構成を表したブロック図である。 本発明の第5の実施形態の情報再構成システムの再構成カウンタの概要を説明するための図である。 本発明の第5の実施形態の情報再構成システムの動作を表したフローチャートである。 本発明の第6の実施形態の情報再構成システム(検索機能付きメールシステム)の構成を表したブロック図である。 本発明の第6の実施形態の情報再構成システム(検索機能付きメールシステム)の再構成カウンタの概要を説明するための図である。 本発明の第7の実施形態の情報再構成システム(ストリーム処理システム)の構成を表したブロック図である。 本発明の第7の実施形態の情報再構成システム(ストリーム処理システム)の再構成カウンタの概要を説明するための図である。
符号の説明
1 情報受付部
2 情報格納部
3 再構成契機通知部
4 情報再構成処理部
5 再構成情報格納部
6 条件設定手段
11 情報受付手段
12 到達通知手段
13 情報記録処理手段
31 通知受信手段
32 再構成カウンタ
33 監視手段
34 再構成契機通知手段
35 カウンタ修正手段
36 再構成処理時間計測手段
100 メール受付部(メールサーバ)
101 ストリーム情報受付部
200 メールボックス
201 ストリーム情報記憶部
301 ストリーム処理契機通知部
400 検索インデックス作成処理部
401 ストリーム処理部
500 検索インデックス格納部
501 ストリーム情報記憶部
502 処理結果出力部
701〜703 ストリーム情報発信源
続いて、本発明の好適な実施形態について図面を参照して詳細に説明する。
[発明の概要]
図1は、本発明に係る情報再構成システムの概略構成を表したブロック図である。図1を参照すると、情報受付部1と、情報格納部(記憶手段)2と、再構成契機通知部3と、情報再構成処理部4と、再構成情報格納部5と、を含んだ情報再構成システムが示されている。
これらの手段はそれぞれ概略次のように動作する。
情報受付部1は、情報格納部2に対する情報更新や新たな情報の到着を受け付ける機能を果たす。具体的には、データベースのトランザクション受付や、メールの受付を行うメールサーバ、MTA(Mail Transfer Agent)やMDA(Mail Delivery Agent)等が該当する。
情報格納部2は、情報受付部1が受け付けた新規情報や更新された情報を保持する記憶手段である。具体的には、データベースシステムの記憶装置、メールサーバのメールボックスが構成された記憶装置等が当てはまる。
再構成契機通知部3は、意味属性と対応付けられたいくつかのカウンタを保持し、前記情報受付部1にて情報が受け付けられた場合に、これらのカウンタのうち、受け付けた情報に対応する意味属性を持つカウンタの値を更新する。そして、カウンタの値が予め定める情報再構成条件を満たした場合に、前記情報再構成処理部4に対し情報再構成を実行するよう通知する。再構成契機通知部3は、所定のカウンタ戻し条件が成立した場合に、該当するカウンタの戻し処理を行う。
情報再構成処理部4は、再構成契機通知部3からの通知に基づいて、情報格納部2から必要な情報を読み込み、データベースの再構成やユーザの電子メールのインデクシング等の情報再構成処理を行う手段である。
再構成情報格納部5は、情報再構成処理部4によって再構成された再構成済みのデータベースや、電子メールの検索用インデックス等の再構成情報を格納する記憶手段である。
上記情報再構成条件は、各再構成処理の必要性(優先順位)、情報再構成処理部4の処理能力や再構成処理を実行可能な時間に応じて、時間内に情報再構成処理を完了できるように設定される。これにより、限られた時間内で確実に必要な再構成処理を完了させることが可能になる。
[第1の実施形態]
続いて、本発明の第1の実施形態について図面を参照して詳細に説明する。図2は、本発明の第1の実施形態の情報再構成システムの構成を表したブロック図である。
情報受付部1は、情報受付手段11と、到着通知手段12と、情報記録処理手段13とを備える。
情報受付手段11は、外部から情報格納部2に対する情報更新や新規情報を受け付け、到着通知手段12及び情報記録処理手段13に転送する機能を果たす。
到着通知手段12は、情報受付手段11が情報を受け取った後に、その受け取った情報から、再構成処理の必要性が高まった再構成処理を特定し、その再構成処理の種類を示す情報を、再構成契機通知部3に対して通知する。なお、ここで、到着通知手段12による通知は、必ずしも一つの再構成処理の種類を特定するものである必要はなく、2以上の再構成処理の種類を通知するものであってもよい。
上記再構成処理の種類としては、再構成処理の内容そのものの違い(例えば、電子メールの送信順序による物理的な並び替え処理と、メールボックス内のヘッダ情報の削除処理、電子メールのインデクシング処理、電子メールのデータ保存先の移行処理、データ分散配置処理、分散配置されたデータ再配分処理等。)はもちろんとして、再構成処理の対象の違い(例えば、宛先ユーザAとする電子メールのインデクシングと、宛先ユーザBとする電子メールのインデクシング等。)、あるいは、これらの組み合わせ(宛先ユーザAとする電子メールのソート、宛先ユーザAとする電子メール中の迷惑メールの振り分け、宛先ユーザBとする電子メール中の迷惑メールの削除、宛先ユーザA及びB及びCの電子メールの電子メールのデータ保存先の移行処理等。)を指定することができるものとする。
なお、上記到着通知手段12は、再構成契機通知部3側に配置することもできる。この場合、情報受付部1は受け取った命令あるいは情報の全部あるいは一部を再構成契機通知部3に対して転送し、再構成契機通知部3側にて再構成処理の種類の特定処理が行われる。
情報記録処理手段13は、情報受付手段11が受け取った情報を、情報格納部2に対して記録する機能を果たす。
再構成契機通知部3は、通知受信手段31と、再構成カウンタ32と、監視手段33と、再構成契機通知手段34と、カウンタ修正手段35と、を備える。
通知受信手段31は、到着通知手段12が発行した通知を受け取り、再構成カウンタ32の更新を行う。具体的には、到着通知手段12より通知された再構成処理の種類のカウンタを所定幅で増大させる処理を行う。
再構成カウンタ32は、再構成契機通知部3を構成するコンピュータの記憶装置上に構成され、情報受付部1が受け付けた新規情報や情報更新の到達状態を、意味属性毎に、記録する機能を果たす。具体的には、再構成契機通知部3を構成するコンピュータに備えられた磁気メモリや磁気ディスク等を利用可能である。ここで、意味属性とは、更新すべき再構成カウンタ32を決定するために予め規定される情報自体が持つ意味的な属性を指す。例えば、データベースシステムにおいては、更新されたテーブルや、カラムの値によって異なる意味属性を持つものと規定することができる。また他にも、情報受付部1の受け付ける新規情報内の値をもって異なる意味属性とすることもできる。また、例えば、メッセージ内の任意のフィールドに含まれるキーワードによって異なる意味属性を持つものと規定することができる。
図3は、再構成カウンタ32の概要を説明するための図であり、意味属性A、意味属性B、意味属性Cとそれぞれ対応付けられたa〜cの3種類のカウンタが設けられており、それぞれに値が保持されている。図3の例では、意味属性Aのカウンタaの値は20である。これは、情報受付部1が、情報更新や新規情報の登録毎に再構成契機通知部3に通知を発行し、再構成契機通知部3がカウンタ値を1だけ増加させる場合、意味属性Aを持つ情報の更新や新規登録が20回行なわれたことを意味する。
なお、図3の例では、a〜cの3種類のカウンタを示しているが、カウンタの数は、意味属性の種類に応じて適宜増減することができる。また図3の例では、カウンタIDとその値のみを示したが、情報受付部1から通知が到着した時刻や、最近の時間帯における通知到着の頻度等を記録するようにし、これらを参照する情報再構成条件を設定することもできる。
監視手段33は、予め情報再構成処理毎に設定された情報再構成条件を保持し、再構成カウンタ32が、情報再構成条件を満たしたか否かを監視する。少なくとも1つの情報再構成条件が成立した場合、監視手段33は、再構成契機通知手段34に、情報再構成処理契機通知を発行させる。なお、情報再構成条件として、複数のカウンタの値が一定値以上となった場合に、情報再構成処理を実行するような情報再構成条件を設定することもできる。
情報再構成処理に掛かる時間は一般に、情報更新量(情報更新回数)と比例すると考えることができる。従って、一定時間内に情報再構成処理が完了するような情報再構成条件を設定することで、常に一定時間内に情報再構成処理が終了することを保証することができる。
例えば、システムが、何らかの情報再構成処理を1分実行可能であり、21件分のデータの情報再構成処理Aは必ず1分以内で終了するものとする。このとき、ある情報再構成処理の実行条件(情報再構成条件)としてカウンタa=21と設定することで、図3のカウンタaの値が21となった場合に、監視手段33による当該情報再構成処理の実行契機通知の発行が保証される。
当然ながら、監視手段33は、通知受信手段31と一体化することも可能である。この場合、通知受信手段31は、カウンタを増加する度に情報再構成条件を満たしているか否かを確認することになる。また、通知受信手段31又は監視手段33が定期的に再構成カウンタ32を参照して確認する構成であってもよい。更に、ある情報再構成条件はカウンタを増加する度に確認し、他の情報再構成条件は定期的に確認する等、両者を組み合わせることも可能である。
再構成契機通知手段34は、監視手段33からの通知に基づいて、情報再構成処理部4に対して再構成処理の開始を促すメッセージを通知する機能を果たす。
カウンタ修正手段35は、情報再構成処理が完了した情報再構成処理部4からの通知に基づいて、該当する再構成カウンタ32を修正する機能を果たす。例えば、カウンタa=21になったことにより、ある情報再構成処理が実行された場合、カウンタaを0にすることで、再度、当該情報再構成処理の必要性を0からカウントすることが可能となる。
情報再構成処理部4は、再構成契機通知部3からの通知に基づいて、情報再構成処理を行うとともに、前記カウンタ修正手段35に対して再構成カウンタ32を修正するよう通知する。
なお、上記した情報受付部1、再構成契機通知部3の各処理手段及び情報再構成処理部4は、コンピュータに上述した各処理を実行させるプログラムにより実現することが可能である。例えば、上記した情報受付手段11は、データベースシステムのコマンドを受け付けるプログラム、メールサーバの外部からメールを受信するプログラムにより実現することができる。同様に、情報記録処理手段13は、データベースシステムのコマンドを解釈して記憶装置に書き出す部分のプログラム、メールサーバのユーザ毎のメールボックスに到着メールを書き出すプログラムにより実現することができる。
続いて、第1の実施形態の情報再構成システムの動作について図面を参照して詳細に説明する。図4は、再構成カウンタ32が更新されるまでの動作の流れを表したフローチャートである。図4を参照すると、まず、情報受付部1が、外部システム等から情報更新や新規情報登録等の命令やデータを受け付ける(ステップS101)。
次に、情報受付手段11は受け付けた命令やデータを解釈し、その意味属性を特定し、再構成契機通知部3に対して通知を発行する(ステップS102)。また、情報受付部1は、ステップS101で受け付けた命令やデータに基づき、情報格納部2の内容を更新する。
前記通知を受け取った再構成契機通知部3の通知受信手段31は、当該通知において記述されている意味属性に対応する再構成カウンタ32を更新する(ステップS103)。
上記ステップS103までの処理と、情報格納部2の更新処理とが完了した時点で、情報受付部1に対し命令やデータを送信した外部システム等に対して、これら命令やデータの受理通知を発行することができる。
図5は、上記のようにして更新される再構成カウンタを用いた情報再構成システムの動作を表したフローチャートである。図5を参照すると、まず、監視手段33が、再構成カウンタ32の値を参照する(ステップS201)。先に述べたように、監視手段33が定期的に再構成カウンタ32を参照することとしても良いし、再構成カウンタ32の更新を契機に再構成カウンタ32を参照することとしても良い。
次に、監視手段33は、再構成カウンタ32の値が、情報再構成条件として定められた閾値を満たしているか否かを確認する(ステップS202)。情報再構成条件として用いる閾値は、一定値である必要はなく、情報再構成処理の内容やユーザに対するサービスレベルに応じて、再構成カウンタ毎に適宜変更することができる。ここで、再構成カウンタ32の値が、情報再構成条件を満たしていない場合は、処理終了となる(ステップS202のNo)。
再構成カウンタ32の値が、情報再構成条件を満たしている場合、監視手段33は、再構成契機通知手段34に対して、当該情報再構成条件に応じた情報再構成処理の実行契機通知を発行するよう通知する。再構成契機通知手段34は、情報再構成処理部4に対して、当該情報再構成条件に応じた情報再構成処理の実行契機通知を発行する(ステップS203)。
情報再構成処理の実行契機通知を受信した情報再構成処理部4は、情報格納部2から必要な情報を取得し、再構成情報作成処理を実行し、再構成情報格納部5に出力する(ステップS204)。なお、情報再構成処理の内容によっては、再構成情報格納部5から情報を取得した情報(例えば、前回実施した情報再構成処理の結果。)をベースに、情報格納部2から取得した情報を用いて情報再構成処理を行うようにすることもできる。
情報再構成処理が完了すると、情報再構成処理部4は、カウンタ修正手段35に対して通知を発行する。カウンタ修正手段35は、前記通知に基づいて、再構成カウンタ32を修正する(ステップS205)。なお、このステップS205の処理は、ステップS204の情報再構成処理が開始された時点で行なうこととしても良い。
以上のように、本実施形態では、情報格納部2に対する情報更新や新規情報登録が一定量行われたことを契機として、情報再構成処理を実行させることが可能となる。その結果、再構成処理に要する時間は、情報の変更量に比例するため、情報再構成処理についてそれぞれ情報再構成条件を設定することで、情報再構成処理を常に一定時間で終了させることができる。これにより、例えば、予定した時間内で情報再構成処理が完了せずに実働システムの運用に影響が及ぶこともなくなる。また例えば、情報再構成処理を必要とする処理の応答性を向上させることも可能となる。
また、本実施形態の構成は、情報再構成処理部4が、情報再構成処理に必要な更新情報を保持するバッファ等を用いずに、情報格納部2に格納されている情報を取得して情報再構成処理を行うように構成されているため、システム全体の記憶容量を削減できる構成にもなっている。また、情報更新や新規情報の登録の度に情報再構成処理を実行するシステムと比較しても、新規情報の登録と削除、同一箇所に対する複数回の更新に伴う無用な情報再構成処理を抑止できるため、全体として効率よく情報再構成処理を実行することが可能となる。
また、本実施形態の構成は、再構成契機通知部3が情報再構成処理の契機を通知した際のみ、情報再構成処理部4が情報再構成処理を行うため、情報再構成処理を効率化し高速に実行することが可能となっている。もちろん、いくつかの情報再構成処理は、日時等を契機として実行するようにしてもよい。
[第2の実施形態]
続いて、本発明の第2の実施形態について図面を参照して詳細に説明する。図6は、本発明の第2の実施形態の情報再構成システムの構成を表したブロック図である。上記した第1の実施形態の情報再構成システムとの相違点は、条件設定手段6が追加されている点である。
条件設定手段6は、監視手段33の情報再構成条件又はカウンタ修正手段35のカウンタ修正動作を変更する機能を提供する。例えば、システムの管理者等が、監視手段33の情報再構成条件として設定された閾値を小さくすることで、情報再構成処理の実行間隔と、情報再構成処理に要する時間を短くすることができる。
上記のような構成によれば、上記した第1の実施形態の効果に加えて、情報再構成システムの処理能力の変動による情報再構成処理時間の増減に対応可能となる。また、情報再構成処理時間が、情報の変更量から予測された時間を大きく上回る場合も対応することが可能となる。
[第3の実施形態]
続いて、本発明の第3の実施形態について図面を参照して詳細に説明する。本実施形態は、上記した第1の実施形態の情報再構成システムと同様の構成で実現可能であるので、以下、その動作上の相違点について図2を参照して説明する。
本実施形態では、再構成契機通知部3が(図2参照)、情報再構成処理部4に対する情報再構成処理契機の通知時に、情報再構成処理対象とするデータ量(処理量)を指定する。具体的には、再構成契機通知部3の再構成契機通知手段34が、再構成カウンタ32が保持しているカウンタを用いて、情報再構成処理部4が処理する必要がある再構成対象のデータ量を決定し、情報再構成処理部4への契機通知とともに通知する。
例えば、情報再構成システムが、メール検索用のインデックスを作成(再構成)するものである場合、再構成カウンタ32の値は、インデクシング処理(情報再構成処理)の対象とするメールを特定するための情報として利用される。再構成契機通知部3は、情報再構成処理契機の通知時に、再構成カウンタ32の値をそのまま、あるいは、適宜変換して、情報再構成処理の対象とすべきメールを情報再構成処理部4に通知する。情報再構成処理部4は通知された電子メールについてインデクシング処理を実行する。
このように構成することによって、情報格納部2あるいは再構成情報格納部5、またはその他の要素において、情報格納部2内のデータが情報再構成処理を行う対象のデータであるかどうかを判別する情報を保持せずに済むという効果も得られる。
但し、本実施形態では、情報再構成処理部4からカウンタ修正手段35への通知においても、情報再構成処理を行ったデータを特定できるようにする必要がある。
[第4の実施形態]
続いて、本発明の第4の実施形態について図面を参照して詳細に説明する。本実施形態は、上記した第1の実施形態の情報再構成システムと同様の構成で実現可能であるので、以下、その動作上の相違点について図2を参照して説明する。
本実施形態は、情報受付部1が再構成契機通知部3に対して通知をできない場合を想定して、第1の実施形態の情報再構成システムに機能を追加したものである。例えば、情報受付部1と再構成契機通知部3がそれぞれ別の計算機で実現されている時に、その計算機間のネットワーク装置に障害が起きた場合に、情報格納部2に情報再構成処理対象とするデータがあるにも拘わらず、再構成カウンタが動作しないことが考えられる。
また、情報受付部1の内部の情報受付手段11と到着通知手段12の間で同様に情報を渡せない場合も考えられる。また、情報受付部1の処理負荷が大きく、本発明の情報再構成システムのような副次的な機能を実現する処理を一時的に行わないようにする場合も含まれる。
このような場合、上記した第1の実施形態の再構成契機通知部3は、到着通知手段12から通知を受信することができない間は、再構成カウンタ32の更新を行うことができず、通知送信が再開できた時点で、上記第1の実施形態に示した動作を行なうことになる。つまり、上記到着通知手段12から通知が無い間は、再構成処理が促されないため、再構成処理が元の想定より長くなる可能性がある。
そこで、本実施形態の監視手段33は、通常時の情報再構成条件とは別に、通信障害時における情報再構成条件を保持して動作する。通信障害時における情報再構成条件としては、例えば、再構成カウンタ32の値と比較する情報再構成条件の閾値として、通常より低い閾値が設定される。
なお、本実施形態では、情報格納部2あるいはその他の記憶手段に、情報格納部2の情報について情報再構成処理が必要であるか否かを判断するための情報が保持されているものとする。これにより、情報再構成処理部4は、情報再構成処理対象のデータを選択し情報再構成処理を実行することが可能である。例えば、情報再構成システムが、メール検索用のインデックスを作成(再構成)するものである場合、メールボックスに、メールがインデックスされたか、そうではないか、という情報が保持されていれば、情報再構成処理部4は、確実にインデクシング処理(再構成処理)を実行することが可能となる。
以上のように、本実施形態によれば、情報受付部1と再構成契機通知部3間の通信障害や情報受付部1の負荷増大等により、再構成カウンタが動作しない状況になっても、情報再構成処理を実行することが可能となる。また本実施形態は、再構成カウンタが動作しない事態が継続している間に、情報再構成処理をすべきデータ(未処理データ)が必要以上に増えないようにする効果もある。
以上、本発明の第4の実施形態では、通信障害時における情報再構成条件を別途設けるものとして説明したが、情報再構成条件を変えずに、障害発生時に、再構成カウンタ32の動作を変更する方法も採用可能である。例えば、情報再構成条件を監視手段33に、再構成カウンタ32の増加状態(増加速度)等を監視させておき、情報受付部1と再構成契機通知部3間の通信障害や情報受付部1の負荷増大が発生した際に、監視手段33が、前記監視した増加状態(増加速度)により、再構成カウンタ32を自動的に増大させていく。本構成によっても、再構成カウンタが動作しない状況において、適切に情報再構成処理を実行することが可能となる。また、上記した情報再構成条件の変更と、再構成カウンタの強制動作とを併用することも可能である。
[第5の実施形態]
上記したように、本発明の第2の実施形態では、監視手段33の情報再構成条件をシステムの管理者等が変更することによって、再構成処理時間を調整することができる。しかしながら、第2の実施の形態では、システムの管理者等が調整できるのは、情報再構成条件であり、ある情報再構成条件を設定した場合に、システムの管理者等が見込んだ再構成処理時間と、実際に掛かった再構成処理時間とが一致しないことが考えられる。そこで、再構成処理に要する時間を保証できるように構成した本発明の第5の実施形態について説明する。
図7は、本発明の第5の実施形態の情報再構成システムの構成を表したブロック図である。上記した第1の実施形態の情報再構成システムとの相違点は、情報再構成処理部4による情報再構成処理の所要時間(再構成処理時間)を計測する再構成処理時間計測手段36が追加されている点である。
再構成処理時間計測手段36は、情報再構成処理部4によって行われる情報再構成処理に掛かる時間を測定して記録する役割を果たす。図7の例では、再構成処理時間計測手段36は、情報再構成処理時間を再構成カウンタ32に記録するようにしている。もちろん、再構成処理時間計測手段36が、再構成カウンタ32以外に情報再構成処理時間を記録するようにしてもよい。
再構成処理時間計測手段36は、例えば、再構成契機通知手段34において情報再構成処理部4に情報再構成処理契機の通知を発行した時刻と、情報再構成処理部4が処理を完了した際に通知を受け取った時刻との時間間隔により、情報再構成処理時間を計測する。その他、情報再構成処理部4に、情報再構成処理時間を計測させ、再構成処理時間計測手段36に通知してもらう方法や、再構成契機通知手段34の通知発行の時刻とカウンタ修正手段35がカウンタ修正命令を受け取った時刻との時間間隔により、情報再構成処理時間を求める方法も採用可能である。
図8は、上記のようにして、計測された情報再構成処理時間が記録された再構成カウンタを表している。図8の例では、「処理時間」欄に、情報再構成条件として設定されたカウンタの値(括弧内)と、処理時間とが記録されている。図8の例では、再構成カウンタaによって実行制御される情報再構成処理は、カウンタ値が40のときに実行され、そのとき1時間掛かったことが記録されている。当然ながら、上記情報再構成条件として設定されたカウンタの値は省略することが可能であり、カウンタ1あたりの処理時間として「1.5分」というように記録してもよい。また時間の単位も任意に設定することができる。
また、上記情報再構成処理時間として、今までの、あるいは、過去数回分の情報再構成処理時間の平均値を計算して記録しても良いし、前回の情報再構成処理時間を記録しても良いし、今までの情報再構成処理時間すべてを記録してもよい。また、情報再構成処理の実行時間や日時などで分けて記録しても良い。
図9は、本発明の第5の実施形態の情報再構成システムの動作の流れを表したフローチャートである。図9の再構成カウンタの参照(ステップS301)〜情報再構成処理(ステップS304)までの動作は、上記第1の実施形態(図5)と略同様である。ステップS304の情報再構成処理が完了すると、まず、再構成処理時間計測手段36が、情報再構成処理部4における再構成処理時間を計測する(ステップS305)。
次に、カウンタ修正手段35が、再構成カウンタ32の修正を行う(図9のステップS306)。最後に、監視手段33が、再構成カウンタ32に記録された情報再構成処理時間を用いて、情報再構成条件の見直しを行う(ステップS307)。
上記ステップS307における情報再構成条件の見直し処理は次のように行われる。まず、カウンタaが閾値αを超えた場合に情報再構成処理Aを実行するという情報再構成条件が設定されている場合を考える。また、条件設定手段6より、情報再構成処理Aを概ね1時間前後で完了させたいという条件がシステム管理者によって入力されているものとする。
このとき、監視手段33は、情報再構成処理Aの情報再構成処理時間が1時間を超えたときに、情報再構成条件として設定された閾値αを下げる処理を行う。これにより、次回以降の情報再構成処理Aの処理時間が短縮される。
反対に、情報再構成処理Aの情報再構成処理時間が1時間を大きく下回る場合、監視手段33は、情報再構成条件として設定された閾値αを上げる処理を行うこととしてもよい。これにより、例えば、情報再構成処理Aの情報再構成処理時間が30分未満であるような場合、閾値αは大きく引き上げられる。これにより、次回以降の情報再構成処理Aの所要時間を1時間程度にするとともに、その実行間隔を広くして、情報再構成処理の効率性を高めることが可能となる。
また、上記した実施形態では、再構成処理時間計測手段36を備えて、情報再構成処理時間が予定された時間内であるか否かにより、情報再構成条件を変更する例を挙げて説明したが、その他の条件により、情報再構成条件を変更(厳格化・緩和)するようにしてもよい。例えば、情報再構成処理部4やシステム全体の負荷に応じて情報再構成条件を変更することが考えられる。例えば、システム全体に負荷が掛かっており、情報再構成処理時間が長引くことが予想される場合には、情報再構成条件を緩和することにより、上記した実施形態と同等の効果が得られる。
[第6の実施形態−メール検索システム]
次に、本発明を、複数ユーザに電子メールの検索サービスを提供するメールシステムに適用した本発明の第6の実施形態について説明する。
図10は、本発明の第6の実施形態の構成を表したブロック図である。メール受付部(メールサーバ)100は、第1の実施形態の情報受付部1に相当し、メールを受け付け、ユーザのメールボックスに記録をする役割を果たす。
メールボックス200は、第1の実施形態の情報格納部2に相当する。メールボックス200は、たとえば、メール受付部(メールサーバ)100に接続された磁気ディスクなどの記憶媒体そのものか、あるいは記憶媒体を備えたファイルサーバ等の記憶装置によって構成される。
再構成契機通知部3は、コンピュータプログラムによって上記再構成契機通知部3の各手段として機能するコンピュータにより構成できる。もちろん、メール受付部(メールサーバ)100と同一のハードウェアに構成することも可能である。
図11は、ある時点における再構成契機通知部3内の再構成カウンタ32の状態を表している。
図11に示すように、再構成カウンタ32には、検索インデックスを作成する単位であるアカウント毎にメール到着数をカウントするカウンタ値が保持される。
なお、図11の例では、aaaa、bbbb、ccccの3つのアカウントが示されているが、再構成カウンタ32には、ユーザ数分のレコードが存在するものとする。
再構成カウンタ32は、データベースのテーブル、プログラム上でのハッシュテーブル等のデータ構造で実現することができる。磁気ディスクや半導体メモリ等を用いることが可能であるが、磁気メモリを用いてすべてのレコードに高速にアクセスできるようにしておくことが望ましい。
メール受付部(メールサーバ)100は、上記第1の実施形態の到着通知手段12に相当する処理手段を有し、メール受信時(あるいはメールボックスへの書き出し時)に、意味属性として該当メールの受信者のアカウント名を抽出して、アカウント名を識別できる情報を含んだ通知を再構成契機通知部3に通知する。
前記通知を受け取った再構成契機通知部3は、上記第1の実施形態の通知受信手段31に相当する処理手段を有し、再構成カウンタ32が保持する該当アカウント名のカウンタを1増やす。
再構成契機通知部3は、上記第1の実施形態の監視手段33に相当する処理手段を有し、再構成カウンタ32のアカウント名のカウンタが、予め決められた閾値αを超えたときに、該当のアカウントの検索インデックス作成処理を行うよう、検索インデックス作成処理部400に対して依頼する。
検索インデックス作成処理部400は、上記第1の実施形態の情報再構成処理部4に相当し、メールボックス200から該当ユーザのメールデータを読み出し、形態素解析などの方法を用いて索引語を抽出し、検索インデックス格納部500に保持された検索インデックスを更新する処理を行う。
上記検索インデックスの更新処理において、検索インデックス作成処理部400は、新しいメールから数えて閾値αで決められた数だけ、更新対象のアカウントのメールボックスから読み込み、インデクシング処理を行う。また、インデクシング処理の完了後、検索インデックス作成処理部400は、対象アカウントのカウンタを0にリセットするよう、再構成契機通知部3に対して依頼する。なお、新たにメールが着信することを考慮して、インデックス閾値αより所定数、所定率分だけ多くのメールをインデクシング処理の対象としてもよい。
検索インデックス格納部500は、ユーザ毎に検索インデックスを保持する機能を果たす。検索インデックス格納部500は、例えば、検索インデックス作成処理部400に接続された磁気ディスクなどの記憶媒体そのものか、あるいは記憶媒体を備えたファイルサーバ等の記憶装置に構成される。
複数ユーザに電子メールの検索サービスを提供するメールシステムにおいては、ユーザが電子メールを利用する際には、そのユーザの検索インデックスを最新にしておくことが望ましい。例えば、ユーザが電子メールシステムにログインする際などの契機によって、検索インデックスの更新を行うことができるが、この更新処理はユーザが保持しているメールのうちインデックスされていないメール数にほぼ比例する。
しかしながら、本実施形態では、上記の閾値αを超えるとユーザのログインを待つことなく検索インデックスの更新が行われるため、インデックスされていないメールの数は、最大でも上記の閾値αに抑えられる。すなわち、閾値α数分のメールをインデクシングするのに掛かる時間が、ユーザのログイン時の最大待ち時間(最新インデックスを用いた検索を利用できるまでに掛かる時間)となる。また、上記閾値αを調整することによって、ユーザ毎に(検索インデックス毎に)サービスレベルを調整することもできる。
閾値αが小さい場合には、ユーザに対するサービスレベルは高いが検索インデクシング処理の効率性は悪いため、計算機リソースを大きく必要とする。閾値αが大きい場合には、ユーザに対するサービスレベルは小さいが、検索インデクシング処理の効率性が高くなるため、必要な計算機リソース量が小さくなる。このように、本発明を電子メール検索システムに利用することによって、必要な計算機リソースの量とユーザへのサービスレベルのトレードオフを調整することができる、電子メール検索システムを提供できる、という効果がある。
[第7の実施形態−ストリーム処理システム]
次に、本発明を、ストリーム処理システムに適用した本発明の第7の実施形態について説明する。ストリーム処理システムとは、時系列に発信されるデータ(ストリーム)に対して、情報再構成処理として、所定の情報処理(クエリ)を行うシステムのことを指す。例えば、RFIDなどの製品管理情報や、株価等の金融情報、温度等のセンサ情報等を、ストリーム発信する例が知られている。
図12は、本発明の第7の実施形態の構成を表したブロック図である。ストリーム情報受付部101は、第1の実施形態の情報受付部1に相当し、ストリーム情報発信源701〜703より随時発行されるストリーム情報を受け付ける役割を果たす。
ストリーム情報発信源701〜703はストリーム情報を発信する手段であり、センサや金融情報を発行する機器やソフトウェアシステムが該当する。
ストリーム情報記憶部201は、ストリーム情報受付部101が受け取ったストリーム情報を一時的に(永続的であってもよい)記憶する。ストリーム情報記憶部201の適当な装置を用いて実現することができる。ストリーム情報は連続して大量に受信する特性を持つものが多いため、半導体メモリなどの高速な記憶媒体を用いることが好ましい。磁気ディスクを用いることも可能であり、この場合は、シーケンシャルに書き出すことで高速に格納できるような記憶方式が用いることができる。その他、データベースソフトウェアシステムを用いて実現することも可能である。
ストリーム処理契機通知部301は、上記第1の実施形態の再構成契機通知部3に相当し、コンピュータプログラムによって上記再構成契機通知部3の各手段として機能するコンピュータにより構成できる。ストリーム情報受付部101と同一のハードウェアに構成することも可能である。
ストリーム処理契機通知部301には、上記第1の実施形態の再構成契機通知部3と同様に、再構成カウンタ32が保持される。図13は、ある時点における再構成契機通知部3内の再構成カウンタ32の状態を表している。例えば、カウンタaは、ストリーム情報のcolumnA(例えば、センサの温度情報などが相当する)の値が1−10の範囲に収まっていたストリーム情報の数をカウントする。
そして、ストリーム処理契機通知部301は、上記第1の実施形態の再構成契機通知部3の監視手段33に相当する処理手段を有し、カウンタaが閾値を超えたら、意味属性aに関連付けられたストリーム情報処理(クエリ)を実行するよう、ストリーム処理部401に通知を行う。1つのカウンタ(カウンタa)と、ストリーム情報処理(クエリ)とが1対1で関連付けられている必要はなく、複数のカウンタが条件を満たしたらストリーム情報処理(クエリ)を行うようにしてもよいし、1つのカウンタaに対して複数のストリーム情報処理(クエリ)が関連付けられても良い。
ストリーム処理部401は、上記第1の実施形態の情報再構成処理部4に相当し、ストリーム情報に対する情報処理(クエリ)を実行する。
また、ストリーム処理部401で実行するストリームに対する情報処理(クエリ)の種類が増えたら、対応するカウンタを新たに作成し、ストリーム情報処理の実行条件を追加する。これはストリーム情報処理の管理システムにユーザが入力する形を採っても良いし、既存の意味属性および実行条件から自動的にストリーム処理契機通知部301が作成する形を採っても良い。
ストリーム情報記憶部501および処理結果出力部502は、上記第1の実施形態の再構成情報格納部5に相当する。ストリーム情報記憶部501はストリーム情報処理の結果を格納する手段で、データベースシステムなどの各種の情報システムによって実現される。また、処理結果をストリーム情報記憶部501に記憶せず、処理結果を出力する構成も採用可能である、処理結果出力部502はユーザに対してストリーム情報処理の結果を表示する役割を果たす。
このように動作する本発明の情報再構成システムは、ストリーム情報処理を効率的に実行することが可能となる。その理由は、再構成契機通知部3により、ストリーム情報処理契機を決定することによって、実際に処理をする情報がないのに情報格納部2のデータを読み込むような非効率な処理が発生しないためである。
以上、本発明の好適な実施形態を説明したが、本発明は、上記した実施形態に限定されるものではなく、本発明の基本的技術的思想を逸脱しない範囲で、更なる変形・置換・調整を加えることができる。例えば、複数のユーザに対してユーザ毎の情報検索機能を提供する情報検索システム(一般的な電子ファイル全文検索システム、電子メール検索システム、RSSリーダーにおける検索システム)、情報検索システムをコンピュータにより実現するプログラムといった用途に適用することができる。また、データウェアハウスシステム、データベースシステム、情報分析システム、ストリーム処理システム、任意のドライブのウイルス検査結果やファイル構成情報を当該ドライブに書き出す方式等のウイルス検査システム及びこれらを実現するプログラムといった用途にも適用可能である。
本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。

Claims (17)

  1. 電子メールのアカウントと対応付けられた複数のカウンタと、
    電子メールの受信によりメールボックスに格納された情報が更新された場合に、該更新内容に基づいて、前記複数のカウンタのうち、該電子メールのアカウントに対応するカウンタを特定する手段と、
    前記特定されたカウンタの値を更新する手段と、
    前記カウンタの値または前記カウンタの2以上の組み合わせが、予め定める情報再構成条件のうちのいずれか一つ以上を満たした場合に、前記情報再構成条件に対応する情報再構成処理として、前記メールボックスから該当アカウントのメールデータを所定数読み出し、検索インデックスを作成する手段と、を備え、
    前記検索インデックスを用いて、前記メールサーバに保持された電子メールの検索サービスを提供する情報再構成システム。
  2. 時系列にストリーム情報源から発信されるストリーム情報の特定のカラムが取る値の条件と対応付けられた複数のカウンタと、
    所定の記憶手段に格納された前記ストリーム情報が更新された場合に、該更新内容に基づいて、前記複数のカウンタのうち、該更新内容に対応するカウンタを特定する手段と、
    前記特定されたカウンタの値を更新する手段と、
    前記カウンタの値または前記カウンタの2以上の組み合わせが、予め定める情報再構成条件のうちのいずれか一つ以上を満たした場合に、前記所定の記憶手段に格納されたストリーム情報を対象に、前記情報再構成条件に対応する情報再構成処理を実行する手段と、を備えたこと、を特徴とする情報再構成システム。
  3. 更に、予め定めるカウンタ修正条件が成立した場合に、前記カウンタの値の戻し処理を実行するカウンタ修正手段を備える請求項1又は2に記載の情報再構成システム。
  4. 情報再構成処理が完了した場合に、情報再構成処理に対応するカウンタの値の戻し処理を実行するよう前記カウンタ修正条件が設定されている請求項3に記載の情報再構成システム。
  5. 更に、前記情報再構成条件又は前記カウンタ修正条件の変更を受け付ける条件入出力手段を備える請求項3又は4に記載の情報再構成システム。
  6. 前記情報再構成処理の処理量が、前記カウンタの値に基づいて決定される請求項1乃至5いずれか一に記載の情報再構成システム。
  7. 前記所定の記憶手段に対する更新が一定期間行なわれなかった場合に、前記情報再構成条件を変更する請求項1乃至6いずれか一に記載の情報再構成システム。
  8. 前記所定の記憶手段に対する更新が一定期間行なわれなかった場合に、前記カウンタの更新幅を増減させる請求項1乃至7いずれか一に記載の情報再構成システム。
  9. 更に、前記情報再構成処理に要した時間を計測する手段を備え、予め設定された情報再構成処理の見込み時間と、実際に情報再構成処理に要した時間との差に基づいて、前記情報再構成条件を変更する請求項1乃至8いずれか一に記載の情報再構成システム。
  10. 前記情報再構成処理を実行する手段の負荷に応じて、前記情報再構成条件を変更する請求項1乃至9いずれか一に記載の情報再構成システム。
  11. 前記情報再構成処理として、所定の記憶手段に格納された情報の検索インデックスを再構成する請求項1乃至10いずれか一に記載の情報再構成システム。
  12. 前記所定の記憶手段に格納された情報の内容に応じて作成され、情報検索時にいずれか一つ以上が選択される複数の検索インデックスと、前記各検索インデックスに対応する複数のカウンタとを有し、
    前記複数のカウンタのうち、前記所定の記憶手段に対する更新内容に対応するカウンタを更新し、
    前記複数のカウンタのうちいずれかのカウンタの値が、前記情報再構成条件を満たした場合に、該カウンタに対応する検索インデックスの再構成を開始する請求項11に記載の情報再構成システム。
  13. 前記情報再構成条件は、検索インデックス毎に変更可能である請求項12に記載の情報再構成システム。
  14. コンピュータに、電子メールのアカウントと対応付けられた複数のカウンタを保持させておくステップと、
    前記コンピュータが、電子メールの受信によりメールボックスに格納された情報が更新された場合に、該更新内容に基づいて、前記複数のカウンタのうち、該電子メールに対応するカウンタを特定するステップと、
    前記特定されたカウンタの値を更新するステップと、
    前記コンピュータが、前記カウンタの値または前記カウンタの値の2以上の組み合わせが予め定める情報再構成条件のうちのいずれか一つ以上を満たした場合に、前記情報再構成条件に対応する情報再構成処理として、前記メールボックスから該当アカウントのメールデータを所定数読み出し、検索インデックスを作成するステップと、を含み、
    前記検索インデックスを用いて、前記メールサーバに保持された電子メールの検索サービスを提供するステップと、
    を含む電子メールの検索サービスの提供方法。
  15. コンピュータのメモリに、電子メールのアカウントと対応付けられた複数のカウンタを設ける処理と、
    電子メールの受信によりメールボックスに格納された情報が更新された場合に、該更新内容に基づいて、前記複数のカウンタのうち、該電子メールに対応するカウンタを特定する処理と、
    前記特定されたカウンタの値を更新する処理と、
    前記カウンタの値または前記カウンタの値の2以上の組み合わせが予め定める情報再構成条件のうちのいずれか一つ以上を満たした場合に、前記情報再構成条件に対応する情報再構成処理として、前記メールボックスから該当アカウントのメールデータを所定数読み出し、検索インデックスを作成する処理と、
    前記検索インデックスを用いて、前記メールサーバに保持された電子メールの検索サービスを提供する処理と、
    をコンピュータに実行させる電子メールの検索サービス提供用プログラム。
  16. コンピュータに、時系列にストリーム情報源から発信されるストリーム情報の特定のカラムが取る値の条件と対応付けられた複数のカウンタを保持させておくステップと、
    前記コンピュータが、所定の記憶手段に格納された前記ストリーム情報が更新された場合に、該更新内容に基づいて、前記複数のカウンタのうち、該更新内容に対応するカウンタを特定するステップと、
    前記特定されたカウンタの値を更新するステップと、
    前記コンピュータが、前記カウンタの値または前記カウンタの値の2以上の組み合わせが予め定める情報再構成条件のうちのいずれか一つ以上を満たした場合に、前記所定の記憶手段に格納されたストリーム情報を対象に、前記情報再構成条件に対応する情報再構成処理を実行するステップと、を含むストリーム情報再構成方法。
  17. コンピュータのメモリに、時系列にストリーム情報源から発信されるストリーム情報の特定のカラムが取る値の条件と対応付けられた複数のカウンタを設ける処理と、
    所定の記憶手段に格納された前記ストリーム情報が更新された場合に、該更新内容に基づいて、前記複数のカウンタのうち、該更新内容に対応するカウンタを特定する処理と、
    前記特定されたカウンタの値を更新する処理と、
    前記カウンタの値または前記カウンタの値の2以上の組み合わせが予め定める情報再構成条件のうちのいずれか一つ以上を満たした場合に、前記所定の記憶手段に格納されたストリーム情報を対象に、前記情報再構成条件に対応する情報再構成処理と、をコンピュータに実行させるストリーム情報再構成用プログラム。
JP2010505841A 2008-03-28 2009-03-27 情報再構成システム、情報再構成方法及び情報再構成用プログラム Expired - Fee Related JP5589837B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010505841A JP5589837B2 (ja) 2008-03-28 2009-03-27 情報再構成システム、情報再構成方法及び情報再構成用プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008087240 2008-03-28
JP2008087240 2008-03-28
JP2010505841A JP5589837B2 (ja) 2008-03-28 2009-03-27 情報再構成システム、情報再構成方法及び情報再構成用プログラム
PCT/JP2009/056296 WO2009119811A1 (ja) 2008-03-28 2009-03-27 情報再構成システム、情報再構成方法及び情報再構成用プログラム

Publications (2)

Publication Number Publication Date
JPWO2009119811A1 JPWO2009119811A1 (ja) 2011-07-28
JP5589837B2 true JP5589837B2 (ja) 2014-09-17

Family

ID=41113996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010505841A Expired - Fee Related JP5589837B2 (ja) 2008-03-28 2009-03-27 情報再構成システム、情報再構成方法及び情報再構成用プログラム

Country Status (3)

Country Link
US (2) US8489610B2 (ja)
JP (1) JP5589837B2 (ja)
WO (1) WO2009119811A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9189280B2 (en) 2010-11-18 2015-11-17 Oracle International Corporation Tracking large numbers of moving objects in an event processing system
US8990416B2 (en) 2011-05-06 2015-03-24 Oracle International Corporation Support for a new insert stream (ISTREAM) operation in complex event processing (CEP)
WO2013145129A1 (ja) 2012-03-27 2013-10-03 富士通株式会社 データベース管理方法、プログラム、および情報処理装置
KR20140042409A (ko) * 2012-09-28 2014-04-07 삼성전자주식회사 오브젝트 부가 정보를 입력하는 장치 및 오브젝트 부가 정보를 입력하는 방법
US9563663B2 (en) 2012-09-28 2017-02-07 Oracle International Corporation Fast path evaluation of Boolean predicates
US9953059B2 (en) 2012-09-28 2018-04-24 Oracle International Corporation Generation of archiver queries for continuous queries over archived relations
US10956422B2 (en) 2012-12-05 2021-03-23 Oracle International Corporation Integrating event processing with map-reduce
US10298444B2 (en) 2013-01-15 2019-05-21 Oracle International Corporation Variable duration windows on continuous data streams
US9390135B2 (en) 2013-02-19 2016-07-12 Oracle International Corporation Executing continuous event processing (CEP) queries in parallel
US9418113B2 (en) 2013-05-30 2016-08-16 Oracle International Corporation Value based windows on relations in continuous data streams
US9934279B2 (en) 2013-12-05 2018-04-03 Oracle International Corporation Pattern matching across multiple input data streams
US9712645B2 (en) 2014-06-26 2017-07-18 Oracle International Corporation Embedded event processing
US9886486B2 (en) 2014-09-24 2018-02-06 Oracle International Corporation Enriching events with dynamically typed big data for event processing
US10120907B2 (en) 2014-09-24 2018-11-06 Oracle International Corporation Scaling event processing using distributed flows and map-reduce operations
JP6558928B2 (ja) * 2015-03-30 2019-08-14 株式会社エヌ・ティ・ティ・データ 管理システム、管理装置、管理方法、及びプログラム
WO2017018901A1 (en) 2015-07-24 2017-02-02 Oracle International Corporation Visually exploring and analyzing event streams
JP6571046B2 (ja) * 2016-06-21 2019-09-04 株式会社東芝 サーバ装置、情報処理方法及びプログラム
US11876851B2 (en) * 2019-12-26 2024-01-16 Akamai Technologies, Inc. Synchronizing independent media and data streams using media stream synchronization points
WO2023014783A1 (en) * 2021-08-03 2023-02-09 Akamai Technologies, Inc. Synchronizing independent media and data streams using media stream synchronization points

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04115332A (ja) * 1990-09-05 1992-04-16 Sekisui Chem Co Ltd ファイル管理装置
JPH0628229A (ja) * 1992-07-07 1994-02-04 Hokkaido Nippon Denki Software Kk データベース索引ファイル処理方式
JPH11161686A (ja) * 1997-10-08 1999-06-18 Hewlett Packard Co <Hp> 連続インデックス機構

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03276368A (ja) 1990-03-27 1991-12-06 Nec Corp 文書格納検索システム
JPH06215037A (ja) 1993-01-18 1994-08-05 Fuji Xerox Co Ltd インデックスの自動更新装置
JP3310240B2 (ja) 1999-07-22 2002-08-05 俊雄 今尾 電子メールシステム
US6904596B1 (en) * 2000-05-24 2005-06-07 Lucent Technologies Inc. Method and apparatus for shared flow control of data
US20040073617A1 (en) * 2000-06-19 2004-04-15 Milliken Walter Clark Hash-based systems and methods for detecting and preventing transmission of unwanted e-mail
JP3959742B2 (ja) * 2003-10-09 2007-08-15 ソニー株式会社 ファイル管理装置、ファイル管理方法、ファイル管理方法のプログラム及びファイル管理方法のプログラムを記録した記録媒体
US7870200B2 (en) * 2004-05-29 2011-01-11 Ironport Systems, Inc. Monitoring the flow of messages received at a server
US20060059178A1 (en) * 2004-08-19 2006-03-16 Copernic Technologies, Inc. Electronic mail indexing systems and methods
US8126895B2 (en) * 2004-10-07 2012-02-28 Computer Associates Think, Inc. Method, apparatus, and computer program product for indexing, synchronizing and searching digital data
JP2008176565A (ja) * 2007-01-18 2008-07-31 Hitachi Ltd データベース管理方法、そのプログラムおよびデータベース管理装置
US8838774B2 (en) * 2007-08-21 2014-09-16 Inmon Corporation Method, system, and computer program product for identifying common factors associated with network activity with reduced resource utilization

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04115332A (ja) * 1990-09-05 1992-04-16 Sekisui Chem Co Ltd ファイル管理装置
JPH0628229A (ja) * 1992-07-07 1994-02-04 Hokkaido Nippon Denki Software Kk データベース索引ファイル処理方式
JPH11161686A (ja) * 1997-10-08 1999-06-18 Hewlett Packard Co <Hp> 連続インデックス機構

Also Published As

Publication number Publication date
US20110010369A1 (en) 2011-01-13
WO2009119811A1 (ja) 2009-10-01
US8489610B2 (en) 2013-07-16
US8856137B2 (en) 2014-10-07
US20130268537A1 (en) 2013-10-10
JPWO2009119811A1 (ja) 2011-07-28

Similar Documents

Publication Publication Date Title
JP5589837B2 (ja) 情報再構成システム、情報再構成方法及び情報再構成用プログラム
US10372723B2 (en) Efficient query processing using histograms in a columnar database
CN108319654B (zh) 计算***、冷热数据分离方法及装置、计算机可读存储介质
US8589432B2 (en) Real time searching and reporting
US8412696B2 (en) Real time searching and reporting
US12032525B2 (en) Systems and computer implemented methods for semantic data compression
US7917499B2 (en) Updating adaptive, deferred, incremental indexes
CN103412916B (zh) 一种监控***的多维度数据存储、检索方法及装置
US20110087644A1 (en) Enterprise node rank engine
US7734618B2 (en) Creating adaptive, deferred, incremental indexes
US20180341669A1 (en) Pre-caching of relational database management system based on data retrieval patterns
KR20090035527A (ko) 영속성 관리 방법, 장치 및 컴퓨터 판독 가능 매체
JP2005115514A (ja) データベース検索システム及びその検索方法並びにプログラム
US11892976B2 (en) Enhanced search performance using data model summaries stored in a remote data store
CN104750855A (zh) 一种大数据存储优化方法和装置
JP2012048332A (ja) データベース処理方法、データベース処理システム及びデータベースサーバ
CN117725283B (zh) 一种基于大数据的档案数据存储***
CN102508857A (zh) 一种基于事件关联的桌面云搜索方法
US10671636B2 (en) In-memory DB connection support type scheduling method and system for real-time big data analysis in distributed computing environment
US11106739B2 (en) Document structures for searching within and across messages
JP2011186853A (ja) データ処理装置及びシステム及び方法及びプログラム
US10942969B2 (en) Non-transitory computer-readable storage medium, search control method, and search control apparatus
JP6609941B2 (ja) メール管理装置、メール管理方法及びメール管理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130917

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140219

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140701

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140714

R150 Certificate of patent or registration of utility model

Ref document number: 5589837

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees