JP4634096B2 - データ処理装置及びデータ処理方法及びプログラム - Google Patents

データ処理装置及びデータ処理方法及びプログラム Download PDF

Info

Publication number
JP4634096B2
JP4634096B2 JP2004249402A JP2004249402A JP4634096B2 JP 4634096 B2 JP4634096 B2 JP 4634096B2 JP 2004249402 A JP2004249402 A JP 2004249402A JP 2004249402 A JP2004249402 A JP 2004249402A JP 4634096 B2 JP4634096 B2 JP 4634096B2
Authority
JP
Japan
Prior art keywords
data
storage
unit
candidate
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004249402A
Other languages
English (en)
Other versions
JP2006065702A (ja
Inventor
修一 森川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2004249402A priority Critical patent/JP4634096B2/ja
Publication of JP2006065702A publication Critical patent/JP2006065702A/ja
Application granted granted Critical
Publication of JP4634096B2 publication Critical patent/JP4634096B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、所定のデータ格納領域にデータを格納するデータ格納技術に関する。
実時間で持続的に発生するデータを継続的に格納する必要のあるシステムにおけるデータ格納方式において、従来ではデータ格納用の待ち行列のデータ数が一定数を超えたとき、データを別に用意したバッファ領域に溜めるようにして、データをバッファ領域から数件まとめて一括して格納することによって、大量データが発生した場合もデータ格納処理の回数を削減することで、処理能力の向上を行っていた(例えば、特許文献1)。
特開平4−126493号公報
従来のデータ格納方式は、データ量が増加したときデータをバッファ領域に溜めて一括処理することで処理能力は向上するが、一時的に処理能力を超えた大量データが発生した場合、データの到着(格納要求)から格納完了までに、システム処理上無視できない遅延が発生する。この遅延はそのまま後続データの格納遅延としてシステムに影響を与えて、データ量が定常状態に戻った後も、データの格納が最新データに追いつくまで遅延として残る。このため、データの完備性よりも実時間性が重要視される、周期的に最新データを使った処理を行うようなシステムにおいては、大量データ発生によりデータ格納遅延が発生すると、大量データ発生時点だけでなく、データ量が定常状態に戻った後も遅延の影響により最新データによる処理ができない期間が発生するという問題点があった。
この発明は上記のような問題点を解決するためになされたもので、実時間で持続的に発生するデータの継続的な格納処理において大量データが発生したとき、格納データ量を調節することによりデータの格納遅延が後続の処理に波及することを防ぎ、大量データ発生時点以外の定常状態のときには遅延のないデータ格納を保障するデータ格納方式を得ることを主な目的とする。
本発明に係るデータ処理装置は、
データの格納領域であるデータ格納部と、
前記データ格納部への格納の候補となる格納候補データを取得するデータ取得部と、
前記データ取得部により取得された格納候補データを所定の制限時間内に前記データ格納部に格納できるか否かを判断し、前記制限時間内に格納候補データを格納できる場合に格納候補データを格納処理の対象となる格納対象データに指定し、前記制限時間内に格納候補データを格納できない場合に格納候補データの格納処理を保留するデータ格納調整部と、
前記データ格納調整部により指定された格納対象データを前記データ格納部に格納するデータ格納処理部とを有することを特徴とする。
本発明によれば、大量データが発生したとき、データ格納の遅延の可能性を検出して大量データの一部の格納を保留することができ、これによりデータ格納遅延を大量データの発生時点以外へ波及することを防ぎ、定常状態における遅延のないデータ格納を保障することができる。
実施の形態1.
図1は、本実施の形態に係るデータ格納システム(データ処理装置)100の構成例を示す図である。
図1において、データ格納システム100は発生したデータを受け取るデータ入力部101、データの内容を解析し、データを実際の記憶形式に変換するデータ解析・正規化部102、格納データ量の調節を行いデータベース109への格納処理の対象となるデータを指定するデータ量調整部103、データ量調整の際に参照されるシステム設定情報104、格納するデータブロックの待ち行列を管理するキュー制御部106、データの書き込みを行うデータ書き込み部108、データ格納領域であるデータベース109を有する。
なお、データ入力部101はデータ取得部の例であり、データ量調整部103はデータ格納調整部の例であり、データ書き込み部108はデータ格納処理部の例であり、データベース109はデータ格納部の例である。
保留データ列105はデータ量調整部103においてデータ格納の順序を後回しにされた(保留された)データブロックの列であり、データ量調整部103によって管理される。書き込みデータ列107は、データ量調整部103によりデータベース109への格納処理の対象として指定され、データベース109への書き込みを待つデータブロックの待ち行列であり、キュー制御部106によって管理される。
なお、データ入力部101により入力され、データ量調整部103によって保留データ列105及び書き込みデータ列107のいずれに振り分けられるかが決定していないデータは、データベース109への格納の候補となるデータであり、格納候補データに相当する。また、書き込みデータ列107のデータは格納対象データに相当する。
システム設定情報104にはデータ書き込み部108が単位データブロックの内容をデータベース109に書き込む際に必要となるデータ書き込み時間の情報と、データがデータ入力部101に到着してからデータベース109に書き込まれるまでの時間として遅れが許される最大時間を示す遅延許容時間(制限時間)の情報が含まれる。
次に動作について説明する。
まずデータ格納システム100の稼動前の準備段階として、システム設定情報104にデータ書き込み時間と遅延許容時間(制限時間)を設定する。データ書き込み時間の値はシステム構成や実行するH/W(Hard Ware)仕様などを勘案してシステム管理者(ユーザ)が導出する。また試験用データなどを使ってデータ書き込み時間の統計情報を採取して、これを元に自動的に導出するようにしてもよい。遅延許容時間の値はデータ書き込み時間とシステム構成などを基にシステム管理者(ユーザ)が導出する。
次にデータ格納システム100におけるデータ入力部101でのデータの受け取りからデータベース109へのデータの書き込みまでの処理の流れを図2、図3、図4のフローチャートを用いて説明する。
図2は本実施の形態のデータ入力部101及びデータ解析・正規化部102によるデータ入力手順(データ取得ステップ)を示すフローチャートである。
ステップ121でデータ入力部101はデータベース109に格納する入力データを受け取る。データ入力部101はシステム構成に応じて入力データをネットワーク経由で受け取る場合もあれば、データの発生源から直接受け取る場合もある。入力データはSQL文のような命令として指定されるか、あるいは予め決められた形式のデータとしてデータ入力部101に受け渡される。データ入力部101は一度に複数の入力データを受け取ってもよい。データ入力部101ではデータを受け取ったときの取得時刻(タイムスタンプ)情報を追加して、データ解析・正規化部102に1件ずつ入力データを渡す。
ステップ122でデータ解析・正規化部102は入力データが不正なデータでないか検査を行う。データが正しいとき、入力データをデータベース109に実際に書き込む際の内部データ形式に変換する。
ステップ123では内部データ形式に変換したデータをデータ量調整部103へ送る。
図3は本実施の形態のデータ量調整部103によるデータ量調整手順(データ格納調整ステップ)を示すフローチャートである。
ステップ131でデータ量調整部103は一定時間、データ解析・正規化部102からデータが到着するのを待つ。ここで一定時間とは、システム設定情報104に設定されたデータ書き込み時間を基に、書き込みデータ列107のデータブロックの1個以上が書き込み完了する時間(例えばデータ書き込み時間×1.2)をシステムが自動算出したものである。
ステップ132で一定時間内にデータを受け取った場合はステップ133に、受け取らなかった場合はステップ138に進む。
ステップ133でデータ解析・正規化部102から受け取ったデータをデータバッファに蓄積してブロック化する。データがバッファを満たして単位データブロックの1ブロック分のデータが到着した場合はステップ134に、1ブロック分に満たない場合はステップ131に戻る。
ステップ134でデータ量調整部103はキュー制御部106から書き込みデータ列107で待機しているデータブロックの数を取得する。データブロック数とシステム設定情報104のデータ書き込み時間から、データ量調整部103が保持しているデータブロックを書き込みデータ列107に追加した場合に書き込みが完了するのに必要な時間(格納予定時間)を算出する。ここで、データブロックごとのデータ量は一定であるため、待機しているデータブロックのブロック数と判断の対象となっているデータブロックのブロック数を加算し、この加算値にデータ書き込み時間を乗算すれば、格納予定時間を求めることができる。このため、格納予定時間は、判断の対象となっているデータブロックのデータ量と書き込みデータ列で待機しているデータブロックのデータ量とに基づく。
ステップ135で格納予定時間と保持しているデータブロックの先頭データの取得時刻(タイムスタンプ)を比較し、システム設定情報104の遅延許容時間(制限時間)内にデータ格納が完了するかどうか調べる。データの格納が遅延許容時間(制限時間)内に完了する場合はステップ136に、完了しない場合はステップ137に進む。
ステップ136で保持しているデータブロックをキュー制御部106に渡す。キュー制御部106はデータブロックを書き込みデータ列107の末尾に追加する。
ステップ137では保持しているデータブロックを保留データ列105の末尾に追加する。
また、ステップ132において一定時間内に入力データが到着しなかった場合は、ステップ138で、保留データ列105にデータブロックが存在するか調べる。保留データ列105にデータブロックが存在する場合、ステップ139に進む。
ステップ139では、保留データ列105から先頭のデータブロックを取り出す。その後、ステップ136に進み、取り出したデータブロックを書き込みデータ列107の末尾に追加する。
図4は本実施の形態のデータ書き込み部108によるデータ書き込み手順(データ格納処理ステップ)を示すフローチャートである。
ステップ141でデータ書き込み部108はキュー制御部106にデータブロックを要求する。キュー制御部106は書き込みデータ列107にデータブロックが存在する場合、先頭データブロックをデータ書き込み部108に渡す。データブロックが存在しない場合、データ量調整部103からデータブロックが渡されるまで、処理の実行を待つ。
ステップ142でデータ書き込み部108は受け取ったデータブロックをデータベース109に書き込む。
図15は、以上のデータ格納システム100の処理を説明するタイミングチャートである。
一定時間内に入力データの入力があった場合に、データブロックの格納予定時間が、当該データブロックの先頭データの取得時刻(タイムスタンプ)に遅延許容時間を加算した格納期限よりも前であれば、当該データブロックを書き込みデータ列の末尾に追加する。一方、当該データブロックの格納予定時間が格納期限の後になる場合は、当該データブロックを保留データ列に追加する。また、一定時間内に入力データがなかった場合は、保留データ列のデータブロックを書き込みデータ列に追加する。
以上のように、データをブロック化して遅延許容時間内に格納が完了するかどうか評価し、完了しない場合はそのデータブロックの格納を保留にしているので、大量データが発生したとき、データ格納の遅延の可能性を検出して大量データの一部の格納を後回しにすることができる。これによりデータ格納遅延を大量データの発生時点以外へ波及することを防ぎ、定常状態における遅延のないデータ格納を保障することができる。
また、大量データによる一部データ格納の保留及びデータ量が戻った時点での保留データの格納は、システムが自動的に検出して処理するので、人手の介入なしで予期しない一時的なデータ増加に対応することができる。
なお、以上では、データブロックごとに書き込みデータ列又は保留データ列への振り分けを行っていたが、データごとに書き込みデータ列又は保留データ列への振り分けを行うことも可能である。この場合は、システム設定情報104中のデータ書き込み時間の情報をブロック数に対応させた情報からデータ量に対応させた情報に変更し、また、図3の処理を図16のように変更する。
図16は、このような場合のデータ量調整部103によるデータ量調整手順(データ格納調整ステップ)を示すフローチャートである。
ステップ151でデータ量調整部103は一定時間、データ解析・正規化部102からデータが到着するのを待つ。
ステップ152で一定時間内にデータを受け取った場合はステップ153に、受け取らなかった場合はステップ157に進む。
ステップ153でデータ量調整部103はキュー制御部106から書き込みデータ列107で待機しているデータのデータ量を取得し、また、ステップ151で受取った入力データのデータ量を算出する。書き込みデータ列のデータのデータ量と入力データのデータ量とシステム設定情報104のデータ書き込み時間から、データ量調整部103が保持している入力データを書き込みデータ列107に追加した場合に書き込みが完了するのに必要な時間(格納予定時間)を算出する。
ステップ154で格納予定時間と入力データの取得時刻(タイムスタンプ)を比較し、システム設定情報104の遅延許容時間(制限時間)内にデータ格納が完了するかどうか調べる。データの格納が遅延許容時間(制限時間)内に完了する場合はステップ155に、完了しない場合はステップ156に進む。
ステップ155で保持している入力データをキュー制御部106に渡す。キュー制御部106は当該入力データを書き込みデータ列107の末尾に追加する。
ステップ156では保持している入力データを保留データ列105の末尾に追加する。
また、ステップ152において一定時間内に入力データが到着しなかった場合は、ステップ157で、保留データ列105にデータが存在するか調べる。保留データ列105にデータが存在する場合、ステップ158に進む。
ステップ158では、保留データ列105から先頭のデータを取り出す。その後、ステップ155に進み、取り出したデータを書き込みデータ列107の末尾に追加する。
以降は、図4と同様のデータ書き込み処理が行われる。
以上より、データごとの書き込みデータ列又は保留データ列への振り分けが可能である。
実施の形態2.
以上の実施の形態1では、遅延許容時間内に格納が完了しないデータの書き込みを保留するようにしたものであるが、次に格納を保留する際にデータの索引情報を管理する実施の形態を示す。
図5は、本実施の形態に係るデータ格納システム(データ処理装置)200の構成例を示す図である。
図5において、データ格納システム200は発生したデータを受け取るデータ入力部101、データの内容を解析し、データを実際の記憶形式に変換するデータ解析・正規化部102、格納データ量の調節を行いデータベース109への格納処理の対象となるデータを指定するデータ量調整部201、データ量調整の際に参照されるシステム設定情報202、格納するデータブロックの待ち行列を管理するキュー制御部106、データの書き込みを行うデータ書き込み部108、データ格納領域であるデータベース109を有する。
なお、データ入力部101はデータ取得部の例であり、データ量調整部201はデータ格納調整部の例であり、データ書き込み部108はデータ格納処理部の例であり、データベース109はデータ格納部の例である。
索引表203はデータ量調整部201においてデータの格納を保留にされたデータに関する索引情報を管理する表であり、データ量調整部201によって管理される。
保留データ列204はデータ量調整部201においてデータ格納の順序を後回しにされたデータブロックの列であり、データ量調整部201によって管理される。書き込みデータ列107はデータベース109への書き込みを待つデータブロックの待ち行列であり、キュー制御部106によって管理される。
システム設定情報202にはデータ書き込み部108がデータブロックの内容をデータベース109に書き込む際に必要となるデータ書き込み時間の情報と、データがデータ入力部101に到着してからデータベース109に書き込まれるまでの時間として遅れが許される最大時間を示す遅延許容時間(制限時間)の情報、及び格納が保留にされたときに索引情報を作成する必要のあるデータの列名を示す索引定義情報が含まれる。
なお、図5と実施の形態1の図1で同一符号の要素については、同じ動作をするものである。
図6は、索引表203の一例を示す図である。ブロックIDはデータブロックを一意に識別する識別子、表名はシステム設定情報202で索引定義が行われているデータの名前、列名は索引情報を作成するデータの列名、値はその列の実際の値である。索引表203について索引列を使って検索を行うことにより、保留データ列204にあるデータに対して存在の確認を調べることができる。
次に動作について説明する。
まずデータ格納システム200の稼動前の準備段階として、システム設定情報202にデータ書き込み時間と遅延許容時間(制限時間)、索引定義情報を設定する。データ書き込み時間と遅延許容時間については実施の形態1と同様である。索引定義情報はデータベース109に定義されている格納対象のデータに対して、格納が保留にされたときのデータの存在確認に使用する列情報を定義する。
次にデータ格納システム200におけるデータ量調整処理の流れを説明する。なお、データ入力の流れについては実施の形態1の図2の手順と、データ書き込みの流れについては実施の形態1の図4の手順と同様である。
図7は本実施の形態のデータ量調整部201によるデータ量調整手順(データ格納調整ステップ)を示すフローチャートである。
ステップ221でデータ量調整部201は一定時間、データ解析・正規化部102からデータが到着するのを待つ。ここで一定時間とは、実施の形態1のステップ131と同様である。
ステップ222で一定時間内にデータを受け取った場合はステップ223に、受け取らなかった場合はステップ228に進む。
ステップ223でデータ解析・正規化部102から受け取ったデータをデータバッファに蓄積してブロック化する。データバッファにはデータ用の領域の他に索引用の領域が用意されている。システム設定情報202で索引定義がなされているデータを受け取った場合、索引領域に索引列として指定されている列のデータがコピーされる。データがバッファを満たして1ブロック分データが到着した場合はステップ224に、1ブロック分に満たない場合はステップ221に戻る。
ステップ224でデータ量調整部201はキュー制御部106から書き込みデータ列107で待機しているデータブロックの数を取得する。データブロック数とシステム設定情報202のデータ書き込み時間からデータ量調整部201が保持しているデータブロックを書き込みデータ列107に追加した場合に書き込みが完了するのに必要な時間(格納予定時間)を算出する。
ステップ225で格納予定時間と保持しているデータブロックの先頭データの取得時刻(タイムスタンプ)を比較し、システム設定情報202の遅延許容時間内にデータ格納が完了するかどうか調べる。データの格納が遅延許容時間内に完了する場合はステップ226に、完了しない場合はステップ227に進む。
ステップ226では保持しているデータブロックをキュー制御部106に渡す。キュー制御部106はデータブロックを書き込みデータ列107の末尾に追加する。
ステップ227では保持しているデータブロックの索引領域の情報をブロックIDと共に索引表203に追加して、データブロックを保留データ列204の末尾に追加する。
また、ステップ222において一定時間内に入力データが到着しなかった場合は、ステップ228で保留データ列204にデータブロックが存在するか調べる。保留データ列204にデータブロックが存在する場合、ステップ229に進む。
ステップ229では保留データ列204から先頭のデータブロックを取り出し、索引表203から取り出したデータブロックのブロックIDと一致する情報を削除して、ステップ226に進む。
以上のように、データをブロック化して遅延許容時間内に格納が完了するかどうか評価し、完了しない場合はそのデータブロックの格納を保留にしているので、大量データが発生したとき、データ格納の遅延の可能性を検出して大量データの一部の格納を後回しにすることができる。これによりデータ格納遅延を大量データの発生時点以外へ波及することを防ぎ、定常状態における遅延のないデータ格納を保障することができる。
また、格納を保留しているデータの索引情報を管理しているので、データ検索においてデータが存在していない場合に、格納が保留されているだけで到着しているのか、実際に存在していないかの選別を行うことができる。
さらに、大量データによる一部データ格納の保留及びデータ量が戻った時点での保留データの格納は、システムが自動的に検出して処理するので、人手の介入なしで予期しない一時的なデータ増加に対応することができる。
なお、以上では、データブロックごとに書き込みデータ列又は保留データ列への振り分けを行っていたが、データごとに書き込みデータ列又は保留データ列への振り分けを行うことも可能である。この場合は、索引表のブロックIDの代わりにデータごとのデータIDを用い、更に、図7の処理を図17のように変更する。
図17は、この場合のデータ量調整部201によるデータ量調整手順(データ格納調整ステップ)を示すフローチャートである。
ステップ231でデータ量調整部201は一定時間、データ解析・正規化部102からデータが到着するのを待つ。
ステップ232で一定時間内にデータを受け取った場合はステップ233に、受け取らなかった場合はステップ237に進む。
ステップ233でデータ量調整部201はキュー制御部106から書き込みデータ列107で待機しているデータのデータ量を取得し、またステップ231で入力した入力データのデータ量を算出する。書き込みデータ列のデータのデータ量と入力データのデータ量とシステム設定情報202のデータ書き込み時間からデータ量調整部201が保持している入力データを書き込みデータ列107に追加した場合に書き込みが完了するのに必要な時間(格納予定時間)を算出する。
ステップ234で格納予定時間と保持している入力データの取得時刻(タイムスタンプ)を比較し、システム設定情報202の遅延許容時間内にデータ格納が完了するかどうか調べる。データの格納が遅延許容時間内に完了する場合はステップ235に、完了しない場合はステップ236に進む。
ステップ235では保持している入力データをキュー制御部106に渡す。キュー制御部106は入力データを書き込みデータ列107の末尾に追加する。
ステップ236では保持している入力データの索引領域の情報をデータIDと共に索引表203に追加して、入力データを保留データ列204の末尾に追加する。
また、ステップ232において一定時間内に入力データが到着しなかった場合は、ステップ237で保留データ列204にデータが存在するか調べる。保留データ列204にデータが存在する場合、ステップ238に進む。
ステップ238では保留データ列204から先頭のデータを取り出し、索引表203から取り出したデータのデータIDと一致する情報を削除して、ステップ235に進む。
以降は、図4と同様のデータ書き込み処理が行われる。
以上より、データごとの書き込みデータ列又は保留データ列への振り分けが可能である。
実施の形態3.
以上の実施の形態1では、格納対象の入力データをメモリ上で受け取るようにしたものであるが、次に入力データをファイルで受け取る実施の形態を示す。
図8は、本実施の形態に係るデータ格納システム(データ処理装置)300の構成例を示す図である。
図8において、データ格納システム300は発生データが記録されているデータファイル302を受け付けるデータ受信部301、格納データ量の調節を行いデータベース109への格納処理の対象となるデータを指定するデータ量調整部303、データ量調整の際に参照されるシステム設定情報104、データファイル302から入力データを読み込み、データ内容の解析と、データの記憶形式への変換を行うデータ解析・正規化部305、格納するデータブロックの待ち行列を管理するキュー制御部106、データの書き込みを行うデータ書き込み部108、データ格納領域であるデータベース109を有する。保留リスト304はデータ量調整部303においてデータ格納の順序を後回しにされたデータのファイル名が、ファイルの受付時間順に並べられた一覧であり、データ量調整部303によって管理される。書き込みデータ列107はデータベース109への書き込みを待つデータブロックの待ち行列であり、キュー制御部106によって管理される。なお、図8と実施の形態1の図1で同一符号の要素については、同じ動作をするものである。
データファイル302はデータベース109に格納する入力データが記録されているファイルである。予め決められたファイル命名規則とデータ記録形式に従って作成される。一つのファイルに記録されるデータの最大件数はシステムで決められており、一つのファイルにあるデータが、データベース109に書き込むときの一つのデータブロックとなる。
なお、データ受信部301及びデータ解析・正規化部305はデータ取得部の例であり、データ量調整部303はデータ格納調整部の例であり、データ書き込み部108はデータ格納処理部の例であり、データベース109はデータ格納部の例である。
次に動作について説明する。
まずデータ格納システム300の稼動前の準備段階として、システム設定情報104にデータ書き込み時間と遅延許容時間を設定する。設定内容は実施の形態1と同様である。
次にデータ格納システム300におけるデータ受信部301でのデータ受け付けからデータ量調整部303での書き込みデータ列107へのデータブロック追加までの処理の流れを図9と図10のフローチャートを用いて説明する。なお、書き込みデータ列107のデータ書き込みの流れについては、実施の形態1の図4の手順と同様である。
図9は、本実施の形態のデータ受信部301によるデータ受け付け手順を示すフローチャートである。
ステップ321でデータ受信部301は入力データとしてデータファイル302が生成されたことを検知する。データファイル302はネットワーク経由でデータ発生元から転送、生成される。あるいはアプリケーションプログラムなどが直接作成してもよい。データファイル302の検知はデータ受信部301がファイルシステムの特定の場所を周期的に監視して、新しいファイルが生成されているかどうかを調べることで行う。データファイル302を生成するプログラム(ファイル転送プログラム、アプリケーションプログラムなど)がファイル生成後にデータ受信部301に通知するようにしてもよい。
ステップ322で、検知したデータファイル302に関する情報を採取する。ファイル名などから格納先のデータを特定し、ファイルサイズから書き込みデータ量の概算値を求める。採取した情報に、データファイル302を検知したときの取得時刻(タイムスタンプ)情報を加えて入力データのファイル情報とする。なお、このファイル情報には格納の候補となるデータのデータ量が示されており、ファイル情報はデータ量情報に相当する。
ステップ323で、データファイル302のファイル情報をデータ量調整部303に渡す。
図10は、本実施の形態のデータ量調整部303によるデータ量調整手順を示すフローチャートである。
ステップ331でデータ量調整部303はデータ受信部301からのファイル情報の到着を一定時間待つ。ここで一定時間とは、実施の形態1のステップ131と同様である。ファイル情報が届いた場合はステップ332に、届かなかった場合はステップ336に進む。
ステップ332でデータ量調整部303はキュー制御部106から現在の書き込みデータ列107で待機しているデータブロックの数を取得する。データブロック数とファイル情報に示されたデータ量とシステム設定情報104のデータ書き込み時間を使って、データファイル302から得られるデータブロックを書き込みデータ列107に追加した場合に書き込みが完了するのに必要な時間(格納予定時間)を算出する。
ステップ333で格納予定時間とファイル情報の取得時刻(タイムスタンプ)を比較し、システム設定情報104に設定された遅延許容時間内にデータ格納が完了するかどうか調べる。データの格納が遅延許容時間内に完了する場合はステップ334に、完了しない場合はステップ335に進む。
ステップ334では、データ量調整部303はファイル情報をデータ解析・正規化部305に渡して対象となるデータの取得を要求する。データ解析・正規化部305ではファイル情報を元にデータファイル302をオープンしてデータを読み込む。データが不正なデータでないか検査し、データベース109に実際に書き込む際の内部データ形式に変換、データバッファにコピーする。データファイル302にある全データに対して処理を行ってデータブロックを作成し、データブロックをデータ量調整部303へ渡す。
ステップ338では、データ量調整部303はデータブロックをキュー制御部106に渡し、キュー制御部106はデータブロックを書き込みデータ列107の末尾に追加する。
一方、ステップ333で遅延許容時間内に格納が完了しないと判断された場合に、ステップ335で、ファイル情報を保留リスト304の末尾に追加する。
また、ステップ331において一定時間内にファイル情報が到着しなかった場合は、ステップ336で、データ量調整部303は保留リスト304にファイル情報が存在するか調べる。ファイル情報が存在する場合ステップ337に進む。
ステップ337では、保留リスト304の先頭にあるファイル情報を取り出し、ステップ334に進む。
以上のように、ファイルのデータが遅延許容時間内に格納できるか評価し、格納できない場合はそのファイルのデータ格納処理を保留にすることにより、大量データが発生したとき、データ格納の遅延の可能性を検出して大量データの一部の格納を後回しにすることができる。これによりデータ格納遅延を大量データの発生時点以外へ波及することを防ぎ、定常状態における遅延のないデータ格納を保障することができる。
また、格納が保留されているデータはそのままファイルとして保存されているため、メモリといった処理実行に必要なシステムリソースを節約することができる。
さらに、大量データによる一部データ格納の保留及びデータ量が戻った時点での保留データの格納は、システムが自動的に検出して処理するので、人手の介入なしで予期しない一時的なデータ増加に対応することができる。
実施の形態4.
以上の実施の形態1では、書き込みを保留するデータをデータブロック単位で行うようにしたものであるが、次にデータ一件単位で行う実施の形態を示す。
図11は、本実施の形態に係るデータ格納システム(データ処理装置)400の構成例を示す図である。
図11において、データ格納システム400は発生したデータを受け取るデータ入力部401、データの内容を解析し、データを実際の記憶形式に変換するデータ解析・正規化部402、格納データ量の調節を行いデータベース109への格納処理の対象となるデータを指定するデータ量調整部403、データの分類とデータ量調整の際に参照されるシステム設定情報404、データの書き込みを行うデータ書き込み部406、データ格納領域であるデータベース109を有する。保留データバッファ405はデータ量調整部403においてデータ格納の順序を後回しにされたデータを記憶するバッファである。
なお、データ入力部401はデータ取得部の例であり、データ量調整部403はデータ格納調整部の例であり、データ書き込み部406はデータ格納処理部の例であり、データベース109はデータ格納部の例である。
システム設定情報404には調整単位時間の情報と最大データ量の情報及びデータ区分条件の情報が含まれる。調整単位時間とは格納するデータ量を調節するときの処理の単位時間間隔を示し、この時間毎にデータ量の調整処理を行う。最大データ量とは調整単位時間当たりに格納するデータ量を示す。なお、最大データ量は、制限データ量に相当する。データ区分条件とは入力データを分類してデータの系統毎にデータ量を調整するために、データを分類するのに使用する条件定義である。データ区分条件の定義内容としては、例えば区分の判定で使用するデータの列名、区分の総数、各区分のID、各区分での列の値の範囲、各区分の格納データ量の割合(最大データ量に占める区分データの割合)がある。
なお、図11と実施の形態1の図1で同一符号の要素については、同じ動作をするものである。
図12はシステム設定情報404のデータ区分条件を表で定義した場合の一例を示す図である。表名410のデータ件数が区分の総数を表す。値域411は各区分での列の値の範囲を示し、値の比較といった単純な演算によりデータが区分に該当するかどうか判断するのに用いる。比率412は各区分の格納データ量の割合として調整単位時間内での相対データ量である。
次に動作について説明する。
まずデータ格納システム400の稼動前の準備段階として、システム設定情報404に調整単位時間と最大データ量、データ区分条件を設定する。調整単位時間の値は実行するシステム構成やH/W仕様などを勘案してシステム管理者(ユーザ)が導出する。最大データ量の値は調整単位時間とH/W仕様などを基にシステムで現実的にデータ格納が可能なデータ量をシステム管理者(ユーザ)が導出する。データ区分条件は発生するデータに関する情報を基にシステム管理者(ユーザ)が定義する。
システム稼動開始時にデータ量調整部403では最大データ量とデータ区分条件にある各区分の格納データ量の割合から、データの各区分における調整単位時間での区分最大データ量を算出する。なお、区分最大データ量は、区分ごとの制限データ量に相当する。
次にデータ格納システム400におけるデータ入力部401でのデータの受け取りからデータベース109へのデータの書き込みまでの処理の流れを図13、図14のフローチャートを用いて説明する。
図13は本実施の形態のデータ入力部401及びデータ解析・正規化部402によるデータ入力手順(データ取得ステップ)を示すフローチャートである。
ステップ421で、データ入力部401はデータベース109に格納する入力データを受け取る。データ入力部401はシステム構成に応じて入力データをネットワーク経由で受け取る場合もあれば、データの発生源から直接受け取る場合もある。入力データはSQL文のような命令として指定されるか、あるいは予め決められた形式のデータとしてデータ入力部401に受け渡される。データ入力部401は一度に複数の入力データを受け取ってもよい。データ入力部401はデータ解析・正規化部402に1件ずつ入力データを渡す。
ステップ422で、データ解析・正規化部402は入力データが不正なデータでないか検査を行う。データが正しいとき、入力データをデータベース109に実際に書き込む際の内部データ形式に変換する。
ステップ423で、システム設定情報404のデータ区分条件を基に入力データの分類を行う。入力データが属する区分を判定し、その区分IDの情報をデータに付加する。
ステップ424では、内部データ形式に変換したデータをデータ量調整部403へ送る。
図14は本実施の形態のデータ量調整部403によるデータ量調整手順(データ格納調整ステップ)を示すフローチャートである。
ステップ431で、データ量調整部403は調整単位時間の間、データ解析・正規化部402からデータが到着するのを待つ。
ステップ432で調整単位時間内にデータを受け取った場合はステップ433に、受け取らなかった場合はステップ437に進む。
ステップ433で、データ解析・正規化部402から受け取ったデータの区分IDを参照し、該当区分のデータ総量が調整単位時間の間に区分最大データ量に達しているかどうか調べる。データがまだ区分最大データ量に達していない場合はステップ434に、既に達している場合はステップ435に進む。
ステップ434ではデータをデータ書き込み部406に渡し、ステップ436へ進む。
ステップ435ではデータを保留データバッファ405の末尾に追加して、ステップ436へ進む。
ステップ436で処理時間が調整単位時間を超えていないか調べる。超えていない場合はステップ431に戻る。超えている場合はステップ437に進む。
ステップ437で調整単位時間内にデータ書き込み部406に渡したデータ総量(格納データ量)が最大データ量(制限データ量)に達しているか調べる。達していない場合はステップ438に進む。
ステップ438で保留データバッファ405にデータがあるか調べる。データがある場合はステップ439に進む。
ステップ439で保留データバッファ405のデータをデータ書き込み部406に渡して、そのデータを保留データバッファ405から削除する。データ書き込み部406へのデータの受け渡しは保留データバッファ405にデータが無くなるか、格納データ量が最大データ量に達するまで行う。
ステップ434、ステップ439でデータ書き込み部406に渡されたデータは、データ書き込み部406によってデータベース109に格納される。このときデータの書き込みはデータが渡される毎に1件ずつ行ってもよいし、データ書き込み部406でバッファリングして書き込んでもよい。
なお、図13、図14の例では、入力データを区分に分け、区分ごとにデータ総量と区分最大データ量とを比較して書き込み対象のデータを決定したが、入力データを区分に分けることなく、入力データ全体のデータ総量と最大データ量とを比較して書き込み対象のデータを決定することも可能である。
また、図14のステップ438及びステップ439では、保留データバッファ405にバッファリングされているデータの区分にかかわらず、保留データバッファ405の先頭のデータから順にデータ書き込み対象としたが、いずれかの区分のデータ総量が区分最大データ量に満たない場合に、保留データバッファ405にバッファリングされているデータのうち当該区分のデータのみをデータ書き込み対象とする、または、当該区分のデータから順にデータ書き込み対象とし、当該区分のデータがなくなったら他の区分のデータをデータ書き込み対象とするようにしてもよい。
以上のように、データの格納処理を単位時間毎に区切り、最大データ量を超える場合にはデータの格納を保留にしているので、大量データが発生したとき、データ格納の遅延の可能性を検出して大量データの一部の格納を後回しにすることができる。これによりデータ格納遅延を大量データの発生時点以外へ波及することを防ぎ、定常状態における遅延のないデータ格納を保障することができる。
また、単位時間毎にデータ量の調整を行っているので、大量データ発生により格納が保留されるデータが単位時間毎に平均的に散らばるため、大量発生時点の格納データが発生初期のデータに偏らず、時間的に平均したデータを格納することができる。
さらに、データを分類して区分毎にデータ量の調整を行っているため、ある区分のデータが大量に発生した場合にも、他の区分のデータ格納を保障することができる。
そして、大量データによる一部データ格納の保留及びデータ量が戻った時点での保留データの格納は、システムが自動的に検出して処理するので、人手の介入なしで予期しない一時的なデータ増加に対応することができる。
前述した各実施の形態で、データ格納システムは、コンピュータで実現できるものである。
図示していないが、データ格納システムは、プログラムを実行するCPU(Central Processing Unit)を備えている。
例えば、CPUは、バスを介して、ROM(Read Only Memory)、RAM(Random Access Memory)、通信ボード、表示装置、K/B(キーボード)、マウス、FDD(Flexible Disk Drive)、CDD(コンパクトディスクドライブ)、磁気ディスク装置、光ディスク装置、プリンタ装置、スキャナ装置等と接続されている。
RAMは、揮発性メモリの一例である。ROM、FDD、CDD、磁気ディスク装置、光ディスク装置は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部の一例である。
前述した各実施の形態のデータ格納システムが扱うデータや情報は、記憶装置あるいは記憶部に保存され、データ格納システムの各部により、記録され読み出されるものである。
また、通信ボードは、例えば、LAN、インターネット、或いはISDN等のWAN(ワイドエリアネットワーク)に接続されている。
磁気ディスク装置には、オペレーティングシステム(OS)、ウィンドウシステム、プログラム群、ファイル群(データベース)が記憶されている。
プログラム群は、CPU、OS、ウィンドウシステムにより実行される。
上記データ格納システムの各部は、一部或いはすべてコンピュータで動作可能なプログラムにより構成しても構わない。或いは、ROMに記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェア或いは、ハードウェア或いは、ソフトウェアとハードウェアとファームウェアとの組み合わせで実施されても構わない。
上記プログラム群には、実施の形態の説明において「〜部」として説明した処理をCPUに実行させるプログラムが記憶される。これらのプログラムは、例えば、C言語やHTMLやSGMLやXMLなどのコンピュータ言語により作成される。
また、上記プログラムは、磁気ディスク装置、FD(Flexible Disk)、光ディスク、CD(コンパクトディスク)、MD(ミニディスク)、DVD(Digital Versatile Disk)等のその他の記録媒体に記憶され、CPUにより読み出され実行される。
ここで、以上の実施の形態で説明したデータ格納システムの特徴を以下にて示す。
実施の形態1で説明したデータ格納システムは、
持続的に発生するデータの格納処理において、データブロックのデータベースへの書き込みに必要な時間を示すデータ書き込み時間と、データ到着からデータベースへの格納までの時間として遅れが許される最大時間を示す遅延許容時間とを備え、
格納対象のデータを受け取るデータ入力手段と、
データを解析して実際の記憶形式に変換するデータ解析・正規化手段と、
データをブロック化してデータブロックが上記遅延許容時間内に書き込みが完了するか判定し、完了しない場合は格納を一時保留することで書き込みデータ量を調節するデータ量調整手段と、
データブロックをデータベースに書き込むデータ書き込み手段とを備えたことを特徴とする。
実施の形態1で説明したデータ格納システムは、
持続的に発生するデータの格納処理において、データブロックのデータベースへの書き込みに必要な時間を示すデータ書き込み時間と、データ到着からデータベースへの格納までの時間として遅れが許される最大時間を示す遅延許容時間と、上記データ書き込み時間と上記遅延許容時間を記憶するシステム設定情報と、格納が保留にされたデータブロックを管理する保留データ列と、書き込み処理を行うデータブロックの待ち行列である書き込みデータ列とを備え、
格納対象のデータを受け取るデータ入力手段と、
データを解析して実際の記憶形式に変換するデータ解析・正規化手段と、
データをブロック化してデータブロックが上記遅延許容時間内に書き込みが完了するか判定し、完了しない場合は上記保留データ列で格納を一時保留することで上記書き込みデータ列のデータブロック数を調節するデータ量調整手段と、
上記書き込みデータ列を管理するキュー制御手段と、
上記書き込みデータ列のデータブロックをデータベースに書き込むデータ書き込み手段とを備えたことを特徴とする。
実施の形態2で説明したデータ格納システムは、
持続的に発生するデータの格納処理において、データブロックのデータベースへの書き込みに必要な時間を示すデータ書き込み時間と、データ到着からデータベースへの格納までの時間として遅れが許される最大時間を示す遅延許容時間と、格納が保留されたデータに対して作成する索引の定義情報を示す索引定義情報と、上記データ書き込み時間と上記遅延許容時間と上記索引定義情報を記憶するシステム設定情報と、上記索引定義情報に基づき格納が保留されたデータに対して作成された索引情報を記憶する索引表と、格納が保留にされたデータブロックを管理する保留データ列と、書き込み処理を行うデータブロックの待ち行列である書き込みデータ列とを備え、
格納対象のデータを受け取るデータ入力手段と、
データを解析して実際の記憶形式に変換するデータ解析・正規化手段と、
データをブロック化してデータブロックが上記遅延許容時間内に書き込みが完了するか判定し、完了しない場合は上記保留データ列で格納を一時保留することで上記書き込みデータ列のデータブロック数を調節すると共に、保留にしたデータの索引情報を上記索引表に追加するデータ量調整手段と、
上記書き込みデータ列を管理するキュー制御手段と、
上記書き込みデータ列のデータブロックをデータベースに書き込むデータ書き込み手段とを備えたことを特徴とする。
実施の形態3で説明したデータ格納システムは、
持続的に発生するデータの格納処理において、データブロックのデータベースへの書き込みに必要な時間を示すデータ書き込み時間と、データ到着からデータベースへの格納までの時間として遅れが許される最大時間を示す遅延許容時間と、上記データ書き込み時間と上記遅延許容時間を記憶するシステム設定情報と、格納を保留したデータのファイル名を記憶する保留リストと、
書き込み処理を行うデータブロックの待ち行列である書き込みデータ列とを備え、
格納対象のデータが入ったファイルを検知するデータ受信手段と、
ファイルのデータが上記遅延許容時間内に書き込みを完了するか判定し、完了しない場合はファイルを上記保留リストに登録することで上記書き込みデータ列のデータブロック数を調節するデータ量調整手段と、
ファイルのデータを解析して実際の記憶形式に変換し、データブロックを作成するデータ解析・正規化手段と、
上記書き込みデータ列を管理するキュー制御手段と、
上記書き込みデータ列のデータブロックをデータベースに書き込むデータ書き込み手段とを備えたことを特徴とする。
実施の形態4で説明したデータ格納システムは、
持続的に発生するデータの格納処理において、格納するデータ量の調節を行う時間間隔を示す調整単位時間と、上記調整単位時間で格納するデータ量を示す最大データ量とを備え、
格納対象のデータを受け取るデータ入力手段と、
入力されたデータを解析して実際の記憶形式に変換するデータ解析・正規化手段と、
データ量を評価し、最大データ量を超過した場合にデータの格納を一時保留するデータ量調整手段と、
データをデータベースに書き込むデータ書き込み手段とを備えたことを特徴とする。
実施の形態4で説明したデータ格納システムは、
持続的に発生するデータの格納処理において、格納するデータ量の調節を行う時間間隔を示す調整単位時間と、上記調整単位時間で格納するデータ量を示す最大データ量と、データの系統毎にデータ量を調節するためにデータを分類するのに使用する条件定義を示すデータ区分条件と、上記調整時間時間と上記最大データ量と上記データ区分条件を記憶するシステム設定情報と、格納を保留にしたデータを記憶する保留データバッファとを備え、
格納対象のデータを受け取るデータ入力手段と、
入力されたデータを解析して実際の記憶形式に変換し、上記データ区分条件に従ってデータの区分を判定するデータ解析・正規化手段と、
データ区分毎にデータ量を評価し、最大データ量を超過した場合にデータを上記保留データバッファに追加することによりデータ格納を一時保留するデータ量調整手段と、
データをデータベースに書き込むデータ書き込み手段とを備えたことを特徴とする。
実施の形態1に係るデータ格納システムの構成例を示す図。 実施の形態1に係るデータ入力処理を示すフローチャート図。 実施の形態1に係るデータ量調整処理を示すフローチャート図。 実施の形態1に係る書き込み処理を示すフローチャート図。 実施の形態2に係るデータ格納システムの構成例を示す図。 実施の形態2に係る索引表の例を示す図。 実施の形態2に係るデータ量調整処理を示すフローチャート図。 実施の形態3に係るデータ格納システムの構成例を示す図。 実施の形態3に係る入力データ受付処理を示すフローチャート図。 実施の形態3に係るデータ量調整処理を示すフローチャート図。 実施の形態4に係るデータ格納システムの構成例を示す図。 実施の形態4に係るデータ区分条件の例を示す図。 実施の形態4に係るデータ入力処理を示すフローチャート図。 実施の形態4に係るデータ量調整処理を示すフローチャート図。 実施の形態1に係るデータ量調整処理を示すタイミングチャート図。 実施の形態1に係るデータ量調整処理を示すフローチャート図。 実施の形態2に係るデータ量調整処理を示すフローチャート図。
符号の説明
100 データ格納システム、101 データ入力部、102 データ解析・正規化部、103 データ量調整部、104 システム設定情報、105 保留データ列、106 キュー制御部、107 書き込みデータ列、108 データ書き込み部、109 データベース、200 データ格納システム、201 データ量調整部、202 システム設定情報、203 索引表、204 保留データ列、301 データ受信部、302 データファイル、303 データ量調整部、304 保留リスト、305 データ解析・正規化部、401 データ入力部、402 データ解析・正規化部、403 データ量調整部、404 システム設定情報、405 保留データバッファ、406 データ書き込み部。

Claims (13)

  1. データの格納領域であるデータ格納部と、
    前記データ格納部への格納の候補となる格納候補データを取得するデータ取得部と、
    前記データ取得部により取得された格納候補データを所定の制限時間内に前記データ格納部に格納できるか否かを判断し、前記制限時間内に格納候補データを格納できる場合に格納候補データを格納処理の対象となる格納対象データに指定し、前記制限時間内に格納候補データを格納できない場合に格納候補データの格納処理を保留するデータ格納調整部と、
    前記データ格納調整部により指定された格納対象データを前記データ格納部に格納するデータ格納処理部とを有し、
    前記データ格納調整部は、
    格納処理を保留した格納候補データの属性を示し、検索対象のデータが格納処理を保留されている格納候補データであるのか、検索対象のデータが存在していないかの確認が可能な索引情報を所定の索引表に記録することを特徴とするデータ処理装置。
  2. 前記データ処理装置は、
    前記索引情報に基づき、検索対象のデータが格納処理を保留されている格納候補データであるのか、検索対象のデータが前記データ処理装置内に存在していないかの確認を行うことを特徴とする請求項1に記載のデータ処理装置。
  3. 前記データ格納調整部は、
    格納候補データのデータ量と当該格納候補データに対する判断の際に前記データ格納処理部による前記データ格納部への格納処理を待っている格納対象データのデータ量とに基づき、所定の制限時間内に格納候補データを前記データ格納部に格納できるか否かを判断することを特徴とする請求項1に記載のデータ処理装置。
  4. 前記データ格納調整部は、
    一定時間の間、前記データ取得部により新たな格納候補データが取得されない場合に、既に格納処理が保留されている格納候補データを格納対象データに指定することを特徴とする請求項1に記載のデータ処理装置。
  5. 前記データ格納処理部は、
    所定の単位データブロックごとに格納対象データを前記データ格納部に格納し、
    前記データ格納調整部は、
    前記データ取得部より格納候補データを入力するとともに、前記データ取得部より単位データブロック分の格納候補データを入力しているか否かを判断し、前記データ取得部より単位データブロック分の格納候補データを入力している場合に、単位データブロック分の格納候補データを所定の制限時間内に前記データ格納部に格納できるか否かを判断し、前記制限時間内に単位データブロック分の格納候補データを格納できる場合に、単位データブロック分の格納候補データを格納処理の対象となる格納対象データに指定し、前記制限時間内に単位データブロック分の格納候補データを格納できない場合に、単位データブロック分の格納候補データの格納処理を保留することを特徴とする請求項1に記載のデータ処理装置。
  6. 前記データ取得部は、
    格納候補データを取得する度に、取得時刻を計測し、
    前記データ格納調整部は、
    前記データ取得部より格納候補データを入力するとともに、入力した格納候補データを前記データ取得部の格納候補データの取得時刻から所定の制限時間内に前記データ格納部に格納できるか否かを判断することを特徴とする請求項1に記載のデータ処理装置。
  7. 前記データ格納調整部は、
    一定時間の間、前記データ取得部により新たな格納候補データが取得されない場合に、既に格納処理が保留されている格納候補データを格納対象データに指定するとともに、格納対象データに指定した格納候補データの索引情報を索引表から削除することを特徴とする請求項に記載のデータ処理装置。
  8. 前記データ取得部は、
    格納候補データの取得に先立ち、格納候補データのデータ量を示すデータ量情報を取得し、
    前記データ格納調整部は、
    前記データ取得部からデータ量情報を入力し、データ量情報に示された格納候補データのデータ量に基づいて、格納候補データを所定の制限時間内に前記データ格納部に格納できるか否かを判断することを特徴とする請求項1に記載のデータ処理装置。
  9. 前記データ格納調整部は、
    データ量情報に示された格納候補データのデータ量と当該格納候補データに対する判断の際に前記データ格納処理部による前記データ格納部への格納処理を待っている格納対象データのデータ量とに基づき、所定の制限時間内に格納候補データを前記データ格納部に格納できるか否かを判断することを特徴とする請求項8に記載のデータ処理装置。
  10. 前記データ格納調整部は、
    格納候補データを所定の制限時間内に前記データ格納部に格納できるか否かを判断した結果、前記制限時間内に格納候補データを格納できる場合に、格納候補データを格納処理の対象となる格納対象データに指定するとともに、格納対象データに指定した格納候補データを取得するよう前記データ取得部に要求することを特徴とする請求項8に記載のデータ処理装置。
  11. 前記データ格納処理部は、
    所定の単位データブロックごとに格納対象データを前記データ格納部に格納し、
    前記データ取得部は、
    格納候補データの取得に先立ち、単位データブロック分の格納候補データのデータ量を示すデータ量情報を取得し、
    前記データ格納調整部は、
    前記データ取得部からデータ量情報を入力し、データ量情報に示された単位データブロック分の格納候補データのデータ量に基づいて、単位データブロック分の格納候補データを所定の制限時間内に前記データ格納部に格納できるか否かを判断し、前記制限時間内に単位データブロック分の格納候補データを格納できる場合に、単位データブロック分の格納候補データを格納処理の対象となる格納対象データに指定し、前記制限時間内に単位データブロック分の格納候補データを格納できない場合に、単位データブロック分の格納候補データの格納処理を保留することを特徴とする請求項8に記載のデータ処理装置。
  12. データ格納領域への格納の候補となる格納候補データを取得するデータ取得ステップと、
    前記データ取得ステップにより取得された格納候補データを所定の制限時間内に前記データ格納領域に格納できるか否かを判断し、前記制限時間内に格納候補データを格納できる場合に格納候補データを格納処理の対象となる格納対象データに指定し、前記制限時間内に格納候補データを格納できない場合に格納候補データの格納処理を保留するデータ格納調整ステップと、
    前記データ格納調整ステップにより指定された格納対象データを前記データ格納領域に格納するデータ格納処理ステップとを有し、
    前記データ格納調整ステップは、
    格納処理を保留した格納候補データの属性を示し、検索対象のデータが格納処理を保留されている格納候補データであるのか、検索対象のデータが存在していないかの確認が可能な索引情報を所定の索引表に記録することを特徴とするデータ処理方法。
  13. データ格納領域への格納の候補となる格納候補データを取得するデータ取得処理と、
    前記データ取得処理により取得された格納候補データを所定の制限時間内に前記データ格納領域に格納できるか否かを判断し、前記制限時間内に格納候補データを格納できる場合に格納候補データを格納の対象となる格納対象データに指定し、前記制限時間内に格納候補データを格納できない場合に格納候補データの格納を保留するデータ格納調整処理と、
    前記データ格納調整処理により指定された格納対象データを前記データ格納領域に格納するデータ格納処理とをコンピュータに実行させ、
    前記データ格納調整処理において、
    前記コンピュータに、
    格納処理を保留した格納候補データの属性を示し、検索対象のデータが格納処理を保留されている格納候補データであるのか、検索対象のデータが存在していないかの確認が可能な索引情報を所定の索引表に記録させることを特徴とするプログラム。
JP2004249402A 2004-08-30 2004-08-30 データ処理装置及びデータ処理方法及びプログラム Expired - Fee Related JP4634096B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004249402A JP4634096B2 (ja) 2004-08-30 2004-08-30 データ処理装置及びデータ処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004249402A JP4634096B2 (ja) 2004-08-30 2004-08-30 データ処理装置及びデータ処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2006065702A JP2006065702A (ja) 2006-03-09
JP4634096B2 true JP4634096B2 (ja) 2011-02-16

Family

ID=36112124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004249402A Expired - Fee Related JP4634096B2 (ja) 2004-08-30 2004-08-30 データ処理装置及びデータ処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4634096B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5244430B2 (ja) * 2008-03-21 2013-07-24 株式会社日立製作所 ストレージ装置及びその制御方法
CN103886087B (zh) * 2014-03-28 2018-10-12 上海斐讯数据通信技术有限公司 Md5的计算流程以及文件校验方法
KR102226721B1 (ko) * 2015-10-21 2021-03-11 에스케이텔레콤 주식회사 데이터 검색 장치 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222310A (ja) * 1997-02-10 1998-08-21 Matsushita Electric Ind Co Ltd 記録再生装置
JPH11110140A (ja) * 1997-10-03 1999-04-23 Matsushita Electric Ind Co Ltd データ記録装置および方法
JP2003196924A (ja) * 2001-12-21 2003-07-11 Sharp Corp ディスクの実時間交替処理方法およびデータ記録方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222310A (ja) * 1997-02-10 1998-08-21 Matsushita Electric Ind Co Ltd 記録再生装置
JPH11110140A (ja) * 1997-10-03 1999-04-23 Matsushita Electric Ind Co Ltd データ記録装置および方法
JP2003196924A (ja) * 2001-12-21 2003-07-11 Sharp Corp ディスクの実時間交替処理方法およびデータ記録方法

Also Published As

Publication number Publication date
JP2006065702A (ja) 2006-03-09

Similar Documents

Publication Publication Date Title
WO2019227689A1 (zh) 数据监控方法、装置、计算机设备及存储介质
CN112346829B (zh) 一种用于任务调度的方法及设备
US8533718B2 (en) Batch job assignment apparatus, program, and method that balances processing across execution servers based on execution times
US9619373B2 (en) Method and apparatus to semantically connect independent build and test processes
US9146927B2 (en) Data processing apparatus, data processing method, and program
US9715409B2 (en) Job delay detection method and information processing apparatus
US20060048155A1 (en) Organizing transmission of repository data
US20160352822A1 (en) Command process load balancing system
US20100211949A1 (en) Management computer and processing management method
US9535743B2 (en) Data processing control method, computer-readable recording medium, and data processing control device for performing a Mapreduce process
WO2021185206A1 (zh) 集群任务的资源分配方法及装置、计算机装置及存储介质
US20170329770A1 (en) System and method for facilitating data migration
US20200142870A1 (en) Data sampling in a storage system
US8732323B2 (en) Recording medium storing transaction model generation support program, transaction model generation support computer, and transaction model generation support method
JP5610524B2 (ja) 文書の優先度を決定する方法、プログラム及び装置
US7711812B2 (en) Definition system and method for web services that monitor other web services
JP4634096B2 (ja) データ処理装置及びデータ処理方法及びプログラム
US11514083B2 (en) Data processing system and data processing method
CN112433888B (zh) 数据处理方法及装置、存储介质和电子设备
JP2019144872A (ja) 機械学習を行なう計算モデルを有するシステム、及び機械学習の方法
JP2015185027A (ja) ジョブ判別プログラム、装置、及び方法
JP2009252050A (ja) サーバ負荷管理システム、サーバ負荷管理方法、サーバ負荷管理プログラム
KR101540012B1 (ko) 불변 데이터를 자동 검출하는 맵리듀스 순환 처리 장치 및 방법
CN111563123A (zh) 一种hive仓库元数据实时同步方法
JP2006277530A (ja) 割当システム、割当装置、割当方法及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070425

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101118

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees