JP6916442B2 - データ処理装置およびデータ処理プログラム - Google Patents
データ処理装置およびデータ処理プログラム Download PDFInfo
- Publication number
- JP6916442B2 JP6916442B2 JP2017223761A JP2017223761A JP6916442B2 JP 6916442 B2 JP6916442 B2 JP 6916442B2 JP 2017223761 A JP2017223761 A JP 2017223761A JP 2017223761 A JP2017223761 A JP 2017223761A JP 6916442 B2 JP6916442 B2 JP 6916442B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- chunk
- bloom filter
- bit string
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2237—Vectors, bitmaps or matrices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0608—Saving storage space on storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
- G06F16/24556—Aggregation; Duplicate elimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
- G06F3/0641—De-duplication techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
〔第1の実施の形態〕
図1は、第1の実施の形態に係るデータ処理装置の構成例および処理例を示す図である。図1に示すデータ処理装置1は、記憶部1aと演算部1bを有する。なお、記憶部1aは、RAM(Random Access Memory)やHDD(Hard Disk Drive)など、データ処理装置1が備える記憶装置の記憶領域によって実現される。演算部1bは、例えば、データ処理装置1が備えるプロセッサとして実現される。
図2は、第2の実施の形態に係る情報処理システムの構成例を示す図である。図2に示す情報処理システムは、クラウドストレージゲートウェイ100、NAS(Network Attached Storage)クライアント210およびストレージシステム220を有する。クラウドストレージゲートウェイ100は、ネットワーク231を介してNASクライアント210と接続し、また、ネットワーク232を介してストレージシステム220と接続する。ネットワークは、例えばLAN(Local Area Network)であり、ネットワークは、例えばWAN(Wide Area Network)である。
RAM102は、クラウドストレージゲートウェイ100の主記憶装置として使用される。RAM102には、プロセッサ101に実行させるOS(Operating System)プログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、プロセッサ101による処理に必要な各種データが格納される。
以上のようなハードウェア構成によって、クラウドストレージゲートウェイ100の処理機能を実現することができる。なお、NASクライアント210や制御サーバ221aも、図3と同様のハードウェア構成を有するコンピュータとして実現可能である。
チャンクメタテーブル113は、チャンクデータとチャンクグループとを関連付けるための管理テーブルである。チャンクメタテーブル113には、「gno」「gindex」「offset」「size」「hash」の各項目を有するレコードが登録される。各レコードは、1つのチャンクデータに対応付けられている。
なお、図7に示すテーブル115−1は、チャンクデータテーブル115から、グループ番号「1」のチャンクグループに属するチャンクデータに対応するレコードを抽出したものである。同様に、図7に示すテーブル115−2は、チャンクデータテーブル115から、グループ番号「2」のチャンクグループに属するチャンクデータに対応するレコードを抽出したものである。また、図7に示すテーブル115−3は、チャンクデータテーブル115から、グループ番号「3」のチャンクグループに属するチャンクデータに対応するレコードを抽出したものである。
次に、階層型ブルームフィルタ117および二分木検索データ118を用いたチャンクデータの検索処理について説明する。まず、図9、図10を用いて、階層型ブルームフィルタ117を用いたチャンクデータの検索処理について説明する。
第3階層のブルームフィルタには、検索対象となるデータ群がそれぞれ割り当てられる。例えば、ブルームフィルタBF3−1−1,BF3−1−2,・・・,BF3−1−dには、それぞれデータ群DG1−1,DG1−2,・・・,DG1−dが、検索対象として割り当てられる。ブルームフィルタBF3−2−1,BF3−2−2,・・・,BF3−2−dには、それぞれデータ群DG2−1,DG2−2,・・・,DG2−dが、検索対象として割り当てられる。ブルームフィルタBF3−d−1,BF3−d−2,・・・,BF3−d−dには、それぞれデータ群DGd−1,DGd−2,・・・,DGd−dが、検索対象として割り当てられる。これらのデータ群は、最大で20個のチャンクグループに属するチャンクデータを含む。
二分木検索データ118は、データ群DG1−1,DG1−2,・・・,DG1−d,DG2−1,DG2−2,・・・,DG2−d,・・・,DGd−1,DGd−2,・・・,DGd−dにそれぞれ対応する木構造データBT1−1,BT1−2,・・・,BT1−d,BT2−1,BT2−2,・・・,BT2−d,・・・,BTd−1,BTd−2,・・・,BTd−dを含む。
階層型ブルームフィルタ117の各ブルームフィルタのビット数は、検索対象の要素数(すなわち、チャンクデータ数)に応じて決まる。検索対象の要素数が多くなるほど、各ブルームフィルタのビット数も多くなるので、階層型ブルームフィルタ117を構成するデータが記憶部110において占有する記憶領域も大きくなる。例えば、第1階層のブルームフィルタBF1を構成するデータ量は、各ビットの情報を4KBのデータで管理した場合、330MB程度になる場合がある。この場合、3階層の階層型ブルームフィルタ117は、約1GBという大きな記憶領域を占有する。
図12に示す記憶領域115a,115b,・・・は、チャンクグループごとのチャンクデータの記憶領域を示す。これらの記憶領域115a,115b,・・・は、チャンクデータテーブル115に含まれるチャンクグループごとのレコード群に対応する。記憶領域115a,115b,・・・においては、破線で区切られた1つの領域が、1つのチャンクデータの記憶領域を示す。1つのデータ群(ここでは「データ群DG」とする)には最大20のチャンクグループが属するので、データ群DGには、上記のような記憶領域が最大20個含まれる。
図15は、ビット数が削減されたブルームフィルタを用いた検索処理の例を示す図である。この図15では、図14のような手順でブルームフィルタBF1,BF2−1,BF3−1−1のビット数が削減された状態において、チャンクデータCDの検索が要求された場合について示す。
図16は、ファイル書き込み処理の例を示すフローチャートである。NASサービス処理部121は、NASクライアント210から新規のファイルの書き込み要求を受信すると、図16の処理を実行する。
[ステップS31]NASサービス処理部121は、チャンクデータテーブル115を参照し、最後尾のレコードに登録されたグループ番号(すなわち、現時点で最大のグループ番号)を取得する。
[ステップS34]NASサービス処理部121は、チャンクマップテーブル112、チャンクメタテーブル113および参照カウンタテーブル114に対してレコードを追加する。
[ステップS63]フィルタ記憶域削減処理部124は、ステップS62のガベージコレクションによって有効なチャンクデータがなくなったチャンクグループがある場合、このチャンクグループをクラウド転送処理部125による転送対象に設定する。例えば、このチャンクグループを示すグループ番号が図示しない転送キューに登録されることで、このチャンクグループが転送対象に設定される。
なお、上記の各実施の形態に示した装置(データ処理装置1、クラウドストレージゲートウェイ100)の処理機能は、コンピュータによって実現することができる。その場合、各装置が有すべき機能の処理内容を記述したプログラムが提供され、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、CD(Compact Disc)、DVD(Digital Versatile Disc)、ブルーレイディスク(BD)などがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。
(付記1) 複数のデータ要素を含むデータ集合と、前記データ集合における検索対象のデータ要素の存否判定に用いられ、前記複数のデータ要素のそれぞれを用いた所定の演算に基づく特定のビットが特定の値に設定された第1のブルームフィルタと、を記憶する記憶部と、
前記データ集合に含まれる一部のデータ要素を削除する場合、前記第1のブルームフィルタの上位側から、削除されるデータ要素の数に応じたビット数を有する第1のビット列を削除し、
検索対象の第1のデータ要素が入力されると、前記第1のブルームフィルタから前記第1のビット列が削除された第2のブルームフィルタの上位側に、前記第1のビット列と同じビット数を有し、かつ、すべてのビット値が前記特定の値に設定された第2のビット列を一時的に付加し、前記第2のビット列が付加された前記第2のブルームフィルタを用いて、前記一部のデータ要素が削除された前記データ集合における前記第1のデータ要素の存否を判定する、演算部と、
を有するデータ処理装置。
付記1に記載のデータ処理装置。
前記演算部は、さらに、
前記データ集合に含まれる前記一部のデータ要素を削除する場合、前記第1階層ブルームフィルタの上位側から前記第1のビット列と同じビット数を有する第3のビット列を削除し、
前記第1のデータ要素が入力されると、前記第1階層ブルームフィルタの上位側から前記第3のビット列が削除された第3のブルームフィルタの上位側に、前記第2のビット列と同一の第4のビット列を一時的に付加し、前記第4のビット列が付加された前記第3のブルームフィルタを用いて、前記一部のデータ要素が削除された前記第1のデータ集合における前記第1のデータ要素の存否を判定する、
付記1または2に記載のデータ処理装置。
前記演算部は、さらに、
外部装置から書き込みが要求された複数の書き込みデータ要素を、重複を排除して前記書き込みデータ記憶領域に格納するとともに、少なくとも前記複数のデータ要素のそれぞれと、前記複数の書き込みデータ要素との対応関係を示す情報を、前記記憶部に記録し、
前記複数のデータ要素のそれぞれについて、前記複数の書き込みデータ要素のうちのいくつと対応するかを示す第1のカウント値を、前記記憶部に記録し、
前記複数の書き込みデータ要素の1つであって、前記複数のデータ要素のうち一のデータ要素に対応する一の書き込みデータ要素についての更新または削除が前記外部装置から要求されると、前記一のデータ要素に対応する前記第1のカウント値を減少させ、
前記複数のデータ要素のうち、前記第1のカウント値が0であるデータ要素の数を示す第2のカウント値を、前記記憶部に記録し、
前記第2のカウント値が所定の閾値を超えた場合に、前記複数のデータ要素の中から、前記一部のデータ要素として前記第1のカウント値が0であるデータ要素を削除する、
付記1乃至3のいずれか1つに記載のデータ処理装置。
付記4に記載のデータ処理装置。
付記4または5に記載のデータ処理装置。
記憶部に記憶された、複数のデータ要素を含むデータ集合から、一部のデータ要素を削除する場合、前記データ集合における検索対象のデータ要素の存否判定に用いられ、前記複数のデータ要素のそれぞれを用いた所定の演算に基づく特定のビットが特定の値に設定された第1のブルームフィルタの上位側から、削除されるデータ要素の数に応じたビット数を有する第1のビット列を削除し、
検索対象の第1のデータ要素が入力されると、前記第1のブルームフィルタから前記第1のビット列が削除された第2のブルームフィルタの上位側に、前記第1のビット列と同じビット数を有し、かつ、すべてのビット値が前記特定の値に設定された第2のビット列を一時的に付加し、前記第2のビット列が付加された前記第2のブルームフィルタを用いて、前記一部のデータ要素が削除された前記データ集合における前記第1のデータ要素の存否を判定する、
処理を実行させるデータ処理プログラム。
付記7に記載のデータ処理プログラム。
前記コンピュータに、
前記データ集合に含まれる前記一部のデータ要素を削除する場合、前記第1階層ブルームフィルタの上位側から前記第1のビット列と同じビット数を有する第3のビット列を削除し、
前記第1のデータ要素が入力されると、前記第1階層ブルームフィルタの上位側から前記第3のビット列が削除された第3のブルームフィルタの上位側に、前記第2のビット列と同一の第4のビット列を一時的に付加し、前記第4のビット列が付加された前記第3のブルームフィルタを用いて、前記一部のデータ要素が削除された前記第1のデータ集合における前記第1のデータ要素の存否を判定する、
処理をさらに実行させる、
付記7または8に記載のデータ処理プログラム。
前記コンピュータに、
外部装置から書き込みが要求された複数の書き込みデータ要素を、重複を排除して前記書き込みデータ記憶領域に格納するとともに、少なくとも前記複数のデータ要素のそれぞれと、前記複数の書き込みデータ要素との対応関係を示す情報を、前記記憶部に記録し、
前記複数のデータ要素のそれぞれについて、前記複数の書き込みデータ要素のうちのいくつと対応するかを示す第1のカウント値を、前記記憶部に記録し、
前記複数の書き込みデータ要素の1つであって、前記複数のデータ要素のうち一のデータ要素に対応する一の書き込みデータ要素についての更新または削除が前記外部装置から要求されると、前記一のデータ要素に対応する前記第1のカウント値を減少させ、
前記複数のデータ要素のうち、前記第1のカウント値が0であるデータ要素の数を示す第2のカウント値を、前記記憶部に記録し、
前記第2のカウント値が所定の閾値を超えた場合に、前記複数のデータ要素の中から、前記一部のデータ要素として前記第1のカウント値が0であるデータ要素を削除する、
処理をさらに実行させる、
付記7乃至9のいずれか1つに記載のデータ処理プログラム。
付記10に記載のデータ処理プログラム。
1a 記憶部
1b 演算部
2 データ集合
3 ブルームフィルタ
3a,3b ビット列
E1,E2,E11,E12,E13,Ei,ES データ要素
S1〜S5 ステップ
Claims (7)
- 複数のデータ要素を含むデータ集合と、前記データ集合における検索対象のデータ要素の存否判定に用いられ、前記複数のデータ要素のそれぞれを用いた所定の演算に基づく特定のビットが特定の値に設定された第1のブルームフィルタと、を記憶する記憶部と、
前記データ集合に含まれる一部のデータ要素を削除する場合、前記第1のブルームフィルタの上位側から、削除されるデータ要素の数に応じたビット数を有する第1のビット列を削除し、
検索対象の第1のデータ要素が入力されると、前記第1のブルームフィルタから前記第1のビット列が削除された第2のブルームフィルタの上位側に、前記第1のビット列と同じビット数を有し、かつ、すべてのビット値が前記特定の値に設定された第2のビット列を一時的に付加し、前記第2のビット列が付加された前記第2のブルームフィルタを用いて、前記一部のデータ要素が削除された前記データ集合における前記第1のデータ要素の存否を判定する、演算部と、
を有するデータ処理装置。 - 前記第1のビット列は、前記データ集合に含まれるデータ要素の数に対する、前記削除されるデータ要素の数の割合に応じたビット数を有する、
請求項1に記載のデータ処理装置。 - 前記記憶部は、第1のデータ集合における検索対象のデータ要素の存否判定に用いられる第1階層ブルームフィルタと、前記第1のデータ集合が分割された複数の第2のデータ集合のそれぞれにおける検索対象のデータ要素の存否判定に用いられる複数の第2階層ブルームフィルタと、を記憶し、前記第1のブルームフィルタは、前記複数の第2階層ブルームフィルタのうち一の第2階層ブルームフィルタであり、前記データ集合は、前記複数の第2のデータ集合のうち前記一の第2階層ブルームフィルタに対応する一の第2のデータ集合であり、
前記演算部は、さらに、
前記データ集合に含まれる前記一部のデータ要素を削除する場合、前記第1階層ブルームフィルタの上位側から前記第1のビット列と同じビット数を有する第3のビット列を削除し、
前記第1のデータ要素が入力されると、前記第1階層ブルームフィルタの上位側から前記第3のビット列が削除された第3のブルームフィルタの上位側に、前記第2のビット列と同一の第4のビット列を一時的に付加し、前記第4のビット列が付加された前記第3のブルームフィルタを用いて、前記一部のデータ要素が削除された前記第1のデータ集合における前記第1のデータ要素の存否を判定する、
請求項1または2に記載のデータ処理装置。 - 前記記憶部は、前記データ集合の記憶領域を含む書き込みデータ記憶領域を有し、
前記演算部は、さらに、
外部装置から書き込みが要求された複数の書き込みデータ要素を、重複を排除して前記書き込みデータ記憶領域に格納するとともに、少なくとも前記複数のデータ要素のそれぞれと、前記複数の書き込みデータ要素との対応関係を示す情報を、前記記憶部に記録し、
前記複数のデータ要素のそれぞれについて、前記複数の書き込みデータ要素のうちのいくつと対応するかを示す第1のカウント値を、前記記憶部に記録し、
前記複数の書き込みデータ要素の1つであって、前記複数のデータ要素のうち一のデータ要素に対応する一の書き込みデータ要素についての更新または削除が前記外部装置から要求されると、前記一のデータ要素に対応する前記第1のカウント値を減少させ、
前記複数のデータ要素のうち、前記第1のカウント値が0であるデータ要素の数を示す第2のカウント値を、前記記憶部に記録し、
前記第2のカウント値が所定の閾値を超えた場合に、前記複数のデータ要素の中から、前記一部のデータ要素として前記第1のカウント値が0であるデータ要素を削除する、
請求項1乃至3のいずれか1項に記載のデータ処理装置。 - 前記第1のデータ要素の存否判定は、前記複数の書き込みデータ要素の1つとして前記第1のデータ要素の書き込みが要求されたとき、前記第1のデータ要素と同一のデータ要素が前記データ集合に存在するかを判定するために実行される、
請求項4に記載のデータ処理装置。 - 前記複数の書き込みデータ要素のそれぞれは、前記外部装置から書き込みが要求されたファイルに含まれる部分データである、
請求項4または5に記載のデータ処理装置。 - コンピュータに、
記憶部に記憶された、複数のデータ要素を含むデータ集合から、一部のデータ要素を削除する場合、前記データ集合における検索対象のデータ要素の存否判定に用いられ、前記複数のデータ要素のそれぞれを用いた所定の演算に基づく特定のビットが特定の値に設定された第1のブルームフィルタの上位側から、削除されるデータ要素の数に応じたビット数を有する第1のビット列を削除し、
検索対象の第1のデータ要素が入力されると、前記第1のブルームフィルタから前記第1のビット列が削除された第2のブルームフィルタの上位側に、前記第1のビット列と同じビット数を有し、かつ、すべてのビット値が前記特定の値に設定された第2のビット列を一時的に付加し、前記第2のビット列が付加された前記第2のブルームフィルタを用いて、前記一部のデータ要素が削除された前記データ集合における前記第1のデータ要素の存否を判定する、
処理を実行させるデータ処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017223761A JP6916442B2 (ja) | 2017-11-21 | 2017-11-21 | データ処理装置およびデータ処理プログラム |
EP18203351.4A EP3495964B1 (en) | 2017-11-21 | 2018-10-30 | Apparatus and program for data processing |
US16/174,407 US10789228B2 (en) | 2017-11-21 | 2018-10-30 | Data presence/absence determination apparatus and computer-readable storage medium storing program for determination of data presence/absence |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017223761A JP6916442B2 (ja) | 2017-11-21 | 2017-11-21 | データ処理装置およびデータ処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019095986A JP2019095986A (ja) | 2019-06-20 |
JP6916442B2 true JP6916442B2 (ja) | 2021-08-11 |
Family
ID=64109735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017223761A Active JP6916442B2 (ja) | 2017-11-21 | 2017-11-21 | データ処理装置およびデータ処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10789228B2 (ja) |
EP (1) | EP3495964B1 (ja) |
JP (1) | JP6916442B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7107877B2 (ja) * | 2019-03-22 | 2022-07-27 | 株式会社日立製作所 | ストレージシステム、及び、記憶コスト適正化方法 |
JP2021043542A (ja) * | 2019-09-06 | 2021-03-18 | 日本電気株式会社 | データ管理システム及びデータ管理方法 |
JP7295422B2 (ja) * | 2019-09-10 | 2023-06-21 | 富士通株式会社 | 情報処理装置および情報処理プログラム |
JP7323801B2 (ja) | 2019-11-06 | 2023-08-09 | 富士通株式会社 | 情報処理装置および情報処理プログラム |
JP7323804B2 (ja) | 2019-12-10 | 2023-08-09 | 富士通株式会社 | データ処理装置およびデータ処理プログラム |
US11341108B2 (en) * | 2020-10-20 | 2022-05-24 | Dell Products L.P. | System and method for data deduplication in a smart data accelerator interface device |
US20230221864A1 (en) * | 2022-01-10 | 2023-07-13 | Vmware, Inc. | Efficient inline block-level deduplication using a bloom filter and a small in-memory deduplication hash table |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7602785B2 (en) * | 2004-02-09 | 2009-10-13 | Washington University | Method and system for performing longest prefix matching for network address lookup using bloom filters |
JP2006106810A (ja) | 2004-09-30 | 2006-04-20 | Canon Inc | ファイル管理装置、ファイル管理方法、記録媒体及びプログラム |
US8290972B1 (en) * | 2009-04-29 | 2012-10-16 | Netapp, Inc. | System and method for storing and accessing data using a plurality of probabilistic data structures |
JP5664467B2 (ja) | 2011-06-13 | 2015-02-04 | 富士通株式会社 | 検索プログラム、検索方法、検索装置、およびノード |
US20130173853A1 (en) * | 2011-09-26 | 2013-07-04 | Nec Laboratories America, Inc. | Memory-efficient caching methods and systems |
JP5821744B2 (ja) | 2012-03-28 | 2015-11-24 | 富士通株式会社 | データ有無判定装置、データ有無判定方法及びデータ有無判定プログラム |
WO2014132136A2 (en) * | 2013-02-27 | 2014-09-04 | Marvell World Trade Ltd. | Efficient longest prefix matching techniques for network devices |
JP6089890B2 (ja) | 2013-03-29 | 2017-03-08 | 富士通株式会社 | ストレージ制御装置、ストレージ制御装置の制御方法およびストレージ制御装置の制御プログラム |
CA2876466C (en) * | 2014-12-29 | 2022-07-05 | Ibm Canada Limited - Ibm Canada Limitee | Scan optimization using bloom filter synopsis |
-
2017
- 2017-11-21 JP JP2017223761A patent/JP6916442B2/ja active Active
-
2018
- 2018-10-30 US US16/174,407 patent/US10789228B2/en active Active
- 2018-10-30 EP EP18203351.4A patent/EP3495964B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3495964A1 (en) | 2019-06-12 |
JP2019095986A (ja) | 2019-06-20 |
EP3495964B1 (en) | 2021-06-09 |
US20190155927A1 (en) | 2019-05-23 |
US10789228B2 (en) | 2020-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6916442B2 (ja) | データ処理装置およびデータ処理プログラム | |
US10761758B2 (en) | Data aware deduplication object storage (DADOS) | |
JP6304406B2 (ja) | ストレージ装置、プログラム、情報処理方法 | |
JP5445682B2 (ja) | ストレージシステム | |
JP5878548B2 (ja) | 重複排除ストレージ・システム、その内部の合成バックアップを容易にする方法、及び、プログラム | |
US9043540B2 (en) | Systems and methods for tracking block ownership | |
Carstoiu et al. | Hadoop hbase-0.20. 2 performance evaluation | |
JP7323804B2 (ja) | データ処理装置およびデータ処理プログラム | |
JP2006293981A (ja) | データベース格納方法、および、データベース格納システム | |
CN104054071A (zh) | 访问存储设备的方法和存储设备 | |
US10229127B1 (en) | Method and system for locality based cache flushing for file system namespace in a deduplicating storage system | |
CN113535670A (zh) | 一种虚拟化资源镜像存储***及其实现方法 | |
US8375071B2 (en) | File management information storage apparatus and method and program for controlling the same | |
JP7007565B2 (ja) | 情報処理装置および情報処理プログラム | |
JP6006740B2 (ja) | インデックス管理装置 | |
JP2014130492A (ja) | インデックスの生成方法及び計算機システム | |
JP2021043642A (ja) | 情報処理装置および情報処理プログラム | |
JPWO2012081165A1 (ja) | データベース管理装置及びデータベース管理方法 | |
WO2022121274A1 (zh) | 一种存储***中元数据管理方法、装置及存储*** | |
JP7323801B2 (ja) | 情報処理装置および情報処理プログラム | |
JP4825504B2 (ja) | データ登録・検索システムおよびデータ登録・検索方法 | |
JP5729173B2 (ja) | 制御装置、制御方法およびストレージ装置 | |
Mishra | A survey of LSM-Tree based Indexes, Data Systems and KV-stores | |
JP2022074654A (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP2023150248A (ja) | ストレージ制御プログラム、ストレージ制御方法およびストレージ制御装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200807 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20200825 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20200825 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210528 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210615 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210628 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6916442 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |