JP2017512344A - 迅速なデータ解析のためのシステム及び方法 - Google Patents
迅速なデータ解析のためのシステム及び方法 Download PDFInfo
- Publication number
- JP2017512344A JP2017512344A JP2016554870A JP2016554870A JP2017512344A JP 2017512344 A JP2017512344 A JP 2017512344A JP 2016554870 A JP2016554870 A JP 2016554870A JP 2016554870 A JP2016554870 A JP 2016554870A JP 2017512344 A JP2017512344 A JP 2017512344A
- Authority
- JP
- Japan
- Prior art keywords
- data
- query
- collecting
- pieces
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000007405 data analysis Methods 0.000 title claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 230000006870 function Effects 0.000 description 49
- 238000005192 partition Methods 0.000 description 18
- 238000005070 sampling Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 238000007781 pre-processing Methods 0.000 description 9
- 238000013507 mapping Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013480 data collection Methods 0.000 description 4
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2425—Iterative querying; Query formulation based on the results of a preceding query
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24542—Plan optimisation
- G06F16/24545—Selectivity estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/278—Data partitioning, e.g. horizontal or vertical partitioning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Software Systems (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Automatic Analysis And Handling Materials Therefor (AREA)
Abstract
Description
本出願は、2014年3月10日に出願され、参照することによりその全体が盛り込まれた米国仮出願第61/950,827号の利益を請求する。
図4に示すように、迅速なデータ解析の方法200が、クエリを読み取るステップS210と、クエリに基づいて第1のデータサンプルを実行するステップS220と、データサンプルからのクエリの中間結果を計算するステップS230と、クエリの中間結果に基づいて第2のデータサンプルを実行するステップS240と、第2のデータサンプルに基づいて最終的なクエリの結果を計算するステップS250とを有する。この方法200は、好適には、上記のシステム100によって実施されるが、追加的又は代替的に、任意の適切なシステムによって実施され得る。
Claims (20)
- 迅速なデータ解析のための方法であって、
クエリを受け取り且つ読み取るステップであって、前記クエリを読み取るステップが、文字列変換器を用いて整数に前記クエリの文字列を変換することを具え、前記クエリを読み取るステップが、さらに、前記クエリに関するデータを含むデータ片の第1のセットを識別することを具える、ステップと、
前記データ片の第1のセットから第1のデータサンプルを収集するステップであって、前記第1のデータサンプルを収集するステップが、前記データ片の第1のセットのそれぞれからデータを収集することを具えており、前記データ片の第1のセットのそれぞれからデータを収集することが、前記データ片の第1のセットのそれぞれの中に含まれるデータのサブセットのみを収集することを具える、ステップと、
前記第1のデータサンプルの解析に基づいてクエリに中間結果を計算するステップと、
前記中間結果に基づいてデータ片の第2のセットを識別するステップと、
前記データ片の第2のセットから第2のデータサンプルを収集するステップであって、前記第2のデータサンプルを収集するステップが、前記データ片の第2のセットのそれぞれからデータを収集することを具えており、前記データ片の第2のセットのそれぞれからデータを収集することが、前記データ片の第2のセットのそれぞれの中に含まれるデータの完全なセットを収集することを具える、ステップと、
前記第2のデータサンプルの解析に基づいて前記クエリに最終結果を計算するステップと、
を具えることを特徴とする方法。 - 請求項1に記載の方法において、
前記データ片の第1のセットから前記第1のデータサンプルを収集するステップが、前記データ片の第1のセットの列のデータセットからデータを収集することを具えることを特徴とする方法。 - 請求項2に記載の方法において、
前記データ片の第1のセットが、時間によって整理された事象データを具えることを特徴とする方法。 - 請求項1に記載の方法において、
前記クエリを受け取り且つ読み取るステップが、さらに、インプリシットデータへの参照を読み取ることを具えることを特徴とする方法。 - 請求項4に記載の方法において、
前記クエリを受け取り且つ読み取るステップが、さらに、順序付け機能及び分類機能のうちの少なくとも一方を選択することを具えることを特徴とする方法。 - 請求項1に記載の方法において、
データ片の第1のセットを識別するステップが、構成データベースを用いて前記データ片の第1のセットのノードの場所を識別することを具えることを特徴とする方法。 - 請求項1に記載の方法において、
文字列変換器を用いて整数に前記クエリの文字列を変換するステップが、プレフィクスマッチングを可能にするフォーマットで記憶された文字列識別器を用いて文字列を変換することを具えることを特徴とする方法。 - 請求項1に記載の方法において、
前記クエリが、少なくとも1の時間範囲及び少なくとも1の事象データソースを有することを特徴とする方法。 - 請求項8に記載の方法において、
前記クエリに前記最終結果を計算するステップが、さらに、抽出データの統計分布の解析に基づいて結果の精度の推定のための信頼帯を計算することを具えることを特徴とする方法。 - 請求項9に記載の方法において、
前記クエリに前記最終結果を計算するステップが、さらに、クエリ結果としてコホートに関連するコホート及び集計データ双方を戻すことを具えることを特徴とする方法。 - 請求項9に記載の方法において、
前記クエリに中間結果を計算するステップが、さらに、抽出データの統計分布の解析に基づいて結果の精度の推定のための信頼帯を計算することを具えることを特徴とする方法。 - 迅速なデータ解析のための方法であって、
クエリを受け取り且つ読み取るステップであって、当該クエリを読み取るステップが、文字列変換器を用いて整数に前記クエリの文字列を変換することを具え、前記クエリを読み取るステップが、さらに、前記クエリに関するデータを含むデータ片の第1のセットを識別することを具える、ステップと、
前記データ片の第1のセットから第1のデータサンプルを収集するステップであって、前記第1のデータサンプルを収集するステップが、前記データ片の第1のセットのそれぞれからデータを収集することを具えており、前記データ片の第1のセットのそれぞれからデータを収集することが、前記データ片の第1のセットのそれぞれの中に含まれるデータのサブセットのみを収集することを具える、ステップと、
前記第1のデータサンプルの解析に基づいて前記クエリに第1の中間結果を計算するステップと、
多くの中間サーチを実行するステップであって、各中間サーチが、
前記第1の中間結果及びさらなる中間結果のうちの少なくとも一方に基づいてデータ片のさらなるセットを識別するステップと、
前記データ片のさらなるセットからさらなるデータサンプルを収集するステップと、
前記さらなるデータサンプルの解析に基づいてさらなる中間結果を計算するステップと、を具える、ステップと、
前記クエリに最終結果を計算するステップと、
を具えることを特徴とする方法。 - 請求項12に記載の方法において、
前記中間サーチの数が、固定数であることを特徴とする方法。 - 請求項12に記載の方法において、
さらに、抽出データの統計分布の解析に基づいて、それぞれのさらなる中間結果について信頼帯を計算するステップを具えることを特徴とする方法。 - 請求項14に記載の方法において、
多くの中間サーチを実行するステップが、さらなる中間結果の信頼帯が信頼閾値を過ぎるまで中間サーチを実行することを具えることを特徴とする方法。 - 請求項15に記載の方法において、
前記信頼閾値が、スピード/精度変数に応じて自動的に設定されることを特徴とする方法。 - 請求項15に記載の方法において、
前記クエリを受け取り且つ読み取るステップが、さらに、クエリツリーの中にSQLタイプのクエリの文字列を解析することを具えることを特徴とする方法。 - 請求項16に記載の方法において、前記スピード/精度変数が、前記クエリの部分として通過されることを特徴とする方法。
- 請求項18に記載の方法において、前記クエリが、少なくとも1の時間範囲及び少なくとも1の事象データソースを有することを特徴とする方法。
- 請求項14に記載の方法において、さらに、前記信頼帯が信頼閾値を下回っていることをユーザに知らせるステップを具えることを特徴とする方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461950827P | 2014-03-10 | 2014-03-10 | |
US61/950,827 | 2014-03-10 | ||
PCT/US2015/019765 WO2015138497A2 (en) | 2014-03-10 | 2015-03-10 | Systems and methods for rapid data analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017512344A true JP2017512344A (ja) | 2017-05-18 |
JP6307169B2 JP6307169B2 (ja) | 2018-04-04 |
Family
ID=54017560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016554870A Active JP6307169B2 (ja) | 2014-03-10 | 2015-03-10 | 迅速なデータ解析のためのシステム及び方法 |
Country Status (5)
Country | Link |
---|---|
US (5) | US9323809B2 (ja) |
EP (1) | EP3117347B1 (ja) |
JP (1) | JP6307169B2 (ja) |
CN (1) | CN106462583B (ja) |
WO (1) | WO2015138497A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230015073A (ko) * | 2021-07-22 | 2023-01-31 | 에스케이텔레콤 주식회사 | 데이터 전처리 장치 및 방법 |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9607045B2 (en) | 2012-07-12 | 2017-03-28 | Microsoft Technology Licensing, Llc | Progressive query computation using streaming architectures |
US8631325B1 (en) | 2013-08-09 | 2014-01-14 | Zoomdata, Inc. | Real-time data visualization of streaming data |
US9659079B2 (en) * | 2014-05-30 | 2017-05-23 | Wal-Mart Stores, Inc. | Shard determination logic for scalable order and inventory management architecture with a sharded transactional database |
US10296507B2 (en) | 2015-02-12 | 2019-05-21 | Interana, Inc. | Methods for enhancing rapid data analysis |
US9251276B1 (en) | 2015-02-27 | 2016-02-02 | Zoomdata, Inc. | Prioritization of retrieval and/or processing of data |
US10331752B2 (en) * | 2015-07-21 | 2019-06-25 | Oath Inc. | Methods and systems for determining query date ranges |
US10268710B2 (en) | 2015-10-07 | 2019-04-23 | Oracle International Corporation | Relational database organization for sharding |
US11442909B2 (en) * | 2015-12-01 | 2022-09-13 | Motorola Solutions, Inc. | Data analytics system |
US10740328B2 (en) | 2016-06-24 | 2020-08-11 | Microsoft Technology Licensing, Llc | Aggregate-query database system and processing |
CN107798021B (zh) * | 2016-09-07 | 2021-04-30 | 北京京东尚科信息技术有限公司 | 数据关联处理方法、***及电子设备 |
US11055273B1 (en) * | 2016-11-04 | 2021-07-06 | Amazon Technologies, Inc. | Software container event monitoring systems |
US9942312B1 (en) | 2016-12-16 | 2018-04-10 | Zoomdata, Inc. | System and method for facilitating load reduction at a landing zone |
US10552435B2 (en) | 2017-03-08 | 2020-02-04 | Microsoft Technology Licensing, Llc | Fast approximate results and slow precise results |
US10776361B2 (en) * | 2017-04-07 | 2020-09-15 | Salesforce.Com, Inc. | Time series database search system |
CN107665228B (zh) * | 2017-05-10 | 2019-12-20 | 平安科技(深圳)有限公司 | 一种关联信息查询方法、终端及设备 |
JP6528807B2 (ja) * | 2017-06-28 | 2019-06-12 | オムロン株式会社 | 制御システム、制御装置、結合方法およびプログラム |
US20190163790A1 (en) * | 2017-11-29 | 2019-05-30 | Intuit Inc. | System and method for generating aggregated statistics over sets of user data while enforcing data governance policy |
CN108280153B (zh) * | 2018-01-08 | 2022-01-07 | 天津科技大学 | 一种碎片化知识智能化聚合方法 |
CN111143393A (zh) * | 2018-11-03 | 2020-05-12 | 广州市明领信息科技有限公司 | 一种大数据的处理*** |
CN109491989B (zh) * | 2018-11-12 | 2021-08-31 | 北京懿医云科技有限公司 | 数据处理方法及装置、电子设备、存储介质 |
CN109471862B (zh) * | 2018-11-12 | 2021-06-11 | 北京懿医云科技有限公司 | 数据处理方法及装置、电子设备、存储介质 |
US11354168B2 (en) * | 2019-01-18 | 2022-06-07 | Salesforce.Com, Inc. | Elastic data partitioning of a database |
US11194773B2 (en) | 2019-09-12 | 2021-12-07 | Oracle International Corporation | Integration of existing databases into a sharding environment |
US11537572B2 (en) | 2020-01-31 | 2022-12-27 | Salesforce.Com, Inc. | Multidimensional partition of data to calculate aggregation at scale |
US11609886B2 (en) | 2020-01-31 | 2023-03-21 | Salesforce.Com, Inc. | Mechanism for stream processing efficiency using probabilistic model to reduce data redundancy |
US11886435B1 (en) * | 2023-01-06 | 2024-01-30 | Snark AI, Inc. | Systems and methods for executing queries on tensor datasets |
CN118132591B (zh) * | 2024-05-07 | 2024-07-02 | 深圳九有数据库有限公司 | 数据库分片键自动识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232804A (ja) * | 1997-01-31 | 1998-09-02 | Informix Software Inc | データベースシステムにおいて集合体照会を遂行するための方法と装置 |
JPH10269248A (ja) * | 1997-01-24 | 1998-10-09 | Hitachi Ltd | データベース処理システムにおけるデータの無作為抽出処理方法及びこれに基づくデータベース処理システム |
JP2005100392A (ja) * | 2003-09-23 | 2005-04-14 | Internatl Business Mach Corp <Ibm> | クエリ処理操作中に補助属性を用いてクエリをリライトするための方法および装置 |
JP2012108635A (ja) * | 2010-11-16 | 2012-06-07 | Nec Corp | 分散メモリデータベースシステム、フロントデータベースサーバ、データ処理方法およびプログラム |
JP2013196565A (ja) * | 2012-03-22 | 2013-09-30 | Toshiba Corp | データベース処理方法、及びデータベース処理装置 |
Family Cites Families (120)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5335345A (en) | 1990-04-11 | 1994-08-02 | Bell Communications Research, Inc. | Dynamic query optimization using partial information |
WO1996032685A1 (en) | 1995-04-11 | 1996-10-17 | Kinetech, Inc. | Identifying data in a data processing system |
US5668987A (en) * | 1995-08-31 | 1997-09-16 | Sybase, Inc. | Database system with subquery optimizer |
JP3144470B2 (ja) | 1996-07-08 | 2001-03-12 | 矢崎総業株式会社 | 衝撃検出装置、遮断弁制御装置、衝撃検出方法及び遮断弁制御方法 |
US6804663B1 (en) * | 1998-09-21 | 2004-10-12 | Microsoft Corporation | Methods for optimizing the installation of a software product onto a target computer system |
US20030195872A1 (en) * | 1999-04-12 | 2003-10-16 | Paul Senn | Web-based information content analyzer and information dimension dictionary |
US6681331B1 (en) | 1999-05-11 | 2004-01-20 | Cylant, Inc. | Dynamic software system intrusion detection |
US6766320B1 (en) * | 2000-08-24 | 2004-07-20 | Microsoft Corporation | Search engine with natural language-based robust parsing for user query and relevance feedback learning |
US7120624B2 (en) | 2001-05-21 | 2006-10-10 | Microsoft Corporation | Optimization based method for estimating the results of aggregate queries |
US6775681B1 (en) * | 2002-02-26 | 2004-08-10 | Oracle International Corporation | Evaluation of grouping sets by reduction to group-by clause, with or without a rollup operator, using temporary tables |
US7010521B2 (en) * | 2002-05-13 | 2006-03-07 | Netezza Corporation | Optimized database appliance |
US6920460B1 (en) * | 2002-05-29 | 2005-07-19 | Oracle International Corporation | Systems and methods for managing partitioned indexes that are created and maintained by user-defined indexing schemes |
US7213012B2 (en) * | 2003-05-09 | 2007-05-01 | Oracle International Corporation | Optimizer dynamic sampling |
US7043621B2 (en) | 2003-05-16 | 2006-05-09 | Hewlett-Packard Development Company, L.P. | Sharding method and apparatus using directed graphs |
US7250858B2 (en) | 2003-09-05 | 2007-07-31 | Sensitech, Inc. | Automated identification of anomalous conditions in supply chain processes |
CN102982065B (zh) * | 2003-09-15 | 2016-09-21 | 起元科技有限公司 | 数据处理方法、数据处理装置及计算机可读存储介质 |
US20050223019A1 (en) * | 2004-03-31 | 2005-10-06 | Microsoft Corporation | Block-level sampling in statistics estimation |
JP4484643B2 (ja) | 2004-09-10 | 2010-06-16 | 独立行政法人科学技術振興機構 | 時系列データ異常判定用プログラム及び時系列データ異常判別方法 |
US7932906B2 (en) | 2004-09-15 | 2011-04-26 | Hewlett-Packard Development Company, L.P.. | Constructing substantially equal-width pixel bar charts to enable visual data analysis |
US8108579B2 (en) | 2005-03-31 | 2012-01-31 | Qualcomm Incorporated | Mechanism and method for managing data storage |
US7930752B2 (en) | 2005-11-18 | 2011-04-19 | Nexthink S.A. | Method for the detection and visualization of anomalous behaviors in a computer network |
US20070150949A1 (en) | 2005-12-28 | 2007-06-28 | At&T Corp. | Anomaly detection methods for a computer network |
US7650367B2 (en) | 2006-01-13 | 2010-01-19 | Tekelec | Methods, systems, and computer program products for detecting and restoring missing or corrupted data in a distributed, scalable, redundant measurement platform database |
US7593939B2 (en) | 2006-04-07 | 2009-09-22 | Google Inc. | Generating specialized search results in response to patterned queries |
US8239383B2 (en) * | 2006-06-15 | 2012-08-07 | International Business Machines Corporation | System and method for managing execution of queries against database samples |
US7930595B2 (en) | 2006-06-22 | 2011-04-19 | International Business Machines Corporation | Method and apparatus for analyzing error conditions in a massively parallel computer system by identifying anomalous nodes within a communicator set |
US20080091730A1 (en) | 2006-09-29 | 2008-04-17 | Searete Llc, A Limited Liability Corporation Of The State Of Delaware | Computational systems for biomedical data |
US9465823B2 (en) | 2006-10-19 | 2016-10-11 | Oracle International Corporation | System and method for data de-duplication |
US20100138919A1 (en) | 2006-11-03 | 2010-06-03 | Tao Peng | System and process for detecting anomalous network traffic |
US20080109423A1 (en) * | 2006-11-08 | 2008-05-08 | Eric Lawrence Barsness | Apparatus and method for database partition elimination for sampling queries |
US20090271762A1 (en) | 2008-04-29 | 2009-10-29 | Sugarcrm Inc. | Business software application system and method |
JP2010531553A (ja) | 2007-03-30 | 2010-09-24 | ネットクオス・インコーポレーテッド | ネットワーク異常検出のための統計的方法およびシステム |
US9128877B1 (en) | 2007-04-19 | 2015-09-08 | Robert E. Cousins | Systems, methods and computer program products including features of transforming data involving a secure format from which the data is recoverable |
US20090070752A1 (en) | 2007-09-06 | 2009-03-12 | International Business Machines Corporation | Method and system for optimization of an application |
US20080215576A1 (en) | 2008-03-05 | 2008-09-04 | Quantum Intelligence, Inc. | Fusion and visualization for multiple anomaly detection systems |
US8000993B2 (en) | 2008-04-14 | 2011-08-16 | Tra, Inc. | Using consumer purchase behavior for television targeting |
US8484162B2 (en) | 2008-06-24 | 2013-07-09 | Commvault Systems, Inc. | De-duplication systems and methods for application-specific data |
US8140522B2 (en) * | 2008-08-12 | 2012-03-20 | International Business Machines Corporation | Method, apparatus, and computer program product for adaptive query parallelism partitioning with look-ahead probing and feedback |
US8903973B1 (en) | 2008-11-10 | 2014-12-02 | Tanium Inc. | Parallel distributed network management |
US8380738B2 (en) | 2009-03-17 | 2013-02-19 | Nec Laboratories America, Inc. | System and methods for database distribution and querying over key-based scalable storage |
US8510538B1 (en) * | 2009-04-13 | 2013-08-13 | Google Inc. | System and method for limiting the impact of stragglers in large-scale parallel data processing |
US8108343B2 (en) | 2009-04-23 | 2012-01-31 | Microsoft Corporation | De-duplication and completeness in multi-log based replication |
WO2010148415A1 (en) | 2009-06-19 | 2010-12-23 | Blekko, Inc. | Scalable cluster database |
US8918365B2 (en) | 2009-06-19 | 2014-12-23 | Blekko, Inc. | Dedicating disks to reading or writing |
US9866426B2 (en) | 2009-11-17 | 2018-01-09 | Hawk Network Defense, Inc. | Methods and apparatus for analyzing system events |
US9323758B1 (en) | 2009-12-22 | 2016-04-26 | Emc Corporation | Efficient migration of replicated files from a file server having a file de-duplication facility |
US8527496B2 (en) | 2010-02-11 | 2013-09-03 | Facebook, Inc. | Real time content searching in social network |
US8458131B2 (en) | 2010-02-26 | 2013-06-04 | Microsoft Corporation | Opportunistic asynchronous de-duplication in block level backups |
US20120016633A1 (en) | 2010-07-16 | 2012-01-19 | Andreas Wittenstein | System and method for automatic detection of anomalous recurrent behavior |
US9246932B2 (en) | 2010-07-19 | 2016-01-26 | Sitelock, Llc | Selective website vulnerability and infection testing |
US9424351B2 (en) * | 2010-11-22 | 2016-08-23 | Microsoft Technology Licensing, Llc | Hybrid-distribution model for search engine indexes |
US10198492B1 (en) | 2010-12-28 | 2019-02-05 | Amazon Technologies, Inc. | Data replication framework |
US8468132B1 (en) | 2010-12-28 | 2013-06-18 | Amazon Technologies, Inc. | Data replication framework |
US9251097B1 (en) | 2011-03-22 | 2016-02-02 | Amazon Technologies, Inc. | Redundant key management |
US9535765B1 (en) | 2011-03-28 | 2017-01-03 | Google Inc. | Opportunistic job Processing of input data divided into partitions of different sizes |
US9054864B2 (en) | 2011-03-29 | 2015-06-09 | Kaseya Limited | Method and apparatus of securely processing data for file backup, de-duplication, and restoration |
US8856169B2 (en) * | 2011-07-13 | 2014-10-07 | Case Western Reserve University | Multi-modality, multi-resource, information integration environment |
US20140245337A1 (en) * | 2011-07-27 | 2014-08-28 | Google Inc. | Proxy Analytics |
CN103891298B (zh) * | 2011-08-31 | 2018-05-25 | 谷歌有限责任公司 | 用于收集和管理电视收视数据的方法和*** |
US9305043B2 (en) | 2011-09-12 | 2016-04-05 | Hitachi, Ltd. | Stream data anomaly detection method and device |
US9129039B2 (en) | 2011-10-18 | 2015-09-08 | Ut-Battelle, Llc | Scenario driven data modelling: a method for integrating diverse sources of data and data streams |
US8356050B1 (en) | 2011-11-21 | 2013-01-15 | Yahoo! Inc. | Method or system for spilling in query environments |
US8756209B2 (en) | 2012-01-04 | 2014-06-17 | International Business Machines Corporation | Computing resource allocation based on query response analysis in a networked computing environment |
US9239851B1 (en) * | 2012-07-12 | 2016-01-19 | Cross Commerce Media, Inc. | Advanced database systems and methods |
US20130253888A1 (en) | 2012-03-22 | 2013-09-26 | Microsoft Corporation | One-pass statistical computations |
WO2013147785A1 (en) | 2012-03-29 | 2013-10-03 | Hitachi Data Systems Corporation | Highly available search index with storage node addition and removal |
GB2514947B (en) | 2012-05-04 | 2015-06-17 | Box Inc | Repository redundancy implementation of a system which incrementally updates clients with events that occured via a cloud-enabled platform |
US8825752B1 (en) | 2012-05-18 | 2014-09-02 | Netapp, Inc. | Systems and methods for providing intelligent automated support capable of self rejuvenation with respect to storage systems |
US9015812B2 (en) | 2012-05-22 | 2015-04-21 | Hasso-Plattner-Institut Fur Softwaresystemtechnik Gmbh | Transparent control of access invoking real-time analysis of the query history |
US9218573B1 (en) * | 2012-05-22 | 2015-12-22 | Google Inc. | Training a model using parameter server shards |
JP6396294B2 (ja) | 2012-07-05 | 2018-09-26 | リテルヒューズ・インク | 過渡電圧回路保護のためのクローバーデバイス |
US9792320B2 (en) * | 2012-07-06 | 2017-10-17 | Box, Inc. | System and method for performing shard migration to support functions of a cloud-based service |
US9904788B2 (en) | 2012-08-08 | 2018-02-27 | Amazon Technologies, Inc. | Redundant key management |
US20140108421A1 (en) * | 2012-10-04 | 2014-04-17 | Codefutures Corporation | Partitioning database data in a sharded database |
US9104786B2 (en) * | 2012-10-12 | 2015-08-11 | International Business Machines Corporation | Iterative refinement of cohorts using visual exploration and data analytics |
US9146830B2 (en) | 2012-10-26 | 2015-09-29 | Jsmapreduce Corporation | Hybrid local/remote infrastructure for data processing with lightweight setup, powerful debuggability, controllability, integration, and productivity features |
US9633022B2 (en) | 2012-12-28 | 2017-04-25 | Commvault Systems, Inc. | Backup and restoration for a deduplicated file system |
US9633033B2 (en) | 2013-01-11 | 2017-04-25 | Commvault Systems, Inc. | High availability distributed deduplicated storage system |
US20140214886A1 (en) | 2013-01-29 | 2014-07-31 | ParElastic Corporation | Adaptive multi-client saas database |
US10148548B1 (en) | 2013-01-29 | 2018-12-04 | Axway, Inc. | System and method for real-time analysis of incoming data |
US9424330B2 (en) | 2013-03-15 | 2016-08-23 | Tactile, Inc. | Database sharding by shard levels |
US9244952B2 (en) * | 2013-03-17 | 2016-01-26 | Alation, Inc. | Editable and searchable markup pages automatically populated through user query monitoring |
WO2014174599A1 (ja) | 2013-04-24 | 2014-10-30 | 株式会社日立製作所 | 計算機、記録媒体及びデータ検索方法 |
US20140337491A1 (en) | 2013-05-08 | 2014-11-13 | Box, Inc. | Repository redundancy implementation of a system which incrementally updates clients with events that occurred via a cloud-enabled platform |
US9195826B1 (en) | 2013-05-30 | 2015-11-24 | Emc Corporation | Graph-based method to detect malware command-and-control infrastructure |
US9053167B1 (en) | 2013-06-19 | 2015-06-09 | Amazon Technologies, Inc. | Storage device selection for database partition replicas |
US9774401B1 (en) | 2013-07-15 | 2017-09-26 | Paul Borrill | Entangled links, transactions and trees for distributed computing systems |
US10394848B2 (en) | 2013-07-29 | 2019-08-27 | Amazon Technologies, Inc. | Generating a multi-column index for relational databases by interleaving data bits for selectivity |
US20150039749A1 (en) | 2013-08-01 | 2015-02-05 | Alcatel-Lucent Canada Inc. | Detecting traffic anomalies based on application-aware rolling baseline aggregates |
US20150067860A1 (en) | 2013-08-29 | 2015-03-05 | Barracuda Networks, Inc. | Virus Detector Controlled Backup Apparatus and File Restoration |
US9280591B1 (en) | 2013-09-20 | 2016-03-08 | Amazon Technologies, Inc. | Efficient replication of system transactions for read-only nodes of a distributed database |
US10116697B2 (en) | 2013-09-20 | 2018-10-30 | Open Text Sa Ulc | System and method for geofencing |
US10311154B2 (en) | 2013-09-21 | 2019-06-04 | Oracle International Corporation | Combined row and columnar storage for in-memory databases for OLTP and analytics workloads |
US9483509B2 (en) | 2013-10-02 | 2016-11-01 | Google Inc. | Dynamic shuffle reconfiguration |
US9503465B2 (en) | 2013-11-14 | 2016-11-22 | At&T Intellectual Property I, L.P. | Methods and apparatus to identify malicious activity in a network |
US10331695B1 (en) | 2013-11-25 | 2019-06-25 | Amazon Technologies, Inc. | Replication coordination service for data transfers between distributed databases |
US9411862B1 (en) | 2013-12-03 | 2016-08-09 | Google Inc. | Systems and methods for dynamic sharding of hierarchical data |
US10235377B2 (en) | 2013-12-23 | 2019-03-19 | Sap Se | Adaptive dictionary compression/decompression for column-store databases |
US9697274B2 (en) | 2013-12-27 | 2017-07-04 | International Business Machines Corporation | Stratified sampling using adaptive parallel data processing |
US10380072B2 (en) | 2014-03-17 | 2019-08-13 | Commvault Systems, Inc. | Managing deletions from a deduplication database |
US9633056B2 (en) | 2014-03-17 | 2017-04-25 | Commvault Systems, Inc. | Maintaining a deduplication database |
US9667738B2 (en) | 2014-03-24 | 2017-05-30 | Tanium Inc. | Local data caching for data transfers on a network of computational devices |
US10025710B2 (en) | 2014-04-30 | 2018-07-17 | Walmart Apollo, Llc | Pattern for integrating primary and secondary data stores in a sharded data domain |
US9613122B2 (en) | 2014-05-02 | 2017-04-04 | Facebook, Inc. | Providing eventual consistency for multi-shard transactions |
US9672241B2 (en) | 2014-05-28 | 2017-06-06 | International Business Machines Corporation | Representing an outlier value in a non-nullable column as null in metadata |
US10230747B2 (en) | 2014-07-15 | 2019-03-12 | Cisco Technology, Inc. | Explaining network anomalies using decision trees |
US9973520B2 (en) | 2014-07-15 | 2018-05-15 | Cisco Technology, Inc. | Explaining causes of network anomalies |
US9753955B2 (en) | 2014-09-16 | 2017-09-05 | Commvault Systems, Inc. | Fast deduplication data verification |
EP2998881B1 (en) | 2014-09-18 | 2018-07-25 | Amplidata NV | A computer implemented method for dynamic sharding |
US9575673B2 (en) | 2014-10-29 | 2017-02-21 | Commvault Systems, Inc. | Accessing a file system using tiered deduplication |
US9288617B1 (en) | 2014-10-30 | 2016-03-15 | Deep Rock Ventures, Inc. | Mobile media communications system |
US9830342B2 (en) | 2014-11-20 | 2017-11-28 | International Business Machines Corporation | Optimizing database deduplication |
US20160171071A1 (en) | 2014-12-11 | 2016-06-16 | International Business Machines Corporation | Dynamic creation and configuration of partitioned index through analytics based on existing data population |
US20160191508A1 (en) | 2014-12-31 | 2016-06-30 | Nexenta Systems, Inc. | Methods and Systems for Block Sharding of Objects Stored in Distributed Storage System |
EP3091816B1 (en) | 2015-01-06 | 2019-12-25 | Battelle Memorial Institute | Uniform heat distribution in resistive heaters for anti-icing and de-icing |
US10353900B2 (en) | 2015-07-24 | 2019-07-16 | Oracle International Corporation | System and method for creating an intelligent synopsis of a database using re-partitioning based sampling |
US10268710B2 (en) | 2015-10-07 | 2019-04-23 | Oracle International Corporation | Relational database organization for sharding |
US11210279B2 (en) | 2016-04-15 | 2021-12-28 | Apple Inc. | Distributed offline indexing |
US11030169B1 (en) | 2017-03-07 | 2021-06-08 | Amazon Technologies, Inc. | Data re-sharding |
US11550505B1 (en) | 2020-09-01 | 2023-01-10 | Amazon Technologies, Inc. | Intra-shard parallelization of data stream processing using virtual shards |
-
2015
- 2015-03-10 US US14/644,081 patent/US9323809B2/en active Active
- 2015-03-10 WO PCT/US2015/019765 patent/WO2015138497A2/en active Application Filing
- 2015-03-10 EP EP15762364.6A patent/EP3117347B1/en active Active
- 2015-03-10 JP JP2016554870A patent/JP6307169B2/ja active Active
- 2015-03-10 CN CN201580011997.3A patent/CN106462583B/zh active Active
-
2016
- 2016-03-22 US US15/077,800 patent/US9734202B2/en active Active
-
2017
- 2017-07-10 US US15/645,698 patent/US10713240B2/en active Active
-
2020
- 2020-06-08 US US16/895,190 patent/US11372851B2/en active Active
-
2022
- 2022-05-26 US US17/825,402 patent/US11977541B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10269248A (ja) * | 1997-01-24 | 1998-10-09 | Hitachi Ltd | データベース処理システムにおけるデータの無作為抽出処理方法及びこれに基づくデータベース処理システム |
JPH10232804A (ja) * | 1997-01-31 | 1998-09-02 | Informix Software Inc | データベースシステムにおいて集合体照会を遂行するための方法と装置 |
JP2005100392A (ja) * | 2003-09-23 | 2005-04-14 | Internatl Business Mach Corp <Ibm> | クエリ処理操作中に補助属性を用いてクエリをリライトするための方法および装置 |
JP2012108635A (ja) * | 2010-11-16 | 2012-06-07 | Nec Corp | 分散メモリデータベースシステム、フロントデータベースサーバ、データ処理方法およびプログラム |
JP2013196565A (ja) * | 2012-03-22 | 2013-09-30 | Toshiba Corp | データベース処理方法、及びデータベース処理装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230015073A (ko) * | 2021-07-22 | 2023-01-31 | 에스케이텔레콤 주식회사 | 데이터 전처리 장치 및 방법 |
KR102667872B1 (ko) | 2021-07-22 | 2024-05-20 | 에스케이텔레콤 주식회사 | 데이터 전처리 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
CN106462583B (zh) | 2020-03-24 |
WO2015138497A2 (en) | 2015-09-17 |
US20220284017A1 (en) | 2022-09-08 |
EP3117347A4 (en) | 2017-11-29 |
EP3117347B1 (en) | 2020-09-23 |
US9323809B2 (en) | 2016-04-26 |
US10713240B2 (en) | 2020-07-14 |
US20150254307A1 (en) | 2015-09-10 |
US9734202B2 (en) | 2017-08-15 |
US20200311064A1 (en) | 2020-10-01 |
US20160203179A1 (en) | 2016-07-14 |
CN106462583A (zh) | 2017-02-22 |
US20170308570A1 (en) | 2017-10-26 |
WO2015138497A3 (en) | 2015-12-03 |
EP3117347A2 (en) | 2017-01-18 |
JP6307169B2 (ja) | 2018-04-04 |
US11977541B2 (en) | 2024-05-07 |
US11372851B2 (en) | 2022-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6307169B2 (ja) | 迅速なデータ解析のためのシステム及び方法 | |
US5899986A (en) | Methods for collecting query workload based statistics on column groups identified by RDBMS optimizer | |
US10592481B2 (en) | Classifying an unmanaged dataset | |
US9720986B2 (en) | Method and system for integrating data into a database | |
US20090063461A1 (en) | User query mining for advertising matching | |
US20150242407A1 (en) | Discovery of Data Relationships Between Disparate Data Sets | |
US20180139222A1 (en) | Method and device for detecting website attack | |
CN106933893B (zh) | 多维度数据的查询方法及装置 | |
CN103425650B (zh) | 推荐搜索方法和*** | |
CN109308303B (zh) | 一种基于马尔可夫链的多表连接在线聚集方法 | |
GB2498762A (en) | Computing user traffic at the website based on user actions | |
WO2013078478A1 (en) | Improved database query optimization and cost estimation | |
US20110179013A1 (en) | Search Log Online Analytic Processing | |
US9727666B2 (en) | Data store query | |
CN106933902B (zh) | 数据多维度自由剖析的查询方法及装置 | |
CN103605744B (zh) | 网站搜索引擎流量数据的分析方法及装置 | |
US9286350B2 (en) | Estimating most frequent values for a data set | |
CN114022051A (zh) | 一种指标波动分析方法,存储介质和电子设备 | |
CN113792084A (zh) | 数据热度的分析方法、装置、设备及存储介质 | |
CN112131288B (zh) | 数据源接入处理方法和装置 | |
Li et al. | Cost-efficient data acquisition on online data marketplaces for correlation analysis | |
CN106933909B (zh) | 多维度数据的查询方法及装置 | |
CN107133281B (zh) | 一种基于分组的全局多查询优化方法 | |
CN113553477B (zh) | 一种图的拆分方法和装置 | |
US20140181075A1 (en) | Techniques for query statistics inheritance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171010 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180309 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6307169 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |