CN116150179A - 一种数据库间的数据一致性比对方法及装置 - Google Patents
一种数据库间的数据一致性比对方法及装置 Download PDFInfo
- Publication number
- CN116150179A CN116150179A CN202310394989.8A CN202310394989A CN116150179A CN 116150179 A CN116150179 A CN 116150179A CN 202310394989 A CN202310394989 A CN 202310394989A CN 116150179 A CN116150179 A CN 116150179A
- Authority
- CN
- China
- Prior art keywords
- data
- boundary
- data block
- calculating
- comparison
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/273—Asynchronous replication or reconciliation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种数据库间的数据一致性比对方法及装置,涉及数据库中数据一致性比对领域,包括:基于表数据选一个字段为计算数据块边界的条件列,计算条件列的最大值和最小值;根据最小值计算出数据块边界,将最大值标记为下一次的边界查询最小值,重复计算出整个表的数据块边界;配置启动2n个线程,分别分配n个线程负责处理源表数据和目标表数据,和从条件队列获取数据块边界值;查询源表边界值范围内的所有主键值,根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。本申请通过算法将数据分解成多个数据块边界,每个数据块边界可以独立进行数据查询比对,多个数据块边界间可以并行比对从而提升性能,提高比对速度,降低比对难度。
Description
技术领域
本申请涉及数据库中数据一致性比对领域,尤其涉及一种数据库间的数据一致性比对方法。本申请还涉及一种数据库间的数据一致性比对装置。
背景技术
随着大数据的发展,很多业务场景中会涉及到数据同步的操作。
现有技术中,一般需要将主节点数据同步到备节点数据,或者将某一类型数据库表的数据同步到其他类型数据库表中。同步中如果出现数据不一致,通常采用人工方法将差异数据比对出来。
现有技术中存在的缺陷是,采用人工方法很难将差异数据比对出来,特别是异构数据库间本身不互通,更难于操作。
发明内容
本申请的目的在于克服现有技术中人工方法很难将差异数据比对出来的缺陷,提供一种数据库间的数据一致性比对方法。本申请还涉及一种数据库间的数据一致性比对装置。
本申请提供的一种数据库间的数据一致性比对方法,包括:
基于表数据中选取一个字段作为计算数据块边界的条件列,计算出该表所述条件列的最大值和最小值;
根据所述最小值计算出数据块边界,同时将所述最大值标记为下一次的边界查询最小值,重复并计算出整个表的数据块边界;
配置启动2n个线程,分别分配n个线程负责处理源表数据和目标表数据,以及从条件队列获取数据块边界值;
查询所述源表边界值范围内的所有主键值,根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。
可选的,所述条件列有索引。
可选的,所述计算出该表所述条件列的最大值和最小值,包括:
通过【select min(c1),max(c1)from t】计算出该表所述条件列的最大值和最小值;
其中,所述c1表示条件列。
可选的,所述计算出数据块边界,包括:
通过 【select max(c1) from t where c1 >= 边界查询最小值 order by c1limit 1000 】 计算出数据块边界为【max(c1)值-该sql的查询条件列的值】;
其中,所述c1表示条件列。
可选的,所述查询所述源表边界值范围内的所有主键值形式如下:
select 主键列1,...,主键列n from t where 比较列 >= 边界最小值 and 比较列 <= 边界最大值 order by 比较列 desc。
可选的,还包括:查询源表该边界的所有主键值,记录到源表块数据容器中。
可选的,所述记录到源表块数据容器中,包括:
通过配置控制块数据容器的使用大小。
可选的,所述计算相同数据块边界对应的数据中源表与目标表的差异数据:包括:
将相同数据块边界的源表数据块与目标表数据块标记为同一组;
读取标记为同一组的数据进行双向比较,计算出差异主键数据后落地成文件。
可选的,所述落地成文件,包括:
源表存在的主键,如果目标表不存在,将该主键数据记录到文件1中;
目标表存在的主键,如果源表不存在,将该主键数据记录到文件2中。
本申请还提供一种数据库间的数据一致性比对装置,包括:
第一计算模块,基于表数据中选取一个字段作为计算数据块边界的条件列,计算出该表所述条件列的最大值和最小值;
第二计算模块,根据所述最小值计算出数据块边界,同时将所述最大值标记为下一次的边界查询最小值,重复并计算出整个表的数据块边界;
配置查询模块,配置启动2n个线程,分别分配n个线程负责处理源表数据和目标表数据,以及从条件队列获取数据块边界值;
比对模块,查询所述源表边界值范围内的所有主键值,根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。
本申请的优点和有益效果:
本申请提供的一种数据库间的数据一致性比对方法,包括:基于表数据中选取一个字段作为计算数据块边界的条件列,计算出该表所述条件列的最大值和最小值;根据所述最小值计算出数据块边界,同时将所述最大值标记为下一次的边界查询最小值,重复并计算出整个表的数据块边界;配置启动2n个线程,分别分配n个线程负责处理源表数据和目标表数据,以及从条件队列获取数据块边界值;查询所述源表边界值范围内的所有主键值,根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。本申请通过算法快速将数据分解成多个数据块边界,每个数据块边界可以独立进行数据查询比对,多个数据块边界间可以并行比对从而提升性能,提高比对速度,降低比对难度。
附图说明
图1是本申请中数据库间的数据一致性比对流程示意图。
图2是本申请中数据库间的数据一致性比对逻辑示意图。
图3是本申请中数据库间的数据一致性比对装置示意图。
具体实施方式
下面结合附图和具体实施例对本申请作进一步说明,以使本领域的技术人员可以更好地理解本申请并能予以实施。
以下内容均是为了详细说明本申请要保护的技术方案所提供的具体实施过程的示例,但是本申请还可以采用不同于此的描述的其他方式实施,本领域技术人员可以在本申请构思的指引下,采用不同的技术手段实现本申请,因此本申请不受下面具体实施例的限制。
本申请提供的一种数据库间的数据一致性比对方法,包括:基于表数据中选取一个字段作为计算数据块边界的条件列,计算出该表所述条件列的最大值和最小值;根据所述最小值计算出数据块边界,同时将所述最大值标记为下一次的边界查询最小值,重复并计算出整个表的数据块边界;配置启动2n个线程,分别分配n个线程负责处理源表数据和目标表数据,以及从条件队列获取数据块边界值;查询所述源表边界值范围内的所有主键值,根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。本申请通过算法快速将数据分解成多个数据块边界,每个数据块边界可以独立进行数据查询比对,多个数据块边界间可以并行比对从而提升性能,提高比对速度,降低比对难度。
请参照图1所示,本申请目的是解决传统数据比对方式慢的问题。通过算法快速将数据分解成多个数据块边界,每个数据块(chunk)边界可以独立进行数据查询比对,多个数据块边界间可以并行比对从而提升性能。比对过程中仅进行主键比对,且进行双向比对。
对于源表存在的主键,如果目标表不存在,将该主键数据记录到文件1中。
对于目标表存在的主键,如果源表不存在,将该主键数据记录到文件2中。
本申请涉及的技术方案中不要求切分数据块边界的条件必须为主键,所以即使存在联合主键的情况下也不影响使用及效率,同时在综合考虑内存,cpu的资源占用基础上,通过合理配置实现了比对任务的最优性能。
如图1所示,S101基于表数据中选取一个字段作为计算数据块边界的条件列,计算出该表所述条件列的最大值和最小值。
计算表的数据块边界,所述表包括:源表和目标表。
本申请中,计算表的数据块边界是最重要的一步,通过快速计算边界后才能通过多线程并行查询数据块边界的数据进行比较提升性能。
具体的,首先需要选取一个字段作为计算数据块边界的条件列,一般该列要求有索引,且数据尽可能不重复。在本申请中,该条件列记为c1。
通过【select min(c1),max(c1)from t】计算出该表所述条件列的最大值最小值。其中min(c1)记为初始化的边界查询最小值。
如图1所示,S102根据所述最小值计算出数据块边界,同时将所述最大值标记为下一次的边界查询最小值,重复并计算出整个表的数据块边界。
通过 【select max(c1) from t where c1 >= 边界查询最小值 order by c1limit 1000 】 计算出数据块边界为【max(c1)值-该sql的查询条件列的值】,同时标记max(c1)值为下一次的边界查询最小值。
最后,重复并计算出整个表的数据块边界。
一个具体的例子说明以上步骤计算后的结果如下:
假设t表有c1,c2,c3列,共1000条数据,为了方便演示,假设c1列数据内容为data1-data1000共计1000条,计算边界时limit条件为100,经过上述规则计算后拆分的数据块记录如下:
数据块 Range | 数据块 ID |
data1-data100 | 1 |
data100-data200 | 2 |
... ... | ... ... |
data800-data900 | 9 |
data900-data1000 | 10 |
计算获取如上结构的数据块边界并放入条件队列,供后续步骤处理。
如图1所示,S103配置启动2n个线程,分别分配n个线程负责处理源表数据和目标表数据,以及从条件队列获取数据块边界值。
该步骤为多线程,每个线程负责从条件队列获取数据块边界后,从表中读取需要比较的主键数据,并存入内存,用于后续比较。
上文说过数据块边界为条件列,并不强制要求条件列必须为主键,因为主键理论上可能为联合主键,如果多列作为条件列会加大计算边界的难度并影响性能。其基本算法过程如下:
如图2所示,S201边界查询线程。
S202准备已确定的源表条件列和目标条件列。
S203通过配置启动2n个线程,针对源表n个线程负责处理源表数据,n个线程负责处理目标表数据。
S204针对源表的每个线程负责从条件队列获取数据块边界值,然后查询源表该边界的所有主键值,记录到源表块数据容器中。其sql如下形式:
select 主键列1,...,主键列n from t where 比较列 >= 边界最小值 and 比较列 <= 边界最大值 order by 比较列 desc。
针对目标表的每个线程负责从条件队列获取数据块边界值,然后查询目标表该边界的所有主键值,记录到目标表块数据容器中。其sql如下形式:
select 主键列1,...,主键列n from t where 比较列 >= 边界最小值 and 比较列 <= 边界最大值 order by 比较列 desc。
超过指定大小后,向块数据容器中放入数据时会被阻塞,只有数据被后续线程比较处理销毁后被阻塞的数据才能放进去。为了控制内存的使用,通过配置可以控制块数据容器的使用大小。
如图1所示,S104查询所述源表边界值范围内的所有主键值,根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。
根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。
请继续参考图2所示,S205相同数据块边界的源表数据块与目标表数据块会被标记为同一组,该线程负责获取已经读取完成的被标记为同一组的数据进行双向比较。
S206计算出差异主键数据后落地成文件,该组数据被比对完成后销毁数据块,释放空间。
最后,差异数据落地生成文件。
对于比较结果,按如下规则落地文件:
对于源表存在的主键,如果目标表不存在,将该主键数据记录到文件1中。
对于目标表存在的主键,如果源表不存在,将该主键数据记录到文件2中。
如图3所示,本申请还提供一种数据库间的数据一致性比对装置,该装置用于执行上述方法。
第一计算模块301,基于表数据中选取一个字段作为计算数据块边界的条件列,计算出该表所述条件列的最大值和最小值。
计算表的数据块边界,所述表包括:源表和目标表。
本申请中,计算表的数据块边界是最重要的一步,通过快速计算边界后才能通过多线程并行查询数据块边界的数据进行比较提升性能。
具体的,选取一个字段作为计算数据块边界的条件列,一般该列要求有索引,且数据尽可能不重复。在本申请中,该条件列记为c1。
通过【select min(c1),max(c1)from t】计算出该表所述条件列的最大值最小值。其中min(c1)记为初始化的边界查询最小值。
第二计算模块302,根据所述最小值计算出数据块边界,同时将所述最大值标记为下一次的边界查询最小值,重复并计算出整个表的数据块边界。
通过 【select max(c1) from t where c1 >= 边界查询最小值 order by limit1000 】 计算出数据块边界为【max(c1)值-该sql的查询条件列的值】,同时标记max(c1)值为下一次的边界查询最小值。
最后,重复并计算出整个表的数据块边界。
配置查询模块303,配置启动2n个线程,分别分配n个线程负责处理源表数据和目标表数据,以及从条件队列获取数据块边界值。
该步骤为多线程,每个线程负责从条件队列获取数据块边界后,从表中读取需要比较的主键数据,并存入内存,用于后续比较。
上文所述条件列,并不强制要求条件列必须为主键,因为主键理论上可能为联合主键,如果多列作为条件列会加大计算边界的难度并影响性能。其基本算法如下:
通过配置启动2n个线程,针对源表n个线程负责处理源表数据,n个线程负责处理目标表数据
针对源表的每个线程负责从条件队列获取数据块边界值,然后查询源表该边界的所有主键值,记录到源表块数据容器中。其sql如下形式:
select 主键列1,...,主键列n from t where 比较列 >= 边界最小值 and 比较列 <= 边界最大值 order by 比较列 desc。
针对目标表的每个线程负责从条件队列获取数据块边界值,然后查询目标表该边界的所有主键值,记录到目标表块数据容器中。其sql如下形式:
select 主键列1,...,主键列n from t where 比较列 >= 边界最小值 and 比较列 <= 边界最大值 order by 比较列 desc。
超高指定大小后,向块数据容器中放入数据时会被阻塞,只用块数被后续线程比较处理被销毁后被阻塞的数据才能放进去。为了控制内存的使用,通过配置可以控制块数据容器的使用大小。
比对模块304,查询所述源表边界值范围内的所有主键值,根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。
根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。
具体的,相同数据块边界的源表数据块与目标表数据块会被标记为同一组,该线程负责获取已经读取完成的被标记为同一组的数据进行双向比较,计算出差异主键数据后落地成文件,该组数据被比对完成后销毁数据块,释放空间。
最后,差异数据落地生成文件。
对于比较结果,按如下规则落地文件:
对于源表存在的主键,如果目标表不存在,将该主键数据记录到文件1中。
对于目标表存在的主键,如果源表不存在,将该主键数据记录到文件2中。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种数据库间的数据一致性比对方法,其特征在于,包括:
基于表数据中选取一个字段作为计算数据块边界的条件列,计算出该表所述条件列的最大值和最小值;
根据所述最小值计算出数据块边界,同时将所述最大值标记为下一次的边界查询最小值,重复并计算出整个表的数据块边界;
配置启动2n个线程,分别分配n个线程负责处理源表数据和目标表数据,以及从条件队列获取数据块边界值;
查询所述源表边界值范围内的所有主键值,根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。
2.根据权利要求1所述数据库间的数据一致性比对方法,其特征在于,所述条件列有索引。
3.根据权利要求1所述数据库间的数据一致性比对方法,其特征在于,所述计算出该表所述条件列的最大值和最小值,包括:
通过【select min(c1),max(c1)from t】计算出该表所述条件列的最大值和最小值;
其中,所述c1表示条件列,所述min(c1)记为初始化的边界查询最小值,max(c1)为下一次的边界查询最小值。
4.根据权利要求3所述数据库间的数据一致性比对方法,其特征在于,所述计算出数据块边界,包括:
通过 【select max(c1) from t where c1 >= 边界查询最小值 order by c1 limit1000 】 计算出数据块边界为【max(c1)值-sql的查询条件列的值】,max(c1)为下一次的边界查询最小值;
其中,所述c1表示条件列。
5.根据权利要求1所述数据库间的数据一致性比对方法,其特征在于,所述查询所述源表边界值范围内的所有主键值形式如下:
select 主键列1,...,主键列n from t where 比较列 >= 边界最小值 and 比较列 <= 边界最大值 order by 比较列 desc。
6.根据权利要求1所述数据库间的数据一致性比对方法,其特征在于,还包括:查询源表该边界的所有主键值,记录到源表块数据容器中。
7.根据权利要求6所述数据库间的数据一致性比对方法,其特征在于,所述记录到源表块数据容器中,包括:
通过配置控制块数据容器的使用大小。
8.根据权利要求1~7任一所述数据库间的数据一致性比对方法,其特征在于,所述计算相同数据块边界对应的数据中源表与目标表的差异数据:包括:
将相同数据块边界的源表数据块与目标表数据块标记为同一组;
读取标记为同一组的数据进行双向比较,计算出差异主键数据后落地成文件。
9.根据权利要求8所述数据库间的数据一致性比对方法,其特征在于,所述落地成文件,包括:
源表存在的主键,如果目标表不存在,将该主键数据记录到文件1中;
目标表存在的主键,如果源表不存在,将该主键数据记录到文件2中。
10.一种数据库间的数据一致性比对装置,其特征在于,包括:
第一计算模块,基于表数据中选取一个字段作为计算数据块边界的条件列,计算出该表所述条件列的最大值和最小值;
第二计算模块,根据所述最小值计算出数据块边界,同时将所述最大值标记为下一次的边界查询最小值,重复并计算出整个表的数据块边界;
配置查询模块,配置启动2n个线程,分别分配n个线程负责处理源表数据和目标表数据,以及从条件队列获取数据块边界值;
比对模块,查询所述源表边界值范围内的所有主键值,根据主键计算相同数据块边界对应的数据中源表与目标表的差异数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310394989.8A CN116150179A (zh) | 2023-04-14 | 2023-04-14 | 一种数据库间的数据一致性比对方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310394989.8A CN116150179A (zh) | 2023-04-14 | 2023-04-14 | 一种数据库间的数据一致性比对方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116150179A true CN116150179A (zh) | 2023-05-23 |
Family
ID=86373868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310394989.8A Pending CN116150179A (zh) | 2023-04-14 | 2023-04-14 | 一种数据库间的数据一致性比对方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116150179A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989194A (zh) * | 2015-03-20 | 2016-10-05 | 国际商业机器公司 | 表数据比较的方法和*** |
CN107679104A (zh) * | 2017-09-12 | 2018-02-09 | 杭州美创科技有限公司 | 大表流式并行高速数据比对方法 |
CN108153619A (zh) * | 2017-12-25 | 2018-06-12 | 杭州恩牛网络技术有限公司 | 一种数据校对方法和装置 |
CN114138739A (zh) * | 2021-11-05 | 2022-03-04 | 浪潮软件集团有限公司 | 一种数据库表内容快速比对*** |
CN114328470A (zh) * | 2022-03-14 | 2022-04-12 | 北京奥星贝斯科技有限公司 | 针对单个源表的数据迁移方法及装置 |
CN114996288A (zh) * | 2022-06-23 | 2022-09-02 | 网易(杭州)网络有限公司 | 数据比对方法及装置、计算机存储介质、电子设备 |
CN115952168A (zh) * | 2022-12-23 | 2023-04-11 | 成都康赛信息技术有限公司 | 一种面向教育行业的多尺度渐进式差异数据定位方法 |
-
2023
- 2023-04-14 CN CN202310394989.8A patent/CN116150179A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989194A (zh) * | 2015-03-20 | 2016-10-05 | 国际商业机器公司 | 表数据比较的方法和*** |
CN107679104A (zh) * | 2017-09-12 | 2018-02-09 | 杭州美创科技有限公司 | 大表流式并行高速数据比对方法 |
CN108153619A (zh) * | 2017-12-25 | 2018-06-12 | 杭州恩牛网络技术有限公司 | 一种数据校对方法和装置 |
CN114138739A (zh) * | 2021-11-05 | 2022-03-04 | 浪潮软件集团有限公司 | 一种数据库表内容快速比对*** |
CN114328470A (zh) * | 2022-03-14 | 2022-04-12 | 北京奥星贝斯科技有限公司 | 针对单个源表的数据迁移方法及装置 |
CN114996288A (zh) * | 2022-06-23 | 2022-09-02 | 网易(杭州)网络有限公司 | 数据比对方法及装置、计算机存储介质、电子设备 |
CN115952168A (zh) * | 2022-12-23 | 2023-04-11 | 成都康赛信息技术有限公司 | 一种面向教育行业的多尺度渐进式差异数据定位方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9367556B2 (en) | Hashing scheme using compact array tables | |
US10452676B2 (en) | Managing database with counting bloom filters | |
EP3251033B1 (en) | Hybrid data distribution in a massively parallel processing architecture | |
CN107679104B (zh) | 大表流式并行高速数据比对方法 | |
CN105677683A (zh) | 批量数据查询方法和装置 | |
CN109189783B (zh) | 一种时序数据库表结构改变处理方法 | |
US8843499B2 (en) | Accelerating database queries comprising positional text conditions plus bitmap-based conditions | |
WO2021077741A1 (zh) | 一种基因数据的查询方法、***、设备及存储介质 | |
US9779121B2 (en) | Transparent access to multi-temperature data | |
CN116126864A (zh) | 索引构建方法、数据查询方法及相关设备 | |
CN117609181A (zh) | 一种用于TChouse数据库迁移方法和*** | |
CN116150179A (zh) | 一种数据库间的数据一致性比对方法及装置 | |
CN110399375B (zh) | 一种数据表索引创建方法及装置 | |
CN110928863A (zh) | 一种应用于数据清洗工具的任务断点续传的方法 | |
CN109213751B (zh) | 一种基于Spark平台的Oracle数据库并行迁移方法 | |
CN116226086A (zh) | 一种数据迁移过程中分段数据的顺序维护与校验方法 | |
US20210248142A1 (en) | Dual filter histogram optimization | |
CN110413617B (zh) | 一种根据数据量的大小动态调节哈希表组的方法 | |
US11816245B2 (en) | Method for analysis on interim result data of de-identification procedure, apparatus for the same, computer program for the same, and recording medium storing computer program thereof | |
CN106649754B (zh) | 一种数据仓库性能测试方法及*** | |
US20150269253A1 (en) | Information processing device | |
CN114969200B (zh) | 数据同步方法、装置、电子设备及存储介质 | |
CN114791916B (zh) | 一种临床试验数据的快速比对方法 | |
CN117390064B (zh) | 一种基于可嵌入子图的数据库查询优化方法 | |
CN114238258B (zh) | 数据库数据处理方法、装置、计算机设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230523 |