CN111125063B - 一种快速校验集群间的数据迁移的方法及装置 - Google Patents

一种快速校验集群间的数据迁移的方法及装置 Download PDF

Info

Publication number
CN111125063B
CN111125063B CN201911327676.0A CN201911327676A CN111125063B CN 111125063 B CN111125063 B CN 111125063B CN 201911327676 A CN201911327676 A CN 201911327676A CN 111125063 B CN111125063 B CN 111125063B
Authority
CN
China
Prior art keywords
data
module
clusters
computers
migration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911327676.0A
Other languages
English (en)
Other versions
CN111125063A (zh
Inventor
马强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wireless Life Hangzhou Information Technology Co ltd
Original Assignee
Wireless Life Hangzhou Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wireless Life Hangzhou Information Technology Co ltd filed Critical Wireless Life Hangzhou Information Technology Co ltd
Priority to CN201911327676.0A priority Critical patent/CN111125063B/zh
Publication of CN111125063A publication Critical patent/CN111125063A/zh
Application granted granted Critical
Publication of CN111125063B publication Critical patent/CN111125063B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种快速校验集群间的数据迁移的方法及装置。所述快速校验集群间的数据迁移的方法,包括:获取数据迁移的相关集群的校对数据表;将所述数据迁移的相关集群的校对数据表中的数据,有选择性的存储在校验型数据模型中;将所述校验型数据模型中数据内容发送到多个计算机中;将所述多个计算机反馈的结果写入结果库;将所述结果库中的校验结果通过web页面或者相应的展示文件进行展示。本发明可避免了对数据表进行切割,同时极大的加速了对迁移数据的准确性的核对过程,还可根据用户需求直接对数据表中某些特定数据列进行核对。

Description

一种快速校验集群间的数据迁移的方法及装置
技术领域
本发明涉及计算机集群技术领域,特别涉及一种快速校验集群间的数据迁移的方法及装置。
背景技术
在计算机集群的使用过程中,经常需要在计算机集群之间进行数据迁移。迁移的数据量往往是海量的数据,这就需要在迁移以后进行校验。在发送方的计算机集群和接受方的计算机集群都有一个与该次数据迁移相关的数据表,校验也是通过核对该数据表之中的内容是否一致。但是,海量的数据迁移,也带来了该数据表中海量的数据量,动辄很多个GB的数据量,是无法直接进行核对的。需要对该数据表进行切割,但是如何选择合适的切割点,也是困扰业界的一个课题。无法直接的对数据表中某些特定数据列进行定制化的对比。使用一台设备进行关于该数据表的单线程的核对任务,效率也不尽如意人。如何妥善的解决上述问题,就成为了业界亟待解决的课题。
发明内容
本发明提供一种快速校验集群间的数据迁移的方法及装置,用以避免了对数据表进行切割,同时极大的加速了对迁移数据的准确性的核对过程,还可根据用户需求直接对数据表中某些特定数据列进行核对。
根据本发明实施例的第一方面,提供一种快速校验集群间的数据迁移的方法,包括:
获取数据迁移的相关集群的校对数据表;
将所述数据迁移的相关集群的校对数据表中的数据,有选择性的存储在校验型数据模型中;
将所述校验型数据模型中数据内容发送到多个计算机中;
将所述多个计算机反馈的结果写入结果库;
将所述结果库中的校验结果通过web页面或者相应的展示文件进行展示。
在一个实施例中,所述获取数据迁移的相关集群的校对数据表,包括:
分析出数据迁移相关的发送方集群和接受方集群的数量,其中,所述发送方集群和所述接受方集群的数量都可以为多个;
获取数据迁移的各个发送方集群和各个接受方集群的校对数据表。
在一个实施例中,所述将所述数据迁移的相关集群的校对数据表中的数据,有选择性的存储在校验型数据模型中,包括:
根据预设的过滤器,对所述校对数据表进行过滤式读取;
将过滤式读取的数据存储在预设的校验型数据模型中。
在一个实施例中,所述将所述校验型数据模型中数据内容发送到多个计算机中,包括:
将所述存入数据后的校验数据模型转化为多个分布式内存型数据集合;
将所述多个分布式内存型数据集合发送到多个计算机,并附带令接收端的计算机进行校验运算的指令。
在一个实施例中,,所述将所述多个计算机反馈的结果写入结果库,包括:
收集所述多个计算机的校验运算的结果;
拼接所述多个计算机的校验运算的结果并写入结果库。
根据本发明实施例的第二方面,提供一种快速校验集群间的数据迁移的装置,包括:
获取模块,用于获取数据迁移的相关集群的校对数据表;
存储模块,用于将所述数据迁移的相关集群的校对数据表中的数据,有选择性的存储在校验型数据模型中;
发送模块,用于将所述校验型数据模型中数据内容发送到多个计算机中;
写入模块,用于将所述多个计算机反馈的结果写入结果库;
展示模块,用于将所述结果库中的校验结果通过web页面或者相应的展示文件进行展示。
在一个实施例中,所述获取模块,包括:
分析子模块,用于分析出数据迁移相关的发送方集群和接受方集群的数量,其中,所述发送方集群和所述接受方集群的数量都可以为多个;
获取子模块,用于获取数据迁移的各个发送方集群和各个接受方集群的校对数据表。
在一个实施例中,所述存储模块,包括:
过滤子模块,用于根据预设的过滤器,对所述校对数据表进行过滤式读取;
存储子模块,用于将过滤式读取的数据存储在预设的校验型数据模型中。
在一个实施例中,所述发送模块,包括:
转化子模块,用于将所述存入数据后的校验数据模型转化为多个分布式内存型数据集合;
发送子模块,用于将所述多个分布式内存型数据集合发送到多个计算机,并附带令接收端的计算机进行校验运算的指令。
在一个实施例中,所述写入模块,包括:
收集子模块,用于收集所述多个计算机的校验运算的结果;
拼接子模块,用于拼接所述多个计算机的校验运算的结果并写入结果库。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明一示例性实施例示出的一种快速校验集群间的数据迁移的方法的流程图;
图2为本发明一示例性实施例示出的一种快速校验集群间的数据迁移的方法的步骤S11的流程图;
图3为本发明一示例性实施例示出的一种快速校验集群间的数据迁移的方法的步骤S12的流程图;
图4为本发明一示例性实施例示出的一种快速校验集群间的数据迁移的方法的步骤S13的流程图;
图5为本发明一示例性实施例示出的一种快速校验集群间的数据迁移的方法的步骤S14的流程图;
图6为本发明一示例性实施例示出的一种快速校验集群间的数据迁移的装置的框图;
图7为本发明一示例性实施例示出的一种快速校验集群间的数据迁移的装置的获取模块61的框图;
图8为本发明一示例性实施例示出的一种快速校验集群间的数据迁移的装置的存储模块62的框图;
图9为本发明一示例性实施例示出的一种快速校验集群间的数据迁移的装置的发送模块63的框图;
图10为本发明一示例性实施例示出的一种快速校验集群间的数据迁移的装置的写入模块64的框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1是根据一示例性实施例示出的一种快速校验集群间的数据迁移的方法流程图,如图1所示,该快速校验集群间的数据迁移的方法,包括以下步骤S11-S14:
在步骤S11中,获取数据迁移的相关集群的校对数据表;
在步骤S12中,将所述数据迁移的相关集群的校对数据表中的数据,有选择性的存储在校验型数据模型中;
在步骤S13中,将所述校验型数据模型中数据内容发送到多个计算机中;
在步骤S14中,将所述多个计算机反馈的结果写入结果库;
将所述结果库中的校验结果通过web页面或者相应的展示文件进行展示。
在一个实施例中,在计算机集群的使用过程中,经常需要在计算机集群之间进行数据迁移。迁移的数据量往往是海量的数据,这就需要在迁移以后进行校验。在发送方的计算机集群和接受方的计算机集群都有一个与该次数据迁移相关的数据表,校验也是通过核对该数据表之中的内容是否一致。但是,海量的数据迁移,也带来了该数据表中海量的数据量,动辄很多个GB的数据量,是无法直接进行核对的。需要对该数据表进行切割,但是如何选择合适的切割点,也是困扰业界的一个课题。无法直接的对数据表中某些特定数据列进行定制化的对比。使用一台设备进行关于该数据表的单线程的核对任务,效率也不尽如意人。本实施例中可妥善的解决上述问题。
获取数据迁移的相关集群的校对数据表。其中,分析出数据迁移相关的发送方集群和接受方集群的数量,其中,所述发送方集群和所述接受方集群的数量都可以为多个;获取数据迁移的各个发送方集群和各个接受方集群的校对数据表。
将所述数据迁移的相关集群的校对数据表中的数据,有选择性的存储在校验型数据模型中。其中,根据预设的过滤器,对所述校对数据表进行过滤式读取;将过滤式读取的数据存储在预设的校验型数据模型中。
将所述校验型数据模型中数据内容发送到多个计算机中。其中,将所述存入数据后的校验数据模型转化为多个分布式内存型数据集合;将所述多个分布式内存型数据集合发送到多个计算机,并附带令接收端的计算机进行校验运算的指令。
将所述多个计算机反馈的结果写入结果库。其中,收集所述多个计算机的校验运算的结果;拼接所述多个计算机的校验运算的结果并写入结果库。
将所述结果库中的校验结果通过web页面或者相应的展示文件进行展示。
本实施例中的技术方案可避免了对数据表进行切割,同时极大的加速了对迁移数据的准确性的核对过程,还可根据用户需求直接对数据表中某些特定数据列进行核对。
在一个实施例中,如图2所示,步骤S11包括如下步骤S21-S22:
在步骤S21中,分析出数据迁移相关的发送方集群和接受方集群的数量,其中,所述发送方集群和所述接受方集群的数量都可以为多个;
在步骤S22中,获取数据迁移的各个发送方集群和各个接受方集群的校对数据表。
在一个实施例中,数据迁移的发送方集群的个数可以是n个,数据迁移的接受方的集群的个数也可以m个,其中n、m为正整数。每一个数据迁移的过程中,在接受方集群和发送方集群都各有一张数据表,接受方集群的数据表和发送发集群的数据表中记录发送数据的数据名称、数据列、数据格式和数据公式中的任一者或多者。
在一个实施例中,如图3所示,步骤S12包括如下步骤S31-S32:
在步骤S31中,根据预设的过滤器,对所述校对数据表进行过滤式读取;
在步骤S32中,将过滤式读取的数据存储在预设的校验型数据模型中。
在一个实施例中,预设的过滤器可以设置数据迁移中的数据的那些数据列被过滤掉,从而可简化得到数据表。也可根据用户的使用用途,剔除掉用户不感兴趣的数据列,为后续的处理过程节省了大量的计算资源,从而加速了处理过程。预设的校验型数据模型在建立时,就已经设置该数据模型中包含那些数据列,已经和该数据列相对于的数据格式和数据公式等。
在一个实施例中,如图4所示,步骤S13包括如下步骤S41-S42:
在步骤S41中,将所述存入数据后的校验数据模型转化为多个分布式内存型数据集合;
在步骤S42中,将所述多个分布式内存型数据集合发送到多个计算机,并附带令接收端的计算机进行校验运算的指令。
在一个实施例中,通过Spark计算引擎快速的处理大规模数据的特性,将校验型数据模型中数据内容转化为分布式内存型数据集合。为了使用多个计算机来协同运算,将该分布式内存型数据集合分割成多个小块的分布式内存型数据集合,便于后续使用多个计算机来完成各自部分的分布式内存型数据集合的校验运算。
在一个实施例中,如图5所示,步骤S14包括如下步骤S51-S52:
在步骤S51中,收集所述多个计算机的校验运算的结果;
在步骤S52中,拼接所述多个计算机的校验运算的结果并写入结果库。
在一个实施例中,在各个计算机完成了各自部分的分布式内存型数据集合的校验运算后,收集该多个计算机的反馈的结果。按照各个计算机在接收分布式内存型数据集合的编号,将该些反馈的结果按照先后顺序进行拼接,并将拼接完成的结果写入到结果库中,方便在后续过程中进行展示。
在一个实施例中,图6是根据一示例性实施例示出的一种快速校验集群间的数据迁移的装置框图。如图6示,该装置包括获取模块61、存储模块62、发送模块63、写入模块64和展示模块65。
该获取模块61,用于获取数据迁移的相关集群的校对数据表;
该存储模块62,用于将所述数据迁移的相关集群的校对数据表中的数据,有选择性的存储在校验型数据模型中;
该发送模块63,用于将所述校验型数据模型中数据内容发送到多个计算机中;
该写入模块64,用于将所述多个计算机反馈的结果写入结果库;
该展示模块65,用于将所述结果库中的校验结果通过web页面或者相应的展示文件进行展示。
如图7所示,该获取模块61包括分析子模块71和获取子模块72。
该分析子模块71,用于分析出数据迁移相关的发送方集群和接受方集群的数量,其中,所述发送方集群和所述接受方集群的数量都可以为多个;
该获取子模块72,用于获取数据迁移的各个发送方集群和各个接受方集群的校对数据表。
如图8所示,该存储模块62包括过滤子模块81和存储子模块82。
该过滤子模块81,用于根据预设的过滤器,对所述校对数据表进行过滤式读取;
该存储子模块82,用于将过滤式读取的数据存储在预设的校验型数据模型中。
如图9所示,该发送模块63包括转化子模块91和发送子模块92。
该转化子模块91,用于将所述存入数据后的校验数据模型转化为多个分布式内存型数据集合;
该发送子模块92,用于将所述多个分布式内存型数据集合发送到多个计算机,并附带令接收端的计算机进行校验运算的指令。
如图10所示,该写入模块64包括收集子模块101和拼接子模块102。
该收集子模块101,用于收集所述多个计算机的校验运算的结果;
该拼接子模块102,用于拼接所述多个计算机的校验运算的结果并写入结果库。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种快速校验集群间的数据迁移的方法,其特征在于,包括:
获取数据迁移的相关集群的校对数据表,所述校对数据表是接受方集群和发送方集群的数据表,数据表中记录发送数据的数据名称和数据列;
将所述数据迁移的相关集群的校对数据表中的数据,有选择性的存储在校验型数据模型中,包括:根据预设的过滤器,对所述校对数据表进行过滤式读取;将过滤式读取的数据存储在预设的校验型数据模型中,其中,预设的过滤器设置被过滤掉的数据列,预设的校验型数据模型设置数据模型中包含的数据列、数据列相对应的数据格式和数据公式中的任一者或多者;
将所述校验型数据模型中数据内容发送到多个计算机中,包括:通过Spark计算引擎将所述存入数据后的校验数据模型转化为多个分布式内存型数据集合;将所述多个分布式内存型数据集合发送到多个计算机,并附带令接收端的计算机进行校验运算的指令;
将所述多个计算机反馈的结果写入结果库;
将所述结果库中的校验结果通过web页面或者相应的展示文件进行展示。
2.如权利要求1所述的方法,其特征在于,所述获取数据迁移的相关集群的校对数据表,包括:
分析出数据迁移相关的发送方集群和接受方集群的数量,其中,所述发送方集群和所述接受方集群的数量都可以为多个;
获取数据迁移的各个发送方集群和各个接受方集群的校对数据表。
3.如权利要求1所述的方法,其特征在于,所述将所述多个计算机反馈的结果写入结果库,包括:
收集所述多个计算机的校验运算的结果;
拼接所述多个计算机的校验运算的结果并写入结果库。
4.一种快速校验集群间的数据迁移的装置,其特征在于,包括:
获取模块,用于获取数据迁移的相关集群的校对数据表,所述校对数据表是接受方集群和发送方集群的数据表,数据表中记录发送数据的数据名称和数据列;
存储模块,用于将所述数据迁移的相关集群的校对数据表中的数据,有选择性的存储在校验型数据模型中;
发送模块,用于将所述校验型数据模型中数据内容发送到多个计算机中;
写入模块,用于将所述多个计算机反馈的结果写入结果库;
展示模块,用于将所述结果库中的校验结果通过web页面或者相应的展示文件进行展示;
所述存储模块,包括:
过滤子模块,用于根据预设的过滤器,对所述校对数据表进行过滤式读取;
存储子模块,用于将过滤式读取的数据存储在预设的校验型数据模型中;其中,预设的过滤器设置被过滤掉的数据列,预设的校验型数据模型设置数据模型中包含的数据列、数据列相对应的数据格式和数据公式中的任一者或多者;
所述发送模块,包括:
转化子模块,用于通过Spark计算引擎将所述存入数据后的校验数据模型转化为多个分布式内存型数据集合;
发送子模块,用于将所述多个分布式内存型数据集合发送到多个计算机,并附带令接收端的计算机进行校验运算的指令。
5.根据权利要求4所述的装置,其特征在于,所述获取模块,包括:
分析子模块,用于分析出数据迁移相关的发送方集群和接受方集群的数量,其中,所述发送方集群和所述接受方集群的数量都可以为多个;
获取子模块,用于获取数据迁移的各个发送方集群和各个接受方集群的校对数据表。
6.根据权利要求4所述的装置,其特征在于,所述写入模块,包括:
收集子模块,用于收集所述多个计算机的校验运算的结果;拼接子模块,用于拼接所述多个计算机的校验运算的结果并写入结果库。
CN201911327676.0A 2019-12-20 2019-12-20 一种快速校验集群间的数据迁移的方法及装置 Active CN111125063B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911327676.0A CN111125063B (zh) 2019-12-20 2019-12-20 一种快速校验集群间的数据迁移的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911327676.0A CN111125063B (zh) 2019-12-20 2019-12-20 一种快速校验集群间的数据迁移的方法及装置

Publications (2)

Publication Number Publication Date
CN111125063A CN111125063A (zh) 2020-05-08
CN111125063B true CN111125063B (zh) 2023-09-26

Family

ID=70500745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911327676.0A Active CN111125063B (zh) 2019-12-20 2019-12-20 一种快速校验集群间的数据迁移的方法及装置

Country Status (1)

Country Link
CN (1) CN111125063B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680004B (zh) * 2020-06-08 2023-09-22 中国银行股份有限公司 核对非结构化影像文件迁移准确性的方法和装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105989044A (zh) * 2015-02-04 2016-10-05 阿里巴巴集团控股有限公司 一种数据库校验方法及***
CN106055670A (zh) * 2016-06-06 2016-10-26 中国工商银行股份有限公司 一种***间数据迁移方法及装置
WO2017071337A1 (zh) * 2015-10-26 2017-05-04 中兴通讯股份有限公司 管理数据库表数据的方法、装置及***
CN107766572A (zh) * 2017-11-13 2018-03-06 北京国信宏数科技有限责任公司 基于经济领域数据的分布式提取及可视化分析方法和***
CN108073688A (zh) * 2017-11-20 2018-05-25 苏宁云商集团股份有限公司 一种数据迁移的方法及装置
CN108241632A (zh) * 2016-12-23 2018-07-03 航天星图科技(北京)有限公司 一种面向数据库数据迁移的数据验证方法
CN108595664A (zh) * 2018-04-28 2018-09-28 尚谷科技(天津)有限公司 一种hadoop环境下的农业数据监控方法
CN110209521A (zh) * 2019-02-22 2019-09-06 腾讯科技(深圳)有限公司 数据校验方法、装置、计算机可读存储介质和计算机设备
CN110543483A (zh) * 2019-08-30 2019-12-06 北京百分点信息科技有限公司 一种数据稽核方法、装置及电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9613116B2 (en) * 2013-11-15 2017-04-04 Workday, Inc. Identifying and formatting data for data migration
US9990219B2 (en) * 2015-10-01 2018-06-05 International Business Machines Corporation Risk-appropriate validation for live operating system migration
CN106874389B (zh) * 2017-01-11 2023-04-07 腾讯科技(深圳)有限公司 数据的迁移方法和装置
CN106953893A (zh) * 2017-02-15 2017-07-14 北京百度网讯科技有限公司 云存储***间的数据迁移
US10929384B2 (en) * 2017-08-16 2021-02-23 Walmart Apollo, Llc Systems and methods for distributed data validation

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105989044A (zh) * 2015-02-04 2016-10-05 阿里巴巴集团控股有限公司 一种数据库校验方法及***
WO2017071337A1 (zh) * 2015-10-26 2017-05-04 中兴通讯股份有限公司 管理数据库表数据的方法、装置及***
CN106055670A (zh) * 2016-06-06 2016-10-26 中国工商银行股份有限公司 一种***间数据迁移方法及装置
CN108241632A (zh) * 2016-12-23 2018-07-03 航天星图科技(北京)有限公司 一种面向数据库数据迁移的数据验证方法
CN107766572A (zh) * 2017-11-13 2018-03-06 北京国信宏数科技有限责任公司 基于经济领域数据的分布式提取及可视化分析方法和***
CN108073688A (zh) * 2017-11-20 2018-05-25 苏宁云商集团股份有限公司 一种数据迁移的方法及装置
CN108595664A (zh) * 2018-04-28 2018-09-28 尚谷科技(天津)有限公司 一种hadoop环境下的农业数据监控方法
CN110209521A (zh) * 2019-02-22 2019-09-06 腾讯科技(深圳)有限公司 数据校验方法、装置、计算机可读存储介质和计算机设备
CN110543483A (zh) * 2019-08-30 2019-12-06 北京百分点信息科技有限公司 一种数据稽核方法、装置及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于Spark的大规模软件完整性校验行为识别框架;邱景;李宜卓;;软件导刊(04);52-55 *

Also Published As

Publication number Publication date
CN111125063A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN109255112A (zh) 一种报告自动生成方法和***
CN107992492B (zh) 一种数据区块的存储方法、读取方法、其装置及区块链
CN106940693B (zh) 实验室原始记录单结构化处理方法
CN111061696A (zh) 一种交易报文日志的解析方法及装置
CN111476013A (zh) 信息收集方法、装置、介质及电子设备
CN111221698A (zh) 任务数据采集方法与装置
CN111125063B (zh) 一种快速校验集群间的数据迁移的方法及装置
CN103455497A (zh) 一种提供整合的搜索结果的方法以及***
CN114239535A (zh) 一种基于网页页面的Word文档自动生成方法及***
CN111125385A (zh) 分析报表的生成方法、装置、存储介质和处理器
CN112084111A (zh) 一种数据处理方法、***和装置
CN113722278B (zh) 一种基于pdf文件的知识元抽取方法、设备及介质
CN111078905A (zh) 一种数据处理方法、装置、介质以及设备
CN111143329B (zh) 一种数据处理方法及装置
WO2021129849A1 (zh) 日志处理方法、装置、设备和存储介质
CN111143156B (zh) 大数据平台垃圾任务采集***、方法及计算机***
CN110955709B (zh) 一种数据的处理方法、装置及电子设备
CN113377681A (zh) 测试案例数据处理方法、装置、电子设备及存储介质
CN111090436B (zh) 一种Jenkins编译结果汇总方法、装置及设备
CN112162951A (zh) 一种信息检索方法、服务器及存储介质
CN111352824A (zh) 测试方法、装置及计算机设备
CN113485693B (zh) 接口配置方法、装置、设备及存储介质
CN112579553B (zh) 用于记录信息的方法和装置
CN116599950A (zh) 一种数据的导出方法、装置、设备及介质
CN111367976A (zh) 基于java反射机制的excel文件数据的导出方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant