CN109828979A - 一种数据一致性检测方法及*** - Google Patents

一种数据一致性检测方法及*** Download PDF

Info

Publication number
CN109828979A
CN109828979A CN201910100217.2A CN201910100217A CN109828979A CN 109828979 A CN109828979 A CN 109828979A CN 201910100217 A CN201910100217 A CN 201910100217A CN 109828979 A CN109828979 A CN 109828979A
Authority
CN
China
Prior art keywords
data
queue
target data
detection
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910100217.2A
Other languages
English (en)
Inventor
贾立锋
周欢
王宏波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Little Thai Technology Co Ltd
Original Assignee
Zhejiang Little Thai Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Little Thai Technology Co Ltd filed Critical Zhejiang Little Thai Technology Co Ltd
Priority to CN201910100217.2A priority Critical patent/CN109828979A/zh
Publication of CN109828979A publication Critical patent/CN109828979A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种数据一致性检测方法,属于大数据处理技术领域,实现了目标数据与原始数据的一致性检测。包括如下步骤:S1:主机接收原始数据和目标数据;S2:主机设定检测节点;S3:主机根据检测节点,提取原始数据与目标数据中对应的数据,进行数据数量比较,判断数据一致性,若数量一致,则该检测节点对应的原始数据与目标数据一致,若数量不一致,则该检测节点对应的原始数据与目标数据不一致,返回步骤S2。

Description

一种数据一致性检测方法及***
技术领域
本发明涉及大数据处理技术领域,尤其涉及一种数据一致性检测方法及***。
背景技术
大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。
现有技术中,大量的数据需要录入到标准的表格中,由于延迟、录入失败等原因,将导致原始数据与表格中的目标数据不一致,这是就需要对数据进行检测,保证目标数据与原始数据的一致性。
发明内容
本发明的目的一在于提供一种数据一致性检测方法,实现了目标数据与原始数据的一致性检测。
本发明的上述目的一是通过以下技术方案得以实现的:
一种数据一致性检测方法,包括如下步骤:S1:主机接收原始数据和目标数据;S2:主机设定检测节点;S3:主机根据检测节点,提取原始数据与目标数据中对应的数据,进行数据数量比较,判断数据一致性,若数量一致,则该检测节点对应的原始数据与目标数据一致,若数量不一致,则该检测节点对应的原始数据与目标数据不一致,返回步骤S2。
进一步的,所述步骤S3中 ,根据检测节点,提取原始数据与目标数据中对应的数据之后,还包括步骤S301:主机根据提取的原始数据与目标数据的大小,将原始数据与目标数据分割成多个队列,将队列分别分配给空闲的服务器进行数据数量计算。
进一步的,在步骤S301后,进行步骤S302:主机接收某一检测节点下的所有原始数据与目标数据的队列的数量比较,再进行统计。
进一步的,在所述步骤S301中,当服务器在处理队列时,不再接收队列,当队列处理完后继续处于空闲状态,接收下一队列。
进一步的,所述检测节点为时间段。
本发明的目的二在于提供一种数据一致性检测方法,实现了目标数据与原始数据的一致性检测。
本发明的上述目的二是通过以下技术方案得以实现的:
一种数据一致性检测***,包括:主机,用于接收原始数据和目标数据,设定检测节点,根据检测节点提取原始数据与目标数据中对应的数据;服务器,用于对原始数据与目标数据进行数据数量比较。
进一步的,所述主机还用于根据提取的原始数据与目标数据的大小,将原始数据与目标数据分割成多个队列,将队列分别分配给空闲的服务器进行数据数量计算。
进一步的,主机接收某一检测节点下的所有原始数据与目标数据的队列的数量比较,再进行统计。
进一步的,服务器在处理队列时,不再接收队列,当队列处理完后继续处于空闲状态,接收下一队列。
综上所述,本发明具有以下有益效果:
通过对数据的分接结点分队列比较原始数据与目标数据的数量一致性,在保证数据准确性的同时,还提高了检测的效率。
附图说明
图1是本发明的方法流程图;
图2是本发明的***框图。
具体实施方式
下面将结合附图,对本发明实施例的技术方案进行描述。
本发明揭露了一种数据一致性检测方法及***,结合图1和图2,方法包括如下步骤:
S1:主机接收原始数据和目标数据;
S2:主机设定检测节点;
S3:主机根据检测节点,提取原始数据与目标数据中对应的数据,进行数据数量比较,判断数据一致性,若数量一致,则该检测节点对应的原始数据与目标数据一致,若数量不一致,则该检测节点对应的原始数据与目标数据不一致,返回步骤S2。
作为平台,接入的数据库的数量是非常庞大的。在作为以表为比较单位的话,比较的次数也是非常巨大的。为了比较的及时性和稳定性,采用任务分发处理方式多服务多线程处理数据比较。
因此,在步骤S3中,根据检测节点,提取原始数据与目标数据中对应的数据之后,还包括步骤S301:主机根据提取的原始数据与目标数据的大小,将原始数据与目标数据分割成多个队列,将队列分别分配给空闲的服务器进行数据数量计算。在步骤S301后,进行步骤S302:主机接收某一检测节点下的所有原始数据与目标数据的队列的数量比较,再进行统计。
具体地,在数据分发中,通过zookeeper得到leader,zookeeper中间件提供了在多个服务器之间选取一台主服务器,通过其中一台检测节点服务作为分发所有服务,当然分发服务也是高可用的。即某个服务器出现宕机的情况下,其他服务器依然能够处理分配给宕机服务器的任务,保证分发的任务不会出现没有处理的情况的,将比较的表数据存放在redis缓存中,等待检测节点获取数据。节点服务主要是监听解答redis缓存队列,实时处理消息内容。处理完成后实时反馈处理结果。
在通过表数据数量比较中,需要通过统一的时间节点来进行数量统计然后比较,所以需要通过双方表联系起来。在针对分库分表的复杂数据结构中,他们也需要配置统一管理的检测任务,最终汇总得出比较结果。分库分表主要是解决单表数据量过大,用以拆分数据表,将数据分散在各个表中。但是针对我们是可以大数据的,需要将分散在各个表中的数据集中在我们一个表中。

Claims (9)

1.一种数据一致性检测方法,其特征在于,包括如下步骤:
S1:主机接收原始数据和目标数据;
S2:主机设定检测节点;
S3:主机根据检测节点,提取原始数据与目标数据中对应的数据,进行数据数量比较,判断数据一致性,若数量一致,则该检测节点对应的原始数据与目标数据一致,若数量不一致,则该检测节点对应的原始数据与目标数据不一致,返回步骤S2。
2.根据权利要求1所述的一种数据一致性检测方法,其特征在于,所述步骤S3中,根据检测节点,提取原始数据与目标数据中对应的数据之后,还包括步骤S301:主机根据提取的原始数据与目标数据的大小,将原始数据与目标数据分割成多个队列,将队列分别分配给空闲的服务器进行数据数量计算。
3.根据权利要求2所述的一种数据一致性检测方法,其特征在于,在步骤S301后,进行步骤S302:主机接收某一检测节点下的所有原始数据与目标数据的队列的数量比较,再进行统计。
4.根据权利要求3所述的一种数据一致性检测方法及***,其特征在于,在所述步骤S301中,当服务器在处理队列时,不再接收队列,当队列处理完后继续处于空闲状态,接收下一队列。
5.根据权利要求3所述的一种数据一致性检测方法及***,其特征在于,所述检测节点为时间段。
6.一种数据一致性检测***,其特征在于,包括:
主机,用于接收原始数据和目标数据,设定检测节点,根据检测节点提取原始数据与目标数据中对应的数据;
服务器,用于对原始数据与目标数据进行数据数量比较。
7.根据权利要求1所述的一种数据一致性检测***,其特征在于,所述主机还用于根据提取的原始数据与目标数据的大小,将原始数据与目标数据分割成多个队列,将队列分别分配给空闲的服务器进行数据数量计算。
8.根据权利要求1所述的一种数据一致性检测***,其特征在于,主机接收某一检测节点下的所有原始数据与目标数据的队列的数量比较,再进行统计。
9.根据权利要求1所述的一种数据一致性检测***,其特征在于,服务器在处理队列时,不再接收队列,当队列处理完后继续处于空闲状态,接收下一队列。
CN201910100217.2A 2019-01-31 2019-01-31 一种数据一致性检测方法及*** Pending CN109828979A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910100217.2A CN109828979A (zh) 2019-01-31 2019-01-31 一种数据一致性检测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910100217.2A CN109828979A (zh) 2019-01-31 2019-01-31 一种数据一致性检测方法及***

Publications (1)

Publication Number Publication Date
CN109828979A true CN109828979A (zh) 2019-05-31

Family

ID=66862035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910100217.2A Pending CN109828979A (zh) 2019-01-31 2019-01-31 一种数据一致性检测方法及***

Country Status (1)

Country Link
CN (1) CN109828979A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666286A (zh) * 2020-05-21 2020-09-15 微民保险代理有限公司 分库分表检测方法、装置、计算机设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079683A (zh) * 2007-06-27 2007-11-28 ***通信集团四川有限公司 数据一致性处理方法
US8498967B1 (en) * 2007-01-30 2013-07-30 American Megatrends, Inc. Two-node high availability cluster storage solution using an intelligent initiator to avoid split brain syndrome
CN104036029A (zh) * 2014-06-27 2014-09-10 深圳市腾讯计算机***有限公司 大数据一致性对比方法和***
CN104503845A (zh) * 2015-01-14 2015-04-08 北京邮电大学 一种任务分发方法和***
CN105468718A (zh) * 2015-11-18 2016-04-06 腾讯科技(深圳)有限公司 数据一致性处理方法、装置和***
CN106341454A (zh) * 2016-08-23 2017-01-18 世纪龙信息网络有限责任公司 跨机房多活分布式数据库管理***和方法
CN106789095A (zh) * 2017-03-30 2017-05-31 腾讯科技(深圳)有限公司 分布式***及消息处理方法
CN108280080A (zh) * 2017-01-06 2018-07-13 阿里巴巴集团控股有限公司 一种数据同步方法、装置以及电子设备
CN108833503A (zh) * 2018-05-29 2018-11-16 华南理工大学 一种基于ZooKeeper的Redis集群方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8498967B1 (en) * 2007-01-30 2013-07-30 American Megatrends, Inc. Two-node high availability cluster storage solution using an intelligent initiator to avoid split brain syndrome
CN101079683A (zh) * 2007-06-27 2007-11-28 ***通信集团四川有限公司 数据一致性处理方法
CN104036029A (zh) * 2014-06-27 2014-09-10 深圳市腾讯计算机***有限公司 大数据一致性对比方法和***
CN104503845A (zh) * 2015-01-14 2015-04-08 北京邮电大学 一种任务分发方法和***
CN105468718A (zh) * 2015-11-18 2016-04-06 腾讯科技(深圳)有限公司 数据一致性处理方法、装置和***
CN106341454A (zh) * 2016-08-23 2017-01-18 世纪龙信息网络有限责任公司 跨机房多活分布式数据库管理***和方法
CN108280080A (zh) * 2017-01-06 2018-07-13 阿里巴巴集团控股有限公司 一种数据同步方法、装置以及电子设备
CN106789095A (zh) * 2017-03-30 2017-05-31 腾讯科技(深圳)有限公司 分布式***及消息处理方法
CN108833503A (zh) * 2018-05-29 2018-11-16 华南理工大学 一种基于ZooKeeper的Redis集群方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
青岛英谷教育科技股份有限公司: "《云计算与大数据概论》", 31 October 2017 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666286A (zh) * 2020-05-21 2020-09-15 微民保险代理有限公司 分库分表检测方法、装置、计算机设备和存储介质
CN111666286B (zh) * 2020-05-21 2023-06-30 微民保险代理有限公司 分库分表检测方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
US10891177B2 (en) Message management method and device, and storage medium
US10701012B2 (en) Method, apparatus and system for customer service information forwarding
EP4234060A1 (en) Service processing method and apparatus, and storage medium
US9286316B2 (en) Enterprise level data collection systems and methodologies
CN108712426B (zh) 基于用户行为埋点的爬虫识别方法及***
CN112860695B (zh) 监控数据查询方法、装置、设备、存储介质及程序产品
CN105577801B (zh) 一种业务加速方法及装置
WO2020192649A1 (zh) 一种数据中心管理***
CN111813573B (zh) 管理平台与机器人软件的通信方法及其相关设备
CN110493065A (zh) 一种云中心运维的告警关联度分析方法及***
CN110708256A (zh) Cdn调度方法、装置、网络设备及存储介质
CN110147470B (zh) 一种跨机房数据比对***及方法
CN114567519B (zh) 一种多线程并行管理多个智能设备指令消息的方法及装置
US20200004785A1 (en) Automatic grouping based on user behavior
CN109828979A (zh) 一种数据一致性检测方法及***
CN105007200B (zh) 网络数据包的分析方法及***
CN105162837B (zh) 海量数据存储环境下提升i/o吞吐率的方法及***
CN106487653B (zh) 一种消息处理方法及服务器
CN110909072B (zh) 一种数据表建立方法、装置及设备
US20230063599A1 (en) Edge computing network, data transmission method and apparatus, device and storage medium
CN116521335A (zh) 一种倾斜影像模型生产的分布式任务调度方法及***
KR102464688B1 (ko) 모니터링 결과의 이벤트 등급 결정 방법 및 장치
CN110647448A (zh) 一种移动应用操作日志数据实时分析方法、服务器和***
CN105357317A (zh) 一种基于多客户端轮循排队的数据上传方法及***
CN109542855A (zh) 一种文档共享和文档控制的方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190531