CN111221777B - 一种数据记录的匹配方法及装置 - Google Patents
一种数据记录的匹配方法及装置 Download PDFInfo
- Publication number
- CN111221777B CN111221777B CN202010003028.6A CN202010003028A CN111221777B CN 111221777 B CN111221777 B CN 111221777B CN 202010003028 A CN202010003028 A CN 202010003028A CN 111221777 B CN111221777 B CN 111221777B
- Authority
- CN
- China
- Prior art keywords
- data
- acquisition
- files
- host system
- system architectures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000013480 data collection Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 4
- 230000005587 bubbling Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/20—Software design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/65—Updates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种数据记录的匹配方法及装置,所述方法包括:通过比较在不同的主机***架构下生成的采集文件的数据记录结果,得到数据记录差异,选取标准采集文件,根据所述数据记录差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的生成规则。由此可以将标准采集文件数据记录不匹配的采集文件的生成规则调整,使得在不同的主机***架构下的采集文件的生成规则相一致,生成的采集文件的数据可以实现相互匹配,便于下游的其他***进行使用,提高了采集文件和其中的数据的适用性,解决了现有技术中采集文件由于是在不同的架构下生成的导致采集文件中数据记录不匹配的问题。
Description
技术领域
本申请涉及数据处理领域,尤其涉及一种数据记录的匹配方法及装置。
背景技术
随着计算机技术的快速发展,为了适应计算机处理的需要,计算机的主机***架构也在不断的更新。对于不同的主机***架构来说,所对应的文件的格式和规范也并不相同。对于数据采集文件来说,在主机***架构为X86的***中和在其他主机***架构中的文件格式并不相同。所以,在不同的主机***架构下,由于采集文件的生成缺乏相同的规则,即使采集相同的数据,所获得的采集文件也并不相同,采集文件中的数据记录也并不匹配。这导致其他相关的***难以适用不同的采集文件,部分主机***架构获取的采集文件无法达到相关的***的使用要求,所以需要提高不同的主机***架构生成的采集文件中数据记录的匹配程度,使得不同主机***架构生成的采集文件中的数据记录均是有效的,可以被相关的***所使用。
发明内容
为了解决现有技术存在的上述技术问题,本申请提供了一种数据记录的匹配方法及装置,可以通过调整采集文件的生成规则,使得不同主机***架构生成的采集文件中的数据记录可以匹配,解决了现有技术中不同的主机***架构生成的采集文件中的数据记录不匹配,相关的***无法正常使用采集文件的问题。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种数据记录的匹配方法,包括:
获取在不同的主机***架构下生成的采集文件;其中,所述采集文件是针对相同数据进行数据采集生成的文件种类相同的采集文件;
分别获取所述在不同的主机***架构下生成的采集文件中的数据记录结果;比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异;
从所述采集文件中选择标准采集文件,根据所述数据记录差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的生成规则,使得所述不同主机***架构中采集文件的数据与所述标准采集文件中的数据记录相匹配。
可选的,所述分别获取所述采集文件中的数据记录结果,包括:
分别从所述在不同的主机***架构下生成的采集文件的数据记录中选取相同预设数量的数据记录,根据所述选取的数据记录获取所述在不同的主机***架构下生成的采集文件中的数据记录结果。
可选的,所述数据记录结果具有数据记录数量和/或数据类型。
可选的,当所述数据记录结果具有数据记录数量时,所述数据记录差异具有记录数量差异;
所述根据所述数据记录差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的生成规则,具体包括:
根据所述记录数量差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的数据采集规则。
可选的,当所述数据记录结果具有数据类型时,所述数据记录差异具有数据类型差异;
所述根据所述数据记录差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的生成规则,具体包括:
所述根据所述数据类型差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的数据分类规则。
可选的,当所述数据记录结果具有数据类型时,所述比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异,具体包括:
将所述数据记录结果中的数据类型按照预设的排列顺序进行排序,依次比较所述排序后的数据类型中具有的数据,得到所述在不同的主机***架构下生成的采集文件的数据类型差异。
可选的,当所述数据记录结果中具有数据类型时,所述比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异,具体包括:
从所述数据记录结果中具有的数据类型中选取的预先设置的比对数据类型,比较所述比对数据类型中具有的数据,得到所述在不同的主机***架构下生成的采集文件的数据类型差异。
可选的,所述方法还包括:
根据所述采集文件的文件种类获取预设文件格式,判断所述在不同的主机***架构下生成的采集文件的文件格式是否符合预设文件格式;若不符合,修正所述采集文件的文件格式。
第二方面,本申请实施例提供了一种数据记录的匹配装置,包括:
获取单元,用于获取在不同的主机***架构下生成的采集文件;其中,所述采集文件是针对相同数据进行数据采集生成的文件种类相同的采集文件;
比较单元,用于分别获取所述在不同的主机***架构下生成的采集文件中的数据记录结果;比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异;
调整单元,用于从所述采集文件中选择标准采集文件,根据所述数据记录差异和所述标准采集文件,调整不同的主机***架构中采集文件的生成规则,使得所述不同主机***架构中采集文件的数据与所述标准采集文件中的数据记录相匹配。
可选的,所述装置还包括:
抽样单元,用于分别从所述在不同的主机***架构下生成的采集文件的数据记录中选取相同预设数量的数据记录,根据所述选取的数据记录获取所述在不同的主机***架构下生成的采集文件中的数据记录结果。
相较于现有技术,本申请具有以下有益效果:
在本申请实施例提供的方法中,通过比较在不同的主机***架构下生成的采集文件的数据记录结果,得到数据记录差异,选取标准采集文件,根据所述数据记录差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的生成规则。由此可以将标准采集文件数据记录不匹配的采集文件的生成规则调整,使得在不同的主机***架构下的采集文件的生成规则相一致,生成的采集文件的数据记录可以实现相互匹配,便于下游的其他***进行使用,提高了采集文件和其中的数据的适用性,解决了现有技术中采集文件由于是在不同的架构下生成的导致数据记录不匹配的问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种数据记录的匹配方法的流程图;
图2为本申请实施例提供的另一种数据记录的匹配方法的流程图;
图3为本申请实施例提供的一种数据记录的匹配装置的结构示意图。
具体实施方式
正如前文所述,不同种类的主机***架构生成的文件在格式和规范方面可能不同。对于数据采集文件来说,由于在不同的主机***架构中采集文件的生成规则并不相同,所以由在不同的主机***架构下生成的采集文件中的数据并不匹配,采集文件之间采集数据的规则,数据记录的规则等方面都有可能存在着不同。而由在不同的主机***架构下生成的采集文件会发送到下游的其他相关***中,相关***会利用采集文件中的数据进行处理,实现其他功能,但是相关***难以对由在不同的主机***架构下生成的采集文件分别进行数据的处理。
发明人发现,即使是从相同的数据库中进行数据的采集,由于采集规则不同,不同的主机***架构生成的采集文件也不相同。但是,由于是从相同的数据库中采集到的数据,根据最后生成的采集文件可以判断出不同的主机***架构所采集数据的规则的差异。对不同主机的采集文件生成规则进行调整,就可以得到文件中数据记录的匹配的采集文件。
发明人经过研究发现,可以获取针对于相同数据的由不同的主机***架构所生成的采集文件的数据记录结果,对获得的数据记录结果进行比较。由于是基于相同的数据生成的采集文件,所以采集文件不同的记录结果就是由采集文件的采集规则导致的。比较记录结果可以得到数据记录差异,可以根据数据记录差异对不同的***中的采集文件的采集规则进行修改。如此便可以得到较为统一的数据采集文件,由在不同的主机***架构下生成的采集文件中的数据记录均是相互匹配的,其他***就可以正常使用不同的主机***架构生成的采集文件。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
第一实施例
参见图1,该图为本申请实施例提供的一种数据记录的匹配方法的流程图。
在本申请实施例中,所述方法例如可以通过如下步骤S101-S103实现。
S101:获取在不同的主机***架构下生成的采集文件;其中,所述采集文件是针对相同数据进行数据采集生成的文件种类相同的采集文件。
需要说明的是,本申请实施例中的主机***架构是指计算机主机的指令集架构,本申请实施例中不限定主机***架构的具体种类以及不同主机***架构的数量,可以根据实际调整的需要进行选择,在一种可能的实现方式中,不同的主机***架构中可以有X86架构。
需要说明的是,本申请实施例中不限定采集文件的种类和形式,在一种可能的实现方式中,采集文件可以为表格文件。可以理解的是,采集文件具有多种,本申请实施例中不限定采集文件的种类。但是,在不同的主机***架构下生成的用于匹配数据的采集文件应当是同一种采集文件。
可以理解的是,本申请实施例中的采集文件是指数据采集文件,可以由表格文件体现的,可以由表头、表尾、记录数据部分的固定格式构成,其中记录数据部分每行数据都是针对于同一个记录对象,每一列均是对于记录对象的数据一种类型。同一个记录对象的一个或者多个数据可以称为一条记录,不同的数据所代表的类型可以称为栏位。例如,数据库中具有用户的各种信息,数据采集文件中的数据记录可能是每个用户的姓名、年龄、手机号码的数据。一个用户的姓名数据、年龄数据、手机号码数据组成一条记录,而“姓名”、“年龄”、“手机号码”为数据的类型,也就是栏位。
本申请实施例中获取的采集文件的数量可以为两个或者两个以上,同一种主机***架构可以对应于一个或者多个采集文件。
可以理解的是,本申请实施例中的相同数据可以为同一个数据库中的数据。
S102:分别获取所述在不同的主机***架构下生成的采集文件中的数据记录结果;比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异。
需要说明的是,本申请实施例中不限定数据记录结果所包括的内容,可以根据采集文件的具体设定进行设置,可以为采集文件中数据记录的数量,也可以为数据的类型。
可以理解的是,本申请实施例中比较数据记录结果,可以为通过将不同的采集文件中的数据记录结果先进行整理,在根据整理的结果进行比较。例如,根据第一采集文件中记录的所有的数据,可以整理得到第一采集文件中数据记录具有100条,记录的数据类型有3种,分别为“姓名”、“年龄”、“手机号码”,而第二采集文件中数据记录具有50条,记录的数据类型有4种,分别为“姓名”、“年龄”、“手机号码”、“账户余额”,根据整理的结果进行比较。
本申请实施例中不限定数据记录结果的具体表现形式,在一种可能的实现方式中,可以直接为采集文件中的数据记录部分,也可以是对记录的数据整理后生成的数据记录结果。
可以理解的是,数据记录差异可以以文本的形式保存,数据记录差异与所比较的数据记录结果相对应。当所述数据记录结果具有数据记录数量时,所述数据记录差异具有记录数量差异,当所述数据记录结果具有数据类型时,所述数据记录差异具有数据类型差异。
需要说明的是,本申请实施例中不限定比较方式,在一种可能的实现方式中,可以是两两进行对比。
S103:从所述采集文件中选择标准采集文件,根据所述数据记录差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的生成规则,使得所述不同主机***架构中采集文件的数据与所述标准采集文件中的数据记录相匹配。
需要说明的是,本申请实施例中不限定标准采集文件所属的主机***架构,可以根据实际需要进行选择。可以在进行比较之前进行标准采集文件的选择,也可以在生成数据记录差异之后进行选择。
可以理解的是,采集文件的生成规则是与主机***架构相关的。
可以理解的是,本申请实施例中的调整生成规则可以对生成采集文件的具体指令进行修改,也可以针对采集文件生成规则中的部分参数进行修改,本申请实施例不限定调整的具体方式,可以根据采集文件的具体的生成规则以及数据记录结果决定。
由上可知,本申请实施例提供的一种数据记录的匹配方法通过比较在不同的主机***架构下生成的采集文件的数据记录结果,得到数据记录差异,并根据数据记录差异和所选择的标准采集文件对采集文件的生成规则进行调整,可以得到数据记录相匹配的采集文件。解决了现有技术中采集文件由于是在不同的架构下生成的导致数据记录不匹配的问题。
第二实施例
在上述第一实施例中,通过对采集文件中的数据记录结果进行对比,得到记录结果差异,根据记录结果差异并且选择标准采集文件,对不同的主机***架构下的采集文件的生成规则进行调整。但是,实际生成的采集文件中可能具有数量较大的数据记录,如果将每个采集文件中的全部的数据记录都进行比较,速度较慢并且影响计算能力。
针对上述情况,本申请提供了另一种数据记录的匹配方法,图2为本申请实施例提供的另一种数据记录的匹配方法的流程图。
下面对该实施例进行详细的说明,在本实施例中,所述方法例如可以通过如下步骤S201-S204实现。
S201:获取在不同的主机***架构下生成的采集文件;其中,所述采集文件是针对相同数据进行数据采集生成的文件种类相同的采集文件。
S202:分别从所述在不同的主机***架构下生成的采集文件的数据记录中选取相同预设数量的数据记录,根据所述选取的数据记录获取所述在不同的主机***架构下生成的采集文件中的数据记录结果;其中,所述数据记录结果具有数据记录数量和/或数据类型;比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异。
需要说明的是,本申请实施例中不限定选取数据记录的方式,在一种可能的实现方式中,可以通过抽样选取,也可以根据数据记录的类型分类抽取。
可以理解的是,本申请实施例中的数据记录结果可以为数据记录数量以及数据类型中的一种或两种。
需要说明的是,当数据记录结果为数据类型时,可以将所述数据记录结果中的数据类型按照预设的排列顺序进行排序,依次比较所述排序后的数据类型中具有的数据,得到所述在不同的主机***架构下生成的采集文件的数据类型差异。由于不同的采集文件中记录的数据类型多顺序并不一致,所以可以将数据类型进行排序,按照顺序进行比较。本申请实施例中不限定排序的方法,在一种可能的实现方式中,可以通过冒泡排序先将采集文件中的数据类型的顺序进行整理,再进行比较。
需要说明的是,当数据记录结果为数据类型时,可以从所述数据记录结果中具有的数据类型中选取的预先设置的比对数据类型,比较所述比对数据类型中具有的数据,得到所述在不同的主机***架构下生成的采集文件的数据类型差异。其中,预先设置的比对数据类型可以根据数据采集的需要进行设置,可以从采集文件的数据类型中选择需要的数据类型进行比对。
可以理解的是,在一种可能实现的方式中各个数据类型可以由特殊分隔符进行分隔。
S203:从所述采集文件中选择标准采集文件,根据所述数据记录差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的生成规则,使得所述不同主机***架构中采集文件的数据与所述标准采集文件中的数据记录相匹配。
可以理解的是,采集文件的生成规则和主机***架构有关,并且不同种类的采集文件的规则也不相同。
本申请实施例中不限定调整的具体的生成规则,以及调整的方式,在一种可能的实现方式中,当所述数据记录结果具有数据记录数量时,所述数据记录差异具有记录数量差异,根据所述记录数量差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的数据采集规则。在另一种可能的实现方式中,当所述数据记录结果具有数据类型时,所述数据记录差异具有数据类型差异,所述根据所述数据类型差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的数据分类规则。
可以理解的是,为了确保根据调整后的采集文件生成规则可以生成数据记录相匹配的采集文件,可以将调整生成规则后生成的采集文件再次进行对比。
S204:根据所述采集文件的文件种类获取预设文件格式,判断所述在不同的主机***架构下生成的采集文件的文件格式是否符合预设文件格式;若不符合,修正所述采集文件的文件格式。
可以理解的是,相同种类的采集文件可能文件格式并不一致,可以根据预设的文件格式对不符合的采集文件进行文件格式的修正。预设文件格式可以为其他下游***所能够读取、处理的文件格式。本申请实施例中不限定文件格式的修正方法,在一种可能的实现方式中,可以通过文件格式的转换。
需要说明的是,文件格式可以包括文件名称,可以根据标准采集文件的名称对其他采集文件的名称进行重命名。
在本申请实施例中,通过选取采集文件中的部分数据记录进行数据记录结果的对比和数据记录差异的获取,减小了对采集文件中全部的数据记录的对比产生的运行压力,可以相应的减小计算机的计算压力,并且可以较快的得到比较结果。
第三实施例
图3为本申请实施例提供的一种数据记录的匹配装置的结构示意图。
例如具体可以包括:
获取单元301,可以用于获取在不同的主机***架构下生成的采集文件;其中,所述采集文件是针对相同数据进行数据采集生成的文件种类相同的采集文件;
比较单元302,可以用于分别获取所述在不同的主机***架构下生成的采集文件中的数据记录结果;比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异;
调整单元303,可以用于从所述采集文件中选择标准采集文件,根据所述数据记录差异和所述标准采集文件,调整不同的主机***架构中采集文件的生成规则,使得所述不同主机***架构中采集文件的数据与所述标准采集文件中的数据记录相匹配。
可以理解的是,所述装置还可以包括:
抽样单元,用于分别从所述在不同的主机***架构下生成的采集文件的数据记录中选取相同预设数量的数据记录,根据所述选取的数据记录获取所述在不同的主机***架构下生成的采集文件中的数据记录结果。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元及模块可以是或者也可以不是物理上分开的。另外,还可以根据实际的需要选择其中的部分或者全部单元和模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (7)
1.一种数据记录的匹配方法,其特征在于,包括:
获取在不同的主机***架构下生成的采集文件;其中,所述采集文件是针对相同数据进行数据采集生成的文件种类相同的采集文件;
分别获取所述在不同的主机***架构下生成的采集文件中的数据记录结果;所述数据记录结果具有数据记录数量和数据类型;
比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异;
所述比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异,包括:
通过冒泡排序的方式对所述数据记录结果中的数据类型的顺序进行整理,依次比较排序后的数据类型中具有的数据,得到所述在不同的主机***架构下生成的采集文件的数据类型差异和记录数量差异;
从所述采集文件中选择标准采集文件,根据所述数据记录差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的生成规则,使得所述在不同的主机***架构下生成的采集文件的数据记录与所述标准采集文件中的数据记录相匹配;
所述根据所述数据记录差异和所述标准采集文件的数据记录结果,调整不同主机***架构中采集文件的生成规则,包括:
根据数据类型差异、记录数量差异和标准采集文件的数据记录结果,调整不同主机***架构中采集文件的数据生成规则。
2.根据权利要求1所述的方法,其特征在于,所述分别获取所述采集文件中的数据记录结果,包括:
分别从所述在不同的主机***架构下生成的采集文件的数据记录中选取相同预设数量的数据记录,根据所述选取的数据记录获取所述在不同的主机***架构下生成的采集文件中的数据记录结果。
3.根据权利要求1所述的方法,其特征在于,当所述数据记录结果具有数据类型时,所述数据记录差异具有数据类型差异;
所述根据所述数据记录差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的生成规则,具体包括:
根据所述数据类型差异和所述标准采集文件的数据记录结果,调整不同的主机***架构中采集文件的数据分类规则。
4.根据权利要求1所述的方法,其特征在于,当所述数据记录结果中具有数据类型时,所述比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异,具体包括:
从所述数据记录结果中具有的数据类型中选取的预先设置的比对数据类型,比较所述比对数据类型中具有的数据,得到所述在不同的主机***架构下生成的采集文件的数据类型差异。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述采集文件的文件种类获取预设文件格式,判断所述在不同的主机***架构下生成的采集文件的文件格式是否符合预设文件格式;若不符合,修正所述采集文件的文件格式。
6.一种数据记录的匹配装置,其特征在于,包括:
获取单元,用于获取在不同的主机***架构下生成的采集文件;其中,所述采集文件是针对相同数据进行数据采集生成的文件种类相同的采集文件;数据记录结果具有数据记录数量和数据类型;
比较单元,用于分别获取所述在不同的主机***架构下生成的采集文件中的数据记录结果;比较所述数据记录结果,得到所述在不同的主机***架构下生成的采集文件的数据记录差异;
所述比较单元,具体用于:
通过冒泡排序的方式对所述数据记录结果中的数据类型的顺序进行整理,依次比较排序后的数据类型中具有的数据,得到所述在不同的主机***架构下生成的采集文件的数据类型差异和记录数量差异;
调整单元,用于从所述采集文件中选择标准采集文件,根据所述数据记录差异和所述标准采集文件,调整不同的主机***架构中采集文件的生成规则,使得所述不同主机***架构中采集文件的数据与所述标准采集文件中的数据记录相匹配;
所述调整单元,具体用于:
根据数据类型差异、记录数量差异和标准采集文件的数据记录结果,调整不同主机***架构中采集文件的数据生成规则。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
抽样单元,用于分别从所述在不同的主机***架构下生成的采集文件的数据记录中选取相同预设数量的数据记录,根据所述选取的数据记录获取所述在不同的主机***架构下生成的采集文件中的数据记录结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010003028.6A CN111221777B (zh) | 2020-01-02 | 2020-01-02 | 一种数据记录的匹配方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010003028.6A CN111221777B (zh) | 2020-01-02 | 2020-01-02 | 一种数据记录的匹配方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111221777A CN111221777A (zh) | 2020-06-02 |
CN111221777B true CN111221777B (zh) | 2024-01-30 |
Family
ID=70832239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010003028.6A Active CN111221777B (zh) | 2020-01-02 | 2020-01-02 | 一种数据记录的匹配方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111221777B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114510267B (zh) * | 2022-04-20 | 2023-03-21 | 麒麟软件有限公司 | 基于Linux***的程序ABI接口兼容性计算方法 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079749A (zh) * | 2007-06-27 | 2007-11-28 | ***通信集团四川有限公司 | 数据一致性检测方法 |
CN104866943A (zh) * | 2015-03-19 | 2015-08-26 | 国家电网公司 | 基于cim/e文件的分布式数据采集***主备调同步方法 |
CN105808772A (zh) * | 2016-03-28 | 2016-07-27 | 中国建设银行股份有限公司 | 一种数据定义文件生成方法及装置 |
CN105843871A (zh) * | 2016-03-18 | 2016-08-10 | ***股份有限公司 | 分布式应用文件的控制与管理*** |
CN106201502A (zh) * | 2016-07-06 | 2016-12-07 | ***股份有限公司 | 一种跨主机应用程序部署方法及装置 |
CN106294125A (zh) * | 2016-07-25 | 2017-01-04 | 重庆农村商业银行股份有限公司 | 银行核心***数据处理方法 |
CN107833637A (zh) * | 2017-06-19 | 2018-03-23 | 平安医疗健康管理股份有限公司 | 药品规则记录更新方法、装置、计算机设备及介质 |
CN108521527A (zh) * | 2018-03-14 | 2018-09-11 | 北京思特奇信息技术股份有限公司 | 话单差异检测方法、***、计算机存储介质及计算机设备 |
CN108647935A (zh) * | 2018-05-07 | 2018-10-12 | 山东浪潮通软信息科技有限公司 | 一种财务凭证生成规则更新方法及装置 |
CN109460268A (zh) * | 2018-11-19 | 2019-03-12 | 中国银行股份有限公司 | 应用参数配置方法、装置和*** |
CN109598602A (zh) * | 2017-09-28 | 2019-04-09 | 平安普惠企业管理有限公司 | 对账方法、装置、设备及计算机可读存储介质 |
CN110324356A (zh) * | 2019-07-17 | 2019-10-11 | 陕西千山航空电子有限责任公司 | 一种多类总线数据的混合数据包处理方法 |
CN110457302A (zh) * | 2019-07-31 | 2019-11-15 | 河南开合软件技术有限公司 | 一种结构化数据智能清洗方法 |
WO2019227689A1 (zh) * | 2018-06-01 | 2019-12-05 | 平安科技(深圳)有限公司 | 数据监控方法、装置、计算机设备及存储介质 |
CN110619115A (zh) * | 2019-08-30 | 2019-12-27 | 深圳壹账通智能科技有限公司 | 一种模板创建方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10671646B2 (en) * | 2016-12-22 | 2020-06-02 | Aon Global Operations Ltd (Singapore Branch) | Methods and systems for linking data records from disparate databases |
-
2020
- 2020-01-02 CN CN202010003028.6A patent/CN111221777B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079749A (zh) * | 2007-06-27 | 2007-11-28 | ***通信集团四川有限公司 | 数据一致性检测方法 |
CN104866943A (zh) * | 2015-03-19 | 2015-08-26 | 国家电网公司 | 基于cim/e文件的分布式数据采集***主备调同步方法 |
CN105843871A (zh) * | 2016-03-18 | 2016-08-10 | ***股份有限公司 | 分布式应用文件的控制与管理*** |
CN105808772A (zh) * | 2016-03-28 | 2016-07-27 | 中国建设银行股份有限公司 | 一种数据定义文件生成方法及装置 |
CN106201502A (zh) * | 2016-07-06 | 2016-12-07 | ***股份有限公司 | 一种跨主机应用程序部署方法及装置 |
CN106294125A (zh) * | 2016-07-25 | 2017-01-04 | 重庆农村商业银行股份有限公司 | 银行核心***数据处理方法 |
CN107833637A (zh) * | 2017-06-19 | 2018-03-23 | 平安医疗健康管理股份有限公司 | 药品规则记录更新方法、装置、计算机设备及介质 |
CN109598602A (zh) * | 2017-09-28 | 2019-04-09 | 平安普惠企业管理有限公司 | 对账方法、装置、设备及计算机可读存储介质 |
CN108521527A (zh) * | 2018-03-14 | 2018-09-11 | 北京思特奇信息技术股份有限公司 | 话单差异检测方法、***、计算机存储介质及计算机设备 |
CN108647935A (zh) * | 2018-05-07 | 2018-10-12 | 山东浪潮通软信息科技有限公司 | 一种财务凭证生成规则更新方法及装置 |
WO2019227689A1 (zh) * | 2018-06-01 | 2019-12-05 | 平安科技(深圳)有限公司 | 数据监控方法、装置、计算机设备及存储介质 |
CN109460268A (zh) * | 2018-11-19 | 2019-03-12 | 中国银行股份有限公司 | 应用参数配置方法、装置和*** |
CN110324356A (zh) * | 2019-07-17 | 2019-10-11 | 陕西千山航空电子有限责任公司 | 一种多类总线数据的混合数据包处理方法 |
CN110457302A (zh) * | 2019-07-31 | 2019-11-15 | 河南开合软件技术有限公司 | 一种结构化数据智能清洗方法 |
CN110619115A (zh) * | 2019-08-30 | 2019-12-27 | 深圳壹账通智能科技有限公司 | 一种模板创建方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111221777A (zh) | 2020-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105653700B (zh) | 视频检索方法及*** | |
CN111400392B (zh) | 多源异构数据处理方法及装置 | |
WO2013185107A1 (en) | Systems and methods for recognizing ambiguity in metadata | |
JP2010541092A5 (zh) | ||
CN110275861A (zh) | 数据存储方法及装置、存储介质、电子装置 | |
US9342599B2 (en) | Methods and systems for centralized audio and video news product collection, optimization, storage, and distribution | |
CN115391439B (zh) | 文档数据导出方法、装置、电子设备和存储介质 | |
CN111221777B (zh) | 一种数据记录的匹配方法及装置 | |
CN109446520B (zh) | 用于构建知识库的数据聚类方法及装置 | |
CN113901098A (zh) | 一种基于模板的数据导出方法、装置、介质和设备 | |
EP2518668A1 (en) | Apparatus and method for visualizing technology transition | |
CN107506407B (zh) | 一种文件分类、调用的方法及装置 | |
CN106856450B (zh) | 基于社交网络的社交信息生成方法和装置 | |
CN106649583A (zh) | 一种基于sas的图书借阅数据关联规则分析方法 | |
CN109542890B (zh) | 数据修改方法、装置、计算机设备及存储介质 | |
CN112800246B (zh) | 一种政策谱系构建方法、装置和电子设备 | |
EP3828712A1 (en) | Data parsing method and device | |
CN112214494B (zh) | 检索方法及装置 | |
CN112752165B (zh) | 字幕处理方法、装置、服务器及计算机可读存储介质 | |
CN111984657B (zh) | 数据归集方法、装置、存储介质及计算机设备 | |
CN111897778B (zh) | 一种计算机文件合并方法、装置及*** | |
CN112990466A (zh) | 一种冗余规则检测方法、装置以及服务器 | |
CN114253960B (zh) | 面向电子***报销入账和归档一体化的业务中台*** | |
CN110858214A (zh) | 推荐模型训练、及进一步审计程序推荐方法、装置及设备 | |
CN116071740B (zh) | ***识别方法、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |