CN109344132B - 用户信息的合并方法、计算机可读存储介质及终端设备 - Google Patents

用户信息的合并方法、计算机可读存储介质及终端设备 Download PDF

Info

Publication number
CN109344132B
CN109344132B CN201811018263.XA CN201811018263A CN109344132B CN 109344132 B CN109344132 B CN 109344132B CN 201811018263 A CN201811018263 A CN 201811018263A CN 109344132 B CN109344132 B CN 109344132B
Authority
CN
China
Prior art keywords
information
user information
keywords
user
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811018263.XA
Other languages
English (en)
Other versions
CN109344132A (zh
Inventor
程相
张昆轮
邓乾喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201811018263.XA priority Critical patent/CN109344132B/zh
Publication of CN109344132A publication Critical patent/CN109344132A/zh
Application granted granted Critical
Publication of CN109344132B publication Critical patent/CN109344132B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用于数据处理技术领域,提供了一种用户信息的合并方法、计算机可读存储介质及终端设备,包括:获取至少两组用户信息,并分别提取每一组用户信息中的信息类型关键字;根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,所述剩余信息为所述用户信息中除所述信息类型关键字外的信息;根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对;若所述至少两组用户信息中存在完全相同的用户信息,则保存其中一组用户信息,并删除与该组用户信息相同的用户信息。通过上述方法,有效减少了用户信息的冗余,避免了冗余信息占用大量的存储空间。

Description

用户信息的合并方法、计算机可读存储介质及终端设备
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户信息的合并方法、计算机可读存储介质及终端设备。
背景技术
随着信息技术的高速发展,各种应用***大量涌现,需要采集的数据量越来越多,数据处理任务越来越重。数据采集是信息技术中重要的基础工作,现有采集的数据格式各异,以用户信息为例,用户信息可能来自很多不同的应用***,不同的应用***存在采集信息格式不一致的问题。由于采集的信息格式不一致,有可能会出现信息冗余、重复等情况。现有对用户信息合并除重等,大都由人工手动完成,速度慢、效率低,不利于后续数据分析、维护等,无法及时对用户潜在价值进行挖掘。
发明内容
有鉴于此,本发明实施例提供了一种用户信息的合并方法、计算机可读存储介质及终端设备,以解决现有技术中用户信息冗余、占用大量存储空间的问题。
本发明实施例的第一方面,提供了一种用户信息的合并方法,可以包括:
获取至少两组用户信息,并分别提取每一组用户信息中的信息类型关键字;
根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,所述剩余信息为所述用户信息中除所述信息类型关键字外的信息;
根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对;
若所述至少两组用户信息中存在完全相同的用户信息,则保存其中一组用户信息,并删除与该组用户信息相同的用户信息。
本发明实施例的第二方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
获取至少两组用户信息,并分别提取每一组用户信息中的信息类型关键字;
根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,所述剩余信息为所述用户信息中除所述信息类型关键字外的信息;
根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对;
若所述至少两组用户信息中存在完全相同的用户信息,则保存其中一组用户信息,并删除与该组用户信息相同的用户信息。
本发明实施例的第三方面,提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
获取至少两组用户信息,并分别提取每一组用户信息中的信息类型关键字;
根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,所述剩余信息为所述用户信息中除所述信息类型关键字外的信息;
根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对;
若所述至少两组用户信息中存在完全相同的用户信息,则保存其中一组用户信息,并删除与该组用户信息相同的用户信息。
本发明实施例与现有技术相比存在的有益效果是:
本发明实施例通过根据信息类型关键字和剩余信息,将至少两组用户信息进行比对,通过上述方法能够快速地在至少两组用户信息中找到完全相同的用户信息;在找到完全相同的多组用户信息后,只保存一组用户信息,删除其余的与该组用户信息相同的用户信息,通过上述方法,有效减少了用户信息的冗余,且有效避免了冗余信息占用大量的存储空间。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的用户信息的合并方法的实现流程示意图;
图2是本发明实施例提供的用户信息的合并装置的示意图;
图3是本发明实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1是本发明实施例提供的用户信息的合并方法的实现流程示意图,如图所示,所述方法可以包括以下步骤:
步骤S101,获取至少两组用户信息,并分别提取每一组用户信息中的信息类型关键字。
其中,所述信息类型关键字可以包括以下至少一项:
身份标识关键字、性别关键字、联系方式关键字、身份标识关键字的别名、性别关键字的别名、联系方式关键字的别名。
所述身份标识关键字包括以下至少一项:姓名、身份证号。
所述性别关键字包括:性别。
所述联系方式关键字包括以下至少一项:手机号码、电子邮箱。
所述身份标识关键字的别名包括以下至少一项:名字、身份证。
所述性别关键字的别名包括:性别信息。
所述联系方式关键字的别名包括以下至少一项:手机号、邮箱。
在实际应用中,身份标识关键字还可以包括指纹、人脸图像、驾驶证号、护照号等。联系方式关键字还可以包括微信、QQ、MSN等。关键字的别名是关键字的另一种叫法,关键字的别名可以有很多,只要与关键字所表示的意思是一致的即可。例如,身份表示关键字的别名还可以包括称呼、证件号等,联系方式关键字的别名还可以包括Q号、QQ号、微信号、微信号码、微信账号等。
在实际应用中,提取用户信息中的信息类型关键字之前,可以预先定义信息类型关键字,预先定义信息类型关键字包括:预先定义身份标识关键字、性别关键字、联系方式关键字。还包括:预先定义身份标识关键字的别名,并建立身份标识关键字与身份标识关键字的别名的对应关系;预先定义性别关键字的别名,并建立性别关键字与性别关键字的别名的对应关系;预先定义联系方式关键字的别名,并建立联系方式关键字的别名与联系方式关键字的对应关系。
示例性的,预先定义联系方式关键字有手机号码、电子邮箱,预先定义联系方式关键字的别名有手机号、邮箱。则将手机号码与手机号进行关联,将电子邮箱与邮箱进行关联。换句话说,手机号是手机号码的别名,邮箱是电子邮箱的别名。
当然,在实际应用中,除了身份标识、性别、联系方式外,还可以有其他类型的关键字,在此不做限定。
步骤S102,根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,所述剩余信息为所述用户信息中除所述信息类型关键字外的信息。
示例性的,假设用户信息为“姓名张三,性别男,手机号码12345678901”。信息类型关键字为姓名、性别、手机号码,则剩余信息为张三、男、12345678901。
在本发明实施例中,所述根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,包括:
根据所述信息类型关键字对所述用户信息进行划分,得到至少两条子信息,每条子信息中只包含一个信息类型关键字。
从所述子信息中剔除所述信息类型关键字,得到所述子信息的剩余信息。
在实际应用中,根据信息类型关键字对用户信息进行划分,是将每组用户信息划分为至少两条子信息,每条子信息中只包含一个信息类型关键字。具体的,可以在用户信息中检测信息类型关键字,将每个信息类型关键字的第一个字到下一个信息类型关键字的第一个字的前一个字中间所包含的信息作为一个子信息。
示例性的,用户信息为“姓名张三,性别男,手机号码12345678901”。检测到的信息类型关键字为姓名、性别、手机号码。将“姓名”的第一个字到“性别”的第一个字的前一个字中间的信息作为一个子信息,则第一条子信息为“姓名张三”;将“性别”的第一个字到“手机号码”的第一个字的前一个字中间的信息作为一个子信息,则第二条子信息为“性别男”。依次类推,则第三条子信息为“手机号码12345678901”。分别将每条子信息中的信息类型关键字剔除,则得到:第一条子信息的剩余信息为“张三”,第二条子信息的剩余信息为“男”,第三条子信息的剩余信息为“12345678901”。
需要说明的是,上述只是如果对用户信息进行子信息划分的一个示例,还可以用其他方法进行划分,只要是能将一个信息类型关键字和该信息类型关键字对应的剩余信息划分为一个子信息即可,具体划分方法不做限定。
步骤S103,根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对。
在本发明实施例中,所述根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对,包括:
将所述子信息中的信息类型关键字与该子信息的剩余信息进行关联,得到关联结果。
根据所述信息类型关键字、所述剩余信息以及所述关联结果,将获取的至少两组用户信息进行比对。
如步骤S102中的示例,第一条子信息中的关键字为“姓名”,第一条子信息的剩余信息为“张三”,将“张三”与“姓名”关联,则可得到“张三”对应的信息类型关键字为“姓名”。
在实际应用中,根据信息类型关键字、剩余信息、关联结果,将至少两组用户信息进行比对,可以是,分别找到各组用户信息中的信息类型关键字、剩余信息,然后分别比较各组用户信息中的信息类型关键字是否相同,如果相同,则继续比较剩余信息是否相同;判断剩余信息是否相同,既要比较剩余信息本身是否相同,又要根据关联结果,比较剩余信息对应的信息类型关键字是否相同。如果两组用户信息中,信息类型关键字均相同,剩余信息也均相同,则说明这两组用户信息相同。
示例性的,有两组用户信息A和B,用户信息A为“姓名张三,性别男”,用户信息B为“名称张三,性别男”。首先比对两组用户信息中的信息类型关键字,A和B中都只有两个信息类型关键字,且A中“姓名”与B中“名称”为相同的信息类型关键字(名称是姓名的别名),A中的“性别”与B中“性别”为相同的信息类型关键字,所以A和B中信息类型关键字均相同。继续比较剩余信息,A和B中都只有两条剩余信息。A中“张三”与B中“张三”内容相同,且这两个剩余信息对应的信息类型关键字均为“姓名”,所以A中的“张三”与B中的“张三”为相同的剩余信息;A中的“男”与B中的“男”内容相同,且这两个剩余信息对应的信息类型关键字均为“性别”,所以A中的“男”与B中的“男”为相同的剩余信息。综上,A和B中,所有的信息类型关键字相同、所有的剩余信息相同,所以,A和B为相同的用户信息。
需要说明的是,上述只是如何对至少两组用户信息进行比对的一个示例,还可以有其他比对方法,只要能够得到各组用户信息是否相同或不同的比对结果即可,并不对比对方法做具体限定。
在本发明实施例中,所述将获取的至少两组用户信息进行比对,包括:
分别对每一组用户信息进行检测,得到每一组用户信息的检测结果;
根据所述每一组用户信息的检测结果,确定所述至少两组用户信息是否均为完整的用户信息;
若所述至少两组用户信息均为完整的用户信息,则将获取的至少两组用户信息进行比对。
在实际应用中,对各组用户信息进行比对,首先要确定各组用户信息是否完整,如果不完整,则不能进行比对;只有完整,才可以进行比对。
在本发明实施例中,所述分别对每一组用户信息进行检测,得到每一组用户信息的检测结果,包括:
检测所述用户信息是否包含所述信息类型关键字。
如果所述用户信息中不包含所述信息类型关键字,则当前用户信息的检测结果为用户信息不完整。
如果所述用户信息中包含所述信息类型关键字,则检测所述用户信息中是否包含与所述信息类型关键字关联的剩余信息。
若所述用户信息中包含与所述信息类型关键字关联的剩余信息,则当前用户信息的检测结果为用户信息完整。
若所述用户信息中不包含与所述信息类型关键字关联的剩余信息,则当前用户信息的检测结果为用户信息不完整。
在实际应用中,判断用户信息是否完整,实际就是判断该用户信息中是否包含至少一个信息类型关键字,且该信息类型关键字对应的剩余信息不为空。如果满足上述条件,则说明用户信息是完整的。缺少任一项,则用户信息就是不完整的。
步骤S104,若所述至少两组用户信息中存在完全相同的用户信息,则保存其中一组用户信息,并删除与该组用户信息相同的用户信息。
示例性的,有三组用户信息A、B、C。经过比对可知,A和B为完全相同的用户信息,而C与A、B不同。则将A保存,删除B,且保存C。也可以将B保存,删除A,且保存C。只要A和B中保存一组,删除另一组即可。
本发明实施例通过根据信息类型关键字和剩余信息,将至少两组用户信息进行比对,通过上述方法能够快速地在至少两组用户信息中找到完全相同的用户信息;在找到完全相同的多组用户信息后,只保存一组用户信息,删除其余的与该组用户信息相同的用户信息,通过上述方法,有效减少了用户信息的冗余,且有效避免了冗余信息占用大量的存储空间。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图2是本发明实施例提供的用户信息的合并装置的示意图,为了便于说明,仅示出与本发明实施例相关的部分。
图2所示的用户信息的合并装置可以是内置于现有的终端设备内的软件单元、硬件单元、或软硬结合的单元,也可以作为独立的挂件集成到所述终端设备中,还可以作为独立的终端设备存在。
如图所示,所述用户信息的合并装置2包括:
获取单元21,用于获取至少两组用户信息,并分别提取每一组用户信息中的信息类型关键字。
提取单元22,用于根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,所述剩余信息为所述用户信息中除所述信息类型关键字外的信息。
对比单元23,用于根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对。
删除单元24,用于若所述至少两组用户信息中存在完全相同的用户信息,则保存其中一组用户信息,并删除与该组用户信息相同的用户信息。
可选的,所述提取单元22包括:
划分模块,用于根据所述信息类型关键字对所述用户信息进行划分,得到至少两条子信息,每条子信息中只包含一个信息类型关键字。
剔除模块,用于从所述子信息中剔除所述信息类型关键字,得到所述子信息的剩余信息。
可选的,所述对比单元23包括:
关联模块,用于将所述子信息中的信息类型关键字与该子信息的剩余信息进行关联,得到关联结果。
第一比对模块,用于根据所述信息类型关键字、所述剩余信息以及所述关联结果,将获取的至少两组用户信息进行比对。
可选的,所述对比单元23还包括:
检测模块,用于分别对每一组用户信息进行检测,得到每一组用户信息的检测结果。
确定模块,用于根据所述每一组用户信息的检测结果,确定所述至少两组用户信息是否均为完整的用户信息。
第二比对模块,用于若所述至少两组用户信息均为完整的用户信息,则将获取的至少两组用户信息进行比对。
可选的,所述检测模块包括:
第一检测子模块,用于检测所述用户信息是否包含所述信息类型关键字。
第一结果子模块,用于如果所述用户信息中不包含所述信息类型关键字,则当前用户信息的检测结果为用户信息不完整。
第二检测子模块,用于如果所述用户信息中包含所述信息类型关键字,则检测所述用户信息中是否包含与所述信息类型关键字关联的剩余信息。
第二结果子模块,用于若所述用户信息中包含与所述信息类型关键字关联的剩余信息,则当前用户信息的检测结果为用户信息完整。
第三结果子模块,用于若所述用户信息中不包含与所述信息类型关键字关联的剩余信息,则当前用户信息的检测结果为用户信息不完整。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述***中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图3是本发明实施例提供的终端设备的示意图。如图3所示,该实施例的终端设备3包括:处理器30、存储器31以及存储在所述存储器31中并可在所述处理器30上运行的计算机程序32。所述处理器30执行所述计算机程序32时实现上述各个用户信息的合并方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器30执行所述计算机程序32时实现上述各装置实施例中各模块/单元的功能,例如图2所示模块21至24的功能。
示例性的,所述计算机程序32可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序32在所述终端设备3中的执行过程。例如,所述计算机程序32可以被分割成获取单元、提取单元、对比单元、删除单元,各单元具体功能如下:
获取单元,用于获取至少两组用户信息,并分别提取每一组用户信息中的信息类型关键字。
提取单元,用于根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,所述剩余信息为所述用户信息中除所述信息类型关键字外的信息。
对比单元,用于根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对。
删除单元,用于若所述至少两组用户信息中存在完全相同的用户信息,则保存其中一组用户信息,并删除与该组用户信息相同的用户信息。
可选的,所述提取单元包括:
划分模块,用于根据所述信息类型关键字对所述用户信息进行划分,得到至少两条子信息,每条子信息中只包含一个信息类型关键字。
剔除模块,用于从所述子信息中剔除所述信息类型关键字,得到所述子信息的剩余信息。
可选的,所述对比单元包括:
关联模块,用于将所述子信息中的信息类型关键字与该子信息的剩余信息进行关联,得到关联结果。
第一比对模块,用于根据所述信息类型关键字、所述剩余信息以及所述关联结果,将获取的至少两组用户信息进行比对。
可选的,所述对比单元还包括:
检测模块,用于分别对每一组用户信息进行检测,得到每一组用户信息的检测结果。
确定模块,用于根据所述每一组用户信息的检测结果,确定所述至少两组用户信息是否均为完整的用户信息。
第二比对模块,用于若所述至少两组用户信息均为完整的用户信息,则将获取的至少两组用户信息进行比对。
可选的,所述检测模块包括:
第一检测子模块,用于检测所述用户信息是否包含所述信息类型关键字。
第一结果子模块,用于如果所述用户信息中不包含所述信息类型关键字,则当前用户信息的检测结果为用户信息不完整。
第二检测子模块,用于如果所述用户信息中包含所述信息类型关键字,则检测所述用户信息中是否包含与所述信息类型关键字关联的剩余信息。
第二结果子模块,用于若所述用户信息中包含与所述信息类型关键字关联的剩余信息,则当前用户信息的检测结果为用户信息完整。
第三结果子模块,用于若所述用户信息中不包含与所述信息类型关键字关联的剩余信息,则当前用户信息的检测结果为用户信息不完整。
所述终端设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图3仅仅是终端设备3的示例,并不构成对终端设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器31可以是所述终端设备3的内部存储单元,例如终端设备3的硬盘或内存。所述存储器31也可以是所述终端设备3的外部存储设备,例如所述终端设备3上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器31还可以既包括所述终端设备3的内部存储单元也包括外部存储设备。所述存储器31用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (8)

1.一种用户信息的合并方法,其特征在于,包括:
获取至少两组用户信息,并分别提取每一组用户信息中的信息类型关键字;
根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,所述剩余信息为所述用户信息中除所述信息类型关键字外的信息;
根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对;
若所述至少两组用户信息中存在完全相同的用户信息,则保存其中一组用户信息,并删除与该组用户信息相同的用户信息;
其中,所述根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,包括:
根据所述信息类型关键字对所述用户信息进行划分,得到至少两条子信息,每条子信息中只包含一个信息类型关键字,所述信息类型关键字包括:身份标识关键字、性别关键字、联系方式关键字、身份标识关键字的别名、性别关键字的别名、联系方式关键字的别名;
从所述子信息中剔除所述信息类型关键字,得到所述子信息的剩余信息。
2.如权利要求1所述的用户信息的合并方法,其特征在于,所述根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对,包括:
将所述子信息中的信息类型关键字与该子信息的剩余信息进行关联,得到关联结果;
根据所述信息类型关键字、所述剩余信息以及所述关联结果,将获取的至少两组用户信息进行比对。
3.如权利要求2所述的用户信息的合并方法,其特征在于,所述将获取的至少两组用户信息进行比对,包括:
分别对每一组用户信息进行检测,得到每一组用户信息的检测结果;
根据所述每一组用户信息的检测结果,确定所述至少两组用户信息是否均为完整的用户信息;
若所述至少两组用户信息均为完整的用户信息,则将获取的至少两组用户信息进行比对。
4.如权利要求3所述的用户信息的合并方法,其特征在于,所述分别对每一组用户信息进行检测,得到每一组用户信息的检测结果,包括:
检测所述用户信息是否包含所述信息类型关键字;
如果所述用户信息中不包含所述信息类型关键字,则当前用户信息的检测结果为用户信息不完整;
如果所述用户信息中包含所述信息类型关键字,则检测所述用户信息中是否包含与所述信息类型关键字关联的剩余信息;
若所述用户信息中包含与所述信息类型关键字关联的剩余信息,则当前用户信息的检测结果为用户信息完整;
若所述用户信息中不包含与所述信息类型关键字关联的剩余信息,则当前用户信息的检测结果为用户信息不完整。
5.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述用户信息的合并方法的步骤。
6.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如下步骤:
获取至少两组用户信息,并分别提取每一组用户信息的信息类型关键字,
根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,所述剩余信息为所述用户信息中除所述信息类型关键字外的信息;
根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对;
若所述至少两组用户信息中存在完全相同的用户信息,则保存其中一组用户信息,并删除与该组用户信息相同的用户信息;
其中,所述根据所述信息类型关键字,分别提取每一组用户信息中的剩余信息,包括:
根据所述信息类型关键字对所述用户信息进行划分,得到至少两条子信息,每条子信息中只包含一个信息类型关键字,所述信息类型关键字包括:身份标识关键字、性别关键字、联系方式关键字、身份标识关键字的别名、性别关键字的别名、联系方式关键字的别名;
从所述子信息中剔除所述信息类型关键字,得到所述子信息的剩余信息。
7.如权利要求6所述的终端设备,其特征在于,所述根据所述信息类型关键字和所述剩余信息,将获取的至少两组用户信息进行比对,包括:
将所述子信息中的信息类型关键字与该子信息的剩余信息进行关联,得到关联结果;
根据所述信息类型关键字、所述剩余信息以及所述关联结果,将获取的至少两组用户信息进行比对。
8.如权利要求7所述的终端设备,其特征在于,所述将获取的至少两组用户信息进行比对,包括:
分别对每一组用户信息进行检测,得到每一组用户信息的检测结果;
根据所述每一组用户信息的检测结果,确定所述至少两组用户信息是否均为完整的用户信息;
若所述至少两组用户信息均为完整的用户信息,则将获取的至少两组用户信息进行比对。
CN201811018263.XA 2018-09-03 2018-09-03 用户信息的合并方法、计算机可读存储介质及终端设备 Active CN109344132B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811018263.XA CN109344132B (zh) 2018-09-03 2018-09-03 用户信息的合并方法、计算机可读存储介质及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811018263.XA CN109344132B (zh) 2018-09-03 2018-09-03 用户信息的合并方法、计算机可读存储介质及终端设备

Publications (2)

Publication Number Publication Date
CN109344132A CN109344132A (zh) 2019-02-15
CN109344132B true CN109344132B (zh) 2024-04-02

Family

ID=65296870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811018263.XA Active CN109344132B (zh) 2018-09-03 2018-09-03 用户信息的合并方法、计算机可读存储介质及终端设备

Country Status (1)

Country Link
CN (1) CN109344132B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075849A (ja) * 2007-09-20 2009-04-09 Canon Inc 情報処理装置、情報処理方法、そのプログラム及び記憶媒体
CN103095900A (zh) * 2011-11-07 2013-05-08 希姆通信息技术(上海)有限公司 手机中的信息整合方法及手机
CN103516856A (zh) * 2012-06-26 2014-01-15 腾讯科技(深圳)有限公司 信息合并方法和装置
CN104572946A (zh) * 2014-12-30 2015-04-29 小米科技有限责任公司 黄页数据处理方法及装置
CN107592398A (zh) * 2017-08-31 2018-01-16 上海爱优威软件开发有限公司 一种智能信息存储方法及***
CN108170731A (zh) * 2017-12-13 2018-06-15 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机存储介质及服务器
CN108388675A (zh) * 2018-03-26 2018-08-10 深圳市买买提信息科技有限公司 一种身份标识拉通方法及终端设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075849A (ja) * 2007-09-20 2009-04-09 Canon Inc 情報処理装置、情報処理方法、そのプログラム及び記憶媒体
CN103095900A (zh) * 2011-11-07 2013-05-08 希姆通信息技术(上海)有限公司 手机中的信息整合方法及手机
CN103516856A (zh) * 2012-06-26 2014-01-15 腾讯科技(深圳)有限公司 信息合并方法和装置
CN104572946A (zh) * 2014-12-30 2015-04-29 小米科技有限责任公司 黄页数据处理方法及装置
CN107592398A (zh) * 2017-08-31 2018-01-16 上海爱优威软件开发有限公司 一种智能信息存储方法及***
CN108170731A (zh) * 2017-12-13 2018-06-15 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机存储介质及服务器
CN108388675A (zh) * 2018-03-26 2018-08-10 深圳市买买提信息科技有限公司 一种身份标识拉通方法及终端设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种新的新闻信息处理模型;李倩, 朱友芹, 王永县;山东大学学报(理学版);20050630(03);全文 *

Also Published As

Publication number Publication date
CN109344132A (zh) 2019-02-15

Similar Documents

Publication Publication Date Title
CN109299164B (zh) 一种数据查询方法、计算机可读存储介质及终端设备
CN109977684B (zh) 一种数据传输方法、装置及终端设备
CN111159329B (zh) 敏感词检测方法、装置、终端设备和计算机可读存储介质
CN111460098B (zh) 文本匹配方法、装置及终端设备
CN110598008B (zh) 录制数据的数据质检方法及装置、存储介质
CN112732893B (zh) 文本信息的提取方法和装置、存储介质和电子设备
CN110765760A (zh) 一种法律案件分配方法、装置、存储介质和服务器
CN112783825A (zh) 数据归档方法、装置、计算机装置及存储介质
CN113032821A (zh) 数据脱敏方法、装置、电子设备及可读存储介质
CN114722199A (zh) 基于通话录音的风险识别方法、装置、计算机设备及介质
CN113010116A (zh) 一种数据处理方法、装置、终端设备及可读存储介质
CN117216239A (zh) 文本去重方法、装置、计算机设备及存储介质
CN109344132B (zh) 用户信息的合并方法、计算机可读存储介质及终端设备
CN107748705B (zh) ***evt日志碎片恢复的方法、终端设备及存储介质
CN107071553B (zh) 一种修改视频语音的方法、装置和计算机可读存储介质
CN115544214A (zh) 一种事件处理方法、设备及计算机可读存储介质
CN111611056A (zh) 数据处理方法、装置、计算机设备及存储介质
CN110971759A (zh) 退订短信的处理方法、装置及服务器
CN111786992A (zh) 会员注册和认证方法、终端设备及可读存储介质
Yudhana et al. Digital Forensic on Secure Digital High Capacity using DFRWS Method
CN111611417B (zh) 图像去重方法、装置、终端设备及存储介质
CN113392105B (zh) 业务数据处理方法和终端设备
CN117112846B (zh) 一种多信息源证照信息管理方法、***及介质
CN112905024B (zh) 单词的音节记录方法及装置
CN113127712B (zh) 一种归档方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant