CN116385157A - 用于征信信用主体识别的数据处理方法和装置 - Google Patents
用于征信信用主体识别的数据处理方法和装置 Download PDFInfo
- Publication number
- CN116385157A CN116385157A CN202310654127.4A CN202310654127A CN116385157A CN 116385157 A CN116385157 A CN 116385157A CN 202310654127 A CN202310654127 A CN 202310654127A CN 116385157 A CN116385157 A CN 116385157A
- Authority
- CN
- China
- Prior art keywords
- data
- credit
- association
- identified
- subject
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 33
- 238000011835 investigation Methods 0.000 title abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims description 63
- 230000008569 process Effects 0.000 claims description 48
- 238000000605 extraction Methods 0.000 claims description 31
- 238000012216 screening Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 37
- 230000008520 organization Effects 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Collating Specific Patterns (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了一种用于征信信用主体识别的数据处理方法和装置。通过获取待识别信用主体数据;对待识别信用主体数据进行基于预设关联特征的提取处理,得到目标关联特征数据,目标关联特征数据为表示待识别信用主体预设关联特征的数据;在预设信用主体关联数据库中匹配与目标关联特征数据对应的全局唯一标识符,得到目标主体数据,目标主体数据为表示待识别信用主体对应全局唯一标识符的数据。通过对待识别信用主体进行关联特征识别,根据识别到的关联特征在预设***数据库中匹配待识别信用主体的全局唯一标识符,实现对信用主体的识别处理,解决了现有技术中对于大量的征信信用主体信息,不能有效且准确地进行征信信用主体的唯一关联的技术问题。
Description
技术领域
本申请涉及计算机领域,具体而言,涉及一种用于征信信用主体识别的数据处理方法和装置。
背景技术
企业征信是指征信机构作为提供信用信息服务的企业,按一定规则合法采集企业或者个人的信用信息,加工整理形成企业或者个人的信用报告等征信产品,有偿提供给经济活动中的贷款方、赊销方、招标方、出租方或者保险方等有合法需求的信息使用者,为其了解交易对方的信用状况提供便利。
相关技术中,识别征信信用主体主要依赖于统一社会信用代码、企业名称或者自行构建的标识符等。
在实现本公开实施例的过程中,发明人发现相关技术中至少存在如下问题:对于大量的征信信用主体信息,不能有效且准确地进行征信信用主体的唯一关联。
发明内容
本申请的主要目的在于提供一种用于征信信用主体识别的数据处理方法和装置,以解决现有技术中对于大量的征信信用主体信息,不能有效且准确地进行征信信用主体的唯一关联的技术问题。
为了实现上述目的,本申请的第一方面,提出了一种用于征信信用主体识别的数据处理方法,包括:
获取待识别信用主体数据,其中,所述待识别信用主体数据为用于表示待识别信用主体的数据;
对所述待识别信用主体数据进行基于预设关联特征的提取处理,得到目标关联特征数据,其中,所述目标关联特征数据为用于表示待识别信用主体预设关联特征的数据;
在预设信用主体关联数据库中匹配与所述目标关联特征数据对应的全局唯一标识符,得到目标主体数据,其中,所述目标主体数据为用于表示待识别信用主体对应的全局唯一标识符的数据。
进一步地,对所述待识别信用主体数据进行预设关联特征的提取处理,得到目标关联特征数据包括:
对所述待识别信用主体数据进行基于预设关联特征的判断处理,以判断所述待识别信用主体数据中是否存在所述预设关联特征,
如果所述待识别信用主体数据中存在所述预设关联特征,对所述待识别信用主体数据进行关联特征提取处理,得到所述目标关联特征数据;
如果所述待识别信用主体数据中不存在所述预设关联特征,根据所述待识别信用主体数据生成所述目标主体数据,其中,所述目标主体数据为用于表示与所述待识别信用主体对应的全局唯一标识符的数据。
进一步地,如果所述待识别信用主体数据中存在所述预设关联特征,对所述待识别信用主体数据进行关联特征提取处理,得到所述目标关联特征数据包括:
对所述待识别信用主体数据进行基于预设第一数据字段的关联特征匹配处理,得到第一过程关联特征数据,其中,所述第一过程关联特征数据为用于表示第一数据字段和信用主体标识关联关系的特征数据,所述第一数据字段为征信主体名称数据字段;
对所述待识别信用主体数据进行基于预设第二数据字段的关联特征匹配处理,得到第二过程关联特征数据,其中,所述第二过程关联特征数据为用于表示第二数据字段与信用主体标识关联关系的特征数据,所述第二数据字段时为统一社会信用代码数据字段;
对所述第一过程关联特征数据和所述第二过程关联特征数据进行基于预设关联提取规则的提取处理,得到所述目标关联特征数据,其中,所述目标关联特征数据为满足所述预设关联提取规则的关联特征数据。
进一步地,对所述待识别信用主体数据进行基于预设第一数据字段的关联特征匹配处理,得到第一过程关联特征数据包括:
对所述待识别信用主体数据进行基于预设第一数据字段的识别处理,得到主体第一数据字段,其中,所述主体第一数据字段为用于表示待识别信用主体预设第一数据字段的数据;
在预设关联特征数据库中匹配与所述主体第一数据字段对应的主体特征数据,得到第一主体关联特征数据,其中,所述第一主体关联特征数据为用于表示与所述主体第一数据字段对应的主体关联特征的数据,主体关联特征包括征信信用主体成立时间特征和征信信用主体曾用名特征;
根据所述第一主体关联特征数据和所述主体第一数据字段生成所述第一过程关联特征数据。
进一步地,对所述第一过程关联特征数据和所述第二过程关联特征数据进行基于预设关联提取规则的提取处理,得到所述目标关联特征数据包括:
在预设关联特征数据库中匹配与所述第一数据字段对应的关联特征系数数据,得到第一关联特征系数数据,其中,所述第一关联特征系数数据为用于表示所述第一过程关联特征数据对应的关联特征系数的数据;
在预设关联特征数据库中匹配与所述第二数据字段对应的关联特征系数数据,得到第二关联特征系数数据,其中,所述第二关联特征系数数据为用于表示所述第二过程关联特征数据对应的关联特征系数的数据;
根据所述第一关联特征系数数据和所述第二关联特征系数数据对所述第一过程关联特征数据和所述第二过程关联特征数据进行基于关联特征系数的筛选处理,得到所述目标关联特征数据,其中,所述目标关联特征数据为第一关联特征系数和第二关联特征系数中最高的关联特征系数对应的过程关联特征数据。
进一步地,如果所述待识别信用主体数据中不存在所述预设关联特征,根据所述待识别信用主体数据生成所述目标主体数据之后,所述数据处理方法包括:
根据所述待识别信用主体数据和所述目标主体数据生成更新关联特征数据,其中,所述更新关联特征数据为用于表示待识别信用主体与所述目标主体数据关联关系的数据;
根据所述更新关联特征数据对预设信用主体关联数据库进行更新处理,得到更新信用主体关联数据库。
根据本申请的第二方面,本申请提出了一种用于征信信用主体识别的数据处理装置,包括:
数据获取模块,用于获取待识别信用主体数据,其中,所述待识别信用主体数据为用于表示待识别信用主体的数据;
关联特征提取模块,用于对所述待识别信用主体数据进行基于预设关联特征的提取处理,得到目标关联特征数据,其中,所述目标关联特征数据为用于表示待识别信用主体预设关联特征的数据;
主体确认模块,用于在预设信用主体关联数据库中匹配与所述目标关联特征数据对应的全局唯一标识符,得到目标主体数据,其中,所述目标主体数据为用于表示待识别信用主体对应的全局唯一标识符的数据。
进一步地,关联特征提取模块,包括:
关联特征判断模块,用于对所述待识别信用主体数据进行基于预设关联特征的判断处理,以判断所述待识别信用主体数据中是否存在所述预设关联特征,
如果所述待识别信用主体数据中存在所述预设关联特征,对所述待识别信用主体数据进行关联特征提取处理,得到所述目标关联特征数据;
如果所述待识别信用主体数据中不存在所述预设关联特征,根据所述待识别信用主体数据生成所述目标主体数据,其中,所述目标主体数据为用于表示与所述待识别信用主体对应的全局唯一标识符的数据。
根据本申请的第三方面,本申请提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行上述的用于征信信用主体识别的数据处理方法。
根据本申请的第四方面,本申请提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行上述的用于征信信用主体识别的数据处理方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
在本申请中,通过获取待识别信用主体数据,其中,所述待识别信用主体数据为用于表示待识别信用主体的数据;对所述待识别信用主体数据进行基于预设关联特征的提取处理,得到目标关联特征数据,其中,所述目标关联特征数据为用于表示待识别信用主体预设关联特征的数据;在预设信用主体关联数据库中匹配与所述目标关联特征数据对应的全局唯一标识符,得到目标主体数据,其中,所述目标主体数据为用于表示待识别信用主体对应的全局唯一标识符的数据。通过对待识别信用主体中存在的关联特征进行识别,根据识别到的关联特征在预设***数据库中匹配待识别信用主体的全局唯一标识符,实现对信用主体的识别处理,解决了现有技术中对于大量的征信信用主体信息,不能有效且准确地进行征信信用主体的唯一关联的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请提出的一种用于征信信用主体识别的数据处理方法的流程图;
图2为本申请提出的一种用于征信信用主体识别的数据处理方法的流程图;
图3为本申请提出的一种用于征信信用主体识别的数据处理方法的流程图;
图4是本申请提出的一种用于征信信用主体识别的数据处理方法的流程图;
图5为本申请提出的一种用于征信信用主体识别的数据处理装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,“连接”可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
为了便于理解,下面对本公开实施例所涉概念进行介绍,本公开实施例所称征信信息主体,也称为被征信人,指征信机构采集、整理、加工或者使用的征信信息描述对象,包括自然人、法人以及其他组织。就征信业务具体而言,征信信息主体包括作为信息提供者直接向征信机构提供自身信用信息的自然人、法人或者其他组织,以及与信息提供者通过特定关系依法将信息归集到征信机构间接向征信机构提供自身信用信息的自然人、法人或者其他组织。
全局唯一标识符(Globally Unique Identifier,简称为GUID),一种由算法生成的二进制长度为128位的数字标识符。可以应用于拥有多个节点、多台计算机的网络或***中,在理想情况下,任何计算机和计算机集群都不会生成两个相同的GUID。GUID的总数达到了2^128(3.4×10^38)个,随机生成两个相同GUID的可能性非常小,但并不为0。在生成GUID的算法通常加入非随机的参数例如是时间,可以避免重ID的生成。
在本申请的可选实施例中,提出了一种用于征信信用主体识别的数据处理方法,图1为本申请提出的一种用于征信信用主体识别的数据处理方法的流程图,如图1所示,该方法包括以下步骤:
S101:获取待识别信用主体数据;
待识别信用主体数据为用于表示待识别信用主体的数据,其中,征信信用主体信息可以包括:信用主体名称、中征码、统一社会信用代码、成立时间或者组织机构代码。
S102:对待识别信用主体数据进行基于预设关联特征的提取处理,得到目标关联特征数据;
目标关联特征数据为用于表示待识别信用主体预设关联特征的数据。根据预设的识别条件判断待识别信用主体信息中是否存在预设相关关联关系,其中,待识别信用主体信息为待识别信用主体的信息;对于不同数据源,待识别信用主体的信息不同。
在本申请的另一可选实施例中,提出了一种用于征信信用主体识别的数据处理方法,图2为本申请提出的一种用于征信信用主体识别的数据处理方法的流程图,如图2所示,该方法包括以下步骤:
S201:对待识别信用主体数据进行基于预设关联特征的判断处理,以判断待识别信用主体数据中是否存在预设关联特征,
S202:如果待识别信用主体数据中存在预设关联特征,对待识别信用主体数据进行关联特征提取处理,得到目标关联特征数据;
在本申请的另一可选实施例中,提出了一种用于征信信用主体识别的数据处理方法,图3为本申请提出的一种用于征信信用主体识别的数据处理方法的流程图,如图3所示,该方法包括:
S301:对待识别信用主体数据进行基于预设第一数据字段的关联特征匹配处理,得到第一过程关联特征数据;
第一过程关联特征数据为用于表示第一数据字段和信用主体标识关联关系的特征数据,第一数据字段为征信主体名称数据字段;
在本申请的另一可选实施例中,提供了一种用于征信信用主体识别的数据处理方法,包括:
对待识别信用主体数据进行基于预设第一数据字段的识别处理,得到主体第一数据字段,其中,主体第一数据字段为用于表示待识别信用主体预设第一数据字段的数据;在预设关联特征数据库中匹配与主体第一数据字段对应的主体特征数据,得到第一主体关联特征数据,其中,第一主体关联特征数据为用于表示与主体第一数据字段对应的主体关联特征的数据,主体关联特征包括征信信用主体成立时间特征和征信信用主体曾用名特征;根据第一主体关联特征数据和主体第一数据字段生成第一过程关联特征数据。
S302:对待识别信用主体数据进行基于预设第二数据字段的关联特征匹配处理,得到第二过程关联特征数据;
第二过程关联特征数据为用于表示第二数据字段与信用主体标识关联关系的特征数据,第二数据字段时为统一社会信用代码数据字段;
S303:对第一过程关联特征数据和第二过程关联特征数据进行基于预设关联提取规则的提取处理,得到目标关联特征数据。
目标关联特征数据为满足所述预设关联提取规则的关联特征数据。
在本申请的另一可选实施例中,提出了一种用于征信信用主体识别的数据处理方法,以实现对第一过程关联特征数据和第二过程关联特征数据进行基于预设关联提取规则的提取处理,得到目标关联特征数据,该方法包括:
在预设关联特征数据库中匹配与第一数据字段对应的关联特征系数数据,得到第一关联特征系数数据,其中,第一关联特征系数数据为用于表示所第一过程关联特征数据对应的关联特征系数的数据;在预设关联特征数据库中匹配与第二数据字段对应的关联特征系数数据,得到第二关联特征系数数据,其中,第二关联特征系数数据为用于表示第二过程关联特征数据对应的关联特征系数的数据;根据第一关联特征系数数据和第二关联特征系数数据对第一过程关联特征数据和第二过程关联特征数据进行基于关联特征系数的筛选处理,得到所述目标关联特征数据,其中,目标关联特征数据为第一关联特征系数和第二关联特征系数中最高的关联特征系数对应的过程关联特征数据。
S203:如果待识别信用主体数据中不存在预设关联特征,根据待识别信用主体数据生成目标主体数据。
目标主体数据为用于表示与待识别信用主体对应的全局唯一标识符的数据。
在本申请的另一可选实施例,提出了一种用于征信信用主体识别的数据处理方法,包括:
根据待识别信用主体数据和目标主体数据生成更新关联特征数据,其中,更新关联特征数据为用于表示待识别信用主体与目标主体数据关联关系的数据;根据更新关联特征数据对预设信用主体关联数据库进行更新处理,得到更新信用主体关联数据库。
S103:在预设信用主体关联数据库中匹配与目标关联特征数据对应的全局唯一标识符,得到目标主体数据。
目标主体数据为用于表示待识别信用主体对应的全局唯一标识符的数据。
在本申请的另一可选实施例中,提供了一种用于征信信用主体识别的数据处理方法,包括:
获取预先建立的第一关联关系表,其中,第一关联关系表包括:征信信用主体的信息,以及与征信信用主体对应的全局唯一标识符,其中,征信信用主体信息可以包括:信用主体名称、中征码、统一社会信用代码、成立时间或者组织机构代码;编码方式可以使用GUID,也可以使用UUID中的其他编码方法;获取待识别信用主体信息,根据预设的识别条件判断待识别信用主体信息中是否存在预设相关关联关系,其中,待识别信用主体信息为待识别信用主体的信息;对于不同数据源,待识别信用主体的信息不同;如果待识别信用主体信息中存在预设相关关联关系,设置并获取各相关关联关系的权重值,将权重值最高的关联关系对应的全局唯一标识符与待识别信用主体关联;如果待识别信用主体信息中不存在预设相关关联关系,新增全局唯一标识符,将待识别信用主体与新增的全局唯一标识符关联。
通过第一关联关系表给每个征信信用主体赋予全局唯一标识符,将征信信用主体信息与全局唯一标识符关联,便于后续对信用主体的识别,判断是否存在预设相关关联关系,待识别信用主体信息中存在预设相关关联关系时,识别得到第一关联关系表中已存在征信信用主体,待识别信用主体信息中不存在预设相关关联关系时,新增全局唯一标识符,可以有效处理已存在数据和新增数据;通过第一关联关系表可以进行多数据源征信信用主体的关联,可以有效且准确地进行征信信用主体的唯一关联和识别。
在一些实施例中,在根据预设的识别条件判断待识别信用主体信息中是否存在预设相关关联关系时,前述的用于征信信用主体识别的方法还包括:通过第一关联关系表建立第一关联识别条件,并将第一关联识别条件作为预设相关关联关系。这样,第一关联关系表不仅可以用于建立不同数据源间待识别征信信用主体唯一的标识符关联,而且,还可以进行不同数据源间待识别征信信用主体的识别,可以在接入不同数据源时,有效且准确地进行征信信用主体的唯一关联。
在一些实施例中,在根据预设的识别条件判断待识别信用主体信息中是否存在预设相关关联关系时,前述的用于征信信用主体识别的方法还包括:通过数据字段建立关联识别条件,并将关联识别条件作为预设相关关联关系,其中,数据字段按照数据源存在的字段,以及实际情况进行设置。这样,在不同数据源存在的数据字段不同时,也可以进行征信信用主体的识别。
在一些实施例中,在根据预设的识别条件判断待识别信用主体信息中是否存在预设相关关联关系时,前述的用于征信信用主体识别的方法还包括:通过数据字段征信信用主体名称和统一社会信用代码建立第二关联识别条件,并将第二关联识别条件作为预设相关关联关系,和/或,通过数据字段征信信用主体名称和征信信用主体成立时间建立第三关联识别条件,并将第三关联识别条件作为预设相关关联关系,和/或,通过数据字段统一社会信用代码建立第四关联识别条件,并将第四关联识别条件作为所述预设相关关联关系。其中,预设的识别条件具体包括:第一,通过数据字段征信信用主体名称和统一社会信用代码建立的第二关联识别条件;第二,通过数据字段征信信用主体名称和征信信用主体成立时间建立的第三关联识别条件;第三,通过数据字段统一社会信用代码建立的第四关联识别条件;第四,通过数据字段征信信用主体名称和统一社会信用代码建立的第二关联识别条件,以及,通过数据字段征信信用主体名称和征信信用主体成立时间建立的第三关联识别条件;第五,通过数据字段征信信用主体名称和征信信用主体成立时间建立的第三关联识别条件,以及,通过数据字段统一社会信用代码建立的第四关联识别条件;第六,通过数据字段征信信用主体名称和统一社会信用代码建立的第二关联识别条件,通过数据字段征信信用主体名称和征信信用主体成立时间建立第三关联识别条件,以及,通过数据字段统一社会信用代码建立第四关联识别条件。其中,仅有一个预设的识别条件,例如是前述第一、第二或者第三种预设的识别条件,可将各识别条件的权重值设置为1。当识别条件存在两个及以上时,权重值可以根据实际情况进行设置,例如是,对于前述第四种情况,将数据字段征信信用主体名称和统一社会信用代码,即第二关联识别条件的权重值设置为0.6,将数据字段征信信用主体名称和征信信用主体成立时间,即第三关联识别条件的权重值设置为0.4。
在一些实施例中,如果待识别信用主体信息中存在预设相关关联关系,确定该待识别信用主体信息中存在的预设相关关联关系的多个关联识别条件,确定该待识别信用主体中多个关联识别条件分别对应的识别权重值,根据上述多个关联识别条件确定该待识别信用主体对应的预设相关关系的关联权重值,筛选最高预设相关关系对应的关联权重值,确定该待识别信用主体的全局唯一标识符。
在一些实施例中,前述的用于征信信用主体识别的方法还包括:建立第二关联关系表,第二关联关系表包括:征信信用主体名称和征信信用主体曾用名,以及与征信信用主体名称和征信信用主体曾用名对应的全局唯一标识符。这样,可以进行多数据源征信信用主体的关联,还可以在征信信用主体发生变更时,进行征信信用主体的关联。
在一些实施例中,在根据预设的识别条件判断所述待识别信用主体信息中是否存在预设相关关联关系时,前述的用于征信信用主体识别的方法还包括:通过第二关联关系表建立第五关联识别条件,并将第五关联识别条件作为预设相关关联关系。这样,可以进行多数据源征信信用主体的识别,还可以在征信信用主体发生变更时,进行征信信用主体的识别。
在一些实施例中,待识别信用主体信息存在预设相关关联关系,包括:待识别信用主体信息包括预设相关关联关系中的至少一个。在本公开实施例的实现过程中,预设相关关联关系可以包括第一关联识别条件、第二关联识别条件、第三关联识别条件、第四关联识别条件、第五关联识别条件以及第六关联识别条件中的至少一个,也可以包括其他用于识别征信信用主体的条件。
在一些实施例中,在不存在相关关联关系,新增全局唯一标识符,将待识别信用主体与新增的全局唯一标识符关联后,将待识别信用主体信息写入第二关联关系表。这样,可以建立征信信用主体曾用名与GUID的关联,在征信信用主体发生变更时,也可以有效且准确地进行征信信用主体的唯一关联。
图4是本申请提出的一种用于征信信用主体识别的数据处理方法的流程图。如图4所示,对于待识别信信用主体信息,通过识别条件进行可关联识别,判断是否存在相关关联关系,其中,预设识别条件具体包括:第一关联识别条件、第二关联识别条案件、第三关联识别条件、第四关联识别条件、第五关联识别条件或者第六关联识别条件中的至少一个,可以根据实际情况进行设置,存在相关关联关系时,设置并获取各相关关联关系的权重值,将权重值最高的关联关系对应的全局唯一标识符与待识别信用主体关联;不存在相关关联关系时,新增全局唯一标识符,将待识别信用主体与新增的全局唯一标识符关联。
在本申请的另一可选实施例中,提出了一种用于征信信用主体识别的数据处理装置,图5为本申请提出的一种用于征信信用主体识别的数据处理装置的示意图,如图5所示,该装置包括:
数据获取模块51,用于获取待识别信用主体数据,其中,待识别信用主体数据为用于表示待识别信用主体的数据;
关联特征提取模块52,用于对待识别信用主体数据进行基于预设关联特征的提取处理,得到目标关联特征数据,其中,目标关联特征数据为用于表示待识别信用主体预设关联特征的数据;
主体确认模块53,用于在预设信用主体关联数据库中匹配与关联特征数据对应的全局唯一标识符,得到目标主体数据,其中,目标主体数据为用于表示待识别信用主体对应的全局唯一标识符的数据。
在本申请的另一可选实施例中,提供了一种用于征信信用主体识别的数据处理装置,包括:
关联特征判断模块,用于对待识别信用主体数据进行基于预设关联特征的判断处理,以判断待识别信用主体数据中是否存在所述预设关联特征,
如果待识别信用主体数据中存在预设关联特征,对待识别信用主体数据进行关联特征提取处理,得到目标关联特征数据;
如果待识别信用主体数据中不存在预设关联特征,根据待识别信用主体数据生成所述目标主体数据,其中,目标主体数据为用于表示与所述待识别信用主体对应的全局唯一标识符的数据。
关于上述实施例中各单元的执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
综上所述,在本申请中,通过获取待识别信用主体数据,其中,待识别信用主体数据为用于表示待识别信用主体的数据;对待识别信用主体数据进行基于预设关联特征的提取处理,得到目标关联特征数据,其中,目标关联特征数据为用于表示待识别信用主体预设关联特征的数据;在预设信用主体关联数据库中匹配与关联特征数据对应的全局唯一标识符,得到目标主体数据,其中,目标主体数据为用于表示待识别信用主体对应的全局唯一标识符的数据。通过对待识别信用主体中存在的关联特征进行识别,根据识别到的关联特征在预设***数据库中匹配待识别信用主体的全局唯一标识符,实现对信用主体的识别处理,解决了现有技术中对于大量的征信信用主体信息,不能有效且准确地进行征信信用主体的唯一关联的技术问题。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
显然,本领域的技术人员应该明白,上述的本申请的各单元或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种用于征信信用主体识别的数据处理方法,其特征在于,包括:
获取待识别信用主体数据,其中,所述待识别信用主体数据为用于表示待识别信用主体的数据;
对所述待识别信用主体数据进行基于预设关联特征的提取处理,得到目标关联特征数据,其中,所述目标关联特征数据为用于表示待识别信用主体预设关联特征的数据;
在预设信用主体关联数据库中匹配与所述目标关联特征数据对应的全局唯一标识符,得到目标主体数据,其中,所述目标主体数据为用于表示待识别信用主体对应的全局唯一标识符的数据。
2.根据权利要求1所述的数据处理方法,其特征在于,对所述待识别信用主体数据进行预设关联特征的提取处理,得到目标关联特征数据包括:
对所述待识别信用主体数据进行基于预设关联特征的判断处理,以判断所述待识别信用主体数据中是否存在所述预设关联特征,
如果所述待识别信用主体数据中存在所述预设关联特征,对所述待识别信用主体数据进行关联特征提取处理,得到所述目标关联特征数据;
如果所述待识别信用主体数据中不存在所述预设关联特征,根据所述待识别信用主体数据生成所述目标主体数据,其中,所述目标主体数据为用于表示与所述待识别信用主体对应的全局唯一标识符的数据。
3.根据权利要求2所述的数据处理方法,其特征在于,如果所述待识别信用主体数据中存在所述预设关联特征,对所述待识别信用主体数据进行关联特征提取处理,得到所述目标关联特征数据包括:
对所述待识别信用主体数据进行基于预设第一数据字段的关联特征匹配处理,得到第一过程关联特征数据,其中,所述第一过程关联特征数据为用于表示第一数据字段和信用主体标识关联关系的特征数据,所述第一数据字段为征信主体名称数据字段;
对所述待识别信用主体数据进行基于预设第二数据字段的关联特征匹配处理,得到第二过程关联特征数据,其中,所述第二过程关联特征数据为用于表示第二数据字段与信用主体标识关联关系的特征数据,所述第二数据字段时为统一社会信用代码数据字段;
对所述第一过程关联特征数据和所述第二过程关联特征数据进行基于预设关联提取规则的提取处理,得到所述目标关联特征数据,其中,所述目标关联特征数据为满足所述预设关联提取规则的关联特征数据。
4.根据权利要求3所述的数据处理方法,其特征在于,对所述待识别信用主体数据进行基于预设第一数据字段的关联特征匹配处理,得到第一过程关联特征数据包括:
对所述待识别信用主体数据进行基于预设第一数据字段的识别处理,得到主体第一数据字段,其中,所述主体第一数据字段为用于表示待识别信用主体预设第一数据字段的数据;
在预设关联特征数据库中匹配与所述主体第一数据字段对应的主体特征数据,得到第一主体关联特征数据,其中,所述第一主体关联特征数据为用于表示与所述主体第一数据字段对应的主体关联特征的数据,主体关联特征包括征信信用主体成立时间特征和征信信用主体曾用名特征;
根据所述第一主体关联特征数据和所述主体第一数据字段生成所述第一过程关联特征数据。
5.根据权利要求3所述的数据处理方法,其特征在于,对所述第一过程关联特征数据和所述第二过程关联特征数据进行基于预设关联提取规则的提取处理,得到所述目标关联特征数据包括:
在预设关联特征数据库中匹配与所述第一数据字段对应的关联特征系数数据,得到第一关联特征系数数据,其中,所述第一关联特征系数数据为用于表示所述第一过程关联特征数据对应的关联特征系数的数据;
在预设关联特征数据库中匹配与所述第二数据字段对应的关联特征系数数据,得到第二关联特征系数数据,其中,所述第二关联特征系数数据为用于表示所述第二过程关联特征数据对应的关联特征系数的数据;
根据所述第一关联特征系数数据和所述第二关联特征系数数据对所述第一过程关联特征数据和所述第二过程关联特征数据进行基于关联特征系数的筛选处理,得到所述目标关联特征数据,其中,所述目标关联特征数据为第一关联特征系数和第二关联特征系数中最高的关联特征系数对应的过程关联特征数据。
6.根据权利要求2所述的数据处理方法,其特征在于,如果所述待识别信用主体数据中不存在所述预设关联特征,根据所述待识别信用主体数据生成所述目标主体数据之后,所述数据处理方法还包括:
根据所述待识别信用主体数据和所述目标主体数据生成更新关联特征数据,其中,所述更新关联特征数据为用于表示待识别信用主体与所述目标主体数据关联关系的数据;
根据所述更新关联特征数据对预设信用主体关联数据库进行更新处理,得到更新信用主体关联数据库。
7.一种用于征信信用主体识别的数据处理装置,其特征在于,包括:
数据获取模块,用于获取待识别信用主体数据,其中,所述待识别信用主体数据为用于表示待识别信用主体的数据;
关联特征提取模块,用于对所述待识别信用主体数据进行基于预设关联特征的提取处理,得到目标关联特征数据,其中,所述目标关联特征数据为用于表示待识别信用主体预设关联特征的数据;
主体确认模块,用于在预设信用主体关联数据库中匹配与所述目标关联特征数据对应的全局唯一标识符,得到目标主体数据,其中,所述目标主体数据为用于表示待识别信用主体对应的全局唯一标识符的数据。
8.根据权利要求7所述的数据处理装置,其特征在于,关联特征提取模块,包括:
关联特征判断模块,用于对所述待识别信用主体数据进行基于预设关联特征的判断处理,以判断所述待识别信用主体数据中是否存在所述预设关联特征,
如果所述待识别信用主体数据中存在所述预设关联特征,对所述待识别信用主体数据进行关联特征提取处理,得到所述目标关联特征数据;
如果所述待识别信用主体数据中不存在所述预设关联特征,根据所述待识别信用主体数据生成所述目标主体数据,其中,所述目标主体数据为用于表示与所述待识别信用主体对应的全局唯一标识符的数据。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-6任意一项所述的用于征信信用主体识别的数据处理方法。
10.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-6任意一项所述的用于征信信用主体识别的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310654127.4A CN116385157B (zh) | 2023-06-05 | 2023-06-05 | 用于征信信用主体识别的数据处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310654127.4A CN116385157B (zh) | 2023-06-05 | 2023-06-05 | 用于征信信用主体识别的数据处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116385157A true CN116385157A (zh) | 2023-07-04 |
CN116385157B CN116385157B (zh) | 2023-08-15 |
Family
ID=86969739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310654127.4A Active CN116385157B (zh) | 2023-06-05 | 2023-06-05 | 用于征信信用主体识别的数据处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116385157B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060149710A1 (en) * | 2004-12-30 | 2006-07-06 | Ross Koningstein | Associating features with entities, such as categories of web page documents, and/or weighting such features |
CN104520886A (zh) * | 2012-03-31 | 2015-04-15 | 环联公司 | 用于基于离线、在线及信用相关数据的目标因特网营销的***及方法 |
CN108268799A (zh) * | 2017-12-28 | 2018-07-10 | 上海数据交易中心有限公司 | 数据查询***和方法、存储介质、终端 |
CN109376182A (zh) * | 2018-09-26 | 2019-02-22 | 上海睿翎法律咨询服务有限公司 | 基于计算机软件***实现关联公司识别处理的方法 |
CN109829034A (zh) * | 2018-08-24 | 2019-05-31 | 长威信息科技发展股份有限公司 | 一种基于市场主体信用数据的企业树谱图展示方法 |
CN112102093A (zh) * | 2020-08-05 | 2020-12-18 | 中证征信(深圳)有限公司 | 主体身份及关联关系识别方法、装置、设备和介质 |
CN112597927A (zh) * | 2020-12-28 | 2021-04-02 | 电子科技大学 | 二维表格识别方法、装置、设备及*** |
US20210103982A1 (en) * | 2019-10-07 | 2021-04-08 | Albe Information Ltd. | System and methods for credit underwriting and ongoing monitoring using behavioral parameters |
CN113760907A (zh) * | 2021-08-02 | 2021-12-07 | 紫金诚征信有限公司 | 一种数据库中数据唯一性标识方法 |
CN114138869A (zh) * | 2021-12-03 | 2022-03-04 | 爱信诺征信有限公司 | 一种企业信用数据处理方法及装置 |
CN114157502A (zh) * | 2021-12-08 | 2022-03-08 | 北京恒安嘉新安全技术有限公司 | 一种终端识别方法、装置、电子设备及存储介质 |
CN114971840A (zh) * | 2022-03-21 | 2022-08-30 | 中国人民银行征信中心 | 一种基于统一主体标识的信用拓扑采集方法及*** |
CN114998003A (zh) * | 2022-08-02 | 2022-09-02 | 湖南三湘银行股份有限公司 | 一种基于图深度卷积神经网络算法识别洗钱的方法和装置 |
CN116049512A (zh) * | 2023-03-30 | 2023-05-02 | 紫金诚征信有限公司 | 信用主体信息的处理方法、装置及电子设备 |
CN116050828A (zh) * | 2022-12-21 | 2023-05-02 | 杭州有赞科技有限公司 | 基于复杂关系网络的风险团伙识别方法和*** |
-
2023
- 2023-06-05 CN CN202310654127.4A patent/CN116385157B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060149710A1 (en) * | 2004-12-30 | 2006-07-06 | Ross Koningstein | Associating features with entities, such as categories of web page documents, and/or weighting such features |
CN104520886A (zh) * | 2012-03-31 | 2015-04-15 | 环联公司 | 用于基于离线、在线及信用相关数据的目标因特网营销的***及方法 |
CN108268799A (zh) * | 2017-12-28 | 2018-07-10 | 上海数据交易中心有限公司 | 数据查询***和方法、存储介质、终端 |
CN109829034A (zh) * | 2018-08-24 | 2019-05-31 | 长威信息科技发展股份有限公司 | 一种基于市场主体信用数据的企业树谱图展示方法 |
CN109376182A (zh) * | 2018-09-26 | 2019-02-22 | 上海睿翎法律咨询服务有限公司 | 基于计算机软件***实现关联公司识别处理的方法 |
US20210103982A1 (en) * | 2019-10-07 | 2021-04-08 | Albe Information Ltd. | System and methods for credit underwriting and ongoing monitoring using behavioral parameters |
CN112102093A (zh) * | 2020-08-05 | 2020-12-18 | 中证征信(深圳)有限公司 | 主体身份及关联关系识别方法、装置、设备和介质 |
CN112597927A (zh) * | 2020-12-28 | 2021-04-02 | 电子科技大学 | 二维表格识别方法、装置、设备及*** |
CN113760907A (zh) * | 2021-08-02 | 2021-12-07 | 紫金诚征信有限公司 | 一种数据库中数据唯一性标识方法 |
CN114138869A (zh) * | 2021-12-03 | 2022-03-04 | 爱信诺征信有限公司 | 一种企业信用数据处理方法及装置 |
CN114157502A (zh) * | 2021-12-08 | 2022-03-08 | 北京恒安嘉新安全技术有限公司 | 一种终端识别方法、装置、电子设备及存储介质 |
CN114971840A (zh) * | 2022-03-21 | 2022-08-30 | 中国人民银行征信中心 | 一种基于统一主体标识的信用拓扑采集方法及*** |
CN114998003A (zh) * | 2022-08-02 | 2022-09-02 | 湖南三湘银行股份有限公司 | 一种基于图深度卷积神经网络算法识别洗钱的方法和装置 |
CN116050828A (zh) * | 2022-12-21 | 2023-05-02 | 杭州有赞科技有限公司 | 基于复杂关系网络的风险团伙识别方法和*** |
CN116049512A (zh) * | 2023-03-30 | 2023-05-02 | 紫金诚征信有限公司 | 信用主体信息的处理方法、装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
戴洪锐: "数字化视野下公共信用治理优化探析", 《云南民族大学学报(哲学社会科学版)》, vol. 39, no. 05, pages 84 - 92 * |
Also Published As
Publication number | Publication date |
---|---|
CN116385157B (zh) | 2023-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108769111A (zh) | 一种服务器连接方法、计算机可读存储介质及终端设备 | |
CN107909178B (zh) | 电子装置、失联修复率预测方法和计算机可读存储介质 | |
WO2011106897A1 (en) | Systems and methods for conducting more reliable assessments with connectivity statistics | |
EP2484054A1 (en) | Systems and methods for social graph data analytics to determine connectivity within a community | |
CN107784063B (zh) | 算法的生成方法及终端设备 | |
CN112529429B (zh) | 客户信息校验方法、装置、计算机设备及存储介质 | |
CN109271564B (zh) | 保单查询方法及设备 | |
US11431800B2 (en) | Systems and methods for recording an indeterministic transaction on a distributed ledger network | |
CN113760996A (zh) | 一种数据整合方法及***、设备和存储介质 | |
CN111339743A (zh) | 一种账号生成的方法和装置 | |
CN114741384A (zh) | 一种患者信息处理方法及其装置、计算机可读存储介质 | |
CN112073395B (zh) | 一种文件分发方法和装置 | |
CN116385157B (zh) | 用于征信信用主体识别的数据处理方法和装置 | |
CN117349291A (zh) | 一种数据库主键短id生成方法、电子设备和介质 | |
CN111858617A (zh) | 用户查找方法和装置、计算机可读存储介质、电子设备 | |
CN109949090A (zh) | 客户推荐方法、装置、电子设备及介质 | |
CN112527785B (zh) | 数据补录方法、装置、电子设备及存储介质 | |
CN114140256A (zh) | 数据处理方法、装置、设备、介质和程序产品 | |
CN114723239A (zh) | 一种多方协同建模方法、装置、设备、介质及程序产品 | |
CN109783559B (zh) | 房产交易数据的获取方法、装置、电子设备以及存储介质 | |
CN113656466A (zh) | 保单数据查询方法、装置、设备及存储介质 | |
CN112800081A (zh) | 关联用户获取方法和装置 | |
CN111611056A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
US20200081875A1 (en) | Information Association And Suggestion | |
CN116842169B (zh) | 电力网格会话管理方法、***、终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |