CN117876103A - 一种人行征信用户画像搭建方法及*** - Google Patents
一种人行征信用户画像搭建方法及*** Download PDFInfo
- Publication number
- CN117876103A CN117876103A CN202410278375.8A CN202410278375A CN117876103A CN 117876103 A CN117876103 A CN 117876103A CN 202410278375 A CN202410278375 A CN 202410278375A CN 117876103 A CN117876103 A CN 117876103A
- Authority
- CN
- China
- Prior art keywords
- credit
- features
- user
- credibility
- dimensions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000011835 investigation Methods 0.000 title description 3
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000007499 fusion processing Methods 0.000 claims abstract description 12
- 238000011156 evaluation Methods 0.000 claims description 27
- 238000012937 correction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 4
- 238000012800 visualization Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Finance (AREA)
- Evolutionary Computation (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Development Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明提供一种人行征信用户画像搭建方法及***,属于数据处理技术领域,具体包括:从用户的人行征信数据的不同的信息模块中进行实体信息的提取,基于实体信息进行不同的信用维度的信用特征的提取,通过检验数据确定用户在不同的信用维度下的可信度,将可信度不满足要求的信用维度作为疑似风险维度,获取不同的信用维度下的信用特征完整度,并结合不同的信用维度下的可信度确定用户的人行征信数据可靠时,根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行融合处理得到用户的用户画像,降低了授信申请处理的风险。
Description
技术领域
本发明属于数据处理技术领域,尤其涉及一种人行征信用户画像搭建方法及***。
背景技术
人行征信报告是金融机构进行用户画像搭建的重要数据来源,记录了丰富的身份、职业、居住信息。但报告信息较碎片,如户籍地址、通讯地址、居住地址、单位地址均刻画用户地址,传统直接解析获取独立标签的做法,存在结论完整性问题;且因人行信息为人工采集填写,未经严格核验,可能存在模块冲突,直接应用难以保障准确性。
为解决上述技术问题,现有的发明专利CN202010711327.5《基于征信报文变量加工和客户画像的SDK***及其处理方法》给出了对人行征信信息进行解析,并根据解析结果输出征信衍生变量和客户画像码,但是却仍未考虑不同的人行信息的模块之间的冲突情况和对齐处理,导致生成的客户画像的准确率难以满足要求。
针对上述技术问题,本发明提供了一种人行征信用户画像搭建方法及***。
发明内容
为实现本发明目的,本发明采用如下技术方案:
根据本发明的一个方面,提供了一种人行征信用户画像搭建方法。
一种人行征信用户画像搭建方法,其特征在于,具体包括:
S1从用户的人行征信数据的不同的信息模块中进行实体信息的提取,基于所述实体信息进行不同的信用维度的信用特征的提取;
S2进行不同的信用特征之间的语义网络的构建,并通过所述语义网络对不同的信用特征进行对齐检验处理得到不同的信用维度的可信特征的检验数据,通过所述检验数据确定所述用户在不同的信用维度下的可信度,当存在可信度不满足要求的信用维度时,进入下一步骤;
S3将可信度不满足要求的信用维度作为疑似风险维度,并根据所述疑似风险维度的数量以及不同的信用维度的可信度进行人行征信数据的综合可信度的确定,当所述综合可信度满足要求时,进入下一步骤;
S4获取不同的信用维度下的信用特征完整度,并结合不同的信用维度下的可信度确定所述用户的人行征信数据可靠时,根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行融合处理得到用户的用户画像。
本发明的有益效果在于:
1、通过检验数据确定用户在不同的信用维度下的可信度,充分考虑到不同的信用维度下的不同的信用特征由于与其它的信用特征的语义冲突情况和一致情况的差异导致的不同的信用特征的可信度的差异,实现了对不同的信用维度的可信度的准确评估,也为差异化的进行用户的用户画像的生成以及不可信用户的筛选奠定了基础。
2、根据疑似风险维度的数量以及不同的信用维度的可信度进行人行征信数据的综合可信度的确定,实现了从多个信用维度的角度对不可信用户的筛选,避免了对人行征信数据不可信的用户进行用户画像的处理导致的处理效率较低的技术问题。
3、根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行融合处理得到用户的用户画像,即考虑到不同的信用维度下的信用特征的差异,同时通过语义网络的识别使得用户画像的生成处理结果能够更加准确的反应真实的用户的信贷风险,也为进一步进行信贷风险的有效控制奠定了基础。
进一步的技术方案在于,所述信用模块包括用户身份、职业、居住信息、历史信贷数据。
进一步的技术方案在于,所述信用维度包括用户身份信息、信贷逾期信息、信贷申请信息、信贷支用信息和征信查询信息。
进一步的技术方案在于,当所述综合可信度不满足要求时,则确定所述用户的人行征信数据的可信度不满足要求,无须进行用户的用户画像的构建,直接输出授信风险。
进一步的技术方案在于,所述信用特征完整度根据所述用户的人行征信数据在所述信用维度下的信用特征的数量与所述信用维度下的预设的信用特征的数量的比值进行确定。
第二方面,本发明提供了一种计算机***,包括:通信连接的存储器和处理器,以及存储在所述存储器上并能够在所述处理器上运行的计算机程序,其特征在于:所述处理器运行所述计算机程序时执行上述的一种人行征信用户画像搭建方法。
其他特征和优点将在随后的说明书中阐述,本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显;
图1是一种人行征信用户画像搭建方法的流程图;
图2是用户在所述信用维度下的可信度的确定的方法的流程图;
图3是人行征信数据的综合可信度的确定的方法的流程图;
图4是确定用户的人行征信数据可靠的确定的方法的流程图;
图5是一种计算机***的框架图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
人行征信数据作为金融机构进行信贷申请处理的关键参考手段,实现对人行征信数据的分析并进行用户画像的构建,对于金融机构进行授信风险的控制至关重要,但是由于人行征信数据的不同模块之间的信用特征可能存在语义冲突的地方,例如居住地址、工作地址、通讯地址等可能存在语义冲突的地方,因此若不能根据人行征信数据的语义冲突的信用特征的识别结果确定是否需要基于人行征信数据进行用户画像的构建,则会导致画像的构建处理效率和准确率难以满足要求。
为解决上述技术问题,本发明采用人行征信数据的不同的信用维度的信用特征中的存在语义冲突的疑似问题特征的占比确定不同的信用维度的可信度,并根据不同的可信度不满足要求的信用维度的数量占比确定人行征信数据的综合可信度,当所述综合可信度满足要求时,根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行融合处理得到用户的用户画像,其中上述的信用维度包括用户身份信息、信贷逾期信息、信贷申请信息、信贷支用信息和征信查询信息。
具体的,本发明采用以下技术方案:
首先从用户的人行征信数据的不同的信息模块中进行实体信息的提取,并根据实体信息进行不同的信用维度的信用特征的提取;
然后进行不同的信用特征之间的语义网络的构建,通过语义网络对不同的信用特征进行对齐检验处理得到不同的信用维度的可信特征的检验数据,通过检验数据确定所述用户在不同的信用维度下的可信度,具体的通过人行征信数据的不同的信用维度的信用特征中的存在语义冲突的疑似问题特征的占比确定不同的信用维度的可信度,当存在可信度较低的信用维度时,进入下一步骤,当不存在可信度较低的信用维度时,根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行融合处理得到用户的用户画像;
紧接着将可信度不满足要求的信用维度作为疑似风险维度,并根据所述疑似风险维度的数量以及不同的信用维度的可信度进行人行征信数据的综合可信度的确定,具体的可以通过疑似风险维度的数量占比与不同的信用维度的可信度的平均值的乘积进行人行征信数据的综合可信度的确定,当综合可信度较大时,进入下一步骤,当综合可信度较小时,确定所述用户的人行征信数据的可信度不满足要求,无须进行用户的用户画像的构建,直接输出授信风险;
最后根据不同的信用维度下的信用特征完整度以及可信度确定用户的人行征信数据是否可靠,具体的可以通过不同的信用维度下的信用特征完整度以及可信度的权重和的平均值的大小确定用户的人行征信数据是否可靠,当可靠时,根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行可视化处理得到所述用户在不同的信用维度下的用户画像,并对所述用户在不同的信用维度下的用户画像进行融合处理得到所述用户的用户画像,当不可靠时,则确定所述用户的人行征信数据的可信度不满足要求,无须进行用户的用户画像的构建,直接输出授信风险。
以下将从方法类实施例和***类实施例两个角度进行进一步阐述。
为解决上述问题,根据本发明的一个方面,如图1所示,提供了一种人行征信用户画像搭建方法,其特征在于,具体包括:
S1从用户的人行征信数据的不同的信息模块中进行实体信息的提取,基于所述实体信息进行不同的信用维度的信用特征的提取;
具体的,所述信用模块包括用户身份、职业、居住信息、历史信贷数据。
需要说明的是,所述信用维度包括用户身份信息、信贷逾期信息、信贷申请信息、信贷支用信息和征信查询信息。
S2进行不同的信用特征之间的语义网络的构建,并通过所述语义网络对不同的信用特征进行对齐检验处理得到不同的信用维度的可信特征的检验数据,通过所述检验数据确定所述用户在不同的信用维度下的可信度,当存在可信度不满足要求的信用维度时,进入下一步骤;
进一步的,所述信用特征之间的语义网络根据所述信用特征之间的语义逻辑关联关系进行确定,其中所述语义逻辑关联关系根据所述信用特征的匹配结果进行确定。
可以理解的是,所述检验数据包括用于所述信用特征检验的其它的信用特征的数量以及与所述信用特征的语义存在冲突的其它的信用特征的数量。
在可能的一个实施例中,如图2所示,步骤S1中的所述用户在所述信用维度下的可信度的确定的方法为:
根据所述检验数据确定在所述信用维度下与其它的信用特征不存在语义网络的信用特征,并将其作为未检验特征,通过未检验特征的数量以及在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的基础可信度;
将在所述信用维度下与其它的信用特征不存在语义冲突的信用特征作为可信信用特征,根据不同的可信信用特征的关联的其它的信用特征的数量、可信信用特征的数量以及在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的可信特征修正量;
将在所述信用维度下与其它的信用特征存在语义冲突的信用特征作为不可信信用特征,根据不同的不可信信用特征的关联的其它的信用特征的数量、与所述不可信信用特征存在语义冲突的其它的信用特征的数量以及不存在语义冲突的其它的信用特征的数量确定不同的不可信信用特征的特征可信度;
根据不同的不可信信用特征的数量以及特征可信度、在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的偏差特征修正量,并结合所述可信特征修正量以及基础可信度确定所述用户在所述信用维度下的可信度。
在另外的一个实施例中,步骤S1中的所述用户在所述信用维度下的可信度的确定的方法为:
根据所述检验数据确定在所述信用维度下与其它的信用特征不存在语义网络的信用特征,并将其作为未检验特征,将在所述信用维度下与其它的信用特征存在语义冲突的信用特征作为不可信信用特征;
当所述信用维度下不存在未检验特征以及不可信信用特征时,则通过用户在所述信用维度下的信用特征的数量确定所述用户在所述信用维度下的可信度;
当所述信用维度下存在未检验特征或者不可信信用特征时:
通过未检验特征的数量以及在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的基础可信度;
当所述信用维度下不存在不可信信用特征时,判断所述未检验特征的数量占比是否大于预设数量占比,若是,则通过所述用户在所述信用维度下的基础可信度确定所述用户在所述信用维度下的可信度,若否,则通过用户在所述信用维度下的信用特征的数量确定所述用户在所述信用维度下的可信度;
当所述信用维度下存在不可信信用特征时:
将在所述信用维度下与其它的信用特征存在语义冲突的信用特征作为不可信信用特征,根据不同的不可信信用特征的关联的其它的信用特征的数量、与所述不可信信用特征存在语义冲突的其它的信用特征的数量以及不存在语义冲突的其它的信用特征的数量确定不同的不可信信用特征的特征可信度;
根据不同的不可信信用特征的数量以及特征可信度、在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的偏差特征修正量,并结合所述信用特征的数量以及基础可信度确定所述用户在所述信用维度下的可信度。
在另外的一个实施例中,步骤S2中的所述用户在所述信用维度下的可信度的确定的方法为:
S21将在所述信用维度下与其它的信用特征存在语义冲突的信用特征作为不可信信用特征,判断所述信用维度下是否存在不可信信用特征,若是,则进入下一步骤,若否,则进入步骤S24;
S22判断所述信用维度下的不可信信用特征的数量是否大于预设特征数量,若是,则通过不可信信用特征的数量确定所述用户在所述信用维度下的可信度;
S23根据不同的不可信信用特征的关联的其它的信用特征的数量、与所述不可信信用特征存在语义冲突的其它的信用特征的数量以及不存在语义冲突的其它的信用特征的数量确定不同的不可信信用特征的特征可信度,根据不同的不可信信用特征的数量以及特征可信度、在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的偏差特征修正量,判断所述偏差特征修正量是否满足要求,若是,则进入下一步骤,若否,则通过所述偏差特征修正量确定所述用户在所述信用维度下的可信度;
S24根据所述检验数据确定在所述信用维度下与其它的信用特征不存在语义网络的信用特征,并将其作为未检验特征,通过未检验特征的数量以及在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的基础可信度;
S25将在所述信用维度下与其它的信用特征不存在语义冲突的信用特征作为可信信用特征,根据不同的可信信用特征的关联的其它的信用特征的数量、可信信用特征的数量以及在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的可信特征修正量,并结合所述偏差特征修正量以及基础可信度确定所述用户在所述信用维度下的可信度。
进一步的,所述用户在不同的信用维度下的可信度的取值范围在0到1之间,其中当所述用户在所述信用维度下的可信度小于预设可信度时,则确定所述信用维度的可信度不满足要求。
S3将可信度不满足要求的信用维度作为疑似风险维度,并根据所述疑似风险维度的数量以及不同的信用维度的可信度进行人行征信数据的综合可信度的确定,当所述综合可信度满足要求时,进入下一步骤;
需要说明的是,当所述用户不存在可信度不满足要求的可信维度时,则直接根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行融合处理得到用户的用户画像。
在可能的一个实施例中,如图3所示,步骤S3中的所述人行征信数据的综合可信度的确定的方法为:
基于所述疑似风险维度的数量以及不同的疑似风险维度的可信度进行所述疑似风险维度的可信度评估量的确定;
将除去所述疑似风险维度的信用维度作为可信信用维度,基于所述可信风险维度的数量以及不同的可信风险维度的可信度进行所述可信风险维度的可信度评估量的确定;
获取不同的信用维度的可信度的平均值,并结所述可信风险维度的可信度评估量以及所述疑似风险维度的可信度评估量进行所述人行征信数据的综合可信度的确定。
可以理解的是,当所述综合可信度不满足要求时,则确定所述用户的人行征信数据的可信度不满足要求,无须进行用户的用户画像的构建,直接输出授信风险。
在另外的一个实施例中,步骤S3中的所述人行征信数据的综合可信度的确定的方法为:
当所述人行征信数据的疑似风险维度的数量大于预设维度数量时,则确定所述人行征信数据的综合可信度不满足要求;
当所述人行征信数据的疑似风险维度的数量大于预设维度数量时,获取所述疑似风险维度的可信度,当可信度小于可信度阈值的疑似风险维度的数量大于预设维度限定数量时,则确定所述人行征信数据的综合可信度不满足要求;
当可信度小于可信度阈值的疑似风险维度的数量不大于预设维度限定数量时,基于所述疑似风险维度的数量以及不同的疑似风险维度的可信度进行所述疑似风险维度的可信度评估量的确定,当所述疑似风险维度的可信度评估量不满足要求时,则确定所述人行征信数据的综合可信度不满足要求;
当所述疑似风险维度的可信度评估量满足要求时,将除去所述疑似风险维度的信用维度作为可信信用维度,基于所述可信风险维度的数量以及不同的可信风险维度的可信度进行所述可信风险维度的可信度评估量的确定;
获取不同的信用维度的可信度的平均值,并结所述可信风险维度的可信度评估量以及所述疑似风险维度的可信度评估量进行所述人行征信数据的综合可信度的确定。
在另外的一个实施例中,步骤S3中的所述人行征信数据的综合可信度的确定的方法为:
S31判断所述人行征信数据的不同的信用维度的可信度的平均值是否满足要求,若是,则进入下一步骤,若否,则确定所述人行征信数据的综合可信度不满足要求;
S32判断所述人行征信数据的疑似风险维度的数量是否大于预设维度数量,若是,则进入下一步骤,若否,则进入步骤S34;
S33判断所述人行征信数据的疑似风险维度的可信度的和是否满足要求,若是,则进入下一步骤,若否,则确定所述人行征信数据的综合可信度不满足要求;
S34将可信度小于可信度阈值的疑似风险维度作为问题风险维度,并根据问题风险维度的数量以及在所述信用维度的数量占比、疑似风险维度的数量以及不同的疑似风险维度的可信度进行所述疑似风险维度的可信度评估量的确定,判断所述疑似风险维度的可信度评估量是否不满足要求,若是,则确定所述人行征信数据的综合可信度不满足要求,若否,则进入下一步骤;
S35将除去所述疑似风险维度的信用维度作为可信信用维度,基于所述可信风险维度的数量以及不同的可信风险维度的可信度进行所述可信风险维度的可信度评估量的确定,获取不同的信用维度的可信度的平均值,并结所述可信风险维度的可信度评估量以及所述疑似风险维度的可信度评估量进行人行征信数据的综合可信度的确定。
S4获取不同的信用维度下的信用特征完整度,并结合不同的信用维度下的可信度确定所述用户的人行征信数据可靠时,根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行融合处理得到用户的用户画像。
需要说明的是,所述信用特征完整度根据所述用户的人行征信数据在所述信用维度下的信用特征的数量与所述信用维度下的预设的信用特征的数量的比值进行确定。
在可能的一个实施例中,如图4所示,步骤S4中的确定所述用户的人行征信数据可靠,具体包括:
通过不同的信用维度下的可信度以及信用特征完整度进行不同的信用维度下的维度数据可靠性的确定;
获取不同的信用维度下的维度数据可靠性以及类型,并结合所述用户的人行征信数据的信用维度的数量和类型确定所述用户的人行征信数据的可靠性,并通过所述可靠性确定所述用户的人行征信数据是否可靠。
在另外的一个实施例中,步骤S4中的确定所述用户的人行征信数据可靠,具体包括:
S41通过不同的信用维度下的信用特征完整度进行不完整信用维度的数量的确定,判断所述不完整信用维度的数量是否满足要求,若是,则进入下一步骤,若否,则确定所述用户的人行征信数据不可靠;
S42判断所述不完整信用维度的数量与所述疑似风险维度的数量的和是否满足要求,若是,则进入下一步骤,若否,则确定所述用户的人行征信数据不可靠;
S43根据不同的信用维度下的可信度以及信用特征完整度进行不同的信用维度下的维度数据可靠性的确定,判断是否存在维度数据可靠性不满足要求的信用维度,若是,则进入下一步骤,若否,则进入步骤S46;
S44将维度数据可靠性不满足要求的信用维度作为不可靠信用维度,判断所述不可靠信用维度的数量是否满足要求,若是,则进入下一步骤,若否,则确定所述用户的人行征信数据不可靠;
S45通过不可靠信用维度的数量、不可靠信用维度的类型以及不同的不可靠信用维度的维度数据可靠性确定不可靠信用维度的可靠影响值,判断所述不可靠信用维度的可靠影响值是否满足要求,若是,则进入下一步骤,若否,则确定所述用户的人行征信数据不可靠;
S46获取不同的信用维度下的维度数据可靠性以及类型,并结合所述用户的人行征信数据的信用维度的数量和类型、不可靠信用维度的可靠影响值确定所述用户的人行征信数据的可靠性,并通过所述可靠性确定所述用户的人行征信数据是否可靠。
需要说明的是,所述用户的用户画像的构建的方法为:
根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行可视化处理得到所述用户在不同的信用维度下的用户画像,并对所述用户在不同的信用维度下的用户画像进行融合处理得到所述用户的用户画像。
另一方面,如图5所示,本发明提供了一种计算机***,包括:通信连接的存储器和处理器,以及存储在所述存储器上并能够在所述处理器上运行的计算机程序,其特征在于:所述处理器运行所述计算机程序时执行上述的一种人行征信用户画像搭建方法。
其中上述的一种人行征信用户画像搭建方法,具体包括:
从用户的人行征信数据的不同的信息模块中进行实体信息的提取,基于所述实体信息进行不同的信用维度的信用特征的提取;
进行不同的信用特征之间的语义网络的构建,并通过所述语义网络对不同的信用特征进行对齐检验处理得到不同的信用维度的可信特征的检验数据,通过所述检验数据确定所述用户在不同的信用维度下的可信度,当存在可信度不满足要求的信用维度时,进入下一步骤;
当所述人行征信数据的疑似风险维度的数量大于预设维度数量时,则确定所述人行征信数据的综合可信度不满足要求;
当所述人行征信数据的疑似风险维度的数量大于预设维度数量时,获取所述疑似风险维度的可信度,当可信度小于可信度阈值的疑似风险维度的数量大于预设维度限定数量时,则确定所述人行征信数据的综合可信度不满足要求;
当可信度小于可信度阈值的疑似风险维度的数量不大于预设维度限定数量时,基于所述疑似风险维度的数量以及不同的疑似风险维度的可信度进行所述疑似风险维度的可信度评估量的确定,当所述疑似风险维度的可信度评估量不满足要求时,则确定所述人行征信数据的综合可信度不满足要求;
当所述疑似风险维度的可信度评估量满足要求时,将除去所述疑似风险维度的信用维度作为可信信用维度,基于所述可信风险维度的数量以及不同的可信风险维度的可信度进行所述可信风险维度的可信度评估量的确定;
获取不同的信用维度的可信度的平均值,并结所述可信风险维度的可信度评估量以及所述疑似风险维度的可信度评估量进行所述人行征信数据的综合可信度的确定;
获取不同的信用维度下的信用特征完整度,并结合不同的信用维度下的可信度确定所述用户的人行征信数据可靠时,根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行可视化处理得到所述用户在不同的信用维度下的用户画像,并对所述用户在不同的信用维度下的用户画像进行融合处理得到所述用户的用户画像。
通过以上实施例,本发明取得以下有益效果:
1、通过检验数据确定用户在不同的信用维度下的可信度,充分考虑到不同的信用维度下的不同的信用特征由于与其它的信用特征的语义冲突情况和一致情况的差异导致的不同的信用特征的可信度的差异,实现了对不同的信用维度的可信度的准确评估,也为差异化的进行用户的用户画像的生成以及不可信用户的筛选奠定了基础。
2、根据疑似风险维度的数量以及不同的信用维度的可信度进行人行征信数据的综合可信度的确定,实现了从多个信用维度的角度对不可信用户的筛选,避免了对人行征信数据不可信的用户进行用户画像的处理导致的处理效率较低的技术问题。
3、根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行融合处理得到用户的用户画像,即考虑到不同的信用维度下的信用特征的差异,同时通过语义网络的识别使得用户画像的生成处理结果能够更加准确的反应真实的用户的信贷风险,也为进一步进行信贷风险的有效控制奠定了基础。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (11)
1.一种人行征信用户画像搭建方法,其特征在于,具体包括:
从用户的人行征信数据的不同的信息模块中进行实体信息的提取,基于所述实体信息进行不同的信用维度的信用特征的提取;
进行不同的信用特征之间的语义网络的构建,并通过所述语义网络对不同的信用特征进行对齐检验处理得到不同的信用维度的可信特征的检验数据,通过所述检验数据确定所述用户在不同的信用维度下的可信度,当存在可信度不满足要求的信用维度时,进入下一步骤;
将可信度不满足要求的信用维度作为疑似风险维度,并根据所述疑似风险维度的数量以及不同的信用维度的可信度进行人行征信数据的综合可信度的确定,当所述综合可信度满足要求时,进入下一步骤;
获取不同的信用维度下的信用特征完整度,并结合不同的信用维度下的可信度确定所述用户的人行征信数据可靠时,根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行融合处理得到用户的用户画像。
2.如权利要求1所述的人行征信用户画像搭建方法,其特征在于,所述信用模块包括用户身份、职业、居住信息、历史信贷数据。
3.如权利要求1所述的人行征信用户画像搭建方法,其特征在于,所述信用维度包括用户身份信息、信贷逾期信息、信贷申请信息、信贷支用信息和征信查询信息。
4.如权利要求1所述的人行征信用户画像搭建方法,其特征在于,所述检验数据包括用于所述信用特征检验的其它的信用特征的数量以及与所述信用特征的语义存在冲突的其它的信用特征的数量。
5.如权利要求1所述的人行征信用户画像搭建方法,其特征在于,所述用户在所述信用维度下的可信度的确定的方法为:
根据所述检验数据确定在所述信用维度下与其它的信用特征不存在语义网络的信用特征,并将其作为未检验特征,通过未检验特征的数量以及在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的基础可信度;
将在所述信用维度下与其它的信用特征不存在语义冲突的信用特征作为可信信用特征,根据不同的可信信用特征的关联的其它的信用特征的数量、可信信用特征的数量以及在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的可信特征修正量;
将在所述信用维度下与其它的信用特征存在语义冲突的信用特征作为不可信信用特征,根据不同的不可信信用特征的关联的其它的信用特征的数量、与所述不可信信用特征存在语义冲突的其它的信用特征的数量以及不存在语义冲突的其它的信用特征的数量确定不同的不可信信用特征的特征可信度;
根据不同的不可信信用特征的数量以及特征可信度、在所述信用维度下的信用特征的数量占比确定所述用户在所述信用维度下的偏差特征修正量,并结合所述可信特征修正量以及基础可信度确定所述用户在所述信用维度下的可信度。
6.如权利要求1所述的人行征信用户画像搭建方法,其特征在于,所述用户在不同的信用维度下的可信度的取值范围在0到1之间,其中当所述用户在所述信用维度下的可信度小于预设可信度时,则确定所述信用维度的可信度不满足要求。
7.如权利要求1所述的人行征信用户画像搭建方法,其特征在于,当所述用户不存在可信度不满足要求的可信维度时,则直接根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行融合处理得到用户的用户画像。
8.如权利要求1所述的人行征信用户画像搭建方法,其特征在于,所述人行征信数据的综合可信度的确定的方法为:
基于所述疑似风险维度的数量以及不同的疑似风险维度的可信度进行所述疑似风险维度的可信度评估量的确定;
将除去所述疑似风险维度的信用维度作为可信信用维度,基于所述可信风险维度的数量以及不同的可信风险维度的可信度进行所述可信风险维度的可信度评估量的确定;
获取不同的信用维度的可信度的平均值,并结所述可信风险维度的可信度评估量以及所述疑似风险维度的可信度评估量进行所述人行征信数据的综合可信度的确定。
9.如权利要求1所述的人行征信用户画像搭建方法,其特征在于,当所述综合可信度不满足要求时,则确定所述用户的人行征信数据的可信度不满足要求,无须进行用户的用户画像的构建,直接输出授信风险。
10.如权利要求1所述的人行征信用户画像搭建方法,其特征在于,所述用户的用户画像的构建的方法为:
根据不同的信用维度下的信用特征以及信用特征之间的语义网络进行可视化处理得到所述用户在不同的信用维度下的用户画像,并对所述用户在不同的信用维度下的用户画像进行融合处理得到所述用户的用户画像。
11.一种计算机***,包括:通信连接的存储器和处理器,以及存储在所述存储器上并能够在所述处理器上运行的计算机程序,其特征在于:所述处理器运行所述计算机程序时执行权利要求1-10任一项所述的一种人行征信用户画像搭建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410278375.8A CN117876103B (zh) | 2024-03-12 | 2024-03-12 | 一种人行征信用户画像搭建方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410278375.8A CN117876103B (zh) | 2024-03-12 | 2024-03-12 | 一种人行征信用户画像搭建方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117876103A true CN117876103A (zh) | 2024-04-12 |
CN117876103B CN117876103B (zh) | 2024-06-18 |
Family
ID=90597174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410278375.8A Active CN117876103B (zh) | 2024-03-12 | 2024-03-12 | 一种人行征信用户画像搭建方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117876103B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080059364A1 (en) * | 2006-09-01 | 2008-03-06 | Tidwell Lisa C | Systems and methods for performing a financial trustworthiness assessment |
US8504470B1 (en) * | 2011-08-31 | 2013-08-06 | BT Patent LLC | Methods and systems for financial transactions |
CN109191281A (zh) * | 2018-08-21 | 2019-01-11 | 重庆富民银行股份有限公司 | 一种基于知识图谱的团体欺诈识别*** |
CN110110093A (zh) * | 2019-04-08 | 2019-08-09 | 深圳众赢维融科技有限公司 | 一种基于知识图谱的识别方法、装置、电子设备及存储介质 |
CN110163201A (zh) * | 2019-03-01 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 图像测试方法和装置、存储介质及电子装置 |
CN110717816A (zh) * | 2019-07-15 | 2020-01-21 | 上海氪信信息技术有限公司 | 一种基于人工智能技术的全域金融风险知识图谱构建方法 |
CN114282003A (zh) * | 2021-11-30 | 2022-04-05 | 中国建设银行股份有限公司 | 基于知识图谱的金融风险预警方法及装置 |
DE202022104425U1 (de) * | 2022-08-03 | 2022-08-09 | Sayed Sayeed Ahmad | Intelligentes System für die sichere Integration von Kreditwürdigkeitsprüfungen und Bankensystemen durch maschinelles Lernen |
CN115907786A (zh) * | 2022-11-29 | 2023-04-04 | 国网江西省电力有限公司信息通信分公司 | 一种基于知识图谱的供应商画像构建方法 |
CN116629456A (zh) * | 2023-07-20 | 2023-08-22 | 杭银消费金融股份有限公司 | 业务逾期风险预测方法、***与存储介质 |
CN117035985A (zh) * | 2023-07-31 | 2023-11-10 | 浙江孚临科技有限公司 | 一种授信逾期风险控制方法与*** |
CN117078026A (zh) * | 2023-10-17 | 2023-11-17 | 杭银消费金融股份有限公司 | 一种基于数据血缘的风控指标管理方法及*** |
CN117495548A (zh) * | 2023-12-07 | 2024-02-02 | 中国农业银行股份有限公司 | 一种风险预警方法、装置、设备及介质 |
CN117556225A (zh) * | 2024-01-12 | 2024-02-13 | 杭银消费金融股份有限公司 | 一种人行征信数据风险管理*** |
-
2024
- 2024-03-12 CN CN202410278375.8A patent/CN117876103B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080059364A1 (en) * | 2006-09-01 | 2008-03-06 | Tidwell Lisa C | Systems and methods for performing a financial trustworthiness assessment |
US8504470B1 (en) * | 2011-08-31 | 2013-08-06 | BT Patent LLC | Methods and systems for financial transactions |
CN109191281A (zh) * | 2018-08-21 | 2019-01-11 | 重庆富民银行股份有限公司 | 一种基于知识图谱的团体欺诈识别*** |
CN110163201A (zh) * | 2019-03-01 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 图像测试方法和装置、存储介质及电子装置 |
CN110110093A (zh) * | 2019-04-08 | 2019-08-09 | 深圳众赢维融科技有限公司 | 一种基于知识图谱的识别方法、装置、电子设备及存储介质 |
CN110717816A (zh) * | 2019-07-15 | 2020-01-21 | 上海氪信信息技术有限公司 | 一种基于人工智能技术的全域金融风险知识图谱构建方法 |
CN114282003A (zh) * | 2021-11-30 | 2022-04-05 | 中国建设银行股份有限公司 | 基于知识图谱的金融风险预警方法及装置 |
DE202022104425U1 (de) * | 2022-08-03 | 2022-08-09 | Sayed Sayeed Ahmad | Intelligentes System für die sichere Integration von Kreditwürdigkeitsprüfungen und Bankensystemen durch maschinelles Lernen |
CN115907786A (zh) * | 2022-11-29 | 2023-04-04 | 国网江西省电力有限公司信息通信分公司 | 一种基于知识图谱的供应商画像构建方法 |
CN116629456A (zh) * | 2023-07-20 | 2023-08-22 | 杭银消费金融股份有限公司 | 业务逾期风险预测方法、***与存储介质 |
CN117035985A (zh) * | 2023-07-31 | 2023-11-10 | 浙江孚临科技有限公司 | 一种授信逾期风险控制方法与*** |
CN117078026A (zh) * | 2023-10-17 | 2023-11-17 | 杭银消费金融股份有限公司 | 一种基于数据血缘的风控指标管理方法及*** |
CN117495548A (zh) * | 2023-12-07 | 2024-02-02 | 中国农业银行股份有限公司 | 一种风险预警方法、装置、设备及介质 |
CN117556225A (zh) * | 2024-01-12 | 2024-02-13 | 杭银消费金融股份有限公司 | 一种人行征信数据风险管理*** |
Non-Patent Citations (1)
Title |
---|
陈芊汝;: "区块链与大数据技术的结合对互联网征信发展的启示", 甘肃金融, no. 11, 15 November 2016 (2016-11-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN117876103B (zh) | 2024-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109815803B (zh) | 面审风险控制方法、装置、计算机设备和存储介质 | |
CN112084383A (zh) | 基于知识图谱的信息推荐方法、装置、设备及存储介质 | |
CN109697665A (zh) | 基于人工智能的贷款审核方法、装置、设备及介质 | |
CN112785411B (zh) | 征信数据处理方法、***、设备及计算机可读存储介质 | |
CN111652096B (zh) | 基于区块链的人脸识别方法、装置及*** | |
CN116629456B (zh) | 业务逾期风险预测方法、***与存储介质 | |
CN112181835B (zh) | 自动化测试方法、装置、计算机设备及存储介质 | |
CN111709718A (zh) | 基于人工智能的智能保理资产服务平台、方法和存储介质 | |
CN109377347B (zh) | 基于特征选择的网络信用预警方法、***及电子设备 | |
CN110309099A (zh) | 接口管理方法、装置、设备及计算机可读存储介质 | |
CN112988896A (zh) | 一种基于区块链的同步共识方法及***及装置及介质 | |
CN114218110A (zh) | 财务数据的对账测试方法、装置、计算机设备及存储介质 | |
CN115034886A (zh) | 一种违约风险预测方法及装置 | |
CN117876103B (zh) | 一种人行征信用户画像搭建方法及*** | |
CN111461191B (zh) | 为模型训练确定图像样本集的方法、装置和电子设备 | |
CN112966304A (zh) | 流程文档的防篡改方法、装置、计算机设备及介质 | |
CN111275540A (zh) | 一种消费信贷审批方法、装置及终端设备 | |
CN109636572A (zh) | 银行卡的风险检测方法、装置、设备及可读存储介质 | |
CN115150150A (zh) | 一种基于区块链技术的信息记录方法 | |
CN115050042A (zh) | 一种理赔资料录入方法、装置、计算机设备及存储介质 | |
CN114971017A (zh) | 银行交易数据的处理方法及装置 | |
CN109636573A (zh) | 信贷分析方法、装置、设备及可读存储介质 | |
CN112053051A (zh) | 尽职调查应用***及其信息处理方法 | |
CN111275506A (zh) | 一种开具票据的方法以及区块链节点设备 | |
CN111770080A (zh) | 一种设备指纹的恢复方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |