CN115063224A - 基于用户画像的业务审核方法、装置、设备及存储介质 - Google Patents

基于用户画像的业务审核方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115063224A
CN115063224A CN202210598086.7A CN202210598086A CN115063224A CN 115063224 A CN115063224 A CN 115063224A CN 202210598086 A CN202210598086 A CN 202210598086A CN 115063224 A CN115063224 A CN 115063224A
Authority
CN
China
Prior art keywords
data
user
credit investigation
service
portrait
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210598086.7A
Other languages
English (en)
Inventor
罗炜鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202210598086.7A priority Critical patent/CN115063224A/zh
Publication of CN115063224A publication Critical patent/CN115063224A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及人工智能技术领域,尤其涉及一种基于用户画像的业务审核方法、装置、设备及存储介质。通过获取待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息,并输入至预设的征信评分模型进行征信评分,判断征信评分的结果是否满足与业务对应的审核条件;若满足,则利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并构造用户的用户画像;将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并以此确定所述业务数据的审核结果,从而解决了现有技术中无法对客户征信情况进行全面分析以及无法对业务审核过程中的可能存在的高风险情况进行有效判别的问题。

Description

基于用户画像的业务审核方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于用户画像的业务审核方法、装置、设备及存储介质。
背景技术
现有技术在对业务进行审核时,例如,对贷款业务进行审核时,需要所以审查各个方面的风险,业界一般通过人工审核的方式对客户上传材料,客户征信信息,客户收入信息等进行审核来评估上述风险。现有的业务审核技术存在无法对客户征信情况进行全面分析以及无法对业务审核过程中的可能存在的高风险情况进行有效判别的问题。
发明内容
本申请的主要目的是提供一种基于用户画像的业务审核方法、装置、设备及存储介质,以解决现有的业务审核技术中存在的无法对客户征信情况进行全面分析以及无法对业务审核过程中的可能存在的高风险情况进行有效判别的问题。
本发明第一方面提供了一种基于用户画像的业务审核方法,所述业务审核方法包括:获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息;将所述征信信息输入至预设的征信评分模型进行征信评分,并判断征信评分的结果是否满足与业务对应的审核条件;若满足,则利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并根据所述用户个人信息和所述环境数据构造用户的用户画像;将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果。
可选地,在本发明第一方面的第一种实现方式中,所述获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息,包括:获取业务审核***界面中的待审核的业务数据,并提取其中的用户标识信息,其中,所述用户标识信息至少包括用户姓名和证件号;以所述用户标识信息作为检索索引,从所述业务数据中筛选出与其匹配的征信数据;基于预先构造的用户征信数据结构对所述征信数据进行预处理,以用户标识信息为数据单位,将征信数据中与用户征信数据结构所对应的数据类型整合到所述数据单位中,得到征信信息。
可选地,在本发明第一方面的第二种实现方式中,所述将所述征信信息输入至预设的征信评分模型进行征信评分,并判断征信评分的结果是否满足与业务对应的审核条件,包括:将所述征信信息输入至征信评分模型中,通过所述征信评分模型的卷积神经网络层进行卷积操作,得到多个维度的特征向量;通过所述征信评分模型的输入层,对多个所述特征向量进行加权求和,并将加权求和所得的值输出至所述隐藏层;通过所述隐藏层调用预设的激活函数构建非线性神经网络模型单元,基于所述非线性神经网络模型单元对所述加权求和所得的值进行非线性转化,得到非线性拟合值,输出至所述输出层;通过所述输出层对所述非线性拟合值进行回归计算,得到回归值;调用预设的归一化函数对所述回归值进行归一化,得到征信评分值。
可选地,在本发明第一方面的第三种实现方式中,在所述获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息之前,还包括:采集数据,并对其中与征信评分相关的数据进行筛选和分类,整理成征信评分数据集,其中,所述征信评分数据集至少包括基于所述征信评分相关的数据所得的征信评分真实值;将所述征信评分数据集中的数据输入至待训练的神经网络模型,通过所述神经网络模型对所述征信信息进行转换,得到对应的特征向量;通过所述神经网络模型的输入层,对特征向量加权求和,并将加权求和所得值传入隐藏层;通过所述神经网络模型的隐藏层,调用预设的激活函数对所述加权求和所得值进行非线性转化,得到非线性神经网络模型单元;通过所述神经网络模型的输出层,对非线性神经网络模型单元所输出的值进行回归计算,得到回归值;调用预设的归一化函数对所述回归值进行归一化,得到征信评分预测值;调用反向传播算法中的误差计算公式,根据征信评分预测值和对应的征信评分真实值分别对所述隐藏层和所述输出层进行误差计算,得到对应的误差值;调用反向传播算法中的权重修改公式,根据所述隐藏层和所述输出层分别对应的误差值进行权重修改值计算,得到对应的权重修改值;调用反向传播算法中的偏置向修改公式,根据所述隐藏层和所述输出层分别对应的误差值进行偏置向修改值计算,得到对应的偏置向修改值;根据所述权重修改值和偏置向修改值对所述神经网络模型进行修改;根据所述征信评分数据集,迭代计算征信评分预测值,在每一次迭代中,根据所述权重修改值和偏置向修改值对所述神经网络模型进行修改,直到所述误差值或者循环次数满足预设条件值,停止迭代,并输出征信评分模型。
可选地,在本发明第一方面的第四种实现方式中,所述根据所述用户个人信息和所述环境数据构造用户的用户画像,包括:提取所述用户个人信息中的信用记录,以及所述环境数据中的活动轨迹;获取所述活动轨迹的特定范围内与所述信用记录相匹配的信用案例数据;根据所有信用案例数据计算用户不同维度的标签度量值;基于所述标签度量值构建用户的用户画像。
可选地,在本发明第一方面的第五种实现方式中,所述将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果,包括:根据所述用户画像,提取出所述违法记录维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到违法记录维度标签度量值比对结果;根据所述用户画像,提取出所述工作地址相关信用案例维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到工作地址相关信用案例维度标签度量值比对结果;根据所述用户画像,提取出所述手机号码黑名单标记维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到手机号码黑名单标记维度标签度量值比对结果;根据所述用户画像,提取出所述账单地址与手机号码归属地对应情况维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到账单地址与手机号码归属地对应情况维度标签度量值比对结果;根据预设的黑名单画像比对结果构造方法,基于所述违法记录维度标签度量值比对结果、所述工作地址相关信用案例维度标签度量值比对结果、所述手机号码黑名单标记维度标签度量值比对结果和所述账单地址与手机号码归属地对应情况维度标签度量值比对结果构造黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果。
可选地,在本发明第一方面的第六种实现方式中,在所述将用户画像与预设的黑名单画像比对,得到黑名单画像比对结果,并判断所述黑名单画像比对结果是否满足与业务对应的审核条件之后,还包括:采集数据,并对其中与对于所述与业务对应的审核条件的符合度相关的数据进行筛选和分类,整理成聚类分析数据集;选取数据空间中数目为预设聚类中心数目的数据对象,作为聚类中心,其中,所述聚类中心数目至少为2,每一个聚类中心对应一个聚类群,所述聚类群至少包括对于所述与业务对应的审核条件的符合度较高的聚类群和对于所述与业务对应的审核条件的符合度较低的聚类群;根据欧氏距离计算公式,计算数据空间中所有数据对象与所述聚类中心的欧氏距离,并根据欧氏距离最近原则,将数据空间中所有数据对象划分成与所述聚类中心对应的聚类群;计算每一个所述聚类群包含的数据对象的均值,并将所述均值对应的数据对象作为对应聚类群的聚类中心,记录所有聚类中心,得到基于所述聚类中心欧氏距离最小化的目标函数,此时,完成一次聚类中心的更新;根据所述聚类分析数据集,迭代计算数据空间中所有数据对象与所述聚类中心的欧氏距离,在每一次迭代中,根据上述步骤完成所述聚类中心的更新,并计算更新前后所述聚类中心之间的欧氏距离,直到所述更新前后所述聚类中心之间的欧氏距离或者迭代次数满足预设聚类分析条件值,停止迭代,并输出对应的所述基于所述聚类中心欧氏距离最小化的目标函数,得到聚类分析目标函数;获取所述用户画像,以多维数据点的形式将所述用户画像映射成数据空间中的数据对象,其中,所述多维数据点的维度为对应的用户画像所具有的信息维度,所述数据空间的维度为所述多维数据点的维度加上分析维度;通过聚类分析目标函数确定所述聚类中心,其中,每一个所述聚类中心对应一个所述聚类群;根据欧氏距离计算公式,计算数据空间中所有数据对象与所述聚类中心的欧氏距离,并根据欧氏距离最近原则,将数据空间中所有数据对象划分成与所述聚类中心对应的聚类群;根据所述用户画像对应的数据对象所被划分到的所述聚类群,得到所述用户画像的聚类分析结果;根据所述聚类分析结果,判断是否通过业务审核,并输出判断结果。
本发明第二方面提供了一种基于用户画像的业务审核装置,包括:信息筛选模块,用于获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息;征信评分模块,用于将所述征信信息输入至预设的征信评分模型进行征信评分,并判断征信评分的结果是否满足与业务对应的审核条件;画像构造模块,用于利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并根据所述用户个人信息和所述环境数据构造用户的用户画像;画像比对模块,用于将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果。
可选地,在本发明第二方面的第一种实现方式中,所述信息筛选模块包括:标识提取单元,用于获取业务审核***界面中的待审核的业务数据,并提取其中的用户标识信息,其中,所述用户标识信息至少包括用户姓名和证件号;检索筛选单元,用于以所述用户标识信息作为检索索引,从所述业务数据中筛选出与其匹配的征信数据;预处理单元,用于基于预先构造的用户征信数据结构对所述征信数据进行预处理,以用户标识信息为数据单位,将征信数据中与用户征信数据结构所对应的数据类型整合到所述数据单位中,得到征信信息。
可选地,在本发明第二方面的第二种实现方式中,所述征信评分模块包括:卷积操作单元,用于将所述征信信息输入至征信评分模型中,通过所述征信评分模型的卷积神经网络层进行卷积操作,得到多个维度的特征向量;加权求和单元,用于通过所述征信评分模型的输入层,对多个所述特征向量进行加权求和,并将加权求和所得的值输出至所述隐藏层;非线性转化单元,用于通过所述隐藏层调用预设的激活函数构建非线性神经网络模型单元,基于所述非线性神经网络模型单元对所述加权求和所得的值进行非线性转化,得到非线性拟合值,输出至所述输出层;回归计算单元,用于通过所述输出层对所述非线性拟合值进行回归计算,得到回归值;归一化单元,用于调用预设的归一化函数对所述回归值进行归一化,得到征信评分值。
可选地,在本发明第二方面的第三种实现方式中,所述画像构造模块包括:第一获取单元,用于提取所述用户个人信息中的信用记录,以及所述环境数据中的活动轨迹;第二获取单元,用于获取所述活动轨迹的特定范围内与所述信用记录相匹配的信用案例数据;度量计算单元,用于根据所有信用案例数据计算用户不同维度的标签度量值;画像构建单元,用于基于所述标签度量值构建用户的用户画像。
可选地,在本发明第二方面的第四种实现方式中,所述画像比对模块包括:第一比对单元,用于根据所述用户画像,提取出所述违法记录维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到违法记录维度标签度量值比对结果;第二比对单元,用于根据所述用户画像,提取出所述工作地址相关信用案例维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到工作地址相关信用案例维度标签度量值比对结果;第三比对单元,用于根据所述用户画像,提取出所述手机号码黑名单标记维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到手机号码黑名单标记维度标签度量值比对结果;第四比对单元,用于根据所述用户画像,提取出所述账单地址与手机号码归属地对应情况维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到账单地址与手机号码归属地对应情况维度标签度量值比对结果;结果判断单元,用于根据预设的黑名单画像比对结果构造方法,基于所述违法记录维度标签度量值比对结果、所述工作地址相关信用案例维度标签度量值比对结果、所述手机号码黑名单标记维度标签度量值比对结果和所述账单地址与手机号码归属地对应情况维度标签度量值比对结果构造黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果。
可选地,在本发明第二方面的第五种实现方式中,所述基于用户画像的业务审核装置还包括:模型输出模块,用于采集数据,并对其中与征信评分相关的数据进行筛选和分类,整理成征信评分数据集,其中,所述征信评分数据集至少包括基于所述征信评分相关的数据所得的征信评分真实值;将所述征信评分数据集中的数据输入至待训练的神经网络模型,通过所述神经网络模型对所述征信信息进行转换,得到对应的特征向量;通过所述神经网络模型的输入层,对特征向量加权求和,并将加权求和所得值传入隐藏层;通过所述神经网络模型的隐藏层,调用预设的激活函数对所述加权求和所得值进行非线性转化,得到非线性神经网络模型单元;通过所述神经网络模型的输出层,对非线性神经网络模型单元所输出的值进行回归计算,得到回归值;调用预设的归一化函数对所述回归值进行归一化,得到征信评分预测值;调用反向传播算法中的误差计算公式,根据征信评分预测值和对应的征信评分真实值分别对所述隐藏层和所述输出层进行误差计算,得到对应的误差值;调用反向传播算法中的权重修改公式,根据所述隐藏层和所述输出层分别对应的误差值进行权重修改值计算,得到对应的权重修改值;调用反向传播算法中的偏置向修改公式,根据所述隐藏层和所述输出层分别对应的误差值进行偏置向修改值计算,得到对应的偏置向修改值;根据所述权重修改值和偏置向修改值对所述神经网络模型进行修改;根据所述征信评分数据集,迭代计算征信评分预测值,在每一次迭代中,根据所述权重修改值和偏置向修改值对所述神经网络模型进行修改,直到所述误差值或者循环次数满足预设条件值,停止迭代,并输出征信评分模型。
可选地,在本发明第二方面的第六种实现方式中,所述基于用户画像的业务审核装置还包括:聚类分析模块,用于采集数据,并对其中与对于所述与业务对应的审核条件的符合度相关的数据进行筛选和分类,整理成聚类分析数据集;选取数据空间中数目为预设聚类中心数目的数据对象,作为聚类中心,其中,所述聚类中心数目至少为2,每一个聚类中心对应一个聚类群,所述聚类群至少包括对于所述与业务对应的审核条件的符合度较高的聚类群和对于所述与业务对应的审核条件的符合度较低的聚类群;根据欧氏距离计算公式,计算数据空间中所有数据对象与所述聚类中心的欧氏距离,并根据欧氏距离最近原则,将数据空间中所有数据对象划分成与所述聚类中心对应的聚类群;计算每一个所述聚类群包含的数据对象的均值,并将所述均值对应的数据对象作为对应聚类群的聚类中心,记录所有聚类中心,得到基于所述聚类中心欧氏距离最小化的目标函数,此时,完成一次聚类中心的更新;根据所述聚类分析数据集,迭代计算数据空间中所有数据对象与所述聚类中心的欧氏距离,在每一次迭代中,根据上述步骤完成所述聚类中心的更新,并计算更新前后所述聚类中心之间的欧氏距离,直到所述更新前后所述聚类中心之间的欧氏距离或者迭代次数满足预设聚类分析条件值,停止迭代,并输出对应的所述基于所述聚类中心欧氏距离最小化的目标函数,得到聚类分析目标函数;获取所述用户画像,以多维数据点的形式将所述用户画像映射成数据空间中的数据对象,其中,所述多维数据点的维度为对应的用户画像所具有的信息维度,所述数据空间的维度为所述多维数据点的维度加上分析维度;通过聚类分析目标函数确定所述聚类中心,其中,每一个所述聚类中心对应一个所述聚类群;根据欧氏距离计算公式,计算数据空间中所有数据对象与所述聚类中心的欧氏距离,并根据欧氏距离最近原则,将数据空间中所有数据对象划分成与所述聚类中心对应的聚类群;根据所述用户画像对应的数据对象所被划分到的所述聚类群,得到所述用户画像的聚类分析结果;根据所述聚类分析结果,判断是否通过业务审核,并输出判断结果。
本发明第三方面提供了一种计算机设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行上述的基于用户画像的业务审核方法的各个步骤。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于用户画像的业务审核方法的各个步骤。
本发明的技术方案中,该方法具体是通过获取待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息,并输入至预设的征信评分模型进行征信评分,判断征信评分的结果是否满足与业务对应的审核条件;若满足,则利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并构造用户的用户画像;将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并以此确定所述业务数据的审核结果,从而解决了现有技术中无法对客户征信情况进行全面分析以及无法对业务审核过程中的可能存在的高风险情况进行有效判别的问题。
附图说明
图1为本发明实施例中为基于用户画像的业务审核方法的第一个实施例示意图;
图2为本发明实施例中为基于用户画像的业务审核方法的第二个实施例示意图;
图3为本发明实施例中为基于用户画像的业务审核方法的第三个实施例示意图;
图4为本发明实施例中基于用户画像的业务审核装置的一个实施例示意图;
图5为本发明实施例中基于用户画像的业务审核装置的另一个实施例示意图;
图6为本发明实施例中计算机设备的一个实施例示意图。
具体实施方式
为了解决现有技术中存在的无法对客户征信情况进行全面分析以及无法对可能存在的高风险情况进行有效判别的技术问题,本申请提供了一种基于用户画像的业务审核方法。通过获取待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息,并输入至预设的征信评分模型进行征信评分,判断征信评分的结果是否满足与业务对应的审核条件;若满足,则利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并构造用户的用户画像;将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并以此确定所述业务数据的审核结果,从而解决了现有技术中无法对客户征信情况进行全面分析以及无法对业务审核过程中的可能存在的高风险情况进行有效判别的问题。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中基于用户画像的业务审核方法的第一个实施例,该方法的实现步骤如下:
101、获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从业务数据中筛选出其中的征信信息;
对于该步骤,具体可以通过以下方式实现:
通过兼容于业务审核***的采集工具,获取业务审核***界面中的待审核的业务数据,例如,通过在相应业务审核***设置合法的数据采集接口,将该数据采集接口作为采集工具进行数据采集;
为业务数据中的不同种类的数据添加标识号,例如,客户身份信息标识号为001,用户所提交的业务审核申请表标识号为002;
获取预先构造的用户征信数据结构中的数据标识号,在业务数据中搜索与对应标识号所匹配的数据,提取这些数据并按照预先构造的用户征信数据结构进行保存,例如,若预先构造的用户征信数据结构中包括标识号001和标识号002对应的数据,且预先构造的用户征信数据结构是以客户身份证号为主键的两个具有对应关系的数据表,则在业务数据中搜索与对应标识号001和002所匹配的数据,提取这些数据并按照以客户身份证号为主键的两个具有对应关系的数据表的形式进行保存。
102、将征信信息输入至预设的征信评分模型进行征信评分,并判断征信评分的结果是否满足与业务对应的审核条件;
在该步骤中,所述征信评分模型采用BP神经网络,包括输入层、输出层和多个隐藏层,例如,包括两个隐藏层。
在该步骤中,所述将征信信息输入至预设的征信评分模型进行征信评分的过程包括:
通过One-hot编码提取所述征信信息所包含的文字信息,将其转换成词向量,其中,所述One-hot编码,又称一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候只有一位有效;
获取所述词向量,并通过所述征信评分模型的输入层对词向量进行加权求和处理,具体地,采用以下公式,对词向量进行加权求和:
Figure BDA0003668890090000081
其中,Ij表示加权求和所得值,ωi,j表示在维度i和维度j上的权重,Oi表示当前神经单元的值,θj为当前神经单元的偏置向;
所述征信评分模型中的输入层对所述词向量经过加权求和之后,传递给隐藏层,当所述神经网络包括两个隐藏层时,第一个隐藏层采用上述加权求和公式作为传递函数,分别在传递函数中代入该层的权重和偏置向,将经过传递函数处理的词向量值传递给第二个隐藏层,第二个隐藏层再以同样的方式将词向量值传递至输出层;
在输出层,采用Sigmoid函数对词向量值进行回归计算,得到对应的回归值;
采用对数函数对回归值进行归一化,得到0到1之间的征信评分值;
根据征信评分值判断征信评分的结果是否满足与业务对应的审核条件,并输出判断结果。
103、利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并根据用户个人信息和环境数据构造用户的用户画像;
对于该步骤,具体可以通过以下方式实现:
调用大数据搜索引擎在得到合法授权的范围内进行搜索,例如,调用ElasticSearch搜索引擎进行搜索,并获取得到合法授权的用户个人信息和环境数据;
将所述用户个人信息和所述环境数据按照数据类型的不同进行提取,例如,将其中的图片信息和文字信息分别提取,并归纳至预先设置好的数据结构中进行保存,例如,将图片信息存储于可兼容图的数据表中,将文字信息存储于数组中;
按照预先设置的用户画像标签,将所述不同数据类型的的数据进行统一量纲的操作,例如,对不同标签对应的文字信息统一量纲,设为在该标签下对应信息的存在状态和不存在状态,其中,存在状态用1表示,不存在状态用0表示;
获取所有标签对应的统一量纲下的取值,构建用户画像。
104、将用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并根据黑名单画像比对结果确定业务数据的审核结果;
对于该步骤,具体可以通过以下方式实现:
获取用户画像和黑名单画像中所有标签对应的统一量纲下的取值,例如,获取用户画像的第一标签、第二标签和第三标签对应的取值,与之对应地,获取黑名单画像中第一标签、第二标签和第三标签对应的取值;
依次将用户画像的标签对应的统一量纲下的取值与黑名单画像的标签对应的统一量纲下的取值进行比对,得到黑名单画像比对结果,例如,当用户画像与预设的黑名单画像存在三个对应的标签时,比对第一标签对应的取值,若比对结果为不符合,则比对第二标签对应的取值,若比对结果为不符合,则比对第三标签对应的取值,若比对结果为不符合,则黑名单画像比对结果输出为不符合,若上述比对过程出现了比对结果为符合的情况,则黑名单画像比对结果输出为符合;
若黑名单画像比对结果为符合,则业务数据的审核结果输出为审核不通过;
若黑名单画像比对结果为不符合,则业务数据的审核结果输出为审核通过。
通过对上述方法的实施,通过获取待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息,并输入至预设的征信评分模型进行征信评分,判断征信评分的结果是否满足与业务对应的审核条件;若满足,则利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并构造用户的用户画像;将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并以此确定所述业务数据的审核结果,在此过程中,对于业务数据的审核结果的判断是基于评分和黑名单画像比对结果综合判断得出的,从而解决了现有技术中无法对客户征信情况进行全面分析以及无法对业务审核过程中的可能存在的高风险情况进行有效判别的问题。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图2,本发明实施例中基于用户画像的业务审核方法的第二个实施例,该方法的实现步骤如下:
201、获取待审核的业务数据,分别提取出其中与业务审核条件信息和征信信息,并根据业务审核条件信息确定与业务对应的审核条件;
对于该步骤,具体可以通过以下方式实现:
获取待审核的业务数据,并获取业务名称和待审核用户名称,并采用标识号进行标识,例如,业务名称标识号设为0100,用户标识号设为0101;
以业务名称和待审核用户名称作为索引,搜索业务数据中与之匹配的信息,并按照预设的格式提取业务审核条件信息和征信信息,例如,以业务名称和待审核用户名称作为索引,搜索到业务数据中与之匹配的位置,并按照业务数据的结构,提取业务名称之后的表头名称,得到业务审核条件信息,提取待审核用户名称之后的字符串,得到征信信息;
对业务审核条件信息进行数据清洗,得到与业务对应的审核条件,例如,去除业务审核条件信息中的重复部分,获取业务审核条件信息中的所有条件名称,构造与业务对应的审核条件。
202、将征信信息输入至预设的征信评分模型进行征信评分,并判断征信评分的结果是否满足与业务对应的审核条件;
在本实施例中,所述预设的征信评分模型包括神经网络模型,其中,神经网络模型包括输出层、隐藏层和输出层,该神经网络模型可以通过如下方式进行训练:
采集数据并构建训练数据集,按照预设方式输入至神经网络模型,得到训练预测值,例如,将所述训练数据集中的数据分为训练数据和测试数据,循环将训练数据输入至神经网络模型,得到对应的训练预测值,每循环一百次,将测试数据输入至神经网络模型,得到对应的训练预测值;
采用如下公式分别对所述输出层、隐藏层和输出层进行迭代误差计算:
Figure BDA0003668890090000101
其中,j代表当前计算误差所在层的编号,k代表当前计算误差所在层之后的一层的编号,Errj表示当前计算误差所在层的误差值,Errk表示当前层之后的一层的误差值,Oj表示当前层输出的预测值,ωj, k表示当前单元与后层单元的权重值;
计算得到每层的误差之后,根据误差来修改所述神经网络模型的权重和偏置向,例如,在原权重的基础上乘以误差值与预测值的比值,在原偏置向的基础上加上误差值与真实值的比值;
在每一次完成神经网络模型的权重和偏置向修改之后,进行一次误差值计算,直到所述误差值小于设定阈值,输出征信评分模型,例如,当误差值小于0.1时,输出征信评分模型。
在实际应用中,将征信信息输入至征信评分模型进行征信评分,得到评分结果,并判断征信评分的结果是否满足与业务对应的审核条件,例如,当评分结果以百分制表示时,若评分结果大于80分,则判断征信评分的结果满足与业务对应的审核条件,反之则不满足。
203、根据用户上传的信息构建用户画像;
对于该步骤,具体可以通过以下方式实现:
获取用户上传的信息,并按照不同的维度分类保存,例如,预设的维度包括身份维度、活动轨迹维度和违法记录维度,将用户上传的上述维度的信息分类保存;
按照预设的度量标准,对每个维度的信息进行度量,例如,在每个维度都采用0.00到1.00的度量值范围,将用户上传的各个维度的信息对于度量标准的符合度转换成数值,在实际应用中,以活动轨迹维度为例,若用户上传的公司地址满足真实可靠的要求,对应数值0.20,若用户上传的住址信息满足真实可靠的要求,对应数值0.20,将上述数值进行累加,得到活动轨迹维度的度量值为0.40;
根据不同维度对应的度量值,构建用户画像,例如,当预设的维度包括身份维度、活动轨迹维度和违法记录维度时,将各维度的名称和对应度量值保存为用户画像数据表的形式,得到用户画像。
204、将用户画像与预设的黑名单画像进行比对,得到比对结果,根据比对结果确定业务数据的审核结果并输出;
对于该步骤,具体可以通过以下方式实现:
获取用户画像中每个维度的度量值以及预设的黑名单画像中每个维度的度量值范围,例如,当用户画像中包含的维度包括身份维度、活动轨迹维度和违法记录维度时,获取身份维度、活动轨迹维度和违法记录维度的度量值,并获取预设的黑名单画像中对于身份维度、活动轨迹维度和违法记录维度的度量值范围,在实际应用中,所述度量值范围可以设为:身份维度度量值小于0.40,活动轨迹维度度量值小于0.40,违法记录维度度量值大于0.40;
判断用户画像中每个维度的度量值是否符合黑名单画像中对应的每个维度的度量值范围,得到每个维度的比对结果,例如,当用户画像中包含的维度包括身份维度、活动轨迹维度和违法记录维度时,用户画像中的身份维度度量值为0.50,不符合黑名单画像中身份维度度量值小于0.40的范围,活动轨迹维度度量值为0.50,不符合黑名单画像中活动轨迹维度度量值小于0.40的范围,违法记录维度度量值为0.50,符合黑名单画像中违法记录维度度量值小于0.40的范围;
基于预设的判断方法,根据所述每个维度的比对结果得到所述比对结果,例如,当用户画像中包含的维度包括身份维度、活动轨迹维度和违法记录维度时,身份维度的比对结果为不符合,活动轨迹维度的比对结果为不符合,违法记录维度的比对结果为符合,在实际应用中,若预设的判断方法为:只要有一个维度符合,则判断比对结果为符合,那么,得到比对结果为符合;
根据所述比对结果确定业务数据的审核结果,例如,若比对结果为符合,则输出业务数据的审核结果为不通过,反之,则输出业务数据的审核结果为通过。
通过对上述方法的实施,通过获取待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息,并输入至预设的征信评分模型进行征信评分,判断征信评分的结果是否满足与业务对应的审核条件;若满足,则利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并构造用户的用户画像;将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并以此确定所述业务数据的审核结果,在进行征信评分的过程中,采用BP算法对征信评分模型进行修改,使得征信评分模型的预测能够有效拟合征信评分的真实情况,从而解决了现有技术中无法对客户征信情况进行全面分析以及无法对业务审核过程中的可能存在的高风险情况进行有效判别的问题。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图3,本发明实施例中基于用户画像的业务审核方法的第三个实施例,该方法的实现步骤如下:
301、获取用户提交审核的业务名称和用户上传的待审核信息,并根据提交审核的业务名称得到与业务对应的审核条件,根据与业务对应的审核条件从用户上传的待审核信息之中筛选出征信信息;
对于该步骤,具体可以通过以下方式实现:
获取用户提交审核的业务名称和用户上传的待审核信息,并根据所述提交审核的业务名称得到与业务对应的审核条件,例如,获取到所述用户待审核的业务名称后,搜索审核业务条件表中的匹配项,得到与业务对应的审核条件,其中,所述审核业务条件表是基于实际应用中待审核的业务和对应的业务条件所构建的数据表;
获取与业务对应的审核条件,搜索并提取所述用户上传的待审核信息中对应的数据项,得到征信信息,例如,对于与业务对应的审核条件中的身份证号这一审核条件,在所述用户上传的待审核信息中搜索“身份证号”,得到身份证号对应的数据项,并提取出身份证号对应的字符串,对于与业务对应的审核条件中的其他审核条件,采取同样的方法搜索并提取,将提取到的信息进行整合,在实际应用中,以数据表的形式进行保存,得到征信信息。
302、将征信信息输入至预设的征信评分模型进行征信评分,得到征信评分结果;
在本实施例中,所述征信评分模型包括特征提取模块、征信值预测模块和征信值归一化模块;
对于该步骤,具体可以通过以下方式实现:
通过所述征信评分模型中的特征提取模块对征信信息进行特征提取,例如,当征信信息以数据表的形式进行保存时,所述特征提取模块提取出数据表中每一项的特征信息,得到特征向量矩阵;
通过所述征信值预测模块对所述特征向量矩阵进行加权求和以及非线性拟合计算,得到预测的征信值;
在实际应用中,所述征信评分模型对多个用户的征信信息进行征信评分后,需要得到一个等比例的征信评分结果,可以通过所述征信值归一化模块调用线性函数对基于多个用户征信信息分别预测的征信值进行归一化,将原始数据通过线性化的方法转换到[0,1]范围内,实现对所述预测的征信值的等比例缩放,得到征信评分结果,其中,线性函数公式如下:
Figure BDA0003668890090000121
其中,Xnorm为归一化后的数据,X为原始征信值,Xmax、Xmin分别为征信值的最大值和最小值。
303、利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并传送至风险评估平台,通过风险评估平台进行各风险项目的比对,得到风险评估结果;
该步骤中,所述风险评估平台包括基于云端的风险评估知识图谱和可调用路径查找算法的查找工具;
在实际应用中,该知识图谱包含的数据节点包括违法记录节点、贷款申请记录节点,账单地址与手机归属地对应情况节点;
在实际应用中,通过可调用路径查找算法的查找工具,调用路径查找算法,其中,路径查找算法包括Dijkstra算法,可以依托知识图谱的结构寻找最短路径,得到对应的数据节点;
在本实施例中,所述通过风险评估平台进行各风险项目的比对,得到风险评估结果的过程,包括:
获取用户个人信息和环境数据,并按照预设的风险项目提取出其中各风险项目的信息,例如,预设的风险项目包括:违法记录风险项目、贷款申请记录风险项目和账单地址与手机归属地对应情况风险项目,以上述风险项目为索引,在用户信息中进行搜索,并提取匹配到的各风险项目的信息;
按照预设的风险评估方法,通过风险评估平台进行各风险项目的比对,得到风险评估结果,例如,当预设的风险项目包括:违法记录风险项目、贷款申请记录风险项目和账单地址与手机归属地对应情况风险项目时,通过查找知识图谱中对应的数据节点,逐一进行判断,并得到风险评估结果;
在实际应用中,通过查找知识图谱中对应的数据节点,判断用户是否存在违法驾驶行为或者肇事逃逸,若不存在,则根据公司地址,判断公司地址50米内是否存在大量的贷款申请记录,若不存在,则判断是否存在公司成立时间未满半年的情况,若不存在,则判断是否存在账单地址与手机联系人电话归属地不一致的情况,若不存在,则输出风险评估结果为低风险,若存在,则输出风险评估结果为高风险。
304、根据用户个人信息和环境数据构建用户画像,对用户画像进行黑名单画像符合度的聚类分析,得到聚类分析结果;
对于该步骤,具体可以通过以下方式实现:
对用户个人信息和环境数据按照不同的特征类型进行分类,例如,将用户个人信息和环境数据分成身份特征信息、违法记录特征信息和账单地址与手机归属地对应情况特征信息;
对不同的特征类型信息采用标准化存储方式进行存储,得到对应的特征值例如,对于信息中的离散型变量,可以将其编码成每一个输入单元对应一个特征值可能赋的值,在实际应用中,账单地址与手机归属地对应情况特征信息这一特征信息可能取三个值(a0,a 1,a 2),可以分别使用a 0、a 1和a 2这3个输入单元来代表账单地址与手机归属地对应情况这一特征信息,得到对应的特征值;
根据不同的特征类型对应的特征值,构建用户画像,并以多维数据矩阵的方式将用户画像映射至数据空间的数据对象,其中,多维数据矩阵的维度为特征类型的数目,多维数据矩阵的每一个维度保存对应特征类型的特征值;
调用K-means算法进行聚类分析,采用以下方式计算数据对象之间的距离:
Figure BDA0003668890090000141
其中,J表示数据对象之间的距离,k表示聚类分析所预设的聚类群数目,例如,当k设为2时,所述聚类群包括黑名单画像高符合度聚类群和黑名单画像低符合度聚类群;
在上述公式中,μk表示聚类群的均值向量,i表示当前计算的数据对象的编号,xi表示当前计算的数据对象对应的向量;
根据预设的迭代方法,迭代计算出聚类中心,例如,通过以上公式,可以采用如下迭代方式:随机选取K个样本作为聚类中心;计算各样本与各个聚类中心的距离;将各样本回归于与之距离最近的聚类中心;求各个类的样本的均值,作为新的聚类中心;每完成一次迭代后,进行判断,若聚类中心不再发生变动或者达到迭代次数,停止聚类计算,否则重新开始迭代计算,直到得到满足要求的聚类中心;
根据J最小原则,将数据空间中所有数据对象划分成与所述聚类中心对应的聚类群,得到聚类分析结果,例如,当k设为2时,所述聚类群包括黑名单画像高符合度聚类群和黑名单画像低符合度聚类群,若用户画像属于黑名单画像高符合度聚类群,则聚类分析结果为具有黑名单画像高符合度,若用户画像属于黑名单画像低符合度聚类群,则聚类分析结果为具有黑名单画像低符合度。
305、按照预设的判断方式,根据征信评分结果、风险评估结果和聚类分析结果判断业务审核结果;
该步骤中,所述预设的判断方式包括:
若征信评分结果小于0.5,则判断业务审核结果为不通过;
若大于,则判断风险评估结果是否为高风险,若是,则判断业务审核结果为不通过;
若否,则判断聚类分析结果是否为具有黑名单画像高符合度,若是,则判断业务审核结果为不通过;
若否,则判断业务审核结果为通过;
在实际应用中,还可以采用综合判断的方式,例如,将征信评分结果、风险评估结果和聚类分析结果按照预设的权重转换成数值,并设置数值阈值进行业务审核结果的判断。
通过对上述方法的实施,通过获取待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息,并输入至预设的征信评分模型进行征信评分,判断征信评分的结果是否满足与业务对应的审核条件;若满足,则利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并构造用户的用户画像;将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并以此确定所述业务数据的审核结果,通过风险评估平台中的知识图谱的对比,对风险项目进行比对分析,并采用聚类分析的方法对于黑名单画像符合度的高低进行判断,能够全面地反映风险情况,从而解决了现有技术中无法对客户征信情况进行全面分析以及无法对业务审核过程中的可能存在的高风险情况进行有效判别的问题。
上面对本发明实施例中的基于用户画像的业务审核方法进行了描述,下面对本发明实施例中的基于用户画像的业务审核装置进行描述,请参照图4,本发明实施例中的基于用户画像的业务审核装置的一个实施例包括:
信息筛选模块401,用于获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息;
征信评分模块402,用于将所述征信信息输入至预设的征信评分模型进行征信评分,并判断征信评分的结果是否满足与业务对应的审核条件;
画像构造模块403,用于利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并根据所述用户个人信息和所述环境数据构造用户的用户画像;
画像比对模块404,用于将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果。
通过对上述装置的实施,通过获取待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息,并输入至预设的征信评分模型进行征信评分,判断征信评分的结果是否满足与业务对应的审核条件;若满足,则利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并构造用户的用户画像;将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并以此确定所述业务数据的审核结果,从而解决了现有技术中无法对客户征信情况进行全面分析以及无法对业务审核过程中的可能存在的高风险情况进行有效判别的问题。
请参阅图5,本发明实施例中的基于用户画像的业务审核装置的另一个实施例包括:
信息筛选模块401,用于获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息;
征信评分模块402,用于将所述征信信息输入至预设的征信评分模型进行征信评分,并判断征信评分的结果是否满足与业务对应的审核条件;
画像构造模块403,用于利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并根据所述用户个人信息和所述环境数据构造用户的用户画像;
画像比对模块404,用于将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果;
模型输出模块405,用于采集数据,并对其中与征信评分相关的数据进行筛选和分类,整理成征信评分数据集,其中,所述征信评分数据集至少包括基于所述征信评分相关的数据所得的征信评分真实值;将所述征信评分数据集中的数据输入至待训练的神经网络模型,通过所述神经网络模型对所述征信信息进行转换,得到对应的特征向量;通过所述神经网络模型的输入层,对特征向量加权求和,并将加权求和所得值传入隐藏层;通过所述神经网络模型的隐藏层,调用预设的激活函数对所述加权求和所得值进行非线性转化,得到非线性神经网络模型单元;通过所述神经网络模型的输出层,对非线性神经网络模型单元所输出的值进行回归计算,得到回归值;调用预设的归一化函数对所述回归值进行归一化,得到征信评分预测值;调用反向传播算法中的误差计算公式,根据征信评分预测值和对应的征信评分真实值分别对所述隐藏层和所述输出层进行误差计算,得到对应的误差值;调用反向传播算法中的权重修改公式,根据所述隐藏层和所述输出层分别对应的误差值进行权重修改值计算,得到对应的权重修改值;调用反向传播算法中的偏置向修改公式,根据所述隐藏层和所述输出层分别对应的误差值进行偏置向修改值计算,得到对应的偏置向修改值;根据所述权重修改值和偏置向修改值对所述神经网络模型进行修改;根据所述征信评分数据集,迭代计算征信评分预测值,在每一次迭代中,根据所述权重修改值和偏置向修改值对所述神经网络模型进行修改,直到所述误差值或者循环次数满足预设条件值,停止迭代,并输出征信评分模型;
聚类分析模块406,用于采集数据,并对其中与对于所述与业务对应的审核条件的符合度相关的数据进行筛选和分类,整理成聚类分析数据集;选取数据空间中数目为预设聚类中心数目的数据对象,作为聚类中心,其中,所述聚类中心数目至少为2,每一个聚类中心对应一个聚类群,所述聚类群至少包括对于所述与业务对应的审核条件的符合度较高的聚类群和对于所述与业务对应的审核条件的符合度较低的聚类群;根据欧氏距离计算公式,计算数据空间中所有数据对象与所述聚类中心的欧氏距离,并根据欧氏距离最近原则,将数据空间中所有数据对象划分成与所述聚类中心对应的聚类群;计算每一个所述聚类群包含的数据对象的均值,并将所述均值对应的数据对象作为对应聚类群的聚类中心,记录所有聚类中心,得到基于所述聚类中心欧氏距离最小化的目标函数,此时,完成一次聚类中心的更新;根据所述聚类分析数据集,迭代计算数据空间中所有数据对象与所述聚类中心的欧氏距离,在每一次迭代中,根据上述步骤完成所述聚类中心的更新,并计算更新前后所述聚类中心之间的欧氏距离,直到所述更新前后所述聚类中心之间的欧氏距离或者迭代次数满足预设聚类分析条件值,停止迭代,并输出对应的所述基于所述聚类中心欧氏距离最小化的目标函数,得到聚类分析目标函数;获取所述用户画像,以多维数据点的形式将所述用户画像映射成数据空间中的数据对象,其中,所述多维数据点的维度为对应的用户画像所具有的信息维度,所述数据空间的维度为所述多维数据点的维度加上分析维度;通过聚类分析目标函数确定所述聚类中心,其中,每一个所述聚类中心对应一个所述聚类群;根据欧氏距离计算公式,计算数据空间中所有数据对象与所述聚类中心的欧氏距离,并根据欧氏距离最近原则,将数据空间中所有数据对象划分成与所述聚类中心对应的聚类群;根据所述用户画像对应的数据对象所被划分到的所述聚类群,得到所述用户画像的聚类分析结果;根据所述聚类分析结果,判断是否通过业务审核,并输出判断结果;
其中,所述信息筛选模块401包括:
标识提取单元4011,用于获取业务审核***界面中的待审核的业务数据,并提取其中的用户标识信息,其中,所述用户标识信息至少包括用户姓名和证件号;
检索筛选单元4012,用于以所述用户标识信息作为检索索引,从所述业务数据中筛选出与其匹配的征信数据;
预处理单元4013,用于基于预先构造的用户征信数据结构对所述征信数据进行预处理,以用户标识信息为数据单位,将征信数据中与用户征信数据结构所对应的数据类型整合到所述数据单位中,得到征信信息;
在本实施例中,所述征信评分模块402包括:
卷积操作单元4021,用于将所述征信信息输入至征信评分模型中,通过所述征信评分模型的卷积神经网络层进行卷积操作,得到多个维度的特征向量;
加权求和单元4022,用于通过所述征信评分模型的输入层,对多个所述特征向量进行加权求和,并将加权求和所得的值输出至所述隐藏层;
非线性转化单元4023,用于通过所述隐藏层调用预设的激活函数构建非线性神经网络模型单元,基于所述非线性神经网络模型单元对所述加权求和所得的值进行非线性转化,得到非线性拟合值,输出至所述输出层;
回归计算单元4024,用于通过所述输出层对所述非线性拟合值进行回归计算,得到回归值;
归一化单元4025,用于调用预设的归一化函数对所述回归值进行归一化,得到征信评分值;
在本实施例中,所述画像构造模块403包括:
第一获取单元4031,用于提取所述用户个人信息中的信用记录,以及所述环境数据中的活动轨迹;
第二获取单元4032,用于获取所述活动轨迹的特定范围内与所述信用记录相匹配的信用案例数据;
度量计算单元4033,用于根据所有信用案例数据计算用户不同维度的标签度量值;
画像构建单元4034,用于基于所述标签度量值构建用户的用户画像;
在本实施例中,所述画像比对模块404包括:
第一比对单元4041,用于根据所述用户画像,提取出所述违法记录维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到违法记录维度标签度量值比对结果;
第二比对单元4042,用于根据所述用户画像,提取出所述工作地址相关信用案例维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到工作地址相关信用案例维度标签度量值比对结果;
第三比对单元4043,用于根据所述用户画像,提取出所述手机号码黑名单标记维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到手机号码黑名单标记维度标签度量值比对结果;
第四比对单元4044,用于根据所述用户画像,提取出所述账单地址与手机号码归属地对应情况维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到账单地址与手机号码归属地对应情况维度标签度量值比对结果;
结果判断单元4045,用于根据预设的黑名单画像比对结果构造方法,基于所述违法记录维度标签度量值比对结果、所述工作地址相关信用案例维度标签度量值比对结果、所述手机号码黑名单标记维度标签度量值比对结果和所述账单地址与手机号码归属地对应情况维度标签度量值比对结果构造黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果。
通过对上述装置的实施,通过获取待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息,并输入至预设的征信评分模型进行征信评分,判断征信评分的结果是否满足与业务对应的审核条件;若满足,则利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并构造用户的用户画像;将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并以此确定所述业务数据的审核结果,从而解决了现有技术中无法对客户征信情况进行全面分析以及无法对业务审核过程中的可能存在的高风险情况进行有效判别的问题。
请参阅图6,下面从硬件处理的角度对本发明实施例中的计算机设备的一个实施例进行详细描述。
图6是本发明实施例提供的一种计算机设备的结构示意图,该计算机设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)610(例如,一个或一个以上处理器)和存储器620,一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备600中的一系列指令操作。更进一步地,处理器610可以设置为与存储介质630通信,在计算机设备600上执行存储介质630中的一系列指令操作。
计算机设备600还可以包括一个或一个以上电源640,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口660,和/或,一个或一个以上操作***631,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的计算机设备结构并不构成对本申请提供的计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行上述基于用户画像的业务审核方法的步骤。
在实际应用中,上述提供的方法可以基于人工智能技术来实现,其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。其具体可以是基于服务器来执行,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于用户画像的业务审核方法,其特征在于,所述业务审核方法包括:
获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息;
将所述征信信息输入至预设的征信评分模型进行征信评分,并判断征信评分的结果是否满足与业务对应的审核条件;
若满足,则利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并根据所述用户个人信息和所述环境数据构造用户的用户画像;
将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果。
2.根据权利要求1所述的基于用户画像的业务审核方法,所述获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息,包括:
获取业务审核***界面中的待审核的业务数据,并提取其中的用户标识信息,其中,所述用户标识信息至少包括用户姓名和证件号;
以所述用户标识信息作为检索索引,从所述业务数据中筛选出与其匹配的征信数据;
基于预先构造的用户征信数据结构对所述征信数据进行预处理,以用户标识信息为数据单位,将征信数据中与用户征信数据结构所对应的数据类型整合到所述数据单位中,得到征信信息。
3.根据权利要求1所述的基于用户画像的业务审核方法,其特征在于,所述征信评分模型包括卷积神经网络层和输入层、隐藏层和输出层,所述将所述征信信息输入至预设的征信评分模型进行征信评分,并判断征信评分的结果是否满足与业务对应的审核条件,包括:
将所述征信信息输入至征信评分模型中,通过所述征信评分模型的卷积神经网络层进行卷积操作,得到多个维度的特征向量;
通过所述征信评分模型的输入层,对多个所述特征向量进行加权求和,并将加权求和所得的值输出至所述隐藏层;
通过所述隐藏层调用预设的激活函数构建非线性神经网络模型单元,基于所述非线性神经网络模型单元对所述加权求和所得的值进行非线性转化,得到非线性拟合值,输出至所述输出层;
通过所述输出层对所述非线性拟合值进行回归计算,得到回归值;
调用预设的归一化函数对所述回归值进行归一化,得到征信评分值。
4.根据权利要求1-3中任一项所述的基于用户画像的业务审核方法,其特征在于,在所述获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息之前,还包括:
采集数据,并对其中与征信评分相关的数据进行筛选和分类,整理成征信评分数据集,其中,所述征信评分数据集至少包括基于所述征信评分相关的数据所得的征信评分真实值;
将所述征信评分数据集中的数据输入至待训练的神经网络模型,通过所述神经网络模型对所述征信信息进行转换,得到对应的特征向量;
通过所述神经网络模型的输入层,对特征向量加权求和,并将加权求和所得值传入隐藏层;
通过所述神经网络模型的隐藏层,调用预设的激活函数对所述加权求和所得值进行非线性转化,得到非线性神经网络模型单元;
通过所述神经网络模型的输出层,对非线性神经网络模型单元所输出的值进行回归计算,得到回归值;
调用预设的归一化函数对所述回归值进行归一化,得到征信评分预测值;
调用反向传播算法中的误差计算公式,根据征信评分预测值和对应的征信评分真实值分别对所述隐藏层和所述输出层进行误差计算,得到对应的误差值;
调用反向传播算法中的权重修改公式,根据所述隐藏层和所述输出层分别对应的误差值进行权重修改值计算,得到对应的权重修改值;
调用反向传播算法中的偏置向修改公式,根据所述隐藏层和所述输出层分别对应的误差值进行偏置向修改值计算,得到对应的偏置向修改值;
根据所述权重修改值和偏置向修改值对所述神经网络模型进行修改;
根据所述征信评分数据集,迭代计算征信评分预测值,在每一次迭代中,根据所述权重修改值和偏置向修改值对所述神经网络模型进行修改,直到所述误差值或者循环次数满足预设条件值,停止迭代,并输出征信评分模型。
5.根据权利要求1所述的基于用户画像的业务审核方法,其特征在于,所述根据所述用户个人信息和所述环境数据构造用户的用户画像,包括:
提取所述用户个人信息中的信用记录,以及所述环境数据中的活动轨迹;
获取所述活动轨迹的特定范围内与所述信用记录相匹配的信用案例数据;
根据所有信用案例数据计算用户不同维度的标签度量值;
基于所述标签度量值构建用户的用户画像。
6.根据权利要求5所述的基于用户画像的业务审核方法,其特征在于,所述用户画像包括不同维度的标签度量值,所述标签度量值至少包括违法记录维度标签度量值、工作地址相关信用案例维度标签度量值、手机号码黑名单标记维度标签度量值、账单地址与手机号码归属地对应情况维度标签度量值;
所述将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果,包括:
根据所述用户画像,提取出所述违法记录维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到违法记录维度标签度量值比对结果;
根据所述用户画像,提取出所述工作地址相关信用案例维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到工作地址相关信用案例维度标签度量值比对结果;
根据所述用户画像,提取出所述手机号码黑名单标记维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到手机号码黑名单标记维度标签度量值比对结果;
根据所述用户画像,提取出所述账单地址与手机号码归属地对应情况维度标签度量值,并与所述预设的黑名单画像中相应的标签度量值进行比对,得到账单地址与手机号码归属地对应情况维度标签度量值比对结果;
根据预设的黑名单画像比对结果构造方法,基于所述违法记录维度标签度量值比对结果、所述工作地址相关信用案例维度标签度量值比对结果、所述手机号码黑名单标记维度标签度量值比对结果和所述账单地址与手机号码归属地对应情况维度标签度量值比对结果构造黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果。
7.根据权利要求6所述的基于用户画像的业务审核方法,其特征在于,在所述将用户画像与预设的黑名单画像比对,得到黑名单画像比对结果,并判断所述黑名单画像比对结果是否满足与业务对应的审核条件之后,还包括:
采集数据,并对其中与对于所述与业务对应的审核条件的符合度相关的数据进行筛选和分类,整理成聚类分析数据集;
选取数据空间中数目为预设聚类中心数目的数据对象,作为聚类中心,其中,所述聚类中心数目至少为2,每一个聚类中心对应一个聚类群,所述聚类群至少包括对于所述与业务对应的审核条件的符合度较高的聚类群和对于所述与业务对应的审核条件的符合度较低的聚类群;
根据欧氏距离计算公式,计算数据空间中所有数据对象与所述聚类中心的欧氏距离,并根据欧氏距离最近原则,将数据空间中所有数据对象划分成与所述聚类中心对应的聚类群;
计算每一个所述聚类群包含的数据对象的均值,并将所述均值对应的数据对象作为对应聚类群的聚类中心,记录所有聚类中心,得到基于所述聚类中心欧氏距离最小化的目标函数,此时,完成一次聚类中心的更新;
根据所述聚类分析数据集,迭代计算数据空间中所有数据对象与所述聚类中心的欧氏距离,在每一次迭代中,根据上述步骤完成所述聚类中心的更新,并计算更新前后所述聚类中心之间的欧氏距离,直到所述更新前后所述聚类中心之间的欧氏距离或者迭代次数满足预设聚类分析条件值,停止迭代,并输出对应的所述基于所述聚类中心欧氏距离最小化的目标函数,得到聚类分析目标函数;
获取所述用户画像,以多维数据点的形式将所述用户画像映射成数据空间中的数据对象,其中,所述多维数据点的维度为对应的用户画像所具有的信息维度,所述数据空间的维度为所述多维数据点的维度加上分析维度;
通过聚类分析目标函数确定所述聚类中心,其中,每一个所述聚类中心对应一个所述聚类群;
根据欧氏距离计算公式,计算数据空间中所有数据对象与所述聚类中心的欧氏距离,并根据欧氏距离最近原则,将数据空间中所有数据对象划分成与所述聚类中心对应的聚类群;
根据所述用户画像对应的数据对象所被划分到的所述聚类群,得到所述用户画像的聚类分析结果;
根据所述聚类分析结果,判断是否通过业务审核,并输出判断结果。
8.一种基于用户画像的业务审核装置,其特征在于,所述基于用户画像的业务审核装置包括:
信息筛选模块,用于获取业务审核***界面中的待审核的业务数据,基于预先构造的用户征信数据结构从所述业务数据中筛选出其中的征信信息;
征信评分模块,用于将所述征信信息输入至预设的征信评分模型进行征信评分,并判断征信评分的结果是否满足与业务对应的审核条件;
画像构造模块,用于利用大数据搜索技术,采集得到合法授权的用户个人信息和环境数据,并根据所述用户个人信息和所述环境数据构造用户的用户画像;
画像比对模块,用于将所述用户画像与预设的黑名单画像进行比对,得到黑名单画像比对结果,并根据所述黑名单画像比对结果确定所述业务数据的审核结果。
9.一种计算机设备,其特征在于,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行如权利要求1-7中任一项所述的基于用户画像的业务审核方法的各个步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项的所述基于用户画像的业务审核方法的各个步骤。
CN202210598086.7A 2022-05-30 2022-05-30 基于用户画像的业务审核方法、装置、设备及存储介质 Pending CN115063224A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210598086.7A CN115063224A (zh) 2022-05-30 2022-05-30 基于用户画像的业务审核方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210598086.7A CN115063224A (zh) 2022-05-30 2022-05-30 基于用户画像的业务审核方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115063224A true CN115063224A (zh) 2022-09-16

Family

ID=83198283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210598086.7A Pending CN115063224A (zh) 2022-05-30 2022-05-30 基于用户画像的业务审核方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115063224A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116823163A (zh) * 2023-06-28 2023-09-29 北银消费金融有限公司 流程审批方法、装置、计算机设备及存储介质
CN117829987A (zh) * 2024-03-05 2024-04-05 山东兰图地理信息科技有限公司 不动产信息管理方法及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116823163A (zh) * 2023-06-28 2023-09-29 北银消费金融有限公司 流程审批方法、装置、计算机设备及存储介质
CN117829987A (zh) * 2024-03-05 2024-04-05 山东兰图地理信息科技有限公司 不动产信息管理方法及***
CN117829987B (zh) * 2024-03-05 2024-05-10 山东兰图地理信息科技有限公司 不动产信息管理方法及***

Similar Documents

Publication Publication Date Title
CN110221965B (zh) 测试用例生成、测试方法、装置、设备及***
CN109873812A (zh) 异常检测方法、装置及计算机设备
CN113255815B (zh) 用户行为异常分析方法、装置、设备及存储介质
CN112132233A (zh) 一种基于有效影响因子的服刑人员危险行为预测方法及***
CN115063224A (zh) 基于用户画像的业务审核方法、装置、设备及存储介质
CN110381079B (zh) 结合gru和svdd进行网络日志异常检测方法
CN109739844B (zh) 基于衰减权重的数据分类方法
CN110956547A (zh) 一种基于搜索引擎的实时识别欺诈团伙的方法及***
CN113904872A (zh) 一种针对匿名服务网站指纹攻击的特征提取方法及***
CN104321794A (zh) 一种使用多维评级来确定一实体的未来商业可行性的***和方法
CN117151870B (zh) 一种基于客群画像行为分析方法及***
CN116861331A (zh) 一种融合专家模型决策的数据识别方法及***
CN113554310A (zh) 基于智能合约的企业信用动态评估模型
CN110716957B (zh) 类案可疑对象智能挖掘分析方法
CN112435078A (zh) 一种用户忠诚度分类的方法
CN114202336A (zh) 一种金融场景下的风险行为监测方法及***
CN113722617A (zh) 企业实际办公地址的识别方法、装置及电子设备
CN117972783A (zh) 基于联邦学习的大数据隐私保护方法及***
CN117094184A (zh) 基于内网平台的风险预测模型的建模方法、***及介质
CN112990989B (zh) 价值预测模型输入数据生成方法、装置、设备和介质
CN114399367A (zh) 保险产品推荐方法、装置、设备及存储介质
CN114692593A (zh) 一种网络信息安全监测预警方法
CN112035775B (zh) 基于随机森林模型的用户识别方法、装置和计算机设备
CN113435900A (zh) 交易风险确定方法、装置和服务器
Tundis et al. Limits in the data for detecting criminals on social media

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination