CN114119191A - 风控方法、逾期预测方法、模型训练方法及相关设备 - Google Patents

风控方法、逾期预测方法、模型训练方法及相关设备 Download PDF

Info

Publication number
CN114119191A
CN114119191A CN202010884467.2A CN202010884467A CN114119191A CN 114119191 A CN114119191 A CN 114119191A CN 202010884467 A CN202010884467 A CN 202010884467A CN 114119191 A CN114119191 A CN 114119191A
Authority
CN
China
Prior art keywords
app name
wind control
name sequence
app
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010884467.2A
Other languages
English (en)
Inventor
赵宏宇
蒋宁
王洪斌
谢家智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mashang Consumer Finance Co Ltd
Original Assignee
Mashang Consumer Finance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mashang Consumer Finance Co Ltd filed Critical Mashang Consumer Finance Co Ltd
Priority to CN202010884467.2A priority Critical patent/CN114119191A/zh
Publication of CN114119191A publication Critical patent/CN114119191A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种风控方法、风控指标预测模型的模型训练方法、装置及电子设备,该风控方法包括:获取待预测的目标用户的终端设备安装和/或使用的目标APP名称序列,所述目标APP名称序列包括APP名称;将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果;其中,所述风控指标预测模型为APP名称序列图卷积网络模型。通过本发明提供的风控方法,不仅可以提高风控的预测效率,还可以提高风控结果的准确性。

Description

风控方法、逾期预测方法、模型训练方法及相关设备
技术领域
本发明涉及信息处理技术领域,尤其涉及一种风控方法、逾期预测方法、风控指标预测模型的模型训练方法、装置及电子设备。
背景技术
随着互联网技术的不断发展,涌现了大量的互联网应用,例如,互联网购物、互联网金融(例如,信贷、理财、支付等)等。其中,以信贷类服务为主的各种互联网金融服务平台,其往往面临着较大地来源于贷款用户的违约、诈骗风险。为了降低来源于贷款用户的违约、诈骗风险,需要对贷款用户进行风险预测,然而,在现有技术中往往是通过人工审核用户信息以评估该用户的风险指数,这种方式不仅效率较低,而且准确性较差。
发明内容
本发明实施例提供一种风控方法、逾期预测方法、风控指标预测模型的模型训练方法、装置及电子设备,以解决现有的风控方式效率较低且准确性较差的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种风控方法。该方法包括:
获取待预测的目标用户的终端设备安装和/或使用的目标APP名称序列,所述目标APP名称序列包括APP名称;
将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果;
其中,所述风控指标预测模型为APP名称序列图卷积网络模型。
第二方面,本发明实施例提供了一种贷款逾期预测方法,包括:
利用上述风控方法得到目标用户的风控指标的预测结果,所述风控指标为贷款逾期指标,所述风控指标为贷款逾期指标。
第三方面,本发明实施例提供了一种风控指标预测模型的模型训练方法。该方法包括:
获取M个APP名称序列样本,其中,所述APP名称序列样本包括APP名称,且所述APP名称序列样本标注有风控指标,M为正整数;
将所述M个APP名称序列样本输入图卷积网络以对图卷积网络进行训练,得到风控指标预测模型。
APP名称序列APP名称序列APP名称序列APP名称序列APP名称序列APP名称序列APP名称序列APP名称序列第四方面,本发明实施例还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述的风控方法的步骤,或者实现上述的风控指标预测模型的模型训练方法的步骤。
第五方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的风控方法的步骤,或者实现上述的风控方法的步骤。
本发明实施例中,通过获取待预测的目标用户对应的目标APP名称序列,并将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果,不仅可以提高风控的预测效率,还可以提高风控结果的准确性,尤其是应用在金融等高风险领域,通过目标用户的APP的属性类别(比如银行类APP、信贷类APP),将APP名称和APP名称序列作为图卷积网络的图的节点,根据APP之间的关系建立连接而构造一个大型图,进而利用图卷积网络将针对用户属性的预测分类问题转化为图卷积网络的节点分类问题,而不需要结合用户的其他信息即可以有效地实现对多头借贷、借新还旧等逾期行为的识别以及预测。进一步而言,通过实验证明,本申请采用图卷积网络对APP名称构造的图进行分类时,各个评价指标较为突出,图卷积网络具有更好的稳定性与鲁棒性,也没有出现过拟合现象,收敛速度较快,能够满足风控领域对风控响应速度快、风控结果准确的高标准和高要求,从而能够更好地运用到风控领域。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的风控方法的流程图;
图2是本发明实施例提供的风控指标预测模型的模型训练方法的流程图;
图3是本发明实施例提供的风控装置的结构图;
图4是本发明实施例提供的风控指标预测模型的模型训练装置的结构图;
图5是本发明又一实施例提供的风控装置的结构图;
图6是本发明又一实施例提供的风控指标预测模型的模型训练装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种风控方法。参见图1,图1是本发明实施例提供的风控方法的流程图,如图1所示,包括以下步骤:
步骤101、获取待预测的目标用户的终端设备安装和/或使用的目标APP名称序列。
本实施例中,上述目标用户可以是需要进行风控的任一用户,其中,上述风控可以包括但不限于逾期预测、欺诈预测等。上述目标APP名称序列可以包括目标用户的终端设备安装和/或使用的APP(即应用程序)中的部分或全部APP的名称。
例如,若目标用户的终端设备安装和/或使用有10个APP,则上述目标APP名称序列可以包括10个APP的名称,或者上述目标APP名称序列可以包括10个APP中满足预设条件的APP的名称,其中,上述预设条件可以包括但不限于第三方APP、名称不全为字母的APP等。
需要说明的是,上述终端设备使用的APP可以包括当前使用的APP以及历史使用过的APP,例如,可以根据终端设备记录的APP相关使用信息获取终端设备当前使用的APP以及历史使用过的APP。实际情况中,存在一些用户刻意地卸载一些对其风控不利的APP,以在基于APP名称序列的风控过程中获得较优的预测结果,因此,本实施例基于终端设备使用的APP进行风控,可以减少因用户刻意地卸载一些对其不利的APP而造成的违约、诈骗等风险。
步骤102、将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果;
在步骤102中,本实施例APP名称序列中还可以包括其安装时间、相同类型APP的使用频率、APP自身的用户评分等,比如,安装时间可以体现用户的用钱紧急程度,相同类型APP的使用频率可以进一步体现用户是否不断切换APP平台进行借贷并以新还旧等,APP自身的用户评分则可以体现使用该APP的用户属性,比如有些用户可能使用线上赌博的APP,或者使用高利贷的高风险APP等。本实施例通过这些APP的相关信息,可以准确地预测用户的当前财产状况,进而根据其当前财产状况对其接下来的风险进行预测,以此可以获得较准确的预测结果。
需要补充说明的是,为进一步提高预测准确率,本申请在步骤102中可以进一步获取目标用户的用户信息,以将所述用户信息和所述目标APP名称序列共同输入所述风控指标预测模型,得到风控指标的预测结果。其中,本实施例的目标用户的用户信息,可以包括用户的身份信息、用户的贷款申请额度、用户的贷款期数、用户填写的其他联系人信息等。本实施例通过上述用户信息作为输入,可以得到更加综合而全面的用户信息,提高风控指标预测模型的预测准确率。
其中,所述风控指标预测模型为图卷积网络模型,其可以是利用标注有所述风控指标的APP名称序列样本对图卷积网络训练得到的模型。
本实施例中,上述风控指标可以包括但不限于首次还款逾期(First PaymentDeliquency,FPD)、第二期还款逾期(Second Payment Deliquency,SPD)、第三期还款逾期(Third Payment Deliquency,TPD)和第四期还款逾期(Quarter Payment Deliquency,QPD)、欺诈等中的至少一项。上述图卷积网络(Graph Convolutional Network,GCN)是一种针对图结构数据进行特征提取的深度神经网络,该图卷积网络可以包括至少两个图卷积层。
实际情况中,用户的终端设备安装和/或使用的APP数据往往可以反映其年龄、性别、文化程度等用户基本属性,预测爱好、习惯、兴趣、性格、消费观念、不良行为等用户扩展属性,以及APP数据中的安装时间、相同类型APP的使用频率和APP自身的用户评分等。具体地,可以预先采集M个用户对应的APP名称序列,也即M个APP名称序列样本,对每个APP名称序列样本标注风控指标,并利用标注有风控指标的M个APP名称序列样本对图卷积网络进行训练,得到风控指标预测模型,这样基于训练得到的风控指标预测模型可以同时对待预测的用户进行风控指标的风控属性检测;进一步地,为了提高预测准确性,本实施例除了利用APP名称序列样本,还可以另外增加标注了历史贷款信息集、历史逾期信息集、历史逾期期数信息集和/或历史欠款信息集进行训练,其中,历史贷款信息集、历史逾期信息集、历史逾期期数信息集和/或历史欠款信息集可以为基于现有的实际数据进行标记,此外,本实施例还可以对现有的实际数据进行扩展而构建其衍生的历史贷款信息子集、历史逾期信息子集、历史逾期期数信息子集和/或历史欠款信息子集,以丰富训练样本,提高预测准确度。例如,可以基于M个APP名称序列样本、历史贷款信息集、历史逾期信息集、历史逾期期数信息集和/或历史欠款信息集等确定目标图结构的数据,例如,目标图结构的节点、邻接矩阵等,其中,邻接矩阵可以用于表示节点之间的相邻关系,并基于目标图结构的数据对图卷积网络进行训练,得到风控指标预测模型。
需要说明的是,基于一个风控指标对用户进行风控可被看作为一个二分类问题(也即将被预测用户划分为两个类别中的一个),基于多个风控指标对用户进行风控可被看作为多个二分类问题。例如,上述风控指标包括FPD30(即首次还款逾期30天)和SPD,若风控指标预测模型输出的预测结果中对应于FPD30的预测值为0,对应于SPD的预测值为1,则表示预测用户不会发生首次还款逾期30天,而会发生第二期还款逾期,或者预测该用户存在恶意贷款的欺诈指标等。
本实施例提供的风控方法,通过获取待预测的目标用户对应的目标APP名称序列,并将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果,不仅可以提高风控的效率,还可以提高风控结果的准确性,尤其是应用在金融等高风险领域,通过目标用户的APP的属性类别(比如银行类APP、信贷类APP、***类APP),将APP名称和APP名称序列作为图卷积网络的图的节点,根据APP之间的关系建立连接而构造一个大型图,进而利用图卷积网络将针对用户属性的预测分类问题转化为图卷积网络的节点分类问题,而不需要结合用户的其他信息即可以有效地实现对多头借贷、借新还旧等逾期行为的识别以及预测。进一步而言,通过实验证明,本申请采用图卷积网络对APP名称构造的图进行分类时,各个评价指标较为突出,图卷积网络具有更好的稳定性与鲁棒性,也没有出现过拟合现象,收敛速度较快,能够满足风控领域对风控响应速度快、风控结果准确的高标准和高要求,从而能够更好地运用到风控领域。
可选地,本实施例用于所述图卷积网络训练的目标图结构的节点可以包括分别用于表示上述M个APP名称序列样本的M个第一类节点,相应地,上述目标图结构的邻接矩阵可以基于上述第一类节点之间的关系确定,这样基于目标图结构的数据训练图卷积网络,可以使得图卷积网络学习APP名称序列之间的关系。
可选地,本实施例用于所述图卷积网络训练的目标图结构的节点可以包括M个第一类节点和K个第二类节点,所述第一类节点用于表示APP名称序列,所述第二类节点用于表示APP名称,所述APP名称序列包括至少一个APP名称,所述APP名称为所述APP名称序列中的APP名称,M、K均为正整数。
本实施例中,可以基于M个APP名称序列构建目标图结构,以用于图卷积网络训练。其中,上述目标图结构的节点可以包括用于表示APP名称序列的第一类节点和用于表示APP名称的第二类节点。上述K个APP名称包括上述M个APP名称序列所包括的APP名称,例如,上述M个APP名称序列包括100个APP名称,则上述K个APP名称可以为上述100个APP名称。
相应地,由于目标图结构的节点可以包括M个第一类节点和K个第二类节点,因此,上述目标图结构的邻接矩阵可以基于第一类节点之间的关系、第二类节点之间的关系以及第一类节点和第二类节点之间的关系确定。
本实施例中,由于目标图结构的节点包括用于表示APP名称序列的第一类节点和用于表示APP名称的第二类节点,这样基于目标图结构的数据训练图卷积网络,可以使得图卷积网络可以同时学习APP名称序列之间的关系、APP名称之间的关系以及APP名称序列和APP名称之间的关系,进而可以提高训练得到的风控指标预测模型进行风控的准确性。
可选地,所述目标图结构的邻接矩阵中所述第一类节点之间的权重值可以为所述第一类节点之间的相似度;
和/或
所述邻接矩阵中所述第二类节点之间的权重值可以为所述第二类节点之间的共现关系值;
和/或
所述邻接矩阵中所述第一类节点和所述第二类节点之间的权重值可以为所述第一类节点和所述第二类节点之间的逆文本频率指数。
本实施例中,上述目标图结构的邻接矩阵可以是由上述M+K个节点之间的权重值构成的矩阵,其中,上述节点之间的权重值可以用于表示节点之间边的权重值,也即节点之间的邻接关系,例如,若某两个节点之间的权重值大于或等于某个阈值,则表示这两个节点之间有边连接,若某两个节点之间的权重值小于某个阈值,则表示这两个节点之间没有边连接。
上述邻接矩阵中第一类节点之间的权重值可以为第一类节点之间的相似度,也即通过第一类节点之间的相似度衡量第一类节点之间的邻接关系。其中,上述第一类节点之间的相似度可以通过但不限于APP名称序列样本之间的海明距离、欧氏距离和余弦距离等度量。
上述第二类节点之间的权重值可以为第二类节点之间的共现关系值,也即通过第二类节点之间的共现关系值衡量第二类节点之间的邻接关系。其中,上述第二类节点之间的共现关系值可以通过但不限于两个APP名称同时出现的次数和APP名称样本的总数量之间的比值、点互信息(Point-wise Mutual Information,PMI)值等。
上述第一类节点和第二类节点之间的权重值可以为第一类节点和第二类节点之间的逆文本频率(Inverse Document Frequency,IDF)值,也即通过第一类节点和第二类节点之间的IDF值衡量第一类节点和第二类节点之间的邻接关系。具体地,任意的第一类节点和第二类节点之间的IDF值可以通过如下公式计算得到:
Figure BDA0002655141820000081
式1中,|Ni|表示APP名称i出现的数量,也即包括APP名称i的APP名称序列的数量,V1表示APP名称序列的数量,也即M。上述IDF可以用于APP名称的重要性的度量,例如,若某个用户手机里安装的某一APP名称在其它用户APP名称序列中很少出现,则认为该APP名称具有较强的类别区分能力。
本实施例中,通过第一类节点之间的相似度衡量第一类节点之间的邻接关系,和/或通过第二类节点之间的共现关系值衡量第二类节点之间的邻接关系,和/或通过第一类节点和第二类节点之间的逆文本频率指数衡量第一类节点和第二类节点之间的邻接关系,可以较为准确地反映不同类节点之间的邻接关系,从而基于邻接矩阵训练图卷积网络,可以使得图卷积网络可以更为准确地学习不同类节点之间的邻接关系,进而可以提高训练得到的风控指标预测模型进行风控的准确性。
可选地,所述第一类节点之间的相似度为所述第一类节点之间的Jaccard相似度;
和/或
所述第二类节点之间的共现关系值为所述第二类节点之间的点互信息值。
本实施例中,上述第一类节点之间的相似度为第一类节点之间的Jaccard相似度,也即通过第一类节点之间的Jaccard距离衡量第一类节点之间的相似度。具体地,任意两个第一类节点之间的Jaccard相似度可以通过如下公式计算得到:
Figure BDA0002655141820000082
式2中,i与j表示任意两个不同的集合,也即M个APP名称序列中任意两个不同的APP名称序列。
可选地,由于训练样本的数量通常较大,为了加快计算速度,上述第一类节点之间的Jaccard相似度可以基于最小哈希(即Minhash)算法和局部敏感哈希(LocalitySensitive Hashing,LSH)算法计算得到。
例如,可以通过Minhash算法和LSH算法确定M个APP名称序列中相似的APP名称序列并划分为同一类别,并计算同一类别中的APP名称序列之间的Jaccard相似度。
需要说明的是,上述LSH算法主要包括两个参数:阈值TLSH和哈希置换函数个数HLSH,仅Jaccard相似度大于TLSH且属于同一类别的两个APP名称序列之间才添加边(即认为权重值有效),且其值为该Jaccard相似度。
上述第二类节点之间的共现关系值为第二类节点之间的点互信息值,也即通过第二类节点之间的点互信息值衡量第二类节点之间的共现关系值。具体地,任意两个第二类节点之间的点互信息值可以通过如下公式计算得到:
Figure BDA0002655141820000091
式3中,
Figure BDA0002655141820000092
M(i)表示APP名称i出现的数量,也即包括APP名称i的APP名称序列的数量;
M(j)表示APP名称j出现的数量,也即包括APP名称j的APP名称序列的数量;
M(i,j)表示APP名称i与APP名称j同时出现的数量,也即同时包括APP名称i与APP名称j的APP名称序列的数量;
V1表示APP名称序列的数量,也即M。
需要说明的是,当PMI(i,j)为正数时,表示APP名称i与APP名称j有较强的关联性,且该值越大关联性较强。为了简化网络,可以设置阈值TPMI,只对PMI值大于TPMI的两个APP名称之间添加边,且其值为该PMI值。
可选地,可以定义目标图结构的邻接矩阵A如下:
Figure BDA0002655141820000101
本实施例中,在i和j均表示APP名称的情况下,Ai,j等于MI(i,j);在i表示APP名称,j表示APP名称序列的情况下,Ai,j等于IDFi;在i和j均表示APP名称序列的情况下,Ai,j等于Jaccard(i,j);在i=j的情况下,Ai,j等于1;在其他情况下,Ai,j等于0。
也即,用于表示APP名称的第二类节点之间的权重采用PMI值表示;用于表示APP名称序列的第一类节点和用于表示APP名称的第二类节点之间的权重采用IDF值表示;用于表示APP名称序列的第一类节点之间的权重采用Jaccard相似度表示;邻接矩阵A的对角线元素被设置为1,其他情况设置为0。上述i和j可以表示目标图结构的任意两个节点。
需要说明的是,上述PMI值、IDF值和Jaccard相似度的计算公式可以参见前述相关说明,为避免重复,在此不做赘述。
此外,本实施例中上述APP名称和APP名称序列均可以是采用向量形式表示。例如,可以在获取到M个APP名称序列之后,将M个APP名称序列中每个APP名称序列转换为词向量序列,将M个APP名称序列样本中包括的K个APP名称中每个APP名称转换为词向量,这样可以基于M个词向量序列和K个词向量确定邻接矩阵,并基于M个词向量序列、K个词向量以及邻接矩阵训练图卷积网络,得到风控指标预测模型。
其中,将APP名称序列转换为词向量序列以及K个APP名称中每个APP名称转换为词向量的算法可以包括但不限于Word2Vec的词袋模型(Continuous Bag-of-Words Model,CBOW)、ELMo模型或者BERT模型等,本实施例对此不做限定。
可选地,所述图卷积网络可以包括两个图卷积层。
本实施例中,上述图卷积网络可以是两层的图卷积网络,其中,第一层卷积层可以用于学习目标图结构中相邻节点的特征信息,第二层卷积层可以用于学习目标图结构中相邻节点的特征信息以及相邻节点的相邻节点的特征信息。此外,第二层卷积层嵌入的维度可以与标注的风控指标的数量相同,该层可以采用Softmax函数作为分类器:
Figure BDA0002655141820000111
式4中,
Figure BDA0002655141820000112
D为邻接矩阵A的对角矩阵,ReLU为激活函数,Softmax函数表示为
Figure BDA0002655141820000113
损失函数采用交叉熵函数,如下所示:
Figure BDA0002655141820000114
式5中,YD表示带标签的APP名称序列集合,F表示输出特征的维度,等于类别数量,Ydf表示标注类别,Zdf为预测的类别。通过梯度下降来训练W0和W1两个权重参数。
在具体实施例中,所述图卷积网络模型可以包括第一图卷积层和与所述第一图卷积层连接的第二图卷积层,所述图卷积网络模型包括如下处理过程。所述将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果的步骤,包括:将所述目标APP名称序列输入所述第一图卷积层,所述第一图卷积层提取并聚合中心节点及与所述中心节点连接的节点的信息,得到与所述目标APP名称序列对应的第一Graph Embedding特征信息、与所述APP名称对应的第二Graph Embedding特征信息,其中,以所述目标APP名称序列和目标APP名称序列中的APP名称作为所述中心节点;接着,将所述第一Graph Embedding特征信息与所述第二Graph Embedding特征信息输入所述第二图卷积层,所述第二图卷积层输出所述目标用户对应的风控指标的预测结果。
其中,上述的Graph Embedding,即图嵌入,指的是采用Graph Embedding进行图的特征表示,其可以实现表征用户的关键的信息特征,以此通过第二图卷积层基于第一、第二Graph Embedding可以输出最终的用户分类,实现风控指标的预测结果。
需要特别说明的,本实施例除了可以直接使用图卷积网络模型得到风控指标的预测结果外,还可以采用多种模型融合的方式,将图卷积网络模型得到的Graph Embedding特征信息输入到其他子模型进行处理。具体而言,所述图卷积网络模型包括第一图卷积层和与所述第一图卷积层连接的第二图卷积层,所述获取待预测的目标用户对应的目标APP名称序列的步骤之后,还包括:获取待预测的目标用户的用户信息,其中,所述用户信息包括历史贷款信息集、历史逾期信息集、历史逾期期数信息集和/或历史欠款信息集;将所述目标APP名称序列输入所述第一图卷积层,所述第一图卷积层提取并聚合中心节点及与所述中心节点连接的节点的信息,得到与所述目标APP名称序列对应的第一Graph Embedding特征信息、与所述APP名称对应的第二Graph Embedding特征信息,其中,以所述目标APP名称序列和目标APP名称序列中的APP名称作为所述中心节点;将所述第一Graph Embedding特征信息与所述用户信息进行特征融合以得到融合特征信息;将所述融合特征信息输入预训练的反欺诈融合子模型,以得到所述目标用户的反欺诈预测结果。
容易理解的是,上述进行反欺诈预测的反欺诈融合子模型可以预先进行训练得到,例如,本实施例可以预先采用基于APP名称序列样本进行图卷积网络模型提取的第一Graph Embedding特征信息,将第一Graph Embedding特征信息与用户样本信息进行融合之后,对反欺诈融合子模型进行训练。
可选地,所述获取待预测的目标用户对应的目标APP名称序列,可以包括:
获取待预测的目标用户对应的初始APP名称序列;
对所述初始APP名称序列进行预处理,得到所述目标APP名称序列;
其中,所述预处理包括如下至少一项:
过滤所述初始APP名称序列中预设类型APP的APP名称;
过滤所述初始APP名称序列中未包含于预设的APP名称词典中的APP名称;
将所述初始APP名称序列中的APP名称的格式转换为预设格式。
本实施例中,上述预设类型可以根据实际需求进行合理设置,例如,上述预设类型可以包括但不限于名称均为字母的APP、***APP或者***默认安装的APP等中的一项或者多项。可选地,本实施例可以过滤初始APP名称序列中属于预设类型且未位于预设APP列表的APP的名称。例如,可以将一些常见的名称均为字母的APP的名称存储于预设APP列表,这样可以仅过滤掉那些不常用的名称均为字母的APP。
上述预设的APP名称词典可以是依据用于期预测模型训练的APP名称序列样本生成的APP名称词典,该APP名称词典中可以存储APP名称序列样本中出现次数超过预设次数的APP名称。
上述将初始APP名称序列中的APP名称的格式转换为预设格式,可以包括但不限于如下至少一项:过滤初始APP名称序列中的APP名称的特殊字符,例如,仅保留初始APP名称序列中的中的APP名称中的字母、汉字和数字等字符;将初始APP名称序列中的APP名称中大写格式的字母均转换为小写格式;将初始APP名称序列中的APP名称中的繁体字转换为简体字;将初始APP名称序列中对应于同一APP的不同版本的APP名称转换为同一名称,例如,将“XX浏览器极速版”转换为“XX浏览器”。
本实施例通过对目标用户对应的初始APP名称序列执行上述至少一种的预处理过程,可以使得到的APP名称序列可以更为准确地反映用户的属性信息,进而可以提高基于APP名称序列进行风控的准确性。
需要说明的是,由于本实施例采用的深度学习模型适用于较大规模的数据处理,且保留较为完整的APP名称序列比经过特征筛选的APP名称序列的特征挖掘效果要好,因此本实施例不对预处理后得到的目标APP名称序列进行特征筛选操作,而直接基于预处理后得到的目标APP名称序列进行风控。
可选地,所述将所述目标APP名称序列输入预先训练的风控指标预测模型之前,所述方法还可以包括:
根据预设的APP名称词典中APP名称对应的词向量,确定所述目标APP名称序列中每个APP名称对应的词向量,得到词向量序列;
所述将所述目标APP名称序列输入预先训练的风控指标预测模型,包括:
将所述词向量序列输入预先训练的风控指标预测模型。
本实施例中,上述预设的APP名称词典可以是依据用于风控指标预测模型训练的APP名称序列样本生成的APP名称词典,其中,该APP名称词典中存储的APP名称可以是词向量形式表示的,这样,基于APP名称词典可以快速确定目标APP名称序列中每个APP名称对应的词向量,得到词向量序列。
此外,由于上述预设的APP名称词典可以是依据用于风控指标预测模型训练的APP名称序列样本生成的APP名称词典,这样可以保证训练阶段和应用阶段中同一APP名称对应的词向量相同或词向量表达方式基本一致。
需要补充说明的是,通过上述处理过程得到APP名称对应的词向量以及目标APP名称序列的词向量序列后,本实施例图卷积网络模型的具体处理过程包括如下。
首先,所述将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果的步骤,具体包括:将所述目标APP名称序列对应的词向量序列输入所述第一图卷积层,所述第一图卷积层提取并聚合中心节点及与所述中心节点连接的节点的信息,得到与所述目标APP名称序列的词向量序列对应的第一GraphEmbedding特征信息、与所述APP名称的词向量对应的第二Graph Embedding特征信息,其中,以所述目标APP名称序列的词向量序列和目标APP名称序列中的APP名称的词向量作为所述中心节点;接着,将所述第一Graph Embedding特征信息与所述第二Graph Embedding特征信息输入所述第二图卷积层,所述第二图卷积层输出所述目标用户对应的风控指标的预测结果。
针对上述风控方法的实施例,本发明实施例还提供一种贷款逾期预测方法,如前所述,本实施例所述贷款逾期预测方法可以包括但不限于如下几个步骤。
步骤S001,获取待预测的目标用户的终端设备安装和/或使用的目标APP名称序列,所述目标APP名称序列包括APP名称;
步骤S002,将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果;
如前所述,本实施例所述风控指标预测模型为图卷积网络模型,所述风控指标为贷款逾期指标。
本实施例中,上述风控指标可以包括但不限于首次还款逾期(FPD)、第二期还款逾期(SPD)、第三期还款逾期(TPD)和第四期还款逾期(QPD)、欺诈等中的至少一项。
需要说明的是,本实施例APP名称序列中还可以包括其安装时间、相同类型APP的使用频率、APP自身的用户评分等,比如,安装时间可以体现用户的用钱紧急程度,相同类型APP的使用频率可以进一步体现用户是否不断切换APP平台进行借贷并以新还旧等,APP自身的用户评分则可以体现使用该APP的用户属性,比如有些用户可能使用线上赌博的APP,或者使用高利贷的高风险APP等。本实施例通过这些APP的相关信息,可以准确地预测用户的当前财产状况,进而根据其当前财产状况对其接下来的风险进行预测,以此可以获得较准确的预测结果。
在本实施例中,所述风控指标预测模型具体为利用标注风控指标的APP名称序列样本对图卷积网络训练得到的模型,其中,本实施例用于所述图卷积网络训练的目标图结构的节点包括M个第一类节点和K个第二类节点,所述第一类节点用于表示APP名称序列样本,所述第二类节点用于表示APP名称样本,所述APP名称序列样本包括至少一个APP名称,所述APP名称样本为所述APP名称序列样本中的APP名称,M、K均为正整数。
需要说明的是,本实施方式所述图卷积网络模型可以包括第一图卷积层和与所述第一图卷积层连接的第二图卷积层,所述将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果的步骤,具体包括:将所述目标APP名称序列输入所述第一图卷积层,所述第一图卷积层提取并聚合中心节点及与所述中心节点连接的节点的信息,得到与所述目标APP名称序列对应的第一Graph Embedding特征信息、与所述APP名称对应的第二Graph Embedding特征信息,其中,以所述目标APP名称序列和目标APP名称序列中的APP名称作为所述中心节点;将所述第一Graph Embedding特征信息与所述第二Graph Embedding特征信息输入所述第二图卷积层,所述第二图卷积层基于所述第一Graph Embedding特征信息与所述第二Graph Embedding特征信息进行分类,输出所述目标用户对应的风控指标的预测结果。
进一步而言,本实施例所述将所述目标APP名称序列输入预先训练的风控指标预测模型,还可以包括:获取目标用户的用户信息,以将所述用户信息和所述目标APP名称序列共同输入所述风控指标预测模型,得到贷款逾期指标的预测结果。
其中,本实施例的目标用户的用户信息,可以包括用户的身份信息、用户的贷款申请额度、用户的贷款期数、用户填写的其他联系人信息等。本实施例通过上述贷款申请信息作为输入,可以得到更加综合而全面的用户信息,提高风控指标预测模型的预测准确率。
通过上述实施例,本申请可以提高风控指标预测模型的预测准确率,下面将通过具体实验结果数据进行说明。
本实验使用智能手机作为运行平台,提供的数据包含APP名称序列数据与FPD30数据,并对数据进行脱敏和去除用户信息等。接着,基于相同数据,本实验进行对比分析的模型采用如下:
(1)TF-IDF+LR:利用TF-IDF(Term Frequency-inverse Document Frequency)模型进行APP名称序列的关键字提取,实现APP名称序列的向量化,分类器采用逻辑回归(Logistic Regression,LR)算法;
(2)TF-IDF+MNB:利用TF-IDF模型进行关键字的提取,实现APP名称序列的向量化,分类器采用多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)算法;
(3)Embedding+FC:利用Embedding(嵌入)方法对APP名称序列进行向量化,分类器采用全链接层(Fully connected layers,FC),其中包含了Softmax函数;
(4)Embedding+LSTM:使用Embedding方法实现了APP名称序列的初始向量化,并代入到LSTM(长短周期记忆)层进行特征提取,分类器采用全链接层,分类器中包含有Softmax函数;
(5)FastText(快速文本分类器):采用Word2Vec(词向量模型)、Softmax函数和N-gram(N元模型,语言模型)等技术;
在本实施例的实验中,评价指标采用Accuracy、F1、AUC,且本申请的参数设置为TPMI=0.3、TLSH=0.8、HLSH=128,最终,实验对比结果如下表:
Figure BDA0002655141820000161
Figure BDA0002655141820000171
其中,F1-score是F1分数指标,AUC是ROC曲线下的面积(Area Under Curve,AUC)指标。从上述对比结果不难看出,模型(3)的Embedding向量化的结果通过模型自动学习,其值与字典中APP名称的位置有关,由于用户APP序列中的各个APP名称之间没有较强的前后依赖关系,因此模型(3)与模型(4)的评价结果较为近似;模型(3)与模型(4)均取了算法在迭代过程中最好的评价结果,尤其是在AUC指标上取得了较高的结果,但是由于算法模型过于复杂,出现了过拟合的现象。
通过对比可知,与其它模型相比,本申请预测方法在各个评价指标下的结果都较为突出,本申请具备较优的稳定性与鲁棒性。同时,本申请GCN的双层图卷积层架构可以实现轻量化,而且处理过程没有出现过拟合现象,容易收敛,并且在迭代20次左右即可收敛而停止。
本申请提供将APP名称和APP名称序列作为图的节点,根据它们自身与它们之间的关系建立连接,从而构造一个大型的图结构,再将用户属性的分类问题转化为节点分类问题,最后结合GCN深度学习的方式,通过APP数据实现更好地去识别用户。在一些信贷应用场景中,本申请可以在欺诈行为发生之前对其进行阻止,有效避免个人信贷业务中面临的欺诈和信用等风险。
本发明实施例还提供了一种风控指标预测模型的模型训练方法,上述实施例的风控指标预测模型可以是基于本发明实施例提供的风控指标预测模型的模型训练方法训练得到的模型。
参见图2,图2是本发明实施例提供的风控指标预测模型的模型训练方法的流程图。如图2所示,本发明实施例提供的风控指标预测模型的模型训练方法包括以下步骤:
步骤201、获取M个APP名称序列样本,其中,所述APP名称序列样本包括APP名称,且所述APP名称序列样本标注有风控指标,M为正整数。
本实施例中,上述M个APP名称序列样本可以是采集的M个用户对应的APP名称序列。上述风控指标可以为逾期指标,其中逾期指标可以包括但不限于FPD、SPD、TPD和QPD等中的至少一项。上述每个APP名称序列样本均包括至少一个APP名称,且标注有风控指标。
步骤202、将所述M个APP名称序列样本输入图卷积网络以对图卷积网络进行训练,得到风控指标预测模型。
本实施例中,上述图卷积网络是一种针对图结构数据进行特征提取的深度神经网络,该图卷积网络可以包括至少两个图卷积层。
上述步骤202中,可以基于M个APP名称序列样本确定目标图结构的数据,例如,目标图结构的节点、邻接矩阵等,其中,邻接矩阵可以用于表示节点之间的相邻关系,从而可以基于目标图结构的数据对图卷积网络进行训练,得到风控指标预测模型。例如,目标图结构的节点可以包括分别用于表示上述M个APP名称序列样本的M个第一类节点,相应地,上述目标图结构的邻接矩阵可以基于上述第一类节点之间的关系确定,这样基于目标图结构的数据训练图卷积网络,可以使得图卷积网络学习APP名称序列样本之间的关系。
需要说明的是,由于APP名称序列样本标注有风控指标,这样基于APP名称序列样本训练得到的风控指标预测模型可以同时对风控指标进行预测,得到对应于风控指标的预测结果。例如,上述风控指标包括FPD和SPD,则训练得到的风控指标预测模型可以同时预测用户是否会发生首次还款逾期以及预测用户是否会发生第二期还款逾期。
本实施例提供的风控指标预测模型的模型训练方法,通过获取M个APP名称序列样本,其中,所述APP名称序列样本包括至少一个APP名称,且所述APP名称序列样本标注了风控指标,并根据所述M个APP名称序列样本对图卷积网络进行训练,得到风控指标预测模型,可以使得训练得到的风控指标预测模型可以较为快速和准确地进行风控。
容易理解的是,用户的终端设备安装和/或使用的APP数据往往可以反映其年龄、性别、文化程度等用户基本属性,预测爱好、习惯、兴趣、性格、消费观念、不良行为等用户扩展属性,以及APP数据中的安装时间、相同类型APP的使用频率和APP自身的用户评分等。具体地,可以预先采集M个用户对应的APP名称序列,也即M个APP名称序列样本,对每个APP名称序列样本标注风控指标,并利用标注有风控指标的M个APP名称序列样本对图卷积网络进行训练,得到风控指标预测模型,这样可以基于训练得到的风控指标预测模型可以同时对待预测的用户进行风控指标的风控属性检测;进一步地,为了提高预测准确性,本实施例除了利用APP名称序列样本,还可以另外增加标注有历史贷款信息集、历史逾期信息集、历史逾期期数信息集和/或历史欠款信息集进行训练,其中,历史贷款信息集、历史逾期信息集、历史逾期期数信息集和/或历史欠款信息集可以为基于现有的实际数据进行标记,此外,本实施例还可以对现有的实际数据进行扩展而构建其衍生的历史贷款信息子集、历史逾期信息子集、历史逾期期数信息子集和/或历史欠款信息子集,以丰富训练样本,提高预测准确度。例如,可以基于M个APP名称序列样本、历史贷款信息集、历史逾期信息集、历史逾期期数信息集和/或历史欠款信息集等确定目标图结构的数据,例如确定目标图结构的节点、邻接矩阵等;其中,邻接矩阵可以用于表示节点之间的相邻关系,并基于目标图结构的数据对图卷积网络进行训练,得到风控指标预测模型。
可选地,所述根据所述M个APP名称序列样本对图卷积网络进行训练,得到风控指标预测模型,包括:
根据所述M个APP名称序列样本确定目标图结构的节点,其中,所述目标图结构的节点包括M个第一类节点和K个第二类节点,所述第一类节点用于表示所述APP名称序列样本,所述第二类节点用于表示APP名称样本,所述APP名称序列样本包括至少一个APP名称,所述APP名称样本为所述APP名称序列样本中的APP名称,K均为正整数;
根据所述M个第一类节点和所述K个第二类节点,确定所述目标图结构的邻接矩阵;
根据所述目标图结构的节点和所述目标图结构的邻接矩阵对图卷积网络进行训练,得到风控指标预测模型。
本实施例中,可以基于M个APP名称序列样本构建目标图结构,以用于述图卷积网络训练。其中,上述目标图结构的节点可以包括用于表示APP名称序列样本的第一类节点和用于表示APP名称样本的第二类节点。上述K个APP名称样本包括上述M个APP名称序列样本所包括的APP名称,例如,上述M个APP名称序列样本包括100个APP名称,则上述K个APP名称样本可以为上述100个APP名称。
相应地,上述邻接矩阵可以用于表示目标图结构的节点之间的邻接关系。具体地,上述邻接矩阵可以基于第一类节点之间的关系、第二类节点之间的关系以及第一类节点和第二类节点之间的关系确定。
在确定目标图结构的节点和邻接矩阵之后,可以将目标图结构的节点和邻接矩阵输入至构建的图卷积网络,以对图卷积网络进行训练,得到风控指标预测模型。
需要说明的是,上述目标图结构的各个节点(也即APP名称序列样本和APP名称样本)均可以采用向量形式表示。例如,可以在获取到M个APP名称序列样本之后,将M个APP名称序列样本中每个APP名称序列样本转换为词向量序列,将M个APP名称序列样本中包括的K个APP名称样本中每个APP名称样本转换为词向量,这样可以基于M个词向量序列和K个词向量确定邻接矩阵,并基于M个词向量序列、K个词向量以及邻接矩阵训练图卷积网络,得到风控指标预测模型。
其中,将APP名称序列样本转换为词向量序列以及K个APP名称样本中每个APP名称样本转换为词向量的算法可以包括但不限于Word2Vec的CBOW模型、ELMo模型或者BERT模型等,本实施例对此不做限定。
本实施例中,由于目标图结构的节点包括用于表示APP名称序列样本的第一类节点和用于表示APP名称样本的第二类节点,这样基于目标图结构的数据训练图卷积网络,可以使得图卷积网络可以同时学习APP名称序列样本之间的关系、APP名称样本之间的关系以及APP名称序列样本和APP名称样本之间的关系,进而可以提高训练得到的风控指标预测模型进行风控的准确性。
可选地,所述邻接矩阵中所述第一类节点之间的权重值为所述第一类节点之间的相似度;
和/或
所述邻接矩阵中所述第二类节点之间的权重值为所述第二类节点之间的共现关系值;
和/或
所述邻接矩阵中所述第一类节点和所述第二类节点之间的权重值为所述第一类节点和所述第二类节点之间的逆文本频率指数。
本实施例中,上述目标图结构的邻接矩阵可以是由上述M+K个节点之间的权重值构成的矩阵,其中,上述节点之间的权重值可以用于表示节点之间边的权重值,也即节点之间的邻接关系,例如,若某两个节点之间的权重值大于或等于某个阈值,则表示这两个节点之间有边连接,若某两个节点之间的权重值小于某个阈值,则表示这两个节点之间没有边连接。
上述邻接矩阵中第一类节点之间的权重值可以为第一类节点之间的相似度,也即通过第一类节点之间的相似度衡量第一类节点之间的邻接关系。其中,上述第一类节点之间的相似度可以通过但不限于APP名称序列样本之间的海明距离、欧氏距离和余弦距离等度量。
上述第二类节点之间的权重值可以为第二类节点之间的共现关系值,也即通过第二类节点之间的共现关系值衡量第二类节点之间的邻接关系。其中,上述第二类节点之间的共现关系值可以通过但不限于两个APP名称样本同时出现的次数和APP名称样本的总数量之间的比值、PMI值等。
上述第一类节点和第二类节点之间的权重值可以为第一类节点和第二类节点之间的IDF值,也即通过第一类节点和第二类节点之间的IDF值衡量第一类节点和第二类节点之间的邻接关系。具体地,任意的第一类节点和第二类节点之间的IDF值可以通过如下公式计算得到:
Figure BDA0002655141820000211
式6中,|Ni|表示APP名称i出现的样本数量,也即包括APP名称i的APP名称序列样本的数量,V1表示APP名称序列样本的数量,也即M。上述IDF可以用于APP名称的重要性的度量,例如,若某个用户手机里安装的某一APP的名称在其它用户APP名称序列中很少出现,则认为该APP名称具有较强的类别区分能力。
本实施例中,通过第一类节点之间的相似度衡量第一类节点之间的邻接关系,和/或通过第二类节点之间的共现关系值衡量第二类节点之间的邻接关系,和/或通过第一类节点和第二类节点之间的逆文本频率指数衡量第一类节点和第二类节点之间的邻接关系,可以较为准确地反映不同类节点之间的邻接关系,从而基于邻接矩阵训练图卷积网络,可以使得图卷积网络可以更为准确地学习不同类节点之间的邻接关系,进而可以提高训练得到的风控指标预测模型进行风控的准确性。
可选地,所述第一类节点之间的相似度为所述第一类节点之间的Jaccard相似度;
和/或
所述第二类节点之间的共现关系值为所述第二类节点之间的点互信息值。
本实施例中,上述第一类节点之间的相似度为第一类节点之间的Jaccard相似度,也即通过第一类节点之间的Jaccard距离衡量第一类节点之间的相似度。具体地,任意两个第一类节点之间的Jaccard相似度可以通过如下公式计算得到:
Figure BDA0002655141820000221
式7中,i与j表示任意两个不同的集合,也即M个APP名称序列样本中任意两个不同的APP名称序列样本。
可选地,由于样本的数量通常较大,为了加快计算速度,上述第一类节点之间的Jaccard相似度可以基于Minhash算法和LSH算法计算得到。
例如,可以通过Minhash算法和LSH算法确定M个APP名称序列样本中相似的APP名称序列样本并划分为同一类别,并计算同一类别中的APP名称序列样本之间的Jaccard相似度。
需要说明的是,上述LSH算法主要包括两个参数:阈值TLSH和哈希置换函数个数HLSH,仅Jaccard相似度大于TLSH且属于同一类别的两个APP名称序列样本之间才添加边,且其值为该Jaccard相似度。
上述第二类节点之间的共现关系值为第二类节点之间的点互信息值,也即通过第二类节点之间的点互信息值衡量第二类节点之间的共现关系值。具体地,任意两个第二类节点之间的点互信息值可以通过如下公式计算得到:
Figure BDA0002655141820000222
式8中,
Figure BDA0002655141820000231
M(i)表示APP名称i出现的样本数量,也即包括APP名称i的APP名称序列样本的数量;
M*j)表示APP名称j出现的样本数量,也即包括APP名称j的APP名称序列样本的数量;
M*i,j)表示APP名称i与APP名称j同时出现的样本数量,也即同时包括APP名称i与APP名称j的APP名称序列样本的数量;
V1表示APP名称序列样本的数量,也即M。
需要说明的是,当PMI*i,j)为正数时,表示APP名称i与APP名称j有较强的关联性,且该值越大关联性较强。为了简化网络,可以设置阈值TPMI,只对PMI值大于TPMI的两个APP名称样本之间添加边,且其值为该PMI值。
可选地,可以定义目标图结构的邻接矩阵A如下:
Figure BDA0002655141820000232
本实施例中,在i和j均表示APP名称样本的情况下,Ai,j等于MI(i,j);在i表示APP名称,j表示APP名称序列样本的情况下,Ai,j等于IDFi;在i和j均表示APP名称序列样本的情况下,Ai,j等于Jaccard(i,j);在i=j的情况下,Ai,j等于1;在其他情况下,Ai,j等于0。
也即,用于表示APP名称样本的第二类节点之间的权重采用PMI值表示;用于表示APP名称序列样本的第一类节点和用于表示APP名称样本的第二类节点之间的权重采用IDF值表示;用于表示APP名称序列样本的第一类节点之间的权重采用Jaccard相似度表示;邻接矩阵A的对角线元素被设置为1,其他情况设置为0。上述i和j可以表示目标图结构的任意两个节点。
需要说明的是,上述PMI值、IDF值和Jaccard相似度的计算公式可以参见前述相关说明,为避免重复,在此不做赘述。
可选地,所述图卷积网络可以包括两个图卷积层。
本实施例中,上述图卷积网络可以是两层的图卷积网络,其中,第一层卷积层可以用于学习目标图结构中相邻节点的特征信息,第二层卷积层可以用于学习目标图结构中相邻节点的特征信息以及相邻节点的相邻节点的特征信息。此外,第二层卷积层嵌入的维度可以与标注的风控指标的数量相同,该层可以采用Softmax函数作为分类器:
Figure BDA0002655141820000241
式9中,
Figure BDA0002655141820000242
D为邻接矩阵A的对角矩阵,ReLU为激活函数,Softmax函数表示为:
Figure BDA0002655141820000243
损失函数采用交叉熵函数,该交叉熵函数可以如下所示:
Figure BDA0002655141820000244
式10中,YD表示带标签的APP名称序列集合,F表示输出特征的维度,等于类别数量,Ydf表示标注类别,Zdf为预测的类别。通过梯度下降来训练W0和W1两个权重参数。
结合上述实施例,本实施例的图卷积网络模型包括相连接的第一图卷积层和第二图卷积层,所述根据所述M个APP名称序列样本对图卷积网络进行训练,得到风控指标预测模型的步骤,具体包括:
将所述APP名称序列样本输入所述第一图卷积层,所述第一图卷积层提取并聚合中心节点及与所述中心节点连接的节点的信息,得到与所述APP名称序列样本对应的第一Graph Embedding特征信息、与所述APP名称对应的第二Graph Embedding特征信息,其中,以所述APP名称序列样本和APP名称序列样本中的APP名称作为所述中心节点;
将所述第一Graph Embedding特征信息与所述第二Graph Embedding特征信息输入所述第二图卷积层,所述第二图卷积层基于所述第一Graph Embedding特征信息与所述第二Graph Embedding特征信息进行分类,以训练得到风控指标预测模型。
可选地,所述获取M个APP名称序列样本,包括:
获取S个初始APP名称序列样本,S为正整数;
对所述S个初始APP名称序列样本进行预处理,得到M个APP名称序列样本,M为小于或等于S的正整数;
其中,所述预处理包括如下至少一项:
过滤所述S个初始APP名称序列样本中预设类型APP的APP名称;
过滤所述S个初始APP名称序列样本中出现次数小于预设次数的APP名称;
将所述S个初始APP名称序列样本中的APP名称的格式转换为预设格式。
本实施例中,上述预设类型可以根据实际需求进行合理设置,例如,上述预设类型可以包括但不限于名称均为字母的APP、***APP或者***默认安装的APP等中的一项或者多项。可选地,本实施例可以过滤初始APP名称序列中属于预设类型且未位于预设APP列表的APP的名称。例如,可以将一些常见的名称均为字母的APP的名称存储于预设APP列表,这样可以仅过滤掉那些不常用的名称均为字母的APP。
上述预设次数可以根据实际情况进行合理设置,例如,2、3、5等。
上述将初始APP名称序列样本中的APP名称的格式转换为预设格式,可以包括但不限于如下至少一项:过滤S个初始APP名称序列样本中的APP名称的特殊字符,例如,仅保留S个初始APP名称序列样本中的APP名称中的字母、汉字和数字等字符;将S个初始APP名称序列样本中的APP名称中大写格式的字母均转换为小写格式;将S个初始APP名称序列样本中的APP名称中的繁体字转换为简体字;将S个初始APP名称序列样本中对应于同一APP的不同版本的APP名称转换为同一名称,例如,将“XX浏览器极速版”转换为“XX浏览器”。
本实施例通过对S个初始APP名称序列样本执行上述至少一种的预处理过程,可以使得到的M个APP名称序列样本可以更为准确地反映用户的属性信息,这样基于上述M个APP名称序列样本对图卷积网络进行训练,可以提高训练得到的风控指标预测模型的准确性。
需要说明的是,由于本实施例采用的深度学习模型适用于较大规模的数据处理,且保留较为完整的APP名称序列比经过特征筛选的APP名称序列的特征挖掘效果要好,因此本实施例不对预处理后得到的M个APP名称序列样本进行特征筛选操作,而直接基于预处理后得到的M个APP名称序列样本对图卷积网络进行训练。
可选地,所述根据所述M个APP名称序列样本对图卷积网络进行训练,得到风控指标预测模型之前,所述方法还可以包括:
根据所述M个APP名称序列样本中的APP名称,生成APP名称词典;
确定所述APP名称词典中每个APP名称对应的词向量;
根据所述APP名称词典中每个APP名称对应的词向量,确定所述M个APP名称序列样本中每个APP名称序列样本对应的词向量序列;
所述根据所述M个APP名称序列样本对图卷积网络进行训练,得到风控指标预测模型,包括:
根据所述M个APP名称序列样本中每个APP名称序列样本对应的词向量序列对图卷积网络进行训练,得到风控指标预测模型。
本实施例中,上述APP名称词典存储的APP名称可以是按照出现次数排列的。上述确定所述APP名称词典中每个APP名称对应的词向量,可以包括但不限于基于Word2Vec的CBOW、ELMo模型或者BERT模型等确定每个APP名称对应的词向量。
在确定APP名称词典中每个APP名称对应的词向量之后,也即得到采用词向量表示各个APP名称的APP名称词典之后,可以基于APP名称词典中每个APP名称对应的词向量确定所述M个APP名称序列样本中每个APP名称序列样本对应的词向量序列,例如,分别将每个APP名称序列样本中的每个APP名称样本替换成APP名称词典中该APP名称样本对应的词向量,以得到每个APP名称序列样本对应的词向量序列。
可选地,本实施例可以保存上述采用词向量表示APP名称的APP名称词典,这样在基于训练得到的风控指标预测模型进行风控的过程中,可以基于上述APP名称词典不仅可以快速地将待预测的用户对应的APP名称序列转换为词向量序列,可以保证训练阶段和应用阶段中同一APP名称对应的词向量相同。
综上,本发明实施例在创建用于GCN训练的目标图结构时建立了APP名称序列之间的联系,同时有效的捕捉全局APP名称的共现信息以及具有代表性的APP名称,实现了将用户属性分类问题转为图节点分类问题,不仅实现算法较为简单,且训练得到的风控指标预测模型的准确率、F1分数和ROC曲线下的面积(即AUC)等指标均较优。
参见图3,图3是本发明实施例提供的风控装置的结构图。如图3所示,风控装置300包括:
获取模块301,用于获取待预测的目标用户的终端设备安装和/或使用的目标APP名称序列,所述目标APP名称序列包括APP名称;
输入模块302,用于将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果;
其中,所述风控指标预测模型为基于标注了所述风控指标的APP名称序列样本对图卷积网络训练得到的模型。本实施例中,上述风控指标可以包括但不限于首次还款逾期(FPD)、第二期还款逾期(SPD)、第三期还款逾期(TPD)和第四期还款逾期(QPD)、欺诈等中的至少一项。
可选地,所述风控指标预测模型具体为基于标注了风控指标的APP名称序列样本对图卷积网络训练得到的模型,本实施例用于所述图卷积网络训练的目标图结构的节点包括M个第一类节点和K个第二类节点,所述第一类节点用于表示APP名称序列样本,所述第二类节点用于表示APP名称样本,所述APP名称序列样本包括至少一个APP名称,所述APP名称样本为所述APP名称序列样本中的APP名称,M、K均为正整数。
可选地,所述目标图结构的邻接矩阵中所述第一类节点之间的权重值为所述第一类节点之间的相似度;
和/或
所述邻接矩阵中所述第二类节点之间的权重值为所述第二类节点之间的共现关系值;
和/或
所述邻接矩阵中所述第一类节点和所述第二类节点之间的权重值为所述第一类节点和所述第二类节点之间的逆文本频率指数。
可选地,所述第一类节点之间的相似度为所述第一类节点之间的Jaccard相似度;
和/或
所述第二类节点之间的共现关系值为所述第二类节点之间的点互信息值。
可选地,所述获取模块具体用于:
获取待预测的目标用户对应的初始APP名称序列;
对所述初始APP名称序列进行第一预处理,得到所述目标APP名称序列;
其中,所述预处理包括如下至少一项:
过滤所述初始APP名称序列中预设类型APP的APP名称;
过滤所述初始APP名称序列中未包含于预设的APP名称词典中的APP名称;
将所述初始APP名称序列中的APP名称的格式转换为预设格式。
可选地,所述装置还包括:
确定模块,用于所述将所述目标APP名称序列输入预先训练的风控指标预测模型之前,根据预设的APP名称词典中APP名称对应的词向量,确定所述目标APP名称序列中每个APP名称对应的词向量,得到词向量序列;
所述输入模块,具体用于:
将所述词向量序列输入预先训练的风控指标预测模型。
需要特别说明的是,为了进一步提高预测准确率,所述获取模块301还用于获取目标用户的贷款申请信息;所述输入模块302还用于将所述贷款申请信息和所述目标APP名称序列共同输入所述风控指标预测模型,得到风控指标的预测结果。其中,本实施例的目标用户的贷款申请信息,可以包括用户的身份信息、用户的贷款申请额度、用户的贷款期数、用户填写的其他联系人信息等。本实施例通过上述贷款申请信息作为输入,可以得到更加综合而全面的用户信息,提高风控指标预测模型的预测准确率。
本发明实施例提供的风控装置300能够实现上述风控方法实施例中的各个过程,为避免重复,这里不再赘述。
本发明实施例的风控装置300,获取模块301,用于获取待预测的目标用户对应的目标APP名称序列,所述目标APP名称序列包括所述目标用户的终端设备安装和/或使用的至少一个APP的APP名称;输入模块302,用于将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果,不仅可以提高风控的效率,还可以提高风控结果的准确性。例如,本申请可以应用在金融等高风险领域,通过目标用户的APP的属性类别(比如银行类APP、信贷类APP),将APP名称和APP名称序列作为图卷积网络的图的节点,根据APP之间的关系建立连接而构造一个大型图,进而利用图卷积网络将针对用户属性的预测分类问题转化为图卷积网络的节点分类问题,而不需要结合用户的其他信息即可以有效地实现对多头借贷、借新还旧等逾期行为的识别以及预测。进一步而言,通过实验证明,本申请采用图卷积网络对APP名称构造的图进行分类时,各个评价指标较为突出,图卷积网络具有更好的稳定性与鲁棒性,也没有出现过拟合现象,收敛速度较快,能够满足风控领域对风控响应速度快、风控结果准确的高标准和高要求,从而能够更好地运用到风控领域。
参见图4,图4是本发明实施例提供的风控指标预测模型的模型训练装置的结构图。如图4所示,风控指标预测模型的模型训练装置400包括:
获取模块401,用于获取M个APP名称序列样本,其中,所述APP名称序列样本包括APP名称,且所述APP名称序列样本标注有风控指标,M为正整数;
训练模块402,用于将所述M个APP名称序列样本输入图卷积网络以对图卷积网络进行训练,得到风控指标预测模型。
本实施例中,上述风控指标可以包括但不限于首次还款逾期(FPD)、第二期还款逾期(SPD)、第三期还款逾期(TPD)和第四期还款逾期(QPD)、欺诈等中的至少一项。
可选地,所述训练模块具体用于:
根据所述M个APP名称序列样本确定目标图结构的节点,其中,所述目标图结构的节点包括M个第一类节点和K个第二类节点,所述第一类节点用于表示所述APP名称序列样本,所述第二类节点用于表示APP名称样本,所述APP名称序列样本包括至少一个APP名称,所述APP名称样本为所述APP名称序列样本中的APP名称,K均为正整数;
根据所述M个第一类节点和所述K个第二类节点,确定所述目标图结构的邻接矩阵;
根据所述目标图结构的节点和所述目标图结构的邻接矩阵对图卷积网络进行训练,得到风控指标预测模型。
可选地,所述邻接矩阵中所述第一类节点之间的权重值为所述第一类节点之间的相似度;
和/或
所述邻接矩阵中所述第二类节点之间的权重值为所述第二类节点之间的共现关系值;
和/或
所述邻接矩阵中所述第一类节点和所述第二类节点之间的权重值为所述第一类节点和所述第二类节点之间的逆文本频率指数。
可选地,所述第一类节点之间的相似度为所述第一类节点之间的Jaccard相似度;
和/或
所述第二类节点之间的共现关系值为所述第二类节点之间的点互信息值。
可选地,所述获取模块具体用于:
获取S个初始APP名称序列样本,S为正整数;
对所述S个初始APP名称序列样本进行预处理,得到M个APP名称序列样本,M为小于或等于S的正整数;
其中,所述预处理包括如下至少一项:
过滤所述S个初始APP名称序列样本中预设类型APP的APP名称;
过滤所述S个初始APP名称序列样本中出现次数小于预设次数的APP名称;
将所述S个初始APP名称序列样本中的APP名称的格式转换为预设格式。
可选地,所述装置还包括:
生成模块,用于所述根据所述M个APP名称序列样本对图卷积网络进行训练,得到风控指标预测模型之前,根据所述M个APP名称序列样本中的APP名称,生成APP名称词典;
第一确定模块,用于确定所述APP名称词典中每个APP名称对应的词向量;
第二确定模块,用于根据所述APP名称词典中每个APP名称对应的词向量,确定所述M个APP名称序列样本中每个APP名称序列样本对应的词向量序列;
所述训练模块具体用于:
根据所述M个APP名称序列样本中每个APP名称序列样本对应的词向量序列对图卷积网络进行训练,得到风控指标预测模型。
具体而言,在本实施例中,所述图卷积网络模型可以包括第一图卷积层和与第一图卷积层连接的第二图卷积层,在训练过程中,本实施例可以将所述APP名称序列样本对应的词向量序列输入所述第一图卷积层,所述第一图卷积层提取并聚合中心节点及与中心节点连接的节点的信息,得到与所述APP名称序列样本对应的词向量序列对应的第一GraphEmbedding特征信息、与所述APP名称序列样本中的APP名称的词向量对应的第二GraphEmbedding特征信息,其中,以所述APP名称序列样本对应的词向量序列和/或APP名称序列样本中的APP名称的词向量作为中心节点;将所述第一Graph Embedding特征信息与所述第二Graph Embedding特征信息输入所述第二图卷积层,所述第二图卷积层基于所述第一Graph Embedding特征信息与所述第二Graph Embedding特征信息进行分类,以得到对应的风控指标的预测结果。
此外,本实施例还可以通过多种模型融合的方式,实现对用户多种属性的预测分类,具体而言,在训练时,本实施例可以获取用户样本的用户信息,其中,所述用户信息包括历史贷款信息集、历史逾期信息集、历史逾期期数信息集和/或历史欠款信息集;接着,将所述APP名称序列样本对应的词向量序列输入所述第一图卷积层,所述第一图卷积层提取并聚合中心节点及与所述中心节点连接的节点信息,得到与所述APP名称序列样本对应的词向量序列对应的第一Graph Embedding特征信息;最后,将所述第一Graph Embedding特征信息与所述用户信息进行特征融合以得到融合特征信息;将所述融合特征信息输入预训练的反欺诈融合子模型,以得到所述目标用户的反欺诈预测结果。
本发明实施例提供的风控指标预测模型的模型训练装置400能够实现上述风控指标预测模型的模型训练方法实施例中的各个过程,为避免重复,这里不再赘述。
本发明实施例的风控指标预测模型的模型训练装置400,获取模块401,用于获取M个APP名称序列样本,其中,所述APP名称序列样本包括至少一个APP名称,且所述APP名称序列样本标注了风控指标,M为正整数;训练模块402,用于将所述M个APP名称序列样本输入图卷积网络以对图卷积网络进行训练,得到风控指标预测模型,可以使得训练得到的风控指标预测模型可以较为快速和准确地进行风控。
参见图5,图5是本发明又一实施提供的风控装置的结构图,如图5所示,风控装置500包括:处理器501、存储器502及存储在所述存储器502上并可在所述处理器上运行的计算机程序,风控装置500中的各个组件通过总线接口503耦合在一起,所述计算机程序被所述处理器501执行时实现如下步骤:
获取待预测的目标用户的终端设备安装和/或使用的目标APP名称序列,所述目标APP名称序列包括APP名称;
将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果;
其中,所述风控指标预测模型为基于标注了所述风控指标的APP名称序列样本对图卷积网络训练得到的模型。
本实施例中,上述风控指标可以包括但不限于首次还款逾期(FPD)、第二期还款逾期(SPD)、第三期还款逾期(TPD)和第四期还款逾期(QPD)、欺诈等中的至少一项。
应理解的是,本发明实施例中,所述计算机程序被处理器501执行时能够实现上述风控方法实施例中的各个过程,为避免重复,这里不再赘述。
参见图6,图6是本发明又一实施提供的风控指标预测模型的模型训练装置的结构图,如图6所示,风控指标预测模型的模型训练装置600包括:处理器601、存储器602及存储在所述存储器602上并可在所述处理器上运行的计算机程序,风控指标预测模型的模型训练装置600中的各个组件通过总线接口603耦合在一起,所述计算机程序被所述处理器601执行时实现如下步骤:
获取M个APP名称序列样本,其中,所述APP名称序列样本包括APP名称,且所述APP名称序列样本标注了风控指标,M为正整数;
将所述M个APP名称序列样本输入图卷积网络以对图卷积网络进行训练,得到风控指标预测模型。
上述风控指标可以包括但不限于首次还款逾期(FPD)、第二期还款逾期(SPD)、第三期还款逾期(TPD)和第四期还款逾期(QPD)、欺诈等中的至少一项。
应理解的是,本发明实施例中,所述计算机程序被处理器601执行时能够实现上述风控指标预测模型的模型训练方法实施例中的各个过程,为避免重复,这里不再赘述。
本发明实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述风控方法实施例的各个过程,或者实现上述风控指标预测模型的模型训练方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述风控方法实施例的各个过程,,或者实现上述风控指标预测模型的模型训练方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (12)

1.一种风控方法,其特征在于,包括:
获取待预测的目标用户的终端设备安装和/或使用的目标APP名称序列;
将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果;
其中,所述风控指标预测模型为图卷积网络模型。
2.根据权利要求1所述的方法,其特征在于,所述风控指标预测模型是利用标注有风控指标的APP名称序列样本对图卷积网络训练得到的模型,其中,用于所述图卷积网络训练的目标图结构的节点包括M个第一类节点和K个第二类节点,所述第一类节点用于表示APP名称序列,所述第二类节点用于表示APP名称,M、K均为正整数。
3.根据权利要求2所述的方法,其特征在于,所述目标图结构的邻接矩阵中所述第一类节点之间的权重值为所述第一类节点之间的相似度;
和/或
所述邻接矩阵中所述第二类节点之间的权重值为所述第二类节点之间的共现关系值;
和/或
所述邻接矩阵中所述第一类节点和所述第二类节点之间的权重值为所述第一类节点和所述第二类节点之间的逆文本频率指数。
4.根据权利要求3所述的方法,其特征在于,所述第一类节点之间的相似度为所述第一类节点之间的Jaccard相似度;
和/或
所述第二类节点之间的共现关系值为所述第二类节点之间的点互信息值。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取待预测的目标用户对应的目标APP名称序列,包括:
获取待预测的目标用户对应的初始APP名称序列;
对所述初始APP名称序列进行第一预处理,得到所述目标APP名称序列;
其中,所述预处理包括如下至少一项:
过滤所述初始APP名称序列中预设类型APP的APP名称;
过滤所述初始APP名称序列中未包含于预设的APP名称词典中的APP名称;
将所述初始APP名称序列中的APP名称的格式转换为预设格式。
6.根据权利要求1所述的方法,其特征在于,所述将所述目标APP名称序列输入预先训练的风控指标预测模型之前,所述方法还包括:
根据预设的APP名称词典中APP名称对应的词向量,确定所述目标APP名称序列中每个APP名称对应的词向量,得到词向量序列;
所述将所述目标APP名称序列输入预先训练的风控指标预测模型,包括:
将所述词向量序列输入预先训练的风控指标预测模型。
7.根据权利要求2-4任一项所述的方法,其特征在于,所述图卷积网络模型包括第一图卷积层和与所述第一图卷积层连接的第二图卷积层,所述将所述目标APP名称序列输入预先训练的风控指标预测模型,得到所述目标用户对应的风控指标的预测结果的步骤,包括:
将所述目标APP名称序列输入所述第一图卷积层,所述第一图卷积层提取并聚合中心节点及与所述中心节点连接的节点的信息,得到与所述目标APP名称序列对应的第一GraphEmbedding特征信息、与所述APP名称对应的第二Graph Embedding特征信息,其中,以所述目标APP名称序列和目标APP名称序列中的APP名称作为所述中心节点;
将所述第一Graph Embedding特征信息与所述第二Graph Embedding特征信息输入所述第二图卷积层,所述第二图卷积层输出所述目标用户对应的风控指标的预测结果。
8.根据权利要求2-4任一项所述的方法,其特征在于,所述图卷积网络模型包括第一图卷积层:
所述获取待预测的目标用户对应的目标APP名称序列的步骤之后,还包括:
获取待预测的目标用户的用户信息,其中,所述用户信息包括历史贷款信息集、历史逾期信息集、历史逾期期数信息集和/或历史欠款信息集;
将所述目标APP名称序列输入所述第一图卷积层,所述第一图卷积层提取并聚合中心节点及与所述中心节点连接的节点的信息,得到与所述目标APP名称序列对应的第一GraphEmbedding特征信息,其中,以所述目标APP名称序列和目标APP名称序列中的APP名称作为所述中心节点;
将所述第一Graph Embedding特征信息与所述用户信息进行特征融合以得到融合特征信息;
将所述融合特征信息输入预训练的反欺诈融合子模型,以得到所述目标用户的反欺诈预测结果。
9.一种贷款逾期预测方法,其特征在于,包括:
利用权利要求1-8任意一项风控方法得到目标用户的风控指标的预测结果,所述风控指标为贷款逾期指标。
10.一种风控指标预测模型的模型训练方法,其特征在于,包括:获取M个APP名称序列样本,所述APP名称序列样本标注有风控指标,M为正整数;
将所述M个APP名称序列样本输入图卷积网络以对图卷积网络进行训练,得到风控指标预测模型。
11.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的风控方法的步骤,或者实现如权利要求9所述的贷款逾期预测方法的步骤,或者实现如权利要求10所述的风控指标预测模型的模型训练方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的风控方法的步骤,或者实现如权利要求9所述的贷款逾期预测方法的步骤,或者实现如权利要求10所述的风控指标预测模型的模型训练方法的步骤。
CN202010884467.2A 2020-08-28 2020-08-28 风控方法、逾期预测方法、模型训练方法及相关设备 Pending CN114119191A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010884467.2A CN114119191A (zh) 2020-08-28 2020-08-28 风控方法、逾期预测方法、模型训练方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010884467.2A CN114119191A (zh) 2020-08-28 2020-08-28 风控方法、逾期预测方法、模型训练方法及相关设备

Publications (1)

Publication Number Publication Date
CN114119191A true CN114119191A (zh) 2022-03-01

Family

ID=80374847

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010884467.2A Pending CN114119191A (zh) 2020-08-28 2020-08-28 风控方法、逾期预测方法、模型训练方法及相关设备

Country Status (1)

Country Link
CN (1) CN114119191A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114581693A (zh) * 2022-03-07 2022-06-03 支付宝(杭州)信息技术有限公司 一种用户行为模式的区分方法和装置
CN114819764A (zh) * 2022-06-27 2022-07-29 岩火科技(杭州)有限公司 一种基于脱敏数据的虚假诉讼行为风险预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009430A (zh) * 2019-04-11 2019-07-12 腾讯科技(深圳)有限公司 作弊用户检测方法、电子设备及计算机可读存储介质
CN110705260A (zh) * 2019-09-24 2020-01-17 北京工商大学 一种基于无监督图神经网络结构的文本向量生成方法
CN110796542A (zh) * 2019-09-26 2020-02-14 北京淇瑀信息科技有限公司 金融风险控制方法、金融风险控制装置和电子设备
CN111325258A (zh) * 2020-02-14 2020-06-23 腾讯科技(深圳)有限公司 特征信息获取方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009430A (zh) * 2019-04-11 2019-07-12 腾讯科技(深圳)有限公司 作弊用户检测方法、电子设备及计算机可读存储介质
CN110705260A (zh) * 2019-09-24 2020-01-17 北京工商大学 一种基于无监督图神经网络结构的文本向量生成方法
CN110796542A (zh) * 2019-09-26 2020-02-14 北京淇瑀信息科技有限公司 金融风险控制方法、金融风险控制装置和电子设备
CN111325258A (zh) * 2020-02-14 2020-06-23 腾讯科技(深圳)有限公司 特征信息获取方法、装置、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114581693A (zh) * 2022-03-07 2022-06-03 支付宝(杭州)信息技术有限公司 一种用户行为模式的区分方法和装置
CN114581693B (zh) * 2022-03-07 2023-11-03 支付宝(杭州)信息技术有限公司 一种用户行为模式的区分方法和装置
CN114819764A (zh) * 2022-06-27 2022-07-29 岩火科技(杭州)有限公司 一种基于脱敏数据的虚假诉讼行为风险预测方法
CN114819764B (zh) * 2022-06-27 2022-11-01 岩火科技(杭州)有限公司 一种基于脱敏数据的虚假诉讼行为风险预测方法

Similar Documents

Publication Publication Date Title
CN108550065B (zh) 评论数据处理方法、装置及设备
CN113220886A (zh) 文本分类方法、文本分类模型训练方法及相关设备
CN109471944A (zh) 文本分类模型的训练方法、装置及可读存储介质
CN112015901A (zh) 文本分类方法及装置、警情分析***
CN111339260A (zh) 一种基于bert和qa思想的细粒度情感分析方法
CN111177367B (zh) 案件分类方法、分类模型训练方法及相关产品
CN112016313A (zh) 口语化要素识别方法及装置、警情分析***
CN114298176A (zh) 一种欺诈用户检测方法、装置、介质及电子设备
CN114119191A (zh) 风控方法、逾期预测方法、模型训练方法及相关设备
CN114202336A (zh) 一种金融场景下的风险行为监测方法及***
CN112215629B (zh) 基于构造对抗样本的多目标广告生成***及其方法
CN111709225A (zh) 一种事件因果关系判别方法、装置和计算机可读存储介质
CN114971294A (zh) 数据采集方法、装置、设备及存储介质
CN110910235A (zh) 一种基于用户关系网络的贷中异常行为检测方法
CN113449103A (zh) 融入标签与文本交互机制的银行交易流水分类方法及***
CN113761184A (zh) 文本数据的分类方法、设备及存储介质
CN117114705A (zh) 一种基于持续学习的电商欺诈识别方法与***
CN115688101A (zh) 一种基于深度学习的文件分类方法及装置
CN116089605A (zh) 基于迁移学习和改进词袋模型的文本情感分析方法
CN115017894A (zh) 一种舆情风险识别方法及装置
CN112115258B (zh) 一种用户的信用评价方法、装置、服务器及存储介质
CN113886539A (zh) 话术推荐方法、装置、客服设备及存储介质
CN112507912A (zh) 一种识别违规图片的方法及装置
CN117094817B (zh) 一种信用风险控制智能预测方法及***
CN117787922B (zh) 基于蒸馏学习和自动学习的反洗钱业务处理方法、***、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination