CN111681091B - 基于时间域信息的金融风险预测方法、装置及存储介质 - Google Patents

基于时间域信息的金融风险预测方法、装置及存储介质 Download PDF

Info

Publication number
CN111681091B
CN111681091B CN202010804538.3A CN202010804538A CN111681091B CN 111681091 B CN111681091 B CN 111681091B CN 202010804538 A CN202010804538 A CN 202010804538A CN 111681091 B CN111681091 B CN 111681091B
Authority
CN
China
Prior art keywords
sample
financial
network
information processing
financial information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010804538.3A
Other languages
English (en)
Other versions
CN111681091A (zh
Inventor
蓝利君
孙艺芙
郭清宇
李超
王翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010804538.3A priority Critical patent/CN111681091B/zh
Publication of CN111681091A publication Critical patent/CN111681091A/zh
Application granted granted Critical
Publication of CN111681091B publication Critical patent/CN111681091B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于时间域信息的金融风险预测方法、基于时间域信息的金融风险预测方法、装置、电子设备、存储介质,方法包括:获取与目标用户相匹配的无标签的金融信息样本特征;确定与目标用户相匹配的无标签的金融信息样本特征所分别对应的不同金融业务场景调用经由时间域训练样本对抗训练的金融信息处理模型,并通过金融信息处理模型对无标签样本特征集合进行风险预测处理,得到目标用户的金融风险预测结果,由此,能够实现通过金融信息处理模型对金融场景中的目标用户的风险进行预测,降低金融信息处理的复杂性,在兼顾了训练精确性的同时,使得金融信息处理模型的泛化能力以及数据处理能力更强,适应不同的数据处理环境,降低鲁棒性。

Description

基于时间域信息的金融风险预测方法、装置及存储介质
技术领域
本发明涉及神经网络模型中的数据处理技术,尤其涉及基于时间域信息的金融风险预测方法、装置、电子设备及存储介质。
背景技术
基于深度学习所进行的各类别识别,一直以来都是各应用场景下解决大量数据分的重要工具。例如,在图像、自然语言处理、风险预警等应用场景中,对大量数据所实现的大规模分类和识别,以此来快速准确的获得相关的分类预测结果,加速所在应用场景的功能实现。例如在支付、借贷、理财等金融业务环节中的风险控制中,不同客户群体的数据分布差异大,并且存在众多具有小样本特性的客户群体。因此,传统的模型筛选方法依赖于一个数据量大、时间跨度长、且有标签样本丰富的数据集,但是在金融风控场景实际生产中,模型的使用面临着数据量小且正负样本非常不均衡的数据问题,从而容易出现模型过拟合现象,使得金融信息处理模型的预测结果随着使用时间的增长出现准确率降低。
发明内容
有鉴于此,本发明实施例提供一种基于时间域信息的金融风险预测方法、装置、电子设备及存储介质,能够实现通过金融信息处理模型对金融场景中的目标用户的风险进行预测,降低金融信息处理的复杂性,在兼顾了训练精确性的同时,使得金融信息处理模型的泛化能力以及数据处理能力更强,适应不同的数据处理环境降低鲁棒性。
本发明实施例的技术方案是这样实现的:
本发明实施例还提供了一种基于时间域信息的金融风险预测方法,包括:
响应于金融风险预测请求,获取与目标用户相匹配的无标签的金融信息样本特征;
确定与所述目标用户相匹配的无标签的金融信息样本特征所分别对应的不同金融业务场景;
基于所述不同金融业务场景,确定与所述不同金融业务场景相匹配的动态噪声;
基于所述动态噪声,对所述目标用户相匹配的无标签的金融信息样本特征进行动态去噪处理,以形成与对应的金融业务场景相匹配的无标签样本特征集合;
调用经由时间域训练样本对抗训练的金融信息处理模型,并通过所述金融信息处理模型对所述无标签样本特征集合进行风险预测处理,得到所述目标用户的金融风险预测结果;
输出所述目标用户的金融风险预测结果。
上述方案中,所述方法还包括:
获取目标用户集合的特征和金融场景的历史参数;
根据所述目标用户集合的特征和金融场景的历史参数,得到与所述金融信息处理模型相匹配的样本特征集合,其中所述样本特征集合中包括不同时间域的样本特征;
基于不同的时间窗长度,对所述样本特征集合进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合,其中,所述训练样本集合包括至少一组训练样本;
根据与所述金融信息处理模型相匹配的不同时间域的训练样本集合对所述金融信息处理模型进行训练,确定与所述金融信息处理模型相适配的模型参数,以实现通过所述金融信息处理模型对所述金融场景中的目标用户的风险进行预测。
上述方案中,所述方法还包括:
确定与所金融信息处理模型的使用环境相匹配的动态噪声阈值;
根据所述动态噪声阈值对所述样本特征集合进行去噪处理,以形成与所述动态噪声阈值相匹配的样本特征集合;或者,
确定与所金融信息处理模型相对应的固定噪声阈值,并根据所述固定噪声阈值对所述样本特征集合进行去噪处理,以形成与所述固定噪声阈值相匹配的样本特征集合。
上述方案中,所述响应于所述特征提取器网络的初始参数,通过所述特征提取器网络对所述训练样本集合进行处理,确定所述特征提取器网络的更新参数,包括:
将所述训练样本集合中不同训练样本,代入由所述特征提取器网络所对应的损失函数;
确定所述损失函数满足相应的收敛条件时所述特征提取器网络对应所述更新参数。
上述方案中,所述方法还包括:
将目标用户标识、金融信息处理模型的模型参数、金融场景标识发送至区块链网络,以使所述区块链网络的节点将所述目标用户标识、金融信息处理模型的模型参数、金融场景标识填充至新区块,且当对所述新区块共识一致时,将所述新区块追加至区块链的尾部。
上述方案中,所述方法还包括:
接收所述区块链网络中的其他节点的数据同步请求;
响应于所述数据同步请求,对所述其他节点的权限进行验证;
当所述其他节点的权限通过验证时,控制当前节点与所述其他节点之间进行数据同步,以实现所述其他节点获取目标用户标识、金融信息处理模型的模型参数、金融场景标识。
上述方案中,所述方法还包括:
响应于查询请求,解析所述查询请求以获取对应的对象标识;
根据所述对象标识,获取区块链网络中的目标区块内的权限信息;
对所述权限信息与所述对象标识的匹配性进行校验;
当所述权限信息与所述对象标识相匹配时,在所述区块链网络中获取相应的目标用户标识、金融信息处理模型的模型参数、金融场景标识;
响应于所述查询指令,将所获取的相应的金融信息以及与所述基础对象相匹配的目标对象向相应的客户端进行推送,以实现所述客户端获取所述区块链网络中所保存的相应的金融信息以及与所述基础对象相匹配的目标对象。
本发明实施例还提供了一种基于时间域信息的金融风险预测装置,所述装置包括:
第一信息传输模块,用于响应于金融风险预测请求,获取与目标用户相匹配的无标签的金融信息样本特征;
信息处理模块,用于确定与所述目标用户相匹配的无标签的金融信息样本特征所分别对应的不同金融业务场景;
所述信息处理模块,用于基于所述不同金融业务场景,确定与所述不同金融业务场景相匹配的动态噪声;基于所述动态噪声,对所述目标用户相匹配的无标签的金融信息样本特征进行动态去噪处理,以形成与对应的金融业务场景相匹配的无标签样本特征集合;
所述信息处理模块,用于调用经由时间域训练样本对抗训练的金融信息处理模型,并通过所述金融信息处理模型对所述无标签样本特征集合进行风险预测处理,得到所述目标用户的金融风险预测结果;
所述信息处理模块,用于输出所述目标用户的金融风险预测结果。
上述方案中,第二信息传输模块,用于获取目标用户集合的特征和金融场景的历史参数;
根据所述目标用户集合的特征和金融场景的历史参数,得到与所述金融信息处理模型相匹配的样本特征集合,其中所述样本特征集合中包括不同时间域的样本特征;
训练模块,用于确定不同的时间窗长度,并根据相应的时间窗长度对所述样本特征集合进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合,其中,所述训练样本集合包括至少一组训练样本;
所述训练模块,用于根据与所述金融信息处理模型相匹配的不同时间域的训练样本集合对所述金融信息处理模型进行训练,确定与所述金融信息处理模型相适配的模型参数,以实现通过所述金融信息处理模型对所述金融场景中的目标用户的风险进行预测。
上述方案中,所述训练模块,用于确定与所金融信息处理模型的使用环境相匹配的动态噪声阈值;
根据所述动态噪声阈值对所述样本特征集合进行去噪处理,以形成与所述动态噪声阈值相匹配的样本特征集合;或者,
确定与所金融信息处理模型相对应的固定噪声阈值,并根据所述固定噪声阈值对所述样本特征集合进行去噪处理,以形成与所述固定噪声阈值相匹配的样本特征集合。
上述方案中,所述训练模块,用于基于所述金融信息处理模型的使用环境,确定不同长度的时间窗;
所述训练模块,用于确定所述样本特征集合中的不同样本数据所携带的时间戳参数;
所述训练模块,用于根据与所述金融信息处理模型相匹配的随机梯度下降算法,以及不同长度的时间窗对样本特征集合中的不同样本数据所携带的时间戳参数进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合。
上述方案中,所述训练模块,用于根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中特征提取器网络的模型参数;
所述训练模块,用于根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中样本分类器网络的模型参数;
所述训练模块,用于根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中域分类器网络的模型参数。
上述方案中,所述训练模块,用于通过所述金融信息处理模型中特征提取器网络,对所述训练样本集合进行处理,以确定所述特征提取器网络的初始参数;
所述训练模块,用于响应于所述特征提取器网络的初始参数,通过所述特征提取器网络对所述训练样本集合进行处理,确定所述特征提取器网络的更新参数;
所述训练模块,用于根据所述特征提取器网络的更新参数,通过所述训练样本集合对所述特征提取器网络的参数进行迭代更新,以提取所述训练样本集合中每个样本的特征嵌入向量。
上述方案中,所述训练模块,用于将所述训练样本集合中不同训练样本,代入由所述特征提取器网络所对应的损失函数;
所述训练模块,用于确定所述损失函数满足相应的收敛条件时所述特征提取器网络对应所述更新参数。
上述方案中,所述训练模块,用于确定所述特征提取器网络对应的损失函数;
所述训练模块,用于根据所述特征提取器网络的更新参数,对所述特征提取器网络的参数进行迭代更新;直至所述特征提取器网络的损失函数达到相应的收敛条件,并且基于所述特征提取器网络中的参数,能够提取所述训练样本集合中每个样本的特征嵌入向量。
上述方案中,所述训练模块,用于通过所述金融信息处理模型中样本分类器网络,对所述训练样本集合进行处理,以确定所述样本分类器网络的初始参数;
所述训练模块,用于响应于所述样本分类器网络的初始参数,通过所述样本分类器网络对所述训练样本集合进行处理,确定所述样本分类器网络的更新参数;
所述训练模块,用于根据所述样本分类器网络的更新参数,通过所述训练样本集合对所述样本分类器网络的参数进行迭代更新,以实现基于相应的样本标签以及每个样本的特征嵌入向量,确定不同样本的风险预测结果。
上述方案中,所述训练模块,用于将所述训练样本集合中不同训练样本,代入由所述样本分类器网络所对应的损失函数;
所述训练模块,用于确定所述损失函数满足相应的收敛条件时所述样本分类器网络对应所述更新参数。
上述方案中,所述训练模块,用于确定所述样本分类器网络对应的损失函数;
所述训练模块,用于根据所述样本分类器网络的更新参数,对所述样本分类器网络的参数进行迭代更新;直至所述样本分类器网络的损失函数达到相应的收敛条件,并且基于相应的样本标签以及每个样本的特征嵌入向量,确定不同样本的风险预测结果。
上述方案中,所述训练模块,用于响应于所述域分类器网络的初始参数,通过所述域分类器网络对所述训练样本集合进行处理,确定所述域分类器网络的更新参数;
所述训练模块,用于根据所述域分类器网络的更新参数,通过所述训练样本集合对所述域分类器网络的参数进行迭代更新,以判断所述样本集合中不同样本所分别对应的时间域。
上述方案中,所述训练模块,用于将所述训练样本集合中不同训练样本,代入由所述域分类器网络所对应的损失函数;
所述训练模块,用于确定所述损失函数满足相应的收敛条件时所述域分类器网络对应所述更新参数。
上述方案中,所述训练模块,用于确定所述域分类器网络对应的损失函数;
所述训练模块,用于根据所述域分类器网络的更新参数,对所述域分类器网络的参数进行迭代更新;直至所述域分类器网络的损失函数达到相应的收敛条件,并且基于所述域分类器网络中的参数,能够判断所述样本集合中不同样本所分别对应的时间域。
上述方案中,所述信息处理模块,用于将目标用户标识、金融信息处理模型的模型参数、金融场景标识发送至区块链网络,以使所述区块链网络的节点将所述目标用户标识、金融信息处理模型的模型参数、金融场景标识填充至新区块,且当对所述新区块共识一致时,将所述新区块追加至区块链的尾部。
上述方案中,所述信息处理模块,用于接收所述区块链网络中的其他节点的数据同步请求;
所述信息处理模块,用于响应于所述数据同步请求,对所述其他节点的权限进行验证;
所述信息处理模块,用于当所述其他节点的权限通过验证时,控制当前节点与所述其他节点之间进行数据同步,以实现所述其他节点获取目标用户标识、金融信息处理模型的模型参数、金融场景标识。
上述方案中,所述信息处理模块,用于响应于查询请求,解析所述查询请求以获取对应的对象标识;
所述信息处理模块,用于根据所述对象标识,获取区块链网络中的目标区块内的权限信息;
所述信息处理模块,用于对所述权限信息与所述对象标识的匹配性进行校验;
所述信息处理模块,用于当所述权限信息与所述对象标识相匹配时,在所述区块链网络中获取相应的目标用户标识、金融信息处理模型的模型参数、金融场景标识;
所述信息处理模块,用于响应于所述查询指令,将所获取的相应的金融信息以及与所述基础对象相匹配的目标对象向相应的客户端进行推送,以实现所述客户端获取所述区块链网络中所保存的相应的金融信息以及与所述基础对象相匹配的目标对象。
本发明实施例还提供了一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现前述的基于时间域信息的金融风险预测方法,或者前述的基于时间域信息的金融风险预测方法。
本发明实施例具有以下有益效果:
本发明通过响应于金融风险预测请求,获取与目标用户相匹配的无标签的金融信息样本特征;确定与所述目标用户相匹配的无标签的金融信息样本特征所分别对应的不同金融业务场景;基于所述不同金融业务场景,确定与所述不同金融业务场景相匹配的动态噪声;基于所述动态噪声,对所述目标用户相匹配的无标签的金融信息样本特征进行动态去噪处理,以形成与对应的金融业务场景相匹配的无标签样本特征集合;基于所述无标签的金融信息样本特征,通过金融信息处理模型进行处理,形成所述目标用户的风险预测结果;输出所述目标用户的风险预测结果,由此能够实现通过金融信息处理模型对金融场景中的目标用户的风险进行预测,降低金融信息处理的复杂性,在兼顾了训练精确性的同时,使得金融信息处理模型的泛化能力以及数据处理能力更强,适应不同的金融数据处理环境,降低鲁棒性。
附图说明
图1是本发明实施例提供的基于时间域信息的金融风险预测方法的使用环境示意图;
图2为本发明实施例提供的电子设备的组成结构示意图;
图3为本申请所提供的基于时间域信息的金融风险预测方法一个可选的流程示意图;
图4为本发明实施例中一个可选的模型训练示意图;
图5为本申请所提供的基于时间域信息的金融风险预测方法一个可选的流程示意图;
图6是本发明实施例提供的基于时间域信息的金融风险预测装置100的架构示意图;
图7是本发明实施例提供的区块链网络200中区块链的结构示意图;
图8是本发明实施例提供的区块链网络200的功能架构示意图;
图9为本申请所提供的基于时间域信息的金融风险预测方法的前端显示示意图;
图10为本申请所提供的基于时间域信息的金融风险预测方法使用过程示意图;
图11为本申请所提供的基于时间域信息的金融风险预测方法的前端显示示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)响应于,用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
2)基于,用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
3)卷积神经网络(CNN Convolutional Neural Networks)是一类包含卷积计算且具有深度结构的前馈神经网络(Feed forward Neural Networks),是深度学***移不变分类(shift-invariantclassification)。
4)模型训练,对图像数据集进行多分类学习。该模型可采用Tensor Flow、torch等深度学习框架进行构建,使用CNN等神经网络层的多层结合组成多分类模型。模型的输入为图像经过openCV等工具读取形成的三通道或原通道矩阵,模型输出为多分类概率,通过softmax等算法最终输出网页类别。在训练时,模型通过交叉熵等目标函数向正确趋势逼近。
5)神经网络(Neural Network,NN):人工神经网络(Artificial Neural Network,ANN),简称神经网络或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经***,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。
6)交易(Transaction),等同于计算机术语“事务”,交易包括了需要提交到区块链网络执行的操作,并非单指商业语境中的交易,鉴于在区块链技术中约定俗成地使用了“交易”这一术语,本发明实施例遵循了这一习惯。
例如,部署(Deploy)交易用于向区块链网络中的节点安装指定的智能合约并准备好被调用;调用(Invoke)交易用于通过调用智能合约在区块链中追加交易的记录,并对区块链的状态数据库进行操作,包括更新操作(包括增加、删除和修改状态数据库中的键值对)和查询操作(即查询状态数据库中的键值对)。
7)区块链(Block chain),是由区块(Block)形成的加密的、链式的交易的存储结构。
例如,每个区块的头部既可以包括区块中所有交易的哈希值,同时也包含前一个区块中所有交易的哈希值,从而基于哈希值实现区块中交易的防篡改和防伪造;新产生的交易被填充到区块并经过区块链网络中节点的共识后,会被追加到区块链的尾部从而形成链式的增长。
8)区块链网络(Block chain Network),通过共识的方式将新区块纳入区块链的一系列的节点的集合。
9)账本(Ledger),是区块链(也称为账本数据)和与区块链同步的状态数据库的统称。
其中,区块链是以文件***中的文件的形式来记录交易;状态数据库是以不同类型的键(Key)值(Value)对的形式来记录区块链中的交易,用于支持对区块链中交易的快速查询。
10)智能合约(Smart Contracts),也称为链码(Chain code)或应用代码,部署在区块链网络的节点中的程序,节点执行接收的交易中所调用的智能合约,来对账本数据库的键值对数据进行更新或查询的操作。
11)共识(Consensus),是区块链网络中的一个过程,用于在涉及的多个节点之间对区块中的交易达成一致,达成一致的区块将被追加到区块链的尾部,实现共识的机制包括工作量证明(Po W,Proof of Work)、权益证明(PoS,Proof of Stake)、股份授权证明(DPo S,Delegated Proof-of-Stake)、消逝时间量证明(Po ET,Proof of Elapsed Time)等。
12)K-S test,基于累计分布函数,用以检验两个经验分布是否不同或一个经验分布与另一个理想分布是否不同。在金融风控场景下,KS值常用于模型区分正负样本分隔程度的评价指标。
13)OOT集合,即时间上与训练数据隔离的跨时间验证集,是从整个有标记的数据集中,以某一时间节点为标准划分出来的。该时间节点之前为训练测试集,该时间节点之后为OOT集合,通常会预留最近申请日期的样本作为OOT,以测量模型在时间上的稳定性。
图1为本发明实施例提供的基于时间域信息的金融风险预测方法的使用场景示意图,参见图1,终端(包括终端10-1和终端10-2)上设置有能够显示相应金融信息的软件的客户端,例如虚拟资源或者实体资源进行金融活动或者通过虚拟资源(比特币或者Q币)支付的客户端或插件,用户通过相应的客户端可以获得金融信息并进行展示,并在金融信息处理过程中触发相应的金融信息处理进程(例如微信财付通支付或者通过微信小程序进行金融借贷的进程);终端通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,使用无线链路实现数据传输。
作为一个示例,服务器200用于布设所述基于时间域信息的金融风险预测装置以实现本发明所提供的基于时间域信息的金融风险预测方法,以通过响应于金融风险预测请求,获取与目标用户相匹配的无标签的金融信息样本特征;调用经由时间域训练样本对抗训练的金融信息处理模型,并通过所述金融信息处理模型对所述无标签样本特征集合进行风险预测处理,得到所述目标用户的金融风险预测结果;输出所述目标用户的金融风险预测结果。
当然在通过金融信息处理模型对金融数据进行处理以生成相应的预测结果之前,还需要对金融信息处理模型进行训练,具体包括:
获取目标用户集合的特征和金融场景的历史参数;根据所述目标用户集合的特征和金融场景的历史参数,得到与所述金融信息处理模型相匹配的样本特征集合,其中所述样本特征集合中包括不同时间域的样本特征;基于不同的时间窗长度,对所述样本特征集合进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合,其中,所述训练样本集合包括至少一组训练样本;根据与所述金融信息处理模型相匹配的不同时间域的训练样本集合对所述金融信息处理模型进行训练,确定与所述金融信息处理模型相适配的模型参数,以实现通过所述金融信息处理模型对所述金融场景中的目标用户的风险进行预测。
当然,本发明所提供的基于时间域信息的金融风险预测装置可以应用于虚拟资源或者实体资源进行金融活动或者通过实体金融资源支付环境(包括但不限于各类型的实体金融资源变化环境)或者社交软件进行信息交互的使用环境,在各类型的实体金融资源进行金融活动或者通过虚拟资源支付中通常会对不同数据来源的金融信息进行处理,最终在用户界面(User Interface,UI)上呈现出与相应的与所述目标用户所选择的目标对象相对应的金融信息。用户在当前显示界面中获得的金融信息(例如用户风险判断)还可以供其他应用程序调用。
下面对本发明实施例的基于时间域信息的金融风险预测装置的结构做详细说明,基于时间域信息的金融风险预测装置可以各种形式来实施,如带有基于时间域信息的金融风险预测装置处理功能的专用终端,也可以为设置有基于时间域信息的金融风险预测装置处理功能的服务器,例如前序图1中的服务器200。图2为本发明实施例提供的电子设备的组成结构示意图,可以理解,图2仅仅示出了基于时间域信息的金融风险预测装置的示例性结构而非全部结构,根据需要可以实施图2示出的部分结构或全部结构。
本发明实施例提供的基于时间域信息的金融风险预测装置包括:至少一个处理器201、存储器202、用户接口203和至少一个网络接口204。基于时间域信息的金融风险预测装置中的各个组件通过总线***205耦合在一起。可以理解,总线***205用于实现这些组件之间的连接通信。总线***205除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线***205。
其中,用户接口203可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
可以理解,存储器202可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。本发明实施例中的存储器202能够存储数据以支持终端(如10-1)的操作。这些数据的示例包括:用于在终端(如10-1)上操作的任何计算机程序,如操作***和应用程序。其中,操作***包含各种***程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序可以包含各种应用程序。
在一些实施例中,本发明实施例提供的基于时间域信息的金融风险预测装置可以采用软硬件结合的方式实现,作为示例,本发明实施例提供的基于时间域信息的金融风险预测装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本发明实施例提供的基于时间域信息的金融风险预测方法。例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,ComplexProgrammable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable GateArray)或其他电子元件。
作为本发明实施例提供的基于时间域信息的金融风险预测装置采用软硬件结合实施的示例,本发明实施例所提供的基于时间域信息的金融风险预测装置可以直接体现为由处理器201执行的软件模块组合,软件模块可以位于存储介质中,存储介质位于存储器202,处理器201读取存储器202中软件模块包括的可执行指令,结合必要的硬件(例如,包括处理器201以及连接到总线205的其他组件)完成本发明实施例提供的基于时间域信息的金融风险预测方法。
作为示例,处理器201可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
作为本发明实施例提供的基于时间域信息的金融风险预测装置采用硬件实施的示例,本发明实施例所提供的装置可以直接采用硬件译码处理器形式的处理器201来执行完成,例如,被一个或多个应用专用集成电路(ASIC,Application Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件执行实现本发明实施例提供的基于时间域信息的金融风险预测方法。
本发明实施例中的存储器202用于存储各种类型的数据以支持基于时间域信息的金融风险预测装置的操作。这些数据的示例包括:用于在基于时间域信息的金融风险预测装置上操作的任何可执行指令,如可执行指令,实现本发明实施例的从基于时间域信息的金融风险预测方法的程序可以包含在可执行指令中。
在另一些实施例中,本发明实施例提供的基于时间域信息的金融风险预测装置可以采用软件方式实现,图2示出了存储在存储器202中的基于时间域信息的金融风险预测装置,其可以是程序和插件等形式的软件,并包括一系列的模块,作为存储器202中存储的程序的示例,可以包括基于时间域信息的金融风险预测装置,基于时间域信息的金融风险预测装置中包括以下的软件模块:第二信息传输模块2081和训练模块2082、第一信息传输模块2083以及信息处理模块2084。当基于时间域信息的金融风险预测装置中的软件模块被处理器201读取到RAM中并执行时,将实现本发明实施例提供的基于时间域信息的金融风险预测方法,其中,基于时间域信息的金融风险预测装置中各个软件模块的功能,包括:
第二信息传输模块2081,用于获取目标用户集合的特征和金融场景的历史参数;
根据所述目标用户集合的特征和金融场景的历史参数,得到与所述金融信息处理模型相匹配的样本特征集合,其中所述样本特征集合中包括不同时间域的样本特征;
训练模块2082,用于基于不同的时间窗长度,对所述样本特征集合进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合,其中,所述训练样本集合包括至少一组训练样本;
所述训练模块2082,用于根据与所述金融信息处理模型相匹配的不同时间域的训练样本集合对所述金融信息处理模型进行训练,确定与所述金融信息处理模型相适配的模型参数,以实现通过所述金融信息处理模型对所述金融场景中的目标用户的风险进行预测。
第一信息传输模块2083,用于响应于金融风险预测请求,获取与目标用户相匹配的无标签的金融信息样本特征;
信息处理模块2084,用于基于所述无标签的金融信息样本特征,通过金融信息处理模型进行处理,形成所述目标用户的风险预测结果;
所述信息处理模块2084,用于输出所述目标用户的风险预测结果。
在介绍本申请所提供的基于时间域信息的金融风险预测方法之前,优先对现有技术中的金融风控场景下的金融信息处理模型进行说明,其中,传统机器学习关注于如何从海量数据中学习一个稳定精准预测的数学模型。但是对模型随时间衰减问题,并没有行之有效解决的方法。大多数的传统机器学习依赖于在OOT验证集上被动的选取在时间维度上泛化性能强的模型来降低模型效果随时间衰减的风险。通过入模特征选取,超参数调节等方式训练模型,并选出在OOT验证集上与训练集效果相比衰减最小的模型。但是,在金融风控场景下,不同客户群体的数据分布差异大,且往往难以收集足够的标记数据,现有技术方案均不适用于该场景下的预测模型训练,具体来说,现有技术的缺陷主要集中在1)OOT验证集的模型筛选方法依赖于一个数据量大、时间跨度长、且有标签样本丰富的数据集。其中,OOT集合是指时间上与训练数据隔离的跨时间验证集,是从整个有标记的数据集中,以某一时间节点为标准划分出来的。该时间节点之前为训练测试集,该时间节点之后为OOT集合,通常会预留最近申请日期的样本作为OOT,以测量模型在时间上的稳定性。由于OOT验证集是从整个有标记的数据集中,以某一时间节点为基准划分出来的,所有OOT验证集的有标签数据都不会被用来做模型训练,所以在有标签数据集有限的情况下,OOT验证集过大则会导致模型训练数据不足,精准度下降。OOT验证集过小则会导致模型筛选效果不佳,无法有效筛选出随时间变化稳定的模型。但是在金融风控场景实际生产中,模型的使用面临着数据量小且正负样本非常不均衡的数据问题。过大的OOT验证集会使得模型学习不充分,不仅无法筛选出稳定精准的模型而且对模型预测的精准度甚至会产生负面影响。2)获取金融环境中有标签样本的获取成本非常高并且存在时间跨度长且样本量丰富的无标签样本,如果仅仅将成本高的有标签样本用于模型筛选,势必增加***构建和维护的成本且无法有效利用所有数据。3)OOT时间节点的选择也会影响模型的筛选。筛选的有效性依赖于OOT时间节点,节点的选择需要能将数据分布的变化在OOT集合中体现出来。但是该过程往往依赖于专家经验,无法有效的量化,筛选效果不可控。且OOT集合往往只有一个,只能再一个时间划分上选取模型,无法捕捉到数据分布在一个持续的时间上变化趋势。
为解决上述缺陷,参考图3,图3为本申请所提供的基于时间域信息的金融风险预测方法一个可选的流程示意图,可以理解地,图3所示的步骤可以由运行基于时间域信息的金融风险预测装置的各种电子设备执行,以完成对相应的金融信息处理模型的训练与部署,具体来说,这些电子设备可以是如带有金融数据处理功能的专用终端、带有金融信息处理模型训练功能的服务器或者服务器集群,实现针对不同的金融场景中所适配的金融信息处理模型进行训练及部署。下面针对图3示出的步骤进行说明。
步骤301:基于时间域信息的金融风险预测装置基于目标用户集合的特征和金融场景的历史参数,获取与所述金融信息处理模型相匹配的样本特征集合。
其中,所述样本特征集合中包括不同时间域的样本特征。在本发明的一些实施例中,由于所获取的包括不同时间域的样本特征可能含有噪声信息,因此需要进行除噪处理,可以通过以下方式实现:
确定与所金融信息处理模型的使用环境相匹配的动态噪声阈值;
根据所述动态噪声阈值对所述样本特征集合进行去噪处理,以形成与所述动态噪声阈值相匹配的样本特征集合。其中,由于金融信息处理模型的使用环境不同,与所述金融信息处理模型的使用环境相匹配的动态噪声阈值也不相同,例如,通过微信进程进行支付和转账的金融使用环境中,与所述金融信息处理模型的使用环境相匹配的动态噪声阈值需要小于用户通过微信进程购买理财产品和进行金融借贷的金融使用环境中的动态噪声阈值。
在本发明的一些实施例中,由于所获取的包括不同时间域的样本特征可能含有噪声信息,因此需要进行除噪处理,可以通过以下方式实现:
确定与所金融信息处理模型相对应的固定噪声阈值,并根据所述固定噪声阈值对所述样本特征集合进行去噪处理,以形成与所述固定噪声阈值相匹配的样本特征集合。其中,当金融信息处理模型固化于相应的硬件机构中,例如金融终端(POS机或柜员机),使用环境为金融借贷使用环境中对目标用户进行预测风险时,由于噪声较为单一,通过固定金融信息处理模型相对应的固定噪声阈值,能够有效提升金融信息处理模型的训练速度,减少用户的等待时间。
步骤302:基于时间域信息的金融风险预测装置确定不同的时间窗长度,并根据相应的时间窗长度,对所述样本特征集合进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合。
其中,所述训练样本集合包括至少一组训练样本。
在本发明的一些实施例中,基于不同的时间窗长度,对所述样本特征集合进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合,可以通过以下方式实现:
基于所述金融信息处理模型的使用环境,确定不同长度的时间窗;确定所述样本特征集合中的不同样本数据所携带的时间戳参数;根据与所述金融信息处理模型相匹配的随机梯度下降算法,以及不同长度的时间窗对样本特征集合中的不同样本数据所携带的时间戳参数进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合。其中,可选地,金融信息处理模型中的神经网络结构可以为卷积神经网络(CNNConvolutional Neural Network)、深度神经网络(DNN Deep Neural Network)或生成对抗网络(Generative Adversarial Networks,GAN)等,本发明实施例对金融信息处理模型中的神经网络结构的类型不作限定。金融信息处理模型中的神经网络结构可以为适用于不同的目标对象预测任务的神经网络,例如:目标用户风险预判任务、产品风险评估任务、目标用户状态分析任务等。金融信息处理模型中的神经网络结构也可以为适用于不同的应用场景的神经网络,例如:金融支付场景、金融产品购买场景、目标用户金融借贷等,本发明实施例对金融信息处理模型中的神经网络结构的适用范围不作限定。可选地,金融信息处理模型中的神经网络结构的网络结构可以根据计算机视觉任务设计,或者,金融信息处理模型中的神经网络结构的网络结构可以采用现有的网络结构的至少一部分,例如:深度残差网络或者,视觉几何组网络(VGGNet Visual Geometry Group Network)等,本发明实施例对金融信息处理模型中的神经网络结构的网络结构不作限定。其中,在训练样本的获取阶段,所采集的训练数据是带有数据采集时间戳且存在一定时间跨度的有标签数据,因此,基于存在一定时间跨度的有标记数据集作为训练样本集合,通过对不同时间段的样本进行对抗训练,可以完成对与时间域无关的金融信息处理模型中的特征提取器网络的训练,根据与金融信息处理模型相匹配的随机梯度下降算法,以及不同长度的时间窗对样本特征集合中的不同样本数据所携带的时间戳参数进行处理将,可以实现将不同时间域的有差异的特征向量分布映射至一个随时间稳定的特征分布空间,并通过相应的特征空间完成对金融信息处理模型的训练。
步骤303:基于时间域信息的金融风险预测装置根据与所述金融信息处理模型相匹配的不同时间域的训练样本集合对所述金融信息处理模型进行训练,确定与所述金融信息处理模型相适配的模型参数。
由此,可以实现通过所述金融信息处理模型对所述金融场景中的目标用户的风险进行预测。
在本发明的一些实施例中,根据所述训练样本集合对所述金融信息处理模型进行训练,确定与所述金融信息处理模型相适配的模型参数,可以通过以下方式实现:
根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中特征提取器网络的模型参数;根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中样本分类器网络的模型参数;根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中域分类器网络的模型参数。其中,本申请中的金融信息处理模型训练阶段包括:1)特征提取器网络训练阶段2)样本分类器网络和域分类器网络的训练阶段。假设利用预先设定好的时间窗将数据划分为了N个时间域数据集,
Figure 694868DEST_PATH_IMAGE001
每个时间域数据集上有不同的作为训练样本的有标记数据。当然,在本发明的另一些实施例中,训练样本的数据采集阶段还存在一些无标签数据也可以加入训练样本中,但仅用做域分类器网络的训练样本集合,不用于样本分类器网络的训练样本。
在本发明的一些实施例中,根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中特征提取器网络的模型参数,可以通过以下方式实现:
通过所述金融信息处理模型中特征提取器网络,对所述训练样本集合进行处理,以确定所述特征提取器网络的初始参数;响应于所述特征提取器网络的初始参数,通过所述特征提取器网络对所述训练样本集合进行处理,确定所述特征提取器网络的更新参数;根据所述特征提取器网络的更新参数,通过所述训练样本集合对所述特征提取器网络的参数进行迭代更新,以提取所述训练样本集合中每个样本的特征嵌入向量。其中金融信息处理模型包括由一个特征提取器网络(Feature Extractor)和一个样本分类器网络(Classifier)以及域分类器网络组成,其中,特征提取器网络(Feature extractor)负责提取后续不通分类网络所需要的特征嵌入向量,所有不同时间域的数据共享同一个域无关特征提取器。该特征提取器将各个时间域样本特征映射到同一个空间中。其结构为一个全连接网络,它的输入为每个样本的原始特征,输出为每个样本的特征嵌入向量,具体来说,特征提取网络的主要目的为基于训练样本集合的少量样本将其映射到不同的特征向量表示空间,在该空间中相似的任务距离越近。参数生成网络则以特征向量为输入自适应地生成后续样本分类器网络参数以及分类器网络的模型参数。
在本发明的一些实施例中,响应于所述特征提取器网络的初始参数,通过所述特征提取器网络对所述训练样本集合进行处理,确定所述特征提取器网络的更新参数,可以通过以下方式实现:将所述训练样本集合中不同训练样本,代入由所述特征提取器网络所对应的损失函数;确定所述损失函数满足相应的收敛条件时所述特征提取器网络对应所述更新参数。其中,
在本发明的一些实施例中,根据所述特征提取器网络的更新参数,通过所述训练样本集合对所述特征提取器网络的参数进行迭代更新,以提取所述训练样本集合中每个样本的特征嵌入向量,可以通过以下方式实现:
确定所述特征提取器网络对应的损失函数;根据所述特征提取器网络的更新参数,对所述特征提取器网络的参数进行迭代更新;直至所述特征提取器网络的损失函数达到相应的收敛条件,并且基于所述特征提取器网络中的参数,能够提取所述训练样本集合中每个样本的特征嵌入向量。其中,特征提取器网络所处理的样本集合包括不同金融业务场景中的不同用户所分别对应的个人信息特征、风控模式特征、信用风险类别特征、以及相匹配的训练任务标签。所提取的每个样本的特征嵌入向量可以用于金融信息处理模型中的分类器网络型形成相应的预测结果,以及域分类器网络判断不同样本所分别对应的时间域。
在本发明的一些实施例中,根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中样本分类器网络的模型参数,包括:
通过所述金融信息处理模型中样本分类器网络,对所述训练样本集合进行处理,以确定所述样本分类器网络的初始参数;响应于所述样本分类器网络的初始参数,通过所述样本分类器网络对所述训练样本集合进行处理,确定所述样本分类器网络的更新参数;根据所述样本分类器网络的更新参数,通过所述训练样本集合对所述样本分类器网络的参数进行迭代更新,以实现基于相应的样本标签以及每个样本的特征嵌入向量,确定不同样本的风险预测结果。其中,不同训练样本可以包括多个训练任务Ti的训练任务集T,其中多个训练任务Ti被提供有各自不同的类别样本分类器网络Pi,不同的类别样本分类器网络Pi对应于不同的金融业务场景,每个训练任务Ti包括多个数据样本,每个数据样本包括相应用户的个人信息特征、风控模式特征、该相应用户的信用风险类别、以及指示该数据样本所属的训练任务的任务标签。示例性地,用户的个人信息特征、风控模式特征可以包括个人基本信息(诸如用户的性别、年龄、职业、收入、常住地址、纳税信息以及征信信息等)、社交行为信息(诸如微信等社交软件的登录频次、最后登录时间、注册时间、活跃程度等参数)、金融行为信息(诸如消费支付信息、历史借贷信息、征信信息、银行等级信息等)以及所使用设备信息等。用户的信用风险类别可以简单地包括例如高风险用户和中等风险用户和低风险用户,或者以信用分数、信用等级等更详细地表示。任务标签可以是支付(诸如依照支付时间、支付对象类型或支付渠道信息、支付金额等定义任务标签)、借贷(诸如依照借贷类型、借贷金额、还款时限、还款利息等定义任务标签)、理财(诸如依照理财产品类型、资金监管方信息、风险水平信息、资金封闭时限等定义任务标签),使用环境及噪声信息(诸如金融信息处理模型的部署终端环境,金融业务环境、固定噪声、动态噪声)等不同金融业务场景中的任务标签。
在本发明的一些实施例中,响应于所述样本分类器网络的初始参数,通过所述样本分类器网络对所述训练样本集合进行处理,确定所述样本分类器网络的更新参数,可以通过以下方式实现:
将所述训练样本集合中不同训练样本,代入由所述样本分类器网络所对应的损失函数;确定所述损失函数满足相应的收敛条件时所述样本分类器网络对应所述更新参数。
在本发明的一些实施例中,根据所述样本分类器网络的更新参数,通过所述训练样本集合对所述样本分类器网络的参数进行迭代更新,以实现基于相应的样本标签以及每个样本的特征嵌入向量,确定不同样本的风险预测结果,可以通过以下方式实现:
确定所述样本分类器网络应的损失函数;根据所述样本分类器网络的更新参数,对所述样本分类器网络的参数进行迭代更新;直至所述样本分类器网络的损失函数达到相应的收敛条件,并且基于相应的样本标签以及每个样本的特征嵌入向量,确定不同样本的风险预测结果。其中,金融信息处理模型中的样本分类器网络可以通过对所有域中有标记样本进行识别分类预测,可选的,样本分类器网络的结构为一个全连接网络。通过的每个有标记样本的特征嵌入向量,输出样本的预测类别,以提示当前的用户是否有金融借贷的风险。
在本发明的一些实施例中,根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中域分类器网络的模型参数,可以通过以下方式实现:
响应于所述域分类器网络的初始参数,通过所述域分类器网络对所述训练样本集合进行处理,确定所述域分类器网络的更新参数;根据所述域分类器网络的更新参数,通过所述训练样本集合对所述域分类器网络的参数进行迭代更新,以判断所述样本集合中不同样本所分别对应的时间域。其中,域识别分类器网络可以对续联集合汇总的所有样本进行域判别预测,判断当前样本来自哪一个时间域。域识别分类器网络的结构为一个全连接网络,域识别分类器网络的输入为每个有标记样本的特征嵌入向量,输出为域判别的预测结果。通过约束w-distance距离拟合域的真实域关系,即两个类来自同一时间域则,进一步地,还可以监督地将来不同时间域的特征映射到同一个latent task-space上的嵌入向量。
在本发明的一些实施例中,响应于所述域分类器网络的初始参数,通过所述域分类器网络对所述训练样本集合进行处理,确定所述域分类器网络的更新参数,可以通过以下方式实现:
将所述训练样本集合中不同训练样本,代入由所述域分类器网络所对应的损失函数;确定所述损失函数满足相应的收敛条件时所述域分类器网络对应所述更新参数。
在本发明的一些实施例中,根据所述域分类器网络的更新参数,通过所述训练样本集合对所述域分类器网络的参数进行迭代更新,以提取所述训练样本集合中每个样本的特征嵌入向量,可以通过以下方式实现:
确定所述域分类器网络对应的损失函数;根据所述域分类器网络的更新参数,对所述域分类器网络的参数进行迭代更新;直至所述域分类器网络的损失函数达到相应的收敛条件,并且基于所述域分类器网络中的参数,能够判断所述样本集合中不同样本所分别对应的时间域。其中,为了克服前序实施例所说明的传统金融信息处理方式的缺陷,本申请中可以通过对抗对特征提取器网络和域分类器网络进行训练。其中,前向传播中特征提取器网络提取的信息传入域分类器网络,域分类器网络通过判断传入的信息来哪一个时间域,并计算域分类损失。域分类器网络的目标是尽可能区分出输入的特征来哪一个时间域。在反向传播过程中,域分类器网络和特征提取器网络中间的梯度反转层(gradientreversal layer)使得特征提取器网络的训练目标与域分类器网络相反,即特征提取器网络希望输出的特征让域分类器网络无法正确判断出信息来自于哪一个域。这种对抗关系最终使得域分类器网络不能将接收的信息正确区分,特征提取器网络成功将不同时间域样本混合在某个公共的特征空间中,以提高经过训练的金融信息处理模型的泛华性和鲁棒性,避免由于金融信息处理的长时间运行造成的预测能力下降。
在本发明的一些实施例中,还可以根据与所述金融信息处理模型相匹配的随机梯度下降算法,以及不同长度的时间窗对样本特征集合中的不同样本数据所携带的时间戳参数进行处理,确定与所述金融信息处理模型相匹配的不同时间域的测试样本集合;通过所述金融信息处理模型对所述测试样本集合中的不同测试样本进行处理,以实现通过所述测试样本集合对所述金融信息处理模型输出的风险预测结果进行测试。其中参考图4,图4为本发明实施例中一个可选的模型训练示意图,其中金融信息处理模型可以通过误差反向传播算法进行训练。由于目标用户的风险预测为需要使用历史数据作为训练集与验证集。训练集验证集构成如图4所示。其中根据不同的时间戳参数,较早的作为训练集(2个时间域),最近一段时间的用作验证集选择最优模型,最后基于现有数据对未来进行预测。
进一步地,经过训练的金融信息处理模型可以部署在不同服务器,服务器群组以及金融区块链网络中。
继续参考图5,图5为本申请所提供的基于时间域信息的金融风险预测方法一个可选的流程示意图,可以理解地,图5所示的步骤可以由运行基于时间域信息的金融风险预测装置的各种电子设备执行,例如可以是如带有金融数据处理功能的专用终端、带有金融信息处理功能的服务器或者服务器集群,实现利用所部署的不同的金融场景中所适配的金融信息处理模型进行金融信息处理。下面针对图5示出的步骤进行说明。
步骤501:基于时间域信息的金融风险预测装置接收客户端发送的金融风险判断请求。
步骤502:基于时间域信息的金融风险预测装置响应于金融风险预测请求,获取与目标用户相匹配的无标签的金融信息样本特征。
步骤503:基于时间域信息的金融风险预测装置确定与所述目标用户相匹配的无标签的金融信息样本特征所分别对应的不同金融业务场景。
步骤504:基于时间域信息的金融风险预测装置基于所述不同金融业务场景,确定与所述不同金融业务场景相匹配的动态噪声;基于所述动态噪声,对所述目标用户相匹配的无标签的金融信息样本特征进行动态去噪处理,以形成与对应的金融业务场景相匹配的无标签样本特征集合。
步骤505:基于时间域信息的金融风险预测装置基于所述无标签的金融信息样本特征,通过金融信息处理模型进行处理,形成所述目标用户的金融风险预测结果。
步骤506:基于时间域信息的金融风险预测装置输出所述目标用户的金融风险预测结果。
步骤507:基于不同目标用户的风险预测结果,确定执行相应的金融借贷金额。
在本发明的一些实施例中,确定与所述目标用户相匹配的无标签的金融信息样本特征所分别对应的不同金融业务场景;
基于所述不同金融业务场景,确定与所述不同金融业务场景相匹配的动态噪声;基于所述动态噪声,对所述目标用户相匹配的无标签的金融信息样本特征进行动态去噪处理,以形成与对应的金融业务场景相匹配的样本特征集合,其中,所述每一个样本包括相应目标用户的个人特征、所述目标用户的信用风险类别特征。其中,当金融APP的目标用户欲办理相关金融业务的用户使用客户端设备访问企业的客户服务器提供的服务时,客户服务器可以将该用户的个人特征信息提交至经训练的金融信息处理模型获得相应的预测结果进行风险预测,来得到该用户的信用风险类别。通过经过训练金融信息处理模型,可以协助金融平台或者出借方对是否为用户提供金融业务服务进行判断,或者可以协助金融平台中的不同出借方对不同信用风险类型的用户进行不同的管理。
同时考虑到实际应用中不但可以通过金融APP实现本申请的方案,同时还可以通过微信小程序实现本申请的方案,因此,通过金融区块链,用户在更换终端时,可以通过部署在区块链网络中金融信息处理模型,快速地对不同目对象的金融信息进行预测。
具体来说,可以将目标用户标识、金融信息处理模型的模型参数、金融场景标识发送至区块链网络,以使所述区块链网络的节点将所述目标用户标识、金融信息处理模型的模型参数、金融场景标识填充至新区块,且当对所述新区块共识一致时,将所述新区块追加至区块链的尾部。
其中,本发明实施例可结合云技术实现,云技术(Cloud technology)是指在广域网或局域网内将硬件、软件及网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术,也可理解为基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术及应用技术等的总称。技术网络***的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站,因此云技术需要以云计算作为支撑。
需要说明的是,云计算是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用***能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。作为云计算的基础能力提供商,会建立云计算资源池平台,简称云平台,一般称为基础设施即服务(IaaS,Infrastructure as a Service),在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(可为虚拟化机器,包含操作***)、存储设备和网络设备。
结合前序图1所示,本发明实施例所提供的目标对象确定方法可以通过相应的云端设备实现,例如:终端(包括终端10-1和终端10-2)通过网络300连接位于云端的服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。值得说明的是,服务器200可为实体设备,也可为虚拟化设备。
在本发明的一些实施例中所述方法还包括:
接收所述区块链网络中的其他节点的数据同步请求;
响应于所述数据同步请求,对所述其他节点的权限进行验证;
当所述其他节点的权限通过验证时,控制当前节点与所述其他节点之间进行数据同步,以实现所述其他节点获取目标用户标识、金融信息处理模型的模型参数、金融场景标识。
在本发明的一些实施例中,还可以响应于查询请求,解析所述查询请求以获取对应的对象标识;根据所述对象标识,获取区块链网络中的目标区块内的权限信息;对所述权限信息与所述对象标识的匹配性进行校验;当所述权限信息与所述对象标识相匹配时,在所述区块链网络中获取相应的目标用户标识、金融信息处理模型的模型参数、金融场景标识;响应于所述查询指令,将所获取的相应的金融信息以及与所述基础对象相匹配的目标对象向相应的客户端进行推送,以实现所述客户端获取所述区块链网络中所保存的相应的金融信息以及与所述基础对象相匹配的目标对象。
参见图6,图6是本发明实施例提供的基于时间域信息的金融风险预测装置100的架构示意图,包括区块链网络200(示例性示出了共识节点210-1、共识节点210-2、共识节点210-3)、认证中心300、业务主体400和业务主体500,下面分别进行说明。
区块链网络200的类型是灵活多样的,例如可以为公有链、私有链或联盟链中的任意一种。以公有链为例,任何业务主体的电子设备例如用户终端和服务器,都可以在不需要授权的情况下接入区块链网络200;以联盟链为例,业务主体在获得授权后其下辖的电子设备(例如终端/服务器)可以接入区块链网络200,此时,成为区块链网络200中的客户端节点。
在一些实施例中,客户端节点可以只作为区块链网络200的观察者,即提供支持业务主体发起交易(例如,用于上链存储数据或查询链上数据)功能,对于区块链网络200的共识节点210的功能,例如排序功能、共识服务和账本功能等,客户端节点可以缺省或者有选择性(例如,取决于业务主体的具体业务需求)地实施。从而,可以将业务主体的数据和业务处理逻辑最大程度迁移到区块链网络200中,通过区块链网络200实现数据和业务处理过程的可信和可追溯。
区块链网络200中的共识节点接收来自不同业务主体(例如图6中示出的业务主体400和业务主体500)的客户端节点(例如,图6中示出的归属于业务主体400的客户端节点410、以及归属于服务器500的客户端节点510)提交的交易,执行交易以更新账本或者查询账本,执行交易的各种中间结果或最终结果可以返回业务主体的客户端节点中显示。
例如,客户端节点410/510可以订阅区块链网络200中感兴趣的事件,例如区块链网络200中特定的组织/通道中发生的交易,由共识节点210推送相应的交易通知到客户端节点410/510,从而触发客户端节点410/510中相应的业务逻辑。
下面以多个业务主体接入区块链网络以实现金融信息的管理与处理为例,说明区块链网络的示例性应用。
参见图6,管理环节涉及的多个业务主体,如业务主体400可以是基于人工智能的基于时间域信息的金融风险预测装置,业务主体500可以是带有金融信息显示(操作)功能的显示***,从认证中心300进行登记注册获得各自的数字证书,数字证书中包括业务主体的公钥、以及认证中心300对业务主体的公钥和身份信息签署的数字签名,用来与业务主体针对交易的数字签名一起附加到交易中,并被发送到区块链网络,以供区块链网络从交易中取出数字证书和签名,验证消息的可靠性(即是否未经篡改)和发送消息的业务主体的身份信息, 区块链网络会根据身份进行验证,例如是否具有发起交易的权限。业务主体下辖的电子设备(例如终端或者服务器)运行的客户端都可以向区块链网络200请求接入而成为客户端节点。
业务主体400的客户端节点410用于响应于金融信息预测请求,获取与目标用户相匹配的金融信息;基于所述金融信息,确定所述金融信息预测请求中的目标对象的知识图谱;基于所述金融信息,确定与所述目标对象相匹配的趋势隐变量;根据所述目标对象的知识图谱和与所述目标对象相匹配的趋势隐变量,确定金融信息处理模型中的图神经网络;基于所述金融信息处理模型中的图神经网络,确定相应目标对象的变化趋势,以实现通过所述目标对象的变化趋势对所述金融信息预测请求进行回应。将目标用户标识、金融信息处理模型的模型参数、金融场景标识发送至区块链网络200。
其中,将目标用户标识、金融信息处理模型的模型参数、金融场景标识发送至区块链网络200,可以预先在客户端节点410设置业务逻辑,当形成相应的金融信息时,客户端节点410将目标用户标识、金融信息处理模型的模型参数、金融场景标识自动发送至区块链网络200,也可以由业务主体400的业务人员在客户端节点410中登录,手动打包目标用户标识、金融信息处理模型的模型参数、金融场景标识,并将其发送至区块链网络200。在发送时,客户端节点410根据目标用户标识、金融信息处理模型的模型参数、金融场景标识生成对应更新操作的交易,在交易中指定了实现更新操作需要调用的智能合约、以及向智能合约传递的参数,交易还携带了客户端节点410的数字证书、签署的数字签名(例如,使用客户端节点410的数字证书中的私钥,对交易的摘要进行加密得到),并将交易广播到区块链网络200中的共识节点210。
区块链网络200中的共识共识节点210中接收到交易时,对交易携带的数字证书和数字签名进行验证,验证成功后,根据交易中携带的业务主体400的身份,确认业务主体400是否是具有交易权限,数字签名和权限验证中的任何一个验证判断都将导致交易失败。验证成功后签署共识节点210自己的数字签名(例如,使用共识节点210-1的私钥对交易的摘要进行加密得到),并继续在区块链网络200中广播。
区块链网络200中的共识节点210接收到验证成功的交易后,将交易填充到新的区块中,并进行广播。区块链网络200中的共识节点210广播的新区块时,会对新区块进行共识过程,如果共识成功,则将新区块追加到自身所存储的区块链的尾部,并根据交易的结果更新状态数据库,执行新区块中的交易:对于提交更新目标用户标识、金融信息处理模型的模型参数、金融场景标识的交易,在状态数据库中添加包括目标用户标识、金融信息处理模型的模型参数、金融场景标识的键值对。
业务主体500的业务人员在客户端节点510中登录,输入目标用户标识、金融信息处理模型的模型参数、金融场景标识查询请求,客户端节点510根据目标用户标识、金融信息处理模型的模型参数、金融场景标识查询请求生成对应更新操作/查询操作的交易,在交易中指定了实现更新操作/查询操作需要调用的智能合约、以及向智能合约传递的参数,交易还携带了客户端节点510的数字证书、签署的数字签名(例如,使用客户端节点510的数字证书中的私钥,对交易的摘要进行加密得到),并将交易广播到区块链网络200中的共识节点210。
区块链网络200中的共识节点210中接收到交易,对交易进行验证、区块填充及共识一致后,将填充的新区块追加到自身所存储的区块链的尾部,并根据交易的结果更新状态数据库,执行新区块中的交易:对于提交的更新某一文目标用户标识、金融信息处理模型的模型参数、金融场景标识的交易,根据不同目标用户标识更新状态数据库中该目标用户对应的键值对;对于提交的查询某个目标用户的交易,从状态数据库中查询目标用户对应的键值对,并返回交易结果。
值得说明的是,在图6中示例性地示出了将目标用户标识、金融信息处理模型的模型参数、金融场景标识直接上链的过程,但在另一些实施例中,对于目标用户的数据量较大的情况,客户端节点410可将目标用户的哈希以及相应的金融信息的哈希成对上链,将原始的目标用户以及相应的目标金融信息存储于分布式文件***或数据库。客户端节点510从分布式文件***或数据库获取到目标用户以及相应的目标金融信息后,可结合区块链网络200中对应的哈希进行校验,从而减少上链操作的工作量。
作为区块链的示例,参见图7,图7是本发明实施例提供的区块链网络200中区块链的结构示意图,每个区块的头部既可以包括区块中所有交易的哈希值,同时也包含前一个区块中所有交易的哈希值,新产生的交易的记录被填充到区块并经过区块链网络中节点的共识后,会被追加到区块链的尾部从而形成链式的增长,区块之间基于哈希值的链式结构保证了区块中交易的防篡改和防伪造。其中,存储在区块链网络中的目标用户可以是不同金融场景中的金融信息,通过存储在区块链网络中可以实现不同的节点之间共享这些目标用户。
下面说明本发明实施例提供的区块链网络的示例性的功能架构,参见图8,图8是本发明实施例提供的区块链网络200的功能架构示意图,包括应用层201、共识层202、网络层203、数据层204和资源层205,下面分别进行说明。
资源层205封装了实现区块链网路200中的各个共识节点210的计算资源、存储资源和通信资源。
数据层204封装了实现账本的各种数据结构,包括以文件***中的文件实现的区块链,键值型的状态数据库和存在性证明(例如区块中交易的哈希树)。
网络层203 封装了点对点(P2P,Point to Point)网络协议、数据传播机制和数据验证机制、接入认证机制和业务主体身份管理的功能。
其中,P2P网络协议实现区块链网络200中共识节点210之间的通信,数据传播机制保证了交易在区块链网络200中的传播,数据验证机制用于基于加密学方法(例如数字证书、数字签名、公/私钥对)实现共识节点210之间传输数据的可靠性;接入认证机制用于根据实际的业务场景对加入区块链网络200的业务主体的身份进行认证,并在认证通过时赋予业务主体接入区块链网络200的权限;业务主体身份管理用于存储允许接入区块链网络200的业务主体的身份、以及权限(例如能够发起的交易的类型)。
共识层202封装了区块链网络200中的节点210对区块达成一致性的机制(即共识机制)、交易管理和账本管理的功能。共识机制包括POS、POW和DPOS等共识算法,支持共识算法的可插拔。
交易管理用于验证共识节点210接收到的交易中携带的数字签名,验证业务主体的身份信息,并根据身份信息判断确认其是否具有权限进行交易(从业务主体身份管理读取相关信息);对于获得接入区块链网络200的授权的业务主体而言,均拥有认证中心颁发的数字证书,业务主体利用自己的数字证书中的私钥对提交的交易进行签名,从而声明自己的合法身份。
账本管理用于维护区块链和状态数据库。对于取得共识的区块,追加到区块链的尾部;执行取得共识的区块中的交易,当交易包括更新操作时更新状态数据库中的键值对,当交易包括查询操作时查询状态数据库中的键值对并向业务主体的客户端节点返回查询结果。支持对状态数据库的多种维度的查询操作,包括:根据区块向量号(例如交易的哈希值)查询区块;根据区块哈希值查询区块;根据交易向量号查询区块;根据交易向量号查询交易;根据业务主体的账号(向量号)查询业务主体的账号数据;根据通道名称查询通道中的区块链。
应用层201 封装了区块链网络能够实现的各种业务,包括交易的溯源、存证和验证等。
下面目标对象为股票,金融场景为股票交易为例对本发明所提供的基于时间域信息的金融风险预测方法进行说明,其中,用户通过图1所示的终端(包括终端10-1和终端10-2)通过网络300从相应的服务器200中所获取的基金、股票等金融资源配置进程的类型既可以相同也可以不相同,例如零钱通、股票交易APP等平台,用户可以方便快捷的购买股票获取收益,因此,及时地获取股票的预测信息,确定股市指数的变化,有助于提升用户的使用体验。
下面以金融借贷使用场景中的对需要进行金融借贷的目标用户进行预测为例,对本申请所提供的基于时间域信息的金融风险预测方法以及基于时间域信息的金融风险预测方法进行说明,其中,参见图9,图9为本申请所提供的基于时间域信息的金融风险预测方法的前端显示示意图,其中终端(例如图1中的终端10-1和终端10-2)上设置有能够显示相应进行金融借贷的软件的客户端,例如虚拟资源或者实体资源进行金融活动或者通过虚拟资源借贷的客户端或插件,用户通过相应的客户端可以获向金融机构或平台进行借贷(例如微信财付通支付或者微信中的进行资金借贷购买物品的进程);终端通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,使用无线链路实现数据传输。服务器(例如图1中的服务器)银行、证券、互金、P2P等提供支付、借贷、理财等金融业务的企业的服务器。当用户需要办理相关金融业务的用户使用客户端设备访问企业的客户服务器提供的服务时,客户服务器可以将该用户的个人信息特征、风控模式特征、信息提交至经训练的金融信息处理模型获得相应的预测结果进行风险预测,来得到该用户的信用风险类别。通过经过训练金融信息处理模型,可以协助金融平台或者出借方对是否为用户提供金融业务服务进行判断,或者可以协助金融平台中的不同出借方对不同信用风险类型的用户进行不同的管理。
参考图10,图10为本申请所提供的基于时间域信息的金融风险预测方法使用过程示意图,其中本申请所提供的基于时间域信息的金融风险预测方法包括以下步骤:
步骤1001:服务器获取有标签金融样本特征;
步骤1002:服务器对所述金融样本进行划分,形成训练样本集合与测试样本集合。
其中,可以对金融样本特征设置样本划分的时间窗长度,并对所有金融样本特征进行基于数据采集时间进行划分,分成至少2个时间域的训练样本集合。
步骤1003:服务器通过有标签金融样本训练集合进行金融信息处理模型的训练,并且在测试集合评估模型训练效果。
其中,继续介绍基于本申请所提供的金融信息处理模型训练过程。模型训练的输入数据包括来自N个时间域的全部样本,如算法中的步骤1)-9)所示,预训练的每个迭代从N个时间域的全部样本
Figure 533511DEST_PATH_IMAGE002
中随机采样两个时间域的minibatch的样本,并采用SGD梯度下降法对特征提取器网络
Figure 33894DEST_PATH_IMAGE003
和样本分类器网络
Figure 627686DEST_PATH_IMAGE004
(样本分类器网络的一种可选形式)进行参数更新。其中,金融信息处理模型的训练装置获取包含N个时间域的数据集
Figure 705363DEST_PATH_IMAGE005
之后,所执行的金融信息处理模型的训练算法的执行步骤包括:
1)初始化DNN网络参数
Figure 223063DEST_PATH_IMAGE006
2)重复;
3)采样两个时间域
Figure 968166DEST_PATH_IMAGE007
Figure 529597DEST_PATH_IMAGE008
,分别从
Figure 170269DEST_PATH_IMAGE007
Figure 350715DEST_PATH_IMAGE008
中采样
Figure 809378DEST_PATH_IMAGE009
Figure 417077DEST_PATH_IMAGE010
4)计算样本特征提取器
Figure 610292DEST_PATH_IMAGE011
Figure 328849DEST_PATH_IMAGE012
上每个样本的特征嵌入向量,其中,嵌入向量表示:
Figure 110861DEST_PATH_IMAGE013
,其中
Figure 764827DEST_PATH_IMAGE014
5)计算金融信息处理模型分类网络
Figure 304393DEST_PATH_IMAGE015
在minibatchX上的预测结果
Figure 951275DEST_PATH_IMAGE016
,其中,
Figure 525475DEST_PATH_IMAGE017
6)计算minibatchX上的有标签样本的预测结果
Figure 350343DEST_PATH_IMAGE018
的loss:
其中,
Figure 439522DEST_PATH_IMAGE019
7)计算域识别网络
Figure 765461DEST_PATH_IMAGE020
在minibatchxX上的Loss,其中,
Figure 818604DEST_PATH_IMAGE021
Figure 939006DEST_PATH_IMAGE022
8)确定梯度更新特征提取器和样本分类器的网络参数:
其中,特征提取器更新:
Figure 577798DEST_PATH_IMAGE023
Figure 441849DEST_PATH_IMAGE024
样本分类器更新:
Figure 334850DEST_PATH_IMAGE025
;域分类器更新:
Figure 157312DEST_PATH_IMAGE026
9)进行更新,直到
Figure 17821DEST_PATH_IMAGE027
Figure 685563DEST_PATH_IMAGE028
Figure 433070DEST_PATH_IMAGE029
收敛。
下面对前序步骤所示的算法分别进行说明,1)特征提取器网络训练(算法步骤4)):特征提取器(Feature extractor)
Figure 160854DEST_PATH_IMAGE003
负责提取后续分类网络所需要的特征嵌入向量,所有不同时间域的数据共享同一个域无关特征提取器。该特征提取器将各个时间域样本特征映射到同一个空间中。
Figure 711922DEST_PATH_IMAGE030
的结构为一个全连接网络,它的输入为每个样本的原始特征,输出为每个样本的特征嵌入向量。
2)样本分类器网络(算法步骤5)与步骤6)):欺诈识别是一种样本分类算法,样本分类器网络
Figure 714513DEST_PATH_IMAGE031
负责对所有域中有标记样本进行欺诈识别分类预测,
Figure 785368DEST_PATH_IMAGE032
的结构为一个全连接网络。它的输入为每个有标记样本的特征嵌入向量,输出为样本的预测类别。
3)域识别分类网络(算法步骤7)):域识别分类网络
Figure 480791DEST_PATH_IMAGE033
负责对所有样本进行域判别预测,判断当前样本来自时间域Ti还是Tj。域识别分类网络的结构为一个全连接网络。它的输入为每个有标记样本的特征嵌入向量,输出为域判别的预测结果。通过约束w-distance距离拟合域的真实域关系
Figure 50313DEST_PATH_IMAGE034
,即两个类来自同一时间域则,来自不同时间域则
Figure 44606DEST_PATH_IMAGE036
,可有监督地将来不同时间域的特征映射到同一个latent task-space上的嵌入向量。
步骤1004:服务器部署经过训练的金融信息处理模型。
步骤1005:服务器响应处理请求,加载金融信息处理模型对金融场景中的对无标签金融样本进行处理,确定目标用户的风险预测结果。
其中,参见图11,图11为本申请所提供的基于时间域信息的金融风险预测方法的前端显示示意图,其中终端(例如图1中的终端10-1和终端10-2)上设置有能够显示相应进行金融借贷的软件的客户端,当目标用户通过终端所提供的金融借贷的软件的客户端发出金融借贷请求后,部署在不同服务器中的不同金融信息处理模型可以分别对目标用户的风险进行评估,以确定目标用户地风险等级,并确定是否向目标用户进行放贷。
由此,克服了传统机器学习通过时间上隔离的有标记OOT数据集筛选模型带来的无法充分利用全部有标记样本和无标记样本的缺陷。不仅能够充分利用所有有标记样本进行训练并且可充分利用实时无标签样本对模型进行迭代更新,减少了对样本进行标记的时间和标记成本,提升模型训练的效率。同时,克服了选择单一OOT时间节点对金融信息处理模型的影响,充分利用多个时间节点划分数据集,使得金融信息处理模型可以充分的学习数据在时间维度上的连续变化趋势。与此同时,降低单一OOT时间节点对模型的影响可以降低对专家经验等无法量化的建模标准的依赖,有效的规范化和量化金融风控的金融信息处理模型的训练标准以及训练流程。进一步地,利用了时间域对抗的方法使得金融信息处理模型能够精准的对高风险欺诈用户进行识别,并且效果能够在时间维度随数据分布变动效果稳定,有效增加金融信息处理模型的生命周期。在金融风控使用场景中,可以有效的保证业务的持续高效稳定的运行,避免模型频繁更新对业务带来的风险不稳定的问题。
有益技术效果:
本发明通过响应于金融风险预测请求,获取与目标用户相匹配的无标签的金融信息样本特征;确定与所述目标用户相匹配的无标签的金融信息样本特征所分别对应的不同金融业务场景;基于所述不同金融业务场景,确定与所述不同金融业务场景相匹配的动态噪声;基于所述动态噪声,对所述目标用户相匹配的无标签的金融信息样本特征进行动态去噪处理,以形成与对应的金融业务场景相匹配的无标签样本特征集合;基于所述无标签的金融信息样本特征,通过金融信息处理模型进行处理,形成所述目标用户的风险预测结果;输出所述目标用户的风险预测结果,由此能够实现通过金融信息处理模型对金融场景中的目标用户的风险进行预测,降低金融信息处理的复杂性,在兼顾了训练精确性的同时,使得金融信息处理模型的泛化能力以及数据处理能力更强,适应不同的金融数据处理环境,降低鲁棒性。
以上所述,仅为本发明的实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种基于时间域信息的金融风险预测方法,其特征在于,所述方法包括:
响应于金融风险预测请求,获取与目标用户相匹配的无标签的金融信息样本特征;
确定与所述目标用户相匹配的无标签的金融信息样本特征所分别对应的不同金融业务场景;
基于所述不同金融业务场景,确定与所述不同金融业务场景相匹配的动态噪声;
基于所述动态噪声,对所述目标用户相匹配的无标签的金融信息样本特征进行动态去噪处理,以形成与对应的金融业务场景相匹配的无标签样本特征集合;
调用经由时间域训练样本对抗训练的金融信息处理模型,并通过所述金融信息处理模型对所述无标签样本特征集合进行风险预测处理,得到所述目标用户的金融风险预测结果,其中,所述金融信息处理模型包括特征提取器网络、样本分类器网络以及域分类器网络;
输出所述目标用户的金融风险预测结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取目标用户集合的特征和金融场景的历史参数;
根据所述目标用户集合的特征和金融场景的历史参数,得到与所述金融信息处理模型相匹配的样本特征集合,其中所述样本特征集合中包括不同时间域的样本特征;
确定不同的时间窗长度,并根据相应的时间窗长度对所述样本特征集合进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合,其中,所述训练样本集合包括至少一组训练样本;
根据与所述金融信息处理模型相匹配的不同时间域的训练样本集合对所述金融信息处理模型进行训练,确定与所述金融信息处理模型相适配的模型参数,以实现通过所述金融信息处理模型对所述金融场景中的目标用户的风险进行预测。
3.根据权利要求2所述的方法,其特征在于,所述确定不同的时间窗长度,并根据相应的时间窗长度对所述样本特征集合进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合,包括:
确定所述金融信息处理模型的使用环境,并根据所述金融信息处理模型的使用环境确定不同长度的时间窗;
确定所述样本特征集合中的不同样本数据所携带的时间戳参数;
根据与所述金融信息处理模型相匹配的随机梯度下降算法,以及不同长度的时间窗对样本特征集合中的不同样本数据所携带的时间戳参数进行处理,确定与所述金融信息处理模型相匹配的不同时间域的训练样本集合。
4.根据权利要求2所述的方法,其特征在于,所述根据与所述金融信息处理模型相匹配的不同时间域的训练样本集合对所述金融信息处理模型进行训练,确定与所述金融信息处理模型相适配的模型参数,包括:
根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中特征提取器网络的模型参数;
根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中样本分类器网络的模型参数;
根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中域分类器网络的模型参数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中特征提取器网络的模型参数,包括:
通过所述金融信息处理模型中特征提取器网络,对所述训练样本集合进行处理,以确定所述特征提取器网络的初始参数;
响应于所述特征提取器网络的初始参数,通过所述特征提取器网络对所述训练样本集合进行处理,确定所述特征提取器网络的更新参数;
根据所述特征提取器网络的更新参数,通过所述训练样本集合对所述特征提取器网络的参数进行迭代更新,以提取所述训练样本集合中每个样本的特征嵌入向量。
6.根据权利要求5所述的方法,其特征在于,所述根据所述特征提取器网络的更新参数,通过所述训练样本集合对所述特征提取器网络的参数进行迭代更新,以提取所述训练样本集合中每个样本的特征嵌入向量,包括:
确定所述特征提取器网络对应的损失函数;
根据所述特征提取器网络的更新参数,对所述特征提取器网络的参数进行迭代更新;直至所述特征提取器网络的损失函数达到相应的收敛条件,并且基于所述特征提取器网络中的参数,能够提取所述训练样本集合中每个样本的特征嵌入向量。
7.根据权利要求5所述的方法,其特征在于,所述根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中样本分类器网络的模型参数,包括:
通过所述金融信息处理模型中样本分类器网络,对所述训练样本集合进行处理,以确定所述样本分类器网络的初始参数;
响应于所述样本分类器网络的初始参数,通过所述样本分类器网络对所述训练样本集合进行处理,确定所述样本分类器网络的更新参数;
根据所述样本分类器网络的更新参数,通过所述训练样本集合对所述样本分类器网络的参数进行迭代更新,以实现基于相应的样本标签以及每个样本的特征嵌入向量,确定不同样本的风险预测结果。
8.根据权利要求7所述的方法,其特征在于,所述响应于所述样本分类器网络的初始参数,通过所述样本分类器网络对所述训练样本集合进行处理,确定所述样本分类器网络的更新参数,包括:
将所述训练样本集合中不同训练样本,代入由所述样本分类器网络所对应的损失函数;
确定所述损失函数满足相应的收敛条件时所述样本分类器网络对应所述更新参数。
9.根据权利要求7所述的方法,其特征在于,所述根据所述样本分类器网络的更新参数,通过所述训练样本集合对所述样本分类器网络的参数进行迭代更新,以实现基于相应的样本标签以及每个样本的特征嵌入向量,确定不同样本的风险预测结果,包括:
确定所述样本分类器网络对应的损失函数;
根据所述样本分类器网络的更新参数,对所述样本分类器网络的参数进行迭代更新;直至所述样本分类器网络的损失函数达到相应的收敛条件,并且基于相应的样本标签以及每个样本的特征嵌入向量,确定不同样本的风险预测结果。
10.根据权利要求4所述的方法,其特征在于,所述根据所述训练样本集合对所述金融信息处理模型进行训练,确定所述金融信息处理模型中域分类器网络的模型参数,包括:
响应于所述域分类器网络的初始参数,通过所述域分类器网络对所述训练样本集合进行处理,确定所述域分类器网络的更新参数;
根据所述域分类器网络的更新参数,通过所述训练样本集合对所述域分类器网络的参数进行迭代更新,以判断所述样本集合中不同样本所分别对应的时间域。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
将所述训练样本集合中不同训练样本,代入由所述域分类器网络所对应的损失函数;
确定所述损失函数满足相应的收敛条件时所述域分类器网络对应所述更新参数;
确定所述域分类器网络对应的损失函数;
根据所述域分类器网络的更新参数,对所述域分类器网络的参数进行迭代更新;直至所述域分类器网络的损失函数达到相应的收敛条件,并且基于所述域分类器网络中的参数,能够判断所述样本集合中不同样本所分别对应的时间域。
12.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据与所述金融信息处理模型相匹配的随机梯度下降算法,以及不同长度的时间窗对样本特征集合中的不同样本数据所携带的时间戳参数进行处理,确定与所述金融信息处理模型相匹配的不同时间域的测试样本集合;
通过所述金融信息处理模型对所述测试样本集合中的不同测试样本进行处理,以实现通过所述测试样本集合对所述金融信息处理模型输出的风险预测结果进行测试。
13.一种基于时间域信息的金融风险预测装置,其特征在于,所述装置包括:
第一信息传输模块,用于响应于金融风险预测请求,获取与目标用户相匹配的无标签的金融信息样本特征;
信息处理模块,用于确定与所述目标用户相匹配的无标签的金融信息样本特征所分别对应的不同金融业务场景;
所述信息处理模块,用于基于所述不同金融业务场景,确定与所述不同金融业务场景相匹配的动态噪声;
所述信息处理模块,用于基于所述动态噪声,对所述目标用户相匹配的无标签的金融信息样本特征进行动态去噪处理,以形成与对应的金融业务场景相匹配的无标签样本特征集合;
所述信息处理模块,用于调用经由时间域训练样本对抗训练的金融信息处理模型,并通过所述金融信息处理模型对所述无标签样本特征集合进行风险预测处理,得到所述目标用户的金融风险预测结果,其中,所述金融信息处理模型包括特征提取器网络、样本分类器网络以及域分类器网络;
所述信息处理模块,用于输出所述目标用户的金融风险预测结果。
14.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现权利要求1至12任一项所述的基于时间域信息的金融风险预测方法。
15.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1至12任一项所述的基于时间域信息的金融风险预测方法。
CN202010804538.3A 2020-08-12 2020-08-12 基于时间域信息的金融风险预测方法、装置及存储介质 Active CN111681091B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010804538.3A CN111681091B (zh) 2020-08-12 2020-08-12 基于时间域信息的金融风险预测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010804538.3A CN111681091B (zh) 2020-08-12 2020-08-12 基于时间域信息的金融风险预测方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111681091A CN111681091A (zh) 2020-09-18
CN111681091B true CN111681091B (zh) 2020-11-27

Family

ID=72458286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010804538.3A Active CN111681091B (zh) 2020-08-12 2020-08-12 基于时间域信息的金融风险预测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111681091B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112116441B (zh) * 2020-10-13 2024-03-12 腾讯科技(深圳)有限公司 金融风险分类模型的训练方法、分类方法、装置及设备
CN112308236A (zh) * 2020-10-30 2021-02-02 北京百度网讯科技有限公司 用于处理用户请求的方法、装置、电子设备及存储介质
CN112487462B (zh) * 2020-12-11 2023-10-31 航天信息股份有限公司 基于区块链车购税***的数据授权方法及设备
CN112966754B (zh) * 2021-03-10 2023-11-07 中国平安人寿保险股份有限公司 样本筛选方法、样本筛选装置及终端设备
CN112801780A (zh) * 2021-03-19 2021-05-14 中国工商银行股份有限公司 基于联邦学习的境内外风险客户识别方法、装置及***
CN113222414B (zh) * 2021-05-14 2023-09-29 北京百度网讯科技有限公司 模型稳定性的评估方法、装置、电子设备和存储介质
CN113421165A (zh) * 2021-05-19 2021-09-21 绿融(广州)信息科技有限公司 一种绿色金融产品评估与管理的方法及***
CN113393321B (zh) * 2021-07-11 2022-12-13 深圳市鼎驰科技发展有限公司 一种基于区块链的金融风控方法
US11556935B1 (en) 2021-07-28 2023-01-17 International Business Machines Corporation Financial risk management based on transactions portrait

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110310199A (zh) * 2019-06-27 2019-10-08 上海上湖信息技术有限公司 借贷风险预测模型的构建方法、***及借贷风险预测方法
CN110705177A (zh) * 2019-09-29 2020-01-17 支付宝(杭州)信息技术有限公司 基于机器学习的终端风险评估模型的生成方法及其***
US10558913B1 (en) * 2018-10-24 2020-02-11 Equifax Inc. Machine-learning techniques for monotonic neural networks
CN111327946A (zh) * 2018-12-17 2020-06-23 中移(杭州)信息技术有限公司 视频质量评价和特征字典的训练方法、装置和介质
CN111401558A (zh) * 2020-06-05 2020-07-10 腾讯科技(深圳)有限公司 数据处理模型训练方法、数据处理方法、装置、电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10937540B2 (en) * 2017-12-21 2021-03-02 International Business Machines Coporation Medical image classification based on a generative adversarial network trained discriminator
CN110750645B (zh) * 2019-10-15 2023-11-07 广东外语外贸大学 基于对抗训练的跨领域虚假评论识别方法
CN111488995B (zh) * 2020-04-08 2021-12-24 北京字节跳动网络技术有限公司 用于评估联合训练模型的方法、装置和***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10558913B1 (en) * 2018-10-24 2020-02-11 Equifax Inc. Machine-learning techniques for monotonic neural networks
CN111327946A (zh) * 2018-12-17 2020-06-23 中移(杭州)信息技术有限公司 视频质量评价和特征字典的训练方法、装置和介质
CN110310199A (zh) * 2019-06-27 2019-10-08 上海上湖信息技术有限公司 借贷风险预测模型的构建方法、***及借贷风险预测方法
CN110705177A (zh) * 2019-09-29 2020-01-17 支付宝(杭州)信息技术有限公司 基于机器学习的终端风险评估模型的生成方法及其***
CN111401558A (zh) * 2020-06-05 2020-07-10 腾讯科技(深圳)有限公司 数据处理模型训练方法、数据处理方法、装置、电子设备

Also Published As

Publication number Publication date
CN111681091A (zh) 2020-09-18

Similar Documents

Publication Publication Date Title
CN111681091B (zh) 基于时间域信息的金融风险预测方法、装置及存储介质
CN111401558B (zh) 数据处理模型训练方法、数据处理方法、装置、电子设备
CN110263024B (zh) 数据处理方法、终端设备及计算机存储介质
CN111311409B (zh) 目标对象确定方法、装置、电子设备及存储介质
CN110569377A (zh) 一种媒体文件的处理方法和装置
CN112580952A (zh) 用户行为风险预测方法、装置、电子设备及存储介质
CN111367965B (zh) 目标对象确定方法、装置、电子设备及存储介质
US20220351284A1 (en) System and method for the rapid, flexible approval and disbursement of a loan
CN111860865B (zh) 模型构建和分析的方法、装置、电子设备和介质
CN113568973B (zh) 基于区块链和联邦学习的金融征信数据共享方法及装置
CN113011646A (zh) 一种数据处理方法、设备以及可读存储介质
US20220398573A1 (en) Machine learning classifier based on category modeling
CN112749827A (zh) 金融信息处理方法、装置、电子设备及存储介质
CN112989186B (zh) 资讯信息推荐模型训练方法、装置、电子设备及存储介质
CN113011895A (zh) 关联账户样本筛选方法、装置和设备及计算机存储介质
CN112861056A (zh) 一种企业网站建设信息展示发布***及方法
Zola et al. Attacking Bitcoin anonymity: generative adversarial networks for improving Bitcoin entity classification
CN112989338A (zh) 异常应用数据检测方法、装置、电子设备及存储介质
CN113298121A (zh) 基于多数据源建模的消息发送方法、装置和电子设备
CN116318974A (zh) 站点风险识别方法、装置、计算机可读介质及电子设备
CN113542527B (zh) 一种人脸图像传输方法、装置、电子设备及存储介质
CN113269179B (zh) 数据处理方法、装置、设备及存储介质
CN112347102B (zh) 多表拼接方法和多表拼接装置
CN111860597B (zh) 一种视频信息处理方法、装置、电子设备及存储介质
CN110362981B (zh) 基于可信设备指纹判断异常行为的方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40028478

Country of ref document: HK