CN111724083B

CN111724083B - 金融风险识别模型的训练方法、装置、计算机设备及介质

Info

Publication number: CN111724083B
Application number: CN202010704499.XA
Authority: CN
Inventors: 孙艺芙; 蓝利君; 赵雪尧; 李超
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-07-21
Filing date: 2020-07-21
Publication date: 2023-10-13
Anticipated expiration: 2040-07-21
Also published as: CN111724083A

Abstract

本申请公开了一种金融风险识别模型的训练方法、装置、计算机设备及介质，该训练方法获取目标域金融项目带有第一信用风险标签的第一用户数据输入元学习器进行训练，得到对应目标域金融项目的分类器进行风险识别。本申请通过使用元学习的方式训练对应目标域金融项目的分类器，能够有效迁移源域任务中的先验知识，使得模型训练所需的带标签样本数据量小，提高了识别模型的泛化性能，且模型的训练过程更加快速高效。另外，本申请在元学习器的训练过程中，对各个任务集的类别之间的源域相关性进行了学习，能够使得迁移学习时有效地从和本次目标域任务更接近的任务中迁移先验知识，可提高模型识别的准确性。本申请可广泛应用于机器学习技术领域。

Description

金融风险识别模型的训练方法、装置、计算机设备及介质

技术领域

本发明涉及机器学习技术领域，尤其是一种金融风险识别模型的训练方法、装置、计算机设备及介质。

背景技术

近年来，人工智能技术飞速发展，基于机器学习的分类应用在多个领域取得了较大进展。传统的机器学习主要是单任务学习，即在给定任务的数据集上训练预测模型，这种方式存在着所需训练数据多、模型泛化能力差的缺陷。对于一些特定领域的分类任务，样本数据往往存在有标记不足的问题，例如金融风控领域中，一些新的项目并没有大量包含信用记录的用户数据，这可能导致模型的训练无法有效进行或者训练出的模型准确性不高，无法达到预期的使用效果。

发明内容

本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。

为此，本申请实施例的一个目的在于提供一种金融风险识别模型的训练方法，该方法通过迁移学习能够基于少量带信用风险标签的用户数据训练出针对目标域金融项目的识别模型，可提高模型的泛化性能。

为了达到上述技术目的，本申请实施例所采取的技术方案包括：

第一方面，本申请实施例提供了金融风险识别模型的训练方法，所述识别模型包括元学习器和分类器，所述训练方法包括以下步骤：

获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据；所述第一用户数据带有第一信用风险标签，所述第二用户数据带有第二信用风险标签；

根据所述第二用户数据构造任务集；所述任务集中所述第二用户数据的类别包括具有信用风险类别和无信用风险类别；

确定各个所述任务集的类别之间的距离标签；

对所述第二用户数据进行预测，得到对应各个所述任务集的第一识别结果和所述类别之间的距离预测结果；

根据所述第二信用风险标签和所述第一识别结果确定第一损失值，根据所述距离标签和所述距离预测结果确定第二损失值；

根据所述第一损失值和所述第二损失值对所述元学习器的第一参数进行迭代训练，得到训练好的所述元学习器；

将所述第一用户数据和所述第一信用风险标签输入训练好的所述元学习器进行训练，得到对应所述目标域金融项目的训练好的所述分类器。

第二方面，本申请实施例提供了一种金融风险识别方法，包括以下步骤：

获取目标域金融项目的用户数据；

将所述用户数据输入到通过如第一方面所述的训练方法所得到的识别模型进行预测，得到所述识别模型输出的识别结果。

第三方面，本申请实施例提供了一种金融风险识别模型的训练装置，所述识别模型包括元学习器和分类器，所述训练装置包括：

第一获取模块，用于获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据；所述第一用户数据带有第一信用风险标签，所述第二用户数据带有第二信用风险标签；

任务集构造模块，用于根据所述第二用户数据构造任务集；所述任务集中所述第二用户数据的类别包括具有信用风险类别和无信用风险类别；

距离标签确定模块，用于确定各个所述任务集的类别之间的距离标签；

预测模块，用于对所述第二用户数据进行预测，得到对应各个所述任务集的第一识别结果和所述类别之间的距离预测结果；

损失值确定模块，用于根据所述第二信用风险标签和所述第一识别结果确定第一损失值，根据所述距离标签和所述距离预测结果确定第二损失值；

第一训练模块，用于根据所述第一损失值和所述第二损失值对所述元学习器的第一参数进行迭代训练，得到训练好的所述元学习器；

第二训练模块，用于将所述第一用户数据和所述第一信用风险标签输入训练好的所述元学习器进行训练，得到对应所述目标域金融项目的训练好的所述分类器。

第四方面，本申请实施例提供了一种金融风险识别装置，包括：

第二获取模块，用于获取目标域金融项目的用户数据；

识别模块，用于采用如第一方面所述的训练方法所得到的识别模型对所述用户数据进行预测，得到识别结果。

第五方面，本申请实施例提供了一种计算机设备，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行时，使得所述至少一个处理器实现第一方面所述的金融风险识别模型的训练方法或者第二方面所述的金融风险识别方法。

第六方面，本申请实施例还提供了一种计算机可读存储介质，其中存储有处理器可执行的程序，所述处理器可执行的程序在由处理器执行时用于实现第一方面所述的金融风险识别模型的训练方法或者第二方面所述的金融风险识别方法。

本发明的优点和有益效果将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到：

本申请金融风险识别模型的训练方法中，识别模型包括元学习器和分类器，该方法获取目标域金融项目带有第一信用风险标签的第一用户数据输入元学习器进行训练，得到对应目标域金融项目的分类器进行风险识别；本申请通过使用元学习的方式训练对应目标域金融项目的分类器，能够有效迁移源域任务中的先验知识为本次识别任务所用，使得模型训练所需的带标签样本数据量小，提高了识别模型的泛化性能，且模型的训练过程更加快速高效。另外，本申请在元学习器的训练过程中，对各个任务集的类别之间的源域相关性进行了学习，能够使得迁移学习时有效地从和本次任务更接近的任务中迁移先验知识，可提高模型识别的准确性。

附图说明

为了更清楚地说明本申请实施例或者现有技术中的技术方案，下面对本申请实施例或者现有技术中的相关技术方案附图作以下介绍，应当理解的是，下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例，对于本领域的技术人员来说，在无需付出创造性劳动的前提下，还可以根据这些附图获取到其他附图。

图1为机器学习模型基于不同的训练数据集进行分类任务的示意图；

图2为本申请实施例中提供的一种分类模型的训练方法的流程示意图；

图3为本申请实施例中提供的一种分类模型的训练方法的预训练阶段和元学习训练阶段示意图；

图4为本申请实施例中提供的一种分类模型的训练方法的预训练阶段的第一种流程示意图；

图5为本申请实施例中提供的一种分类模型的训练方法的预训练阶段的第二种流程示意图；

图6为本申请实施例中提供的一种分类模型的元学习器的结构示意图；

图7为本申请实施例中提供的一种分类模型的用于元学习器训练的任务集获取示意图；

图8为本申请实施例中提供的一种分类模型的训练方法的元学习训练阶段的流程图；

图9为本申请实施例中提供的一种分类方法的流程示意图；

图10为本申请实施例中提供的一种金融风险识别模型的训练方法的流程示意图；

图11为本申请实施例中提供的一种金融风险识别方法的流程示意图；

图12为本申请实施例中提供的一种金融风控信息的显示方法的流程示意图；

图13为本申请实施例中提供的一种应用金融风控信息的显示方法的终端设备显示界面示意图；

图14为本申请实施例中提供的一种金融风险识别模型的训练装置的结构示意图；

图15为本申请实施例中提供的一种金融风险识别装置的结构示意图；

图16为本申请实施例中提供的一种计算机设备的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。对于以下实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释。

元学习(Meta-Learning)：也叫“learning to learn”，即学习如何学习，在机器学习领域具体来说是学习不同的机器学习任务的训练过程，其目的是学习如何更快、更好地训练一个模型。

泛化能力(Generalization ability)：指一个机器学习算法对于没有见过的输入样本的识别能力。

任务(Task)：元学习的训练集由多个任务组成，每个任务都是一个独立的包含支持集(support set)和查询集(query set)的机器学习任务。

源域：迁移学习过程中被迁移知识所在的知识域，存在有大量的通用知识供迁移学习。

目标域：迁移学习过程中被迁移知识所要迁移到的知识域，也即本申请中机器学习应用的金融风险识别任务所在的领域。

本申请实施例中所提供的金融风险识别模型的训练方法、金融风险识别方法均可以应用于人工智能技术之中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。其中，人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术；人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例中提供的金融风险识别模型的训练方法、金融风险识别方法可以应用在结合人工智能的金融领域对应场景中，例如金融借贷产品、分期还款权限等。在这些应用场景中，人工智能***可以利用该金融风险识别方法得到的风险识别结果作进一步的应用，也就是说，通过本申请实施例方法所得到的风险识别结果可以是这些人工智能应用的中间结果。

本申请实施例中，主要涉及的人工智能技术是机器学习。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，算法类型很多。其中，机器学习根据学习方式可以分为：监督式学习、非监督式学习、半监督式学习和强化学习。根据算法的功能可以分为：回归算法、分类算法、聚类算法、降维算法和集成算法等。

本申请中的金融风险识别任务，在功能上属于机器学习中的分类算法，为典型的二分类问题，金融风险识别模型属于分类模型的一种。一般的机器学习问题，是基于海量的数据集从头开始训练一个用于预测的模型，模型学习的效果很大程度上依赖于带有标签的样本数据的数量。参照图1，当训练分类模型时使用的带标签的数据集充足与训练分类模型时采用少量带标签的数据集，两者训练得到的分类模型对同一个目标任务给出的识别结果可能会大相径庭，少量带标签的数据集所训练得到的分类模型，在精度上很难达到预期的效果。而在实际的应用中，带标签的样本数据往往是比较稀缺的，可能对样本数据做标签的代价过于昂贵或者根本难以实现。具体地，在金融风控场景下，例如互联网金融公司的某个新项目想要对潜在的用户进行信用评级，识别用户是否存在信用风险，这种情况下想要获得大量的带标签的样本数据，可能需要很长时间的跟踪和记录，延长了项目本身的测评、投入的周期，显然是难以满足当下需求的。

上述这种解决在少量带标签的样本数据情况下，进行有效分类模型训练的问题被称为小样本学习(Few-shot learning，也叫少样本学习)。鉴于实际存在的大数据与少标签之间的矛盾，相关人员注意到人类面临一个新问题时，可以运用积累的经验和相关知识快速学习，例如一个儿童仅仅见过几次某种动物的照片，也能在见到实物时做到快速识别，从而有效解决新问题的特点，对机器学习的算法和学习方式进行了改进，通过模拟人类强大的知识迁移能力来提高模型的泛化能力，得到了多任务学习、元学习等一些迁移学习的方式。具体地，多任务学习通过共享底层特征表示，把多个相关的任务放在一起学习。目标域金融项目(Target task)利用源域任务(Source task)的训练信号所拥有的领域信息(domain-specific information)来提升自己的泛化性能及准确性，并通过共享底层的特征表示(shared representation)来互相帮助学习，从而同时提升多个相关任务的模型表现。元学习中，则主要是模型无关的元学习(MAML)。作为元学习的一个子领域，其核心思想是通过从大量训练任务中学习神经网络的初始参数，即元参数，使得被元参数初始化后的新机器学习任务在小样本条件下也能快速收敛到一个较优的解。模型无关的元学习的训练过程主要包括两部分：基学习器(Base-learner)和元学习器(Meta-learner)。基学习器是根据目标任务学习的预测模型，由元学习器赋予其初始化参数再经过少量的梯度迭代进行训练。元学习器通过最小化元学习器在大量的目标任务(即基学习器)上的元损失，寻求基学习器的最优初始参数。由于模型无关的元学习的元学习器是基于大量的元学习任务训练得到的，所以其能够在新的任务上通过少量的梯度迭代产生高泛化性的新模型，即训练出一个易于微调的模型。

但是，以上的迁移学习方式在应用上仍存在一些弊端，例如多任务学习虽然实现了多源域向目标域的知识迁移，但是多个源域对于目标域的迁移贡献度相同，这种无差别地从多个源域迁移知识到目标域可能导致与目标域相关性较低或者完全不相关的源域带来的知识迁移，即负迁移，相对地抑制了相关源域到目标域的正迁移贡献，整体上降低了迁移学习的效果。类似地，模型无关的元学习在学习过程中也引入了多个源域信息，但它的训练方式使得模型更倾向于学习所有源域和目标域的共有信息(Meta Knowledge)，导致对目标域的特有信息的学习能力较弱。虽然可基于模型无关的元学习所训练的网络初始参数及目标域的标签样本有针对性地对目标域模型进行网络微调，但在目标域上，模型无关的元学习通过微调训练将元模型迁移至目标域，对元模型中的先验知识未加以选择，在一定程度上抑制了模型从更相关的源域上面迁移知识的能力，而且基于少量样本的微调极可能造成目标域模型在小样本上的过度拟合。综合来说，学习类别内各类样本数据之间的相似性和差异性以及各个类别间的相似性和差异性，对分类模型的训练至关重要，而现有的迁移学习方式，均无法解决上述源域的负迁移问题。

有鉴于此，本申请提供的一种金融风险识别模型的训练方法，通过元学习的思想训练金融风险识别模型进行迁移学习，针对每个目标域金融项目，识别模型的元学习器都会生成对应的分类器供识别使用；在元学习器中，通过任务类别之间的样本数据分布特性确定类别之间的距离，以学习类别所对应的源域相关性，并采用基于注意力机制的多源域知识聚合的迁移方法，有选择性地迁移对识别任务有正增益的先验知识，从而有效改善训练得到的识别模型的泛化性能，能够提高其应用于风险识别时的准确性。

下面结合附图，对本申请的具体实施方式进行说明，首先描述本申请实施例中的训练方法。需要说明的是：该训练方法可以应用于任何需要进行迁移学习的分类模型中，为方便起见，本申请实施例中从分类模型的角度详述该训练方法，金融风险识别模型属于分类模型的一种，可以理解的是，下述实施例的内容均适用于金融风险识别模型。

本申请实施例提供了一种分类模型的训练方法，可应用于终端中，也可应用于服务器中，还可以是运行于终端或服务器中的软件。在一些实施例中，终端可以是智能手机、平板电脑、笔记本电脑或者台式计算机等；服务器可以配置成独立的物理服务器，也可以配置成多个物理服务器构成的服务器集群或者分布式***，还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN以及大数据和人工智能平台等基础云计算服务的云服务器；软件可以是训练分类模型的应用程序等，但并不局限于以上形式。图2是本申请实施例提供的一种分类模型的训练方法的一个可选的流程图，图2中的方法包括步骤210至步骤220。

步骤210、获取目标域的第一数据；所述第一数据带有第一分类标签；

步骤220、将第一数据和第一分类标签输入分类模型进行训练，得到对应目标域任务的分类器。

本申请实施例中，针对目标域的待分类对象，可以获取并将小批量带有第一分类标签的第一数据输入到分类模型中进行训练，分类模型会生成对应目标域任务的一个分类器，该分类器可用于进行目标域的分类任务。本申请实施例中，第一数据指的是实际分类应用前，输入到分类模型进行目标域任务训练的数据，第一数据的数据结构可以包括数值、向量或者矩阵等，数据形式可以包括数值、文字、图形、图像、声音等；第一分类标签是指第一数据所对应的分类任务的真实类别标记，例如图像分类任务中某个动物的类别、邮件识别任务中某个邮件是否属于垃圾邮件等等标记。类似地，标签本身的数据结构、形式也可根据需要灵活设定。可以理解的是，本申请实施例中，后述的各类数据、标签都适用于以上结构和形式的解释。

本申请实施例中的分类模型包括特征提取器、元学习器和分类器，该分类器是元学习器基于迁移学习的方式，从其他的源域任务中迁移相关的分类任务经验生成对应的目标域分类任务的分类器。此处，源域指的是已积累有大量的经验知识，可供其他分类任务学习的知识域；目标域指的是可能只含有少量经验知识，需要从源域进行迁移学习的知识域。本申请实施例中，源域的相关数据记为第二数据，其带有第二分类标签。举例而言，假设现有的图像数据有猫和老虎，其中猫的图像数据中带有大量猫的种类标签，分类模型可以基于这些带标签的猫的图像数据，在监督学习中有效掌握猫的分类任务，而当前面临的任务是对老虎的种类进行分类，且现有的老虎的图像数据中只有少量标记有老虎的种类标签，难以进行有效的监督学习或者训练出的分类模型预测精度很低。迁移学习就是通过迁移分类模型在训练猫类的分类任务时所掌握的部分知识，用于虎类的分类任务的模型训练。在这种情况下，猫的图像数据就相当于源域的第二数据，老虎的图像数据就相当于目标域的第一数据。迁移学习就是利用不同问题之间的关联性，将一个或者多个源域的知识迁移到目标域，共享不同任务之间学习到的信息，以提高分类模型的泛化性及准确性。其本质是将传统机器学习的单任务学习转换为多任务学习的方式，通过寻找新问题和已有问题的相似性，并利用相似性将已有问题所积累的经验知识迁移到新问题中。当然，应当理解的是，本申请实施例中，只是提供一种能够通过少量带第一分类标签的第一数据去训练分类模型的方法，并不限定本申请实施例中的训练方法只能应用于含有少量经验知识的目标域，即本申请中目标域的对象，同样也可以是带有大量第一分类标签的第一数据。

参照图3，本申请实施例中，分类模型本身的特征提取器和元学习器基于两个过程训练得到：预训练阶段训练得到特征提取器，元学习训练阶段训练得到元学习器，其中元学习器包括了类编码器、域聚合器和域关系学习器。下面详细说明特征提取器和元学习器的两个训练过程。

参照图4，本申请实施例中的特征提取器可以通过图4所示的预训练阶段的步骤得到，图4中的方法包括步骤410至步骤450：

步骤410、获取批量源域的带有第二分类标签的第二数据；

步骤420、将第二数据输入至预分类模型，得到第二分类结果；预分类模型包括特征提取器和基分类器；

步骤430、根据第二分类标签和第二分类结果确定第三损失值；

步骤440、根据第三损失值对预分类模型的第二参数进行迭代训练，得到训练好的预分类模型；

步骤450、将训练好的预分类模型的特征提取器配置到分类模型。

本申请实施例中，在预训练阶段，将第二数据输入到预分类模型中训练一个通用的特征提取器，以供目标域任务进行迁移学习时使用。具体地，第二数据所对应的源域的数量可以大于一个，以尽可能提高特征提取器提取数据特征向量时的精度。本申请实施例中，在预训练阶段使用第二数据的目的是基于监督学习训练出一个通用的特征提取器和广泛适用于各类分类任务的基分类器。下面对预训练过程的详细内容进行展开说明。

具体地，参照图3，第二数据301按照源域的不同可以分为若干个源域数据集，例如第一源域数据集3011、第二源域数据集3012等。假设第二数据301涵盖N个源域的数据集，分别记为D_S1,D_S2,D_S3,...,D_SN，其中第i个源域数据集D_Si(0<i≤N)中的数据包括L_Si个类别，故第i个源域数据集D_Si中的数据共含有L_Si个分类标签。将每个源域数据集的分类标签组成一个标签集，例如第i个源域数据集D_Si的标签集为Y_Si，为方便训练起见，可以设置为任意两个源域的标签集是互斥的，即(Y_Sj表示第j个源域数据集D_Sj的标签集，0<j≤N)。

图5示出了本申请实施例中预训练阶段的具体过程，图5中的步骤主要包括步骤500至步骤570：

步骤500、训练开始；

步骤510、获取N个源域数据集；即前述的第二数据，第二数据带有第二分类标签；

步骤520、初始化预分类模型的参数；预分类模型的第二参数主要包括特征提取器的参数和基分类器的权重矩阵；

步骤530、随机采样训练样本集；此处，每次循环过程中，随机采样的训练样本集的个数是固定的，例如源域数据集中的总样本数据个数为1000，可以选择每次随机挑选100个组成训练样本集；

步骤540、确定训练样本集的损失值；对于机器学***均值，能够更好地衡量出分类模型的预测效果。常用的损失函数种类有很多，例如0-1损失函数、平方损失函数、绝对损失函数、对数损失函数等均可以作为机器学习模型的损失函数，在此不再一一阐述。本申请实施例中，选用的损失函数为交叉熵损失函数。一般来说，基于上述的代价函数，再加上衡量模型复杂度的正则项即为训练的目标函数，基于该目标函数便能求出整个训练样本集的损失值。本申请实施例中，预分类模型的预测结果即为第二分类结果，因此通过第二分类标签和第二分类结果便可以确定第二数据的第三损失值。

步骤550、梯度更新预训练模型的参数；在机器学习模型训练时，可以通过梯度下降法(Gradient Descent，GD)来更新参数，梯度下降法是为目标函数求取全局最小值的一种常用迭代算法，它的种类有很多，例如批量梯度下降法(Batch Gradient Descent，BGD)、随机梯度下降法(Stochastic Gradient Descent，SGD)、小批量梯度下降法(Mini-batchGradient Descent，MBGD)等等。本申请实施例中，选用的是随机梯度下降法，基于前述的第三损失值对预训练模型的第二参数进行更新，随机梯度下降法的学习速率比较快，效果也十分良好。

步骤560、判断预训练模型的参数是否收敛，若收敛则执行步骤570，若不收敛则返回步骤530重新执行；此处，判断第二参数是否收敛的方式，可以是判断随机梯度下降法迭代的总次数是否达到预设的次数；也可以是判断相邻两次迭代后的第二参数的变化量是否小于预设阈值；还可以是采用另外的验证集来判断何时模型的预测正确率最高作为第二参数收敛的条件。

步骤570、训练结束。

如步骤450所述，训练完成的预训练模型，其特征提取器可以直接配置到本申请实施例中的分类模型中。训练完成的基分类器则用于元学习器生成分类器时贡献权重矩阵给不同的分类任务进行迁移学习。

下面参照附图对本申请实施例中的元学习器进行详细说明。

参照图6，本申请实施例中，分类模型的元学习器主要包括类编码器、域聚合器和域关系学习器。

其中，类编码器主要负责提取每个任务中类别的类内共有特征和类间差异特征，具体地，在特征提取器提取到输入数据的数据特征向量后输入到类编码器，类编码器本身的超参数中含有任务类别的个数信息，其会将该任务所有数据的特征向量映射到一个潜在任务空间(latent task-space)，并根据各个样本数据在潜在任务空间的分布进行嵌入学习，提取出对应分类任务中的类别特征的类特征嵌入向量和对应分类任务本身任务特征的任务特征嵌入向量。换句话说，类特征嵌入向量是反映每个类别的特征的向量，例如一个分类任务中要求对猫和狗的图像进行分类，那么对应这个分类任务的类别就会有两个类特征嵌入向量，其中一个代表猫类的特征，另一个代表狗类的特征。任务特征嵌入向量则是反应每个分类任务的特征的向量，例如有两个分类任务，其中一个是对布偶猫和蓝色英短猫进行分类，另一个是对柯基和萨摩耶进行分类，那么对应的任务特征嵌入向量就会有两个，每个任务特征嵌入向量都反映各自分类任务的特征：猫的分类任务的任务特征嵌入向量反映出布偶猫和蓝色英短猫在哪些特征上不一样，狗的分类任务的任务特征嵌入向量反映出柯基和萨摩耶在哪些特征上不一样。上述的这些信息以高维的向量形式反映在类特征嵌入向量或者任务特征嵌入向量中，而不是像素级别的。从构成上来说，类编码器主要包括两个部分，第一部分为一个全连接网络，对每一个类别的所共有的特征进行了编码，输出类特征嵌入向量；第二部分为一个卷积网络，用于对各个任务内的所有类特征嵌入向量进行嵌入学习，输出任务特征嵌入向量。

域聚合器内部主要包括两部分：自适应聚合器和分类器生成器。其中自适应聚合器的主要作用是利用注意力机制，自适应地从基分类器中有针对性地选择对分类任务产生正向增益的信息，并结合分类任务本身的信息生成对应的分类器。具体地，本申请实施例中，注意力机制可以描述为一个查询(query)到一系列键-值(key-value)对的映射，其过程主要分为三步：第一步，将查询(query)和每个键(key)进行相似度计算得到注意力权重，常用的相似度算法有点积、拼接和感知机等；第二步，使用softmax函数对这些注意力权重进行归一化；第三步，将注意力权重和相应的值(value)进行加权求和得到最终的结果。具体可选用的注意力机制有加性注意力机制、多头注意力机制、全局注意力机制、局部注意力机制等多种。在本申请实施例中，查询(query)相当于是权重矩阵，键-值(key-value)对则为类特征嵌入向量和分类器的第一权重参数。通过注意力机制，利用基分类器的权重矩阵和类编码器所输出的类特征嵌入向量之间的相似度的大小，确定权重矩阵中关于迁移第一权重参数的注意力得分，然后根据注意力得分归一化后得到的注意力权重，聚合一部分基分类器的权重，即可迁移得到分类器的第一权重参数。可选地，本申请实施例中，还可以进一步将前述的任务特征嵌入向量对角化，得到任务特征矩阵，然后乘以该第一权重参数对其进行重调，以尽可能减少源域知识负迁移的影响。以上这部分是迁移学习所学习到的知识，基分类器的权重矩阵和类特征嵌入向量之间的相似度，可以通过余弦相似度算法确定，其公式表示为：其中s(q,k)代表基分类器的权重矩阵和类特征嵌入向量之间的余弦相似度，q代表基分类器的权重矩阵，k代表类特征嵌入向量，首先计算权重矩阵的转置和类特征嵌入向量的点积、权重矩阵的第一二范数和类特征嵌入向量的第二二范数的乘积，然后将该点积和乘积作商得到权重矩阵和类特征嵌入向量之间的余弦相似度。余弦相似度的数值越大，相似度越高。本申请实施例中，通过注意力机制聚合基分类器的部分权重参数，可以针对性地学习对分类任务有正增益的部分知识，同时抑制不相关源域对分类任务的负迁移影响，可有效提高最终生成的分类器的分类精确度。分类器生成器的主要作用是基于任务中小批量样本的自有特征，生成针对该任务特征的一部分权重参数，具体地，分类器生成器的输入为各个任务的类特征嵌入向量，输出为第二权重参数。第一权重参数和第二权重参数经过加权融合后，即可得到对应的分类器的权重参数。

域关系学习器的作用是体现不同分类任务中类别的相关性，采用域关系学习器使得训练类特征嵌入向量时，除了学习到任务本身特有的信息，也进一步学习不同任务的类特征嵌入向量的相关性，使得来自相近任务的类特征嵌入向量在前述的潜在任务空间(latent task-space)上的距离更近。具体地，域关系学习器能够基于预设的距离算法，确定各个任务中的类别之间的距离，该距离算法可以是推土机距离(Earth-Mover距离，EM距离，又叫做Wasserstain距离，一种用于衡量两个分布之间距离的算法)。各个类别之间的距离可以从两个方面衡量：如果同是一种分类类别，则距离较小，如果是不同的分类类别，则距离较大；如果同属于一个源域，则距离较小，如果属于不同的源域，则距离较大。举例而言，若两个类别为同一源域任务的同一个类别则距离为0，两个类别为同一源域任务的不同类别则距离为1，两个类别为不同源域任务的同一个类别则距离为3，两个类别为不同源域任务的不同类别则距离为4。当然，以上仅为一种可选的确定类别之间距离的方式，实际运用中还可以根据各个类别内样本数据间的欧氏距离、余弦距离、曼哈顿距离或者汉明距离中的任意一种确定。在元学习器的训练过程中，域关系学习器根据各个任务对应的分类器给出的预测结果，学习到预测出的分类类别之间的距离，通过对域关系学习器学习到类别之间的距离预测结果和实际类别之间带有的距离标签做监督学习，可以使得类编码器更有效地将相似任务的类别映射到潜在任务空间中相近的类特征嵌入向量上，即使得类特征嵌入向量进一步体现出其所对应任务的源域相关性，并在域聚合的过程中引入该信息，尽可能地迁移与目标域相似的源域的基分类器权重，提高生成的分类器的分类准确度。

本申请实施例中，分类器中元学习器的训练过程主要如下：

在分类模型中，元学习器本身是一个学习如何生成分类器的模型组成分枝，其利用了元学习的思想，即通过在各种分类任务的层面进行学习，从而使得元学习器能够基于少量的带标签样本生成对应的分类器来解决新的分类任务。换句话说，元学习器可以理解为一个生成分类器的“模型”，它能够根据不同的任务生成不同的分类器，这个分类器可以快速学习适应新任务，且无需大量的带标签样本数据。为了得到具有快速适应能力的分类器，元学习器的训练一般是以Few-shot learning(小样本学习，也叫少样本学习)的形式进行的，即通过少量的带标签的样本数据构建成一个分类任务，然后让元学习器在许多按照这个形式创建的分类任务上进行训练学习，这样，经过训练的元学习器就能凭借少量的带标签的样本数据和几次训练迭代快速适应新的分类任务。与传统机器学习模型的不同点在于：元学习器的训练过程是以整个的任务作为训练样本的，这类训练样本典型的设置方式是N-way K-shot，即每个任务包括N个类别，每个类别有K个带标签数据，任务的总数量可以自行设定。

本申请实施例中，参照图3，在元学习的训练阶段，第二数据301按照任务的不同进行区分，可以分为若干个任务集，例如第一任务集3013、第二任务集3014等，各个任务集内的第二数据按照前述的N-way K-shot方式进行设置。具体地，本申请实施例中的任务集可以从前述的源域数据集中获取构造，参照图7，对于第二数据组成的至少两个源域数据集，可以从中采样构造M个的任务集{D_nv1,D_nv2,D_nv3,...,D_nvM}，其中第i个任务集记为D_nvi(0<i≤M)，具体地，从各个源域数据集中采集的任务集数量可以是任意整数个。这些带有第二分类标签的第二数据所组成的任务集用于训练元学习器。这M个任务集中，各个任务集内的类别总数相同，每个类别中的第二数据的个数相同，形成“N-way K-shot”形式，因此各个任务集内的第二数据的总个数也相同。在每个任务集内，又将第二数据随机分为支持集(supportset)和查询集(query set)。当然，各个任务所对应的支持集和查询集内第二数据的样本个数也是相同的，例如本申请实施例中，可以是一共包括10个任务集，即M等于10；每个任务集中包括2个类别，每个类别均有15个带标签的第二数据，则元学习器的训练样本为“2-way15-shot”形式，每个任务集共30个第二数据。其中，每个任务集的每个类别下，有10个第二数据在支持集中，另外5个第二数据在查询集中，所以每个支持集中共20个第二数据，每个查询集中共10个第二数据。应当理解的是，以上仅为一组任务集的具体形式，并不对实际任务集数据的构成形成限制。完成任务集的获取后，基于域关系学习器中预配置的距离算法，根据类别是否相同和/或者类别所对应任务集的源域是否相同，确定各个任务集的类别之间的距离，得到距离标签，然后开始元学习器的训练过程。

参照图8，本申请实施例中，元学习器的实际训练过程采用了内外双循环的逻辑：在内层的训练上，采用支持集输入到元学习器中，通过类编码器和域聚合器基于支持集的样本数据生成各个任务的分类器。本申请实施例中，为了方便与前述待分类对象的分类器做区分，将训练过程中任务集对应的分类器记为任务分类器，确定这些任务分类器预测的支持集识别结果，并通过域关系学习器确定这些任务分类器预测的类别之间的距离。然后，根据预测的支持集识别结果和支持集中第二数据的第二分类标签得到支持集损失值，并对对应的任务分类器进行反向传播更新，微调各个任务分类器的第三参数。可以理解的是，本申请实施例中，各个任务集的第一分类结果包括支持集分类结果和查询集分类结果，第一损失值包括支持集损失值和查询集损失值。

在外层的循环训练上，采用查询集输入到元学习器中，通过对应的任务分类器对查询集内的第二数据进行预测，得到这些任务分类器预测的查询集分类结果，根据预测的查询集分类结果和第二数据对应的第二分类标签得到查询集损失值，并确定这些任务分类器预测的类别之间的距离和类别之间的距离标签的第二损失值，根据各个查询集损失值与第二损失值的总和对元学习器的第一参数进行反向传播更新，然后重新执行内层的循环训练，直到元学习器的第一参数收敛。

具体地，参照图8，本申请实施例中，元学习器的训练过程主要包括步骤800至步骤8120。

步骤800、训练开始；

步骤810、获取批量的任务集；本申请实施例中，仍以前述的10个任务集，即M等于10为例来说明；

步骤820、初始化元学习器的参数；元学习器的第一参数Φ主要包括类编码器的参数域聚合器的参数ψ和域关系学习器的参数φ，即/>

步骤830、赋值i＝1；

步骤840、输入第i个支持集；

步骤850、生成第i个支持集的任务分类器θ_i；由于同一个任务集中支持集的第二数据和查询集的第二数据是统一的，因此基于支持集生成的任务分类器是适用于任务集层面的，也即适用于其对应的查询集。本申请实施例中，支持集的第二数据输入到元学习器中，元学习器内的类编码器输出类特征嵌入向量到域聚合器，域聚合器基于该任务的类特征嵌入向量生成对应的任务分类器。

步骤860、基于第i个支持集对任务分类器θ_i进行梯度更新；本申请实施例中，任务分类器在生成后，还需要根据每个支持集内的第二数据进行参数微调，如前述的任务集中有20个第二用户数据在支持集中，则基于这20个第二用户数据的第一分类结果和第二分类标签确定该任务分类器预测的支持集损失值，并根据该支持集损失值通过梯度下降算法反向传播更新任务分类器的第三参数。具体地过程类似于前述的步骤540和步骤550，在此不再赘述。由于任务分类器本身是元学习器基于大量的先验知识生成的，故虽然对应每个任务分类器的带标签样本数据仅有一个支持集，却仍能够通过少量的梯度迭代产生高准确度的任务分类器。

步骤870、判断i是否等于M，若是则执行步骤890，否则执行步骤880；本步骤中，判断内层的循环训练是否完成，即是否所有的任务都已经生成、微调好任务分类器，如是则执行外层的训练训练，如否则继续执行内层的循环训练。

步骤880、赋值i＝i+1，并返回步骤840；

步骤890、确定类别距离预测的第二损失值；本步骤中，确定内层的循环训练所得到的任务分类器预测的类别之间的距离和类别之间的距离标签的第二损失值，具体的损失函数可以采用交叉熵损失函数。

步骤8100、根据各个任务的查询集损失值总和与第二损失值，对元学习器的参数进行梯度更新；本步骤中，将各个任务集的查询集输入到对应的任务分类器中，确定所有分类任务的查询集损失值总和，并加上前述的类别距离预测的第二损失值以及正则项约束，作为元学习器训练的目标函数，通过梯度下降算法反向传播更新元学习器的第一参数。

步骤8110、判断元学习器的参数是否收敛，若是则执行步骤8120，若否则返回执行步骤830；本步骤中，若元学习器的第一参数收敛，则说明训练目标已达到，此处收敛的判断方式可参照前述的步骤560，若元学习器的第一参数未收敛，则再重新执行内层的循环训练和外层的循环训练。

步骤8120、训练结束。

本申请实施例中，在分类模型的元学习器训练好以后，即可用于对目标域的第一数据进行训练，从而生成对应待分类对象的分类器，使得分类模型能够基于特征提取器和生成的分类器，对大量待分类对象的数据完成分类，并且拥有较高的分类精度。具体地，参照图2，在使用目标域的第一数据对分类模型进行训练时，本质上是一个“使用”元学习器的过程，因为元学习器本身的训练样本是一个个完整的任务，所以其在使用时也是基于任务层面的。本申请实施例中，由于解决的是小样本学习的问题，因此目标域带有第一分类标签的第一数据的数据量并不需要很多，可以按照前述训练元学习器的任务集形式输入到分类模型中。例如第一数据的个数为10个，则此时元学习器生成对应目标域任务的分类器，并基于这个分类器对第一数据进行分类预测，得到了预测结果，然后分类模型根据第一分类标签和预测结果确定的损失值执行微调，即基于分类器对这10个第一数据预测的损失值，通过梯度下降算法反向传播更新该分类器的参数，微调后的分类器被配置到分类模型中，分类模型对待分类对象的训练完成。可以看到，本申请实施例中，针对目标域任务，分类模型的元学习器通过少量的带标签样本数据便能够生成对应的分类器供分类使用，训练的时长可以被大大缩短，模型的泛化能力得到了改善。

本申请实施例还提供了一种对象分类方法，与前述训练方法类似地，该分类方法可应用于终端中，也可应用于服务器中，还可以是运行于终端或服务器中的软件。图9是本申请实施例提供的一种对象分类方法的一个可选的流程图，图9中的方法包括步骤910至步骤920。

步骤910、获取目标域的第三数据；

步骤920、通过分类模型对第三数据进行预测，得到第三分类结果。

本申请实施例中，第三数据指的是实际分类应用时，输入到分类模型进行分类的数据。基于前述训练好的分类模型，可以执行对目标域的对象的分类任务。具体地，在获取到目标域需要进行分类的第三数据后，输入到分类模型，分类模型的特征提取器会对第三数据进行处理，得到对应的特征向量，并将该特征向量送到分类器中，输出第三分类结果。

下面结合本申请中具体的应用场景以及实际的测试数据对本申请实施例的金融风险识别模型的训练方法及识别方法进行说明，应当理解的是，以下仅为本申请实施例的实际应用方式之一，并不意味着对具体的应用场景进行限制。

随着互联网技术的发展和应用的广泛普及，利用互联网进行金融理财已经成为一种新兴的产业。然而，互联网金融给企业带来方便、快捷、回报率高的同时，也带来了相当大的风险，这主要表现在信誉管理混乱、不良借贷和恶意欺骗等。因此，金融风控成为目前一个机器学***台、消费分期借贷、保险等)希望通过网络运营商的大数据对用户数据进行分析，识别出潜在的违约用户或者存在欺诈行为的用户，以尽可能降低金融风险。从分类的角度看，这是一个典型的二分类任务，即将用户分类为有信用风险用户和无信用风险用户两类。

参照图10，本申请实施例提供的一种金融风险识别模型的训练方法，包括步骤1010至步骤1070：

步骤1010、获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据；第一用户数据带有第一信用风险标签，第二用户数据带有第二信用风险标签；

本申请实施例中，目标域金融项目和源域金融项目可以是例如借贷平台、消费分期借贷业务、保险业务等任一项的金融业务项目，目标域金融项目指的是需要进行金融风险识别的项目，源域金融项目是指供目标域进行迁移学习的金融项目。用户数据可以是例如合法获取的用户网络消费行为数据、通信数据、***数据、第三方征信数据等；信用风险标签则是用户是否存在违约、欺诈等行为的记录情况，若存在则标记为具有信用风险类别，若不存在则标记为无信用风险类别。

步骤1020、根据第二用户数据构造任务集；任务集中第二用户数据的类别包括具有信用风险类别和无信用风险类别；

本申请实施例中，任务集的类别种类一共有两类，即具有信用风险和无信用风险，构造任务集的过程可参照图7，从每个源域金融项目中得到的任务集数量可随意设置。

步骤1030、确定各个任务集的类别之间的距离标签；

步骤1040、对第二用户数据进行预测，得到对应各个任务集的第一识别结果和类别之间的距离预测结果；

步骤1050、根据第二信用风险标签和第一识别结果确定第一损失值，根据距离标签和距离预测结果确定第二损失值；

步骤1060、根据第一损失值和第二损失值对元学习器的第一参数进行迭代训练，得到训练好的元学习器；

步骤1070、将第一用户数据和第一信用风险标签输入训练好的元学习器进行训练，得到对应目标域金融项目的训练好的分类器。

由于本申请实施例为分类模型的训练方法实施例的一个实际应用场景，因此上述的分类模型的训练方法中的内容均适用于本申请实施例，本申请实施例中的第一用户数据相当于前述的第一数据，第二用户数据相当于前述的第二数据；第一信用风险标签相当于前述的第一分类标签；第一识别结果相当于前述的第一分类结果。

本申请提供的金融风险识别模型的训练方法，通过元学习的思想训练金融风险识别模型进行迁移学习，针对每个目标域金融项目，识别模型的元学习器都会生成对应的分类器；并且通过源域任务类别之间的样本数据的分布特性确定类别之间的距离，学习类别所对应源域的相关性，从而有选择性地迁移对目标域金融项目有正增益的先验知识，有效改善训练得到的识别模型的泛化性能，能够提高其识别的准确性。

可选地，本申请实施例中金融风险识别模型的训练方法，也可以通过预训练模型预训练特征提取器和基分类器，在该过程中，通过预训练模型对第二用户数据预测得到第二识别结果，并根据第二信用风险标签和第二识别结果确定第三损失值，基于第三损失值完成预训练模型的迭代训练。具体的过程可参照图4和图5，本申请实施例中的第二识别结果相当于前述的第二分类结果。

参照图11，本申请实施例还提供一种金融风险的识别方法，包括步骤1110和步骤1120：

步骤1110、获取目标域金融项目的用户数据；

步骤1120、将用户数据输入到如图10所示的金融风险识别模型的训练方法实施例中得到的识别模型进行预测，得到该识别模型输出的识别结果；该识别结果为具有信用风险或者无信用风险。本申请实施例中的用户数据相当于图9中的第三数据，该识别结果相当于图9中的第三分类结果。

本申请实施例中，该金融风险识别模型基于图10所示的金融风险识别模型的训练方法实施例训练得到，通过输入用户数据，基于这些用户数据对用户在某个金融项目上是否存在信用风险进行预测，从而得到存在信用风险或者无信用风险的识别结果。该结果可以帮助金融公司更好地管控风险，做好相应的业务准入、反欺诈、信用评估等流程。

在上述金融风控场景下的模型，一般是采用K-S test(Kolmogorov-Smirnovtest，KS检验)的指标来评价模型识别的好坏，即在衡量模型分类的效果时，通过机器学习模型给出的预测结果和真实的标签值计算出KS值，通过KS值的大小来确定模型的准确度。具体地，KS检验是一种比较频率分布f(x)与理论分布g(x)或者两个观测值分布一致性的检验方法，其经常用于对模型的风险区分能力进行评估，KS值衡量的是好、坏样本累计分布之间的差值，好坏样本的累计差异越大，KS指标越大，也就说明模型的风险区分能力越强，模型的准确度越好。

为了客观验证本申请实施例中提出的金融风险识别方法的优越性，本申请实施例中，通过运营商大数据支撑平台、金融App上网日志作为采集对象，基于Spark并行大数据处理的方式，收集了10个不同金融场景下的数据集，其中8个作为源域数据集，另外2个作为目标域数据集。表1中示出了采用本申请实施例中的金融风险识别方法和现有的其他迁移学习算法给出的预测结果的KS值：

表1

表1中列出了8个源域到目标域一和目标域二的迁移学习的效果，并且分别在2-way 500-shot的样本数据维度和2-way 1500-shot的样本数据维度进行了测试，效果的评价指标采用了金融风控场景下的通用指标KS值。表1中的纵轴对应不同的迁移学习算法：其中Fine-tune算法是将所有的源域数据合并为一个大的数据集，训练一个基础的深度学习神经网络，并通过在目标域数据上微调训练该网络以达到迁移学习的目的；ALL-DANN算法是基于域对抗的迁移方法，将所有的源域数据合并为一个数据集后与目标域的数据进行域对抗迁移；MAML算法则是前述的模型无关的元学习算法；WD-DANN也是基于域对抗的迁移学习算法，但其与ALL_DANN的不同之处表现为将每个源域与目标域数据分别进行域对抗迁移后得到多个模型，再对每个模型的预测结果进行加权；算法5则是本申请实施例中提供的金融风险识别方法。

可以看到，本申请实施例中的方法在两个目标域的任务上表现最佳，KS值优于其他的算法2％-33％，说明本申请实施例中提供的识别方法，识别模型的元学习器通过两个类别之间样本数据的分布特性确定类别之间的距离以学习类别之间的相关性，并采用基于注意力机制的多源域知识聚合的迁移方法，有选择性地迁移对识别任务有正增益的先验知识以生成分类器，训练得到的识别模型的准确度得到了有效提升。

参照图12，本申请实施例还提供了一种金融风控信息的显示方法，包括步骤1210和步骤1220：

步骤1210、输入用户数据；

步骤1220、显示金融风控信息；该金融风控信息为存在信用风险或者无信用风险；

其中，该金融风控信息通过上述的金融风险识别方法实施例得到。

本申请实施例中，该金融风控信息的显示方法可以应用在各类终端设备上，图13给出了本申请一个示例性实施例提供的终端设备显示界面示意图。本申请实施例中的显示方法应用在该终端设备上时，终端设备通过数据输入框1301获取输入的用户数据，经内部程序执行识别任务后可直接在界面上显示出金融风控信息的识别结果，例如“该用户无信用风险！”。其中，该内部程序中采用的是如前述金融风险识别方法实施例对输入的用户数据进行处理。

本申请实施例中的显示方法，一方面可以作为后端处理步骤，服务于现有金融业务***，从该***中获取用户数据并输出金融风控信息，可以有效应用于各类金融、信贷公司。另一方面也可以作为独立执行的方法，供用户自行查询自己是否可能被标记有违约倾向或者是否用于某项金融业务的准入资格等。

本申请实施例中，基于金融风险识别方法实施例提出了一种金融风控信息的显示方法，使得输入用户数据后能够在相关设备上输出显示对应的金融风控信息。利用该方法能够帮助金融公司有效提高风控的效率，方便减轻各类金融业务所承担的风险。

参照图14，本申请实施例还公开了一种金融风险识别模型的训练装置，包括：

第一获取模块1410，用于获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据；第一用户数据带有第一信用风险标签，第二用户数据带有第二信用风险标签；

任务集构造模块1420，用于根据第二用户数据构造任务集；任务集中第二用户数据的类别包括具有信用风险类别和无信用风险类别；

距离标签确定模块1430，用于确定各个任务集的类别之间的距离标签；

预测模块1440，用于对第二用户数据进行预测，得到对应各个任务集的第一识别结果和类别之间的距离预测结果；

损失值确定模块1450，用于根据第二信用风险标签和第一识别结果确定第一损失值，根据距离标签和距离预测结果确定第二损失值；

第一训练模块1460，用于根据第一损失值和第二损失值对元学习器的第一参数进行迭代训练，得到训练好的元学习器；

第二训练模块1470，用于将第一用户数据和第一信用风险标签输入训练好的元学习器进行训练，得到对应目标域金融项目的训练好的分类器。

可以理解的是，图10所示的金融风险识别模型的训练方法实施例中的内容均适用于本装置实施例中，本装置实施例所具体实现的功能与图10所示的金融风险识别模型的训练方法实施例相同，并且达到的有益效果与图10所示的金融风险识别模型的训练方法实施例所达到的有益效果也相同。

参照图15，本申请实施例还公开了一种金融风险识别装置，包括：

第二获取模块1510，用于获取目标域金融项目的用户数据；

识别模块1520，用于采用如图10所示的训练方法实施例所得到的识别模型对用户数据进行预测，得到识别结果。

可以理解的是，图11所示的金融风险识别方法实施例中的内容均适用于本装置实施例中，本装置实施例所具体实现的功能与图11所示的金融风险识别方法实施例相同，并且达到的有益效果与图11所示的金融风险识别方法实施例所达到的有益效果也相同。

参照图16，本申请实施例还公开了一种计算机设备，包括：

至少一个处理器1610；

至少一个存储器1620，用于存储至少一个程序；

当至少一个程序被至少一个处理器1610执行，使得至少一个处理器1610实现如图10所示的金融风险识别模型的训练方法实施例或者如图11所示的金融风险识别方法实施例。

本申请实施例还公开了一种计算机可读存储介质，其中存储有处理器可执行的程序，处理器可执行的程序在由处理器执行时用于实现如图10所示的金融风险识别模型的训练方法实施例或者如图11所示的金融风险识别方法实施例。

可以理解的是，图10或图11中任一图所示的方法实施例中的内容均适用于本设备、存储介质实施例中，本设备、存储介质实施例所具体实现的功能与图10或图11中任一图所示的方法实施例相同，并且达到的有益效果与图10或图11中任一图所示的方法实施例所达到的有益效果也相同。

在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

在本说明书的上述描述中，参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。尽管已经示出和描述了本发明的实施方式，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明，但本发明并不限于实施例，熟悉本领域的技术人员在不违背本发明精神的前提下可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种金融风险识别模型的训练方法，其特征在于，所述识别模型包括元学习器和分类器，所述元学习器包括域关系学习器，所述训练方法包括以下步骤：

确定各个所述任务集的类别之间的距离标签；其中，所述确定各个所述任务集的类别之间的距离标签，包括：根据域关系学习器中预配置的距离算法，确定各个任务集的类别之间的距离，得到距离标签；

2.根据权利要求1所述的方法，其特征在于：所述根据所述第二用户数据构造任务集，包括：

从至少两个所述源域金融项目中随机采样相同个数的所述第二用户数据，得到对应各个所述源域金融项目的任务集。

3.根据权利要求2所述的方法，其特征在于，根据所述任务集对应的所述源域金融项目是否相同，确定各个所述类别之间的所述距离标签。

4.根据权利要求1所述的方法，其特征在于，所述训练方法还包括以下步骤：

将所述第二用户数据输入至预分类模型，得到第二识别结果；所述预分类模型包括特征提取器和基分类器；

根据所述第二信用风险标签和所述第二识别结果确定第三损失值；

根据所述第三损失值对所述预分类模型的第二参数进行迭代训练，得到训练好的所述预分类模型；

将训练好的所述预分类模型的所述特征提取器配置到所述识别模型。

5.根据权利要求4所述的方法，其特征在于：所述任务集包括支持集；所述第一识别结果包括支持集识别结果；

所述对所述第二用户数据进行预测，得到对应各个所述任务集的第一识别结果，包括：

将各个所述支持集输入至所述元学习器，得到对应各个所述任务集的分类器；

通过对应的所述分类器对所述支持集进行分类，得到所述支持集识别结果。

6.根据权利要求5所述的方法，其特征在于：所述元学习器包括类编码器和域聚合器，所述域聚合器包括自适应聚合器和分类器生成器；

所述将各个所述支持集输入至所述元学习器，得到对应各个所述任务集的分类器，包括：

通过所述类编码器提取所述支持集的类特征嵌入向量；

根据所述基分类器的权重矩阵和所述类特征嵌入向量，通过所述自适应聚合器迁移所述权重矩阵，得到第一权重参数；

基于所述类特征嵌入向量，通过所述分类器生成器生成第二权重参数；

根据所述第一权重参数和所述第二权重参数，得到所述分类器。

7.根据权利要求6所述的方法，其特征在于：所述根据所述基分类器的权重矩阵和所述类特征嵌入向量，通过所述自适应聚合器迁移所述权重矩阵，包括：

确定所述权重矩阵和所述类特征嵌入向量的相似度；

根据所述相似度，确定所述权重矩阵的注意力得分；

根据所述注意力得分，通过所述自适应聚合器迁移所述权重矩阵。

8.根据权利要求7所述的方法，其特征在于：所述确定所述权重矩阵和所述类特征嵌入向量的相似度，包括：

确定所述权重矩阵的转置与所述类特征嵌入向量的点积；

确定所述权重矩阵的第一二范数和所述类特征嵌入向量的第二二范数，并确定所述第一二范数和所述第二二范数的乘积；

根据所述点积与所述乘积的商，确定所述权重矩阵和所述类特征嵌入向量的相似度。

9.根据权利要求6所述的方法，其特征在于，所述将各个所述支持集输入至所述元学习器，得到对应各个所述任务集的分类器，还包括：

通过所述类编码器提取所述类特征嵌入向量的任务特征嵌入向量；

对所述任务特征嵌入向量进行对角化，得到任务特征矩阵；

根据所述任务特征矩阵，通过所述自适应聚合器对所述第一权重参数进行重调。

10.根据权利要求5所述的方法，其特征在于：所述第一损失值包括支持集损失值；

所述对所述第二用户数据进行预测，得到对应各个所述任务集的第一识别结果，还包括：

根据所述支持集识别结果和所述第二信用风险标签，确定所述支持集损失值；

根据各个所述支持集损失值，对对应的所述分类器的第三参数进行反向更新。

11.根据权利要求10所述的方法，其特征在于：所述任务集还包括查询集；所述第一识别结果还包括查询集识别结果；所述第一损失值还包括查询集损失值；

所述根据所述第一损失值和所述第二损失值对所述元学习器的第一参数进行迭代训练，包括：

通过更新后的所述分类器对对应的所述查询集进行分类，得到所述查询集识别结果；

根据所述查询集识别结果和所述第二信用风险标签，确定所述查询集损失值；

根据各个所述查询集损失值的总和与所述第二损失值，对所述第一参数进行反向更新，并返回所述对所述第二用户数据进行预测的步骤，直至所述第一参数收敛。

12.一种金融风险识别模型的训练装置，其特征在于，所述识别模型包括元学习器和分类器，所述元学习器包括域关系学习器，所述训练装置包括：

距离标签确定模块，用于确定各个所述任务集的类别之间的距离标签；其中，所述确定各个所述任务集的类别之间的距离标签，包括：根据域关系学习器中预配置的距离算法，确定各个任务集的类别之间的距离，得到距离标签；

13.一种金融风险识别方法，包括以下步骤：

获取目标域金融项目的用户数据；

将所述用户数据输入到通过如权利要求1-11中任一项所述的训练方法所得到的识别模型进行预测，得到所述识别模型输出的识别结果。

14.一种金融风险识别装置，包括：

第二获取模块，用于获取目标域金融项目的用户数据；

识别模块，用于采用如权利要求1-11中任一项所述的训练方法所得到的识别模型对所述用户数据进行预测，得到识别结果。

15.一种计算机设备，其特征在于，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1-11中任一项所述的方法。

16.一种计算机可读存储介质，其中存储有处理器可执行的程序，其特征在于：所述处理器可执行的程序在由处理器执行时用于实现如权利要求1-11中任一项所述的方法。