CN112418441A

CN112418441A - 基于迁移学习的数据处理方法、装置、设备及存储介质

Info

Publication number: CN112418441A
Application number: CN202011393117.2A
Authority: CN
Inventors: 康焱; 刘洋
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2020-12-02
Filing date: 2020-12-02
Publication date: 2021-02-26

Abstract

本发明公开了一种基于迁移学习的数据处理方法、装置、设备及存储介质，其中，方法包括：基于第一样本特征组确定第一样本特征表征，基于第二样本特征组确定第二样本特征表征；基于第一样本特征表征、第二样本特征表征，获得第一特征提取模型；基于第一特征表征，确定训练后的预测模型以及第二特征提取模型；基于第二特征表征以及训练后的预测模型，确定目标预测模型以及目标特征提取模型。本发明能够得到兼顾模型迁移和模型可解释的目标模型，通过目标特征提取模型对样本的知识进行迁移，在迁移学习过程中通过领域区分模型进行准确的领域区分，提高迁移学习的效率，提高了数据处理的效率以及计算机算力资源的利用率。

Description

基于迁移学习的数据处理方法、装置、设备及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于迁移学习的数据处理方法、装置、设备及存储介质。

背景技术

机器学习在大量标记的数据上进行监督式训练可以获得很好的性能和效果，然而大型的标记数据集在数量和应用领域方面均有限，且手动标记足量的训练数据往往需要高昂的代价。针对这一问题，通常采用迁移学习方法解决，即训练一个鉴别器用于调整迁移学习网络的参数，使得参数调整后的迁移学习网络下，源领域的数据与目标领域的数据间的分布偏移减小，从而迁移学习网络应用目标领域完成目标任务时有较佳的效果。

但是，深度学习模型的缺乏可解释性使其在要求模型可解释性的应用中(比如，金融风险控制)很难被用于迁移学习，而复杂度低的深度学习模型从原始数据中学习到可迁移知识的能力较弱，因此其迁移能力不强。这就产生了一个矛盾，迁移能力强的深度学习模型缺乏可解释性，可解释性强的深度学习模型迁移能力不强，导致深度学习模型无法兼顾可解释性以及迁移能力。同时，在迁移学习中，由于不能对不同领域或场景的数据进行有效的领域区分，使得迁移学习过程中需要训练更长时间才能使得训练后的模型达到目标性能，造成迁移学习的效率低，进而导致计算机需要耗费大量资源算力，致使计算机算力资源的利用率低。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种基于迁移学习的数据处理方法、装置、设备及存储介质，旨在解决深度学习模型无法兼顾可解释性以及迁移能力，以及迁移学习的效率低而导致计算机算力资源的利用率低的技术问题。

为实现上述目的，本发明提供一种基于迁移学习的数据处理方法，所述基于迁移学习的数据处理方法包括以下步骤：

基于预设业务需求对第一业务场景的第一样本的特征进行分组，以获得预设个数的第一样本特征组，并基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得预设个数的第二样本特征组；

基于每一个第一样本特征组及其对应的特征提取模型，确定第一样本特征表征，并基于每一个第二样本特征组及其对应的特征提取模型，确定第二样本特征表征；

基于每一个第一样本特征表征及其对应的领域区分模型，确定第一领域区分损失值，基于每一个第二样本特征表征及其对应的领域区分模型，确定第二领域区分损失值，并基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型，以获得第一特征提取模型；

基于所述第一特征表征以及可解释的待训练预测模型，确定第一预测损失值以及训练后的预测模型，并基于所述第一预测损失值以及各个第一特征提取模型，确定第二特征提取模型；

基于所述第二特征表征以及训练后的预测模型，确定第二预测损失值以及目标预测模型，基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型。

进一步地，所述基于每一个第一样本特征表征及其对应的领域区分模型，确定第一领域区分损失值的步骤包括：

将每一个第一样本特征表征输入对应的领域区分模型，以获得各个第一样本特征表征对应的第一领域区分损失值；

基于所述第一领域区分损失值更新对应的领域区分模型，以获得更新后的领域区分模型，并基于各个第一领域区分损失值通过领域对抗学习，更新对应的特征提取模型，以获得中间特征提取模型。

进一步地，所述基于每一个第二样本特征表征及其对应的领域区分模型，确定一第二领域区分损失值，并基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型，以获得第一特征提取模型的步骤包括：

将各个第二样本特征表征输入对应的更新后的领域区分模型，以获得各个第二样本特征表征对应的第二领域区分损失值；

基于各个第二领域区分损失值通过领域对抗学习，更新对应的中间特征提取模型，以获得第一特征提取模型。

进一步地，所述基于所述第一特征表征以及可解释的待训练预测模型，确定第一预测损失值以及训练后的预测模型，并基于所述第一预测损失值以及各个第一特征提取模型，确定第二特征提取模型的步骤包括：

将所述第一特征表征对应的特征表征集输入所述待训练预测模型进行模型训练，以获得第一预测损失值；

基于所述第一预测损失值更新所述待训练预测模型，以获得训练后的预测模型；

基于所述第一预测损失值更新各个第一特征提取模型，以获得第二特征提取模型。

进一步地，所述基于所述第二特征表征以及训练后的预测模型，确定第二预测损失值以及目标预测模型，基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型的步骤包括：

将所述第二特征表征对应的特征表征集输入训练后的预测模型进行模型训练，以获得第二预测损失值；

基于所述第二预测损失值更新训练后的待训练预测模型，以获得目标预测模型；

基于所述第二预测损失值更新各个第二特征提取模型，以获得目标特征提取模型。

进一步地，基于预设业务需求对第一业务场景的第一样本的特征进行分组，以获得预设个数的第一样本特征组的步骤包括：

基于预设业务需求对所述第一样本的特征进行分组，以获得第一样本对应的第一样本特征组以及多个第一单体特征；

所述将所述第一特征表征对应的特征表征集输入待训练预测模型进行模型训练，以获得第一预测损失值的步骤包括：

将所述第一特征表征以及第一单体特征对应的特征表征集输入待训练预测模型进行模型训练，以获得第一预测损失值。

进一步地，所述基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得预设个数的第二样本特征组的步骤包括：

基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得第二样本对应的第二样本特征组以及多个第二单体特征；

所述将所述第二特征表征对应的特征表征集输入训练后的预测模型进行模型训练，以获得第二预测损失值的步骤包括：

将所述第二特征表征以及第二单体特征对应的特征表征集输入训练后的预测模型进行模型训练，以获得第二预测损失值。

进一步地，所述目标预测模型为欺诈评分预测模型；所述第一业务场景包括用户的信用评分场景，所述第二业务场景包括用户的欺诈评分场景，所述第一样本包括为第一参与方中的信用评分数据，第二样本为第一参与方中的欺诈评分数据；

所述基于每一个第一样本特征表征及其对应的领域区分模型，确定第一领域区分损失值，基于每一个第二样本特征表征及其对应的领域区分模型，确定第二领域区分损失值，并基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型的步骤包括:

基于第一参与方中的信用评分数据对应的第一样本特征表征及其对应的领域区分模型，确定第一领域区分损失值，基于第一参与方中的欺诈评分数据对应的第二样本特征表征及其对应的领域区分模型，确定第二领域区分损失值，并基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型；

所述基于所述第一特征表征以及可解释的待训练预测模型，确定第一预测损失值以及训练后的预测模型，并基于所述第一预测损失值以及各个第一特征提取模型，确定第二特征提取模型的步骤包括：

基于第一参与方中的信用评分数据对应的第一样本特征表征以及可解释的待训练预测模型，确定预测损失值以及训练后的预测模型，并基于所述第一预测损失值以及各个第一特征提取模型，确定第二特征提取模型；

所述基于所述第二特征表征以及训练后的预测模型，确定第二预测损失值以及目标预测模型，基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型的步骤包括：

基于第一参与方中的欺诈评分数据对应的第二特征表征以及训练后的预测模型，确定第二预测损失值以及欺诈评分预测模型，基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型。

进一步地，所述基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型的步骤之后，所述基于迁移学习的数据处理方法还包括：

基于预设业务需求对第二业务场景的待预测样的特征本进行分组，以获得待预测样本特征组；

将待预测样本特征组输入对应的目标特征提取模型，以获得多个待预测特征表征；

将待预测特征表征对应的特征表征集输入目标预测模型，以获得预测结果。

进一步地，所述基于预设业务需求对第二业务场景的待预测样的特征本进行分组，以获得待预测样本特征组的步骤包括：

基于预设业务需求对第二业务场景的待预测样本的特征进行分组，以获得待预测样本特征组以及多个待预测单体特征；

所述将待预测特征表征对应的特征表征集输入目标预测模型，以获得预测结果的步骤包括：

将待预测特征表征以及待预测单体特征对应的特征表征集输入目标预测模型，以获得预测结果。

此外，为实现上述目的，本发明还提供一种基于迁移学习的数据处理装置，所述基于迁移学习的数据处理装置包括：

分组模块，用于基于预设业务需求对第一业务场景的第一样本的特征进行分组，以获得预设个数的第一样本特征组，并基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得预设个数的第二样本特征组；

表征提取模块，用于基于每一个第一样本特征组及其对应的特征提取模型，确定第一样本特征表征，并基于每一个第二样本特征组及其对应的特征提取模型，确定第二样本特征表征；

模型确定模块，用于基于每一个第一样本特征表征及其对应的领域区分模型，确定第一领域区分损失值，基于每一个第二样本特征表征及其对应的领域区分模型，确定第二领域区分损失值，并基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型；

第一预测模型确定模块，用于基于所述第一特征表征以及待训练预测模型，确定第一预测损失值以及训练后的预测模型，并基于所述第一预测损失值以及各个第一特征提取模型，确定第二特征提取模型；

第二预测模型确定模块，用于基于所述第二特征表征以及训练后的预测模型，确定第二预测损失值以及目标预测模型，基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型。

此外，为实现上述目的，本发明还提供一种基于迁移学习的数据处理设备，所述基于迁移学习的数据处理设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于迁移学习的数据处理程序，所述基于迁移学习的数据处理程序被所述处理器执行时实现前述的基于迁移学习的数据处理方法的步骤。

此外，为实现上述目的，本发明还提供一种存储介质，所述存储介质上存储有基于迁移学习的数据处理程序，所述基于迁移学习的数据处理程序被处理器执行时实现前述的基于迁移学习的数据处理方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机程序产品，所述计算机程序产品执行时实现前述的基于迁移学习的数据处理方法的步骤。

本发明通过基于预设业务需求对第一业务场景的第一样本的特征进行分组，以获得预设个数的第一样本特征组，并基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得预设个数的第二样本特征组；接着基于每一个第一样本特征组及其对应的特征提取模型，确定第一样本特征表征，并基于每一个第二样本特征组及其对应的特征提取模型，确定第二样本特征表征；而后基于每一个第一样本特征表征及其对应的领域区分模型，确定第一领域区分损失值，基于每一个第二样本特征表征及其对应的领域区分模型，确定第二领域区分损失值，并基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型，以获得第一特征提取模型；然后基于所述第一特征表征以及可解释的待训练预测模型，确定第一预测损失值以及训练后的预测模型，并基于所述第一预测损失值以及各个第一特征提取模型，确定第二特征提取模型；最后基于所述第二特征表征以及训练后的预测模型，确定第二预测损失值以及目标预测模型，基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型，能够得到兼顾模型迁移和模型可解释的目标模型，通过目标特征提取模型对样本的知识进行迁移，通过可解释的目标预测模型进行预测，能够解释每个特征组对预测结果的贡献，从而达到了兼顾模型迁移和模型可解释的目的。同时，在迁移学习过程中通过领域区分模型对第一样本以及第二样本进行准确的领域区分，提高迁移学习的效率，克服了现有技术中大量耗费计算机算力资源的缺陷，提高了数据处理的效率以及计算机算力资源的利用率。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的基于迁移学习的数据处理设备的结构示意图；

图2为本发明基于迁移学习的数据处理方法第一实施例的流程示意图；

图3为本发明基于迁移学习的数据处理方法一实施例中第一样本以及第二样本的示意图；

图4为本发明基于迁移学习的数据处理方法另一实施例中第一样本以及第二样本的示意图；

图5为本发明基于迁移学习的数据处理方法一实施例中迁移学习的训练过程示意图；

图6为本发明基于迁移学习的数据处理方法另一实施例中迁移学习的训练过程示意图；

图7为本发明基于迁移学习的数据处理方法一实施例中的预测过程示意图；

图8为本发明基于迁移学习的数据处理方法另一实施例中的预测过程示意图；

图9为本发明基于迁移学习的数据处理装置一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的基于迁移学习的数据处理设备的结构示意图。

本发明实施例基于迁移学***板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。

如图1所示，该基于迁移学习的数据处理设备可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，基于迁移学习的数据处理设备还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。当然，基于迁移学习的数据处理设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对基于迁移学习的数据处理设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及基于迁移学习的数据处理程序。

在图1所示的基于迁移学习的数据处理设备中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的基于迁移学习的数据处理程序。

在本实施例中，基于迁移学习的数据处理设备包括：存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的基于迁移学习的数据处理程序，其中，处理器1001调用存储器1005中存储的基于迁移学习的数据处理程序时，并执行以下各个实施例中基于迁移学习的数据处理方法的步骤。

本发明还提供一种基于迁移学习的数据处理方法，参照图2，图2为本发明基于迁移学习的数据处理方法第一实施例的流程示意图。

步骤S101，基于预设业务需求对第一业务场景的第一样本的特征进行分组，以获得预设个数的第一样本特征组，并基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得预设个数的第二样本特征组；

本实施例中，第一业务场景与第二业务场景为两个业务相似但不同的业务场景，例如，第一业务场景为信用评分和欺诈评分，第二业务场景为欺诈评分；其中，第一业务场景有大量的样本，第二业务场景有一定数量的样本，即第一样本的数量(远)大于第二样本的数量；第一样本中的每一个样本对应一个类别标签和一个领域标签，第二样本中的每一个样本对应一个类别标签和一个领域标签，第一样本的领域标签与第二样本的领域标签不同，例如，领域标签与业务场景对应，第一样本中各个样本的领域标签均为1，第二样本中各个样本的领域标签均为0。

本实施例中，先获取第一业务场景的第一样本以及第二业务场景的第二样本，为使第一特征表征的数量与第二特征表征的数量相同，针对第一业务场景以及第二业务场景，确定第一业务场景与第二业务场景之间完全相同的部分特征作为预设业务需求，而后基于预设业务需求对第一样本以及第二样本的特征进行分组，具体地，基于预设业务需求对第一业务场景的第一样本的特征进行分组，以获得预设个数的第一样本特征组，并基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得预设个数的第二样本特征组，使得每一组样本中的特征均为对样本某个属性的描述，每个样本组可以看着是对样本某一方面的比较抽象的描述，例如可把婚恋交友、微博交友、微信交友等特征划为一组，这组特征是对样本的社交属性的描述。其中，预设个数根据预设业务需求进行合理设置。

参照图3，图3中，A业务为第一业务场景，B业务为第二业务场景，第一样本以及第二样本在分组后均还包括单体特征，具体地，F_i ^A为第一样本特征组，F_i ^B为第二样本特征组，f_j ^A为第一样本对应的单体特征，f_j ^B为第二样本对应的单体特征。

参照图4，图4中，A业务为第一业务场景，B业务为第二业务场景，第一样本以及第二样本在分组后均不包括单体特征，具体地，F_i ^A为第一样本特征组，F_i ^B为第二样本特征组。

步骤S102，基于每一个第一样本特征组及其对应的特征提取模型，确定第一样本特征表征，并基于每一个第二样本特征组及其对应的特征提取模型，确定第二样本特征表征；

本实施例中，在获取到第一样本特征组以及第二样本特征组之后，基于每一个第一样本特征组及其对应的特征提取模型，确定第一样本特征表征，并基于每一个第二样本特征组及其对应的特征提取模型，确定第二样本特征表征，具体地，将每一个第一样本特征组输入其对应的特征提取模型进行特征提取，得到每一个第一样本特征组对应的第一样本特征表征，将每一个第二样本特征组输入其对应的特征提取模型进行特征提取，得到每一个第二样本特征组对应的第二样本特征表征，例如，第一样本特征组包括特征组1、特征组2……特征组n等n组特征，第二样本特征组同样包括特征组1、特征组2……特征组n等n组特征，特征提取模型则包括特征提取模型1、特征提取模型2……特征提取模型n，则需要相同的特征组对应相同需要的特征提取模型，即第一样本特征组的特征组1与第二样本特征组的特征组1均对应特征提取模型1，第一样本特征组的特征组n与第二样本特征组的特征组n均对应特征提取模型n。

步骤S103，基于每一个第一样本特征表征及其对应的领域区分模型，确定第一领域区分损失值，基于每一个第二样本特征表征及其对应的领域区分模型，确定第二领域区分损失值，并基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型，以获得第一特征提取模型；

本实施例中，在获取到第一特征表征以及第二特征表征时，基于每一个第一特征表征以及其对应的领域区分模型，确定多个第一领域区分损失值，具体地，将第一特征表征输入其对应的领域区分模型，得到各个第一特征表征对应的第一预测领域标签，并分别根据第一预测领域标签以及各个第一特征表征对应的领域标签计算各个第一特征表征对应的第一领域区分损失值。基于每一个第二特征表征以及其对应的领域区分模型，确定多个第二领域区分损失值，具体地，将每一个第二特征表征输入其对应的领域区分模型，得到各个第二特征表征对应的第二预测领域标签，并分别根据第二预测领域标签以及各个第二特征表征对应的领域标签计算各个第二特征表征对应的第二领域区分损失值。而后，基于第一领域区分损失值以及第二领域区分损失值，更新对应的各个特征提取模型，得到更新后的特征提取模型。

步骤S104，基于所述第一特征表征以及可解释的待训练预测模型，确定第一预测损失值以及训练后的预测模型，并基于所述第一预测损失值以及各个第一特征提取模型，确定第二特征提取模型；

本实施例中，在确定第二特征提取模型之后，基于第一特征表征以及可解释的待训练预测模型，确定第一预测损失值以及训练后的预测模型，具体地，将第一特征表征对应的特征表征集输入可解释的待训练预测模型进行模型训练，得到第一预测损失值，该第一特征表征对应的特征表征集为包括所有第一特征表征数据集，根据该第一预测损失值更新该待训练预测模型得到训练后的预测模型，并根据该第一预测损失值更新各个第一特征提取模型得到第二特征提取模型。

需要说明的是，在其他实施例中，在确定第二特征提取模型时，累计待训练预测模型的训练轮数，若训练轮数小于预设值，则将训练后的预测模型作为待训练预测模型，将第二特征提取模型作为第一特征提取模型，并继续执行该步骤S104。

其中，其中待训练预测模型为具有可解释性的机器学习模型，例如，待训练预测模型为线性回归模型或者逻辑回归模型等。

步骤S105，基于所述第二特征表征以及训练后的预测模型，确定第二预测损失值以及目标预测模型，基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型。

本实施例中，在确定第二特征提取模型以及训练后的预测模型之后，基于第二特征表征以及训练后的预测模型，确定第二预测损失值以及目标预测模型，具体地，将第二特征表征对应的特征表征集输入训练后的预测模型进行模型训练，得到第二预测损失值，该第二特征表征对应的特征表征集为包括所有第二特征表征数据集，根据该第二预测损失值更新该训练后的预测模型得到目标预测模型，并根据该第二预测损失值更新第二特征提取模型得到目标特征提取模型。

然而本设计不限于此，于其他实施例中，所述目标预测模型为欺诈评分预测模型；所述第一业务场景包括用户的信用评分场景，所述第二业务场景包括用户的欺诈评分场景，所述第一样本包括为第一参与方中的信用评分数据，第二样本为第一参与方中的欺诈评分数据；

步骤S103包括:

步骤S104包括：

步骤S105包括：

具体地，将第一参与方中的信用评分数据对应的第一样本特征表征输入其对应的领域区分模型，得到第一领域区分损失值，并将第一参与方中的欺诈评分数据对应的第二样本特征表征输入其对应的领域区分模型，得到第二领域区分损失值，而后基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型，得到更新后的特征提取模型。

接着，将第一参与方中的信用评分数据对应的第一样本特征表征输入可解释的待训练预测模型进行模型训练，得到第一预测损失值，根据第一预测损失值更新可解释的待训练预测模型得到训练后的预测模型，并基于所述第一预测损失值更新第一特征提取模型，得到第二特征提取模型。然后，基于第一参与方中的欺诈评分数据对应的第二特征表征输入训练后的预测模型进行模型训练，得到第二预测损失值，根据第二预测损失值更新训练后的预测模型得到欺诈评分预测模型，并基于所述第二预测损失值更新第二特征提取模型，得到目标特征提取模型。

本实施例提出的基于迁移学习的数据处理方法，通过基于预设业务需求对第一业务场景的第一样本的特征进行分组，以获得预设个数的第一样本特征组，并基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得预设个数的第二样本特征组；接着基于每一个第一样本特征组及其对应的特征提取模型，确定第一样本特征表征，并基于每一个第二样本特征组及其对应的特征提取模型，确定第二样本特征表征；而后基于每一个第一样本特征表征及其对应的领域区分模型，确定第一领域区分损失值，基于每一个第二样本特征表征及其对应的领域区分模型，确定第二领域区分损失值，并基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型，以获得第一特征提取模型；然后基于所述第一特征表征以及可解释的待训练预测模型，确定第一预测损失值以及训练后的预测模型，并基于所述第一预测损失值以及各个第一特征提取模型，确定第二特征提取模型；最后基于所述第二特征表征以及训练后的预测模型，确定第二预测损失值以及目标预测模型，基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型，能够得到兼顾模型迁移和模型可解释的目标模型，通过目标特征提取模型对样本的知识进行迁移，通过可解释的目标预测模型进行预测，能够解释每个特征组对预测结果的贡献，从而达到了兼顾模型迁移和模型可解释的目的。同时，在迁移学习过程中通过领域区分模型对第一样本以及第二样本进行准确的领域区分，提高迁移学习的效率，克服了现有技术中大量耗费计算机算力资源的缺陷，提高了数据处理的效率以及计算机算力资源的利用率。

基于第一实施例，提出本发明基于迁移学习的数据处理方法的第二实施例，在本实施例中，步骤S103包括：

步骤S201，将每一个第一样本特征表征输入对应的领域区分模型，以获得各个第一样本特征表征对应的第一领域区分损失值；

步骤S202，基于所述第一领域区分损失值更新对应的领域区分模型，以获得更新后的领域区分模型，并基于各个第一领域区分损失值通过领域对抗学习，更新各个第一样本特征表征对应的特征提取模型，以获得中间特征提取模型。

本实施例中，在获取到第一特征表征时，将各个第一特征表征输入对应的领域区分模型进行模型训练，以获得各个第一特征表征对应的更新后的领域区分模型以及各个第一特征表征对应的第一领域区分损失值，即将第一特征表征分别输入对应的领域区分模型，得到各个第一特征表征对应的第一预测领域标签，并分别根据第一预测领域标签以及各个第一特征表征对应的领域标签计算各个第一特征表征对应的第一领域区分损失值。

而后，后，根据各个第一领域区分损失值更新各个第一特征表征对应的领域区分模型以获得更新后的领域区分模型，基于各个第一领域区分损失值通过领域对抗学习，更新各个第一特征表征对应的特征提取模型，以获得第一特征提取模型。

例如，第一特征表征包括r_a1、r_a2……r_an，领域区分模型包括n个，D₁-D_n，则将r_a1输入D₁，r_a2输入D，r_an输入Dn，分别进行模型训练，得到n个第一预测领域标签B_y1、B_y2……B_yn，根据r_a1、r_a2……r_an对应的(真实)领域标签B_s1、B_s2……B_sn以及B_y1、B_y2……B_yn分别确定对应的第一领域区分损失值L₁、L₂……L_n，即根据B_y1、B_s1确定L₁，根据B_y2、B_s2确定L₂，根据B_yn、B_sn确定Ln，而后根据L₁更新D₁，根据L₂更新D₂，根据L₁更新D₁，根据L_n更新D_n，得到各个更新后的领域区分模型，同理，分别根据L₁、L₂……L_n更新各个r_a1、r_a2……r_an对应的特征提取模型，即根据L₁更新r_a1对应的特征提取模型，根据L₂更新r_a2对应的特征提取模型，根据L₁更新D₁，根据L_n更新r_an对应的特征提取模型，得到各个中间特征提取模型。

本实施例提出的基于迁移学习的数据处理方法，通过将每一个第一样本特征表征输入对应的领域区分模型，以获得各个第一样本特征表征对应的第一领域区分损失值；接着基于所述第一领域区分损失值更新对应的领域区分模型，以获得更新后的领域区分模型，并基于各个第一领域区分损失值通过领域对抗学习，更新对应的特征提取模型，以获得中间特征提取模型，实现了对领域区分模型以及特征提取模型的更新，提高模型训练的准确性。

基于第二实施例，提出本发明基于迁移学习的数据处理方法的第三实施例，在本实施例中，步骤S103包括：

步骤S301，将各个第二样本特征表征输入对应的更新后的领域区分模型，以获得各个第二样本特征表征对应的第二领域区分损失值；

步骤S302，基于各个第二领域区分损失值通过领域对抗学习，更新对应的中间特征提取模型，以获得第一特征提取模型。

本实施例中，将各个第二特征表征输入对应的更新后的领域区分模型进行模型训练，以获得各个第二特征表征对应的目标领域区分模型以及各个第二特征表征对应的第二领域区分损失值，即将第二特征表征分别输入对应的更新后的领域区分模型，得到各个第二特征表征对应的第二预测领域标签，并分别根据第二预测领域标签以及各个第二特征表征对应的领域标签计算各个第二特征表征对应的第二领域区分损失值。

而后，基于各个第二领域区分损失值通过领域对抗学习，更新各个第二特征表征对应的中间特征提取模型，以获得第一特征提取模型。在其他实施例中，还可以根据各个第二领域区分损失值更新各个第二特征表征对应的更新后的领域区分模型以获得目标领域区分模型，以便于后续在进行训练时将该目标领域区分模型作为领域区分模型。

本实施例提出的基于迁移学习的数据处理方法，通过将各个第二样本特征表征输入对应的更新后的领域区分模型，以获得各个第二样本特征表征对应的第二领域区分损失值；接着基于各个第二领域区分损失值通过领域对抗学习，更新对应的中间特征提取模型，以获得第一特征提取模型，实现了对特征提取模型的更新，提高模型训练的准确性。

基于第一实施例，提出本发明基于迁移学习的数据处理方法的第四实施例，在本实施例中，步骤S104包括：

步骤S401，将所述第一特征表征对应的特征表征集输入所述待训练预测模型进行模型训练，以获得第一预测损失值；

步骤S402，基于所述第一预测损失值更新所述待训练预测模型，以获得训练后的预测模型；

步骤S403，基于所述第一预测损失值更新各个第一特征提取模型，以获得第二特征提取模型。

本实施例中，在确定第二特征提取模型之后，将第一特征表征对应的特征表征集输入待训练预测模型进行模型训练，以获得第一预测损失值，即按照第一特征表征的编号顺序得到第一特征表征对应的特征表征集，该第一特征表征对应的特征表征集为包括所有第一特征表征的数据集，将第一特征表征对应的特征表征集输入待训练预测模型进行模型训练，得到第一特征表征对应的第一预测类别标签，根据第一特征表征对应的第一预测类别标签以及第一特征表征对应的类别标签(真实类别标签)计算第一预测损失值。

而后，根据该第一预测损失值更新该待训练预测模型得到训练后的预测模型，并根据该第一预测损失值更新第一特征提取模型得到第二特征提取模型。

本实施例提出的基于迁移学习的数据处理方法，通过将所述第一特征表征对应的特征表征集输入所述待训练预测模型进行模型训练，以获得第一预测损失值；接着基于所述第一预测损失值更新所述待训练预测模型，以获得训练后的预测模型；而后基于所述第一预测损失值更新各个第一特征提取模型，以获得第二特征提取模型，通过第一特征表征对待训练预测模型以及第一特征提取模型进行更新，以提高目标预测模型以及目标特征提取模型的准确性。

基于第四实施例，提出本发明基于迁移学习的数据处理方法的第五实施例，在本实施例中，步骤S105包括：

步骤S501，将所述第二特征表征对应的特征表征集输入训练后的预测模型进行模型训练，以获得第二预测损失值；

步骤S502，基于所述第二预测损失值更新训练后的待训练预测模型，以获得目标预测模型；

步骤S503，基于所述第二预测损失值更新各个第二特征提取模型，以获得目标特征提取模型。

本实施例中，将第二特征表征对应的特征表征集输入训练后的预测模型进行模型训练，以获得第二预测损失值，即按照第二特征表征的编号顺序得到第二特征表征对应的特征表征集，该第二特征表征对应的特征表征集为包括所有第二特征表征的数据集，将第二特征表征对应的特征表征集输入训练后的待训练预测模型进行模型训练，得到第二特征表征对应的第二预测类别标签，根据第二特征表征对应的第二预测类别标签以及第二特征表征对应的类别标签(真实类别标签)计算第二预测损失值。

而后，根据该第二预测损失值更新该训练后的预测模型得到目标预测模型，并根据该第二预测损失值更新第二特征提取模型得到目标特征提取模型。

进一步地，在一实施例中，

步骤S101包括：基于预设业务需求对所述第一样本的特征进行分组，以获得第一样本对应的第一样本特征组以及多个第一单体特征；

步骤S401包括：将所述第一特征表征以及第一单体特征对应的特征表征集输入待训练预测模型进行模型训练，以获得第一预测损失值。

本实施例中，在对第一样本进行分组时，往往会存在没有被分组的样本，这类样本为第一单体特征，而在进行预测模型的训练时，为了提高模型的准确性，将所述第一特征表征以及第一单体特征对应的特征表征集输入待训练预测模型进行模型训练，以获得第一预测损失值，即先按顺序将第一特征表征以及第一单体特征拼接为一个数据集，将该数据集输入待训练预测模型进行模型训练，得到对应的第一预测类别标签，根据第一预测类别标签以及对应的类别标签(真实类别标签)计算第一预测损失值，进而提高模型训练的准确性。

进一步地，在一实施例中，

步骤S101包括：基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得第二样本对应的第二样本特征组以及多个第二单体特征；

步骤S501包括：将所述第二特征表征以及第二单体特征对应的特征表征集输入训练后的预测模型进行模型训练，以获得第二预测损失值。

本实施例中，在对第二样本进行分组时，往往也会存在没有被分组的样本，这类样本为第二单体特征，而在进行预测模型的训练时，为了提高模型的准确性，将所述第二特征表征以及第二单体特征对应的特征表征集输入训练后的预测模型进行模型训练，以获得第二预测损失值，即先按顺序将第二特征表征以及第二单体特征拼接为一个数据集，将该数据集输入训练后的预测模型进行模型训练，得到对应的第二预测类别标签，根据第二预测类别标签以及对应的类别标签(真实类别标签)计算第二预测损失值，进而提高模型训练的准确性。

参照图5，图5中，通过第一样本特征组中的特征组F₁ ^A以及第二样本特征组中的特征组F₁ ^B训练得到目标特征模型R₁，……通过第一样本特征组中的特征组F_n ^A以及第二样本特征组中的特征组F_n ^B训练得到更新后的特征模型R_n，D₁……D₃为领域区分模型，L_d,1……L_d,3为领域区分损失值。将第一样本特征组F_i ^A以及多个单体特征f_j ^A输入待训练预测模型，得到预测损失值L_cls ^A，最后根据该预测损失值L_cls ^A更新各个更新后的特征提取模型，以获得目标特征提取模型，并更新所述待训练预测模型，以获得目标预测模型。

参照图6，图6中，通过第一样本特征组中的特征组F₁ ^A以及第二样本特征组中的特征组F₁ ^B训练得到目标特征模型R₁，……通过第一样本特征组中的特征组F_n ^A以及第二样本特征组中的特征组F_n ^B训练得到更新后的特征模型R_n，D₁……D₃为领域区分模型，L_d,1……L_d,3为领域区分损失值。将第一样本特征组F_i ^A输入待训练预测模型，得到预测损失值L_cls ^A，最后根据该预测损失值L_cls ^A更新各个更新后的特征提取模型，以获得目标特征提取模型，并更新所述待训练预测模型，以获得目标预测模型。

本实施例提出的基于迁移学习的数据处理方法，通过将所述第二特征表征对应的特征表征集输入训练后的预测模型进行模型训练，以获得第二预测损失值；接着基于所述第二预测损失值更新训练后的待训练预测模型，以获得目标预测模型；而后基于所述第二预测损失值更新各个第二特征提取模型，以获得目标特征提取模型，能够得到兼顾模型迁移和模型可解释的目标模型，通过目标特征提取模型对样本的知识进行迁移，通过可解释的目标预测模型进行预测，能够解释每个特征组对预测结果的贡献，从而达到了兼顾模型迁移和模型可解释的目的。

基于上述各个实施例，提出本发明基于迁移学习的数据处理方法的第六实施例，在本实施例中，步骤S105之后，还包括：

步骤S701，基于预设业务需求对第二业务场景的待预测样的特征本进行分组，以获得待预测样本特征组；

步骤S702，将待预测样本特征组输入对应的目标特征提取模型，以获得多个待预测特征表征；

步骤S703，将待预测特征表征对应的特征表征集输入目标预测模型，以获得预测结果。

在本实施例中，在需要进行预测时，先获取第二业务场景的待预测样本，而后基于预设业务需求对待预测样本的特征进行分组，以获得待预测样本特征组，将待预测样本特征组输入对应的目标特征提取模型，以获得多个待预测特征表征，其中，多个待预测样本特征组的编号/排序方式与第一样本组相同，将每一个待预测样本特征组输入其对应的目标特征提取模型，得到多个待预测特征表征，即每一个待预测样本特征组对应一个待预测特征表征。

而后，将待预测特征表征进行拼接，得到待预测特征表征对应的特征表征集，并将待预测特征表征对应的特征表征集输入目标预测模型，以获得预测结果，即得到该待预测样本的预存类别。

进一步地，在一实施例中，

步骤701包括：基于预设业务需求对第二业务场景的待预测样本的特征进行分组，以获得待预测样本特征组以及多个待预测单体特征；

步骤703包括：将待预测特征表征以及待预测单体特征对应的特征表征集输入目标预测模型，以获得预测结果。

本实施例中，在对待预测样本进行分组时，若得到待预测样本特征组以及多个待预测单体特征，则将待预测特征表征以及待预测单体特征进行拼接，得到待预测特征表征集，并将待预测特征表征集输入目标预测模型，以获得预测结果，即得到该待预测样本的预存类别。

参照图7，图7中，F₁ ^B、F₂ ^B、F₃ ^B为待预测样本对应的待预测样本特征组，f₁ ^B、f₂ ^B、f₃ ^B为待预测样本的待预测单体特征，将F₁ ^B、F₂ ^B、F₃ ^B分别输入对应的目标特征提取模型R₁、R₂、R₃，以获得多个待预测特征表征，而后将多个待预测特征表征以及待预测单体特征输入目标预测模型G得到预测结果(即类别标签)。

参照图8，图8中，F₁ ^B、F₂ ^B、F₃ ^B为待预测样本对应的待预测样本特征组，将F₁ ^B、F₂ ^B、F₃ ^B分别输入对应的目标特征提取模型R₁、R₂、R₃，以获得多个待预测特征表征，而后将多个待预测特征表征输入目标预测模型G得到预测结果(即类别标签)。

本实施例提出的基于迁移学习的数据处理方法，通过基于预设业务需求对第二业务场景的待预测样本的特征进行分组，以获得待预测样本特征组；接着将待预测样本特征组输入对应的目标特征提取模型，以获得多个待预测特征表征；而后将待预测特征表征对应的特征表征集输入目标预测模型，以获得预测结果，实现了通过目标模型对待预测样本进行预测，通过迁移学习得到的目标特征提取模型能够提高预测结果的准确性，通过目标预测模型可以解释得到预测结果的原因，以实现模型迁移与模型可解释的兼顾。

本发明实施例还提供一种基于迁移学习的数据处理装置，参照图9，图9为本发明基于迁移学习的数据处理装置一实施例的功能模块示意图，所述基于迁移学习的数据处理装置包括：

分组模块100，用于基于预设业务需求对第一业务场景的第一样本的特征进行分组，以获得预设个数的第一样本特征组，并基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得预设个数的第二样本特征组；

表征提取模块200，用于基于每一个第一样本特征组及其对应的特征提取模型，确定第一样本特征表征，并基于每一个第二样本特征组及其对应的特征提取模型，确定第二样本特征表征；

模型确定模块300，用于基于每一个第一样本特征表征及其对应的领域区分模型，确定第一领域区分损失值，基于每一个第二样本特征表征及其对应的领域区分模型，确定第二领域区分损失值，并基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型；

第一预测模型确定模块400，用于基于所述第一特征表征以及待训练预测模型，确定第一预测损失值以及训练后的预测模型，并基于所述第一预测损失值以及各个第一特征提取模型，确定第二特征提取模型；

第二预测模型确定模块500，用于基于所述第二特征表征以及训练后的预测模型，确定第二预测损失值以及目标预测模型，基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型。

可选地，第一模型确定模块200，还用于：

可选地，第二模型确定模块300，还用于：

可选地，第一预测模型确定模块400，还用于：

可选地，第二预测模型确定模块500，还用于：

可选地，获取模块100，还用于：

第一预测模型确定模块400，还用于：

可选地，获取模块100，还用于：

第二预测模型确定模块500，还用于：

可选地，所述目标预测模型为欺诈评分预测模型；所述第一业务场景包括用户的信用评分场景，所述第二业务场景包括用户的欺诈评分场景，所述第一样本包括为第一参与方中的信用评分数据，第二样本为第一参与方中的欺诈评分数据；

模型确定模块300，还用于：

第一预测模型确定模块400，还用于：

第二预测模型确定模块500，还用于：

可选地，所述基于迁移学习的数据处理装置还包括：

基于预设业务需求对第二业务场景的待预测样本的特征进行分组，以获得待预测样本特征组；

可选地，所述基于迁移学习的数据处理装置还包括：

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有基于迁移学习的数据处理程序，所述基于迁移学习的数据处理程序被处理器执行时实现如上所述的基于迁移学习的数据处理方法的步骤。

其中，在所述处理器上运行的基于迁移学习的数据处理程序被执行时所实现的方法可参照本发明基于迁移学习的数据处理方法各个实施例，此处不再赘述。

此外，本发明实施例还提出一种计算机程序产品，所述计算机程序产品执行时实现如上所述的基于迁移学习的数据处理方法的步骤。

其中，计算机程序产品执行基于迁移学习的数据处理程序时所实现的方法可参照本发明基于迁移学习的数据处理方法各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于迁移学习的数据处理方法，其特征在于，所述基于迁移学习的数据处理方法包括以下步骤：

2.如权利要求1所述的基于迁移学习的数据处理方法，其特征在于，所述基于每一个第一样本特征表征及其对应的领域区分模型，确定第一领域区分损失值的步骤包括：

3.如权利要求2所述的基于迁移学习的数据处理方法，其特征在于，所述基于每一个第二样本特征表征及其对应的领域区分模型，确定一第二领域区分损失值，并基于第一领域区分损失值以及第二领域区分损失值，更新各个特征提取模型，以获得第一特征提取模型的步骤包括：

4.如权利要求1所述的基于迁移学习的数据处理方法，其特征在于，所述基于所述第一特征表征以及可解释的待训练预测模型，确定第一预测损失值以及训练后的预测模型，并基于所述第一预测损失值以及各个第一特征提取模型，确定第二特征提取模型的步骤包括：

5.如权利要求4所述的基于迁移学习的数据处理方法，其特征在于，所述基于所述第二特征表征以及训练后的预测模型，确定第二预测损失值以及目标预测模型，基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型的步骤包括：

6.如权利要求5所述的基于迁移学习的数据处理方法，其特征在于，所述基于预设业务需求对第一业务场景的第一样本的特征进行分组，以获得预设个数的第一样本特征组的步骤包括：

7.如权利要求5所述的基于迁移学习的数据处理方法，其特征在于，所述基于预设业务需求对第二业务场景的第二样本的特征进行分组，以获得预设个数的第二样本特征组的步骤包括：

8.如权利要求1所述的基于迁移学习的数据处理方法，所述目标预测模型为欺诈评分预测模型；所述第一业务场景包括用户的信用评分场景，所述第二业务场景包括用户的欺诈评分场景，所述第一样本包括为第一参与方中的信用评分数据，第二样本为第一参与方中的欺诈评分数据；

9.如权利要求1至8任一项所述的基于迁移学习的数据处理方法，其特征在于，所述基于所述第二预测损失值以及第二特征提取模型，确定目标特征提取模型的步骤之后，所述基于迁移学习的数据处理方法还包括：

10.如权利要求9所述的基于迁移学习的数据处理方法，其特征在于，所述基于预设业务需求对第二业务场景的待预测样的特征本进行分组，以获得待预测样本特征组的步骤包括：

11.一种基于迁移学习的数据处理装置，其特征在于，所述基于迁移学习的数据处理装置包括：

12.一种基于迁移学习的数据处理设备，其特征在于，所述基于迁移学习的数据处理设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于迁移学习的数据处理程序，所述基于迁移学习的数据处理程序被所述处理器执行时实现如权利要求1至10中任一项所述的基于迁移学习的数据处理方法的步骤。

13.一种存储介质，其特征在于，所述存储介质上存储有基于迁移学习的数据处理程序，所述基于迁移学习的数据处理程序被处理器执行时实现如权利要求1至10中任一项所述的基于迁移学习的数据处理方法的步骤。

14.一种计算机程序产品，其特征在于，所述计算机程序产品执行时实现如权利要求1至10中任一项所述的基于迁移学习的数据处理方法的步骤。