CN115238826B - 一种模型训练的方法、装置、存储介质及电子设备 - Google Patents

一种模型训练的方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN115238826B
CN115238826B CN202211121861.6A CN202211121861A CN115238826B CN 115238826 B CN115238826 B CN 115238826B CN 202211121861 A CN202211121861 A CN 202211121861A CN 115238826 B CN115238826 B CN 115238826B
Authority
CN
China
Prior art keywords
data
prediction result
model
prediction
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211121861.6A
Other languages
English (en)
Other versions
CN115238826A (zh
Inventor
赵闻飙
吴星
孟昌华
王维强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202211121861.6A priority Critical patent/CN115238826B/zh
Publication of CN115238826A publication Critical patent/CN115238826A/zh
Application granted granted Critical
Publication of CN115238826B publication Critical patent/CN115238826B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,首先获取样本业务数据以及隐私数据,将获取到的样本业务数据以及隐私数据输入到待训练的参照模型中,得到第一预测结果,以及,将样本业务数据输入到待训练的预测模型中,得到第二预测结果,以最小化第一预测结果与第二预测结果之间的偏差,以及最小化第一预测结果与样本业务数据对应的标签数据之间的偏差为优化目标,对参照模型以及预测模型进行联合训练,其中,训练后的预测模型应用于业务执行。

Description

一种模型训练的方法、装置、存储介质及电子设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种模型训练的方法、装置、存储介质及电子设备。
背景技术
随着机器学习的不断发展,目前已在诸多的业务领域中使用机器学习模型来执行各项业务。
然而,在模型使用的过程中,通常会将用户的隐私数据也输入到模型中,这一过程可能会存在泄漏用户隐私数据的可能,从而给用户的信息安全带来一定的隐患。
发明内容
本说明书提供一种模型训练的方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种模型训练的方法,包括:
获取样本业务数据以及隐私数据;
将所述样本业务数据以及所述隐私数据输入到待训练的参照模型中,得到第一预测结果,以及,将所述样本业务数据输入到待训练的预测模型中,得到第二预测结果;
以最小化所述第一预测结果与所述第二预测结果之间的偏差,以及最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练,其中,训练后的所述预测模型应用于业务执行。
可选地,以最小化所述第一预测结果与所述第二预测结果之间的偏差,以及最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练,具体包括:
以最小化所述第一预测结果与所述第二预测结果之间的偏差,最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差以及最小化所述第二预测结果与所述标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练。
可选地,所述方法还包括:
获取用户的业务数据;
将所述业务数据输入到所述预测模型中,获取到所述预测模型输出的预测结果,其中,所述预测模型是根据上述模型训练的方法训练得到的;
根据所述预测结果,执行业务。
可选地,获取用户的业务数据,具体包括:
获取用户执行业务所需的初始数据;
从所述初始数据中识别出所述用户的隐私数据;
将所述隐私数据从所述初始数据中剔除,得到执行业务所需的业务数据。
本说明书提供了一种模型训练的装置,包括:
获取模块,用于获取样本业务数据以及隐私数据;
输入模块,用于将所述样本业务数据以及所述隐私数据输入到待训练的参照模型中,得到第一预测结果,以及,将所述样本业务数据输入到待训练的预测模型中,得到第二预测结果;
训练模块,用于以最小化所述第一预测结果与所述第二预测结果之间的偏差,以及最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练,其中,训练后的所述预测模型应用于业务执行。
可选地,所述训练模块具体用于,以最小化所述第一预测结果与所述第二预测结果之间的偏差,最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差以及最小化所述第二预测结果与所述标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练。
可选地,所述装置还包括:
应用模块,用于获取用户的业务数据;将所述业务数据输入到所述预测模型中,获取到所述预测模型输出的预测结果,其中,所述预测模型是根据上述模型训练的方法训练得到的;根据所述预测结果,执行业务。
可选地,所述应用模块具体用于,获取用户执行业务所需的初始数据;从所述初始数据中识别出所述用户的隐私数据;将所述隐私数据从所述初始数据中剔除,得到执行业务所需的业务数据。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练的方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练的方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的模型训练的方法,首先获取样本业务数据以及隐私数据,将获取到的样本业务数据以及隐私数据输入到待训练的参照模型中,得到第一预测结果,以及,将样本业务数据输入到待训练的预测模型中,得到第二预测结果,以最小化第一预测结果与第二预测结果之间的偏差,以及最小化第一预测结果与样本业务数据对应的标签数据之间的偏差为优化目标,对参照模型以及预测模型进行联合训练,其中,训练后的预测模型应用于业务执行。
从上述方法中可以看出,通过上述模型训练的方法,可以根据参照模型输出的预测结果,训练预测模型。这样在使用该训练后的预测模型执行业务时,不仅不需要获取用户的隐私数据,并且在不输入用户的隐私数据情况下,也可以准确的执行相应的业务,从而在保证业务能够准确执行的前提下,避免了用户隐私泄露的可能,保证了用户的信息安全。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书提供的一种模型训练的方法的流程示意图;
图2为本说明书提供的一种模型训练的示意图;
图3为本说明书提供的一种模型训练的装置的示意图;
图4为本说明书提供的一种对应于图1的电子设备的示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中提供的一种模型训练的方法的流程示意图,包括以下步骤:
S101:获取样本业务数据以及隐私数据。
在本说明书中,具体实施模型训练的方法的执行主体可以是设置在业务平台的服务器等设备,也可以是诸如台式电脑、笔记本电脑等终端设备,为便于描述,下面仅以服务器为例,对本说明书提供的模型训练的方法进行说明。
目前,为了提高训练得到的模型的性能,往往会将用户的隐私数据也输入到模型中。这样就存在泄漏用户的隐私数据的可能,从而无法保证用户的信息安全。
为了解决上述提到的问题,本说明书提供了一种模型训练的方法,首先,服务器可以获取到样本业务数据以及隐私数据,其中,样本业务数据可以为用户在执行业务时产生的不涉及用户隐私的数据,例如,对于用户执行的支付业务来说,用户的支付金额、用户账号、用于表征用户支付方式的信息、付款账户的信息等数据可以视为用户执行支付业务的业务数据。而对于用户的年龄、姓名、电话号码、设备信息等数据,则可以视为用户的隐私数据。
再例如,对于信息推荐业务来说,用户在客户端展示的搜索词输入框内输入的搜索词、用户自行设置的信息偏好标签(每个信息偏好标签对应一种类型的信息)、用户的历史浏览记录等数据可以视为用户的业务数据,而用户的年龄、性别、收入、地理位置等信息则可以视为是用户的隐私数据。
在本说明书中,服务器可以获取用户执行历史业务所产生的业务数据,并将获取到的业务数据,作为样本业务数据,以在后续过程中,对参照模型和预测模型进行训练。而与样本业务数据对应的隐私数据,则可以是指授权允许获取自身隐私数据的用户的隐私数据。
对于一个训练样本来说,该训练样本中包含的样本业务数据和隐私数据可以归属于同一对象,如,对于一个业务场景来说,用户的业务数据和用户自身的隐私数据都归属于该用户,那么,用户的业务数据可以作为样本业务数据,并与该用户自身的隐私数据构建出一个训练样本。
样本业务数据可以是指用户在历史上执行一次业务所产生的业务数据,如,用户执行一次支付业务所产生的业务数据。样本业务数据也可以是指用户在一个历史时间段内执行的业务所产生的业务数据,抑或是指用户在历史上执行过的所有业务所产生的业务数据。
需要说明的是,上述提到的样本业务数据和用户的隐私数据也可以是人为通过经验自行构建出的,即,样本业务数据和用户的隐私数据也可以不是从真实的数据源中获取的业务数据和隐私数据。
S102:将所述样本业务数据以及所述隐私数据输入到待训练的参照模型中,得到第一预测结果,以及,将所述样本业务数据输入到待训练的预测模型中,得到第二预测结果。
在本说明书中,可以采用联合训练的方式对参照模型和预测模型进行同时训练,其中,对参照模型进行训练的目的是主要在于:希望参照模型能够将通过样本业务数据和隐私数据所学习到的“知识”,传递给预测模型,使得训练后的预测模型即使不使用用户的隐私数据,也能够得到准确的结果。所以,参照模型具体是应用于模型训练阶段的,而预测模型则应用于实际使用中。
所以,参数模型和预测模型在训练阶段中,各自的输入是有所不同的。具体的,服务器在获取到样本业务数据以及隐私数据后,需要将样本业务数据以及隐私数据输入到待训练的参照模型中,得到参照模型输出的第一预测结果。
其中,服务器可以直接将一个训练样本中的样本业务数据和隐私数据输入到待训练的参照模型中,待训练的参照模型可以对该样本业务数据和隐私数据进行编码、提取特征等数据处理,并根据得到的处理后数据得到第一预测结果。
当然,在本说明书中,服务器也可以先将样本业务数据和隐私数据在输入到参照模型之前,可以先将其转换为特征向量的形式,然后,转换样本业务数据和隐私数据得到的特征向量输入到参照模型中,以得到第一预测结果。
对于不同的业务来说,参照模型输出的第一预测结果的具体形式也有所不同,例如,对于业务风控的场景来说,服务器可以将用户的支付金额、用户账号等样本业务数据以及用户年龄、用户收入、用户性别等隐私数据输入到参照模型中,参照模型对这些数据进行处理后得到的第一预测结果,可以是用户执行支付业务的风险概率,其中,若该风险概率越大,则说明用户执行此次支付业务存在风险的可能性越高,若该风险概率越小,则说明用户执行此次支付业务存在风险的可能性越低。再例如,对于信息推荐业务来说,服务器可以将用户输入的搜索词、用户的历史浏览记录以及待推荐信息等样本业务数据,以及用户的年龄、性别、月支付金额等隐私数据输入到参照模型中,参照模型对这些数据进行数据处理后得到的第一预测结果可以是参照模型预测出的用户点击每个待推荐信息的概率。
与此同时,服务器也需要将样本业务数据输入到待训练的预测模型中,得到待训练的预测模型输出的第二预测结果。其中,服务器可以直接将样本业务数据直接输入到预测模型中,也可以先将样本业务数据转换成特征向量,然后再将特征向量输入到预测模型中,以得到第二预测结果。这里提到的第二预测结果与上述第一预测结果相同,都是对于不同的业务来说,可以有不同的具体形式,在此就不再赘述了。而需要指出的是,由于在后续的业务执行过程中,只需要使用训练后的预测模型,所以,无论是在模型训练阶段还是模型的实际使用阶段,预测模型的输入均不包含有用户的隐私数据。
由于参照模型和预测模型在输入上有所不同,所以,参照模型和预测模型在模型结构以及模型参数上也将有所不同。其中,参照模型的模型结构在总体上相较于预测模型的模型结构复杂,并且,预测模型中所包含的网络层可以来自于参照模型中所包含的网络层。可以理解为预测模型的功能可以来自于参照模型。
S103:以最小化所述第一预测结果与所述第二预测结果之间的偏差,以及最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练,其中,训练后的所述预测模型应用于业务执行。
由于在本说明书中是采用联合训练的方式来同时训练参照模型和预测模型的,所以,服务器一是需要保证参照模型所输出的第一预测结果与样本业务数据对应的标签数据之间偏差最小化,其目的就是要保证参照模型能够较好的通过样本业务数据和隐私数据学习到的相应的“知识,这里所谓的学习到相应的“知识”,可以理解为参照模型通过第一预测结果与样本业务数据对应的标签数据之间的偏差最小化,学习到根据输入的样本业务数据和隐私数据如何准确得到输出结果的能力。二是需要保证参照模型所输出的第一预测结果与预测模型所输出的第二预测结果之间的偏差最小化,其目的就是要将学习到的“知识”,传递给预测模型,即,通过预测模型通过第一预测结果与第二预测结果之间的偏差最小化,学习到参照模型如何根据输入数据准确得到输出结果的能力,以及学习如何能够只使用样本业务数据,就能得到参照模型所输出的结果的能力。
基于此,在本说明书中,服务器可以确定样本业务数据对应的标签数据,并以最小化第一预测结果与第二预测结果之间的偏差,以及最小化第二预测结果与样本业务数据对应的标签数据之间的偏差为优化目标,对预测模型进行训练。其中,确定样本业务数据对应的标签数据的方式可以为手动标注,也可以使用服务器自动标注。而所谓的训练,即是通过设置合理的优化目标,自动调整模型内的模型参数,使得模型能够根据输入的数据,得到合理、准确的输出结果。
当然,为了进一步地提高模型的训练效果,在本说明书中,也可以引入以最小化预测模型输出的第二预测结果与上述标签数据之间的偏差的优化目标,对预测模型和参照模型进行联合训练。即,服务器也可以以最小化第一预测结果与第二预测结果之间的偏差,最小化第一预测结果与样本业务数据对应的标签数据之间的偏差以及最小化第二预测结果与标签数据之间的偏差为优化目标,对参照模型以及预测模型进行联合训练。所谓的联合训练,即是指通过设置的合理的优化目标,同时调整参照模型和预测模型的模型参数,从而达到一同训练参照模型和预测模型的效果。
从上述方法中可以看出,通过上述模型训练的方法,可以根据参照模型输出的预测结果,训练预测模型。这样在使用该训练后的预测模型执行业务时,不仅不需要获取用户的隐私数据,并且在不输入用户的隐私数据情况下,也可以准确的执行相应的业务,从而在保证业务能够准确执行的前提下,避免了用户隐私泄露的可能,保证了用户的信息安全。
另外,在本说明书中,参照模型也可以为预先训练好的模型,训练的方式可以先通过样本业务数据以及隐私数据,构建用于训练参照模型的训练样本,服务器根据构建出的训练样本,采用诸如有监督训练等常规训练方式,训练参照模型。
在这种情况下,参照模型的一个主要作用则是用于输出用于对预测模型进行训练的标签数据。所以,服务器可以最小化参照模型输出的第一预测结果与预测模型输出的第二预测结果之间的偏差,以及最小化第二预测结果与样本业务数据对应的标签数据之间的偏差,对预测模型进行训练。
具体的,可以参照如下损失函数,对待训练的预测模型进行训练。
Figure 660757DEST_PATH_IMAGE001
其中,
Figure 458949DEST_PATH_IMAGE002
可以为第二预测结果与样本业务数据对应的标签数据之间的损失函数,
Figure 454587DEST_PATH_IMAGE003
可以为第一预测结果与第二预测结果之间的损失函数,
Figure 350562DEST_PATH_IMAGE004
为损失函数
Figure 140663DEST_PATH_IMAGE002
的权重,
Figure 193195DEST_PATH_IMAGE005
为 损失函数
Figure 461365DEST_PATH_IMAGE003
的权重。其中,第二预测结果与样本业务数据对应的标签数据之间的损失函 数,以及第一预测结果与第二预测结果之间的损失函数可以是常规的损失函数,如交叉熵 损失函数等,本说明书不对所采用的损失函数做具体的限定。
服务器在获取到用户的业务数据后,可以将业务数据输入到上述的预测模型中,以获取到预测模型输出的预测结果,并可以根据预测结果,执行业务。
其中,为了避免用户的隐私数据泄漏,服务器可以先获取用户执行业务所需的初始数据,并从初始数据中识别出用户的隐私数据,而后,服务器可以将隐私数据从初始数据中剔除,从而得到执行业务所需的业务数据,进而通过获取到的业务数据,执行相应的业务。
值得强调的是,在实际应用中,服务器可以只使用训练的得到的预测模型执行业务,而不使用参照模型执行业务。
下面结合图2为本说明书提供的一种模型训练的示意图进行说明:
其中,服务器可以将样本业务数据以及隐私数据输入到参照模型中,获取到参照模型输出的第一预测结果,并将样本业务数据输入到待训练的预测模型中,得到第二预测结果,而后,根据第二预测结果与第一预测结果之间的损失,以及第一预测结果与样本业务数据对应标签数据之间的损失,对参照模型和预测模型进行调整,以达到同时对参照模型和预测模型进行联合训练的目的。
为了便于说明,下面将以一个具体的实例,来对上述模型训练过程进行详细介绍。
对于风控业务来说,服务器可以获取用户在历史上执行支付业务所产生的业务数据,作为样本业务数据,以及获取该用户的隐私数据。
然后,服务器可以将该样本业务数据和隐私数据输入到待训练的参照模型中,参照模型通过对这些数据进行数据处理,可以得到第一预测结果,该第一预测结果用于表示参照模型预测出的该用户执行该历史支付业务存在风险的概率。
与此同时,服务器可以将样本业务数据输入到待训练的预测模型中,预测模型通过对样本业务数据进行数据处理,可以得到第二预测结果,该第二预测结果用于表示预测模型预测出的该用户执行该历史支付业务存在风险的概率。
服务器可以参照模型预测出的该用户执行该历史支付业务存在风险的概率与用于表示该用户执行该历史支付业务时实际上是否存在风险的标签数据尽可能相接近,以及以参照模型预测出的该用户执行该历史支付业务存在风险的概率与预测模型预测出的该用户执行该历史支付业务存在风险的概率尽可能相接近为优化目标,对参照模型和预测模型进行联合训练。
在完成上述预测模型的训练后,可以将预测模型应用到实际的风控业务中,而参照模型则不需要使用在实际的风控业务中。具体的,用户在执行支付业务时,服务器可以将用户执行支付业务过程中所产生的业务数据输入到训练后的预测模型中,预测模型可以根据该业务数据,得到预测结果,该预测结果用于表示用户此时执行支付业务时存在风险的概率,进而服务器可以根据该预测结果,来对用户进行业务风控。如,若确定该概率超过预设的概率阈值,则确定用户此时执行的支付业务存在风险,进而可以停止完成最终的支付阶段,并向用户发送用于提示用户本次支付业务存在风险的提示信息。
另外,在训练过程中,具体要使用哪类隐私数据可以是人为通过实际经验来确定的,也可以是服务器通过不同用户的样本业务数据以及不同用户的实际业务结果来进行筛选的。其中,对于性别、年龄、收入、学位这些数据,即可以视为是不同类型的隐私数据。
对于具体的筛选过程来说,服务器可以先获取到在业务数据上高度相似,但是在业务标签上差异较大的各用户。如,对于风控业务来说,服务器可以筛选出在支付金额、支付方式、支付时间上都高度相似的,但是实际面临的风险情况(即业务标签)差异较大的各用户(即有些用户在支付过程中不存在风险,而有些用户在支付过程中存在风险)。
在筛选出这些用户后,服务器可以先从隐私数据所涉及的所有数据类型中,选择一部分类型,得到类型集合。而后,针对筛选出的每个用户,服务器可以先将该用户的样本业务数据和该用户在类型集合中包含的类型下的隐私数据输入到经过预训练的参照模型中,得到该用户对应的预测结果。
在得到每个用户对应的预测结果后,服务器可以根据每个用户对应的预测结果与每个用户实际的业务标签之间的偏差,来确定出服务器基于类型集合包含的类型下的隐私数据进行预测的准确率,进而根据准确率,来确定具体应该使用哪些类型的隐私数据。
具体的,如果确定出该准确率超过预设阈值,则可以确定类型集合中包含的类型是合理的,进而可以在此基础上,再选择一些类型,加入到类型集合中,进而在根据加入新类型后的类型集合所对应的隐私数据,来进行预测,并根据得到的准确率,再次调整类型集合,直到满足预设的条件为止。其中,这里提到的预设的停止条件可以有多种,如,筛选出的类型集合中包含的类型的数量超过阈值,或是,服务器基于类型集合对应的隐私数据进行预测的准确率超过设定准确率等,在此就不详细举例说明了。
当然,若是确定出该准确率未超过上述预设阈值,则可以将类型集合中的至少部分类型移出,再加入一些新的类型,并根据加入新类型后的类型集合所对应的隐私数据,来进行预测,并根据得到的准确率,来对类型集合进行调整,直到满足预设的停止条件为止,从而确定出具体应该使用哪些类型的隐私数据。
图3为本说明书提供的一种模型训练的装置的示意图,包括:
获取模块301,用于获取样本业务数据以及隐私数据;
输入模块302,用于将所述样本业务数据以及所述隐私数据输入到待训练的参照模型中,得到第一预测结果,以及,将所述样本业务数据输入到待训练的预测模型中,得到第二预测结果;
训练模块303,用于以最小化所述第一预测结果与所述第二预测结果之间的偏差,以及最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练,其中,训练后的所述预测模型应用于业务执行。
可选地,训练模块303,具体用于,以最小化所述第一预测结果与所述第二预测结果之间的偏差,最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差以及最小化所述第二预测结果与所述标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练。
可选地,所述装置还包括:
应用模块304,用于获取用户的业务数据;将所述业务数据输入到所述预测模型中,获取到所述预测模型输出的预测结果,其中,所述预测模型是根据上述模型训练的方法训练得到的;根据所述预测结果,执行业务。
可选地,应用模块304,具体用于,获取用户执行业务所需的初始数据;从所述初始数据中识别出所述用户的隐私数据;将所述隐私数据从所述初始数据中剔除,得到执行业务所需的业务数据。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的一种模型训练的方法。
本说明书还提供了图4所示的一种对应于图1的电子设备的示意结构图。如图4所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的模型训练的方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device, PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、***、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (10)

1.一种模型训练的方法,包括:
获取样本业务数据以及隐私数据;
将所述样本业务数据以及所述隐私数据输入到待训练的参照模型中,得到第一预测结果,以及,将所述样本业务数据输入到待训练的预测模型中,得到第二预测结果;
以最小化所述第一预测结果与所述第二预测结果之间的偏差,以及最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练,其中,训练后的所述预测模型应用于业务执行。
2.如权利要求1所述的方法,以最小化所述第一预测结果与所述第二预测结果之间的偏差,以及最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练,具体包括:
以最小化所述第一预测结果与所述第二预测结果之间的偏差,最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差以及最小化所述第二预测结果与所述标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练。
3.如权利要求1所述的方法,所述方法还包括:
获取用户的业务数据;
将所述业务数据输入到所述预测模型中,获取到所述预测模型输出的预测结果,其中,所述预测模型是根据上述权利要求1或2所述的方法训练得到的;
根据所述预测结果,执行业务。
4.如权利要求3所述的方法,获取用户的业务数据,具体包括:
获取用户执行业务所需的初始数据;
从所述初始数据中识别出所述用户的隐私数据;
将所述隐私数据从所述初始数据中剔除,得到执行业务所需的业务数据。
5.一种模型训练的装置,包括:
获取模块,用于获取样本业务数据以及隐私数据;
输入模块,用于将所述样本业务数据以及所述隐私数据输入到待训练的参照模型中,得到第一预测结果,以及,将所述样本业务数据输入到待训练的预测模型中,得到第二预测结果;
训练模块,用于以最小化所述第一预测结果与所述第二预测结果之间的偏差,以及最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练,其中,训练后的所述预测模型应用于业务执行。
6.如权利要求5所述的装置,所述训练模块具体用于,以最小化所述第一预测结果与所述第二预测结果之间的偏差,最小化所述第一预测结果与所述样本业务数据对应的标签数据之间的偏差以及最小化所述第二预测结果与所述标签数据之间的偏差为优化目标,对所述参照模型以及所述预测模型进行联合训练。
7.如权利要求5所述的装置,所述装置还包括:
应用模块,用于获取用户的业务数据;将所述业务数据输入到所述预测模型中,获取到所述预测模型输出的预测结果,其中,所述预测模型是根据上述权利要求1或2所述的方法训练得到的;根据所述预测结果,执行业务。
8.如权利要求7所述的装置,所述应用模块具体用于,获取用户执行业务所需的初始数据;从所述初始数据中识别出所述用户的隐私数据;将所述隐私数据从所述初始数据中剔除,得到执行业务所需的业务数据。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~4任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~4任一项所述的方法。
CN202211121861.6A 2022-09-15 2022-09-15 一种模型训练的方法、装置、存储介质及电子设备 Active CN115238826B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211121861.6A CN115238826B (zh) 2022-09-15 2022-09-15 一种模型训练的方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211121861.6A CN115238826B (zh) 2022-09-15 2022-09-15 一种模型训练的方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN115238826A CN115238826A (zh) 2022-10-25
CN115238826B true CN115238826B (zh) 2022-12-27

Family

ID=83682027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211121861.6A Active CN115238826B (zh) 2022-09-15 2022-09-15 一种模型训练的方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN115238826B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115545720B (zh) * 2022-11-29 2023-03-10 支付宝(杭州)信息技术有限公司 一种模型训练的方法、业务风控的方法及装置
CN116109008B (zh) * 2023-04-04 2023-07-04 支付宝(杭州)信息技术有限公司 一种业务执行的方法、装置、存储介质及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113221717A (zh) * 2021-05-06 2021-08-06 支付宝(杭州)信息技术有限公司 一种基于隐私保护的模型构建方法、装置及设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110868326B (zh) * 2019-11-27 2022-07-19 武汉虹旭信息技术有限责任公司 网络服务质量的分析方法、边缘设备及中心服务器
US11803657B2 (en) * 2020-04-23 2023-10-31 International Business Machines Corporation Generation of representative data to preserve membership privacy
CN111738441B (zh) * 2020-07-31 2020-11-17 支付宝(杭州)信息技术有限公司 兼顾预测精度和隐私保护的预测模型训练方法及装置
CN111931216B (zh) * 2020-09-16 2021-03-30 支付宝(杭州)信息技术有限公司 一种基于隐私保护的方式获取联合训练模型的方法及***
US11770407B2 (en) * 2021-01-12 2023-09-26 Walmart Apollo, Llc Methods and apparatuses for defending against data poisoning attacks in recommender systems
CN112800468B (zh) * 2021-02-18 2022-04-08 支付宝(杭州)信息技术有限公司 一种基于隐私保护的数据处理方法、装置及设备
CN113221747B (zh) * 2021-05-13 2022-04-29 支付宝(杭州)信息技术有限公司 一种基于隐私保护的隐私数据处理方法、装置及设备
CN113094758B (zh) * 2021-06-08 2021-08-13 华中科技大学 一种基于梯度扰动的联邦学习数据隐私保护方法及***
CN113378982A (zh) * 2021-07-02 2021-09-10 支付宝(杭州)信息技术有限公司 一种图像处理模型的训练方法和***
CN114003949B (zh) * 2021-09-30 2022-08-30 清华大学 基于隐私数据集的模型训练方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113221717A (zh) * 2021-05-06 2021-08-06 支付宝(杭州)信息技术有限公司 一种基于隐私保护的模型构建方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向移动终端智能的自治学习***;徐梦炜等;《软件学报》;20201014(第10期);全文 *

Also Published As

Publication number Publication date
CN115238826A (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
CN115238826B (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN112966186A (zh) 一种模型训练和信息推荐的方法及装置
CN113688313A (zh) 一种预测模型的训练方法、信息推送的方法及装置
CN110008991B (zh) 风险事件的识别、风险识别模型的生成方法、装置、设备及介质
CN113643119A (zh) 一种模型训练的方法、业务风控的方法及装置
CN114997472A (zh) 一种模型训练的方法、业务风控的方法及装置
CN114882311A (zh) 一种训练集的生成方法及装置
CN111507726A (zh) 一种报文生成方法、装置及设备
CN112966577B (zh) 一种模型训练以及信息提供的方法及装置
CN112561162A (zh) 一种信息推荐的方法及装置
CN116308738B (zh) 一种模型训练的方法、业务风控的方法及装置
CN115545353B (zh) 一种业务风控的方法、装置、存储介质及电子设备
CN115563584B (zh) 一种模型训练方法、装置、存储介质及电子设备
CN116822606A (zh) 一种异常检测模型的训练方法、装置、设备及存储介质
CN114996570A (zh) 一种信息推荐的方法及装置
CN116188023A (zh) 一种风险识别模型训练的方法、装置、存储介质及设备
CN115017905A (zh) 一种模型训练和信息推荐的方法及装置
CN113343085B (zh) 一种信息推荐方法、装置、存储介质及电子设备
CN115758141A (zh) 一种模型训练和业务风控的方法及装置
CN113344590A (zh) 一种模型训练以及投诉率预估的方法及装置
CN114331602A (zh) 一种基于迁移学习的模型训练方法、信息推荐方法及装置
CN110704742B (zh) 一种特征提取方法及装置
CN115018866A (zh) 一种边界确定方法、装置、存储介质及电子设备
CN109325127B (zh) 一种风险识别方法和装置
CN111539962A (zh) 一种目标图像分类方法、装置以及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant