CN114819614A - 数据处理方法、装置、***及设备 - Google Patents
数据处理方法、装置、***及设备 Download PDFInfo
- Publication number
- CN114819614A CN114819614A CN202210429444.1A CN202210429444A CN114819614A CN 114819614 A CN114819614 A CN 114819614A CN 202210429444 A CN202210429444 A CN 202210429444A CN 114819614 A CN114819614 A CN 114819614A
- Authority
- CN
- China
- Prior art keywords
- user
- risk identification
- risk
- trained
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 180
- 238000012545 processing Methods 0.000 claims abstract description 121
- 238000000034 method Methods 0.000 claims abstract description 69
- 230000006870 function Effects 0.000 claims description 43
- 238000000605 extraction Methods 0.000 claims description 14
- 230000001960 triggered effect Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 description 27
- 238000012546 transfer Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 17
- 238000004590 computer program Methods 0.000 description 12
- 230000006399 behavior Effects 0.000 description 10
- 230000006872 improvement Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000003993 interaction Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本说明书实施例提供了一种数据处理方法、装置、***及设备,其中,该方法包括:接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型。
Description
技术领域
本文件涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、***及设备。
背景技术
随着计算机技术的快速发展,如网上银行等为用户提供资源转移服务的企业的用户量急剧增长,企业所面临的数据风险也越来越大,为降低数据风险,企业可以通过构建风险识别模型的方式进行风险识别处理。例如,企业可以基于本地存储的用户样本数据和风险标签,对风险识别模型进行训练,并基于训练后的风险识别模型进行风险识别处理。
但是,如网上银行等企业可能存在用户样本数据及风险标签的数据量少,数据质量差的情况,这就会导致训练得到的风险识别模型的风险识别效果差,风险识别的准确性低,因此,需要一种能够提高风险识别模型的风险识别效果以及风险识别准确性的解决方案。
发明内容
本说明书实施例的目的是提供一种数据处理方法、装置、***及设备,以提供一种能够提高风险识别模型的风险识别效果以及风险识别准确性的解决方案。
为了实现上述技术方案,本说明书实施例是这样实现的:
第一方面,一种数据处理方法,包括:接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
第二方面,本说明书实施例提供的一种数据处理方法,包括:在检测到目标用户触发执行目标业务的情况下,获取所述目标用户的第一特征数据;将所述目标用户的第一特征数据输入预先训练的第二风险识别模型,得到所述目标用户的目标风险识别结果,所述预先训练的第二风险识别模型为基于第一用户的第二特征数据、所述第一用户的风险识别结果、第二用户的特征数据以及所述第二用户的风险识别结果进行训练得到,所述第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;基于所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
第三方面,本说明书实施例提供的一种数据处理***,包括服务端和客户端,其中:所述客户端,用于将第一用户的用户标识发送给所述服务端;所述服务端,用于基于所述用户标识获取所述第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;所述客户端,用于基于所述第一用户的第二特征数据和所述服务端返回的所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型,并基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
第四方面,本说明书实施例提供了一种数据处理装置,包括:结果接收模块,用于接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;第一训练模块,用于基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;第二训练模块,用于基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
第五方面,本说明书实施例提供了一种数据处理装置,包括:数据获取模块,用于在检测到目标用户触发执行目标业务的情况下,获取所述目标用户的第一特征数据;结果获取模块,用于将所述目标用户的第一特征数据输入预先训练的第二风险识别模型,得到所述目标用户的目标风险识别结果,所述预先训练的第二风险识别模型为基于第一用户的第二特征数据、所述第一用户的风险识别结果、第二用户的特征数据以及所述第二用户的风险识别结果进行训练得到,所述第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;风险确定模块,用于基于所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
第六方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
第七方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:在检测到目标用户触发执行目标业务的情况下,获取所述目标用户的第一特征数据;将所述目标用户的第一特征数据输入预先训练的第二风险识别模型,得到所述目标用户的目标风险识别结果,所述预先训练的第二风险识别模型为基于第一用户的第二特征数据、所述第一用户的风险识别结果、第二用户的特征数据以及所述第二用户的风险识别结果进行训练得到,所述第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;基于所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
第八方面,本说明书实施例提供了一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
第九方面,本说明书实施例提供了一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:在检测到目标用户触发执行目标业务的情况下,获取所述目标用户的第一特征数据;将所述目标用户的第一特征数据输入预先训练的第二风险识别模型,得到所述目标用户的目标风险识别结果,所述预先训练的第二风险识别模型为基于第一用户的第二特征数据、所述第一用户的风险识别结果、第二用户的特征数据以及所述第二用户的风险识别结果进行训练得到,所述第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;基于所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1A为本说明书一种数据处理方法实施例的流程图;
图1B为本说明书一种数据处理方法的处理过程示意图;
图2为本说明书又一种数据处理方法的处理过程示意图;
图3为本说明书一种第二风险识别模型的初始化训练和参数更新过程的示意图;
图4A为本说明书又一种数据处理方法实施例的流程图;
图4B为本说明书又一种数据处理方法的处理过程示意图;
图5为本说明书又一种数据处理方法的处理过程示意图;
图6为本说明书一种数据处理***的示意图;
图7为本说明书另一种数据处理装置实施例的结构示意图;
图8为本说明书另一种数据处理装置实施例的结构示意图;
图9为本说明书一种数据处理设备的结构示意图。
具体实施方式
本说明书实施例提供一种数据处理方法、装置、***及设备。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
实施例一
如图1A和1B所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为客户端,该客户端可以是服务器或终端设备,其中,服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群,终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备。该方法具体可以包括以下步骤:
在S102中,接收服务端针对第一用户的风险识别结果。
其中,第一用户的风险识别结果可以为服务端基于预先训练的第一风险识别模型对第一用户的第一特征数据进行风险识别得到,第一用户可以是使用客户端提供的任意服务的历史用户,第一用户的第一特征数据可以是服务端存储的包括第一用户的属性信息(如性别、年龄、地区等)、行为信息(如转账行为、通话行为等)等,例如,第一用户可以是近一个月内使用客户端提供的资源转移服务进行转账的任意一个或多个用户,预先训练的第一风险识别模型可以为服务端基于预设第一数量的用户特征数据(包括用户的属性信息、行为信息等特征数据)进行训练得到,第一风险识别模型可以是基于预设深度学习算法构建的用于进行风险识别的模型,预设第一数量可以大于预设样本数量阈值,例如,预先训练的第一风险识别模型可以是服务端基于1000条用户特征数据,对由深度神经网络(DeepNeural Networks,DNN)算法构建的风险识别模型进行训练得到。
在实施中,随着计算机技术的快速发展,如网上银行等为用户提供资源转移服务的企业的用户量急剧增长,企业所面临的数据风险也越来越大,为降低数据风险,企业可以通过构建风险识别模型的方式进行风险识别处理。例如,企业可以基于本地存储的用户样本数据和风险标签,对风险识别模型进行训练,并基于训练后的风险识别模型进行风险识别处理。但是,如网上银行等企业可能存在用户样本数据及风险标签的数据量少,数据质量差的情况,这就会导致训练得到的风险识别模型的风险识别效果差,风险识别的准确性低,因此,需要一种能够提高风险识别模型的风险识别效果以及风险识别准确性的解决方案。为此,本说明书实施例提供一种可以解决上述问题的技术方案,具体可以参见下述内容。
以客户端为能够为用户提供资源转移业务的机构所使用的客户端为例,由于不同的机构所拥有的用户私有数据不同,且每个机构所拥有的用户私有数据可能存在数据量较小,数据质量较差的问题,因此,为使本地使用的风险识别模型(即第二风险识别模型)达到较好的风险识别效果,可以通过与数据量较多、数据处理能力较强的服务端进行数据交互,以对本地使用的风险识别模型的模型参数进行更新操作。
客户端可以构建用于训练第二风险识别模型的第一样本数据集,该第一样本数据集中可以包括多个用户的用户标识及对应的特征数据,客户端可以将第一样本数据集中的用户标识发送给服务端,服务端可以根据用户标识确定服务端是否存在与该用户标识对应的用户以及特征数据,若存在与该用户标识对应的用户及特征数据,则可以将该用户确定为第一用户,并将该用户的特征数据确定为第一用户的第一特征数据,然后服务端可以将第一用户的第一特征数据输入预先训练的第一风险识别模型,得到针对第一用户的风险识别结果,服务端可以将针对第一用户的风险识别结果返回给客户端。
客户端可以基于接收到的第一用户的风险识别结果,对第一样本数据集进行更新筛选处理,以得到由第一用户的第二特征数据以及第一用户的风险识别结果构成的目标样本数据集。
例如,客户端可以基于预设模型训练周期内获取的用户数据,构建第一样本数据集,例如,客户端可以基于近半个月内使用资源转移业务的用户数据构建第一样本数据集,具体如,构建的第一样本数据集中可以包括用户1的特征数据以及用户1的用户标识、用户2的特征数据以及用户2的用户标识,客户端可以将用户1和用户2的用户标识发送给服务端,若服务端仅存储有用户2的特征数据,则可以将用户2确定为第一用户,服务端可以基于存储的用户2的第一特征数据和预先训练的第一风险识别模型,确定针对用户2的风险识别结果,并将用户2的风险识别结果返回给客户端。客户端可以将第一样本数据集中的用户2的特征数据确定为用户2的第二特征数据,并由用户2的第二特征数据以及服务端确定的用户2的风险识别结果,构建目标样本数据集。
在S104中,基于第一用户的第二特征数据和第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型。
其中,第二风险识别模型可以是基于预设深度学习算法构建的用于进行风险识别的模型,第二风险识别模型的模型结构可以与第一风险识别模型相同,也可以不同,例如,第一风险识别模型可以是基于决策树算法构建的模型,第二风险识别模型也可以是基于决策树算法构建的模型,或者,第二风险识别模型也可以是基于神经网络算法构建的模型。
在实施中,可以将目标样本数据集中的数据输入预设第二风险识别模型进行初始化训练,以得到初始化训练后的第二风险识别模型。
这样,由于第一用户的风险识别结果是基于服务端的预先训练的第一风险识别模型得到的,而服务端的预先训练的第一风险识别模型是基于预设第一数量的用户特征数据进行训练得到,因此,预先训练的第一风险识别模型的风险识别效果较好,基于第一用户的风险识别结果对预设第二风险识别模型进行初始化训练,可以在第一风险识别模型的辅助下,提高第二风险识别模型的风险识别效果。另外,在训练过程中,服务端的私有数据也可以实现数据不出域的目的,即可以保护服务端的私有数据的数据安全性。
在S106中,基于第二用户的特征数据以及第二用户的风险识别结果,对初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于预先训练的第二风险识别模型对用户进行风险识别处理。
其中,第二用户可以包括第一用户,第二用户的风险识别结果可以是通过人工等方式,根据第二用户的特征数据确定的风险识别结果。
在实施中,可以基于第二用户的特征数据以及第二用户的风险识别结果,对初始化训练后的第二风险识别模型的参数进行微调,以使得到的预先训练的第二风险识别模型的风险识别效果与客户端的风险识别需求的符合度更高。
如上述S102中所述,客户端可以构建第一样本数据集,并根据服务端返回的第一用户的风险识别结果和第一样本数据集,确定包含第一用户的第二特征数据和第一用户的风险识别结果的目标样本数据集。此外,客户端还可以根据第一样本数据集,构建包含第二用户的特征数据和第二用户的风险识别结果的第二样本数据集,例如,客户端可以获取与第一样数据集中的用户的特征数据对应的风险识别结果(该风险识别结果可以是客户端基于人工等方式确定的风险识别结果),并基于第一样本数据集中的用户的特征数据以及确定的风险识别结果,构建第二样本数据集,该第二样本数据集中的用户即为第二用户。
在将第二用户的特征数据以及第二用户的风险识别结果,输入初始化训练后的第二风险识别模型进行参数更新处理,就可以得到预先训练的第二风险识别模型。
此外,在第一风险识别模型和第二风险识别模型的模型结构不同的情况下,第二风险识别模型也可以在第一用户的风险识别结果的辅助下,学习第一风险识别模型的风险识别能力。即第二风险识别模型只在初始化训练过程中,依赖可公开交互的信息(即第一用户的风险识别结果),而在参数更新处理过程、以及后续的风险识别过程中,不需要引入和依赖其他额外的数据,就可以在数据完全隔离的情况下训练和部署第二风险识别模型,也不依赖复杂的底层数据交互框架,在保护私有数据的安全性的基础上,提高了第二风险识别模型的风险识别效果。
本说明书实施例提供一种数据处理方法,接收服务端针对第一用户的风险识别结果,第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对第一用户的第一特征数据进行风险识别得到,预先训练的第一风险识别模型为服务端基于预设第一数量的用户特征数据进行训练得到,基于第一用户的第二特征数据和第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型,基于第二用户的特征数据以及第二用户的风险识别结果,对初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于预先训练的第二风险识别模型对用户进行风险识别处理。这样,由于服务端仅将第一用户的风险识别结果返回给客户端,而不需要将第一用户的第一特征数据发送给客户端,即可以实现服务端的私有数据不出域,保证私有数据的安全性,同时,客户端还可以在第一用户的风险识别结果的辅助下,学习第一风险识别模型的风险识别能力,在基于本地存储的第二用户的特征数据以及风险识别结果,对初始化训练后的第二风险识别模型进行参数更新,使预先训练的第二风险识别模型可以更加符合客户端本地的风险识别需要,提高了预先训练的第二风险识别模型的风险识别效果。
实施例二
如图2所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为客户端,该客户端可以是服务器或终端设备,其中,服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群,终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备。该方法具体可以包括以下步骤:
在S102中,接收服务端针对第一用户的风险识别结果。
其中,第一用户的风险识别结果可以为服务端基于预先训练的第一风险识别模型对第一用户的第一特征数据进行风险识别得到,预先训练的第一风险识别模型可以为服务端基于预设第一数量的用户特征数据进行训练得到。
在S202中,基于第一用户的第二特征数据、第一用户的风险识别结果,以及第一损失函数,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型。
其中,第一用户的风险识别结果可以包括风险分值,第一损失函数可以为均方误差损失函数。
在S204中,基于第二用户的特征数据、第二用户的风险分类标签,以及第二损失函数,对初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型。
其中,第二用户的风险识别结果可以包括风险分类标签,第二损失函数可以为交叉熵损失函数。
在实施中,由于服务端的数据量以及数据处理能力可能皆优于客户端,因此,服务端构建的第一风险识别模型可能与第二风险识别模型的模型结构存在不同,得到的风险识别结构可能不同,例如,服务端构建的第一风险识别模型得到的第一用户的风险识别结果可能是较为复杂的连续的风险分值(如风险分值可能是0-1的任意值),而客户端本地确定的第二用户的风险识别结果可能是较为简单的二分类的风险分类标签(如0、1标签,即标签为0可以表示无风险用户,标签为1可以表示风险用户),因此,可以为初始化训练过程和参数更新过程,设定不同的损失函数。
例如,如图3所示,第二风险识别模型可以包括特征提取层和全连接层,以第二风险识别模型为基于卷积神经网络(Convolutional Neural Networks,CNN)构建的模型为例,第二风险识别模型可以包括卷积层、池化层和全连接层,其中,卷积层和池化层即为特征提取层。
客户端可以将第一用户的第二特征数据输入第二风险识别模型,得到第一用户的预测风险分值,在根据服务端基于第一用户的第一特征数据以及第一风险识别模型确定的第一用户的风险分值(即第一用户的风险识别结果)、均方误差损失函数,对第二风险识别模型进行初始化训练,得到初始化训练后的第二风险模型。
在将第二用户的特征数据输入初始化训练后的第二风险模型,得到第二用户的预测风险类型,在基于第二用户的风险分类标签、交叉熵损失函数,对初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型。
此外,为维持第二风险模型的稳定性,可以根据样本量的大小不同,确定第二风险模型的特征提取层和全连接层参数的调整幅度,具体处理过程可以参见下述步骤一~步骤二处理:
步骤一,基于第二用户的数据量和预设数量阈值,确定针对特征提取层的第一参数更新幅度,以及针对全连接层的第二参数更新幅度。
其中,第一参数更新幅度小于第二参数更新幅度。
在实施中,例如,在第二用户的数量小于预设数量阈值的情况下,可以维持初始化训练后的第二风险模型的特征提取层的参数不更新,仅对初始化训练后的第二风险识别模型的全连接层的参数进行参数更新处理;在第二用户的数量不小于预设数量阈值的情况下,可以通过正则损失函数控制初始化训练后的第二风险模型的特征提取层基于第一参数更新幅度进行更新,且对初始化训练后的第二风险识别模型的全连接层的参数基于第一参数更新幅度进行正常的参数更新处理,其中,为维持第二风险识别模型的稳定性,第一参数更新幅度可以小于第二参数更新幅度。
步骤二,基于第一参数更新幅度、第二参数更新幅度、第二用户的特征数据、第二用户的风险分类标签,以及第二损失函数,对初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型。
在实施中,假设预设数量阈值为100条,则在第二用户的数量小于100的情况下,可以维持初始化训练后的第二风险识别模型的特征提取层的参数不更新,只基于第二参数更新幅度对全连接层的参数进行更新处理,得到预先训练的第二风险识别模型;在第二用户的数量不小于100(即客户端的训练样本数据量较大)的情况下,可以基于第一参数更新幅度对初始化训练后的第二风险识别模型的特征提取层的参数进行微调,并基于第二参数更新幅度对全连接层的参数进行更新处理,以得到预先训练的第二风险识别模型。
此外,上述第一参数更新幅度和第二参数更新幅度的确定方法可以有多种,可以根据实际应用场景的不同而有所不同,本说明书实施例对此不做具体限定,
在S206中,基于预设数据处理周期,对预先训练的第二风险识别模型是否满足预设风险识别需求进行检测处理。
在实施中,例如,可以每半个月对预先训练的第二风险识别模型是否满足预设风险识别需求进行检测处理,具体的检测处理方法可以有多种,例如,可以获取近半个月内,基于预先训练的第二风险识别模型进行风险识别的准确率,若准确率小于预设准确率阈值,则可以认为预先训练的第二风险识别模型不满足预设风险识别需求,或者,还可以在预设数据处理周期内,根据预先训练的第二风险识别模型的使用场景的变化情况,确定预先训练的第二风险识别模型是否满足预设风险识别需求,例如,当预先训练的第二风险识别模型的使用场景从资源转移场景转换为身份识别场景,则可以认为预先训练的第二风险识别模型不满足预设风险识别需求。
上述对预先训练的第二风险识别模型是否满足预设风险识别需求进行检测处理的方法是一种可选地、可实现的检测方法,在实际应用场景中,还可以有多种不同的检测方法,可以根据实际应用场景的不同而有所不同,本说明书实施例对此不作具体限定。
在S208中,在检测到预先训练的第二风险识别模型不满足预设风险识别需求的情况下,基于第三用户的特征数据,对预先训练的第二风险识别模型进行更新处理。
在实施中,在实际应用中,上述S208的处理方式可以多种多样,以下提供一种可选的实现方式,具体可以参见下述步骤一~步骤四处理:
步骤一,将第三用户的特征数据输入预先训练的第二风险识别模型,得到第三用户的风险识别结果。
步骤二,在预先训练的第二风险识别模型的模型结构发生变化的情况下,将模型结构变化后的第二风险识别模型确定为第三风险识别模型。
步骤三,基于第三用户的特征数据和第三用户的风险识别结果,对第三风险识别模型进行初始化训练,得到初始化训练后的第三风险识别模型。
在实施中,由于恶意第三方的欺诈手段等更新速度较快,为提高风险识别的准确性,可以对第二风险识别模型的模型结构进行更新(例如,预先训练的第二风险模型可以是基于神经网络算法构建的风险识别模型,模型结构变化后的第二风险识别模型可以是基于决策树构建的风险识别模型),为使模型结构变化后的第二风险识别模型能够保留模型结构变化前的第二风险识别模型的风险识别能力,可以基于第三用户的特征数据和第三用户的风险识别结果,对第三风险识别模型(模型结构变化后的第二风险识别模型)进行初始化训练,得到初始化训练后的第三风险识别模型,这样,初始化训练后的第三风险识别模型就可以学习到预先训练的第二风险识别模型的风险识别能力。
步骤四,基于第四用户的特征数据以及第四用户的风险识别结果,对初始化训练后的第三风险识别模型进行参数更新处理,得到预先训练的第三风险识别模型,并将预先训练的第三风险识别模型,确定为预先训练的第二风险识别模型。
在实施中,对初始化训练后的第三风险识别模型进行参数更新处理的处理过程可以参见上述对初始化训练后的第二风险识别模型进行参数更新处理的处理过程,在此不再赘述。
本说明书实施例提供一种数据处理方法,接收服务端针对第一用户的风险识别结果,第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对第一用户的第一特征数据进行风险识别得到,预先训练的第一风险识别模型为服务端基于预设第一数量的用户特征数据进行训练得到,基于第一用户的第二特征数据和第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型,基于第二用户的特征数据以及第二用户的风险识别结果,对初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于预先训练的第二风险识别模型对用户进行风险识别处理。这样,由于服务端仅将第一用户的风险识别结果返回给客户端,而不需要将第一用户的第一特征数据发送给客户端,即可以实现服务端的私有数据不出域,保证私有数据的安全性,同时,客户端还可以在第一用户的风险识别结果的辅助下,学习第一风险识别模型的风险识别能力,在基于本地存储的第二用户的特征数据以及风险识别结果,对初始化训练后的第二风险识别模型进行参数更新,使预先训练的第二风险识别模型可以更加符合客户端本地的风险识别需要,提高了预先训练的第二风险识别模型的风险识别效果。
实施例三
如图4A和图4B所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为客户端,该客户端可以是服务器或终端设备,其中,服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群,终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备。该方法具体可以包括以下步骤:
在S402中,在检测到目标用户触发执行目标业务的情况下,获取目标用户的第一特征数据。
其中,目标业务可以是客户端能够为用户提供的任意业务,例如,目标业务可以是资源转移业务、身份验证业务等,目标用户的第一特征数据可以包括第一用户的属性信息(如性别、年龄、地区等)、行为信息(如转账行为、通话行为等)等。
在实施中,以客户端为能够为用户提供资源转移业务的机构所使用的客户端为例,目标业务可以是资源转移业务,目标用户可以触发启动客户端中安装的资源转移应用程序,并触发启动资源转移业务(即目标业务),客户端在检测到目标用户触发执行资源转移业务的情况下,可以获取目标用户的属性信息以及资源转移行为信息(如资源转移数量、资源转移时间、资源转移对象等)。
在S404中,将目标用户的第一特征数据输入预先训练的第二风险识别模型,得到目标用户的目标风险识别结果。
其中,预先训练的第二风险识别模型可以为基于第一用户的第二特征数据、第一用户的风险识别结果、第二用户的特征数据以及第二用户的风险识别结果进行训练得到,第一用户的风险识别结果可以为服务端基于预先训练的第一风险识别模型对第一用户的第一特征数据进行风险识别得到,预先训练的第一风险识别模型可以为服务端基于预设第一数量的用户特征数据进行训练得到。
在实施中,可以将目标用户的属性信息以及资源转移行为信息(如资源转移数量、资源转移时间、资源转移对象等)等第一特征数据输入预先训练的第二风险识别模型,得到目标用户的目标风险识别结果。
在S406中,基于目标风险识别结果,确定触发执行目标业务是否存在风险。
在实施中,若基于目标风险识别结果,确定触发执行目标业务存在风险,则可以向目标用户输出预设告警信息,并停止执行目标业务。
本说明书实施例提供一种数据处理方法,在检测到目标用户触发执行目标业务的情况下,获取目标用户的第一特征数据,将目标用户的第一特征数据输入预先训练的第二风险识别模型,得到目标用户的目标风险识别结果,预先训练的第二风险识别模型为基于第一用户的第二特征数据、第一用户的风险识别结果、第二用户的特征数据以及第二用户的风险识别结果进行训练得到,第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对第一用户的第一特征数据进行风险识别得到,预先训练的第一风险识别模型为服务端基于预设第一数量的用户特征数据进行训练得到,基于目标风险识别结果,确定触发执行目标业务是否存在风险。由于客户端在对第二风险模型进行训练时,除客户端本地的第一用户的第二特征数据、第二用户的特征数据以及第二用户的风险识别结果外,仅使用了服务端提供的第一用户的风险识别结果,所以,可以实现服务端的私有数据不出域,保证私有数据的安全性,这样,客户端可以在第一用户的风险识别结果的辅助下,学习第一风险识别模型的风险识别能力,并根据本地存储的第二用户的特征数据以及第二用户的风险识别结果,使得到的预先训练的第二风险识别模型更加符合客户端本地的风险识别需要,提高了预先训练的第二风险识别模型的风险识别效果,提高了针对目标用户触发执行目标业务的风险检测的准确性。
实施例四
如图5所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为客户端,该客户端可以是服务器或终端设备,其中,服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群,终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备。该方法具体可以包括以下步骤:
在S402中,在检测到目标用户触发执行目标业务的情况下,获取目标用户的第一特征数据。
在S404中,将目标用户的第一特征数据输入预先训练的第二风险识别模型,得到目标用户的目标风险识别结果。
在S502中,将目标用户的用户标识发送给服务端,并接收服务端返回的目标用户的第一风险识别结果。
其中,目标用户的第一风险识别结果可以为服务端基于预先训练的第一风险识别模型对目标用户的第二特征数据进行风险识别得到。
在S504中,基于第一风险识别结果和目标风险识别结果,确定触发执行目标业务是否存在风险。
在实施中,由于服务端的数据量以及数据处理能力可能皆优于客户端,所以,客户端还可以将目标用户的用户标识发送给服务端,并接收服务端返回的目标用户的第一风险识别结果。
此外,服务端构建的第一风险识别模型输出的模型结果可能与第二风险识别模型的模型结果存在不同,例如,服务端构建的第一风险识别模型的第一风险识别结果可能是较为复杂的连续的风险分值(如风险分值可能是0-1的任意值),而客户端本地确定的目标风险识别结果可能是较为简单的二分类的风险分类标签(如0、1标签,即标签为0可以表示无风险用户,标签为1可以表示风险用户),因此,可以结合目标用户的风险分值以及风险分类标签,确定触发执行目标业务是否存在风险。具体的风险确定方法可以根据实际应用场景的不同而选取不同的确定方法,本说明书实施例对此不作具体限定。
本说明书实施例提供一种数据处理方法,在检测到目标用户触发执行目标业务的情况下,获取目标用户的第一特征数据,将目标用户的第一特征数据输入预先训练的第二风险识别模型,得到目标用户的目标风险识别结果,预先训练的第二风险识别模型为基于第一用户的第二特征数据、第一用户的风险识别结果、第二用户的特征数据以及第二用户的风险识别结果进行训练得到,第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对第一用户的第一特征数据进行风险识别得到,预先训练的第一风险识别模型为服务端基于预设第一数量的用户特征数据进行训练得到,基于目标风险识别结果,确定触发执行目标业务是否存在风险。由于客户端在对第二风险模型进行训练时,除客户端本地的第一用户的第二特征数据、第二用户的特征数据以及第二用户的风险识别结果外,仅使用了服务端提供的第一用户的风险识别结果,所以,可以实现服务端的私有数据不出域,保证私有数据的安全性,这样,客户端可以在第一用户的风险识别结果的辅助下,学习第一风险识别模型的风险识别能力,并根据本地存储的第二用户的特征数据以及第二用户的风险识别结果,使得到的预先训练的第二风险识别模型更加符合客户端本地的风险识别需要,提高了预先训练的第二风险识别模型的风险识别效果,提高了针对目标用户触发执行目标业务的风险检测的准确性。
实施例五
本说明书实施例提供一种数据处理***,该数据处理***包括:服务端和客户端,其中:
客户端,可以用于将第一用户的用户标识发送给服务端。
服务端,可以用于基于用户标识获取第一用户的风险识别结果,第一用户的风险识别结果可以为服务端基于预先训练的第一风险识别模型对第一用户的第一特征数据进行风险识别得到,预先训练的第一风险识别模型可以为服务端基于预设第一数量的用户特征数据进行训练得到。
客户端,可以用于基于第一用户的第二特征数据和服务端返回的第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型,并基于第二用户的特征数据以及第二用户的风险识别结果,对初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于预先训练的第二风险识别模型对用户进行风险识别处理。
例如,如图6所示,数据处理***中可以有多个服务端和客户端,以资源转移场景下的风险用户识别为例,假设客户端和多个服务端分别存储有若干用户的特征数据(如资源转移行为信息等),客户端可以将本地存储的多个第一用户的用户标识分别发送给多个服务端,服务端可以根据接收到的第一用户的用户标识,获取本地存储的第一用户的第一特征数据,在根据服务端预先训练的第一风险识别模型,确定第一用户的风险识别结果,并返回给客户端。
客户端再基于第一用户的第二特征数据、服务端返回的第一用户的风险识别结果、第二用户的特征数据以及第二用户的风险识别结果,对预设第二风险识别模型进行初始化训练以及参数更新处理(具体处理过程可以参见上述实施例一~实施例二中的处理过程),得到预先训练的第二风险识别模型。
另外,数据处理***中可以有多个服务端,客户端可能接收到多个服务端针对同一个第一用户的风险识别结果,例如,如图6所示,客户端可以接收到服务端1基于本地存储的第一用户的第一特征数据1以及预先训练的第一风险识别模型1确定的第一用户1的风险识别结果,客户端还可以接收到服务端2基于本地存储的第一用户的第一特征数据2以及预先训练的第一风险识别模型2确定的第一用户1的风险识别结果,客户端可以基于服务端1返回的第一用户1的风险识别结果以及服务端2返回的第一用户1的风险识别结果,确定第一用户1的风险识别结果。
例如,客户端可以根据服务端对应的预设权重值,以及服务端返回的第一用户的风险识别结果,确定第一用户的风险识别结果,具体如,假设服务端1的预设权重为0.8,服务端1返回的第一用户1的风险识别结果为风险分值0.8,服务端2的预设权重为0.7,服务端1返回的第一用户1的风险识别结果为风险分值0.75,则第一用户的风险识别结果可以为(0.8*0.8+0.7*0.75)/2=0.58。
上述第一用户的风险识别结果的确定方法是一种可选地、可实现的确定方法,在实际应用场景中还可以有多种不同的确定方法,如还可以根据服务端的风控优先级确定第一用户的风险识别结果等,可以根据实际应用场景的不同选取不同的确定方法,本说明书实施例对此不作具体限定。
此外,客户端在检测到目标用户触发执行目标业务的情况下,可以获取目标用户的第一特征数据,并将目标用户的第一特征数据输入预先训练的第二风险识别模型,得到目标用户的目标风险识别结果。
客户端可以将目标用户的用户标识发送给服务端,并接收服务端返回的目标用户的第一风险识别结果。其中,目标用户的第一风险识别结果可以为服务端基于预先训练的第一风险识别模型对目标用户的第二特征数据进行风险识别得到。
最后,客户端可以基于第一风险识别结果和目标风险识别结果,确定触发执行目标业务是否存在风险。
这样,第二风险识别模型就可以通过蒸馏学习的方式迁移服务端侧的风险识别结果,可以将服务端的第一风险识别模型的风险识别能力学习应用到客户端,避免了实际应用中的隐私数据交互的问题,另外,客户端还可以通过预先训练的第二风险识别模型进行实时的风险识别,避免通过数据交互进行风险识别(如通过黑名单的交互进行风险识别)的方式存在的防控漏洞。
本说明书实施例提供一种数据处理***,由于服务端仅将第一用户的风险识别结果返回给客户端,而不需要将第一用户的第一特征数据发送给客户端,即可以实现服务端的私有数据不出域,保证私有数据的安全性,同时,客户端还可以在第一用户的风险识别结果的辅助下,学习第一风险识别模型的风险识别能力,在基于本地存储的第二用户的特征数据以及风险识别结果,对初始化训练后的第二风险识别模型进行参数更新,使预先训练的第二风险识别模型可以更加符合客户端本地的风险识别需要,提高了预先训练的第二风险识别模型的风险识别效果。
实施例六
以上为本说明书实施例提供的数据处理方法,基于同样的思路,本说明书实施例还提供一种数据处理装置,如图7所示。
该数据处理装置包括:结果接收模块701、第一训练模块702和第二训练模块703,其中:
结果接收模块701,用于接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
第一训练模块702,用于基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;
第二训练模块703,用于基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
本说明书实施例中,所述第一用户的风险识别结果包括风险分值,所述第一训练模块702,用于:
基于所述第一用户的第二特征数据、所述第一用户的风险识别结果,以及第一损失函数,对所述预设第二风险识别模型进行初始化训练,得到所述初始化训练后的第二风险识别模型;
所述第二用户的风险识别结果包括风险分类标签,所述第二训练模块1103,用于:
基于所述第二用户的特征数据、所述第二用户的风险分类标签,以及第二损失函数,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到所述预先训练的第二风险识别模型;
所述第一损失函数为均方误差损失函数,所述第二损失函数为交叉熵损失函数。
本说明书实施例中,所述第二风险识别模型包括特征提取层和全连接层,所述第二训练模块703,用于:
基于所述第二用户的数据量和预设数量阈值,确定针对所述特征提取层的第一参数更新幅度,以及针对所述全连接层的第二参数更新幅度,所述第一参数更新幅度小于所述第二参数更新幅度;
基于所述第一参数更新幅度、所述第二参数更新幅度、所述第二用户的特征数据、所述第二用户的风险分类标签,以及第二损失函数,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到所述预先训练的第二风险识别模型。
本说明书实施例中,所述装置还包括:
模型检测模块,用于基于预设数据处理周期,对所述预先训练的第二风险识别模型是否满足预设风险识别需求进行检测处理;
模型更新模块,用于在检测到所述预先训练的第二风险识别模型不满足所述预设风险识别需求的情况下,基于第三用户的特征数据,对所述预先训练的第二风险识别模型进行更新处理。
本说明书实施例中,所述模型更新模块,用于:
将所述第三用户的特征数据输入所述预先训练的第二风险识别模型,得到所述第三用户的风险识别结果;
在所述预先训练的第二风险识别模型的模型结构发生变化的情况下,将模型结构变化后的第二风险识别模型确定为第三风险识别模型;
基于所述第三用户的特征数据和所述第三用户的风险识别结果,对所述第三风险识别模型进行初始化训练,得到初始化训练后的第三风险识别模型;
基于第四用户的特征数据以及所述第四用户的风险识别结果,对所述初始化训练后的第三风险识别模型进行参数更新处理,得到预先训练的第三风险识别模型,并将所述预先训练的第三风险识别模型,确定为所述预先训练的第二风险识别模型。
本说明书实施例提供一种数据处理装置,接收服务端针对第一用户的风险识别结果,第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对第一用户的第一特征数据进行风险识别得到,预先训练的第一风险识别模型为服务端基于预设第一数量的用户特征数据进行训练得到,基于第一用户的第二特征数据和第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型,基于第二用户的特征数据以及第二用户的风险识别结果,对初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于预先训练的第二风险识别模型对用户进行风险识别处理。这样,由于服务端仅将第一用户的风险识别结果返回给客户端,而不需要将第一用户的第一特征数据发送给客户端,即可以实现服务端的私有数据不出域,保证私有数据的安全性,同时,客户端还可以在第一用户的风险识别结果的辅助下,学习第一风险识别模型的风险识别能力,在基于本地存储的第二用户的特征数据以及风险识别结果,对初始化训练后的第二风险识别模型进行参数更新,使预先训练的第二风险识别模型可以更加符合客户端本地的风险识别需要,提高了预先训练的第二风险识别模型的风险识别效果。
实施例七
基于同样的思路,本说明书实施例还提供一种数据处理装置,如图8所示。
该数据处理装置包括:数据获取模块801、结果获取模块802和风险确定模块803,其中:
数据获取模块801,用于在检测到目标用户触发执行目标业务的情况下,获取所述目标用户的第一特征数据;
结果获取模块802,用于将所述目标用户的第一特征数据输入预先训练的第二风险识别模型,得到所述目标用户的目标风险识别结果,所述预先训练的第二风险识别模型为基于第一用户的第二特征数据、所述第一用户的风险识别结果、第二用户的特征数据以及所述第二用户的风险识别结果进行训练得到,所述第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
风险确定模块803,用于基于所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
本说明书实施例中,所述风险确定模块803,用于:
将所述目标用户的用户标识发送给所述服务端,并接收所述服务端返回的所述目标用户的第一风险识别结果,所述目标用户的第一风险识别结果为所述服务端基于所述预先训练的第一风险识别模型对所述目标用户的第二特征数据进行风险识别得到;
基于所述第一风险识别结果和所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
本说明书实施例提供一种数据处理装置,在检测到目标用户触发执行目标业务的情况下,获取目标用户的第一特征数据,将目标用户的第一特征数据输入预先训练的第二风险识别模型,得到目标用户的目标风险识别结果,预先训练的第二风险识别模型为基于第一用户的第二特征数据、第一用户的风险识别结果、第二用户的特征数据以及第二用户的风险识别结果进行训练得到,第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对第一用户的第一特征数据进行风险识别得到,预先训练的第一风险识别模型为服务端基于预设第一数量的用户特征数据进行训练得到,基于目标风险识别结果,确定触发执行目标业务是否存在风险。由于客户端在对第二风险模型进行训练时,除客户端本地的第一用户的第二特征数据、第二用户的特征数据以及第二用户的风险识别结果外,仅使用了服务端提供的第一用户的风险识别结果,所以,可以实现服务端的私有数据不出域,保证私有数据的安全性,这样,客户端可以在第一用户的风险识别结果的辅助下,学习第一风险识别模型的风险识别能力,并根据本地存储的第二用户的特征数据以及第二用户的风险识别结果,使得到的预先训练的第二风险识别模型更加符合客户端本地的风险识别需要,提高了预先训练的第二风险识别模型的风险识别效果,提高了针对目标用户触发执行目标业务的风险检测的准确性。
实施例八
基于同样的思路,本说明书实施例还提供一种数据处理设备,如图9所示。
数据处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器901和存储器902,存储器902中可以存储有一个或一个以上存储应用程序或数据。其中,存储器902可以是短暂存储或持久存储。存储在存储器902的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对数据处理设备中的一系列计算机可执行指令。更进一步地,处理器901可以设置为与存储器902通信,在数据处理设备上执行存储器902中的一系列计算机可执行指令。数据处理设备还可以包括一个或一个以上电源903,一个或一个以上有线或无线网络接口904,一个或一个以上输入输出接口905,一个或一个以上键盘906。
具体在本实施例中,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;
基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
可选地,所述第一用户的风险识别结果包括风险分值,所述基于所述第一用户的特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型,包括:
基于所述第一用户的第二特征数据、所述第一用户的风险识别结果,以及第一损失函数,对所述预设第二风险识别模型进行初始化训练,得到所述初始化训练后的第二风险识别模型;
所述第二用户的风险识别结果包括风险分类标签,所述基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,包括:
基于所述第二用户的特征数据、所述第二用户的风险分类标签,以及第二损失函数,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到所述预先训练的第二风险识别模型;
所述第一损失函数为均方误差损失函数,所述第二损失函数为交叉熵损失函数。
可选地,所述第二风险识别模型包括特征提取层和全连接层,所述基于所述第二用户的特征数据、所述第二用户的风险分类标签,以及第二损失函数,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到所述预先训练的第二风险识别模型,包括:
基于所述第二用户的数据量和预设数量阈值,确定针对所述特征提取层的第一参数更新幅度,以及针对所述全连接层的第二参数更新幅度,所述第一参数更新幅度小于所述第二参数更新幅度;
基于所述第一参数更新幅度、所述第二参数更新幅度、所述第二用户的特征数据、所述第二用户的风险分类标签,以及第二损失函数,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到所述预先训练的第二风险识别模型。
可选地,所述方法还包括:
基于预设数据处理周期,对所述预先训练的第二风险识别模型是否满足预设风险识别需求进行检测处理;
在检测到所述预先训练的第二风险识别模型不满足所述预设风险识别需求的情况下,基于第三用户的特征数据,对所述预先训练的第二风险识别模型进行更新处理。
可选地,所述基于第三用户的特征数据以及所述第三用户的风险识别结果,对所述预先训练的第二风险识别模型进行更新处理,包括:
将所述第三用户的特征数据输入所述预先训练的第二风险识别模型,得到所述第三用户的风险识别结果;
在所述预先训练的第二风险识别模型的模型结构发生变化的情况下,将模型结构变化后的第二风险识别模型确定为第三风险识别模型;
基于所述第三用户的特征数据和所述第三用户的风险识别结果,对所述第三风险识别模型进行初始化训练,得到初始化训练后的第三风险识别模型;
基于第四用户的特征数据以及所述第四用户的风险识别结果,对所述初始化训练后的第三风险识别模型进行参数更新处理,得到预先训练的第三风险识别模型,并将所述预先训练的第三风险识别模型,确定为所述预先训练的第二风险识别模型。
另外,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
在检测到目标用户触发执行目标业务的情况下,获取所述目标用户的第一特征数据;
将所述目标用户的第一特征数据输入预先训练的第二风险识别模型,得到所述目标用户的目标风险识别结果,所述预先训练的第二风险识别模型为基于第一用户的第二特征数据、所述第一用户的风险识别结果、第二用户的特征数据以及所述第二用户的风险识别结果进行训练得到,所述第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
基于所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
可选地,所述基于所述目标用户的风险识别结果,确定触发执行所述目标业务是否存在风险,包括:
将所述目标用户的用户标识发送给所述服务端,并接收所述服务端返回的所述目标用户的第一风险识别结果,所述目标用户的第一风险识别结果为所述服务端基于所述预先训练的第一风险识别模型对所述目标用户的第二特征数据进行风险识别得到;
基于所述第一风险识别结果和所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
本说明书实施例提供一种数据处理设备,由于服务端仅将第一用户的风险识别结果返回给客户端,而不需要将第一用户的第一特征数据发送给客户端,即可以实现服务端的私有数据不出域,保证私有数据的安全性,同时,客户端还可以在第一用户的风险识别结果的辅助下,学习第一风险识别模型的风险识别能力,在基于本地存储的第二用户的特征数据以及风险识别结果,对初始化训练后的第二风险识别模型进行参数更新,使预先训练的第二风险识别模型可以更加符合客户端本地的风险识别需要,提高了预先训练的第二风险识别模型的风险识别效果。
实施例九
本说明书实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本说明书实施例提供一种计算机可读存储介质,由于服务端仅将第一用户的风险识别结果返回给客户端,而不需要将第一用户的第一特征数据发送给客户端,即可以实现服务端的私有数据不出域,保证私有数据的安全性,同时,客户端还可以在第一用户的风险识别结果的辅助下,学习第一风险识别模型的风险识别能力,在基于本地存储的第二用户的特征数据以及风险识别结果,对初始化训练后的第二风险识别模型进行参数更新,使预先训练的第二风险识别模型可以更加符合客户端本地的风险识别需要,提高了预先训练的第二风险识别模型的风险识别效果。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、***、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (14)
1.一种数据处理方法,包括:
接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;
基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
2.根据权利要求1所述的方法,所述第一用户的风险识别结果包括风险分值,所述基于所述第一用户的特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型,包括:
基于所述第一用户的第二特征数据、所述第一用户的风险识别结果,以及第一损失函数,对所述预设第二风险识别模型进行初始化训练,得到所述初始化训练后的第二风险识别模型;
所述第二用户的风险识别结果包括风险分类标签,所述基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,包括:
基于所述第二用户的特征数据、所述第二用户的风险分类标签,以及第二损失函数,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到所述预先训练的第二风险识别模型;
所述第一损失函数为均方误差损失函数,所述第二损失函数为交叉熵损失函数。
3.根据权利要求2所述的方法,所述第二风险识别模型包括特征提取层和全连接层,所述基于所述第二用户的特征数据、所述第二用户的风险分类标签,以及第二损失函数,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到所述预先训练的第二风险识别模型,包括:
基于所述第二用户的数据量和预设数量阈值,确定针对所述特征提取层的第一参数更新幅度,以及针对所述全连接层的第二参数更新幅度,所述第一参数更新幅度小于所述第二参数更新幅度;
基于所述第一参数更新幅度、所述第二参数更新幅度、所述第二用户的特征数据、所述第二用户的风险分类标签,以及第二损失函数,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到所述预先训练的第二风险识别模型。
4.根据权利要求1所述的方法,所述方法还包括:
基于预设数据处理周期,对所述预先训练的第二风险识别模型是否满足预设风险识别需求进行检测处理;
在检测到所述预先训练的第二风险识别模型不满足所述预设风险识别需求的情况下,基于第三用户的特征数据,对所述预先训练的第二风险识别模型进行更新处理。
5.根据权利要求4所述的方法,所述基于第三用户的特征数据以及所述第三用户的风险识别结果,对所述预先训练的第二风险识别模型进行更新处理,包括:
将所述第三用户的特征数据输入所述预先训练的第二风险识别模型,得到所述第三用户的风险识别结果;
在所述预先训练的第二风险识别模型的模型结构发生变化的情况下,将模型结构变化后的第二风险识别模型确定为第三风险识别模型;
基于所述第三用户的特征数据和所述第三用户的风险识别结果,对所述第三风险识别模型进行初始化训练,得到初始化训练后的第三风险识别模型;
基于第四用户的特征数据以及所述第四用户的风险识别结果,对所述初始化训练后的第三风险识别模型进行参数更新处理,得到预先训练的第三风险识别模型,并将所述预先训练的第三风险识别模型,确定为所述预先训练的第二风险识别模型。
6.一种数据处理方法,包括:
在检测到目标用户触发执行目标业务的情况下,获取所述目标用户的第一特征数据;
将所述目标用户的第一特征数据输入预先训练的第二风险识别模型,得到所述目标用户的目标风险识别结果,所述预先训练的第二风险识别模型为基于第一用户的第二特征数据、所述第一用户的风险识别结果、第二用户的特征数据以及所述第二用户的风险识别结果进行训练得到,所述第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
基于所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
7.根据权利要求6所述的方法,所述基于所述目标用户的风险识别结果,确定触发执行所述目标业务是否存在风险,包括:
将所述目标用户的用户标识发送给所述服务端,并接收所述服务端返回的所述目标用户的第一风险识别结果,所述目标用户的第一风险识别结果为所述服务端基于所述预先训练的第一风险识别模型对所述目标用户的第二特征数据进行风险识别得到;
基于所述第一风险识别结果和所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
8.一种数据处理***,包括服务端和客户端,其中:
所述客户端,用于将第一用户的用户标识发送给所述服务端;
所述服务端,用于基于所述用户标识获取所述第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
所述客户端,用于基于所述第一用户的第二特征数据和所述服务端返回的所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型,并基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
9.一种数据处理装置,包括:
结果接收模块,用于接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
第一训练模块,用于基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;
第二训练模块,用于基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
10.一种数据处理装置,包括:
数据获取模块,用于在检测到目标用户触发执行目标业务的情况下,获取所述目标用户的第一特征数据;
结果获取模块,用于将所述目标用户的第一特征数据输入预先训练的第二风险识别模型,得到所述目标用户的目标风险识别结果,所述预先训练的第二风险识别模型为基于第一用户的第二特征数据、所述第一用户的风险识别结果、第二用户的特征数据以及所述第二用户的风险识别结果进行训练得到,所述第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
风险确定模块,用于基于所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
11.一种数据处理设备,所述数据处理设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;
基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
12.一种数据处理设备,所述数据处理设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
在检测到目标用户触发执行目标业务的情况下,获取所述目标用户的第一特征数据;
将所述目标用户的第一特征数据输入预先训练的第二风险识别模型,得到所述目标用户的目标风险识别结果,所述预先训练的第二风险识别模型为基于第一用户的第二特征数据、所述第一用户的风险识别结果、第二用户的特征数据以及所述第二用户的风险识别结果进行训练得到,所述第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
基于所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
13.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
接收服务端针对第一用户的风险识别结果,所述第一用户的风险识别结果为所述服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
基于所述第一用户的第二特征数据和所述第一用户的风险识别结果,对预设第二风险识别模型进行初始化训练,得到初始化训练后的第二风险识别模型;
基于第二用户的特征数据以及所述第二用户的风险识别结果,对所述初始化训练后的第二风险识别模型进行参数更新处理,得到预先训练的第二风险识别模型,以基于所述预先训练的第二风险识别模型对用户进行风险识别处理。
14.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
在检测到目标用户触发执行目标业务的情况下,获取所述目标用户的第一特征数据;
将所述目标用户的第一特征数据输入预先训练的第二风险识别模型,得到所述目标用户的目标风险识别结果,所述预先训练的第二风险识别模型为基于第一用户的第二特征数据、所述第一用户的风险识别结果、第二用户的特征数据以及所述第二用户的风险识别结果进行训练得到,所述第一用户的风险识别结果为服务端基于预先训练的第一风险识别模型对所述第一用户的第一特征数据进行风险识别得到,所述预先训练的第一风险识别模型为所述服务端基于预设第一数量的用户特征数据进行训练得到;
基于所述目标风险识别结果,确定触发执行所述目标业务是否存在风险。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210429444.1A CN114819614A (zh) | 2022-04-22 | 2022-04-22 | 数据处理方法、装置、***及设备 |
PCT/CN2023/088491 WO2023202496A1 (zh) | 2022-04-22 | 2023-04-14 | 数据处理方法、装置、***及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210429444.1A CN114819614A (zh) | 2022-04-22 | 2022-04-22 | 数据处理方法、装置、***及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114819614A true CN114819614A (zh) | 2022-07-29 |
Family
ID=82505618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210429444.1A Pending CN114819614A (zh) | 2022-04-22 | 2022-04-22 | 数据处理方法、装置、***及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114819614A (zh) |
WO (1) | WO2023202496A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115563153A (zh) * | 2022-09-23 | 2023-01-03 | 温仲恺 | 基于人工智能的任务批量处理方法、***及服务器 |
WO2023202496A1 (zh) * | 2022-04-22 | 2023-10-26 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置、***及设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113592293A (zh) * | 2021-07-29 | 2021-11-02 | 上海掌门科技有限公司 | 风险识别处理方法、电子设备及计算机可读存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110134316A (zh) * | 2019-04-17 | 2019-08-16 | 华为技术有限公司 | 模型训练方法、情绪识别方法及相关装置和设备 |
CN110222880A (zh) * | 2019-05-20 | 2019-09-10 | 阿里巴巴集团控股有限公司 | 业务风险的确定方法、模型训练方法和数据处理方法 |
CN110992037A (zh) * | 2020-03-03 | 2020-04-10 | 支付宝(杭州)信息技术有限公司 | 基于多方安全计算的风险防控方法、装置和*** |
CN111062563A (zh) * | 2019-11-08 | 2020-04-24 | 支付宝(杭州)信息技术有限公司 | 风险预测模型的训练方法、风险预测方法及相关装置 |
CN111489168A (zh) * | 2020-04-17 | 2020-08-04 | 支付宝(杭州)信息技术有限公司 | 一种目标对象的风险识别方法、装置和处理设备 |
CN112288573A (zh) * | 2020-12-25 | 2021-01-29 | 支付宝(杭州)信息技术有限公司 | 一种构建风险评估模型的方法、装置及设备 |
CN112906903A (zh) * | 2021-01-11 | 2021-06-04 | 北京源堡科技有限公司 | 网络安全风险预测方法、装置、存储介质及计算机设备 |
CN113011632A (zh) * | 2021-01-29 | 2021-06-22 | 招商银行股份有限公司 | 企业风险评估方法、装置、设备及计算机可读存储介质 |
CN113095408A (zh) * | 2021-04-14 | 2021-07-09 | 中国工商银行股份有限公司 | 风险的确定方法、装置和服务器 |
CN113312667A (zh) * | 2021-06-07 | 2021-08-27 | 支付宝(杭州)信息技术有限公司 | 一种风险防控方法、装置及设备 |
CN113313575A (zh) * | 2021-06-08 | 2021-08-27 | 支付宝(杭州)信息技术有限公司 | 一种风险识别模型的确定方法及装置 |
CN114169467A (zh) * | 2021-12-27 | 2022-03-11 | 上海联影智能医疗科技有限公司 | 图像标注方法、电子设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112750038B (zh) * | 2021-01-14 | 2024-02-02 | 中国工商银行股份有限公司 | 交易风险的确定方法、装置和服务器 |
CN113379530A (zh) * | 2021-06-09 | 2021-09-10 | 中国工商银行股份有限公司 | 用户风险的确定方法、装置和服务器 |
CN114021168B (zh) * | 2021-11-09 | 2022-05-24 | 深圳大学 | 基于联邦学习的地铁基坑开挖风险识别方法及装置 |
CN114819614A (zh) * | 2022-04-22 | 2022-07-29 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置、***及设备 |
-
2022
- 2022-04-22 CN CN202210429444.1A patent/CN114819614A/zh active Pending
-
2023
- 2023-04-14 WO PCT/CN2023/088491 patent/WO2023202496A1/zh unknown
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110134316A (zh) * | 2019-04-17 | 2019-08-16 | 华为技术有限公司 | 模型训练方法、情绪识别方法及相关装置和设备 |
CN110222880A (zh) * | 2019-05-20 | 2019-09-10 | 阿里巴巴集团控股有限公司 | 业务风险的确定方法、模型训练方法和数据处理方法 |
CN111062563A (zh) * | 2019-11-08 | 2020-04-24 | 支付宝(杭州)信息技术有限公司 | 风险预测模型的训练方法、风险预测方法及相关装置 |
CN110992037A (zh) * | 2020-03-03 | 2020-04-10 | 支付宝(杭州)信息技术有限公司 | 基于多方安全计算的风险防控方法、装置和*** |
CN111489168A (zh) * | 2020-04-17 | 2020-08-04 | 支付宝(杭州)信息技术有限公司 | 一种目标对象的风险识别方法、装置和处理设备 |
CN112288573A (zh) * | 2020-12-25 | 2021-01-29 | 支付宝(杭州)信息技术有限公司 | 一种构建风险评估模型的方法、装置及设备 |
CN112906903A (zh) * | 2021-01-11 | 2021-06-04 | 北京源堡科技有限公司 | 网络安全风险预测方法、装置、存储介质及计算机设备 |
CN113011632A (zh) * | 2021-01-29 | 2021-06-22 | 招商银行股份有限公司 | 企业风险评估方法、装置、设备及计算机可读存储介质 |
CN113095408A (zh) * | 2021-04-14 | 2021-07-09 | 中国工商银行股份有限公司 | 风险的确定方法、装置和服务器 |
CN113312667A (zh) * | 2021-06-07 | 2021-08-27 | 支付宝(杭州)信息技术有限公司 | 一种风险防控方法、装置及设备 |
CN113313575A (zh) * | 2021-06-08 | 2021-08-27 | 支付宝(杭州)信息技术有限公司 | 一种风险识别模型的确定方法及装置 |
CN114169467A (zh) * | 2021-12-27 | 2022-03-11 | 上海联影智能医疗科技有限公司 | 图像标注方法、电子设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023202496A1 (zh) * | 2022-04-22 | 2023-10-26 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置、***及设备 |
CN115563153A (zh) * | 2022-09-23 | 2023-01-03 | 温仲恺 | 基于人工智能的任务批量处理方法、***及服务器 |
CN115563153B (zh) * | 2022-09-23 | 2023-11-24 | 湖南新艺信息技术有限公司 | 基于人工智能的任务批量处理方法、***及服务器 |
Also Published As
Publication number | Publication date |
---|---|
WO2023202496A1 (zh) | 2023-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114819614A (zh) | 数据处理方法、装置、***及设备 | |
US20240095538A1 (en) | Privacy-preserving graphical model training methods, apparatuses, and devices | |
CN113297396B (zh) | 基于联邦学习的模型参数更新方法、装置及设备 | |
CN112200132B (zh) | 一种基于隐私保护的数据处理方法、装置及设备 | |
CN110020427B (zh) | 策略确定方法和装置 | |
CN109214193B (zh) | 数据加密、机器学习模型训练方法、装置以及电子设备 | |
CN114969293A (zh) | 数据处理方法、装置及设备 | |
CN115545002B (zh) | 一种模型训练和业务处理的方法、装置、存储介质及设备 | |
CN115712866B (zh) | 数据处理方法、装置及设备 | |
CN113837638A (zh) | 话术确定方法、装置及设备 | |
CN116049761A (zh) | 数据处理方法、装置及设备 | |
CN114880489A (zh) | 数据处理方法、装置及设备 | |
CN116308738B (zh) | 一种模型训练的方法、业务风控的方法及装置 | |
CN113221717A (zh) | 一种基于隐私保护的模型构建方法、装置及设备 | |
CN115204395A (zh) | 数据的处理方法、装置及设备 | |
CN113992429B (zh) | 一种事件的处理方法、装置及设备 | |
CN113220852B (zh) | 人机对话方法、装置、设备和存储介质 | |
CN114638998A (zh) | 模型更新方法、装置、***及设备 | |
CN115688130B (zh) | 数据处理方法、装置及设备 | |
CN114662706B (zh) | 一种模型训练方法、装置及设备 | |
CN111275445B (zh) | 一种数据的处理方法、装置及设备 | |
CN117972436B (zh) | 大语言模型的训练方法、训练装置、存储介质及电子设备 | |
CN114662706A (zh) | 一种模型训练方法、装置及设备 | |
CN116186607A (zh) | 一种模型的处理方法、装置及设备 | |
CN109242478B (zh) | 一种口令红包创建方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |