CN115600106A - 一种风险识别模型的训练方法、装置、设备及存储介质 - Google Patents
一种风险识别模型的训练方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115600106A CN115600106A CN202211276933.4A CN202211276933A CN115600106A CN 115600106 A CN115600106 A CN 115600106A CN 202211276933 A CN202211276933 A CN 202211276933A CN 115600106 A CN115600106 A CN 115600106A
- Authority
- CN
- China
- Prior art keywords
- event
- parameters
- risk
- determining
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Computer Security & Cryptography (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书公开了一种风险识别模型的训练方法、装置、设备及存储介质,将训练样本输入待训练的风险识别模型,通过特征子网得到训练样本的第一特征,根据全连接层中的各参数对第一特征进行线性变换得到第二特征,通过分类子网得到训练样本的分类结果。以训练样本的标签以及分类结果之间的差异最小化,以及全连接层的各参数之间的相似性的最大化为训练目标,训练风险识别模型。可见,通过在训练目标中增加全连接层的各参数之间的相似性的最大化,能够使得训练后的风险识别模型不仅能够直接输出事件的风险类型,还可以通过表征子网输出的事件的特征适应于基于数据库的特征检索,扩展了风险识别的应用场景,提高了风险识别的准确性以及隐私的保护性。
Description
技术领域
本说明书涉及计算机技术领域,尤其涉及一种风险识别模型的训练方法、装置、设备及存储介质。
背景技术
随着人们对隐私数据关注度的提高,以及互联网技术的快速发展,线上业务得到了快速的发展和广泛的关注。但是,用户在执行线上业务时可能会出现风险事件,进而导致用户的线上业务受到影响,因此,业务提供方可针对用户所执行的线上业务进行风险识别,从而及时识别出风险事件,以提供相应的风险处理方案。
基于此,本说明书提供一种风险识别方法。
发明内容
本说明书提供一种风险识别模型的训练方法、装置、设备及存储介质,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种风险识别模型的训练方法,所述风险识别模型包括特征子网、全连接层和分类子网,包括:
获取业务事件以及所述业务事件的风险类型,确定训练样本以及所述训练样本的标签;
将所述训练样本输入到待训练的风险识别模型中,通过所述特征子网得到所述训练样本的第一特征;
根据所述第一特征,通过所述全连接层中的各参数对所述第一特征进行加权,得到所述训练样本的第二特征;
将所述第二特征输入所述分类子网,得到所述训练样本的分类结果;
以所述训练样本的标签与所述分类结果之间的差异的最小化,以及所述全连接层的各参数之间相似性的最大化为训练目标,调整所述风险识别模型的参数;
其中,所述风险识别模型用于确定待识别的业务事件的风险类型。
本说明书提供了一种风险识别模型的训练装置,所述风险识别模型包括特征子网、全连接层和分类子网,包括:
第一获取模块,用于获取业务事件以及所述业务事件的风险类型,确定训练样本以及所述训练样本的标签;
第一特征确定模块,用于将所述训练样本输入到待训练的风险识别模型中,通过所述特征子网得到所述训练样本的第一特征;
第二特征确定模块,用于根据所述第一特征,通过所述全连接层中的各参数对所述第一特征进行加权,得到所述训练样本的第二特征;
分类模块,用于将所述第二特征输入所述分类子网,得到所述训练样本的分类结果;
调整模块,用于以所述训练样本的标签与所述分类结果之间的差异的最小化,以及所述全连接层的各参数之间相似性的最大化为训练目标,调整所述风险识别模型的参数;其中,所述风险识别模型用于确定待识别的业务事件的风险类型。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述风险识别模型的训练方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述风险识别模型的训练方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
本说明提供的风险识别模型的训练方法中,将训练样本输入到待训练的风险识别模型中,通过特征子网得到训练样本的第一特征,并根据全连接层中的各参数对第一特征进行加权得到第二特征,进而通过分类子网得到训练样本的分类结果。以训练样本的标签以及分类结果之间的差异最小化,以及全连接层的各参数之间的相似性的最大化为训练目标,训练风险识别模型。可见,通过在训练目标中增加全连接层的各参数之间的相似性的最大化,能够使得训练后的风险识别模型不仅能够直接输出事件的风险类型,还可以通过表征子网输出的事件的特征适应于基于数据库的特征检索确定风险类型的方案,扩展了风险识别的应用场景,提高了风险识别的准确性。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中一种风险识别模型的训练方法的流程示意图;
图2为本说明书中一种风险识别模型的结构示意图;
图3为本说明书中一种风险识别方法的流程示意图;
图4为本说明书中一种风险识别模型的训练装置的示意图;
图5为本说明书提供的对应于图1的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
另外,需要说明的是,本发明中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
目前,随着互联网技术的飞速发展,基于线上的交易业务蓬勃发展。但是,用户在线上进行交易业务时可能会遭遇风险,如欺诈。为了及时识别出具有风险的交易事件,可以通过训练风险识别模型的方式,识别交易事件是否有风险,以及具有何种类型的风险。
基于此,本说明书提供一种风险识别模型的训练方法。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书提供的一种风险识别模型的训练方法的流程示意图。
S100:获取业务事件以及所述业务事件的风险类型,确定训练样本以及所述训练样本的标签。
本说明书实施例中提供一种风险识别模型的训练方法,可由用于训练模型的服务器等电子设备执行该风险识别模型的训练过程。
其中,风险识别模型用于确定待识别的业务事件的风险类型。待训练的风险识别模型包括表征子网、全连接层以及分类子网,如图2所示,表征子网用于从训练样本中提取训练样本的特征,全连接层用于对训练样本的特征进行线性变换,分类子网用于根据线性变换后的特征确定训练样本的分类结果。
具体的,用于训练风险识别模型的训练样本包括标签为具有交易风险的业务事件的黑数据样本,以及标签为不具有交易风险的业务事件的白数据样本。例如,对于已经发生的交易事件,可通过参与交易的用户的举报和反馈,以及经人工分析后,确定该交易事件存在违规交易的风险,那么即可将该交易事件的分类标签设置为黑数据样本。反之,如果用户举报自身参与的交易存在违规交易的风险,但经人工复核后不存在交易风险,可将人工复核结果反馈给用户,并将该交易事件的分类标签设置为白数据样本。
另外,在实际应用中,交易事件中分类标签为黑数据样本的风险事件的数量会远远少于分类标签为白数据样本的风险事件。这会导致由于黑数据样本的样本量太小,无法进行有效的深度学习。这是由于风险识别模型的分类子网输出的分类结果在多分类任务中会想样本数量更多的标签倾斜。而在本说明书实施例的场景中,这种倾斜即而影响风险识别任务的准确性。除此之外,由于白数据样本的交易场景和交易类型等事件特征维度较大,采用现有的监督学习或者监督对比学习的方式训练出的风险识别模型中,训练目标为最小化白数据样本之间的差距,这会导致风险识别模型的准确率的降低。
为此,在本说明书中的风险识别模型的训练过程中,通过调整损失函数的构成,最大化风险识别模型的全连接层的各参数之间的相似性,使得训练后的风险识别模型的表征子网能够输出具有欧式性质的事件的表征,以便进一步适应于基于风险识别模型的风险类型识别,以及基于数据库向量检索的风险类型识别。
S102:将所述训练样本输入到待训练的风险识别模型中,通过所述特征子网得到所述训练样本的第一特征。
在实际应用中,通过特征子网,提取训练样本的交易特征,以便后续根据交易特征对训练样本进行分类。
S104:根据所述第一特征,通过所述全连接层中的各参数对所述第一特征进行加权,得到所述训练样本的第二特征。
进一步的,将训练样本的第一特征的每个维度的特征值进行线性加权,进行线性变换得到可以输入到分类子网的第二特征,其中,全连接层的各参数的输入维度通常根据作为输入的第一特征的维度确定,各参数的输出维度通常根据分类子网的输入维度确定。
S106:将所述第二特征输入所述分类子网,得到所述训练样本的分类结果。
具体的,风险识别模型可以是二分类模型,则训练样本的分类结果可以是存在交易风险或者是不存在交易风险。风险识别模型还可以是多分类模型,则训练样本的分类结果可以是不存在交易风险,或者存在何种交易风险。
S108:以所述训练样本的标签与所述分类结果之间的差异的最小化,以及所述全连接层的各参数之间相似性的最大化为训练目标,调整所述风险识别模型的参数。
其中,最小化训练样本的标签与分类子网输出的分类结果之间的差异,目的是使得风险识别模型能够学习到根据训练样本的交易特征确定该训练样本的风险类型的能力。最大化全连接层的各参数之间的相似性,目的是使得训练后的风险识别模型的表征子网能够输出具有欧式性质的事件的特征,进而,使得风险识别模型不仅能够直接输出事件的风险类型,还能够适应于基于向量检索的风险类型识别,扩展风险识别的应用场景,提高风险识别的准确性以及泛用性。
本说明提供的风险识别模型的训练方法中,将训练样本输入待训练的风险识别模型,通过特征子网得到训练样本的第一特征,根据全连接层中的各参数对第一特征进行加权得到第二特征,通过分类子网得到训练样本的分类结果。以训练样本的标签以及分类结果之间的差异最小化,以及全连接层的各参数之间的相似性的最大化为训练目标,训练风险识别模型。可见,通过在训练目标中增加全连接层的各参数之间的相似性的最大化,能够使得训练后的风险识别模型不仅能够直接输出事件的风险类型,还可以通过表征子网输出的事件的特征适应于基于数据库的特征检索,扩展了风险识别的应用场景,提高了风险识别的准确性。
在本说明书一个或多个实施例中,在如图1步骤S108所示以所述训练样本的标签与所述分类结果之间的差异的最小化,以及所述全连接层的各参数之间相似性的最大化为训练目标,调整所述风险识别模型的参数时,可以通过以下可选的方案确定全连接层的各参数之间相似性,以实现以全连接层的各参数之间相似性的最大化为训练目标,具体通过以下方案确定:
首先,根据所述训练样本的标签与所述分类结果之间的差异确定第一损失。
具体的,训练样本的分类结果用于表征风险识别模型根据训练样本的特征,预测出的训练样本对应的风险类型。第一损失训练样本的标签与所述分类结果之间的差异确定,即第一损失可以用来评价训练过程中风险识别模型预测的分类结果与实际风险类型之间的差异程度。第一损失可采用先用的任一损失函数确定,如平方损失函数、交叉熵损失函数等,本说明书对此不做限定。
其中,训练样本的标签根据训练样本的业务事件的风险类型确定。如风险识别模型为二分类模型,则训练样本的标签可以是存在风险,以及不存在风险。如风险识别模型为多分类模型,则训练样本的标签可以是不存在风险或存在何种类型的风险。
其次,根据所述全连接层的各参数的方差确定所述各参数之间的相似性,得到第二损失。
具体的,第二损失能够表征全连接层对应的各参数之间的相似程度,各参数的方差与所述各参数之间的相似性呈负相关的关系。通过最大化参数之间的相似性,以及模型训练的反向传播的过程,可以训练处能够输出具有欧式性质的训练样本的第一特征,进而,在风险识别模型训练后,可采用风险识别模型中的特征子网输出事件的第一特征,以第一特征为检索对象,查找与待识别事件最相近的指定事件,进而得到待识别事件的风险类型。
可选地,全连接层的各参数之间的相似性可按照下述方案确定:
首先,根据所述各参数中任意两个参数确定参数差异,其次,遍历所述各参数,得到各参数差异,然后,根据所述各参数差异的方差确定所述各参数之间的相似性,得到第二损失。
具体的,第二损失表征的是全连接层中各参数之间的相似性,反之,可通过确定各参数之间的差异得到第二损失,当然,也可以通过各参数的离散程度确定第二损失。上述遍历各参数得到各参数中任意两个参数之间的参数差异,并根据各参数差异的方差确定第二损失,实际上就是以各参数之间的差异的离散程度表征各参数之间的相似性,各参数差异的方差越小,各参数之间的相似性越大。
基于此,上述基于各参数的方差得到第二损失,以及基于各参数差异的方差得到第二损失均可以是本说明书实施例提供的可选的确定第二损失的方案,当然,还可以通过其他方案确定第二损失,如根据各参数的平方的方差得到第二损失,本说明书对此不做限定。
然后,确定所述第二损失的权重,并对所述第二损失加权。
进一步的,可以确定第二损失的权重,也就是在风险识别模型的训练目标中,全连接层的各参数之间的相似性的最大化在总训练目标中的占比比重。另外,第二损失的权重在训练过程中同样是可以通过学习得到的。
最后,以所述第一损失的最小化以及加权后的第二损失的最大化为优化目标,调整所述风险识别模型的参数。
在本说明书一个或多个实施例中,在如图1步骤S106~S108所示在风险识别模型的训练过程中,当风险识别模型为多分类模型时,可能存在由于参数的自由度较高,参数调整不收敛的情况,基于此,可采用下述方案进一步的调整风险识别模型的参数:
第一步:在所述第二特征中确定指定特征值,并针对所述第二特征中的每个特征值,根据该特征值与所述指定特征值的差异更新该特征值。
具体的,在模型参数中,对于可以在训练过程中进行调整的模型参数,均可将该模型参数作为具有自由度的模型参数,模型参数的自由度越高,模型能够学习到的风险识别能力越强。但同时,由于模型参数之间可以是相互影响的,当模型参数的自由度过高时,可能会出现无法降低模型输出以及训练样本的标签之间的差异,造成参数调整不收敛,模型无法实现训练目标的情况。基于此,在本说明书实施例中,在通过所述全连接层的各参数之间相似性的最大化的同时,还可以通过限制模型参数的自由度的方式,辅助模型训练实现训练目标。
具体的,对于多分类的风险识别模型,其模型参数的自由度的增加可以体现在全连接层用于对第一特征进行线性变换的各参数的维度的增加。为了降低参数的自由度,可通过忽略某些参数的调整,只调整除了该参数以外的其余参数。同时,为了不影响根据参数确定的第二特征,可在根据全连接层的各参数对第一特征进行线性变换,得到第二特征之后,就从第二特征的某一维选择指定特征值,针对第二特征中的每个特征值,根据该特征值与指定特征值值的差异更新该特征值,在第二特征中的每个特征值都更新后,得到更新后的第二特征。
第二步:将更新后的第二特征输入所述分类子网,得到所述训练样本的分类结果。
由于在第二特征的每一维度的特征值上都减去了指定特征值,更新后的第二特征输入所述分类子网得到的分类结果,与更新前的第二特征输入所述分类子网的分类结果相同,也就是说,在第二特征的每一维度的特征值上都减去了指定特征值,不会影响基于第二特征得到的分类结果。
其中,可以理解的是,第二特征中的指定特征值也需要减去自身,也就是说,在模型的训练过程中,可以在每次确定第二特征时,均将第二特征中的每个特征值都减去指定特征值,在更新后的第二特征中,指定特征值的维度对应的特征值通常为零。由于每次第二特征中的指定特征值也需要减去自身,因此指定特征值的取值并不影响模型的训练,进而,得到第二特征中指定特征值的参数是否在模型训练的过程中被调整,也不会影响模型的训练,但同时还可以减少模型参数的自由度,辅助模型训练的收敛。
例如,第二特征为(z1,z2,z3),当确定z3为指定特征值时,更新后的第二特征为(z1-z3,z2-z3,0),将更新前后的第二特征分别经过softmax函数,得到的分类结果相同。
第三步:在所述全连接层中,确定所述指定特征值对应的指定参数。
进一步的,第二特征是根据第一特征经全连接层中各参数的线性变换而来,因此,指定特征值在第二特征中的维度,与全连接层中各参数对应,即可得到在所述全连接层中,确定所述指定特征值对应的指定参数。
第四步:以调整所述风险识别模型的参数为参数调整方向,调整所述全连接层的各参数中,除所述指定参数外的其余参数。
通过不调整指定参数的方式降低模型参数的自由度,辅助模型参数的收敛。
基于上述方案,通过调整所述全连接层的各参数中,除所述指定参数外的其余参数的方案,可以减少模型训练过程中参数可调的自由度,使得以各参数之间的相似性最大化的训练目标能够收敛,提高模型训练的可行性。
在本说明书一个或多个实施例中,可采用如图1所示的风险识别模型的训练方法得到训练后的风险识别模型,基于训练后的风险识别模型,可结合包含不存在风险的交易事件的特征,以及不同风险类型的风险事件的特征的数据库,通过特征检索的方式,对待识别的事件进行风险识别。基于此,本说明书实施例中提供一个基于训练后的风险识别模型的风险识别方法,如图3所示:
S200:响应于识别请求,将待识别事件输入到训练后的风险识别模型,通过所述风险识别模型的特征子网得到所述待识别事件的特征。
其中,所述风险识别模型是如图1所示的风险识别模型的训练方法,根据业务事件以及业务事件的风险类型,以模型预测的风险分类结果与所述风险类型之间的差异最小化,以及所述风险识别模型中全连接层的各参数之间的相似性最大化为训练目标训练得到的。
具体的,在本说明书实施例中采用向量检索的方式,确定待识别事件的风险类型。
其中,通过训练后的风险识别模型的特征子网得到的待识别事件的特征是由多维数字组成的数组,即多维向量。而通过向量检索得到待识别事件的风险类型的方案即为,基于k近邻(k-nearest neighbor,k-NN)方法,在给定的向量数据库中,按照指定的相似性度量方式,检索出与待识别事件的特征相近的指定数量的指定事件的特征,进而基于该指定数量的指定事件的风险类型,确定待识别事件的风险类型。
S202:获取数据库中包含的若干指定事件的特征,以及各指定事件的风险类型。
其中,数据库中包含大量已确定风险类型的交易事件的特征,数据库可存储交易事件的特征以及该交易事件的风险类型的映射关系。即通过查询交易事件的特征即可确定该交易事件的风险类型。
具体的,指定事件可以是根据具体的应用场景首先粗分类得到的与待识别事件可能相同风险类型的交易事件,当然,也可以是不经筛选的数据库存储的若干交易事件,本说明书对此不做限定。
数据库中存储的指定的特征可以是通过如图1所示的风险识别模型中的特征子网得到的,也可以是预先根据其他预训练的特征提取模型得到,本说明书对此不做限定。
S204:针对每个指定事件,确定所述待识别事件的特征与该指定事件的特征的相似度。
进一步的,为了确定可从各指定事件中选择哪些指定事件作为确定待识别事件的防线类型所用的目标事件,可针对每个指定事件,确定待识别事件的特征与该指定事件的特征的相似度,由于上述特征均为向量的表征形式,因此,可采用现有的向量相似性的度量方式,如欧式距离、内积。
可选的,确定该指定事件的特征,与所述待识别事件的特征之间的欧式距离,根据所述欧式距离,确定所述待识别事件的特征与该指定事件的特征的相似度。其中,待识别事件的特征与指定事件的特征之间的欧式距离越小,两者之间的相似度越大。
S206:根据各相似度,从所述各指定事件中选择指定数量的目标事件。
具体的,可根据确定出的各相似度,将各指定事件将相似度大于预设阈值的各指定事件确定为待识别事件对应的目标事件,其中,指定数量可预先根据具体的应用场景确定,本说明书对此不做限定。
S208:根据各目标事件的风险类型,确定所述待识别事件的风险类型。
根据确定出的各目标事件的风险类型进行聚类,得到待识别事件的风险类型。
本说明提供的风险识别方法中,通过训练后的风险识别模型中的特征子网,得到待识别事件的特征,根据数据库包含的若干指定事件的特征,针对每个指定事件,确定待识别事件的特征与该指定时间的特征之间的相似度,根据确定出的各相似度,从指定事件中选择指定数量的目标事件,进而以各目标事件的风险类型,确定待识别事件的风险类型。可见,由于风险识别模型的训练目标之一是全连接层的各参数之间的相似性最大化,因此特征子网输出的待识别事件的特征具有与其他事件的特征进行相似度度量的性质,通过基于数据库的特征检索方案,即使数据库动态更新,也可以通过上述特征检索的方式获得待识别事件的风险类型,具有快速对抗批量风险的性质,提高了风险识别的准确性。
在本说明书一个可选的实施例中,当数据库包含的指定事件的特征以及指定事件的风险类型更新时,可根据下述方案实施:
首先,响应于数据库更新请求,获取待更新事件以及所述待更新事件的风险类型。
当出现风险类型不同于数据库中包含的各事件的风险类型的事件时,可将该事件作为待更新事件,并将待更新事件及其风险类型的对应关系存储在数据库中。
其次,将所述待更新事件输入所述特征子网,得到所述待更新事件的特征。
另外,在本说明书实施例中,待识别事件的风险类型可以基于数据库的特征检索进行识别。由此,还可以将待更新事件的特征存入数据库,以便在出现与待更新事件的风险类型相似的其他事件时,可以快速识别出改时间的风险类型,以应对不同场景下的风险识别。
最后,将所述待更新事件的特征以及所述待更新事件的风险类型存储在所述数据库。
图4为本说明书提供的一种风险识别模型的训练装置,所述风险识别模型包括特征子网、全连接层和分类子网,包括:
第一获取模块300,用于获取业务事件以及所述业务事件的风险类型,确定训练样本以及所述训练样本的标签;
第一特征确定模块302,用于将所述训练样本输入到待训练的风险识别模型中,通过所述特征子网得到所述训练样本的第一特征;
第二特征确定模块304,用于根据所述第一特征,通过所述全连接层中的各参数对所述第一特征进行加权,得到所述训练样本的第二特征;
分类模块306,用于将所述第二特征输入所述分类子网,得到所述训练样本的分类结果;
调整模块308,用于以所述训练样本的标签与所述分类结果之间的差异的最小化,以及所述全连接层的各参数之间相似性的最大化为训练目标,调整所述风险识别模型的参数;其中,所述风险识别模型用于确定待识别的业务事件的风险类型。
可选地,所述调整模块308具体用于,根据所述训练样本的标签与所述分类结果之间的差异确定第一损失;根据所述全连接层的各参数的方差确定所述各参数之间的相似性,得到第二损失;确定所述第二损失的权重,并对所述第二损失加权;以所述第一损失的最小化以及加权后的第二损失的最大化为优化目标,调整所述风险识别模型的参数。
可选地,所述调整模块308具体用于,根据所述各参数中任意两个参数确定参数差异;遍历所述各参数,得到各参数差异;根据所述各参数差异的方差确定所述各参数之间的相似性,得到第二损失。
可选地,所述分类模块306具体用于,在所述第二特征中确定指定特征值;针对所述第二特征中的每个特征值,根据该特征值与所述指定特征值的差异更新该特征值;将更新后的第二特征输入所述分类子网,得到所述训练样本的分类结果。
可选地,所述调整模块308具体用于,在所述全连接层中,确定所述指定特征值对应的指定参数;以调整所述风险识别模型的参数为参数调整方向,调整所述全连接层的各参数中,除所述指定参数外的其余参数。
可选地,所述装置还包括:
风险类型确定模块310,具体用于响应于识别请求,将待识别事件输入到训练后的风险识别模型,通过所述风险识别模型的特征子网得到所述待识别事件的特征;获取数据库中包含的若干指定事件的特征,以及各指定事件的风险类型;针对每个指定事件,确定所述待识别事件的特征与该指定事件的特征的相似度;选择模块,用于根据各相似度,从所述各指定事件中选择指定数量的目标事件;根据各目标事件的风险类型,确定所述待识别事件的风险类型。
可选地,所述风险类型确定模块310具体用于,确定该指定事件的特征,与所述待识别事件的特征之间的欧式距离;根据所述欧式距离,确定所述待识别事件的特征与该指定事件的特征的相似度。
可选地,所述装置还包括:
更新模块312,具体用于响应于数据库更新请求,获取待更新事件以及所述待更新事件的风险类型;将所述待更新事件输入所述特征子网,得到所述待更新事件的特征;将所述待更新事件的特征以及所述待更新事件的风险类型存储在所述数据库。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1所示的风险识别模型的训练方法。
本说明书还提供了图5所示的电子设备的示意结构图。如图5所述,在硬件子网面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所示的风险识别模型的训练方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (18)
1.一种风险识别模型的训练方法,所述风险识别模型包括特征子网、全连接层和分类子网,所述方法包括:
获取业务事件以及所述业务事件的风险类型,确定训练样本以及所述训练样本的标签;
将所述训练样本输入到待训练的风险识别模型中,通过所述特征子网得到所述训练样本的第一特征;
根据所述第一特征,通过所述全连接层中的各参数对所述第一特征进行线性变换,得到所述训练样本的第二特征;
将所述第二特征输入所述分类子网,得到所述训练样本的分类结果;
以所述训练样本的标签与所述分类结果之间的差异的最小化,以及所述全连接层的各参数之间相似性的最大化为训练目标,调整所述风险识别模型的参数;
其中,所述风险识别模型用于确定待识别的业务事件的风险类型。
2.如权利要求1所述的方法,以所述训练样本的标签与所述分类结果之间的差异的最小化,以及所述全连接层的各参数之间相似性的最大化为训练目标,调整所述风险识别模型的参数,具体包括:
根据所述训练样本的标签与所述分类结果之间的差异确定第一损失;
根据所述全连接层的各参数的方差确定所述各参数之间的相似性,得到第二损失;
确定所述第二损失的权重,并对所述第二损失加权;
以所述第一损失的最小化以及加权后的第二损失的最大化为优化目标,调整所述风险识别模型的参数。
3.如权利要求2所述的方法,得到第二损失,具体包括:
根据所述各参数中任意两个参数确定参数差异;
遍历所述各参数,得到各参数差异;
根据所述各参数差异的方差确定所述各参数之间的相似性,得到第二损失。
4.如权利要求1所述的方法,将所述第二特征输入所述分类子网,得到所述训练样本的分类结果,具体包括:
在所述第二特征中确定指定特征值;
针对所述第二特征中的每个特征值,根据该特征值与所述指定特征值的差异更新该特征值;
将更新后的第二特征输入所述分类子网,得到所述训练样本的分类结果。
5.如权利要求4所述的方法,调整所述风险识别模型的参数,具体包括:
在所述全连接层中,确定所述指定特征值对应的指定参数;
以调整所述风险识别模型的参数为参数调整方向,调整所述全连接层的各参数中,除所述指定参数外的其余参数。
6.如权利要求1所述的方法,所述方法还包括:
响应于识别请求,将待识别事件输入到训练后的风险识别模型,通过所述风险识别模型的特征子网得到所述待识别事件的特征;
获取数据库中包含的若干指定事件的特征,以及各指定事件的风险类型;
针对每个指定事件,确定所述待识别事件的特征与该指定事件的特征的相似度;
根据各相似度,从所述各指定事件中选择指定数量的目标事件;
根据各目标事件的风险类型,确定所述待识别事件的风险类型。
7.如权利要求6所述的方法,确定所述待识别事件的特征与该指定事件的特征的相似度,具体包括:
确定该指定事件的特征,与所述待识别事件的特征之间的欧式距离;
根据所述欧式距离,确定所述待识别事件的特征与该指定事件的特征的相似度。
8.如权利要求6所述的方法,所述方法还包括:
响应于数据库更新请求,获取待更新事件以及所述待更新事件的风险类型;
将所述待更新事件输入所述特征子网,得到所述待更新事件的特征;
将所述待更新事件的特征以及所述待更新事件的风险类型存储在所述数据库。
9.一种风险识别模型的训练装置,所述风险识别模型包括特征子网、全连接层和分类子网,包括:
第一获取模块,用于获取业务事件以及所述业务事件的风险类型,确定训练样本以及所述训练样本的标签;
第一特征确定模块,用于将所述训练样本输入到待训练的风险识别模型中,通过所述特征子网得到所述训练样本的第一特征;
第二特征确定模块,用于根据所述第一特征,通过所述全连接层中的各参数对所述第一特征进行加权,得到所述训练样本的第二特征;
分类模块,用于将所述第二特征输入所述分类子网,得到所述训练样本的分类结果;
调整模块,用于以所述训练样本的标签与所述分类结果之间的差异的最小化,以及所述全连接层的各参数之间相似性的最大化为训练目标,调整所述风险识别模型的参数;其中,所述风险识别模型用于确定待识别的业务事件的风险类型。
10.如权利要求9所述的装置,所述调整模块具体用于,根据所述训练样本的标签与所述分类结果之间的差异确定第一损失;根据所述全连接层的各参数的方差确定所述各参数之间的相似性,得到第二损失;确定所述第二损失的权重,并对所述第二损失加权;以所述第一损失的最小化以及加权后的第二损失的最大化为优化目标,调整所述风险识别模型的参数。
11.如权利要求10所述的装置,所述调整模块具体用于,根据所述各参数中任意两个参数确定参数差异;遍历所述各参数,得到各参数差异;根据所述各参数差异的方差确定所述各参数之间的相似性,得到第二损失。
12.如权利要求9所述的装置,所述分类模块具体用于,在所述第二特征中确定指定特征值;针对所述第二特征中的每个特征值,根据该特征值与所述指定特征值的差异更新该特征值;将更新后的第二特征输入所述分类子网,得到所述训练样本的分类结果。
13.如权利要求12所述的装置,所述调整模块具体用于,在所述全连接层中,确定所述指定特征值对应的指定参数;以调整所述风险识别模型的参数为参数调整方向,调整所述全连接层的各参数中,除所述指定参数外的其余参数。
14.如权利要求9所述的装置,所述装置还包括:
风险类型确定模块,具体用于响应于识别请求,将待识别事件输入到训练后的风险识别模型,通过所述风险识别模型的特征子网得到所述待识别事件的特征;获取数据库中包含的若干指定事件的特征,以及各指定事件的风险类型;针对每个指定事件,确定所述待识别事件的特征与该指定事件的特征的相似度;选择模块,用于根据各相似度,从所述各指定事件中选择指定数量的目标事件;根据各目标事件的风险类型,确定所述待识别事件的风险类型。
15.如权利要求14所述的装置,所述风险类型确定模块具体用于,确定该指定事件的特征,与所述待识别事件的特征之间的欧式距离;根据所述欧式距离,确定所述待识别事件的特征与该指定事件的特征的相似度。
16.如权利要求14所述的装置,所述装置还包括:
更新模块,具体用于响应于数据库更新请求,获取待更新事件以及所述待更新事件的风险类型;将所述待更新事件输入所述特征子网,得到所述待更新事件的特征;将所述待更新事件的特征以及所述待更新事件的风险类型存储在所述数据库。
17.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~8任一项所述的方法。
18.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211276933.4A CN115600106A (zh) | 2022-10-18 | 2022-10-18 | 一种风险识别模型的训练方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211276933.4A CN115600106A (zh) | 2022-10-18 | 2022-10-18 | 一种风险识别模型的训练方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115600106A true CN115600106A (zh) | 2023-01-13 |
Family
ID=84849747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211276933.4A Pending CN115600106A (zh) | 2022-10-18 | 2022-10-18 | 一种风险识别模型的训练方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115600106A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115935265A (zh) * | 2023-03-03 | 2023-04-07 | 支付宝(杭州)信息技术有限公司 | 训练风险识别模型的方法、风险识别方法及对应装置 |
CN115937617A (zh) * | 2023-03-06 | 2023-04-07 | 支付宝(杭州)信息技术有限公司 | 一种风险识别模型训练、风险控制方法、装置和设备 |
CN116028820A (zh) * | 2023-03-20 | 2023-04-28 | 支付宝(杭州)信息技术有限公司 | 一种模型训练的方法、装置、存储介质及电子设备 |
CN116578877A (zh) * | 2023-07-14 | 2023-08-11 | 之江实验室 | 一种模型训练及二次优化打标的风险识别的方法及装置 |
-
2022
- 2022-10-18 CN CN202211276933.4A patent/CN115600106A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115935265A (zh) * | 2023-03-03 | 2023-04-07 | 支付宝(杭州)信息技术有限公司 | 训练风险识别模型的方法、风险识别方法及对应装置 |
CN115935265B (zh) * | 2023-03-03 | 2023-05-26 | 支付宝(杭州)信息技术有限公司 | 训练风险识别模型的方法、风险识别方法及对应装置 |
CN115937617A (zh) * | 2023-03-06 | 2023-04-07 | 支付宝(杭州)信息技术有限公司 | 一种风险识别模型训练、风险控制方法、装置和设备 |
CN116028820A (zh) * | 2023-03-20 | 2023-04-28 | 支付宝(杭州)信息技术有限公司 | 一种模型训练的方法、装置、存储介质及电子设备 |
CN116028820B (zh) * | 2023-03-20 | 2023-07-04 | 支付宝(杭州)信息技术有限公司 | 一种模型训练的方法、装置、存储介质及电子设备 |
CN116578877A (zh) * | 2023-07-14 | 2023-08-11 | 之江实验室 | 一种模型训练及二次优化打标的风险识别的方法及装置 |
CN116578877B (zh) * | 2023-07-14 | 2023-12-26 | 之江实验室 | 一种模型训练及二次优化打标的风险识别的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115600106A (zh) | 一种风险识别模型的训练方法、装置、设备及存储介质 | |
CN113313575B (zh) | 一种风险识别模型的确定方法及装置 | |
EP3971806B1 (en) | Data processing methods, apparatuses, and devices | |
CN110633989A (zh) | 一种风险行为生成模型的确定方法及装置 | |
CN115862088A (zh) | 一种身份识别方法及装置 | |
CN114429222A (zh) | 一种模型的训练方法、装置及设备 | |
CN116303989A (zh) | 一种面向多种检索场景的专利检索方法、装置、设备 | |
CN116049761A (zh) | 数据处理方法、装置及设备 | |
CN115618964A (zh) | 一种模型训练的方法、装置、存储介质及电子设备 | |
CN116152933A (zh) | 一种异常检测模型的训练方法、装置、设备及存储介质 | |
CN116402108A (zh) | 一种模型训练及图数据的处理方法、装置、介质及设备 | |
CN115712866A (zh) | 数据处理方法、装置及设备 | |
US20220335566A1 (en) | Method and apparatus for processing point cloud data, device, and storage medium | |
Li et al. | Object detection based on semi-supervised domain adaptation for imbalanced domain resources | |
WO2022096943A1 (en) | Method and apparatus for processing point cloud data, device, and storage medium | |
CN115564450B (zh) | 一种风控方法、装置、存储介质及设备 | |
Wang et al. | Salient object detection based on multi-feature graphs and improved manifold ranking | |
CN115131570B (zh) | 图像特征提取模型的训练方法、图像检索方法及相关设备 | |
CN113992429B (zh) | 一种事件的处理方法、装置及设备 | |
CN112967044B (zh) | 一种支付业务的处理方法及装置 | |
CN116308738A (zh) | 一种模型训练的方法、业务风控的方法及装置 | |
CN111753583A (zh) | 一种识别方法及装置 | |
CN113344197A (zh) | 一种识别模型的训练方法、业务执行的方法以及装置 | |
CN116340852B (zh) | 一种模型训练、业务风控的方法及装置 | |
CN116186540A (zh) | 数据处理方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |