CN115660060A - 一种模型训练方法以及检测方法、装置、设备及存储介质 - Google Patents
一种模型训练方法以及检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115660060A CN115660060A CN202211163468.3A CN202211163468A CN115660060A CN 115660060 A CN115660060 A CN 115660060A CN 202211163468 A CN202211163468 A CN 202211163468A CN 115660060 A CN115660060 A CN 115660060A
- Authority
- CN
- China
- Prior art keywords
- abnormal operation
- behavior
- user
- detection model
- risk identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 182
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000012549 training Methods 0.000 title claims abstract description 55
- 230000006399 behavior Effects 0.000 claims abstract description 496
- 230000002159 abnormal effect Effects 0.000 claims abstract description 258
- 230000009471 action Effects 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 14
- 238000011176 pooling Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000003058 natural language processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供了一种模型训练方法以及检测方法、装置、设备及存储介质,涉及互联网应用技术领域。包括:获取多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识;针对每一用户的每一行为序列,重复执行:将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型对行为序列进行嵌入学习;通过异常操作行为检测模型对嵌入表示结果进行分类;基于风险标识预测结果和行为序列对应的风险标识对异常操作行为检测模型的模型参数进行调整;直至满足预设迭代结束条件;将满足预设迭代结束条件时所得到的模型参数作为训练后的异常操作行为检测模型的模型参数。本发明减少了对异常操作用户的漏检。
Description
技术领域
本发明涉及互联网应用技术领域,特别是涉及一种模型训练方法以及检测方法、装置、设备及存储介质。
背景技术
一些互联网平台会开设拉新返现或参与活动返现等形式的活动,以吸引用户使用平台或参与平台活动。目前存在通过平台活动维持运营的组织,这些组织通过一些异常操作,如将平台返现中的一部分支付给真人的“众包”等手段维持运营。为了避免这些异常操作行为对平台带来的损失,检测这些异常操作行为就显得十分重要。
一般情况下,所谓“众包”,就是将任务分配给不同地方的用户来执行,如此,“众包”会出现“五湖四海”的特征,即任务完成的来源分布较广,相关技术中通过检测“五湖四海”的特征以检测异常操作用户。但是,相关技术中这种方式容易被规避,例如如果这类组织将任务“众包”给本地用户,即将任务分配给同一地方的用户来执行,则相关技术中通过检测“五湖四海”的特征的方式无法检测到这些异常操作的用户,如此会导致对异常操作用户的漏检。
发明内容
本发明实施例的目的在于提供一种模型训练方法以及检测方法、装置、设备及存储介质,以减少对异常操作用户的漏检。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种异常操作行为检测模型训练方法,包括:
获取多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识,针对每一用户的行为序列,所述行为序列包括所述用户在预设时间范围内所执行行为的相关信息,所述相关信息包括用户在平台执行的各个行为的信息;所述风险标识表示所述用户是否为异常操作用户,所述异常操作用户为进行异常操作行为的用户;
针对每一用户的每一行为序列,将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果;
通过所述异常操作行为检测模型对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果;
基于所述风险标识预测结果和所述行为序列对应的风险标识对所述异常操作行为检测模型的模型参数进行调整;返回执行将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型的嵌入层对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果的步骤,直至满足预设迭代结束条件;
将满足预设迭代结束条件时所得到的模型参数作为训练后的异常操作行为检测模型的模型参数。
可选地,所述异常操作行为检测模型包括嵌入层和分类层;
所述通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果,包括:
通过所述异常操作行为检测模型的嵌入层对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果;
所述通过所述异常操作行为检测模型对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果,包括:
通过所述异常操作行为检测模型的分类层,对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果。
可选地,所述分类层包括平均池化层和线性层;
所述通过所述异常操作行为检测模型的分类层,对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果,包括:
通过所述平均池化层对所述嵌入表示结果中的每一列求取平均值,得到平均行为向量;
通过所述线性层将所述平均行为向量与参数矩阵相乘,得到所述风险标识预测结果。
可选地,所述基于所述风险标识预测结果和所述行为序列对应的风险标识对所述异常操作行为检测模型的模型参数进行调整,包括:
计算所述风险标识预测结果和所述风险标识的差异;
基于所述差异对所述异常操作行为检测模型的模型参数进行调整。
可选地,所述计算所述风险标识预测结果和所述风险标识的差异,包括:
计算所述风险标识预测结果和所述风险标识的交叉熵。
可选地,针对每一用户的行为序列,所述行为序列包括L行W列的数据结构,L表示用户在预设时间范围内所执行行为包括的动作数量,W表示预设行为维度数;
所述通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果,包括:
通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到L 行d列的矩阵,d表示嵌入的维度。
在本发明实施的第二方面,提供了一种异常操作行为的检测方法,包括:
获取待检测用户的行为序列,所述行为序列包括所述待检测用户在预设时间范围内所执行行为的相关信息;
将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型得到所述用户的风险标识结果,所述风险标识结果用于表示所述待检测用户是否为异常操作用户,所述异常操作用户为进行异常操作行为的用户,所述异常操作行为检测模型是通过上述第一方面所述的异常操作行为检测模型训练方法得到的。
在本发明实施的第三方面,提供了一种异常操作行为检测模型训练装置,包括:
获取模块,用于获取多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识,针对每一用户的行为序列,所述行为序列包括所述用户在预设时间范围内所进行行为的相关信息,所述相关信息包括用户在平台执行的各个行为的信息;所述风险标识表示所述用户是否为异常操作用户,所述异常操作用户为进行异常操作行为的用户;
训练模块,用于针对每一用户的每一行为序列,将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果;通过所述异常操作行为检测模型对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果;基于所述风险标识预测结果和所述行为序列对应的风险标识对所述异常操作行为检测模型的模型参数进行调整;返回执行将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型的嵌入层对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果的步骤,直至满足预设迭代结束条件;将满足预设迭代结束条件时所得到的模型参数作为训练后的异常操作行为检测模型的模型参数。
可选地,所述异常操作行为检测模型包括嵌入层和分类层;
所述训练模块,具体用于通过所述异常操作行为检测模型的嵌入层对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果;通过所述异常操作行为检测模型的分类层,对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果。
可选地,所述分类层包括平均池化层和线性层;
所述训练模块,具体用于通过所述平均池化层对所述嵌入表示结果中的每一列求取平均值,得到平均行为向量;通过所述线性层将所述平均行为向量与参数矩阵相乘,得到所述风险标识预测结果。
可选地,所述训练模块,具体用于计算所述风险标识预测结果和所述风险标识的差异;基于所述差异对所述异常操作行为检测模型的模型参数进行调整。
可选地,所述训练模块,具体用于计算所述风险标识预测结果和所述风险标识的交叉熵。
可选地,针对每一用户的行为序列,所述行为序列包括L行W列的数据结构,L表示用户在预设时间范围内所执行行为包括的动作数量,W表示预设行为维度数;
所述训练模块,具体用于通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到L行d列的矩阵,d表示嵌入的维度。
在本发明实施的第四方面,提供了一种异常操作行为的检测装置,包括:
获取模块,用于获取待检测用户的行为序列,所述行为序列包括所述待检测用户在预设时间范围内所执行行为的相关信息;
检测模块,用于将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型得到所述用户的风险标识结果,所述风险标识结果用于表示所述待检测用户是否为异常操作用户,所述异常操作用户为进行异常操作行为的用户,所述异常操作行为检测模型是通过上述第三方面所述的异常操作行为检测模型训练装置得到的。
在本发明实施的第五方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面或第二方面所述的方法任一所述的方法的方法步骤。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面或第二方面所述的方法。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面或第二方面所述的方法任一所述的方法。
本发明实施例中,基于多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识,可以使得异常操作行为检测模型学习用户行为与风险标识的对应关系,也即使得异常操作行为检测模型学习用户的行为特征与用户是否为异常操作用户的对应关系,如此,训练后的异常操作行为检测模型基于用户的行为序列即可确定用户是否为异常操作用户,避免相关技术中通过检测“五湖四海”的特征以检测异常操作用户的方式而漏检异常操作用户,如即使采用本地众包的方式分配任务、基于该用户的行为序列通过训练后的异常操作行为检测模型也可以检测出来该用户为异常操作用户,本发明实施例减少了对异常操作用户的漏检。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例中异常操作行为检测模型训练方法一种流程图;
图2为本发明实施例中单个用户单天的风险标识的数据结构示意图;
图3为本发明实施例中单个用户单天的行为序列的数据结构示意图;
图4为应用本发明实施例中异常操作行为检测模型训练方法进行模型训练的示意图;
图5为本发明实施例中异常操作行为的检测方法的流程图;
图6为本发明实施例中异常操作行为检测模型训练装置的结构示意图;
图7为本发明实施例中异常操作行为的检测装置的结构示意图;
图8为本发明实施例中电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
异常操作用户的异常操作行为相似或相同,也可以理解为异常操作行为较为一致,例如,不同于正常操作用户,异常操作用户一般是通过比较短的时间执行比较多的任务等,异常操作用户在比较短的时间内执行比较相似的行为。其中,异常操作行为也可以理解为采用某些手段利用互联网平台设计或开设的拉新返现或参与活动返现等形式活动(以下简称:活动)维持组织运营的行为。
在此基础上,本发明实施例将基于用户行为进行建模,以深度学***台上的行为通过该用于异常操作行为检测的模型确定用户是否是异常操作用户。
下面对本发明实施例提供的异常操作行为检测模型训练方法以及利用该异常操作行为检测模型进行异常操作行为的检测方法进行详细说明。
本发明实施例提供了一种异常操作行为检测模型训练方法,包括:
获取多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识,针对每一用户的行为序列,行为序列包括用户在预设时间范围内所执行行为的相关信息,相关信息包括用户在平台执行的各个行为的信息;风险标识表示用户是否为异常操作用户;
针对每一用户的每一行为序列,将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型对行为序列进行嵌入学习,得到行为序列对应的嵌入表示结果;
通过异常操作行为检测模型对嵌入表示结果进行分类,得到行为序列对应的风险标识预测结果;
基于风险标识预测结果和行为序列对应的风险标识对异常操作行为检测模型的模型参数进行调整;返回执行将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型的嵌入层对行为序列进行嵌入学习,得到行为序列对应的嵌入表示结果的步骤,直至满足预设迭代结束条件;
将满足预设迭代结束条件时所得到的模型参数作为训练后的异常操作行为检测模型的模型参数。
本发明实施例中,基于多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识,可以使得异常操作行为检测模型学习用户行为与风险标识的对应关系,也即使得异常操作行为检测模型学习用户的行为特征与用户是否为异常操作用户的对应关系,如此,训练后的异常操作行为检测模型基于用户的行为序列即可确定用户是否为异常操作用户,避免相关技术中通过检测“五湖四海”的特征以检测异常操作用户的方式而漏检异常操作用户,如即使采用本地众包的方式分配任务、基于该用户的行为序列通过训练后的异常操作行为检测模型也可以检测出来该用户为异常操作用户,本发明实施例减少了对异常操作用户的漏检。
本发明实施例提供的异常操作行为检测模型训练方法可以应用于电子设备,具体地电子设备可以是服务器、终端等等。
图1为本发明实施例中异常操作行为检测模型训练方法一种流程图,参照图1,本发明实施例提供的异常操作行为检测模型训练方法可以包括如下步骤:
S101,获取多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识。
针对每一用户的行为序列,行为序列包括用户在预设时间范围内所执行行为的相关信息。相关信息包括用户在平台执行的各个行为的信息。
其中,预设时间范围可以根据实际需求来确定。例如,预设时间范围可以为1天、2天、1周等等。
行为包括用户在平台执行的行为,例如:登录、点击等操作。
一种场景下,用户参与平台开设的拉新返现或其他返现活动,如为了吸引用户观看视频,开展了通过观看视频返现的活动,用户可登陆视频平台观看视频,若观看数量超过预设数量个,则向用户返现。平台是希望用户观看视频,而若用户连续对多个视频打开后即滑向其他视频,如仅是点击开并没有观看,则认为用户是异常操作用户,而电子设备可以检测用户连续对多个视频打开后即滑向其他视频而执行的行为,如检测登陆时间、点击持续的时长等。
本发明实施例可以应用于待检测异常操作用户的场景。例如,用户使用终端参与平台开设的拉新返现或其他返现活动,终端可以记录用户所进行行为的相关信息,如此,待训练异常操作行为检测模型时,上述电子设备可以从终端中获取用户所进行行为的相关信息。其中,上述电子设备与终端可以是同一个设备,也可以是不同的设备。
相关信息具体指行为所涉及的动作的动作名称、执行时间、执行时长、设备编号和收益,例如所执行的动作包括登录和触摸,相关信息包括登陆的时间,登陆的时长,登陆的设备编号,登陆后获取到的收益,触摸的时间,触摸的时长,触摸的设备编号,触摸后获取到的收益等等。
风险标识表示用户是否为异常操作用户。
异常操作用户即进行异常操作行为的用户。
风险标识可以包括TRUE和FALSE,TRUE表示用户为异常操作用户,也可以理解为具有异常操作倾向的用户;FALSE为用户为正常用户,也即正常操作用户。
或者,风险标识可以包括0和1,1表示用户为异常操作用户,也可以理解为具有异常操作倾向的用户;0表示用户为正常用户,也即正常操作用户。
例如,将每个用户的每一天的所有行为视作是一个“文本”,即用户的行为序列。其中,用户的行为,例如:登录、观看视频等,视作一个“句子”;每个行为涉及的动作、动作执行时间、动作持续时间、收益、设备编号等,视作每个行为的构成,即组成“句子”的“词”。
风险标识可以是人工预判的结果,电子设备接收该结果,并记录该结果作为风险标识。例如,对应于一个用户过往每天的行为序列,经过人工预判,会有一个过往每天用户的风险标识。以单个用户的单天数据为例,单个用户单天的风险标识的数据结构如图2所示。
S102,针对每一用户的每一行为序列,将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型对行为序列进行嵌入学习,得到行为序列对应的嵌入表示结果。
对行为序列进行嵌入学习具体可以包括:将行为序列进行编码,将编码后的行为序列与预设维度的可学习参数矩阵相乘,如此即可得到行为序列对应的嵌入表示结果。其中,可学习参数矩阵可以先进行初始化。
其中,可以采用NLP中的编码技术进行“行为序列”的编码。
一种可选地实施例中,针对每一用户的行为序列,行为序列包括L行 W列的数据结构,L表示用户在预设时间范围内所执行行为包括的动作数量,W表示预设行为维度数;
通过异常操作行为检测模型对行为序列进行嵌入学习,得到行为序列对应的嵌入表示结果,包括:
通过异常操作行为检测模型对行为序列进行嵌入学习,得到L行d列的矩阵,d表示嵌入的维度。
嵌入的维度也可以理解为异常操作行为检测模型表示行为的维度数。
每个用户均对应包括L行W列的数据结构的行为序列,针对每一行为序列,可以将行为序列进行编码,将编码后的行为序列与预设维度的可学习参数矩阵相乘,如此即可得到行为序列对应的嵌入表示结果。
例如以单个用户的单天数据为例,如图3所示,单个用户单天的行为序列的数据结构可以描述为(L,W)。其中,L表示用户在预设时间范围内所执行行为包括的动作数量,W表示预设行为维度数,每一维度的内容可以理解为构成每个动作的“词”,一个例子中W为5。
例如,W为5,行为序列为L行5列的矩阵,行为序列中的每一行表示一个行为的相关信息,第0列表示行为所涉及的动作名称,第1行表示动作的执行时间、第2行表示执行时长、第3行表示设备编号,第4行表示收益;对一个行为序列进行编码后得到的编码后的行为序列为其中,表示行为序列的行号,例如,的范围为0,1,2……,L-1;
d表示嵌入的维度,可以根据实际需求确定,例如,d为256。
如此,可以得到行为序列对应的嵌入表示结果,从d个维度表示每个行为。
S103,通过异常操作行为检测模型对嵌入表示结果进行分类,得到行为序列对应的风险标识预测结果。
S104,基于风险标识预测结果和行为序列对应的风险标识对异常操作行为检测模型的模型参数进行调整;
返回执行将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型的嵌入层对行为序列进行嵌入学习Embedding,得到行为序列对应的嵌入表示结果的步骤,直至满足预设迭代结束条件。
S105,将满足预设迭代结束条件时所得到的模型参数作为训练后的异常操作行为检测模型的模型参数。
模型参数可以包括嵌入层的参数以及分类层的参数,其中,嵌入层的参数如上述可学习参数矩阵中的各元素。
本发明实施例中可以计算风险标识预测结果和风险标识的差异;基于差异对异常操作行为检测模型的模型参数进行调整。
风险标识可以是数值化的标识,例如,1标识是异常操作用户,0标识正常操作用户。通过异常操作行为检测模型得到的行为序列对应的风险标识预测结果也是数值,例如,得到的行为序列对应的用户是异常操作用户的概率,可以是0至1之间的值。
然后,可以将风险标识预测结果和风险标识,具体地计算风险标识预测结果和风险标识的差异,基于差异对异常操作行为检测模型的模型参数进行调整。
其中,可以通过风险标识预测结果和行为序列对应的风险标识之间的统计值,将该统计值作为上述差异,其中,统计值可以是差值、方差值等。
具体地基于差异调整模型参数的过程可以利用相关技术中深度学习模型中调整模型参数的方式,本发明实施例中不对此进行限制。
一种可实现方式中,计算风险标识预测结果和风险标识的差异,包括:计算风险标识预测结果和风险标识的交叉熵。
具体地,计算风险标识预测结果和风险标识的交叉熵;基于交叉熵对异常操作行为检测模型的模型参数进行调整。
利用风险标识预测结果和风险标识的交叉熵表示风险标识预测结果和行为序列对应的风险标识的差异。基于交叉熵对异常操作行为检测模型的模型参数进行调整,具体可以是将交叉熵作为惩罚以学习模型参数,具体地将交叉熵作为惩罚以学习模型参数可以利用相关技术中神经网络训练过程中参数调整的方式,这里不再赘述。
通过交叉熵可以更加准确地表示风险标识预测结果和行为序列对应的风险标识的差异,进而使得训练得到的异常操作行为检测模型的精准度更高。
模型参数的调整过程将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型的嵌入层对行为序列进行嵌入学习Embedding,得到行为序列对应的嵌入表示结果;通过异常操作行为检测模型的分类层,对嵌入表示结果进行分类,得到行为序列对应的风险标识预测结果;基于风险标识预测结果和行为序列对应的风险标识对异常操作行为检测模型的模型参数进行调整的过程。
简单理解,基于多个行为序列,重复执行S102-S104,直至满足预设迭代结束条件。
预设迭代结束条件可以包括模型预测得到的风险标识预测结果与行为序列对应的风险标识之间的差异达到预设精度,或者迭代次数达到预设次数。其中,预设精度可以根据实际需求确定例如0.01,0.01,等等。利用一个行为序列与该行为序列对应的风险标识,执行将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型的嵌入层对行为序列进行嵌入学习(Embedding),得到行为序列对应的嵌入表示结果,通过异常操作行为检测模型的分类层,对嵌入表示结果进行分类,得到行为序列对应的风险标识预测结果,并基于风险标识预测结果和行为序列对应的风险标识对异常操作行为检测模型的模型参数进行调整的过程称之为一次迭代,每执行一次迭代则迭代次数加1。
本发明实施例提供了以“文本”为特点的行为序列数据结构,进而可以基于自然语言处理(Natural Language Processing,NLP)来对行为序列进行分析,具体地,构建以自然语言处理为基础的“用户风险识别”模型,模型包括行为嵌入学习、分类两个模块,也即上述嵌入层和分类层,将行为序列作为训练样本,利用训练样本对以自然语言处理为基础的“用户风险识别”模型进行训练,得到训练后的“用户风险识别”模型后,即可基于用户的行为序列利用该训练后的“用户风险识别”模型得到用户的风险识别结果,风险识别结果用于表示待检测用户是否为异常操作用户。
一种可选地实施例中,异常操作行为检测模型可以包括嵌入层和分类层。
通过异常操作行为检测模型的嵌入层对行为序列进行嵌入学习,得到行为序列对应的嵌入表示结果;通过异常操作行为检测模型的分类层,对嵌入表示结果进行分类,得到行为序列对应的风险标识预测结果。
嵌入层对行为序列进行嵌入学习具体可以包括:将行为序列进行编码,将编码后的行为序列与预设维度的可学习参数矩阵相乘,如此即可得到行为序列对应的嵌入表示结果。其中,可学习参数矩阵可以先进行初始化。
一种可选地实施例中,分类层包括平均池化层和线性层。
S103可以包括:
通过平均池化层对嵌入表示结果中的每一列求取平均值,得到平均行为向量;通过线性层将平均行为向量与参数矩阵相乘,得到风险标识预测结果。
平均池化层的目的是对(L,W)中的每列求平均,得到(1,W)。
线形层的目的是将(1,W)与一个参数可学习矩阵相乘得到分类结果 (1,1)。
本发明实施例中异常操作行为检测模型中分类层包括平均池化层和线性层,通过平均池化层和线性层实现分类,也即通过平均池化层和线性层基于用户的行为序列对用户是否为异常操作用户进行检测,模型结构简单,能够降低模型训练的复杂度,且利用该模型进行用户是否为异常操作用户的检测时也能够降低检测的复杂度。
如图4所示,本发明实施例中经过数据收集得到多个行为序列,针对各个行为序列,通过嵌入层对行为序列进行嵌入学习Embedding,通过分类层对嵌入学习的结果也即嵌入表示结果进行分类,得到行为序列对应的风险标识预测结果,将该风险标识预测结果与行为序列对应的风险标识进行比较,以进行异常操作行为检测模型训练,该过程可以理解为有监督的模型训练,也可以理解为有监督的模型分类。
获取多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识可以理解为数据收集的过程。
收集过往一段时间内平台用户的行为,例如,收集过往半年内平台用户的行为,收集时间的长短决定了待处理数据量的多少,会影响最终训练的模型的效果,例如,收集时间比较长,则待处理数量比较多,计算复杂度比较大,但也会使得训练的模型的精准度更加高,在实际应用过程中,可以根据实际需求如考虑计算复杂度以及模型训练的精确度要求等,以确定收集时间的长短(也即上述历史时间的范围)。收集数据可以包括:用户每天的动作、动作执行时间、动作持续时间、收益、设备编号,用户当天的风险标识。
收集数据后可以形成行为序列和风险标识。每个用户每天的行为数据可描述为(L,W),对应的风险标识为(1)。可以理解为,一个用户一天的行为序列可以是L行W列的数据结构,对应的风险标识可以是1个数值。另外,为了更好的学习用户间的行为关系,本发明实施例在模型训练的过程中也可以称之为学习过程中采取多用户混合训练,即行为序列格式为(B,L,W),对应风险标识的数据格式为(B,1)。即B个用户分别有多个行为序列,每个行为序列的数据格式是(L,W),B个用户分别对应有风险标识,风险标识为1个数值。其中,B 为用户数量,B的值可以根据实际需求来确定,例如B=32。
将多个用户的多个行为序列分别通过嵌入层进行嵌入表示,得到行为序列对应的嵌入表示结果。例如,将B个用户的行为数据格式为(L,W) 的行为序列进行嵌入表示得到嵌入表示结果(B,L,D),其中,D也即上述 d,表示嵌入的维度,例如可以为256。将行为序列从D个维度进行嵌入表示。
针对B个用户的每一行为序列均可以得到1个风险标识预测结果,针对该风险标识预测结果可以分别和行为序列对应的风险标识进行比较以对模型参数进行调整,直至满足预设迭代结束条件,将满足预设迭代结束条件时所得到的模型参数作为训练后的模型参数,将包括训练后的模型参数的异常操作行为检测模型作为训练后的异常操作行为检测模型。
一种可选地实施例中,S104可以包括:
计算风险标识预测结果和风险标识的交叉熵;基于交叉熵对异常操作行为检测模型的模型参数进行调整。
本发明实施例还提供了一种异常操作行为的检测方法,如图5所示,可以包括:
S501,获取待检测用户的行为序列,行为序列包括待检测用户在预设时间范围内所执行行为的相关信息;
S502,将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型得到用户的风险标识结果,风险标识结果用于表示待检测用户是否为异常操作用户。
异常操作用户为进行异常操作行为的用户。
异常操作行为检测模型是通过上述实施例中异常操作行为检测模型训练方法得到的。
风险识别结果可以是一个概率值,表示用户为异常操作用户的概率,例如,风险标识预测结果为0~1范围的一个数值,值越大则表示为异常操作用户的概率越大。可以预先设置一个阈值如0.5,风险识别结果大于等于0.5,则表示行为序列对应的用户为异常操作用户;风险识别结果小于0.5,则表示行为序列对应的用户为正常操作用户。
本发明实施例中异常操作行为检测模型是基于多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识训练得到的,训练异常操作行为检测模型过程可以使得异常操作行为检测模型学习用户行为与风险标识的对应关系,也即使得异常操作行为检测模型学习用户的行为特征与是否为异常操作用户的对应关系,如此,利用该训练后的异常操作行为检测模型基于用户的行为序列即可确定用户是否为异常操作用户,即使被采用本地众包的方式分配任务的、执行异常操作的用户,本发明实施例也可以检测出来,减少了对异常操作用户的漏检。
本发明实施例可以有效的检测具有异常操作倾向的用户,也即异常操作用户,减少对异常操作用户的漏检,以减少平台不必要的活动激励支出。
对应于上述实施例提供的异常操作行为检测模型训练方法,本发明实施例还提供了一种异常操作行为检测模型训练装置,如图6所示,可以包括:
获取模块601,用于获取多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识,针对每一用户的行为序列,行为序列包括用户在预设时间范围内所进行行为的相关信息,相关信息包括用户在平台执行的各个行为的信息;风险标识表示用户是否为异常操作用户,异常操作用户为进行异常操作行为的用户;
训练模块602,用于针对每一用户的每一行为序列,将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型对行为序列进行嵌入学习,得到行为序列对应的嵌入表示结果;通过异常操作行为检测模型对嵌入表示结果进行分类,得到行为序列对应的风险标识预测结果;基于风险标识预测结果和行为序列对应的风险标识对异常操作行为检测模型的模型参数进行调整;返回执行将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型的嵌入层对行为序列进行嵌入学习,得到行为序列对应的嵌入表示结果的步骤,直至满足预设迭代结束条件;将满足预设迭代结束条件时所得到的模型参数作为训练后的异常操作行为检测模型的模型参数。
可选地,异常操作行为检测模型包括嵌入层和分类层;
训练模块602,具体用于通过异常操作行为检测模型的嵌入层对行为序列进行嵌入学习,得到行为序列对应的嵌入表示结果;通过异常操作行为检测模型的分类层,对嵌入表示结果进行分类,得到行为序列对应的风险标识预测结果。
可选地,分类层包括平均池化层和线性层;
训练模块602,具体用于通过平均池化层对嵌入表示结果中的每一列求取平均值,得到平均行为向量;通过线性层将平均行为向量与参数矩阵相乘,得到风险标识预测结果。
可选地,训练模块602,具体用于计算风险标识预测结果和风险标识的差异;基于差异对异常操作行为检测模型的模型参数进行调整。
可选地,训练模块602,具体用于计算风险标识预测结果和风险标识的交叉熵。
可选地,针对每一用户的行为序列,行为序列包括L行W列的数据结构,L 表示用户在预设时间范围内所执行行为包括的动作数量,W表示预设行为维度数;
训练模块602,具体用于通过异常操作行为检测模型对行为序列进行嵌入学习,得到L行d列的矩阵,d表示嵌入的维度。
对应于上述实施例提供的异常操作行为的检测方法,本发明实施例提供了一种异常操作行为的检测装置,如图7所示,可以包括:
获取模块701,用于获取待检测用户的行为序列,行为序列包括待检测用户在预设时间范围内所执行行为的相关信息;
检测模块702,用于将行为序列输入异常操作行为检测模型,通过异常操作行为检测模型得到用户的风险标识结果,风险标识结果用于表示待检测用户是否为异常操作用户,异常操作用户为进行异常操作行为的用户,异常操作行为检测模型是通过上述异常操作行为检测模型训练装置得到的。
本发明实施例还提供了一种电子设备,如图8所示,包括处理器801、通信接口802、存储器803和通信总线804,其中,处理器801,通信接口802,存储器803通过通信总线804完成相互间的通信。
存储器803,用于存放计算机程序;
处理器801,用于执行存储器803上所存放的程序时,实现上述异常操作行为检测模型训练方法或异常操作行为检测方法的方法步骤。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一所述的异常操作行为检测模型训练方法或异常操作行为检测方法的方法步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的上述异常操作行为检测模型训练方法或异常操作行为检测方法的方法步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质以及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (11)
1.一种异常操作行为检测模型训练方法,其特征在于,包括:
获取多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识,针对每一用户的行为序列,所述行为序列包括所述用户在预设时间范围内所执行行为的相关信息,所述相关信息包括用户在平台执行的各个行为的信息;所述风险标识表示所述用户是否为异常操作用户,所述异常操作用户为进行异常操作行为的用户;
针对每一用户的每一行为序列,将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果;
通过所述异常操作行为检测模型对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果;
基于所述风险标识预测结果和所述行为序列对应的风险标识对所述异常操作行为检测模型的模型参数进行调整;返回执行将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型的嵌入层对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果的步骤,直至满足预设迭代结束条件;
将满足预设迭代结束条件时所得到的模型参数作为训练后的异常操作行为检测模型的模型参数。
2.根据权利要求1所述的方法,其特征在于,所述异常操作行为检测模型包括嵌入层和分类层;
所述通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果,包括:
通过所述异常操作行为检测模型的嵌入层对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果;
所述通过所述异常操作行为检测模型对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果,包括:
通过所述异常操作行为检测模型的分类层,对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果。
3.根据权利要求2所述的方法,其特征在于,所述分类层包括平均池化层和线性层;
所述通过所述异常操作行为检测模型的分类层,对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果,包括:
通过所述平均池化层对所述嵌入表示结果中的每一列求取平均值,得到平均行为向量;
通过所述线性层将所述平均行为向量与参数矩阵相乘,得到所述风险标识预测结果。
4.根据权利要求1所述的方法,其特征在于,所述基于所述风险标识预测结果和所述行为序列对应的风险标识对所述异常操作行为检测模型的模型参数进行调整,包括:
计算所述风险标识预测结果和所述风险标识的差异;
基于所述差异对所述异常操作行为检测模型的模型参数进行调整。
5.根据权利要求4所述的方法,其特征在于,所述计算所述风险标识预测结果和所述风险标识的差异,包括:
计算所述风险标识预测结果和所述风险标识的交叉熵。
6.根据权利要求1所述的方法,其特征在于,针对每一用户的行为序列,所述行为序列包括L行W列的数据结构,L表示用户在预设时间范围内所执行行为包括的动作数量,W表示预设行为维度数;
所述通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果,包括:
通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到L行d列的矩阵,d表示嵌入的维度。
7.一种异常操作行为的检测方法,其特征在于,包括:
获取待检测用户的行为序列,所述行为序列包括所述待检测用户在预设时间范围内所执行行为的相关信息;
将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型得到所述用户的风险标识结果,所述风险标识结果用于表示所述待检测用户是否为异常操作用户,所述异常操作用户为进行异常操作行为的用户,所述异常操作行为检测模型是通过上述权利要求1至6任一项所述的异常操作行为检测模型训练方法得到的。
8.一种异常操作行为检测模型训练装置,其特征在于,包括:
获取模块,用于获取多个用户分别在历史时间内的多个行为序列以及各个行为序列对应的风险标识,针对每一用户的行为序列,所述行为序列包括所述用户在预设时间范围内所进行行为的相关信息,所述相关信息包括用户在平台执行的各个行为的信息;所述风险标识表示所述用户是否为异常操作用户,所述异常操作用户为进行异常操作行为的用户;
训练模块,用于针对每一用户的每一行为序列,将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果;通过所述异常操作行为检测模型对所述嵌入表示结果进行分类,得到所述行为序列对应的风险标识预测结果;基于所述风险标识预测结果和所述行为序列对应的风险标识对所述异常操作行为检测模型的模型参数进行调整;返回执行将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型的嵌入层对所述行为序列进行嵌入学习,得到所述行为序列对应的嵌入表示结果的步骤,直至满足预设迭代结束条件;将满足预设迭代结束条件时所得到的模型参数作为训练后的异常操作行为检测模型的模型参数。
9.一种异常操作行为的检测装置,其特征在于,包括:
获取模块,用于获取待检测用户的行为序列,所述行为序列包括所述待检测用户在预设时间范围内所执行行为的相关信息;
检测模块,用于将所述行为序列输入异常操作行为检测模型,通过所述异常操作行为检测模型得到所述用户的风险标识结果,所述风险标识结果用于表示所述待检测用户是否为异常操作用户,所述异常操作用户为进行异常操作行为的用户,所述异常操作行为检测模型是通过上述权利要求8所述的异常操作行为检测模型训练装置得到的。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211163468.3A CN115660060A (zh) | 2022-09-23 | 2022-09-23 | 一种模型训练方法以及检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211163468.3A CN115660060A (zh) | 2022-09-23 | 2022-09-23 | 一种模型训练方法以及检测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115660060A true CN115660060A (zh) | 2023-01-31 |
Family
ID=84985304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211163468.3A Pending CN115660060A (zh) | 2022-09-23 | 2022-09-23 | 一种模型训练方法以及检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115660060A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116070916A (zh) * | 2023-03-06 | 2023-05-05 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置及设备 |
-
2022
- 2022-09-23 CN CN202211163468.3A patent/CN115660060A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116070916A (zh) * | 2023-03-06 | 2023-05-05 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN109302410B (zh) | 一种内部用户异常行为检测方法、***及计算机存储介质 | |
CN112131383B (zh) | 特定目标的情感极性分类方法 | |
CN111259142A (zh) | 基于注意力编码和图卷积网络的特定目标情感分类方法 | |
CN112347367B (zh) | 信息服务提供方法、装置、电子设备和存储介质 | |
CN111125525B (zh) | 一种面向服刑人员的个性化改造矫正策略推荐***及其运行方法 | |
CN112257966B (zh) | 模型处理方法、装置、电子设备及存储介质 | |
CN112905876B (zh) | 基于深度学习的信息推送方法、装置和计算机设备 | |
CN111477329B (zh) | 一种基于图文结合评估心理状态的方法 | |
CN113722474A (zh) | 文本分类方法、装置、设备及存储介质 | |
Bhardwaj et al. | Health insurance amount prediction | |
CN116089708A (zh) | 农业知识推荐方法及装置 | |
CN115660060A (zh) | 一种模型训练方法以及检测方法、装置、设备及存储介质 | |
Pan et al. | A survival analysis based volatility and sparsity modeling network for student dropout prediction | |
CN118134630A (zh) | 信用风险等级评估方法、装置及电子设备 | |
CN115794898B (zh) | 一种金融资讯推荐方法、装置、电子设备及存储介质 | |
CN113761193A (zh) | 日志分类方法、装置、计算机设备和存储介质 | |
CN115346084B (zh) | 样本处理方法、装置、电子设备、存储介质及程序产品 | |
CN116029422A (zh) | 一种行为序列预测方法、装置、电子设备及介质 | |
CN113051607B (zh) | 一种隐私政策信息提取方法 | |
CN112463964B (zh) | 文本分类及模型训练方法、装置、设备及存储介质 | |
CN115116614A (zh) | 一种健康状态评估方法、装置、设备及存储介质 | |
Corpuz | An application method of long short-term memory neural network in classifying english and tagalog-based customer complaints, feedbacks, and commendations | |
CN113688633A (zh) | 一种提纲确定方法及装置 | |
Song et al. | Neural ideal point estimation network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |