CN115660817A - 一种分类模型训练方法及装置 - Google Patents

一种分类模型训练方法及装置 Download PDF

Info

Publication number
CN115660817A
CN115660817A CN202211413563.4A CN202211413563A CN115660817A CN 115660817 A CN115660817 A CN 115660817A CN 202211413563 A CN202211413563 A CN 202211413563A CN 115660817 A CN115660817 A CN 115660817A
Authority
CN
China
Prior art keywords
transaction
sub
sequence
sample
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211413563.4A
Other languages
English (en)
Inventor
庞悦
郭佳宇
骆祥峰
郑建宾
高鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN202211413563.4A priority Critical patent/CN115660817A/zh
Publication of CN115660817A publication Critical patent/CN115660817A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种分类模型训练方法及装置,应用在人工智能技术领域,包括:按照交易时间对多个样本交易进行排序,获得样本交易序列;按设定的时间窗对样本交易序列进行切分,得到多个子交易序列;对每个子交易序列进行时序特征提取,以及对每个子交易序列对应的子交易图网络进行空间特征提取;基于每个子交易序列的时序序列表示和空间结构表示,获得每个子交易序列的目标特征向量,目标特征向量以及目标特征向量对应的标签用于训练交易分类模型。通过提取子交易序列的时序特征和其对应的子交易图网络的空间特征,充分挖掘交易图网络中包含的时间信息和空间结构信息,增强了图数据特征的多样性,使交易分类模型有较好的识别效果。

Description

一种分类模型训练方法及装置
技术领域
本申请涉及人工智能技术领域,尤其涉及一种分类模型训练方法及装置。
背景技术
随着人工智能技术的发展,人工智能技术在异常交易检测场景下的也应用越来越广泛,其中,图异常检测是一种常用于异常交易检测的人工智能技术。具体地,图异常检测包括以下步骤:使用图学习算法获得交易图网络中交易节点的节点表示,然后采用获得的节点表示对交易分类模型进行训练。
然而,上述图异常检测方法在提取交易节点的节点表示时,仅关注交易节点与邻居节点之间的局部结构信息,即所使用的交易图数据特征较为单一,从而导致交易分类模型的训练效果较差。
发明内容
本申请实施例提供了一种分类模型训练方法及装置,用于对交易图网络中的交易节点进行异常交易检测。
第一方面,本申请实施例提供了一种分类模型训练方法,包括:
获取样本交易图网络中的多个样本交易,并按照交易时间对所述多个样本交易进行排序,获得样本交易序列;
按照设定的时间窗对所述样本交易序列进行切分,得到多个子交易序列;
对每个子交易序列进行时序特征提取,获得相应的时序序列表示;以及对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示;
基于每个子交易序列的时序序列表示和空间结构表示,获得每个子交易序列的目标特征向量,所述目标特征向量以及所述目标特征向量对应的标签用于训练交易分类模型。
通过对子交易序列进行时序特征提取,和对子交易序列对应的子交易图网络进行空间特征提取,基于得到的时序序列表示和空间结构表示,得到目标特征向量,将该目标特征向量用于训练交易分类模型。充分挖掘了交易图网络中包含的时间信息和空间结构信息,增强了图数据特征的多样性,为后续的交易分类模型训练提供了更高的可靠性,使得交易分类模型有较好的识别效果。
可选地,针对每个子交易序列,若所述子交易序列中的每个样本交易均正常,则将相应的目标特征向量的标签设置为正常;
若所述子交易序列中存在至少一个样本交易异常,则将相应的目标特征向量的标签设置为异常。
可选地,所述按照交易时间对所述多个样本交易进行排序,获得样本交易序列,包括:
按照交易时间的先后顺序对所述多个样本交易进行排序,获得样本交易序列。
可选地,所述对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示之前,还包括:
针对每个子交易序列,对所述样本交易图网络中除所述子交易序列之外的样本交易进行裁剪,获得所述子交易序列对应的子交易图网络。
可选地,所述对每个子交易序列进行时序特征提取,获得相应的时序序列表示,包括:
将每个子交易序列输入长短期记忆网络模型中进行时序特征提取,获得相应的时序序列表示。
可选地,所述将对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示,包括:
将每个子交易序列输入到图神经网络模型中进行空间特征提取,获得相应的空间结构表示。
第二方面,本申请实施例提供了一种分类模型训练装置,包括:
获取模块,用于获取样本交易图网络中的多个样本交易,并按照交易时间对所述多个样本交易进行排序,获得样本交易序列;
处理模块,用于按照设定的时间窗对所述样本交易序列进行切分,得到多个子交易序列;
所述处理模块,还用于对每个子交易序列进行时序特征提取,获得相应的时序序列表示;以及对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示;
所述处理模块,还用于基于每个子交易序列的时序序列表示和空间结构表示,获得每个子交易序列的目标特征向量,所述目标特征向量以及所述目标特征向量对应的标签用于训练交易分类模型。
可选地,所述处理模块具体用于:
针对每个子交易序列,若所述子交易序列中的每个样本交易均正常,则将相应的目标特征向量的标签设置为正常;
若所述子交易序列中存在至少一个样本交易异常,则将相应的目标特征向量的标签设置为异常。
可选地,所述处理模块具体用于:
按照交易时间的先后顺序对所述多个样本交易进行排序,获得样本交易序列。
可选地,所述处理模块具体用于:
针对每个子交易序列,对所述样本交易图网络中除所述子交易序列之外的样本交易进行裁剪,获得所述子交易序列对应的子交易图网络。
可选地,所述处理模块具体用于:
将每个子交易序列输入长短期记忆网络模型中进行时序特征提取,获得相应的时序序列表示。
可选地,所述处理模块具体用于:
将每个子交易序列输入到图神经网络模型中进行空间特征提取,获得相应的空间结构表示。
第三方面,本申请实施例提供了一种交易序列检测方法,包括:
获取待检测交易序列的特征向量;将所述待检测交易序列的特征向量输入交易分类模型进行分类,获得所述待检测交易序列的异常检测结果,其中,所述交易分类模型是采用上述第一方面任意所述的分类模型训练方法训练获得的。
第四方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行上述第一方面任意所述的分类模型训练方法。
第五方面,本申请实施例提供了一种计算机可读存储介质,其存储有可由计算机设备执行的计算机程序,当所述程序在计算机设备上运行时,使得所述计算机设备执行上述第一方面任意所述的分类模型训练方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种***架构示意图;
图2为本发明实施例提供的一种分类模型训练方法的流程示意图;
图3为本发明施例提供的一种得到子交易序列的示意图;
图4为本发明实施例提供的一种得到子交易图网络的示意图;
图5为本发明实施例提供的一种提取子交易序列中时序特征的流程示意图;
图6为本发明实施例提供的一种提取子交易图网络中空间特征的流程示意图;
图7为本发明实施例提供的一种分类模型训练方法的流程示意图;
图8为本发明实施例提供的一种分类模型训练装置的结构示意图;
图9为本发明实施例提供的一种计算设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
参见图1,其为本申请实施例使用的一种***架构图,该***100架构包括终端设备101和服务端102,其中,终端设备101用于采集用户的交易信息;终端设备101可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。
服务端102接收终端设备101发送的交易信息,服务端102对交易信息进行特征提取,获得目标特征向量,将获得的目标特征向量用于训练交易分类模型。服务端102可以是独立的物理服务端,也可以是多个物理服务端构成的服务端集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务端。
终端设备101和服务端102可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
基于上述***架构,图2示例性的示出了一种分类模型训练方法的流程,该方法的流程由服务端执行,包括以下步骤:
步骤S201,获取样本交易图网络中的多个样本交易,并按照交易时间对多个样本交易进行排序,获得样本交易序列。
具体地,服务端获取样本交易图网络中的多个样本交易。举例来说,样本交易图网络以一张付款银行卡为中心节点,该付款银行卡向一张收款银行卡发生一个样本转账交易时,产生一个交易节点,且该交易节点与中心节点存在边关系;关联与该付款银行卡发生交易的所有收款银行卡发生的多个样本交易,获得多个交易节点,多个交易节点均与中心节点存在边关系,多个交易节点与中心节点构成样本交易图网络。针对N张银行卡,获得的样本交易集合为C={C1,C2,Ci,···,CN},其中,Ci表示第i张银行卡对应的所有样本交易。针对每张银行卡Ci,服务端按照样本交易的交易时间,对所有样本交易进行排序,形成样本交易序列。
步骤S202,按照设定的时间窗对样本交易序列进行切分,得到多个子交易序列。
具体地,时间窗为滑动时间窗口,滑动时间窗口能够根据指定的单位长度来框住时间序列,从而计算框内的统计指标。相当于一个指定长度的滑块正在刻度尺上面滑动,每滑动一个单位即可反馈滑块内的数据。针对第i张银行卡对应的样本交易序列,服务端通过时间窗对样本交易序列进行切分,每滑动一次时间窗,获得一个子交易序列,在滑动结束后,获得由多个子交易序列组成的二维矩阵
Figure BDA0003938931670000061
N张银行卡对应的二维矩阵
Figure BDA0003938931670000062
组成了交易序列集合
Figure BDA0003938931670000063
其中,交易序列集合S为一个三维矩阵。
举例来说,如图3所示的样本交易图网络中,中心节点为一张付款银行卡,该付款银行卡共进行9比交易,产生9个交易节点,按照时间先后顺序分别标号为1、2、3、4、5、6、7、8、9。设定时间窗为5,则在第一个时间窗内的子交易序列为1、2、3、4、5;第二个时间窗内的子交易序列为2、3、4、5、6;第三个时间窗内的子交易序列为3、4、5、6、7;第四个时间窗内的子交易序列为4、5、6、7、8;第五个时间窗内的子交易序列为5、6、7、8、9。
步骤S203,对每个子交易序列进行时序特征提取,获得相应的时序序列表示;以及对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示。
具体地,服务端将对每个子交易序列进行时序特征提取,得到该子交易序列对应的时序序列表示。其中,每个子交易序列对应一个子交易图网络,每个子交易网络具有相应的空间结构信息,其中,空间结构信息包括子交易网络的网络结构信息和拓扑信息等。服务端对每个子交易图网络进行空间特征提取,获得每个子交易网络的空间结构表示。
举例来说,如图4所示的样本交易图网络中,中心节点为一张付款银行卡,该付款银行卡共进行9比交易,产生9个交易节点,按照时间先后顺序分别标号为1、2、3、4、5、6、7、8、9。设定时间窗为5,则产生5个子交易序列,分别为1、2、3、4、5;2、3、4、5、6;3、4、5、6、7;4、5、6、7、8;5、6、7、8、9。上述5个子交易序列分别对应一个子交易图网络。即9个交易节点在时间窗为5时,获得5个子交易图网络。
步骤S204,基于每个子交易序列的时序序列表示和空间结构表示,获得每个子交易序列的目标特征向量,目标特征向量以及目标特征向量对应的标签用于训练交易分类模型。
具体地,服务端基于提取到的每个子交易序列时序序列表示和每个子交易序列对应子交易图网络的空间结构表示,其中,每个子交易序列的时序序列表示和空间结构表示都通过向量来表示。服务端将每个子交易序列的时序序列表示和空间结构表示进行拼接,得到每个子交易序列的目标特征向量,该目标特征向量携带对应的时序信息和空间信息。将目标特征向量和目标特征向量对应的标签对交易分类模型进行训练。其中,目标特征向量对应的标签是基于该目标特征向量对应的子交易序列确定的。
通过对子交易序列进行时序特征提取,和对子交易序列对应的子交易图网络进行空间特征提取,基于得到的时序序列表示和空间结构表示,得到目标特征向量,将该目标特征向量用于训练交易分类模型。充分挖掘了交易图网络中包含的时间信息和空间结构信息,增强了图数据特征的多样性,为后续的交易分类模型训练提供了更高的可靠性,使得交易分类模型有较好的识别效果。
在一些实施例中,针对每个子交易序列,若子交易序列中的每个样本交易均正常,则将相应的目标特征向量的标签设置为正常;若子交易序列中存在至少一个样本交易异常,则将相应的目标特征向量的标签设置为异常。
具体地,每个子交易序列的样本交易均为正常交易,则该子交易序列携带的标签为正常,则将该子交易序列相应的目标特征向量的标签设置为正常;若在子交易序列的样本交易中有一个或者多个样本交易为异常,则将该子交易序列相应的目标特征向量的标签设置为异常。
通过对目标特征向量引入标签,用于标记目标特征向量的正常与异常,将该标签作为输入,输入到交易分类模型中进行训练,使得交易分类模型可以识别正常和异常的交易。
在上述步骤S201中,按照交易时间对多个样本交易进行排序,获得样本交易序列,包括:按照交易时间的先后顺序对多个样本交易进行排序,获得样本交易序列。
具体地,每个样本交易包含交易的时间信息,服务端根据交易时间的先后顺序,对获得的多个样本交易进行排序,获得样本交易序列。
在一些实施例中,对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示之前,还包括:针对每个子交易序列,对样本交易图网络中除子交易序列之外的样本交易进行裁剪,获得子交易序列对应的子交易图网络。
具体地,样本交易图网络包含一个中心节点、和中心节点有边关系的多个样本交易,服务端按照时间窗对样本交易序列进行切分,获得多个子交易序列。服务端对子交易序列之外的样本交易进行裁剪,得到的每个子交易序列对应的子交易图网络。
举例来说,在一个样本交易图网络中,中心节点为一张付款银行卡,该付款银行卡共进行9比交易,产生9个样本交易,按照时间先后顺序分别标号为1、2、3、4、5、6、7、8、9。设定时间窗为5,则在第一个时间窗内的子交易序列为1、2、3、4、5,服务端通过对除该子交易序列之外的样本交易进行剪裁,即对样本交易6、7、8、9进行剪裁,得到第一时间窗内的子交易序列的子交易图网络,以此类推,最后服务端得到5个子交易图网络。
通过对样本交易图网络中除子交易序列之外的样本交易进行裁剪,可以保留子交易序列对应的子交易图网络的空间结构信息。
在一些实施例中,对每个子交易序列进行时序特征提取,获得相应的时序序列表示,包括:将每个子交易序列输入长短期记忆网络模型中进行时序特征提取,获得相应的时序序列表示。
具体地,长短期记忆网络(Long Short-Term Memory,简称为LSTM)是一种时间循环神经网络,在该实施例中长短期记忆网络数量与子交易序列个数对应;服务端将二维矩阵
Figure BDA0003938931670000091
中的每个子交易序列分别输入到对应的长短期记忆网络中,进行时序特征的提取,获得相应的时序序列表示。其中,将交易序列集合
Figure BDA0003938931670000092
中,每张银行卡对应的二维矩阵
Figure BDA0003938931670000093
输入到相应的长短期记忆网络中,进行时序特征的提取。
举例来说,如图5所示,在一个样本交易图网络中,中心节点为一张付款银行卡,该付款银行卡共进行9比交易,产生9个样本交易,按照时间先后顺序分别标号为1、2、3、4、5、6、7、8、9。设定时间窗为5,则产生5个子交易序列,将5个子交易序列分别输入到5个长短期记忆网络中,进行时序特征的提取,最后得到5个向量,来分别表示5个子交易序列的时序特征。
通过长短期记忆网络模型,对子交易序列进行时序特征提取,对交易分类模型训练时引入时序信息,增加了图数据特征的多样性。
在一些实施例中,将对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示,包括:将每个子交易序列输入到图神经网络模型中进行空间特征提取,获得相应的空间结构表示。
具体地,图神经网络(Graph Neural Network,简称为GNN),在该实施例中图神经网络数量与子交易序列个数对应;服务端将每个子交易序列对应的子交易图网络分别输入到对应的图神经网络中,进行空间特征的提取,获得相应的空间结构表示。其中,空间结构表示为一个向量。
举例来说,如图6所示,在一个样本交易图网络中,中心节点为一张付款银行卡,该付款银行卡共进行9比交易,产生9个样本交易,按照时间先后顺序分别标号为1、2、3、4、5、6、7、8、9。设定时间窗为5,则产生5个子交易序列,5个子交易序列分别对应1个子交易图网络,服务端将5个子交易图网络分别输入到5个图神经网络中,进行空间特征的提取,最后得到5个向量,来分别表示5个子交易图网络的空间特征。
通过图神经网络模型,对子交易图网络进行空间特征提取,对交易分类模型训练时引入空间结构信息,增加了图数据特征的多样性。
为了更好地介绍本申请实施例中的分类模型训练方法,下面结合具体实施场景介绍本申请实施例中的方案,如图7所示,为本发明实施例提供的一种分类模型训练方法的流程示意图。该方法包括以下步骤:
服务端获取样本交易图网络中的9个样本交易,并按照交易时间的先后顺序对9个样本交易进行排序,获得样本交易序列;按照设定的时间窗对样本交易序列进行切分,得到5个子交易序列,下面以第一个子交易序列为例,进行说明。
将第一子交易序列输入长短期记忆网络模型中进行时序特征提取,服务端得到一个向量表示,用于表示该子交易序列的时序特征;将第一子交易序列对应的子交易图网络输入到图神经网络模型中进行空间特征提取,服务端得到一个向量表示,用于表示该子交易序列的空间特征。服务端基于得到的两个向量,进行拼接,得到一个目标特征向量。其中,该目标特征向量携带一个标签,若子交易序列中的每个样本交易均正常,则将相应的目标特征向量的标签设置为正常;若子交易序列中存在至少一个样本交易异常,则将相应的目标特征向量的标签设置为异常。将目标特征向量以及其携带的标签输入到交易分类模型中进行训练。其他子交易序列用于分类模型训练的过程同上。
通过对子交易序列进行时序特征提取,和对子交易序列对应的子交易图网络进行空间特征提取,基于得到的时序序列表示和空间结构表示,得到目标特征向量,将该目标特征向量用于训练交易分类模型。充分挖掘了交易图网络中包含的时间信息和空间结构信息,增强了图数据特征的多样性,为后续的交易分类模型训练提供了更高的可靠性,使得交易分类模型有较好的识别效果。
在上述任意实施例获得交易分类模型的基础上,本申请实施例提供了一种交易序列检测方法,该方法具体包括:
获取待检测交易序列的特征向量;将待检测交易序列的特征向量输入交易分类模型进行分类,获得待检测交易序列的异常检测结果。
具体地,服务端提取待检测交易序列的特征向量,该特征向量中可以包括时间信息和空间结构信息,将该特征向量输入到交易分类模型中进行分类,交易分类模型根据特征向量中包括的时间信息和空间结构信息等,判断出该待检测交易序列的异常检测结果,其中,异常检测结果为异常或正常。
通过挖掘交易图网络中包含的时间信息和空间结构信息,增强了图数据特征的多样性,为交易分类模型训练提供了更高的可靠性,使得交易分类模型有较好的识别效果。
基于相同的技术构思,本申请实施例提供了一种分类模型训练装置结构示意图,如图8所示,该装置800包括:
获取模块801,用于获取样本交易图网络中的多个样本交易,并按照交易时间对所述多个样本交易进行排序,获得样本交易序列;
处理模块802,用于按照设定的时间窗对所述样本交易序列进行切分,得到多个子交易序列;
所述处理模块802,还用于对每个子交易序列进行时序特征提取,获得相应的时序序列表示;以及对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示;
所述处理模块802,还用于基于每个子交易序列的时序序列表示和空间结构表示,获得每个子交易序列的目标特征向量,所述目标特征向量以及所述目标特征向量对应的标签用于训练交易分类模型。
通过对子交易序列进行时序特征提取,和对子交易序列对应的子交易图网络进行空间特征提取,基于得到的时序序列表示和空间结构表示,得到目标特征向量,将该目标特征向量用于训练交易分类模型。充分挖掘了交易图网络中包含的时间信息和空间结构信息,增强了图数据特征的多样性,为后续的交易分类模型训练提供了更高的可靠性,使得交易分类模型有较好的识别效果。
可选地,所述处理模块802具体用于:
针对每个子交易序列,若所述子交易序列中的每个样本交易均正常,则将相应的目标特征向量的标签设置为正常;
若所述子交易序列中存在至少一个样本交易异常,则将相应的目标特征向量的标签设置为异常。
可选地,所述处理模块802具体用于:
按照交易时间的先后顺序对所述多个样本交易进行排序,获得样本交易序列。
可选地,所述处理模块802具体用于:
针对每个子交易序列,对所述样本交易图网络中除所述子交易序列之外的样本交易进行裁剪,获得所述子交易序列对应的子交易图网络。
可选地,所述处理模块802具体用于:
将每个子交易序列输入长短期记忆网络模型中进行时序特征提取,获得相应的时序序列表示。
可选地,所述处理模块802具体用于:
将每个子交易序列输入到图神经网络模型中进行空间特征提取,获得相应的空间结构表示。
基于相同的技术构思,本申请实施例提供了一种计算机设备,该计算机设备可以是图1所示的终端设备101和/或服务端102,如图9所示,包括至少一个处理器901,以及与至少一个处理器连接的存储器902,本申请实施例中不限定处理器901与存储器902之间的具体连接介质,图9中处理器901和存储器902之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。
在本申请实施例中,存储器902存储有可被至少一个处理器901执行的指令,至少一个处理器901通过执行存储器902存储的指令,可以执行上述分类模型训练方法的步骤。
其中,处理器901是计算机设备的控制中心,可以利用各种接口和线路连接计算机设备的各个部分,通过运行或执行存储在存储器902内的指令以及调用存储在存储器902内的数据,从而实现用样本交易对分类模型进行训练。可选的,处理器901可包括一个或多个处理单元,处理器901可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器901中。在一些实施例中,处理器901和存储器902可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器901可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器902作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器902可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器902是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机设备存取的任何其他介质,但不限于此。本申请实施例中的存储器902还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
基于同一发明构思,本申请实施例提供了一种计算机可读存储介质,其存储有可由计算机设备执行的计算机程序,当程序在计算机设备上运行时,使得计算机设备执行上述分类模型训练方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种分类模型训练方法,其特征在于,包括:
获取样本交易图网络中的多个样本交易,并按照交易时间对所述多个样本交易进行排序,获得样本交易序列;
按照设定的时间窗对所述样本交易序列进行切分,得到多个子交易序列;
对每个子交易序列进行时序特征提取,获得相应的时序序列表示;以及对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示;
基于每个子交易序列的时序序列表示和空间结构表示,获得每个子交易序列的目标特征向量,所述目标特征向量以及所述目标特征向量对应的标签用于训练交易分类模型。
2.如权利要求1所述的方法,其特征在于,还包括:
针对每个子交易序列,若所述子交易序列中的每个样本交易均正常,则将相应的目标特征向量的标签设置为正常;
若所述子交易序列中存在至少一个样本交易异常,则将相应的目标特征向量的标签设置为异常。
3.如权利要求1所述的方法,其特征在于,所述按照交易时间对所述多个样本交易进行排序,获得样本交易序列,包括:
按照交易时间的先后顺序对所述多个样本交易进行排序,获得样本交易序列。
4.如权利要求1所述的方法,其特征在于,所述对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示之前,还包括:
针对每个子交易序列,对所述样本交易图网络中除所述子交易序列之外的样本交易进行裁剪,获得所述子交易序列对应的子交易图网络。
5.如权利要求1至4任一所述的方法,其特征在于,所述对每个子交易序列进行时序特征提取,获得相应的时序序列表示,包括:
将每个子交易序列输入长短期记忆网络模型中进行时序特征提取,获得相应的时序序列表示。
6.如权利要求1至4任一所述的方法,其特征在于,所述将对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示,包括:
将每个子交易序列输入到图神经网络模型中进行空间特征提取,获得相应的空间结构表示。
7.一种交易序列检测方法,其特征在于,包括:
获取待检测交易序列的特征向量;
将所述待检测交易序列的特征向量输入交易分类模型进行分类,获得所述待检测交易序列的异常检测结果,其中,所述交易分类模型是采用权利要求1至6任一所述的方法训练获得的。
8.一种分类模型训练装置,其特征在于,包括:
获取模块,用于获取样本交易图网络中的多个样本交易,并按照交易时间对所述多个样本交易进行排序,获得样本交易序列;
处理模块,用于按照设定的时间窗对所述样本交易序列进行切分,得到多个子交易序列;
所述处理模块,还用于对每个子交易序列进行时序特征提取,获得相应的时序序列表示;以及对每个子交易序列对应的子交易图网络进行空间特征提取,获得相应的空间结构表示;
所述处理模块,还用于基于每个子交易序列的时序序列表示和空间结构表示,获得每个子交易序列的目标特征向量,所述目标特征向量以及所述目标特征向量对应的标签用于训练交易分类模型。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1~7任一权利要求所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,其存储有可由计算机设备执行的计算机程序,当所述程序在计算机设备上运行时,使得所述计算机设备执行权利要求1~7任一所述方法的步骤。
CN202211413563.4A 2022-11-11 2022-11-11 一种分类模型训练方法及装置 Pending CN115660817A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211413563.4A CN115660817A (zh) 2022-11-11 2022-11-11 一种分类模型训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211413563.4A CN115660817A (zh) 2022-11-11 2022-11-11 一种分类模型训练方法及装置

Publications (1)

Publication Number Publication Date
CN115660817A true CN115660817A (zh) 2023-01-31

Family

ID=85020999

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211413563.4A Pending CN115660817A (zh) 2022-11-11 2022-11-11 一种分类模型训练方法及装置

Country Status (1)

Country Link
CN (1) CN115660817A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116070152A (zh) * 2023-03-30 2023-05-05 北京徐工汉云技术有限公司 基于多维运行特征的挖掘机工作量识别方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116070152A (zh) * 2023-03-30 2023-05-05 北京徐工汉云技术有限公司 基于多维运行特征的挖掘机工作量识别方法和装置

Similar Documents

Publication Publication Date Title
CN110781784A (zh) 基于双路注意力机制的人脸识别方法、装置及设备
CN110737818B (zh) 网络发布数据处理方法、装置、计算机设备和存储介质
CN111461164B (zh) 样本数据集的扩容方法及模型的训练方法
CN104679818A (zh) 一种视频关键帧提取方法及***
CN110941978B (zh) 一种未识别身份人员的人脸聚类方法、装置及存储介质
CN112270686A (zh) 图像分割模型训练、图像分割方法、装置及电子设备
CN111260220B (zh) 群控设备识别方法、装置、电子设备和存储介质
CN112116436A (zh) 一种智能推荐方法、装置、计算机设备及可读存储介质
CN110969526A (zh) 重叠社群处理方法、装置以及电子设备
CN109325118A (zh) 不平衡样本数据预处理方法、装置和计算机设备
CN112328657A (zh) 特征衍生方法、装置、计算机设备及介质
CN111582932A (zh) 场景间信息推送方法、装置、计算机设备及存储介质
CN115965058A (zh) 神经网络训练方法、实体信息分类方法、装置及存储介质
CN110991538B (zh) 样本分类方法、装置、存储介质和计算机设备
CN115660817A (zh) 一种分类模型训练方法及装置
CN111324883A (zh) 基于互联网的电商平台入侵检测方法及计算机设备
CN110751490A (zh) 欺诈识别方法、装置、电子设备及计算机可读存储介质
CN111325255B (zh) 特定人群圈定方法、装置、电子设备及存储介质
CN113837878B (zh) 一种数据比对方法、装置、设备及存储介质
CN115439928A (zh) 一种操作行为识别方法及装置
CN115956889A (zh) 一种血压监测方法、装置及电子设备
CN114998001A (zh) 业务类别识别方法、装置、设备、存储介质和程序产品
CN114359811A (zh) 数据鉴伪方法、装置、电子设备以及存储介质
CN113487320A (zh) 欺诈交易检测方法、装置、计算机设备和存储介质
CN113434660A (zh) 基于多领域分类的产品推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination