CN110990164B

CN110990164B - 账户检测方法和装置、账户检测模型的训练方法和装置

Info

Publication number: CN110990164B
Application number: CN201911089114.7A
Authority: CN
Inventors: 曹绍升; 崔卿
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2019-11-08
Filing date: 2019-11-08
Publication date: 2022-05-24
Anticipated expiration: 2039-11-08
Also published as: CN110990164A

Abstract

本说明书实施例提供一种账户检测方法和装置、账户检测模型的训练方法和装置，通过第一训练RPC序列预先训练无监督学习模型的模型参数，再将该模型参数作为初始模型参数来训练账户检测模型，最后由该账户检测模型来进行账户安全性预测。用于无监督学习模型训练过程的RPC序列中的每个RPC单元之间是有关联性的，因此，将无监督训练得到的模型参数作为初值应用到账户检测模型的训练过程中，所训练出的账户检测模型所以在账户安全性预测过程中获得更高的准确性。

Description

账户检测方法和装置、账户检测模型的训练方法和装置

技术领域

本说明书涉及人工智能技术领域，尤其涉及账户检测方法和装置、账户检测模型的训练方法和装置。

背景技术

近来，常常有不法分子通过盗取他人账户获得非法利益，使用户的合法权益受到损害。因此，为了保证账户安全，维护用户合法权益，有必要对账户安全性进行检测。

发明内容

基于此，本说明书实施例提供了账户检测方法和装置、账户检测模型的训练方法和装置。

根据本说明书实施例的第一方面，提供一种账户检测方法，所述方法包括：

获取待检测账户的RPC序列，所述RPC序列用于记录所述待检测账户产生的历史操作集合；

将所述RPC序列输入预先训练的账户检测模型，以检测所述待检测账户的安全性；其中，所述账户检测模型在训练过程中将预先训练的无监督学习模型的模型参数作为初始模型参数，所述无监督学习模型通过第一训练RPC序列预先训练。

根据本说明书实施例的第二方面，提供一种账户检测模型的训练方法，所述方法包括：

通过第一训练RPC序列对无监督学习模型进行训练，获取所述无监督学习模型的模型参数；

将所述模型参数作为所述账户检测模型的初始模型参数，将第二训练RPC序列作为所述账户检测模型的输入，并将所述第二训练RPC序列的标签作为所述账户检测模型的输出，以训练所述账户检测模型。

根据本说明书实施例的第三方面，提供一种账户检测装置，所述装置包括：

获取模块，用于获取待检测账户的RPC序列，所述RPC序列用于记录所述待检测账户产生的历史操作集合；

检测模块，用于将所述RPC序列输入预先训练的账户检测模型，以检测所述待检测账户的安全性；其中，所述账户检测模型在训练过程中将预先训练的无监督学习模型的模型参数作为初始模型参数，所述无监督学习模型通过第一训练RPC序列预先训练。

根据本说明书实施例的第四方面，提供一种账户检测模型的训练装置，所述装置包括：

第一训练模块，用于通过第一训练RPC序列对无监督学习模型进行训练，获取所述无监督学习模型的模型参数；

第二训练模块，用于将所述模型参数作为所述账户检测模型的初始模型参数，将第二训练RPC序列作为所述账户检测模型的输入，并将所述第二训练RPC序列的标签作为所述账户检测模型的输出，以训练所述账户检测模型。

根据本说明书实施例的第五方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现任一实施例所述的方法。

根据本说明书实施例的六方面，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现任一实施例所述的方法。

应用本说明书实施例方案，通过第一训练RPC序列预先训练无监督学习模型的模型参数，再将该模型参数作为初始模型参数来训练账户检测模型，最后由该账户检测模型来进行账户安全性预测。用于无监督学习模型训练过程的RPC序列中的每个RPC单元之间是有关联性的，因此，将无监督训练得到的模型参数作为初值应用到账户检测模型的训练过程中，所训练出的账户检测模型所以在账户安全性预测过程中获得更高的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本说明书的实施例，并与说明书一起用于解释本说明书的原理。

图1是本说明书一实施例的账户检测方法流程图。

图2是本说明书一实施例的降维处理的示意图。

图3是本说明书一实施例的无监督训练过程流程图。

图4是本说明书一实施例的监督训练过程流程图。

图5是本说明书一实施例的账户检测模型的训练方法流程图。

图6是本说明书一实施例的账户检测装置的框图。

图7是本说明书一实施例的账户检测模型的训练装置的框图。

图8是本说明书一实施例的用于实施本说明书实施例方法的计算机设备的示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。

在本说明书使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

如图1所示，本说明书实施例提供一种图片检测方法，所述方法可包括：

步骤S102：获取待检测账户的RPC序列，所述RPC序列用于记录所述待检测账户产生的历史操作集合；

步骤S104：将所述RPC序列输入预先训练的账户检测模型，以检测所述待检测账户的安全性；其中，所述账户检测模型在训练过程中将预先训练的无监督学习模型的模型参数作为初始模型参数，所述无监督学习模型通过第一训练RPC序列预先训练。

对于步骤S102，远程过程调用(Remote Procedure Call,RPC)是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。一个RPC序列中包括多个RPC单元，每一个RPC单元通常是一个特定的字符串编码，代表一定的特定含义。

待检测账户可以是某些APP的账户，例如，支付宝账户、钉钉账户，也可以是网络平台的账户，例如，微博账户，还可以是某些网站的账户或者其他类型的账户。以待检测账户是购物类网站或者APP的账户为例，在账户检测场景下，RPC序列可以用于记录账户在一段时间内产生的历史操作集合。一个实际应用场景中的RPC序列可以是{登录，修改密码，修改账户名，签到，搜索商品，购买商品}。当然，本领域技术人员可以理解，上述RPC序列仅用于举例，本说明书实施例不限于此。可以通过账户的RPC序列来对该账户的安全性进行分析。

传统方法中，都是由人工根据RPC序列中各个RPC单元的特定含义对不同RPC单元归类，并进行业务角度的知识总结。由于RPC种类在不断增加，这种人工总结会消耗很多时间；同时，人工总结的知识不能深度地刻画RPC单元的内在属性。

为了方便理解，这里举一个风控场景的例子，比如有以下RPC序列“…登陆；修改密码；返回验证信息错误信息；修改密码；返回验证信息错误信息；修改密码；返回验证信息错误信息；修改密码；返回验证信息错误信息；…”，这个时候，风控***就可察觉到账户异常。传统的方法是人工总结这种特定“模式”，但RPC序列的数量不断增多，而且不断有新的“模式”产生，人工总结难以覆盖全面。为了解决上述问题，可以使用机器学习中的分类模型，即将相同的RPC单元看成是一个特征，但这种方法的缺点就在于不能够刻画RPC单元之间的内在联系，只是表面上把不同RPC单元不同对待而已。

为了刻画不同RPC单元之间的内在联系，对于步骤S104，可以将所述RPC序列输入预先训练的账户检测模型，所述账户检测模型是将由第一训练RPC序列预先训练的无监督学习模型的模型参数作为初始模型参数而训练得到的，由于每个第一训练RPC序列都具有一定的含义，即，第一训练RPC序列中的每个RPC单元之间是有关联性的。通过第一训练RPC序列训练无监督学习模型的模型参数的过程正是利用了第一训练RPC序列中各个RPC单元之间的内在联系，因此，将无监督训练得到的模型参数作为初始模型参数应用到所述账户检测模型的训练过程中，所以训练出的账户检测模型能够刻画RPC单元之间的内在联系，检测结果更加准确。

在训练所述账户检测模型时，可以将所述无监督学习模型的模型参数作为所述账户检测模型的初始模型参数，将第二训练RPC序列作为所述账户检测模型的输入，并将所述第二训练RPC序列的标签作为所述账户检测模型的输出，以训练所述账户检测模型。

其中，第二训练RPC序列是带标签的训练数据，该标签用于表示产生第二训练RPC序列的账户是否存在风险，即，该账户的安全性的高低。如果第一训练RPC序列中既包括有标签的序列，又包括无标签的序列，则可以先采用全体第一训练RPC序列(无需标签)来训练无监督学习模型，再取第一训练RPC序列中存在标签的序列作为第二训练RPC序列用以训练账户检测模型。

在训练所述账户检测模型时，可以将第一训练RPC序列中的各个RPC单元分别转换到同一个向量空间下，向量的维度是固定的，例如100维。然后，可以将同一RPC序列对应的各个向量作为一条训练数据输入到无监督学习模型中，并根据预先设定的优化目标来训练无监督学习模型。一种可选的优化目标是损失函数最小化，当然，也可以采用其他条件作为优化目标，本说明书实施例对此不做限定。

该向量可以直接用于意图识别、商品推荐等任务中。意图识别即识别用户执行某个操作的目的。例如，执行“修改密码”操作的目的可能是将原密码修改为新密码；执行“搜索”操作的目的可能是获取某种对象(例如，商品)的信息；执行“购买”操作的意图是购买商品。商品推荐可以基于意图识别，也可以不基于意图识别，例如，用户执行了购买跑步鞋的操作，可以向用户推荐运动相关的商品。

还可以对各个RPC单元对应的向量分别进行降维处理，以将所述向量映射到同一个二维空间中，并得到各个向量在该二维空间中的平面可视化图。该二维空间中的两个向量之间的距离可以用于表征这两个向量之间的相似度。通过这种方式，使业务人员可以直观地进行数据分析。图2示出了一个实施例的平面可视化图，图中RPC_1至RPC_9分别为不同的RPC单元对应的二维向量，两个圈内的是平面可视化图中的局部放大图，在左上角的圈中，RPC_1与RPC_5对应的二维向量之间的距离比较接近，表示，RPC_1与RPC_5对应的二维向量之间的相似度较高；同理，RPC_2、RPC_3、RPC_4对应的二维向量之间的相似度较高，且这三个二维向量与RPC_1和RPC_5对应的二维向量之间的相似度较低。右下角的圈内各个向量之间的关系类似，此处不再赘述。

应当说明的是，训练出的无监督学习模型的模型参数除了模型内部的参数之外，还包括所述无监督学习模型的输入参数(即，根据RPC单元生成的向量)。也就是说，在训练该无监督学习模型的过程中，不仅可以根据对模型内部的参数进行调整，还可以对各个向量进行调整。无监督学习模型训练完成之后，可以将调整后的向量以及模型内部的参数共同作为账户检测模型的初始模型参数来对该账户检测模型进行训练。

在训练所述无监督学习模型的过程中，可以将所述第一训练RPC序列输入所述无监督学习模型；其中，随机隐藏所述第一训练RPC序列中的至少一个RPC单元，并通过所述无监督学习模型预测隐藏的所述至少一个RPC单元；根据预测结果对所述无监督学习模型进行训练。

例如，假设第一训练RPC序列为{RPC_1，RPC_2，RPC_3，……，RPC_N}，则可以隐藏其中的RPC_3，然后，将其余RPC单元输入，所述无监督学习模型，通过所述无监督学习模型来预测隐藏的RPC单元。对于前述风控场景的例子，所述无监督学习模型可以预测隐藏的RPC_3具体是“登录”还是“修改密码”，即，输出RPC_3为“登录”的概率，以及RPC_3为“修改密码”的概率，若RPC_3是“登录”的概率大于RPC_3是“修改密码”的概率，则判定RPC_3是“登录”。在实际操作时，也可以随机隐藏两个RPC单元，例如，RPC_1和RPC_3，或者随机隐藏两个以上RPC单元，本说明书实施例对此不做限制。

在一个实施例中，所述无监督学习模型为由若干层LSTM(Long Short-TermMemory，长短期记忆网络)构成的机器学习模型。在另一个实施例中，所述账户检测模型为由若干层LSTM构成的机器学习模型。每层LSTM包括若干个LSTM单元，每个LSTM单元可用于输入一个RPC单元对应的向量。如图3所示，是由两层LSTM构成的机器学习模型，最下层为RPC序列输入层，上面两层为LSTM层，最上层为输出层。在本实施例中，每个RPC序列共有N个RPC单元，每个RPC单元输入一个LSTM单元。可以预先收集大量的RPC序列，然后按照图3的方式进行学习。这里，随机地“隐匿”一个RPC单元(如RPC_3所示)，根据RPC序列中的其它RPC单元来预测这个RPC单元。这样，通过若干次预测，并根据优化目标，最终得到该机器学习模型的模型参数。

如图4所示，根据无监督学习得到的参数值作为初值，然后加入标签(label)进行监督学习(如最后一列所示)。在这个过程中，不“隐匿”任何的RPC单元，而是利用整个RPC序列去预测标签，即是否账户异常。当监督学习的模型训练完成之后，输入某个账户在某段时间内的操作对应的RPC序列，同样按照图4的方式，就可以预测其账户行为是否异常。

传统的方法，仅仅是第二步的监督过程，而没有很好地利用RPC序列中各个RPC单元之间的内在联系。本方法充分的使用大量的RPC序列，通过无监督的训练得到神经网络的初值，有了较好的初值之后，在监督学习的过程中，容易产生更好的效果，提高了预测准确性。整体来看，这种半监督学习的方法充分利用了大量的RPC序列，以及有限的标注信息。

如图5所示，是本说明书一实施例的账户检测模型的训练方法流程图。所述方法可包括：

步骤S502：通过第一训练RPC序列对无监督学习模型进行训练，获取所述无监督学习模型的模型参数；

步骤S504：将所述模型参数作为所述账户检测模型的初始模型参数，将第二训练RPC序列作为所述账户检测模型的输入，并将所述第二训练RPC序列的标签作为所述账户检测模型的输出，以训练所述账户检测模型。

本说明书实施例将由第一训练RPC序列训练的无监督学习模型的模型参数作为初始模型参数而训练得到的账户检测模型，由于每个第一训练RPC序列都具有一定的含义，即，第一训练RPC序列中的每个RPC单元之间是有关联性的。通过第一训练RPC序列训练无监督学习模型的模型参数的过程正是利用了第一训练RPC序列中各个RPC单元之间的内在联系，因此，将无监督训练得到的模型参数作为初始模型参数应用到所述账户检测模型的训练过程中，所以训练出的账户检测模型能够刻画RPC单元之间的内在联系，检测结果更加准确。

在一个实施例中，通过第一训练RPC序列对无监督学习模型进行训练的步骤包括：将所述第一训练RPC序列输入所述无监督学习模型；其中，随机隐藏所述第一训练RPC序列中的至少一个RPC单元，并通过所述无监督学习模型预测隐藏的所述至少一个RPC单元；根据预测结果对所述无监督学习模型进行训练。

还可以对各个RPC单元对应的向量分别进行降维处理，以将所述向量映射到同一个二维空间中，并得到各个向量在该二维空间中的平面可视化图。该二维空间中的两个向量之间的距离可以用于表征这两个向量之间的相似度。通过这种方式，使业务人员可以直观地进行数据分析。

在一个实施例中，所述无监督学习模型为由若干层LSTM构成的机器学习模型。在另一个实施例中，所述账户检测模型为由若干层LSTM构成的机器学习模型。

如图6所示，是本说明书一个实施例的账户检测装置的框图，所述装置可包括：

获取模块602，用于获取待检测账户的RPC序列，所述RPC序列用于记录所述待检测账户产生的历史操作集合；

检测模块604，用于将所述RPC序列输入预先训练的账户检测模型，以检测所述待检测账户的安全性；其中，所述账户检测模型在训练过程中将预先训练的无监督学习模型的模型参数作为初始模型参数，所述无监督学习模型通过第一训练RPC序列预先训练。

上述装置中各个模块的功能和作用的实现过程具体详情见上述账户检测方法中对应步骤的实现过程，在此不再赘述。

如图7所示，是本说明书一个实施例的账户检测模型的训练装置的框图，所述装置可包括：

第一训练模块702，用于通过第一训练RPC序列对无监督学习模型进行训练，获取所述无监督学习模型的模型参数；

第二训练模块704，用于将所述模型参数作为所述账户检测模型的初始模型参数，将第二训练RPC序列作为所述账户检测模型的输入，并将所述第二训练RPC序列的标签作为所述账户检测模型的输出，以训练所述账户检测模型。

上述装置中各个模块的功能和作用的实现过程具体详情见上述账户检测模型的训练方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本说明书装置的实施例可以应用在计算机设备上，例如服务器或终端设备。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在文件处理的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图8所示，为本说明书装置所在计算机设备的一种硬件结构图，除了图8所示的处理器802、内存804、网络接口806、以及非易失性存储器808之外，实施例中装置所在的服务器或电子设备，通常根据该计算机设备的实际功能，还可以包括其他硬件，对此不再赘述。

相应地，本说明书实施例还提供一种计算机存储介质，所述存储介质中存储有程序，所述程序被处理器执行时实现上述任一实施例中的方法。

相应地，本说明书实施例还提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一实施例中的方法。

本说明书实施例可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体，可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于：相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

本领域技术人员在考虑说明书及实践这里公开的内容后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

以上所述仅为本公开的较佳实施例而已，并不用以限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开保护的范围之内。

Claims

1.一种账户检测方法，所述方法包括：

将所述RPC序列输入预先训练的账户检测模型，以检测所述待检测账户的安全性；其中，所述账户检测模型在训练过程中将预先训练的无监督学习模型的模型参数作为初始模型参数，所述无监督学习模型通过第一训练RPC序列预先训练；

所述无监督学习模型根据以下方式训练得到：

将所述第一训练RPC序列输入所述无监督学习模型；其中，随机隐藏所述第一训练RPC序列中的至少一个RPC单元，并通过所述无监督学习模型预测隐藏的所述至少一个RPC单元；

根据预测结果对所述无监督学习模型进行训练。

2.根据权利要求1所述的方法，所述账户检测模型根据以下方式训练得到：

将所述无监督学习模型的模型参数作为所述账户检测模型的初始模型参数，将第二训练RPC序列作为所述账户检测模型的输入，并将所述第二训练RPC序列的标签作为所述账户检测模型的输出，以训练所述账户检测模型。

3.根据权利要求1或2所述的方法，所述无监督学习模型和/或所述账户检测模型为由若干层LSTM构成的机器学习模型。

4.一种账户检测模型的训练方法，所述方法包括：

将所述模型参数作为所述账户检测模型的初始模型参数，将第二训练RPC序列作为所述账户检测模型的输入，并将所述第二训练RPC序列的标签作为所述账户检测模型的输出，以训练所述账户检测模型；

通过第一训练RPC序列对无监督学习模型进行训练的步骤包括：

根据预测结果对所述无监督学习模型进行训练。

5.根据权利要求4所述的方法，所述无监督学习模型和/或所述账户检测模型为由若干层LSTM构成的机器学习模型。

6.一种账户检测装置，所述装置包括：

检测模块，用于将所述RPC序列输入预先训练的账户检测模型，以检测所述待检测账户的安全性；其中，所述账户检测模型在训练过程中将预先训练的无监督学习模型的模型参数作为初始模型参数，所述无监督学习模型通过第一训练RPC序列预先训练；

所述无监督学习模型根据以下方式训练得到：

根据预测结果对所述无监督学习模型进行训练。

7.一种账户检测模型的训练装置，所述装置包括：

第二训练模块，用于将所述模型参数作为所述账户检测模型的初始模型参数，将第二训练RPC序列作为所述账户检测模型的输入，并将所述第二训练RPC序列的标签作为所述账户检测模型的输出，以训练所述账户检测模型；

所述第一训练模块用于：

根据预测结果对所述无监督学习模型进行训练。

8.一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权利要求1至5任意一项所述的方法。

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至5任意一项所述的方法。