CN113098912B - 用户账户异常的识别方法、装置、电子设备及存储介质 - Google Patents
用户账户异常的识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113098912B CN113098912B CN202110641125.2A CN202110641125A CN113098912B CN 113098912 B CN113098912 B CN 113098912B CN 202110641125 A CN202110641125 A CN 202110641125A CN 113098912 B CN113098912 B CN 113098912B
- Authority
- CN
- China
- Prior art keywords
- account
- value
- type
- group
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
- H04L63/1425—Traffic logging, e.g. anomaly detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Debugging And Monitoring (AREA)
Abstract
本公开关于一种用户账户异常的识别方法、装置、电子设备及存储介质。该方法包括:根据平台中各用户账户的当前被关注值,将各用户账户分别归属至预设的多个账户分组中对应的账户分组;获取与各个账户分组的被关注值区间对应的异常检测模型,通过所述异常检测模型检测各个账户分组中的疑似异常账户,并合并多个账户分组中疑似异常账户,得到平台的疑似异常账户。本公开基于用户账户的当前被关注值以及当前的被关注值变化量进行用户账户异常检测,无需获取多种不同属性的用户账户信息,提高了进行用户账户异常识别的效率,针对被关注值差别较大的用户账户可通过不同的异常检测模型进行异常识别,进一步提高了用户账户异常识别的准确性。
Description
技术领域
本公开涉及通信技术领域,尤其涉及一种用户账户异常的识别方法、装置、电子设备及存储介质。
背景技术
随着社交网络技术的发展,用户可以在不同平台中注册用户账户并发布信息,还可以与平台中的其他用户或者粉丝互动,当用户账户发生异常时,平台管理方需要针对该用户账户的权限进行限制,以确保平台的信息安全。
相关技术中,通常通过检测用户账户的登陆行为、操作行为等行为信息,判断该用户账户是否出现异常,而用户账户异常通常还可能是由登陆行为、操作行为以外的因素引起的,因此,相关技术中对用户账户异常检测的准确性较低。
发明内容
本公开提供一种用户账户异常的识别方法、装置、电子设备及存储介质,以至少解决相关技术中对用户账户异常检测准确性低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种用户账户异常的识别方法,包括:
获取平台中各用户账户的当前被关注值,并根据所述当前被关注值,将各用户账户归属至预设的多个账户分组中的某个账户分组;其中,所述多个账户分组分别对应有不同被关注值区间;
获取与各个账户分组的被关注值区间对应的异常检测模型,通过所述异常检测模型检测所述各个账户分组中的疑似异常账户;所述异常检测模型用于根据各用户账户的被关注值变化量,检测各用户账户是否为疑似异常账户;
合并所述多个账户分组内的疑似异常账户,得到所述平台的疑似异常账户。
在其中一个实施例中,获取平台中各用户账户的当前被关注值,并根据所述当前被关注值,将各用户账户归属至预设的多个账户分组中的某个账户分组之前,还包括:
获取所述平台对应的被关注值范围,将所述被关注值范围划分为多个被关注值区间;
针对所述多个被关注值区间,分别配置对应的账户分组,作为所述多个账户分组。
在其中一个实施例中,获取与各个账户分组的被关注值区间对应的异常检测模型,包括:
根据预设的被关注值区间与异常检测模型之间的对应关系,得到与所述各个账户分组的被关注值区间对应的异常检测模型。
在其中一个实施例中,所述通过所述异常检测模型检测所述各个账户分组中的疑似异常账户,包括:
针对各个账户分组,获取该账户分组对应的被关注值变化序列;所述被关注值变化序列用于表征该账户分组中用户账户在多个历史时刻的被关注值变化量的统计信息;
获取该账户分组中各用户账户在检测时刻的被关注值变化量;
通过所述异常检测模型,将所述各用户账户的所述被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定所述各用户账户在所述检测时刻是否为疑似异常账户;所述检测值区间基于该账户分组的所述被关注值变化序列确定。
在其中一个实施例中,所述被关注值变化序列包括第一类型变化序列;所述第一类型变化序列用于表征在多个历史时刻该账户分组中第一类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第一类型账户为在该历史时刻有发布信息的用户账户;
所述通过所述异常检测模型,将所述各用户账户的所述被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定所述各用户账户在所述检测时刻是否为疑似异常账户,包括:
针对该账户分组中的第一类型账户,将各第一类型账户的所述被关注值变化量与第一检测值区间进行比对,并根据对比结果,确定所述各第一类型账户在所述检测时刻是否为疑似异常账户;所述第一检测值区间基于该账户分组的所述第一类型变化序列确定。
在其中一个实施例中,所述针对各个账户分组,获取该账户分组对应的被关注值变化序列,包括:
对于每个设定的历史时刻,获取该账户分组中多个第一类型账户的被关注值变化量的第一加权平均值,以及该账户分组中多个第二类型账户的被关注值变化量的第二加权平均值;所述历史时刻的所述第二类型账户为在该历史时刻未发布信息的用户账户;
根据所述第一加权平均值和第二加权平均值的差值,得到所述历史时刻该账户分组中第一类型账户对应的被关注值变化量的第一统计信息;
根据所述多个历史时刻该账户分组对应的第一统计信息,得到所述第一类型变化序列。
在其中一个实施例中,所述根据对比结果,确定所述各个第一类型账户在所述检测时刻是否为疑似异常账户,包括:
当第一类型账户的被关注值变化量未落入所述第一检测值区间时,确定该第一类型账户在该检测时刻为疑似异常账户。
在其中一个实施例中,所述被关注值变化序列包括第二类型变化序列;所述第二类型变化序列用于表征多个历史时刻该账户分组中第二类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第二类型账户为在该历史时刻未发布信息的用户账户;
所述通过所述异常检测模型,将所述各用户账户的所述被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定所述各用户账户在所述检测时刻是否为疑似异常账户,包括:
针对该账户分组中的第二类型账户,将各第二类型账户的所述被关注值变化量与第二检测值区间进行比对,并根据对比结果,确定所述各个第二类型账户在所述检测时刻是否为疑似异常账户;所述第二检测值区间基于该账户分组的所述第二类型变化序列确定。
在其中一个实施例中,所述针对各个账户分组,获取该账户分组对应的被关注值变化序列,还包括:
对于每个设定的历史时刻,获取该账户分组中多个第二类型账户的被关注值变化量的第二加权平均值;
根据所述第二加权平均值,得到在所述历史时刻该账户分组中第二类型账户对应的被关注值变化量的第二统计信息;
根据在所述多个历史时刻该账户分组对应的第二统计信息,得到所述第二类型变化序列。
在其中一个实施例中,所述根据对比结果,确定所述各个第二类型账户在所述检测时刻是否为疑似异常账户,包括:
当第二类型账户的被关注值变化量未落入所述第二检测值区间时,确定该第二类型账户在该检测时刻为疑似异常账户。
根据本公开实施例的第二方面,提供一种用户账户异常的识别装置,包括:
账户分组确定单元,被配置为执行获取平台中各用户账户的当前被关注值,并根据所述当前被关注值,将各用户账户分别归属至预设的多个账户分组中对应的某个账户分组;其中,所述多个账户分组分别对应有不同被关注值区间;
异常账户检测单元,被配置为执行获取与各个账户分组的被关注值区间对应的异常检测模型,通过所述异常检测模型检测所述各个账户分组中的疑似异常账户;所述异常检测模型用于根据对应账户分组中各用户账户的被关注值变化量,检测各用户账户是否为疑似异常账户;
异常账户获取单元,被配置为执行合并所述多个账户分组内的疑似异常账户,得到所述平台的疑似异常账户。
在其中一个实施例中,所述账户分组确定单元还包括:
账户分组获取模块,被配置为执行获取所述平台对应的被关注值范围,将所述被关注值范围划分为多个被关注值区间;针对所述多个被关注值区间,分别配置对应的账户分组,作为所述多个账户分组。
在其中一个实施例中,所述异常账户检测单元包括:
异常检测模型获取模块,被配置为执行根据预设的被关注值区间与异常检测模型之间的对应关系,得到与所述各个账户分组的被关注值区间对应的异常检测模型。
在其中一个实施例中,所述异常账户检测单元包括:
分组序列获取模块,被配置为执行针对各个账户分组,获取该账户分组对应的被关注值变化序列;所述被关注值变化序列用于表征该账户分组中用户账户在多个历史时刻的被关注值变化量的统计信息;
被关注值变化量获取模块,被配置为执行获取该账户分组中各用户账户在检测时刻的被关注值变化量;
异常账户确定模块,被配置为执行通过所述异常检测模型,将所述各用户账户的所述被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定所述各用户账户在所述检测时刻是否为疑似异常账户;所述检测值区间基于该账户分组的所述被关注值变化序列确定。
在其中一个实施例中,所述分组被关注值变化序列包括第一类型变化序列;所述第一类型变化序列用于表征在多个历史时刻该账户分组中的第一类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第一类型账户为在该历史时刻发布信息的用户账户;
所述异常账户确定模块包括:
第一异常账户确定子模块,被配置为执行针对该账户分组中的第一类型账户,将各第一类型账户的所述被关注值变化量与所述第一检测值区间进行比对,并根据对比结果,确定所述各第一类型账户在所述检测时刻是否为疑似异常账户;所述第一检测值区间基于该账户分组的所述第一类型变化序列确定。
在其中一个实施例中,所述分组序列获取模块包括,
第一序列获取子模块,被配置为执行对于每个设定的历史时刻,获取该账户分组中多个第一类型账户的被关注值变化量的第一加权平均值,以及该账户分组中多个第二类型账户的被关注值变化量的第二加权平均值;所述历史时刻的所述第二类型账户为在该历史时刻未发布信息的用户账户;根据所述第一加权平均值和第二加权平均值的差值,得到所述历史时刻该账户分组中第一类型账户对应的被关注值变化量的第一统计信息;根据所述多个历史时刻该账户分组对应的第一统计信息,得到所述第一类型变化序列。
在其中一个实施例中,所述第一异常账户确定子模块,进一步被配置为执行当第一类型账户的被关注值变化量未落入所述第一检测值区间时,确定该第一类型账户在该检测时刻为疑似异常账户。
在其中一个实施例中,所述分组被关注值变化序列包括第二类型变化序列;所述第二类型变化序列用于表征多个历史时刻该账户分组中的第二类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第二类型账户为在该历史时刻未发布信息的用户账户;
所述异常账户确定模块包括:
第二异常账户确定子模块,被配置为执行针对该账户分组中的第二类型账户,将各第二类型账户的所述被关注值变化量与所述第二检测值区间进行比对,并根据对比结果,确定所述各个第二类型账户在所述检测时刻是否为疑似异常账户;所述第二检测值区间基于该账户分组的所述第二类型变化序列确定。
在其中一个实施例中,所述分组序列获取模块包括,
第二序列获取子模块,被配置为执行对于每个设定的历史时刻,获取该账户分组中多个第二类型账户的被关注值变化量的第二加权平均值;根据所述第二加权平均值,得到在所述历史时刻该账户分组中第二类型账户对应的被关注值变化量的第二统计信息;根据在所述多个历史时刻该账户分组对应的第二统计信息,得到所述第二类型变化序列。
在其中一个实施例中,所述第二异常账户确定子模块,进一步被配置为执行当第二类型账户的被关注值变化量未落入所述第二检测值区间时,确定该第二类型账户在该检测时刻为疑似异常账户。
根据本公开实施例的第三方面,提供一种电子设备,包括处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现上述第一方面中任一实施例中所述的用户账户异常的识别方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述第一方面中任一实施例中所述的用户账户异常的识别方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一实施例中的用户账户异常的识别方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开基于用户账户的当前被关注值以及当前的被关注值变化量进行用户账户异常检测,无需获取多种不同属性的用户账户信息,提高了进行用户账户异常检测的效率,并且基于当前被关注值将用户账户归属于对应的账户分组,各个账户分组对应不同的异常检测模型,使得被关注值差别较大的用户账户分别通过不同方式进行异常识别,进一步提高了用户账户异常识别的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种用户账户异常的识别方法的流程图。
图2是根据另一示例性实施例示出的一种用户账户异常的识别方法的流程图。
图3是根据另一示例性实施例示出的一种用户账户异常的识别方法的流程图。
图4是根据一示例性实施例示出的一种用户账户异常识别结果示意图。
图5是根据另一示例性实施例示出的一种用户账户异常的识别方法的流程图。
图6是根据一示例性实施例示出的一种用户账户异常的识别装置的结构框图。
图7是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开所提供的用户账户异常的识别方法,可以应用于平台对应的服务器中。该服务器可以根据平台中的用户账户的当前被关注值,通过对应的异常检测模型,进行各用户账户的异常检测。该服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。可以理解的是,上述方法还可以应用于包括终端和服务器的***中,并通过终端和服务器的交互实现。
本公开中,平台可以是短视频平台、知识问答平台、实时消息广播平台等,用户可通过平台注册用户账户,还可以发布信息,以及浏览其他用户发布的信息。
本公开中,用户账户可以是平台上用于区分用户身份的信息。不同的平台上,用户账户体系可以不同。例如,在一些平台中,用户账户可以是用户ID或用户编码的形式。
本公开中,被关注值可以理解为用户账户对应的粉丝数量、点赞数量、收藏数量、评论数量中的一项或者多项,或者其他代表用户账户的被关注度的变量参数。各用户账户的被关注值具有可变性,例如当用户账户发布消息、产生关联事件等,被关注值会发生增加或减少。被关注值接近的用户账户,其被关注值随各种事件的变化通常具有相似性,而不符合该相似性的用户账户,可能发生账户异常,因此服务器可以基于被关注值变化量识别疑似异常账户。本公开的部分实施例中将以被关注值为粉丝数量来进行示例说明。
图1是根据一示例性实施例示出的一种用户账户异常的识别方法的流程图,如图1所示,用户账户异常的识别方法用于服务器中,包括以下步骤:
在步骤S110中,获取平台中各用户账户的当前被关注值,并根据当前被关注值,从预设的多个账户分组中确定各用户账户对应的账户分组,将各用户账户分别归属至对应的账户分组。
本公开中,用户账户的当前被关注值指的是在启动用户账户异常识别的时刻,该用户账户的被关注值。
本公开中,预设的多个账户分组可以按照平台中用户账户整体上的被关注值的分布情况,划分出多个被关注值区间,基于这多个被关注值区间确定多个账户分组,多个账户分组分别对应有不同的被关注值区间。在某一时刻,归属于某一账户分组的用户账户,在被关注值方面具有相似性。被关注值区间可以是被关注值的数值区间,是将平台的被关注值范围进行划分得到。服务器可以预先配置各个账户分组与被关注值区间的对应关系。例如,服务器针对平台的用户账户划分m个分组,编号依次为0至m-1,并且配置其中账户分组0对应的被关注值区间为[0-10),账户分组1对应的被关注值区间为[10-100),账户分组5对应的被关注组区间可以为[100000-1000000),以此类推,账户分组i()对应的被关注值区间可为。
其中,获取平台中各用户账户的当前被关注值,可以是服务器从存储模块中获取记录的平台各用户账户的当前被关注值。该存储模块可以是服务器的内存,也可以是服务器可访问的独立存储装置。在一些情况下,服务器可以实时获取各用户账户的当前被关注值。
其中,根据当前被关注值,从预设的多个账户分组中确定各用户账户对应的账户分组,将各用户账户分别归属至对应的账户分组,指的是服务器可以根据用户账户的当前被关注值落入的被关注值区间,确定该被关注值区间对应的账户分组,作为该用户账户对应的账户分组,并将该用户账户归属至该账户分组。对应的具体实施方式可为,服务器可以获取某一用户账户的当前被关注值落入的被关注值区间,根据该被关注值区间对应的账户分组,确定该用户账户对应的账户分组,并将该用户账户归属至该账户分组中。
具体地,服务器可以获取平台各用户账户的当前被关注值,根据各用户账户的当前被关注值落入的被关注值区间,从该关注值区间对应的账户分组中,确定各用户账户对应的账户分组,并将各用户中分别归属至对应的账户分组。
例如,在时刻t,服务器获取用户账户x的当前被关注值,根据当前被关注值落入的被关注值区间,确定该用户账户x在时刻t归属于账户分组x。服务器可以将该用户账户的当前被关注值、账户分组x对应的标识和时刻t作为一组关联数据,存储在该用户账户x的相关信息中。
在步骤S120中,获取与各个账户分组的被关注值区间对应的异常检测模型,通过异常检测模型检测各个账户分组中的疑似异常账户。所述异常检测模型用于根据各用户账户的被关注值变化量,检测各用户账户是否为疑似异常账户。
本公开中,异常检测模型可以基于对应账户分组对应的被关注值区间确定,可以是时间序列模型或深度学习模型,可以用于根据对应账户分组中各用户账户的被关注值变化量,检测各用户账户是否为疑似异常账户。不同账户分组中的用户账户的被关注值变化规律、被关注值大小存在不同。
本公开中,疑似异常账户可以理解为该用户账户的被关注值发生了明显不符合预期规律的变化,可能是与该用户账户在历史时刻的被关注值变化表现不符合,或者与该用户账户相似的其他用户账户的被关注值变化表现不符。
本公开中,各个账户分组分别对应有不同的异常检测模型。各个账户分组中的用户账户的被关注值变化规律、被关注值数值大小等存在不同,服务器可以基于账户分组对应的被关注值区间,确定各个账户分组对应的异常检测模型。其中,异常检测模型可以是时间序列模型或深度学习模型,用于根据对应账户分组中各用户账户的被关注值变化量,检测各用户账户的异常状况。
其中,被关注值变化量可以是在某一时间周期内,用户账户在当前时刻的被关注值与检测时刻时的被关注值的差值。例如,时间周期为T,获取当前被关注值对应的时刻为t,检测时刻可以为t+T,服务器可以获取用户账户x在t时刻的被关注值,和t+T时刻的被关注值,根据t时刻和t+T时刻的被关注值的差值,可以得到用户账户x的被关注值变化量。
具体地,服务器可以根据账户分组与异常检测模型的对应关系,确定各个账户分组对应的异常检测模型,并通过异常检测模型,检测对应的各个账户分组中的用户账户的被关注值变化量,以确定各个账户分组中的疑似异常账户。异常检测模型可以包括3-sigma模型、prophet 模型等。3-Sigma 又称为拉依达准则,是先假设一组检测数据只含有随机误差,对已检测到的一组数据进行计算处理得到标准差,然后基于该标准差确定一个区间,认为实际检测到的数据超过这个区间的就属于异常值。Prophet通过建立时间序列模型,根据已检测到的一组数据作为历史数据,对历史数据进行仿真得到下一时间点的数据预测值,并基于该数据预测值确定一个置信区间,当下一时间点的实际检测数据是否落入该置信区间,确定下一时间点的实际检测数据是否异常。
例如,针对上述账户分组1对应的被关注值区间为[10-100),服务器可以为其配置3-sigma 模型作为异常检测模型。而账户分组5对应的被关注值区间为[100000-1000000),该被关注值较大,服务器可以为其配置prophet 模型作为异常检测模型。那么,若用户账户x的当前被关注值为80,则可以判断该被关注值落入被关注值区间[10-100),则该用户账户x对应的账户分组为账户分组1,则可以通过3-sigma 模型对该用户账户x进行账户异常识别,以检测该用户账户x是否为疑似异常账户。若用户账户x的当前被关注值为900000,则对应的账户分组5,可以通过prophet 模型对该用户账户x进行账户异常识别,以检测该用户账户x是否为疑似异常账户。
此外,异常检测模型还可以为其他模型,如RNN(循环神经网络,Recurrent NeuralNetwork)检测模型、LSTM(长短期记忆网络,Long Short-Term Memory)检测模型等。
若账户分组i对应的异常检测模型记为,账户分组i中包括N个用户账户,服务器可以通过异常检测模型检测这N个用户账户的被关注值变化量,以确定各个用户账户是否为疑似异常账户,账户分组i中可包含小于或等于N个疑似异常账户。同理,其他账户分组中也分别采用各自对应的异常检测模型,检测出各账户分组中的疑似异常账户。
在步骤S130中,合并多个账户分组内的疑似异常账户,得到平台的疑似异常账户。
其中,合并多个账户分组内的疑似异常账户的具体实施方式可以将各个账户分组中的疑似异常账户直接合并,也可以获取各个疑似异常账户的异常概率的大小,按照概率大小筛选后进行合并等。
本公开中,多个账户分组内可以分别对应有被识别出的疑似异常账户。服务器可以将各个账户分组内的疑似异常账户合并,以得到平台整体的疑似异常账户,可以用于进行疑似异常账户分析和处理,例如将合并的疑似异常账户一起发送给平台管理员终端,以在平台管理员终端进行账户异常情况的审核。
上述用户账户异常的识别方法中,根据平台各用户账户的当前被关注值,从预设的多个账户分组中确定各用户账户对应的账户分组,并将各用户账户分别归属至对应的账户分组。获取与各个账户分组的被关注值区间对应的异常检测模型,通过所述异常检测模型检测各个账户分组中的疑似异常账户,并合并多个账户分组中疑似异常账户,得到平台的疑似异常账户。其中,异常检测模型用于根据对应账户分组中的各用户账户的被关注值变化量,检测各用户账户是否为疑似异常账户。本公开通过用户账户的当前被关注值和被关注值变化量进行用户账户异常检测,无需获取多种不同属性的用户账户信息,提高了进行用户账户异常检测的效率,并且基于当前被关注值将用户账户归属于预设的多个账户分组中某个账户分组,各个账户分组对应不同的异常检测模型,以对不同被关注值的用户账户分别进行异常识别,进一步提高了用户账户异常识别的准确性。
在一示例性实施例中,在上述步骤S110获取平台中各用户账户的当前被关注值,并根据当前被关注值,从预设的多个账户分组中确定各用户账户对应的账户分组的步骤之前,还包括:
获取平台对应的被关注值范围,将被关注值范围划分为多个被关注值区间;为多个被关注值区间,分别配置对应的账户分组,作为多个账户分组。
本公开中,平台对应的被关注值范围可以理解为台上的用户账户的被关注值的最小值和最大值所所确定的数值范围。平台上的用户账户的被关注值通常不同,从零到几千万不等。服务器可以获取当前平台上的用户账户的被关注值最大值作为该被关注值范围的最大值,也可以按照统计规律或同类其他平台的用户账户被关注值的最大值确定,被关注值最小值可以为0或者其他设定最小值。
本公开中,被关注值不同的用户账户,其被关注值增加或者减少等变化趋势是不同的,通过被关注值区间的划分,服务器可以将各个时刻时,被关注值相似的用户账户纳入同一账户分组,通过该账户分组中多个用户账户的被关注值变化趋势,得到被关注值在对应量级的用户账户的被关注值波动情况。在进行被关注值区间划分时,服务器可以根据检测精度的需求、服务器承载能力和***维护的角度,确定合适的被关注值区间的个数,并将划分得到各个被关注值区间,分别配置对应的账户分组,建立被关注值区间与账户分组之间的对应关系。
其中,平台能够达到几千万被关注值的用户账户数量通常较少,而大多数用户账户的被关注值有限,因此,在时刻t,落入被关注值区间[0-10)、 [10-100)的用户账户数量,明显大于落入[100000-1000000)的用户账户数量。服务器可以根据被关注值区间的个数、各个被关注值区间对应个用户账户数量、各个被关注值区间对应的被关注值变化规律等因素,将被关注值范围划分多个被关注值区间。
例如,账户分组0、账户分组1分别对应被关注值区间[0-10)、 [10-100)。上述两个分组的被关注值的基数较小,属于这两个分组的用户账户的被关注值变化趋势类似,因此可以为其配置同样的异常检测模型,例如3-sigma模型。
又例如,对于账户分组5对应被关注值区间[10000-100000),用户账户的被关注值基数较大,被关注值通常会呈现线性的变化,服务器可以为其配置与账户分组0和账户分组1不同的异常检测模型,例如prophet模型。
本公开中,服务器可以按照历史经验数据对被关注值范围进行区间划分,也可以按照被关注值范围对应的数据分布的情况,将被关注值范围进行处理,以得到多个被关注值区间,并配置各个被关注值区间对应的账户分组。
例如,各个被关注值区间以10为底数进行区间划分,如表1所示,以该被关注值范围可以划分为m个被关注值区间,则对应配置有m个账户分组(),在时刻 t,表征各个被关注值区间分别对应的账户分组,第 i 个账户分组所对应的被关注值区间为。同理,该底数10可以为其他自然数,服务器可以基于平台的被关注值范围情况和所需要的账户分组的数量来确定。
表1:
上述实施例的方案,通过获取平台对应的被关注值范围,可以将被关注值范围划分为多个被关注值区间,为各个被关注值区间分别配置对应的账户分组,使得服务器可以根据平台对应的被关注值范围确定对应的账户分组,提高了多个账户分组与平台的关联性。
在一示例性实施例中,步骤S120中,获取各个账户分组对应的异常检测模型,包括:
根据预设的被关注值区间与异常检测模型之间的对应关系,得到各个账户分组对应的异常检测模型。
本公开中,被关注值区间与异常检测模型之间的对应关系指的是,根据被关注值区间可以唯一确定该被关注值区间对应的异常检测模型。不同的被关注值区间对应的异常检测模型可以相同,也可以不同。
被关注值区间和账户分组也存在对应关系,因此账户分组与异常检测模型也存在对应关系。例如,被关注值区间[10-100)对应异常检测模型为3-sigma模型,且账户分组i对应于被关注值区间[10-100),因此账户分组i对应的异常检测模型为3-sigma模型。
上述实施例的方案,通过预设的被关注值区间与异常检测模型之间的对应关系,得到各个账户分组对应的异常检测模型,能够提高获取异常识别模型的效率。
在一示例性实施例中,步骤S120的通过异常检测模型检测各个账户分组中的疑似异常账户的步骤,包括:
步骤S121, 针对各个账户分组,获取该账户分组对应的被关注值变化序列。所述被关注值变化序列用于表征该账户分组中用户账户在多个历史时刻的被关注值变化量的统计信息。
本公开中,被关注值变化序列中的各个序列值,分别表示账户分组i中用户账户在对应历史时刻的被关注值变化量的统计信息,可基于该账户分组i中各用户账户在对应历史时刻的被关注值变化量得到。
例如,对于平台上的m个账户分组,针对其中的任意一个账户分组i,该账户分组i在时刻t()包含的多个用户账户的被关注值变化量的统计信息记为,服务器可以获得该账户分组i对应的被关注值变化序列,该被关注值变化序列反应了在n+1个时刻,归属于该账户分组i的用户账户的被关注值变化量的多个统计信息。
步骤S122, 获取该账户分组中各用户账户在检测时刻的被关注值变化量。
以账户分组i为例,上一个步骤121中,被关注值变化序列是基于历史时刻归于账户分组i中多个用户账户的被关注值变化量的统计信息得到的,可理解为针对账户分组i中曾经包含的多个历史用户账户而言,被关注值变化序列是用于反应多个历史用户账户的被关注值变化情况。而本步骤中,是针对账户分组i当前包含的各个用户账户而言,获取的是账户分组i中当前包含的各用户账户的被关注值变化量。
本公开中,若账户分组i中当前包含用户账户g,且用户账户g是在时刻k被归属于账户分组i中的,那么检测时刻可以指的是时刻k之后一个时间周期T的时刻,检测时刻可表示为k+1。对于用户账户g,在时刻 k 的被关注值以f(g, k)表示。检测时刻k+1时,用户账户g的被关注值变化量可表示为f(g, k+1)-f(g, k)。
应当说明的是,时间周期T可以是天为单位,也可以以小时、分钟、秒等为单位,指的是检测疑似异常账户的检测周期。
步骤S123,通过异常检测模型,将各用户账户的所述被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定各用户账户在检测时刻是否为疑似异常账户。所述检测值区间基于该账户分组的所述被关注值变化序列确定。
在一个实施例中,检测值区间具体可以基于异常检测模型的检测算法,对所述被关注值变化序列进行处理得到。
本公开中,检测算法指的是与异常检测模型用于对被关注值变化序列进行处理,以得到上述检测值区间的算法。各个异常检测模型可以对应有不同检测算法。例如,3-Sigma检测模型对应的检测算法,用于计算出对应序列中多个序列值的均值 u 和方差sigma,并确定 (u-3*sigma, u+3*sigma)作为对应的检测值区间。而 prophet检测模型对应的检测算法是,基于对应序列中的多个序列值,预测下一位序列值的数值范围,作为对应的检测值区间。
例如,针对上述的账户分组i,对应的被关注值变化序列为,当异常检测模型对应的检测算法是3-Sigma,可以计算中多个序列值的均值 u 和方差 sigma,此时检测值区间为 (u-3*sigma, u+3*sigma)。又例如,当异常检测模型对应的检测算法是Prophet,可以基于预测后续序列值的数值范围,作为检测值区间。
在一个实施例中,针对上述账户分组i中当前包含的用户账户g,在检测时刻k+1时,用户账户g的被关注值变化量为f(g, k+1)-f(g, k); 若f(g, k+1)-f(g, k)落入基于确定的检测值区间,表征该用户账户g在检测时刻不是疑似异常账户,若f(g, k+1)-f(g, k)未落入基于确定的检测值区间,表征该用户账户g在检测时刻是疑似异常账户。
本公开中,时刻k和检测时刻k+1,是针对疑似用户检测阶段计量的时刻,而时刻t和检测时刻t+1,是基于预先确定用户账户分组对应的被关注值变化序列过程中计量的时刻,属于两个不同维度的时刻。
基于此,服务器可以得到账户分组i在检测时刻的至少一个疑似异常账户,进而根据平台的多个账户分组在该检测时刻的疑似异常账户,得到平台在该检测时刻的疑似异常账户。
应当说明的是,服务器还可以根据用户账户的历史记录数据,进行某一历史时刻时的疑似异常账户判断。具体检测过程参照上述实施例。服务器可以根据各用户账户的历史记录数据,对该用户账户的历史行为进行追溯,以确定该用户账户的使用规范情况,还可以根据用户账户被列为疑似异常账户的频次,设置相应的***响应措施。
上述实施例的方案,针对各个账户分组,获取不同历史时刻包含的用户账户的被关注值变化量的统计值,生成上述的被关注值变化序列,充分考虑了同一账户分组中被关注值相似的多个用户账户的被关注值变化特征,并针对不同的账户分组使用不同的异常检测模型,提高了检测基准数据的准确性,并进一步提高异常账户检测的准确性。
在一示例性实施例中,各个账户分组的被关注值变化序列可以包括第一类型变化序列,所述第一类型变化序列用于表征在多个历史时刻该账户分组中第一类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第一类型账户为在该历史时刻有发布信息的用户账户。
其中,第一类型变化序列中的各个序列值,分别与各个历史时刻该账户分组中的第一类型账户和第二类型账户的被关注值变化量相关联;各个历史时刻的第一类型账户为在该历史时刻发布信息的用户账户,各个历史时刻的第二类型账户为在该历史时刻未发布信息的用户账户。
本公开中,用户账户类型指的是用户在对应时刻是否发布信息而划分的类型,将发布信息的用户账户划分为第一类型账户,将未发布信息的用户账户,划分为第二类型账户。对于时刻t时,账户分组i对应的用户账户集合为,对于中的各个用户账户,在t时刻发布信息的第一类型账户的集合表示为,在t时刻未发布信息的第二类型账户的集合表示为。也就是。
本公开中,第一类型变化序列可以是根据各个历史时刻时该账户分组中的第一类型账户和第二类型账户的被关注值变化量的统计信息得到的时间变化序列。
上述实施例的方案,将账户分组中的用户账户按照是否发布信息进行划分,并为发布信息的用户账户类型单独确定对应的异常检测序列(即上述的第一类型变化序列),基于该异常检测序列进行用户账户的异常检测,提高了针对发布信息的用户账户的异常识别的准确性。
例如,服务器可以获取账户分组i中第一类型账户的集合中用户账户的被关注值变化量的统计信息,获取其中第二类型账户的集合中用户账户的被关注值变化量的统计信息。和可以通过如下公式获得,其中,表征时刻t,账户分组i中第一类型账户的数量,表征时刻t,账户分组i中第二类型账户的数量。f(b,t)表示账户分组i中第一类型账户b 在历史时刻 t 的被关注值,f(b,t+1)表示账户分组i中第一类型账户b在历史时刻 t+1 的被关注值。f(c,t)表示账户分组i中第二类型账户c在历史时刻 t 的被关注值,f(c,t+1)表示账户分组i中第二类型账户c在历史刻 t+1 的被关注值。
在一个实施例中,和的对比结果,可以是和的差值,即。得到账户分组i 的第一类型变化序列,根据该第一类型变化序列,能够整体统计出属于该账户分组i的第一类型账户,在多个不同时刻的被关注值变化情况,更加准确的描述了在该账户分组i对应的被关注值区间下,账户发布作品之后的预期涨粉变化数量。
在一示例性实施例中,如图2所示,步骤S123的通过异常检测模型,将各用户账户的被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定各用户账户在所检测时刻是否为疑似异常账户的步骤,包括:
步骤S310,基于该账户分组的第一类型变化序列以及异常检测模型对应的检测算法,确定第一检测值区间。
本公开中,第一检测值区间指的是基于账户分组i的异常检测模型对应的检测算法,对第一类型变化序列进行处理得到的检测值区间。若账户分组i对应的异常检测模型为,对应的第一类型变化序列为,服务器可以通过对应的检测算法,针对进行计算,得到对应的第一检测值区间。如,可以计算对应的均值 u 和方差 sigma,得到第一检测值区间为 (u-3*sigma, u+3*sigma)。
步骤S320,针对该账户分组中的第一类型账户,获取各第一类型账户在检测时刻的被关注值变化量。
本公开中,检测时刻可以为k+1,服务器可以获取账户分组i中在时刻k为第一类型账户b,并获取该第一类型账户b在时刻k的当前被关注值f(b, k),以及在检测时刻k+1时的被关注值f(b, k+1),进而获取该第一类型账户b在检测时刻k+1时的被关注量值变化值f(b, k+1)-f(b, k)。
步骤S330,将各第一类型账户的被关注值变化量与第一检测值区间进行比对,并根据对比结果,确定所述各第一类型账户在所述检测时刻是否为疑似异常账户。
具体地,当第一类型账户b的被关注量值变化值f(b, k+1)-f(b, k)落入该第一检测值区间,则该第一类型账户b判断为正常账户。当第一类型账户b的被关注量值变化值f(b, k+1)-f(b, k)未落入该第一检测值区间时,则将该第一类型用户x判断为疑似异常账户。
通过上述实施例,通过将对用户账户的异常检测,转换为异常数值的检测,有利于提高检测效率。
在一示例性实施例中,账户分组对应的被关注值变化序列可以包括第二类型变化序列,所述第二类型变化序列用于表征多个历史时刻该账户分组中第二类型账户对应的被关注值变化量的统计信息。因此,第二类型变化序列中的各个序列值,分别与各个历史时刻该账户分组中的第二类型账户的被关注值变化量相关联,各个历史时刻的第二类型账户为在该历史时刻未发布信息的用户账户。
上述实施例的方案,将账户分组中的用户账户按照是否发布信息进行划分,并为未发布信息的用户账户类型单独确定对应的异常检测序列(即上述的第二类型变化序列),基于该异常检测序列进行未发布信息的用户账户的异常检测,提高了针对未发布信息的用户账户的异常识别的准确性。
根据上述实施例确定的第二类型变化序列,能够整体统计出属于各账户分组的未发布信息的账户的预期涨粉变化数量,为后续账户分组中未发布信息的账户的异常检测提供基础,有利于提高未发布信息的账户的异常检测准确度。
在一示例性实施例中,如图3所示,步骤S223的通过异常检测模型,将各用户账户的被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定各用户账户在检测时刻是否为疑似异常账户,包括:
步骤S410,基于该账户分组的第二类型变化序列以及异常检测模型对应的检测算法,确定第二检测值区间。
本公开中,第二检测值区间指的是基于账户分组i的异常检测模型对应的检测算法,对第二类型变化序列进行处理得到的检测值区间。若账户分组i对应的异常检测模型为,对应的第二类型变化序列为,服务器可以通过对应的检测算法,针对进行计算,得到对应的第二检测值区间。
步骤S420,针对该账户分组中的第二类型账户,获取各第二类型账户在检测时刻的被关注值变化量。
本公开中,检测时刻k+1,服务器可以获取账户分组i中第二类型账户c的被关注值变化量f(c,k+1)- f(c,k)。
步骤S430,将各第二类型账户的被关注值变化量与第二检测值区间进行比对,并根据对比结果,确定各个第二类型账户在所述检测时刻是否为疑似异常账户。
例如,当第二类型账户c的被关注值变化量f(c,k+1)- f(c,k)落入该第二检测值区间时,则将该第二类型账户c判断为正常账户。当第二类型账户c的被关注值变化量f(c,k+1)- f(c,k)未落入该第二检测值区间时,则将该第二类型用户c判断为疑似异常账户。如图4所示,为某平台在2008至2017年的疑似异常账户的统计情况。
通过上述实施例,通过将对用户账户的异常检测转换为异常数值的检测,有利于提高检测效率。
在一示例性实施例中,将用户账户异常的识别方法,应用在基于用户账户的粉丝数量变化量进行用户账户异常识别过程中,进行详细说明:
如图5所示,基于用户账户的粉丝数量进行用户账户的异常识别,包括以下步骤:
步骤S510中,服务器将社交平台的用户账户进行分组,得到多个账户分组,其中,不同的账户分组里面的用户账户的粉丝数量变化趋势不同。
本公开中,服务器基于用户帐号的粉丝数量确定账户分组。通常来说,用户账户的粉丝数量从零到几千万不等,能够达到几千万粉丝的帐号属于头部帐号,而大多数帐号则是集中在底部的,粉丝数量有限。而且在进行账户分组划分的时候,要保证账户分组的数量m 不能够太大,因为 m 的数量太大会导致异常检测模型特别多,不利于整个***的维护。
其中,平台上基于用户账户粉丝数量分布范围,可以分成 m 个账户分组,第 i (0≤i≤m-1)个账户分组在时刻 t 所对应的用户账户集合是, 而根据在时刻t这些用户账户是否有发信息的行为,可以分为发布了信息的用户账户集合 和没有发布信息的用户账户集合,也就是,并且表示平台的全体用户账户的集合。
步骤S520中,服务器预先基于不同的账户分组构建对应的粉丝数量变化序列,然后在不同的账户分组里面使用相应的异常检测模型来进行异常账户的识别。
本公开中,服务器可以构建各个账户分组的粉丝数变化序列的过程如下。
因此,在时刻t时,发布了信息的用户账户的粉丝变化数量的期望可表示为。当时,针对账户分组i中发布了信息的用户账户,构建的序列可以为。该序列描述了在对应粉丝数量下,该账户分组内的用户账户发布信息之后的预期涨粉变化数量。
本公开中,服务器可以通过各个用户分组对应的异常检测模型,对该用户分组对应的序列进行计算。例如,异常检测模型可以包括3-Sigma 模型。基于3-Sigma 模型可以计算中多个序列值的均值 u 和方差sigma,进而得到第一检测值区间。若在检测时刻归属于账户分组i的、且发布了信息的用户账户的真实粉丝数量变化值在之外,则确定该用户账户为疑似异常账户。
服务器可以通过账户分组i对应的异常检测模型对应的检测算法处理该序列,得到第二检测值区间。针对在检测时刻归属于账户分组i的没有发布信息的用户账户,当该没有发布信息的用户账户在检测时刻的粉丝数量变化值未落入第二检测值区间中时,则确定为疑似异常账户。
步骤S530中,服务器将粉丝疑似异常的用户账户汇聚在一起,形成粉丝异常的用户账户集合,并推送给平台管理员进行审核和决策。
本公开中,服务器可以获得各个账户分组对应的疑似异常账户对应的信息,例如,该疑似异常账户的粉丝变化情况、是否发布信息、发布信息的内容、用户账户昵称以及用户账户的个人简介等。
其中,服务器可以直接将各个账户分组中的疑似异常的用户账户直接合并,也可以根据各个疑似异常账户的异常情况,以及所归属的账户分组,分类合并之后,形成疑似异常粉丝集合。
上述实施例的方案,根据平台的粉丝数量分布,确定账户分组对应的异常检测模型。将各个账户分组内的用户账户,按照在各个时刻是否发布信息进行类型划分,并针对各个用户类型分别获取对应的序列,作为异常检测的基础,提高各个账户分组内各个用户账户异常检测的准确性。
应该理解的是,虽然图1-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-5中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的至少一部分轮流或者交替地执行。
图6是根据一示例性实施例示出的一种用户账户异常的识别装置框图。参照图6,该装置包括账户分组确定单元610,异常账户检测单元620和异常账户获取单元630。
该账户分组确定单元610,被配置为执行获取平台中各用户账户的当前被关注值,并根据所述当前被关注值,从预设的多个账户分组中确定各用户账户对应的账户分组,将各用户账户分别归属至对应的账户分组;其中,所述多个账户分组分别对应有不同被关注值区间;
该异常账户检测单元620,被配置为执行获取与各个账户分组的被关注值区间对应的异常检测模型,通过所述异常检测模型检测所述各个账户分组中的疑似异常账户;所述异常检测模型用于根据对应账户分组中各用户账户的被关注值变化量,检测各用户账户是否为疑似异常账户;
该异常账户获取单元630,被配置为执行合并所述多个账户分组内的疑似异常账户,得到所述平台的疑似异常账户。
在一示例性实施例中,账户分组确定单元610还包括:账户分组获取模块,被配置为执行获取所述平台对应的被关注值范围,将所述被关注值范围划分为多个被关注值区间;针对所述多个被关注值区间,分别配置对应的账户分组,作为所述多个账户分组。
在一示例性实施例中,所述异常账户检测单元620包括:异常检测模型获取模块,被配置为执行根据预设的被关注值区间与异常检测模型之间的对应关系,得到与所述各个账户分组的被关注值区间对应的异常检测模型。
在一示例性实施例中,异常账户检测单元620包括:分组序列获取模块,被配置为执行针对各个账户分组,获取该账户分组对应的被关注值变化序列;所述被关注值变化序列用于表征该账户分组中用户账户在多个历史时刻的被关注值变化量的统计信息;被关注值变化量获取模块,被配置为执行获取该账户分组中各用户账户在检测时刻的被关注值变化量;异常账户确定模块,被配置为执行通过所述异常检测模型,将所述各用户账户的所述被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定所述各用户账户在所述检测时刻是否为疑似异常账户;所述检测值区间基于该账户分组的所述分组被关注值变化序列以及所述异常检测模型对应的检测算法得到。
在一示例性实施例中,所述分组被关注值变化序列包括第一类型变化序列;所述第一类型变化序列用于表征在多个历史时刻该账户分组中的第一类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第一类型账户为在该历史时刻发布信息的用户账户;所述异常账户确定模块包括:第一异常账户确定子模块,被配置为执行针对该账户分组中的第一类型账户,将各第一类型账户的所述被关注值变化量与所述第一检测值区间进行比对,并根据对比结果,确定所述各第一类型账户在所述检测时刻是否为疑似异常账户;所述第一检测值区间基于该账户分组的所述第一类型变化序列确定。
在一示例性实施例中,所述分组序列获取模块包括,
第一序列获取子模块,被配置为执行对于每个设定的历史时刻,获取该账户分组中多个第一类型账户的被关注值变化量的第一加权平均值,以及该账户分组中多个第二类型账户的被关注值变化量的第二加权平均值;所述历史时刻的所述第二类型账户为在该历史时刻未发布信息的用户账户;根据所述第一加权平均值和第二加权平均值的差值,得到所述历史时刻该账户分组中第一类型账户对应的被关注值变化量的第一统计信息;根据所述多个历史时刻该账户分组对应的第一统计信息,得到所述第一类型变化序列。
在一示例性实施例中,所述第一异常账户子模块,进一步被配置为执行当第一类型账户的被关注值变化量未落入所述第一检测值区间时,确定该第一类型账户在该检测时刻为疑似异常账户。
在一示例性实施例中,所述分组被关注值变化序列包括第二类型变化序列;所述第二类型变化序列用于表征多个历史时刻该账户分组中的第二类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第二类型账户为在该历史时刻未发布信息的用户账户;所述异常账户确定模块包括:第二异常账户确定子模块,被配置为执行针对该账户分组中的第二类型账户,将各第二类型账户的所述被关注值变化量与所述第二检测值区间进行比对,并根据对比结果,确定所述各个第二类型账户在所述检测时刻是否为疑似异常账户;所述第二检测值区间基于该账户分组的所述第二类型变化序列确定。
在一示例性实施例中,所述分组序列获取模块包括,第二序列获取子模块,被配置为执行对于每个设定的历史时刻,获取该账户分组中多个第二类型账户的被关注值变化量的第二加权平均值;根据所述第二加权平均值,得到在所述历史时刻该账户分组中第二类型账户对应的被关注值变化量的第二统计信息;根据在所述多个历史时刻该账户分组对应的第二统计信息,得到所述第二类型变化序列。
在一示例性实施例中,所述第二异常账户确定子模块,进一步被配置为执行当第二类型账户的被关注值变化量未落入所述第二检测值区间时,确定该第二类型账户在该检测时刻为疑似异常账户。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种用户账户异常的识别的电子设备700的框图。例如,电子设备700可以为一服务器。参照图7,电子设备700包括处理组件720,其进一步包括一个或多个处理器,以及由存储器722所代表的存储器资源,用于存储可由处理组件720的执行的指令,例如应用程序。存储器722中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件720被配置为执行指令,以执行上述用户账户异常的识别的方法。
电子设备700还可以包括一个电源组件724,被配置为执行电子设备700的电源管理,一个有线或无线网络接口726被配置为将电子设备700连接到网络,和一个输入输出(I/O)接口728。电子设备700可以操作基于存储在存储器722的操作***,例如WindowsServer,Mac OSX,Unix,Linux,FreeBSD或类似。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器722,上述指令可由电子设备700的处理器执行以完成上述方法。存储介质可以是计算机可读存储介质,例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一项所述的用户账户异常的识别方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (22)
1.一种用户账户异常的识别方法,其特征在于,包括:
获取平台中各用户账户的当前被关注值,并根据所述当前被关注值,将各用户账户归属至预设的多个账户分组中的某个账户分组,各用户账户的当前被关注值落入其归属的某个账户分组所对应的被关注值区间;其中,所述多个账户分组分别对应有不同被关注值区间;其中,所述当前被关注值代表各用户账户的被关注度的变量参数,所述被关注值区间为被关注值的数值区间;
获取与各个账户分组的被关注值区间对应的异常检测模型,各个账户分组分别对应不同的异常检测模型,通过所述异常检测模型检测所述各个账户分组中的疑似异常账户;所述异常检测模型用于根据各用户账户的被关注值变化量,检测各用户账户是否为疑似异常账户;所述疑似异常账户为被关注值发生了不符合预期规律的变化的账户;
合并所述多个账户分组内的疑似异常账户,得到所述平台的疑似异常账户。
2.根据权利要求1所述的用户账户异常的识别方法,其特征在于,获取平台中各用户账户的当前被关注值,并根据所述当前被关注值,将各用户账户归属至预设的多个账户分组中的某个账户分组之前,还包括:
获取所述平台对应的被关注值范围,将所述被关注值范围划分为多个被关注值区间;
针对所述多个被关注值区间,分别配置对应的账户分组,作为所述多个账户分组。
3.根据权利要求1所述的用户账户异常的识别方法,其特征在于,获取与各个账户分组的被关注值区间对应的异常检测模型,包括:
根据预设的被关注值区间与异常检测模型之间的对应关系,得到与所述各个账户分组的被关注值区间对应的异常检测模型。
4.根据权利要求1所述的用户账户异常的识别方法,其特征在于,所述通过所述异常检测模型检测所述各个账户分组中的疑似异常账户,包括:
针对各个账户分组,获取该账户分组对应的被关注值变化序列;所述被关注值变化序列用于表征该账户分组中用户账户在多个历史时刻的被关注值变化量的统计信息;
获取该账户分组中各用户账户在检测时刻的被关注值变化量;
通过所述异常检测模型,将所述各用户账户的所述被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定所述各用户账户在所述检测时刻是否为疑似异常账户;所述检测值区间基于该账户分组的所述被关注值变化序列确定。
5.根据权利要求4所述的用户账户异常的识别方法,其特征在于,所述被关注值变化序列包括第一类型变化序列;所述第一类型变化序列用于表征在多个历史时刻该账户分组中第一类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第一类型账户为在该历史时刻有发布信息的用户账户;
所述通过所述异常检测模型,将所述各用户账户的所述被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定所述各用户账户在所述检测时刻是否为疑似异常账户,包括:
针对该账户分组中的第一类型账户,将各第一类型账户的所述被关注值变化量与第一检测值区间进行比对,并根据对比结果,确定所述各第一类型账户在所述检测时刻是否为疑似异常账户;所述第一检测值区间基于该账户分组的所述第一类型变化序列确定。
6.根据权利要求5所述的用户账户异常的识别方法,其特征在于,所述针对各个账户分组,获取该账户分组对应的被关注值变化序列,包括:
对于每个设定的历史时刻,获取该账户分组中多个第一类型账户的被关注值变化量的第一加权平均值,以及该账户分组中多个第二类型账户的被关注值变化量的第二加权平均值;所述历史时刻的所述第二类型账户为在该历史时刻未发布信息的用户账户;
根据所述第一加权平均值和第二加权平均值的差值,得到所述历史时刻该账户分组中第一类型账户对应的被关注值变化量的第一统计信息;
根据所述多个历史时刻该账户分组对应的第一统计信息,得到所述第一类型变化序列。
7.根据权利要求5所述的用户账户异常的识别方法,其特征在于,所述根据对比结果,确定所述各个第一类型账户在所述检测时刻是否为疑似异常账户,包括:
当第一类型账户的被关注值变化量未落入所述第一检测值区间时,确定该第一类型账户在该检测时刻为疑似异常账户。
8.根据权利要求4所述的用户账户异常的识别方法,其特征在于,所述被关注值变化序列包括第二类型变化序列;所述第二类型变化序列用于表征多个历史时刻该账户分组中第二类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第二类型账户为在该历史时刻未发布信息的用户账户;
所述通过所述异常检测模型,将所述各用户账户的所述被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定所述各用户账户在所述检测时刻是否为疑似异常账户,包括:
针对该账户分组中的第二类型账户,将各第二类型账户的所述被关注值变化量与第二检测值区间进行比对,并根据对比结果,确定所述各个第二类型账户在所述检测时刻是否为疑似异常账户;所述第二检测值区间基于该账户分组的所述第二类型变化序列确定。
9.根据权利要求8所述的用户账户异常的识别方法,其特征在于,所述针对各个账户分组,获取该账户分组对应的被关注值变化序列,还包括:
对于每个设定的历史时刻,获取该账户分组中多个第二类型账户的被关注值变化量的第二加权平均值;
根据所述第二加权平均值,得到在所述历史时刻该账户分组中第二类型账户对应的被关注值变化量的第二统计信息;
根据在所述多个历史时刻该账户分组对应的第二统计信息,得到所述第二类型变化序列。
10.根据权利要求8所述的用户账户异常的识别方法,其特征在于,所述根据对比结果,确定所述各个第二类型账户在所述检测时刻是否为疑似异常账户,包括:
当第二类型账户的被关注值变化量未落入所述第二检测值区间时,确定该第二类型账户在该检测时刻为疑似异常账户。
11.一种用户账户异常的识别装置,其特征在于,包括:
账户分组确定单元,被配置为执行获取平台中各用户账户的当前被关注值,并根据所述当前被关注值,将各用户账户分别归属至预设的多个账户分组中对应的某个账户分组,各用户账户的当前被关注值落入其归属的某个账户分组所对应的被关注值区间;其中,所述多个账户分组分别对应有不同被关注值区间;其中,所述当前被关注值代表各用户账户的被关注度的变量参数,所述被关注值区间为被关注值的数值区间;
异常账户检测单元,被配置为执行获取与各个账户分组的被关注值区间对应的异常检测模型,各个账户分组分别对应不同的异常检测模型;通过所述异常检测模型检测所述各个账户分组中的疑似异常账户;所述异常检测模型用于根据对应账户分组中各用户账户的被关注值变化量,检测各用户账户是否为疑似异常账户;所述疑似异常账户为被关注值发生了不符合预期规律的变化的账户;
异常账户获取单元,被配置为执行合并所述多个账户分组内的疑似异常账户,得到所述平台的疑似异常账户。
12.根据权利要求11所述的用户账户异常的识别装置,其特征在于,所述账户分组确定单元还包括:
账户分组获取模块,被配置为执行获取所述平台对应的被关注值范围,将所述被关注值范围划分为多个被关注值区间;针对所述多个被关注值区间,分别配置对应的账户分组,作为所述多个账户分组。
13.根据权利要求11所述的用户账户异常的识别装置,其特征在于,所述异常账户检测单元包括:
异常检测模型获取模块,被配置为执行根据预设的被关注值区间与异常检测模型之间的对应关系,得到与所述各个账户分组的被关注值区间对应的异常检测模型。
14.根据权利要求11所述的用户账户异常的识别装置,其特征在于,所述异常账户检测单元包括:
分组序列获取模块,被配置为执行针对各个账户分组,获取该账户分组对应的被关注值变化序列;所述被关注值变化序列用于表征该账户分组中用户账户在多个历史时刻的被关注值变化量的统计信息;
被关注值变化量获取模块,被配置为执行获取该账户分组中各用户账户在检测时刻的被关注值变化量;
异常账户确定模块,被配置为执行通过所述异常检测模型,将所述各用户账户的所述被关注值变化量与对应的检测值区间进行比对,并根据对比结果,确定所述各用户账户在所述检测时刻是否为疑似异常账户;所述检测值区间基于该账户分组的所述被关注值变化序列确定。
15.根据权利要求14所述的用户账户异常的识别装置,其特征在于,所述被关注值变化序列包括第一类型变化序列;所述第一类型变化序列用于表征在多个历史时刻该账户分组中的第一类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第一类型账户为在该历史时刻发布信息的用户账户;
所述异常账户确定模块包括:
第一异常账户确定子模块,被配置为执行针对该账户分组中的第一类型账户,将各第一类型账户的所述被关注值变化量与第一检测值区间进行比对,并根据对比结果,确定所述各第一类型账户在所述检测时刻是否为疑似异常账户;所述第一检测值区间基于该账户分组的所述第一类型变化序列确定。
16.根据权利要求15所述的用户账户异常的识别装置,其特征在于,所述分组序列获取模块包括,
第一序列获取子模块,被配置为执行对于每个设定的历史时刻,获取该账户分组中多个第一类型账户的被关注值变化量的第一加权平均值,以及该账户分组中多个第二类型账户的被关注值变化量的第二加权平均值;所述历史时刻的所述第二类型账户为在该历史时刻未发布信息的用户账户;根据所述第一加权平均值和第二加权平均值的差值,得到所述历史时刻该账户分组中第一类型账户对应的被关注值变化量的第一统计信息;根据所述多个历史时刻该账户分组对应的第一统计信息,得到所述第一类型变化序列。
17.根据权利要求15所述的用户账户异常的识别装置,其特征在于,所述第一异常账户确定子模块,进一步被配置为执行当第一类型账户的被关注值变化量未落入所述第一检测值区间时,确定该第一类型账户在该检测时刻为疑似异常账户。
18.根据权利要求14所述的用户账户异常的识别装置,其特征在于,
所述被关注值变化序列包括第二类型变化序列;所述第二类型变化序列用于表征多个历史时刻该账户分组中的第二类型账户对应的被关注值变化量的统计信息;各个历史时刻的所述第二类型账户为在该历史时刻未发布信息的用户账户;
所述异常账户确定模块包括:
第二异常账户确定子模块,被配置为执行针对该账户分组中的第二类型账户,将各第二类型账户的所述被关注值变化量与第二检测值区间进行比对,并根据对比结果,确定所述各个第二类型账户在所述检测时刻是否为疑似异常账户;所述第二检测值区间基于该账户分组的所述第二类型变化序列确定。
19.根据权利要求18所述的用户账户异常的识别装置,其特征在于,所述分组序列获取模块包括,
第二序列获取子模块,被配置为执行对于每个设定的历史时刻,获取该账户分组中多个第二类型账户的被关注值变化量的第二加权平均值;根据所述第二加权平均值,得到在所述历史时刻该账户分组中第二类型账户对应的被关注值变化量的第二统计信息;根据在所述多个历史时刻该账户分组对应的第二统计信息,得到所述第二类型变化序列。
20.根据权利要求18所述的用户账户异常的识别装置,其特征在于,
所述第二异常账户确定子模块,进一步被配置为执行当第二类型账户的被关注值变化量未落入所述第二检测值区间时,确定该第二类型账户在该检测时刻为疑似异常账户。
21.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至10中任一项所述的用户账户异常的识别方法。
22.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至10中任一项所述的用户账户异常的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110641125.2A CN113098912B (zh) | 2021-06-09 | 2021-06-09 | 用户账户异常的识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110641125.2A CN113098912B (zh) | 2021-06-09 | 2021-06-09 | 用户账户异常的识别方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113098912A CN113098912A (zh) | 2021-07-09 |
CN113098912B true CN113098912B (zh) | 2022-10-14 |
Family
ID=76666002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110641125.2A Active CN113098912B (zh) | 2021-06-09 | 2021-06-09 | 用户账户异常的识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113098912B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113537616A (zh) * | 2021-07-28 | 2021-10-22 | 北京达佳互联信息技术有限公司 | 账户预测模型的训练方法、装置、电子设备及存储介质 |
CN116882409A (zh) * | 2023-09-08 | 2023-10-13 | 中国科学院自动化研究所 | 异常账号检测方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014019465A1 (zh) * | 2012-07-30 | 2014-02-06 | 腾讯科技(深圳)有限公司 | 一种基于账号属性的异常消息检测方法、设备及存储介质 |
CN105357189A (zh) * | 2015-10-13 | 2016-02-24 | 精硕世纪科技(北京)有限公司 | 僵尸账号检测方法和装置 |
CN108055281A (zh) * | 2017-12-27 | 2018-05-18 | 百度在线网络技术(北京)有限公司 | 账户异常检测方法、装置、服务器及存储介质 |
CN110942314A (zh) * | 2019-12-02 | 2020-03-31 | 中国建设银行股份有限公司 | 异常账户监管方法及装置 |
CN112926699A (zh) * | 2021-04-25 | 2021-06-08 | 恒生电子股份有限公司 | 异常对象识别方法、装置、设备及存储介质 |
-
2021
- 2021-06-09 CN CN202110641125.2A patent/CN113098912B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014019465A1 (zh) * | 2012-07-30 | 2014-02-06 | 腾讯科技(深圳)有限公司 | 一种基于账号属性的异常消息检测方法、设备及存储介质 |
CN105357189A (zh) * | 2015-10-13 | 2016-02-24 | 精硕世纪科技(北京)有限公司 | 僵尸账号检测方法和装置 |
CN108055281A (zh) * | 2017-12-27 | 2018-05-18 | 百度在线网络技术(北京)有限公司 | 账户异常检测方法、装置、服务器及存储介质 |
CN110942314A (zh) * | 2019-12-02 | 2020-03-31 | 中国建设银行股份有限公司 | 异常账户监管方法及装置 |
CN112926699A (zh) * | 2021-04-25 | 2021-06-08 | 恒生电子股份有限公司 | 异常对象识别方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113098912A (zh) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8078913B2 (en) | Automated identification of performance crisis | |
CN113098912B (zh) | 用户账户异常的识别方法、装置、电子设备及存储介质 | |
CN111177714B (zh) | 异常行为检测方法、装置、计算机设备和存储介质 | |
CN108429649B (zh) | 基于多次单类型采集结果的综合异常判断的*** | |
CN113037595B (zh) | 异常设备检测方法、装置、电子设备及存储介质 | |
CN113518011A (zh) | 异常检测方法和装置、电子设备及计算机可读存储介质 | |
CN111984442A (zh) | 计算机集群***的异常检测方法及装置、存储介质 | |
CN113190426B (zh) | 一种大数据评分***稳定性监控方法 | |
CN111611146A (zh) | 一种微服务故障预测方法和装置 | |
CN115204536A (zh) | 楼宇设备故障预测方法、装置、设备及存储介质 | |
CN112565422A (zh) | 一种对电力物联网故障数据的识别方法、***和存储介质 | |
CN115617784A (zh) | 一种信息化配电的数据处理***及其处理方法 | |
CN117290719B (zh) | 基于数据分析的巡检管理方法、装置及存储介质 | |
CN117519951B (zh) | 基于消息中台的实时数据处理方法及*** | |
CN114978877A (zh) | 一种异常处理方法、装置、电子设备及计算机可读介质 | |
JP7173284B2 (ja) | イベント監視装置、方法及びプログラム | |
CN114268839A (zh) | 视频发布账户筛选方法、装置、电子设备及存储介质 | |
US11188949B2 (en) | Segment content optimization delivery system and method | |
US20210287154A1 (en) | Information processing device, information processing method, and computer program product | |
CN110991241B (zh) | 异常识别方法、设备及计算机可读介质 | |
CN115658441B (zh) | 一种基于日志的家政业务***异常监控方法、设备及介质 | |
CN117170915A (zh) | 数据中心设备故障预测方法、装置和计算机设备 | |
CN115759263A (zh) | 一种基于因果推断的策略效果评估方法及装置 | |
CN111368104A (zh) | 信息处理方法、装置及设备 | |
CN115225455A (zh) | 异常设备检测方法及装置、电子设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |