CN116305033A - 一种异常账户识别方法、装置及电子设备 - Google Patents

一种异常账户识别方法、装置及电子设备 Download PDF

Info

Publication number
CN116305033A
CN116305033A CN202310170419.0A CN202310170419A CN116305033A CN 116305033 A CN116305033 A CN 116305033A CN 202310170419 A CN202310170419 A CN 202310170419A CN 116305033 A CN116305033 A CN 116305033A
Authority
CN
China
Prior art keywords
account
node
abnormal
target
accounts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310170419.0A
Other languages
English (en)
Inventor
邢玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202310170419.0A priority Critical patent/CN116305033A/zh
Publication of CN116305033A publication Critical patent/CN116305033A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明实施例提供了一种异常账户识别方法、装置及电子设备,涉及数据处理技术领域,该方法包括:获取多个账户的账户信息;其中,每一账户的账户信息中包括该账户的指示信息;每一账户的指示信息为:指示该账户的关联对象的信息,每一账户的关联对象为:与该账户存在关联关系的对象;以每一账户为账户节点,每一账户的指示信息所指示的关联对象为对象节点,建立账户知识图谱;其中,账户知识图谱中的每一账户所对应的账户节点,与该账户的关联对象所对应的对象节点之间存在节点边;基于账户知识图谱,确定多个账户中的目标账户是否为异常账户。通过本方案,可以准确识别异常账户。

Description

一种异常账户识别方法、装置及电子设备
技术领域
本发明涉及数据处理技术领域,特别是涉及一种异常账户识别方法、装置及电子设备。
背景技术
用户的异常行为往往会给企业的互联网业务带来风险,例如,同一用户反复注册新账户,以多次享受低价会员权益,并将会员权益以转赠的方式出售;活动期低价购买会员账户,再以换绑手机号的方式出售给他人;将购买了会员权益的账户出租给多人使用等行为,这些异常行为中所涉及使用的账户可以视作异常账户。而若能准确地识别异常账户,并及时采取风控措施,则可以有效降低风险。
然而,注册的新账户是否为同一用户反复注册、账户是否出租给他人使用往往难以判定,且用户在正常使用过程中也会对账户进行换绑手机号和转赠会员权益的操作,因此,异常账户难以被准确的识别。
发明内容
本发明实施例的目的在于提供一种异常账户识别方法、装置及电子设备,以准确地识别异常账户。具体技术方案如下:
在本发明实施的第一方面,提供了一种异常账户识别方法,所述方法包括:
获取多个账户的账户信息;其中,每一账户的账户信息中包括该账户的指示信息;每一账户的指示信息为:指示该账户的关联对象的信息,每一账户的关联对象为:与该账户存在关联关系的对象;
以每一账户为账户节点,每一账户的指示信息所指示的关联对象为对象节点,建立账户知识图谱;其中,所述账户知识图谱中的每一账户所对应的账户节点,与该账户的关联对象所对应的对象节点之间存在节点边;
基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户。
可选地,每一账户的账户信息中还包括:表征该账户的行为状态的账户属性,和/或描述该账户与关联对象之间关联状态的关联描述信息;
在所述基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户之前,所述方法还包括:
针对每一账户,在所述账户知识图谱中,将该账户的账户属性作为该账户对应的账户节点的节点属性;和\或,将该账户的关联描述信息作为该账户对应的节点,和该账户的关联对象对应的节点之间节点边的边属性。
可选地,在所述基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户之前,所述方法还包括:
针对每一关联对象,获取表征该关联对象行为状态的对象属性;
将每一关联对象的对象属性作为该关联对象对应的对象节点的节点属性。
可选地,在各关联对象中包括:账户所登录过的设备,且所述设备为多个,所述设备的对象属性包括:指定设备特征的情况下;其中,每一所述设备的指定设备特征为表征该设备唯一性的信息;在所述针对每一关联对象,获取表征该关联对象行为状态的对象属性之后,所述方法还包括:
针对每一所述设备,确定与该设备的指定设备特征相同,身份标识码不同的其他设备,与该设备之间存在同设备篡改关系;
在存在同设备篡改关系的设备所对应的对象节点之间生成节点边。
可选地,在所述基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户之前,所述方法还包括:
获取账户状态信息;其中,所述账户状态信息用于指示所述账户知识图谱各账户节点所对应的各账户中,已确定异常的账户,和/或已确定正常的账户;
将所述已确定异常的账户和/或已确定正常的账户中的至少一账户作为样本账户;
利用所述样本账户所对应的账户节点,和所述样本账户是否为异常的真值,训练待训练的图神经网络模型,并将训练完成的图神经网络模型作为节点分类模型;
所述基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户,包括:
利用所述节点分类模型,识别所述多个账户中的目标账户所对应的节点是否为异常节点;若是异常节点,确定所述目标账户为异常账户。
可选地,所述基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户,包括:
基于所述目标账户对应的目标节点与其他各节点的连接关系,确定所述目标账户是否为异常账户;其中,所述目标节点与其他各节点的连接关系表征:所述目标节点与其他各节点之间是否存在节点边。
可选地,所述基于所述目标账户对应的目标节点与其他各节点的连接关系,确定所述目标账户是否为异常账户,包括:
确定所述目标节点是否与异常的第一类型对象节点之间是否存在节点边;若是,确定所述目标账户为异常账户;其中,所述第一类型对象节点包括:表征使用账户时所利用的外部实体的节点。
可选地,所述异常的第一类型对象节点的确定方式包括:
将与账户节点之间的节点边数量达到第一预设阈值的第一类型对象节点确定为异常的第一类型对象节点;和/或,
在所述第一类型对象节点表征:账户所登录过的设备,且各所述设备中包含至少两个存在同设备篡改关系的设备的情况下,将该至少两个存在同设备篡改关系的设备所对应的第一类型对象节点,确定为异常的第一类型对象节点。
可选地,所述基于所述目标账户对应的目标节点与其他各节点的连接关系,确定所述目标账户是否为异常账户,包括:
检测所述目标节点与账户节点,或第一类型对象节点之间的节点边的数量;其中,所述第一类型对象节点包括:表征使用账户时所利用的外部实体的节点;
判断所检测的数量是否达到第二预设阈值;若达到,将所述目标账户确定为异常账户。
可选地,所述基于所述目标账户对应的目标节点与其他各节点的连接关系,确定所述目标账户是否为异常账户,包括:
确定与所述目标节点之间存在节点边的各个第二类型对象节点;其中,所述第二类型对象节点包括:表征账户所访问的网络产品的节点;
获取所确定的各个第二类型对象所表征对象的类型标签;其中,每一对象的类型标签为预先针对该对象的类型所设定的标签;
计算所获取的各个类型标签的离散程度;
判断所述各个类型标签的离散程度是否达到第三预设阈值;若达到,将所述目标账户确定为异常账户。
在本发明实施的又一方面,还提供了一种异常账户识别装置,所述装置包括:
信息获取模块,用于获取多个账户的账户信息;其中,每一账户的账户信息中包括该账户的指示信息;每一账户的指示信息为:指示该账户的关联对象的信息,每一账户的关联对象为:与该账户存在关联关系的对象;
图谱建立模块,以每一账户为账户节点,每一账户的指示信息所指示的关联对象为对象节点,建立账户知识图谱;其中,所述账户知识图谱中的每一账户所对应的账户节点,与该账户的关联对象所对应的对象节点之间存在节点边;
识别模块,基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户。
在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的异常账户识别方法。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的异常账户识别方法。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的异常账户识别方法。
本发明实施例提供的异常账户识别方法,通过获取多个账户的账户信息;以每一账户为账户节点,每一账户的指示信息所指示的关联对象为对象节点,建立账户知识图谱;其中,账户知识图谱中的每一账户所对应的账户节点,与该账户的关联对象所对应的对象节点之间存在节点边;基于账户知识图谱,确定多个账户中的目标账户是否为异常账户。可见,本方案中,利用账户信息以账户和关联对象为节点生成账户知识图谱,以及用节点边来表示账户与关联对象之间的关联关系,在进行异常账户识别时,能够利用该账户知识图谱反映各账户、各关联对象之间的关系,从而将账户信息的数据与知识图谱技术相结合,以准确识别异常账户。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例中异常账户识别方法的流程图;
图2为本发明实施例中账户知识图谱的示意图;
图3为本发明实施例中异常账户识别方法的另一流程图;
图4为本发明实施例中异常账户识别装置的结构示意图;
图5为本发明实施例中电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
目前,企业的互联网业务可能会面临以下风险场景:
1、同一用户反复注册新账户,以多次享受低价会员权益;2、低价购买会员账户,即购买了会员权益的账户,并通过换绑手机号的方式、或利用会员权益转赠业务将会员权益出售给下游用户;3、预先为账户购买会员权益,并将会员账户出租给其他用户使用,导致***放弃购买官方的会员权益等。
以上风险场景中所涉及的账户可以被视作异常账户。然而,注册的新账户是否为同一用户反复注册、账户是否出租给其他用户使用难以判定,且正常用户在使用过程中也会进行换绑手机号和转赠会员业务的操作,可见异常导致异常账户难以被准确的确定。
为了准确识别异常账户,本发明实施例提供了一种异常账户识别方法、装置及电子设备。在具体应用中,本发明实施例所提供的异常账户识别方法可以应用于各类电子设备中,例如,个人电脑、服务器、手机以及其他具有数据处理能力的设备。并且,本发明实施例所提供的异常账户识别方法可以通过软件、硬件或软硬件结合的方式实现。
本申请的技术方案中,所涉及的用户个人数据的获取、存储、使用、加工、传输、提供和公开等操作,均是在已取得用户或所属权利体授权的情况下进行的。
下面首先对本发明实施例所提供的异常账户识别方法进行介绍,该方法可以包括以下步骤:
获取多个账户的账户信息;其中,每一账户的账户信息中包括该账户的指示信息;每一账户的指示信息为:指示该账户的关联对象的信息,每一账户的关联对象为:与该账户存在关联关系的对象;
以每一账户为账户节点,每一账户的指示信息所指示的关联对象为对象节点,建立账户知识图谱;其中,账户知识图谱中的每一账户所对应的账户节点,与该账户的关联对象所对应的对象节点之间存在节点边;
基于账户知识图谱,确定多个账户中的目标账户是否为异常账户。
本实施例中,利用账户信息以账户和关联对象为节点生成账户知识图谱,以及用节点边来表示账户与关联对象之间的关联关系,在进行异常账户识别时,能够利用该账户知识图谱反映各账户、各关联对象之间的关系,从而将账户信息的数据与知识图谱技术相结合,以准确识别异常账户。
下面结合附图对本发明实施例所提供的异常账户识别方法进行示例性介绍。如图1所示,本发明实施例所提供的异常账户识别方法可以包括以下步骤:
S101,获取多个账户的账户信息;其中,每一账户的账户信息中包括该账户的指示信息;每一账户的指示信息为:指示该账户的关联对象的信息,每一账户的关联对象为:与该账户存在关联关系的对象;
其中,账户可以是网络账户,即用户在访问互联网的特定项目时所注册的账户。针对每一账户而言,与该账户存在关联关系的对象可以是非账户的对象,例如:该账户所登录过的设备;该账户在登录时所在的城市;该账户所绑定过的号码;该账户所使用过的支付账号;该账户所使用过的网络地址;该账户所播放、预约、评论和/或关注过的视频等中的至少一种,与该账户存在关联关系的对象还可以是其他账户,例如:与该账户发生过会员权益转赠行为的其他账户,账户与账户之间的关联关系还可以是发生过转账的关系、发生过聊天的关系等。
每一账户的账户信息可以是针对该账户所预先记录并存储在指定存储位置的信息,例如,当该账户绑定了一个号码时,则可以实时记录下该账户所绑定的号码,当需要利用账户信息时,可以从该指定存储位置处获取。
S102,以每一账户为账户节点,每一账户的指示信息所指示的关联对象为对象节点,建立账户知识图谱;其中,账户知识图谱中的每一账户所对应的账户节点,与该账户的关联对象所对应的对象节点之间存在节点边;
其中,所建立的账户知识图谱可以是任意一种图引擎中的知识图谱,例如,Neo4j(一种面向网络的数据库)、GraphX(一种分布式图处理框架)、TigerGraph(虎图)、GES(Graph Engine Service,图引擎服务)等,并不做具体限制。
本步骤中,在获取了每一账户的指示信息后,即可获知与该账户存在关联关系的关联对象,因此,可以在知识图谱中生成各个账户对应的账户节点,以及针对每一账户,生成该账户的指示信息所指示的关联对象对应的对象节点,并建立该账户节点与该对象节点之间的节点边,得到账户知识图谱。在实际处理过程中,可以预先建立以账户为主键的临时表,例如,hive(数据仓库分析***)表,该临时表中的每一行中可以记录一个账户,和与该账户存在关联关系的关联对象,该临时表的构建可以利用Spark(为大规模数据处理而设计的快速通用的计算引擎)来完成。进而可以将该临时表以及其他建立知识图谱所需的数据导出为CSV(Comma-Separated Values,逗号分隔值)格式的文件,再调用图引擎的更新接口导入该CSV格式的文件,即可自动在知识图谱中生成各个节点以及各个节点边。
进一步的,每一账户的账户信息中还可以包括:表征该账户的行为状态的账户属性,该情况下,还可以针对每一账户,在知识图谱中,将该账户的账户属性作为该账户对应的账户节点的节点属性。
在每一账户的账户信息中还包括账户属性的情况下,每一账户的账户属性可以包括:预设的账户评分、会员类型、表征账户登陆行为的登陆特征、表征账户播放视频行为的播放特征、表征账户购买产品行为的购买特征中的至少一种,以上仅为示例性介绍,账户属性也可以为其他的账户信息,并不仅限于此;
其中,示例性的,表征账户登陆行为的登陆特征可以包括:近24小时登陆过多少台设备、近7天改密的次数、相同密码的用户的个数,以及登陆的IP(Internet Protocol,网际互连协议)地址是否聚集等中的至少一种;表征账户播放视频行为的播放特征可以包括:近7天在多少个城市播放过视频、24小时累计播放时长、近90天常用播放城市,以及近期是否有在非常用播放城市进行播放等中的至少一种;表征账户购买产品行为的购买特征可以包括:是否七天内有过换绑手机号行为、是否存在注销账号后重新注册新账号并购买产品的行为,以及24小时内购买过多少笔订单等中的至少一种。
此外,每一账户的账户信息中还可以包括:描述该账户与关联对象之间关联状态的关联描述信息,该情况下,还可以针对每一账户,在知识图谱中,将该账户的关联描述信息作为该账户对应的节点,和该账户的关联对象对应的节点之间节点边的边属性。
其中,关联描述信息用于描述账户与关联对象之间关联状态。示例性的,在每一账户的账户信息中还包括关联描述信息的情况下,每一账户的关联描述信息可以包括:该账户与关联对象发生关联关系的关联时间和/或关联频率。关联时间可以是发生关联关系的每一次的时间,还可以是第一次发生关联关系的时间等,关联频率可以是指定时间段内发送关联关系的次数。除此之外,关联描述信息还可以包括:近七天是否发生过关联关系、所发生关联关系的类型,例如,号码绑定类型、设备登录类型等。
除了仅生成账户与关联对象所对应的节点,以及账户与关联对象之间的节点边以外,本实施例中还可以为各账户节点设置节点属性、为各对象节点设置属性,以及为节点边设置边属性,还可以在存在关联关系的账户对应的账户节点之间生成节点边,从而进一步丰富知识图谱中的信息,以提高异常账户识别的准确性。
示例性的,所建立的账户知识图谱可以如图2所示,该账户知识图谱中可以包含多个账户节点、多个对象节点、账户节点与对象节点之间的节点边、账户节点与账户节点之间的节点边,以及节点属性和边属性。
S103,基于账户知识图谱,确定多个账户中的目标账户是否为异常账户。
在得到了描述账户的账户知识图谱之后,当满足进行异常账户识别的识别条件时,可以根据该中知识图谱确定待进行异常账户识别的目标账户是否为异常账户。其中,识别条件可以为:接收到异常账户识别的识别指令。目标账户可以为多个账户中未确定是否为异常的至少一个账户,还可以为多个账户中未确定是否为异常的全部账户。
一种实现方式中,可以利用图神经网络来识别目标账户是否为异常账户。另一种实现方式中,还可以基于目标账户对应的目标节点与其他各节点的连接关系,确定目标账户是否为异常账户;其中,目标节点与其他各节点的连接关系表征:目标节点与其他各节点之间是否存在节点边。
示例性的,在与目标节点相连的对象节点包括其他账户的账户节点,或第一类型对象节点的情况下,可以检测目标节点与账户节点,或第一类型对象节点之间的节点边的数量;其中,第一类型对象节点包括:表征使用账户时所利用的外部实体的节点,其中,在本实施例中,外部实体是指非账户的,又和账户有联系事物,例如:目标账户所登录过的设备、目标账户在登录时所在的城市、目标账户所绑定过的手机号码,或目标账户所使用过的IP地址等;进而判断所检测的数量是否达到第二预设阈值;若达到,则将目标账户确定为异常账户;
可以理解的,由于与目标节点相连的对象节点可以为:与目标账户存在转赠会员权益行为的其他账户,而在正常情况下,账户不会频繁进行会员权益的转赠,因此,若与目标节点相连的账户节点较多,目标账户的行为显然是异常的,因此可以将该目标账户确定为异常账户。
此外,由于同一账号往往不会在过多的城市登录,不会频繁地绑定不同的号码,也不会频繁使用不同的IP地址。因此,在此情况中,若与目标账户所对应的账户节点相连接的对象节点的数量是否达到第二预设阈值,则可以将该目标账户确定为异常账户。
在与目标账户节点相连的对象节点包括第二类型对象节点的情况下,其中,第二类型对象节点包括:表征账户所访问的网络产品的节点,例如:网络中的视频、商品、文章等,可以确定与目标节点之间存在节点边的各个第二类型对象节点,进而获取所确定的各个第二类型对象所表征对象的类型标签;其中,每一对象的类型标签为预先针对该对象的类型所设定的标签。
以第二类型对象节点表征网络中的视频为例,该类型标签可以是视频的标签;其中,每一视频的标签可以为针对该视频所预设的表征该视频类型的向量,该向量中的每一个元素表示该视频属于一个视频类型的置信度,其中,视频类型可以是动作片、喜剧片、爱情片等。可以理解的,同一个人所观看的视频的视频类型往往比较集中,因此,若针对一账户所确定的视频标签的离散程度较高,该账户很可能由多人使用,因此,可以将该账户确定为异常账户。
除此之外,还可以利用社区挖掘算法,将各个账户节点划分为多个社区,并针对每一社区,根据该社区中已确定为异常账户所对应的账户节点,来确定该社区中其他账户节点所对应的账户是否为异常账户,例如,可以判断该社区中已确定为异常账户所对应的账户节点所占全部账户节点的比例是否达到预设比例阈值,若达到,则将该社区中的全部账户节点对应的账户确定为异常账户。
本实施例中,利用账户信息以账户和关联对象为节点生成账户知识图谱,以及用节点边来表示账户与关联对象之间的关联关系,在进行异常账户识别时,能够利用该账户知识图谱反映各账户、各关联对象之间的关系,从而将账户信息的数据与知识图谱技术相结合,以准确识别异常账户。
可选地,为了进一步丰富知识图谱的信息,提高异常账户识别的准确性,在本发明的一实施例中,在上述基于知识图谱,确定多个账户中的待进行异常账户识别的目标账户是否为异常账户之前,方法还可以包括:
针对每一关联对象,获取表征该关联对象行为状态的对象属性,并将每一关联对象的对象属性作为该关联对象对应的对象节点的节点属性。
示例性的,针对每一关联对象,在该关联对象为:账户所登录过的设备的情况下;该关联对象的对象属性可以包括:设备类型、预设设备评分、设备参数中的至少一种;其中,设备类型可以包括:电脑、智能手机等类型;每一设备的预设设备评分为针对该设备所预设的评分;设备参数可以包括:设备的配置信息、IMEI(International Mobile EquipmentIdentity,国际移动设备识别码)、沙盒路径等中的至少一种。
针对每一关联对象,在该关联对象为:账户所绑定过的号码的情况下,该关联对象的对象属性可以包括:号码区号、是否为异常号码中的至少一种。在该关联对象为:账户访问过的视频的情况下,该关联对象的对象属性可以包括:视频标签。
进一步的,在各关联对象中包括:账户所登录过的设备,且设备为多个,设备的对象属性包括:指定设备标识的情况下;在获取关联对象的对象信息之后,还可以针对每一设备,基于该设备的指定设备特征,从各设备中确定与该设备存在同设备篡改关系的其他设备,并在存在同设备篡改关系的设备所对应的对象节点之间生成节点边。
其中,指定设备特征为表征该设备唯一性的信息,例如可以是设备的设备指纹,设备的沙盒路径等能够用于唯一标识设备的信息,可以理解的,为了伪装成不同的设备,用户往往对设备的身份标识码进行修改,而设备的沙盒路径这些能够唯一标识设备的指定设备特征却往往不会被修改,因此当两个设备的身份标识码不同,而指定设备特征相同,则该两个设备很可能是同一个设备篡改而来,因此,针对每一设备,通过确定与该设备的指定设备标识相同身份标识码不同的其他设备,就可以确定出存在同设备篡改关系的设备。
本实施例中,能够准确识别异常账户。进一步的,通过为对象节点设置节点属性,以及在存在同设备篡改关系的设备对应的对象节点之间生成节点边,能够进一步丰富知识图谱的信息,提高异常账户识别的准确性。
可选地,在本发明的一实施例中,如图3所示,本发明实施例所提供的异常账户识别方法可以包括以下步骤:
S301,获取多个账户的账户信息;
S302,以每一账户为账户节点,每一账户的指示信息所指示的关联对象为对象节点,建立账户知识图谱;其中,账户知识图谱中的每一账户所对应的账户节点,与该账户的关联对象所对应的对象节点之间存在节点边;
以上步骤S301-S302已在上文介绍,在此不再赘述。
S303,获取账户状态信息;其中,账户状态信息用于指示知识图谱各账户节点所对应的各账户中,已确定异常的账户,和/或已确定正常的账户;
在知识图谱中建立了各个账户对应的账户节点,关联对象对应的对象节点以及账户节点与对象节点之间的节点边之后,可以获取账户状态信息,账户异常信息可以是针对各账户中已确定是否异常的账户所预先生成的,当已有证据表明某一账户的行为异常时,则可以将该账户视作已确定异常的账户。
S304,将已确定异常的账户和/或已确定正常的账户中的至少一账户作为样本账户;
本步骤中,可以根据所获取账户状态信息,找到已确定异常的账户,和/或已确定正常的账户,并从中选取至少一账户作为样本账户。
S305,利用样本账户所对应的账户节点,和样本账户是否为异常的真值,训练待训练的图神经网络模型,并将训练完成的图神经网络模型作为节点分类模型;
其中,图神经网络模型是指:使用神经网络来学习知识图谱的结构,提取和发掘知识图谱中的特征,以实现聚类、分类、预测等图学习任务需求的算法模型。在确定样本账户后,可以利用该待训练的图神经网络模型识别样本账户所对应的账户节点,得到预测值,进而利用所得到的预测值以及样本账户是否为异常的真值调整该训练的图神经网络模型的模型参数,直至该训练的图神经网络模型的损失函数收敛,得到训练完成的图神经网络模型。
S306,利用节点分类模型,识别多个账户中待进行异常账户识别的目标账户所对应的节点是否为异常节点;若是异常节点,确定目标账户为异常账户。
其中,该节点分类模型可以预先训练完成,在满足预设的识别条件时,对待进行异常账户识别的目标账户进行识别,预设的识别条件可以是,接收到指定的异常账户识别指令。
本实施例中,能够准确识别异常账户。进一步的,利用预先训练的节点分类模型来识别待进行异常账户识别的目标账户所对应的节点是否为异常节点,若是异常节点,则确定目标账户为异常账户,通过模型来进行异常账户的识别可以进一步提高准确性。
可选地,在本发明的另一实施例中,上述基于目标账户节点与其他各节点的连接关系,确定目标账户是否为异常账户的方式,可以包括:
确定目标账户节点是否与异常的第一类型对象节点相连;若是,确定目标账户为异常账户。其中,第一类型对象节点包括:表征使用账户时所利用的外部实体的节点,上述异常的第一类型对象节点的确定方法至少可以包括以下情形:
直接将与账户节点之间的节点边数量达到第一预设阈值的第一类型对象节点确定为异常的第一类型对象节点;
由于一支付账号\设备\网络地址往往不会被较多的账户所使用,因此,可以将与账户节点之间的节点边数量达到第一预设阈值的对象节点确定为异常对象节点。
或者,在第一类型对象节点表征:账户所登录过的设备,且各设备中包含至少两个存在同设备篡改关系的设备的情况下,将该至少两个存在同设备篡改关系的设备所对应的第一类型对象节点,确定为异常的第一类型对象节点。
由于用户在正常使用设备,是不会将一设备篡改为另一设备的,当确定了存在同设备篡改关系的设备,则该设备很可能为异常设备,因此,可以将存在同设备篡改关系的设备所对应的对象节点,确定为异常对象节点。
进而,在确定了异常的第一类型对象节点后,与之相连的账户节点所对应的账户,即与该异常对象节点对应的关联对象存在关联关系,可见,这些存在着较大的风险,因此,若目标账户节点与异常的第一类型对象节点相连,则可以确定目标账户为异常账户。
在一种实现方式中,还可以利用图神经网络模型来确定异常的第一类型对象节点,当然也可以不仅限于此。
本实施例中,能够准确识别异常账户。进一步的,通过确定目标账户节点是否与异常的第一类型对象节点相连的方式,来确定目标账户是否为异常账户,为上述基于知识图谱,确定多个账户中的待进行异常账户识别的目标账户是否为异常账户提供了实现基础。
本发明实施例还提供了一种异常账户识别装置,如图4所示,所述装置包括:
信息获取模块401,用于获取多个账户的账户信息;其中,每一账户的账户信息中包括该账户的指示信息;每一账户的指示信息为:指示该账户的关联对象的信息,每一账户的关联对象为:与该账户存在关联关系的对象;
图谱建立模块402,以每一账户为账户节点,每一账户的指示信息所指示的关联对象为对象节点,建立账户知识图谱;其中,所述账户知识图谱中的每一账户所对应的账户节点,与该账户的关联对象所对应的对象节点之间存在节点边;
识别模块403,用于基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户。
可选地,每一账户的账户信息中还包括:表征该账户的行为状态的账户属性,和/或描述该账户与关联对象之间关联状态的关联描述信息;
所述图谱建立模块还用于:
针对每一账户,在所述账户知识图谱中,将该账户的账户属性作为该账户对应的账户节点的节点属性;和\或,将该账户的关联描述信息作为该账户对应的节点,和该账户的关联对象对应的节点之间节点边的边属性。
可选地,所述图谱建立模块还用于:
针对获取表征该关联对象行为状态的对象属性;将每一关联对象的对象属性作为该关联对象对应的对象节点的节点属性。
可选地,在各关联对象中包括:账户所登录过的设备,且所述设备为多个,所述设备的对象属性包括:指定设备特征的情况下;其中,每一所述设备的指定设备特征为表征该设备唯一性的信息;所述图谱建立模块具体用于:
针对每一所述设备,确定与该设备的指定设备特征相同,身份标识码不同的其他设备,与该设备之间存在同设备篡改关系;在存在同设备篡改关系的设备所对应的对象节点之间生成节点边。
可选地,所述装置还包括,模型训练模块,用于在基于所述知识图谱,确定所述多个账户中的待进行异常账户识别的目标账户是否为异常账户之前,获取账户状态信息;其中,所述账户状态信息用于指示所述知识图谱各账户节点所对应的各账户中,已确定异常的账户,和/或已确定正常的账户;将所述已确定异常的账户和/或已确定正常的账户中的至少一账户作为样本账户;利用所述样本账户所对应的账户节点,和所述样本账户是否为异常的真值,训练待训练的图神经网络模型,并将训练完成的图神经网络模型作为节点分类模型;
所述识别模块具体用于:
利用所述节点分类模型,识别所述多个账户中目标账户所对应的节点是否为异常节点;若是异常节点,确定所述目标账户为异常账户。
可选地,所述识别模块具体用于:
基于所述目标账户节点与其他各节点的连接关系,确定所述目标账户是否为异常账户;其中,所述目标节点与其他各节点的连接关系表征:所述目标节点与其他各节点之间是否存在节点边。
可选地,所述识别模块具体用于:
确定所述目标节点是否与异常的第一类型对象节点之间是否存在节点边;若是,确定所述目标账户为异常账户;其中,所述第一类型对象节点包括:表征使用账户时所利用的外部实体的节点。
可选地,所述识别模块具体用于:
将与账户节点之间的节点边数量达到第一预设阈值的第一类型对象节点确定为异常的第一类型对象节点;和/或,
在所述第一类型对象节点表征:账户所登录过的设备,且各所述设备中包含至少两个存在同设备篡改关系的设备的情况下,将该至少两个存在同设备篡改关系的设备所对应的第一类型对象节点,确定为异常的第一类型对象节点。
可选地,所述识别模块具体用于:
检测所述目标节点与账户节点,或第一类型对象节点之间的节点边的数量;其中,所述第一类型对象节点包括:表征使用账户时所利用的外部实体的节点;
判断所检测的数量是否达到第二预设阈值;若达到,将所述目标账户确定为异常账户。
可选地,所述识别模块具体用于:
确定与所述目标节点之间存在节点边的各个第二类型对象节点;其中,所述第二类型对象节点包括:表征账户所访问的网络产品的节点;
获取所确定的各个第二类型对象所表征对象的类型标签;其中,每一对象的类型标签为预先针对该对象的类型所设定的标签;
计算所获取的各个类型标签的离散程度;
判断所述各个类型标签的离散程度是否达到第三预设阈值;若达到,将所述目标账户确定为异常账户。
本发明实施例还提供了一种电子设备,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现上述实施例中任一所述的异常账户识别方法。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一所述的异常账户识别方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的异常账户识别方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (13)

1.一种异常账户识别方法,其特征在于,所述方法包括:
获取多个账户的账户信息;其中,每一账户的账户信息中包括该账户的指示信息;每一账户的指示信息为:指示该账户的关联对象的信息,每一账户的关联对象为:与该账户存在关联关系的对象;
以每一账户为账户节点,每一账户的指示信息所指示的关联对象为对象节点,建立账户知识图谱;其中,所述账户知识图谱中的每一账户所对应的账户节点,与该账户的关联对象所对应的对象节点之间存在节点边;
基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户。
2.根据权利要求1所述的方法,其特征在于,每一账户的账户信息中还包括:表征该账户的行为状态的账户属性,和/或描述该账户与关联对象之间关联状态的关联描述信息;
在所述基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户之前,所述方法还包括:
针对每一账户,在所述账户知识图谱中,将该账户的账户属性作为该账户对应的账户节点的节点属性;和\或,将该账户的关联描述信息作为该账户对应的节点,和该账户的关联对象对应的节点之间节点边的边属性。
3.根据权利要求1所述的方法,其特征在于,在所述基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户之前,所述方法还包括:
针对每一关联对象,获取表征该关联对象行为状态的对象属性;
将每一关联对象的对象属性作为该关联对象对应的对象节点的节点属性。
4.根据权利要求3所述的方法,其特征在于,在各关联对象中包括:账户所登录过的设备,且所述设备为多个,所述设备的对象属性包括:指定设备特征的情况下;其中,每一所述设备的指定设备特征为表征该设备唯一性的信息;在所述针对每一关联对象,获取表征该关联对象行为状态的对象属性之后,所述方法还包括:
针对每一所述设备,确定与该设备的指定设备特征相同,身份标识码不同的其他设备,与该设备之间存在同设备篡改关系;
在存在同设备篡改关系的设备所对应的对象节点之间生成节点边。
5.根据权利要求1-4任一项所述的方法,其特征在于,在所述基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户之前,所述方法还包括:
获取账户状态信息;其中,所述账户状态信息用于指示所述账户知识图谱各账户节点所对应的各账户中,已确定异常的账户,和/或已确定正常的账户;
将所述已确定异常的账户和/或已确定正常的账户中的至少一账户作为样本账户;
利用所述样本账户所对应的账户节点,和所述样本账户是否为异常的真值,训练待训练的图神经网络模型,并将训练完成的图神经网络模型作为节点分类模型;
所述基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户,包括:
利用所述节点分类模型,识别所述多个账户中的目标账户所对应的节点是否为异常节点;若是异常节点,确定所述目标账户为异常账户。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户,包括:
基于所述目标账户对应的目标节点与其他各节点的连接关系,确定所述目标账户是否为异常账户;其中,所述目标节点与其他各节点的连接关系表征:所述目标节点与其他各节点之间是否存在节点边。
7.根据权利要求6所述的方法,其特征在于,所述基于所述目标账户对应的目标节点与其他各节点的连接关系,确定所述目标账户是否为异常账户,包括:
确定所述目标节点是否与异常的第一类型对象节点之间是否存在节点边;若是,确定所述目标账户为异常账户;其中,所述第一类型对象节点包括:表征使用账户时所利用的外部实体的节点。
8.根据权利要求7所述的方法,其特征在于,所述异常的第一类型对象节点的确定方式包括:
将与账户节点之间的节点边数量达到第一预设阈值的第一类型对象节点确定为异常的第一类型对象节点;和/或,
在所述第一类型对象节点表征:账户所登录过的设备,且各所述设备中包含至少两个存在同设备篡改关系的设备的情况下,将该至少两个存在同设备篡改关系的设备所对应的第一类型对象节点,确定为异常的第一类型对象节点。
9.根据权利要求6所述的方法,其特征在于,所述基于所述目标账户对应的目标节点与其他各节点的连接关系,确定所述目标账户是否为异常账户,包括:
检测所述目标节点与账户节点,或第一类型对象节点之间的节点边的数量;其中,所述第一类型对象节点包括:表征使用账户时所利用的外部实体的节点;
判断所检测的数量是否达到第二预设阈值;若达到,将所述目标账户确定为异常账户。
10.根据权利要求6所述的方法,其特征在于,所述基于所述目标账户对应的目标节点与其他各节点的连接关系,确定所述目标账户是否为异常账户,包括:
确定与所述目标节点之间存在节点边的各个第二类型对象节点;其中,所述第二类型对象节点包括:表征账户所访问的网络产品的节点;
获取所确定的各个第二类型对象所表征对象的类型标签;其中,每一对象的类型标签为预先针对该对象的类型所设定的标签;
计算所获取的各个类型标签的离散程度;
判断所述各个类型标签的离散程度是否达到第三预设阈值;若达到,将所述目标账户确定为异常账户。
11.一种异常账户识别装置,其特征在于,所述装置包括:
信息获取模块,用于获取多个账户的账户信息;其中,每一账户的账户信息中包括该账户的指示信息;每一账户的指示信息为:指示该账户的关联对象的信息,每一账户的关联对象为:与该账户存在关联关系的对象;
图谱建立模块,用于以每一账户为账户节点,每一账户的指示信息所指示的关联对象为对象节点,建立账户知识图谱;其中,所述账户知识图谱中的每一账户所对应的账户节点,与该账户的关联对象所对应的对象节点之间存在节点边;
识别模块,用于基于所述账户知识图谱,确定所述多个账户中的目标账户是否为异常账户。
12.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-10任一所述的方法步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-10任一所述的方法步骤。
CN202310170419.0A 2023-02-27 2023-02-27 一种异常账户识别方法、装置及电子设备 Pending CN116305033A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310170419.0A CN116305033A (zh) 2023-02-27 2023-02-27 一种异常账户识别方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310170419.0A CN116305033A (zh) 2023-02-27 2023-02-27 一种异常账户识别方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN116305033A true CN116305033A (zh) 2023-06-23

Family

ID=86821607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310170419.0A Pending CN116305033A (zh) 2023-02-27 2023-02-27 一种异常账户识别方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116305033A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117520927A (zh) * 2024-01-04 2024-02-06 支付宝(杭州)信息技术有限公司 检测异常账户的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117520927A (zh) * 2024-01-04 2024-02-06 支付宝(杭州)信息技术有限公司 检测异常账户的方法和装置
CN117520927B (zh) * 2024-01-04 2024-05-21 支付宝(杭州)信息技术有限公司 检测异常账户的方法和装置

Similar Documents

Publication Publication Date Title
CN108399418B (zh) 一种用户分类方法及装置
CN110402570B (zh) 信息处理方法和***、服务器、终端、计算机存储介质
US11570214B2 (en) Crowdsourced innovation laboratory and process implementation system
CN109165691B (zh) 用于识别作弊用户的模型的训练方法、装置及电子设备
CN110855648B (zh) 一种网络攻击的预警控制方法及装置
CN108366012B (zh) 一种社交关系建立方法、装置及电子设备
CN111522724B (zh) 异常账号的确定方法、装置、服务器及存储介质
CN105450598A (zh) 信息识别方法、信息识别设备及用户终端
CN116305033A (zh) 一种异常账户识别方法、装置及电子设备
CN114996348A (zh) 一种用户画像生成方法、装置、电子设备及存储介质
CN112347457A (zh) 异常账户检测方法、装置、计算机设备和存储介质
CN108021713B (zh) 一种文档聚类的方法和装置
CN109829593B (zh) 目标对象的信用度确定方法、装置、存储介质及电子装置
JP7170689B2 (ja) 出力装置、出力方法及び出力プログラム
CN113010785A (zh) 用户推荐方法及设备
KR102192327B1 (ko) 스몰 데이터를 이용한 신뢰지수 평가 및 예측 방법
CN113763057A (zh) 用户身份画像的数据处理方法和装置
CN113220949B (zh) 一种隐私数据识别***的构建方法及装置
CN111401959B (zh) 风险群体的预测方法、装置、计算机设备及存储介质
CN113901817A (zh) 文档分类方法、装置、计算机设备和存储介质
CN112560961A (zh) 基于图聚类的目标识别方法、装置、电子设备及存储介质
CN111708988A (zh) 侵权视频识别方法、装置、电子设备及存储介质
Zhang et al. IoT network for international trade cold chain logistics tracking based on kalman algorithm
CN112434894A (zh) 一种实时风险控制方法、计算机设备及可读存储介质
CN110968785B (zh) 目标帐号的识别方法和装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination