CN113706279B - 欺诈分析方法、装置、电子设备及存储介质 - Google Patents
欺诈分析方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113706279B CN113706279B CN202110615490.6A CN202110615490A CN113706279B CN 113706279 B CN113706279 B CN 113706279B CN 202110615490 A CN202110615490 A CN 202110615490A CN 113706279 B CN113706279 B CN 113706279B
- Authority
- CN
- China
- Prior art keywords
- node
- information
- nodes
- fraud
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 71
- 230000002776 aggregation Effects 0.000 claims description 65
- 238000004220 aggregation Methods 0.000 claims description 65
- 238000000034 method Methods 0.000 claims description 42
- 238000012549 training Methods 0.000 claims description 42
- 230000006870 function Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004141 dimensional analysis Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Technology Law (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供一种欺诈分析方法、装置、电子设备及存储介质,包括基于预先构建的欺诈异构图,确定所述欺诈异构图的路径节点聚类信息;根据所述欺诈异构图中相邻节点的连接关系,确定所述每个节点的符号聚类信息;基于所述路径节点聚类信息以及所述符号聚类信息,通过预先构建的欺诈分析模型,获取所述每个节点的欺诈特征表示。本公开的欺诈分析方法能够有效地提升对欺诈的识别准确性。
Description
技术领域
本公开涉及反欺诈技术领域,尤其涉及一种欺诈分析方法、装置、电子设备及存储介质。
背景技术
随着技术发展,金融领域的交易行为越来越多的依赖于互联网进行,但是伴随而来的骗贷、违约、转账等欺诈性行为,逐渐渗入到互联网中,为了保证交易行为的安全,对于金融机构而言,针对反欺诈识别监控成为防范金融风险的重要工作之一。
现有的反欺诈手段,往往是通过构建异构图,以此作为交易数据的补充,基于异构图能够提取异构图的结构以及相应的特征属性。
现有通过构建异构图的反欺诈手段,一般是直接将用户和用户的连接构成异构图,通过传统的图节点特征计算方法,例如Deep Walk、LINE、Node2Vec、Struc2Vec等计算图节点的特征表示,但是现有方法会忽略与用户相关属性,例如用户之间通过相同设备连接、或者共用IP、或者用户之间距离信息等,忽略用户相关属性,最终将导致对异构图中节点的分类结果不准确。
发明内容
本公开实施例提供一种欺诈分析方法、装置、电子设备及存储介质,能够有效解决现有构建异构图的反欺诈手段对异构图中节点的分类结果不准确的问题。
本公开实施例的第一方面,提供一种欺诈分析方法,包括:
基于预先构建的欺诈异构图,确定所述欺诈异构图的路径节点聚类信息,
其中,所述欺诈异构图包括多个节点以及所述节点之间的连接关系,所述节点的连接关系包括正向连接关系和负向连接关系,所述路径节点聚类信息包括同一类别节点的聚类信息;
根据所述欺诈异构图中相邻节点的连接关系,确定所述每个节点的符号聚类信息,
其中,所述符号聚类信息包括每个节点的相邻节点的聚类信息;
基于所述路径节点聚类信息以及所述符号聚类信息,通过预先构建的欺诈分析模型,获取所述每个节点的欺诈特征表示。
可选地,在确定所述欺诈异构图的路径节点聚类信息之前,所述方法还包括构建所述欺诈异构图:
分别将用户以及与用户相关属性作为所述欺诈异构图的节点;
将欺诈用户与被欺诈用户对应的节点、欺诈用户与欺诈用户相关属性对应的节点进行负向连接;
将正常交易用户对应的节点、正常交易用户与正常交易用户相关属性对应的节点进行正向连接;
基于用户节点、用户属性节点以及节点之间的连接关系构建所述欺诈异构图。
可选地,所述符号聚类信息包括一阶符号聚类信息和多阶符号聚类信息,
所述一阶符号聚类信息包括直接连接的两个节点;
所述多阶符号聚类信息包括通过至少一个节点作为中间节点连接的多个节点;
所述一阶符号聚类信息和所述多阶符号聚类信息还包括正向连接节点集合和负向连接节点集合,
所述正向连接节点集合中相邻节点负向连接的节点个数为偶数个;
所述负向连接节点集合中相邻节点负向连接的节点个数为奇数个。
可选地,所述确定所述每个节点的符号聚类信息的方法还包括:
根据所述欺诈异构图中相邻节点的连接关系,将与该节点属于不同类别的相邻节点删除,将删除不同类别相邻节点后的邻居节点聚类信息作为符号聚类信息。
可选地,所述获取所述每个节点的欺诈特征表示之前,所述方法还包括训练所述欺诈分析模型:
基于预先获取的多个训练路径节点聚类信息,通过待训练的欺诈分析模型,获取第一邻居聚合信息;
基于预先获取的多个训练符号聚类信息,以及所述第一邻居聚合信息,通过待训练的欺诈分析模型,获取第二邻居聚合信息;
根据所述第一邻居聚合信息以及所述第二邻居聚合信息,确定所述训练路径节点聚类信息对应的专注参数;
基于所述第一邻居聚合信息、所述第二邻居聚合信息以及所述专注参数,通过待训练的欺诈分析模型的损失函数,训练所述欺诈分析模型。
本公开实施例的第二方面,提供一种欺诈分析装置,包括:
第一单元,用于基于预先构建的欺诈异构图,确定所述欺诈异构图的路径节点聚类信息,
其中,所述欺诈异构图包括多个节点以及所述节点之间的连接关系,所述节点的连接关系包括正向连接关系和负向连接关系,所述路径节点聚类信息包括同一类别节点的聚类信息;
第二单元,用于根据所述欺诈异构图中相邻节点的连接关系,确定所述每个节点的符号聚类信息,
其中,所述符号聚类信息包括每个节点的相邻节点的聚类信息;
第三单元,用于基于所述路径节点聚类信息以及所述符号聚类信息,通过预先构建的欺诈分析模型,获取所述每个节点的欺诈特征表示。
可选地,所述装置还包括第四单元,所述第四单元用于:
分别将用户以及与用户相关属性作为所述欺诈异构图的节点;
将欺诈用户与被欺诈用户对应的节点、欺诈用户与欺诈用户相关属性对应的节点进行负向连接;
将正常交易用户对应的节点、正常交易用户与正常交易用户相关属性对应的节点进行正向连接;
基于用户节点、用户属性节点以及节点之间的连接关系构建所述欺诈异构图。
可选地,所述符号聚类信息包括一阶符号聚类信息和多阶符号聚类信息,
所述一阶符号聚类信息包括直接连接的两个节点;
所述多阶符号聚类信息包括通过至少一个节点作为中间节点连接的多个节点;
所述一阶符号聚类信息和所述多阶符号聚类信息还包括正向连接节点集合和负向连接节点集合,
所述正向连接节点集合中相邻节点负向连接的节点个数为偶数个;
所述负向连接节点集合中相邻节点负向连接的节点个数为奇数个。
可选地,所述第二单元还用于:
根据所述欺诈异构图中相邻节点的连接关系,将与该节点属于不同类别的相邻节点删除,将删除不同类别相邻节点后的邻居节点聚类信息作为符号聚类信息。
可选地,所述装置还包括第五单元,所述第五单元用于:
基于预先获取的多个训练路径节点聚类信息,通过待训练的欺诈分析模型,获取第一邻居聚合信息;
基于预先获取的多个训练符号聚类信息,以及所述第一邻居聚合信息,通过待训练的欺诈分析模型,获取第二邻居聚合信息;
根据所述第一邻居聚合信息以及所述第二邻居聚合信息,确定所述训练路径节点聚类信息对应的专注参数;
基于所述第一邻居聚合信息、所述第二邻居聚合信息以及所述专注参数,通过待训练的欺诈分析模型的损失函数,训练所述欺诈分析模型。
本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述任意一项所述的方法。
本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述任意一项所述的方法。
本公开提供的一种欺诈分析方法,包括:
基于预先构建的欺诈异构图,确定所述欺诈异构图的路径节点聚类信息,其中,所述欺诈异构图包括多个节点以及所述节点之间的连接关系,所述节点的连接关系包括正向连接关系和负向连接关系;
本公开的欺诈异构图不仅加入了与用户相关属性,还引入了符号网络,通过节点之间的正向连接关系和负向连接关系,进一步增加了维度信息;此外,通过确定路径节点聚类信息,能够挖掘潜在的关系信息,无需计算不同类别的异构信息,降低计算压力,提升识别速度;
根据所述欺诈异构图中相邻节点的连接关系,确定所述每个节点的符号聚类信息;
通过确定每个节点的符号聚类信息,增加了欺诈异构图中相邻节点在实际交易过程的交易情况这一维度数据,而并非只是对异构图中相邻节点进行简单拓展,便于后期对相关节点进行分类,进一步对信息进行开发;
基于所述路径节点聚类信息以及所述符号聚类信息,通过预先构建的欺诈分析模型,获取所述每个节点的欺诈特征表示;
通过预先构建的欺诈分析模型,可以综合处理路径节点聚类信息以及符号聚类信息,能够有效地提升对欺诈的识别准确性;基于欺诈异构图中每个节点的欺诈特征表示,能够根据用户需求进一步处理,具有较高灵活度。
附图说明
图1为本公开实施例欺诈分析方法的流程示意图;
图2为本公开实施例欺诈异构图的示意图;
图3为本公开实施例欺诈分析装置的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本公开的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。
应当理解,在本公开中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本公开中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本公开中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本公开的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1示例性地示出本公开实施例欺诈分析方法的流程示意图,如图1所示,所述方法包括:
步骤S101、基于预先构建的欺诈异构图,确定所述欺诈异构图的路径节点聚类信息;
示例性地,所述欺诈异构图可以包括多个节点以及所述节点之间的连接关系,所述节点的连接关系可以包括正向连接关系和负向连接关系,所述路径节点聚类信息可以包括同一类别节点的聚类信息。
本公开的欺诈异构图不仅加入了与用户相关属性,还引入了符号网络,通过节点之间的正向连接关系和负向连接关系,进一步增加了维度信息;此外,通过确定路径节点聚类信息,能够挖掘潜在的关系信息,无需计算不同类别的异构信息,降低计算压力,提升识别速度。
在一种可选的实施方式中,在确定所述欺诈异构图的路径节点聚类信息之前,所述方法还包括构建所述欺诈异构图:
分别将用户以及与用户相关属性作为所述欺诈异构图的节点;
将欺诈用户与被欺诈用户对应的节点、欺诈用户与欺诈用户相关属性对应的节点进行负向连接;
将正常交易用户对应的节点、正常交易用户与正常交易用户相关属性对应的节点进行正向连接;
基于用户节点、用户属性节点以及节点之间的连接关系构建所述欺诈异构图。
图2示例性地示出本公开实施例欺诈异构图的示意图,如图2所示,所述欺诈异构图可以包括多个节点,多个节点可以通过不同连接方式进行连接。可选地,图2中数字节点可以表示用户节点,非数字节点可以表示与用户相关属性节点。
在实际交易过程中,主要包括两种类型的交易:欺诈交易和正常交易,其中,以用户节点为例,图2中可以用虚线连接的两个节点表示用户之间存在欺诈交易,用实线连接的两个节点表示用户之间属于正常交易。需要说明的是,可以从第三方平台或者从数据库中获取交易类型数据,本公开实施例对交易类型数据的获取方式不进行限定。
示例性地,非数字节点可以表示与用户相关属性节点,其中,与用户相关属性可以包括但不限于用户所用设备、用户所用设备的IP地址、用户名下银行卡信息以及用户所在地理位置等,需要说明的是,本公开实施例对与用户相关属性的类型和种类不进行限定。
现有通过构建异构图的反欺诈手段,一般是直接将用户和用户的连接构成异构图,会忽略与用户相关属性,而本申请实施例通过在异构图中加入与用户相关属性,提高了信息丰富度,有利于提高欺诈识别能力。
示例性地,图2中节点a、b、c可以表示用户所用设备,节点m可以表示用户所用设备的IP地址。图2中多个节点可以通过不同连接方式进行连接,具体地,
以节点1和节点2为例,节点1和节点2通过虚线进行连接,可以表示用户1被用户2欺诈;
以节点1和节点a为例,节点1和节点a通过实线连接,可以表示用户1在被欺诈时,所用的设备为a;
以节点2和节点b为例,节点2和节点b通过虚线连接,可以表示用户2在欺诈时,所用的设备为b。
可以理解的是,本公开实施例中节点通过实线连接,则可以认为节点之间为正向连接,节点通过虚线连接,则可以认为节点之间为负向连接。通过节点之间的正向连接关系和负向连接关系,进一步增加了异构图的维度信息,有利于提高欺诈识别的准确度。
需要说明的是,在异构图中引入符号网络能够扩展维度信息和挖掘潜在的关系信息,但是不同类别的数据对于欺诈识别容易形成干扰,增加计算压力。本公开实施例基于欺诈异构图,确定欺诈异构图的路径节点聚类信息,能够有效解决上述问题。
具体地,以图2为例,欺诈异构图的节点可以包括用户节点、与用户相关属性节点,其中,与用户相关属性节点可以进一步包括用户所用设备、用户所用设备的IP地址。
通过聚合同一类别节点信息,能够有效地处理不同类别的异构信息,减轻计算压力。示例性地,可以通过用户节点聚合与用户相关属性节点信息,也可以通过与用户相关属性节点信息聚合用户节点信息,示例性地,路径节点聚类信息的类型可以包括但不限于:
用户-设备-用户类型;
用户-IP-用户类型;
IP-用户-IP类型;
设备-用户-设备类型。
需要说明的是,上述只是示例性说明,本公开实施例对路径节点聚类信息的类型以及信息长度不进行限定,示例性地,路径节点聚类信息还可以包括用户-设备-用户-设备-用户类型,例如图2中,节点2-节点b-节点4-节点c-节点6。为了聚合同一类别节点信息,路径节点聚类信息中第一个节点和最后一个节点必须是同一类别,本公开实施例对路径节点聚类信息中间节点的数量和类型不进行限定。
通过路径节点聚类信息,可以获取某一节点在特定路径上相关节点的信息,路径节点聚类信息用于指示同一类别节点的聚类信息,因此能够明确相同类别节点的聚类信息,有利于后期对于同一类别节点的分析。
步骤S102、根据所述欺诈异构图中相邻节点的连接关系,确定所述每个节点的符号聚类信息;
示例性地,所述符号聚类信息包括每个节点的相邻节点的聚类信息。
可以理解的是,根据平衡理论,朋友的朋友是朋友,朋友的敌人是敌人,敌人的敌人是朋友,通过不同相邻节点之间正向和负向连接关系,可以确定每个节点的符号聚类信息。
在一种可选的实施方式中,所述符号聚类信息包括一阶符号聚类信息和多阶符号聚类信息,
所述一阶符号聚类信息包括直接连接的两个节点;
所述多阶符号聚类信息包括通过至少一个节点作为中间节点连接的多个节点。
其中,一阶符号聚类信息包括直接连接的两个节点,示例性地,以节点1为例,节点1的一阶符号聚类信息可以包括与节点1正向连接的节点a、与节点1正向连接的节点7、与节点1负向连接的节点2;
其中,多阶符号聚类信息包括通过至少一个节点作为中间节点连接的多个节点,示例性地,以二阶符号聚类信息以及节点1为例,节点1的二阶符号聚类信息可以包括节点c、节点3、节点b、节点m以及节点4。
通过符号聚类信息,能够获取某一节点邻居节点的聚类信息,而符号聚类信息包括一阶符号聚类信息和多阶符号聚类信息,对于某一节点,通过多个维度获取其邻居节点的信息,能够对该节点进行横向的聚类分析,对该节点进行多维度分析。
在一种可选的实施方式中,所述一阶符号聚类信息和所述多阶符号聚类信息包括正向连接节点集合和负向连接节点集合,其中,正向连接节点集合中相邻节点负向连接的节点个数为偶数个,负向连接节点集合中相邻节点负向连接的节点个数为奇数个。
示例性地,以节点i和节点j为例,若节点i和节点j有偶数个负连接的边,则可以认定节点i和节点j是正向连接的关系;若节点i和节点j有奇数个负连接的边,则可以认定节点i和节点j是负向连接的关系。
示例性地,一阶符号聚类信息可以如下公式所示:
其中,Bi(1)表示一阶符号聚类信息的正向连接节点集合,Ui(1)表示一阶符号聚类信息的负向连接节点集合,uj表示第j个节点,表示一阶符号聚类信息中正向连接节点的节点数量,/>表示一阶符号聚类信息中负向连接节点的节点数量。
示例性地,多阶符号聚类信息可以如下公式所示:
其中,Bi(l+1)表示多阶符号聚类信息的正向连接节点集合,Ui(l+1)表示多阶符号聚类信息的负向连接节点集合,表示多阶符号聚类信息中正向连接节点的节点数量,表示多阶符号聚类信息中负向连接节点的节点数量,uk表示第k个节点。
示例性地,以节点1为例,节点1的一阶符号聚类信息的正向连接节点集合可以包括节点7和节点a;节点1的一阶符号聚类信息的负向连接节点集合可以包括节点2;
以节点1和二阶符号聚类信息为例,节点1的二阶符号聚类信息的正向连接节点集合可以包括节点c、节点3、节点b和节点m;节点1的二阶符号聚类信息的负向连接节点集合可以包括节点4。
在一阶符号聚类信息和多阶符号聚类信息的基础上,还可以进一步包括正向连接节点集合和负向连接节点集合,能够对节点进行纵向的聚类分析,并且可以发现与节点虽未直接连接,但是具有实际交易关系的节点,有利于提高欺诈分析的准确性。
在一种可选的实施方式中,所述确定所述每个节点的符号聚类信息的方法还包括:
根据所述欺诈异构图中相邻节点的连接关系,将与该节点属于不同类别的相邻节点删除,将删除不同类别相邻节点后的邻居节点聚类信息作为符号聚类信息。
在实际应用中,欺诈异构图中相邻节点的连接关系往往是包括多个类别的节点,而与某个节点不同类别的相邻节点,对于分析该节点的参考意义不大,通过将与该节点属于不同类别的相邻节点删除,能够减轻计算压力,提高欺诈识别效率。
步骤S103、基于所述路径节点聚类信息以及所述符号聚类信息,通过预先构建的欺诈分析模型,获取所述每个节点的欺诈特征表示。
可以理解的是,每个节点的欺诈特征表示能够表示该节点在欺诈异构图中的特征信息,欺诈特征表示可以是通过欺诈分析模型映射后的低维度向量,基于每个节点的欺诈特征表示,能够根据用户需求进一步处理,具有较高灵活度。
在一种可选的实施方式中,所述获取所述每个节点的欺诈特征表示之前,所述方法还包括训练所述欺诈分析模型:
基于预先获取的多个训练路径节点聚类信息,通过待训练的欺诈分析模型,获取第一邻居聚合信息;
基于预先获取的多个训练符号聚类信息,以及所述第一邻居聚合信息,通过待训练的欺诈分析模型,获取第二邻居聚合信息;
根据所述第一邻居聚合信息以及所述第二邻居聚合信息,通过待训练的欺诈分析模型的损失函数,确定所述训练路径节点聚类信息对应的专注参数;
基于所述第一邻居聚合信息、所述第二邻居聚合信息以及所述专注参数,训练所述欺诈分析模型。
示例性地,本公开实施例的欺诈分析模型可以是基于GCN(Graph ConvolutionalNetwork,图卷积网络)构建的。GCN可以采用局部感知区域、共享权值和空间域上的降采样,相对于位移、缩放和扭曲,具有稳定不变的特性,能够很好的提取图像的空间特征。其中,欺诈分析模型可以通过mean-pooling的方式对信息进行聚合,需要说明的是,本公开实施例对信息聚合的方式不进行限定。
具体地,可以通过预先获取的多个训练路径节点,通过待训练的欺诈分析模型,获取第一邻居聚合信息;
示例性地,可以通过如下公式所示的方法获取第一邻居聚合信息,获取第一邻居聚合信息可以只考虑正向连接和负向连接:
其中,表示正向连接的第一邻居聚合信息,σ表示sigmoid激活函数,WB(1)表示第一正向训练参数,/>表示节点j的初始特征,/>表示正向连接节点的节点数量,/>表示节点i的初始特征;
其中,表示负向连接的第一邻居聚合信息,WU(1)表示第一负向训练参数,/>表示节点k的初始特征,/>表示负向连接节点的节点数量。
具体地,可以基于预先获取的多个训练符号聚类信息,以及所述第一邻居聚合信息,通过待训练的欺诈分析模型,获取第二邻居聚合信息;
示例性地,可以通过如下公式所示的方法获取第二邻居聚合信息,获取第二邻居聚合信息可以考虑正向连接和负向连接的节点,还可以考虑正向连接节点集合和负向连接节点集合:
其中,表示正向连接节点集合的第二邻居聚合信息,WB(l)表示第二正向连接节点集合的训练参数,/>表示第i个节点第l―1层正向连接的第一邻居聚合信息,表示第k个节点第l―1层负向连接的第一邻居聚合信息;
其中,表示负向连接节点集合的第二邻居聚合信息,WU(l)表示第二负向连接节点集合的训练参数,/>表示第i个节点第l―1层负向连接的第一邻居聚合信息,表示第k个节点第l―1层正向连接的第一邻居聚合信息,/>表示第i个节点第l―1层负向连接的第一邻居聚合信息。
在一种可选的实施方式中,根据所述第一邻居聚合信息以及所述第二邻居聚合信息,确定所述训练路径节点聚类信息对应的专注参数;
示例性地,欺诈异构图中,不同的路径节点,具有不同的专注参数,专注参数能够更准确地分析路径节点属性信息。示例性地,可以通过如下公式所示的方法确定所述训练路径节点聚类信息对应的专注参数:
其中,表示节点i在对应的路径节点的专注参数,/>表示节点j在对应的路径节点的专注参数,v表示节点数量,q表示第三训练参数,qT表示第三训练参数的转置矩阵,W表示第四训练参数,b表示第五训练参数。
示例性地,获取不同路径节点对应的专注参数后,可以进一步对专注参数进行归一化处理。可选地,可以通过如下公式所示的方法对专注参数进行归一化处理:
其中,表示对/>进行归一化的结果,/>表示对/>进行归一化的结果,P表示预设常数。
不同评价指标(即特征向量中的不同特征)往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,可以进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过归一化处理后,各指标处于同一数量级,适合进行综合对比评价。
在一种可选的实施方式中,基于所述第一邻居聚合信息、所述第二邻居聚合信息以及所述专注参数,通过待训练的欺诈分析模型的损失函数,训练所述欺诈分析模型。示例性地,在欺诈异构图中,如果两个节点是正向连接的,则可以认为这两个节点的特征表示在空间维度上距离较近;如果两个节点是负向连接的,则可以认为这两个节点的特征表示在空间维度上距离较远。
可选地,本公开实施例的损失函数可以如下公式所示:
Loss表示损失函数的损失值,表示节点u的特征表示的转置,/>表示节点u和节点v正向连接的边,/>表示节点u和节点v负向连接的边,Q表示第六训练参数,其中,第六训练参数用于调节损失值。
在一种可选的实施方式中,基于所述第一邻居聚合信息、所述第二邻居聚合信息以及所述专注参数,通过训练后的欺诈分析模型,获取每个节点的欺诈特征表示。示例性地,可以按照如下公式所示的方法获取每个节点的欺诈特征表示:
Z=CONCAT(ZB,ZU)
其中,ZB表示正向连接节点的欺诈特征表示,ZU表示负向连接节点的欺诈特征表示,Z表示每个节点的欺诈特征表示,CONCAT表示连接字符串函数。
本公开实施例通过训练欺诈分析模型,可以综合处理路径节点聚类信息以及符号聚类信息,能够有效地提升对欺诈的识别准确性。
在一种可选的实施方式中,所述获取所述每个节点的欺诈特征表示后,所述方法还包括:
基于所述每个节点的欺诈特征表示,通过预设的特征表示类别聚类方法,将所述欺诈特征表示属于同一类别的节点进行聚类,并将聚类结果发送至目标客户。
基于欺诈异构图中每个节点的欺诈特征表示,能够根据用户需求进一步处理,具有较高灵活度。示例性地,可以通过DBSCAN(Density-Based Spatial Clustering ofApplications with Noise)聚类算法,将同一类别的欺诈特征表示分到同一组中。可选地,以用户欺诈为例,可以将同一类别的欺诈用户特征表示进行分类,实际中可以表示具有一定联系的欺诈团伙,有利于相关部门(例如公安部门)进行精准打击。
本公开实施例提供的欺诈分析方法的欺诈异构图不仅加入了与用户相关属性,还引入了符号网络,通过节点之间的正向连接关系和负向连接关系,进一步增加了维度信息;此外,通过确定路径节点聚类信息,能够挖掘潜在的关系信息,无需计算不同类别的异构信息,降低计算压力,提升识别速度。
通过确定每个节点的符号聚类信息,增加了欺诈异构图中相邻节点在实际交易过程的交易情况这一维度数据,而并非只是对异构图中相邻节点进行简单拓展,便于后期对相关节点进行分类,进一步对信息进行开发。
通过预先构建的欺诈分析模型,可以综合处理路径节点聚类信息以及符号聚类信息,能够有效地提升对欺诈的识别准确性;基于欺诈异构图中每个节点的欺诈特征表示,能够根据用户需求进一步处理,具有较高灵活度。
图3示例性地示出本公开实施例欺诈分析方法的流程示意图,如图3所示,所述装置包括:
第一单元31,用于基于预先构建的欺诈异构图,确定所述欺诈异构图的路径节点聚类信息,
其中,所述欺诈异构图包括多个节点以及所述节点之间的连接关系,所述节点的连接关系包括正向连接关系和负向连接关系,所述路径节点聚类信息包括同一类别节点的聚类信息;
第二单元32,用于根据所述欺诈异构图中相邻节点的连接关系,确定所述每个节点的符号聚类信息,
其中,所述符号聚类信息包括每个节点的相邻节点的聚类信息;
第三单元33,用于基于所述路径节点聚类信息以及所述符号聚类信息,通过预先构建的欺诈分析模型,获取所述每个节点的欺诈特征表示。
在一种可选的实施方式中,所述装置还包括第四单元,所述第四单元用于:
分别将用户以及与用户相关属性作为所述欺诈异构图的节点;
将欺诈用户与被欺诈用户对应的节点、欺诈用户与欺诈用户相关属性对应的节点进行负向连接;
将正常交易用户对应的节点、正常交易用户与正常交易用户相关属性对应的节点进行正向连接;
基于用户节点、用户属性节点以及节点之间的连接关系构建所述欺诈异构图。
在一种可选的实施方式中,所述符号聚类信息包括一阶符号聚类信息和多阶符号聚类信息,
所述一阶符号聚类信息包括直接连接的两个节点;
所述多阶符号聚类信息包括通过至少一个节点作为中间节点连接的多个节点;
所述一阶符号聚类信息和所述多阶符号聚类信息还包括正向连接节点集合和负向连接节点集合,
所述正向连接节点集合中相邻节点负向连接的节点个数为偶数个;
所述负向连接节点集合中相邻节点负向连接的节点个数为奇数个。
在一种可选的实施方式中,所述第二单元32还用于:
根据所述欺诈异构图中相邻节点的连接关系,将与该节点属于不同类别的相邻节点删除,将删除不同类别相邻节点后的邻居节点聚类信息作为符号聚类信息。
在一种可选的实施方式中,所述装置还包括第五单元,所述第五单元用于:
基于预先获取的多个训练路径节点聚类信息,通过待训练的欺诈分析模型,获取第一邻居聚合信息;
基于预先获取的多个训练符号聚类信息,以及所述第一邻居聚合信息,通过待训练的欺诈分析模型,获取第二邻居聚合信息;
根据所述第一邻居聚合信息以及所述第二邻居聚合信息,确定所述训练路径节点聚类信息对应的专注参数;
基于所述第一邻居聚合信息、所述第二邻居聚合信息以及所述专注参数,通过待训练的欺诈分析模型的损失函数,训练所述欺诈分析模型。
本公开实施例还提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行如图1对应实施例所述的方法。
本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如图1对应实施例所述的方法。
本公开还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。
其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(ApplicationSpecific Integrated Circuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在上述终端或者服务器的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本公开所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
最后应说明的是:以上各实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述各实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。
Claims (10)
1.一种欺诈分析方法,其特征在于,包括:
基于预先构建的欺诈异构图,确定欺诈异构图的路径节点聚类信息,
其中,所述欺诈异构图包括多个节点以及所述节点之间的连接关系,所述节点的连接关系包括正向连接关系和负向连接关系,所述路径节点聚类信息包括同一类别节点的聚类信息;
符号聚类信息包括一阶符号聚类信息和多阶符号聚类信息,
所述一阶符号聚类信息包括直接连接的两个节点;
所述多阶符号聚类信息包括通过至少一个节点作为中间节点连接的多个节点;
所述一阶符号聚类信息和所述多阶符号聚类信息还包括正向连接节点集合和负向连接节点集合,
所述正向连接节点集合中相邻节点负向连接的节点个数为偶数个;
所述负向连接节点集合中相邻节点负向连接的节点个数为奇数个;
根据所述欺诈异构图中相邻节点的连接关系,确定每个节点的符号聚类信息,
其中,所述符号聚类信息包括每个节点的相邻节点的聚类信息;
基于所述路径节点聚类信息以及所述符号聚类信息,通过预先构建的欺诈分析模型,获取所述每个节点的欺诈特征表示。
2.根据权利要求1所述的方法,其特征在于,在确定所述欺诈异构图的路径节点聚类信息之前,所述方法还包括构建所述欺诈异构图:
分别将用户以及与用户相关属性作为所述欺诈异构图的节点;
将欺诈用户与被欺诈用户对应的节点、欺诈用户与欺诈用户相关属性对应的节点进行负向连接;
将正常交易用户对应的节点、正常交易用户与正常交易用户相关属性对应的节点进行正向连接;
基于用户节点、用户属性节点以及节点之间的连接关系构建所述欺诈异构图。
3.根据权利要求1所述的方法,其特征在于,所述确定所述每个节点的符号聚类信息的方法还包括:
根据所述欺诈异构图中相邻节点的连接关系,将与该节点属于不同类别的相邻节点删除,将删除不同类别相邻节点后的邻居节点聚类信息作为符号聚类信息。
4.根据权利要求1所述的方法,其特征在于,所述获取所述每个节点的欺诈特征表示之前,所述方法还包括训练所述欺诈分析模型:
基于预先获取的多个训练路径节点聚类信息,通过待训练的欺诈分析模型,获取第一邻居聚合信息;
基于预先获取的多个训练符号聚类信息,以及所述第一邻居聚合信息,通过待训练的欺诈分析模型,获取第二邻居聚合信息;
根据所述第一邻居聚合信息以及所述第二邻居聚合信息,确定所述训练路径节点聚类信息对应的专注参数;
基于所述第一邻居聚合信息、所述第二邻居聚合信息以及所述专注参数,通过待训练的欺诈分析模型的损失函数,训练所述欺诈分析模型。
5.一种欺诈分析装置,其特征在于,包括:
第一单元,用于基于预先构建的欺诈异构图,确定欺诈异构图的路径节点聚类信息,
其中,所述欺诈异构图包括多个节点以及所述节点之间的连接关系,所述节点的连接关系包括正向连接关系和负向连接关系,所述路径节点聚类信息包括同一类别节点的聚类信息;
符号聚类信息包括一阶符号聚类信息和多阶符号聚类信息,
所述一阶符号聚类信息包括直接连接的两个节点;
所述多阶符号聚类信息包括通过至少一个节点作为中间节点连接的多个节点;
所述一阶符号聚类信息和所述多阶符号聚类信息还包括正向连接节点集合和负向连接节点集合,
所述正向连接节点集合中相邻节点负向连接的节点个数为偶数个;
所述负向连接节点集合中相邻节点负向连接的节点个数为奇数个;
第二单元,用于根据所述欺诈异构图中相邻节点的连接关系,确定每个节点的符号聚类信息,
其中,所述符号聚类信息包括每个节点的相邻节点的聚类信息;
第三单元,用于基于所述路径节点聚类信息以及所述符号聚类信息,通过预先构建的欺诈分析模型,获取所述每个节点的欺诈特征表示。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括第四单元,所述第四单元用于:
分别将用户以及与用户相关属性作为所述欺诈异构图的节点;
将欺诈用户与被欺诈用户对应的节点、欺诈用户与欺诈用户相关属性对应的节点进行负向连接;
将正常交易用户对应的节点、正常交易用户与正常交易用户相关属性对应的节点进行正向连接;
基于用户节点、用户属性节点以及节点之间的连接关系构建所述欺诈异构图。
7.根据权利要求5所述的装置,其特征在于,所述第二单元还用于:
根据所述欺诈异构图中相邻节点的连接关系,将与该节点属于不同类别的相邻节点删除,将删除不同类别相邻节点后的邻居节点聚类信息作为符号聚类信息。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括第五单元,所述第五单元用于:
基于预先获取的多个训练路径节点聚类信息,通过待训练的欺诈分析模型,获取第一邻居聚合信息;
基于预先获取的多个训练符号聚类信息,以及所述第一邻居聚合信息,通过待训练的欺诈分析模型,获取第二邻居聚合信息;
根据所述第一邻居聚合信息以及所述第二邻居聚合信息,确定所述训练路径节点聚类信息对应的专注参数;
基于所述第一邻居聚合信息、所述第二邻居聚合信息以及所述专注参数,通过待训练的欺诈分析模型的损失函数,训练所述欺诈分析模型。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至4中任意一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至4中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110615490.6A CN113706279B (zh) | 2021-06-02 | 2021-06-02 | 欺诈分析方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110615490.6A CN113706279B (zh) | 2021-06-02 | 2021-06-02 | 欺诈分析方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113706279A CN113706279A (zh) | 2021-11-26 |
CN113706279B true CN113706279B (zh) | 2024-04-05 |
Family
ID=78648079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110615490.6A Active CN113706279B (zh) | 2021-06-02 | 2021-06-02 | 欺诈分析方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113706279B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115660688B (zh) * | 2022-10-24 | 2024-04-30 | 西南财经大学 | 金融交易异常检测方法及其跨区域可持续训练方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107730262A (zh) * | 2017-10-23 | 2018-02-23 | 阿里巴巴集团控股有限公司 | 一种欺诈识别方法和装置 |
CN108431846A (zh) * | 2015-12-18 | 2018-08-21 | Aci环球公司 | 使用图形分析交易信息 |
CN110189167A (zh) * | 2019-05-20 | 2019-08-30 | 华南理工大学 | 一种基于异构图嵌入的移动广告欺诈检测方法 |
CN112257959A (zh) * | 2020-11-12 | 2021-01-22 | 上海优扬新媒信息技术有限公司 | 用户风险预测方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200034852A1 (en) * | 2018-07-25 | 2020-01-30 | Ebay Korea Co., Ltd. | Fraud detection system |
-
2021
- 2021-06-02 CN CN202110615490.6A patent/CN113706279B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108431846A (zh) * | 2015-12-18 | 2018-08-21 | Aci环球公司 | 使用图形分析交易信息 |
CN107730262A (zh) * | 2017-10-23 | 2018-02-23 | 阿里巴巴集团控股有限公司 | 一种欺诈识别方法和装置 |
CN110189167A (zh) * | 2019-05-20 | 2019-08-30 | 华南理工大学 | 一种基于异构图嵌入的移动广告欺诈检测方法 |
CN112257959A (zh) * | 2020-11-12 | 2021-01-22 | 上海优扬新媒信息技术有限公司 | 用户风险预测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113706279A (zh) | 2021-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108965245B (zh) | 基于自适应异构多分类模型的钓鱼网站检测方法和*** | |
CN108615119B (zh) | 一种异常用户的识别方法及设备 | |
WO2022121145A1 (zh) | 一种基于图分类的以太坊网络钓鱼诈骗检测方法及装置 | |
WO2020199621A1 (zh) | 基于知识图谱检测欺诈 | |
CN111371767B (zh) | 恶意账号识别方法、恶意账号识别装置、介质及电子设备 | |
CN110990683B (zh) | 一种基于地域与情感特征的微博谣言集成识别方法及装置 | |
CN106874253A (zh) | 识别敏感信息的方法及装置 | |
CN112435137B (zh) | 一种基于社团挖掘的欺诈信息检测方法及*** | |
CN111612038A (zh) | 异常用户检测方法及装置、存储介质、电子设备 | |
CN111581445A (zh) | 基于图基元的图嵌入学习方法 | |
WO2019200739A1 (zh) | 数据欺诈识别方法、装置、计算机设备和存储介质 | |
CN111932130A (zh) | 业务类型识别方法及装置 | |
CN113807073B (zh) | 文本内容异常检测方法、装置以及存储介质 | |
CN111507385A (zh) | 一种可扩展的网络攻击行为分类方法 | |
Hu et al. | BTG: A Bridge to Graph machine learning in telecommunications fraud detection | |
CN113706279B (zh) | 欺诈分析方法、装置、电子设备及存储介质 | |
CN112417152A (zh) | 涉案舆情的话题检测方法和装置 | |
CN109617864B (zh) | 一种网站识别方法及网站识别*** | |
CN113254580A (zh) | 一种特殊群体搜索方法及*** | |
CN113495886A (zh) | 用于模型训练的污染样本数据的检测方法及装置 | |
CN115115369A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN110097258B (zh) | 一种用户关系网络建立方法、装置及计算机可读存储介质 | |
CN109992960B (zh) | 一种伪造参数检测方法、装置、电子设备及存储介质 | |
CN111245815A (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN110851828A (zh) | 基于多维度特征的恶意url监测方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |