CN110874786B - 虚假交易团伙识别方法、设备及计算机可读介质 - Google Patents

虚假交易团伙识别方法、设备及计算机可读介质 Download PDF

Info

Publication number
CN110874786B
CN110874786B CN201910963294.0A CN201910963294A CN110874786B CN 110874786 B CN110874786 B CN 110874786B CN 201910963294 A CN201910963294 A CN 201910963294A CN 110874786 B CN110874786 B CN 110874786B
Authority
CN
China
Prior art keywords
transaction
buyer
item set
seller
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910963294.0A
Other languages
English (en)
Other versions
CN110874786A (zh
Inventor
晏荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201910963294.0A priority Critical patent/CN110874786B/zh
Publication of CN110874786A publication Critical patent/CN110874786A/zh
Application granted granted Critical
Publication of CN110874786B publication Critical patent/CN110874786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种虚假交易团伙识别方案,首先可以获取预设时间段内服务商下买家对应的交易特征信息项集,所述交易特征信息项集的元素为对应的买家所完成的交易的交易特征信息,能够反映出服务商下各个买家在交易时的特点,然后根据所述交易特征信息项集,获取所述服务商下的最大频繁项集,并计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度,根据将所述相似度与第一阈值判断是否存在虚假交易的行为,从而识别出虚假交易团伙。

Description

虚假交易团伙识别方法、设备及计算机可读介质
技术领域
本申请涉及信息技术领域,尤其涉及一种虚假交易团伙识别方法、设备及计算机可读介质。
背景技术
在进行业务拓展时,企业会雇佣服务商进行用户和商户拓展。在该过程中,服务商会通过各种方式开拓新的用户和商户,并促成买家(用户)与卖家(商户)之间的交易,从而为企业带来利益。而对于通过服务商促成的交易,企业会给与服务商一定金额的奖励。在利益驱动下,部分服务商会伙同卖家和买家组成团伙,通过虚假交易的方式来骗取企业给与的奖励,从而会对企业造成损失。对于服务商的这种行为,目前没有较好的方式来进行识别。
发明内容
本申请的一个目的是提供一种虚假交易团伙识别方案,用以解决目前无法有效识别服务商伙同卖家和买家进行虚假交易的问题。
本申请实施例提供了一种虚假交易团伙识别方法,该方法包括:
获取预设时间段内服务商下买家对应的交易特征信息项集,其中,所述交易特征信息项集的元素为对应的买家所完成的交易的交易特征信息;
根据所述交易特征信息项集,获取所述服务商下的最大频繁项集;
计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度;
若存在所述相似度超过第一阈值的买家,将所述服务商确定为虚假交易团伙的成员。
本申请实施例还提供了一种虚假交易团伙识别设备,该设备包括:
信息获取模块,用于获取预设时间段内服务商下买家对应的交易特征信息项集,其中,所述交易特征信息项集的元素为对应的买家所完成的交易的交易特征信息;
计算处理模块,用于根据所述交易特征信息项集,获取所述服务商下的最大频繁项集,以及计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度;
识别模块,用于在判断存在所述相似度超过第一阈值的买家时,将所述服务商确定为虚假交易团伙的成员。
此外,本申请的一些实施例还提供了一种计算设备,该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发所述设备执行所述的虚假交易团伙识别方法。
本申请的另一些实施例还提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机可读指令可被处理器执行以实现所述的虚假交易团伙识别方法。
本申请实施例提供的虚假交易团伙识别方案中,首先可以获取预设时间段内服务商下买家对应的交易特征信息项集,所述交易特征信息项集的元素为对应的买家所完成的交易的交易特征信息,能够反映出服务商下各个买家在交易时的特点,然后根据所述交易特征信息项集,获取所述服务商下的最大频繁项集,并计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度,若存在所述相似度超过第一阈值的买家,将所述服务商确定为虚假交易团伙的成员。由于虚假交易团伙的表现形式往往是一批买家与同一服务商拓展的一批卖家集中交易,交易时往往会表现出一些特定的模式,例如交易的卖家类似、交易金额类似等,最大频繁项集则可以表示所述特定的模式,因此相似度越高,表示该服务商下的买家在交易是越符合虚假交易团伙的特定模式,由此可以识别出服务商是否存在虚假交易的行为。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为虚假交易团伙的一种交易表现形式;
图2为本申请实施例提供的一种虚假交易团伙识别方法的处理流程图;
图3为采用本申请实施例提供的方案识别虚假交易团伙时的处理流程图;
图4为本申请实施例提供的一种虚假交易团伙识别设备的结构示意图;
图5为本申请实施例提供的一种用于识别虚假交易团伙的计算设备的结构示意图;
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的装置或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本申请实施例提供了一种虚假交易团伙识别方法,该方法基于最大频繁项集和服务商下买家用户对应的交易特征信息项集之间的相似度来识别是否存在虚假交易,由于虚假交易团伙的表现形式往往是一批买家与同一服务商拓展的一批卖家集中交易,如图1所示,交易时往往会表现出一些特定的模式,例如交易的卖家类似、交易金额类似等,最大频繁项集则可以表示所述特定的模式,因此相似度越高,表示该服务商下的买家在交易是越符合虚假交易团伙的特定模式,由此可以有效地识别出服务商是否存在虚假交易的行为。
在实际场景中,该方法的执行主体可以是用户设备、网络设备或者用户设备与网络设备通过网络相集成所构成的设备,此外也可以是运行于上述设备中的程序。所述用户设备包括但不限于计算机、手机、平板电脑等各类终端设备;所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟计算机。
图2示出了本申请实施例提供的一种虚假交易团伙识别方法的处理流程,至少包括以下几个处理步骤:
步骤S201,获取预设时间段内服务商下买家对应的交易特征信息项集。其中,所述预设时间段可以根据实际场景的需求来进行设定,当交易发生的较为频繁,数据较为密集时可以设定较短的一个时间段,反之可以设定一个较长的时间段,保证有充足的样本进行后续的计算,例如可以根据需要设定为N个小时、N天或者N个月等。
所述交易特征信息项集的元素为对应的买家所完成的交易的交易特征信息,所述交易特征信息可以是能够反映出交易的特点的信息,例如买家的交易金额或与所述买家交易的卖家。
以服务商A下的买家1和买家2为例,若采用的交易特征信息为与所述买家交易的卖家,买家1在预设时间段内交易的卖家包括了卖家11、卖家23和卖家12,则预设时间段内服务商A下的买家1对应的交易特征信息项集为{卖家11,卖家23,卖家12},买家2在预设时间段内交易的卖家包括了卖家11、卖家24、卖家14、卖家13和卖家12,则预设时间段内服务商A下的买家2对应的交易特征信息项集为{卖家11,卖家24,卖家14,卖家13,卖家12}。
若采用的交易特征信息为买家的交易金额,买家1在预设时间段内所完成的交易的交易金额包括了4、5和6,则预设时间段内服务商A下的买家1对应的交易特征信息项集为{4,5,6},买家2在预设时间段内所完成的交易的交易金额包括了6、7、8、9和10,则预设时间段内服务商A下的买家2对应的交易特征信息项集为{6,7,8,9,10}。
在实际场景中,在进行数据采集时,可以同时获取包括多个服务商下买家对应的交易特征信息项集,实际使用时可以先根据服务商进行分组,例如将服务商A下的数据分组为Group1,服务商B下的数据分组为Group2,以此类推完成分组之后,可以对每个分组单独进行处理,以判断各个服务商是否存在虚假交易的行为,是否属于虚假交易团伙的成员。
步骤S202,根据所述交易特征信息项集,获取所述服务商下的最大频繁项集。其中,频繁项集是指数据集中频繁出现的集合,最大频繁项集为无超集的频繁项集,可以采用支持度作为判断一个项集是否为频繁项集的依据,即可以将支持度大于支持度阈值的项集判定为频繁项集。所述支持度(Support)可以定义为样本项集中的元素同时出现的概率,以X和Y两个元素为例,其支持度为:
Support(X,Y)=P(XY)=num(XY)/num(AllSamples)
其中,Support(X,Y)表示项集{X,Y}的支持度,P(XY)表示样本项集中X和Y同时出现的概率,num(XY)表示样本项集中X和Y同时出现的次数,num(AllSamples)表示样本项集的数量。以服务商C为例,其下买家1~4对应的交易特征信息如下表1所示:
服务商ID 买家ID 卖家ID
C 买家1 卖家11,卖家23,卖家12
C 买家2 卖家11,卖家24,卖家14,卖家13
C 买家3 卖家11,卖家25,卖家14,卖家13
C 买家4 卖家11,卖家13,卖家12
表1
由此可知,服务商C下买家1~4对应的交易特征信息项集分别为:{卖家11,卖家23,卖家12}、{卖家11,卖家24,卖家14,卖家13}、{卖家11,卖家25,卖家14,卖家13}、{卖家11,卖家13,卖家12},通过计算可以获取该服务商C下的最大频繁项集为{卖家11,卖家13,卖家14}。
在本申请的一些实施例中,在获取最大频繁项集时可以采用Apriori算法。以前述服务商C下买家1~4对应的卖家为例,采用Apriori算法确定最大频繁项集的处理流程如下:
设定支持度阈值为50%,计算候选的频繁1项集的集合C1的支持度如下表2:
项集 支持度
卖家11 100%
卖家12 50%
卖家13 75%
卖家14 50%
卖家23 25%
卖家24 25%
卖家25 25%
表2与支持度阈值比较之后,可以获得频繁1项集的集合L1如下表3:
项集 支持度
卖家11 100%
卖家12 50%
卖家13 75%
卖家14 50%
表3
通过集合L1中的频繁1项集自身连接产生候选的频繁2项集的集合C2,同时计算其支持度如下表4:
Figure GDA0003736212160000061
Figure GDA0003736212160000071
表4与支持度阈值比较之后,可以获得频繁2项集的集合L2如下表5:
项集 支持度
卖家11,卖家12 50%
卖家11,卖家13 75%
卖家11,卖家14 50%
卖家13,卖家14 50%
表5
通过集合L2中的频繁2项集自身连接产生候选的频繁3项集的集合C3,同时计算其支持度如下表6:
项集 支持度
卖家11,卖家12,卖家13 25%
卖家11,卖家12,卖家14 0%
卖家11,卖家13,卖家14 50%
卖家12,卖家13,卖家14 0%
表6与支持度阈值比较之后,可以获得频繁3项集的集合L3如下表7:
项集 支持度
卖家11,卖家13,卖家14 50%
表7
由此可知,根据所述交易特征信息项集,可以确定获取所述服务商下买家对应的交易特征信息项集的集合中,所包含的频繁项集为集合L1、L2和L3中的所有项集,其中最大频繁项集为{卖家11,卖家13,卖家14}。
同理,若交易特征信息项集中的元素为买家的交易金额,也可以采用Apriori算法获取所述服务商下的最大频繁项集。
步骤S203,计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度。由于最大频繁项集表示了经常一起出现的交易特征信息,例如可以是同一服务商下频繁买家进行交易的卖家的集合,或者也可以是同一服务商下买家频繁的使用的交易金额等。这些信息能够反映出该服务商下买家和卖家进行交易时的特定模式,例如买家集中与特定的几个卖家进行交易,大量买家以特定的价格进行交易等,这些可能是虚假交易团伙进行交易时的常见模式。因此,买家对应的交易特征信息项集与最大频繁项集的相似度越高,则表示该买家及其对应的服务商进行的交易是虚假交易的可能性越高,由此该服务商以及其下的买家、卖家参与了虚假交易的可性能越大。
在本申请的一些实施例中,在计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似时,可以将第一集合的元素数量与第二集合的元素数量的比值确定为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度。其中,所述第一集合为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的交集,所述第二集合为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的并集。由此,相似度的计算方法可以采用如下公式表示:
S=|A∩B|/|A∪B|
其中,S为相似度,A为服务商下买家对应的交易特征信息项集,B为服务商下的最大频繁项集。
例如,对于前述服务商C下的样本数据,买家1对应的交易特征信息项集为{卖家11,卖家23,卖家12},最大频繁项集为{卖家11,卖家13,卖家14},由此可知,第一集合为{卖家11,卖家23,卖家12}与{卖家11,卖家13,卖家14}的交集{卖家11},第二集合为{卖家11,卖家23,卖家12}与{卖家11,卖家13,卖家14}的并集{卖家11,卖家23,卖家12,卖家13,卖家14},第一集合的元素数量与第二集合的元素数量分别为1和5,由此可以计算出相似度S为0.2。同理,可以计算出买家2、3、4对应的交易特征信息项集与所述服务商下的最大频繁项集的相似分别为:0.75、0.75和0.5,具体如下表8所示:
Figure GDA0003736212160000081
Figure GDA0003736212160000091
表8
步骤S204,若存在所述相似度超过第一阈值的买家,将所述服务商确定为虚假交易团伙的成员。其中,所述第一阈值为预先设定的相似度阈值,若服务商下的某一买家的交易特征信息项集与最大频繁项集之间的相似度高于该第一阈值,则可以认为该买家及其对应的服务商进行了虚假交易。若一个服务商下的买家对应的相似度都未超过第一阈值,则表示该服务商不存在虚假交易的行为。
以前述服务商C为例,本实施例中若设定第一阈值为0.6,则存在两个相似度超过第一阈值的买家,即买家2和买家3,由此可知服务商C存在虚假交易的行为,可以将其确定为虚假交易团伙的成员。若仅需要识别出服务商是否进行了虚假交易,则仅将买家对应的服务商确定为虚假交易团伙的成员即可。
在本申请的另一些实施例中,还可以将所述相似度超过第一阈值的买家,以及与所述买家完成过交易的卖家也同时确定为虚假交易团伙的成员,从而获取完整的虚假交易团伙。例如,前述服务商C下的买家2和买家3即为相似度超过第一阈值的买家,卖家11、卖家24、卖家14、卖家13是与买家2完成过交易的卖家,卖家11、卖家25、卖家14、卖家13是与买家3完成过交易的卖家,由此可以确定该虚假交易团伙的成员为:
服务商:{C}
买家列表:{买家2,买家3}
卖家列表:{卖家11,卖家13,卖家14,卖家24,卖家25}
基于类似的方式,可以基于各个服务商下的样本数据单独进行处理,从而识别出每个服务商是否属于虚假交易团伙的成员,以及包括买家、卖家在内的虚假交易团伙的完整成员名单。
在实际场景中,所述服务商下的最大频繁项集数量可能是一个,也可能存在多个。当存在多个最大频繁项集时,表示服务商下也可能存在同样数量的虚假交易团伙。由此,计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度时,可以先构建与最大频繁项集数量相同的候选团伙,每个候选团伙分别对应所述服务商下的一个最大频繁项集。
例如,若服务商D下的最大频繁项集为两项分别为{卖家11,卖家13,卖家14}和{卖家11,卖家22,卖家23},则可以构建对应于这两个最大频繁项集的两个候选团伙。在构建候选团伙时,可以分别为候选团伙创建团伙ID,以便于在后续处理中区分多个候选团伙。在本实施例中,团伙ID可以基于服务商和最大频繁项集自动生成,例如对于服务商D下的两个候选团伙,可以分别创建团伙ID为“D+卖家11,卖家13,卖家14”,“D+卖家11,卖家22,卖家23”。
在候选团伙构建完成之后,再分别计算买家对应的交易特征信息项集与各个候选团伙对应的最大频繁项集的相似度。若服务商D下的买家分别为买家1~6,其对于候选团伙“D+卖家11,卖家13,卖家14”的相似度分别为0.2、0.4、0.7、0.9、0.5和0.8,对于另一个候选团伙“D+卖家11,卖家22,卖家23”的相似度分别为0.9、0.7、0.8、0.3、0.3和0.2,具体可以如下表9所示:
服务商ID 买家ID 相似度1 相似度2
D 买家1 0.2 0.9
D 买家2 0.4 0.7
D 买家3 0.7 0.8
D 买家4 0.9 0.3
D 买家5 0.5 0.3
D 买家6 0.8 0.2
表9
其中,相似度1为买家1~6对应于候选团伙“D+卖家11,卖家13,卖家14”的相似度,相似度2为买家1~6对应于候选团伙“D+卖家11,卖家22,卖家23”的相似度。
此时,在判断所述服务商是否为虚假交易团伙的成员时,可以将买家归入相似度最高的候选团伙,对于任一候选团伙,若所述候选团伙中存在所述相似度超过第一阈值的买家,将所述候选团伙确定为虚假交易团伙,并将所述服务商确定为虚假交易团伙的成员。例如,对于买家1,其相似度1为0.2,相似度2为0.9,则该买家1会归入到候选团伙“D+卖家11,卖家22,卖家23”中,同理可以将买家2~6采用同样的方式分别归入候选团伙中。
而后对于每一个候选团伙,根据存在相似度超过第一阈值的买家,判定该候选团伙是否为虚假交易团伙。若候选团伙中至少存在一个相似度超过第一阈值的买家,则表示该候选团伙为虚假交易团伙,其对应的服务商即为该虚假交易团伙的成员。若候选团伙中不存在相似度超过第一阈值的买家,则表示该候选团伙不是虚假交易团伙。在此,本领域技术人员应当理解,本实施例中描述的前后顺序并不用于限定实际执行中的处理逻辑,例如将买家归入相似度最高的候选团伙以及基于第一阈值进行判断之间并不存在严格的时序关系,实际场景中可以先筛选相似度超过第一阈值的买家,再为筛选后的买家分配候选团伙。现有或今后出现的基于类似原理的具体实现方式如果能够适用于本申请,也应该包含在本申请的保护范围内,并以引用的形式包含于此。
在本申请的另一些实施例中,对于每个虚假交易团伙,还可以将所述相似度超过第一阈值的买家,以及与所述买家完成过交易的卖家也同时确定为虚假交易团伙的成员,从而获取完整的虚假交易团伙。因此,当存在多个候选团伙时,对于任一候选团伙,可以基于第一阈值进行判断,若所述候选团伙中存在所述相似度超过第一阈值的买家,将所述候选团伙确定为虚假交易团伙,并将所述服务商、所述候选团伙下相似度超过第一阈值的买家、以及与所述虚假交易团伙中的买家完成过交易的卖家确定为所述虚假交易团伙的成员。
在实际场景中,还可以获取买家所述预设时间段内交易的卖家数量这一信息,并根据这一信息优化虚假交易团伙识别的方案。由此,在获取预设时间段内服务商下买家对应的交易特征信息项集时,可以先基于所述预设时间段内交易的卖家数量进行一次筛选。由于服务商在组织虚假交易团伙时,其所能组织的进行虚假交易的卖家数量一般不会很大,因此可以设定一个第二阈值,将所述预设时间段内交易的卖家数量与该第二阈值进行比较,若超过了该第二阈值,则可以认为与这么多卖家进行交易的买家进行虚假交易的可能性不高,因此可以排除。即,在本申请的一些实施例中,在获取预设时间段内服务商下买家对应的交易特征信息项集时,可以获取预设时间段内服务商下符合识别要求的买家对应的交易特征信息项集,其中,所述符合识别要求的买家为所述预设时间段内交易的卖家数量小于第二阈值的买家。
图3示出了采用本申请实施例提供的方案识别虚假交易团伙时的处理流程,处理过程中需要准备的样本数据包括:预设时间段同服务商下交易卖家集合,预设时间段同服务商下交易金额集合,预设时间段同服务商下交易卖家数,具体如下表10所示:
Figure GDA0003736212160000121
Figure GDA0003736212160000131
表10
识别虚假交易团伙时,包括以下处理步骤:
步骤S301,根据服务商分组,分组结果如下表11所示:
Figure GDA0003736212160000132
Figure GDA0003736212160000141
表11
步骤S302,生成关于卖家的最大频繁项集。以group1为例,采用Apriori算法,根据各个卖家对应的卖家的集合,可以确定最大频繁项集为{卖家11,卖家12,卖家13,卖家14}。
步骤S303,根据服务商和最大频繁项集构建候选团伙ID。以group1为例,Group1的团伙ID可以基于{A}和{卖家11,卖家12,卖家13,卖家14}生成。
步骤S304,计算买家对应的卖家集合与分组下最大频繁项集的相似性,此处采用前述的公式S=|A∩B|/|A∪B|来进行计算。对于group1,可以获得如下表12的计算结果:
Figure GDA0003736212160000142
Figure GDA0003736212160000151
表12
步骤S305,团伙生成。若设定第一阈值为0.6,则group1中所有买家对应的相似度都大于该第一阈值,且由于候选团伙仅有一个,则可以确定该候选团伙为虚假交易团伙,服务商A以及这些买家与交易的卖家均是该虚假交易团伙的成员。由此,生成完整的团伙集合如下:
{A}--服务商
{卖家11,卖家12,卖家13,卖家14}--最大频繁项集
{买家1,买家10,买家11,买家12,买家13,买家14,买家2,买家3,买家4,买家5,买家6,买家7,买家8,买家9}--买家LIST
{卖家11,卖家12,卖家13,卖家14,卖家21,卖家22,卖家23,卖家24}--卖家LIST
基于同一发明构思,本申请实施例中还提供了一种虚假交易团伙识别设备,所述设备对应的方法是前述实施例中虚假交易团伙识别方法,并且其解决问题的原理与该方法相似。
本申请实施例提供了一种虚假交易团伙识别设备,该设备在实现虚假交易团伙识别时,基于最大频繁项集和服务商下买家用户对应的交易特征信息项集之间的相似度来识别是否存在虚假交易,由于虚假交易团伙的表现形式往往是一批买家与同一服务商拓展的一批卖家集中交易,如图1所示,交易时往往会表现出一些特定的模式,例如交易的卖家类似、交易金额类似等,最大频繁项集则可以表示所述特定的模式,因此相似度越高,表示该服务商下的买家在交易是越符合虚假交易团伙的特定模式,由此可以有效地识别出服务商是否存在虚假交易的行为。
在实际场景中,所述虚假交易团伙识别设备可以是用户设备、网络设备或者用户设备与网络设备通过网络相集成所构成的设备,此外也可以是运行于上述设备中的程序。所述用户设备包括但不限于计算机、手机、平板电脑等各类终端设备;所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟计算机。
图4示出了本申请实施例提供的一种虚假交易团伙识别设备的结构,包括信息获取模块410、计算处理模块420和识别模块430。其中,信息获取模块410用于获取预设时间段内服务商下买家对应的交易特征信息项集。计算处理模块420用于根据所述交易特征信息项集,获取所述服务商下的最大频繁项集,以及计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度。识别模块430用于在判断存在所述相似度超过第一阈值的买家时,将所述服务商确定为虚假交易团伙的成员。
所述预设时间段可以根据实际场景的需求来进行设定,当交易发生的较为频繁,数据较为密集时可以设定较短的一个时间段,反之可以设定一个较长的时间段,保证有充足的样本进行后续的计算,例如可以根据需要设定为N个小时、N天或者N个月等。
所述交易特征信息项集的元素为对应的买家所完成的交易的交易特征信息,所述交易特征信息可以是能够反映出交易的特点的信息,例如买家的交易金额或与所述买家交易的卖家。
以服务商A下的买家1和买家2为例,若采用的交易特征信息为与所述买家交易的卖家,买家1在预设时间段内交易的卖家包括了卖家11、卖家23和卖家12,则预设时间段内服务商A下的买家1对应的交易特征信息项集为{卖家11,卖家23,卖家12},买家2在预设时间段内交易的卖家包括了卖家11、卖家24、卖家14、卖家13和卖家12,则预设时间段内服务商A下的买家2对应的交易特征信息项集为{卖家11,卖家24,卖家14,卖家13,卖家12}。
若采用的交易特征信息为买家的交易金额,买家1在预设时间段内所完成的交易的交易金额包括了4、5和6,则预设时间段内服务商A下的买家1对应的交易特征信息项集为{4,5,6},买家2在预设时间段内所完成的交易的交易金额包括了6、7、8、9和10,则预设时间段内服务商A下的买家2对应的交易特征信息项集为{6,7,8,9,10}。
在实际场景中,在进行数据采集时,可以同时获取包括多个服务商下买家对应的交易特征信息项集,实际使用时可以先根据服务商进行分组,例如将服务商A下的数据分组为Group1,服务商B下的数据分组为Group2,以此类推完成分组之后,可以对每个分组单独进行处理,以判断各个服务商是否存在虚假交易的行为,是否属于虚假交易团伙的成员。
计算处理模块获取的频繁项集是指数据集中频繁出现的集合,最大频繁项集为无超集的频繁项集,可以采用支持度作为判断一个项集是否为频繁项集的依据,即可以将支持度大于支持度阈值的项集判定为频繁项集。所述支持度(Support)可以定义为样本项集中的元素同时出现的概率,以X和Y两个元素为例,其支持度为:
Support(X,Y)=P(XY)=num(XY)/num(AllSamples)
其中,Support(X,Y)表示项集{X,Y}的支持度,P(XY)表示样本项集中X和Y同时出现的概率,num(XY)表示样本项集中X和Y同时出现的次数,num(AllSamples)表示样本项集的数量。以服务商C为例,其下买家1~4对应的交易特征信息下表1所示。
由此可知,服务商C下买家1~4对应的交易特征信息项集分别为:{卖家11,卖家23,卖家12}、{卖家11,卖家24,卖家14,卖家13}、{卖家11,卖家25,卖家14,卖家13}、{卖家11,卖家13,卖家12},通过计算可以获取该服务商C下的最大频繁项集为{卖家11,卖家13,卖家14}。
在本申请的一些实施例中,计算处理模块在获取最大频繁项集时可以采用Apriori算法。
由于最大频繁项集表示了经常一起出现的交易特征信息,例如可以是同一服务商下频繁买家进行交易的卖家的集合,或者也可以是同一服务商下买家频繁的使用的交易金额等。这些信息能够反映出该服务商下买家和卖家进行交易时的特定模式,例如买家集中与特定的几个卖家进行交易,大量买家以特定的价格进行交易等,这些可能是虚假交易团伙进行交易时的常见模式。因此,买家对应的交易特征信息项集与最大频繁项集的相似度越高,则表示该买家及其对应的服务商进行的交易是虚假交易的可能性越高,由此该服务商以及其下的买家、卖家参与了虚假交易的可性能越大。
在本申请的一些实施例中,计算处理模块在计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似时,可以将第一集合的元素数量与第二集合的元素数量的比值确定为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度。其中,所述第一集合为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的交集,所述第二集合为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的并集。由此,相似度的计算方法可以采用如下公式表示:
S=|A∩B|/|A∪B|
其中,S为相似度,A为服务商下买家对应的交易特征信息项集,B为服务商下的最大频繁项集。
例如,对于前述服务商C下的样本数据,买家1对应的交易特征信息项集为{卖家11,卖家23,卖家12},最大频繁项集为{卖家11,卖家13,卖家14},由此可知,第一集合为{卖家11,卖家23,卖家12}与{卖家11,卖家13,卖家14}的交集{卖家11},第二集合为{卖家11,卖家23,卖家12}与{卖家11,卖家13,卖家14}的并集{卖家11,卖家23,卖家12,卖家13,卖家14},第一集合的元素数量与第二集合的元素数量分别为1和5,由此可以计算出相似度S为0.2。同理,可以计算出买家2、3、4对应的交易特征信息项集与所述服务商下的最大频繁项集的相似分别为:0.75、0.75和0.5,具体如表8所示。
识别模块所使用的第一阈值为预先设定的相似度阈值,若服务商下的某一买家的交易特征信息项集与最大频繁项集之间的相似度高于该第一阈值,则可以认为该买家及其对应的服务商进行了虚假交易。若一个服务商下的买家对应的相似度都未超过第一阈值,则表示该服务商不存在虚假交易的行为。
以前述服务商C为例,本实施例中若设定第一阈值为0.6,则存在两个相似度超过第一阈值的买家,即买家2和买家3,由此可知服务商C存在虚假交易的行为,识别模块可以将其确定为虚假交易团伙的成员。若仅需要识别出服务商是否进行了虚假交易,则仅将买家对应的服务商确定为虚假交易团伙的成员即可。
在本申请的另一些实施例中,识别模块还可以将所述相似度超过第一阈值的买家,以及与所述买家完成过交易的卖家也同时确定为虚假交易团伙的成员,从而获取完整的虚假交易团伙。例如,前述服务商C下的买家2和买家3即为相似度超过第一阈值的买家,卖家11、卖家24、卖家14、卖家13是与买家2完成过交易的卖家,卖家11、卖家25、卖家14、卖家13是与买家3完成过交易的卖家,由此可以确定该虚假交易团伙的成员为:
服务商:{C}
买家列表:{买家2,买家3}
卖家列表:{卖家11,卖家13,卖家14,卖家24,卖家25}
基于类似的方式,可以基于各个服务商下的样本数据单独进行处理,从而识别出每个服务商是否属于虚假交易团伙的成员,以及包括买家、卖家在内的虚假交易团伙的完整成员名单。
在实际场景中,所述服务商下的最大频繁项集数量可能是一个,也可能存在多个。当存在多个最大频繁项集时,表示服务商下也可能存在同样数量的虚假交易团伙。由此,计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度时,计算处理模块可以先构建与最大频繁项集数量相同的候选团伙,每个候选团伙分别对应所述服务商下的一个最大频繁项集。
例如,若服务商D下的最大频繁项集为两项分别为{卖家11,卖家13,卖家14}和{卖家11,卖家22,卖家23},则可以构建对应于这两个最大频繁项集的两个候选团伙。在构建候选团伙时,可以分别为候选团伙创建团伙ID,以便于在后续处理中区分多个候选团伙。在本实施例中,团伙ID可以基于服务商和最大频繁项集自动生成,例如对于服务商D下的两个候选团伙,可以分别创建团伙ID为“D+卖家11,卖家13,卖家14”,“D+卖家11,卖家22,卖家23”。
在候选团伙构建完成之后,计算处理模块再分别计算买家对应的交易特征信息项集与各个候选团伙对应的最大频繁项集的相似度。若服务商D下的买家分别为买家1~6,其对于候选团伙“D+卖家11,卖家13,卖家14”的相似度分别为0.2、0.4、0.7、0.9、0.5和0.8,对于另一个候选团伙“D+卖家11,卖家22,卖家23”的相似度分别为0.9、0.7、0.8、0.3、0.3和0.2,具体可以如表9所示。
其中,相似度1为买家1~6对应于候选团伙“D+卖家11,卖家13,卖家14”的相似度,相似度2为买家1~6对应于候选团伙“D+卖家11,卖家22,卖家23”的相似度。
此时,在判断所述服务商是否为虚假交易团伙的成员时,识别模块可以将买家归入相似度最高的候选团伙,对于任一候选团伙,若所述候选团伙中存在所述相似度超过第一阈值的买家,将所述候选团伙确定为虚假交易团伙,并将所述服务商确定为虚假交易团伙的成员。例如,对于买家1,其相似度1为0.2,相似度2为0.9,则该买家1会归入到候选团伙“D+卖家11,卖家22,卖家23”中,同理可以将买家2~6采用同样的方式分别归入候选团伙中。
而后对于每一个候选团伙,根据存在相似度超过第一阈值的买家,判定该候选团伙是否为虚假交易团伙。若候选团伙中至少存在一个相似度超过第一阈值的买家,则表示该候选团伙为虚假交易团伙,其对应的服务商即为该虚假交易团伙的成员。若候选团伙中不存在相似度超过第一阈值的买家,则表示该候选团伙不是虚假交易团伙。在此,本领域技术人员应当理解,本实施例中描述的前后顺序并不用于限定实际执行中的处理逻辑,例如将买家归入相似度最高的候选团伙以及基于第一阈值进行判断之间并不存在严格的时序关系,实际场景中可以先筛选相似度超过第一阈值的买家,再为筛选后的买家分配候选团伙。现有或今后出现的基于类似原理的具体实现方式如果能够适用于本申请,也应该包含在本申请的保护范围内,并以引用的形式包含于此。
在本申请的另一些实施例中,对于每个虚假交易团伙,识别模块还可以将所述相似度超过第一阈值的买家,以及与所述买家完成过交易的卖家也同时确定为虚假交易团伙的成员,从而获取完整的虚假交易团伙。因此,当存在多个候选团伙时,对于任一候选团伙,可以基于第一阈值进行判断,若所述候选团伙中存在所述相似度超过第一阈值的买家,将所述候选团伙确定为虚假交易团伙,并将所述服务商、所述候选团伙下相似度超过第一阈值的买家、以及与所述虚假交易团伙中的买家完成过交易的卖家确定为所述虚假交易团伙的成员。
在实际场景中,信息获取模块还可以获取买家所述预设时间段内交易的卖家数量这一信息,并根据这一信息优化虚假交易团伙识别的方案。由此,在获取预设时间段内服务商下买家对应的交易特征信息项集时,可以先基于所述预设时间段内交易的卖家数量进行一次筛选。由于服务商在组织虚假交易团伙时,其所能组织的进行虚假交易的卖家数量一般不会很大,因此可以设定一个第二阈值,将所述预设时间段内交易的卖家数量与该第二阈值进行比较,若超过了该第二阈值,则可以认为与这么多卖家进行交易的买家进行虚假交易的可能性不高,因此可以排除。即,在本申请的一些实施例中,在获取预设时间段内服务商下买家对应的交易特征信息项集时,可以获取预设时间段内服务商下符合识别要求的买家对应的交易特征信息项集,其中,所述符合识别要求的买家为所述预设时间段内交易的卖家数量小于第二阈值的买家。
综上所述,本申请实施例提供的虚假交易团伙识别方案中,首先可以获取预设时间段内服务商下买家对应的交易特征信息项集,所述交易特征信息项集的元素为对应的买家所完成的交易的交易特征信息,能够反映出服务商下各个买家在交易时的特点,然后根据所述交易特征信息项集,获取所述服务商下的最大频繁项集,并计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度,若存在所述相似度超过第一阈值的买家,将所述服务商确定为虚假交易团伙的成员。由于虚假交易团伙的表现形式往往是一批买家与同一服务商拓展的一批卖家集中交易,交易时往往会表现出一些特定的模式,例如交易的卖家类似、交易金额类似等,最大频繁项集则可以表示所述特定的模式,因此相似度越高,表示该服务商下的买家在交易是越符合虚假交易团伙的特定模式,由此可以识别出服务商是否存在虚假交易的行为。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一些实施例包括一个如图5所示的计算设备,该设备包括存储有计算机可读指令的一个或多个存储器510和用于执行计算机可读指令的处理器520,其中,当该计算机可读指令被该处理器执行时,使得所述设备执行基于前述本申请的多个实施例的方法和/或技术方案。
此外,本申请的一些实施例还提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机可读指令可被处理器执行以实现前述本申请的多个实施例的方法和/或技术方案。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一些实施例中,本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (16)

1.一种虚假交易团伙识别方法,其中,该方法包括:
获取预设时间段内服务商下买家对应的交易特征信息项集,其中,所述交易特征信息项集的元素为对应的买家所完成的交易的交易特征信息;所述交易特征信息为用于反映所述交易的特点的信息;
根据所述交易特征信息项集,获取所述服务商下的最大频繁项集;
计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度;
若存在所述相似度超过第一阈值的买家,将所述服务商确定为虚假交易团伙的成员;
其中,所述服务商用于促成所述买家与卖家之间的所述交易。
2.根据权利要求1所述的方法,其中,该方法还包括:
将所述相似度超过第一阈值的买家,以及与所述买家完成过交易的卖家确定为虚假交易团伙的成员。
3.根据权利要求1所述的方法,其中,计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度,包括:
将第一集合的元素数量与第二集合的元素数量的比值确定为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度,其中,所述第一集合为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的交集,所述第二集合为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的并集。
4.根据权利要求1所述的方法,其中,所述服务商下的最大频繁项集数量为至少一个;
计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度,包括:
构建与最大频繁项集数量相同的候选团伙,每个候选团伙分别对应所述服务商下的一个最大频繁项集;
分别计算买家对应的交易特征信息项集与各个候选团伙对应的最大频繁项集的相似度;
若存在所述相似度超过第一阈值的买家,将所述服务商确定为虚假交易团伙的成员,包括:
将买家归入相似度最高的候选团伙;
对于任一候选团伙,若所述候选团伙中存在所述相似度超过第一阈值的买家,将所述候选团伙确定为虚假交易团伙,并将所述服务商确定为虚假交易团伙的成员。
5.根据权利要求4所述的方法,其中,对于任一候选团伙,若所述候选团伙中存在所述相似度超过第一阈值的买家,将所述候选团伙确定为虚假交易团伙,并将所述服务商确定为虚假交易团伙的成员,包括:
对于任一候选团伙,若所述候选团伙中存在所述相似度超过第一阈值的买家,将所述候选团伙确定为虚假交易团伙,并将所述服务商、所述候选团伙下相似度超过第一阈值的买家、以及与所述虚假交易团伙中的买家完成过交易的卖家确定为所述虚假交易团伙的成员。
6.根据权利要求1所述的方法,其中,获取预设时间段内服务商下买家对应的交易特征信息项集,包括:
获取预设时间段内服务商下符合识别要求的买家对应的交易特征信息项集,其中,所述符合识别要求的买家为所述预设时间段内交易的卖家数量小于第二阈值的买家。
7.根据权利要求1所述的方法,其中,所述交易特征信息为买家的交易金额或与所述买家交易的卖家。
8.一种虚假交易团伙识别设备,其中,该设备包括:
信息获取模块,用于获取预设时间段内服务商下买家对应的交易特征信息项集,其中,所述交易特征信息项集的元素为对应的买家所完成的交易的交易特征信息;所述交易特征信息为用于反映所述交易的特点的信息;
计算处理模块,用于根据所述交易特征信息项集,获取所述服务商下的最大频繁项集,以及计算买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度;
识别模块,用于在判断存在所述相似度超过第一阈值的买家时,将所述服务商确定为虚假交易团伙的成员;
其中,所述服务商用于促成所述买家与卖家之间的所述交易。
9.根据权利要求8所述的设备,其中,所述识别模块,还用于将所述相似度超过第一阈值的买家,以及与所述买家完成过交易的卖家确定为虚假交易团伙的成员。
10.根据权利要求8所述的设备,其中,所述计算处理模块,用于将第一集合的元素数量与第二集合的元素数量的比值确定为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的相似度,其中,所述第一集合为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的交集,所述第二集合为买家对应的交易特征信息项集与所述服务商下的最大频繁项集的并集。
11.根据权利要求8所述的设备,其中,所述服务商下的最大频繁项集数量为至少一个;
所述计算处理模块,用于构建与最大频繁项集数量相同的候选团伙,每个候选团伙分别对应所述服务商下的一个最大频繁项集;分别计算买家对应的交易特征信息项集与各个候选团伙对应的最大频繁项集的相似度;
所述识别模块,用于将买家归入相似度最高的候选团伙;对于任一候选团伙,若所述候选团伙中存在所述相似度超过第一阈值的买家,将所述候选团伙确定为虚假交易团伙,并将所述服务商确定为虚假交易团伙的成员。
12.根据权利要求11所述的设备,其中,所述识别模块,用于对于任一候选团伙,若所述候选团伙中存在所述相似度超过第一阈值的买家,将所述候选团伙确定为虚假交易团伙,并将所述服务商、所述候选团伙下相似度超过第一阈值的买家、以及与所述虚假交易团伙中的买家完成过交易的卖家确定为所述虚假交易团伙的成员。
13.根据权利要求8所述的设备,其中,所述信息获取模块,用于获取预设时间段内服务商下符合识别要求的买家对应的交易特征信息项集,其中,所述符合识别要求的买家为所述预设时间段内交易的卖家数量小于第二阈值的买家。
14.根据权利要求8所述的设备,其中,所述交易特征信息为买家的交易金额或与所述买家交易的卖家。
15.一种计算设备,其中,该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发所述设备执行权利要求1至7中任一项所述的方法。
16.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至7中任一项所述的方法。
CN201910963294.0A 2019-10-11 2019-10-11 虚假交易团伙识别方法、设备及计算机可读介质 Active CN110874786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910963294.0A CN110874786B (zh) 2019-10-11 2019-10-11 虚假交易团伙识别方法、设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910963294.0A CN110874786B (zh) 2019-10-11 2019-10-11 虚假交易团伙识别方法、设备及计算机可读介质

Publications (2)

Publication Number Publication Date
CN110874786A CN110874786A (zh) 2020-03-10
CN110874786B true CN110874786B (zh) 2022-10-18

Family

ID=69717801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910963294.0A Active CN110874786B (zh) 2019-10-11 2019-10-11 虚假交易团伙识别方法、设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN110874786B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582886B (zh) * 2020-05-07 2022-06-21 支付宝(杭州)信息技术有限公司 虚假资源转移的识别方法、装置、设备及介质
CN111340509B (zh) * 2020-05-22 2020-08-21 支付宝(杭州)信息技术有限公司 一种虚假交易识别方法、装置及电子设备
CN112926998B (zh) * 2021-03-24 2022-05-06 支付宝(杭州)信息技术有限公司 作弊识别方法和装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5724573A (en) * 1995-12-22 1998-03-03 International Business Machines Corporation Method and system for mining quantitative association rules in large relational tables
CN103927398A (zh) * 2014-05-07 2014-07-16 中国人民解放军信息工程大学 基于最大频繁项集挖掘的微博炒作群体发现方法
US20140303993A1 (en) * 2013-04-08 2014-10-09 Unisys Corporation Systems and methods for identifying fraud in transactions committed by a cohort of fraudsters
CN105719155A (zh) * 2015-09-14 2016-06-29 南京理工大学 一种基于Apriori改进算法的关联规则算法
CN105847302A (zh) * 2016-05-31 2016-08-10 北京奇艺世纪科技有限公司 一种异常检测方法及装置
CN106503086A (zh) * 2016-10-11 2017-03-15 成都云麒麟软件有限公司 分布式局部离群点的检测方法
CN106910101A (zh) * 2016-07-21 2017-06-30 阿里巴巴集团控股有限公司 群体虚假交易识别方法及装置
CN108830655A (zh) * 2018-06-19 2018-11-16 郑州云海信息技术有限公司 一种用户操作关系获取方法及相关装置
CN109102151A (zh) * 2018-07-03 2018-12-28 阿里巴巴集团控股有限公司 一种可疑群组识别方法和装置
CN109191107A (zh) * 2018-06-29 2019-01-11 阿里巴巴集团控股有限公司 交易异常识别方法、装置以及设备
CN110033170A (zh) * 2019-03-14 2019-07-19 阿里巴巴集团控股有限公司 识别风险商家的方法及装置
CN110060053A (zh) * 2019-01-30 2019-07-26 阿里巴巴集团控股有限公司 一种识别方法、设备及计算机可读介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5724573A (en) * 1995-12-22 1998-03-03 International Business Machines Corporation Method and system for mining quantitative association rules in large relational tables
US20140303993A1 (en) * 2013-04-08 2014-10-09 Unisys Corporation Systems and methods for identifying fraud in transactions committed by a cohort of fraudsters
CN103927398A (zh) * 2014-05-07 2014-07-16 中国人民解放军信息工程大学 基于最大频繁项集挖掘的微博炒作群体发现方法
CN105719155A (zh) * 2015-09-14 2016-06-29 南京理工大学 一种基于Apriori改进算法的关联规则算法
CN105847302A (zh) * 2016-05-31 2016-08-10 北京奇艺世纪科技有限公司 一种异常检测方法及装置
CN106910101A (zh) * 2016-07-21 2017-06-30 阿里巴巴集团控股有限公司 群体虚假交易识别方法及装置
CN106503086A (zh) * 2016-10-11 2017-03-15 成都云麒麟软件有限公司 分布式局部离群点的检测方法
CN108830655A (zh) * 2018-06-19 2018-11-16 郑州云海信息技术有限公司 一种用户操作关系获取方法及相关装置
CN109191107A (zh) * 2018-06-29 2019-01-11 阿里巴巴集团控股有限公司 交易异常识别方法、装置以及设备
CN109102151A (zh) * 2018-07-03 2018-12-28 阿里巴巴集团控股有限公司 一种可疑群组识别方法和装置
CN110060053A (zh) * 2019-01-30 2019-07-26 阿里巴巴集团控股有限公司 一种识别方法、设备及计算机可读介质
CN110033170A (zh) * 2019-03-14 2019-07-19 阿里巴巴集团控股有限公司 识别风险商家的方法及装置

Also Published As

Publication number Publication date
CN110874786A (zh) 2020-03-10

Similar Documents

Publication Publication Date Title
CN109978538B (zh) 确定欺诈用户、训练模型、识别欺诈风险的方法及装置
CN110874786B (zh) 虚假交易团伙识别方法、设备及计算机可读介质
US10489372B2 (en) Data storage methods, query methods, and apparatuses thereof
TWI673666B (zh) 資料風險控制的方法及裝置
CN109102151B (zh) 一种可疑群组识别方法和装置
JP2020177670A (ja) 情報推奨方法、情報推奨装置、機器および媒体
JP5965911B2 (ja) オンライン取引プラットフォームに基づくデータ処理
CN110060053B (zh) 一种识别方法、设备及计算机可读介质
WO2019169978A1 (zh) 资源推荐方法及装置
US11823026B2 (en) Artificial intelligence system employing graph convolutional networks for analyzing multi-entity-type multi-relational data
CN104574126A (zh) 一种用户特征识别方法及装置
WO2017148272A1 (zh) 一种目标用户的识别方法和装置
WO2016144540A1 (en) Visualizing performance, performing advanced analytics, and invoking actions with respect to a financial institution
US20230053063A1 (en) Statistics-aware sub-graph query engine
CN112434884A (zh) 一种供应商分类画像的建立方法及装置
WO2019144808A1 (zh) 判定虚假资源转移及虚假交易的方法、装置及电子设备
CN109542785A (zh) 一种无效bug确定方法和装置
CN112330373A (zh) 用户行为分析方法、装置及计算机可读存储介质
CN110659308B (zh) 一种数据清算处理方法及装置
CN111681099A (zh) 产品信息推送方法、装置、计算机设备及可读存储介质
CN111143546A (zh) 一种获得推荐语的方法、装置及电子设备
CN111126788A (zh) 风险识别方法及装置和电子设备
Nangoy et al. Analysis of chatbot-based image classification on Social Commerce line@ platform
CN111598638A (zh) 点击率确定方法、装置及设备
CN114943563A (zh) 一种权益推送方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant