CN112116378A - 作弊概率确定方法、装置、电子设备及存储介质 - Google Patents
作弊概率确定方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112116378A CN112116378A CN202010815103.9A CN202010815103A CN112116378A CN 112116378 A CN112116378 A CN 112116378A CN 202010815103 A CN202010815103 A CN 202010815103A CN 112116378 A CN112116378 A CN 112116378A
- Authority
- CN
- China
- Prior art keywords
- order
- cheating
- processed
- target
- cheating probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000006399 behavior Effects 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 9
- 230000000875 corresponding effect Effects 0.000 description 62
- 238000010586 diagram Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0225—Avoiding frauds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0236—Incentive or reward received by requiring registration or ID from user
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
- G06Q30/0637—Approvals
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开的实施例提供了一种作弊概率确定方法、装置、电子设备及存储介质。所述方法包括:获取多个待处理订单,及每个所述待处理订单关联的特征数据集;根据各所述特征数据集之间的关联关系,对所述多个待处理订单进行群组划分,生成订单群组;根据所述订单群组对应的作弊概率,确定所述多个待处理订单中的目标订单对应的目标作弊概率。本公开实施例可以提高作弊检测的准确率和召回率。
Description
技术领域
本公开的实施例涉及订单处理技术领域,尤其涉及一种作弊概率确定方法、装置、电子设备及存储介质。
背景技术
当前互联网行业为培养用户消费习惯,常以各种营销形式对新老用户进行补贴,从而催生一批职业黄牛刷手利用技术手段模拟新设备批量注册新客账户、或在网络上发布真人众包刷单招聘的方式,非法获取各种补贴,给互联网公司带来巨大损失。
业内主流的反作弊识别方式是在用户注册、交易等环节采集设备指纹、环境信息、用户行为等信息,基于人工构建的规则或有监督模型对单个订单作弊概率进行预测和判定。当用户使用促销被判定为作弊时,***会拦截该笔交易来减少公司损失。
业内主要的反作弊检测方法是对单个用户及订单的多维度特征进行刻画和总结,并基于历史识别的作弊用户黑样本做预测和分类,这种方法的缺点在于需要大量的黑白训练样本,无法在新场景上快速启动。且由于作弊攻击手法的不断变化模型会持续退化,导致准确率和召回率下降。
发明内容
本公开的实施例提供一种作弊概率确定方法、装置、电子设备及存储介质,用以提高作弊检测的准确率和召回率。
根据本公开的实施例的第一方面,提供了一种作弊概率确定方法,包括:
获取多个待处理订单,及每个所述待处理订单关联的特征数据集;
根据各所述特征数据集之间的关联关系,对所述多个待处理订单进行群组划分,生成订单群组;
根据所述订单群组对应的作弊概率,确定所述多个待处理订单中的目标订单对应的目标作弊概率。
可选地,所述获取多个待处理订单,及每个所述待处理订单关联的特征数据集,包括:
获取每个所述待处理订单关联的设备信息和登录环境信息;
获取每个所述待处理订单关联的用户基础信息、用户行为信息和业务数据信息;
根据所述设备信息、所述登录环境信息、所述用户基础信息、所述用户行为信息和所述业务数据信息,生成每个所述待处理订单关联的特征数据集。
可选地,所述根据各所述特征数据集之间的关联关系,对所述多个待处理订单进行群组划分,生成订单群组,包括:
对各所述特征数据集进行去异常处理,生成处理后的特征数据集;
获取所述处理后的特征数据集中任意两个特征之间的关联关系,及每个特征对应的特征熵值;
根据所述关联关系和所述特征熵值,对所述处理后的特征数据集进行群组划分,生成所述订单群组。
可选地,所述根据所述订单群组对应的作弊概率,确定所述多个待处理订单中的目标订单对应的目标作弊概率,包括:
基于历史作弊数据,确定所述订单群组对应的作弊概率;
获取所述目标订单出现于所述订单群组中的至少一个订单群组;
根据所述至少一个订单群组对应的作弊概率,确定所述目标订单的目标作弊概率。
可选地,所述根据所述至少一个订单群组对应的作弊概率,确定所述目标订单的目标作弊概率,包括:
获取所述至少一个订单群组对应的作弊概率中的最大值;
将所述最大值作为所述目标作弊概率。
可选地,所述根据所述至少一个订单群组对应的作弊概率,确定所述目标订单的目标作弊概率,包括:
获取所述至少一个订单群组对应的作弊概率的作弊概率均值;
将所述作弊概率均值作为所述目标作弊概率。
根据本公开的实施例的第二方面,提供了一种作弊概率确定装置,包括:
特征数据集获取模块,用于获取多个待处理订单,及每个所述待处理订单关联的特征数据集;
订单群组生成模块,用于根据各所述特征数据集之间的关联关系,对所述多个待处理订单进行群组划分,生成订单群组;
目标作弊概率确定模块,用于根据所述订单群组对应的作弊概率,确定所述多个待处理订单中的目标订单对应的目标作弊概率。
可选地,所述特征数据集获取模块包括:
设备环境信息获取单元,用于获取每个所述待处理订单关联的设备信息和登录环境信息;
行为业务信息获取单元,用于获取每个所述待处理订单关联的用户基础信息、用户行为信息和业务数据信息;
特征数据集生成单元,用于根据所述设备信息、所述登录环境信息、所述用户基础信息、所述用户行为信息和所述业务数据信息,生成每个所述待处理订单关联的特征数据集。
可选地,所述订单群组生成模块包括:
处理数据集生成单元,用于对各所述特征数据集进行去异常处理,生成处理后的特征数据集;
特征熵值获取单元,用于获取所述处理后的特征数据集中任意两个特征之间的关联关系,及每个特征对应的特征熵值;
订单群组生成单元,用于根据所述关联关系和所述特征熵值,对所述处理后的特征数据集进行群组划分,生成所述订单群组。
可选地,所述目标作弊概率确定模块包括:
作弊概率确定单元,用于基于历史作弊数据,确定所述订单群组对应的作弊概率;
订单群组获取单元,用于获取所述目标订单出现于所述订单群组中的至少一个订单群组;
目标作弊概率确定单元,用于根据所述至少一个订单群组对应的作弊概率,确定所述目标订单的目标作弊概率。
可选地,所述目标作弊概率确定单元包括:
最大值获取子单元,用于获取所述至少一个订单群组对应的作弊概率中的最大值;
第一概率获取子单元,用于将所述最大值作为所述目标作弊概率。
可选地,所述目标作弊概率确定单元包括:
概率均值获取子单元,用于获取所述至少一个订单群组对应的作弊概率的作弊概率均值;
第二概率获取子单元,用于将所述作弊概率均值作为所述目标作弊概率。
根据本公开的实施例的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的作弊概率确定方法。
根据本公开的实施例的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项所述的作弊概率确定方法。
本公开的实施例提供的作弊概率确定方案,通过获取多个待处理订单,及每个待处理订单关联的特征数据集,根据各特征数据集之间的关联关系,对多个待处理订单进行群组划分,生成订单群组,根据订单群组对应的作弊概率,确定多个待处理订单中的目标订单对应的目标作弊概率。本公开的实施例通过将订单的特征归纳为群组,从而将小概率风险事件对应的风险特征包含在群组拓扑结构内进行表示,从而实现高准确率和高召回率的作弊检测。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种作弊概率确定方法的步骤流程图;
图2为本公开实施例提供的另一种作弊概率确定方法的步骤流程图;
图3为本公开实施例提供的一种作弊概率确定装置的结构示意图;
图4为本公开实施例提供的另一种作弊概率确定装置的结构示意图。
具体实施方式
下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
实施例一
参照图1,示出了本公开实施例提供的一种作弊概率确定方法的步骤流程图,如图1所示,该作弊概率确定方法具体可以包括如下步骤:
步骤101:获取多个待处理订单,及每个所述待处理订单关联的特征数据集。
本公开实施例可以应用于对订单的作弊概率进行预测的场景中。
待处理订单是指需要进行作弊概率预测的订单。
在本实施例中,待处理订单可以是针对某些事件发起的订单,例如,在用户发起营销事件如领取优惠券、提交、支付订单,可以将这些订单视为待处理订单等。
特征数据集是指与每个待处理订单关联的特征构成的数据集,在本实施例中,每个待处理订单关联的特征可以分为基础特征和业务特征等,如基础特征可以包括:用户发起订单的设备信息、环境信息,设备信息又可以包括设备型号、分辨率、内核版本等。环境信息又可以包括用户接入网络的IP地址、定位经纬度、基站及蜂窝类型等。
业务特征可以包括:用户基础信息、业务端数据等,用户基础信息是指用户ID、注册账号号段、支付账号、支付通道等信息,业务端数据是指购买商品、购买商家、使用优惠券ID等数据。
步骤102:根据各所述特征数据集之间的关联关系,对所述多个待处理订单进行群组划分,生成订单群组。
订单群组是指根据特征数据集中各订单特征的关联关系进行群组划分,得到的一个或多个群组。
在获取各待处理订单对应的特征数据集之后,可以根据特征数据集中的订单特征之间的关联关系及特征类型对至少一个特征数据集中的订单特征进行分组,以生成订单群组。
对于具体地群组划分方式将在下述实施例二中进行详细描述,本实施例在此不再加以赘述。
在根据各特征数据集之间的关联关系,对多个待处理订单进行群组划分生成订单群组之后,执行步骤103。
步骤103:根据所述订单群组对应的作弊概率,确定所述多个待处理订单中的目标订单对应的目标作弊概率。
作弊概率是指订单群组的作弊概率。
目标订单是指多个待处理订单中需要进行作弊概率预测的订单,在本实施例中,目标订单可以为一个订单,也可以为多个订单,具体地,可以根据业务需求而定,本实施例对此不加以限制。
目标作弊概率是指待处理订单中某个或某几个订单的作弊概率。
在根据各特征数据集之间的关联关系,对多个待处理订单进行群组划分生成订单群组之后,可以结合历史作弊数据对订单群组进行分析,以对订单群组进行作弊识别,得到订单群组对应的作弊概率。
在识别得到订单群组对应的作弊概率之后,可以获取多个待处理订单中的目标订单,根据目标订单在订单群组中出现的概率,结合订单群组的作弊概率,确定出目标订单的目标作弊概率。
本实施例通过无监督方法将特征归纳为群组,从而将小概率风险事件对应的风险特征包含在群组拓扑结构内进行表示,再利用有监督模型对群组中业务特行分类,从而实现高准召、低退化的作弊检测。
本公开实施例提供的作弊概率确定方法,通过获取多个待处理订单,及每个待处理订单关联的特征数据集,根据各特征数据集之间的关联关系,对多个待处理订单进行群组划分,生成订单群组,根据订单群组对应的作弊概率,确定多个待处理订单中的目标订单对应的目标作弊概率。本公开的实施例通过将订单的特征归纳为群组,从而将小概率风险事件对应的风险特征包含在群组拓扑结构内进行表示,从而实现高准确率和高召回率的作弊检测。
实施例二
参照图2,示出了本公开实施例提供的另一种作弊概率确定方法的步骤流程图,如图2所示,该作弊概率确定方法具体可以包括如下步骤:
步骤201:获取每个所述待处理订单关联的设备信息和登录环境信息。
本公开实施例可以应用于对订单的作弊概率进行预测的场景中。
待处理订单是指需要进行作弊概率预测的订单。
在本实施例中,待处理订单可以是针对某些事件发起的订单,例如,在用户发起营销事件如领取优惠券、提交、支付订单,可以将这些订单视为待处理订单等。
设备信息是指用户发起待处理订单所使用的设备相关信息,如设备型号、分辨率、内核版本等。
登录环境信息是指用户发起待处理订单时登录设备的环境信息,如用户接入网络的IP地址、定位经纬度、基站及蜂窝类型等。
在获取多个待处理订单之后,可以获取每个待处理订单关联的设备信息和登录环境信息。
步骤202:获取每个所述待处理订单关联的用户基础信息、用户行为信息和业务数据信息。
用户基础信息是指发起待处理订单的用户基础信息,如用户ID、注册账号号段、支付账号、支付通道等信息。
用户行为信息是指用户发起待处理订单的行为信息,如支付行为、领取优惠券行为、提交支付行为等信息。
业务数据信息是指发起的待处理订单的业务信息,如购买商品、购买商家、使用优惠券ID等信息。
在获取多个待处理订单之后,可以获取每个待处理订单关联的用户基础信息、用户行为信息和业务数据信息。
步骤203:根据所述设备信息、所述登录环境信息、所述用户基础信息、所述用户行为信息和所述业务数据信息,生成每个所述待处理订单关联的特征数据集。
在获取每个待处理订单关联的设备信息、登录环境信息、用户基础信息、用户行为信息和业务数据信息之后,可以结合这些信息组成每个待处理订单所对应的特征数据集。
在生成每个待处理订单关联的特征数据集之后,执行步骤204。
步骤204:对各所述特征数据集进行去异常处理,生成处理后的特征数据集。
在生成每个待处理订单关联的特征数据集之后,可以对每个待处理订单的特征数据集进行去异常处理,以生成处理后的特征数据集,具体地,在获取每个待处理订单的特征数据集之后,可以对特征数据集中的订单特征进行特征提取,并处理其中的异常值,如空值、非法值等,在特征数据集中剔除这些异常值,从而可以得到每个待处理订单对应的处理后的特征数据集。
在对各特征数据集进行去异常处理生成处理后的特征数据集之后,执行步骤205。
步骤205:获取所述处理后的特征数据集中任意两个特征之间的关联关系,及每个特征对应的特征熵值。
在获取处理后的特征数据集之后,可以根据处理后的特征数据集构造特征矩阵,并计算各特征的特征熵值。
然后根据构造的特征矩阵计算两两订单特征之间的互信息(即两两订单特征之间的特征相关性)。
在获取处理后的特征数据集中任意两个特征之间的关联关系,及每个特征对应的特征熵值之后,执行步骤206。
步骤206:根据所述关联关系和所述特征熵值,对所述处理后的特征数据集进行群组划分,生成所述订单群组。
在获取处理后的特征数据集中任意两个特征之间的关联关系,及每个特征对应的特征熵值之后,可以根据关联关系和特征熵值对特征数据集进行群组划分,以生成订单群组,具体地,可以根据特征熵值和关联关系去掉强关联特征:如果多个特征强关联,保留特征熵值最大的一个特征。然后基于每个特征的类型和熵值选择合适的无监督算法进行分组,其中低熵特征可以通过条件概率公式得到多个特征组合下出现概率,该特征组合可以被看做一个高熵特征。例如ip、设备型号、安装渠道单独来看均为低熵特征,三个特征可以被构造为一组“相同ip+设备型号+安装渠道”特征组,该特征组合则成为高熵特征。
以每个订单为图中的节点,以单独高熵特征或组合高熵特征为边,构建订单关联关系的图网络。通过联通子图划分、社区发现等图算法得到订单群组,并给该群组赋予全局唯一群组ID值作为标识。然后,可以计算每个群组ID下包含的业务统计特征、群组拓扑特征。其中业务统计特征为:群组内商户数、商家ID熵、下单平均距离、新用户占比等;群组拓扑特征为:群组密度,群组节点数量,群组边数量,节点类型,边类型等。
在根据关联关系和特征熵值对处理后的特征数据集进行群组划分,生成订单群组之后,执行步骤207。
步骤207:基于历史作弊数据,确定所述订单群组对应的作弊概率。
通过对历史作弊数据分析可以发现,作弊用户为实现批量转售及流通,在业务特征上必然存在攻击指向性,例如集中出现在特定商家、购买特定商品、集中使用相同一批次抵用券等。基于历史作弊案例分析,抽象出群组维度的所有订单对应的业务统计特征,例如:群组拓扑特征、群组使用优惠活动ID熵、群组包含商家数等,对群组的作弊行为进行描述。并在此基础上进行群组的作弊识别,具体地:
1、通过分析利用各个业务特征筛选组合构建规则,进行作弊群组的识别,以确定订单群组对应的作弊概率;
2、通过规则和人工分析积累一定样本后,基于已经提取的群组特征和黑白样本,使用树模型、深度学习模型等方法构建群组分类模型,模型输出结果为订单群组作弊的概率。
在基于历史作弊数据确定订单群组对应的作弊概率之后,执行步骤208。
步骤208:获取所述目标订单出现于所述订单群组中的至少一个订单群组。
目标订单是指多个待处理订单中的需要进行作弊概率预测的订单。在本实施例中,目标订单可以为一个订单,也可以为多个订单,具体地,可以根据业务需求而定,本实施例对此不加以限制。
至少一个订单群组是指订单群组中目标订单出现的群组。
在获取目标订单之后,可以识别该目标订单出现的至少一个订单群组,进而,执行步骤209。
步骤209:根据所述至少一个订单群组对应的作弊概率,确定所述目标订单的目标作弊概率。
在获取目标订单出现的至少一个订单群组之后,可以根据至少一个订单群组对应的作弊概率,确定出目标订单的目标作弊概率,具体地,可以分为以下两种方式:
1、获取至少一个订单群组对应的作弊概率中的最大值,并将该最大值作为目标订单的目标作弊概率。
2、获取至少一个订单去租对应的作弊概率的作弊概率均值,并将该作弊概率均值作为目标订单的目标作弊概率。
本公开实施例提供的作弊概率确定方法,通过获取多个待处理订单,及每个待处理订单关联的特征数据集,根据各特征数据集之间的关联关系,对多个待处理订单进行群组划分,生成订单群组,根据订单群组对应的作弊概率,确定多个待处理订单中的目标订单对应的目标作弊概率。本公开的实施例通过将订单的特征归纳为群组,从而将小概率风险事件对应的风险特征包含在群组拓扑结构内进行表示,从而实现高准确率和高召回率的作弊检测。
实施例三
参照图3,示出了本公开实施例提供的一种作弊概率确定装置的结构示意图,如图3所示,该作弊概率确定装置具体可以包括如下模块:
特征数据集获取模块310,用于获取多个待处理订单,及每个所述待处理订单关联的特征数据集;
订单群组生成模块320,用于根据各所述特征数据集之间的关联关系,对所述多个待处理订单进行群组划分,生成订单群组;
目标作弊概率确定模块330,用于根据所述订单群组对应的作弊概率,确定所述多个待处理订单中的目标订单对应的目标作弊概率。
本公开实施例提供的作弊概率确定装置,通过获取多个待处理订单,及每个待处理订单关联的特征数据集,根据各特征数据集之间的关联关系,对多个待处理订单进行群组划分,生成订单群组,根据订单群组对应的作弊概率,确定多个待处理订单中的目标订单对应的目标作弊概率。本公开的实施例通过将订单的特征归纳为群组,从而将小概率风险事件对应的风险特征包含在群组拓扑结构内进行表示,从而实现高准确率和高召回率的作弊检测。
实施例四
参照图4,示出了本公开实施例提供的另一种作弊概率确定装置的结构示意图,如图4所示,该作弊概率确定装置具体可以包括如下模块:
特征数据集获取模块410,用于获取多个待处理订单,及每个所述待处理订单关联的特征数据集;
订单群组生成模块420,用于根据各所述特征数据集之间的关联关系,对所述多个待处理订单进行群组划分,生成订单群组;
目标作弊概率确定模块430,用于根据所述订单群组对应的作弊概率,确定所述多个待处理订单中的目标订单对应的目标作弊概率。
可选地,所述特征数据集获取模块410包括:
设备环境信息获取单元411,用于获取每个所述待处理订单关联的设备信息和登录环境信息;
行为业务信息获取单元412,用于获取每个所述待处理订单关联的用户基础信息、用户行为信息和业务数据信息;
特征数据集生成单元413,用于根据所述设备信息、所述登录环境信息、所述用户基础信息、所述用户行为信息和所述业务数据信息,生成每个所述待处理订单关联的特征数据集。
可选地,所述订单群组生成模块420包括:
处理数据集生成单元421,用于对各所述特征数据集进行去异常处理,生成处理后的特征数据集;
特征熵值获取单元422,用于获取所述处理后的特征数据集中任意两个特征之间的关联关系,及每个特征对应的特征熵值;
订单群组生成单元423,用于根据所述关联关系和所述特征熵值,对所述处理后的特征数据集进行群组划分,生成所述订单群组。
可选地,所述目标作弊概率确定模块430包括:
作弊概率确定单元431,用于基于历史作弊数据,确定所述订单群组对应的作弊概率;
订单群组获取单元432,用于获取所述目标订单出现于所述订单群组中的至少一个订单群组;
目标作弊概率确定单元433,用于根据所述至少一个订单群组对应的作弊概率,确定所述目标订单的目标作弊概率。
可选地,所述目标作弊概率确定单元433包括:
最大值获取子单元,用于获取所述至少一个订单群组对应的作弊概率中的最大值;
第一概率获取子单元,用于将所述最大值作为所述目标作弊概率。
可选地,所述目标作弊概率确定单元433包括:
概率均值获取子单元,用于获取所述至少一个订单群组对应的作弊概率的作弊概率均值;
第二概率获取子单元,用于将所述作弊概率均值作为所述目标作弊概率。
本公开实施例提供的作弊概率确定装置,通过获取多个待处理订单,及每个待处理订单关联的特征数据集,根据各特征数据集之间的关联关系,对多个待处理订单进行群组划分,生成订单群组,根据订单群组对应的作弊概率,确定多个待处理订单中的目标订单对应的目标作弊概率。本公开的实施例通过将订单的特征归纳为群组,从而将小概率风险事件对应的风险特征包含在群组拓扑结构内进行表示,从而实现高准确率和高召回率的作弊检测。
本公开的实施例还提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述实施例的作弊概率确定方法。
本公开的实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的作弊概率确定方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。
Claims (14)
1.一种作弊概率确定方法,其特征在于,包括:
获取多个待处理订单,及每个所述待处理订单关联的特征数据集;
根据各所述特征数据集之间的关联关系,对所述多个待处理订单进行群组划分,生成订单群组;
根据所述订单群组对应的作弊概率,确定所述多个待处理订单中的目标订单对应的目标作弊概率。
2.根据权利要求1所述的方法,其特征在于,所述获取多个待处理订单,及每个所述待处理订单关联的特征数据集,包括:
获取每个所述待处理订单关联的设备信息和登录环境信息;
获取每个所述待处理订单关联的用户基础信息、用户行为信息和业务数据信息;
根据所述设备信息、所述登录环境信息、所述用户基础信息、所述用户行为信息和所述业务数据信息,生成每个所述待处理订单关联的特征数据集。
3.根据权利要求1所述的方法,其特征在于,所述根据各所述特征数据集之间的关联关系,对所述多个待处理订单进行群组划分,生成订单群组,包括:
对各所述特征数据集进行去异常处理,生成处理后的特征数据集;
获取所述处理后的特征数据集中任意两个特征之间的关联关系,及每个特征对应的特征熵值;
根据所述关联关系和所述特征熵值,对所述处理后的特征数据集进行群组划分,生成所述订单群组。
4.根据权利要求1所述的方法,其特征在于,所述根据所述订单群组对应的作弊概率,确定所述多个待处理订单中的目标订单对应的目标作弊概率,包括:
基于历史作弊数据,确定所述订单群组对应的作弊概率;
获取所述目标订单出现于所述订单群组中的至少一个订单群组;
根据所述至少一个订单群组对应的作弊概率,确定所述目标订单的目标作弊概率。
5.根据权利要求4所述的方法,其特征在于,所述根据所述至少一个订单群组对应的作弊概率,确定所述目标订单的目标作弊概率,包括:
获取所述至少一个订单群组对应的作弊概率中的最大值;
将所述最大值作为所述目标作弊概率。
6.根据权利要求5所述的方法,其特征在于,所述根据所述至少一个订单群组对应的作弊概率,确定所述目标订单的目标作弊概率,包括:
获取所述至少一个订单群组对应的作弊概率的作弊概率均值;
将所述作弊概率均值作为所述目标作弊概率。
7.一种作弊概率确定装置,其特征在于,包括:
特征数据集获取模块,用于获取多个待处理订单,及每个所述待处理订单关联的特征数据集;
订单群组生成模块,用于根据各所述特征数据集之间的关联关系,对所述多个待处理订单进行群组划分,生成订单群组;
目标作弊概率确定模块,用于根据所述订单群组对应的作弊概率,确定所述多个待处理订单中的目标订单对应的目标作弊概率。
8.根据权利要求7所述的装置,其特征在于,所述特征数据集获取模块包括:
设备环境信息获取单元,用于获取每个所述待处理订单关联的设备信息和登录环境信息;
行为业务信息获取单元,用于获取每个所述待处理订单关联的用户基础信息、用户行为信息和业务数据信息;
特征数据集生成单元,用于根据所述设备信息、所述登录环境信息、所述用户基础信息、所述用户行为信息和所述业务数据信息,生成每个所述待处理订单关联的特征数据集。
9.根据权利要求7所述的装置,其特征在于,所述订单群组生成模块包括:
处理数据集生成单元,用于对各所述特征数据集进行去异常处理,生成处理后的特征数据集;
特征熵值获取单元,用于获取所述处理后的特征数据集中任意两个特征之间的关联关系,及每个特征对应的特征熵值;
订单群组生成单元,用于根据所述关联关系和所述特征熵值,对所述处理后的特征数据集进行群组划分,生成所述订单群组。
10.根据权利要求7所述的装置,其特征在于,所述目标作弊概率确定模块包括:
作弊概率确定单元,用于基于历史作弊数据,确定所述订单群组对应的作弊概率;
订单群组获取单元,用于获取所述目标订单出现于所述订单群组中的至少一个订单群组;
目标作弊概率确定单元,用于根据所述至少一个订单群组对应的作弊概率,确定所述目标订单的目标作弊概率。
11.根据权利要求10所述的装置,其特征在于,所述目标作弊概率确定单元包括:
最大值获取子单元,用于获取所述至少一个订单群组对应的作弊概率中的最大值;
第一概率获取子单元,用于将所述最大值作为所述目标作弊概率。
12.根据权利要求10所述的装置,其特征在于,所述目标作弊概率确定单元包括:
概率均值获取子单元,用于获取所述至少一个订单群组对应的作弊概率的作弊概率均值;
第二概率获取子单元,用于将所述作弊概率均值作为所述目标作弊概率。
13.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至6任一项所述的作弊概率确定方法。
14.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1至6任一项所述的作弊概率确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010815103.9A CN112116378A (zh) | 2020-08-13 | 2020-08-13 | 作弊概率确定方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010815103.9A CN112116378A (zh) | 2020-08-13 | 2020-08-13 | 作弊概率确定方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112116378A true CN112116378A (zh) | 2020-12-22 |
Family
ID=73804128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010815103.9A Pending CN112116378A (zh) | 2020-08-13 | 2020-08-13 | 作弊概率确定方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112116378A (zh) |
-
2020
- 2020-08-13 CN CN202010815103.9A patent/CN112116378A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009915B (zh) | 一种欺诈用户社区的标记方法及相关装置 | |
CN107423613B (zh) | 依据相似度确定设备指纹的方法、装置及服务器 | |
US20210035126A1 (en) | Data processing method, system and computer device based on electronic payment behaviors | |
CN112837069B (zh) | 基于区块链与大数据的安全支付方法及云平台*** | |
CN105631049A (zh) | 一种识别诈骗短信的方法和*** | |
CN108961019B (zh) | 一种用户账户的检测方法和装置 | |
CN111090807A (zh) | 一种基于知识图谱的用户识别方法及装置 | |
CN112435137B (zh) | 一种基于社团挖掘的欺诈信息检测方法及*** | |
CN106709318A (zh) | 一种用户设备唯一性的识别方法、装置和计算设备 | |
CN112258254B (zh) | 基于大数据架构的互联网广告风险监测方法及*** | |
CN113792089B (zh) | 基于人工智能的非法行为检测方法、装置、设备及介质 | |
CN111242318A (zh) | 基于异构特征库的业务模型训练方法及装置 | |
CN112632609A (zh) | 异常检测方法、装置、电子设备及存储介质 | |
CN111091408A (zh) | 用户识别模型创建方法、装置与识别方法、装置 | |
CN112396079A (zh) | 号码识别模型训练方法、号码识别方法及装置 | |
CN111245815B (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN113065748A (zh) | 业务风险评估方法、装置、设备及存储介质 | |
CN109587248B (zh) | 用户识别方法、装置、服务器及存储介质 | |
CN112116378A (zh) | 作弊概率确定方法、装置、电子设备及存储介质 | |
CN114817518B (zh) | 基于大数据档案识别的证照办理方法、***及介质 | |
CN110855641B (zh) | 社区属性信息确定方法、装置及存储介质 | |
CN114218997A (zh) | 一种实验数据的分组方法、装置、介质及电子设备 | |
CN113706279A (zh) | 欺诈分析方法、装置、电子设备及存储介质 | |
CN112288528A (zh) | 恶意社群发现方法、装置、计算机设备和可读存储介质 | |
CN113822691A (zh) | 用户账号的识别方法、装置、***和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20201222 |
|
WD01 | Invention patent application deemed withdrawn after publication |