CN108062674B - 基于gps的订单欺诈识别方法、***、存储介质和电子设备 - Google Patents

基于gps的订单欺诈识别方法、***、存储介质和电子设备 Download PDF

Info

Publication number
CN108062674B
CN108062674B CN201711499022.7A CN201711499022A CN108062674B CN 108062674 B CN108062674 B CN 108062674B CN 201711499022 A CN201711499022 A CN 201711499022A CN 108062674 B CN108062674 B CN 108062674B
Authority
CN
China
Prior art keywords
gps
order
fraud
orders
positioning area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711499022.7A
Other languages
English (en)
Other versions
CN108062674A (zh
Inventor
袁帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Ctrip Business Co Ltd
Original Assignee
Shanghai Ctrip Business Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Ctrip Business Co Ltd filed Critical Shanghai Ctrip Business Co Ltd
Priority to CN201711499022.7A priority Critical patent/CN108062674B/zh
Publication of CN108062674A publication Critical patent/CN108062674A/zh
Application granted granted Critical
Publication of CN108062674B publication Critical patent/CN108062674B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

本发明提供一种基于GPS的订单欺诈识别方法、***、存储介质和电子设备,方法包括:根据网站内已完成订单的GPS坐标分布,将世界地图划分成多个GPS网格定位区域;在每个GPS网格定位区域内,分别获取历史订单和近期订单;在每个GPS网格定位区域内,计算每个特征变量的信息价值;筛选出信息价值高于预设阈值的特征变量,进行模型训练,得到针对每个GPS网格定位区域的各自独立的欺诈识别模型;实时获取新增订单及其GPS坐标,定位新增订单所在的GPS网格定位区域,采用该GPS网格定位区域的欺诈识别模型,对新增订单进行欺诈识别。本发明使用对GPS坐标划分网格的方法,降低了传统使用统一模型进行欺诈识别的成本,加强了对频繁更换用户特征的欺诈交易的辨识能力。

Description

基于GPS的订单欺诈识别方法、***、存储介质和电子设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种基于GPS的订单欺诈识别方法、***、存储介质和电子设备。
背景技术
在“互联网+”大环境的良性驱动下,在线票务预订业务不断发展、产品服务越来越多样化,随之而来的欺诈行为也越来越多。不法分子使用盗取的账户和非法取得的***信息在网站购买产品,对网站以及其他消费者造成了损失。
在现有技术下,网站通常会利用规则/模型对这些欺诈交易进行识别,在不影响正常客户体验的情况下阻拦欺诈交易,防止资损,实现既能保护用户在网站平台的资金安全又能提高用户在线支付的安全感。
通过分析,发明人发现,通常不法分子在获取用户银行卡/账户安全信息后,都会在被盗用户感知之前全力进行销赃,考虑到犯罪成本以及手段高低的不同,同一人作案或同一团伙作案大多会留下相同的用户特征。传统反欺诈规则/模型对欺诈订单的识别,会依赖用户特征维度的变量,例如基于账户维度、设备维度、银行卡维度等维度产生的变量。伴随着支付风控与不法分子对抗的不断升级,欺诈分子技术手段不断提高,从而频繁变换用户特征或伪造用户特征的成本也越来越低,传统反欺诈规则/模型对于此类欺诈交易的辨识难度增加。然而对于团伙欺诈分子而言,作案地点相对固定,更换或增加作案地点必然会增加其作案成本,而这部分成本无法通过技术手段降低,若使用模拟GPS点位则会增加其作案成本而且也容易被识别出来,所以精准的GPS信息可以帮助我们有效地识别欺诈交易的发生地。
可见,结合GPS信息进行欺诈识别,是风控识别领域的发展方向。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
针对现有技术中的缺陷,本发明要解决的问题在于,如何结合交易历史数据以及GPS定位数据,对GPS坐标进行网格划分并结合二分类算法设计出一款有效的欺诈交易识别方案。
根据本发明的一个方面,提供一种基于GPS的订单欺诈识别方法,所述方法包括:获取网站内所有已完成订单,提取每个已完成订单的特征变量和该已完成订单发生的GPS坐标,根据所有已完成订单的GPS坐标分布,将世界地图划分成多个GPS网格定位区域;在每个GPS网格定位区域内,预设当前时间点之前的第一时间点,筛选出该第一时间点之前的已完成订单,作为该GPS网格定位区域的历史订单,每个GPS网格定位区域的历史订单包含历史欺诈订单和历史非欺诈订单;在每个GPS网格定位区域内,预设当前时间点之前的第二时间点,筛选出该第二时间点至当前时间点之间的已完成订单,作为该GPS网格定位区域的近期订单,每个GPS网格定位区域的近期订单包含近期欺诈订单和近期非欺诈订单;在每个GPS网格定位区域内,基于各特征变量分别在近期欺诈订单、近期非欺诈订单、历史欺诈订单和历史非欺诈订单中的取值的差异度,计算每个特征变量的信息价值;筛选出信息价值高于该GPS网格定位区域内的预设阈值的特征变量,利用筛选出的特征变量进行模型训练,得到针对每个GPS网格定位区域的各自独立的欺诈识别模型;实时获取新增订单及其GPS坐标,根据新增订单的GPS坐标定位该新增订单所在的GPS网格定位区域,采用该GPS网格定位区域的欺诈识别模型,对所述新增订单进行欺诈识别。
优选地,计算每个特征变量的信息价值的公式为:
Figure BDA0001530983340000021
Figure BDA0001530983340000022
IV为特征变量的信息价值,N为特征变量将近期订单与历史订单区分开的差异度类别,i的不同取值对应不同类别的差异度,
Figure BDA0001530983340000023
代表在i类别下的欺诈订单占该GPS网格定位区域的所有欺诈订单的比例,
Figure BDA0001530983340000024
代表在i类别下的非欺诈订单占该GPS网格定位区域的所有非欺诈订单的比例,WOEi代表在i类别下的该特征变量的权重值,WOEi的计算公式为:
Figure BDA0001530983340000031
i=1,2,...,N。
优选地,所述N等于2,i取1时对应该特征变量将该GPS网格定位区域内的近期订单与历史订单区分开的差异度大于等于预设的差异度阈值,i取2时对应该特征变量将该GPS网格定位区域内的近期订单与历史订单区分开的差异度小于差异度阈值。
优选地,将世界地图划分成多个该GPS网格定位区域时,已完成订单的GPS坐标分布密集的GPS网格定位区域的面积小于已完成订单的GPS坐标分布稀疏的GPS网格定位区域的面积。
优选地,所述第二时间点等于所述第一时间点,或所述第二时间点早于所述第一时间点。
优选地,所述欺诈识别模型为二分类算法模型。
优选地,所述欺诈识别模型包括决策树模型、逻辑回归模型、贝叶斯模型中的至少一个。
根据本发明的另一个方面,提供一种基于GPS的订单欺诈识别***,所述***包括:网格划分模块,获取网站内所有已完成订单,提取每个已完成订单的特征变量和该已完成订单发生的GPS坐标,根据所有已完成订单的GPS坐标分布,将世界地图划分成多个GPS网格定位区域;历史订单模块,在每个GPS网格定位区域内,预设当前时间点之前的第一时间点,筛选出该第一时间点之前的已完成订单,作为该GPS网格定位区域的历史订单,每个GPS网格定位区域的历史订单包含历史欺诈订单和历史非欺诈订单;近期订单模块,在每个GPS网格定位区域内,预设当前时间点之前的第二时间点,筛选出该第二时间点至当前时间点之间的已完成订单,作为该GPS网格定位区域的近期订单,每个GPS网格定位区域的近期订单包含近期欺诈订单和近期非欺诈订单;变量处理模块,在每个GPS网格定位区域内,基于各特征变量分别在近期欺诈订单、近期非欺诈订单、历史欺诈订单和历史非欺诈订单中的取值的差异度,计算每个特征变量的信息价值;模型训练模块,筛选出信息价值高于该GPS网格定位区域内的预设阈值的特征变量,利用筛选出的特征变量进行模型训练,得到针对每个GPS网格定位区域的各自独立的欺诈识别模型;欺诈识别模块,实时获取新增订单及其GPS坐标,根据新增订单的GPS坐标定位该新增订单所在的GPS网格定位区域,采用该GPS网格定位区域的欺诈识别模型,对所述新增订单进行欺诈识别。
根据本发明的另一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的基于GPS的订单欺诈识别方法的步骤。
根据本发明的另一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述的基于GPS的订单欺诈识别方法的步骤。
有鉴于此,本发明与现有技术相比的有益效果在于:本发明通过精分用户GPS定位的网格化,分析该网格交易特征,通过观察该网格内的每笔交易的特征是否与历史群体特征有显著差异,以及该网格历史交易是否有欺诈特征,形成针对每个GPS网格定位区域的欺诈识别模型。从而对新增订单进行欺诈识别时,直接采用其对应的GPS网格定位区域的欺诈识别模型进行针对性识别,准确度更高,可以最大限度识别并阻止欺诈交易发生,保护用户财产安全,降低资金损失,提升用户支付安全感。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明示例性实施例中一种基于GPS的订单欺诈识别方法的流程示意图;
图2示出本发明示例性实施例中一种GPS网格定位区域的划分示意图;
图3示出本发明示例性实施例中一种计算机可读存储介质的示意图;
图4示出本发明示例性实施例中一种电子设备的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出实施例中基于GPS的订单欺诈识别方法的步骤示意图。参照图1所示,本实施例的基于GPS的订单欺诈识别方法包括:
步骤S101、获取网站内所有已完成订单,提取每个已完成订单的特征变量和该已完成订单发生的GPS坐标,根据所有已完成订单的GPS坐标分布,将世界地图划分成多个GPS网格定位区域。
当使用较高精度的GPS定位信息时(依据GPS经纬度精确到具体的一个点),绝大多数的样本量过于稀松不利于建模,模型的准确性也会受限于GPS信息采集的准确性,欺诈分子每次作案地点的细微差别就有可能会导致模型效果降低;若使用传统数学聚类方法,虽可以避免上述几个问题,但这样就需要计算所有点与点之间的距离,计算量巨大,在现有技术条件下,成本无法承受;而如果使用低精度的GPS信息(例如精确到某市的某个区),则无法有效地反映出欺诈交易与普通交易的差异。
因此,本发明基于订单数据以及GPS信息,将GPS经纬度进行网格化,通过观察用户GPS定位所在网格当前交易行为以及结合历史该网格交易状况进行比对分析,分析各项结果作为输入,通过使用二分类算法训练出来的模型对交易欺诈可能性加以判别。以期实现当欺诈分子频繁变换、伪造或使用全新用户特征时,不影响该方法对交易欺诈判断的准确性。同时,对GPS经纬度进行网格化,通过调整网格大小,保留了GPS经纬度有效信息的同时减少了计算成本,而且对GPS经纬度采集有一定容错范围。
具体的,针对已完成订单的GPS坐标分布进行网格划分时,根据GPS经纬度对世界地图进行网格划分,将世界地图视作一个完整的二维空间,每一个GPS坐标视作二维空间上的一个点,保证划分的每一个网格区间都是封闭的且相邻网格之间不存在交叉或缝隙,每一个网格内的二维空间都是连续的,每一个GPS坐标都只属于唯一的一个网格。对于交易高发地区,例如城市商业区、机场、车站等地方,网格范围适当缩小,对于交易低频或者没有交易地区,网格范围适当放大。
参照图2所示,为根据所有已完成订单的GPS坐标分布,将世界地图(图中未示意出世界地图的具体信息)划分成多个GPS网格定位区域20的示意图。根据历史交易数据在地图上标记GPS位置,其中黑色圆点201为已完成订单被识别为欺诈交易的GPS定位点。在划分时,可以根据已完成订单的GPS坐标分布的实际情况进行针对性划分,使得GPS坐标分布密集的GPS网格定位区域的面积小于GPS坐标分布稀疏的GPS网格定位区域的面积。
步骤S102、在每个GPS网格定位区域内,预设当前时间点之前的第一时间点,筛选出该第一时间点之前的已完成订单,作为该GPS网格定位区域的历史订单,每个GPS网格定位区域的历史订单包含历史欺诈订单和历史非欺诈订单。步骤S103、在每个GPS网格定位区域内,预设当前时间点之前的第二时间点,筛选出该第二时间点至当前时间点之间的已完成订单,作为该GPS网格定位区域的近期订单,每个GPS网格定位区域的近期订单包含近期欺诈订单和近期非欺诈订单。其中,第二时间点可以等于或早于第一时间点。
所有的已完成订单是否属于欺诈均是已被识别的,具体是从交易订单维度对请求数据打上标签,一部分标签来源于风控人员在进行交易审核时,认定为欺诈的订单,另一部分标签则来源于银行或第三方支付公司的反馈。针对欺诈订单,可以依据其作案手段大致对标签进行分类,例如盗用***为国外还是国内,是否有结合盗用账户行为等等。因同一团伙作案手段基本大致相同且作案地点有规律可循,同一GPS网格定位区域内重复作案的基本可以认定为同一团伙,所以对作案手段分类可以帮助我们更精准地识别欺诈订单。对划分好的GPS网格定位区域内的订单数据进行统计,对于非欺诈订单,根据业务类型分类统计汇总,例如订单产线、出发地、目的地、价格等,对于欺诈订单,根据欺诈标签分类统计汇总。将数据汇总到每个自然日维度,每个订单与该订单所属GPS网格定位区域在该订单请求之前的统计数据进行关联(为保证模型线上效果与线下效果差异在可接受范围内,不能使用当时还未发生的数据进行建模,且需要考虑实际生产运用时数据的时效性),将每个GPS网格定位区域的近期订单数据与历史订单数据进行比对(近期订单与历史订单的时间区间可以根据业务周期划分,二者也可以有交叉区间),记录比对结果。
步骤S104、在每个GPS网格定位区域内,基于各特征变量分别在近期欺诈订单、近期非欺诈订单、历史欺诈订单和历史非欺诈订单中的取值的差异度,计算每个特征变量的信息价值。具体的,计算每个特征变量的信息价值的公式为:
Figure BDA0001530983340000071
IV为特征变量的信息价值,N为特征变量将近期订单与历史订单区分开的差异度类别,i的不同取值对应不同类别的差异度,
Figure BDA0001530983340000072
代表在i类别下的欺诈订单占该GPS网格定位区域的所有欺诈订单的比例,
Figure BDA0001530983340000073
代表在i类别下的非欺诈订单占该GPS网格定位区域的所有非欺诈订单的比例,WOEi代表在i类别下的该特征变量的权重值,WOEi的计算公式为:
Figure BDA0001530983340000074
在本实施例中,N等于2,i取1时对应该特征变量将该GPS网格定位区域内的近期订单与历史订单区分开的差异度大于等于预设的差异度阈值,i取2时对应该特征变量将该GPS网格定位区域内的近期订单与历史订单区分开的差异度小于差异度阈值。
具体的,设立模型目标标记,若订单为欺诈订单则标记为1,非欺诈订单标记为0。将每个GPS网格定位区域统计的历史数据、近期数据、历史数据与近期数据对比结果作为变量,使用Information Value(信息价值,简称IV)方法计算特征变量的信息价值并筛选特征变量。
Figure BDA0001530983340000081
Figure BDA0001530983340000082
计算特征变量重要性表格:
1(欺诈订单) 0(非欺诈订单)
1(近期订单与历史订单差异>阈值) 0.8 0.3
0(近期订单与历史订单差异<阈值) 0.2 0.7
上述表格中数字代表同一特征变量不同分类在欺诈订单或非欺诈订单中的占比,每一列纵向表格内的值相加等于1,例如近期订单与历史订单相比差异大于阈值的订单,占所有欺诈订单的80%(这里只是举例说明,真实的特征变量及分类会比近期订单是否与历史订单差异很大要更复杂、更精确)。
计算该特征变量的WOE值:
Figure BDA0001530983340000083
计算该特征变量的IV值:
Figure BDA0001530983340000084
按照上述方法,对所有特征变量计算IV值,并根据IV值由大到小排序对特征变量进行排序,IV值较大的特征变量代表该特征变量对于欺诈订单的区分能力比较强,计算较强IV值的特征变量之间的关联关系,去除关联关系较强但IV值较低的特征变量,保留剩下IV值较高的特征变量。
步骤S105、筛选出信息价值高于该GPS网格定位区域内的预设阈值的特征变量,利用筛选出的特征变量进行模型训练,得到针对每个GPS网格定位区域的各自独立的欺诈识别模型。
利用上一步中筛选出来的特征变量进行模型训练,具体的算法可以通过模型训练后的结果评估选择合适的二分类算法,例如决策树、逻辑回归、贝叶斯等等,可以是一个模型也可以是多个模型,模型结果对每笔订单进行打分,打分高低代表着预测该订单可能是欺诈订单的概率。通过形成各个GPS网格定位区域的各自独立的欺诈识别模型,后续可以基于新增订单的GPS定位更有针对性地识别欺诈。
以朴素贝叶斯模型为例,已知贝叶斯定理如下:
Figure BDA0001530983340000091
此处,设立目标项Y0=0代表非欺诈订单,Y1=1代表欺诈订单。
在步骤S104中筛选出来的变量为每个订单不同维度的特征属性,由于此处使用贝叶斯定理,所以需要尽量保证各变量之间相互独立。例如筛选出如下3个变量:x1:GPS网格定位区域内历史每日成交订单量,x2:GPS网格定位区域是否靠近景区,x3:GPS网格定位区域内历史是否发生过批量欺诈。然后对变量进行分类:a1j:{x1=0,0<x1<100,x1>=100},a2j:{x2=0(否),x2=1(是)},a3j:{x3=0(否),x3=1(是)},a1j代表x1属于第j个分类。抽取训练样本并统计每个特征属性对应欺诈订单与非欺诈订单的频率:P(Y0),P(Y1),P(a1j|Y0),P(a2j|Y0),P(a3j|Y0),P(a1j|Y1),P(a2j|Y1),P(a3j|Y1)。设X={a1j,a2j,a3j}为待分类订单,则该订单的欺诈系数为:R1=P(Y1)P(X|Y1)=P(Y1)P(a1j|Y1)P(a2j|Y1)P(a3j|Y1),非欺诈系数为:R0=P(Y0)P(X|Y0)=P(Y0)P(a1j|Y0)P(a2j|Y0)P(a3j|Y0)。当R1>R0时,则认为该订单为欺诈订单,反之则认为该订单为非欺诈订单。
步骤S106、实时获取新增订单及其GPS坐标,根据新增订单的GPS坐标定位该新增订单所在的GPS网格定位区域,采用该GPS网格定位区域的欺诈识别模型,对新增订单进行欺诈识别。
具体的,各个GPS网格定位区域的各自独立的欺诈识别模型可用于实时支付拦截:对模型结果设立阈值,根据模型判断订单欺诈概率划分阈值,根据实际业务需求以及操作成本确定每个阈值的范围,每个订单都会对应唯一的阈值,对于欺诈可能性最高的那部分订单进行实时拦截,模型判断模棱两可的订单则转至人工审核,余下的订单则不予干涉。
进一步的,各个GPS网格定位区域的各自独立的欺诈识别模型还可用于支付成功欺诈订单止损:对于少数疑似订单激增或当前交易行为与历史交易行为反差较大的GPS网格定位区域,可以反查该GPS网格定位区域近期已支付成功但还未真正消费的订单,若新发现欺诈订单,则可以采取止损措施,降低盗损。
另外,对于历史团伙欺诈案件聚类:对于传统团伙案件研究,需要订单有相同的用户特征才能将批量的案件归于同一团伙所为,而在一定时间范围内,同一GPS网格定位区域或相邻GPS网格定位区域内的欺诈订单基本可以确立为同一团伙所为,有助于团伙欺诈案件的特征提取。
而且,以往互联网支付欺诈案件在向警方报案时,提供案件信息有限,且很难提供出有明确指向犯罪嫌疑人身份或作案地点等破案信息,所以警方对于案件侦查成本极高,而目前GPS网格定位区域可以很轻松地精确到方圆50米范围内的地方,为警方破案提供了关键的线索。
综上,本实施例使用对GPS坐标划分网格的方法,降低了传统使用GPS信息进行计算的计算成本,使得GPS相关变量可以支持风控***线上实时调用;使用本发明进行风险交易识别,提高了风控***对于欺诈订单识别的准确性,加强了对频繁更换用户特征的欺诈交易的辨识能力,减少了团伙案件研究时案件订单分类以及团伙特征提取的成本,同时也降低欺诈带来的资损。通过构建GPS网格,在保留GPS坐标信息有效性的同时,客观地将一定区域内的坐标进行聚类,使得历史数据统计更加方便,降低了相关变量的计算成本,风控特征提取更加高效,从而可以支持风控***线上实时调用,对欺诈订单实时拦截或报警;将GPS相关变量带入适合的二分类算法进行模型训练,模型结果对于欺诈交易的识别不再依赖传统用户特征维度变量,也就意味着对于频繁变换、伪造或使用全新用户特征的欺诈交易有更强的辨识能力。
本发明还提供一种基于GPS的订单欺诈识别***,包括:
网格划分模块,获取网站内所有已完成订单,提取每个已完成订单的特征变量和该已完成订单发生的GPS坐标,根据所有已完成订单的GPS坐标分布,将世界地图划分成多个GPS网格定位区域。历史订单模块,在每个GPS网格定位区域内,预设当前时间点之前的第一时间点,筛选出该第一时间点之前的已完成订单,作为该GPS网格定位区域的历史订单,每个GPS网格定位区域的历史订单包含历史欺诈订单和历史非欺诈订单。近期订单模块,在每个GPS网格定位区域内,预设当前时间点之前的第二时间点,筛选出该第二时间点至当前时间点之间的已完成订单,作为该GPS网格定位区域的近期订单,每个GPS网格定位区域的近期订单包含近期欺诈订单和近期非欺诈订单。变量处理模块,在每个GPS网格定位区域内,基于各特征变量分别在近期欺诈订单、近期非欺诈订单、历史欺诈订单和历史非欺诈订单中的取值的差异度,计算每个特征变量的信息价值。模型训练模块,筛选出信息价值高于该GPS网格定位区域内的预设阈值的特征变量,利用筛选出的特征变量进行模型训练,得到针对每个GPS网格定位区域的各自独立的欺诈识别模型。欺诈识别模块,实时获取新增订单及其GPS坐标,根据新增订单的GPS坐标定位该新增订单所在的GPS网格定位区域,采用该GPS网格定位区域的欺诈识别模型,对新增订单进行欺诈识别。
其中,各个模块的工作原理以及步骤流程均已在上述方法实施例中阐述,因此不再赘述。
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被例如处理器执行时可以实现上述任意一个实施例中所述基于GPS的订单欺诈识别方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述基于GPS的订单欺诈识别方法描述的根据本发明各种示例性实施方式的步骤。
参考图3所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品300,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
所述程序产品300可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本发明的示例性实施例中,还提供一种电子设备,该电子设备可以包括处理器,以及用于存储所述处理器的可执行指令的存储器。其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一个实施例中所述基于GPS的订单欺诈识别方法的步骤。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为***、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
下面参照图4来描述根据本发明的这种实施方式的电子设备400。图4显示的电子设备400仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400以通用计算设备的形式表现。电子设备400的组件可以包括但不限于:至少一个处理单元410、至少一个存储单元420、连接不同***组件(包括存储单元420和处理单元410)的总线430、显示单元440等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元410执行,使得所述处理单元410执行本说明书上述基于GPS的订单欺诈识别方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元410可以执行如图1中所示的步骤。
所述存储单元420可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)4201和/或高速缓存存储单元4202,还可以进一步包括只读存储单元(ROM)4203。
所述存储单元420还可以包括具有一组(至少一个)程序模块4205的程序/实用工具4204,这样的程序模块4205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线430可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备400也可以与一个或多个外部设备500(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备400交互的设备通信,和/或与使得该电子设备400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口450进行。并且,电子设备400还可以通过网络适配器460与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器460可以通过总线430与电子设备400的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明实施方式的上述基于GPS的订单欺诈识别方法。
综上,本发明的基于GPS的订单欺诈识别方法、***、存储介质和电子设备,基于已完成订单数据构建GPS网格,在保留GPS坐标信息有效性的同时,客观地将一定区域内的坐标进行聚类,使得历史数据统计更加方便,降低了相关变量的计算成本,风控特征提取更加高效,从而可以支持风控***线上实时调用,对欺诈订单实时拦截或报警;将GPS相关变量带入适合的二分类算法进行模型训练,模型结果对于欺诈交易的识别不再依赖传统用户特征维度变量,使得对于频繁变换、伪造或使用全新用户特征的欺诈交易有更强的辨识能力。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。

Claims (7)

1.一种基于GPS的订单欺诈识别方法,其特征在于,所述方法包括:
获取网站内所有已完成订单,提取每个已完成订单的特征变量和该已完成订单发生的GPS坐标,根据所有已完成订单的GPS坐标分布,将世界地图划分成多个GPS网格定位区域;
在每个GPS网格定位区域内,预设当前时间点之前的第一时间点,筛选出该第一时间点之前的已完成订单,作为该GPS网格定位区域的历史订单,每个GPS网格定位区域的历史订单包含历史欺诈订单和历史非欺诈订单;
在每个GPS网格定位区域内,预设当前时间点之前的第二时间点,所述第二时间点等于或早于所述第一时间点,筛选出该第二时间点至当前时间点之间的已完成订单,作为该GPS网格定位区域的近期订单,每个GPS网格定位区域的近期订单包含近期欺诈订单和近期非欺诈订单;
在每个GPS网格定位区域内,基于各特征变量分别在近期欺诈订单、近期非欺诈订单、历史欺诈订单和历史非欺诈订单中的取值的差异度,计算每个特征变量的信息价值IV,
Figure FDA0002571603550000011
N为特征变量将近期订单与历史订单区分开的差异度类别,N等于2;i的不同取值对应不同类别的差异度,i取1时对应该特征变量将该GPS网格定位区域内的近期订单与历史订单区分开的差异度大于等于预设的差异度阈值,i取2时对应该特征变量将该GPS网格定位区域内的近期订单与历史订单区分开的差异度小于差异度阈值;
Figure FDA0002571603550000012
代表在i类别下的欺诈订单占该GPS网格定位区域的所有欺诈订单的比例,
Figure FDA0002571603550000013
代表在i类别下的非欺诈订单占该GPS网格定位区域的所有非欺诈订单的比例,WOEi代表在i类别下的该特征变量的权重值,WOEi的计算公式为:
Figure FDA0002571603550000014
i=1,2…,N;
筛选出信息价值高于该GPS网格定位区域内的预设阈值的特征变量,利用筛选出的特征变量进行模型训练,得到针对每个GPS网格定位区域的各自独立的欺诈识别模型;
实时获取新增订单及其GPS坐标,根据新增订单的GPS坐标定位该新增订单所在的GPS网格定位区域,采用该GPS网格定位区域的欺诈识别模型,对所述新增订单进行欺诈识别。
2.如权利要求1所述的基于GPS的订单欺诈识别方法,其特征在于,将世界地图划分成多个GPS网格定位区域时,已完成订单的GPS坐标分布密集的GPS网格定位区域的面积小于已完成订单的GPS坐标分布稀疏的GPS网格定位区域的面积。
3.如权利要求1所述的基于GPS的订单欺诈识别方法,其特征在于,所述欺诈识别模型为二分类算法模型。
4.如权利要求3所述的基于GPS的订单欺诈识别方法,其特征在于,所述欺诈识别模型包括决策树模型、逻辑回归模型、贝叶斯模型中的至少一个。
5.一种基于GPS的订单欺诈识别***,其特征在于,所述***包括:
网格划分模块,获取网站内所有已完成订单,提取每个已完成订单的特征变量和该已完成订单发生的GPS坐标,根据所有已完成订单的GPS坐标分布,将世界地图划分成多个GPS网格定位区域;
历史订单模块,在每个GPS网格定位区域内,预设当前时间点之前的第一时间点,筛选出该第一时间点之前的已完成订单,作为该GPS网格定位区域的历史订单,每个GPS网格定位区域的历史订单包含历史欺诈订单和历史非欺诈订单;
近期订单模块,在每个GPS网格定位区域内,预设当前时间点之前的第二时间点,所述第二时间点等于或早于所述第一时间点,筛选出该第二时间点至当前时间点之间的已完成订单,作为该GPS网格定位区域的近期订单,每个GPS网格定位区域的近期订单包含近期欺诈订单和近期非欺诈订单;
变量处理模块,在每个GPS网格定位区域内,基于各特征变量分别在近期欺诈订单、近期非欺诈订单、历史欺诈订单和历史非欺诈订单中的取值的差异度,计算每个特征变量的信息价值IV,
Figure FDA0002571603550000021
N为特征变量将近期订单与历史订单区分开的差异度类别,N等于2;i的不同取值对应不同类别的差异度,i取1时对应该特征变量将该GPS网格定位区域内的近期订单与历史订单区分开的差异度大于等于预设的差异度阈值,i取2时对应该特征变量将该GPS网格定位区域内的近期订单与历史订单区分开的差异度小于差异度阈值;
Figure FDA0002571603550000031
代表在i类别下的欺诈订单占该GPS网格定位区域的所有欺诈订单的比例,
Figure FDA0002571603550000032
代表在i类别下的非欺诈订单占该GPS网格定位区域的所有非欺诈订单的比例,WOEi代表在i类别下的该特征变量的权重值,WOEi的计算公式为:
Figure FDA0002571603550000033
i=1,2…,N;
模型训练模块,筛选出信息价值高于该GPS网格定位区域内的预设阈值的特征变量,利用筛选出的特征变量进行模型训练,得到针对每个GPS网格定位区域的各自独立的欺诈识别模型;
欺诈识别模块,实时获取新增订单及其GPS坐标,根据新增订单的GPS坐标定位该新增订单所在的GPS网格定位区域,采用该GPS网格定位区域的欺诈识别模型,对所述新增订单进行欺诈识别。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~4任一项所述的基于GPS的订单欺诈识别方法的步骤。
7.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~4任一项所述的基于GPS的订单欺诈识别方法的步骤。
CN201711499022.7A 2017-12-28 2017-12-28 基于gps的订单欺诈识别方法、***、存储介质和电子设备 Active CN108062674B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711499022.7A CN108062674B (zh) 2017-12-28 2017-12-28 基于gps的订单欺诈识别方法、***、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711499022.7A CN108062674B (zh) 2017-12-28 2017-12-28 基于gps的订单欺诈识别方法、***、存储介质和电子设备

Publications (2)

Publication Number Publication Date
CN108062674A CN108062674A (zh) 2018-05-22
CN108062674B true CN108062674B (zh) 2020-09-08

Family

ID=62140668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711499022.7A Active CN108062674B (zh) 2017-12-28 2017-12-28 基于gps的订单欺诈识别方法、***、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN108062674B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109118119A (zh) * 2018-09-06 2019-01-01 多点生活(成都)科技有限公司 风控模型生成方法及装置
US11467605B2 (en) * 2019-04-10 2022-10-11 Deere & Company Zonal machine control
CN110992072A (zh) * 2018-11-30 2020-04-10 北京嘀嘀无限科技发展有限公司 异常订单预测方法和***
CN109741065A (zh) * 2019-01-28 2019-05-10 广州虎牙信息科技有限公司 一种支付风险识别方法、装置、设备及存储介质
CN110490608B (zh) * 2019-07-12 2022-05-10 招联消费金融有限公司 风险评估方法、装置、计算机设备和存储介质
CN110633991A (zh) * 2019-09-20 2019-12-31 阿里巴巴集团控股有限公司 风险识别方法、装置和电子设备
CN110827117A (zh) * 2019-10-17 2020-02-21 北京互金新融科技有限公司 订单行为识别方法、装置、存储介质和处理器
CN111078900B (zh) * 2019-11-19 2023-10-10 口碑(上海)信息技术有限公司 一种数据的风险识别方法及***
CN112465522B (zh) * 2020-11-26 2022-07-01 江苏满运物流信息有限公司 一种虚假订单识别方法、装置、电子设备及存储介质
CN113781156A (zh) * 2021-05-13 2021-12-10 北京沃东天骏信息技术有限公司 恶意订单的识别方法、模型的训练方法、设备及存储介质
CN113554281A (zh) * 2021-07-02 2021-10-26 北京淇瑀信息科技有限公司 基于网格的用户业务风险的分析方法、装置和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279868A (zh) * 2013-05-22 2013-09-04 兰亭集势有限公司 一种自动识别欺诈订单的方法和装置
CN103678659A (zh) * 2013-12-24 2014-03-26 焦点科技股份有限公司 一种基于随机森林算法的电子商务网站欺诈用户识别方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8145562B2 (en) * 2009-03-09 2012-03-27 Moshe Wasserblat Apparatus and method for fraud prevention

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279868A (zh) * 2013-05-22 2013-09-04 兰亭集势有限公司 一种自动识别欺诈订单的方法和装置
CN103678659A (zh) * 2013-12-24 2014-03-26 焦点科技股份有限公司 一种基于随机森林算法的电子商务网站欺诈用户识别方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
时空犯罪热点预测模型研究;陈鹏等;《***仿真学报》;20110930;第23卷(第9期);正文第1783页第1-3段 *

Also Published As

Publication number Publication date
CN108062674A (zh) 2018-05-22

Similar Documents

Publication Publication Date Title
CN108062674B (zh) 基于gps的订单欺诈识别方法、***、存储介质和电子设备
US20220114676A1 (en) Methods and systems for automatically detecting fraud and compliance issues in expense reports and invoices
US20170262852A1 (en) Database monitoring system
CN109035003A (zh) 基于机器学习的反欺诈模型建模方法和反欺诈监控方法
EP2555153A1 (en) Financial activity monitoring system
US11151569B2 (en) Systems and methods for improved detection of network fraud events
US20200211020A1 (en) Systems and methods for improved detection of network fraud events
CN110659961A (zh) 一种用于识别线下商户的方法和装置
US20210312452A1 (en) Systems and methods real-time institution analysis based on message traffic
CN104321794A (zh) 一种使用多维评级来确定一实体的未来商业可行性的***和方法
CN111144697A (zh) 数据处理方法、装置、存储介质及电子设备
CN112990386B (zh) 用户价值聚类方法、装置、计算机设备和存储介质
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
AU2022379544A1 (en) Systems and methods for improved detection of network attacks
CN115204881A (zh) 一种数据处理方法、装置、设备及存储介质
CN116664306A (zh) 风控规则的智能推荐方法、装置、电子设备及介质
CN115809930A (zh) 基于数据融合匹配的反欺诈分析方法、装置、设备及介质
Shah Developing financial distress prediction models using cutting edge recursive partitioning techniques: a study of Australian mining performance
CN114626863A (zh) 出口骗税企业的检测方法、装置、设备及存储介质
CN114862560A (zh) 一种汽车反欺诈风险识别方法及其相关设备
CN114331463A (zh) 基于线性回归模型的风险识别方法及其相关设备
CN113420789A (zh) 一种预测风险账号的方法、装置、存储介质和计算机设备
Wang et al. A deep neural network based financial statement fraud detection model: Evidence from China
CN109800947B (zh) 基于机器学习的贷款业务处理方法、装置、计算机设备
Takahashi et al. An Efficient Method of Characterization of the Bad Debt Customers in the Mail Order Industry

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant