CN111126629A - 模型的生成方法、刷单行为识别方法、***、设备和介质 - Google Patents

模型的生成方法、刷单行为识别方法、***、设备和介质 Download PDF

Info

Publication number
CN111126629A
CN111126629A CN201911356516.9A CN201911356516A CN111126629A CN 111126629 A CN111126629 A CN 111126629A CN 201911356516 A CN201911356516 A CN 201911356516A CN 111126629 A CN111126629 A CN 111126629A
Authority
CN
China
Prior art keywords
order
orders
sample data
negative sample
brushing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911356516.9A
Other languages
English (en)
Other versions
CN111126629B (zh
Inventor
张艺颖
江文斌
李健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Ctrip International Travel Agency Co Ltd
Original Assignee
Shanghai Ctrip International Travel Agency Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Ctrip International Travel Agency Co Ltd filed Critical Shanghai Ctrip International Travel Agency Co Ltd
Priority to CN201911356516.9A priority Critical patent/CN111126629B/zh
Publication of CN111126629A publication Critical patent/CN111126629A/zh
Application granted granted Critical
Publication of CN111126629B publication Critical patent/CN111126629B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种模型的生成方法、刷单行为识别方法、***、设备和介质,模型的生成方法包括以下步骤:获取若干历史订单,基于所述历史订单构建模型数据;基于所述模型数据构建基础信息特征;基于刷单行为的趋同性和所述模型数据构建上下文信息特征;基于所述基础信息特征和所述上下文信息特征采用集成学习方法训练得到所述刷单行为识别模型。本发明能够识别出人工未知的刷单行为,进一步提高刷单识别的召回率。

Description

模型的生成方法、刷单行为识别方法、***、设备和介质
技术领域
本发明属于人工智能领域,特别涉及一种模型的生成方法、刷单行为识别方法、***、设备和介质。
背景技术
近年来,伴随着日益专业的刷单手段,在电子商务的各种应用场景下构建刷单识别***能够有效减少刷单行为给用户及平台带来的利益损失。
各种应用场景例如旅游场景下构建刷单识别***需要考虑多种复杂的因素。当前的刷单识别主要基于规则***,通过人工专家的领域知识经验,来制定不同规则用于识别存在刷单行为的异常订单。然而,规则***只考虑了历史上通过统计得到的刷单行为特点,而无法识别出人工未知的刷单行为;另外,随着刷单手法的不断提升与专业化,现有规则***需要进行不断地更新迭代,在此过程中会出现较多的漏抓、错抓。
发明内容
本发明要解决的技术问题是为了克服现有技术中基于规则***,通过人工专家的领域知识经验,来制定不同规则用于识别存在刷单行为的异常订单,无法识别出人工未知的刷单行为的缺陷,提供一种模型的生成方法、刷单行为识别方法、***、设备和介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供了一种刷单行为识别模型的生成方法,所述刷单行为识别模型的生成包括:
获取若干历史订单,基于所述历史订单构建模型数据;
基于所述模型数据构建基础信息特征;
基于刷单行为的趋同性和所述模型数据构建上下文信息特征;
基于所述基础信息特征和所述上下文信息特征采用集成学习方法训练得到所述刷单行为识别模型。
本方案中,通过构建模型数据及上下文信息特征,采用集成学习方法训练得到所述刷单行为识别模型,从而为实现识别刷单行为提供了准确的识别模型。
较佳地,所述基于刷单行为的趋同性和所述模型数据构建上下文信息特征的步骤包括:
每次从若干所述历史订单中获取一个作为当前订单,获取所述当前订单对应的产品和供应商;
获取所述产品的与所述当前订单邻近的N条所述历史订单作为第一待筛选订单;
获取所述供应商的与所述当前订单邻近的N条所述历史订单作为第二待筛选订单;
基于所述第一待筛选订单和所述第二待筛选订单计算符合预设筛选条件的订单比例和/或订单数,将所述订单比例和/或所述订单数作为所述上下文信息特征。
本方案中,提供了基于刷单行为的趋同性和所述模型数据构建上下文信息特征的步骤,解决了因各个维度的基础信息特征能够在一定程度上反映当前订单的信息,无法体现刷单行为的趋同性问题,提升了刷单行为识别模型训练的准确度。
较佳地,所述上下文信息特征包括硬件设备相同但用户名不同的订单数,支付类型相同的订单所占的订单比例,相似用户的订单所占的订单比例,手机号码和/或证件号码异常订单所占的订单比例中的至少一种。
本方案中,提供的四种上下文特征,仅为根据类型进行划分后的四类,但实际上下文特征总数大于四。
较佳地,当所述上下文信息特征包括所述支付类型相同的订单所占的订单比例和/或所述硬件设备相同但用户名不同的订单数时,所述支付类型相同的订单所占的订单比例的计算步骤和/或所述硬件设备相同但用户名不同的订单数的计算步骤均包括:
获取若干所述历史订单中的任意一个所述历史订单为当前订单,获取所述当前订单对应的产品和供应商;
将若干所述历史订单分别按照产品相同和供应商相同进行分组,以得到第一订单组和第二订单组;
从所述第一订单组和所述第二订单组中筛选出与所述当前订单的产品及供应商均相同的邻近N个订单,以得到第三订单组;
当所述上下文信息特征包括所述支付类型相同的订单所占的订单比例时,所述支付类型相同的订单所占的订单比例的计算步骤还包括:
在所述第三订单组中筛选出与所述当前订单的订单支付方式相同的n个订单;
根据上下文特征计算公式计算所述支付类型相同的订单所占的订单比例;
所述上下文特征计算公式如下:
Figure BDA0002336077040000031
其中,RsamePay表示所述支付类型相同的订单所占的订单比例;
当所述上下文信息特征包括所述硬件设备相同但用户名不同的订单数时,所述硬件设备相同但用户名不同的订单数的计算步骤还包括:
在所述第三订单组中筛选出与所述当前订单的硬件设备相同的订单,以得到第五订单组;
在所述第五订单组中统计所述用户名的个数作为所述硬件设备相同但用户名不同的订单数。
较佳地,所述获取若干历史订单,基于所述历史订单构建模型数据的步骤包括:
获取多种渠道的若干所述历史订单;
对每条所述历史订单打标签,以得到第一样本数据,所述打标签的结果包括刷单和非刷单;所述打标签的结果为刷单的所述第一样本数据为第一正样本数据,所述打标签的结果为非刷单的所述第一样本数据为第一负样本数据;
基于先验知识进行负样本扩充,以得到第二负样本数据;
将所述第二负样本数据与所述第一负样本数据合并,以得到第三负样本数据;
按照预设的正负样本比例,对所述第一正样本数据和所述第三负样本数据进行采样,以得到所述模型数据。
本方案中,对正负样本比例进行限制,解决了扩充负样本规模大的问题,得到了较优的模型数据。
较佳地,所述基于先验知识进行负样本扩充,以得到第二负样本数据的步骤包括:
从基础订单数据集中获取同时有低评分和投诉的订单作为所述第二负样本数据;
所述按照预设的正负样本比例,对所述第一正样本数据和所述第三负样本数据进行采样,以得到所述模型数据的步骤包括:
按比例限制的公式对所述第一正样本数据和所述第三负样本数据的比例进行限制;
所述比例限制的公式如下:
Figure BDA0002336077040000041
其中,Npos,Nneg,Nadd分别表示所述第一正样本数据的例数,所述第一负样本数据的例数,所述第二负样本数据的例数,neg2posRate表示所述第一正样本数据的例数与所述第三负样本数据的例数的比值,negSampleRate表示所述第一负样本数据的比例;
所述模型数据包括所述第一正样本数据和所述第三负样本数据。
较佳地,所述基于所述基础信息特征和所述上下文信息特征采用集成学习方法训练得到所述刷单行为识别模型的步骤包括:
基于所述基础信息特征和所述上下文信息特征采用集成学习方法中的XGBoost(Extreme Gradient Boosting,极端梯度提升)模型训练得到所述刷单行为识别模型。
本方案中,基于刷单订单的特征表现较为复杂,不同刷单手段具有不同的行为偏好,采用了XGBoost模型训练得到稳定且各方面表现较好的刷单行为识别模型。
本发明还提供了一种刷单行为识别方法,所述刷单行为识别方法包括:
获取待识别的订单数据;
将所述待识别的订单数据输入至刷单行为识别模型中进行识别,以得到刷单行为识别的结果;
所述刷单行为识别模型使用所述的刷单行为识别模型的生成方法生成。
本方案中,采用刷单行为识别模型的生成方法生成刷单行为识别模型,能够识别出人工未知的刷单行为,进一步提高刷单识别的召回率。
本发明还提供了一种刷单行为识别模型的生成***,所述刷单行为识别模型的生成***包括:
第一获取模块,用于获取若干历史订单,基于所述历史订单构建模型数据;
第一构建模块,用于基于所述模型数据构建基础信息特征;
第二构建模块,用于基于刷单行为的趋同性和所述模型数据构建上下文信息特征;
训练模块,用于基于所述基础信息特征和所述上下文信息特征采用集成学习方法训练得到所述刷单行为识别模型。
较佳地,所述第二构建模块包括:
第一获取单元,用于每次从若干所述历史订单中获取一个作为当前订单,获取所述当前订单对应的产品和供应商;
第二获取单元,用于获取所述产品的与所述当前订单邻近的N条所述历史订单作为第一待筛选订单;
第三获取单元,用于获取所述供应商的与所述当前订单邻近的N条所述历史订单作为第二待筛选订单;
筛选单元,用于基于所述第一待筛选订单和所述第二待筛选订单计算符合预设筛选条件的订单比例和/或订单数,将所述订单比例和/或所述订单数作为所述上下文信息特征。
较佳地,所述上下文信息特征包括硬件设备相同但用户名不同的订单数,支付类型相同的订单所占的订单比例,相似用户的订单所占的订单比例,手机号码和/或证件号码异常订单所占的订单比例中的至少一种。
较佳地,当所述上下文信息特征包括所述支付类型相同的订单所占的订单比例和/或所述硬件设备相同但用户名不同的订单数时,所述筛选单元包括对应的所述支付类型相同的订单所占的订单比例的计算子单元和/或所述硬件设备相同但用户名不同的订单数的计算子单元;所述筛选单元还包括预处理子单元;
所述预处理子单元用于获取若干所述历史订单中的任意一个所述历史订单为当前订单,获取所述当前订单对应的产品和供应商;将若干所述历史订单分别按照产品相同和供应商相同进行分组,以得到第一订单组和第二订单组;从所述第一订单组和所述第二订单组中筛选出与所述当前订单的产品及供应商均相同的邻近N个订单,以得到第三订单组;
所述支付类型相同的订单所占的订单比例的计算子单元用于在所述第三订单组中筛选出与所述当前订单的订单支付方式相同的n个订单;根据上下文特征计算公式计算所述支付类型相同的订单所占的订单比例;
所述上下文特征计算公式如下:
Figure BDA0002336077040000061
其中,RsamePay表示所述支付类型相同的订单所占的订单比例;
所述硬件设备相同但用户名不同的订单数的计算子单元用于在所述第三订单组中筛选出与所述当前订单的硬件设备相同的订单,以得到第五订单组;在所述第五订单组中统计用户名的个数作为所述硬件设备相同但用户名不同的订单数。
较佳地,所述第一构建模块包括:
第四获取单元用于获取多种渠道的若干所述历史订单;
打标签单元用于对每条所述历史订单打标签,以得到第一样本数据,所述打标签的结果包括刷单和非刷单;所述打标签的结果为刷单的所述第一样本数据为第一正样本数据,所述打标签的结果为非刷单的所述第一样本数据为第一负样本数据;
扩充单元用于基于先验知识进行负样本扩充,以得到第二负样本数据;
合并单元用于将所述第二负样本数据与所述第一负样本数据合并,以得到第三负样本数据;
采样单元用于按照预设的正负样本比例,对所述第一正样本数据和所述第三负样本数据进行采样,以得到所述模型数据。
较佳地,所述扩充单元还用于从基础订单数据集中获取同时有低评分和投诉的订单作为所述第二负样本数据;
所述采样单元还用于按比例限制的公式对所述第一正样本数据和所述第三负样本数据的比例进行限制;
所述比例限制的公式如下:
Figure BDA0002336077040000071
其中,Npos,Nneg,Nadd分别表示所述第一正样本数据的例数,所述第一负样本数据的例数,所述第二负样本数据的例数,neg2posRate表示所述第一正样本数据的例数与所述第三负样本数据的例数的比值,negSampleRate表示所述第一负样本数据的比例;
所述模型数据包括所述第一正样本数据和所述第三负样本数据。
较佳地,所述训练模块用于基于所述基础信息特征和所述上下文信息特征采用集成学习方法中的XGBoost模型训练得到所述刷单行为识别模型。
本发明还提供了一种刷单行为识别***,所述刷单行为识别***包括:
第二获取模块,用于获取待识别的订单数据;
识别模块,用于将所述待识别的订单数据输入至刷单行为识别模型中进行识别,以得到刷单行为识别的结果;
所述刷单行为识别模型使用前述刷单行为识别模型的生成***生成。
本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述的刷单行为识别模型的生成方法或刷单行为识别方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述的刷单行为识别模型的生成方法或刷单行为识别方法的步骤。
本发明的积极进步效果在于:本发明提供了一种模型的生成方法、刷单行为识别方法、***、设备和介质,通过模型数据的构建,模型特征的构建及模型构建和训练生成了一个刷单行为识别模型,进一步地,利用该模型能够识别刷单行为。对比基于规则***,通过人工专家的领域知识经验,来制定不同规则用于识别存在刷单行为的方法,本发明能够识别出人工未知的刷单行为,进一步提高刷单识别的召回率。
附图说明
图1为本发明实施例1的刷单行为识别模型的生成方法的流程图。
图2为本发明实施例1中步骤S103的流程图。
图3为本发明实施例1的支付类型相同的订单所占的订单比例的计算步骤的流程图。
图4为本发明实施例1的硬件设备相同但用户名不同的订单数的计算步骤的流程图。
图5为本发明实施例1中步骤S102的流程图。
图6为本发明实施例2的刷单行为识别方法的流程图。
图7为本发明实施例3的刷单行为识别模型的生成***的模块示意图。
图8为本发明实施例3中第二构建模块的结构示意图。
图9为本发明实施例3中第一构建模块的结构示意图。
图10为本发明实施例4的刷单行为识别***的模块示意图。
图11为本发明实施例5的电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
如图1所示,本实施例公开了一种刷单行为识别模型的生成方法,包括以下步骤:
步骤S101、获取若干历史订单,基于所述历史订单构建模型数据;
步骤S102、基于所述模型数据构建基础信息特征;
本实施例中,基础信息特征包括用户维度特征、订单基础属性维度特征、产品维度特征。用户维度特征包括:用户最近15天的行为数据,通过对比刷单与非刷单用户行为差异,刷单订单的用户在最近15天的行为数据呈现出异于非刷单用户行为数据的分布,通过行为数据特征能够反映出用户下单前的是否存在异常;用户注册、下单及最后一次登录之间的时间间隔等。订单基础属性维度特征包括:产品形态、产品类型、订单来源;订单出行人数;订单销售额、成本、毛利,及基于其他已有特征进行计算所得的衍生特征,例如订单平均每人每天的销售额;行程天数、提前预定天数、订单所在月份、订单是否有机票、订单是否有保险等。产品维度特征包括:订单产品在当日不同下单、浏览的用户数;订单产品在当日的转化率、平均日转化率、二者之间的相对波动率。
步骤S103、基于刷单行为的趋同性和所述模型数据构建上下文信息特征;
基础信息特征能够在一定程度上反映当前订单的信息,然而无法体现刷单行为的趋同性。已知典型刷单行为通常伴随着批量进行的特征,即刷单订单附近存在行为类似的批量订单。例如,仅将订单用户的id作为特征输入模型,与刷单行为本身存在较弱关联性,因此无法为模型训练过程提供有用的信息。基于刷单行为的趋同性,计算该订单同一产品下邻近订单中相似用户id所占比例,若该比例接近1,则说明该产品在一段时间内存在批量注册用户下单的情形。因此,当前订单为刷单的嫌疑增大。本实施例基于刷单行为的特性,也即刷单行为的趋同性,针对订单进行上下文特征的开发。
步骤S104、基于所述基础信息特征和所述上下文信息特征采用集成学习方法训练得到所述刷单行为识别模型。
本实施例中,基于基础信息特征和上下文信息特征采用集成学习方法中的XGBoost模型训练得到所述刷单行为识别模型。本实施例以旅游场景刷单为例,在旅游场景下,判断订单是否存在刷单行为,为了学习出一个稳定且各方面表现较好地模型,采用有监督学习算法。而旅游场景下的刷单订单的特征表现较为复杂,不同刷单手段具有不同的行为偏好,实际训练出的模型为弱监督模型,对于某个偏好下的刷单行为具有较好地识别能力。集成学习通过组合多个弱监督学习器以期得到一个更加全面的强监督模型,适合应用于旅游场景下的刷单行为检测。本实施例采用集成学习中的XGBoost模型进行二分类任务,该算法思想是通过不断添加树模型,不断进行特征***来生成一棵树;每新生成一棵树,实际为学习一个新的函数,来拟合上一轮预测的残差。训练完成后得到K棵子树,每个样本在每棵树中落到对应的某个叶子节点,每个叶子节点对应一个打分,该样本的最终预测值即为其对应每棵树叶子节点的打分之和。对于第K轮的目标函数表示如下:
Figure BDA0002336077040000111
其中,ObjK表示第K轮的目标函数,yi表示第i个真实值,
Figure BDA0002336077040000112
表示第K轮中的第i个预测值,L()表示损失函数,fK表示第K棵子树,Ω()表示子树复杂度,constant表示常数。
在XGBoost中,通过对损失函数进行二阶泰勒展开,从而求取梯度,具体计算公式如下:
Figure BDA0002336077040000113
其中,
Figure BDA0002336077040000114
表示第K-1轮中的第i个预测值,fK(xi)表示第K棵子树对第i个样本预测值。
该算法的详细过程均为现有技术,在此不再赘述。
如图2所示,本实施例中,步骤S103包括以下步骤:
步骤S1031、从若干历史订单中获取一个订单作为当前订单,获取当前订单对应的产品和供应商;
步骤S1032、获取所述产品的与所述当前订单邻近的N条所述历史订单作为第一待筛选订单;
步骤S1033、获取所述供应商的与所述当前订单邻近的N条所述历史订单作为第二待筛选订单;
步骤S1034、基于所述第一待筛选订单和所述第二待筛选订单计算符合预设筛选条件的订单比例和订单数,将所述订单比例和所述订单数作为所述上下文信息特征。其它可选实施方式中,订单比例和订单数也可以只包括一种。
本实施例中,依次用以上步骤构建历史订单中的每一个定单的上下文特征,上下文信息特征包括硬件设备相同但用户名不同的订单数,支付类型相同的订单所占的订单比例,相似用户的订单所占的订单比例,手机号码和/或证件号码异常订单所占的订单比例。其它可选实施方式中,也可以仅包括前述的几种上下文特征中的一种或多种。
如图3所示,本实施例中,所述支付类型相同的订单所占的订单比例的计算步骤包括:
S1051、获取若干所述历史订单中的任意一个所述历史订单为当前订单,获取所述当前订单对应的产品和供应商;
S1052、将若干所述历史订单分别按照产品相同和供应商相同进行分组,以得到第一订单组和第二订单组;
S1053、从所述第一订单组和所述第二订单组中筛选出与所述当前订单的产品及供应商均相同的邻近N个订单,以得到第三订单组;
S1054、在所述第三订单组中筛选出与所述当前订单的订单支付方式相同的n个订单;
根据上下文特征计算公式计算所述支付类型相同的订单所占的订单比例;
所述上下文特征计算公式如下:
Figure BDA0002336077040000121
其中,RsamePay表示所述支付类型相同的订单所占的订单比例。
如图4所示,本实施例中,所述硬件设备相同但用户名不同的订单数的计算步骤包括:
S1061、获取若干所述历史订单中的任意一个所述历史订单为当前订单,获取所述当前订单对应的产品和供应商;
S1062、将若干所述历史订单分别按照产品相同和供应商相同进行分组,以得到第一订单组和第二订单组;
S1063、从所述的第一订单组和所述第二订单组中筛选出与所述当前订单的产品及供应商均相同的邻近的订单,以得到第三订单组;
S1064、在所述第三订单组中筛选出与所述当前订单的硬件设备相同的订单,以得到第五订单组;
S1065、在所述第五订单组中统计所述用户名的个数作为所述硬件设备相同但用户名不同的订单数。
如图5所示,本实施例中,步骤S102包括以下步骤:
S1021、获取多种渠道的若干所述历史订单;
本实施例中,历史订单可以从业务举报后被人工确认为刷单的订单、举报后供应商成功申诉的订单、人工采样判别的订单等多渠道中获取,并对从不同渠道获取的历史订单数据进行合并。在合并数据过程中,若同一个订单同时出现在多张数据表中,则按照事先规定的优先级,保留其优先级最高的记录。
S1022、对每条所述历史订单打标签,以得到第一样本数据,所述打标签的结果包括刷单和非刷单;所述打标签的结果为刷单的所述第一样本数据为第一正样本数据,所述打标签的结果为非刷单的所述第一样本数据为第一负样本数据;
S1023、基于先验知识进行负样本扩充,以得到第二负样本数据;
本实施例中,从基础订单数据集中获取同时有低评分和投诉的订单作为所述第二负样本数据;
S1024、将所述第二负样本数据与所述第一负样本数据合并,以得到第三负样本数据;
S1025、按照预设的正负样本比例,对所述第一正样本数据和所述第三负样本数据进行采样,以得到模型数据,模型数据包括第一正样本数据和第三负样本数据。
本实施例中,按比例限制的公式对所述第一正样本数据和所述第三负样本数据的比例进行限制;
所述比例限制的公式如下:
Figure BDA0002336077040000131
其中,Npos,Nneg,Nadd分别表示所述第一正样本数据的例数,所述第一负样本数据的例数,所述第二负样本数据的例数,neg2posRate表示第一正样本数据的例数与第三负样本数据的例数的比值,negSampleRate表示所述第一负样本数据的比例;
本实施例公开的刷单行为识别模型的生成方法,通过模型数据的构建,模型特征的构建及模型构建和训练生成了一个刷单行为识别模型,对比基于规则***,通过人工专家的领域知识经验,来制定不同规则用于识别存在刷单行为的方法,本实施例能够识别出人工未知的刷单行为,进一步提高刷单识别的召回率。
实施例2
如图6所示,本实施例提供了一种刷单行为识别方法,包括以下步骤:
步骤S201、获取待识别的订单数据;
步骤S202、将所述待识别的订单数据输入至刷单行为识别模型中进行识别,以得到刷单行为识别的结果;
步骤S203、所述刷单行为识别模型使用前述的刷单行为识别模型的生成方法生成。
本实施例公开的刷单行为识别方法,通过获取待识别的订单数据,并将待识别的订单数据输入至前述的刷单行为识别模型中进行识别,以得到刷单行为识别的结果,本实施例能够识别出人工未知的刷单行为,进一步提高刷单识别的召回率。
实施例3
如图7所示,本实施例提供了一种刷单行为识别模型的生成***,包括:第一获取模块1、第一构建模块2、第二构建模块3、训练模块4。
第一获取模块1用于获取若干历史订单,基于所述历史订单构建模型数据;
第一构建模块2用于基于所述模型数据构建基础信息特征;
第二构建模块3用于基于刷单行为的趋同性和所述模型数据构建上下文信息特征;
训练模块4用于基于所述基础信息特征和所述上下文信息特征采用集成学习方法中的XGBoost模型训练得到所述刷单行为识别模型。
如图8所示,本实施例中,第二构建模块3包括第一获取单元31、第二获取单元32、第三获取单元33、筛选单元34。
第一获取单元31用于获取每次从若干所述历史订单中获取一个作为当前订单,获取所述当前订单对应的产品和供应商;
第二获取单元32用于获取所述产品的与所述当前订单邻近的N条所述历史订单作为第一待筛选订单;
第三获取单元33用于获取所述供应商的与所述当前订单邻近的N条所述历史订单作为第二待筛选订单;
筛选单元34用于基于所述第一待筛选订单和所述第二待筛选订单计算符合预设筛选条件的订单比例和订单数,将所述订单比例和所述订单数作为上下文信息特征。其它可选实施方式中,订单比例和订单数也可以只包括一种。
本实施例中上下文信息特征包括硬件设备相同但用户名不同的订单数,支付类型相同的订单所占的订单比例,相似用户的订单所占的订单比例,手机号码和/或证件号码异常订单所占的订单比例。其它可选实施方式中,也可以仅包括前述的几种中的一种或多种。
本实施例中,筛选单元34包括预处理子单元和支付类型相同的订单所占的订单比例的计算子单元;
预处理子单元用于获取若干历史订单中的任意一个历史订单为当前订单,获取当前订单对应的产品和供应商;将若干历史订单分别按照产品相同和供应商均相同进行分组,以得到第一订单组和第二订单组;从所述第一订单组和所述第二订单组中筛选出与所述当前订单的产品及供应商均相同的邻近N个订单,以得到第三订单组;
该支付类型相同的订单所占的订单比例的计算子单元用于在第三订单组中筛选出与当前订单的订单支付方式相同的n个订单;根据上下文特征计算公式计算支付类型相同的订单所占的订单比例;
上下文特征计算公式如下:
Figure BDA0002336077040000161
其中,RasmePay表示支付类型相同的订单所占的订单比例;
本实施例中,筛选单元34还包括硬件设备相同但用户名不同的订单数的计算子单元;
该硬件设备相同但用户名不同的订单数的计算子单元用于在第三订单组中筛选出与当前订单的硬件设备相同的订单,以得到第五订单组;在第五订单组中统计用户名的个数作为所述硬件设备相同但用户名不同的订单数。
如图9所示,本实施例中,第一构建模块2包括:第四获取单元21、打标签单元22、扩充单元23、合并单元24、采样单元25。
第四获取单元21用于获取多种渠道的若干历史订单;
打标签单元22用于对每条所述历史订单打标签,以得到第一样本数据,打标签的结果包括刷单和非刷单;打标签的结果为刷单的第一样本数据为第一正样本数据,打标签的结果为非刷单的第一样本数据为第一负样本数据;
扩充单元23用于基于先验知识进行负样本扩充,以得到第二负样本数据;以及从基础订单数据集中获取同时有低评分和投诉的订单作为所述第二负样本数据;
合并单元24用于将所述第二负样本数据与所述第一负样本数据合并,以得到第三负样本数据;
采样单元25用于按照预设的正负样本比例,对所述第一正样本数据和所述第三负样本数据进行采样,以得到所述模型数据,该模型数据包括所述第一正样本数据和所述第三负样本数据。具体地,按比例限制的公式对所述第一正样本数据和所述第三负样本数据的比例进行限制;
所述比例限制的公式如下:
Figure BDA0002336077040000162
其中,Npos,Nneg,Nadd分别表示所述第一正样本数据的例数,所述第一负样本数据的例数,所述第二负样本数据的例数,neg2posRate表示第一正样本的数据例数与第三负样本的数据例数的比值,negSampleRate表示所述第一负样本数据的比例;
本实施例提供的刷单行为识别模型的生成***,通过模型数据的构建,模型特征的构建及模型构建和训练生成了一个用于刷单行为识别模型,对比基于规则***,通过人工专家的领域知识经验,来制定不同规则用于识别存在刷单行为的方法,本实施例能够识别出人工未知的刷单行为,进一步提高刷单识别的召回率。
实施例4
如图10所示,本实施例提供了一种刷单行为识别***,包括:第二获取模块5、输入模块6。
第二获取模块5用于获取待识别的订单数据;
输入模块6用于将所述待识别的订单数据输入至刷单行为识别模型中进行识别,以得到刷单行为识别的结果;
所述刷单行为识别模型使用实施例3的刷单行为识别模型的生成***生成。
本实施例公开的刷单行为识别***,通过获取待识别的订单数据,并将待识别的订单数据输入至前述的刷单行为识别模型中进行识别,以得到刷单行为识别的结果,本实施例能够识别出人工未知的刷单行为,进一步提高刷单识别的召回率。
实施例5
图11为本发明实施例5提供的一种电子设备的结构示意图。所述电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现实施例1所提供的刷单行为识别模型的生成方法及实施例2所提供的刷单行为识别方法。图11显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图11所示,电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同***组件(包括存储器32和处理器31)的总线33。
总线33包括数据总线、地址总线和控制总线。
存储器32可以包括易失性存储器,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1所提供的刷单行为识别模型的生成方法及实施例2所提供的刷单行为识别方法。
电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,模型生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器36通过总线33与模型生成的设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)***、磁带驱动器以及数据备份存储***等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1所提供的刷单行为识别模型的生成方法及实施例2所提供的刷单行为识别方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1所提供的刷单行为识别模型的生成方法及实施例2所提供的刷单行为识别方法中的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (16)

1.一种刷单行为识别模型的生成方法,其特征在于,包括:
获取若干历史订单,基于所述历史订单构建模型数据;
基于所述模型数据构建基础信息特征;
基于刷单行为的趋同性和所述模型数据构建上下文信息特征;
基于所述基础信息特征和所述上下文信息特征采用集成学习方法训练得到所述刷单行为识别模型。
2.如权利要求1所述的刷单行为识别模型的生成方法,其特征在于,
所述基于刷单行为的趋同性和所述模型数据构建上下文信息特征的步骤包括:
每次从若干所述历史订单中获取一个作为当前订单,获取所述当前订单对应的产品和供应商;
获取所述产品的与所述当前订单邻近的N条所述历史订单作为第一待筛选订单;
获取所述供应商的与所述当前订单邻近的N条所述历史订单作为第二待筛选订单;
基于所述第一待筛选订单和所述第二待筛选订单计算符合预设筛选条件的订单比例和/或订单数,将所述订单比例和/或所述订单数作为所述上下文信息特征。
3.如权利要求2所述的刷单行为识别模型的生成方法,其特征在于,所述上下文信息特征包括硬件设备相同但用户名不同的订单数,支付类型相同的订单所占的订单比例,相似用户的订单所占的订单比例,手机号码和/或证件号码异常订单所占的订单比例中的至少一种。
4.如权利要求3所述的刷单行为识别模型的生成方法,其特征在于,当所述上下文信息特征包括所述支付类型相同的订单所占的订单比例和/或所述硬件设备相同但用户名不同的订单数时,所述支付类型相同的订单所占的订单比例的计算步骤和/或所述硬件设备相同但用户名不同的订单数的计算步骤均包括:
获取若干所述历史订单中的任意一个所述历史订单为当前订单,获取所述当前订单对应的产品和供应商;
将若干所述历史订单分别按照产品相同和供应商相同进行分组,以得到第一订单组和第二订单组;
从所述第一订单组和所述第二订单组中筛选出与所述当前订单的产品及供应商均相同的邻近N个订单,以得到第三订单组;
当所述上下文信息特征包括所述支付类型相同的订单所占的订单比例时,所述支付类型相同的订单所占的订单比例的计算步骤还包括:
在所述第三订单组中筛选出与所述当前订单的订单支付方式相同的n个订单;
根据上下文特征计算公式计算所述支付类型相同的订单所占的订单比例;
所述上下文特征计算公式如下:
Figure FDA0002336077030000021
其中,RsamePay表示所述支付类型相同的订单所占的订单比例;
当所述上下文信息特征包括所述硬件设备相同但用户名不同的订单数时,所述硬件设备相同但用户名不同的订单数的计算步骤还包括:
在所述第三订单组中筛选出与所述当前订单的硬件设备相同的订单,以得到第五订单组;
在所述第五订单组中统计所述用户名的个数作为所述硬件设备相同但用户名不同的订单数。
5.如权利要求1所述的刷单行为识别模型的生成方法,其特征在于,所述获取若干历史订单,基于所述历史订单构建模型数据的步骤包括:
获取多种渠道的若干所述历史订单;
对每条所述历史订单打标签,以得到第一样本数据,所述打标签的结果包括刷单和非刷单;所述打标签的结果为刷单的所述第一样本数据为第一正样本数据,所述打标签的结果为非刷单的所述第一样本数据为第一负样本数据;
基于先验知识进行负样本扩充,以得到第二负样本数据;
将所述第二负样本数据与所述第一负样本数据合并,以得到第三负样本数据;
按照预设的正负样本比例,对所述第一正样本数据和所述第三负样本数据进行采样,以得到所述模型数据。
6.如权利要求5所述的刷单行为识别模型的生成方法,其特征在于,所述基于先验知识进行负样本扩充,以得到第二负样本数据的步骤包括:
从基础订单数据集中获取同时有低评分和投诉的订单作为所述第二负样本数据;
所述按照预设的正负样本比例,对所述第一正样本数据和所述第三负样本数据进行采样,以得到所述模型数据的步骤包括:
按比例限制的公式对所述第一正样本数据和所述第三负样本数据的比例进行限制;
所述比例限制的公式如下:
Figure FDA0002336077030000031
其中,Npos,Nneg,Nadd分别表示所述第一正样本数据的例数,所述第一负样本数据的例数,所述第二负样本数据的例数,neg2posRate表示所述第一正样本数据的例数与所述第三负样本数据的例数的比值,negSampleRate表示所述第一负样本数据的比例;
所述模型数据包括所述第一正样本数据和所述第三负样本数据。
7.一种刷单行为识别方法,其特征在于,包括:
获取待识别的订单数据;
将所述待识别的订单数据输入至刷单行为识别模型中进行识别,以得到刷单行为识别的结果;
所述刷单行为识别模型使用如权利要求1至6任一项所述的刷单行为识别模型的生成方法生成。
8.一种刷单行为识别模型的生成***,其特征在于,包括:
第一获取模块,用于获取若干历史订单,基于所述历史订单构建模型数据;
第一构建模块,用于基于所述模型数据构建基础信息特征;
第二构建模块,用于基于刷单行为的趋同性和所述模型数据构建上下文信息特征;
训练模块,用于基于所述基础信息特征和所述上下文信息特征采用集成学习方法训练得到所述刷单行为识别模型。
9.如权利要求8所述的刷单行为识别模型的生成***,其特征在于,
所述第二构建模块包括:
第一获取单元,用于每次从若干所述历史订单中获取一个作为当前订单,获取所述当前订单对应的产品和供应商;
第二获取单元,用于获取所述产品的与所述当前订单邻近的N条所述历史订单作为第一待筛选订单;
第三获取单元,用于获取所述供应商的与所述当前订单邻近的N条所述历史订单作为第二待筛选订单;
筛选单元,用于基于所述第一待筛选订单和所述第二待筛选订单计算符合预设筛选条件的订单比例和/或订单数,将所述订单比例和/或所述订单数作为所述上下文信息特征。
10.如权利要求9所述的刷单行为识别模型的生成***,其特征在于,所述上下文信息特征包括硬件设备相同但用户名不同的订单数,支付类型相同的订单所占的订单比例,相似用户的订单所占的订单比例,手机号码和/或证件号码异常订单所占的订单比例中的至少一种。
11.如权利要求10所述的刷单行为识别模型的生成***,其特征在于,当所述上下文信息特征包括所述支付类型相同的订单所占的订单比例和/或所述硬件设备相同但用户名不同的订单数时,所述筛选单元包括对应的所述支付类型相同的订单所占的订单比例的计算子单元和/或所述硬件设备相同但用户名不同的订单数的计算子单元;所述筛选单元还包括预处理子单元;
所述预处理子单元用于获取若干所述历史订单中的任意一个所述历史订单为当前订单,获取所述当前订单对应的产品和供应商;将若干所述历史订单分别按照产品相同和供应商相同进行分组,以得到第一订单组和第二订单组;从所述第一订单组和所述第二订单组中筛选出与所述当前订单的产品及供应商均相同的邻近N个订单,以得到第三订单组;
所述支付类型相同的订单所占的订单比例的计算子单元用于在所述第三订单组中筛选出与所述当前订单的订单支付方式相同的n个订单;根据上下文特征计算公式计算所述支付类型相同的订单所占的订单比例;
所述上下文特征计算公式如下:
Figure FDA0002336077030000051
其中,RsamePay表示所述支付类型相同的订单所占的订单比例;
所述硬件设备相同但用户名不同的订单数的计算子单元用于在所述第三订单组中筛选出与所述当前订单的硬件设备相同的订单,以得到第五订单组;在所述第五订单组中统计用户名的个数作为所述硬件设备相同但用户名不同的订单数。
12.如权利要求8所述的刷单行为识别模型的生成***,其特征在于,所述第一构建模块包括:
第四获取单元,用于获取多种渠道的若干所述历史订单;
打标签单元,用于对每条所述历史订单打标签,以得到第一样本数据,所述打标签的结果包括刷单和非刷单;所述打标签的结果为刷单的所述第一样本数据为第一正样本数据,所述打标签的结果为非刷单的所述第一样本数据为第一负样本数据;
扩充单元,用于基于先验知识进行负样本扩充,以得到第二负样本数据;
合并单元,用于将所述第二负样本数据与所述第一负样本数据合并,以得到第三负样本数据;
采样单元,用于按照预设的正负样本比例,对所述第一正样本数据和所述第三负样本数据进行采样,以得到所述模型数据。
13.如权利要求12所述的刷单行为识别模型的生成***,其特征在于,
所述扩充单元还用于从基础订单数据集中获取同时有低评分和投诉的订单作为所述第二负样本数据;
所述采样单元还用于按比例限制的公式对所述第一正样本数据和所述第三负样本数据的比例进行限制;
所述比例限制的公式如下:
Figure FDA0002336077030000061
其中,Npos,Nneg,Nadd分别表示所述第一正样本数据的例数,所述第一负样本数据的例数,所述第二负样本数据的例数,neg2posRate表示所述第一正样本数据的例数与所述第三负样本数据的例数的比值,negSampleRate表示所述第一负样本数据的比例;
所述模型数据包括所述第一正样本数据和所述第三负样本数据。
14.一种刷单行为识别***,其特征在于,包括:
第二获取模块,用于获取待识别的订单数据;
识别模块,用于将所述待识别的订单数据输入至刷单行为识别模型中进行识别,以得到刷单行为识别的结果;
所述刷单行为识别模型使用如权利要求8至13任一项所述的刷单行为识别模型的生成***生成。
15.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的刷单行为识别模型的生成方法或如权利要求7所述的刷单行为识别方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的刷单行为识别模型的生成方法或如权利要求7所述的刷单行为识别方法的步骤。
CN201911356516.9A 2019-12-25 2019-12-25 模型的生成方法、刷单行为识别方法、***、设备和介质 Active CN111126629B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911356516.9A CN111126629B (zh) 2019-12-25 2019-12-25 模型的生成方法、刷单行为识别方法、***、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911356516.9A CN111126629B (zh) 2019-12-25 2019-12-25 模型的生成方法、刷单行为识别方法、***、设备和介质

Publications (2)

Publication Number Publication Date
CN111126629A true CN111126629A (zh) 2020-05-08
CN111126629B CN111126629B (zh) 2023-09-19

Family

ID=70502074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911356516.9A Active CN111126629B (zh) 2019-12-25 2019-12-25 模型的生成方法、刷单行为识别方法、***、设备和介质

Country Status (1)

Country Link
CN (1) CN111126629B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348624A (zh) * 2020-09-24 2021-02-09 北京沃东天骏信息技术有限公司 一种基于神经网络模型的订单处理方法和装置
CN113762300A (zh) * 2020-06-28 2021-12-07 北京沃东天骏信息技术有限公司 订单分类模型训练方法和装置、订单检测方法和装置
CN114912537A (zh) * 2022-05-26 2022-08-16 中国平安人寿保险股份有限公司 模型训练方法和装置、行为预测方法和装置、设备、介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017084521A1 (zh) * 2015-11-18 2017-05-26 阿里巴巴集团控股有限公司 一种订单聚类方法及装置,以及反恶意信息的方法及装置
CN107146089A (zh) * 2017-03-29 2017-09-08 北京三快在线科技有限公司 一种刷单识别方法及装置,电子设备
CN108596632A (zh) * 2017-03-07 2018-09-28 北京嘀嘀无限科技发展有限公司 一种基于订单属性和用户行为的反作弊识别方法及***
CN109345332A (zh) * 2018-08-27 2019-02-15 中国民航信息网络股份有限公司 一种航空订票恶意行为的智能检测方法
CN109509048A (zh) * 2017-09-15 2019-03-22 北京京东尚科信息技术有限公司 恶意订单识别方法、装置、电子设备及存储介质
CN110046951A (zh) * 2018-12-29 2019-07-23 ***股份有限公司 一种交易行为判断方法和***
CN110198248A (zh) * 2018-02-26 2019-09-03 北京京东尚科信息技术有限公司 检测ip地址的方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017084521A1 (zh) * 2015-11-18 2017-05-26 阿里巴巴集团控股有限公司 一种订单聚类方法及装置,以及反恶意信息的方法及装置
CN108596632A (zh) * 2017-03-07 2018-09-28 北京嘀嘀无限科技发展有限公司 一种基于订单属性和用户行为的反作弊识别方法及***
CN107146089A (zh) * 2017-03-29 2017-09-08 北京三快在线科技有限公司 一种刷单识别方法及装置,电子设备
CN109509048A (zh) * 2017-09-15 2019-03-22 北京京东尚科信息技术有限公司 恶意订单识别方法、装置、电子设备及存储介质
CN110198248A (zh) * 2018-02-26 2019-09-03 北京京东尚科信息技术有限公司 检测ip地址的方法和装置
CN109345332A (zh) * 2018-08-27 2019-02-15 中国民航信息网络股份有限公司 一种航空订票恶意行为的智能检测方法
CN110046951A (zh) * 2018-12-29 2019-07-23 ***股份有限公司 一种交易行为判断方法和***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIN Y,ZHU T, WU H, ET AL: "Towards online anti-opinion spam: Spotting fake reviews from the review sequence" *
刘畅: "电子商务中基于深度学习的虚假交易识别研究" *
方兴林: "演化博弈视角下网络交易平台"刷单炒信"行为控制研究" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762300A (zh) * 2020-06-28 2021-12-07 北京沃东天骏信息技术有限公司 订单分类模型训练方法和装置、订单检测方法和装置
CN112348624A (zh) * 2020-09-24 2021-02-09 北京沃东天骏信息技术有限公司 一种基于神经网络模型的订单处理方法和装置
CN114912537A (zh) * 2022-05-26 2022-08-16 中国平安人寿保险股份有限公司 模型训练方法和装置、行为预测方法和装置、设备、介质

Also Published As

Publication number Publication date
CN111126629B (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
US20200074274A1 (en) System and method for multi-horizon time series forecasting with dynamic temporal context learning
Kotu et al. Predictive analytics and data mining: concepts and practice with rapidminer
CN107766929B (zh) 模型分析方法及装置
CN111723292B (zh) 基于图神经网络的推荐方法、***、电子设备及存储介质
CN109492858B (zh) 基于机器学习的员工绩效预测方法及装置、设备、介质
CN111126629B (zh) 模型的生成方法、刷单行为识别方法、***、设备和介质
CN110995459B (zh) 异常对象识别方法、装置、介质及电子设备
CN109636482B (zh) 基于相似度模型的数据处理方法及***
CN111815060A (zh) 一种用电地区短期负荷预测方法及装置
CN112907063B (zh) 人口流动率和房屋空置率确定方法及终端设备
CN110147389A (zh) 帐号处理方法和装置、存储介质及电子装置
CN106909560B (zh) 兴趣点排序方法
CN110858219A (zh) 物流对象信息处理方法、装置及计算机***
CN112988840A (zh) 一种时间序列预测方法、装置、设备和存储介质
CN112614004A (zh) 用电信息的处理方法及装置
CN115375205A (zh) 一种用水用户画像的确定方法、装置及设备
CN111179055B (zh) 授信额度调整方法、装置和电子设备
CN112925911A (zh) 基于多模态数据的投诉分类方法及其相关设备
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
CN110334720A (zh) 业务数据的特征提取方法、装置、服务器和存储介质
CN111210332A (zh) 贷后管理策略生成方法、装置及电子设备
CN115249081A (zh) 一种对象类型的预测方法、装置、计算机设备和存储介质
CN110717577A (zh) 一种注意区域信息相似性的时间序列预测模型构建方法
CN116257758A (zh) 模型训练方法、人群拓展方法、介质、装置和计算设备
CN116187675A (zh) 任务分配方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant