CN107292495A - Mcc套码的识别方法、装置、计算机可读存储介质及*** - Google Patents

Mcc套码的识别方法、装置、计算机可读存储介质及*** Download PDF

Info

Publication number
CN107292495A
CN107292495A CN201710395599.7A CN201710395599A CN107292495A CN 107292495 A CN107292495 A CN 107292495A CN 201710395599 A CN201710395599 A CN 201710395599A CN 107292495 A CN107292495 A CN 107292495A
Authority
CN
China
Prior art keywords
mcc
default
consumption data
value
transaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710395599.7A
Other languages
English (en)
Inventor
龙凯
赵相龙
张森
葛新蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Information Service (shanghai) Co Ltd
Original Assignee
China Unionpay Information Service (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Information Service (shanghai) Co Ltd filed Critical China Unionpay Information Service (shanghai) Co Ltd
Priority to CN201710395599.7A priority Critical patent/CN107292495A/zh
Publication of CN107292495A publication Critical patent/CN107292495A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种MCC套码的识别方法、装置、计算机可读存储介质及***,所述识别方法包括:获取银联交易的消费数据;计算所述银联交易的消费数据特征值,所述银联交易的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值;将所述银联交易的消费数据特征值输入至预设的第一MCC的识别模型,对所述银联交易的消费数据进行识别,识别所述银联交易的消费数据是否套码。应用上述方案,可以对MCC套码行为进行识别。

Description

MCC套码的识别方法、装置、计算机可读存储介质及***
技术领域
本发明实施例涉及数据处理领域,尤其涉及一种MCC套码的识别方法、装置、计算机可读存储介质及***。
背景技术
在银联现行的***定价机制中,不同的商户类型代码(Merchant CategoryCode,MCC)代表不同的行业,不同的行业有不同的刷卡手续费率。这就导致一些高手续费率的商户(例如,餐饮行业)套用其他低手续费率行业的MCC,即MCC套码。MCC套码指第三方支付机构套用商户类别代码享受低手续费率的行为,该行为会导致基于银联交易的消费数据分析出现偏差。
目前无相应的方法识别MCC套码,导致基于银联交易流水的数据分析出偏差时,无法纠正。
发明内容
本发明实施例解决的技术问题是如何识别MCC套码。
为解决上述技术问题,本发明实施例提供一种MCC套码的识别方法,所述方法包括:获取银联交易的消费数据;计算所述银联交易的消费数据特征值,所述银联交易的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值;将所述银联交易的消费数据特征值输入至预设的第一MCC的识别模型,对所述银联交易的消费数据进行识别,识别所述银联交易的消费数据是否套码。
可选地,采用如下步骤建立所述预设的第一MCC的识别模型,包括:获取预设的第一MCC对应的消费数据;基于预设的第一MCC对应的消费数据计算预设的第一MCC对应的消费数据特征值,所述预设的第一MCC对应的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值;基于所述预设的第一MCC对应的消费数据特征值和机器学习算法,建立预设的第一MCC的识别模型。
可选地,所述金额类特征值包括以下至少一种:交易金额CV均值和标准差、单次交易金额均值和标准差。
可选地,所述交易时间段占比特征值包括以下至少一种:上午交易占比值、中午交易占比值、下午交易占比值、晚上交易占比值和深夜交易占比值。
可选地,所述交易季节性特征值包括:法定节假日交易人数值。
可选地,所述基于所述预设的第一MCC对应的消费数据特征值和机器学习算法,建立预设的第一MCC的识别模型,包括:对所述预设的第一MCC对应的消费数据特征值进行有效性判断,生成预设的第一MCC对应的消费数据有效特征值;基于所述预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
可选地,所述有效性判断包括:差异性判断和相关性判断,将所述差异性和所述相关性均判断有效的预设的第一MCC对应的消费数据特征值作为预设的第一MCC对应的消费数据有效特征值。
可选地,所述差异性判断包括:获取预设的第二MCC对应的消费数据;基于预设的第二MCC对应的消费数据计算预设的第二MCC对应的消费数据特征值;判断预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值是否体现商户的差异,如果预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值能够体现商户的差异,则预设的第一MCC对应的消费数据特征值有效。
可选地,所述相关性判断包括:依次计算任意两个预设的第一MCC对应的消费数据特征值的相关值,如果计算的相关值大于预设的相关系数门限,则参与计算的两个预设的第一MCC对应的消费数据特征值任选一个有效,另一个无效。
可选地,所述基于所述预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型,包括:利用CART决策树,对所述预设的第一MCC对应的消费数据有效特征值进行离散化处理;基于离散化处理后的预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
可选地,所述机器学习算法包括:逻辑回归算法。
本发明实施例还提供一种MCC套码的识别装置,包括:获取单元,适于获取银联交易的消费数据;计算单元,适于计算所述银联交易的消费数据特征值,所述银联交易的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值;识别单元,适于将所述银联交易的消费数据的特征值输入至预设的第一MCC的识别模型,对所述银联交易的消费数据进行识别,识别所述银联交易的消费数据是否套码。
可选地,MCC套码的识别装置还包括:建模单元,适于建立预设的第一MCC的识别模型,所述建模单元包括:获取子单元,适于获取预设的第一MCC对应的消费数据;计算子单元,适于基于预设的第一MCC对应的消费数据计算预设的第一MCC对应的消费数据特征值,所述预设的第一MCC对应的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值;建模子单元,适于基于所述预设的第一MCC对应的消费数据特征值和机器学习算法,建立预设的第一MCC的识别模型。
可选地,所述金额类特征值包括以下至少一种:交易金额CV均值和标准差、单次交易金额均值和标准差。
可选地,所述交易时间段占比特征值包括以下至少一种:上午交易占比值、中午交易占比值、下午交易占比值、晚上交易占比值和深夜交易占比值。
可选地,所述交易季节性特征值包括:法定节假日交易人数值。
可选地,所述建模子单元,包括:有效性判断模块,适于对所述预设的第一MCC对应的消费数据特征值进行有效性判断,生成预设的第一MCC对应的消费数据有效特征值;建模模块,适于基于所述预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
可选地,所述有效性判断模块包括:差异性判断子模块和相关性判断子模块,所述有效性判断模块适于将所述差异性判断子模块和所述相关性判断子模块均判断有效的预设的第一MCC对应的消费数据特征值作为预设的第一MCC对应的消费数据有效特征值。
可选地,所述差异性判断子模块包括:获取子模块,适于获取预设的第二MCC对应的消费数据;计算子模块,适于基于预设的第二MCC对应的消费数据计算预设的第二MCC对应的消费数据特征值;判断子模块,适于判断预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值是否体现商户的差异,如果预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值能够体现商户的差异,则预设的第一MCC对应的消费数据特征值有效。
可选地,所述相关性判断子模块,适于依次计算任意两个预设的第一MCC对应的消费数据特征值的相关值,如果计算的相关值大于预设的相关系数门限,则参与计算的两个预设的第一MCC对应的消费数据特征值任选一个有效,另一个无效。
可选地,所述建模模块包括:处理子模块,适于利用CART决策树,对所述预设的第一MCC对应的消费数据有效特征值进行离散化处理;建模子模块,适于基于离散化处理后的预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
可选地,所述机器学习算法包括:逻辑回归算法。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种实施例所述方法对应的步骤。
本发明实施例还提供一种MCC套码的识别***,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一种实施例所述方法对应的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
通过计算银联交易的消费数据特征值,并将银联交易的消费数据特征值输入至预设的第一MCC的识别模型,识别银联交易的消费数据是否套码,可以对银联交易数据中的MCC套码行为进行识别,并基于MCC套码识别结果及时纠正基于银联交易的消费数据分析偏差。
进一步地,通过计算预设的第一MCC对应的消费数据特征值,并基于预设的第一MCC对应的消费数据特征值和机器学习算法,建立预设的第一MCC的识别模型用于MCC套码的识别。
进一步地,对预设的第一MCC对应的消费数据特征值进行差异性判断,选择能够体现商户差异的预设的第一MCC对应的消费数据特征值作为有效特征值,可以提升识别模型建立的准确率,从而提升MCC套码识别的准确率。
进一步地,对预设的第一MCC对应的消费数据特征值进行相关性判断,通过删除无效的预设的第一MCC对应的消费数据特征值,可以避免后续基于无效的预设的第一MCC对应的消费数据特征值进行的大量的无效运算,从而减少机器学习过程的运算量和复杂度,提升建立预设的第一MCC的识别模型的效率。
进一步地,对预设的第一MCC对应的消费数据有效特征值进行离散化处理,并基于离散化处理后的预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型,可以消除极端特征值对识别模型的影响,提升建立预设的第一MCC的识别模型的准确率和可解释度。
附图说明
图1是本发明实施例提供的一种MCC套码的识别方法的流程图;
图2是本发明实施例提供的一种识别模型的建立方法的流程图;
图3是本发明实施例提供的一种离散化处理的示意图;
图4是本发明实施例提供的一种差异性判断方法的流程图;
图5是本发明实施例提供的餐饮类行业的识别模型对应的ROC曲线;
图6是本发明实施例提供的一种MCC套码的识别装置的示意图。
具体实施方式
目前无相应的方法识别MCC套码,导致基于银联交易的消费数据分析出偏差时,无法纠正。
本发明实施例通过计算银联交易的消费数据特征值,并将银联交易的消费数据特征值输入至预设的第一MCC的识别模型,识别银联交易的消费数据是否套码,可以对银联交易数据中的MCC套码行为进行识别,并基于MCC套码识别结果及时纠正基于银联交易的消费数据分析偏差。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
参见图1,本发明实施例提出了一种MCC套码的识别方法,可以包括如下步骤:
S101,获取银联交易的消费数据。
S102,计算所述银联交易的消费数据特征值,所述银联交易的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值。
在具体实施中,所述金额类特征值可以为交易金额CV均值和标准差,也可以为单次交易金额均值和标准差、或者同时包含交易金额CV均值和标准差、单次交易金额均值和标准差。其中所述交易金额CV均值和标准差反映了交易金额的波动情况,单次交易金额均值和标准差反映了单次交易金额的实际情况,在计算单次交易金额的均值和标准差时,可以剔除最高和最低10%的交易金额,避免个别异常金额对单次交易均值和单次交易标准差的影响。
在具体实施中,所述交易时间段占比特征值可以为上午交易占比值、中午交易占比值、下午交易占比值、晚上交易占比值和深夜交易占比值等一种或者几种。其中所述上午交易占比指7点到10点的交易次数占比,所述中午交易占比指10点到14点的交易次数占比,所述下午交易占比指14点到17点的交易次数占比,所述晚上交易占比指17点到22点的交易次数占比,所述深夜交易占比指其余时间段的交易次数占比。对不同的商户而言,不同的交易时间段占比值具有不同的特征。
在具体实施中,所述交易季节性特征值可以为法定节假日交易人数值。所述法定节假日交易人数值可以为法定节假日交易的卡数。
S103,将所述银联交易的消费数据特征值输入至预设的第一MCC的识别模型,对所述银联交易的消费数据进行识别,识别所述银联交易的消费数据是否套码。
应用上述方案,通过计算银联交易的消费数据特征值,并将银联交易的消费数据特征值输入至预设的第一MCC的识别模型,可以对银联交易数据中的MCC套码行为进行识别,并基于MCC套码识别结果及时纠正基于银联交易的消费数据分析偏差。
为了使本领域技术人员更好地理解和实现本发明,以下通过一具体实施例详细介绍上述实施例中的识别模型的建立方法,如图2所示。可以理解的是,在具体实施中,还可以采用其他的识别模型的建立方法,以下具体实施例并不构成对本发明的限制。
如图2所述,本发明一实施例提供的预设的第一MCC的识别模型的建立方法可以包括如下步骤:
S201,获取预设的第一MCC对应的消费数据。
S202,基于预设的第一MCC对应的消费数据计算预设的第一MCC对应的消费数据特征值,所述预设的第一MCC对应的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值。
在具体实施中,所述金额类特征值可以为交易金额CV均值和标准差,也可以为单次交易金额均值和标准差、或者同时包含交易金额CV均值和标准差、单次交易金额均值和标准差。其中所述交易金额CV均值和标准差反映了交易金额的波动情况,单次交易金额均值和标准差反映了单次交易金额的实际情况,在计算单次交易金额的均值和标准差时,可以剔除最高和最低10%的交易金额,避免个别异常金额对单次交易均值和单次交易标准差的影响。
在具体实施中,所述交易时间段占比特征值可以为上午交易占比值、中午交易占比值、下午交易占比值、晚上交易占比值和深夜交易占比值等一种或者几种。其中所述上午交易占比指7点到10点的交易次数占比,所述中午交易占比指10点到14点的交易次数占比,所述下午交易占比指14点到17点的交易次数占比,所述晚上交易占比指17点到22点的交易次数占比,所述深夜交易占比指其余时间段的交易次数占比。对不同的商户而言,不同的交易时间段占比值具有不同的特征。
在具体实施中,所述交易季节性特征值可以为法定节假日交易人数值。所述法定节假日交易人数值可以为法定节假日交易的卡数。
S203,基于所述预设的第一MCC对应的消费数据特征值和机器学习算法,建立预设的第一MCC的识别模型。
在具体实施中,可以基于逻辑回归机器学习算法,建立预设的第一MCC的识别模型。在本发明一实施例中,可以将所述预设的第一MCC对应的消费数据特征值输入逻辑回归算法,逻辑回归算法通过迭代学习过程后可以输出预设的第一MCC的识别模型对应的模型参数,然后基于逻辑回归算法输出的所述模型参数建立预设的第一MCC的识别模型。
在具体实施中,为了减少机器学习迭代过程的运算量和复杂度,可以对预设的第一MCC对应的消费数据特征值进行有效性判断,生成预设的第一MCC对应的消费数据有效特征值,并基于所述预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
在具体实施中,所述有效性判断可以包括:差异性判断和相关性判断,将所述差异性和所述相关性均判断有效的预设的第一MCC对应的消费数据特征值作为预设的第一MCC对应的消费数据有效特征值。
在本发明一实施例中,所述差异性判断可以通过与预设的第二MCC对应的消费数据特征值进行对比,判断预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值是否体现商户的差异,如果预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值能够体现商户的差异,则预设的第一MCC对应的消费数据特征值有效。
通过对预设的第一MCC对应的消费数据特征值进行差异性判断,选择能够体现商户差异的预设的第一MCC对应的消费数据特征值作为有效特征值,可以提升识别模型建立的准确率,从而提升MCC套码识别的准确率。
在本发明一实施例中,所述相关性判断可以包括:依次计算任意两个预设的第一MCC对应的消费数据特征值的相关值,如果计算的相关值大于预设的相关系数门限,则参与计算的两个预设的第一MCC对应的消费数据特征值任选一个有效,另一个无效。
通过删除无效的预设的第一MCC对应的消费数据特征值,可以避免后续基于无效的预设的第一MCC对应的消费数据特征值进行的大量的无效运算,从而减少机器学习过程的运算量和复杂度,提升建立预设的第一MCC的识别模型的效率。
在具体实施中,为了消除极端特征值对识别模型的影响,提升建立预设的第一MCC的识别模型的准确率和可解释度,可以利用CART决策树,对预设的第一MCC对应的消费数据有效特征值进行离散化处理,并基于离散化处理后的预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
本发明一实施例提供了离散化处理的示意图,如图3所示,所述预设的第一MCC对应的消费数据有效特征值包括:下午交易占比值、交易金额CV均值、单次交易金额均值和国庆七夕交易人数值。对所述消费数据有效特征值离散化处理的过程包括:
以16%为阈值,将下午交易占比值离散化为大于等于16%和小于16%两个值。
以0.94为阈值,将交易金额CV均值离散化为大于等于0.94和小于0.94两个值。
以0.95为阈值,将国庆七夕交易人数值离散化为大于等于0.95和小于0.95两个值。
以147、1677为阈值,将单次交易金额均值离散化为小于147、大于等于147同时小于1677,大于1677三个值。
为了使本领域技术人员更好地理解和实现本发明,本发明实施例还提供了一种差异性判断的方法,用来判断所述预设的第一MCC对应的消费数据特征值是否有效。
参见图4,本发明实施例提供的一种差异性判断的方法,可以包括如下步骤:
S401,获取预设的第二MCC对应的消费数据。
S402,基于预设的第二MCC对应的消费数据计算预设的第二MCC对应的消费数据特征值。
S403,判断预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值是否体现商户的差异,如果预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值能够体现商户的差异,则预设的第一MCC对应的消费数据特征值有效。
在具体实施中,所述预设的第一MCC和预设的第二MCC的商户差异可以包括:消费时间的差异、消费金额的差异等。例如,如果预设的第一MCC的消费时间集中在上午,预设的第二MCC的消费时间无明显的时间段特征,那么当预设的第一MCC的上午交易占比值比预设的第二MCC的上午交易占比值高时,预设的第一MCC对应的上午交易占比值有效。
为使本领域技术人员更好地理解和实现本发明,本发明一实施例提供了基于餐饮行业和商超类行业对应的真实消费数据特征值进行差异性判断的方法。
在本发明一实施例中,预设的第一MCC为餐饮类行业,预设的第二MCC为商超类行业,餐饮类行业和商超类行业对应的真实消费数据金额类特征值如表1所示,餐饮类行业和商超类行业对应的真实消费数据交易时间段占比特征值如表2所示。
表1
对于消费金额的差异,由于商超类行业消费的用户有可能买几个小件,也有可能买大件,而且买小件的用户较多,所以商超类行业对应的交易金额波动很大,商超类行业对应的交易金额均值较小;而餐饮类行业消费的用户都是餐饮消费,餐饮类行业对应的交易金额相对稳定。在表1中,餐饮类行业对应的交易金额CV均值和标准差均小于商超类行业对应的交易金额CV均值和标准差,餐饮类行业对应的单次交易金额标准差小于商超类行业对应的单次交易金额标准差,餐饮类行业对应的单次交易金额均值大于商超类行业对应的单次交易金额均值,体现了上述商户差异,所以交易金额CV均值和标准差、单次交易金额均值和标准差均为消费数据有效特征值。
表2
对于消费时间的差异,餐饮类行业对应的消费时间基本为中午、晚上或者深夜,而商超类行业对应的消费时间基本为白天。在表2中,餐饮类消费数据对应的下午交易占比值比较低,而商超类消费数据对应的下午交易占比值比较高,体现了上述商户差异,所以下午交易占比值为消费数据有效特征值。
在本发明一实施例中,基于上述实施例所述方法建立的餐饮类行业的识别模型,利用所述建立的餐饮类行业的识别模型对真实样本数据中餐饮类行业对应的消费数据是否套用商超类MCC进行识别,识别准确率为86%。
参见图5,所述建立的餐饮类行业的识别模型对应的接收操作特征(ReceiverOperating Characteristic,ROC)曲线为图5中的曲线51,随机参考模型对应的ROC曲线为图5中的曲线52,由于曲线51对应的曲线下面积(Area Under Curve,AUC)值很高,故说明所述建立的餐饮类行业的识别模型具有较高的准确率。
为使本领域技术人员更好地理解和实现本发明,本发明实施例中还提供了能够实现上述实施例中MCC套码的识别方法对应的装置,以下参照附图进行详细说明。
如图6所示的一种MCC套码的识别装置60,包括:获取单元61、计算单元62和识别单元63,其中:
所述获取单元61,适于获取银联交易的消费数据。
所述计算单元62,适于计算所述银联交易的消费数据特征值,所述银联交易的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值。
所述识别单元63,适于将所述银联交易的消费数据的特征值输入至预设的第一MCC的识别模型,对所述银联交易的消费数据进行识别,识别所述银联交易的消费数据是否套码。
在具体实施中,所述MCC套码的识别装置60还可以包括:建模单元64,适于建立预设的第一MCC的识别模型,所述建模单元64可以包括:获取子单元641、计算子单元642和建模子单元643,其中:
所述获取子单元641,适于获取预设的第一MCC对应的消费数据。
所述计算子单元642,适于基于预设的第一MCC对应的消费数据计算预设的第一MCC对应的消费数据特征值,所述预设的第一MCC对应的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值。
所述建模子单元643,适于基于所述预设的第一MCC对应的消费数据特征值和机器学习算法,建立预设的第一MCC的识别模型。
在具体实施中,所述金额类特征值包括以下至少一种:交易金额CV均值和标准差、单次交易金额均值和标准差。
在具体实施中,所述交易时间段占比特征值包括以下至少一种:上午交易占比值、中午交易占比值、下午交易占比值、晚上交易占比值和深夜交易占比值。
在具体实施中,所述交易季节性特征值包括:法定节假日交易人数值。
在具体实施中,所述建模子单元643可以包括:有效性判断模块(未示出)和建模模块(未示出),其中:
所述有效性判断模块,适于对所述预设的第一MCC对应的消费数据特征值进行有效性判断,生成预设的第一MCC对应的消费数据有效特征值。
所述建模模块,适于基于所述预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
在具体实施中,所述有效性判断模块可以包括:差异性判断子模块和相关性判断子模块,所述有效性判断模块适于将所述差异性判断子模块和所述相关性判断子模块均判断有效的预设的第一MCC对应的消费数据特征值作为预设的第一MCC对应的消费数据有效特征值。
在具体实施中,所述差异性判断子模块可以包括:获取子模块(未示出)、计算子模块(未示出)和判断子模块(未示出),其中:
获取子模块,适于获取预设的第二MCC对应的消费数据。
计算子模块,适于基于预设的第二MCC对应的消费数据计算预设的第二MCC对应的消费数据特征值。
判断子模块,适于判断预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值是否体现商户的差异,如果预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值能够体现商户的差异,则预设的第一MCC对应的消费数据特征值有效。
在具体实施中,所述相关性判断子模块,适于依次计算任意两个预设的第一MCC对应的消费数据特征值的相关值,如果计算的相关值大于预设的相关系数门限,则参与计算的两个预设的第一MCC对应的消费数据特征值任选一个有效,另一个无效。
在具体实施中,所述建模模块可以包括:处理子模块(未示出)和建模子模块(未示出),其中:
处理子模块,适于利用CART决策树,对所述预设的第一MCC对应的消费数据有效特征值进行离散化处理。
建模子模块,适于基于离散化处理后的预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
在具体实施中,所述机器学习算法包括:逻辑回归算法。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一实施例所述方法对应的步骤。
本发明实施例还提供一种MCC套码的识别***,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一实施例所述方法对应的步骤。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (24)

1.一种MCC套码的识别方法,其特征在于,包括:
获取银联交易的消费数据;
计算所述银联交易的消费数据特征值,所述银联交易的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值;
将所述银联交易的消费数据特征值输入至预设的第一MCC的识别模型,对所述银联交易的消费数据进行识别,识别所述银联交易的消费数据是否套码。
2.根据权利要求1所述的MCC套码的识别方法,其特征在于,采用如下步骤建立所述预设的第一MCC的识别模型,包括:
获取预设的第一MCC对应的消费数据;
基于预设的第一MCC对应的消费数据计算预设的第一MCC对应的消费数据特征值,所述预设的第一MCC对应的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值;
基于所述预设的第一MCC对应的消费数据特征值和机器学习算法,建立预设的第一MCC的识别模型。
3.根据权利要求1或2所述的MCC套码的识别方法,其特征在于,所述金额类特征值包括以下至少一种:交易金额CV均值和标准差、单次交易金额均值和标准差。
4.根据权利要求1或2所述的MCC套码的识别方法,其特征在于,所述交易时间段占比特征值包括以下至少一种:上午交易占比值、中午交易占比值、下午交易占比值、晚上交易占比值和深夜交易占比值。
5.根据权利要求1或2所述的MCC套码的识别方法,其特征在于,所述交易季节性特征值包括:法定节假日交易人数值。
6.根据权利要求2所述的MCC套码的识别方法,其特征在于,所述基于所述预设的第一MCC对应的消费数据特征值和机器学习算法,建立预设的第一MCC的识别模型,包括:
对所述预设的第一MCC对应的消费数据特征值进行有效性判断,生成预设的第一MCC对应的消费数据有效特征值;
基于所述预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
7.根据权利要求6所述的MCC套码的识别方法,其特征在于,所述有效性判断包括:差异性判断和相关性判断,将所述差异性和所述相关性均判断有效的预设的第一MCC对应的消费数据特征值作为预设的第一MCC对应的消费数据有效特征值。
8.根据权利要求7所述的MCC套码的识别方法,其特征在于,所述差异性判断包括:
获取预设的第二MCC对应的消费数据;
基于预设的第二MCC对应的消费数据计算预设的第二MCC对应的消费数据特征值;
判断预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值是否体现商户的差异,如果预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值能够体现商户的差异,则预设的第一MCC对应的消费数据特征值有效。
9.根据权利要求7所述的MCC套码的识别方法,其特征在于,所述相关性判断包括:
依次计算任意两个预设的第一MCC对应的消费数据特征值的相关值,如果计算的相关值大于预设的相关系数门限,则参与计算的两个预设的第一MCC对应的消费数据特征值任选一个有效,另一个无效。
10.根据权利要求6所述的MCC套码的识别方法,其特征在于,所述基于所述预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型,包括:
利用CART决策树,对所述预设的第一MCC对应的消费数据有效特征值进行离散化处理;
基于离散化处理后的预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
11.根据权利要求2所述的MCC套码的识别方法,其特征在于,所述机器学习算法包括:逻辑回归算法。
12.一种MCC套码的识别装置,其特征在于,包括:
获取单元,适于获取银联交易的消费数据;
计算单元,适于计算所述银联交易的消费数据特征值,所述银联交易的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值;
识别单元,适于将所述银联交易的消费数据的特征值输入至预设的第一MCC的识别模型,对所述银联交易的消费数据进行识别,识别所述银联交易的消费数据是否套码。
13.根据权利要求12所述的MCC套码的识别装置,其特征在于,还包括:建模单元,适于建立预设的第一MCC的识别模型,所述建模单元包括:
获取子单元,适于获取预设的第一MCC对应的消费数据;
计算子单元,适于基于预设的第一MCC对应的消费数据计算预设的第一MCC对应的消费数据特征值,所述预设的第一MCC对应的消费数据特征值包括:金额类特征值、交易时间段占比特征值和交易季节性特征值;
建模子单元,适于基于所述预设的第一MCC对应的消费数据特征值和机器学习算法,建立预设的第一MCC的识别模型。
14.根据权利要求12或13所述的MCC套码的识别装置,其特征在于,所述金额类特征值包括以下至少一种:交易金额CV均值和标准差、单次交易金额均值和标准差。
15.根据权利要求12或13所述的MCC套码的识别装置,其特征在于,所述交易时间段占比特征值包括以下至少一种:上午交易占比值、中午交易占比值、下午交易占比值、晚上交易占比值和深夜交易占比值。
16.根据权利要求12或13所述的MCC套码的识别装置,其特征在于,所述交易季节性特征值包括:法定节假日交易人数值。
17.根据权利要求13所述的MCC套码的识别装置,其特征在于,所述建模子单元,包括:
有效性判断模块,适于对所述预设的第一MCC对应的消费数据特征值进行有效性判断,生成预设的第一MCC对应的消费数据有效特征值;
建模模块,适于基于所述预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
18.根据权利要求17所述的MCC套码的识别装置,其特征在于,所述有效性判断模块包括:差异性判断子模块和相关性判断子模块,所述有效性判断模块适于将所述差异性判断子模块和所述相关性判断子模块均判断有效的预设的第一MCC对应的消费数据特征值作为预设的第一MCC对应的消费数据有效特征值。
19.根据权利要求18所述的MCC套码的识别装置,其特征在于,所述差异性判断子模块包括:
获取子模块,适于获取预设的第二MCC对应的消费数据;
计算子模块,适于基于预设的第二MCC对应的消费数据计算预设的第二MCC对应的消费数据特征值;
判断子模块,适于判断预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值是否体现商户的差异,如果预设的第一MCC对应的消费数据特征值和预设的第二MCC对应的消费数据特征值能够体现商户的差异,则预设的第一MCC对应的消费数据特征值有效。
20.根据权利要求18所述的MCC套码的识别装置,其特征在于,所述相关性判断子模块,适于依次计算任意两个预设的第一MCC对应的消费数据特征值的相关值,如果计算的相关值大于预设的相关系数门限,则参与计算的两个预设的第一MCC对应的消费数据特征值任选一个有效,另一个无效。
21.根据权利要求17所述的MCC套码的识别装置,其特征在于,所述建模模块包括:
处理子模块,适于利用CART决策树,对所述预设的第一MCC对应的消费数据有效特征值进行离散化处理;
建模子模块,适于基于离散化处理后的预设的第一MCC对应的消费数据有效特征值和机器学习算法,建立预设的第一MCC的识别模型。
22.根据权利要求13所述的MCC套码的识别装置,其特征在于,所述机器学习算法包括:逻辑回归算法。
23.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至11任一项所述方法的步骤。
24.一种MCC套码的识别***,其特征在于,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行权利要求1至11任一项所述方法的步骤。
CN201710395599.7A 2017-05-27 2017-05-27 Mcc套码的识别方法、装置、计算机可读存储介质及*** Pending CN107292495A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710395599.7A CN107292495A (zh) 2017-05-27 2017-05-27 Mcc套码的识别方法、装置、计算机可读存储介质及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710395599.7A CN107292495A (zh) 2017-05-27 2017-05-27 Mcc套码的识别方法、装置、计算机可读存储介质及***

Publications (1)

Publication Number Publication Date
CN107292495A true CN107292495A (zh) 2017-10-24

Family

ID=60094213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710395599.7A Pending CN107292495A (zh) 2017-05-27 2017-05-27 Mcc套码的识别方法、装置、计算机可读存储介质及***

Country Status (1)

Country Link
CN (1) CN107292495A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781955A (zh) * 2019-10-24 2020-02-11 ***股份有限公司 无标签对象的分类和检测套码的方法、装置及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636912A (zh) * 2015-02-13 2015-05-20 银联智惠信息服务(上海)有限公司 ***套现识别方法和装置
CN105809195A (zh) * 2016-03-08 2016-07-27 ***股份有限公司 用于判别一个商户是否属于特定商户类别的方法和装置
CN105931051A (zh) * 2015-12-31 2016-09-07 ***股份有限公司 一种安全支付方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636912A (zh) * 2015-02-13 2015-05-20 银联智惠信息服务(上海)有限公司 ***套现识别方法和装置
CN105931051A (zh) * 2015-12-31 2016-09-07 ***股份有限公司 一种安全支付方法及装置
CN105809195A (zh) * 2016-03-08 2016-07-27 ***股份有限公司 用于判别一个商户是否属于特定商户类别的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
林霞霞: ""基于数据挖掘的商户套用欺诈检测研究与应用"", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781955A (zh) * 2019-10-24 2020-02-11 ***股份有限公司 无标签对象的分类和检测套码的方法、装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN108846520B (zh) 贷款逾期预测方法、装置以及计算机可读存储介质
US10528945B1 (en) Open ticket payment handling with incremental authorization
CN103258388B (zh) 自动交易装置和服务器、以及用于预测现金需求量的方法
CN103971197A (zh) 一种跨境电子商务的对账方法及***
JP6209691B2 (ja) マーケティング装置、マーケティング方法およびプログラム
CN111008896A (zh) 金融风险预警方法、装置、电子设备及存储介质
CN108492170A (zh) 一种还款方法、计算机可读存储介质及终端设备
Zhu et al. Revisiting the nexus between exchange rate, exports and economic growth: further evidence from Asia
CN110428244B (zh) 套餐推荐方法和装置
US20160350726A1 (en) Vehicle maintenance reminders generated from analysis of payment transaction data
KR102092461B1 (ko) 투자성공률 제공방법
US20170169426A1 (en) Dynamic security code authorization verification service
Stanisic et al. Predicting the type of auditor opinion: Statistics, machine learning, or a combination of the two?
CN104021628B (zh) 数据处理方法和装置
CN111353812A (zh) 链式智能营销方法及装置
CN107292495A (zh) Mcc套码的识别方法、装置、计算机可读存储介质及***
CN114581249A (zh) 基于投资风险承受能力评估的金融产品推荐方法及***
CN111488407B (zh) 数据处理方法、***及装置
CA3037134A1 (en) Systems and methods of generating a pooled investment vehicle using shared data
CN111144899B (zh) 识别虚假交易的方法及装置和电子设备
US20220318903A1 (en) Machine learning based prediction for multiple currency goals
CN113298510B (zh) 一种扣款指令发起方法及装置
WO2021130991A1 (ja) 不正検知システム、不正検知方法、及びプログラム
CN111047303A (zh) 一种碳排放权交易清结算方法及***
TWI818263B (zh) 智能消費預估串接基金自動交易系統及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171024

WD01 Invention patent application deemed withdrawn after publication