CN115034873A - 挂失类型识别方法、装置、设备、存储介质和程序产品 - Google Patents

挂失类型识别方法、装置、设备、存储介质和程序产品 Download PDF

Info

Publication number
CN115034873A
CN115034873A CN202210414341.8A CN202210414341A CN115034873A CN 115034873 A CN115034873 A CN 115034873A CN 202210414341 A CN202210414341 A CN 202210414341A CN 115034873 A CN115034873 A CN 115034873A
Authority
CN
China
Prior art keywords
loss
identified
bank card
target
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210414341.8A
Other languages
English (en)
Inventor
张珂欣
吴欢
董江雪
孟靖祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202210414341.8A priority Critical patent/CN115034873A/zh
Publication of CN115034873A publication Critical patent/CN115034873A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请涉及一种挂失类型识别方法、装置、设备、存储介质和程序产品,计算机设备通过获取待识别银行卡的挂失交易数据,将挂失交易数据分别输入多个目标模型中,得到各目标模型输出的针对待识别银行卡的挂失类型,进而根据各目标模型输出的针对待识别银行卡的挂失类型,确定待识别银行卡的目标挂失类型。本方法中通过目标模型获取待识别银行卡的目标挂失类型,提高了银行卡挂失类型的识别效率,而且,本方法中采用多个目标模型得到基于各个模型的针对待识别银行卡的挂失类型,进一步根据各模型输出的挂失类型确定目标挂失类型,避免了采用单一目标模型时带来的误判问题,保证在提高银行卡挂失类型的识别效率的同时,提高识别的准确性。

Description

挂失类型识别方法、装置、设备、存储介质和程序产品
技术领域
本申请涉及大数据技术领域,特别是涉及一种挂失类型识别方法、装置、 设备、存储介质和程序产品。
背景技术
挂失是在客户遗失、损坏、失窃银行卡等行为中,避免财产损失的一种自 救行为,在实际的银行卡挂失业务中,存在部分客户使用同一号码多次呼入并 办理多个不同客户借记卡挂失的情况,但坐席人员无法判断客户来电次数以及 无法快速识别客户高频***挂失的情况,存在较大的信息泄露风险和外部欺诈 风险。
现有技术方案中,主要是坐席人员自己根据以往的工作经验,识别银行卡 挂失业务的类型,该类型包括正常挂失或异常挂失,然而,该方法存在银行卡 挂失类型的识别效率低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高银行卡挂失类型的 识别效率的挂失类型识别方法、装置、设备、存储介质和程序产品。
第一方面,本申请提供了一种挂失类型识别方法,所述方法包括:
获取待识别银行卡的挂失交易数据;
将所述挂失交易数据分别输入多个目标模型中,得到各所述目标模型输出 的针对所述待识别银行卡的挂失类型;
根据各所述目标模型输出的针对所述待识别银行卡的挂失类型,确定所述 待识别银行卡的目标挂失类型。
在其中一个实施例中,所述根据各所述目标模型输出的针对所述待识别银 行卡的挂失类型,确定所述待识别银行卡的目标挂失类型,包括:
根据各所述目标模型输出的针对所述待识别银行卡的挂失类型,从各所述 挂失类型中确定异常挂失类型的数量;
确定所述异常挂失类型的数量与所述挂失类型的总数量的比值;
根据所述比值确定所述待识别银行卡的目标挂失类型。
在其中一个实施例中,所述根据所述比值确定所述待识别银行卡的目标挂 失类型,包括:
若所述比值大于第一预设比值,则确定所述待识别银行卡的目标挂失类型 为第一异常风险程度的异常挂失类型。
在其中一个实施例中,所述方法还包括:
若所述比值大于第二预设比值且小于等于所述第一预设比值,则确定所述 待识别银行卡的目标挂失类型为第二异常风险程度的异常挂失类型,其中,所 述第二异常风险程度小于所述第一异常风险程度。
在其中一个实施例中,所述方法还包括:
若所述比值小于所述第二预设比值,则确定所述待识别银行卡的目标挂失 类型为正常挂失类型。
在其中一个实施例中,所述多个目标模型包括逻辑回归模型和随机森林模 型;所述将所述挂失交易数据分别输入多个目标模型中,得到各所述目标模型 输出的针对所述待识别银行卡的挂失类型,包括:
将所述挂失交易数据输入所述逻辑回归模型中,得到第一挂失类型;
将所述挂失交易数据输入所述随机森林模型中,得到第二挂失类型。
在其中一个实施例中,所述方法还包括:
获取挂失交易数据样本和对应的挂失类型标签;
根据所述挂失交易数据样本和对应的挂失类型标签,训练初始逻辑回归模 型得到所述逻辑回归模型。
在其中一个实施例中,获取挂失交易数据样本和对应的挂失类型标签;
根据所述挂失交易数据样本和对应的挂失类型标签,训练初始随机森林模 型得到所述随机森林模型。
第二方面,本申请还提供了一种挂失类型识别装置,所述装置包括:
输入模块,用于将所述挂失交易数据分别输入多个目标模型中,得到各所 述目标模型输出的针对所述待识别银行卡的挂失类型;
确定模块,用于根据各所述目标模型输出的针对所述待识别银行卡的挂失 类型,确定所述待识别银行卡的目标挂失类型。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器 和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时 实现以下步骤:
获取待识别银行卡的挂失交易数据;
将所述挂失交易数据分别输入多个目标模型中,得到各所述目标模型输出 的针对所述待识别银行卡的挂失类型;
根据各所述目标模型输出的针对所述待识别银行卡的挂失类型,确定所述 待识别银行卡的目标挂失类型。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存 储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步 骤:
获取待识别银行卡的挂失交易数据;
将所述挂失交易数据分别输入多个目标模型中,得到各所述目标模型输出 的针对所述待识别银行卡的挂失类型;
根据各所述目标模型输出的针对所述待识别银行卡的挂失类型,确定所述 待识别银行卡的目标挂失类型。
第五方面,本申请还提供了一种计算机程序产品,所述计算机程序产品, 包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待识别银行卡的挂失交易数据;
将所述挂失交易数据分别输入多个目标模型中,得到各所述目标模型输出 的针对所述待识别银行卡的挂失类型;
根据各所述目标模型输出的针对所述待识别银行卡的挂失类型,确定所述 待识别银行卡的目标挂失类型。
上述挂失类型识别方法、装置、设备、存储介质和程序产品,计算机设备 通过获取待识别银行卡的挂失交易数据,将挂失交易数据分别输入多个目标模 型中,得到各目标模型输出的针对待识别银行卡的挂失类型,进而根据各目标 模型输出的针对待识别银行卡的挂失类型,确定待识别银行卡的目标挂失类型。 本方法中通过目标模型获取待识别银行卡的目标挂失类型,提高了银行卡挂失 类型的识别效率,而且,本方法中采用多个目标模型得到基于各个模型的针对 待识别银行卡的挂失类型,进一步根据各模型输出的挂失类型确定目标挂失类 型,避免了采用单一目标模型时带来的误判问题,保证在提高银行卡挂失类型 的识别效率的同时,提高识别的准确性。
附图说明
图1为一个实施例中挂失类型识别方法的应用环境图;
图2为一个实施例中挂失类型识别方法的流程示意图;
图3为一个实施例中确定待识别银行卡的目标挂失类型的流程示意图;
图4为一个实施例中初始逻辑回归模型训练过程的流程示意图;
图5为一个实施例中初始随机森林模型训练过程的流程示意图;
图6为一个实施例中挂失类型识别装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅 用以解释本申请,并不用于限定本申请。
本申请实施例提供的挂失类型识别方法,可以应用于如图1所示的应用环 境中。该应用环境包括一种计算机设备,该计算机设备可以是服务器,其内部 结构图可以如图1所示。该计算机设备包括通过***总线连接的处理器、存储 器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计 算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存 储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操 作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储银行相 关交易数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。 该计算机程序被处理器执行时以实现一种挂失类型识别方法。
在一个实施例中,如图2所示,提供了一种挂失类型识别方法,以该方法 应用于图1中的计算机设备为例进行说明,包括以下步骤:
S201,获取待识别银行卡的挂失交易数据。
可选的,挂失交易数据可以包括:挂失交易方式、挂失交易过程信息核对 是否成功、待识别银行卡的挂失致电号码所在地区、待识别银行卡的挂失致电 号码近n天内的致电挂失总次数(n=1,2,3,5,7,14)、待识别银行卡的挂 失致电号码30日内单日最大挂失次数、待识别银行卡近n天内被挂失总次数 (n=1,2,3,5,7,14)、待识别银行卡30日内单日最大被挂失次数。
可选的,挂失交易方式:客户通过电话进行挂失时,结合具体情况的不同, 有如下几种挂失交易方式:非注册客户人工密码挂失,注册客户人工坐席挂失, 非注册客户人工免密挂失,自助语音身份证挂失。(其中,注册客户表示电话 银行注册客户是在自助语音侧或者座席侧做过验密或设置***的操作。)
挂失交易过程信息核对是否成功:在挂失交易中,坐席人员核对致电客户 信息,如身份证号码、银行***、最近一次交易时间等信息。
在本实施例中,异常挂失很可能在同一地区进行电话的呼出,因此,挂失 致电号码所在地区对挂失类型的识别有辅助作用。而且,在实际工作中,使用 同一号码多次呼入并办理多个不同客户借记卡挂失的情况,或者同一号码在单 日内致电挂失次数很多时可能属于异常情况,存在异常挂失的可能性就会很大。
在本实施例中,计算机设备可以通过埋点的方式从所有的交易数据中获取 待识别银行卡的挂失交易数据,也可以利用特征提取的方式从所有的交易数据 中获取待识别银行卡的挂失交易数据,或者利用神经学习网络从所有的交易数 据中获取待识别银行卡的挂失交易数据。
S202,将挂失交易数据分别输入多个目标模型中,得到各目标模型输出的 针对待识别银行卡的挂失类型。
可选的,目标模型可以为卷积神经网络、自编码器、循环神经网络等深度 学习网络,也可以为决策树、随机森林、逻辑回归、支持向量机等分类器等, 本申请实施例对此不做限制。
在本实施例中,将挂失交易数据分别输入多个目标模型中,得到各目标模 型输出的针对待识别银行卡的挂失类型。例如。可以将待识别银行卡的挂失交 易数据输入至卷积神经网络,得到基于卷积神经网络的挂失类型为正常挂失, 将待识别银行卡的挂失交易数据输入至支持向量机中,得到基于支持向量机的 挂失类型为异常挂失。
S203,根据各目标模型输出的针对待识别银行卡的挂失类型,确定待识别 银行卡的目标挂失类型。
在本实施例中,在根据各目标模型输出的针对待识别银行卡的挂失类型, 确定待识别银行卡的目标挂失类型时,可以采用正常挂失的数量与挂失类型总 数量的比值,根据比值与第一预设阈值确定待识别银行卡的目标挂失类型。例 如,第一预设阈值为70%,卷积神经网络输出的挂失类型为正常挂失,支持向 量机输出的挂失类型为正常挂失,BP神经网络输出的挂失类型为异常挂失,逻 辑回归输出的挂失类型为正常挂失,则正常挂失的数量与挂失类型总数量的比 值为75%,则待识别银行卡的目标挂失类型为正常挂失。
在本实施例中,确定待识别银行卡的目标挂失类型时,也可以根据各个模 型的识别精度,对各个模型赋予不同的权重,获取正常挂失的权重与总权重1 之间的比值,根据比值与第二预设阈值确定待识别银行卡的目标挂失类型。例 如,卷积神经网络的权重为0.5,支持向量机的权重为0.2,BP神经网络的权重 为0.3,第二预设阈值为0.8,卷积神经网络输出的挂失类型为正常挂失,支持 向量机输出的挂失类型为异常挂失,BP神经网络输出的挂失类型为正常挂失, 则正常挂失的权重为0.8,则正常挂失的权重与总权重1之间的比值为0.8,所 以待识别银行卡的目标挂失类型为正常挂失。若卷积神经网络输出的挂失类型 为正常挂失,支持向量机输出的挂失类型为正常挂失,BP神经网络输出的挂失 类型为异常挂失,则正常挂失的权重为0.7,则正常挂失的权重与总权重1之间 的比值为0.7,所以待识别银行卡的目标挂失类型为异常挂失。
上述挂失类型识别方法中,计算机设备通过获取待识别银行卡的挂失交易 数据,将挂失交易数据分别输入多个目标模型中,得到各目标模型输出的针对 待识别银行卡的挂失类型,进而根据各目标模型输出的针对待识别银行卡的挂 失类型,确定待识别银行卡的目标挂失类型。本方法中通过目标模型获取待识 别银行卡的目标挂失类型,提高了银行卡挂失类型的识别效率,而且,本方法 中采用多个目标模型得到基于各个模型的针对待识别银行卡的挂失类型,进一 步根据各模型输出的挂失类型确定目标挂失类型,避免了采用单一目标模型时 带来的误判问题,保证在提高银行卡挂失类型的识别效率的同时,提高识别的 准确性。
图3为一个实施例中确定待识别银行卡的目标挂失类型的流程示意图,如 图3所示,本实施例涉及的是如何根据各目标模型输出的针对待识别银行卡的 挂失类型,确定待识别银行卡的目标挂失类型的一种可能的实现方式,包括以 下步骤:
S301,根据各目标模型输出的针对待识别银行卡的挂失类型,从各挂失类 型中确定异常挂失类型的数量。
在本实施例中,根据各目标模型输出的针对待识别银行卡的挂失类型,包 括正常交挂失和异常挂失,从中确定出异常挂失类型的数量。例如,包括5个 目标模型,目标模型1输出的挂失类型为正常挂失、目标模型2输出的挂失类 型为异常挂失、目标模型3输出的挂失类型为异常挂失、目标模型4输出的挂 失类型为异常挂失以及目标模型5输出的挂失类型为正常挂失,则异常挂失类 型的数量为3个。
S302,确定异常挂失类型的数量与挂失类型的总数量的比值。
在本实施例中,还是以上述S301为例,异常挂失类型的数量为3个,挂失 类型的总数量为5个,则异常挂失类型的数量与挂失类型的总数量的比值为0.6。
S303,根据比值确定待识别银行卡的目标挂失类型。
在本实施例中,可以直接根据异常挂失类型的数量与挂失类型的总数量的 第一比值与第一预设阈值进行比较,若第一比值大于预设阈值,则确定待识别 银行卡的目标挂失类型为异常挂失。也可以根据第一比值得到第二比值(即正 常挂失类型的数量与挂失类型的总数量的比值)与第二预设阈值进行比较,若 第二比值小于第二预设阈值,则确定待识别银行卡的目标挂失类型为异常挂失。
进一步地,“根据比值确定待识别银行卡的目标挂失类型”包括以下三种 方式:
第一种方式:若比值大于第一预设比值,则确定待识别银行卡的目标挂失 类型为第一异常风险程度的异常挂失类型。
可选的,第一预设比值可以为0.2、0.3等,本申请实施例对此并不做限制。
在本实施例中,假设,第一预设比值为0.8,异常挂失类型的数量与挂失类 型的总数量的比值为1,则确定待识别银行卡的目标挂失类型为第一异常风险程 度的异常挂失类型。
第二种方式:若比值大于第二预设比值且小于等于第一预设比值,则确定 待识别银行卡的目标挂失类型为第二异常风险程度的异常挂失类型,其中,第 二异常风险程度小于第一异常风险程度。
可选的,第二预设比值也可以为0.2、0.3等,本申请实施例对此并不做限 制。
在本实施例中,假设第一预设比值为0.8,第二预设比值为0.4,异常挂失 类型的数量与挂失类型的总数量的比值为为0.5,则确定待识别银行卡的目标挂 失类型为第二异常风险程度的异常挂失类型。
进一步地,当目标挂失类型为异常挂失类型时,可以得到第一异常风险程 度大于第二异常风险程度,通过输出报警提示信息提醒坐席人员对致电号码客 户进行复核。例如,当异常挂失类型为第一风险程度时,则提醒坐席人员对致 电号码客户的身份证、单位电话、最近一次交易时间、最近一次交易金额等进 行复核;当异常挂失类型为第一风险程度时,则提醒坐席人员对致电号码的客 户的身份证、单位电话复核。
第三种方式:若比值小于第二预设比值,则确定待识别银行卡的目标挂失 类型为正常挂失类型。
在本实施例中,假设,第二预设比值为0.4,异常挂失类型的数量与挂失类 型的总数量的比值为为0.2,则确定待识别银行卡的目标挂失类型为正常挂失类 型,坐席人员不需要进行复核。
进一步地,若想要得到更加精确、更加详细的识别方式,可以设置多个预 设阈值,将比值与预设阈值进行比较。
本申请实施例中,通过确定异常挂失类型的数量与挂失类型的总数量的比 值,根据比值确定待识别银行卡的目标挂失类型。本方法中通过比值确定目标 挂失类型,方法简单,可以提高目标挂失类型的识别效率。
本实施例涉及的是当多个目标模型包括逻辑回归模型和随机森林模型时, 如何根据挂失交易数据与多个目标模型,得到各目标模型输出的针对待识别银 行卡的挂失类型的一种可能的实现方式:将挂失交易数据输入逻辑回归模型中, 得到第一挂失类型;将挂失交易数据输入随机森林模型中,得到第二挂失类型。
在本实施例中,将上述S201中获取的待识别银行卡的挂失交易数据输入至 逻辑回归模型中,假设,挂失交易为异常挂失的概率为P,那么挂失交易为正常 挂失的概率为1-P,当概率P的值大于50%,则第一挂失类型为异常挂失,当概 率P的值小于50%,则第一挂失类型为正常挂失。
在本实施例中,还是将上述S201中获取的待识别银行卡的挂失交易数据输 入至随机森林模型中,随机森林构造了多个决策树,当需要对待识别银行卡的 挂失类型进行预测时,随机森林中的每棵决策树对该样本得到的一个预测挂失 类别,然后通过投票法从这些预测挂失类别中选出最后的结果,即第二挂失类 型。
本申请实施例中,将挂失交易数据分别输入到逻辑回归模型和随机森林模 型中,得到第一挂失类型和第二挂失类型,本方法中利用两种目标模型对数据 样本进行预测,为后续确定目标挂失类型奠定重要基础。
图4为一个实施例中初始逻辑回归模型训练过程的流程示意图,如图4所 示,本实施例涉及的是如何根据挂失交易数据样本和对应的挂失类型标签,训 练初始逻辑回归模型得到逻辑回归模型的一种可能的实现方式,包括以下步骤:
S401,获取挂失交易数据样本和对应的挂失类型标签。
在本实施例中,挂失交易数据样本可以包括挂失交易方式、挂失交易结果、 挂失交易过程信息核对是否成功、挂失致电号码所在地区、同一挂失致电号码 近n天内的致电挂失总次数(n=1,2,3,5,7,14)、同一挂失致电号码30 日内单日最大挂失次数、同一银行卡近n天内被挂失总次数(n=1,2,3,5,7, 14)、同一银行卡30日内单日最大挂失次数。
其中,挂失类型标签为正常挂失和异常挂失,获取多个挂失交易数据样本 与对应的挂失类型标签作为初始逻辑回归模型的训练样本。
S402,根据挂失交易数据样本和对应的挂失类型标签,训练初始逻辑回归 模型得到逻辑回归模型。
逻辑回归模型一般用于二分类问题,对于给定的一些输入,输出结果是二 元化的离散值。假设挂失类型标签P表示一次挂失交易是否为恶意挂失,P应当 为一个二元变量,取值为0或1,那么可以进行如下定义:P为1时,为异常挂 失,P为0时,为正常挂失。
逻辑回归的模型如下:
Figure BDA0003604786010000101
将上述逻辑回归模型公式进行转换得到逻辑回归函数,具体如下:
Figure BDA0003604786010000102
其中,P表示挂失类型标签,Xi表示挂失交易相关的各项指标,βi表示各项 指标Xi的系数。
在本实施例中,对初始逻辑回归模型进行训练时,将挂失交易方式、挂失 交易结果、挂失交易过程信息核对是否成功、挂失致电号码所在地区等挂失交 易数据以及对应的挂失类型标签输入到逻辑回归函数中,进行逻辑回归分析即 可得到βi参数的估计值。进一步地,可以根据预测挂失类型分类结果与挂失类型 标签构成混淆矩阵,如下表1所示:
表1
Figure BDA0003604786010000103
其中,真正例(True Positive,TP):真实类别为异常挂失交易,预测类别 为异常挂失交易;假正例(False Positive,FP):真实类别为正常挂失,预测类 别为异常挂失;假负例(False Negative,FN):真实类别为异常挂失,预测类 别为正常挂失;真负例(TrueNegative,TN):真实类别为正常挂失,预测类 别为异常挂失。
根据上述表1可以计算准确率(Accuracy),准确率可以衡量所有样本被正 确分类的比例:
Figure BDA0003604786010000111
精确率(Precision)为预测为异常挂失的挂失交易数据样本中,真正的异常 挂失数据交易样本所占的比例:
Figure BDA0003604786010000112
召回率(Recall):真正的异常挂失交易样本中,预测正确的比例:
Figure BDA0003604786010000113
除了上述准确率、精确率和召回率可以评价逻辑回归模型的分类能力,同 时,ROC曲线和AUC也常被用来评价一个二值分类器的优劣。为此,还可以利 用TPR和FPR两个指标评价逻辑回归模型的分类能力。其中,TPR是衡量模型 正确程度的指标,FPR是衡量模型错误程度的指标。对于一个预测结果,TPR 越高越好,而FPR越低越好。将逻辑回归模型的阈值从0缓慢增加到1,记录 相应的TPR、FPR值,则可以绘出ROC曲线,ROC曲线下的面积被称为AUC, AUC越大,逻辑回归模型的预测效果越好。
本申请实施例中,获取挂失交易数据样本和对应的挂失类型标签,将挂失 交易数据样本和对应的挂失类型标签输入到初始逻辑回归模型得到逻辑回归模 型。本方法中逻辑回归模型适合二分类问题,不需要缩放输入特征,而且在对 样本进行分类的时候,计算量仅仅只和特征的数目相关,训练速度快。
图5为一个实施例中初始随机森林模型训练过程的流程示意图,如图5所 示,本实施例涉及的是如何根据挂失交易数据样本和对应的挂失类型标签,训 练初始随机森林模型得到随机森林模型的一种可能的实现方式,包括以下步骤:
S501,获取挂失交易数据样本和对应的挂失类型标签;
本实施例具体实现方式可见上述S401。
S502,根据挂失交易数据样本和对应的挂失类型标签,训练初始随机森林 模型得到随机森林模型。
在本实施例中,从N个挂失交易数据样本中有放回的随机选取n个挂失交 易数据样本作为单颗决策树的训练集,假设,每个挂失交易数据样本中包括M 个属性特征,从中随机选取m个属性特征,从第T棵决策树的根节点出发,对 节点计算m个属性特征的信息增益,选择信息增益最大的属性特征作为决策树 根节点,根据该特征的不同取值建立子节点;对每个子节点都递归调用上述信 息增益的方法生成新的子节点,直到叶子节点上的所有样本都属于同一类,则 第T棵决策树构建完成。
进一步地,采用上述方法共建立S棵决策树,对于S棵决策树,采用投票 法,确定最终的分类模型,即随机森林模型。
本申请实施例中,在获取挂失交易数据样本和对应的挂失类型标签后,将 挂失交易数据样本和对应的挂失类型标签输入到初始随机森林模型,对初始随 机森林模型进行训练,从而得到随机森林模型。本方法中随机森林即使存在部 分数据缺失的情况,也能保持很高的分类精度,对异常值、缺失值不敏感。进 一步地,因为特征子集是随机选择的,能够处理数量庞大的高维度的特征,且 不需要进行降维;而且通过生成树状结构判断各个特征的重要性,能够又凶啊 评估各个特征在分类问题上的重要性。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭 头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。 除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤 可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部 分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一 时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也 不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至 少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的 挂失类型识别方法的挂失类型识别装置。该装置所提供的解决问题的实现方案 与上述方法中所记载的实现方案相似,故下面所提供的一个或多个挂失类型识 别装置实施例中的具体限定可以参见上文中对于挂失类型识别方法的限定,在 此不再赘述。
在一个实施例中,如图6所示,提供了一种挂失类型识别装置,包括:获 取模块11、输入模块12和确定模块13,其中:
获取模块11,用于获取待识别银行卡的挂失交易数据;
输入模块12,用于将挂失交易数据分别输入多个目标模型中,得到各目标 模型输出的针对待识别银行卡的挂失类型;
确定模块13,用于根据各目标模型输出的针对待识别银行卡的挂失类型, 确定待识别银行卡的目标挂失类型。
在一个实施例中,确定模块,包括:
第一确定单元,用于根据各目标模型输出的针对待识别银行卡的挂失类型, 从各挂失类型中确定异常挂失类型的数量;
第二确定单元,用于确定异常挂失类型的数量与挂失类型的总数量的比值;
第三确定单元,用于根据比值确定待识别银行卡的目标挂失类型。
在一个实施例中,第三确定单元还用于在比值大于第一预设比值的情况下, 确定待识别银行卡的目标挂失类型为第一异常风险程度的异常挂失类型。
在一个实施例中,第三确定单元还用于在比值大于第二预设比值且小于等 于第一预设比值的情况下,确定待识别银行卡的目标挂失类型为第二异常风险 程度的异常挂失类型,其中,第二异常风险程度小于第一异常风险程度。
在一个实施例中,第三确定单元还用于在比值小于第二预设比值的情况下, 确定待识别银行卡的目标挂失类型为正常挂失类型。
在一个实施例中,输入模块,包括:
第一输入单元,用于将挂失交易数据输入逻辑回归模型中,得到第一挂失 类型;
第二输入单元,用于将挂失交易数据输入随机森林模型中,得到第二挂失 类型。
在一个实施例中,输入模块,还包括:
第一获取单元,用于获取挂失交易数据样本和对应的挂失类型标签;
第一训练单元,用于根据挂失交易数据样本和对应的挂失类型标签,训练 初始逻辑回归模型得到逻辑回归模型。
在一个实施例中,输入模块,还包括:
第二获取单元,用于获取挂失交易数据样本和对应的挂失类型标签;
第二训练单元,用于根据挂失交易数据样本和对应的挂失类型标签,训练 初始随机森林模型得到随机森林模型。
上述挂失类型识别装置中的各个模块可全部或部分通过软件、硬件及其组 合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中, 也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以 上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其 内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、 存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提 供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。 该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存 储介质中的操作***和计算机程序的运行提供环境。该计算机设备的通信接口 用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂 窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种挂失类型识别方法。该计算机设备的显示屏可以是液晶显示屏或者电 子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可 以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、 触控板或鼠标等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关 的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定, 具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件, 或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器 中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待识别银行卡的挂失交易数据;
将挂失交易数据分别输入多个目标模型中,得到各目标模型输出的针对待 识别银行卡的挂失类型;
根据各目标模型输出的针对待识别银行卡的挂失类型,确定待识别银行卡 的目标挂失类型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据各目标模型输出的针对待识别银行卡的挂失类型,从各挂失类型中确 定异常挂失类型的数量;
确定异常挂失类型的数量与挂失类型的总数量的比值;
根据比值确定待识别银行卡的目标挂失类型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若比值大于第一预设比值,则确定待识别银行卡的目标挂失类型为第一异 常风险程度的异常挂失类型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若比值大于第二预设比值且小于等于第一预设比值,则确定待识别银行卡 的目标挂失类型为第二异常风险程度的异常挂失类型,其中,第二异常风险程 度小于第一异常风险程度。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若比值小于第二预设比值,则确定待识别银行卡的目标挂失类型为正常挂失类型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将挂失交易数据输入逻辑回归模型中,得到第一挂失类型;
将挂失交易数据输入随机森林模型中,得到第二挂失类型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取挂失交易数据样本和对应的挂失类型标签;
根据挂失交易数据样本和对应的挂失类型标签,训练初始逻辑回归模型得 到逻辑回归模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取挂失交易数据样本和对应的挂失类型标签;
根据挂失交易数据样本和对应的挂失类型标签,训练初始随机森林模型得 到随机森林模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程 序,计算机程序被处理器执行时实现以下步骤:
获取待识别银行卡的挂失交易数据;
将挂失交易数据分别输入多个目标模型中,得到各目标模型输出的针对待 识别银行卡的挂失类型;
根据各目标模型输出的针对待识别银行卡的挂失类型,确定待识别银行卡 的目标挂失类型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据各目标模型输出的针对待识别银行卡的挂失类型,从各挂失类型中确 定异常挂失类型的数量;
确定异常挂失类型的数量与挂失类型的总数量的比值;
根据比值确定待识别银行卡的目标挂失类型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若比值大于第一预设比值,则确定待识别银行卡的目标挂失类型为第一异 常风险程度的异常挂失类型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若比值大于第二预设比值且小于等于第一预设比值,则确定待识别银行卡 的目标挂失类型为第二异常风险程度的异常挂失类型,其中,第二异常风险程 度小于第一异常风险程度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若比值小于第二预设比值,则确定待识别银行卡的目标挂失类型为正常挂失类型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将挂失交易数据输入逻辑回归模型中,得到第一挂失类型;
将挂失交易数据输入随机森林模型中,得到第二挂失类型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取挂失交易数据样本和对应的挂失类型标签;
根据挂失交易数据样本和对应的挂失类型标签,训练初始逻辑回归模型得 到逻辑回归模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取挂失交易数据样本和对应的挂失类型标签;
根据挂失交易数据样本和对应的挂失类型标签,训练初始随机森林模型得 到随机森林模型。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算 机程序被处理器执行时实现以下步骤:
获取待识别银行卡的挂失交易数据;
将挂失交易数据分别输入多个目标模型中,得到各目标模型输出的针对待 识别银行卡的挂失类型;
根据各目标模型输出的针对待识别银行卡的挂失类型,确定待识别银行卡 的目标挂失类型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据各目标模型输出的针对待识别银行卡的挂失类型,从各挂失类型中确 定异常挂失类型的数量;
确定异常挂失类型的数量与挂失类型的总数量的比值;
根据比值确定待识别银行卡的目标挂失类型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若比值大于第一预设比值,则确定待识别银行卡的目标挂失类型为第一异 常风险程度的异常挂失类型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若比值大于第二预设比值且小于等于第一预设比值,则确定待识别银行卡 的目标挂失类型为第二异常风险程度的异常挂失类型,其中,第二异常风险程 度小于第一异常风险程度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若比值小于第二预设比值,则确定待识别银行卡的目标挂失类型为正常挂失类型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将挂失交易数据输入逻辑回归模型中,得到第一挂失类型;
将挂失交易数据输入随机森林模型中,得到第二挂失类型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取挂失交易数据样本和对应的挂失类型标签;
根据挂失交易数据样本和对应的挂失类型标签,训练初始逻辑回归模型得 到逻辑回归模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取挂失交易数据样本和对应的挂失类型标签;
根据挂失交易数据样本和对应的挂失类型标签,训练初始随机森林模型得到随机森林模型。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、 用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示 的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于 一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述 各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、 数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一 种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、 软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、 磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器 (Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase ChangeMemory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器 (Random AccessMemory,RAM)或外部高速缓冲存储器等。作为说明而非局 限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory, DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库 和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数 据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计 算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述 实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特 征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细, 但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域 的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和 改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利 要求为准。

Claims (12)

1.一种挂失类型识别方法,其特征在于,所述方法包括:
获取待识别银行卡的挂失交易数据;
将所述挂失交易数据分别输入多个目标模型中,得到各所述目标模型输出的针对所述待识别银行卡的挂失类型;
根据各所述目标模型输出的针对所述待识别银行卡的挂失类型,确定所述待识别银行卡的目标挂失类型。
2.根据权利要求1所述的方法,其特征在于,所述根据各所述目标模型输出的针对所述待识别银行卡的挂失类型,确定所述待识别银行卡的目标挂失类型,包括:
根据各所述目标模型输出的针对所述待识别银行卡的挂失类型,从各所述挂失类型中确定异常挂失类型的数量;
确定所述异常挂失类型的数量与所述挂失类型的总数量的比值;
根据所述比值确定所述待识别银行卡的目标挂失类型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述比值确定所述待识别银行卡的目标挂失类型,包括:
若所述比值大于第一预设比值,则确定所述待识别银行卡的目标挂失类型为第一异常风险程度的异常挂失类型。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若所述比值大于第二预设比值且小于等于所述第一预设比值,则确定所述待识别银行卡的目标挂失类型为第二异常风险程度的异常挂失类型,其中,所述第二异常风险程度小于所述第一异常风险程度。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若所述比值小于所述第二预设比值,则确定所述待识别银行卡的目标挂失类型为正常挂失类型。
6.根据权利要求1所述的方法,其特征在于,所述多个目标模型包括逻辑回归模型和随机森林模型;所述将所述挂失交易数据分别输入多个目标模型中,得到各所述目标模型输出的针对所述待识别银行卡的挂失类型,包括:
将所述挂失交易数据输入所述逻辑回归模型中,得到第一挂失类型;
将所述挂失交易数据输入所述随机森林模型中,得到第二挂失类型。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取挂失交易数据样本和对应的挂失类型标签;
根据所述挂失交易数据样本和对应的挂失类型标签,训练初始逻辑回归模型得到所述逻辑回归模型。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取挂失交易数据样本和对应的挂失类型标签;
根据所述挂失交易数据样本和对应的挂失类型标签,训练初始随机森林模型得到所述随机森林模型。
9.一种挂失类型识别装置,其特征在于,所述装置包括:
获取模块,用于获取待识别银行卡的挂失交易数据;
输入模块,用于将所述挂失交易数据分别输入多个目标模型中,得到各所述目标模型输出的针对所述待识别银行卡的挂失类型;
确定模块,用于根据各所述目标模型输出的针对所述待识别银行卡的挂失类型,确定所述待识别银行卡的目标挂失类型。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
12.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
CN202210414341.8A 2022-04-20 2022-04-20 挂失类型识别方法、装置、设备、存储介质和程序产品 Pending CN115034873A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210414341.8A CN115034873A (zh) 2022-04-20 2022-04-20 挂失类型识别方法、装置、设备、存储介质和程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210414341.8A CN115034873A (zh) 2022-04-20 2022-04-20 挂失类型识别方法、装置、设备、存储介质和程序产品

Publications (1)

Publication Number Publication Date
CN115034873A true CN115034873A (zh) 2022-09-09

Family

ID=83119032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210414341.8A Pending CN115034873A (zh) 2022-04-20 2022-04-20 挂失类型识别方法、装置、设备、存储介质和程序产品

Country Status (1)

Country Link
CN (1) CN115034873A (zh)

Similar Documents

Publication Publication Date Title
CN108876133B (zh) 基于业务信息的风险评估处理方法、装置、服务器和介质
CN108898418B (zh) 用户账号检测方法、装置、计算机设备和存储介质
CN113642030B (zh) 敏感数据多层识别方法
CN109801151B (zh) 财务造假风险监控方法、装置、计算机设备和存储介质
CN114693192A (zh) 风控决策方法、装置、计算机设备和存储介质
CN111192153A (zh) 人群关系网络构建方法、装置、计算机设备和存储介质
CN113538070A (zh) 用户生命价值周期检测方法、装置和计算机设备
CN111415167B (zh) 网络欺诈交易检测方法及装置、计算机存储介质和终端
CN116414815A (zh) 数据质量检测方法、装置、计算机设备和存储介质
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
CN115630221A (zh) 终端应用界面展示数据处理方法、装置及计算机设备
CN112990989B (zh) 价值预测模型输入数据生成方法、装置、设备和介质
WO2021129368A1 (zh) 一种客户类型的确定方法及装置
US11694208B2 (en) Self learning machine learning transaction scores adjustment via normalization thereof accounting for underlying transaction score bases relating to an occurrence of fraud in a transaction
CN110619564B (zh) 一种反欺诈特征生成方法和装置
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
CN115034873A (zh) 挂失类型识别方法、装置、设备、存储介质和程序产品
CN113706258B (zh) 基于组合模型的产品推荐方法、装置、设备及存储介质
CN114170000A (zh) ***用户风险类别识别方法、装置、计算机设备和介质
US11651461B1 (en) Artificial intelligence crime linking network
CN113723524B (zh) 基于预测模型的数据处理方法、相关设备及介质
CN112100660B (zh) 一种日志文件敏感信息检测方法及装置
US20240185090A1 (en) Assessment of artificial intelligence errors using machine learning
CN117853227A (zh) 风险评估方法、装置、计算机设备和存储介质
CN117853217A (zh) 数据隐私保护的金融违约率预测方法、装置以及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination