CN111709844A - 一种保险洗钱人员检测方法、装置和计算机可读存储介质 - Google Patents

一种保险洗钱人员检测方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN111709844A
CN111709844A CN202010404117.1A CN202010404117A CN111709844A CN 111709844 A CN111709844 A CN 111709844A CN 202010404117 A CN202010404117 A CN 202010404117A CN 111709844 A CN111709844 A CN 111709844A
Authority
CN
China
Prior art keywords
money laundering
insurance
preset
information
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010404117.1A
Other languages
English (en)
Inventor
袁杰
陈秀坤
张�杰
高古明
于皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mininglamp Software System Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN202010404117.1A priority Critical patent/CN111709844A/zh
Publication of CN111709844A publication Critical patent/CN111709844A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请实施例公开了一种保险洗钱人员检测方法、装置和计算机可读存储介质,该方法包括:获取关于一份或多份保险业务信息的保险业务特征矩阵以及训练好的保险洗钱检测模型;将保险业务特征矩阵输入保险洗钱检测模型;将保险洗钱检测模型的输出结果作为保险业务信息是否涉及保险洗钱的检测结果;将确定为涉及保险洗钱的保险业务信息的相关人员确定为保险洗钱嫌疑人;保险洗钱检测模型是以包含预设的洗钱特征的洗钱业务特征矩阵作为训练数据对预设的机器学习模型训练获得的。该实施例方案不依赖于专家规则,有效地对异常洗钱人员进行筛查,提高工作效率,降低排查难度,对海量数据快速处理,大大改善了传统筛查方式存在的弊端。

Description

一种保险洗钱人员检测方法、装置和计算机可读存储介质
技术领域
本文涉及犯罪人员筛查技术,尤指一种保险洗钱人员检测方法、装置和计算机可读存储介质。
背景技术
许多不法分子的洗钱手段已经蔓延到基层的保险领域,开始侵蚀金融保险体系,由于基层的保险机构反洗钱风险意识较差,内部的管控机制以及业务流程存在诸多隐藏风险,因此,准确识别洗钱风险十分有必要。
现有的保险领域反洗钱业务开展主要是通过积累多年的人工经验,通过人工总结出来的多条规则,对保险客户进行等级划分,不同等级客户的规则稍有不同,进一步筛选后通过人工进行甄别。
现有技术方案严重依赖专家规则,规则小量且有限,在大数据场景下难以适用,筛选出的结果集依然庞大,仍需大量人工精力。并且专家规则只对部分地区,特定的人群较为适用,不同地区的专家意见不同,规则可能不尽相同,难以复用。
发明内容
本申请实施例提供了一种保险洗钱人员检测方法、装置和计算机可读存储介质,能够不依赖于专家规则,准确地识别洗钱风险,有效地对异常洗钱人员进行筛查,提高工作效率,降低排查难度,对海量数据快速处理,大大改善了传统筛查方式存在的弊端。
本申请实施例提供了一种保险洗钱人员检测方法,所述方法可以包括:
获取关于一份或多份保险业务信息的保险业务特征矩阵以及训练好的保险洗钱检测模型;所述保险业务特征矩阵是用于表征预设的业务特征在每一份保险业务信息中相对应的信息的矩阵;
将所述保险业务特征矩阵作为输入数据输入所述保险洗钱检测模型;
将所述保险洗钱检测模型的输出结果作为所述一份或多份保险业务信息是否涉及保险洗钱的检测结果;
将确定为涉及保险洗钱的保险业务信息的相关人员确定为保险洗钱嫌疑人;所述相关人员包括以下任意一种或多种:投保人、被保人和受益人;
其中,所述保险洗钱检测模型是以包含预设的洗钱特征的洗钱业务特征矩阵作为训练数据,对预设的机器学习模型进行训练获得的。
本申请实施例还提出了一种保险洗钱人员检测装置,可以包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任意一项所述的保险洗钱人员检测方法。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的保险洗钱人员检测方法。
与相关技术相比,本申请实施例包括:获取关于一份或多份保险业务信息的保险业务特征矩阵以及训练好的保险洗钱检测模型;所述保险业务特征矩阵是用于表征预设的业务特征在每一份保险业务信息中相对应的信息的矩阵;将所述保险业务特征矩阵作为输入数据输入所述保险洗钱检测模型;将所述保险洗钱检测模型的输出结果作为所述一份或多份保险业务信息是否涉及保险洗钱的检测结果;将确定为涉及保险洗钱的保险业务信息的相关人员确定为保险洗钱嫌疑人;所述相关人员包括以下任意一种或多种:投保人、被保人和受益人;其中,所述保险洗钱检测模型是以包含预设的洗钱特征的洗钱业务特征矩阵作为训练数据,对预设的机器学习模型进行训练获得的。通过该实施例方案,能够不依赖于专家规则,基于训练好的机器学习模型准确地识别洗钱风险,有效地对异常洗钱人员进行筛查,提高工作效率,降低排查难度,对海量数据快速处理,大大改善了传统筛查方式存在的弊端。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。
附图说明
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本申请实施例的保险洗钱人员检测方法流程图;
图2为本申请实施例的获取保险洗钱检测模型的方法流程图;
图3为本申请实施例的获取保险洗钱检测模型的方法示意图;
图4为本申请实施例的保险洗钱人员检测装置组成框图。
具体实施方式
本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。
本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。
此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。
本申请实施例提供了一种保险洗钱人员检测方法,如图1所示,所述方法可以包括步骤S101-S104:
S101、获取关于一份或多份保险业务信息的保险业务特征矩阵以及训练好的保险洗钱检测模型;其中,所述保险业务特征矩阵是用于表征预设的业务特征在每一份保险业务信息中相对应的信息的矩阵;所述保险洗钱检测模型是以包含预设的洗钱特征的洗钱业务特征矩阵作为训练数据,对预设的机器学习模型进行训练获得的。
在本申请的示例性实施例中,针对保险领域的反洗钱业务,提出了一种基于机器学习模型识别异常人员的方法,采用机器学习中无监督的方式(如孤立森林算法),无需依赖大量人工规则,可以从数据本身学习一些特定的关联关系,帮助挖掘出异常的洗钱风险较大的人员。
在本申请的示例性实施例中,该实施例方案可以基于保险企业日常处理的大量保险业务,将大量保险业务信息输入训练好的保险洗钱检测模型,以对洗钱业务进行筛查。
在本申请的示例性实施例中,为了便于保险洗钱检测模型的识别,该大量保险业务信息可以转化为关于一份或多份保险业务信息的保险业务特征矩阵,作为保险洗钱检测模型的输入数据。
在本申请的示例性实施例中,所述获取关于一份或多份保险业务信息的保险业务特征矩阵可以包括:
获取一份或多份保险业务信息,并从所述一份或多份保险业务信息中提取出一个或多个预设特征;
按照预设顺序以向量的形式罗列出每一份保险业务信息对应的一个或多个预设特征的信息,以获取每一个保险业务信息对应的保险业务特征向量;
由全部保险业务信息对应的全部保险业务特征向量组成所述保险业务特征矩阵。
在本申请的示例性实施例中,所述保险业务信息可以包括但不限于以下任意一种或多种:保单信息表的信息、投保人信息表的信息、被保人信息表的信息、受益人信息表的信息以及保单交易记录表的信息。
在本申请的示例性实施例中,可以从上述的各种信息表中抽取出用于进行洗钱风险识别的有用信息,即上述的预设特征。
在本申请的示例性实施例中,所述预设特征可以包括但不限于以下任意一种或多种:
是否失效表单、退保办理时间、退保损失累计金额、保险业务信息的非相关人员退保累计获取金额、退保银行***与办理银行***的一致性、现金支付的保单金额、保单投保人变更总次数、保单投保人变更时间差、保单投保人变更时间段是否处于节假日前后、预设时长内(例如,3个月以内)的保单业务变更次数、投保人年龄、投保人国籍、投保人职业以及投保人与退保办理人的一致性。
在本申请的示例性实施例中,在获取一份或多份保险业务信息的预设特征以后,可以对这些预设特征进行预处理,获取一个保险业务特征向量,作为保险洗钱检测模型的输入,从而鉴定出一份或多份保险业务信息是否为与保险洗钱相关的业务信息,从而便于将这些保险业务信息的相关人员列为洗钱犯罪嫌疑人,从而可以锁定目标,便于进一步侦查。
在本申请的示例性实施例中,对这些预设特征进行预处理可以包括:特征向量化和归一化操作。
在本申请的示例性实施例中,对这些预设特征进行特征向量化可以包括:按照预设顺序以向量的形式罗列出每一份保险业务信息对应的一个或多个预设特征的信息,以获取每一个保险业务信息对应的保险业务特征向量;通过与全部保险业务信息对应的全部保险业务特征向量组成保险业务特征矩阵。
在本申请的示例性实施例中,对这些预设特征进行归一化操作可以包括:
对所述保险业务特征矩阵进行无量纲化操作,并去除所述保险业务特征矩阵中每一列的中的最大值max和最小值min,以获取每列的特征值yi
Figure BDA0002490621760000061
其中,yi是指每一列中的第i个特征值,i为自然数。
在本申请的示例性实施例中,对于每一份保险业务信息对应的一个或多个预设特征的信息,都可以获得一个对应的保险业务特征向量,多份保险业务信息对应多个保险业务特征向量,多个保险业务特征向量可以组合成保险业务特征矩阵。
在本申请的示例性实施例中,由于特征维度的衡量标准不一样,不同维度的特征值的取值范围也不大相同,因此要进行去量纲化操作。并且可以通过最大、最小标准化的方法,对特征值进行归一化操作。即,对于保险业务特征矩阵的每列特征来说,去除特征列中的最大值max和特征列中的最小值min,获取每列特征值yi
Figure BDA0002490621760000062
在本申请的示例性实施例中,获取训练好的保险洗钱检测模型可以包括:
调取预先创建并已经训练好的保险洗钱检测模型;或者,
创建机器学习模型,并对所述机器学习模型进行训练,获取所述保险洗钱检测模型。
在本申请的示例性实施例中,在进行洗钱风险筛查过程中,可以直接调取已经训练好的保险洗钱检测模型,也可以临时建立并训练机器学习模型来获取一个保险洗钱检测模型。
在本申请的示例性实施例中,如图2、图3所示,所述创建机器学习模型,并对所述机器学习模型进行训练,获取所述保险洗钱检测模型可以包括步骤S201-S203:
S201、获取已经确定为涉及保险洗钱业务的洗钱保险业务信息集,从所述洗钱保险业务信息集中获取一种或多种预设的洗钱特征,由一种或多种预设的洗钱特征构成所述洗钱业务特征矩阵,作为训练数据。
在本申请的示例性实施例中,可以利用预先保存的已经确定为涉及保险洗钱业务的洗钱保险业务信息集为基础,提取一种或多种预设的洗钱特征,来构建训练数据(或称训练数据集)。
在本申请的示例性实施例中,该洗钱特征可以为能够表征一份洗钱保险业务对应的保险业务信息中不符合正常保险逻辑、具有洗钱行为指向的信息特征。
在本申请的示例性实施例中,所述预设的洗钱特征可以包括以下任意一种或多种:
当前表单为失效表单;
退保办理时间与投保办理时间的时长差距小于预设的时长阈值;
退保损失累计金额大于或等于预设的第一金额阈值;
保险业务信息的非相关人员退保累计获取金额大于或等于预设的第二金额阈值;
退保银行***与办理银行***不一致;
现金支付的保单金额大于或等于预设的第三金额阈值;
保单投保人变更总次数大于或等于预设的第一次数阈值;
预设时长内的保单业务变更次数大于或等于预设的第二次数阈值;
保单投保人变更时间差小于或等于预设的时差阈值;
保单投保人变更时间段处于节假日前后;
投保人年龄大于预设的年龄阈值;
投保人国籍为异国国籍;
投保人的就职企业属于预设的洗钱高危企业范围;以及,
投保人与退保办理人不一致。
在本申请的示例性实施例中,该预设的洗钱特征可以根据不同的需求和不同的应用场景自行设定和组合,对于具体内容不做作详细限制。
在本申请的示例性实施例中,所述由一种或多种预设的洗钱特征构成所述洗钱业务特征矩阵可以包括:
获取每一份洗钱保险业务信息对应的具有所述洗钱特征的洗钱业务特征向量,以通过与全部洗钱保险业务信息对应的全部洗钱业务特征向量组成所述洗钱业务特征矩阵;
其中,所述洗钱业务特征向量是指按照预设顺序以向量的形式罗列出每一份洗钱保险业务信息对应的一种或多种洗钱特征的信息。
所述方法还包括:在将所述洗钱业务特征矩阵作为所述训练数据之前,对所述洗钱业务特征矩阵进行预处理;所述预处理包括:缺失值补充和归一化操作;
对所述洗钱业务特征矩阵进行缺失值补充包括:
对所述洗钱业务特征矩阵中每一个具有缺失值的洗钱特征采用以下任意一种或多种方式对缺失值部分进行填充:均值填充、众数填充、中位数填充以及补0填充;
对所述洗钱业务特征矩阵进行归一化操作包括:
对所述洗钱业务特征矩阵进行无量纲化操作,并去除所述洗钱业务特征矩阵中每一列的中的最大值MAX和最小值MIN,以获取每列的特征值xi
Figure BDA0002490621760000081
其中,xi是指每一列中的第i个特征值,i为自然数。
在本申请的示例性实施例中,对于每一份洗钱保险业务信息对应的一种或多种预设的洗钱特征,都可以获得一个对应的洗钱业务特征向量,多份洗钱保险业务信息对应多个洗钱业务特征向量,多个洗钱业务特征向量可以组合成洗钱业务特征矩阵。
在本申请的示例性实施例中,构建好的洗钱业务特征矩阵可以为下面的矩阵A,矩阵A可以表示为:
Figure BDA0002490621760000091
其中,fai和fmi表示不同维度的洗钱特征(即不同类型的洗钱特征),fai表示维度a(第a类洗钱特征)上第n个样本(第n份洗钱保险业务信息)的取值(可以为具体数值,例如天数,“是”或“否”等回答的代表数值等,也可以为具体的答案描述);i为1到n的自然数,n是数据集的总样本数(即洗钱保险业务信息总份数)。
在本申请的示例性实施例中,对于获得的每一笔洗钱保单交易记录(分别对应一份洗钱保险业务信息),通过洗钱特征抽取都可以获得一个对应的洗钱业务特征向量。但是每一笔洗钱保单交易记录对应的洗钱特征的特征值可能缺失,需要对缺失值的部分进行补全。缺失值的补全可以采用以下任意一种或多种方式:
1、均值填充:通过一个洗钱特征列中非缺失值的部分计算平均值,将平均值补全到缺失值部分;
2、众数填充:通过一个洗钱特征列中非缺失值的部分计算众数,将众数补全到缺失值部分;
3、中位数填充:通过一个洗钱特征列中非缺失值的部分计算中位数,将中位数补全到缺失值部分;
4、补0填充:将0直接填充到所有的缺失值部分。
在本申请的示例性实施例中,具体采用哪一种填充方式可以根据最后试验的缺失值补齐效果进行选择。
在本申请的示例性实施例中,对于经过缺失值填充后的洗钱业务特征矩阵,接下可以进行特征归一化操作。由于特征维度的衡量标准不一样,不同维度的特征值的取值范围也不大相同,因此要进行去量纲化操作。并且可以通过最大、最小标准化的方法,对特征值进行归一化操作。即,对于洗钱业务特征矩阵的每列特征来说,去除特征列中的最大值MAX和最小值MIN,获取每列特征值xi
Figure BDA0002490621760000101
在本申请的示例性实施例中,所述方法还可以包括:
在对所述洗钱业务特征矩阵进行归一化操作之后,通过预设的相关性计算式计算所述洗钱业务特征矩阵中任意两个特征维度之间的相关性;将相关性计算结果大于预设的相关性阈值的两个特征维度中的任意一个特征维度去除,实现对所述洗钱业务特征矩阵的筛选。
在本申请的示例性实施例中,如果已构建好机器学习模型,可能由于所述洗钱业务特征矩阵中特征维度很大,影响计算的效率,甚至可能对预测准确率有影响。其中,洗钱业务特征矩阵中的一些特征可能包含相同或者重复的信息,从而造成了特征维度较大,因此,在得到上述的机器学习模型后,可以通过特征相关性分析和选择,丢弃一部分相关性较大的特征。
在本申请的示例性实施例中,预设的相关性计算式(即特征相关性分析方法)可以包括:下述的皮尔逊相关系数corr的计算式(即,通过计算特征维度fi与特征维度fj的相关性corr):
Figure BDA0002490621760000102
其中,cov(fi,fj)表示特征维度fi与特征维度fj的协方差,
Figure BDA0002490621760000103
表示特征维度fi的标准差,
Figure BDA0002490621760000104
表示特征维度fj的标准差,E(X)表示X的均值。
在本申请的示例性实施例中,对于洗钱业务特征矩阵中两两特征维度之间的皮尔逊相关系数corr,如果计算出任意两个特征维度的皮尔逊相关系数corr大于预设的相关性阈值,例如0.85,那么可以只保留该两个特征维度之中的一个特征维度即可。
在本申请的示例性实施例中,洗钱业务特征矩阵进行上述的相关性计算以后,可以将最终得到的洗钱业务特征矩阵中的数据作为训练数据,用于保险洗钱检测模型的训练。
S202、采用预设的机器学习算法构建机器学习模型。
在本申请的示例性实施例中,该机器学习算法可以选用机器学习中无监督的孤立森林算法。
在本申请的示例性实施例中,步骤S201和步骤S202可以不分先后,同时进行,也可以任一步骤先执行,对于该两个步骤的先后顺序不做限定。
S203、采用所述训练数据对所述机器学习模型进行训练,获取所述保险洗钱检测模型。
在本申请的示例性实施例中,将构建好的洗钱业务特征矩阵输入到基于孤立森林算法的保险洗钱检测模型中,孤立森林算法可以通过构建孤立树(iTree)对洗钱业务特征矩阵中的信息数据进行训练学习,计算不同特征维度下,不同密度分布下的异常点,对输入洗钱业务特征矩阵的每一行交易记录进行异常值打分,给出每一笔交易记录的异常值分数(数值范围可以在0-1之间,分值越高,越异常)。最终将异常分值最高的前几个结果(例如100个)作为预测名单(涉及洗钱的保单名单),进行输出,以便于公安机关进一步验证。
S102、将所述保险业务特征矩阵作为输入数据输入所述保险洗钱检测模型。
在本申请的示例性实施例中,在通过步骤S101获取关于一份或多份保险业务信息的保险业务特征矩阵(包含一个或多个预设特征)以及保险洗钱检测模型以后,可以直接将该保险业务特征矩阵作为输入,输入保险洗钱检测模型中。
S103、将所述保险洗钱检测模型的输出结果作为所述一份或多份保险业务信息是否涉及保险洗钱的检测结果。
在本申请的示例性实施例中,通过保险洗钱检测模型中包含的孤立森林算法,可以直接根据输入的保险业务特征矩阵中每一条保险业务特征向量对应的预设特征的信息计算出相应的多份保单业务信息是否具有洗钱嫌疑,从而获得对于多份保单业务信息的检测结果。
S104、将确定为涉及保险洗钱的保险业务信息的相关人员确定为保险洗钱嫌疑人;所述相关人员包括以下任意一种或多种:投保人、被保人和受益人。
在本申请的示例性实施例中,如果一份或多份保单业务信息涉及洗钱业务,则,与这些保单业务信息相关的投保人、被保人和受益人等均可以确定为洗钱嫌疑人,因此,便于公安机关锁定目标,对洗钱犯罪进行进一步侦查。
在本申请的示例性实施例中,采用机器学习中无监督的方式,无需依赖大量人工规则,可以从数据本身学习一些特定的关联关系,帮助挖掘出异常的洗钱风险较大的人员。具体地,可以利用机器学习中无监督的孤立森林算法,通过构建保险洗钱检测模型,对关于一份或多份保险业务信息的保险业务特征矩阵进行检测,有效的给出存在异常洗钱嫌疑的保险业务信息对应的保单名单,大大改善了传统的依赖于专家规则、工作效率低下、排查难度较高、海量数据处理速度慢的洗钱风险筛查方式。
本申请实施例还提出了一种保险洗钱人员检测装置1,如图4所示,可以包括处理器11和计算机可读存储介质12,所述计算机可读存储介质12中存储有指令,当所述指令被所述处理器11执行时,实现上述任意一项所述的保险洗钱人员检测方法。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的保险洗钱人员检测方法。
在本申请的示例性实施例中,前述的方法实施例中的任何实施例均适用于该装置实施例以及计算机可读存储介质实施例中,在此不再一一赘述。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、***、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (10)

1.一种保险洗钱人员检测方法,其特征在于,所述方法包括:
获取关于一份或多份保险业务信息的保险业务特征矩阵以及训练好的保险洗钱检测模型;所述保险业务特征矩阵是用于表征预设的业务特征在每一份保险业务信息中相对应的信息的矩阵;
将所述保险业务特征矩阵作为输入数据输入所述保险洗钱检测模型;
将所述保险洗钱检测模型的输出结果作为所述一份或多份保险业务信息是否涉及保险洗钱的检测结果;
将确定为涉及保险洗钱的保险业务信息的相关人员确定为保险洗钱嫌疑人;所述相关人员包括以下任意一种或多种:投保人、被保人和受益人;
其中,所述保险洗钱检测模型是以包含预设的洗钱特征的洗钱业务特征矩阵作为训练数据,对预设的机器学习模型进行训练获得的。
2.根据权利要求1所述的保险洗钱人员检测方法,其特征在于,所述获取关于一份或多份保险业务信息的保险业务特征矩阵包括:
获取一份或多份保险业务信息,并从所述一份或多份保险业务信息中提取出一个或多个预设特征;
按照预设顺序以向量的形式罗列出每一份保险业务信息对应的一个或多个预设特征的信息,以获取每一个保险业务信息对应的保险业务特征向量;
由全部保险业务信息对应的全部保险业务特征向量组成所述保险业务特征矩阵。
3.根据权利要求2所述的保险洗钱人员检测方法,其特征在于,所述保险业务信息包括以下任意一种或多种:保单信息表的信息、投保人信息表的信息、被保人信息表的信息、受益人信息表的信息以及保单交易记录表的信息;
所述预设特征包括以下任意一种或多种:
是否失效表单、退保办理时间、退保损失累计金额、保险业务信息的非相关人员退保累计获取金额、退保银行***与办理银行***的一致性、现金支付的保单金额、保单投保人变更总次数、保单投保人变更时间差、保单投保人变更时间段是否处于节假日前后、预设时长内的保单业务变更次数、投保人年龄、投保人国籍、投保人职业以及投保人与退保办理人的一致性。
4.根据权利要求1所述的保险洗钱人员检测方法,其特征在于,获取训练好的保险洗钱检测模型包括:
调取预先创建并已经训练好的保险洗钱检测模型;或者,
创建机器学习模型,并对所述机器学习模型进行训练,获取所述保险洗钱检测模型。
5.根据权利要求4所述的保险洗钱人员检测方法,其特征在于,所述创建机器学习模型,并对所述机器学习模型进行训练,获取所述保险洗钱检测模型包括:
获取已经确定为涉及保险洗钱业务的洗钱保险业务信息集,从所述洗钱保险业务信息集中获取一种或多种预设的洗钱特征,由一种或多种预设的洗钱特征构成所述洗钱业务特征矩阵,作为训练数据;
采用预设的机器学习算法构建机器学习模型;
采用所述训练数据对所述机器学习模型进行训练,获取所述保险洗钱检测模型。
6.根据权利要求5所述的保险洗钱人员检测方法,其特征在于,所述预设的机器学习算法包括:孤立森林算法;
所述预设的洗钱特征包括以下任意一种或多种:
当前表单为失效表单;
退保办理时间与投保办理时间的时长差距小于预设的时长阈值;
退保损失累计金额大于或等于预设的第一金额阈值;
保险业务信息的非相关人员退保累计获取金额大于或等于预设的第二金额阈值;
退保银行***与办理银行***不一致;
现金支付的保单金额大于或等于预设的第三金额阈值;
保单投保人变更总次数大于或等于预设的第一次数阈值;
预设时长内的保单业务变更次数大于或等于预设的第二次数阈值;
保单投保人变更时间差小于或等于预设的时差阈值;
保单投保人变更时间段处于节假日前后;
投保人年龄大于预设的年龄阈值;
投保人国籍为异国国籍;
投保人的就职企业属于预设的洗钱高危企业范围;以及,
投保人与退保办理人不一致。
7.根据权利要求5所述的保险洗钱人员检测方法,其特征在于,所述由一种或多种预设的洗钱特征构成所述洗钱业务特征矩阵包括:
获取每一份洗钱保险业务信息对应的具有所述洗钱特征的洗钱业务特征向量,以通过与全部洗钱保险业务信息对应的全部洗钱业务特征向量组成所述洗钱业务特征矩阵;
其中,所述洗钱业务特征向量是指按照预设顺序以向量的形式罗列出每一份洗钱保险业务信息对应的一种或多种洗钱特征的信息;
所述方法还包括:在将所述洗钱业务特征矩阵作为所述训练数据之前,对所述洗钱业务特征矩阵进行预处理;所述预处理包括:缺失值补充和归一化操作;
对所述洗钱业务特征矩阵进行缺失值补充包括:
对所述洗钱业务特征矩阵中每一个具有缺失值的洗钱特征采用以下任意一种或多种方式对缺失值部分进行填充:均值填充、众数填充、中位数填充以及补0填充;
对所述洗钱业务特征矩阵进行归一化操作包括:
对所述洗钱业务特征矩阵进行无量纲化操作,并去除所述洗钱业务特征矩阵中每一列中的最大值MAX和最小值MIN,以获取每列的特征值xi
Figure FDA0002490621750000041
其中,xi是指每一列中的第i个特征值,i为自然数。
8.根据权利要求7所述的保险洗钱人员检测方法,其特征在于,所述方法还包括:
在对所述洗钱业务特征矩阵进行归一化操作之后,通过预设的相关性计算式计算所述洗钱业务特征矩阵中任意两个特征维度之间的相关性;将相关性计算结果大于预设的相关性阈值的两个特征维度中的任意一个特征维度去除,实现对所述洗钱业务特征矩阵的筛选。
9.一种保险洗钱人员检测装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令被所述处理器执行时,实现如权利要求1-8任意一项所述的保险洗钱人员检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任意一项所述的保险洗钱人员检测方法。
CN202010404117.1A 2020-05-13 2020-05-13 一种保险洗钱人员检测方法、装置和计算机可读存储介质 Pending CN111709844A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010404117.1A CN111709844A (zh) 2020-05-13 2020-05-13 一种保险洗钱人员检测方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010404117.1A CN111709844A (zh) 2020-05-13 2020-05-13 一种保险洗钱人员检测方法、装置和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111709844A true CN111709844A (zh) 2020-09-25

Family

ID=72537808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010404117.1A Pending CN111709844A (zh) 2020-05-13 2020-05-13 一种保险洗钱人员检测方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111709844A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101950A (zh) * 2020-09-27 2020-12-18 中国建设银行股份有限公司 可疑交易监测模型特征提取方法及装置
CN112686762A (zh) * 2020-12-25 2021-04-20 中国平安人寿保险股份有限公司 保单数据违规检测方法、装置、计算机设备及存储介质
CN113568947A (zh) * 2021-07-21 2021-10-29 众安在线财产保险股份有限公司 数据处理方法、***以及计算机存储介质
CN113962817A (zh) * 2021-11-11 2022-01-21 泰康保险集团股份有限公司 异常人员识别方法及装置、电子设备和存储介质
CN118297730A (zh) * 2024-06-04 2024-07-05 中国人寿保险股份有限公司江苏省分公司 一种基于CIRST指纹匹配的保险行业pos代刷卡风险识别和预警方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952162A (zh) * 2016-01-07 2017-07-14 平安科技(深圳)有限公司 洗钱风险等级计算方法及***
CN108053087A (zh) * 2017-10-20 2018-05-18 深圳前海微众银行股份有限公司 反洗钱监测方法、设备及计算机可读存储介质
CN110046993A (zh) * 2018-12-15 2019-07-23 深圳壹账通智能科技有限公司 非法所得合法化行为监测方法、***、计算机装置及介质
CN110276618A (zh) * 2019-06-28 2019-09-24 第四范式(北京)技术有限公司 生成洗钱案宗预测模型、预测洗钱案宗的方法及***
CN111127200A (zh) * 2019-11-25 2020-05-08 中国建设银行股份有限公司 反洗钱可疑交易监测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952162A (zh) * 2016-01-07 2017-07-14 平安科技(深圳)有限公司 洗钱风险等级计算方法及***
CN108053087A (zh) * 2017-10-20 2018-05-18 深圳前海微众银行股份有限公司 反洗钱监测方法、设备及计算机可读存储介质
CN110046993A (zh) * 2018-12-15 2019-07-23 深圳壹账通智能科技有限公司 非法所得合法化行为监测方法、***、计算机装置及介质
CN110276618A (zh) * 2019-06-28 2019-09-24 第四范式(北京)技术有限公司 生成洗钱案宗预测模型、预测洗钱案宗的方法及***
CN111127200A (zh) * 2019-11-25 2020-05-08 中国建设银行股份有限公司 反洗钱可疑交易监测方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
向玲等: "保险业反洗钱智能监测模型研究", 《金融电子化》 *
罗素文等: ""机器学习技术在商业银行反洗钱领域的应用"", 《金融电子化》 *
赵东明等: ""寿险业客户洗钱风险等级分类管理工作研究——基于分类模型和***架构视角"", 《福建金融》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101950A (zh) * 2020-09-27 2020-12-18 中国建设银行股份有限公司 可疑交易监测模型特征提取方法及装置
CN112101950B (zh) * 2020-09-27 2024-05-10 中国建设银行股份有限公司 可疑交易监测模型特征提取方法及装置
CN112686762A (zh) * 2020-12-25 2021-04-20 中国平安人寿保险股份有限公司 保单数据违规检测方法、装置、计算机设备及存储介质
CN112686762B (zh) * 2020-12-25 2024-05-28 中国平安人寿保险股份有限公司 保单数据违规检测方法、装置、计算机设备及存储介质
CN113568947A (zh) * 2021-07-21 2021-10-29 众安在线财产保险股份有限公司 数据处理方法、***以及计算机存储介质
CN113962817A (zh) * 2021-11-11 2022-01-21 泰康保险集团股份有限公司 异常人员识别方法及装置、电子设备和存储介质
CN118297730A (zh) * 2024-06-04 2024-07-05 中国人寿保险股份有限公司江苏省分公司 一种基于CIRST指纹匹配的保险行业pos代刷卡风险识别和预警方法

Similar Documents

Publication Publication Date Title
CN111291816B (zh) 针对用户分类模型进行特征处理的方法及装置
CN111709844A (zh) 一种保险洗钱人员检测方法、装置和计算机可读存储介质
CN110188198B (zh) 一种基于知识图谱的反欺诈方法及装置
US8121920B2 (en) System and method of detecting mortgage related fraud
US11263644B2 (en) Systems and methods for detecting unauthorized or suspicious financial activity
US8160982B2 (en) Method for detecting people of interest from information sources
WO2005101265A2 (en) Systems and methods for investigation of financial reporting information
US20150363875A1 (en) System and Method for Filtering and Analyzing Transaction Information
CN112132233A (zh) 一种基于有效影响因子的服刑人员危险行为预测方法及***
US8145585B2 (en) Automated methods and systems for the detection and identification of money service business transactions
CN112381640A (zh) 业务数据监控方法、装置、设备及存储介质
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
CN111861715A (zh) 一种信贷数据的处理方法、装置、设备和存储介质
CN115345727B (zh) 一种识别欺诈贷款申请的方法及装置
CN113177733B (zh) 基于卷积神经网络的中小微企业数据建模方法及***
CN115965468A (zh) 基于交易数据的异常行为检测方法、装置、设备及介质
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN112823502B (zh) 针对资源访问规则配置的实时反馈服务
CN113723522B (zh) 异常用户的识别方法、装置、电子设备以及存储介质
US8078517B1 (en) Systems and methods for monitoring remittances for reporting requirements
CN118333739A (zh) 构建零***风险预测模型的方法和零售信贷业务Scoremult模型
Suhanjoyo et al. Fraud Detection in Sales of Distribution Companies Using Machine Learning
CN114066643A (zh) 一种基于滑动窗口快速挖掘疑似关联账单的方法、装置和存储介质
Shaikh et al. Credit Risk Assessment
Erickson Rare Event Prediction with Mortgage Lead Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200925