CN109816535A - 欺诈识别方法、装置、计算机设备及存储介质 - Google Patents

欺诈识别方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109816535A
CN109816535A CN201811527396.XA CN201811527396A CN109816535A CN 109816535 A CN109816535 A CN 109816535A CN 201811527396 A CN201811527396 A CN 201811527396A CN 109816535 A CN109816535 A CN 109816535A
Authority
CN
China
Prior art keywords
corporations
clustering
matrix
network
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811527396.XA
Other languages
English (en)
Inventor
唐文
侯明远
刘波
黄咏宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN201811527396.XA priority Critical patent/CN109816535A/zh
Publication of CN109816535A publication Critical patent/CN109816535A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了欺诈识别方法、装置、计算机设备及存储介质。该方法包括:获取理赔数据对应的节点,通过谱聚类将所述理赔数据对应的节点并行划分为多个子图;将多个子图分别进行聚类,得到网络社团;获取根据历史数据得到的网络关联数据,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点,获取所述群聚社团点;若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中。该方法实现了对理赔数据的全量数据进行高效的实时织网,并基于社团发现算法,快速查找到理赔数据中的疑似欺诈数据以进行核实。

Description

欺诈识别方法、装置、计算机设备及存储介质
技术领域
本发明涉及欺诈识别技术领域,尤其涉及一种欺诈识别方法、装置、计算机设备及存储介质。
背景技术
目前,有很多常用的图织网算法,但基本都是基于小规模网络进行织网,不支持并行、切网、定焦运算。例如,有部分保险公司的产品,在进行理赔时是规则匹配,不支持图形算法,社团发现算法功能。而且现有的图织网算法支持的社团算法有限,在超大规模数据运算(上亿节点时,织网速度超24小时)出现劣势,并且无法支持实时织网运算。
发明内容
本发明实施例提供了一种欺诈识别方法、装置、计算机设备及存储介质,旨在解决现有技术中图织网算法支持的社团算法有限,在超大规模数据运算时织网效率低下,且不支持实时织网运算的问题。
第一方面,本发明实施例提供了一种欺诈识别方法,其包括:
获取理赔数据对应的节点,通过谱聚类将所述理赔数据对应的节点并行划分为多个子图;
将多个子图分别进行聚类,得到网络社团;
获取根据历史数据得到的网络关联数据,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点,获取所述群聚社团点;
若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中。
第二方面,本发明实施例提供了一种欺诈识别装置,其包括:
子图划分单元,用于获取理赔数据对应的节点,通过谱聚类将所述理赔数据对应的节点并行划分为多个子图;
网络社团获取单元,用于将多个子图分别进行聚类,得到网络社团;
群聚社团点检索单元,用于获取根据历史数据得到的网络关联数据,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点,获取所述群聚社团点;
欺诈社团判断单元,用于若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的欺诈识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的欺诈识别方法。
本发明实施例提供了一种欺诈识别方法、装置、计算机设备及存储介质。该方法包括获取理赔数据对应的节点,通过谱聚类将所述理赔数据对应的节点并行划分为多个子图;将多个子图分别进行聚类,得到网络社团;获取根据历史数据得到的网络关联数据,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点,获取所述群聚社团点;若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中。该方法实现了对理赔数据的全量数据进行高效的实时织网,并基于社团发现算法,快速查找到理赔数据中的疑似欺诈数据以进行核实。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的欺诈识别方法的流程示意图;
图2为本发明实施例提供的欺诈识别方法的子流程示意图;
图3为本发明实施例提供的欺诈识别方法的另一子流程示意图;
图4为本发明实施例提供的欺诈识别方法的另一子流程示意图;
图5为本发明实施例提供的欺诈识别装置的示意性框图;
图6为本发明实施例提供的欺诈识别装置的子单元示意性框图;
图7为本发明实施例提供的欺诈识别装置的另一子单元示意性框图;
图8为本发明实施例提供的欺诈识别装置的另一子单元示意性框图;
图9为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的欺诈识别方法的流程示意图,该欺诈识别方法应用于智能终端中,该方法通过安装于智能终端中的应用软件进行执行。
如图1所示,该方法包括步骤S110~S140。
S110、获取理赔数据对应的节点,通过谱聚类将所述理赔数据对应的节点并行划分为多个子图。
在本实施例中,是在管理服务器中对理赔数据进行欺诈识别。当管理服务器接收了海量的案件数据(例如车险理赔场景下的案件数据包括司机、报案人、受益人和伤者,以及修理厂、报案电话、检修地点、GPS信息等数据),若采用现有技术中小规模网络织网,会导致织网效率低下。此时,可以选择通过谱聚类算法对海量的节点进行区域的划分,使得不同子图(子图可以视为一块区域,该区域内包括多个节点)内的节点之间的联系权重较小(即未超过预设的联系权重阈值),而同一子图内的节点之间的联系权重较大(即超过预设的联系权重阈值)。通过谱聚类算法能快速的将所述理赔数据对应的节点并行划分为多个子图。
在一实施例中,如图2所示,步骤S110包括:
S111、获取所输入的相似度矩阵和目标聚类数目;
S112、根据所述相似度矩阵构建与所述理赔数据对应的节点相应的相似矩阵;
S113、根据所述相似矩阵构建邻接矩阵和对角矩阵,由所述对角矩阵与所述邻接矩阵之差得到拉普拉斯矩阵;
S114、获取所述拉普拉斯矩阵的多个特征值中排名位于预设排名阈值之前的特征值所对应的特征向量,以获取目标特征向量集合;
S115、将目标特征向量集合中每一特征向量转置为列向量并依次组合,以得到目标向量矩阵;
S116、通过k-means算法将目标向量矩阵中各行向量进行聚类,得到与所述目标聚类数目相同的子团。
在本实施例中,谱聚类是一种基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵的特征向量进行聚类,从而达到对样本数据聚类的目的。谱聚类可以理解为将高维空间的数据映射到低维,然后在低维空间用其它聚类算法(如k-means)进行聚类。
为了实现对高维空间的理赔数据映射到低维空间,需将所述理赔数据对应的节点先根据式(1)进行相似矩阵的构建:
其中,n为赔数据对应的节点个数,xi和xj分别表示任意一个节点,σ表示节点的标准差,sij则组成了相似矩阵。
由所输入的相似度矩阵来构建与所述理赔数据对应的节点相应的相似矩阵有∈-邻近法,K邻近法和全连接法。例如,全连接法的计算公式如式1。
之后根据式2来计算对角矩阵,式2具体如下:
其中,di表示相似矩阵中每一行的元素之和,由di组成对角矩阵wij则表示相似矩阵中第i行第j列的元素。
当由所述对角矩阵与所述邻接矩阵之差得到拉普拉斯矩阵后,即可以拉普拉斯矩阵中对应的每一特征向量转置为列向量,从而组成目标向量矩阵。最后通过k-means算法将目标向量矩阵中各行向量进行聚类,得到与所述目标聚类数目相同的子团,通过谱聚类实现了将由理赔数据组成的全量数据进行社团的快速发现,而且实现了实时织网。
S120、将多个子图分别进行聚类,得到网络社团。
在本实施例中,将多个子图再分别进行聚类,是一种并行织网,有效的提高了大规模数据的织网效率。通过谱聚类将初始的节点划分为多个区域形成多个子图后,形成了多个规模较小的图,此时需要将每个子图进行织网。织网就是将节点与节点之间用边连接,边代表节点之间的联系权重,两节点之前的关联关系越大则节点之间的联系权重值越大,在对子图进行织网后即可得到网络社团。
在一实施例中,如图3所示,步骤S120包括:
S121、将多个子图分别进行织网,得到初始理赔社交网络拓扑图;
S122、通过社团检测对初始理赔社交网络拓扑图进行聚类,得到网络社团。
在本实施例中,通过谱聚类将初始的节点划分为多个区域形成多个子图后,形成了多个规模较小的图,此时需要将每个子图进行织网,得到初始理赔社交网络拓扑图。之后通过社团检测算法,可对初始理赔社交网络拓扑图进行聚类,得到网络社团。
社团检测,就是要在一个图(包含顶点和边,例如步骤一中的初始理赔社交网络拓扑图)上发现社团结构,也就是要把图中的结点进行聚类,构成一个个的社团。关于社团(community),目前还没有确切的定义,一般认为社团内部的点之间的连接相对稠密,而不同社团的点之间的连接相对稀疏。
例如,输入初始理赔社交网络拓扑图后,通过社团检测算法处理后会输出一种社团划分,也即切图后的网络。
在一实施例中,如图4所示,步骤S122之后还包括:
S123、获取所述网络社团中所包括每一社团对应的模块度;
S124、若每一社团对应的模块度均小于1,标识所述网络社团通过社区网络划分验证;
S125、若有社团对应的模块度大于或等于1,标识所述网络社团未通过社区网络划分验证,通过社团检测对模块度大于或等于1的社团进行聚类,得到更新后的社团网络。
在本实施例中,切图后的网络的模块度(Modularity)是评估一个社区网络划分好坏的度量方法,它的含义是社区内节点的连边数与随机情况下的边数之差,模块度的取值范围是(0,1)。
社团检测算法中,模块度算法主要评估节点的紧凑密集程度,可以更快的帮助进行定焦,而实际中,往往有很多噪音,影像了社团的挖掘,因此可从以下三个方面进行优化:
a)高频异常点剔除。对于超高频的异常点,往往由于录入异常、错录现象,导致高频点出险,针对这类问题,我们会剔除高频点后,切网。
b)时间轴处理,我们通过拉伸时间轴,可以将过去超期限发生的案件进行过滤,从而减小网络的复杂度。
c)将业务规则结合网络模块度结合挖掘高风险网络。
S130、获取根据历史数据得到的网络关联数据,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点,获取所述群聚社团点。
在本实施例中,将海量的节点划分为了多个网络社团后,需要在网络社团中检测是否存在与网络关联数据相同的群聚社团点。例如根据历史数据,得到存在欺诈的社团节点的结构如节点1-节点3-节点2-节点4-节点5-节点1(可以把节点连接关系组成的数据理解为网络关联数据),也就是某一子图中若节点存在上述的节点连接关系,则表示该子图中存在欺诈社团。即是遍历多个子图中每一子图中所包括的网络社团中是否存在与网络关联数据相同的群聚社团点,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点获取所述群聚社团点。
S140、若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中。
在一实施例中,步骤S140之前还包括:
获取群聚社团点中每一节点之间的联系权重,并对每一节点之间的联系权重进行求和,得到群聚社团点对应的评分。
在本实施例中,计算群聚社团点对应的评分时,可以采用预设的权重算法,例如计算所述群聚社团点的权重求和,例如群聚社团点的节点结构如下:节点1-节点3-节点2-节点4-节点5-节点1。节点1与节点3之间的联系权重为0.4,节点3与节点2之间的联系权重为0.3,节点2与节点4之间的联系权重为0.2,节点4与节点5之间的联系权重为0.1,节点5与节点1之间的联系权重为0.2,则上述联系权重之和为1.2,若预设的评分阈值为1,则所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点至于疑似欺诈社团分组内。通过网络关联数据作为历史标志案件,快速的检测到欺诈社团,而且以群聚社团中所有点的权重求和以得到评分,能更为客观作为进一步验证该社团是否存在欺诈。
该方法实现了对理赔数据的全量数据进行高效的实时织网,并基于社团发现算法,快速查找到理赔数据中的疑似欺诈数据以进行核实。
本发明实施例还提供一种欺诈识别装置,该欺诈识别装置用于执行前述欺诈识别方法的任一实施例。具体地,请参阅图5,图5是本发明实施例提供的欺诈识别装置的示意性框图。该欺诈识别装置100可以配置于智能终端中。
如图5所示,欺诈识别装置100包括子图划分单元110、网络社团获取单元120、群聚社团点检索单元130、欺诈社团判断单元140。
子图划分单元110,用于获取理赔数据对应的节点,通过谱聚类将所述理赔数据对应的节点并行划分为多个子图。
在本实施例中,是在管理服务器中对理赔数据进行欺诈识别。当管理服务器接收了海量的案件数据(例如车险理赔场景下的案件数据包括司机、报案人、受益人和伤者,以及修理厂、报案电话、检修地点、GPS信息等数据),若采用现有技术中小规模网络织网,会导致织网效率低下。此时,可以选择通过谱聚类算法对海量的节点进行区域的划分,使得不同子图(子图可以视为一块区域,该区域内包括多个节点)内的节点之间的联系权重较小(即未超过预设的联系权重阈值),而同一子图内的节点之间的联系权重较大(即超过预设的联系权重阈值)。通过谱聚类算法能快速的将所述理赔数据对应的节点并行划分为多个子图。
在一实施例中,如图6所示,所述子图划分单元110包括:
初始录入单元111,用于获取所输入的相似度矩阵和目标聚类数目;
相似矩阵构建单元112,用于根据所述相似度矩阵构建与所述理赔数据对应的节点相应的相似矩阵;
拉普拉斯矩阵构建单元113,用于根据所述相似矩阵构建邻接矩阵和对角矩阵,由所述对角矩阵与所述邻接矩阵之差得到拉普拉斯矩阵;
目标特征向量集合获取单元114,用于获取所述拉普拉斯矩阵的多个特征值中排名位于预设排名阈值之前的特征值所对应的特征向量,以获取目标特征向量集合;
目标向量矩阵获取单元115,用于将目标特征向量集合中每一特征向量转置为列向量并依次组合,以得到目标向量矩阵;
矩阵聚类单元116,用于通过k-means算法将目标向量矩阵中各行向量进行聚类,得到与所述目标聚类数目相同的子团。
在本实施例中,谱聚类是一种基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵的特征向量进行聚类,从而达到对样本数据聚类的目的。谱聚类可以理解为将高维空间的数据映射到低维,然后在低维空间用其它聚类算法(如k-means)进行聚类。
为了实现对高维空间的理赔数据映射到低维空间,需将所述理赔数据对应的节点先根据式(1)进行相似矩阵的构建:
由所输入的相似度矩阵来构建与所述理赔数据对应的节点相应的相似矩阵有∈-邻近法,K邻近法和全连接法。例如,全连接法的计算公式如式1。
当由所述对角矩阵与所述邻接矩阵之差得到拉普拉斯矩阵后,即可以拉普拉斯矩阵中对应的每一特征向量转置为列向量,从而组成目标向量矩阵。最后通过k-means算法将目标向量矩阵中各行向量进行聚类,得到与所述目标聚类数目相同的子团,通过谱聚类实现了将由理赔数据组成的全量数据进行社团的快速发现,而且实现了实时织网。
网络社团获取单元120,用于将多个子图分别进行聚类,得到网络社团。
在本实施例中,将多个子图再分别进行聚类,是一种并行织网,有效的提高了大规模数据的织网效率。通过谱聚类将初始的节点划分为多个区域形成多个子图后,形成了多个规模较小的图,此时需要将每个子图进行织网。织网就是将节点与节点之间用边连接,边代表节点之间的联系权重,两节点之前的关联关系越大则节点之间的联系权重值越大,在对子图进行织网后即可得到网络社团。
在一实施例中,如图7所示,所述网络社团获取单元120,包括:
初始织网单元121,用于将多个子图分别进行织网,得到初始理赔社交网络拓扑图;
社团检测单元122,用于通过社团检测对初始理赔社交网络拓扑图进行聚类,得到网络社团。
在本实施例中,通过谱聚类将初始的节点划分为多个区域形成多个子图后,形成了多个规模较小的图,此时需要将每个子图进行织网,得到初始理赔社交网络拓扑图。之后通过社团检测算法,可对初始理赔社交网络拓扑图进行聚类,得到网络社团。
社团检测,就是要在一个图(包含顶点和边,例如步骤一中的初始理赔社交网络拓扑图)上发现社团结构,也就是要把图中的结点进行聚类,构成一个个的社团。关于社团(community),目前还没有确切的定义,一般认为社团内部的点之间的连接相对稠密,而不同社团的点之间的连接相对稀疏。
例如,输入初始理赔社交网络拓扑图后,通过社团检测算法处理后会输出一种社团划分,也即切图后的网络。
在一实施例中,如图7所示,所述网络社团获取单元120,还包括:
模块度获取单元123,用于获取所述网络社团中所包括每一社团对应的模块度;
第一标识单元124,用于若每一社团对应的模块度均小于1,标识所述网络社团通过社区网络划分验证;
第二标识单元125,用于若有社团对应的模块度大于或等于1,标识所述网络社团未通过社区网络划分验证,通过社团检测对模块度大于或等于1的社团进行聚类,得到更新后的社团网络。
在本实施例中,切图后的网络的模块度(Modularity)是评估一个社区网络划分好坏的度量方法,它的含义是社区内节点的连边数与随机情况下的边数之差,模块度的取值范围是(0,1)。
社团检测算法中,模块度算法主要评估节点的紧凑密集程度,可以更快的帮助进行定焦,而实际中,往往有很多噪音,影像了社团的挖掘,因此可从以下三个方面进行优化:
a)高频异常点剔除。对于超高频的异常点,往往由于录入异常、错录现象,导致高频点出险,针对这类问题,我们会剔除高频点后,切网。
b)时间轴处理,我们通过拉伸时间轴,可以将过去超期限发生的案件进行过滤,从而减小网络的复杂度。
c)将业务规则结合网络模块度结合挖掘高风险网络。
群聚社团点检索单元130,用于获取根据历史数据得到的网络关联数据,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点,获取所述群聚社团点。
在本实施例中,将海量的节点划分为了多个网络社团后,需要在网络社团中检测是否存在与网络关联数据相同的群聚社团点。例如根据历史数据,得到存在欺诈的社团节点的结构如节点1-节点3-节点2-节点4-节点5-节点1(可以把节点连接关系组成的数据理解为网络关联数据),也就是某一子图中若节点存在上述的节点连接关系,则表示该子图中存在欺诈社团。即是遍历多个子图中每一子图中所包括的网络社团中是否存在与网络关联数据相同的群聚社团点,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点获取所述群聚社团点。
欺诈社团判断单元140,用于若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中。
在一实施例中,欺诈识别装置100还包括:
评分计算单元,用于获取群聚社团点中每一节点之间的联系权重,并对每一节点之间的联系权重进行求和,得到群聚社团点对应的评分。
在本实施例中,计算群聚社团点对应的评分时,可以采用预设的权重算法,例如计算所述群聚社团点的权重求和,例如群聚社团点的节点结构如下:节点1-节点3-节点2-节点4-节点5-节点1。节点1与节点3之间的联系权重为0.4,节点3与节点2之间的联系权重为0.3,节点2与节点4之间的联系权重为0.2,节点4与节点5之间的联系权重为0.1,节点5与节点1之间的联系权重为0.2,则上述联系权重之和为1.2,若预设的评分阈值为1,则所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点至于疑似欺诈社团分组内。通过网络关联数据作为历史标志案件,快速的检测到欺诈社团,而且以群聚社团中所有点的权重求和以得到评分,能更为客观作为进一步验证该社团是否存在欺诈。
该装置实现了对理赔数据的全量数据进行高效的实时织网,并基于社团发现算法,快速查找到理赔数据中的疑似欺诈数据以进行核实。
上述欺诈识别装置可以实现为计算机程序的形式,该计算机程序可以在如图9所示的计算机设备上运行。
请参阅图9,图9是本发明实施例提供的计算机设备的示意性框图。
参阅图9,该计算机设备500包括通过***总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作***5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行欺诈识别方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行欺诈识别方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图9中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:获取理赔数据对应的节点,通过谱聚类将所述理赔数据对应的节点并行划分为多个子图;将多个子图分别进行聚类,得到网络社团;获取根据历史数据得到的网络关联数据,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点,获取所述群聚社团点;若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中。
在一实施例中,处理器502在执行所述通过谱聚类将所述理赔数据对应的节点并行划分为多个子图的步骤时,执行如下操作:获取所输入的相似度矩阵和目标聚类数目;根据所述相似度矩阵构建与所述理赔数据对应的节点相应的相似矩阵;根据所述相似矩阵构建邻接矩阵和对角矩阵,由所述对角矩阵与所述邻接矩阵之差得到拉普拉斯矩阵;获取所述拉普拉斯矩阵的多个特征值中排名位于预设排名阈值之前的特征值所对应的特征向量,以获取目标特征向量集合;将目标特征向量集合中每一特征向量转置为列向量并依次组合,以得到目标向量矩阵;通过k-means算法将目标向量矩阵中各行向量进行聚类,得到与所述目标聚类数目相同的子团。
在一实施例中,处理器502在执行所述将多个子图分别进行聚类,得到网络社团的步骤时,执行如下操作:将多个子图分别进行织网,得到初始理赔社交网络拓扑图;通过社团检测对初始理赔社交网络拓扑图进行聚类,得到网络社团。
在一实施例中,处理器502在执行所述通过社团检测对初始理赔社交网络拓扑图进行聚类,得到网络社团的步骤之后,执行如下操作:获取所述网络社团中所包括每一社团对应的模块度;若每一社团对应的模块度均小于1,标识所述网络社团通过社区网络划分验证;若有社团对应的模块度大于或等于1,标识所述网络社团未通过社区网络划分验证,通过社团检测对模块度大于或等于1的社团进行聚类,得到更新后的社团网络。
在一实施例中,处理器502在执行所述若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中的步骤之前,还执行如下操作:获取群聚社团点中每一节点之间的联系权重,并对每一节点之间的联系权重进行求和,得到群聚社团点对应的评分。
本领域技术人员可以理解,图9中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图9所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:获取理赔数据对应的节点,通过谱聚类将所述理赔数据对应的节点并行划分为多个子图;将多个子图分别进行聚类,得到网络社团;获取根据历史数据得到的网络关联数据,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点,获取所述群聚社团点;若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中。
在一实施例中,所述通过谱聚类将所述理赔数据对应的节点并行划分为多个子图,包括:获取所输入的相似度矩阵和目标聚类数目;根据所述相似度矩阵构建与所述理赔数据对应的节点相应的相似矩阵;根据所述相似矩阵构建邻接矩阵和对角矩阵,由所述对角矩阵与所述邻接矩阵之差得到拉普拉斯矩阵;获取所述拉普拉斯矩阵的多个特征值中排名位于预设排名阈值之前的特征值所对应的特征向量,以获取目标特征向量集合;将目标特征向量集合中每一特征向量转置为列向量并依次组合,以得到目标向量矩阵;通过k-means算法将目标向量矩阵中各行向量进行聚类,得到与所述目标聚类数目相同的子团。
在一实施例中,所述将多个子图分别进行聚类,得到网络社团,包括:将多个子图分别进行织网,得到初始理赔社交网络拓扑图;通过社团检测对初始理赔社交网络拓扑图进行聚类,得到网络社团。
在一实施例中,所述通过社团检测对初始理赔社交网络拓扑图进行聚类,得到网络社团,还包括:获取所述网络社团中所包括每一社团对应的模块度;若每一社团对应的模块度均小于1,标识所述网络社团通过社区网络划分验证;若有社团对应的模块度大于或等于1,标识所述网络社团未通过社区网络划分验证,通过社团检测对模块度大于或等于1的社团进行聚类,得到更新后的社团网络。
在一实施例中,所述若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中之前,还包括:获取群聚社团点中每一节点之间的联系权重,并对每一节点之间的联系权重进行求和,得到群聚社团点对应的评分。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种欺诈识别方法,其特征在于,包括:
获取理赔数据对应的节点,通过谱聚类将所述理赔数据对应的节点并行划分为多个子图;
将多个子图分别进行聚类,得到网络社团;
获取根据历史数据得到的网络关联数据,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点,获取所述群聚社团点;
若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中。
2.根据权利要求1所述的欺诈识别方法,其特征在于,所述通过谱聚类将所述理赔数据对应的节点并行划分为多个子图,包括:
获取所输入的相似度矩阵和目标聚类数目;
根据所述相似度矩阵构建与所述理赔数据对应的节点相应的相似矩阵;
根据所述相似矩阵构建邻接矩阵和对角矩阵,由所述对角矩阵与所述邻接矩阵之差得到拉普拉斯矩阵;
获取所述拉普拉斯矩阵的多个特征值中排名位于预设排名阈值之前的特征值所对应的特征向量,以获取目标特征向量集合;
将目标特征向量集合中每一特征向量转置为列向量并依次组合,以得到目标向量矩阵;
通过k-means算法将目标向量矩阵中各行向量进行聚类,得到与所述目标聚类数目相同的子团。
3.根据权利要求1所述的欺诈识别方法,其特征在于,所述将多个子图分别进行聚类,得到网络社团,包括:
将多个子图分别进行织网,得到初始理赔社交网络拓扑图;
通过社团检测对初始理赔社交网络拓扑图进行聚类,得到网络社团。
4.根据权利要求3所述的欺诈识别方法,其特征在于,所述通过社团检测对初始理赔社交网络拓扑图进行聚类,得到网络社团,还包括:
获取所述网络社团中所包括每一社团对应的模块度;
若每一社团对应的模块度均小于1,标识所述网络社团通过社区网络划分验证;
若有社团对应的模块度大于或等于1,标识所述网络社团未通过社区网络划分验证,通过社团检测对模块度大于或等于1的社团进行聚类,得到更新后的社团网络。
5.根据权利要求1所述的欺诈识别方法,其特征在于,所述若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中之前,还包括:
获取群聚社团点中每一节点之间的联系权重,并对每一节点之间的联系权重进行求和,得到群聚社团点对应的评分。
6.一种欺诈识别装置,其特征在于,包括:
子图划分单元,用于获取理赔数据对应的节点,通过谱聚类将所述理赔数据对应的节点并行划分为多个子图;
网络社团获取单元,用于将多个子图分别进行聚类,得到网络社团;
群聚社团点检索单元,用于获取根据历史数据得到的网络关联数据,若在网络社团中检索到存在与所述网络关联数据相同的群聚社团点,获取所述群聚社团点;
欺诈社团判断单元,用于若所述群聚社团点对应的评分超出预设的评分阈值,将所述群聚社团点置于疑似欺诈社团分组中。
7.根据权利要求6所述的欺诈识别装置,其特征在于,所述子图划分单元,包括:
初始录入单元,用于获取所输入的相似度矩阵和目标聚类数目;
相似矩阵构建单元,用于根据所述相似度矩阵构建与所述理赔数据对应的节点相应的相似矩阵;
拉普拉斯矩阵构建单元,用于根据所述相似矩阵构建邻接矩阵和对角矩阵,由所述对角矩阵与所述邻接矩阵之差得到拉普拉斯矩阵;
目标特征向量集合获取单元,用于获取所述拉普拉斯矩阵的多个特征值中排名位于预设排名阈值之前的特征值所对应的特征向量,以获取目标特征向量集合;
目标向量矩阵获取单元,用于将目标特征向量集合中每一特征向量转置为列向量并依次组合,以得到目标向量矩阵;
矩阵聚类单元,用于通过k-means算法将目标向量矩阵中各行向量进行聚类,得到与所述目标聚类数目相同的子团。
8.根据权利要求6所述的欺诈识别装置,其特征在于,所述网络社团获取单元,包括:
初始织网单元,用于将多个子图分别进行织网,得到初始理赔社交网络拓扑图;
社团检测单元,用于通过社团检测对初始理赔社交网络拓扑图进行聚类,得到网络社团。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的欺诈识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的欺诈识别方法。
CN201811527396.XA 2018-12-13 2018-12-13 欺诈识别方法、装置、计算机设备及存储介质 Pending CN109816535A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811527396.XA CN109816535A (zh) 2018-12-13 2018-12-13 欺诈识别方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811527396.XA CN109816535A (zh) 2018-12-13 2018-12-13 欺诈识别方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109816535A true CN109816535A (zh) 2019-05-28

Family

ID=66601587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811527396.XA Pending CN109816535A (zh) 2018-12-13 2018-12-13 欺诈识别方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109816535A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110209660A (zh) * 2019-06-10 2019-09-06 北京阿尔山金融科技有限公司 欺诈团伙挖掘方法、装置及电子设备
CN110348516A (zh) * 2019-07-11 2019-10-18 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备
CN110598128A (zh) * 2019-09-11 2019-12-20 西安电子科技大学 一种对抗女巫攻击的用于大规模网络的社团检测方法
CN110705585A (zh) * 2019-08-22 2020-01-17 深圳壹账通智能科技有限公司 网络欺诈识别方法、装置、计算机装置及存储介质
CN111091287A (zh) * 2019-12-13 2020-05-01 南京三百云信息科技有限公司 风险对象识别方法、装置以及计算机设备
CN111259952A (zh) * 2020-01-14 2020-06-09 中国平安财产保险股份有限公司 异常用户识别方法、装置、计算机设备及存储介质
CN111612039A (zh) * 2020-04-24 2020-09-01 平安直通咨询有限公司上海分公司 异常用户识别的方法及装置、存储介质、电子设备
CN111641518A (zh) * 2020-04-29 2020-09-08 深圳壹账通智能科技有限公司 基于异质网络的社群划分方法、装置、计算机设备及介质
CN111711614A (zh) * 2020-05-27 2020-09-25 平安科技(深圳)有限公司 基于知识图谱的可疑用户验证方法、装置及计算机设备
CN111931023A (zh) * 2020-07-01 2020-11-13 西北工业大学 一种基于网络嵌入的社团结构识别方法及装置
CN112396160A (zh) * 2020-11-02 2021-02-23 北京大学 基于图神经网络的交易欺诈检测方法及***
WO2021189730A1 (zh) * 2020-03-27 2021-09-30 深圳壹账通智能科技有限公司 检测异常高密子图的方法、装置、设备及存储介质
CN113487109A (zh) * 2021-07-27 2021-10-08 中国平安财产保险股份有限公司 群体识别方法、装置、电子设备及存储介质
CN115293919A (zh) * 2022-07-22 2022-11-04 浙江大学 面向社交网络分布外泛化的图神经网络预测方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105469315A (zh) * 2015-08-04 2016-04-06 电子科技大学 基于增量聚类的动态社会网络社团结构演化方法
WO2018103456A1 (zh) * 2016-12-06 2018-06-14 ***股份有限公司 一种基于特征匹配网络的社团划分方法、装置及电子设备
CN108681936A (zh) * 2018-04-26 2018-10-19 浙江邦盛科技有限公司 一种基于模块度和平衡标签传播的欺诈团伙识别方法
CN108960335A (zh) * 2018-07-13 2018-12-07 大连理工大学 一种基于大规模网络进行高效聚类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105469315A (zh) * 2015-08-04 2016-04-06 电子科技大学 基于增量聚类的动态社会网络社团结构演化方法
WO2018103456A1 (zh) * 2016-12-06 2018-06-14 ***股份有限公司 一种基于特征匹配网络的社团划分方法、装置及电子设备
CN108681936A (zh) * 2018-04-26 2018-10-19 浙江邦盛科技有限公司 一种基于模块度和平衡标签传播的欺诈团伙识别方法
CN108960335A (zh) * 2018-07-13 2018-12-07 大连理工大学 一种基于大规模网络进行高效聚类方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110209660A (zh) * 2019-06-10 2019-09-06 北京阿尔山金融科技有限公司 欺诈团伙挖掘方法、装置及电子设备
CN110209660B (zh) * 2019-06-10 2021-12-24 北京阿尔山金融科技有限公司 欺诈团伙挖掘方法、装置及电子设备
CN110348516B (zh) * 2019-07-11 2021-05-11 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备
CN110348516A (zh) * 2019-07-11 2019-10-18 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备
CN110705585A (zh) * 2019-08-22 2020-01-17 深圳壹账通智能科技有限公司 网络欺诈识别方法、装置、计算机装置及存储介质
CN110598128A (zh) * 2019-09-11 2019-12-20 西安电子科技大学 一种对抗女巫攻击的用于大规模网络的社团检测方法
CN110598128B (zh) * 2019-09-11 2022-08-09 西安电子科技大学 一种对抗女巫攻击的用于大规模网络的社团检测方法
CN111091287A (zh) * 2019-12-13 2020-05-01 南京三百云信息科技有限公司 风险对象识别方法、装置以及计算机设备
CN111259952A (zh) * 2020-01-14 2020-06-09 中国平安财产保险股份有限公司 异常用户识别方法、装置、计算机设备及存储介质
WO2021189730A1 (zh) * 2020-03-27 2021-09-30 深圳壹账通智能科技有限公司 检测异常高密子图的方法、装置、设备及存储介质
CN111612039A (zh) * 2020-04-24 2020-09-01 平安直通咨询有限公司上海分公司 异常用户识别的方法及装置、存储介质、电子设备
CN111612039B (zh) * 2020-04-24 2023-09-29 平安直通咨询有限公司上海分公司 异常用户识别的方法及装置、存储介质、电子设备
CN111641518A (zh) * 2020-04-29 2020-09-08 深圳壹账通智能科技有限公司 基于异质网络的社群划分方法、装置、计算机设备及介质
CN111711614A (zh) * 2020-05-27 2020-09-25 平安科技(深圳)有限公司 基于知识图谱的可疑用户验证方法、装置及计算机设备
CN111931023A (zh) * 2020-07-01 2020-11-13 西北工业大学 一种基于网络嵌入的社团结构识别方法及装置
CN112396160A (zh) * 2020-11-02 2021-02-23 北京大学 基于图神经网络的交易欺诈检测方法及***
CN113487109A (zh) * 2021-07-27 2021-10-08 中国平安财产保险股份有限公司 群体识别方法、装置、电子设备及存储介质
CN113487109B (zh) * 2021-07-27 2023-11-24 中国平安财产保险股份有限公司 群体识别方法、装置、电子设备及存储介质
CN115293919A (zh) * 2022-07-22 2022-11-04 浙江大学 面向社交网络分布外泛化的图神经网络预测方法及***
CN115293919B (zh) * 2022-07-22 2023-08-04 浙江大学 面向社交网络分布外泛化的图神经网络预测方法及***

Similar Documents

Publication Publication Date Title
CN109816535A (zh) 欺诈识别方法、装置、计算机设备及存储介质
CN109784636A (zh) 欺诈用户识别方法、装置、计算机设备及存储介质
CN109859054A (zh) 网络社团挖掘方法、装置、计算机设备及存储介质
CN107623697B (zh) 一种基于攻防随机博弈模型的网络安全态势评估方法
CN109598509A (zh) 风险团伙的识别方法和装置
CN106469276B (zh) 数据样本的类型识别方法及装置
CN108809745A (zh) 一种用户异常行为检测方法、装置及***
CN110019876B (zh) 数据查询方法、电子设备及存储介质
CN110276552A (zh) 贷前风险分析方法、装置、设备及可读存储介质
CN110443120A (zh) 一种人脸识别方法及设备
CN108510396B (zh) 投保校验的方法、装置、计算机设备及存储介质
CN111596924B (zh) 一种微服务划分方法和装置
CN104517052B (zh) 一种入侵检测方法及装置
CN111612038A (zh) 异常用户检测方法及装置、存储介质、电子设备
CN106960153B (zh) 病毒的类型识别方法及装置
US9529935B2 (en) Efficient link management for graph clustering
CN111460315B (zh) 社群画像构建方法、装置、设备及存储介质
CN113807940B (zh) 信息处理和欺诈行为识别方法、装置、设备及存储介质
CN109960839B (zh) 基于机器学习的业务支撑***业务链路发现方法和***
CN109325814A (zh) 一种用于发现可疑交易网络的方法
CN112241820A (zh) 资金流动中关键节点的风险识别方法、装置及计算设备
CN108429632B (zh) 一种业务监控方法和装置
CN115905885A (zh) 数据识别方法、设备、存储介质及程序产品
CN111383716B (zh) 基因对的筛选方法、装置、计算机设备和存储介质
CN109670976B (zh) 特征因子确定方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination