CN111369264A - 实体关联方法、装置、设备及计算机可读存储介质 - Google Patents

实体关联方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111369264A
CN111369264A CN202010090265.0A CN202010090265A CN111369264A CN 111369264 A CN111369264 A CN 111369264A CN 202010090265 A CN202010090265 A CN 202010090265A CN 111369264 A CN111369264 A CN 111369264A
Authority
CN
China
Prior art keywords
behavior
entity
similarity
preset
entity object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010090265.0A
Other languages
English (en)
Inventor
赵世泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010090265.0A priority Critical patent/CN111369264A/zh
Publication of CN111369264A publication Critical patent/CN111369264A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及大数据技术领域,公开了一种实体关联方法、装置、设备和一种存储介质,该方法包括:在复杂网络中确定待分析的实体对象,获取待分析的实体对象的行为产生时刻,行为产生时刻为实体对象产生预设欺诈风险行为的时刻;对于行为产生时刻不同的任意两个实体对象,计算两个实体对象之间的行为相似度,并计算两个实体对象之间的行为产生间隔时长;判断行为相似度是否大于或等于预设的相似度阈值,以及行为产生间隔时长是否小于或等于预设时长;若行为相似度大于或等于预设的相似度阈值,且行为产生间隔时长小于或等于预设时长,则建立两个实体对象之间的异常时序行为关联关系。本发明提升了基于复杂网络的欺诈风险判别能力。

Description

实体关联方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及风险管控领域,尤其涉及实体关联方法、装置、设备及计算机可读存储介质。
背景技术
复杂网络在风控反欺诈领域具有非常丰富的应用场景,在复杂网络中,通过关联关系,我们既可以发现和识别不同类型的欺诈或高危表现,也可以通过不同的关联关系进行风险传播,进而进行欺诈风险判别。然而随着黑产(指以互联网为媒介,以网络技术为主要手段,为计算机信息***安全和网络空间管理秩序,甚至国家安全、社会政治稳定带来潜在威胁的非法行为)和风控之间的不断博弈,黑产的欺诈能力不断提升,通过传统的静态复杂网络很难发现一些隐秘行为的欺诈,因此现有的基于复杂网络的欺诈风险判别能力还有待提升。
发明内容
本发明的主要目的在于提出一种实体关联方法、装置、设备及计算机可读存储介质,旨在提升基于复杂网络的欺诈风险判别能力。
为实现上述目的,本发明提供一种实体关联方法,所述方法包括如下步骤:
在复杂网络中确定待分析的实体对象,获取所述待分析的实体对象的行为产生时刻,所述行为产生时刻为所述待分析的实体对象产生预设欺诈风险行为的时刻;
将获取到的不同实体对象的行为产生时刻进行比对,对于所述行为产生时刻不同的任意两个实体对象,分别获取所述两个实体对象的行为数据;
根据所述行为数据计算所述两个实体对象之间的行为相似度,并根据所述行为产生时刻计算所述两个实体对象之间的行为产生间隔时长;
判断所述行为相似度是否大于或等于预设的相似度阈值,以及所述行为产生间隔时长是否小于或等于预设时长;
若所述行为相似度大于或等于预设的相似度阈值,且所述行为产生间隔时长小于或等于预设时长,则建立所述两个实体对象之间的异常时序行为关联关系。
可选地,所述在复杂网络中确定待分析的实体对象的步骤包括:
在复杂网络中,检测各实体对象之间是否存在公共边,将与任一实体对象存在公共边的实体对象作为待分析的实体对象,其中,所述公共边用于表示实体对象之间的行为关联关系。
可选地,所述在复杂网络中确定待分析的实体对象的步骤之前,还包括:
当接收到实体对象***请求时,根据所述实体对象***请求在所述复杂网络中***一个新的实体对象;
获取所述新的实体对象的行为数据,以及所述复杂网络中已有的实体对象的行为数据;
判断所述新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间是否存在预设的公共部分;
若所述新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间存在预设的公共部分,则在所述新的实体对象和所述复杂网络中已有的实体对象之间建立一条公共边。
可选地,所述根据所述行为数据计算所述两个实体对象之间的行为相似度的步骤包括:
分别从所述两个实体对象的行为数据中提取出预设维度的行为特征,对应得到两个行为特征集合;
计算所述两个行为特征集合之间的相似度;
将所述两个行为特征集合之间的相似度作为所述两个实体对象之间的行为相似度。
可选地,所述计算所述两个行为特征集合之间的相似度的步骤包括:
根据杰卡德公式,计算所述两个行为特征集合之间的杰卡德系数,将所述杰卡德系数作为所述两个行为特征集合之间的相似度,所述杰卡德公式为:
Figure BDA0002383474600000021
其中,J(A,B)表示杰卡德系数,A和B分别表示两个行为特征集合,|A∩B|表示集合A与集合B的交集中的元素个数,|A∪B|表示集合A与集合B的并集中的元素个数。
可选地,所述建立所述两个实体对象之间的异常时序行为关联关系的步骤之后,还包括:
根据建立的所述两个实体对象之间的异常时序行为关联关系,生成一个异常时序行为关系网络,并生成与所述异常时序行为关系网络对应的欺诈告警信息;
将所述异常时序行为关系网络及对应的欺诈告警信息发送至预设终端。
可选地,所述判断所述行为相似度是否大于或等于预设的相似度阈值,以及所述行为产生间隔时长是否小于或等于预设时长的步骤之后,还包括:
若所述行为相似度小于预设的相似度阈值,或者所述行为产生间隔时长大于预设时长,则判定所述两个实体对象之间不存在异常时序行为关联关系;
将所述复杂网络中与任一实体对象均不存在所述异常时序行为关联关系的实体对象作为不存在欺诈风险的实体对象。
此外,为实现上述目的,本发明还提供一种实体关联装置,所述装置包括:
确定模块,用于在复杂网络中确定待分析的实体对象,获取所述待分析的实体对象的行为产生时刻,所述行为产生时刻为所述待分析的实体对象产生预设欺诈风险行为的时刻;
比对模块,用于将获取到的不同实体对象的行为产生时刻进行比对,对于所述行为产生时刻不同的任意两个实体对象,分别获取所述两个实体对象的行为数据;
计算模块,用于根据所述行为数据计算所述两个实体对象之间的行为相似度,并根据所述行为产生时刻计算所述两个实体对象之间的行为产生间隔时长;
第一判断模块,用于判断所述行为相似度是否大于或等于预设的相似度阈值,以及所述行为产生间隔时长是否小于或等于预设时长;
第一建立模块,用于若所述行为相似度大于或等于预设的相似度阈值,且所述行为产生间隔时长小于或等于预设时长,则建立所述两个实体对象之间的异常时序行为关联关系。
可选地,所述确定模块还用于:
在复杂网络中,检测各实体对象之间是否存在公共边,将与任一实体对象存在公共边的实体对象作为待分析的实体对象,其中,所述公共边用于表示实体对象之间的行为关联关系。
可选地,所述实体关联装置还包括:
***模块,用于当接收到实体对象***请求时,根据所述实体对象***请求在所述复杂网络中***一个新的实体对象;
获取模块,用于获取所述新的实体对象的行为数据,以及所述复杂网络中已有的实体对象的行为数据;
第二判断模块,用于判断所述新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间是否存在预设的公共部分;
第二建立模块,用于若所述新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间存在预设的公共部分,则在所述新的实体对象和所述复杂网络中已有的实体对象之间建立一条公共边。
可选地,所述计算模块还用于:
分别从所述两个实体对象的行为数据中提取出预设维度的行为特征,对应得到两个行为特征集合;
计算所述两个行为特征集合之间的相似度;
将所述两个行为特征集合之间的相似度作为所述两个实体对象之间的行为相似度。
可选地,所述计算模块还用于:
根据杰卡德公式,计算所述两个行为特征集合之间的杰卡德系数,将所述杰卡德系数作为所述两个行为特征集合之间的相似度,所述杰卡德公式为:
Figure BDA0002383474600000041
其中,J(A,B)表示杰卡德系数,A和B分别表示两个行为特征集合,|A∩B|表示集合A与集合B的交集中的元素个数,|A∪B|表示集合A与集合B的并集中的元素个数。
可选地,所述实体关联装置还包括:
生成模块,用于根据建立的所述两个实体对象之间的异常时序行为关联关系,生成一个异常时序行为关系网络,并生成与所述异常时序行为关系网络对应的欺诈告警信息;
发送模块,用于将所述异常时序行为关系网络及对应的欺诈告警信息发送至预设终端。
可选地,实体关联装置还包括:
识别模块,用于若所述行为相似度小于预设的相似度阈值,或者所述行为产生间隔时长大于预设时长,则判定所述两个实体对象之间不存在异常时序行为关联关系;将所述复杂网络中与任一实体对象均不存在所述异常时序行为关联关系的实体对象作为不存在欺诈风险的实体对象。
此外,为实现上述目的,本发明还提供一种实体关联设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的实体关联程序,所述实体关联程序被所述处理器执行时实现如上所述的实体关联方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实体关联程序,所述实体关联程序被处理器执行时实现如上所述的实体关联方法的步骤。
由于欺诈客户的行为,特别是欺诈群组客户的行为具有短时间、小范围内趋同的表现,因此本发明通过在传统的复杂网络中引入时序因素,结合时序因素和行为相似度判断两个实体对象之间是否存在异常时序行为关联关系,进而将行为相似度大于或等于预设的相似度阈值、行为产生间隔时长小于或等于预设时长的用户实体之间建立异常时序行为关联关系,能够便于对群组反欺诈行为进行分析和识别,从而提升了基于复杂网络的欺诈风险判别能力。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明实体关联方法第一实施例的流程示意图;
图3为本发明实体关联方法第一实施例的应用场景示意图;
图4为本发明实体关联装置一实施例的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
在本发明实施例中,实体关联设备可以是服务器、计算机等具有数据处理功能的设备。
如图1所示,该实体关联设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对本实施例的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及实体关联程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的实体关联程序,并执行下述实体关联方法各个实施例中的操作。
基于上述硬件结构,提出本发明实体关联方法各个实施例。
参照图2,图2为本发明实体关联方法第一实施例的流程示意图,所述方法包括:
步骤S10,在复杂网络中确定待分析的实体对象,获取所述待分析的实体对象的行为产生时刻,所述行为产生时刻为所述待分析的实体对象产生预设欺诈风险行为的时刻;
复杂网络是由顶点和连接顶点的边所组成的网络,其中顶点用于表示真实***中不同的个体,而边则用于表示个体之间相互影响的关联关系。在本实施例中,复杂网络用于表示不同实体对象之间的关联关系。
在本实施例中,以执行实体关联方法的设备为服务器为例进行说明。首先,服务器在复杂网络中确定待分析的实体对象。
在一实施方式中,在复杂网络中确定待分析的实体对象的步骤可以进一步包括:在复杂网络中,检测各实体对象之间是否存在公共边,将与任一实体对象存在公共边的实体对象作为待分析的实体对象,其中,所述公共边用于表示实体对象之间的行为关联关系。
具体地,服务器可以在复杂网络中,检测各实体对象之间是否存在公共边,若某一实体对象与其它任一实体对象之间存在公共边,说明该实体对象与其它实体对象之间存在关联关系,此时将该实体对象作为待分析的实体对象。比如,当前的复杂网络中包括3个实体对象:A、B和C,其中实体对象A与B之间存在一条公共边,实体对象C与实体对象A、B之间均不存公共边,则此时将实体对象A、B作为待分析的实体对象。这种服务器自动确定待分析的实体对象的方式简单便捷,为后续识别群组欺诈行为提供了前提保证。
在另一实施方式中,待分析的实体对象可以由用户通过交互界面选择,即服务器接受用户的选择指令,将用户在复杂网络中选定的实体对象作为待分析的实体对象,具体实施时可灵活设置。
在确定待分析的实体对象后,服务器可以读取预先保存的该待分析的实体对象的行为产生时刻,该行为产生时刻为实体对象产生预设欺诈风险行为的时刻,其中欺诈风险行为可以根据实际业务灵活设置,比如,银行的信贷业务一般存在欺诈风险,因此可以将信贷行为设置为欺诈风险行为,此时可以将贷款申请人的申请时刻作为发生欺诈风险行为的时刻。
步骤S20,将获取到的不同实体对象的行为产生时刻进行比对,对于所述行为产生时刻不同的任意两个实体对象,分别获取所述两个实体对象的行为数据;
本实施例中,由于复杂网络中的不同实体对象的行为产生时刻一般不同,因此可以以行为产生时刻来确定需要进行行为相似度分析的实体对象。具体地,服务器将获取到的不同实体对象的行为产生时刻进行比对,对于行为产生时刻不同的任意两个实体对象,读取预先保存的该两个实体对象的行为数据,该行为数据即实体对象产生欺诈风险行为时所留的相关数据。
以信贷行为为例,假设待分析的实体对象为申请人1、申请人2、申请人3和申请人4,对应的贷款申请时刻分别为10:00、10:03、10:07、10:11,由于任意两个申请人的贷款申请时刻均不同,因此需要获取申请人1、申请人2、申请人3和申请人4的行为数据,该行为数据可以包括申请人贷款时所留下的手机号、设备指纹(后台记录的设备“指纹”,用于唯一标识一台设备,可以综合多种因素生成设备指纹,如手机型号、缓存、屏幕分辨率等)、联系人、邮箱、工作公司、工作地点等。
步骤S30,根据所述行为数据计算所述两个实体对象之间的行为相似度,并根据所述行为产生时刻计算所述两个实体对象之间的行为产生间隔时长;
该步骤中,根据行为数据计算所述两个实体对象之间的行为相似度的步骤可以进一步包括:分别从所述两个实体对象的行为数据中提取出预设维度的行为特征,得到两个行为特征集合;计算所述两个行为特征集合之间的相似度;将所述两个行为特征集合之间的相似度作为所述两个实体对象之间的行为相似度。
其中,提取的行为特征的维度可以灵活设置。以两个实体对象为上述申请人1和申请人2为例,可以分别基于申请人1和申请2提取其贷款时所留的手机号、设备指纹和工作公司三个维度的行为特征,得到两个行为特征集合:集合A={152,09ab,公司X},集合B={138,09ab,公司X},其中152,138表示手机号,09ab表示设备指纹,公司X表示工作公司。之后,计算这两个集合之间的相似度,作为申请人1和申请人2之间的行为相似度。
进一步地,所述计算所述两个行为特征集合之间的相似度的步骤可以包括:根据杰卡德公式,计算所述两个行为特征集合之间的杰卡德系数,将所述杰卡德系数作为所述两个行为特征集合之间的相似度,所述杰卡德公式为:
Figure BDA0002383474600000091
其中,J(A,B)表示杰卡德系数,A和B分别表示两个行为特征集合,|A∩B|表示集合A与集合B的交集中的元素个数,|A∪B|表示集合A与集合B的并集中的元素个数。
以上述集合A={152,09ab,公司X},集合B={138,09ab,公司X}为例,|A∩B|=2,|A∪B|=4,因此J(A,B)=0.5,即申请人1和申请人2之间的行为相似度为0.5。
上述采用杰卡德公式计算两个行为特征集合之间的相似度方便、快捷,计算效率较高。
另外,可以将两个实体对象的行为产生时刻相减,从而计算出两个实体对象之间的行为产生间隔时长,比如申请人1和申请人2的行为产生时刻为10:00、10:03,则申请人1和申请人2的行为产生间隔时长为3s。
步骤S40,判断所述行为相似度是否大于或等于预设的相似度阈值,以及所述行为产生间隔时长是否小于或等于预设时长;
为方便理解,结合实际的信贷行为进行说明,正常的信贷行为都是独立的客户独立进行的,因此通过将这些客户的信息在复杂网络中进行关联,我们会发现,正常的客户借贷行为下,客户填写的资料往往很难关联在一起,或者关联程度非常低;而异常的客户信贷行为则是,由于黑产和羊毛党的存在,他们手中握有大量非法渠道获取的真实客户信息,然后通过这些客户信息,进行虚假借贷,这些借贷行为发生的间隔时间往往较短,且提供的客户信息存在大量的交叉,而这些交叉,反应在复杂网络中的表现就是大量申请人公用相同的信息(比如公用手机号、设备指纹等)。由此可以得出:欺诈情形下,两个申请人的信贷行为具有相似度高、行为发生的时间间隔短的特点;而正常(非欺诈)情形下,两个申请人的信贷行为具有相似度低、行为发生的时间间隔长的特点。
基于上述特点,本实施例中,服务器判断计算得到的行为相似度是否大于或等于预设的相似度阈值,以及所述行为产生间隔时长是否小于或等于预设时长。其中,相似度阈值和时间阈值均可以灵活设置,比如,由于杰卡德系数的取值范围是[0,1],因此相似度阈值可以取[0,1]中的任意值,如0.2,而由于实际的欺诈群组客户的行为具有短时间趋同的表现,因此时间阈值可以设置得较短,如5s。
需要说明的是,随着业务量的扩展和时间的推移,客户的信息慢慢的会不可避免的进行交叉重复,如果只考虑当前时间节点上,客户在复杂网络中的关联表现,很容易对客户的信贷行为进行误判,将一个正常的借贷行为误判为异常信贷行为,本实施例通过结合行为相似度和行为产生间隔时间进行异常判定,能够避免静态复杂网络上由于数据信息累积而造成的误杀。
若所述行为相似度大于或等于预设的相似度阈值,且所述行为产生间隔时长小于或等于预设时长,则执行步骤S50,建立所述两个实体对象之间的异常时序行为关联关系。
本实施例中,若行为相似度大于或等于预设的相似度阈值,或者行为产生间隔时间小于或等于预设的时间阈值,说明两个实体对象之间的行为关联程度较高,符合实际场景中欺诈群组客户的行为具有短时间、小范围内趋同的表现,此时建立这两个实体对象之间的异常时序行为关联关系,表示这两个实体对象具有相关联的异常时序行为。
参照图3,图3为本发明实体关联方法第一实施例的应用场景示意图。假设现在复杂网络中待分析的实体对象有4个,分别是申请人1~4,假设计算得到的申请人1~4两两之间的行为相似度sim和行为产生时间间隔△t分别为:
申请人1和2:sim=0.5,△t=3s;申请人1和3:sim=0.5,△t=7s;
申请人1和4:sim=0.2,△t=11s;申请人2和3:sim=0.2,△t=4s;
申请人2和4:sim=0.2,△t=7s;申请人3和4:sim=0.0,△t=4s。
通过预设的相似度阈值S=0.2,预设时长T=5s,将sim≥0.2,且△t≤5s的实体对象进行关联,可以得到一个异常时序行为关系网络,该异常时序行为关系网络中,申请人1和2、申请人2和3之间存在异常时序行为关联关系,而申请人4不与任何一个人存在异常时序行为关联关系,通过该网络,可以针对性进行风险分析,如社区发现,群组分析,风险传播等。
在本实施例中,由于欺诈客户的行为,特别是欺诈群组客户的行为具有短时间、小范围内趋同的表现,因此本实施例通过在传统的复杂网络中引入时序因素,结合时序因素和行为相似度判断两个实体对象之间是否存在异常时序行为关联关系,进而将行为相似度大于或等于预设的相似度阈值、行为产生间隔时长小于或等于预设时长的用户实体之间建立异常时序行为关联关系,能够便于对群组反欺诈行为进行分析和识别,从而提升了基于复杂网络的欺诈风险判别能力。
进一步地,基于本发明实体关联方法第一实施例,提出本发明实体关联方法第二实施例。
在本实施例中,在复杂网络中确定待分析的实体对象的步骤之前,还可以包括:
当接收到实体对象***请求时,根据所述实体对象***请求在所述复杂网络中***一个新的实体对象;
在本实施例中,当有新的业务生成,比如有一笔新申请的贷款时,触发实体对象***请求,当服务器接收到实体对象***请求时,在复杂网络中***一个新的实体对象。
获取所述新的实体对象的行为数据,以及所述复杂网络中已有的实体对象的行为数据;
该步骤中,服务器可以接收用户的输入指令,从而获取到该新的实体对象的行为数据并进行保存,此外,服务器可以读取预先保存的复杂网络中已有的实体对象的行为数据。
判断所述新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间是否存在预设的公共部分;
该步骤中,服务器判断新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间是否存在预设的公共部分,比如当两个贷款申请人所留手机号相同时,即判定两个申请人对应的实体对象之间存在公共部分。
若所述新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间存在预设的公共部分,则在所述新的实体对象和所述复杂网络中已有的实体对象之间建立一条公共边。
该步骤中,若新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间存在预设的公共部分,则在新的实体对象和复杂网络中已有的实体对象之间建立一条公共边。
本实施例考虑了新的实体对象***复杂网络的情况,通过在所述新的实体对象和所述复杂网络中已有的实体对象之间建立一条公共边,为后续根据公共边确定待分析的实体对象提供了前提保证。
进一步地,基于本发明实体关联方法第一实施例,提出本发明实体关联方法第三实施例。
在本实施例中,上述步骤S50之后,还可以包括:
根据建立的所述两个实体对象之间的异常时序行为关联关系,生成一个异常时序行为关系网络,并生成与所述异常时序行为关系网络对应的欺诈告警信息;
该步骤中,服务器根据建立的两个实体对象之间的异常时序行为关联关系,生成一个异常时序行为关系网络,即重新构建一个基于用户异常时序行为的关系网络,并生成与该异常时序行为关系网络对应的欺诈告警信息。
参照图3,通过预设的相似度阈值S=0.2,预设时长T=5s,将sim≥0.2,且△t≤5s的实体对象进行关联,即建立申请人1和2、申请人2和3之间的关联关系,由此可以将复杂网络转换为一个异常时序行为关系网络,其中申请人4不与任何一个人存在异常时序行为关联关系;之后,服务器生成与该异常时序行为关系网络对应的欺诈告警信息,该欺诈告警信息可以包括实体对象及实体对象之间的异常时序行为关联关系。
将所述异常时序行为关系网络及对应的欺诈告警信息发送至预设终端。
该步骤中,服务器将上述生成的异常时序行为关系网络及对应的告警信息发送至预设终端,该预设终端可以是计算机、手机、平板电脑等。如此便于终端工作人员进行针对性的风险分析,如社区发现,群组分析,风险传播等。
进一步地,基于本发明实体关联方法第一、第二和第三实施例,提出本发明实体关联方法第四实施例。
在本实施例中,上述步骤S40之后,还可以包括:若所述行为相似度小于预设的相似度阈值,或者所述行为产生间隔时长大于预设时长,则判定所述两个实体对象之间不存在异常时序行为关联关系;
该步骤中,由于正常(非欺诈)情形下,两个申请人的信贷行为具有相似度低、行为发生的时间间隔长的特点,因此,若行为相似度小于预设的相似度阈值,或者行为产生间隔时间大于预设的时间阈值,说明两个实体对象之间的行为关联程度非常低,此时可以判定两个实体对象之间不存在异常时序行为关联关系。
将所述复杂网络中与任一实体对象均不存在所述异常时序行为关联关系的实体对象作为不存在欺诈风险的实体对象。
该步骤中,服务器将复杂网络中与任一实体对象均不存在所述异常时序行为关联关系的实体对象作为不存在欺诈风险的实体对象。参照图3,图3生成的异常时序行为关系网络中,申请人4不与任何一个实体对象存在异常时序行为关联关系,因此可以将申请人4作为不存在欺诈风险的实体对象。
上述方式实现了对不存在欺诈风险的实体对象的识别,进一步提升了基于复杂网络的欺诈风险判别能力。
本发明还提供一种实体关联装置。参照图4,图4为本发明实体关联装置一实施例的模块示意图。本实施例中,所述实体关联装置包括:
确定模块10,用于在复杂网络中确定待分析的实体对象,获取所述待分析的实体对象的行为产生时刻,所述行为产生时刻为所述待分析的实体对象产生预设欺诈风险行为的时刻;
比对模块20,用于将获取到的不同实体对象的行为产生时刻进行比对,对于所述行为产生时刻不同的任意两个实体对象,分别获取所述两个实体对象的行为数据;
计算模块30,用于根据所述行为数据计算所述两个实体对象之间的行为相似度,并根据所述行为产生时刻计算所述两个实体对象之间的行为产生间隔时长;
第一判断模块40,用于判断所述行为相似度是否大于或等于预设的相似度阈值,以及所述行为产生间隔时长是否小于或等于预设时长;
第一建立模块50,用于若所述行为相似度大于或等于预设的相似度阈值,且所述行为产生间隔时长小于或等于预设时长,则建立所述两个实体对象之间的异常时序行为关联关系。
进一步地,所述确定模块10还用于:
在复杂网络中,检测各实体对象之间是否存在公共边,将与任一实体对象存在公共边的实体对象作为待分析的实体对象,其中,所述公共边用于表示实体对象之间的行为关联关系。
进一步地,所述实体关联装置还包括:
***模块,用于当接收到实体对象***请求时,根据所述实体对象***请求在所述复杂网络中***一个新的实体对象;
获取模块,用于获取所述新的实体对象的行为数据,以及所述复杂网络中已有的实体对象的行为数据;
第二判断模块,用于判断所述新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间是否存在预设的公共部分;
第二建立模块,用于若所述新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间存在预设的公共部分,则在所述新的实体对象和所述复杂网络中已有的实体对象之间建立一条公共边。
进一步地,所述计算模块30还用于:
分别从所述两个实体对象的行为数据中提取出预设维度的行为特征,对应得到两个行为特征集合;
计算所述两个行为特征集合之间的相似度;
将所述两个行为特征集合之间的相似度作为所述两个实体对象之间的行为相似度。
进一步地,所述计算模块30还用于:
根据杰卡德公式,计算所述两个行为特征集合之间的杰卡德系数,将所述杰卡德系数作为所述两个行为特征集合之间的相似度,所述杰卡德公式为:
Figure BDA0002383474600000141
其中,J(A,B)表示杰卡德系数,A和B分别表示两个行为特征集合,|A∩B|表示集合A与集合B的交集中的元素个数,|A∪B|表示集合A与集合B的并集中的元素个数。
进一步地,所述实体关联装置还包括:
生成模块,用于根据建立的所述两个实体对象之间的异常时序行为关联关系,生成一个异常时序行为关系网络,并生成与所述异常时序行为关系网络对应的欺诈告警信息;
发送模块,用于将所述异常时序行为关系网络及对应的欺诈告警信息发送至预设终端。
进一步地,所述实体关联装置还包括:
识别模块,用于若所述行为相似度小于预设的相似度阈值,或者所述行为产生间隔时长大于预设时长,则判定所述两个实体对象之间不存在异常时序行为关联关系;将所述复杂网络中与任一实体对象均不存在所述异常时序行为关联关系的实体对象作为不存在欺诈风险的实体对象。
上述实体关联装置中各个模块的功能实现与上述实体关联方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有实体关联程序,所述实体关联程序被处理器执行时实现如上所述的实体关联方法的步骤。
其中,在所述处理器上运行的实体关联程序被执行时所实现的方法可参照本发明实体关联方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种实体关联方法,其特征在于,所述实体关联方法包括如下步骤:
在复杂网络中确定待分析的实体对象,获取所述待分析的实体对象的行为产生时刻,所述行为产生时刻为所述待分析的实体对象产生预设欺诈风险行为的时刻;
将获取到的不同实体对象的行为产生时刻进行比对,对于所述行为产生时刻不同的任意两个实体对象,分别获取所述两个实体对象的行为数据;
根据所述行为数据计算所述两个实体对象之间的行为相似度,并根据所述行为产生时刻计算所述两个实体对象之间的行为产生间隔时长;
判断所述行为相似度是否大于或等于预设的相似度阈值,以及所述行为产生间隔时长是否小于或等于预设时长;
若所述行为相似度大于或等于预设的相似度阈值,且所述行为产生间隔时长小于或等于预设时长,则建立所述两个实体对象之间的异常时序行为关联关系。
2.如权利要求1所述的实体关联方法,其特征在于,所述在复杂网络中确定待分析的实体对象的步骤包括:
在复杂网络中,检测各实体对象之间是否存在公共边,将与任一实体对象存在公共边的实体对象作为待分析的实体对象,其中,所述公共边用于表示实体对象之间的行为关联关系。
3.如权利要求2所述的实体关联方法,其特征在于,所述在复杂网络中确定待分析的实体对象的步骤之前,还包括:
当接收到实体对象***请求时,根据所述实体对象***请求在所述复杂网络中***一个新的实体对象;
获取所述新的实体对象的行为数据,以及所述复杂网络中已有的实体对象的行为数据;
判断所述新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间是否存在预设的公共部分;
若所述新的实体对象的行为数据与所述复杂网络中已有的实体对象的行为数据之间存在预设的公共部分,则在所述新的实体对象和所述复杂网络中已有的实体对象之间建立一条公共边。
4.如权利要求1所述的实体关联方法,其特征在于,所述根据所述行为数据计算所述两个实体对象之间的行为相似度的步骤包括:
分别从所述两个实体对象的行为数据中提取出预设维度的行为特征,对应得到两个行为特征集合;
计算所述两个行为特征集合之间的相似度;
将所述两个行为特征集合之间的相似度作为所述两个实体对象之间的行为相似度。
5.如权利要求4所述的实体关联方法,其特征在于,所述计算所述两个行为特征集合之间的相似度的步骤包括:
根据杰卡德公式,计算所述两个行为特征集合之间的杰卡德系数,将所述杰卡德系数作为所述两个行为特征集合之间的相似度,所述杰卡德公式为:
Figure FDA0002383474590000021
其中,J(A,B)表示杰卡德系数,A和B分别表示两个行为特征集合,|A∩B|表示集合A与集合B的交集中的元素个数,|A∪B|表示集合A与集合B的并集中的元素个数。
6.如权利要求1所述的实体关联方法,其特征在于,所述建立所述两个实体对象之间的异常时序行为关联关系的步骤之后,还包括:
根据建立的所述两个实体对象之间的异常时序行为关联关系,生成一个异常时序行为关系网络,并生成与所述异常时序行为关系网络对应的欺诈告警信息;
将所述异常时序行为关系网络及对应的欺诈告警信息发送至预设终端。
7.如权利要求1至6中任一项所述的实体关联方法,其特征在于,所述判断所述行为相似度是否大于或等于预设的相似度阈值,以及所述行为产生间隔时长是否小于或等于预设时长的步骤之后,还包括:
若所述行为相似度小于预设的相似度阈值,或者所述行为产生间隔时长大于预设时长,则判定所述两个实体对象之间不存在异常时序行为关联关系;
将所述复杂网络中与任一实体对象均不存在所述异常时序行为关联关系的实体对象作为不存在欺诈风险的实体对象。
8.一种实体关联装置,其特征在于,所述实体关联装置包括:
确定模块,用于在复杂网络中确定待分析的实体对象,获取所述待分析的实体对象的行为产生时刻,所述行为产生时刻为所述待分析的实体对象产生预设欺诈风险行为的时刻;
比对模块,用于将获取到的不同实体对象的行为产生时刻进行比对,对于所述行为产生时刻不同的任意两个实体对象,分别获取所述两个实体对象的行为数据;
计算模块,用于根据所述行为数据计算所述两个实体对象之间的行为相似度,并根据所述行为产生时刻计算所述两个实体对象之间的行为产生间隔时长;
第一判断模块,用于判断所述行为相似度是否大于或等于预设的相似度阈值,以及所述行为产生间隔时长是否小于或等于预设时长;
第一建立模块,用于若所述行为相似度大于或等于预设的相似度阈值,且所述行为产生间隔时长小于或等于预设时长,则建立所述两个实体对象之间的异常时序行为关联关系。
9.一种实体关联设备,其特征在于,所述实体关联设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的实体关联程序,所述实体关联程序被所述处理器执行时实现如权利要求1至7中任一项所述的实体关联方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有实体关联程序,所述实体关联程序被处理器执行时实现如权利要求1至7中任一项所述的实体关联方法的步骤。
CN202010090265.0A 2020-02-13 2020-02-13 实体关联方法、装置、设备及计算机可读存储介质 Pending CN111369264A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010090265.0A CN111369264A (zh) 2020-02-13 2020-02-13 实体关联方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010090265.0A CN111369264A (zh) 2020-02-13 2020-02-13 实体关联方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111369264A true CN111369264A (zh) 2020-07-03

Family

ID=71211433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010090265.0A Pending CN111369264A (zh) 2020-02-13 2020-02-13 实体关联方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111369264A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112085322A (zh) * 2020-07-30 2020-12-15 北京明略软件***有限公司 基于鲜活度指标的关联可信度评估方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670933A (zh) * 2018-09-26 2019-04-23 深圳壹账通智能科技有限公司 识别用户角色的方法、用户设备、存储介质及装置
CN109903169A (zh) * 2019-01-23 2019-06-18 平安科技(深圳)有限公司 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质
CN110297948A (zh) * 2019-05-28 2019-10-01 阿里巴巴集团控股有限公司 关系网络构建方法以及装置
CN110321438A (zh) * 2019-06-14 2019-10-11 北京奇艺世纪科技有限公司 基于复杂网络的实时欺诈检测方法、装置及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670933A (zh) * 2018-09-26 2019-04-23 深圳壹账通智能科技有限公司 识别用户角色的方法、用户设备、存储介质及装置
CN109903169A (zh) * 2019-01-23 2019-06-18 平安科技(深圳)有限公司 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质
CN110297948A (zh) * 2019-05-28 2019-10-01 阿里巴巴集团控股有限公司 关系网络构建方法以及装置
CN110321438A (zh) * 2019-06-14 2019-10-11 北京奇艺世纪科技有限公司 基于复杂网络的实时欺诈检测方法、装置及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112085322A (zh) * 2020-07-30 2020-12-15 北京明略软件***有限公司 基于鲜活度指标的关联可信度评估方法和装置
CN112085322B (zh) * 2020-07-30 2024-01-23 北京明略软件***有限公司 基于鲜活度指标的关联可信度评估方法和装置

Similar Documents

Publication Publication Date Title
CN106384273B (zh) 恶意刷单检测***及方法
CN105791255B (zh) 基于账户聚类的计算机风险识别方法及其***
CN111861240A (zh) 可疑用户识别方法、装置、设备及可读存储介质
JP2018519586A (ja) アカウント盗難リスクの識別方法、識別装置、及び防止・制御システム
CN111949702B (zh) 异常交易数据的识别方法、装置及设备
CN105208009B (zh) 一种账号安全检测方法及装置
CN113553583A (zh) 信息***资产安全风险评估方法与装置
CN110839003A (zh) 盗号行为识别方法、装置、计算机设备和存储介质
CN112000984A (zh) 一种数据泄露检测方法、装置、设备及可读存储介质
CN112307464A (zh) 诈骗识别方法、装置及电子设备
US9973508B2 (en) Dynamic record identification and analysis computer system with event monitoring components
CN111369264A (zh) 实体关联方法、装置、设备及计算机可读存储介质
CN115713339B (zh) 一种数据量子计算管控方法、装置、设备及计算机介质
CN112699264A (zh) 一种基于聊天记录的风控管理方法及***
US9998486B2 (en) System for utilizing one or more databases to identify a point of compromise
CN111582757A (zh) 欺诈风险的分析方法、装置、设备及计算机可读存储介质
CN114817518B (zh) 基于大数据档案识别的证照办理方法、***及介质
CN108540471B (zh) 移动应用网络流量聚类方法、计算机可读存储介质和终端
CN110706221A (zh) 图片定制化的验证方法、验证设备、存储介质及装置
CN109587248A (zh) 用户识别方法、装置、服务器及存储介质
CN114841698A (zh) 交易信息的处理方法、装置及计算机可读存储介质
CN111339829B (zh) 用户身份鉴定方法、装置、计算机设备和存储介质
CN109636574B (zh) 信贷信息的风险检测方法、装置、设备及存储介质
CN113343010A (zh) 一种图像识别方法、电子设备及计算机可读存储介质
US20220237316A1 (en) Methods and systems for image selection and push notification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination