CN112163096A - 一种恶意团体确定方法、装置、电子设备及存储介质 - Google Patents

一种恶意团体确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112163096A
CN112163096A CN202010988896.4A CN202010988896A CN112163096A CN 112163096 A CN112163096 A CN 112163096A CN 202010988896 A CN202010988896 A CN 202010988896A CN 112163096 A CN112163096 A CN 112163096A
Authority
CN
China
Prior art keywords
candidate
entities
entity
determining
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010988896.4A
Other languages
English (en)
Inventor
杨弘志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202010988896.4A priority Critical patent/CN112163096A/zh
Publication of CN112163096A publication Critical patent/CN112163096A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种恶意团体确定方法、装置、电子设备及存储介质。该方法包括:根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱;确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体;根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体;根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。通过运行本发明实施例所提供的技术方案,可以解决单维度的风控策略难以多方位地获取恶意团伙的行为,并且恶意团伙的行为发生时间迅速,短时间内难以有效发现恶意团伙并部署策略的问题,实现提高恶意团体确定的效率和准确率的效果。

Description

一种恶意团体确定方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及计算机技术,尤其涉及一种恶意团体确定方法、装置、电子设备及存储介质。
背景技术
随着数字技术与金融业的融合发展,产生了从事网络上的薅羊毛,刷单等非法活动的恶意团伙,导致金融欺诈风险不断扩大,网络金融风控形势愈加严峻。
现有技术中,当安全问题爆发时,主要通过人工分析的方式对不同场景观测、分析,从而制定相应的策略。然而单维度的风控策略难以多方位地获取恶意团伙的行为,并且恶意团伙的行为发生时间迅速,短时间内难以有效发现恶意团伙并部署策略。
发明内容
本发明实施例提供一种恶意团体确定方法、装置、电子设备及存储介质,以实现提高恶意团体确定的效率和准确率的效果。
第一方面,本发明实施例提供了一种恶意团体确定方法,该方法包括:
根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱;
确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体;
根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体;
根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。
第二方面,本发明实施例还提供了一种恶意团体确定装置,该装置包括:
知识图谱确定模块,用于根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱;
候选实体选择模块,用于确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体;
知识图谱划分模块,用于根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体;
恶意团体确定模块,用于根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的恶意团体确定方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的恶意团体确定方法。
本发明实施例通过根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱;确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体;根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体;根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。解决单维度的风控策略难以多方位地获取恶意团伙的行为,并且恶意团伙的行为发生时间迅速,短时间内难以有效发现恶意团伙并部署策略的问题,实现提高恶意团体确定的效率和准确率的效果。
附图说明
图1为本发明实施例一提供的一种恶意团体确定方法的流程图;
图2为本发明实施例二提供的一种恶意团体确定方法的流程图;
图3为本发明实施例三提供的一种恶意团体装置的结构示意图;
图4为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种恶意团体确定方法的流程图,本实施例可适用于从历史欺诈数据中确定恶意团体的情况,该方法可以由本发明实施例所提供的恶意团体确定装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本实施例提供的恶意团体确定方法,包括:
步骤110、根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱。
其中,历史欺诈数据为已经认定与欺诈行为相关的数据,例如欺诈交易、欺诈账户等。初始实体为根据历史欺诈数据获取的实体对象,示例性的,若历史欺诈数据为欺诈交易数据,则可根据欺诈交易获取欺诈交易的交易方、交易方的基础信息、交易账户等,并从中确定初始实体。由于恶意团伙的一大行为特点是行为特征会具有高度的相似性和关联性,某些资源会被重复使用,示例性的,大量的用户同时使用同一个手机号、交易来源于同一个服务器IP、用户使用同一个邮箱地址、提交申请时间异常集中等。
本实施例中,可选的,所述初始实体包括用户和以下至少一种:手机号、邮箱地址、服务器地址、申请时间、设备和身份证号码。其中,手机号、邮箱地址、服务器地址、申请时间、设备和身份证号码等属于与用户的强关联性特征,从而提高后续恶意团体确定的准确率,同时通过多种类的初始实体侦测恶意行为,避免由于恶意团伙通过变换单个资源来应对相应的风控策略的情况
初始实体之间的关系初始实体之间的联系,可以为用户和手机号的联系,手机号与账户的绑定关系等。
将初始实体作为知识图谱的节点,初始实体之间的关系作为知识图谱的边,构建知识图谱。边的权重可以根据实体之间的关联关系的重要性进行设置,可以为经验值,权重的合理设置有利于后续知识图谱的划分。边的属性可以根据业务要求而设定,例如交易之间的边为有向边,用户与身份证号码之间的边为无向边等。
步骤120、确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体。
由于在实际场景中,恶意团伙在进行薅羊毛等恶意行为时,团伙成员在属性和行为上通常具有很高的相似度。例如互联网上的营销活动,许多银行企业的网络平台为拉新留存,提高用户活跃度,会采取一些营销活动或者策略,包括注册送红包、送优惠券等。这些活动会吸引来大量的薅羊毛用户。他们通过批量操作或者平台的漏洞来大量领取企业或者平台提供的福利。
因此通过确定知识图谱中不同初始实体之间的相似程度以获取初始实体之间关系的紧密程度。候选实体为初始实体中选择出的,可能与恶意团体相关的实体。
本实施例中,可选的,确定所述知识图谱中不同所述初始实体之间的相似程度,包括:
基于杰卡德相似度算法,确定所述知识图谱中不同所述初始实体之间的相似程度。
其中,可以获取初始实体对应的特征数值,特征数值为体现初始实体属性的数值,若初始实体一的特征数值为A,初始实体二的特征数值为B,则将A和B代入杰卡德相似度算法,获取数值为0-1之间的值作为初始实体一和二之间的相似程度。通过将初始实体的属性转换为数值,获取实体之间的相似程度,提高实体之间的相似程度获取的准确性。
本实施例中,可选的,根据所述相似程度从所述初始实体中选择候选实体,包括:
根据所述相似程度从所述初始实体中选择所述相似程度大于预设相似程度阈值的实体作为所述候选实体。
通过两两比较获取初始实体互相之间的相似程度,筛选相似程度在整个初始实体范围内小于预设相似程度阈值的实体,将筛选后的实体作为候选实体。去除初始实体整体中关联程度不大的实体,从而提高后续知识图谱划分的效率和准确率。
本实施例中,可选的,在确定所述知识图谱中不同所述初始实体之间的相似程度之前,还包括:
保存所述知识图谱至图数据库,以确定所述图数据库中的所述知识图谱中不同所述初始实体之间的相似程度。
计算初始实体之间的相似程度时,计算复杂度会随着初始实体的信息的复杂度的增加而增加,而且在实际的业务场景中,需要在极有限时间内计算百万甚至千万级数量的初始实体的相似性。因此在确定知识图谱后,可以将知识图谱存入具有高存储性能和高计算性能的图数据库进行处理,以提高后续初始实体之间的相似程度计算的处理效率。
步骤130、根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
其中,候选团体为可能为恶意团体的团体。根据候选实体之间的关联,将候选实体和候选实体之间关系确定的知识图谱进行划分,分成若干个特定的、具有独特性质的区域,根据获取的恶意团体的类型,将每个区域中同等类型的实体的集合作为候选团体。例如,若恶意团体为进行恶意操作的用户的集合,则候选团体中的实体为用户实体;若恶意团体为进行恶意操作过程中的账户集合,则候选团体中的实体为账户实体。
步骤140、根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。
其中,候选实体的得分可以为候选实体在候选团体中的相似度得分,本实施例对此不作限制。候选实体的得分可以基于候选实体的自身的基础属性以及候选实体与其它候选实体之间的关系通过知识图谱划分算法获取,根据候选实体的得分确定候选团体是否为整体关系紧密的团体,从而确定候选团体是否为恶意团体。
本实施例中,可选的,根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体,包括:
获取所述候选团体中候选实体的得分;
判断得分大于预设得分阈值的所述候选团体中候选实体的数量占所述候选团体成员数量的比例是否大于预设比例;
若大于所述预设比例,则确定所述候选团体为恶意团体。
获取候选团体中单个候选实体对应的得分后,判断得分大于预设得分阈值的候选团体中候选实体的数量占候选团体成员数量的比例是否大于预设比例。示例性的,预设得分阈值为0.7,预设比例为百分之60,单个候选实体对应的得分区间为0-1,则得分大于0.7分的候选实体的数量占候选团体成员总数的比例大于百分之60时,确定候选团体为恶意团体。避免仅通过知识图谱划分确定恶意团体,提高恶意团体确定准确率。
本实施例中,可选的,在确定所述候选团体是否为恶意团体之后,还包括:
基于页面排名算法,确定所述恶意团体中成员的重要程度排序。
基于页面排名算法获取恶意团体中每个成员对于每个其他成员的影响力,按照影响力对成员进行排名,从而获得恶意团体中成员的重要程度排序。从而获取恶意团体中产生最重要影响的成员。
本实施例中,可选的,在确定所述恶意团体中成员的重要程度排序之后,还包括:
根据所述重要程度排序将所述恶意团体中的目标成员推送至恶意团体处理方。
可以根据预设要求将指定排名的成员作为目标成员推送至恶意团体处理方,例如将排名前百分之三十的成员进行推送,使得恶意团体处理方对推送对象进行处理,避免恶意团体成员过多降低后续分析处理效率,也通过分析重要程度较高的恶意团体成员提高分析的效率和针对性。
本实施例所提供的技术方案,通过根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱;确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体;根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体;根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。解决单维度的风控策略难以多方位地获取恶意团伙的行为,并且恶意团伙的行为发生时间迅速,短时间内难以有效发现恶意团伙并部署策略的问题,实现提高恶意团体确定的效率和准确率的效果。
实施例二
图2为本发明实施例二提供的一种恶意团体确定方法的流程图。本技术方案是针对确定知识图谱中不同所述初始实体之间的相似程度的过程进行补充说明的。与上述方案相比,本方案具体优化为,确定所述知识图谱中不同所述初始实体之间的相似程度,包括:
将属于所述知识图谱中任一实体类别的初始实体的基础属性值和关系属性值,与该实体类别的候选特征值区间进行匹配,得到该初始实体的目标特征值区间;
根据该实体类别下不同初始实体的目标特征值区间,确定不同初始实体之间的相似程度。具体的,恶意团体确定方法流程图如图2所示:
步骤210、根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱。
步骤220、将属于所述知识图谱中任一实体类别的初始实体的基础属性值和/或关系属性值,与该实体类别的候选特征值区间进行匹配,得到该初始实体的目标特征值区间。
其中,知识图谱中任一实体类别的初始实体的基础属性值和关系属性值为与该实体类别的初始实体基础属性和关系属性相关的数值。示例性的,若实体类别为欺诈交易的交易账户类,则单次交易金额的具体数值为基础属性值;交易账户与图谱中其它交易账户是否进行过交易,若进行交易一次则数值增加1,最终得到的值为关系属性值。该实体类别的候选特征值区间为预先设置的特征值区间,与实体类别的属性类别相关,示例性的,若属性类别为金额类,则设置0-5万作为1,5-100万作为区间2,将金额由具体数字转换为目标特征值区间。
步骤230、根据该实体类别下不同初始实体的目标特征值区间,确定不同初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体。
将基础属性值和/或关系属性值转换至目标特征值区间后,通过目标特征值区间获取不同初始实体之间的相似程度,根据相似程度从初始实体中选择相似程度大于预设相似程度阈值的实体作为候选实体。
步骤240、根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
本实施例中,可选的,基于模块度优化迭代算法,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
将知识图谱基于模块度优化迭代算法,将由候选实体确定的知识图谱划分为候选团体。模块度优化迭代算法可以为鲁汶算法。通过将不断地遍历候选实体,通过比较候选实体给每个相邻候选团体带来的模块度的变化,将单个候选实体加入到能够使模块度有最大增量的候选团体中。其中,模块度用于衡量候选团体划分的质量。例如候选实体v分别加入到候选团体A、B、C中,使得三个候选团体的模块度增量为-1,1,2,则候选实体v最终应该加入到候选团体C中。将属于候选团体的候选实体合并,即一个候选团体作为一个新的节点。不断迭代上述步骤,直至模块度不再变化或者到达最大迭代次数,以获取候选团体,从而提高候选团体划分的准确性。
本实施例中,可选的,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体,包括:
基于标签传播的社区发现算法,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
通过预先赋予某些候选实体“好”的标签或者“坏”的标签(白和黑)。然后让候选实体自然地往外拓展,如果靠近“好”的标签,则新的候选实体也被赋予“好”的标签,反之亦然,逐轮刷新所有候选实体的标签,直到达到收敛要求为止,以获取候选团体,从而提高候选团体划分的准确性。
本实施例中,可选的,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体,包括:
基于信息论的社区发现算法,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
开始时为每个候选实体分配一个独立的候选团体,知识图谱中的每个连通部分作为一个候选团体,将还未加入知识图谱的边分别重新加回知识图谱,如果加入知识图谱的边连接了两个不同的候选团体,即合并了两个候选团体,则计算形成的新的候选团体划分的平均描述长度的减少量。选择使平均描述长度减少最大的两个候选团体进行合并,重复上述过程,以获取候选团体,从而提高候选团体划分的准确性。
步骤250、根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。
本实施例所提供的技术方案,通过将基础属性值和/或关系属性值由较大数值转换数值较小的目标特征值区间,解决实际业务场景中需要在有限时间内计算出不同初始实体之间的相似程度的问题,提高后续相似程度计算的效率。
实施例三
图3为本发明实施例三提供的一种恶意团体装置的结构示意图。该装置可以由硬件和/或软件的方式来实现,可执行本发明任意实施例所提供的一种恶意团体方法,具备执行方法相应的功能模块和有益效果。如图3所示,该装置包括:
知识图谱确定模块310,用于根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱;
候选实体选择模块320,用于确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体;
知识图谱划分模块330,用于根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体;
恶意团体确定模块340,用于根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。
本实施例所提供的技术方案,通过根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱;确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体;根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体;根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。解决单维度的风控策略难以多方位地获取恶意团伙的行为,并且恶意团伙的行为发生时间迅速,短时间内难以有效发现恶意团伙并部署策略的问题,实现提高恶意团体确定的效率和准确率的效果。
在上述各技术方案的基础上,可选的,所述候选实体选择模块,包括:
标特征值区间获取单元,用于将属于所述知识图谱中任一实体类别的初始实体的基础属性值和关系属性值,与该实体类别的候选特征值区间进行匹配,得到该初始实体的目标特征值区间;
相似程度确定单元,用于根据该实体类别下不同初始实体的目标特征值区间,确定不同初始实体之间的相似程度。
在上述各技术方案的基础上,可选的,所述候选实体选择模块,包括:
相似程度确定单元,用于基于杰卡德相似度算法,确定所述知识图谱中不同所述初始实体之间的相似程度。
在上述各技术方案的基础上,可选的,所述候选实体选择模块,包括:
候选实体确定单元,用于根据所述相似程度从所述初始实体中选择所述相似程度大于预设相似程度阈值的实体作为所述候选实体。
在上述各技术方案的基础上,可选的,所述知识图谱划分模块,包括:
第一知识图谱划分单元,用于基于模块度优化迭代算法,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
在上述各技术方案的基础上,可选的,所述知识图谱划分模块,包括:
第二知识图谱划分单元,用于基于标签传播的社区发现算法,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
在上述各技术方案的基础上,可选的,所述知识图谱划分模块,包括:
第三知识图谱划分单元,用于基于信息论的社区发现算法,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
在上述各技术方案的基础上,可选的,所述恶意团体确定模块包括:
得分获取单元,用于获取所述候选团体中候选实体的得分;
比例判断单元,用于判断得分大于预设得分阈值的所述候选团体中候选实体的数量占所述候选团体成员数量的比例是否大于预设比例;
恶意团体确定单元,用于若大于所述预设比例,则确定所述候选团体为恶意团体。
在上述各技术方案的基础上,可选的,所述初始实体包括用户和以下至少一种:手机号、邮箱地址、服务器地址、申请时间、设备和身份证号码。
在上述各技术方案的基础上,可选的,所述装置还包括:
排序确定模块,用于所述恶意团体确定模块之后,基于页面排名算法,确定所述恶意团体中成员的重要程度排序。
在上述各技术方案的基础上,可选的,所述装置还包括:
目标成员推送模块,用于所述排序确定模块之后,根据所述重要程度排序将所述恶意团体中的目标成员推送至恶意团体处理方。
在上述各技术方案的基础上,可选的,所述装置还包括:
知识图谱保存模块,用于所述候选实体选择模块之前,保存所述知识图谱至图数据库,以确定所述图数据库中的所述知识图谱中不同所述初始实体之间的相似程度。
实施例四
图4为本发明实施例四提供的一种电子设备的结构示意图,如图4所示,该电子设备包括处理器40、存储器41、输入装置42和输出装置43;电子设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;电子设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的恶意团体确定方法对应的程序指令/模块。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的恶意团体确定方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种恶意团体确定方法,该方法包括:
根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱;
确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体;
根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体;
根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的恶意团体确定方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述恶意团体确定装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (16)

1.一种恶意团体确定方法,其特征在于,包括:
根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱;
确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体;
根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体;
根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。
2.根据权利要求1所述的方法,其特征在于,确定所述知识图谱中不同所述初始实体之间的相似程度,包括:
将属于所述知识图谱中任一实体类别的初始实体的基础属性值和/或关系属性值,与该实体类别的候选特征值区间进行匹配,得到该初始实体的目标特征值区间;
根据该实体类别下不同初始实体的目标特征值区间,确定不同初始实体之间的相似程度。
3.根据权利要求1或2所述的方法,其特征在于,确定所述知识图谱中不同所述初始实体之间的相似程度,包括:
基于杰卡德相似度算法,确定所述知识图谱中不同所述初始实体之间的相似程度。
4.根据权利要求1所述的方法,其特征在于,根据所述相似程度从所述初始实体中选择候选实体,包括:
根据所述相似程度从所述初始实体中选择所述相似程度大于预设相似程度阈值的实体作为所述候选实体。
5.根据权利要求1所述的方法,其特征在于,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体,包括:
基于模块度优化迭代算法,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
6.根据权利要求1所述的方法,其特征在于,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体,包括:
基于标签传播的社区发现算法,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
7.根据权利要求1所述的方法,其特征在于,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体,包括:
基于信息论的社区发现算法,根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体。
8.根据权利要求1所述的方法,其特征在于,根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体,包括:
获取所述候选团体中候选实体的得分;
判断得分大于预设得分阈值的所述候选团体中候选实体的数量占所述候选团体成员数量的比例是否大于预设比例;
若大于所述预设比例,则确定所述候选团体为恶意团体。
9.根据权利要求1所述的方法,其特征在于,所述初始实体包括用户和以下至少一种:手机号、邮箱地址、服务器地址、申请时间、设备和身份证号码。
10.根据权利要求1所述的方法,其特征在于,在确定所述候选团体是否为恶意团体之后,还包括:
基于页面排名算法,确定所述恶意团体中成员的重要程度排序。
11.根据权利要求10所述的方法,其特征在于,在确定所述恶意团体中成员的重要程度排序之后,还包括:
根据所述重要程度排序将所述恶意团体中的目标成员推送至恶意团体处理方。
12.根据权利要求1所述的方法,其特征在于,在确定所述知识图谱中不同所述初始实体之间的相似程度之前,还包括:
保存所述知识图谱至图数据库,以确定所述图数据库中的所述知识图谱中不同所述初始实体之间的相似程度。
13.一种恶意团体确定装置,其特征在于,包括:
知识图谱确定模块,用于根据历史欺诈数据中初始实体和初始实体之间关系,确定知识图谱;
候选实体选择模块,用于确定所述知识图谱中不同所述初始实体之间的相似程度,并根据所述相似程度从所述初始实体中选择候选实体;
知识图谱划分模块,用于根据所述候选实体,将由所述候选实体确定的知识图谱划分为候选团体;
恶意团体确定模块,用于根据所述候选团体中候选实体的得分,确定所述候选团体是否为恶意团体。
14.根据权利要求13所述的装置,其特征在于,所述候选实体选择模块,包括:
标特征值区间获取单元,用于将属于所述知识图谱中任一实体类别的初始实体的基础属性值和关系属性值,与该实体类别的候选特征值区间进行匹配,得到该初始实体的目标特征值区间;
相似程度确定单元,用于根据该实体类别下不同初始实体的目标特征值区间,确定不同初始实体之间的相似程度。
15.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的恶意团体确定方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-12中任一所述的恶意团体确定方法。
CN202010988896.4A 2020-09-18 2020-09-18 一种恶意团体确定方法、装置、电子设备及存储介质 Pending CN112163096A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010988896.4A CN112163096A (zh) 2020-09-18 2020-09-18 一种恶意团体确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010988896.4A CN112163096A (zh) 2020-09-18 2020-09-18 一种恶意团体确定方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112163096A true CN112163096A (zh) 2021-01-01

Family

ID=73863551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010988896.4A Pending CN112163096A (zh) 2020-09-18 2020-09-18 一种恶意团体确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112163096A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926990A (zh) * 2021-03-25 2021-06-08 支付宝(杭州)信息技术有限公司 欺诈识别的方法和装置
CN113283908A (zh) * 2021-06-09 2021-08-20 武汉斗鱼鱼乐网络科技有限公司 目标团体的识别方法及装置
CN113592036A (zh) * 2021-08-25 2021-11-02 北京沃东天骏信息技术有限公司 流量作弊行为识别方法、装置及存储介质和电子设备
CN115150052A (zh) * 2022-06-08 2022-10-04 北京天融信网络安全技术有限公司 攻击团伙的跟踪识别方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598532A (zh) * 2014-12-29 2015-05-06 中国联合网络通信有限公司广东省分公司 一种信息处理方法及装置
CN109598509A (zh) * 2018-10-17 2019-04-09 阿里巴巴集团控股有限公司 风险团伙的识别方法和装置
CN110413707A (zh) * 2019-07-22 2019-11-05 百融云创科技股份有限公司 互联网中欺诈团伙关系的挖掘与排查方法及其***
US20190394225A1 (en) * 2018-06-22 2019-12-26 International Business Machines Corporation Optimizing Ingestion of Structured Security Information into Graph Databases for Security Analytics
CN111339437A (zh) * 2020-02-14 2020-06-26 支付宝(杭州)信息技术有限公司 一种团伙成员角色的确定方法、装置及电子设备
CN111400614A (zh) * 2020-01-08 2020-07-10 上海观安信息技术股份有限公司 一种基于资金交易数据的涉案集群查找的方法
CN111586001A (zh) * 2020-04-28 2020-08-25 咪咕文化科技有限公司 异常用户识别方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598532A (zh) * 2014-12-29 2015-05-06 中国联合网络通信有限公司广东省分公司 一种信息处理方法及装置
US20190394225A1 (en) * 2018-06-22 2019-12-26 International Business Machines Corporation Optimizing Ingestion of Structured Security Information into Graph Databases for Security Analytics
CN109598509A (zh) * 2018-10-17 2019-04-09 阿里巴巴集团控股有限公司 风险团伙的识别方法和装置
CN110413707A (zh) * 2019-07-22 2019-11-05 百融云创科技股份有限公司 互联网中欺诈团伙关系的挖掘与排查方法及其***
CN111400614A (zh) * 2020-01-08 2020-07-10 上海观安信息技术股份有限公司 一种基于资金交易数据的涉案集群查找的方法
CN111339437A (zh) * 2020-02-14 2020-06-26 支付宝(杭州)信息技术有限公司 一种团伙成员角色的确定方法、装置及电子设备
CN111586001A (zh) * 2020-04-28 2020-08-25 咪咕文化科技有限公司 异常用户识别方法、装置、电子设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926990A (zh) * 2021-03-25 2021-06-08 支付宝(杭州)信息技术有限公司 欺诈识别的方法和装置
CN113283908A (zh) * 2021-06-09 2021-08-20 武汉斗鱼鱼乐网络科技有限公司 目标团体的识别方法及装置
CN113592036A (zh) * 2021-08-25 2021-11-02 北京沃东天骏信息技术有限公司 流量作弊行为识别方法、装置及存储介质和电子设备
CN115150052A (zh) * 2022-06-08 2022-10-04 北京天融信网络安全技术有限公司 攻击团伙的跟踪识别方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN112163096A (zh) 一种恶意团体确定方法、装置、电子设备及存储介质
CN112926990B (zh) 欺诈识别的方法和装置
CN111355697B (zh) 僵尸网络域名家族的检测方法、装置、设备及存储介质
de Blas et al. Combined social networks and data envelopment analysis for ranking
CN111368147B (zh) 图特征处理的方法及装置
CN110365636B (zh) 工控蜜罐攻击数据来源的判别方法及装置
KR102086936B1 (ko) 사용자 데이터 공유 방법 및 디바이스
CN112750030A (zh) 风险模式识别方法、装置、设备及计算机可读存储介质
CN113821793A (zh) 一种基于图卷积神经网络的多阶段攻击场景构建方法及***
CN110309154B (zh) 基于图谱的实体特征选择方法、装置、设备和存储介质
CN113537960A (zh) 一种异常资源转移链路的确定方法、装置和设备
CN114124484B (zh) 网络攻击识别方法、***、装置、终端设备以及存储介质
Umbarkar et al. Analysis of heuristic based feature reduction method in intrusion detection system
CN110827036A (zh) 一种欺诈交易的检测方法、装置、设备及存储介质
CN116032741A (zh) 一种设备识别方法、装置、电子设备和计算机存储介质
CN113159793A (zh) 数据处理方法、装置、电子设备及计算机存储介质
US12013855B2 (en) Trimming blackhole clusters
CN113468403A (zh) 基于大数据挖掘的用户信息预测方法及云计算ai服务***
CN113065748A (zh) 业务风险评估方法、装置、设备及存储介质
Ying et al. FrauDetector+ An Incremental Graph-Mining Approach for Efficient Fraudulent Phone Call Detection
CN117294497A (zh) 一种网络流量异常检测方法、装置、电子设备及存储介质
Rahman et al. An efficient approach for selecting initial centroid and outlier detection of data clustering
CN115329078A (zh) 文本数据处理方法、装置、设备以及存储介质
CN110855641B (zh) 社区属性信息确定方法、装置及存储介质
CN109308565B (zh) 人群绩效等级识别方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination