WO2020199621A1

WO2020199621A1 - 基于知识图谱检测欺诈

Info

Publication number: WO2020199621A1
Application number: PCT/CN2019/121458
Authority: WO
Inventors: 陈振
Original assignee: 北京三快在线科技有限公司
Priority date: 2019-04-01
Filing date: 2019-11-28
Publication date: 2020-10-08
Also published as: CN110111110A

Abstract

本公开涉及一种基于知识图谱检测欺诈的方法和装置、存储介质。所述基于知识图谱检测欺诈的方法包括：收集用户的元数据、行为数据和欺诈用户黑名单；选取所述元数据中的实体以作为节点，并根据所述行为数据中实体之间的业务绑定关系以及共现关系建立边，以构建知识图谱；根据所述欺诈用户黑名单，标记所述知识图谱中的欺诈节点；根据所述知识图谱中相邻节点的相似性，计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度；根据计算结果，输出所述无标记节点的欺诈风险评估结果。

Description

基于知识图谱检测欺诈

技术领域

本公开涉及网络技术领域，具体地，涉及一种基于知识图谱检测欺诈的方法和装置、存储介质。

背景技术

金融领域对交易风险控制的要求较高，需要保证资金交易的安全性。在实际应用中，可能会存在一些欺诈行为。比如，在电商或者O2O(Online To Offline，线上到线下)领域，可能存在虚假用户批量注册、刷单、作弊、交易欺诈等行为。

发明内容

本公开提供一种基于知识图谱检测欺诈的方法和装置、存储介质，以解决相关技术中难以识别批量注册进行欺诈的技术问题。

为实现上述目的，本公开实施例的第一方面，提供一种基于知识图谱检测欺诈的方法，所述方法包括：

收集用户的元数据、行为数据和欺诈用户黑名单；选取所述元数据中的实体以作为节点，并根据所述行为数据中实体之间的业务绑定关系以及共现关系建立边，以构建知识图谱；根据所述欺诈用户黑名单，标记所述知识图谱中的欺诈节点；根据所述知识图谱中相邻节点的相似性，计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度；根据计算结果，输出所述无标记节点的欺诈风险评估结果。

可选地，所述计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度，包括：按照以下公式计算所述知识图谱中两个节点的相似度：

其中，s(a,b)是节点a和b的相似度；I(a)表示所述节点a的入射相邻节点的集合，I _i(a)表示所述节点a的第i个入射相邻节点，

表示空，

表示所述节点a存在入射相邻节点；I(b)表示所述节点b的入射相邻节点的集合，I _j(b)表示所述节点b的第j个入射相邻节点，

表示所述节点b存在入射相邻节点；s(I _i(a)，I _j(b))是所述节点a的第i个入射相邻节点与所述节点b的第j个入射相邻节点的相似度；C是阻尼系数，C∈(0,1)。

可选地，根据所述计算结果，输出所述无标记节点的所述欺诈风险评估结果，包括：对于每个所述无标记节点，计算所述无标记节点与所有所述欺诈节点之间的相似度的均值；若所述相似度的均值大于阈值，则输出表征所述无标记节点为疑似欺诈节点的欺诈风险评估结果。

可选地，收集所述用户的所述元数据、所述行为数据，包括：在用户请求日志中提取所述元数据，其中，所述元数据包括设备信息、账号信息、卡信息、上下文信息中的至少一种数据；根据业务流程，获取所述用户的所述行为数据，其中，所述行为数据包括所述用户下单、支付、评论、绑定邮箱手机号和找回密码中的至少一种操作数据。

本公开实施例的第二方面，提供一种基于知识图谱检测欺诈的装置，所述装置包括：

收集模块，用于收集用户的元数据、行为数据和欺诈用户黑名单；构建模块，用于选取所述元数据中的实体以作为节点，并根据所述行为数据中实体之间的业务绑定关系以及共现关系建立边以构建知识图谱；标记模块，用于根据所述欺诈用户黑名单，标记所述知识图谱中的欺诈节点；计算模块，用于根据所述知识图谱中相邻节点的相似性，计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度；输出模块，用于根据计算结果，输出所述无标记节点的欺诈风险评估结果。

可选地，所述计算模块还用于：按照以下公式计算所述知识图谱中两个节点的相似度：

表示空，

可选地，对于每个所述无标记节点，所述输出模块包括：计算子模块，用于计算所述无标记节点与所有所述欺诈节点之间的相似度的均值；输出子模块，用于若所述相似度的均值大于阈值，则输出表征所述无标记节点为疑似欺诈节点的欺诈风险评估结果。

可选地，所述收集模块包括：提取子模块，用于在用户请求日志中提取所述元数据，其中，所述元数据包括设备信息、账号信息、卡信息、上下文信息中的至少一种数据；获取子模块，用于根据业务流程，获取所述用户的所述行为数据，其中，所述行为数据包括所述用户下单、支付、评论、绑定邮箱手机号和找回密码中的至少一种操作数据。

本公开实施例的第三方面，提供一种非易失性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时，促使所述处理器实现上述第一方面中任一项所述方法的步骤。

本公开实施例的第四方面，提供一种基于知识图谱检测欺诈的装置，包括：

存储器，其上存储有计算机程序；以及处理器，用于执行所述存储器中的所述计算机程序，以实现上述第一方面中任一项所述方法的步骤。

采用上述技术方案，至少能够达到如下技术效果。

本公开构建知识图谱，然后，对知识图谱中出现在欺诈用户黑名单中的节点进行标记，接着，计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度，再根据所述相似度，进行欺诈风险评估，大于阈值的节点作为高风险欺诈节点。基于相似度来进行欺诈风险评估，本公开适合虚假用户批量注册识别的场景，可有效检测欺诈用户，避免刷单、作弊、欺诈交易等行为带来的损失。提高了识别批量注册进行欺诈的准确性。

本公开能够充分利用电商或者O2O领域中积累的注册，登陆，下单，支付，评论等用户行为的信息，构建的知识图谱的方式简单易实现，具有较强的性能优势。

本公开中采用的SimRank算法本质上是计算网络中节点之间的相似度，适合解决批量注册进行欺诈的问题。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。

图1是本公开一示例性实施例示出的一种基于知识图谱检测欺诈的方法流程图。

图2是根据一示例性实施例示出的图1中步骤S11的具体流程图。

图3是根据一示例性实施例示出的图1中步骤S15的具体流程图。

图4是本公开一示例性实施例示出的一种基于知识图谱检测欺诈的装置框图。

图5是本公开一示例性实施例示出的一种基于知识图谱检测欺诈的装置的输出模块框图。

图6是本公开一示例性实施例示出的一种基于知识图谱检测欺诈的装置的收集模块框图。

图7是本公开一示例性实施例示出的一种基于知识图谱检测欺诈的装置的硬件结构图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

对于金融领域的欺诈案件，由于受害者没有举报，或者由于其他原因而未被发现。这部分未被发现的欺诈案件对金融安全防控可能会带来很大的风险，比如，欺诈者的账户可以继续骗取其他受害者的钱财，造成资金损失。因此，定位欺诈者，识别隐藏的欺诈案件，对于金融安全防控具有很大的意义。

在一个例子中，可以根据资金流向信息、交易方关联信息和交易数据构建欺诈传播关系图。其中，根据交易方关联信息构建欺诈传播关系图中的各个节点，根据资金流向信息和交易方关联信息构建各个节点之间的有向边，该有向边可以用于表示节点之间的欺诈传播关系；然后按照PageRank迭代更新算法，计算每个节点的欺诈传播权重。

上述例子中，只是针对交易场景，识别交易欺诈，无法泛化到其他欺诈场景，如在电商或者O2O领域，识别虚假用户批量注册、刷单、作弊、交易欺诈等行为。另外，PageRank迭代更新算法本质上是对节点进行重要性排名，给出的只是每个节点的权重，不易体现出涉案节点和非涉案节点之间的关联性。

图1是根据一示例性实施例示出的一种基于知识图谱检测欺诈的方法流程图。如图1所示，该基于知识图谱检测欺诈的方法可以包括以下步骤。

S11，收集用户的元数据、行为数据和欺诈用户黑名单。

S12，选取所述元数据中的实体以作为节点，并根据所述行为数据中实体之间的业务绑定关系以及共现关系建立边，以构建知识图谱。

S13，根据所述欺诈用户黑名单，标记所述知识图谱中的欺诈节点。

S14，根据所述知识图谱中相邻节点的相似性，计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度。

S15，根据计算结果，输出所述无标记节点的欺诈风险评估结果。

在步骤S11中，所述欺诈用户黑名单是根据业务的积累、人工判断和历史记录的案件，获取已经被识别出来的欺诈用户，并把涉案的账户ID，手机号，设备唯一标识号均加入欺诈黑名单中。本申请不限定被收集元数据的用户的数量，通常来讲，用户数量越多，对于最后得到欺诈风险评估结果越有帮助。

图2是根据一示例性实施例示出的图1中步骤S11的具体流程图，如图2所示，收集用户的元数据、行为数据，可以包括以下步骤。

S111，在用户请求日志中提取元数据；所述元数据包括设备信息、账号信息、卡信息、上下文信息中的至少一种数据。

S112，根据业务流程，获取用户的行为数据；所述行为数据包括用户下单、支付、评论、绑定邮箱手机号和找回密码中的至少一种操作数据。

其中，在步骤S111中，用户请求日志包括用户注册请求、下单请求、支付请求等，从这些请求数据中可以提取元数据。所述元数据所包括的设备信息可以是设备唯一标识号、MAC(Media Access Control)地址、IMEI(International Mobile Equipment Identity；国际移动设备识别码)等信息。所述元数据所包括的账号信息可以是账户ID、手机号、邮箱等信息。所述元数据所包括的卡信息可以是银行***。所述元数据所包括的上下文信息可以是IP(Internet Protocol)地址、商户ID、经纬度、Wi-Fi信息、请求时间等信息。

在步骤S112中，根据具体的业务流程，获取用户的行为数据，比如用户下单、支付、评论等行为，绑定邮箱手机号、找回密码等操作。

在收集到用户的元数据、行为数据和欺诈用户黑名单后，即可以以所述元数据中的实体作为节点和所述行为数据中实体之间的关系构建知识图谱。元数据中的实体，具体是指，如手机号、邮箱、Wi-Fi信息、设备号、IP地址等，只要是实际存在且可以有ID来标识的都可以作为实体。但如时间、动作、关系等不能作为实体。知识图谱是将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合，并可以利用可视化的图谱进行形象地展示的现代理论。知识图谱旨在描述真实世界中存在的各种实体或概念及其关系，其构成一张巨大的语义网络图，节点表示实体或概念，边则由属性或关系构成。

以所述元数据中的实体作为节点和所述行为数据中实体之间的关系构建知识图谱，可以包括以下步骤：选取所述元数据中的实体以作为节点；然后，根据所述行为数据中实体之间的业务绑定关系以及共现关系建立边，以构建知识图谱。

在构建知识图谱的过程中，可以把步骤S111中出现的实体作为金融知识图谱的节点，金融知识图谱的节点可以包括设备号、MAC地址、账户ID、手机号、邮箱、***、商户ID、IP地址等。

获取作为节点的实体后，依据实体之间的业务绑定关系、共现关系，建立节点之间的双向边，从而形成一个大的异构网络，一般称之为金融知识图谱。其中，所述业务绑定关系可以为：一个账号绑定了手机号、***和邮箱，则在这几个实体之间形成了绑定关系。所述共现关系可以为：一个账号和一个商户出现在同一订单日志中，则账户ID和商户ID之间形成共现关系。

在构建知识图谱后，执行步骤S13，根据所述欺诈用户黑名单，标记所述知识图谱中的欺诈节点。构建知识图谱后，查找所述知识图谱中的节点是否存在于欺诈用户黑名单中，如果所述知识图谱中存在涉案账户ID、手机号、设备唯一标示号等节点，则在所述知识图谱中将涉案节点标识为欺诈节点。

标记所述知识图谱中的欺诈节点后，执行步骤S14，根据所述知识图谱中相邻节点的相似性，计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度。计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度，可以是基于SimRank算法计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度。在该知识图谱中，运行SimRank算法，来计算两两节点之间的相似度。经过若干次迭代后，所有节点的相似度得以更新并趋于收敛。

SimRank算法的核心思想是，如果两个点在图中的邻域比较相似(有很多相似邻居)，则这两个点也应该比较相似。即两个点是否相似，由他们的邻居是否相似来决定。

可以通过以下公式计算所述知识图谱中两个节点的相似度：

其中，s(a,b)是节点a和b的相似度；I(a)表示节点a的入射相邻节点(即指向结点a的结点)的集合，I _i(a)表示a的第i个入射相邻节点，

表示空，

表示a存在入射相邻节点；I(b)表示节点b的入射相邻节点的集合，I _j(b)表示b的第j个入射相邻节点，

表示b存在入射相邻节点；s(I _i(a)，I _j(b))是a的第i个入射相邻节点与b的第j个入射相邻节点的相似度；C是阻尼系数，C∈(0,1)。

C的含义可以这么理解：假如I(a)＝I(b)＝{A}，A是a的相邻节点。按照上式计算出s(a,b)＝C*s(A,A)＝C，很明显，C应该大于0小于1，所以C∈(0,1)，可选地，C可以设为0.8。该公式可以简单解释为节点a和b的相似度等于a的邻居和b的邻居的相似度均值，乘以系数C。

在上述知识图谱上，任意两点之间的相似度都可以用上述公式来表示。在SimRank执行环节，就是上述公式不断迭代更新的过程。可以简单理解为，经过SimRank算法的多次迭代，得到知识图谱上的相似度矩阵，矩阵的元素表示两个节点之间的相似度。经过该步骤，即可得到所述无标记节点与已经确定的涉案欺诈节点的相似度。

在获取所述无标记节点与所述欺诈节点之间的相似度后，执行步骤S15，根据计算结果，输出所述无标记节点的欺诈风险评估结果。图3是根据一示例性实施例示出的图1中步骤S15的具体流程图，如图3所示，根据计算结果，输出所述无标记节点的欺诈风险评估结果，可以包括以下步骤。

S151，计算每个所述无标记节点与所有所述欺诈节点之间的相似度的均值。

S152，若所述无标记节点与所有所述欺诈节点之间的相似度的均值大于阈值，则输出表征所述无标记节点为疑似欺诈节点的欺诈风险评估结果。

举例来讲，构建的所述知识图谱中有十个欺诈节点。经过迭代后，得到其中一个无标记节点A分别与十个所述欺诈节点的相似度。接着，计算这十个相似度的均值，将均值当作所述无标记节点A的风险大小评分。

假设，所述阈值为0.5，这十个相似度的均值为0.7，则所述无标记节点A的相似度为0.7。由于所述无标记节点A的相似度0.7大于所述阈值0.5，则可以认定所述无标记节点A也为欺诈节点，即可以输出所述无标记节点A为疑似欺诈节点的欺诈风险评估结果。

可以使用该方法，对于构建的所述知识图谱中的其他无标记节点，如B、C、D等，逐一进行上述计算和判断的步骤，输出其他无标记节点的欺诈风险评估结果。

可选地，每种属性的无标记节点对应一个阈值，在获取所述每个所述无标记节点与所有所述欺诈节点之间的相似度的均值后，将所述均值作为所述无标记节点的相似度；接着，判断不同属性的无标记节点的相似度是否大于对应的阈值，不同属性的无标记节点对应参考的阈值可以不相同。

例如，可以把账户ID，手机号，***，邮箱，商户ID等不同属性的节点拆分，根据业务场景，不同属性的节点分别设定一个阈值。以手机号和***为例，把所有相似度大于阈值h的手机号认定为疑似欺诈手机号，把所有相似度大于阈值s的***认定为疑似欺诈***。

采用上述技术方案，至少能够达到如下技术效果。

对于图1所示的方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开并不受所描述的动作顺序的限制。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本公开所必须的。

图4是本公开一示例性实施例示出的一种基于知识图谱检测欺诈的装置。如图4 所示，所述基于知识图谱检测欺诈的装置300包括以下模块。

收集模块310，用于收集用户的元数据、行为数据和欺诈用户黑名单。

构建模块320，用于选取所述元数据中的实体以作为节点，并根据所述行为数据中实体之间的业务绑定关系以及共现关系建立边，以构建知识图谱。

标记模块330，用于根据所述欺诈用户黑名单，标记所述知识图谱中的欺诈节点。

计算模块340，用于根据所述知识图谱中相邻节点的相似性，计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度。

输出模块350，用于根据计算结果，输出所述无标记节点的欺诈风险评估结果。

可选地，所述构建模块320还用于：

按照以下公式计算所述知识图谱中两个节点的相似度；

表示空，

可选地，如图5所示，所述输出模块350包括以下子模块。

计算子模块351，用于计算每个所述无标记节点与所有所述欺诈节点之间的相似度的均值。

输出子模块352，用于若所述无标记节点与所有所述欺诈节点之间的相似度的均值大于阈值，则输出表征所述无标记节点为疑似欺诈节点的欺诈风险评估结果。

可选地，如图6所示，所述收集模块310包括以下子模块。

提取子模块311，用于在用户请求日志中提取所述元数据，其中，所述元数据包括设备信息、账号信息、卡信息、上下文信息中的至少一种数据。

获取子模块312，用于根据业务流程，获取所述用户的所述行为数据，其中，所述行为数据包括所述用户下单、支付、评论、绑定邮箱手机号和找回密码中的至少一种操作数据。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开还提供一种非易失性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时，促使所述处理器实现上述任一项可选实施例所述基于知识图谱检测欺诈的方法步骤。

本公开还提供一种基于知识图谱检测欺诈的装置，包括：

上述的计算机可读存储介质；以及

一个或者多个处理器，用于执行所述计算机可读存储介质中的程序。

图7是根据一示例性实施例示出的一种基于知识图谱检测欺诈的装置400的框图。如图7所示，该装置400可以包括：处理器401，存储器402，多媒体组件403，输入/输出(I/O)接口404，以及通信组件405。

其中，处理器401用于控制该装置400的整体操作，以完成上述的基于知识图谱检测欺诈的方法中的全部或部分步骤。存储器402用于存储各种类型的数据以支持在该装置400的操作，这些数据例如可以包括用于在该装置400上操作的任何应用程序或方法的指令，以及应用程序相关的数据。该存储器402可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。多媒体组件403可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器402或通过通信组件405发送。音频组件还包括至少一个扬声器，用于输出音频信号。I/O接口404为处理器401和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件405用于该装置400与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(Near Field Communication，简称NFC)，2G、3G或4G，或它们中的一种或几种的组合，因此相应的该通信组件405可以包括：Wi-Fi模块，蓝牙模块，NFC模块。

在一示例性实施例中，装置400可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit，简称ASIC)、数字信号处理器(Digital Signal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的基于知识图谱检测欺诈的方法。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，例如包括程序指令的存储器402，上述程序指令可由装置400的处理器401执行以完成上述的基于知识图谱检测欺诈的方法。

以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，可以对本公开的技术方案进行多种简单变型，这些简单变型均属于本公开的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本公开对各种可能的组合方式不再另行说明。

此外，本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。

Claims

一种基于知识图谱检测欺诈的方法，其特征在于，所述方法包括：

收集用户的元数据、行为数据和欺诈用户黑名单；

选取所述元数据中的实体以作为节点，并根据所述行为数据中实体之间的业务绑定关系以及共现关系建立边，以构建知识图谱；

根据所述欺诈用户黑名单，标记所述知识图谱中的欺诈节点；

根据所述知识图谱中相邻节点的相似性，计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度；

根据计算结果，输出所述无标记节点的欺诈风险评估结果。
根据权利要求1所述的方法，其特征在于，计算所述知识图谱中无标记节点与所述欺诈节点之间的所述相似度，包括：

按照以下公式计算所述知识图谱中两个节点的相似度：

其中，s(a,b)是节点a和b的相似度；I(a)表示所述节点a的入射相邻节点的集合，I _i(a)表示所述节点a的第i个入射相邻节点，
表示空，
表示所述节点a存在入射相邻节点；I(b)表示所述节点b的入射相邻节点的集合，I _j(b)表示所述节点b的第j个入射相邻节点，
表示所述节点b存在入射相邻节点；s(I _i(a)，I _j(b))是所述节点a的第i个入射相邻节点与所述节点b的第j个入射相邻节点的相似度；C是阻尼系数，C∈(0,1)。
根据权利要求1所述的方法，其特征在于，根据所述计算结果，输出所述无标记节点的所述欺诈风险评估结果，包括：

对于每个所述无标记节点，

计算所述无标记节点与所有所述欺诈节点之间的相似度的均值；

若所述相似度的均值大于阈值，则输出表征所述无标记节点为疑似欺诈节点的欺诈风险评估结果。
根据权利要求1至3中任一项所述的方法，其特征在于，收集所述用户的所述元数据、所述行为数据，包括：

在用户请求日志中提取所述元数据，其中，所述元数据包括设备信息、账号信息、卡信息、上下文信息中的至少一种数据；

根据业务流程，获取所述用户的所述行为数据，其中，所述行为数据包括所述用户下单、支付、评论、绑定邮箱手机号和找回密码中的至少一种操作数据。
一种基于知识图谱检测欺诈的装置，其特征在于，所述装置包括：

收集模块，用于收集用户的元数据、行为数据和欺诈用户黑名单；

构建模块，用于选取所述元数据中的实体以作为节点，并根据所述行为数据中实体之间的业务绑定关系以及共现关系建立边，以构建知识图谱；

标记模块，用于根据所述欺诈用户黑名单，标记所述知识图谱中的欺诈节点；

计算模块，用于根据所述知识图谱中相邻节点的相似性，计算所述知识图谱中无标记节点与所述欺诈节点之间的相似度；

输出模块，用于根据计算结果，输出所述无标记节点的欺诈风险评估结果。
根据权利要求5所述的装置，其特征在于，所述计算模块还用于：

按照以下公式计算所述知识图谱中两个节点的相似度：

其中，s(a,b)是节点a和b的相似度；I(a)表示所述节点a的入射相邻节点的集合，I _i(a)表示所述节点a的第i个入射相邻节点，
表示空，
表示所述节点a存在入射相邻节点；I(b)表示所述节点b的入射相邻节点的集合，I _j(b)表示所述节点b的第j个入射相邻节点，
表示所述节点b存在入射相邻节点；s(I _i(a)，I _j(b))是所述节点a的第i个入射相邻节点与所述节点b的第j个入射相邻节点的相似度；C是阻尼系数，C∈(0,1)。
根据权利要求5所述的装置，其特征在于，对于每个所述无标记节点，所述输出模块包括：

计算子模块，用于计算所述无标记节点与所有所述欺诈节点之间的相似度的均值；

输出子模块，用于若所述相似度的均值大于阈值，则输出表征所述无标记节点为疑似欺诈节点的欺诈风险评估结果。
根据权利要求5至7中任一项所述的装置，其特征在于，所述收集模块包括：

提取子模块，用于在用户请求日志中提取所述元数据，其中，所述元数据包括设备信息、账号信息、卡信息、上下文信息中的至少一种数据；

获取子模块，用于根据业务流程，获取所述用户的所述行为数据，其中，所述行为数据包括所述用户下单、支付、评论、绑定邮箱手机号和找回密码中的至少一种操作数据。
一种非易失性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时，促使所述处理器实现权利要求1至4中任一项所述方法的步骤。
一种基于知识图谱检测欺诈的装置，其特征在于，包括：

存储器，其上存储有计算机程序；以及

处理器，用于执行所述存储器中的所述计算机程序，以实现权利要求1至4中任一项所述方法的步骤。