CN113609345A - 目标对象关联方法和装置、计算设备以及存储介质 - Google Patents
目标对象关联方法和装置、计算设备以及存储介质 Download PDFInfo
- Publication number
- CN113609345A CN113609345A CN202111157861.7A CN202111157861A CN113609345A CN 113609345 A CN113609345 A CN 113609345A CN 202111157861 A CN202111157861 A CN 202111157861A CN 113609345 A CN113609345 A CN 113609345A
- Authority
- CN
- China
- Prior art keywords
- nodes
- node
- graph
- subgraph
- objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请描述了目标对象关联方法,包括:获取网络图;建立并更新第一子图和第二子图,直至第二子图不含关键节点,关联第一子图中的节点与其对应的目标对象。更新步骤包括:确定核心节点,其是网络图中与第一子图中至少一个关键节点的关联度大于零且与第二子图中所有关键节点的关联度的和值最大的节点,确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点,将节点集合、核心节点、网络图中连接核心节点与节点集合中的节点的边确定为第三子图;在第一子图中添加第三子图,在第二子图中去除第三子图。本发明实施例可应用于云技术、人工智能、智慧交通、网络安全、对象推荐等场景。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及目标对象关联方法和装置、计算设备以及存储介质。
背景技术
随着互联网技术发展和应用,网络安全和对象推荐等技术被广泛使用。网络安全技术的使用场景中例如涉及将恶意用户的银行账户与恶意用户关联、将欺诈用户与涉嫌为其洗钱的商户关联等,对象推荐技术的使用场景中例如涉及将文章作者与其高频阅读者关联、将消费者与其回购商品关联等。这些技术中的关键都是如何高效且准确地从繁多的对象中确定与目标对象关联的对象以及该对象与目标对象之间的主要关联关系。然而,在相关技术中,在从繁多的对象中确定与目标对象关联的对象时,由于各种对象及其相关数据的数量非常庞大,使得这样的工作遇到了极大的挑战。
发明内容
有鉴于此,本公开提供了目标对象关联方法和装置,期望克服上面提到的部分或全部缺陷以及其它可能的缺陷。
根据本公开的第一方面,提供了一种目标对象关联方法,包括:获取基于不同类型的多个对象构建的网络图,其中所述网络图包括与所述多个对象对应的多个节点以及在节点间进行连接的边,节点的类型对应于对象的类型,每条边表示所述每条边连接的两个节点所对应的对象之间的关联关系并且具有权重以表示所述两个节点间的关联度,并且所述两个节点间的关联度指示所述两个节点间对应的对象间的关联度;初始化第一子图和第二子图,使得第一子图包含所述网络图中的一个或多个关键节点,第二子图包括网络图中去除第一子图中的节点后剩余的节点和边,其中每个关键节点表示具有关键类型的对象对应的节点;迭代执行如下更新步骤以对第一子图和第二子图进行更新,直至第二子图中不包括关键节点,所述更新步骤包括:从网络图的节点中确定核心节点,所述核心节点是网络图中与第一子图中所述一个或多个关键节点中的至少一个关键节点的关联度大于零且与第二子图中的所有关键节点的关联度的和值最大的节点;确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点,并且将所述节点集合中的节点、所述核心节点、以及网络图中连接核心节点与所述节点集合中的节点的边确定为第三子图;在第一子图中添加第三子图的节点和边,并且在第二子图中去除第三子图的节点和边;基于更新后的第一子图中包括的边,将更新后的第一子图中的节点对应的目标对象进行关联。
根据本公开的第二方面,提供了一种目标对象关联装置,包括:获取模块,初始化模块,更新模块,关联模块。获取模块被配置成获取基于不同类型的多个对象构建的网络图,其中所述网络图包括与所述多个对象对应的多个节点以及在节点间进行连接的边,节点的类型对应于对象的类型,每条边表示所述每条边连接的两个节点所对应的对象之间的关联关系并且具有权重以表示所述两个节点间的关联度,并且所述两个节点间的关联度指示所述两个节点间对应的对象间的关联度。初始化模块被配置成初始化第一子图和第二子图,使得第一子图包含所述网络图中的一个或多个关键节点,第二子图包括网络图中去除第一子图中的节点后剩余的节点和边,其中每个关键节点表示具有关键类型的对象对应的节点。更新模块被配置成迭代执行如下更新步骤以对第一子图和第二子图进行更新,直至第二子图中不包括关键节点。所述更新步骤包括:从网络图的节点中确定核心节点,所述核心节点是网络图中与第一子图中所述一个或多个关键节点中的至少一个关键节点的关联度大于零且与第二子图中的所有关键节点的关联度的和值最大的节点;确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点,并且将所述节点集合中的节点、所述核心节点、以及网络图中连接核心节点与所述节点集合中的节点的边确定为第三子图;在第一子图中添加第三子图的节点和边,并且在第二子图中去除第三子图的节点和边。关联模块被配置成基于更新后的第一子图中包括的边,将更新后的第一子图中的节点对应的目标对象进行关联。
在一些实施例中,所述更新模块被配置成:遍历网络图的所有节点,并且响应于遍历到的当前节点与第一子图中的至少一个关键节点的关联度大于零,则确定当前节点与第二子图中的所有关键节点的关联度的和值;以及将确定的所有和值中最大的和值对应的节点确定为核心节点。
在一些实施例中,所述网络图中的每个节点具有权重以表示所述节点的重要性,并且所述更新模块被配置成:响应于第一子图包括与核心节点关联度最大的多个节点,则获取第一子图中的所述多个节点中具有最大节点权重的节点;确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及所述获取的具有最大节点权重的节点。
在一些实施例中,所述获取模块被配置成:获取网络对象数据,网络对象数据包括多种类型的对象以及这些对象之间的关联关系;基于网络对象数据中对象的类型和对象之间的关联关系确定异构图,所述异构图包括用于表示对象的节点以及用于表示对象之间的关联关系的边,用于表示对象的节点具有节点权重以表示该节点对应的对象的重要性,用于表示对象之间的关联关系的边具有边权重以表示该边连接的两个节点对应的对象间的关联度;从所述异构图中挖掘异构图的子图,以得到所述网络图。
在一些实施例中,所述获取模块被配置成:获取各种对象的关系网络数据;对获取的关系网络数据进行数据清洗,以得到所述网络对象数据;其中数据清洗包括下述操作中的一项或多项:去除关系网络数据中残缺数据、去除关系网络数据中重复数据、去除关系网络数据中的错误数据。
在一些实施例中,所述获取模块被配置成:基于所述异构图中的每个节点建立初始集合,以将所述异构图中的多个节点划分成多个初始集合,并确定所述每个初始集合的模块度,其中集合的模块度表征集合中的节点间连接的关联度;将所述多个初始集合中的每个集合作为当前集合;迭代执行网络更新步骤,直到所得到的更新集合的模块度不再增大,所述更新步骤包括:通过将所述异构图中的每个节点分配到相邻节点所在的当前集合而形成更新集合,使得所述更新集合的模块度大于所述相邻节点所在的当前集合的模块度,并且将所述更新集合作为当前集合;将所得到的多个当前集合中的一个作为所述网络图。
在一些实施例中,所述获取模块被配置成:确定所得到的多个当前集合中的每个当前集合的模块度;将所得到的多个当前集合中最大模块度对应的集合作为所述网络图。
在一些实施例中,所述获取模块被配置成:从所述异构图中挖掘所述异构图的极大连通子图,以作为所述网络图。
根据本公开的第三方面,提供了一种计算设备,包括处理器;以及存储器,配置为在其上存储有计算机可执行指令,当计算机可执行指令被处理器执行时执行如上面所述的任意方法。
根据本公开的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,当所述计算机可执行指令被执行时,执行如上面所述的任意方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机可执行指令,其中所述计算机可执行指令被处理器执行时执行如上面所述的任意方法。
在本公开要求保护的目标对象关联方法和装置中,首先获取基于不同类型的多个对象构建的网络图,然后对网络应用本申请设计的图计算方法,即:初始化第一子图和第二子图以使第一子图包含所述网络图中的一个或多个关键节点(即关键类型的对象对应的节点)以及第二子图包括网络图中剩余的节点和边,然后迭代更新第一子图和第二子图直至更新后的第一子图中包含所有的关键节点及部分与关键节点关联的高相关性节点,最后基于更新后的第一子图中包括的边将更新后的第一子图中的节点对应的目标对象进行了关联。以这种方式,在本申请的目标对象关联过程中,在更新子图的时候极大去除了不太重要的对象和冗余关联信息造成的干扰,使得目标对象的关联更加准确和高效,从而更适合于例如网络安全和对象推荐等领域的使用。
根据下文描述的实施例,本公开的这些和其它优点将变得清楚,并且参考下文描述的实施例来阐明本公开的这些和其它优点。
附图说明
现在将更详细并且参考附图来描述本公开的实施例,其中:
图1图示了根据本公开的实施例的技术方案可以实施在其中的示例性应用场景;
图2图示了根据本公开的一个实施例的一种目标对象关联方法的示意性流程图;
图3图示了根据本公开的一个实施例的获取基于不同类型的多个对象构建的网络图的示意性流程图;
图4图示了根据本公开的一个实施例的从异构图中挖掘异构图的子图以得到网络图的示意性流程图;
图5图示了根据本公开的一个实施例的在图2中所述的不同类型的多个对象之间的关联关系的示意图;
图6图示了根据本公开的一个实施例的确定第三子图的示意图;
图7图示了根据本公开的一个实施例的目标对象关联方法的效果图;
图8示出了根据本公开的一个实施例的目标对象关联装置的示例性结构框图;
图9图示了一个示例***,其包括代表可以实现本文描述的各种技术的一个或多个***和/或设备的示例计算设备。
具体实施方式
下面的描述提供了本公开的各种实施例的特定细节,以便本领域的技术人员能够充分理解和实施本公开的各种实施例。应当理解,本公开的技术方案可以在没有这些细节中的一些细节的情况下被实施。在某些情况下,本公开并没有示出或详细描述一些熟知的结构或功能,以避免这些不必要的描述使对本公开的实施例的描述模糊不清。在本公开中使用的术语应当以其最宽泛的合理方式来理解,即使其是结合本公开的特定实施例被使用的。
首先,对本申请实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。
网络图:网络图(Network planning)是一种图解模型,形状如同网络,故称为网络图。本申请中的网络图是由表示各类型的对象的节点以及表示对象间关联关系的边构成的形状如同网络的图形。
异构图:属于网络图的一种,一般将图中的节点的类型和边的类型>2作为分类为异构图的标准,例如,论文引用网络中,存在着作者节点和论文节点,用于表示节点间关系的边的类型有:表示作者-作者之间的共同创作关系的边,表示作者-论文之间的从属关系的边,表示论文-论文之间的引用关系的边,即节点的类型和边的类型=2+3>2,因此论文引用网络图属于异构图。
有向图:图中的边有方向的图称为有向图。其数学表达如下,一个有向图D是指一个有序三元组(V(D),A(D),φ(D)),其中φ(D)为关联函数,它使A(D)中的每一个元素(称为有向边或弧)对应于V(D)中的一个有序元素(称为顶点或点)对。
无向图:图中边没有方向的图称为无向图。其数学表达如下,一个无向图G=<V,E>,其中1. V是非空集合,称为顶点集;2. E是V中元素构成的无序二元组的集合,称为边集。
极大联通子图:表示网络图的一种连通子图,在极大连通子图中,加入任何一个不在它的点集中的点都会导致它不再连通。
模块度:也称模块化度量值,是目前常用的一种衡量网络社区结构强度的方法。模块度值的大小主要取决于网络中结点的社区分配,即网络的社区划分情况,可以用来定量的衡量网络社区划分质量,其值越接近1,表示网络划分出的社区结构的强度越强,也就是划分质量越好。因此可以通过最大化模块度来获得最优的网络社区划分。
机器学习:机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
在相关技术中,有可能通过构建网络图来关联网络中的目标对象。例如,预先收集各类型的相互存在关联关系的对象,然后根据这些存在关联关系的对象构建网络图的节点和连接节点的边;然后,利用网络图来确定目标对象的关联对象。然而,如果对象之间关联关系比较复杂,则根据这些对象构建的网络图将稠密且凌乱,使得很难高效准确地根据该网络图确定目标对象的关联对象。
图1图示了根据本公开的实施例的技术方案可以实施在其中的示例性应用场景100。如图1所示,所述应用场景100包括服务器110、终端120、130以及网络140。终端120、130通过网络140与服务器110可通信地耦合在一起。作为示例,用户A和B可以通过终端120、130上的应用程序或客户端观看内容,所述用户A和B例如可以是个人用户、银行用户、商户用户等,所述内容例如可以是视频、音频、图文等。这里仅示出了两个终端,事实上可以存在三个或更多个终端。作为示例,所述服务器110可以收集各终端上的用户对各种类型的内容的观看历史或者点击历史。然后,服务器110可以将所述观看历史或点击历史中涉及的用户和内容作为对象构建网络图。所述网络图包括与所述多个对象对应的多个节点以及在节点间进行连接的边,节点的节点类型对应于对象的类型(例如用户或者内容),每条边具有权重以表示所述每条边连接的两个节点对应的对象间的关联度,关联度例如可以根据用户对内容的观看时长、点击率等确定。例如,个人用户A通过网络与商户用户B之间发生了资金支付操作,个人用户A通过网络与银行用户C之间进行了账户绑定操作,这些通过终端和网络发生的用户之间的关联均可以被服务器110用来构建网络图。
作为示例,所述服务器110可以获取基于不同类型的多个对象构建的网络图,所述网络图包括与所述多个对象对应的多个节点以及在节点间进行连接的边,节点的类型对应于对象的类型(例如用户、商户、账户等),每条边指示该边连接的两个节点所对应的对象之间的关联关系并且具有权重以表示所述两个节点间的关联度,并且所述两个节点间的关联度指示所述两个节点间对应的对象间的关联度,关联度例如可以根据用户向商户支付的金额的多少、用户与用户之间投诉情况等确定。服务器110可以初始化第一子图和第二子图,使得第一子图包含所述网络图中的一个或多个关键节点,第二子图包括网络图中去除第一子图中的节点后剩余的节点和边,其中每个关键节点表示具有关键类型的对象对应的节点,例如在反欺诈场景中的用户类型的对象对应的节点。然后,服务器110可以迭代执行如下更新步骤以对第一子图和第二子图进行更新,直至第二子图中不包括关键节点,所述更新步骤包括:从网络图的节点中确定核心节点,所述核心节点是网络图中与第一子图中所述一个或多个关键节点中的至少一个关键节点的关联度大于零且与第二子图中的所有关键节点的关联度的和值最大的节点;确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点,并且将所述节点集合中的节点、所述核心节点、以及网络图中连接核心节点与所述节点集合中的节点的边确定为第三子图;在第一子图中添加第三子图的节点和边,并且在第二子图中去除第三子图的节点和边。
基于更新后的第一子图中包括的边,服务器110将更新后的第一子图中的节点对应的目标对象进行关联。作为示例,在反欺诈场景中,为了关联用户类型的对象及其他相关对象,服务器110将更新后的第一子图中的节点(包括所有用户节点和部分与用户节点关联的节点(例如,账户类型的节点、商户类型的节点等))对应的目标对象进行关联。
可选地,服务器110可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。上述终端120、130可以包括但不限于以下至少之一:手机、平板电脑、笔记本电脑、台式PC机、数字电视等可以呈现内容的终端。所述网络140例如可以是广域网(WAN)、局域网(LAN)、无线网络、公用电话网、内联网以及本领域的技术人员熟知的任何其它类型的网络。还应当指出,上面描述的场景仅仅是本公开的实施例可以被实施在其中的一个示例,并不是限制性的。
应当指出,上面描述的场景仅仅是本公开的实施例可以被实施在其中的一个示例,并不是限制性的。例如,在一些实施例性场景中,也可能在特定终端上实现目标对象关联。
图2图示了根据本公开的一个实施例的一种目标对象关联方法200的示意性流程图。所述方法200例如可以实施于诸如图1中的服务器120上,当然这不是限制性的。如图2所示,所述方法200包括如下步骤。
在步骤210,获取基于不同类型的多个对象构建的网络图,其中所述网络图包括与所述多个对象对应的多个节点以及在节点间进行连接的边,节点的类型对应于对象的类型,每条边表示所述每条边连接的两个节点所对应的对象之间的关联关系并且具有权重以表示所述两个节点间的关联度,并且所述两个节点间的关联度指示所述两个节点间对应的对象间的关联度。在一些实施例中,网络图中的节点对应的对象的类型(也即,节点的类型)包括以下中的至少一项:用户类型、账户类型、商户类型、证件类型等,并且所述关键类型例如可以是用户类型,当然这不是限制性的。作为示例,关联关系包括以下中的至少一项:用户类型的对象和账户类型的对象之间的绑定关系、用户类型的对象和用户类型的对象之间的投诉关系、用户类型的对象和用户类型的对象之间的支付关系、用户类型的对象和商户类型的对象之间的支付关系、用户类型的对象和证件类型的对象之间的实名关系等。本申请中的网络图可以是有向图或者无向图,这里不做限定。
在关联恶意用户的一个示例应用场景中,网络图包括表示用户类型、商户类型、账户类型、证件类型等类型的对象的节点,以及表示这些对象之间的关联关系的边,即边表示了例如用户类型的对象和账户类型的对象之间的绑定关系、用户类型的对象和用户类型的对象之间的投诉关系、用户类型的对象和用户类型的对象之间的支付关系、用户类型的对象和商户类型的对象之间的支付关系、用户类型的对象和证件类型的对象之间的实名关系等节点代表的对象之间的关联关系。为了简化起见,用户类型的节点下文中被称为用户节点,账户类型的节点下文中被称为账户节点,商户类型的节点下文中被称为商户节点,证件类型的节点下文中被称为证件节点。
在步骤220,初始化第一子图和第二子图,使得第一子图包含所述网络图中的一个或多个关键节点,第二子图包括网络图中去除第一子图中的节点后剩余的节点和边,其中每个关键节点表示具有关键类型的对象对应的节点。作为示例,在关联欺诈用户的场景中,关键类型的对象可以包括用户类型的对象,关键节点可以包括用户对象在网络图中对应的用户节点。例如,初始化第一子图使得第一子图包含一个或多个用户节点,第二子图包括网络图中去除第一子图中所包含的节点后剩余的节点和边。
迭代执行更新步骤以对第一子图和第二子图进行更新,直至满足在步骤234中确定第二子图中不包括关键节点。所述更新步骤包括:步骤231、步骤232和步骤233。作为示例,关键节点可以是用户节点,当更新步骤结束时,第二子图中将不包含用户节点,即获得了第一子图和第二子图的更新结果。
在步骤231,从网络图的节点中确定核心节点,所述核心节点是网络图中与第一子图中所述一个或多个关键节点中的至少一个关键节点的关联度大于零且与第二子图中的所有关键节点的关联度的和值最大的节点。在一些实施例中,网络图中的节点包括用户节点、账户节点、商户节点、证件节点等,用于分别表示用户类型、账户类型、商户类型、节点类型等的对象,如果关键节点被确定为用户节点,则核心节点是网络图中与第一子图中所述一个或多个用户节点中的至少一个用户节点的关联度大于零且与第二子图中的所有用户节点的关联度的和值最大的节点。所确定的核心节点可以是用户节点、账户节点、商户节点、证件节点中的任意一种。
在一些实施例中,从网络图的节点中确定核心节点包括:遍历网络图的所有节点,并且响应于遍历到的当前节点与第一子图中的至少一个关键节点的关联度大于零,则确定当前节点与第二子图中的所有关键节点的关联度的和值;将确定的所有和值中最大的和值对应的节点确定为核心节点。作为示例,当网络图中的节点包括用户节点、账户节点、商户节点、证件节点时,如果关键节点被确定为用户节点,则遍历网络图的所有节点(包括所有的用户节点、账户节点、商户节点、证件节点等),并且响应于遍历到的当前节点与第一子图中的至少一个用户节点的关联度大于零,则确定当前节点与第二子图中的所有用户节点的关联度的和值;将确定的所有和值中最大的和值对应的节点确定为核心节点。所确定的核心节点可以是满足以上要求的用户节点、账户节点、商户节点、证件节点等。
在步骤232,确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点,并且将所述节点集合中的节点、所述核心节点、以及网络图中连接核心节点与所述节点集合中的节点的边确定为第三子图。作为示例,确定第二子图中与核心节点存在连接的边的节点以及第一子图中与核心节点连接的边中权重最大的边连接的节点,以所确定的这些节点建立节点集合。
在一些实施例中,所述网络图中的每个节点具有权重以表示所述节点的重要性。作为示例,在确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点时,可以响应于第一子图包括与核心节点关联度最大的多个节点,即第一子图中与核心节点关联度最大的节点不止一个,则获取第一子图中的所述多个节点中具有最大节点权重的节点;然后确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及所述获取的具有最大节点权重的节点。
作为示例,网络图中的节点可以包括用户节点、账户节点、商户节点、证件节点等。这些节点可以具有权重以表示该节点的重要性。例如,销售额大的商户对应的节点具有的节点权重比销售额小的商户对应的节点大,账户余额更大的账户对应的节点具有的节点权重比账户余额小的账户对应的节点具有的节点权重更大。此时,在确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点时,如果第一子图包括与核心节点关联度最大的多个节点,则可以获取第一子图中的所述多个节点中具有最大节点权重的节点。然后,确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点(即第二子图中与核心节点存在连接的边的节点,其表示与核心节点对应的对象存在关联关系的对象)以及所述获取的具有最大节点权重的节点。
在步骤233,在第一子图中添加第三子图的节点和边,并且在第二子图中去除第三子图的节点和边。作为示例,第三子图包含部分用户节点、商户节点和账户节点以及部分连接它们的边,则在第一子图中添加第三子图中包含的用户节点、商户节点和账户节点以及部门它们之间的边,并在第二子图中去除第三子图中包含的这些用户节点、商户节点、账户节点以及边。
在步骤240,基于更新后的第一子图中包括的边,将更新后的第一子图中的节点对应的目标对象进行关联。更新后的第一子图包括全部用户节点以及部分其他类型的节点和一些连接这些节点的边。作为示例,更新后的第一子图中包括全部的用户节点和部分商户节点、以及它们之间的一些边,则利用更新后的第一子图中包括的边,将这些全部的用户节点和所述部分商户节点进行关联。可以看出,在本申请的目标对象关联过程中,在更新第一子图的步骤231、232、233中极大去除了不太重要的对象和冗余关联信息,使得在步骤240可以基于更新后的第一子图中包括的边对目标对象进行关联,这极大地避免了网络图中不太重要的对象和冗余关联信息对目标对象关联造成的干扰,使得目标对象的关联更加准确和高效,从而更适合于例如网络安全和对象推荐等领域的使用。
图3图示了根据本公开一个实施例的获取基于不同类型的多个对象构建的网络图方法300的示意性流程图。所述方法300可以用于实施图2中的步骤210。如图3所示,所示方法300包括如下步骤。
在步骤310,获取网络对象数据,网络对象数据包括多种类型的对象以及这些对象之间的关联关系。例如,网络对象数据包括用户、证件、账户、商户等类型的对象以及这些对象之间的关联关系。
在一些实施例中,获取网络对象数据还包括:获取各种对象的关系网络数据;对获取的关系网络数据进行数据清洗,以得到所述网络对象数据;其中数据清洗包括下述操作中的一项或多项:去除关系网络数据中残缺数据、去除关系网络数据中重复数据、去除关系网络数据中的错误数据。例如,关系网络数据包含不完整的商户对象的数据、重复的账户对象以及明显错误的用户对象数据,则在关系网络数据的清洗过程中,将会去除这些数据,得到网络对象数据。
在步骤320,基于网络对象数据中对象的类型和对象之间的关联关系确定异构图,所述异构图包括用于表示对象的节点以及用于表示对象之间的关联关系的边,用于表示对象的节点具有节点权重以表示该节点对应的对象的重要性,用于表示对象之间的关联关系的边具有边权重以表示该边连接的两个节点对应的对象间的关联度。作为示例,网络对象数据中对象的类型包括账户类型、用户类型、商户类型,对象之间的关联关系包括用户对象和账户对象之间的绑定关系,用户对象和商户对象之间的支付关系,用户对象和用户对象之间的实名关系。基于网络对象数据中对象的类型和对象之间的关联关系确定的异构图包括用于表示对象的节点(例如用户节点和商户节点)以及用于表示对象之间的关联关系(例如用户对象和商户对象之间的支付关系,用户对象和用户对象之间的实名关系)的边,用于表示对象的节点具有节点权重以表示该节点对应的对象的重要性。例如商户对象A比商户对象B的销售额更大,则商户对象A对应的节点的节点权重可以大于商户对象B对应的节点的节点权重。用于表示对象之间的关联关系的边具有权重以表示该边连接的两个节点对应的对象间的关联度,例如用户对象C和商户对象A之间的支付金额大于用户对象C和商户对象B之间的支付金额,则用户对象C对应的节点与商户对象A对应的节点之间的边的权重大于用户对象C对应的节点与商户对象B对应的节点之间的边的权重。
在步骤330,从所述异构图中挖掘异构图的子图,以得到所述网络图。作为示例,从所述异构图中挖掘异构图的子图可以通过各种方法进行,例如标签传播方法、获取连通图的方法、社区划分方法等进行,这里并不做限定。
在所述方法300中, 根据获取的网络对象数据确定异构图,将网络对象数据中繁琐的信息包含在了异构图中,然后从异构图中挖掘异构图的子图,去除了异构图中相对孤立不太相关的对象对应的节点和边以得到网络图。这样,在以得到的网络图为基础进行后续目标对象关联操作时,可以提高效率和准确性。
图4图示了根据本公开一个实施例的从异构图中挖掘异构图的子图以得到网络图方法400的示意性流程图。所述方法400可以用于实施图3中的步骤330。如图4所示,所示方法400包括如下步骤。
在步骤410,基于所述异构图中的每个节点建立初始集合,以将所述异构图中的多个节点划分成多个初始集合,并确定所述每个初始集合的模块度。作为示例,所述初始集合的模块度Q可以被定义为:
其中,A为邻接矩阵;Aij代表节点i和节点j之间边的权重;是所有与节点i相连的边的权重之和;Kj是所有与节点j相连的边的权重之和;表示所有边的权重之和;ci是i节点所在集合, cj是j节点所在集合;表示:当节点i和节点j在同一个集合内时返回1,否则返回0。
在步骤420,将所述多个初始集合中的每个集合作为当前集合。
然后,迭代执行步骤431,即通过将所述异构图中的每个节点分配到相邻节点所在的当前集合而形成更新集合,使得所述更新集合的模块度大于所述相邻节点所在的当前集合的模块度,并且将所述更新集合作为当前集合,直到满足步骤432中的条件停止,所述条件被设置为:得到的更新集合的模块度不再增大。作为示例,迭代执行步骤431、步骤432以更新当前集合,可以具体地按如下方式操作,(1)将每个节点划分在不同的集合中,(2)对每个节点,将每个节点尝试划分到与其邻接的节点所在的集合中,计算此时的模块度并判断划分前后的模块度的差值ΔQ是否为正数,若为正数,则接受本次的划分,若不为正数,则放弃本次的划分;(3)重复操作(1)和(2),直到模块度不能再增大为止。
在步骤440,将所得到的多个当前集合中的一个作为所述网络图。在一些实施例中,在更新当前集合后,对于得到多个当前集合,确定所得到的多个当前集合中的每个当前集合的模块度,然后将所得到的多个当前集合中最大模块度对应的集合作为所述网络图。方法400可以从异构图中挖掘异构图的子图,有利于对异构图进行集合划分,能够对复杂的异构图进行精细化的分类,进而提高异构图挖掘的准确性。
在一些实施例中,将所得到的多个当前集合中的一个作为所述网络图包括:确定所得到的多个当前集合中的每个当前集合的模块度;将所得到的多个当前集合中最大模块度对应的集合作为所述网络图。作为示例,假设所得到的当前集合有100个,由于所述100个当前集合中模块度最大的集合中的节点间连接的关联度更高,则将所得到的100个当前集合中最大模块度对应的集合作为所述网络图。
在另一些实施例中,步骤330中从异构图中挖掘异构图的子图,以得到所述网络图包括:从所述异构图中挖掘所述异构图的极大连通子图,以作为所述网络图。作为示例,所述异构图包括表示各类对象的节点和表示各类对象间关系的边,从所述异构图中挖掘的极大连通子图可以指示异构图中部分节点对应的对象之间的主要关联关系,因此可以将得到的极大连通子图作为所述网络图。
在一些实施例中,例如在反欺诈领域,为了尽可能识别欺诈用户,需挖掘与用户关联的对象,例如通过商户、账户、证件等与用户之间存在的关联关系,挖掘出用户的关联对象,特别是存在欺诈行为的用户的关联对象及与其的关联关系。
作为示例,图5图示了根据一些实施例的关联关系的示意图。如图5所示,关联关系包括以下中的至少一项:用户类型的对象和账户类型的对象之间的绑定关系、用户类型的对象和用户类型的对象之间的投诉关系、用户类型的对象和用户类型的对象之间的支付关系、用户类型的对象和商户类型的对象之间的支付关系、用户类型的对象和证件类型的对象之间的实名关系。例如,具体而言,用户A与商户B之间进行了一笔支付交易,则用户A与商户B存在支付关系;用户A与证件C之间进行了实名操作,则用户A与证件C存在实名关系;用户A与账户D之间进行了绑定,则用户A与账户D存在绑定关系;用户A投诉了用户E存在欺诈等行为,则用户A与用户E存在投诉关系。
在关联用户对象的过程中,首先确定各节点及相应关联关系的权重。例如对于支付关系而言,可以通过考虑用户对象间的支付金额确定该支付关系的权重。如果支付金额占比大或支付金额数量大,则可以将该支付关系的权重设置2,其他设置为1。而每个节点的权重,则可以用来表示该节点对应的对象的重要性。例如,商户A的销售额比商户B高,则商户A对应的节点的节点权重可以比商户B对应的节点的节点权重大。然后根据各节点及相应关联关系的权重构建关联网络。
然后,依据构建的关联网络,通过标签传播、连通图、社区发现等图挖掘算法,进行恶意聚集挖掘和分析。通过挖掘的聚集结果,得到网络图。其中,表示节点集合,;v表示节点,, 表示节点的类型,表示节点的重要度;表示节点集合中的用户节点的集合。E表示节点间的关联关系集合,,其中,表示关系e是从节点v指向w的边,边的类型为,且权重为,该边的权重可以表示为。因此表示为节点对应的对象存在关联关系,表示节点对应的对象不存在关联关系。
作为示例,将用户类型的节点(即)设定为关键节点,其他类型节点设定为可选保留节点。将第一子图表示为,对于 有;表示第一子图中的用户节点的集合。将第二子图表示为,对于 有。表示第二子图中的用户节点的集合。可选地,可以对第一子图和第二子图进行初始化,使得第一子图包含一个或多个用户节点,第二子图包含网络图中去除第一子图中的节点和边后的剩余节点和边。
步骤(2):构建节点集合,该节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点。然后将节点集合中的节点、核心节点、以及网络图中连接核心节点与所述节点集合中的节点的边确定为第三子图,。表示第三子图中的节点集合,表示第三子图中的边集合,具体表示为:
图6图示了确定第三子图的示例性过程。如图6所示,G1表示第一子图,包含节点N1、N2、N3;G2表示第二子图,包含节点K1、K2、K3、K4。核心节点w与G1中关联度最大的节点是N3,核心节点w与G2中关联度大于零的节点是K1、K2、K3、K4,则节点集合将包含节点N3、K1、K2、K3、K4,第三子图,中的节点集合将包含节点N3、K1、K2、K3、K4和核心节点w,第三子图,中的边集合将包含核心节点w与节点N3、K1、K2、K3、K4连接的边。
完成更新步骤后,基于更新后的第一子图中包括的边,将更新后的第一子图中的节点对应的目标对象进行关联。图7图示了根据本公开的一个实施例的目标对象关联方法的效果图。如图7所示,左侧是将进行目标对象关联的网络图,右侧是目标对象关联的效果。从图中可以看出,通过本公开所示的方法,去除了大部分干扰信息和冗余关联信息,基于更新后的第一子图中包括的边,将更新后的第一子图中的节点对应的目标对象进行关联,使得目标对象的关联更加准确和高效。
图8示出了根据本公开的一个实施例的目标对象关联装置800的示例性结构框图。如图8所示,所述目标对象关联装置800包括获取模块810,初始化模块820,更新模块830、关联模块840。
所述获取模块810被配置成获取基于不同类型的多个对象构建的网络图,其中所述网络图包括与所述多个对象对应的多个节点以及在节点间进行连接的边,节点的类型对应于对象的类型,每条边表示所述每条边连接的两个节点所对应的对象之间的关联关系并且具有权重以表示所述两个节点间的关联度,并且所述两个节点间的关联度指示所述两个节点间对应的对象间的关联度。在一些实施例中,网络图中的节点对应对象的类型包括以下中的至少一项:用户类型、账户类型、商户类型、证件类型,并且所述关键类型包括用户类型。例如,关联关系包括以下中的至少一项:用户类型的对象和账户类型的对象之间的绑定关系、用户类型的对象和用户类型的对象之间的投诉关系、用户类型的对象和用户类型的对象之间的支付关系、用户类型的对象和商户类型的对象之间的支付关系、用户类型的对象和证件类型的对象之间的实名关系。例如,在关联欺诈用户的应用场景中,网络图中的节点可以包含该节点对应的对象的类型(诸如用户节点、账户节点、商户节点、证件节点等)等信息,网络图中的边可以包含这些节点对应的类型之间的信息。例如,连接用户节点和账户节点的边可以表示用户类型的对象与账户类型的对象之间的绑定关系,连接用户节点和用户节点的边可以表示用户类型的对象和用户类型的对象之间的投诉关系或支付关系、连接用户节点和商户节点的边的边可以表示用户类型的对象和商户类型的对象之间的支付关系、连接用户节点和证件节点的边可以表示用户类型的对象和证件类型的对象之间的实名关系。在一些实施例中,获取模块810被配置成获取在基于不同类型的多个对象构建的网络图时,可以示例性地按照以下方式进行:首先获取网络对象数据,这些网络对象数据可以包括多种类型的对象以及这些对象之间的关联关系,然后基于网络对象数据中对象的类型和对象之间的关联关系确定异构图,这里的异构图包括用于表示对象的节点以及用于表示对象之间的关联关系的边,用于表示对象的节点具有节点权重以表示该节点对应的对象的重要性,用于表示对象之间的关联关系的边具有边权重以表示该边连接的两个节点对应的对象间的关联度,然后从所述异构图中挖掘异构图的子图作为网络图。
所述初始化模块820被配置成初始化第一子图和第二子图,使得第一子图包含所述网络图中的一个或多个关键节点,第二子图包括网络图中去除第一子图中的节点后剩余的节点和边,其中每个关键节点表示具有关键类型的对象对应的节点。例如,在关联欺诈用户的场景中,关键类型的对象可以包括用户对象,关键节点可以包括用户对象在网络图中对应的用户节点。例如,初始化第一子图使得第一子图包含一个或多个用户节点,第二子图包括网络中去除第一子图中所包含的节点后剩余的节点和边。
所述更新模块830被配置成迭代执行如下更新步骤以对第一子图和第二子图进行更新,直至第二子图中不包括关键节点,所述更新步骤包括:从网络图的节点中确定核心节点,所述核心节点是网络图中与第一子图中所述一个或多个关键节点中的至少一个关键节点的关联度大于零且与第二子图中的所有关键节点的关联度的和值最大的节点;确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点,并且将所述节点集合中的节点、所述核心节点、以及网络图中连接核心节点与所述节点集合中的节点的边确定为第三子图;在第一子图中添加第三子图的节点和边,并且在第二子图中去除第三子图的节点和边。例如,第三子图包含部分用户节点、商户节点和账户节点以及部分连接它们的边,则在第一子图中添加第三子图中包含的用户节点、商户节点和账户节点以及部门它们之间的边,并在第二子图中去除第三子图中包含的用户节点、商户节点和账户节点以及部门它们之间的边。
所述关联模块840被配置成基于更新后的第一子图中包括的边,将更新后的第一子图中的节点对应的目标对象进行关联。例如,更新后的第一子图中包括全部的用户节点和部分商户节点,以及它们之间的一些边。则根据更新后的第一子图中包括的边,将全部的用户节点和所述部分商户节点进行关联。
图9图示了示例***900,其包括代表可以实现本文描述的各种技术的一个或多个***和/或设备的示例计算设备910。计算设备910可以是例如服务提供商的服务器、与服务器相关联的设备、片上***、和/或任何其它合适的计算设备或计算***。上面参照图8描述的目标对象关联装置800可以采取计算设备910的形式。替换地,目标对象关联装置800可以以应用916的形式被实现为计算机程序。
如图示的示例计算设备910包括彼此通信耦合的处理***911、一个或多个计算机可读介质912以及一个或多个I/O接口913。尽管未示出,但是计算设备910还可以包括***总线或其他数据和命令传送***,其将各种组件彼此耦合。***总线可以包括不同总线结构的任何一个或组合,所述总线结构诸如存储器总线或存储器控制器、***总线、通用串行总线、和/或利用各种总线架构中的任何一种的处理器或局部总线。还构思了各种其他示例,诸如控制和数据线。
处理***911代表使用硬件执行一个或多个操作的功能。因此,处理***911被图示为包括可被配置为处理器、功能块等的硬件元件914。这可以包括在硬件中实现为专用集成电路或使用一个或多个半导体形成的其它逻辑器件。硬件元件914不受其形成的材料或其中采用的处理机构的限制。例如,处理器可以由(多个)半导体和/或晶体管(例如,电子集成电路(IC))组成。在这样的上下文中,处理器可执行指令可以是电子可执行指令。
计算机可读介质912被图示为包括存储器/存储装置915。存储器/存储装置915表示与一个或多个计算机可读介质相关联的存储器/存储容量。存储器/存储装置915可以包括易失性介质(诸如随机存取存储器(RAM))和/或非易失性介质(诸如只读存储器(ROM)、闪存、光盘、磁盘等)。存储器/存储装置915可以包括固定介质(例如,RAM、ROM、固定硬盘驱动器等)以及可移动介质(例如,闪存、可移动硬盘驱动器、光盘等)。计算机可读介质912可以以下面进一步描述的各种其他方式进行配置。
一个或多个I/O接口913代表允许用户使用各种输入设备向计算设备910输入命令和信息并且可选地还允许使用各种输出设备将信息呈现给用户和/或其他组件或设备的功能。输入设备的示例包括键盘、光标控制设备(例如,鼠标)、麦克风(例如,用于语音输入)、扫描仪、触摸功能(例如,被配置为检测物理触摸的容性或其他传感器)、相机(例如,可以采用可见或不可见的波长(诸如红外频率)将不涉及触摸的运动检测为手势)等等。输出设备的示例包括显示设备(例如,监视器或投影仪)、扬声器、打印机、网卡、触觉响应设备等。因此,计算设备910可以以下面进一步描述的各种方式进行配置以支持用户交互。
计算设备910还包括应用916。应用916可以例如是目标对象关联装置800的软件实例,并且与计算设备910中的其他元件相组合地实现本文描述的技术。
本文可以在软件硬件元件或程序模块的一般上下文中描述各种技术。一般地,这些模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元素、组件、数据结构等。本文所使用的术语“模块”,“功能”和“组件”一般表示软件、固件、硬件或其组合。本文描述的技术的特征是与平台无关的,意味着这些技术可以在具有各种处理器的各种计算平台上实现。
所描述的模块和技术的实现可以存储在某种形式的计算机可读介质上或者跨某种形式的计算机可读介质传输。计算机可读介质可以包括可由计算设备910访问的各种介质。作为示例而非限制,计算机可读介质可以包括“计算机可读存储介质”和“计算机可读信号介质”。
与单纯的信号传输、载波或信号本身相反,“计算机可读存储介质”是指能够持久存储信息的介质和/或设备,和/或有形的存储装置。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括诸如易失性和非易失性、可移动和不可移动介质和/或以适用于存储信息(诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路或其他数据)的方法或技术实现的存储设备之类的硬件。计算机可读存储介质的示例可以包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字通用盘(DVD)或其他光学存储装置、硬盘、盒式磁带、磁带,磁盘存储装置或其他磁存储设备,或其他存储设备、有形介质或适于存储期望信息并可以由计算机访问的制品。
“计算机可读信号介质”是指被配置为诸如经由网络将指令发送到计算设备910的硬件的信号承载介质。信号介质典型地可以将计算机可读指令、数据结构、程序模块或其他数据体现在诸如载波、数据信号或其它传输机制的调制数据信号中。信号介质还包括任何信息传递介质。术语“调制数据信号”是指这样的信号,该信号的特征中的一个或多个被设置或改变,从而将信息编码到该信号中。作为示例而非限制,通信介质包括诸如有线网络或直接连线的有线介质以及诸如声、RF、红外和其它无线介质的无线介质。
如前所述,硬件元件914和计算机可读介质912代表以硬件形式实现的指令、模块、可编程器件逻辑和/或固定器件逻辑,其在一些实施例中可以用于实现本文描述的技术的至少一些方面。硬件元件可以包括集成电路或片上***、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)以及硅中的其它实现或其他硬件设备的组件。在这种上下文中,硬件元件可以作为执行由硬件元件所体现的指令、模块和/或逻辑所定义的程序任务的处理设备,以及用于存储用于执行的指令的硬件设备,例如,先前描述的计算机可读存储介质。
前述的组合也可以用于实现本文所述的各种技术和模块。因此,可以将软件、硬件或程序模块和其它程序模块实现为在某种形式的计算机可读存储介质上和/或由一个或多个硬件元件914体现的一个或多个指令和/或逻辑。计算设备910可以被配置为实现与软件和/或硬件模块相对应的特定指令和/或功能。因此,例如通过使用处理***的计算机可读存储介质和/或硬件元件914,可以至少部分地以硬件来实现将模块实现为可由计算设备910作为软件执行的模块。指令和/或功能可以由一个或多个制品(例如,一个或多个计算设备910和/或处理***911)可执行/可操作以实现本文所述的技术、模块和示例。
在各种实施方式中,计算设备910可以采用各种不同的配置。例如,计算设备910可以被实现为包括个人计算机、台式计算机、多屏幕计算机、膝上型计算机、上网本等的计算机类设备。计算设备910还可以被实现为包括诸如移动电话、便携式音乐播放器、便携式游戏设备、平板计算机、多屏幕计算机等移动设备的移动装置类设备。计算设备910还可以实现为电视类设备,其包括具有或连接到休闲观看环境中的一般地较大屏幕的设备。这些设备包括电视、机顶盒、游戏机等。
本文描述的技术可以由计算设备910的这些各种配置来支持,并且不限于本文所描述的技术的具体示例。功能还可以通过使用分布式***、诸如通过如下所述的平台922而在“云”920上全部或部分地实现。
云920包括和/或代表用于资源924的平台922。平台922抽象云920的硬件(例如,服务器)和软件资源的底层功能。资源924可以包括在远离计算设备910的服务器上执行计算机处理时可以使用的应用和/或数据。资源924还可以包括通过因特网和/或通过诸如蜂窝或Wi-Fi网络的订户网络提供的服务。
平台922可以抽象资源和功能以将计算设备910与其他计算设备连接。平台922还可以用于抽象资源的分级以提供遇到的对于经由平台922实现的资源924的需求的相应水平的分级。因此,在互连设备实施例中,本文描述的功能的实现可以分布在整个***900内。例如,功能可以部分地在计算设备910上以及通过抽象云920的功能的平台922来实现。
应当理解,为清楚起见,参考不同的功能单元对本公开的实施例进行了描述。然而,将明显的是,在不偏离本公开的情况下,每个功能单元的功能性可以被实施在单个单元中、实施在多个单元中或作为其它功能单元的一部分被实施。例如,被说明成由单个单元执行的功能性可以由多个不同的单元来执行。因此,对特定功能单元的参考仅被视为对用于提供所描述的功能性的适当单元的参考,而不是表明严格的逻辑或物理结构或组织。因此,本公开可以被实施在单个单元中,或者可以在物理上和功能上被分布在不同的单元和电路之间。
将理解的是,尽管第一、第二、第三等术语在本文中可以用来描述各种设备、元件、部件或部分,但是这些设备、元件、部件或部分不应当由这些术语限制。这些术语仅用来将一个设备、元件、部件或部分与另一个设备、元件、部件或部分相区分。
尽管已经结合一些实施例描述了本公开,但是其不旨在被限于在本文中所阐述的特定形式。相反,本公开的范围仅由所附权利要求来限制。附加地,尽管单独的特征可以被包括在不同的权利要求中,但是这些可以可能地被有利地组合,并且包括在不同权利要求中不暗示特征的组合不是可行的和/或有利的。特征在权利要求中的次序不暗示特征必须以其工作的任何特定次序。此外,在权利要求中,词“包括”不排除其它元件,并且术语“一”或“一个”不排除多个。权利要求中的附图标记仅作为明确的例子被提供,不应该被解释为以任何方式限制权利要求的范围。
Claims (15)
1.一种目标对象关联方法,包括:
获取基于不同类型的多个对象构建的网络图,其中所述网络图包括与所述多个对象对应的多个节点以及在节点间进行连接的边,节点的类型对应于对象的类型,每条边表示所述每条边连接的两个节点所对应的对象之间的关联关系并且具有权重以表示所述两个节点间的关联度,所述两个节点间的关联度指示所述两个节点间对应的对象间的关联度;
初始化第一子图和第二子图,使得第一子图包含所述网络图中的一个或多个关键节点,第二子图包括网络图中去除第一子图中的节点后剩余的节点和边,其中每个关键节点表示具有关键类型的对象对应的节点;
迭代执行如下更新步骤以对第一子图和第二子图进行更新,直至第二子图中不包括关键节点,所述更新步骤包括:
从网络图的节点中确定核心节点,所述核心节点是网络图中与第一子图中所述一个或多个关键节点中的至少一个关键节点的关联度大于零且与第二子图中的所有关键节点的关联度的和值最大的节点;
确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点,并且将所述节点集合中的节点、所述核心节点、以及网络图中连接核心节点与所述节点集合中的节点的边确定为第三子图;
在第一子图中添加第三子图的节点和边,并且在第二子图中去除第三子图的节点和边;
基于更新后的第一子图中包括的边,将更新后的第一子图中的节点对应的目标对象进行关联。
2.根据权利要求1所述的方法,其中,所述从网络图的节点中确定核心节点包括:
遍历网络图的所有节点,并且响应于遍历到的当前节点与第一子图中的至少一个关键节点的关联度大于零,则确定当前节点与第二子图中的所有关键节点的关联度的和值;
将确定的所有和值中最大的和值对应的节点确定为核心节点。
3.根据权利要求1所述的方法,其中,所述网络图中的每个节点具有权重以表示所述节点的重要性,并且,
其中,确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点,包括:
响应于第一子图包括与核心节点关联度最大的多个节点,则获取第一子图中的所述多个节点中具有最大节点权重的节点;
确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及所述获取的具有最大节点权重的节点。
4.根据权利要求1所述的方法,其中,所述获取基于不同类型的多个对象构建的网络图包括:
获取网络对象数据,网络对象数据包括多种类型的对象以及这些对象之间的关联关系;
基于网络对象数据中对象的类型和对象之间的关联关系确定异构图,所述异构图包括用于表示对象的节点以及用于表示对象之间的关联关系的边,用于表示对象的节点具有节点权重以表示该节点对应的对象的重要性,用于表示对象之间的关联关系的边具有边权重以表示该边连接的两个节点对应的对象间的关联度;
从所述异构图中挖掘异构图的子图,以得到所述网络图。
5.根据权利要求4所述的方法,其中,所述获取网络对象数据还包括:
获取各种对象的关系网络数据;
对获取的关系网络数据进行数据清洗,以得到所述网络对象数据;其中数据清洗包括下述操作中的一项或多项:去除关系网络数据中残缺数据、去除关系网络数据中重复数据、去除关系网络数据中的错误数据。
6.根据权利要求4所述的方法,其中,所述从所述异构图中挖掘异构图的子图,以得到所述网络图包括:
基于所述异构图中的每个节点建立初始集合,以将所述异构图中的多个节点划分成多个初始集合,并确定每个所述初始集合的模块度,其中集合的模块度表征集合中的节点间连接的关联度;
将所述多个初始集合中的每个集合作为当前集合;
迭代执行网络更新步骤,直到所得到的更新集合的模块度不再增大,所述更新步骤包括:通过将所述异构图中的每个节点分配到相邻节点所在的当前集合而形成更新集合,使得所述更新集合的模块度大于所述相邻节点所在的当前集合的模块度,并且将所述更新集合作为当前集合;
将所得到的多个当前集合中的一个作为所述网络图。
7.根据权利要求6所述的方法,其中,所述将所得到的多个当前集合中的一个作为所述网络图包括:
确定所得到的多个当前集合中的每个当前集合的模块度;
将所得到的多个当前集合中最大模块度对应的集合作为所述网络图。
8.根据权利要求4所述的方法,其中,从所述异构图中挖掘异构图的子图,以得到所述网络图包括:
从所述异构图中挖掘所述异构图的极大连通子图,以作为所述网络图。
9.根据权利要求1所述的方法,其中,网络图中的节点对应对象的类型包括以下中的至少一项:用户类型、账户类型、商户类型、证件类型,并且所述关键类型包括用户类型。
10.根据权利要求1所述的方法,其中,关联关系包括以下中的至少一项:用户类型的对象和账户类型的对象之间的绑定关系、用户类型的对象和用户类型的对象之间的投诉关系、用户类型的对象和用户类型的对象之间的支付关系、用户类型的对象和商户类型的对象之间的支付关系、用户类型的对象和证件类型的对象之间的实名关系。
11.一种目标对象关联装置,包括:
获取模块,其被配置成获取基于不同类型的多个对象构建的网络图,其中所述网络图包括与所述多个对象对应的多个节点以及在节点间进行连接的边,节点的类型对应于对象的类型,每条边表示所述每条边连接的两个节点所对应的对象之间的关联关系并且具有权重以表示所述两个节点间的关联度,并且所述两个节点间的关联度指示所述两个节点间对应的对象间的关联度;
初始化模块,其被配置成初始化第一子图和第二子图,使得第一子图包含所述网络图中的一个或多个关键节点,第二子图包括网络图中去除第一子图中的节点后剩余的节点和边,其中每个关键节点表示具有关键类型的对象对应的节点;
更新模块,其被配置成迭代执行如下更新步骤以对第一子图和第二子图进行更新,直至第二子图中不包括关键节点,所述更新步骤包括:
从网络图的节点中确定核心节点,所述核心节点是网络图中与第一子图中所述一个或多个关键节点中的至少一个关键节点的关联度大于零且与第二子图中的所有关键节点的关联度的和值最大的节点;
确定节点集合使得所述节点集合包括第二子图中与核心节点关联度大于零的节点以及第一子图中与核心节点关联度最大的节点,并且将所述节点集合中的节点、所述核心节点、以及网络图中连接核心节点与所述节点集合中的节点的边确定为第三子图;
在第一子图中添加第三子图的节点和边,并且在第二子图中去除第三子图的节点和边;
关联模块,其被配置成基于更新后的第一子图中包括的边,将更新后的第一子图中的节点对应的目标对象进行关联。
12.根据权利要求11所述的装置,其中,所述获取模块被配置成:
获取网络对象数据,网络对象数据包括多种类型的对象以及这些对象之间的关联关系;
基于网络对象数据中对象的类型和对象之间的关联关系确定异构图,所述异构图包括用于表示对象的节点以及用于表示对象之间的关联关系的边,用于表示对象的节点具有节点权重以表示该节点对应的对象的重要性,用于表示对象之间的关联关系的边具有边权重以表示该边连接的两个节点对应的对象间的关联度;
从所述异构图中挖掘异构图的子图,以得到所述网络图。
13.一种计算设备,包括
存储器,其被配置成存储计算机可执行指令;
处理器,其被配置成当所述计算机可执行指令被处理器执行时执行根据权利要求1-10中的任一项所述的方法。
14.一种计算机可读存储介质,其存储有计算机可执行指令,当所述计算机可执行指令被执行时,执行根据权利要求1-10中的任一项所述的方法。
15.一种计算机程序产品,包括计算机可执行指令,其中所述计算机可执行指令被处理器执行时执行根据权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111157861.7A CN113609345B (zh) | 2021-09-30 | 2021-09-30 | 目标对象关联方法和装置、计算设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111157861.7A CN113609345B (zh) | 2021-09-30 | 2021-09-30 | 目标对象关联方法和装置、计算设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113609345A true CN113609345A (zh) | 2021-11-05 |
CN113609345B CN113609345B (zh) | 2021-12-10 |
Family
ID=78343290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111157861.7A Active CN113609345B (zh) | 2021-09-30 | 2021-09-30 | 目标对象关联方法和装置、计算设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113609345B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114443783A (zh) * | 2022-04-11 | 2022-05-06 | 浙江大学 | 一种供应链数据分析和增强处理方法及装置 |
CN115268282A (zh) * | 2022-06-29 | 2022-11-01 | 青岛海尔科技有限公司 | 家电设备的控制方法、装置、存储介质及电子装置 |
WO2024104005A1 (zh) * | 2022-11-15 | 2024-05-23 | 中移(成都)信息通信科技有限公司 | 医疗信息处理方法以及装置、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014000435A1 (zh) * | 2012-06-25 | 2014-01-03 | 华为技术有限公司 | 一种挖掘社交网络中话题核心圈的方法及*** |
US20140317033A1 (en) * | 2013-04-23 | 2014-10-23 | International Business Machines Corporation | Predictive and descriptive analysis on relations graphs with heterogeneous entities |
KR20180137387A (ko) * | 2017-06-15 | 2018-12-27 | 한양대학교 산학협력단 | 중첩 커뮤니티 검출 장치 및 방법 |
CN110032665A (zh) * | 2019-03-25 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 确定关系网络图中图节点向量的方法及装置 |
US10795895B1 (en) * | 2017-10-26 | 2020-10-06 | EMC IP Holding Company LLC | Business data lake search engine |
CN112214499A (zh) * | 2020-12-03 | 2021-01-12 | 腾讯科技(深圳)有限公司 | 图数据处理方法、装置、计算机设备和存储介质 |
CN112926990A (zh) * | 2021-03-25 | 2021-06-08 | 支付宝(杭州)信息技术有限公司 | 欺诈识别的方法和装置 |
CN113111193A (zh) * | 2021-05-25 | 2021-07-13 | 合肥工业大学 | 知识图谱的数据处理方法及装置 |
WO2021184367A1 (zh) * | 2020-03-20 | 2021-09-23 | 清华大学 | 基于度分布生成模型的社交网络图生成方法 |
-
2021
- 2021-09-30 CN CN202111157861.7A patent/CN113609345B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014000435A1 (zh) * | 2012-06-25 | 2014-01-03 | 华为技术有限公司 | 一种挖掘社交网络中话题核心圈的方法及*** |
US20140317033A1 (en) * | 2013-04-23 | 2014-10-23 | International Business Machines Corporation | Predictive and descriptive analysis on relations graphs with heterogeneous entities |
KR20180137387A (ko) * | 2017-06-15 | 2018-12-27 | 한양대학교 산학협력단 | 중첩 커뮤니티 검출 장치 및 방법 |
US10795895B1 (en) * | 2017-10-26 | 2020-10-06 | EMC IP Holding Company LLC | Business data lake search engine |
CN110032665A (zh) * | 2019-03-25 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 确定关系网络图中图节点向量的方法及装置 |
WO2021184367A1 (zh) * | 2020-03-20 | 2021-09-23 | 清华大学 | 基于度分布生成模型的社交网络图生成方法 |
CN112214499A (zh) * | 2020-12-03 | 2021-01-12 | 腾讯科技(深圳)有限公司 | 图数据处理方法、装置、计算机设备和存储介质 |
CN112926990A (zh) * | 2021-03-25 | 2021-06-08 | 支付宝(杭州)信息技术有限公司 | 欺诈识别的方法和装置 |
CN113111193A (zh) * | 2021-05-25 | 2021-07-13 | 合肥工业大学 | 知识图谱的数据处理方法及装置 |
Non-Patent Citations (1)
Title |
---|
陈端兵等: "重叠社区发现的两段策略", 《计算机科学》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114443783A (zh) * | 2022-04-11 | 2022-05-06 | 浙江大学 | 一种供应链数据分析和增强处理方法及装置 |
CN115268282A (zh) * | 2022-06-29 | 2022-11-01 | 青岛海尔科技有限公司 | 家电设备的控制方法、装置、存储介质及电子装置 |
WO2024104005A1 (zh) * | 2022-11-15 | 2024-05-23 | 中移(成都)信息通信科技有限公司 | 医疗信息处理方法以及装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113609345B (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113609345B (zh) | 目标对象关联方法和装置、计算设备以及存储介质 | |
Liu et al. | A multiobjective evolutionary algorithm based on similarity for community detection from signed social networks | |
CN112085172B (zh) | 图神经网络的训练方法及装置 | |
CN108140075A (zh) | 将用户行为分类为异常 | |
CN110009486B (zh) | 一种欺诈检测的方法、***、设备及计算机可读存储介质 | |
WO2023065859A1 (zh) | 物品推荐方法、装置及存储介质 | |
CN109766454A (zh) | 一种投资者分类方法、装置、设备及介质 | |
CN110020176A (zh) | 一种资源推荐方法、电子设备以及计算机可读存储介质 | |
CN112085615A (zh) | 图神经网络的训练方法及装置 | |
CN111639253B (zh) | 一种数据判重方法、装置、设备及存储介质 | |
EP4120138A1 (en) | System and method for molecular property prediction using hypergraph message passing neural network (hmpnn) | |
CN110009365B (zh) | 非正常转移电子资产的用户群体检测方法、装置和设备 | |
CN111582538A (zh) | 一种基于图神经网络的社群价值预测方法及*** | |
CN111199474A (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN110310114A (zh) | 对象分类方法、装置、服务器及存储介质 | |
WO2023165271A1 (zh) | 知识图谱的构建、和图计算 | |
CN113191838A (zh) | 一种基于异质图神经网络的购物推荐方法及*** | |
US11455512B1 (en) | Representing graph edges using neural networks | |
Aravazhi Irissappane et al. | Filtering unfair ratings from dishonest advisors in multi-criteria e-markets: a biclustering-based approach | |
CN108446738A (zh) | 一种聚类方法、装置及电子设备 | |
CN116662570A (zh) | 一种用于银行风险评估的异构图知识图谱补全方法及*** | |
CN115545833A (zh) | 一种基于用户社交信息的推荐方法及*** | |
CN114282121A (zh) | 业务节点推荐方法、***、设备及存储介质 | |
CN113393250A (zh) | 一种信息处理方法及装置、存储介质 | |
CN115859197A (zh) | 识别异常集群的方法和装置、计算设备、存储介质和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40055291 Country of ref document: HK |