CN112131261B - 基于社区网络的社区查询方法、装置和计算机设备 - Google Patents
基于社区网络的社区查询方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN112131261B CN112131261B CN202011072391.XA CN202011072391A CN112131261B CN 112131261 B CN112131261 B CN 112131261B CN 202011072391 A CN202011072391 A CN 202011072391A CN 112131261 B CN112131261 B CN 112131261B
- Authority
- CN
- China
- Prior art keywords
- node
- community
- community network
- queried
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012545 processing Methods 0.000 claims abstract description 92
- 238000012549 training Methods 0.000 claims description 200
- 230000004927 fusion Effects 0.000 claims description 120
- 239000011159 matrix material Substances 0.000 claims description 42
- 102000004169 proteins and genes Human genes 0.000 claims description 30
- 108090000623 proteins and genes Proteins 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 14
- 230000003993 interaction Effects 0.000 claims description 14
- 238000007499 fusion processing Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 35
- 238000005096 rolling process Methods 0.000 description 29
- 238000013528 artificial neural network Methods 0.000 description 21
- 238000013527 convolutional neural network Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 5
- 238000007418 data mining Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 230000006916 protein interaction Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种基于社区网络的社区查询方法、装置、计算机设备和存储介质。所述方法包括:获取社区网络中的待查询节点和所述待查询节点对应的待查询属性;所述社区网络包含各节点和所述各节点对应的属性;对所述待查询节点和所述待查询属性进行图卷积处理,获得所述社区网络中目标节点;所述目标节点的结构与所述待查询节点的结构相关联,所述目标节点的目标属性与所述待查询属性相似;基于所述目标节点和所述目标属性,确定所述待查询节点在所述社区网络中对应的社区子图;其中,所述社区子图包含所述目标节点和所述目标属性。采用本方法能够准确查询出节点在社区网络中对应的社区子图。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于社区网络的社区查询方法、装置、计算机设备和存储介质。
背景技术
社区(Community)是一种在网络结构交互图中自然存在的子图结构。它的内部节点互相紧密的连结着,而和外部的节点连接松散。社区查询(Community search)是指给定查询输入,计算出对应的社区子图作为输出。
传统的社区查询技术使用了两阶段处理的过程,先是针对给定的查询节点找到一个密集的候选社区,然后是通过优化属性把社区缩小,以确定目标社区。但传统的社区查询方法仅关注内部节点的拓扑结构,导致查询不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高查询的准确性的基于社区网络的社区查询方法、装置、计算机设备和存储介质。
一种基于社区网络的社区查询方法,所述方法包括:
获取社区网络中的待查询节点和所述待查询节点对应的待查询属性;所述社区网络包含各节点和所述各节点对应的属性;
对所述待查询节点和所述待查询属性进行图卷积处理,获得所述社区网络中目标节点;所述目标节点的结构与所述待查询节点的结构相关联,所述目标节点的目标属性与所述待查询属性相似;
基于所述目标节点和所述目标属性,确定所述待查询节点在所述社区网络中对应的社区子图;
其中,所述社区子图包含所述目标节点和所述目标属性。
一种基于社区网络的社区查询装置,所述装置包括:
第一获取模块,用于获取社区网络中的待查询节点和所述待查询节点对应的待查询属性;所述社区网络包含各节点和所述各节点对应的属性;
第一处理模块,用于对所述待查询节点和所述待查询属性进行图卷积处理,获得所述社区网络中目标节点;所述目标节点的结构与所述待查询节点的结构相关联,所述目标节点的目标属性与所述待查询属性相似;
确定模块,用于基于所述目标节点和所述目标属性,确定所述待查询节点在所述社区网络中对应的社区子图;
其中,所述社区子图包含所述目标节点和所述目标属性。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取社区网络中的待查询节点和所述待查询节点对应的待查询属性;所述社区网络包含各节点和所述各节点对应的属性;
对所述待查询节点和所述待查询属性进行图卷积处理,获得所述社区网络中目标节点;所述目标节点的结构与所述待查询节点的结构相关联,所述目标节点的目标属性与所述待查询属性相似;
基于所述目标节点和所述目标属性,确定所述待查询节点在所述社区网络中对应的社区子图;
其中,所述社区子图包含所述目标节点和所述目标属性。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取社区网络中的待查询节点和所述待查询节点对应的待查询属性;所述社区网络包含各节点和所述各节点对应的属性;
对所述待查询节点和所述待查询属性进行图卷积处理,获得所述社区网络中目标节点;所述目标节点的结构与所述待查询节点的结构相关联,所述目标节点的目标属性与所述待查询属性相似;
基于所述目标节点和所述目标属性,确定所述待查询节点在所述社区网络中对应的社区子图;
其中,所述社区子图包含所述目标节点和所述目标属性。
上述基于社区网络的社区查询方法、装置、计算机设备和存储介质,通过对社区网络中的待查询节点和待查询属性进行图卷积处理,以获得该社区网络中与待查询节点的结构关联、属性相似的目标节点,从而能够结合待查询节点与其它节点的结构相关性和属性相似性,准确地查询出携带属性的节点在社区网络中的社区子图。并且,通过待查询节点与其它节点的结构相关性和属性相似性,能够准确实现节点的分类、聚类,从而确定分类或聚类的节点在社区网络中的社区子图,通过社区子图直观显示分类或聚类的各节点之间的关联关系。
一种预测模型的处理方法,所述方法包括:
获取社区网络中的训练节点、所述训练节点对应的训练属性和所述训练节点对应的标签;所述社区网络包含各节点和所述各节点对应的属性;
通过预测模型对所述训练节点和所述训练属性进行图卷积处理,获得所述社区网络中的预测目标节点;所述预测目标节点的结构与所述训练节点的结构相关联,所述预测目标节点的预测目标属性与所述训练属性相似;
基于所述预测目标节点和所述预测目标属性,确定所述训练节点在所述社区网络中对应的预测社区子图;
根据所述预测社区子图和所述训练节点对应的标签之间的差异,调整所述预测模型的参数,当满足训练停止条件时得到已训练的预测模型。
一种预测模型的处理装置,所述装置包括:
第二获取模块,用于获取社区网络中的训练节点、所述训练节点对应的训练属性和所述训练节点对应的标签;所述社区网络包含各节点和所述各节点对应的属性;
第二处理模块,用于通过预测模型对所述训练节点和所述训练属性进行图卷积处理,获得所述社区网络中的预测目标节点;所述预测目标节点的结构与所述训练节点的结构相关联,所述预测目标节点的预测目标属性与所述训练属性相似;
预测模块,用于基于所述预测目标节点和所述预测目标属性,确定所述训练节点在所述社区网络中对应的预测社区子图;
调整模块,用于根据所述预测社区子图和所述训练节点对应的标签之间的差异,调整所述预测模型的参数,当满足训练停止条件时得到已训练的预测模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取社区网络中的训练节点、所述训练节点对应的训练属性和所述训练节点对应的标签;所述社区网络包含各节点和所述各节点对应的属性;
通过预测模型对所述训练节点和所述训练属性进行图卷积处理,获得所述社区网络中的预测目标节点;所述预测目标节点的结构与所述训练节点的结构相关联,所述预测目标节点的预测目标属性与所述待查询属性相似;
基于所述预测目标节点和所述预测目标属性,确定所述训练节点在所述社区网络中对应的预测社区子图;
根据所述预测社区子图和所述训练节点对应的标签之间的差异,调整所述预测模型的参数,当满足训练停止条件时得到已训练的预测模型。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取社区网络中的训练节点、所述训练节点对应的训练属性和所述训练节点对应的标签;所述社区网络包含各节点和所述各节点对应的属性;
通过预测模型对所述训练节点和所述训练属性进行图卷积处理,获得所述社区网络中的预测目标节点;所述预测目标节点的结构与所述训练节点的结构相关联,所述预测目标节点的预测目标属性与所述待查询属性相似;
基于所述预测目标节点和所述预测目标属性,确定所述训练节点在所述社区网络中对应的预测社区子图;
根据所述预测社区子图和所述训练节点对应的标签之间的差异,调整所述预测模型的参数,当满足训练停止条件时得到已训练的预测模型。
上述预测模型的处理方法、装置、计算机设备和存储介质,通过预测模型对社区网络中的训练节点和训练属性进行图卷积处理,以预测出该社区网络中与训练节点的结构关联、属性相似的目标节点,从而能够结合训练节点与其它节点的结构相关性和属性相似性,预测出训练节点在训练属性下所对应的预测社区子图。通过预测社区子图和标签之间的差异调整预测模型的参数,以提高预测模型的精度和性能,使得训练好的预测模型能够准确快速查询出携带属性的节点在社区网络中对应的社区子图。
附图说明
图1为一个实施例中基于社区网络的社区查询方法的应用环境图;
图2为一个实施例中基于社区网络的社区查询方法的流程示意图;
图3为一个实施例中在社区网络中查询社区子图的原理示意图;
图4为一个实施例中对待查询节点和待查询属性进行图卷积处理的流程示意图;
图5为一个实施例中确定待查询节点与社区网络中的各节点之间的结构特征的流程示意图;
图6为一个实施例中确定查询属性与社区网络中的各节点对应的属性之间的相似特征的流程示意图;
图7为一个实施例中节点和属性的对应关系的示意图;
图8为另一个实施例中基于社区网络的社区查询方法的原理图;
图9为一个实施例中预测模型的处理方法的流程示意图;
图10为一个实施例中预测模型的训练分数的对比示意图;
图11为一个实施例中基于社区网络的社区查询装置的结构框图;
图12为一个实施例中基于社区网络的社区查询装置的结构框图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、图卷积神经网络、深度图卷积神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。本申请实施例提供的方案涉及机器学习的基于社区网络的社区查询方法,具体通过如下各实施例进行说明。
本申请提供的基于社区网络的社区查询方法,可以应用于如图1所示的应用环境中。终端110获取社区网络中的待查询节点和待查询节点对应的待查询属性;该社区网络包含各节点和各节点对应的属性。接着,终端110将待查询节点和待查询属性发送给服务器120。服务器120通过预测模型对待查询节点和待查询属性进行图卷积处理,获得社区网络中目标节点。该目标节点的结构与待查询节点的结构相关联,该目标节点的目标属性与待查询属性相似。接着,服务器120通过预测模型,基于目标节点和目标属性,输出待查询节点在社区网络中对应的社区子图,并将该社区子图返回给终端110。其中,该社区子图包含目标节点和目标属性。终端110接收服务器120返回的该待查询节点在社区网络中对应的社区子图。其中,服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云计算服务的云服务器。终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端110以及服务器120可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
在一个实施例中,该预测模型可运行于终端110上。终端110获取社区网络中的待查询节点和待查询节点对应的待查询属性;该社区网络包含各节点和各节点对应的属性。接着,终端110将待查询节点和待查询属性输入预测模型,通过预测模型对待查询节点和待查询属性进行图卷积处理,获得社区网络中目标节点;该目标节点的结构与待查询节点的结构相关联,该目标节点的目标属性与待查询属性相似。基于目标节点和目标属性,该预测模型输出待查询节点在社区网络中对应的社区子图,该社区子图包含目标节点和目标属性。
在一个实施例中,如图2所示,提供了一种基于社区网络的社区查询方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤202,获取社区网络中的待查询节点和待查询节点对应的待查询属性;该社区网络包含各节点和各节点对应的属性。
其中,社区网络是指以节点和边构成的交互网络,社区网络包括但不限于是社交网络、学术网络、生物信息学领域的网络和化学信息学领域的网络。社交网络具体可以是用户的群关系、活跃群关系、讨论组、收发消息、发表内容(文章、状态、社交图片和视频等)、为他人或内容点赞/评论、发送/接收红包、用户关联地理位置、用户的年龄等数据作为对象所组成的网络。生物信息学领域的网络具体可以是蛋白质交互网络,化学信息学领域的网络具体可以是分子结构网络,但不限于此。
节点是指社区网络中的对象、例如社交网络中的用户为该社交网络中的节点,蛋白质交互网络中的节点即为蛋白质。属性可为节点的特征,例如社交网络中的用户的兴趣爱好作为属性。学术网络中的学者作为节点、学者研究的领域作为学者对应的属性。可以理解的是一个节点可对应多个属性。
具体地,终端可获取待查询节点,该待查询节点即为需要确定社区网络中的社区子图的节点。可以理解的是,该待查询节点为社区网络中的至少一个节点、一个节点可对应至少一个属性。当待查询节点对应一个属性时,终端可确定该一个属性即为待查询属性。当待查询节点对应多个属性时,终端可确定该待查询节点需要查询的属性。
步骤204,对待查询节点和待查询属性进行图卷积处理,获得社区网络中目标节点;该目标节点的结构与待查询节点的结构相关联,该目标节点的目标属性与待查询属性相似。
其中,图卷积处理是指在图上进行卷积处理,可通过图卷积网络(GCN,GraphConvolutional Network),或深度图卷积网络实现。GCN是一种在图上操作的神经网络。
具体地,终端根据社区网络中各节点和各节点对应的属性构造社区网络图,并通过图卷积网络对该社区网络图进行图特征编码处理,得到社区网络对应的特征图。
接着,终端可确定待查询节点与社区网络中的各节点之间的结构特征。并且,终端可确定查询属性与社区网络中的各节点对应的属性之间的相似特征。终端根据社区网络对应的特征图、结构特征和相似特征,确定在该社区网络中结构与待查询节点的结构相关联,且属性与该待查询属性相似的目标节点。
步骤206,基于目标节点和目标属性,确定待查询节点在社区网络中对应的社区子图;其中,该社区子图包含目标节点和目标属性。
具体地,目标节点为社区网络中的至少一个节点,目标节点的结构与待查询节点的结构相关联,目标属性与待查询属性相似。终端确定待查询节点对应的目标节点后,可确定各目标节点和待查询节点在社区网络中的位置,以及各目标节点之间、各目标节点和待查询节点之间的关联关系。根据位置和关联关系确定各目标节点和待查询节点在该社区网络中对应的社区子图,即可得到待查询节点对应的社区子图。该社区网络包含该社区子图。
在一个实施例中,终端将待查询节点、待查询属性,以及社区网络中各节点和对应的属性输入训练好的预测模型。通过预测模型对待查询节点、待查询属性,以及社区网络中各节点和对应的属性进行图卷积处理,确定社区网络中结构与该待查询节点的结构相关联,且属性与待查询属性相似的目标节点。该预测模型输出由该目标节点、目标属性、待查询节点和待查询属性构成的社区子图。
上述基于社区网络的社区查询方法中,通过对社区网络中的待查询节点和待查询属性进行图卷积处理,以获得该社区网络中与待查询节点的结构关联、属性相似的目标节点,从而能够结合待查询节点与其它节点的结构相关性和属性相似性,准确地查询出携带属性的节点在社区网络中的社区子图。并且,通过待查询节点与其它节点的结构相关性和属性相似性,能够准确实现节点的分类、聚类,从而确定分类或聚类的节点在社区网络中的社区子图,通过社区子图直观显示分类或聚类的各节点之间的关联关系。
如图3所示,为一个实施例中在社区网络中查询社区子图的原理图。如图3,该社区网络包含节点1、节点2、节点3、节点4、节点5、节点6、节点7和节点8。属性包括:卷积神经网络(Convolutional Neural Network,简称CNN),图卷积神经网络(Graph ConvolutionalNetwork,简称GCN),图神经网络(Graph Neural Network,简称GNN),计算机视觉(ComputerVision,简称CV),数据挖掘(Data Mining,简称DM)。
具体地,节点1对应的属性为卷积神经网络和图卷积神经网络。节点2对应的属性为计算机视觉。节点3对应的属性为计算机视觉和卷积神经网络。节点4对应的属性为卷积神经网络和计算机视觉。节点5对应的属性为计算机视觉。节点6对应的属性为卷积神经网络和数据挖掘。节点7对应的属性为数据挖掘和图神经网络。节点8对应的属性为数据挖掘和图卷积神经网络。终端需要对社区网络进行两个查询,查询1为查询属性为图神经网络的节点7对应的社区子图,即查询1:<7,图神经网络>。查询2为查询属性为计算机视觉的节点4对应的社区子图,即查询2:<4,计算机视觉>。
终端将对节点7和对应的图神经网络、节点4和对应的计算机视觉、以及社区网络进行图卷积处理,获得节点7对应的目标节点6、8和1。该目标节点6、8、1的结构和节点7的结构相关联,且目标节点6对应的卷积神经网络与节点7的图神经网络相似、目标节点8对应的图卷积神经网络与节点7的图神经网络相似、节点1对应的卷积神经网络、图卷积神经网络与节点7的图神经网络相似,从而得到查询1在该社区网络中对应的社区子图。并且,获得结构与节点4的结构相关联,且属性与计算机视觉相似的目标节点1、6和5,得到查询2在该社区网络中对应的社区子图。
传统的社区查询中,把不同的属性都独立对待,忽略了不同属性之间的相似性和相关性。比如图3中,传统的社区查询中将“图卷积神经网络”和“图神经网络”当作完全不同的属性对待,忽略了两者之间的相似性。而本申请中,通过对社区网络、社区网络中待查询的节点和待查询属性进行图卷积处理,能够根据待查询节点和社区网络中各节点在结构上的相关性,以及待查询属性和社区网络中各节点属性的相似性确定待查询节点对应的社区子图,使得所确定的社区子图更准确,更具备参考价值。
在一个实施例中,如图4所示,对待查询节点和待查询属性进行图卷积处理,获得社区网络中目标节点,包括:
步骤402,通过预测模型的图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,得到社区网络对应的特征图。
其中,预测模型为图卷积网络或深度图卷积网络组成的模型。深度图卷积网络由至少两个图卷积网络构成。预测模型的图卷积网络包括图编码器、结构编码器、特征编码器和特征融合层。
具体地,终端可获取社区网络中包含待查询节点在内的各节点,以及包含待查询属性在内的各节点对应的属性。接着,终端可将社区网络中各节点和各节点对应的属性输入图卷积网络中的图编码器中。图编码器根据各节点和各节点对应的属性构造社区网络图,并对该社区网络图进行图特征编码处理,得到社区网络对应的特征图。
步骤404,通过预测模型的结构编码器确定待查询节点与社区网络中的各节点之间的结构特征。
具体地,终端将待查询节点和社区网络中的各节点输入图卷积网络中的结构编码器。通过结构编码器确定待查询节点和社区网络中各节点的局部拓扑结构,从而得到待查询节点各节点之间的结构特征。
步骤406,通过预测模型的特征编码器确定待查询属性与社区网络中的各节点对应的属性之间的相似特征。
具体地,终端将待查询属性和社区网络中各节点对应的属性输入预测模型的特征编码器。通过特征编码器对待查询属性和社区网络中各节点对应的属性进行特征编码,并确定待查询属性与社区网络中的各节点对应的属性之间的相似特征。
步骤408,根据社区网络对应的特征图、结构特征和相似特征,确定待查询节点在社区网络中对应的目标节点。
具体地,终端将社区网络对应的特征图、结构特征和相似特征输入预测模型的特征融合层,通过特征融合层将特征图、结构特征和相似特征进行融合处理,以将社区网络的全局特征和节点的局部结构特征、属性特征相融合,以进一步提取关键信息,得到融合特征。接着,终端对该融合特征进行分类,以确定各节点是否为与待查询节点结构相关、属性相似的目标节点。
在本实施例中,不限定步骤402至步骤406之间的执行顺序,可同时执行,也可按照顺序执行。
本实施例中,通过图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,能够获得社区网络的全局特征信息。通过结构编码器确定待查询节点与社区网络中的各节点之间的结构特征,能够根据节点之间的结构相关性获得待查询节点和各节点之间相关联的结构特征。根据属性的相似性确定待查询属性和各节点属性之间的相似特征,使得能够结合全局特征信息、结构相关性和属性相似性准确确定待查询节点对应的目标节点,从而准确实现结构相关、属性相似的节点的聚类。
在一个实施例中,通过预测模型的图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,得到社区网络对应的特征图,包括:
通过预测模型的图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,得到图编码器输出的特征图;将预测模型中的上一图编码器输出的特征图和社区网络中各节点,作为下一图编码器的输入,以得到最后一个图编码器输出的社区网络对应的特征图。
具体地,预测模型中包含多个图编码器,终端将社区网络中各节点和各节点对应的属性输入第一个图编码器。通过第一个图编码器构造社区网络图,并对该社区网络图进行图特征编码处理,得到社区网络对应的特征图。从第二个图编码器起,将上一图编码器输出的特征图和社区网络中各节点,作为下一图编码器的输入,直到得到最后一个图编码器输出的社区网络对应的特征图。
进一步地,预测模型由多个图卷积神经网络,即深度图卷积网络构成。终端可社区网络中各节点和各节点对应的属性输入第一个图卷积网络中的图编码器中。图编码器根据各节点和各节点对应的属性构造社区网络图,并对该社区网络图进行图特征编码处理,得到社区网络对应的特征图。接着,终端将第一图卷积网络输出的特征图和社区网络中的各节点,作为第二图卷积网络中的图特征编码器的输入。从第二个图卷积网络起,终端将上一个图卷积网络中的图编码器输出的特征图和社区网络中各节点,作为下一个图卷积网络中的图编码器的输入,以得到最后一个图卷积层网络中的图编码器输出的该社区网络对应的特征图。
在本实施例中,通过预测模型的图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,以获得社区网络的整体信息。将预测模型中的上一图编码器输出的特征图和社区网络中各节点,作为下一图编码器的输入,以得到最后一个图编码器输出的社区网络对应的特征图,从而能够提取出社区网络的全局关键信息。
例如,社区网络可转换为对应的社区网络图,该社区网络图可以定义为G(V,E,F)。其中,V是节点集合,E是边集合,F是属性集合。G(V,E,F)定义了社区网络图中的拓扑关系。A代表社区网络图的邻接矩阵,如果vi,vj之间存在边,则Aij=1,如果不存在,则Aij=0。F表示图中节点的属性的邻接矩阵,对于第k个属性Fk,对于如果vi具有这个属性,那么Fik=1,如果不具备,Fik=0。基于这样的一个社区网络图,对一个查询<Vq,Fq>,查询得到的社区子图而且社区子图中的各节点必须是结构紧凑,且属性相似。
预测模型由图卷积网络或深层图卷积网络构成。预测模型中的图编码器(GraphEncoder)提供了社区网络基于结构和属性信息的全局特征信息。图编码器将输入的特征按照公式(1)进行编码处理:
其中,是当前图编码器输出的社区网络对应的特征图,即预测模型中的第l+1个图编码器输出的社区网络对应的特征图。/>是上一图编码器输出的特征图,预测模型中的第l个图编码器输出的社区网络对应的特征图。/>为权重参数,/>是自我循环参数,/>是归一化后的邻接矩阵A。D为度矩阵,即邻接矩阵对角线上为对应点的度数。σ为激活函数,可以使用ReLU(x)=max(0,x)。b1为常数。
可以理解的是,当当前图编码器为预测模型中的第一个图编码器时,公式(1)中的
在一个实施例中,根据社区网络对应的特征图、结构特征和相似特征,确定待查询节点在社区网络中对应的目标节点,包括:
通过预测模型的特征融合层将社区网络对应的特征图、结构特征和相似特征进行融合处理,得到融合特征;基于融合特征确定待查询节点在社区网络中对应的目标节点。
其中,融合处理是指对社区网络对应的特征图、结构特征和相似特征进行加权融合,或者进行拼接处理,或者进行最大值处理,或均值处理等。
具体地,终端将图编码器输出社区网络对应的特征图、结构编码器输出的结构特征、特征编码器输出的相似特征输入预测模型的特征融合层。通过特征融合层将特征图、结构特征和相似特征进行融合处理。例如,通过特征融合层将特征图、结构特征和相似特征进行拼接处理,或将特征图、结构特征和相似特征进行加权融合处理,或对特征图、结构特征和相似特征进行最大值处理,或对特征图、结构特征和相似特征进行求和,并对求和的结果进行均值处理,得到融合特征。
接着,预测模型对融合特征进行二分类,从而得到待查询节点对应的各目标节点。预测模型基于各目标节点和各目标节点对应的目标属性,确定在社区网络中的社区子图并输出。
例如,终端可通过以下公式(2)进行特征融合:
其中,为第l+1层特征融合层输出的融合特征,/>为第l+1个图编码器输出的特征图,/>为第l+1个结构编码器输出的结构特征,/>为第l+1个特征编码器输出的相似特征。AGG表示对特征进行融合处理,包括但不限于加权融合、拼接、求最大值、均值处理。
在本实施例中,通过预测模型的特征融合层将社区网络对应的特征图、结构特征和相似特征进行融合处理,能够将社区网络的全局特征、待查询节点和各节点之间相关联的结构特征结合起来,从而通过节点的结构相关性和属性特相似性准确查询待查询节点在社区网络中对应的目标节点。
在一个实施例中,如图5所示,通过预测模型的结构编码器确定待查询节点与社区网络中的各节点之间的结构特征,包括:
步骤502,通过预测模型的结构编码器确定待查询节点与社区网络中的各节点之间的距离。
具体地,终端将待查询节点与社区网络中的各节点输入预测模型的第一个结构编码器,并通过第一个结构编码器确定待查询节点与社区网络中的各节点之间的距离。
步骤504,基于待查询节点和社区网络中各节点之间的距离,确定待查询节点与社区网络中的各节点之间相关联的结构特征。
接着,该第一个结构编码器根据待查询节点与社区网络中的各节点之间的距离确定待查询节点的局部拓扑结构,从而得到待查询节点与社区网络中的各节点之间相关联的结构特征。
步骤506,将上一特征融合层输出的融合特征和社区网络中的各节点,作为下一结构编码器的输入,以得到最后一个结构编码器输出的结构特征。
具体地,预测模型中的第一个特征融合层将第一个图编码器输出的社区网络对应的特征图、第一个结构编码器输出的结构特征和第一个特征编码器输出的相似特征进行融合处理,得到第一个特征融合层输出的融合特征。
接着,从第二个结构编码器开始,将社区网络中的各节点和将上一特征融合层输出的融合特征,作为下一结构编码器的输入,以得到最后一个结构编码器输出的结构特征。例如,将社区网络中的各节点和第一个特征融合层输出的融合特征作为第二个结构编码器的输入,根据第二个结构编码器输出的结构特征、第二个特征编码器输出的相似特征和第二个特征图进行融合处理,得到第二个特征融合层输出的融合特征。接着,将社区网络中的各节点和第二个特征融合层输出的融合特征作为第三个结构编码器的输入,以此类推,直至得到最后一个结构编码器输出的结构特征。
结构编码器可通过以下公式(3)(4)对输入的特征进行编码处理,以得到结构特征:
其中,为第l+1个结构编码器输出的结构特征。/>为权重参数,/>为自我循环参数。/>为第l层的距离特征矩阵,当l=0时,/>为待查询节点和社区网络中各节点的距离特征矩阵,b2为常数。dist(vi,Vq)为社区网络中的各节点vi和待查询节点Vq之间的距离,dmax为各节点vi和待查询节点Vq之间的各个距离中的最大值。
在本实施例中,通过待查询节点与各节点之间的距离,能够提取待查询节点和各节点之间相关联的结构特征。通过将上一特征融合层输出的融合特征和各节点作为下一结构编码器的输入,从而结合上一层的整体关键信息进一步提取结构特征的关键信息,使得所获得的结构特征具备更多的信息量。
在一个实施例中,如图6所示,通过预测模型的特征编码器确定查询属性与社区网络中的各节点对应的属性之间的相似特征,包括:
步骤602,通过预测模型的特征编码器,确定社区网络中的各节点对应的属性与待查询属性之间的邻接矩阵。
具体地,终端将社区网络中的各节点对应的属性和待查询属性输入预测模型的第一个特征编码器。第一个特征编码器根据该待查询属性和各节点对应的属性,生成对应的邻接矩阵。
进一步地,第一个特征编码器根据该待查询属性和各节点对应的属性,生成节点-属性的邻接矩阵。接着,终端可将该节点-属性的邻接矩阵进行转置处理,得到属性-节点的邻接矩阵。或者,第一个特征编码器先生成属性-节点的邻接矩阵,对该属性-节点的邻接矩阵进行转置处理,得到节点-属性的邻接矩阵。
步骤604,基于邻接矩阵确定社区网络中的各节点对应的属性与待查询属性之间的相似特征。
具体地,第一个特征编码器基于该节点-属性的邻接矩阵,以及属性-节点的邻接矩阵,确定该待查询属性和各节点对应的属性之间的相似特征,从而得到第一个特征编码器输出的相似特征。
步骤606,将上一特征融合层输出的融合特征和社区网络中的各节点对应的属性,作为下一特征编码器的输入,以得到最后一个特征编码器输出的各节点对应的属性与待查询属性之间的相似特征。
具体地,预测模型中的第一个特征融合层将第一个图编码器输出的社区网络对应的特征图、第一个结构编码器输出的结构特征和第一个特征编码器输出的相似特征进行融合处理,得到第一个特征融合层输出的融合特征。
接着,从第二个特征编码器开始,终端将上一特征融合层输出的融合特征和社区网络中的各节点对应的属性,作为下一特征编码器的输入,直至得到预测模型中的最后一个特征编码器输出的待查询属性和各节点对应的属性之间的相似特征。例如,将社区网络中的各节点和第一个特征融合层输出的融合特征作为第二个特征编码器的输入,根据第二个结构编码器输出的结构特征、第二个特征编码器输出的相似特征和第二个图编码器输出的特征图进行融合处理,得到第二个特征融合层输出的融合特征。接着,将社区网络中的各节点和第二个特征融合层输出的融合特征作为第三个特征编码器的输入,以此类推,直至得到最后一个特征编码器输出的相似特征。
本实施例中,通过待查询属性与各节的属性的邻接矩阵,能够提取待查询属性和各节点属性之间相似的特征。通过将上一特征融合层输出的融合特征和各节点的属性作为下一特征编码器的输入,从而结合上一层的整体关键信息进一步提取相似特征的关键信息,使得所获得的相似特征具备更多的信息量。
在一个实施例中,特征编码器(Attribute Encoder)负责为待查询节点的属性特征Fq提供接口。特征编码器可通过以下公式对输入特征进行编码:
其中,为第l+1个特征编码器输出的相似特征,/>为第l+1个特征编码器的输入特征。BV=F,BV为从节点至属性的邻接矩阵,即节点-属性的邻接矩阵。BF为从属性至节点的邻接矩阵,即属性-节点的邻接矩阵。BF为BV的转置矩阵,即BF=FT。F为社区网络中的各节点的属性。/>为权重参数,/>是自我循环参数。/>为第l+1层特征融合层输出的融合特征。
如图7所示,终端可通过二分图建立邻接矩阵,图7中的节点1、2、3、4、5和6为社区网络中的节点,A、B、C和D为属性。遍历每个节点,确定每个节点分别和各个属性之间的对应关系,以确定节点-属性的邻接矩阵。或者,遍历每个属性,确定每个属性分别和各个节点之间的对应关系,以确定节点-属性的邻接矩阵。对应关系使用如图7中的连接线表示。
在一个实施例中,通过预测模型的特征融合层将社区网络对应的特征图、结构特征和相似特征进行融合处理,得到融合特征,包括:通过预测模型的特征融合层将社区网络对应的特征图、结构特征和相似特征进行拼接处理,得到融合特征。
具体地,终端将图编码器输出的社区网络对应的特征图、结构编码器输出的结构特征,以及特征编码器输出的相似特征输入预测模型的特征融合层。接着,特征融合层将该特征图、结构特征和相似特征进行拼接处理,得到融合特征。进一步地,特征融合层将该特征图、结构特征和相似特征按行或按列进行拼接处理,得到融合特征,从而将全局特征、节点的结构特征和属性的相似特征相结合,进一步提取更准确的特征信息,以筛选处社区网络中的目标节点。
在一个实施例中,该社区网络为社交网络或蛋白质分子交互网络。
具体地,社区网络包括但不限于是社交网络、学术网络、生物信息学领域的网络和化学信息学领域的网络。社交网络具体可以是用户的群关系、活跃群关系、讨论组、收发消息、发表内容(文章、状态、社交图片和视频等)、为他人或内容点赞/评论、发送/接收红包、用户关联地理位置、用户的年龄等数据作为对象所组成的网络。生物信息学领域的网络具体可以是蛋白质交互网络,化学信息学领域的网络具体可以是分子结构网络,但不限于此。
当社区网络为社交网络时,社交网络中的节点可为用户,属性可为用户的兴趣爱好等。当社区网络为蛋白质分子交互网络时,节点为蛋白质分子,属性为蛋白质分子的序列长度、分子量等。当社区网络为学术网络时,节点为学者,属性为各学者研究的领域。
本实施例中,通过将基于社区网络的社区查询方法应用于社交网络,能够根据待查询用户和对应的待查询属性,确定该社交网络中与该待查询用户相关联、且属性相似的目标用户,实现结构相关、属性相似的用户的聚类,并能够从社交网络中准确提取出待查询用户在该待查询属性下对应的社区子图。
通过将基于社区网络的社区查询方法应用于蛋白质分子交互网络,能够根据待查询蛋白质分子和对应的待查询属性,确定该蛋白质分子交互网络中与该待查询蛋白质分子的结构相关联、且属性相似的目标蛋白质分子,实现结构相关、属性相似的蛋白质分子的聚类,并从蛋白质分子交互网络中提取出待查询蛋白质分子在待查询属性下对应的社区子图。
如图8,为一个实施例中基于社区网络的社区查询方法的原理图。如图8所示,预测模型由多个图卷积神经网络构成。
终端获取社区网络中的待查询节点和待查询节点对应的待查询属性,即<Vq,Fq>。该社区网络包含各节点和各节点对应的属性,A是根据社区网络的各节点生成的节点邻接矩阵,F是属性集合。
终端将待查询节点Vq、待查询属性Fq、节点邻接矩阵A和属性集合F输入预测模型的第一层图卷积神经网络。图卷积神经网络中包含图编码器、结构编码器、特征编码器层和特征融合层。
接着,第一层图卷积神经网络中的图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,即对节点邻接矩阵A和属性集合F进行图特征编码处理,得到图编码器输出的特征图
通过第一层图卷积网络中的结构编码器对待查询节点Vq与节点邻接矩阵A进行编码处理,得到结构编码器输出的结构特征。
通过第一层图卷积网络中的特征编码器,对属性集合F与待查询属性Fq进行编码处理,得到特征编码器输出的相似特征。
通过第一层图卷积网络中的特征融合层将社区网络对应的特征图、结构特征和相似特征进行融合处理,得到融合特征
从预测模型的第二层图卷积网络起,将预测模型中的上一图卷积网络中的图编码器输出的特征图和节点邻接矩阵A,作为下一图卷积网络中的图编码器的输入,以得到最后一个图卷积网络中的图编码器输出的社区网络对应的特征图。
将上一图卷积网络中的特征融合层输出的融合特征和节点邻接矩阵A,作为下一图卷积网络中的结构编码器的输入,以得到最后一个图卷积网络中的结构编码器输出的结构特征。
将上一图卷积网络中的特征融合层输出的融合特征和属性集合F,作为下一图卷积网络中的特征编码器的输入,以得到最后一个图卷积网络中的特征编码器输出的各节点对应的属性与待查询属性之间的相似特征。
通过预测模型的最后一图卷积网络中的特征融合层将社区网络对应的特征图、结构特征和相似特征进行融合处理,得到融合特征。
按照相同的处理,得到预测模型的最后一图卷积网络中的最后一特征融合层输出的融合特征。
预测模型基于融合特征确定待查询节点在社区网络中对应的目标节点,该目标节点的结构与待查询节点的结构相关联,该目标节点的目标属性与待查询属性相似。预测模型基于目标节点和目标属性,从社区网络中准确提取出该待查询节点在待查询属性下所对应的社区子图。
在一个实施例中,如图9所示,提供了一种预测模型的处理方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤902,获取社区网络中的训练节点、训练节点对应的训练属性和训练节点对应的标签;该社区网络包含各节点和各节点对应的属性。
其中,标签是指携带训练属性的训练节点在社区网络中对应的社区子图。
具体地,社区网络包含各节点和各节点对应的属性。终端可从社区网络中获取训练节点,该训练节点即为需要确定社区网络中的社区子图的节点。可以理解的是,该训练节点为社区网络中的至少一个节点、一个节点可对应至少一个属性。当训练节点对应一个属性时,终端可确定该一个属性即为训练属性。当训练节点对应多个属性时,终端可确定该训练节点需要查询的属性。该训练属性为训练节点对应的至少一个属性。
步骤904,通过预测模型对训练节点和训练属性进行图卷积处理,获得社区网络中的预测目标节点;该预测目标节点的结构与训练节点的结构相关联,该预测目标节点的预测目标属性与训练属性相似。
具体地,终端将训练节点、训练属性,以及社区网络中各节点和对应的属性输入训练好的预测模型。通过预测模型对训练节点、训练属性,以及社区网络中各节点和对应的属性进行图卷积处理,确定社区网络中结构与该训练节点的结构相关联,且属性与训练属性相似的预测目标节点。则预测得到的预测目标节点的结构与训练节点的结构相关联,该预测目标节点的预测目标属性与训练属性相似。
步骤906,基于预测目标节点和预测目标属性,确定训练节点在社区网络中对应的预测社区子图。
具体地,预测目标节点为社区网络中的至少一个节点,预测目标节点的结构与训练节点的结构相关联,预测目标属性与训练属性相似。终端通过预测模型确定训练节点对应的预测目标节点后,可确定各预测目标节点和训练节点在社区网络中的位置,以及各预测目标节点之间、各预测目标节点和训练节点之间的关联关系。预测模型根据位置和关联关系,确定各预测目标节点和训练节点在该社区网络中对应的社区子图并输出,即可得到训练节点对应的预测社区子图。该社区网络包含该预测社区子图。
步骤908,根据预测社区子图和训练节点对应的标签之间的差异,调整预测模型的参数,当满足训练停止条件时得到已训练的预测模型。
具体地,终端将预测模型输出的预测社区子图和训练节点对应的标签进行对比,确定两者之间的差异。并根据两者之间的差异调整该预测模型的参数并继续训练,直到满足训练停止条件时停止训练,得到训练好的预测模型。
在本实施例中,训练停止条件为训练节点对应的预测社区子图和对应的标签之间的差异小于预设差异。或者训练停止条件为预测模型输出的损失值小于损失阈值。当训练节点对应的预测社区子图和对应的标签之间的差异小于预设差异,或者训练停止条件为预测模型输出的损失值小于或等于损失阈值时,停止训练,得到训练好的预测模型。
在本实施例中,通过预测模型对社区网络中的训练节点和训练属性进行图卷积处理,以预测出该社区网络中与训练节点的结构关联、属性相似的目标节点,从而能够结合训练节点与其它节点的结构相关性和属性相似性,预测出训练节点在训练属性下所对应的预测社区子图。通过预测社区子图和标签之间的差异调整预测模型的参数,以提高预测模型的精度和性能,使得训练好的预测模型能够准确快速查询出携带属性的节点在社区网络中对应的社区子图。
并且,通过训练好的预测模型,能够基于节点的结构相关性和属性相似性,准确实现节点的分类、聚类,从而确定分类或聚类的节点在社区网络中的社区子图,通过社区子图直观显示分类或聚类的各节点之间的关联关系。
在一个实施例中,根据预测社区子图和训练节点对应的标签之间的差异,调整预测模型的参数,包括:
获取损失函数,根据损失函数、预测社区子图和训练节点对应的标签,确定预测模型的损失值;当损失值大于损失阈值时,调整预测模型的参数并继续训练;当损失值小于或等于损失阈值时停止训练,得到已训练的预测模型。
具体地,终端获取预测模型对应的损失函数,将预测社区子图和对应的标签代入该损失函数,得到预测模型对应的损失值。接着,终端获取损失阈值,将预测模型对应的损失值和损失阈值进行对比。当损失值大于损失阈值时,表示预测模型损失的特征较多,预测不准确,则终端调整预测模型的参数,并对调整参数后的预测模型继续进行训练。当预测模型对应的损失值小于或等于损失阈值时停止训练,得到训练好的预测模型。
在本实施例中,通过损失函数确定预测模型在每次训练中所产生的损失值,从而根据损失值和损失阈值之间的差异调整模型参数并继续训练,以提高模型预测的准确性和精度。
预测模型的损失函数如下:
其中,yq是一个n维向量,代表着第q个待查询节点和待查询属性对应的真实社区子图,即第q个查询对应的标签。yq只能有0和1两种取值。例如,yqi=1,代表第i个节点为待查询节点对应的目标节点。zq也是一个n维向量, 为预测模型的最后一层特征融合层输出的融合特征。zqi代表第q个查询中,社区网络中的第i个节点属于社区子图的概率。
在一个实施例中,根据预测社区子图和训练节点对应的标签之间的差异,调整预测模型的参数,包括:根据预测社区子图和训练节点对应的标签,确定预测模型的预测准确率;根据预测社区子图和训练节点对应的标签,确定预测模型的预测召回率;根据预测准确率和预测召回率,调整预测模型的参数。
其中,预测准确率是指预测模型预测正确的社区子图的数量和预测的总数量的占比,即预测正确的和预测总数的占比。预测召回率是指预测正确的社区子图的数量和标签集合中的标签总数量的占比,即预测正确的和标签总数的占比。
具体地,终端可确定预测模型输出的各预测社区子图的总数量,并确定该总数量中预测正确的社区子图的数量。终端计算预测正确的社区子图的数量和预测的总数量的占比,得到预测模型的预测准确率。
接着,终端可确定标签集合中的标签的总数量,并确定预测正确的社区子图的数量和标签的总数量的占比,得到预测模型的预测召回率。接着,终端根据预测准确率和预测召回率确定预测模型的训练分数。终端可根据训练分数和分数阈值之间的差异调整预测模型的参数并继续训练,当训练分数大于或等于分数阈值时停止训练,得到训练好的预测模型。
本实施例中,通过计算确定预测模型的预测准确率和预测召回率,确定预测模型训练的分数,根据训练分数和分数阈值之间的差异调整模型参数并继续训练,以提高模型预测的准确性和精度。
在一个实施例中,终端可通过以下公式计算预测模型的预测准确率和预测召回率:
其中,pre(Z,Y)是预测模型的预测准确率,rec(Z,Y)是预测模型的预测召回率。zq为预测社区子图,yq为标签。Z={z1,z2,....}是预测社区子图的集合,Y={y1,y2,....}是标签的集合。
其中,F1(Z,Y)为训练分数。
在一个实施例中,提供了ATC算法(attributed truss community)对模型进行训练后得到的分数。将使用该ATC算法的预测模型对应的分数和使用本方案的预测模型得到的训练分数F1(Z,Y)进行对比,结果如下表:
预测模型使用的算法 | 平均分数F1 |
本方案 | 0.7452 |
ATC | 0.3996 |
平均分数越高,模型预测越准确。从该表中可看出,本方案可以显著提高模型的预测准确率。
在一个实施例中,预测模型中的图编码器、结构编码器、特征编码器和特征融合层不能任意减少。如图10所示,提供了包含图编码器、结构编码器、特征编码器和特征融合层的预测模型的训练分数,以及分别缺少其中一个结构之后的预测模型所对应的训练分数。从图中可看出,在相同的训练数据集中,例如在数据集A中,数据集B中,完整的预测模型的训练分数最高,缺少其中一个结构之后的预测模型所得到的训练分数明显低于完整的预测模型。
从不同的数据集来看,例如数据集A、数据集B、数据集C均可以看出,完整的预测模型的训练分数均高于缺少任一结构的预测模型的训练分数。由此可知,包含图编码器、结构编码器、特征编码器和特征融合层的预测模型能够对不同的数据集进行处理,并且训练好的预测模型的精度和准确性均能达到要求。
在一个实施例中,提供了一种基于社区网络的社区查询方法,包括:
终端获取社区网络中的待查询节点和待查询节点对应的待查询属性;社区网络包含各节点和各节点对应的属性。
接着,终端通过预测模型的第一层图卷积网络中的图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,得到图编码器输出的特征图。
终端通过第一层图卷积网络中的结构编码器确定待查询节点与社区网络中的各节点之间的距离。
并且,终端通过该结构编码器,基于待查询节点和社区网络中各节点之间的距离,确定待查询节点与社区网络中的各节点之间相关联的结构特征。
并且,终端通过第一层图卷积网络中的特征编码器,确定社区网络中的各节点对应的属性与待查询属性之间的邻接矩阵。
并且,终端通过该特征编码器,基于邻接矩阵确定社区网络中的各节点对应的属性与待查询属性之间的相似特征。
进一步地,终端通过第一层图卷积网络中的特征融合层将社区网络对应的特征图、结构特征和相似特征进行融合处理,得到融合特征。
进一步地,从预测模型的第二层图卷积网络起,将预测模型中的上一图卷积网络中的图编码器输出的特征图和社区网络中各节点,作为下一图卷积网络中的图编码器的输入,以得到最后一个图卷积网络中的图编码器输出的社区网络对应的特征图。
接着,终端将上一图卷积网络中的特征融合层输出的融合特征和社区网络中的各节点,作为下一图卷积网络中的结构编码器的输入,以得到最后一个图卷积网络中的结构编码器输出的结构特征。
接着,终端将上一图卷积网络中的特征融合层输出的融合特征和社区网络中的各节点对应的属性,作为下一图卷积网络中的特征编码器的输入,以得到最后一个图卷积网络中的特征编码器输出的各节点对应的属性与待查询属性之间的相似特征。
进一步地,终端通过预测模型的最后一图卷积网络中的特征融合层将社区网络对应的特征图、结构特征和相似特征进行融合处理,得到融合特征。
接着,终端基于融合特征确定待查询节点在社区网络中对应的目标节点。该目标节点的结构与待查询节点的结构相关联,该目标节点的目标属性与待查询属性相似。
进一步地,终端基于目标节点和目标属性,确定待查询节点在社区网络中对应的社区子图;其中,该社区子图包含目标节点和目标属性。
在本实施例中,通过预测模型的图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,能够获得社区网络的全局特征信息。通过结构编码器确定待查询节点与社区网络中的各节点之间的结构特征,能够根据节点之间的结构相关性获得待查询节点和各节点之间相关联的结构特征。根据属性的相似性确定待查询属性和各节点属性之间的相似特征,使得能够结合全局特征信息、结构相关性和属性相似性准确确定待查询节点对应的目标节点,从而准确实现结构相关、属性相似的节点的聚类。
获得该社区网络中与待查询节点的结构关联、属性相似的目标节点,能够结合待查询节点与其它节点的结构相关性和属性相似性,准确地查询出携带属性的节点在社区网络中的社区子图。并且,通过待查询节点与其它节点的结构相关性和属性相似性,能够准确实现节点的分类、聚类,从而确定分类或聚类的节点在社区网络中的社区子图,通过社区子图直观显示分类或聚类的各节点之间的关联关系。
应该理解的是,虽然图2-图10的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图10中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图11所示,提供了一种基于社区网络的社区查询装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:第一获取模块1102、第一处理模块1104和确定模块1106,其中:
第一获取模块1102,用于获取社区网络中的待查询节点和待查询节点对应的待查询属性;该社区网络包含各节点和各节点对应的属性。
第一处理模块1104,用于对待查询节点和待查询属性进行图卷积处理,获得社区网络中目标节点;目标节点的结构与待查询节点的结构相关联,目标节点的目标属性与待查询属性相似。
确定模块1106,用于基于目标节点和目标属性,确定待查询节点在社区网络中对应的社区子图;其中,该社区子图包含目标节点和目标属性。
上述基于社区网络的社区查询装置中,通过对社区网络中的待查询节点和待查询属性进行图卷积处理,以获得该社区网络中与待查询节点的结构关联、属性相似的目标节点,从而能够结合待查询节点与其它节点的结构相关性和属性相似性,准确地查询出携带属性的节点在社区网络中的社区子图。并且,通过待查询节点与其它节点的结构相关性和属性相似性,能够准确实现节点的分类、聚类,从而确定分类或聚类的节点在社区网络中的社区子图,通过社区子图直观显示分类或聚类的各节点之间的关联关系。
在一个实施例中,该第一处理模块1104还用于:通过预测模型的图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,得到社区网络对应的特征图;通过预测模型的结构编码器确定待查询节点与社区网络中的各节点之间的结构特征;通过预测模型的特征编码器确定查询属性与社区网络中的各节点对应的属性之间的相似特征;根据社区网络对应的特征图、结构特征和相似特征,确定待查询节点在社区网络中对应的目标节点。
本实施例中,通过图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,能够获得社区网络的全局特征信息。通过结构编码器确定待查询节点与社区网络中的各节点之间的结构特征,能够根据节点之间的结构相关性获得待查询节点和各节点之间相关联的结构特征。根据属性的相似性确定待查询属性和各节点属性之间的相似特征,使得能够结合全局特征信息、结构相关性和属性相似性准确确定待查询节点对应的目标节点,从而准确实现结构相关、属性相似的节点的聚类。
在一个实施例中,该第一处理模块1104还用于:通过预测模型的图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,得到图编码器输出的特征图;将预测模型中的上一图编码器输出的特征图和社区网络中各节点,作为下一图编码器的输入,以得到最后一个图编码器输出的社区网络对应的特征图。
在本实施例中,通过预测模型的图编码器对社区网络中各节点和各节点对应的属性进行图特征编码处理,以获得社区网络的整体信息。将预测模型中的上一图编码器输出的特征图和社区网络中各节点,作为下一图编码器的输入,以得到最后一个图编码器输出的社区网络对应的特征图,从而能够提取出社区网络的全局关键信息。
在一个实施例中,该第一处理模块1104还用于:通过预测模型的特征融合层将社区网络对应的特征图、结构特征和相似特征进行融合处理,得到融合特征;基于融合特征确定待查询节点在社区网络中对应的目标节点。
在本实施例中,通过预测模型的特征融合层将社区网络对应的特征图、结构特征和相似特征进行融合处理,能够将社区网络的全局特征、待查询节点和各节点之间相关联的结构特征结合起来,从而通过节点的结构相关性和属性特相似性准确查询待查询节点在社区网络中对应的目标节点。
在一个实施例中,该第一处理模块1104还用于:通过预测模型的结构编码器确定待查询节点与社区网络中的各节点之间的距离;基于待查询节点和社区网络中各节点之间的距离,确定待查询节点与社区网络中的各节点之间相关联的结构特征;将上一特征融合层输出的融合特征和社区网络中的各节点,作为下一结构编码器的输入,以得到最后一个结构编码器输出的结构特征。
在本实施例中,通过待查询节点与各节点之间的距离,能够提取待查询节点和各节点之间相关联的结构特征。通过将上一特征融合层输出的融合特征和各节点作为下一结构编码器的输入,从而结合上一层的整体关键信息进一步提取结构特征的关键信息,使得所获得的结构特征具备更多的信息量。
在一个实施例中,该第一处理模块1104还用于:通过预测模型的特征编码器,确定社区网络中的各节点对应的属性与待查询属性之间的邻接矩阵;基于邻接矩阵确定社区网络中的各节点对应的属性与待查询属性之间的相似特征;将上一特征融合层输出的融合特征和社区网络中的各节点对应的属性,作为下一特征编码器的输入,以得到最后一个特征编码器输出的各节点对应的属性与待查询属性之间的相似特征。
本实施例中,通过待查询属性与各节的属性的邻接矩阵,能够提取待查询属性和各节点属性之间相似的特征。通过将上一特征融合层输出的融合特征和各节点的属性作为下一特征编码器的输入,从而结合上一层的整体关键信息进一步提取相似特征的关键信息,使得所获得的相似特征具备更多的信息量。
在一个实施例中,该第一处理模块1104还用于:通过预测模型的特征融合层将社区网络对应的特征图、结构特征和相似特征进行拼接处理,得到融合特征。
本实施例中,将该特征图、结构特征和相似特征按行或按列进行拼接处理,得到融合特征,从而将全局特征、节点的结构特征和属性的相似特征相结合,进一步提取更准确的特征信息,以筛选处社区网络中的目标节点。
在一个实施例中,该社区网络为社交网络或蛋白质分子交互网络。通过将基于社区网络的社区查询方法应用于社交网络,能够根据待查询用户和对应的待查询属性,确定该社交网络中与该待查询用户相关联、且属性相似的目标用户,实现结构相关、属性相似的用户的聚类,并能够从社交网络中准确提取出待查询用户在该待查询属性下对应的社区子图。
通过将基于社区网络的社区查询方法应用于蛋白质分子交互网络,能够根据待查询蛋白质分子和对应的待查询属性,确定该蛋白质分子交互网络中与该待查询蛋白质分子的结构相关联、且属性相似的目标蛋白质分子,实现结构相关、属性相似的蛋白质分子的聚类,并从蛋白质分子交互网络中提取出待查询蛋白质分子在待查询属性下对应的社区子图。
关于基于社区网络的社区查询装置的具体限定可以参见上文中对于基于社区网络的社区查询方法的限定,在此不再赘述。上述基于社区网络的社区查询装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,如图12所示,提供了一种预测模型的处理装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:第二获取模块1202、第二处理模块1204、预测模块120和调整模块1208。其中,
第二获取模块1202,用于获取社区网络中的训练节点、训练节点对应的训练属性和训练节点对应的标签;该社区网络包含各节点和各节点对应的属性。
第二处理模块1204,用于通过预测模型对训练节点和训练属性进行图卷积处理,获得社区网络中的预测目标节点;该预测目标节点的结构与训练节点的结构相关联,该预测目标节点的预测目标属性与训练属性相似。
预测模块1206,用于基于预测目标节点和预测目标属性,确定训练节点在社区网络中对应的预测社区子图。
调整模块1208,用于根据预测社区子图和训练节点对应的标签之间的差异,调整预测模型的参数,当满足训练停止条件时得到已训练的预测模型。
在本实施例中,通过预测模型对社区网络中的训练节点和训练属性进行图卷积处理,以预测出该社区网络中与训练节点的结构关联、属性相似的目标节点,从而能够结合训练节点与其它节点的结构相关性和属性相似性,预测出训练节点在训练属性下所对应的预测社区子图。通过预测社区子图和标签之间的差异调整预测模型的参数,以提高预测模型的精度和性能,使得训练好的预测模型能够准确快速查询出携带属性的节点在社区网络中对应的社区子图。
并且,通过训练好的预测模型,能够基于节点的结构相关性和属性相似性,准确实现节点的分类、聚类,从而确定分类或聚类的节点在社区网络中的社区子图,通过社区子图直观显示分类或聚类的各节点之间的关联关系。
在一个实施例中,该调整模块1208还用于:获取损失函数,根据损失函数、预测社区子图和训练节点对应的标签,确定预测模型的损失值;当损失值大于损失阈值时,调整预测模型的参数并继续训练;当损失值小于或等于损失阈值时停止训练,得到已训练的预测模型。
在本实施例中,通过损失函数确定预测模型在每次训练中所产生的损失值,从而根据损失值和损失阈值之间的差异调整模型参数并继续训练,以提高模型预测的准确性和精度。
在一个实施例中,该调整模块1208还用于:根据预测社区子图和训练节点对应的标签,确定预测模型的预测准确率;根据预测社区子图和训练节点对应的标签,确定预测模型的预测召回率;根据预测准确率和预测召回率,调整预测模型的参数。
本实施例中,通过计算确定预测模型的预测准确率和预测召回率,确定预测模型训练的分数,根据训练分数和分数阈值之间的差异调整模型参数并继续训练,以提高模型预测的准确性和精度。
关于预测模型的处理装置的具体限定可以参见上文中对于预测模型的处理方法的限定,在此不再赘述。上述预测模型的处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图13所示。该计算机设备包括通过***总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种基于社区网络的社区查询方法和预测模型的处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (22)
1.一种基于社区网络的社区查询方法,其特征在于,所述方法包括:
获取社区网络中的待查询节点和所述待查询节点对应的待查询属性;所述社区网络包含各节点和所述各节点对应的属性,所述社区网络包括社交网络,所述节点表征所述社交网络中的用户,所述属性表征所述用户的特征;
通过预测模型的图编码器对所述社区网络中各节点和所述各节点对应的属性进行图特征编码处理,得到所述社区网络对应的特征图;
通过所述预测模型的结构编码器确定所述待查询节点与所述社区网络中的各节点之间的结构特征;
通过所述预测模型的特征编码器确定所述待查询属性与所述社区网络中的各节点对应的属性之间的相似特征;
根据所述社区网络对应的特征图、所述结构特征和所述相似特征,确定所述待查询节点在所述社区网络中对应的目标节点;所述目标节点的结构与所述待查询节点的结构相关联,所述目标节点的目标属性与所述待查询属性相似;
基于所述目标节点和所述目标属性,确定所述待查询节点在所述社区网络中对应的社区子图;
其中,所述社区子图包含所述目标节点和所述目标属性。
2.根据权利要求1所述的方法,其特征在于,所述通过预测模型的图编码器对所述社区网络中各节点和所述各节点对应的属性进行图特征编码处理,得到所述社区网络对应的特征图,包括:
通过预测模型的图编码器对所述社区网络中各节点和所述各节点对应的属性进行图特征编码处理,得到所述图编码器输出的特征图;
将所述预测模型中的上一图编码器输出的特征图和所述社区网络中各节点,作为下一图编码器的输入,以得到最后一个图编码器输出的所述社区网络对应的特征图。
3.根据权利要求1所述的方法,其特征在于,所述根据所述社区网络对应的特征图、所述结构特征和所述相似特征,确定所述待查询节点在所述社区网络中对应的目标节点,包括:
通过所述预测模型的特征融合层将所述社区网络对应的特征图、所述结构特征和所述相似特征进行融合处理,得到融合特征;
基于所述融合特征确定所述待查询节点在所述社区网络中对应的目标节点。
4.根据权利要求3所述的方法,其特征在于,所述通过所述预测模型的结构编码器确定所述待查询节点与所述社区网络中的各节点之间的结构特征,包括:
通过所述预测模型的结构编码器确定所述待查询节点与所述社区网络中的各节点之间的距离;
基于所述待查询节点和所述社区网络中各节点之间的距离,确定所述待查询节点与所述社区网络中的各节点之间相关联的结构特征;
将上一特征融合层输出的融合特征和所述社区网络中的各节点,作为下一结构编码器的输入,以得到最后一个结构编码器输出的结构特征。
5.根据权利要求3所述的方法,其特征在于,所述通过所述预测模型的特征编码器确定所述查询属性与所述社区网络中的各节点对应的属性之间的相似特征,包括:
通过所述预测模型的特征编码器,确定所述社区网络中的各节点对应的属性与所述待查询属性之间的邻接矩阵;
基于所述邻接矩阵确定所述社区网络中的各节点对应的属性与所述待查询属性之间的相似特征;
将上一特征融合层输出的融合特征和所述社区网络中的各节点对应的属性,作为下一特征编码器的输入,以得到最后一个特征编码器输出的所述各节点对应的属性与所述待查询属性之间的相似特征。
6.根据权利要求3所述的方法,其特征在于,所述通过所述预测模型的特征融合层将所述社区网络对应的特征图、所述结构特征和所述相似特征进行融合处理,得到融合特征,包括:
通过所述预测模型的特征融合层将所述社区网络对应的特征图、所述结构特征和所述相似特征进行拼接处理,得到融合特征。
7.根据权利要求1所述的方法,其特征在于,所述社区网络还包括蛋白质分子交互网络,所述节点表征所述蛋白质分子交互网络中的蛋白质分子,所述属性表征所述蛋白质分子的特征。
8.一种预测模型的处理方法,其特征在于,所述方法包括:
获取社区网络中的训练节点、所述训练节点对应的训练属性和所述训练节点对应的标签;所述社区网络包含各节点和所述各节点对应的属性,所述标签表征携带所述训练属性的训练节点在所述社区网络中对应的社区子图,所述社区网络包括社交网络,所述训练节点表征所述社交网络中的用户,所述属性表征所述用户的特征;
通过预测模型的图编码器对所述社区网络中各节点和所述各节点对应的属性进行图特征编码处理,得到所述社区网络对应的特征图;
通过所述预测模型的结构编码器确定所述训练节点与所述社区网络中的各节点之间的结构特征;
通过所述预测模型的特征编码器确定所述训练属性与所述社区网络中的各节点对应的属性之间的相似特征;
根据所述社区网络对应的特征图、所述结构特征和所述相似特征,确定所述训练节点在所述社区网络中对应的预测目标节点;所述预测目标节点的结构与所述训练节点的结构相关联,所述预测目标节点的预测目标属性与所述训练属性相似;
基于所述预测目标节点和所述预测目标属性,确定所述训练节点在所述社区网络中对应的预测社区子图;
根据所述预测社区子图和所述训练节点对应的标签之间的差异,调整所述预测模型的参数,当满足训练停止条件时得到已训练的预测模型。
9.根据权利要求8所述的方法,其特征在于,所述根据所述预测社区子图和所述训练节点对应的标签之间的差异,调整所述预测模型的参数,包括:
获取损失函数,根据所述损失函数、所述预测社区子图和所述训练节点对应的标签,确定所述预测模型的损失值;
当所述损失值大于损失阈值时,调整所述预测模型的参数并继续训练;
当所述损失值小于或等于所述损失阈值时停止训练,得到已训练的预测模型。
10.根据权利要求8所述的方法,其特征在于,所述根据所述预测社区子图和所述训练节点对应的标签之间的差异,调整所述预测模型的参数,包括:
根据所述预测社区子图和所述训练节点对应的标签,确定所述预测模型的预测准确率;
根据所述预测社区子图和所述训练节点对应的标签,确定所述预测模型的预测召回率;
根据所述预测准确率和所述预测召回率,调整所述预测模型的参数。
11.一种基于社区网络的社区查询装置,其特征在于,所述装置包括:
第一获取模块,用于获取社区网络中的待查询节点和所述待查询节点对应的待查询属性;所述社区网络包含各节点和所述各节点对应的属性,所述社区网络包括社交网络,所述节点表征所述社交网络中的用户,所述属性表征所述用户的特征;
第一处理模块,用于通过预测模型的图编码器对所述社区网络中各节点和所述各节点对应的属性进行图特征编码处理,得到所述社区网络对应的特征图;通过所述预测模型的结构编码器确定所述待查询节点与所述社区网络中的各节点之间的结构特征;通过所述预测模型的特征编码器确定所述待查询属性与所述社区网络中的各节点对应的属性之间的相似特征;根据所述社区网络对应的特征图、所述结构特征和所述相似特征,确定所述待查询节点在所述社区网络中对应的目标节点;所述目标节点的结构与所述待查询节点的结构相关联,所述目标节点的目标属性与所述待查询属性相似;
确定模块,用于基于所述目标节点和所述目标属性,确定所述待查询节点在所述社区网络中对应的社区子图;
其中,所述社区子图包含所述目标节点和所述目标属性。
12.根据权利要求11所述的装置,其特征在于,所述第一处理模块,还用于通过预测模型的图编码器对所述社区网络中各节点和所述各节点对应的属性进行图特征编码处理,得到所述图编码器输出的特征图;将所述预测模型中的上一图编码器输出的特征图和所述社区网络中各节点,作为下一图编码器的输入,以得到最后一个图编码器输出的所述社区网络对应的特征图。
13.根据权利要求11所述的装置,其特征在于,所述第一处理模块,还用于通过所述预测模型的特征融合层将所述社区网络对应的特征图、所述结构特征和所述相似特征进行融合处理,得到融合特征;基于所述融合特征确定所述待查询节点在所述社区网络中对应的目标节点。
14.根据权利要求13所述的装置,其特征在于,所述第一处理模块,还用于通过所述预测模型的结构编码器确定所述待查询节点与所述社区网络中的各节点之间的距离;基于所述待查询节点和所述社区网络中各节点之间的距离,确定所述待查询节点与所述社区网络中的各节点之间相关联的结构特征;将上一特征融合层输出的融合特征和所述社区网络中的各节点,作为下一结构编码器的输入,以得到最后一个结构编码器输出的结构特征。
15.根据权利要求13所述的装置,其特征在于,所述第一处理模块,还用于通过所述预测模型的特征编码器,确定所述社区网络中的各节点对应的属性与所述待查询属性之间的邻接矩阵;基于所述邻接矩阵确定所述社区网络中的各节点对应的属性与所述待查询属性之间的相似特征;将上一特征融合层输出的融合特征和所述社区网络中的各节点对应的属性,作为下一特征编码器的输入,以得到最后一个特征编码器输出的所述各节点对应的属性与所述待查询属性之间的相似特征。
16.根据权利要求13所述的装置,其特征在于,所述第一处理模块,还用于通过所述预测模型的特征融合层将所述社区网络对应的特征图、所述结构特征和所述相似特征进行拼接处理,得到融合特征。
17.根据权利要求11所述的装置,其特征在于,所述社区网络还包括蛋白质分子交互网络,所述节点表征所述蛋白质分子交互网络中的蛋白质分子,所述属性表征所述蛋白质分子的特征。
18.一种预测模型的处理装置,其特征在于,所述装置包括:
第二获取模块,用于获取社区网络中的训练节点、所述训练节点对应的训练属性和所述训练节点对应的标签;所述社区网络包含各节点和所述各节点对应的属性,所述标签表征携带所述训练属性的训练节点在所述社区网络中对应的社区子图,所述社区网络包括社交网络,所述训练节点表征所述社交网络中的用户,所述属性表征所述用户的特征;
第二处理模块,用于通过预测模型的图编码器对所述社区网络中各节点和所述各节点对应的属性进行图特征编码处理,得到所述社区网络对应的特征图;通过所述预测模型的结构编码器确定所述训练节点与所述社区网络中的各节点之间的结构特征;通过所述预测模型的特征编码器确定所述训练属性与所述社区网络中的各节点对应的属性之间的相似特征;根据所述社区网络对应的特征图、所述结构特征和所述相似特征,确定所述训练节点在所述社区网络中对应的预测目标节点;所述预测目标节点的结构与所述训练节点的结构相关联,所述预测目标节点的预测目标属性与所述训练属性相似;
预测模块,用于基于所述预测目标节点和所述预测目标属性,确定所述训练节点在所述社区网络中对应的预测社区子图;
调整模块,用于根据所述预测社区子图和所述训练节点对应的标签之间的差异,调整所述预测模型的参数,当满足训练停止条件时得到已训练的预测模型。
19.根据权利要求18所述的装置,其特征在于,所述调整模块,还用于获取损失函数,根据所述损失函数、所述预测社区子图和所述训练节点对应的标签,确定所述预测模型的损失值;当所述损失值大于损失阈值时,调整所述预测模型的参数并继续训练;当所述损失值小于或等于所述损失阈值时停止训练,得到已训练的预测模型。
20.根据权利要求18所述的装置,其特征在于,所述调整模块,还用于根据所述预测社区子图和所述训练节点对应的标签,确定所述预测模型的预测准确率;根据所述预测社区子图和所述训练节点对应的标签,确定所述预测模型的预测召回率;根据所述预测准确率和所述预测召回率,调整所述预测模型的参数。
21.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。
22.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011072391.XA CN112131261B (zh) | 2020-10-09 | 2020-10-09 | 基于社区网络的社区查询方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011072391.XA CN112131261B (zh) | 2020-10-09 | 2020-10-09 | 基于社区网络的社区查询方法、装置和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112131261A CN112131261A (zh) | 2020-12-25 |
CN112131261B true CN112131261B (zh) | 2024-02-09 |
Family
ID=73843917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011072391.XA Active CN112131261B (zh) | 2020-10-09 | 2020-10-09 | 基于社区网络的社区查询方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112131261B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113011282A (zh) * | 2021-02-26 | 2021-06-22 | 腾讯科技(深圳)有限公司 | 图数据处理方法、装置、电子设备及计算机存储介质 |
CN113746809B (zh) * | 2021-08-12 | 2023-07-07 | 广州分布式软件有限责任公司 | 基于大数据和智慧城市的网络节点安全性验证方法 |
CN115827996B (zh) * | 2023-02-27 | 2023-05-02 | 杭州电子科技大学 | 一种具有共享约束的社区查询方法及*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106960390A (zh) * | 2017-01-03 | 2017-07-18 | 上海大学 | 基于节点聚合度的重叠社区划分方法 |
CN107273934A (zh) * | 2017-06-28 | 2017-10-20 | 电子科技大学 | 一种基于属性融合的图聚类方法 |
CN108022171A (zh) * | 2016-10-31 | 2018-05-11 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及设备 |
CN111597401A (zh) * | 2020-05-20 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 基于图关系网络的数据处理方法、装置、设备及介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9710544B1 (en) * | 2016-05-19 | 2017-07-18 | Quid, Inc. | Pivoting from a graph of semantic similarity of documents to a derivative graph of relationships between entities mentioned in the documents |
EP3583522A4 (en) * | 2017-02-17 | 2020-12-30 | Kyndi, Inc. | METHOD AND DEVICE FOR MACHINE LEARNING USING A NETWORK WITH SOFTWARE AGENTS AT THE NETWORK NODES AND THE FOLLOWING SERIES OF NETWORK NODES |
JP7026973B2 (ja) * | 2018-08-23 | 2022-03-01 | 国立研究開発法人物質・材料研究機構 | 探索システムおよび探索方法 |
-
2020
- 2020-10-09 CN CN202011072391.XA patent/CN112131261B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108022171A (zh) * | 2016-10-31 | 2018-05-11 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及设备 |
CN106960390A (zh) * | 2017-01-03 | 2017-07-18 | 上海大学 | 基于节点聚合度的重叠社区划分方法 |
CN107273934A (zh) * | 2017-06-28 | 2017-10-20 | 电子科技大学 | 一种基于属性融合的图聚类方法 |
CN111597401A (zh) * | 2020-05-20 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 基于图关系网络的数据处理方法、装置、设备及介质 |
Non-Patent Citations (3)
Title |
---|
Detecting community in attributed networks by dynamically exploring node attributes and topological structure;Qiang Wang等;《Knowledge-based systems》;第196卷;1-7 * |
Query driven-graph neural networks for community search: from non-attributed,attributed,to interactive attributed;Yu Rong等;《Databases(第2期);1-9 * |
基于语义的蛋白质复合物识别算法的研究与应用;刘杰;《中国优秀硕士学位论文全文数据库 基础科学辑》;A006-190 * |
Also Published As
Publication number | Publication date |
---|---|
CN112131261A (zh) | 2020-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qi et al. | Finding all you need: web APIs recommendation in web of things through keywords search | |
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
WO2020211566A1 (zh) | 一种用户推荐方法和装置以及计算设备和存储介质 | |
CN111931062B (zh) | 一种信息推荐模型的训练方法和相关装置 | |
CN112131261B (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
CN110837602B (zh) | 基于表示学习和多模态卷积神经网络的用户推荐方法 | |
CN107657015B (zh) | 一种兴趣点推荐方法、装置、电子设备及存储介质 | |
Wang et al. | NEIWalk: Community discovery in dynamic content-based networks | |
CN108288067A (zh) | 图像文本匹配模型的训练方法、双向搜索方法及相关装置 | |
May Petry et al. | MARC: a robust method for multiple-aspect trajectory classification via space, time, and semantic embeddings | |
WO2021203854A1 (zh) | 用户分类方法、装置、计算机设备和存储介质 | |
CN110515986B (zh) | 一种社交网络图的处理方法、装置及存储介质 | |
CN111949886B (zh) | 一种用于信息推荐的样本数据生成方法和相关装置 | |
CN113343091A (zh) | 面向产业和企业的科技服务推荐计算方法、介质及程序 | |
CN110321492A (zh) | 一种基于社区信息的项目推荐方法及*** | |
CN112258250A (zh) | 基于网络热点的目标用户识别方法、装置和计算机设备 | |
Salehi et al. | Attribute-based recommender system for learning resource by learner preference tree | |
CN110262906B (zh) | 接口标签推荐方法、装置、存储介质和电子设备 | |
CN116703531A (zh) | 物品数据处理方法、装置、计算机设备和存储介质 | |
CN112445899A (zh) | 一种基于神经网络的知识库问答中的属性匹配方法 | |
CN116957128A (zh) | 业务指标预测方法、装置、设备和存储介质 | |
Liu | POI recommendation model using multi-head attention in location-based social network big data | |
CN113822291A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN115455306B (zh) | 推送模型训练、信息推送方法、装置和存储介质 | |
CN116702784B (zh) | 实体链接方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |