CN117113240A - 动态网络社区发现方法、装置、设备及存储介质 - Google Patents

动态网络社区发现方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117113240A
CN117113240A CN202311372307.XA CN202311372307A CN117113240A CN 117113240 A CN117113240 A CN 117113240A CN 202311372307 A CN202311372307 A CN 202311372307A CN 117113240 A CN117113240 A CN 117113240A
Authority
CN
China
Prior art keywords
matrix
dynamic
community discovery
graph
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311372307.XA
Other languages
English (en)
Other versions
CN117113240B (zh
Inventor
李远鑫
王振宇
唐镇坤
陈盛福
梁朝恺
李萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Post Consumer Finance Co ltd
South China University of Technology SCUT
Original Assignee
China Post Consumer Finance Co ltd
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Post Consumer Finance Co ltd, South China University of Technology SCUT filed Critical China Post Consumer Finance Co ltd
Priority to CN202311372307.XA priority Critical patent/CN117113240B/zh
Publication of CN117113240A publication Critical patent/CN117113240A/zh
Application granted granted Critical
Publication of CN117113240B publication Critical patent/CN117113240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及网络信息技术领域,并公开了一种动态网络社区发现方法、装置、设备及存储介质,该方法包括:基于用户在网络交互过程中产生的动态社交网络数据得到图邻接矩阵和节点属性矩阵;构建基于动态双重自编码器的动态网络社区发现模型;将图邻接矩阵、节点属性矩阵和上一时刻时序特征输入至动态网络社区发现模型中,得到目标损失函数;基于目标损失函数对用户社区进行类别划分,得到动态网络社区。相比于传统的社区发现方法,由于本发明基于动态网络社区发现模型来划分动态网络社区,避免了传统的社区发现方法忽略了用户在社交网络中产生的各种特征之间的联系以及网络动态性的技术弊端,从而能够准确实时地发现动态网络中的社区结构。

Description

动态网络社区发现方法、装置、设备及存储介质
技术领域
本发明涉及网络信息技术领域,尤其涉及一种动态网络社区发现方法、装置、设备及存储介质。
背景技术
社交网络的发展促进了人们的交流和信息的传播,同时也带来了网络的复杂性和动态性,社区结构是社交网络的一个重要特征,通过对社交网络进行社区发现,能够有效地对用户进行个性化推荐及对信息传播进行监控。
随着虚拟网络的不断发展,社交网络的网络结构也变得越来越复杂。为了处理更加复杂的网络结构,研究者提出了一些传统的社区发现方法。然而,在这些传统的社区发现方法的实施过程中,并未考虑到用户在社交网络中产生的各种特征之间的联系;同时传统的社区发现方法也忽略了网络的动态性,即真实世界的网络节点和边是会随着时间变化不断发生变化的,这导致网络拓扑结构和在固定拓扑上属性的变化从而引起社区结构的变化。基于上述原因,目前传统的社区发现方法无法准确、实时地发现动态网络中的社区结构。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供了一种动态网络社区发现方法、装置、设备及存储介质,旨在解决现有技术方法无法准确、实时地发现动态网络中的社区结构的技术问题。
为实现上述目的,本发明提供了一种动态网络社区发现方法,所述方法包括以下步骤:
基于用户在网络交互过程中产生的动态社交网络数据得到图邻接矩阵和节点属性矩阵;
构建基于动态双重自编码器的动态网络社区发现模型,所述动态网络社区发现模型包括深度自编码器、图注意变分自编码器和时序特征建模层模块;
将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述动态网络社区发现模型中,得到目标损失函数;
基于所述目标损失函数对用户社区进行类别划分,得到动态网络社区。
可选地,所述构建基于动态双重自编码器的动态网络社区发现模型的步骤,包括:
基于属性编码器和属性解码器构建深度自编码器,所述属性编码器用于对所述节点属性矩阵进行编码,所述属性解码器用于对所述节点属性矩阵进行解码,所述属性编码器与所述属性解码器的结构为对称关系;
基于图编码器和图结构解码器构建图注意变分自编码器,所述图编码器用于提取所述动态社交网络数据中图数据的结构信息,所述图结构解码器用于对所述图数据的结构信息进行重构;
基于所述深度自编码器、所述图注意变分自编码器和时序特征建模层模块构建基于动态双重自编码器的动态网络社区发现模型。
可选地,所述将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述动态网络社区发现模型中,得到目标损失函数的步骤之前,还包括:
通过所述时序特征建模层模块中的图卷积网络对上一时刻的图邻接矩阵、上一时刻的节点属性矩阵和上一时刻的节点潜在向量进行融合,得到时序融合矩阵,所述节点潜在向量基于属性编码器和图编码器学习后得到;
通过门控循环单元对所述时序融合矩阵进行特征提取,得到上一时刻时序特征。
可选地,所述将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述动态网络社区发现模型中,得到目标损失函数的步骤,包括:
将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述图编码器中,得到正态分布的均值向量矩阵和正态分布的方差向量矩阵;
将所述节点属性矩阵输入至所述深度自编码器中,得到隐藏属性矩阵和重构节点属性矩阵;
基于所述正态分布的均值向量矩阵、所述正态分布的方差向量矩阵、所述隐藏属性矩阵和所述重构节点属性矩阵得到目标损失函数。
可选地,所述基于所述正态分布的均值向量矩阵、所述正态分布的方差向量矩阵、所述隐藏属性矩阵和所述重构节点属性矩阵得到目标损失函数的步骤,包括:
基于所述重构节点属性矩阵和所述节点属性矩阵得到节点属性损失;
基于所述图邻接矩阵和重构图邻接矩阵得到图邻接损失,所述重构图邻接矩阵通过将所述图邻接矩阵输入至所述图结构解码器进行重构后得到;
基于所述正态分布的均值向量矩阵和所述正态分布的方差向量矩阵得到KL散度损失;
根据所述节点属性损失、所述图邻接损失和所述KL散度损失得到目标损失函数。
可选地,所述基于所述目标损失函数对用户社区进行类别划分,得到动态网络社区的步骤,包括:
基于所述目标损失函数对所述动态网络社区发现模型进行优化,得到优化后的动态网络社区发现模型;
通过k-means聚类算法对用户社区进行类别划分,得到动态网络社区,所述用户社区基于所述优化后的动态网络社区发现模型对所述用户进行识别后获得。
可选地,所述基于所述目标损失函数对所述动态网络社区发现模型进行优化,得到优化后的动态网络社区发现模型的步骤,包括:
通过所述目标损失函数对所述动态网络社区发现模型进行训练学习,得到图结构信息、节点属性信息和社区潜在特征;
基于所述图结构信息、所述节点属性信息和所述社区潜在特征对所述动态网络社区发现模型进行模型优化,得到优化后的动态网络社区发现模型。
此外,为实现上述目的,本发明还提出一种动态网络社区发现装置,所述动态网络社区发现装置包括:
数据获取模块,用于基于用户在网络交互过程中产生的动态社交网络数据得到图邻接矩阵和节点属性矩阵;
模型构建模块,用于构建基于动态双重自编码器的动态网络社区发现模型,所述动态网络社区发现模型包括深度自编码器、图注意变分自编码器和时序特征建模层;
数据输入模块,用于将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述动态网络社区发现模型中,得到目标损失函数;
类别划分模块,用于基于所述目标损失函数对用户社区进行类别划分,得到动态网络社区。
此外,为实现上述目的,本发明还提出一种动态网络社区发现设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的动态网络社区发现程序,所述动态网络社区发现程序配置为实现如上文所述的动态网络社区发现方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有动态网络社区发现程序,所述动态网络社区发现程序被处理器执行时实现如上文所述的动态网络社区发现方法的步骤。
本发明基于用户在网络交互过程中产生的动态社交网络数据得到图邻接矩阵和节点属性矩阵;构建基于动态双重自编码器的动态网络社区发现模型,动态网络社区发现模型包括深度自编码器、图注意变分自编码器和时序特征建模层模块;将图邻接矩阵、节点属性矩阵和上一时刻时序特征输入至动态网络社区发现模型中,得到目标损失函数;基于目标损失函数对用户社区进行类别划分,得到动态网络社区。相比于传统的社区发现方法,由于本发明上述方法基于深度自编码器、图注意变分自编码器和时序特征建模层模块构建动态网络社区发现模型,然后将用户在网络交互过程中产生的动态社交网络数据输入至动态网络社区发现模型中得到目标损失函数,并基于目标损失函数对用户社区进行类别划分后得到动态网络社区,从而避免了传统的社区发现方法忽略了用户在社交网络中产生的各种特征之间的联系以及网络动态性的技术弊端,进而能够准确实时地发现动态网络中的社区结构。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的动态网络社区发现设备的结构示意图;
图2为本发明动态网络社区发现方法第一实施例的流程示意图;
图3为本发明动态网络社区发现方法第二实施例的流程示意图;
图4为本发明动态网络社区发现方法第三实施例的流程示意图;
图5为本发明动态网络社区发现装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的动态网络社区发现设备结构示意图。
如图1所示,该动态网络社区发现设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对动态网络社区发现设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及动态网络社区发现程序。
在图1所示的动态网络社区发现设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明动态网络社区发现设备中的处理器1001、存储器1005可以设置在动态网络社区发现设备中,所述动态网络社区发现设备通过处理器1001调用存储器1005中存储的动态网络社区发现程序,并执行本发明实施例提供的动态网络社区发现方法。
本发明实施例提供了一种动态网络社区发现方法,参照图2,图2为本发明动态网络社区发现方法第一实施例的流程示意图。
本实施例中,所述动态网络社区发现方法包括以下步骤:
步骤S10:基于用户在网络交互过程中产生的动态社交网络数据得到图邻接矩阵和节点属性矩阵。
需要说明的是,本实施例方法的执行主体可以是具有数据处理、网络通讯以及程序运行功能的计算服务设备,例如手机、平板电脑、个人电脑等,还可以是能够实现相同或相似功能的其他电子设备,本实施例对此不加以限制。此处将以动态网络社区发现设备(以下简称发现设备)为例对本发明动态网络社区发现方法的各项实施例进行说明。
可理解的是,上述动态社交网络数据可以表示为,其中是时间步t的快照网络,/>和/>表示时间步t的快照网络的节点集合和边集合。在本实施例的网络中可以有一种类型的节点和一种类型的边,节点数为/>,边数为/>。特别地,上述动态社交网络数据可以是DBLP-3数据集,DBLP-3数据集中动态节点数可以为4257,动态边数可以为23540,时间步长可以为10,节点特征维度可以为100,社区数可以为3;也可以是DBLP-5数据集,DBLP-5数据集中动态节点数可以为6606,动态边数可以为42815,时间步长可以为10,节点特征维度可以为100,社区数可以为5,本实施例对此不加以限制。
应理解的是,上述图邻接矩阵可以为,用于表示快照网络/>节点之间的连接情况。节点/>和/>之间存在一条边则可以表示为/>,否则/>。上述节点属性矩阵可以是/>中的节点特征,可以表示为矩阵/>,矩阵第i行表示节点/>在时间步t的特征向量,如果没有节点特征,则可以将矩阵设置为,/>表示单位向量。
步骤S20:构建基于动态双重自编码器的动态网络社区发现模型,所述动态网络社区发现模型包括深度自编码器、图注意变分自编码器和时序特征建模层模块。
需要说明的是,上述深度自编码器可以包括属性编码器和属性解码器,属性编码器和属性解码器结构对称,可以用来对属性信息进行编码和解码。在本实施例中,可以使用深度自编码器来提取属性信息,并把中间层提取到的属性隐藏表示传递给图注意变分自编码器,将学习到的属性信息补充到图注意变分自编码器中。
应理解的是,上述图注意变分自编码器可以包括图编码器和图结构解码器。图注意变分自编码器可以以上一个时刻时序特征建模的输出、当前时刻的图邻接矩阵和节点属性矩阵作为输入,图编码器采用图注意力网络来提取结构信息,图结构解码器采用向量内积的形式进行邻接矩阵重构,通过最小化图结构重构损失来学习结构信息的潜在表示。
可理解的是,上述时序特征建模层模块可以用来建模动态同构网络结构信息和属性信息的变化,首先使用两层的图卷积网络来融合上一个时刻的网络结构、属性特征向量和节点潜在向量的信息,然后通过优化过的GRU(Gate Recurrent Unit,门控循环单元)来建模学习快照网络的依赖性,学习动态网络的时序特征。
步骤S30:将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述动态网络社区发现模型中,得到目标损失函数。
需要说明的是,上述目标损失函数可以是在机器学习或深度学习中用于衡量预测结果与实际标签之间差异的函数。它是模型训练的核心指标,用于衡量模型的性能和指导参数优化的方向。更具体地,上述目标损失函数可以包括均方差损失函数、交叉熵损失函数、对数损失函数、负对数似然损失函数或其他类型的损失函数,本实施例对此不加以限制。
步骤S40:基于所述目标损失函数对用户社区进行类别划分,得到动态网络社区。
需要说明的是,上述动态网络社区可以是上述用户在动态社交网络中社交行为所属的网络社区。其中,上述动态社交网络的网络节点和边会随着时间变化不断发生变化。
在具体实现中,可以基于上述目标损失函数提供优化方向来对上述动态网络社区发现模型进行优化,从而能够基于优化后的动态网络社区发现模型来对用户所属的用户社区进行类别划分,得到动态网络社区。
本实施例基于用户在网络交互过程中产生的动态社交网络数据得到图邻接矩阵和节点属性矩阵;构建基于动态双重自编码器的动态网络社区发现模型,动态网络社区发现模型包括深度自编码器、图注意变分自编码器和时序特征建模层模块;将图邻接矩阵、节点属性矩阵和上一时刻时序特征输入至动态网络社区发现模型中,得到目标损失函数;基于目标损失函数对用户社区进行类别划分,得到动态网络社区。相比于传统的社区发现方法,由于本实施例上述方法基于深度自编码器、图注意变分自编码器和时序特征建模层模块构建动态网络社区发现模型,然后将用户在网络交互过程中产生的动态社交网络数据输入至动态网络社区发现模型中得到目标损失函数,并基于目标损失函数对用户社区进行类别划分后得到动态网络社区,从而避免了传统的社区发现方法忽略了用户在社交网络中产生的各种特征之间的联系以及网络动态性的技术弊端,进而能够准确实时地发现动态网络中的社区结构。
参考图3,图3为本发明动态网络社区发现方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,为了构建动态双重自编码器的动态网络社区发现模型,从而实现对用户在网络交互过程中产生的动态社交网络数据的重构,所述步骤S20,可以包括:
步骤S201:基于属性编码器和属性解码器构建深度自编码器,所述属性编码器用于对所述节点属性矩阵进行编码,所述属性解码器用于对所述节点属性矩阵进行解码,所述属性编码器与所述属性解码器的结构为对称关系。
在具体实现中,上述属性解码器可以基于全连接的神经网络对上述节点属性矩阵进行重构,从而实现对上述节点属性矩阵的解码动作,具体可以用公式表示为:
其中,上式中表示全连接层的非线性激活函数,/>和/>分别表示属性解码器第l层的权重矩阵和偏置量,节点属性信息的低维隐藏表示经过属性解码器进行解码后,得到重构后的节点属性矩阵/>
步骤S202:基于图编码器和图结构解码器构建图注意变分自编码器,所述图编码器用于提取所述动态社交网络数据中图数据的结构信息,所述图结构解码器用于对所述图数据的结构信息进行重构。
在具体实现中,上述图编码器可以通过采用两层图注意力网络,并以上一个时刻时序特征建模的输出、当前时刻的图邻接矩阵和节点特征矩阵作为输入,学习节点表示的分布,从而提取图数据的结构信息。上述图结构解码器通过采用向量内积的形式计算图中任意两个节点之间存在边相连的概率来对图结构进行重构。
步骤S203:基于所述深度自编码器、所述图注意变分自编码器和时序特征建模层模块构建基于动态双重自编码器的动态网络社区发现模型。
步骤S204:通过所述时序特征建模层模块中的图卷积网络对上一时刻的图邻接矩阵、上一时刻的节点属性矩阵和上一时刻的节点潜在向量进行融合,得到时序融合矩阵,所述节点潜在向量基于属性编码器和图编码器学习后得到。
在具体实现中,可以通过以下公式来表示上述时序融合矩阵:
其中,GCN1可以表示第一层图卷积网络,GCN2可以表示第二层图卷积网络,可以表示上述上一时刻的图邻接矩阵,/>可以表示上述上一时刻的节点属性矩阵,/>可以表示上述上一时刻的节点潜在向量,/>表示矩阵连接操作,/>是多层感知机网络,独立运行在每个节点上,从/>和/>中提取特征。
步骤S205:通过门控循环单元对所述时序融合矩阵进行特征提取,得到上一时刻时序特征。
基于上述第一实施例,在本实施例中,为了得到更为准确的目标损失函数,从而能够衡量模型的性能和指导参数优化的方向,所述步骤S30,可以包括:
步骤S301:将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述图编码器中,得到正态分布的均值向量矩阵和正态分布的方差向量矩阵。
应理解的是,可以通过以下公式来表示上述正态分布的均值向量矩阵和正态分布的方差向量矩阵:
其中,表示上述正态分布的均值向量矩阵,/>表示上述正态分布的方差向量矩阵,/>表示上述上一时刻时序特征,/>表示矩阵连接操作,/>表示深度神经网络,它们独立地操作每个节点上,并从/>提取特征。需要注意的是,第一层图注意力网络/>的权重参数是共享的。节点的结构潜在向量表示是从向量分布/>中进行采样得到的,由于训练模型要使用梯度下降,而采样操作没办法进行反向传播,需要使用重参数化来避免这个问题。更具体地,重参数化的过程可以表示为:
其中,表示线性变换变量/>,/>表示矩阵的哈达玛积。
步骤S302:将所述节点属性矩阵输入至所述深度自编码器中,得到隐藏属性矩阵和重构节点属性矩阵。
在具体实现中,可以基于以下公式来表示上述隐藏属性矩阵:
其中,表示深度自编码器中时间步为t的第l层隐藏属性矩阵,/>表示全连接层的非线性激活函数,/>和/>表示属性编码器第l层的权重矩阵和偏置量。特别地,第一层的输入为原始节点特征矩阵,即/>
步骤S303:基于所述正态分布的均值向量矩阵、所述正态分布的方差向量矩阵、所述隐藏属性矩阵和所述重构节点属性矩阵得到目标损失函数。
在具体实现中,可以对上述正态分布的均值向量矩阵、上述正态分布的方差向量矩阵、上述隐藏属性矩阵和上述重构节点属性矩阵分配各自的权重,并将分配了相应权重后的正态分布的均值向量矩阵、正态分布的方差向量矩阵、隐藏属性矩阵和重构节点属性矩阵进行叠加运算,从而得到上述目标损失函数。
本实施例基于属性编码器和属性解码器构建深度自编码器,属性编码器用于对节点属性矩阵进行编码,属性解码器用于对节点属性矩阵进行解码,属性编码器与属性解码器的结构为对称关系;基于图编码器和图结构解码器构建图注意变分自编码器,图编码器用于提取动态社交网络数据中图数据的结构信息,图结构解码器用于对图数据的结构信息进行重构;基于深度自编码器、图注意变分自编码器和时序特征建模层模块构建基于动态双重自编码器的动态网络社区发现模型;通过时序特征建模层模块中的图卷积网络对上一时刻的图邻接矩阵、上一时刻的节点属性矩阵和上一时刻的节点潜在向量进行融合,得到时序融合矩阵,节点潜在向量基于属性编码器和图编码器学习后得到;通过门控循环单元对时序融合矩阵进行特征提取,得到上一时刻时序特征;将图邻接矩阵、节点属性矩阵和上一时刻时序特征输入至图编码器中,得到正态分布的均值向量矩阵和正态分布的方差向量矩阵;将节点属性矩阵输入至深度自编码器中,得到隐藏属性矩阵和重构节点属性矩阵;基于正态分布的均值向量矩阵、正态分布的方差向量矩阵、隐藏属性矩阵和重构节点属性矩阵得到目标损失函数。相较于传统的网络社区发现方法,本实施例上述方法通过构建动态双重自编码器的动态网络社区发现模型,来实现对用户在网络交互过程中产生的动态社交网络数据的重构,从而能够准确地得到目标损失函数,进而基于目标损失函数得到更接近社区真实情况的节点特征。
参考图4,图4为本发明动态网络社区发现方法第三实施例的流程示意图。
基于上述各实施例,在本实施例中,为了更为准确地得到目标损失函数,从而得到更接近社区真实情况的节点特征,所述步骤S303,可以包括:
步骤S3031:基于所述重构节点属性矩阵和所述节点属性矩阵得到节点属性损失。
在具体实现中,可以使用MSE(Mean Square Error,均方差函数)来衡量所有时间步t的和/>之间差异,从而得到上述节点属性损失。更具体地,可以通过以下公式来表示:
其中,表示上述节点属性损失,/>表示上述节点属性矩阵,/>表示上述重构节点属性矩阵,N表示节点数。
步骤S3032:基于所述图邻接矩阵和重构图邻接矩阵得到图邻接损失,所述重构图邻接矩阵通过将所述图邻接矩阵输入至所述图结构解码器进行重构后得到。
步骤S3033:基于所述正态分布的均值向量矩阵和所述正态分布的方差向量矩阵得到KL散度损失。
在具体实现中,可以通过以下公式来表示上述图邻接损失和KL散度损失:
其中,表示上述图邻接矩阵和上述重构图邻接矩阵的交叉熵损失,/>表示上述正态分布的均值向量矩阵,/>表示上述正态分布的方差向量矩阵,/>表示单位向量,/>表示正态分布。
步骤S3034:根据所述节点属性损失、所述图邻接损失和所述KL散度损失得到目标损失函数。
在具体实现中,可以将上述公式L1和上述公式L2相加后得到上述目标损失函数。
基于上述各实施例,在本实施例中,为了更为准确地对用户社区进行类别划分,所述步骤S40,可以包括:
步骤S401:基于所述目标损失函数对所述动态网络社区发现模型进行优化,得到优化后的动态网络社区发现模型。
在具体实现中,可以基于上述目标损失函数来对上述动态网络社区发现模型的模型参数进行调整,并使得目标损失函数的取值最小化来实现模型优化过程。
步骤S402:通过k-means聚类算法对用户社区进行类别划分,得到动态网络社区,所述用户社区基于所述优化后的动态网络社区发现模型对所述用户进行识别后获得。
基于上述各实施例,在本实施例中,为了有针对性地对动态网络社区发现模型进行训练学习,从而提升动态网络社区发现模型的模型性能,所述步骤S40,可以包括:
步骤S4011:通过所述目标损失函数对所述动态网络社区发现模型进行训练学习,得到图结构信息、节点属性信息和社区潜在特征。
步骤S4012:基于所述图结构信息、所述节点属性信息和所述社区潜在特征对所述动态网络社区发现模型进行模型优化,得到优化后的动态网络社区发现模型。
本实施例基于重构节点属性矩阵和节点属性矩阵得到节点属性损失;基于图邻接矩阵和重构图邻接矩阵得到图邻接损失,重构图邻接矩阵通过将图邻接矩阵输入至图结构解码器进行重构后得到;基于正态分布的均值向量矩阵和正态分布的方差向量矩阵得到KL散度损失;根据节点属性损失、图邻接损失和KL散度损失得到目标损失函数;通过目标损失函数对动态网络社区发现模型进行训练学习,得到图结构信息、节点属性信息和社区潜在特征;基于图结构信息、节点属性信息和社区潜在特征对动态网络社区发现模型进行模型优化,得到优化后的动态网络社区发现模型;通过k-means聚类算法对用户社区进行类别划分,得到动态网络社区,用户社区基于优化后的动态网络社区发现模型对用户进行识别后获得。相较于传统的网络社区发现方法,本实施例上述方法通过k-means聚类算法对基于优化后的动态网络社区发现模型对用户进行识别后得到的用户社区进行类别划分,从而能够更为准确地发现动态网络中的社区结构。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有动态网络社区发现程序,所述动态网络社区发现程序被处理器执行时实现如上文所述的动态网络社区发现方法的步骤。
参照图5,图5为本发明动态网络社区发现装置第一实施例的结构框图。
如图5所示,本发明实施例提出的动态网络社区发现装置包括:
数据获取模块501,用于基于用户在网络交互过程中产生的动态社交网络数据得到图邻接矩阵和节点属性矩阵;
模型构建模块502,用于构建基于动态双重自编码器的动态网络社区发现模型,所述动态网络社区发现模型包括深度自编码器、图注意变分自编码器和时序特征建模层;
数据输入模块503,用于将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述动态网络社区发现模型中,得到目标损失函数;
类别划分模块504,用于基于所述目标损失函数对用户社区进行类别划分,得到动态网络社区。
本实施例基于用户在网络交互过程中产生的动态社交网络数据得到图邻接矩阵和节点属性矩阵;构建基于动态双重自编码器的动态网络社区发现模型,动态网络社区发现模型包括深度自编码器、图注意变分自编码器和时序特征建模层模块;将图邻接矩阵、节点属性矩阵和上一时刻时序特征输入至动态网络社区发现模型中,得到目标损失函数;基于目标损失函数对用户社区进行类别划分,得到动态网络社区。相比于传统的社区发现方法,由于本实施例上述方法基于深度自编码器、图注意变分自编码器和时序特征建模层模块构建动态网络社区发现模型,然后将用户在网络交互过程中产生的动态社交网络数据输入至动态网络社区发现模型中得到目标损失函数,并基于目标损失函数对用户社区进行类别划分后得到动态网络社区,从而避免了传统的社区发现方法忽略了用户在社交网络中产生的各种特征之间的联系以及网络动态性的技术弊端,进而能够准确实时地发现动态网络中的社区结构。
基于本发明上述动态网络社区发现装置的第一实施例,提出本发明动态网络社区发现装置的第二实施例。
在本实施例中,所述模型构建模块502,还用于基于属性编码器和属性解码器构建深度自编码器,所述属性编码器用于对所述节点属性矩阵进行编码,所述属性解码器用于对所述节点属性矩阵进行解码,所述属性编码器与所述属性解码器的结构为对称关系;基于图编码器和图结构解码器构建图注意变分自编码器,所述图编码器用于提取所述动态社交网络数据中图数据的结构信息,所述图结构解码器用于对所述图数据的结构信息进行重构;基于所述深度自编码器、所述图注意变分自编码器和时序特征建模层模块构建基于动态双重自编码器的动态网络社区发现模型。
进一步地,所述数据输入模块503,还用于通过所述时序特征建模层模块中的图卷积网络对上一时刻的图邻接矩阵、上一时刻的节点属性矩阵和上一时刻的节点潜在向量进行融合,得到时序融合矩阵,所述节点潜在向量基于属性编码器和图编码器学习后得到;通过门控循环单元对所述时序融合矩阵进行特征提取,得到上一时刻时序特征。
进一步地,所述数据输入模块503,还用于将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述图编码器中,得到正态分布的均值向量矩阵和正态分布的方差向量矩阵;将所述节点属性矩阵输入至所述深度自编码器中,得到隐藏属性矩阵和重构节点属性矩阵;基于所述正态分布的均值向量矩阵、所述正态分布的方差向量矩阵、所述隐藏属性矩阵和所述重构节点属性矩阵得到目标损失函数。
进一步地,所述数据输入模块503,还用于基于所述重构节点属性矩阵和所述节点属性矩阵得到节点属性损失;基于所述图邻接矩阵和重构图邻接矩阵得到图邻接损失,所述重构图邻接矩阵通过将所述图邻接矩阵输入至所述图结构解码器进行重构后得到;基于所述正态分布的均值向量矩阵和所述正态分布的方差向量矩阵得到KL散度损失;根据所述节点属性损失、所述图邻接损失和所述KL散度损失得到目标损失函数。
进一步地,所述类别划分模块504,还用于基于所述目标损失函数对所述动态网络社区发现模型进行优化,得到优化后的动态网络社区发现模型;通过k-means聚类算法对用户社区进行类别划分,得到动态网络社区,所述用户社区基于所述优化后的动态网络社区发现模型对所述用户进行识别后获得。
进一步地,所述类别划分模块504,还用于通过所述目标损失函数对所述动态网络社区发现模型进行训练学习,得到图结构信息、节点属性信息和社区潜在特征;基于所述图结构信息、所述节点属性信息和所述社区潜在特征对所述动态网络社区发现模型进行模型优化,得到优化后的动态网络社区发现模型。
本发明动态网络社区发现装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种动态网络社区发现方法,其特征在于,所述方法包括以下步骤:
基于用户在网络交互过程中产生的动态社交网络数据得到图邻接矩阵和节点属性矩阵;
构建基于动态双重自编码器的动态网络社区发现模型,所述动态网络社区发现模型包括深度自编码器、图注意变分自编码器和时序特征建模层模块;
将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述动态网络社区发现模型中,得到目标损失函数;
基于所述目标损失函数对用户社区进行类别划分,得到动态网络社区。
2.如权利要求1所述的动态网络社区发现方法,其特征在于,所述构建基于动态双重自编码器的动态网络社区发现模型的步骤,包括:
基于属性编码器和属性解码器构建深度自编码器,所述属性编码器用于对所述节点属性矩阵进行编码,所述属性解码器用于对所述节点属性矩阵进行解码,所述属性编码器与所述属性解码器的结构为对称关系;
基于图编码器和图结构解码器构建图注意变分自编码器,所述图编码器用于提取所述动态社交网络数据中图数据的结构信息,所述图结构解码器用于对所述图数据的结构信息进行重构;
基于所述深度自编码器、所述图注意变分自编码器和时序特征建模层模块构建基于动态双重自编码器的动态网络社区发现模型。
3.如权利要求1所述的动态网络社区发现方法,其特征在于,所述将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述动态网络社区发现模型中,得到目标损失函数的步骤之前,还包括:
通过所述时序特征建模层模块中的图卷积网络对上一时刻的图邻接矩阵、上一时刻的节点属性矩阵和上一时刻的节点潜在向量进行融合,得到时序融合矩阵,所述节点潜在向量基于属性编码器和图编码器学习后得到;
通过门控循环单元对所述时序融合矩阵进行特征提取,得到上一时刻时序特征。
4.如权利要求2所述的动态网络社区发现方法,其特征在于,所述将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述动态网络社区发现模型中,得到目标损失函数的步骤,包括:
将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述图编码器中,得到正态分布的均值向量矩阵和正态分布的方差向量矩阵;
将所述节点属性矩阵输入至所述深度自编码器中,得到隐藏属性矩阵和重构节点属性矩阵;
基于所述正态分布的均值向量矩阵、所述正态分布的方差向量矩阵、所述隐藏属性矩阵和所述重构节点属性矩阵得到目标损失函数。
5.如权利要求4所述的动态网络社区发现方法,其特征在于,所述基于所述正态分布的均值向量矩阵、所述正态分布的方差向量矩阵、所述隐藏属性矩阵和所述重构节点属性矩阵得到目标损失函数的步骤,包括:
基于所述重构节点属性矩阵和所述节点属性矩阵得到节点属性损失;
基于所述图邻接矩阵和重构图邻接矩阵得到图邻接损失,所述重构图邻接矩阵通过将所述图邻接矩阵输入至所述图结构解码器进行重构后得到;
基于所述正态分布的均值向量矩阵和所述正态分布的方差向量矩阵得到KL散度损失;
根据所述节点属性损失、所述图邻接损失和所述KL散度损失得到目标损失函数。
6.如权利要求1所述的动态网络社区发现方法,其特征在于,所述基于所述目标损失函数对用户社区进行类别划分,得到动态网络社区的步骤,包括:
基于所述目标损失函数对所述动态网络社区发现模型进行优化,得到优化后的动态网络社区发现模型;
通过k-means聚类算法对用户社区进行类别划分,得到动态网络社区,所述用户社区基于所述优化后的动态网络社区发现模型对所述用户进行识别后获得。
7.如权利要求6所述的动态网络社区发现方法,其特征在于,所述基于所述目标损失函数对所述动态网络社区发现模型进行优化,得到优化后的动态网络社区发现模型的步骤,包括:
通过所述目标损失函数对所述动态网络社区发现模型进行训练学习,得到图结构信息、节点属性信息和社区潜在特征;
基于所述图结构信息、所述节点属性信息和所述社区潜在特征对所述动态网络社区发现模型进行模型优化,得到优化后的动态网络社区发现模型。
8.一种动态网络社区发现装置,其特征在于,所述动态网络社区发现装置包括:
数据获取模块,用于基于用户在网络交互过程中产生的动态社交网络数据得到图邻接矩阵和节点属性矩阵;
模型构建模块,用于构建基于动态双重自编码器的动态网络社区发现模型,所述动态网络社区发现模型包括深度自编码器、图注意变分自编码器和时序特征建模层;
数据输入模块,用于将所述图邻接矩阵、所述节点属性矩阵和上一时刻时序特征输入至所述动态网络社区发现模型中,得到目标损失函数;
类别划分模块,用于基于所述目标损失函数对用户社区进行类别划分,得到动态网络社区。
9.一种动态网络社区发现设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的动态网络社区发现程序,所述动态网络社区发现程序配置为实现如权利要求1至7中任一项所述的动态网络社区发现方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有动态网络社区发现程序,所述动态网络社区发现程序被处理器执行时实现如权利要求1至7中任一项所述的动态网络社区发现方法的步骤。
CN202311372307.XA 2023-10-23 2023-10-23 动态网络社区发现方法、装置、设备及存储介质 Active CN117113240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311372307.XA CN117113240B (zh) 2023-10-23 2023-10-23 动态网络社区发现方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311372307.XA CN117113240B (zh) 2023-10-23 2023-10-23 动态网络社区发现方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN117113240A true CN117113240A (zh) 2023-11-24
CN117113240B CN117113240B (zh) 2024-03-26

Family

ID=88811352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311372307.XA Active CN117113240B (zh) 2023-10-23 2023-10-23 动态网络社区发现方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117113240B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084328A (zh) * 2020-07-29 2020-12-15 浙江工业大学 一种基于变分图自编码器与K-Means的科技论文聚类分析方法
CN112905656A (zh) * 2021-01-29 2021-06-04 重庆理工大学 一种融合时序网络的动态社区发现***
CN113407784A (zh) * 2021-05-28 2021-09-17 桂林电子科技大学 一种基于社交网络的社团划分方法、***及存储介质
CN114020999A (zh) * 2021-10-20 2022-02-08 山西大学 一种电影社交网络的社区结构检测方法及***
WO2022166361A1 (zh) * 2021-02-04 2022-08-11 浙江师范大学 一种基于跨模态融合的深度聚类方法及***
CN116595479A (zh) * 2023-05-06 2023-08-15 云南大学 基于图双重自编码器的社区发现方法、***、设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084328A (zh) * 2020-07-29 2020-12-15 浙江工业大学 一种基于变分图自编码器与K-Means的科技论文聚类分析方法
CN112905656A (zh) * 2021-01-29 2021-06-04 重庆理工大学 一种融合时序网络的动态社区发现***
WO2022166361A1 (zh) * 2021-02-04 2022-08-11 浙江师范大学 一种基于跨模态融合的深度聚类方法及***
CN113407784A (zh) * 2021-05-28 2021-09-17 桂林电子科技大学 一种基于社交网络的社团划分方法、***及存储介质
CN114020999A (zh) * 2021-10-20 2022-02-08 山西大学 一种电影社交网络的社区结构检测方法及***
CN116595479A (zh) * 2023-05-06 2023-08-15 云南大学 基于图双重自编码器的社区发现方法、***、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUANXIN LI ET AL.: "Maximizing the Influence of Social Networks Based on Graph Attention Networks", 《2023 3RD ASIA-PACIFIC CONFERENCE ON COMMUNICATIONS TECHNOLOGY AND COMPUTER SCIENCE (ACCTCS)》, pages 396 - 403 *
黄瑞阳;吴奇;朱宇航;: "基于联合矩阵分解的动态异质网络社区发现方法", 计算机应用研究, no. 10, 31 October 2017 (2017-10-31), pages 115 - 118 *

Also Published As

Publication number Publication date
CN117113240B (zh) 2024-03-26

Similar Documents

Publication Publication Date Title
CN109120462B (zh) 机会网络链路的预测方法、装置及可读存储介质
US10387768B2 (en) Enhanced restricted boltzmann machine with prognosibility regularization for prognostics and health assessment
US11580363B2 (en) Systems and methods for assessing item compatibility
CN111695415B (zh) 图像识别方法及相关设备
CN113961759B (zh) 基于属性图表示学习的异常检测方法
CN113628059B (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
Steingrimsson et al. Deep learning for survival outcomes
Tomy et al. Estimating the state of epidemics spreading with graph neural networks
CN112507245B (zh) 基于图神经网络的社交网络好友推荐方法
CN116310667B (zh) 联合对比损失和重建损失的自监督视觉表征学习方法
CN115271980A (zh) 风险值预测方法、装置、计算机设备和存储介质
Deng et al. Network Intrusion Detection Based on Sparse Autoencoder and IGA‐BP Network
Devi et al. Smoothing approach to alleviate the meager rating problem in collaborative recommender systems
CN113239266B (zh) 基于局部矩阵分解的个性化推荐方法及***
CN117113240B (zh) 动态网络社区发现方法、装置、设备及存储介质
Wang et al. Enhanced by mobility? Effect of users’ mobility on information diffusion in coupled online social networks
Sharma et al. Comparative analysis of different algorithms in link prediction on social networks
Chen et al. Gaussian mixture embedding of multiple node roles in networks
CN115545833A (zh) 一种基于用户社交信息的推荐方法及***
CN114329099B (zh) 重叠社区识别方法、装置、设备、存储介质及程序产品
CN113065321B (zh) 基于lstm模型和超图的用户行为预测方法及***
Kefeng et al. CNN Based No‐Reference HDR Image Quality Assessment
CN112463964B (zh) 文本分类及模型训练方法、装置、设备及存储介质
JP7420244B2 (ja) 学習装置、学習方法、推定装置、推定方法及びプログラム
Li et al. Dynamic graph embedding‐based anomaly detection on internet of things time series

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant