CN115293437A - 一种基于社交网络平台动态交互的关系预测方法 - Google Patents

一种基于社交网络平台动态交互的关系预测方法 Download PDF

Info

Publication number
CN115293437A
CN115293437A CN202210972715.8A CN202210972715A CN115293437A CN 115293437 A CN115293437 A CN 115293437A CN 202210972715 A CN202210972715 A CN 202210972715A CN 115293437 A CN115293437 A CN 115293437A
Authority
CN
China
Prior art keywords
user
sequence
text
interaction
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210972715.8A
Other languages
English (en)
Inventor
韦世红
吴鹤俊
肖寒春
肖云鹏
庞育才
李暾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202210972715.8A priority Critical patent/CN115293437A/zh
Publication of CN115293437A publication Critical patent/CN115293437A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及社交网络关系预测领域,具体涉及一种基于社交网络平台动态交互的关系预测方法;该方法在线获取用户的交互信息和文本信息,并分别对文本信息和交互信息进行相关处理,得到文本特征表示和交互网络结构特征表示;文本特征表示与交互网络结构特征表示融合得到用户特征表示;计算用户特征表示中任一用户与其余用户的相关性,选取前K个相关性对应的用户构成当前用户的强相关用户组;将其强相关用户组输入图注意力模型,得到当前用户的新特征;将新特征输入训练好的关系预测模型得到当前用户的关系预测结果;本发明引入交互行为间的潜在关系,不仅可以更准确的进行社交网络链接预测,还可以分析出用户之间所建立链接的类型。

Description

一种基于社交网络平台动态交互的关系预测方法
技术领域
本发明涉及社交网络关系预测领域,具体涉及一种基于社交网络平台动态交互的关系预测方法。
背景技术
社交网络中的关系预测是指利用已经存在的链接预测用户之间未来产生交互,并建立链接的可能性。建立链接在社交网络邻域代表的其实就是用户之间产生的交互行为,也即社交行为。传统上,人与人之间的交往通常都是发生在某个确定的时间以及空间,两个人相遇了,才有可能产生社交行为,社交圈小,社交行为少。如今,随着Twitter、微博、微信等社交网络的兴起,人们摒弃了传统社交的距离限制,可以通过在线社交平台与相隔万里的人成为朋友,这对人们生活的各个方面都有重要意义。随着在线社交平台的发展速度,为了帮助社交平台留住用户,进行更准确的好友推荐,链接预测成为了社交网络中的重要研究方向。在传统链接预测的研究中,并未考虑交互行为之间存在的隐藏信息对于整个社交网络演化的影响。因此,开展对不同的交互行为,以及交互行为之间隐藏信息的研究,对社交网络信息挖掘和预测具有重要作用。
近年来,许多学者对链接预测模型进行了大量的研究,主要是基于DynGEM、DDNE的动态网络表示学习方法,和node2vec、GCN的静态网络表示学习方法。基于DynGEM的动态图链接预测模型,它的优点有:随着时间的推移,嵌入稳定;能够处理增大的动态图;比直接在每个快照上套用静态图的方法更高效。DDNE用GRU作为编码器来捕获动态网络中的时间信息,从而在动态网络中进行链接预测。基于node2vec静态网络表示学习模型,它利用随机游走来捕获网络中的邻近性,并将所有节点映射到一个保持邻近性的低维表示空间中。GCN构建了一个半监督的节点嵌入模型,通过对网络拓扑结构和网络节点特征进行编码,从而得到了含有丰富信息的节点表示。虽然众多学者在动态网络链接预测这一领域已经做的很好了,但是在交互规律这一块,却还没有人通过构建分层递进式交互网络去捕捉这种潜在的特征,即使构建图快照,也仅是考虑时间的因素,没有考虑到交互行为之间的递进顺序,本文针对人类潜移默化的社交规律进行了深度研究。
发明内容
为解决上述问题,本发明提供了一种基于社交网络平台动态交互的关系预测方法,包括以下步骤:
S1.在线获取用户数据,其包括用户在社交网络中的交互信息和文本信息;
S2.采用负采样模型对文本信息进行处理得到词序列,通过词序列构建文本序列,将文本序列输入LSTM网络得到文本特征表示;
S3.通过交互信息构建分层递进式用户交互矩阵序列,将其与文本特征表示进行卷积得到分层递进式的用户文本交互快照图序列,将用户文本交互快照图序列输入LSTM网络得到交互网络结构特征表示;
S4.将文本特征表示与交互网络结构特征表示融合,得到用户特征表示;
S5.计算用户特征表示中用户节点ui与其余用户节点的相关性,并进行降序排列,从序列中选取前K个相关性对应的用户节点构成用户节点ui的强相关用户组;
S6.将用户节点ui的强相关用户组输入图注意力模型,得到用户节点ui的新特征;
S7.重复步骤S5-S6得到社交网络中每个用户节点的新特征,基于新特征计算任一用户节点与其余用户节点的相似度,得到每个用户节点的关系预测结果。
进一步的,步骤S2得到文本特征表示的具体过程为:
S210.获取N个用户的文本信息,即每个用户最近一个月内在社交网络上发布的所有原创内容和转发内容;
S211.通过分词器处理文本信息构建各用户的用户词典,并对用户词典中的每个词进行编码;将编码后的词输入负采样模型得到该词的词向量;
S212.一条内容中所有词对应的词向量构成一个词序列;根据原创内容和转发内容的类别分为原创词序列和转发词序列;
S213.选取用户i的s个原创词序列或s个转发词序列,按照时间顺序构成用户i的时序文本序列
Figure BDA0003797365750000031
N个用户的时序文本序列组成一个文本向量矩阵Ct
S214.将文本向量矩阵Ct经过LSTM网络后生成文本特征表示Ct+1
其中,
Figure BDA0003797365750000032
为N个用户的时序文本序列组成的文本向量矩阵,
Figure BDA0003797365750000033
Figure BDA0003797365750000034
表示第i个用户在t时刻的时序文本序列,
Figure BDA0003797365750000035
表示第i个用户在t时刻的时序文本序列中的第s个词序列。
进一步的,步骤S3通过交互信息构建分层递进式用户交互矩阵序列的过程为:
S310.获取用户的多种交互行为的数据,每一种交互行为构建一个邻接矩阵,将邻接矩阵根据交互行为产生关系链接的难度由小到大排列,得到邻接矩阵序列;
S311.对邻接矩阵序列进行前项求和得到分层递进式用户交互矩阵序列,表示为:
Figure BDA0003797365750000036
其中,Ai表示邻接矩阵序列中的第i个邻接矩阵,n表示分层递进式用户交互矩阵序列的层数,Mn表示分层递进式用户交互矩阵序列中第n层的递进交互矩阵。
进一步的,步骤S5采用余弦相似度计算用户节点间的相关性,表示为:
Figure BDA0003797365750000037
其中,ux、uy为用户特征表示中的任意两个用户节点,V(ux)、V(uy)分别表示用户节点ux和用户节点uy的初步特征向量,pi、qi表示初步特征向量V(ux)和V(uy)的分量,b表示初步特征向量的维度。
进一步的,关系预测模型通过用户节点ui与其邻居节点建立连接的概率(相似度)输出预测结果,表示为:
Figure BDA0003797365750000041
其中,
Figure BDA0003797365750000042
表示用户节点ui和uj间的相关性,
Figure BDA0003797365750000043
表示用户节点ui的强相关用户组,Y={0,1,2,3,4}表示预测的链接强度等级分别为0、1、2、3、4,强度等级从小到大分别表示用户间建立的链接关系为无链接、点赞、评论、转发、关注,U、L、C、Fd、Fw分别表示链接强度等级为0、1、2、3、4的取值范围。
进一步的,在关系预测模型的训练过程使用损失函数计算损失,其表示为:
Figure BDA0003797365750000044
其中,Py表示用户在不同连接类型下的相似概率,Y表示预测的链接强度等级。
本发明的有益效果:
本发明提出了一种基于社交网络动态交互的关系预测方法,将交互行为之间的潜在关系引入进来,不仅可以更准确的进行社交网络链接预测,还可以分析出用户之间所建立链接的类型。主要通过构建分层递进式交互矩阵的方式对交互网络中人类遵循的交往规律进行提取,以前大多数学者,都是通过构建时序链路预测模型对社交网络的动态特征提取,本发明将所有变化记录在一张图上,然后通过多种交互行为,对一张图进行分割,提取出不同行为的网络结构图,具体地,在实施例中采用微博数据进行试验测试,一个月内28天,将前27天的所有数据记录在一张图上,然后通过多种交互行为,对一张图进行分割,提取出不同行为的网络结构图,从而进行后续预测;考虑到交互行为的递进关系,又对这种邻接矩阵进行向前求和处理,使得经过LSTM网络后能够多的提取出更加重要的交互特征。为了增强本发明中用户节点的表示,本发明使用强相关用户组和注意力网络重新构建了节点的新特征,以提高预测效果。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的TT2vec算法表示隐藏信息示意图;
图3为本发明实施例的HPIN2vec示意图;
图4为本发明实施例的链接预测模型图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在一实施例中,如图1、图4所示,一种基于社交网络平台动态交互的关系预测方法,包括以下步骤:
S1.在线获取用户数据:
获取用户数据的方式不局限于一种,其可以从公开的数据网站获取,也可以利用成熟的社交网络公共API进行获取。这里需要获取的是用户转发和原创的文本数据(文本信息),以及在不同的交互行为下形成的网络结构数据,也即历史行为数据(交互信息)。文本数据需要得到文本发布或者转发的时间,以便后续TT2vec的时序文本处理。
具体地,获取原始的用户数据后对其进行数据清洗,通常获取的原始数据都是非结构化的,不能直接用于数据分析。通过简单的数据清洗可以使大部分非结构化数据结构化,使得异常值或空值不再出现,减少对于后续计算带来的不便。采用数据库存储清洗后的用户数据,通过表结构使数据进一步的规范化,同时提高数据的检索效率和表间关系的映射。
S2.获取用户兴趣发现和社交规律发现:
对于用户兴趣发现,本实施例从用户在社交网络发布以及转发的文本信息中动态提取影响用户建立链接的兴趣因素,通过设计TT2vec(Timing Text to vector)算法来发现用户和发布的文本间隐藏的动态信息,计算文本信息网络,分析用户当前以及接下来的兴趣偏好信息;
对于社交规律发现,本实施例引入分层递进式用户交互矩阵,构建基于文本特征的GCN模型,为了发现用户交往的潜在规律,通过TT2vec进一步捕获交互网络的演化模式。
在一实施例中,设计TT2vec算法来构建用户和所属文本间的隐藏信息,从而计算文本信息网络,实现用户兴趣发现,如图2所示,包括:采用负采样模型对文本信息进行处理得到词序列,通过词序列构建时序文本序列,将时序文本序列输入LSTM网络得到文本特征表示(文本信息网络)。
具体地,以微博这一社交网络平台为例,完整步骤为:
S210.获取N个用户的文本信息,即每个用户最近一个月内在微博社交网络上发布的所有原创微博和转发微博的文本;
S211.通过分词器处理文本信息构建各用户的用户词典,通过index-word、word-index以及one-hot对用户词典中的每个词进行编码;将编码后的词输入负采样模型得到该词的词向量,词向量的维度为l;
具体地,本实施例采用的负采样模型是基于负采样的skip-gram模型,为了降低与输入词(本实施例中指编码后的词)不相关的其他噪声词对输出(本实施例中指用户词典中的每个词的词向量)的影响和计算复杂度,其目标函数表示为:
Figure BDA0003797365750000071
其中,M,neg分别表示用户词典中的单词总数和负采样单词总数,σ(·)表示sigmoid函数,
Figure BDA0003797365750000072
表示用户词典中第i个单词w的输入向量(编码后的单词w),
Figure BDA0003797365750000073
表示上下文输出向量和噪声词输出向量。
S212.一条微博的文本中所有词对应的词向量构成一个词序列;根据原创微博和转发微博的类别分为原创词序列和转发词序列;
S213.考虑到社交网络中文本信息的冗余、时效性,选取用户i的s个原创词序列或s个转发词序列,按照时间顺序构成用户i的时序文本序列
Figure BDA0003797365750000074
N个用户的时序文本序列组成一个文本向量矩阵
Figure BDA0003797365750000075
具体地,
Figure BDA0003797365750000076
其中,
Figure BDA0003797365750000077
表示第i个用户在t时刻的时序文本序列,
Figure BDA0003797365750000078
表示第i个用户在t时刻的时序文本序列中的第s个词序列,m(不足用零填充)是用户按照时间排好序的文本长度。
S214.将文本向量矩阵Ct经过LSTM网络后生成文本特征表示Ct+1
由于用户的兴趣偏好是动态的,随着时间的推移,随机形成的兴趣会被遗忘,长期形成的兴趣得到保留,而当前形成的兴趣表明当前作者的兴趣倾向,故而利用LSTM模型的长期依赖性功能,对用户长期以来的兴趣特征以及当前的兴趣特征进行提取,对过程中的随机性兴趣进行衰减,提高对用户喜好的表达能力,获得用户下一时刻兴趣偏好的动态表示,更好的为链接预测服务:
Figure BDA0003797365750000079
其中,
Figure BDA00037973657500000710
表示时序文本序列经过LSTM过滤器后生成的t+1时刻的表示,
Figure BDA00037973657500000711
在一实施例中,引入分层递进式用户交互网络表示算法HPIN2vec(HierarchicalProgressive Interactive Network to vector),挖掘交互行为之间潜在的规律特征,计算用户交互行为,实现社交规律发现,如图3所示,包括:通过交互信息构建分层递进式用户交互矩阵序列,将其与文本特征表示进行卷积得到分层递进式的用户文本交互快照图序列,将用户文本交互快照图序列输入LSTM网络得到交互网络结构特征表示。
具体地,同样以微博这一社交网络平台为例,完整步骤为:
S220.获取用户的多种交互行为的数据,本实施例中包括点赞、评论、转发和关注四种交互行为的数据;
S221.每一种交互行为构建一个邻接矩阵,将邻接矩阵根据交互行为产生关系链接的难度由小到大排列,得到邻接矩阵序列;本实施例中四种交互行为产生关系链接的难度由小到大分别是点赞、评论、转发和关注;
S222.不同的交互行为产生关系链接的难度不同,故而简单的行为递进序列学习到的特征存在链接越来越少的短板,所以对邻接矩阵序列进行前项求和得到分层递进式用户交互矩阵序列Mt,每一层的递进交互矩阵的计算表示为:
Figure BDA0003797365750000081
其中,Ai表示邻接矩阵序列中的第i个邻接矩阵,n表示分层递进式用户交互矩阵序列的层数,n与交互行为的种类数相同,在本实施例中有四种交互行为,故n=4,Mn表示分层递进式用户交互矩阵序列中第n层的递进交互矩阵,Mt={M1,M2,…,Mn}。
具体地,A1、A2、A3、A4分别代表点赞、评论、转发以及关注关系的邻接矩阵,则M1=A1,M2=A1+A2,M3=A1+A2+A3,M4=A1+A2+A3+A4
S223.为了进一步处理用户自身信息之外的交互特征以及构建统一化的表达矩阵,为了只获取交互行为的特征,不会对用户自身信息特征造成衰减,去除图卷积网络中的度矩阵,构建基于TT2vec的图卷积网络模型;将所有用户的文本特征表示
Figure BDA0003797365750000082
作为图卷积网络模型的输入,将其分别与分层递进式用户交互矩阵序列Mt={M1,M2,…,Mn}中的递进交互矩阵做卷积运算,获得分层递进式的用户文本交互快照图序列,简单表示为:
Figure BDA0003797365750000091
G1表示用户文本交互快照图序列中的第一个卷积结果,是由M1与Ct+1卷积得到的;
S224.为了获得网络结构的演变信息,将用户文本交互快照图序列输入LSTM网络进行信息提取,得到交互网络结构特征表示,表示为:
Figure BDA0003797365750000092
S3.将文本特征表示与交互网络结构特征表示融合,得到用户特征表示:
Figure BDA0003797365750000093
Vt+1={V(u0),···,V(ui),…,V(uN)},ui表示第i个用户节点,V(ui)表示用户节点ui的初步特征向量。
S4.计算用户特征表示中用户节点ui与其余用户节点的相关性,并进行降序排列,从序列中选取前k个相关性对应的用户节点构成用户节点ui的强相关用户组
Figure BDA0003797365750000094
通过计算节点向量间的相似度来获得用户之间的相关性,节点间的相似度越高,相关性也就越强。
具体地,采用余弦相似度计算用户节点间的相关性,表示为:
Figure BDA0003797365750000095
其中,ux、uy为用户特征表示中的任意两个用户节点,V(ux)、V(uy)分别表示用户节点ux和用户节点uy的初步特征向量,pi、qi表示初步特征向量V(ux)和V(uy)的分量,b表示初步特征向量的维度。
S5.将用户节点ui的强相关用户组输入图注意力模型GAT,得到用户节点ui的新特征V(ui)′。
具体地,
Figure BDA0003797365750000101
Figure BDA0003797365750000102
为了使自注意力能够稳定的表示节点,这里引入了多头注意力机制来提高模型的表征能力:
Figure BDA0003797365750000103
其中,θij表示用户ui与用户uj间经过归一化后的注意力系数,Attij表示用户ui与用户uj间的注意力系数,
Figure BDA0003797365750000104
表示一个大小为2l′的权重向量,W表示l×l′转换矩阵,
Figure BDA0003797365750000105
表示得到强相关用户组后的用户节点ui的特征向量,
Figure BDA0003797365750000106
表示用户节点ui的强相关用户组中的用户uj的特征向量,R表示R重注意力机制。
S7.重复步骤S5-S6得到社交网络中每个用户节点的新特征,基于新特征计算任一用户节点与其余用户节点的相似度,得到每个用户节点的关系预测结果。
具体地,如图4所示,本实施例将关系链接预测任务定义为一个多分类任务,并将建立连接的交互行为由个体到群体,进而分析社交活动链接趋势,判定链接类型。在预测过程中,使用激活函数softmax将输出表示为用户之间是否建立链接的概率值,神经网络输出的5个节点分别代表未建立连接、建立点赞连接、评论连接、转发连接以及关注连接,每个节点的激活函数定义如下所示:
Figure BDA0003797365750000107
其中,
Figure BDA0003797365750000108
表示第i类关系链接的概率,n表示链接类型的种类数量,σi(z)表示归一化后的概率值。
关系预测模型最终的输出值表示用户ui和其邻居之间建立连接的链接强度等级,根据链接强度等级辨别是否建立链接以及建立的链接类型,具体定义如下所示:
Figure BDA0003797365750000111
其中,
Figure BDA0003797365750000112
表示用户节点ui和uj间的相关性,
Figure BDA0003797365750000113
表示用户节点ui的强相关用户组,Y=0表示预测的链接强度等级为0,用户节点ui和uj间可能无链接关系;Y=1表示预测的链接强度等级为1,用户节点ui和uj间可能建立点赞链接关系;Y=2表示预测的链接强度等级为2,用户节点ui和uj间可能建立评论链接关系;Y=3表示预测的链接强度等级为3,用户节点ui和uj间可能建立转发链接关系;Y=4表示预测的链接强度等级为4,用户节点ui和uj间可能建立关注链接关系,U、L、C、Fd、Fw为超参数,分别表示链接强度等级为0、1、2、3、4的取值范围。
具体地,在关系预测模型的训练过程使用损失函数计算损失,其表示为:
L=-∑y∈YPylog(Py)
其中,Py表示用户在不同连接类型下的相似概率,Y表示预测的链接强度等级。
在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种基于社交网络平台动态交互的关系预测方法,其特征在于,包括以下步骤:
S1.在线获取用户数据,其包括用户在社交网络中的交互信息和文本信息;
S2.采用负采样模型对文本信息进行处理得到词序列,通过词序列构建文本序列,将文本序列输入LSTM网络得到文本特征表示;
S3.通过交互信息构建分层递进式用户交互矩阵序列,将其与文本特征表示进行卷积得到分层递进式的用户文本交互快照图序列,将用户文本交互快照图序列输入LSTM网络得到交互网络结构特征表示;
S4.将文本特征表示与交互网络结构特征表示融合,得到用户特征表示;
S5.计算用户特征表示中用户节点ui与其余用户节点的相关性,并进行降序排列,从序列中选取前K个相关性对应的用户节点构成用户节点ui的强相关用户组;
S6.将用户节点ui的强相关用户组输入图注意力模型,得到用户节点ui的新特征;
S7.重复步骤S5-S6得到社交网络中每个用户节点的新特征,基于新特征计算任一用户节点与其余用户节点的相似度,得到每个用户节点的关系预测结果。
2.根据权利要求1所述的一种基于社交网络平台动态交互的关系预测方法,其特征在于,步骤S2得到文本特征表示的具体过程为:
S210.获取N个用户的文本信息,即每个用户最近一个月内在社交网络上发布的所有原创内容和转发内容;
S211.通过分词器处理文本信息构建各用户的用户词典,并对用户词典中的每个词进行编码;将编码后的词输入负采样模型得到该词的词向量;
S212.一条内容中所有词对应的词向量构成一个词序列;根据原创内容和转发内容的类别分为原创词序列和转发词序列;
S213.选取用户i的s个原创词序列或s个转发词序列,按照时间顺序构成用户i的时序文本序列
Figure FDA0003797365740000021
N个用户的时序文本序列组成一个文本向量矩阵Ct
S214.将文本向量矩阵Ct经过LSTM网络后生成文本特征表示Ct+1
其中,
Figure FDA0003797365740000022
为N个用户的时序文本序列组成的文本向量矩阵,
Figure FDA0003797365740000023
Figure FDA0003797365740000024
表示第i个用户在t时刻的时序文本序列,
Figure FDA0003797365740000025
表示第i个用户在t时刻的时序文本序列中的第s个词序列。
3.根据权利要求1所述的一种基于社交网络平台动态交互的关系预测方法,其特征在于,步骤S3通过交互信息构建分层递进式用户交互矩阵序列的过程为:
S310.获取用户的多种交互行为的数据,每一种交互行为构建一个邻接矩阵,将邻接矩阵根据交互行为产生关系链接的难度由小到大排列,得到邻接矩阵序列;
S311.对邻接矩阵序列进行前项求和得到分层递进式用户交互矩阵序列,表示为:
Figure FDA0003797365740000026
其中,Ai表示邻接矩阵序列中的第i个邻接矩阵,n表示分层递进式用户交互矩阵序列的层数,Mn表示分层递进式用户交互矩阵序列中第n层的递进交互矩阵。
4.根据权利要求1所述的一种基于社交网络平台动态交互的关系预测方法,其特征在于,步骤S5采用余弦相似度计算用户节点间的相关性,表示为:
Figure FDA0003797365740000027
其中,ux、uy为用户特征表示中的任意两个用户节点,V(ux)、V(uy)分别表示用户节点ux和用户节点uy的初步特征向量,pi、qi表示初步特征向量V(ux)和V(uy)的分量,b表示初步特征向量的维度。
5.根据权利要求1所述的一种基于社交网络平台动态交互的关系预测方法,其特征在于,关系预测模型通过用户节点ui与其邻居节点建立连接的概率输出预测结果,表示为:
Figure FDA0003797365740000031
其中,
Figure FDA0003797365740000032
表示用户节点ui和uj间的相关性,
Figure FDA0003797365740000033
表示用户节点ui的强相关用户组,Y={0,1,2,3,4}表示预测的链接强度等级分别为0、1、2、3、4,U、L、C、Fd、Fw分别表示链接强度等级为0、1、2、3、4的取值范围。
6.根据权利要求1所述的一种基于社交网络平台动态交互的关系预测方法,其特征在于,在关系预测的训练过程使用损失函数计算损失,其表示为:
L=-∑y∈YPylog(Py)
其中,Py表示用户在不同连接类型下的相似概率,Y表示预测的链接强度等级。
CN202210972715.8A 2022-08-15 2022-08-15 一种基于社交网络平台动态交互的关系预测方法 Pending CN115293437A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210972715.8A CN115293437A (zh) 2022-08-15 2022-08-15 一种基于社交网络平台动态交互的关系预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210972715.8A CN115293437A (zh) 2022-08-15 2022-08-15 一种基于社交网络平台动态交互的关系预测方法

Publications (1)

Publication Number Publication Date
CN115293437A true CN115293437A (zh) 2022-11-04

Family

ID=83830465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210972715.8A Pending CN115293437A (zh) 2022-08-15 2022-08-15 一种基于社交网络平台动态交互的关系预测方法

Country Status (1)

Country Link
CN (1) CN115293437A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115829159A (zh) * 2022-12-29 2023-03-21 人民网股份有限公司 社交媒体粉丝新增预测方法、装置、设备及存储介质
CN115878907A (zh) * 2022-12-28 2023-03-31 人民网股份有限公司 基于用户依赖关系的社交网络转发行为预测方法及装置
CN116562357A (zh) * 2023-07-10 2023-08-08 深圳须弥云图空间科技有限公司 点击预测模型训练方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115878907A (zh) * 2022-12-28 2023-03-31 人民网股份有限公司 基于用户依赖关系的社交网络转发行为预测方法及装置
CN115878907B (zh) * 2022-12-28 2023-08-11 人民网股份有限公司 基于用户依赖关系的社交网络转发行为预测方法及装置
CN115829159A (zh) * 2022-12-29 2023-03-21 人民网股份有限公司 社交媒体粉丝新增预测方法、装置、设备及存储介质
CN115829159B (zh) * 2022-12-29 2023-11-10 人民网股份有限公司 社交媒体粉丝新增预测方法、装置、设备及存储介质
CN116562357A (zh) * 2023-07-10 2023-08-08 深圳须弥云图空间科技有限公司 点击预测模型训练方法及装置
CN116562357B (zh) * 2023-07-10 2023-11-10 深圳须弥云图空间科技有限公司 点击预测模型训练方法及装置

Similar Documents

Publication Publication Date Title
CN113254803B (zh) 一种基于多特征异质图神经网络的社交推荐方法
CN112214685B (zh) 一种基于知识图谱的个性化推荐方法
CN115293437A (zh) 一种基于社交网络平台动态交互的关系预测方法
CN111368074B (zh) 一种基于网络结构和文本信息的链路预测方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及***
CN110837602B (zh) 基于表示学习和多模态卷积神经网络的用户推荐方法
CN112115377B (zh) 一种基于社交关系的图神经网络链路预测推荐方法
KR102234850B1 (ko) 릴레이션 네트워크에 기반한 지식 보완 방법 및 장치
CN110795641B (zh) 基于表示学习的网络谣言传播控制方法
CN111709518A (zh) 一种基于社区感知和关系注意力的增强网络表示学习的方法
CN110751188B (zh) 基于多标记学习的用户标签预测方法、***及存储介质
CN112307351A (zh) 用户行为的模型训练、推荐方法、装置和设备
CN113065649B (zh) 一种复杂网络拓扑图表示学习方法、预测方法及服务器
CN108647800B (zh) 一种基于节点嵌入的在线社交网络用户缺失属性预测方法
CN114780831A (zh) 基于Transformer的序列推荐方法及***
CN113254782B (zh) 问答社区专家推荐方法及***
CN113158071A (zh) 一种基于图神经网络的知识社交推荐方法、***和设备
CN113919440A (zh) 一种融合双重注意力机制和图卷积社交网络谣言检测***
CN116842267A (zh) 基于深度学习的个性化装修方案推荐方法、***及介质
CN110910235A (zh) 一种基于用户关系网络的贷中异常行为检测方法
CN114780841B (zh) 一种基于kphan的序列推荐方法
CN116522232A (zh) 文档分类方法、装置、设备及存储介质
CN114842247B (zh) 基于特征累加的图卷积网络半监督节点分类方法
CN115577288A (zh) 面向内容的群体观点预测方法及***
CN114840777A (zh) 多维度养老服务推荐方法、装置以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination