CN108596205B - 基于地域相关因子与稀疏表示的微博转发行为预测方法 - Google Patents

基于地域相关因子与稀疏表示的微博转发行为预测方法 Download PDF

Info

Publication number
CN108596205B
CN108596205B CN201810231543.2A CN201810231543A CN108596205B CN 108596205 B CN108596205 B CN 108596205B CN 201810231543 A CN201810231543 A CN 201810231543A CN 108596205 B CN108596205 B CN 108596205B
Authority
CN
China
Prior art keywords
user
microblog
topic
sparse representation
correlation factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810231543.2A
Other languages
English (en)
Other versions
CN108596205A (zh
Inventor
吴渝
张宏斌
李红波
储伟
林江鹏
艾伟东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201810231543.2A priority Critical patent/CN108596205B/zh
Publication of CN108596205A publication Critical patent/CN108596205A/zh
Application granted granted Critical
Publication of CN108596205B publication Critical patent/CN108596205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明请求保护一种基于主题地域相关因子与稀疏表示的微博转发行为预测方法,主要涉及机器学习及社交网络信息分析领域。首先,基于社交网络中用户关系以及用户行为数据,提取用户基本特征、微博基本特征、用户活跃度、用户的亲密程度、融入主题地域相关因子的用户兴趣度特征。其次,通过稀疏表示分类算法对特征组进行微博转发行为预测。本发明有效解决了目前微博转发行为预测计算时间长,准确率不高的问题。

Description

基于地域相关因子与稀疏表示的微博转发行为预测方法
技术领域
本发明属于社交网络信息分析领域以及机器学习领域,主要涉及一种社交网络转发预测方式。
背景技术
微博,即微型博客的简称,是一种通过关注机制分享实时信息的广播式的社交网络平台。其具有便捷性、背对脸、原创性、草根性的特点,同时具有反腐、打拐、营销、自媒体等效应。
转发是微博的一个重要机制。微博网络中,信息的传播主要是通过微博的转发实现的。当微博上某用户发布一条博文,该博文会被推送给该用户的全部粉丝,而当其粉丝看到这条博文后,可以选择转发这条博文,***会将此博文再推送给这个粉丝用户的全部粉丝。微博信息通过用户的转发行为在微博平台上实现了持续的传播。因此,研究微博的转发行为对研究信息在微博中传播,比如微博用户行为和兴趣、突发事件预测、控制敏感信息、网络舆情监控、产品营销、以及用户推荐等方面具有重要意义。
在微博转发行为预测中,能采集到的特征众多,而数据集中存在本身与预测无关的特征以及冗余特征,如果选择了几乎不具辨别能力的特征,将导致设计的预测模型性能低下,但若是选择的特征具有充分辨别能力,则会极大提高预测模型的预测精度。
近年来,针对微博转发行为预测准确率不高,特征选择任意性的问题,国内外学者展开了广泛和深入的研究。Petrovic等人通过人工实验证明了微博转发预测的可行性,然后利用改进的passive-aggressive算法预测转发,但正确率仅为46.6%。Morchid等人的研究表明选取的特征如果有较高的辨别能力,预测算法的性能会得到有效的提高。张旸等人提出了一种微博转发行为预测的方法。首先将微博转发转换为二元分类问题,然后使用支持向量机(Support Vector Machine,SVM)算法对加权后的各特征进行训练,但该模型未考虑个性化的用户兴趣特征,且预测命中率仅有85.9%,以及算法执行时间长。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种提高预测准确率、减少预测执行时间的基于地域相关因子与稀疏表示的微博转发行为预测方法。本发明的技术方案如下:
一种基于地域相关因子与稀疏表示的微博转发行为预测方法,其包括以下步骤:
步骤1:从数据中提取用户基本特征、微博基本特征;
步骤2:通过已提取的用户及微博基本特征计算用户活跃度、用户的亲密程度、基于主题地域相关因子的用户兴趣度;
步骤3:对步骤2的包括用户活跃度、用户的亲密程度、基于主题地域相关因子的用户兴趣度在内的多维数据特征进行特征筛选;
步骤4:筛选后的特征组通过稀疏表示分类算法进行转发预测,得到最终预测结果。
进一步的,所述步骤1从数据中提取用户基本特征、微博基本特征具体包括:
步骤1.1:提取用户基本特征:用户昵称、用户所在地、用户姓名、用户粉丝数、用户关注数、用户微博数、用户创建时间;
步骤1.2:提取微博发布时间、微博具体内容、微博是否为转发、是否分享图片、是否含有链接、微博来源、微博转发数、微博评论数以及微博被赞数。
进一步的,所述步骤2用户的亲密程度为
Figure BDA0001602707520000021
其中,rij表示用户i转发j的微博消息数,cij表示用户i评论j的微博消息数,aij表示i提及用户j的次数;
所述用户活跃度为
Figure BDA0001602707520000022
Figure BDA0001602707520000031
其中,PA为发表活跃度,RA为转发活跃度,n为用户在时间t内发表的微博数量,ri为用户第i天转发的微博数量,pi为用户第i天发送的数量。
进一步的,所述步骤2中用户兴趣度引入主题地域相关因子,
融入主题地域相关因子的用户兴趣度表示为:
Figure BDA0001602707520000032
其中,I表示用户兴趣度,S表示兴趣相近度,T表示主题地域相关因子。
进一步的,所述主题地域相关因子计算公式为:
Figure BDA0001602707520000033
其中,Zm表示微博m的主题词语集合,∩表示交集R表示接收用户的所在地区;
所述兴趣相近度为
Figure BDA0001602707520000034
其中,I表示用户兴趣空间,J表示新微博特征空间。∪表示并集。
进一步的,所述主题地域相关因子采用隐含狄利克雷主题模型LDA,生成文档的主题词;
根据隐含狄利克雷分布主题模型的生成过程,词语wm,n的生成概率为:
Figure BDA0001602707520000035
θm表示文档m的主题分布,
Figure BDA0001602707520000036
表示主题k的词分布,t表示词语t,wm,n表示文档m的第n个词语,k表示主题k,zm,n表示为微博m的第n个单词的主题
而LDA模型生成文档m及产生Nm个单词的生成概率为:
Figure BDA0001602707520000037
α表示文档中隐含主题间的强弱关系,β表示隐含主题的概率分布,
Figure BDA0001602707520000038
表示文档m中第n个单词的词分布,wm表示文档m的所有词语
多篇微博文档形成语料集,似然计算如下:
Figure BDA0001602707520000041
以每个用户发布的微博内容为文本预料,先进行预处理,再训练微博主题模型找出核心词语。预处理流程为,先根据“结巴分词”对源内容进行分词,其次去除停用词和标点符号,接着英语单词词干化。设置参数α,β,K从而构建主题模型。K表示主题数量
进一步的,所述步骤3是采用主成分分析方法对已有特征数据降维去噪。
进一步的,所述步骤4)筛选后的特征组通过稀疏表示分类算法进行转发预测,得到最终预测结果,具体包括:
稀疏表示分类(Sparse Representation based Classification,SRC)是通过借助超完备字典,用尽可能少的信号来表示原有信号,其中许多数值约为零的系数被丢弃,并通过最小重构误差来分类。
min||x||0subject to Ax=y(11)
其中,||x||0表示x中非零元素的个数,A为字典,y为待处理信号。显然我们希望x尽可能稀疏,即||x||0尽可能小。通过L0范数表示稀疏性,在计算实现上复杂,因此将L0范数转换为L1范数处理,如式(12)。
min||x||1subject to Ax=y (12)
因此,L1范数的求解可以转变为最优凸近似问题,可以通过L1正则近似得到,如式(13)。
Figure BDA0001602707520000042
式(13)是数理模型中的Lasso问题,可以看做是正则最小二乘问题。
SRC分类算法流程如下:
1)输入训练样本集A=[A1,A2,...,Ak]∈Rm*n,测试样本y∈Rm
2)归一化矩阵A的列,为L2范式;
3)解决L1范式最小化问题:
min||x||1subject to||Ax-y||2≤ε,其中ε为重构误差值;
4)计算残差:
ri(y)=||yr-Aδi(x)||2=||yr-ε-Aδi(x)||2,i=1,2,其残差最小的i,则i为y的分类。本发明的优点及有益效果如下:
本发明提出地域相关因子改进用户兴趣度特征,用户兴趣评价不再完全依赖用户历史微博信息从而提高了微博转发预测的准确率。其次,本发明提出使用稀疏表示分类(SRC)进行微博转发预测,提高了转发预测率并且降低了计算耗时。
附图说明
图1是本发明提供优选实施例基于主题地域相关因子与稀疏表示的微博转发行为预测方法整体流程图。
图2为支持向量机下主题地域相关因子有无的准确率比较图;
图3为基于地域相关因子模型的不同算法准确率比较图;
图4为不同预测算法不同数据量的预测耗时对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
图1为本发明基于主题地域相关因子与稀疏表示的微博转发行为预测方法整体流程图,包括如下步骤:
步骤1:从数据中提取用户基本特征、微博基本特征。
步骤1.1:提取用户基本特征:用户昵称、用户所在地、用户姓名、用户粉丝数、用户关注数、用户微博数、用户创建时间。
步骤1.2:微博发布时间、微博具体内容、微博是否为转发、是否分享图片、是否含有链接、微博来源、微博转发数、微博评论数、微博被赞数。
步骤2:基于提取的基本特征计算用户活跃度、用户的亲密程度和基于主题地域相关因子的用户兴趣度。
步骤2.1:通过用户间转发、评论、提及的数量,使用式(1),计算用户的亲密度。
步骤2.2:统计用户的转发数量、原创数量,通过式(2)、式(3),计算用户的活跃度。
步骤2.3:对用户的历史微博内容进行预处理,使用”结巴分词”进行分词处理,再去除停用词,得到用户兴趣空间I。对新微博进行以上相同处理,得到微博特征空间J。根据式(5)计算兴趣相近度,式(6)计算主题相关因子,最终根据式(4)计算用户兴趣度。
所述用户的亲密程度为
Figure BDA0001602707520000061
其中,rij表示用户i转发j的微博消息数,cij表示用户i评论j的微博消息数,aij表示i提及用户j的次数。
所述用户活跃度为
Figure BDA0001602707520000062
Figure BDA0001602707520000063
其中,PA为发表活跃度,RA为转发活跃度,n为用户在时间t内发表的微博数量,ri为用户第i天转发的微博数量,pi为用户第i天发送的数量。
作为本发明的进一步改进,所述用户兴趣度为
Figure BDA0001602707520000064
其中,I表示用户兴趣度,S表示兴趣相近度,T表示主题地域相关因子。
所述兴趣相近度为
Figure BDA0001602707520000071
其中,I表示用户兴趣空间,J表示新微博特征空间。
进一步的,所述主题地域相关因子采用隐含狄利克雷主题模型(LDA),生成文档的主题词。
根据隐含狄利克雷分布主题模型的生成过程,词语wm,n的生成概率为:
Figure BDA0001602707520000072
而LDA模型生成文档m及产生Nm个单词的生成概率为:
Figure BDA0001602707520000073
多篇微博文档形成语料集,似然计算如下:
Figure BDA0001602707520000074
以每个用户发布的微博内容为文本预料,先进行预处理,再训练微博主题模型找出核心词语。预处理流程为,先根据“结巴分词”对源内容进行分词,其次去除停用词和标点符号,接着英语单词词干化。设置参数α,β,K从而构建主题模型。
所述,主题地域相关因子为
Figure BDA0001602707520000075
其中,Zm表示微博m的主题词语集合,R表示接收用户的所在地区。
作为本发明的进一步改进,采用稀疏表示分类作为预测的算法。虽然支持向量机作为传统的算法,能够很好的解决多维数据的二分类问题,但是面对数据量大、维数高的问题,就显得不足了。稀疏表示分类法可以使用尽可能少的原子来表示信号,然后利用最小重构误差来分类,计算时间相对缩短而预测准确率进一步提高。
步骤3:对多维数据特征使用主成分分析进行特征筛选;
步骤4:筛选后的特征组通过稀疏表示算法进行转发预测,得到最终预测结果。预测效果如图3、图4所示。本发明方法主要解决目前微博转发行为预测计算时间长,准确率不高的问题。实验数据特征包括提取的用户基本特征、微博基本特征、以及之后使用基于主题地域相关因子的用户兴趣度特征等多个合成特征;其次,使用主成分分析法对特征数据进一步筛选处理;最后,基于筛选后的数据,使用稀疏表示分类作为微博转发行为预测算法,实现计算速度快、预测结果好的微博转发行为预测。
图2,支持向量机下主题地域相关因子有无的准确率比较图,证明了基于主题地域相关因子的模型有较好的预测效果。
图3,基于地域相关因子模型的不同算法准确率比较图,说明相同转发行为特征下,稀疏表示方法预测准确率更好。
图4,不同预测算法不同数据量的预测耗时对比图,说明稀疏表示算法在数据量大的转发预测中,计算耗时少的优越性更加明显。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (6)

1.一种基于地域相关因子与稀疏表示的微博转发行为预测方法,其特征在于,包括以下步骤:
步骤1:从数据中提取用户基本特征、微博基本特征;
步骤2:通过已提取的用户及微博基本特征计算用户活跃度、用户的亲密程度、基于主题地域相关因子的用户兴趣度;
步骤3:对步骤2的包括用户活跃度、用户的亲密程度、基于主题地域相关因子的用户兴趣度在内的多维数据特征进行特征筛选;
步骤4:筛选后的特征组通过稀疏表示分类算法进行转发预测,得到最终预测结果;
所述步骤2中用户兴趣度引入主题地域相关因子,
融入主题地域相关因子的用户兴趣度表示为:
Figure FDA0003302755500000011
其中,I表示用户兴趣度,S表示兴趣相近度,T表示主题地域相关因子;
所述主题地域相关因子计算公式为:
Figure FDA0003302755500000012
其中,Zm表示微博m的主题词语集合,∩表示交集,R表示接收用户的所在地区;
所述兴趣相近度为
Figure FDA0003302755500000013
其中,H表示用户兴趣空间,J表示新微博特征空间,∪表示并集。
2.根据权利要求1所述的基于地域相关因子与稀疏表示的微博转发行为预测方法,其特征在于,所述步骤1从数据中提取用户基本特征、微博基本特征具体包括:
步骤1.1:提取用户基本特征:用户昵称、用户所在地、用户姓名、用户粉丝数、用户关注数、用户微博数、用户创建时间;
步骤1.2:提取微博发布时间、微博具体内容、微博是否为转发、是否分享图片、是否含有链接、微博来源、微博转发数、微博评论数以及微博被赞数。
3.根据权利要求1所述的基于地域相关因子与稀疏表示的微博转发行为预测方法,其特征在于,所述步骤2用户的亲密程度为
Figure FDA0003302755500000021
所述用户活跃度为
Figure FDA0003302755500000022
Figure FDA0003302755500000023
其中,PA为发表活跃度,RA为转发活跃度,n为用户在时间t内发表的微博数量,ri为用户第i天转发的微博数量,pi为用户第i天发送的数量。
4.根据权利要求1所述的基于地域相关因子与稀疏表示的微博转发行为预测方法,其特征在于,所述主题地域相关因子采用隐含狄利克雷主题模型LDA,生成文档的主题词;
根据隐含狄利克雷分布主题模型的生成过程,词语wm,n的生成概率为:
Figure FDA0003302755500000024
θm表示文档m的主题分布,
Figure FDA0003302755500000025
表示主题k的词分布,t表示词语t,wm,n表示文档m的第n个词语,zm,n表示为微博m的第n个单词的主题;
而LDA模型生成文档m及产生Nm个单词的生成概率为:
Figure FDA0003302755500000026
α表示文档中隐含主题间的强弱关系,β表示隐含主题的概率分布,
Figure FDA0003302755500000027
表示文档m中第n个单词的词分布,多篇微博文档形成语料集,似然计算如下:
Figure FDA0003302755500000028
以每个用户发布的微博内容为文本语料,先进行预处理,再训练微博主题模型找出核心词语,预处理流程为,先根据“结巴分词”对源内容进行分词,其次去除停用词和标点符号,接着英语单词词干化,设置参数α,β,K从而构建主题模型,K表示主题数量。
5.根据权利要求1所述的基于地域相关因子与稀疏表示的微博转发行为预测方法,其特征在于,所述步骤3是采用主成分分析方法对已有特征数据降维去噪。
6.根据权利要求1所述的基于地域相关因子与稀疏表示的微博转发行为预测方法,其特征在于,所述步骤4筛选后的特征组通过稀疏表示分类算法进行转发预测,得到最终预测结果,具体包括:
稀疏表示分类SRC是通过借助超完备字典,用尽可能少的信号来表示原有信号,其中许多数值约为零的系数被丢弃,并通过最小重构误差来分类;
min||x||0 subject to Ax=y (11)
其中,||x||0表示x中非零元素的个数,A为字典,y为待处理信号,通过L0范数表示稀疏性,在计算实现上复杂,因此将L0范数转换为L1范数处理,如式(12);
min||x||1 subject to Ax=y (12)
因此,L1范数的求解可以转变为最优凸近似问题,可以通过L1正则近似得到,如式(13):
Figure FDA0003302755500000031
式(13)是数理模型中的Lasso问题,可以看做是正则最小二乘问题;
SRC分类算法流程如下:
1)输入训练样本集A=[A1,A2,...,Ak]∈Rm*n,测试样本y∈Rm
2)归一化矩阵A的列,为L2范式;
3)解决L1范式最小化问题:
min||x||1subject to||Ax-y||2≤ε,其中ε为重构误差值;
4)计算残差:ri(y)=||yr-Aδi(x)||2=||yr-ε-Aδi(x)||2,i=1,2,其残差最小的i,则i为y的分类。
CN201810231543.2A 2018-03-20 2018-03-20 基于地域相关因子与稀疏表示的微博转发行为预测方法 Active CN108596205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810231543.2A CN108596205B (zh) 2018-03-20 2018-03-20 基于地域相关因子与稀疏表示的微博转发行为预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810231543.2A CN108596205B (zh) 2018-03-20 2018-03-20 基于地域相关因子与稀疏表示的微博转发行为预测方法

Publications (2)

Publication Number Publication Date
CN108596205A CN108596205A (zh) 2018-09-28
CN108596205B true CN108596205B (zh) 2022-02-11

Family

ID=63626866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810231543.2A Active CN108596205B (zh) 2018-03-20 2018-03-20 基于地域相关因子与稀疏表示的微博转发行为预测方法

Country Status (1)

Country Link
CN (1) CN108596205B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829504B (zh) * 2019-02-14 2022-07-01 重庆邮电大学 一种基于ics-svm分析用户转发行为的预测方法及***
CN112487303B (zh) * 2020-11-26 2022-04-22 杭州电子科技大学 一种基于社交网络用户属性的主题推荐方法
CN116166788A (zh) * 2023-01-12 2023-05-26 烟台大学 基于内外动态因素感知的用户主题兴趣偏好预测方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201663612U (zh) * 2010-03-05 2010-12-01 东莞市华业龙图信息技术有限公司 一种基于位置服务的用户兴趣建模***
CN103870447A (zh) * 2014-03-11 2014-06-18 北京优捷信达信息科技有限公司 一种基于隐含狄利克雷模型的关键词抽取方法
CN103970863A (zh) * 2014-05-08 2014-08-06 清华大学 基于lda主题模型的微博用户兴趣的挖掘方法及***
CN104008203A (zh) * 2014-06-17 2014-08-27 浙江工商大学 一种融入本体情境的用户兴趣挖掘方法
CN104915392A (zh) * 2015-05-26 2015-09-16 国家计算机网络与信息安全管理中心 一种微博转发行为预测方法及装置
CN106547901A (zh) * 2016-11-08 2017-03-29 周口师范学院 一种基于能量优化的微博用户转发行为预测方法
CN106682208A (zh) * 2016-12-30 2017-05-17 桂林电子科技大学 基于融合特征筛选与随机森林的微博转发行为预测方法
CN106682770A (zh) * 2016-12-14 2017-05-17 重庆邮电大学 一种基于好友圈子的动态微博转发行为预测***及方法
CN107590558A (zh) * 2017-03-07 2018-01-16 北京理工大学 一种基于多层集成学习的微博转发预测方法
CN107679101A (zh) * 2017-09-12 2018-02-09 重庆邮电大学 一种基于位置和信任关系的网络服务推荐方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201663612U (zh) * 2010-03-05 2010-12-01 东莞市华业龙图信息技术有限公司 一种基于位置服务的用户兴趣建模***
CN103870447A (zh) * 2014-03-11 2014-06-18 北京优捷信达信息科技有限公司 一种基于隐含狄利克雷模型的关键词抽取方法
CN103970863A (zh) * 2014-05-08 2014-08-06 清华大学 基于lda主题模型的微博用户兴趣的挖掘方法及***
CN104008203A (zh) * 2014-06-17 2014-08-27 浙江工商大学 一种融入本体情境的用户兴趣挖掘方法
CN104915392A (zh) * 2015-05-26 2015-09-16 国家计算机网络与信息安全管理中心 一种微博转发行为预测方法及装置
CN106547901A (zh) * 2016-11-08 2017-03-29 周口师范学院 一种基于能量优化的微博用户转发行为预测方法
CN106682770A (zh) * 2016-12-14 2017-05-17 重庆邮电大学 一种基于好友圈子的动态微博转发行为预测***及方法
CN106682208A (zh) * 2016-12-30 2017-05-17 桂林电子科技大学 基于融合特征筛选与随机森林的微博转发行为预测方法
CN107590558A (zh) * 2017-03-07 2018-01-16 北京理工大学 一种基于多层集成学习的微博转发预测方法
CN107679101A (zh) * 2017-09-12 2018-02-09 重庆邮电大学 一种基于位置和信任关系的网络服务推荐方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Kernel sparse representatio n based classi fication;Jun Yin等;《Neurocomputing》;20121231;第120–128页 *
基于理性行为理论的微博用户转发行为影响因素研究;陈姝等;《情报杂志》;20171130;第205页 *
多特征神经网络微博转发预测;王志峰等;《辽宁石油化工大学学报》;20171231;第47-50页 *
融合兴趣和行为的用户转发行为预测;刘清;《电子技术与软件工程》;20170201;第147-160页 *

Also Published As

Publication number Publication date
CN108596205A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN107608956B (zh) 一种基于cnn-grnn的读者情绪分布预测算法
CN105824922B (zh) 一种融合深层特征和浅层特征的情感分类方法
Yoon et al. Detecting incongruity between news headline and body text via a deep hierarchical encoder
Karayiğit et al. Detecting abusive Instagram comments in Turkish using convolutional Neural network and machine learning methods
CN110457711B (zh) 一种基于主题词的社交媒体事件主题识别方法
CN113704546A (zh) 基于空间时序特征的视频自然语言文本检索方法
CN108596205B (zh) 基于地域相关因子与稀疏表示的微博转发行为预测方法
Mertiya et al. Combining naive bayes and adjective analysis for sentiment detection on Twitter
US20220058464A1 (en) Information processing apparatus and non-transitory computer readable medium
Parveen et al. Twitter sentiment analysis using hybrid gated attention recurrent network
Wan Sentiment analysis of Weibo comments based on deep neural network
Alkhodair et al. Detecting high-engaging breaking news rumors in social media
CN112115712A (zh) 基于话题的群体情感分析方法
CN116245110A (zh) 基于图注意力网络的多维度信息融合用户立场检测方法
Rao et al. Result prediction for political parties using Twitter sentiment analysis
CN114065749A (zh) 一种面向文本的粤语识别模型及***的训练、识别方法
CN116522013B (zh) 基于社交网络平台的舆情分析方法及***
Mehendale et al. Cyber bullying detection for hindi-english language using machine learning
Mediayani et al. Determining Trending Topics in Twitter with a Data Streaming Method in R
Marerngsit et al. A two-stage text-to-emotion depressive disorder screening assistance based on contents from online community
Shi et al. SRTM: A Sparse RNN-Topic Model for Discovering Bursty Topics in Big Data of Social Networks.
CN115599915A (zh) 基于TextRank与注意力机制的长文本分类方法
Ling Coronavirus public sentiment analysis with BERT deep learning
Shah et al. Cyber-bullying detection in hinglish languages using machine learning
US20220269704A1 (en) Irrelevancy filtering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant