CN105224608B - 基于微博数据分析的热点新闻预测方法及*** - Google Patents

基于微博数据分析的热点新闻预测方法及*** Download PDF

Info

Publication number
CN105224608B
CN105224608B CN201510562298.XA CN201510562298A CN105224608B CN 105224608 B CN105224608 B CN 105224608B CN 201510562298 A CN201510562298 A CN 201510562298A CN 105224608 B CN105224608 B CN 105224608B
Authority
CN
China
Prior art keywords
news
topic
microblog
hot
microblogging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510562298.XA
Other languages
English (en)
Other versions
CN105224608A (zh
Inventor
陈健
韩超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201510562298.XA priority Critical patent/CN105224608B/zh
Publication of CN105224608A publication Critical patent/CN105224608A/zh
Application granted granted Critical
Publication of CN105224608B publication Critical patent/CN105224608B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于微博数据分析的热点新闻预测方法及***,所述方法包括:从主流新闻网站采集新闻报道及其在微博上引起的微博用户反应信息;对微博文本进行分词和词频统计,计算词的TF‑IDF值,并转换为使用向量空间描述一个微博话题;对微博话题进行分类,并统计描述微博话题的各个量化指标,计算新闻的各个热度指标;采用多元线性回归算法对样本数据进行学习,建立热点新闻预测模型,并判断之后的新闻是否会成为热点;所述***包括数据采集模块、文本分析处理模块、数据统计分析模块和热点新闻预测模块。本发明对媒体报道的新闻在微博话题中的趋势进行全面分析,预测新闻是否会成为舆情热点,能够很好地解决热点新闻早期预测问题。

Description

基于微博数据分析的热点新闻预测方法及***
技术领域
本发明涉及一种热点新闻预测方法及***,尤其是一种基于微博数据分析的热点新闻预测方法及***,属于政府舆情监控中的热点新闻自动预测领域。
背景技术
随着互联网技术的快速发展,网络舆情越来越影响社会的稳定发展,监控网络舆情是政府维护社会安定的一个重要环节。作为舆情监控其中的一个环节,热点新闻的预测显得尤其关键。微博以其独特的传播特性和实时交互特性改变着传统新闻信息的传播方式。尤其微博和移动终端的的结合,使微博信息能够更加快速的被转发或评论,微博平台上大量的用户评论和交流信息能够快速汇集为观点,从而形成一定的舆论走向。微博天然的开放性、实时性、交互性、海量性和易检性,构成了热点新闻预测的基础。通过综合分析新闻在微博平台的话题量判断新闻的热度。
传统的舆情热点话题仅仅是通过点击数、转发数、评论数等数据进行判断,但这种热点话题预测技术并不能够全面分析热点话题的特征,无法发现潜在成为热点的话题。
发明内容
本发明的目的是为了解决上述现有技术的缺陷,提供了一种基于微博数据分析的热点新闻预测方法,该方法对媒体报道的新闻在微博话题中的趋势进行全面分析,预测新闻是否会成为舆情热点,能够很好地解决热点新闻早期预测问题。
本发明的另一目的在于提供一种基于微博数据分析的热点新闻预测***。
本发明的目的可以通过采取如下技术方案达到:
基于微博数据分析的热点新闻预测方法,所述方法包括以下步骤:
S1、从主流新闻网站采集新闻报道及其在微博上引起的微博用户反应信息;
S2、对微博文本进行分词和词频统计,计算词的TF-IDF值,并转换为使用向量空间描述一个微博话题;
S3、对微博话题进行分类,并统计描述微博话题的各个量化指标,计算新闻的各个热度指标;
S4、采用多元线性回归算法对样本数据进行学习,建立热点新闻预测模型,并根据热点新闻预测模型判断之后的新闻是否会成为热点。
作为一种实施方案,步骤S3中,所述对微博话题进行分类,具体包括:
1)统计社会热点,计算各社会热点的关注度;
2)根据社会热点对微博话题进行分类,计算微博话题的社会关注度。
作为一种实施方案,步骤S3中,所述统计描述微博话题的各个量化指标,具体为:提取描述微博话题的三个特征维度作为量化指标,分别为微博话题的公众响应力、微博话题的核心响应力和微博话题的传播力度。
作为一种实施方案,步骤S3中,所述计算新闻的各个热度指标,具体为:根据描述微博话题的量化指标从多个角度对新闻的热度进行全面分析,新闻的三个热度指标分别为新闻关注度、新闻影响力和新闻传播度。
作为一种实施方案,步骤S4中,所述采用多元线性回归算法对样本数据进行学习,建立热点新闻预测模型,具体包括:
1)变量选择:选择新闻热度作为因变量,新闻的三个热度指标作为自变量,根据定义有新闻的各个热度指标与新闻热度值之间存在且服从线性关系;
2)模型设定:根据所研究的热点新闻预测问题,设定多元线性回归模型;
3)参数估计:使用样本数据学习步骤2)设定的多元线性回归模型的参数,建立热点新闻预测模型;
4)模型检验:热点新闻预测模型建立后,采用F检验和R检验分别对模型的拟合度、显著性进行检验;
5)模型运用:将建立的热点新闻预测模型应用于预测热点新闻。
作为一种实施方案,所述多元线性回归模型,如下式:
其中,R表示新闻热度,Nfoc、Ninf和Ntrans表示新闻的三个热度指标,θ1、θ2、θ3分别是与新闻的三个热度指标无关的未知参数,∈是整体回归函数的随机干扰项。
本发明的另一目的可以通过采取如下技术方案达到:
基于微博数据分析的热点新闻预测***,所述***包括,
数据采集模块,用于从主流网站采集新闻报道及其在微博上引起的微博用户反应信息;
文本分析处理模块,用于对微博文本进行分词和词频统计,计算词的TF-IDF值,并转换为使用向量空间描述一个微博话题;
数据统计分析模块,用于对微博话题进行分类,以及统计描述微博话题的各个量化指标,计算新闻的各个热度指标;
热点新闻预测模块,用于使用多元线性回归算法对样本数据进行学习,建立热点新闻预测模型,并根据热点新闻预测模型判断之后的新闻是否会成为热点。
本发明相对于现有技术具有如下的有益效果:
1、本发明对媒体报道的新闻在微博话题中的趋势进行全面分析,预测新闻是否会成为舆情热点,能够很好地解决热点新闻早期预测问题。
2、本发明对微博话题的描述定义了多个(优选为三个)量化指标,以及根据描述微博话题的量化指标,定义了多个(优选为三个)新闻的热度指标,并设计了一种自适应算法,多元线性回归算法,将其成功运用于热点新闻预测。
3、本发明为增强算法的实践性,设计实现了基于微博数据分析的热点新闻预测***,将提出的算法运用于实际的舆情热点发现。
附图说明
图1为本发明实施例1的基于微博数据分析的热点新闻预测方法的流程图。
图2为本发明实施例1中描述微博话题的量化指标、新闻的热度指标和新闻热度之间的关系图。
图3为本发明实施例2的基于微博数据分析的热点新闻预测***的结构框图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1:
如图1和图2所示,本实施例的基于微博数据分析的热点新闻预测方法,包括以下步骤:
S1、从主流新闻网站采集新闻报道及其在微博上引起的微博用户反应信息,所述新闻报道包括标题和正文,所述微博用户反应信息是以新闻标题作为关键词在微博搜索的结果集,所述的微博结果集包括微博用户信息、微博正文、发文时间,但不包括新闻媒体在微博中的新闻报道;
S2、对微博文本进行分词和词频统计,计算词的TF-IDF(term frequency-inversedocument frequency)值,并转换为使用向量空间描述一个微博话题;
S3、对微博话题进行分类,并描述微博话题的三个量化指标,计算新闻的三个热度指标;
所述对微博话题进行分类,具体包括:
1)统计社会热点(可通过人工进行统计),计算各社会热点的关注度;
2)根据社会热点对微博话题进行分类,并计算微博话题的社会关注度F。
所述统计描述微博话题的三个量化指标,即为提取描述微博话题的三个特征维度作为量化指标,分别为微博话题的公众响应力、微博话题的核心响应力、微博话题的传播力度,三个量化指标具体解释如下:
a、微博话题的公众响应力,指微博话题发生后在短时间内引起微博普通用户的响应程度,可以使用微博话题发生后短时间内关于此话题的普通用户的微博总量衡量,其表示如下式:
Ip=(NP-Pmin)/Pave
其中,NP是话题发生后短时间内关于此话题的普通用户的微博总量,Pmin、Pave分别是事先统计的热点话题发生后短时间内关于此话题的普通用户的最小微博量和平均微博量;
b、微博话题的核心响应力,指微博话题发生后短时间内引起微博认证用户的响应程度,可以使用微博话题发生后短时间内关于此话题的认证用户的微博总量衡量,其表示如下式:
Iv=(NV-Vmin)/Vave
其中,NV是话题发生后短时间内关于此话题的微博认证用户的微博总量,Vmin、Vave分别是事先统计的热点话题发生后短时间内关于此话题的认证用户的最小微博量和平均微博量;
c、微博话题的传播力度,指微博话题发生后关注此话题的微博用户所在地区的分布情况,根据经济发展程度和人口特征全国自动划分为东北、华北、华中、华南、西部五个地区,计算每个地区关于此话题的微博量占全国微博用户微博量的比重,然后引进Gini指数刻画微博话题的传播力度,其表示如下式:
其中,DEN、DN、DC、DS和DW分别是话题发生后东北、华北、华中、华南和西部五个地区关于此话题的微博量占全国微博总量的比重;
所述计算新闻的各个热度指标,即为根据描述微博话题的量化指标从多个角度对新闻的热度进行全面分析,新闻的三个热度指标分别为新闻关注度、新闻影响力、新闻传播力度,新闻的三个热度指标具体解释如下:
a、新闻关注度,指新闻是否是当今公众关注的热点,使用微博话题的社会关注度衡量,其表示如下式:
其中,F是微博话题的社会关注度,Ip、Iv分别是微博话题的公众响应力和核心响应力,Nfoc越大说明越容易受到公众的关注,成为热点新闻的可能性越大;
b、新闻影响力,指新闻能够持续影响社会关注的能力,使用微博话题的公众响应力的潜在的持续增量表示,其表示如下式:
其中,Ip、Iv分别是微博话题的公众响应力和核心响应力,α是微博话题核心响应力的影响参数、β是微博话题的核心影响力对公众影响力的影响参数,Ninf越大说明话题能够持续影响公众的关注,成为热点新闻的可能性越大;
c、新闻传播度,指新闻在各地区形成舆论的平均分布情况,使用微博话题的传播力度衡量,其表示如下式:
Ntrans=G
其中,G是微博话题的传播力度,Ntrans越大说明新闻在各地区形成舆论中心的分布越均匀,成为热点新闻的可能性越大;
S4、采用多元线性回归算法对样本数据进行学习,建立热点新闻预测模型,并根据热点新闻预测模型判断之后的新闻是否会成为热点。
所述采用多元线性回归算法对样本数据进行学习,即新闻的热度值作为因变量,新闻的三个热度指标作为自变量,建立多元线性回归模型,具体包括:
1)变量选择,选择新闻的热度值R作为因变量,新闻的三个热度指标作为自变量,根据定义有每个新闻的热度指标与新闻的热度值之间存在且服从线性关系;
2)模型设定,根据所研究的热点新闻预测问题,设定多元线性回归模型:
其中,R表示新闻热度,Nfoc、Ninf和Ntrans表示新闻的三个热度指标,θ1、θ2、θ3分别是与新闻的三个热度指标无关的未知参数,∈是整体回归函数的随机干扰项;
3)参数估计,使用样本数据学习步骤2)设定的多元线性回归模型的参数,建立热点新闻预测模型;
4)模型检验,热点新闻预测模型建立后,采用F检验和R检验分别对模型的拟合度、显著性进行检验;
5)模型运用,将建立的热点新闻预测模型应用于预测热点新闻。
实施例2:
如图3所示,本实施例的基于微博数据分析的热点新闻预测***,所述***包括:
数据采集模块,用于从主流网站采集新闻报道及其在微博上引起的微博用户反应信息;
文本分析处理模块,用于对微博文本进行分词和词频统计,计算词的TF-IDF值,并转换为使用向量空间描述一个微博话题;
数据统计分析模块,用于对微博话题进行分类,并统计描述微博话题的各个量化指标,计算新闻的各个热度指标;
热点新闻预测模块,用于使用多元线性回归算法对样本数据进行学习,建立热点新闻预测模型,并根据热点新闻预测模型判断之后的新闻是否会成为热点。
上述数据统计分析模块和热点新闻预测模块具体实现过程同实施例1。
综上所述,本发明对媒体报道的新闻在微博话题中的趋势进行全面分析,预测新闻是否成为舆情热点,能够很好地解决热点新闻早期预测问题。
以上所述,仅为本发明专利优选的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。

Claims (3)

1.基于微博数据分析的热点新闻预测方法,其特征在于:所述方法包括以下步骤:
S1、从主流新闻网站采集新闻报道及其在微博上引起的微博用户反应信息;
S2、对微博文本进行分词和词频统计,计算词的TF-IDF值,并转换为使用向量空间描述一个微博话题;
S3、对微博话题进行分类,并统计描述微博话题的各个量化指标,计算新闻的各个热度指标,具体为:提取描述微博话题的三个特征维度作为量化指标,分别为微博话题的公众响应力、微博话题的核心响应力和微博话题的传播力度,根据描述微博话题的量化指标从多个角度对新闻的热度进行全面分析,新闻的三个热度指标分别为新闻关注度、新闻影响力和新闻传播度;
所述微博话题的公众响应力、微博话题的核心响应力和微博话题的传播力度的具体解释如下:
a、微博话题的公众响应力,指微博话题发生后在短时间内引起微博普通用户的响应程度,使用微博话题发生后短时间内关于此话题的普通用户的微博总量衡量,其表示如下式:
Ip=(NP-Pmin)/Pave
其中,Np是话题发生后短时间内关于此话题的普通用户的微博总量,Pmin、Pave分别是事先统计的热点话题发生后短时间内关于此话题的普通用户的最小微博量和平均微博量;
b、微博话题的核心响应力,指微博话题发生后短时间内引起微博认证用户的响应程度,使用微博话题发生后短时间内关于此话题的认证用户的微博总量衡量,其表示如下式:
Iv=(NV-Vmin)/Vave
其中,NV是话题发生后短时间内关于此话题的微博认证用户的微博总量,Vmin、Vave分别是事先统计的热点话题发生后短时间内关于此话题的认证用户的最小微博量和平均微博量;
c、微博话题的传播力度,指微博话题发生后关注此话题的微博用户所在地区的分布情况,根据经济发展程度和人口特征全国自动划分为东北、华北、华中、华南、西部五个地区,计算每个地区关于此话题的微博量占全国微博用户微博量的比重,然后引进Gini指数刻画微博话题的传播力度,其表示如下式:
其中,DEN、DN、DC、DS和D分别是话题发生后东北、华北、华中、华南和西部五个地区关于此话题的微博量占全国微博总量的比重;
所述新闻关注度、新闻影响力和新闻传播度的具体解释如下:
a、新闻关注度,指新闻是否是当今公众关注的热点,使用微博话题的社会关注度衡量,其表示如下式:
其中,F是微博话题的社会关注度,Ip、Iv分别是微博话题的公众响应力和核心响应力,Nfoc越大说明越容易受到公众的关注,成为热点新闻的可能性越大;
b、新闻影响力,指新闻能够持续影响社会关注的能力,使用微博话题的公众响应力的潜在的持续增量表示,其表示如下式:
其中,Ip、Iv分别是微博话题的公众响应力和核心响应力,α是微博话题核心响应力的影响参数、β是微博话题的核心影响力对公众影响力的影响参数,Ninf越大说明话题能够持续影响公众的关注,成为热点新闻的可能性越大;
c、新闻传播度,指新闻在各地区形成舆论的平均分布情况,使用微博话题的传播力度衡量,其表示如下式:
Ntrans=G
其中,G是微博话题的传播力度,Ntrans越大说明新闻在各地区形成舆论中心的分布越均匀,成为热点新闻的可能性越大;
S4、采用多元线性回归算法对样本数据进行学习,建立热点新闻预测模型,并根据热点新闻预测模型判断之后的新闻是否会成为热点;
所述采用多元线性回归算法对样本数据进行学习,建立热点新闻预测模型,具体包括:
1)变量选择:选择新闻热度作为因变量,新闻的三个热度指标作为自变量,根据定义有新闻的各个热度指标与新闻热度值之间存在且服从线性关系;
2)模型设定:根据所研究的热点新闻预测问题,设定多元线性回归模型;
3)参数估计:使用样本数据学习步骤2)设定的多元线性回归模型的参数,建立热点新闻预测模型;
4)模型检验:热点新闻预测模型建立后,采用F检验和R检验分别对模型的拟合度、显著性进行检验;
5)模型运用:将建立的热点新闻预测模型应用于预测热点新闻;
所述多元线性回归模型,如下式:
其中,R表示新闻热度,Nfoc、Ninf和Ntrans表示新闻的三个热度指标,θ1、θ2、θ3分别是与新闻的三个热度指标无关的未知参数,∈是整体回归函数的随机干扰项。
2.根据权利要求1所述的基于微博数据分析的热点新闻预测方法,其特征在于:步骤S3中,所述对微博话题进行分类,具体包括:
1)统计社会热点,计算各社会热点的关注度;
2)根据社会热点对微博话题进行分类,计算微博话题的社会关注度。
3.基于微博数据分析的热点新闻预测***,其特征在于:所述***包括,
数据采集模块,用于从主流网站采集新闻报道及其在微博上引起的微博用户反应信息;
文本分析处理模块,用于对微博文本进行分词和词频统计,计算词的TF-IDF值,并转换为使用向量空间描述一个微博话题;
数据统计分析模块,用于对微博话题进行分类,以及统计描述微博话题的各个量化指标,计算新闻的各个热度指标,具体为:提取描述微博话题的三个特征维度作为量化指标,分别为微博话题的公众响应力、微博话题的核心响应力和微博话题的传播力度,根据描述微博话题的量化指标从多个角度对新闻的热度进行全面分析,新闻的三个热度指标分别为新闻关注度、新闻影响力和新闻传播度;
所述微博话题的公众响应力、微博话题的核心响应力和微博话题的传播力度的具体解释如下:
a、微博话题的公众响应力,指微博话题发生后在短时间内引起微博普通用户的响应程度,使用微博话题发生后短时间内关于此话题的普通用户的微博总量衡量,其表示如下式:
Ip=(NP-Pmin)/Pave
其中,Np是话题发生后短时间内关于此话题的普通用户的微博总量,Pmin、Pave分别是事先统计的热点话题发生后短时间内关于此话题的普通用户的最小微博量和平均微博量;
b、微博话题的核心响应力,指微博话题发生后短时间内引起微博认证用户的响应程度,使用微博话题发生后短时间内关于此话题的认证用户的微博总量衡量,其表示如下式:
Iv=(NV-Vmin)/Vave
其中,NV是话题发生后短时间内关于此话题的微博认证用户的微博总量,Vmin、Vave分别是事先统计的热点话题发生后短时间内关于此话题的认证用户的最小微博量和平均微博量;
c、微博话题的传播力度,指微博话题发生后关注此话题的微博用户所在地区的分布情况,根据经济发展程度和人口特征全国自动划分为东北、华北、华中、华南、西部五个地区,计算每个地区关于此话题的微博量占全国微博用户微博量的比重,然后引进Gini指数刻画微博话题的传播力度,其表示如下式:
其中,DEN、DN、DC、DS和DW分别是话题发生后东北、华北、华中、华南和西部五个地区关于此话题的微博量占全国微博总量的比重;
所述新闻关注度、新闻影响力和新闻传播度的具体解释如下:
a、新闻关注度,指新闻是否是当今公众关注的热点,使用微博话题的社会关注度衡量,其表示如下式:
其中,F是微博话题的社会关注度,Ip、Iv分别是微博话题的公众响应力和核心响应力,Nfoc越大说明越容易受到公众的关注,成为热点新闻的可能性越大;
b、新闻影响力,指新闻能够持续影响社会关注的能力,使用微博话题的公众响应力的潜在的持续增量表示,其表示如下式:
其中,Ip、Iv分别是微博话题的公众响应力和核心响应力,α是微博话题核心响应力的影响参数、β是微博话题的核心影响力对公众影响力的影响参数,Ninf越大说明话题能够持续影响公众的关注,成为热点新闻的可能性越大;
c、新闻传播度,指新闻在各地区形成舆论的平均分布情况,使用微博话题的传播力度衡量,其表示如下式:
Ntrans=G
其中,G是微博话题的传播力度,Ntrans越大说明新闻在各地区形成舆论中心的分布越均匀,成为热点新闻的可能性越大;
热点新闻预测模块,用于使用多元线性回归算法对样本数据进行学习,建立热点新闻预测模型,并根据热点新闻预测模型判断之后的新闻是否会成为热点;
所述采用多元线性回归算法对样本数据进行学习,建立热点新闻预测模型,具体以包括:
1)变量选择:选择新闻热度作为因变量,新闻的三个热度指标作为自变量,根据定义有新闻的各个热度指标与新闻热度值之间存在且服从线性关系;
2)模型设定:根据所研究的热点新闻预测问题,设定多元线性回归模型;
3)参数估计:使用样本数据学习步骤2)设定的多元线性回归模型的参数,建立热点新闻预测模型;
4)模型检验:热点新闻预测模型建立后,采用F检验和R检验分别对模型的拟合度、显著性进行检验;
5)模型运用:将建立的热点新闻预测模型应用于预测热点新闻;
所述多元线性回归模型,如下式:
其中,R表示新闻热度,Nfoc、Ninf和Ntrans表示新闻的三个热度指标,θ1、θ2、θ3分别是与新闻的三个热度指标无关的未知参数,∈是整体回归函数的随机干扰项。
CN201510562298.XA 2015-09-06 2015-09-06 基于微博数据分析的热点新闻预测方法及*** Active CN105224608B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510562298.XA CN105224608B (zh) 2015-09-06 2015-09-06 基于微博数据分析的热点新闻预测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510562298.XA CN105224608B (zh) 2015-09-06 2015-09-06 基于微博数据分析的热点新闻预测方法及***

Publications (2)

Publication Number Publication Date
CN105224608A CN105224608A (zh) 2016-01-06
CN105224608B true CN105224608B (zh) 2019-04-09

Family

ID=54993576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510562298.XA Active CN105224608B (zh) 2015-09-06 2015-09-06 基于微博数据分析的热点新闻预测方法及***

Country Status (1)

Country Link
CN (1) CN105224608B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809554B (zh) * 2016-02-07 2020-03-17 重庆邮电大学 一种社交网络中用户参与热点话题的预测方法
CN105824806B (zh) * 2016-06-13 2018-10-23 腾讯科技(深圳)有限公司 一种公众账号的质量评价方法和装置
CN106097111A (zh) * 2016-06-20 2016-11-09 重庆房慧科技有限公司 一种基于智慧社区网络大数据的舆情预测方法
TWI602430B (zh) * 2016-08-08 2017-10-11 Chunghwa Telecom Co Ltd Multimedia content classification system and method
CN107870957A (zh) * 2016-09-28 2018-04-03 郑州大学 一种基于信息增益和bp神经网络的热门微博预测方法
CN107066537A (zh) * 2017-03-06 2017-08-18 广州神马移动信息科技有限公司 热点新闻生成方法、设备、电子设备
CN107203632B (zh) * 2017-06-01 2019-08-16 中国人民解放军国防科学技术大学 基于相似关系和共现关系的话题流行度预测方法
CN107391712A (zh) * 2017-07-28 2017-11-24 王亚迪 一种网络舆论趋势预测分析方法
CN107506870A (zh) * 2017-09-06 2017-12-22 国家电网公司 一种基于热词的供电服务热点预测方法
CN107783948B (zh) * 2017-10-10 2020-10-13 湖北文理学院 一种基于社交网络原理的词汇社交网络分析方法
CN108038790B (zh) * 2017-11-24 2021-10-15 东华大学 一种内外数据融合的态势分析***
CN109977393B (zh) * 2017-12-28 2021-09-03 中国科学院计算技术研究所 一种基于内容争议性的流行新闻预测方法和***
CN108205589B (zh) * 2017-12-29 2022-02-15 成都优易数据有限公司 一种热度迭代计算方法
CN109214562A (zh) * 2018-08-24 2019-01-15 国网山东省电力公司电力科学研究院 一种基于rnn的电网科研热点预测与推送方法
CN109446329B (zh) * 2018-11-08 2022-02-22 大连瀚闻资讯有限公司 一种舆情分析的热点识别方法
CN110598151B (zh) * 2019-09-09 2023-07-14 河南牧业经济学院 一种判定新闻传播效果的方法及***
CN110674447B (zh) * 2019-09-26 2022-07-29 虎博网络技术(上海)有限公司 资讯重要性判断方法、装置、计算机终端及存储介质
CN112417253B (zh) * 2020-12-28 2021-10-15 时间知道(北京)文化科技有限公司 一种多维舆情监测***及方法
CN114880588B (zh) * 2022-06-13 2024-04-26 四川封面传媒科技有限责任公司 基于知识图谱的新闻热度预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116605A (zh) * 2013-01-17 2013-05-22 上海交通大学 一种基于监测子网的微博热点事件实时检测方法及***
CN103345524A (zh) * 2013-07-19 2013-10-09 中国地质大学(武汉) 微博热点话题检测方法及***
CN103745000A (zh) * 2014-01-24 2014-04-23 福州大学 一种中文微博客的热点话题检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116605A (zh) * 2013-01-17 2013-05-22 上海交通大学 一种基于监测子网的微博热点事件实时检测方法及***
CN103345524A (zh) * 2013-07-19 2013-10-09 中国地质大学(武汉) 微博热点话题检测方法及***
CN103745000A (zh) * 2014-01-24 2014-04-23 福州大学 一种中文微博客的热点话题检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Cost-effective node monitoring for online hot event detection in sina weibo microblogging";Kai Chen etc,;《International Conference on world wide web Companion》;20131231;第107-108页
"一种微博热点话题检测与趋势预测";姚海波;《中国优秀硕士学位论文全文数据库》;20140115(第1期);第3.2.1节-第4.3.4节

Also Published As

Publication number Publication date
CN105224608A (zh) 2016-01-06

Similar Documents

Publication Publication Date Title
CN105224608B (zh) 基于微博数据分析的热点新闻预测方法及***
Yang et al. Prevalence of low-credibility information on twitter during the covid-19 outbreak
Shi et al. Detecting malicious social bots based on clickstream sequences
Morstatter et al. A new approach to bot detection: striking the balance between precision and recall
CN103458042B (zh) 一种微博广告用户检测方法
Morstatter et al. Is the sample good enough? comparing data from twitter's streaming api with twitter's firehose
Narayanan et al. Russian involvement and junk news during Brexit
CN108462888A (zh) 用户电视及上网行为的智能关联分析方法及***
Berkelmans et al. Identifying socio-demographic risk factors for suicide using data on an individual level
CN107122481A (zh) 新闻热度实时在线预测方法
CN103885993A (zh) 用于微博的舆情监控方法和装置
Song et al. Real-time anomaly traffic monitoring based on dynamic k-NN cumulative-distance abnormal detection algorithm
Shi et al. Rumor detection of COVID-19 pandemic on online social networks
Wang et al. Profiling the followers of the most influential and verified users on Sina Weibo
US11356476B2 (en) System and method for social network analysis
KR101785288B1 (ko) 온라인 콘텐츠의 허위 평가 정보 적발 장치, 방법 및 프로그램
CN105427050A (zh) 一种基于信任度模型的食品质量评估方法
CN111080362A (zh) 广告监测***及方法
Nobre et al. More of the same? A study of images shared on Mastodon’s federated timeline
CN107808324A (zh) 一种在线商品的信誉值计算方法、网络交易平台、计算机
CN107480271B (zh) 基于抽样查找和索引查找的人群画像方法及***
Rangnani et al. Autoregressive model for users’ retweeting profiles
Porenta et al. Empirical comparison of IP reputation databases
Udge et al. Statistical Analysis for Twitter Spam Detection
CN117792748B (zh) 一种基于网络层报文相似度的工控网络异常检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant