CN103390051A - 一种基于微博数据的话题发现与追踪方法 - Google Patents
一种基于微博数据的话题发现与追踪方法 Download PDFInfo
- Publication number
- CN103390051A CN103390051A CN2013103163167A CN201310316316A CN103390051A CN 103390051 A CN103390051 A CN 103390051A CN 2013103163167 A CN2013103163167 A CN 2013103163167A CN 201310316316 A CN201310316316 A CN 201310316316A CN 103390051 A CN103390051 A CN 103390051A
- Authority
- CN
- China
- Prior art keywords
- topic
- microblogging
- time window
- window
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000001514 detection method Methods 0.000 title claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 9
- 238000000605 extraction Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000012098 association analyses Methods 0.000 claims description 6
- 238000010187 selection method Methods 0.000 claims description 5
- 238000011438 discrete method Methods 0.000 claims description 4
- 230000010429 evolutionary process Effects 0.000 claims description 4
- 230000002452 interceptive effect Effects 0.000 claims description 4
- 230000006378 damage Effects 0.000 claims description 3
- 230000007547 defect Effects 0.000 claims description 3
- 238000009412 basement excavation Methods 0.000 claims description 2
- 238000010219 correlation analysis Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000005303 weighing Methods 0.000 claims description 2
- 238000011161 development Methods 0.000 abstract description 3
- 230000008033 biological extinction Effects 0.000 abstract description 2
- 238000001914 filtration Methods 0.000 abstract 1
- 238000000638 solvent extraction Methods 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 2
- 230000006854 communication Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002153 concerted effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (8)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310316316.7A CN103390051B (zh) | 2013-07-25 | 2013-07-25 | 一种基于微博数据的话题发现与追踪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310316316.7A CN103390051B (zh) | 2013-07-25 | 2013-07-25 | 一种基于微博数据的话题发现与追踪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103390051A true CN103390051A (zh) | 2013-11-13 |
CN103390051B CN103390051B (zh) | 2016-07-20 |
Family
ID=49534323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310316316.7A Expired - Fee Related CN103390051B (zh) | 2013-07-25 | 2013-07-25 | 一种基于微博数据的话题发现与追踪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103390051B (zh) |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678277A (zh) * | 2013-12-04 | 2014-03-26 | 东软集团股份有限公司 | 基于文档分段的构建主题-词汇分布的方法及*** |
CN103699611A (zh) * | 2013-12-16 | 2014-04-02 | 浙江大学 | 一种基于动态摘要技术的微博流信息提取方法 |
CN103793501A (zh) * | 2014-01-20 | 2014-05-14 | 惠州学院 | 基于社交网络的主题社团发现方法 |
CN103793478A (zh) * | 2014-01-14 | 2014-05-14 | 四川大学 | 基于主题遗传的在线主题建模方法 |
CN103970863A (zh) * | 2014-05-08 | 2014-08-06 | 清华大学 | 基于lda主题模型的微博用户兴趣的挖掘方法及*** |
CN103984729A (zh) * | 2014-05-19 | 2014-08-13 | 北京大学 | 微博信息追踪方法和微博信息追踪装置 |
CN103984731A (zh) * | 2014-05-19 | 2014-08-13 | 北京大学 | 微博环境下自适应话题追踪方法和装置 |
CN104281653A (zh) * | 2014-09-16 | 2015-01-14 | 南京弘数信息科技有限公司 | 一种针对千万级规模微博文本的观点挖掘方法 |
CN104731811A (zh) * | 2013-12-20 | 2015-06-24 | 北京师范大学珠海分校 | 一种面向大规模动态短文本的聚类信息演化分析方法 |
CN105138684A (zh) * | 2015-09-15 | 2015-12-09 | 联想(北京)有限公司 | 一种信息处理方法和信息处理装置 |
CN105260358A (zh) * | 2015-10-14 | 2016-01-20 | 上海大学 | 一种面向短文本的突发事件发展过程表示方法 |
CN105354333A (zh) * | 2015-12-07 | 2016-02-24 | 天云融创数据科技(北京)有限公司 | 一种基于新闻文本的话题提取方法 |
CN105760410A (zh) * | 2015-04-15 | 2016-07-13 | 北京工业大学 | 一种基于转发评论的微博语义扩充模型和方法 |
CN106055538A (zh) * | 2016-05-26 | 2016-10-26 | 达而观信息科技(上海)有限公司 | 主题模型和语义分析相结合的文本标签自动抽取方法 |
CN106294405A (zh) * | 2015-05-22 | 2017-01-04 | 国家计算机网络与信息安全管理中心 | 一种微博子话题演化分析方法及装置 |
CN106354818A (zh) * | 2016-08-30 | 2017-01-25 | 电子科技大学 | 基于社交媒体的动态用户属性提取方法 |
CN106557551A (zh) * | 2016-10-27 | 2017-04-05 | 西南石油大学 | 基于微博事件聚类建模的微博传播规模预测方法和*** |
CN106570088A (zh) * | 2016-10-20 | 2017-04-19 | 浙江大学 | 一种科研文献话题发现和演化跟踪的方法 |
CN106570167A (zh) * | 2016-11-08 | 2017-04-19 | 南京理工大学 | 基于融合知识的主题模型的微博话题发现方法 |
CN106599002A (zh) * | 2015-10-19 | 2017-04-26 | 北京国双科技有限公司 | 话题演化分析的方法及装置 |
CN106649726A (zh) * | 2016-12-23 | 2017-05-10 | 中山大学 | 一种社交网络中社团话题演化挖掘方法 |
CN106776503A (zh) * | 2016-12-22 | 2017-05-31 | 东软集团股份有限公司 | 文本语义相似度的确定方法及装置 |
CN106934014A (zh) * | 2017-03-10 | 2017-07-07 | 山东省科学院情报研究所 | 一种基于Hadoop的网络数据挖掘与分析平台及其方法 |
CN107025299A (zh) * | 2017-04-24 | 2017-08-08 | 北京理工大学 | 一种基于加权lda主题模型的金融舆情感知方法 |
CN107203513A (zh) * | 2017-06-06 | 2017-09-26 | 中国人民解放军国防科学技术大学 | 基于概率模型的微博文本数据细粒度话题演化分析方法 |
CN107835113A (zh) * | 2017-07-05 | 2018-03-23 | 中山大学 | 一种基于网络映射的社交网络中异常用户检测方法 |
CN107918611A (zh) * | 2016-10-09 | 2018-04-17 | 郑州大学 | 一种分析微博话题演化的模型 |
CN108399162A (zh) * | 2018-03-21 | 2018-08-14 | 北京理工大学 | 基于短语袋主题模型的话题发现方法 |
CN108717421A (zh) * | 2018-04-23 | 2018-10-30 | 深圳市城市规划设计研究院有限公司 | 一种基于时空变化的社交媒体文本主题提取方法及*** |
CN108763208A (zh) * | 2018-05-22 | 2018-11-06 | 腾讯科技(上海)有限公司 | 话题信息获取方法、装置、服务器和计算机可读存储介质 |
CN109543110A (zh) * | 2018-11-28 | 2019-03-29 | 南京航空航天大学 | 一种微博情感分析方法及*** |
US10275444B2 (en) | 2016-07-15 | 2019-04-30 | At&T Intellectual Property I, L.P. | Data analytics system and methods for text data |
CN110059225A (zh) * | 2019-03-11 | 2019-07-26 | 北京奇艺世纪科技有限公司 | 视频分类方法、装置、终端设备及存储介质 |
CN111125305A (zh) * | 2019-12-05 | 2020-05-08 | 东软集团股份有限公司 | 热门话题确定方法、装置、存储介质及电子设备 |
CN111666268A (zh) * | 2020-05-20 | 2020-09-15 | 安徽火蓝数据有限公司 | 一种微博大数据舆情分析方法 |
CN112905751A (zh) * | 2021-03-19 | 2021-06-04 | 常熟理工学院 | 一种结合主题模型和孪生网络模型的话题演化跟踪方法 |
CN113127643A (zh) * | 2021-05-11 | 2021-07-16 | 江南大学 | 一种融合微博主题及评论的深度学习谣言检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120041953A1 (en) * | 2010-08-16 | 2012-02-16 | Microsoft Corporation | Text mining of microblogs using latent topic labels |
CN103116651A (zh) * | 2013-03-05 | 2013-05-22 | 南京理工大学常熟研究院有限公司 | 一种舆情热点动态检测方法 |
-
2013
- 2013-07-25 CN CN201310316316.7A patent/CN103390051B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120041953A1 (en) * | 2010-08-16 | 2012-02-16 | Microsoft Corporation | Text mining of microblogs using latent topic labels |
CN103116651A (zh) * | 2013-03-05 | 2013-05-22 | 南京理工大学常熟研究院有限公司 | 一种舆情热点动态检测方法 |
Non-Patent Citations (2)
Title |
---|
胡艳丽等: "一种话题演化建模与分析方法", 《自动化学报》 * |
贺亮: "科技文献话题演化研究", 《现代图书情报技术》 * |
Cited By (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678277A (zh) * | 2013-12-04 | 2014-03-26 | 东软集团股份有限公司 | 基于文档分段的构建主题-词汇分布的方法及*** |
CN103699611A (zh) * | 2013-12-16 | 2014-04-02 | 浙江大学 | 一种基于动态摘要技术的微博流信息提取方法 |
CN103699611B (zh) * | 2013-12-16 | 2017-01-11 | 浙江大学 | 一种基于动态摘要技术的微博流信息提取方法 |
CN104731811A (zh) * | 2013-12-20 | 2015-06-24 | 北京师范大学珠海分校 | 一种面向大规模动态短文本的聚类信息演化分析方法 |
CN104731811B (zh) * | 2013-12-20 | 2018-10-09 | 北京师范大学珠海分校 | 一种面向大规模动态短文本的聚类信息演化分析方法 |
CN103793478B (zh) * | 2014-01-14 | 2017-01-11 | 四川大学 | 基于主题遗传的在线主题建模方法 |
CN103793478A (zh) * | 2014-01-14 | 2014-05-14 | 四川大学 | 基于主题遗传的在线主题建模方法 |
CN103793501B (zh) * | 2014-01-20 | 2016-03-02 | 惠州学院 | 基于社交网络的主题社团发现方法 |
CN103793501A (zh) * | 2014-01-20 | 2014-05-14 | 惠州学院 | 基于社交网络的主题社团发现方法 |
CN103970863B (zh) * | 2014-05-08 | 2017-12-19 | 清华大学 | 基于lda主题模型的微博用户兴趣的挖掘方法及*** |
CN103970863A (zh) * | 2014-05-08 | 2014-08-06 | 清华大学 | 基于lda主题模型的微博用户兴趣的挖掘方法及*** |
CN103984731A (zh) * | 2014-05-19 | 2014-08-13 | 北京大学 | 微博环境下自适应话题追踪方法和装置 |
CN103984729A (zh) * | 2014-05-19 | 2014-08-13 | 北京大学 | 微博信息追踪方法和微博信息追踪装置 |
CN103984731B (zh) * | 2014-05-19 | 2017-03-08 | 北京大学 | 微博环境下自适应话题追踪方法和装置 |
CN104281653A (zh) * | 2014-09-16 | 2015-01-14 | 南京弘数信息科技有限公司 | 一种针对千万级规模微博文本的观点挖掘方法 |
CN104281653B (zh) * | 2014-09-16 | 2018-07-27 | 南京弘数信息科技有限公司 | 一种针对千万级规模微博文本的观点挖掘方法 |
CN105760410B (zh) * | 2015-04-15 | 2019-04-19 | 北京工业大学 | 一种基于转发评论的微博语义扩充模型和方法 |
CN105760410A (zh) * | 2015-04-15 | 2016-07-13 | 北京工业大学 | 一种基于转发评论的微博语义扩充模型和方法 |
CN106294405A (zh) * | 2015-05-22 | 2017-01-04 | 国家计算机网络与信息安全管理中心 | 一种微博子话题演化分析方法及装置 |
CN105138684B (zh) * | 2015-09-15 | 2018-12-14 | 联想(北京)有限公司 | 一种信息处理方法和信息处理装置 |
CN105138684A (zh) * | 2015-09-15 | 2015-12-09 | 联想(北京)有限公司 | 一种信息处理方法和信息处理装置 |
CN105260358A (zh) * | 2015-10-14 | 2016-01-20 | 上海大学 | 一种面向短文本的突发事件发展过程表示方法 |
CN106599002B (zh) * | 2015-10-19 | 2020-06-05 | 北京国双科技有限公司 | 话题演化分析的方法及装置 |
CN106599002A (zh) * | 2015-10-19 | 2017-04-26 | 北京国双科技有限公司 | 话题演化分析的方法及装置 |
CN105354333A (zh) * | 2015-12-07 | 2016-02-24 | 天云融创数据科技(北京)有限公司 | 一种基于新闻文本的话题提取方法 |
CN105354333B (zh) * | 2015-12-07 | 2018-11-06 | 天云融创数据科技(北京)有限公司 | 一种基于新闻文本的话题提取方法 |
CN106055538A (zh) * | 2016-05-26 | 2016-10-26 | 达而观信息科技(上海)有限公司 | 主题模型和语义分析相结合的文本标签自动抽取方法 |
CN106055538B (zh) * | 2016-05-26 | 2019-03-08 | 达而观信息科技(上海)有限公司 | 主题模型和语义分析相结合的文本标签自动抽取方法 |
US10275444B2 (en) | 2016-07-15 | 2019-04-30 | At&T Intellectual Property I, L.P. | Data analytics system and methods for text data |
US11010548B2 (en) | 2016-07-15 | 2021-05-18 | At&T Intellectual Property I, L.P. | Data analytics system and methods for text data |
US10642932B2 (en) | 2016-07-15 | 2020-05-05 | At&T Intellectual Property I, L.P. | Data analytics system and methods for text data |
CN106354818B (zh) * | 2016-08-30 | 2020-01-10 | 电子科技大学 | 基于社交媒体的动态用户属性提取方法 |
CN106354818A (zh) * | 2016-08-30 | 2017-01-25 | 电子科技大学 | 基于社交媒体的动态用户属性提取方法 |
CN107918611A (zh) * | 2016-10-09 | 2018-04-17 | 郑州大学 | 一种分析微博话题演化的模型 |
CN106570088A (zh) * | 2016-10-20 | 2017-04-19 | 浙江大学 | 一种科研文献话题发现和演化跟踪的方法 |
CN106557551A (zh) * | 2016-10-27 | 2017-04-05 | 西南石油大学 | 基于微博事件聚类建模的微博传播规模预测方法和*** |
CN106570167A (zh) * | 2016-11-08 | 2017-04-19 | 南京理工大学 | 基于融合知识的主题模型的微博话题发现方法 |
CN106776503A (zh) * | 2016-12-22 | 2017-05-31 | 东软集团股份有限公司 | 文本语义相似度的确定方法及装置 |
CN106776503B (zh) * | 2016-12-22 | 2020-03-10 | 东软集团股份有限公司 | 文本语义相似度的确定方法及装置 |
CN106649726A (zh) * | 2016-12-23 | 2017-05-10 | 中山大学 | 一种社交网络中社团话题演化挖掘方法 |
CN106934014A (zh) * | 2017-03-10 | 2017-07-07 | 山东省科学院情报研究所 | 一种基于Hadoop的网络数据挖掘与分析平台及其方法 |
CN106934014B (zh) * | 2017-03-10 | 2021-03-19 | 山东省科学院情报研究所 | 一种基于Hadoop的网络数据挖掘与分析平台及其方法 |
CN107025299A (zh) * | 2017-04-24 | 2017-08-08 | 北京理工大学 | 一种基于加权lda主题模型的金融舆情感知方法 |
CN107203513A (zh) * | 2017-06-06 | 2017-09-26 | 中国人民解放军国防科学技术大学 | 基于概率模型的微博文本数据细粒度话题演化分析方法 |
CN107835113B (zh) * | 2017-07-05 | 2020-09-08 | 中山大学 | 一种基于网络映射的社交网络中异常用户检测方法 |
CN107835113A (zh) * | 2017-07-05 | 2018-03-23 | 中山大学 | 一种基于网络映射的社交网络中异常用户检测方法 |
CN108399162A (zh) * | 2018-03-21 | 2018-08-14 | 北京理工大学 | 基于短语袋主题模型的话题发现方法 |
CN108717421A (zh) * | 2018-04-23 | 2018-10-30 | 深圳市城市规划设计研究院有限公司 | 一种基于时空变化的社交媒体文本主题提取方法及*** |
CN108763208A (zh) * | 2018-05-22 | 2018-11-06 | 腾讯科技(上海)有限公司 | 话题信息获取方法、装置、服务器和计算机可读存储介质 |
CN109543110A (zh) * | 2018-11-28 | 2019-03-29 | 南京航空航天大学 | 一种微博情感分析方法及*** |
CN110059225A (zh) * | 2019-03-11 | 2019-07-26 | 北京奇艺世纪科技有限公司 | 视频分类方法、装置、终端设备及存储介质 |
CN111125305A (zh) * | 2019-12-05 | 2020-05-08 | 东软集团股份有限公司 | 热门话题确定方法、装置、存储介质及电子设备 |
CN111666268A (zh) * | 2020-05-20 | 2020-09-15 | 安徽火蓝数据有限公司 | 一种微博大数据舆情分析方法 |
CN112905751A (zh) * | 2021-03-19 | 2021-06-04 | 常熟理工学院 | 一种结合主题模型和孪生网络模型的话题演化跟踪方法 |
CN112905751B (zh) * | 2021-03-19 | 2024-03-29 | 常熟理工学院 | 一种结合主题模型和孪生网络模型的话题演化跟踪方法 |
CN113127643A (zh) * | 2021-05-11 | 2021-07-16 | 江南大学 | 一种融合微博主题及评论的深度学习谣言检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103390051B (zh) | 2016-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103390051A (zh) | 一种基于微博数据的话题发现与追踪方法 | |
CN103514183B (zh) | 基于交互式文档聚类的信息检索方法及*** | |
Bellaachia et al. | Ne-rank: A novel graph-based keyphrase extraction in twitter | |
Kang et al. | Modeling user interest in social media using news media and wikipedia | |
CN103023714B (zh) | 基于网络话题的活跃度与集群结构分析***及方法 | |
CN102200975B (zh) | 一种利用语义分析的垂直搜索引擎*** | |
CN103544255A (zh) | 基于文本语义相关的网络舆情信息分析方法 | |
CN103455562A (zh) | 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器 | |
Hou et al. | Newsminer: Multifaceted news analysis for event search | |
CN105068991A (zh) | 一种基于大数据的舆情发现方法 | |
CN102609427A (zh) | 舆情垂直搜索分析***及方法 | |
CN104965823A (zh) | 一种基于大数据的观点抽取方法 | |
CN102955853B (zh) | 一种跨语言文摘的生成方法及装置 | |
CN104516961A (zh) | 一种基于地域的话题挖掘及话题走势分析方法及*** | |
CN106202065A (zh) | 一种跨语言话题检测方法及*** | |
CN101609445A (zh) | 基于时间信息的关键子话题提取方法 | |
CN105183765A (zh) | 一种基于大数据的话题抽取方法 | |
Zhu et al. | Real-time personalized twitter search based on semantic expansion and quality model | |
Zhang et al. | An approach of service discovery based on service goal clustering | |
Kotlerman et al. | Clustering small-sized collections of short texts | |
Huang et al. | Topic detection from microblog based on text clustering and topic model analysis | |
Zhao et al. | Towards events detection from microblog messages | |
Wimmer et al. | Word sense disambiguation for ontology learning | |
Othman et al. | Customer opinion summarization based on twitter conversations | |
Saputra et al. | C4. 5 and naive bayes for sentiment analysis Indonesian Tweet on E-Money user during pandemic |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20131113 Assignee: Jiangsu Nanyou IOT Technology Park Ltd. Assignor: NANJING University OF POSTS AND TELECOMMUNICATIONS Contract record no.: 2016320000218 Denomination of invention: Topic detection and tracking method based on microblog data Granted publication date: 20160720 License type: Common License Record date: 20161118 |
|
LICC | Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model | ||
EC01 | Cancellation of recordation of patent licensing contract |
Assignee: Jiangsu Nanyou IOT Technology Park Ltd. Assignor: NANJING University OF POSTS AND TELECOMMUNICATIONS Contract record no.: 2016320000218 Date of cancellation: 20170706 |
|
EC01 | Cancellation of recordation of patent licensing contract | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160720 |