CN106021508A - 基于社交媒体的突发事件应急信息挖掘方法 - Google Patents
基于社交媒体的突发事件应急信息挖掘方法 Download PDFInfo
- Publication number
- CN106021508A CN106021508A CN201610345293.6A CN201610345293A CN106021508A CN 106021508 A CN106021508 A CN 106021508A CN 201610345293 A CN201610345293 A CN 201610345293A CN 106021508 A CN106021508 A CN 106021508A
- Authority
- CN
- China
- Prior art keywords
- social media
- accident
- document
- media data
- theme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于社交媒体的突发事件应急信息挖掘方法,包括步骤:S1采用开放平台API或网页爬虫采集社交媒体数据,社交媒体数据即文档集;S2使用MongoDB集群存储文档集;S3文档集预处理;S4利用LDA标注预处理后的文档集,获得已知样本;S5 已知样本各文档中所有词语构成词语特征集,各词语特征在文档中的词频即该词语特征在该文档中的权重;S6构建短文本实时分类模型;S7采用短文本分类模型对实时突发事件进行分类,预测突发事件的主题;S8根据分类后突发事件的社交媒体数据进行信息挖掘。本发明可自动、快速地实现社交媒体短文本的分类,从而提挖掘突发事件应急信息。
Description
技术领域
本发明涉及社交媒体技术领域,尤其涉及一种基于社交媒体的突发事件应急信息挖掘方法。
背景技术
突发事件是指突然发生,造成或可能造成严重社会危害,需采取应急处置措施予以应对的自然灾害、事故灾难、公共卫生事件和社会安全事件。伴随着我国工业化、城市化进程不断加快,突发事件不断发生。与此同时,我国是世界上受自然灾害影响最为严重的国家之一,灾害种类多,发生频度高,每年因自然灾害造成的损失巨大。
根据民政部国家减灾办发布的数据显示:仅2014年各类自然灾害共造成全国24353.7万人次受灾,601.7万人次紧急转移安置,235人失踪,1583人死亡,45万间房屋倒塌,354.2万间不同程度损坏,298.3万人次需紧急生活救助,农作物受灾面积24890.7千公顷,其中绝收3090.3千公顷,直接经济损失3373.8亿元。自然灾害仅作为突发事件其中的一类,便造成了大量的人员伤亡和巨额的经济损失。突发事件的危害可见一斑。
如何尽可能地减少突发事件导致的损失是亟待解决的问题。一方面,从突发事件的起始阶段来看,提高预警能力是一个降低突发事件所带来危害的有效途径。它有助于从源头上遏止突发事件的发生,或者,减少因应对时间不足而导致更多的损失。然而,对于自然灾害、事故灾难等随机性大的突发事件来说,这点实现起来比较困难。另一方面,从突发事件的发展阶段来看,有效、及时地获取应急信息是减少突发事件引致损失的重要途径。一旦突发事件发生,需及时地获取突发事件应急信息,并相应地采取应急处置措施,以减少突发事件带来的损失和危害。所以,如何快速、及时、有效地获取突发事件应急信息是能否应对好突发事件的关键性问题。
传统的突发事件应急信息是由官方或权威机构采集、整理、发布的。其缺点主要表现在:采集过程缺乏大众的参与和反馈,信息来源比较单一;采集时效性低,甚至在突发事件发生后一段时间内不能及时获取事件的任何信息,如重大自然灾害;信息传播方向为官方至大众,呈单向流动,缺少反馈和沟通。这些不足使得传统的突发事件应急信息难以满足及时、有效、合理处置突发事件的需求。
随着移动设备的广泛普及和通信技术的高速发展,社交媒体正成为人们重要的网络社交工具。作为国内最大的社交媒体平台,新浪微博已在中国及190多个国家的华人社区积累了庞大的用户群体。截至2013年12月,新浪微博月活跃用户数量和日活跃用户数量分别达到1.291亿和6140万。社交媒体是人们自发地撰写、分享、评价、讨论、相互沟通的工具。利用这种工具,公众可以透过简短的文字和丰富的多媒体数据及时地讲述着身边的所见所闻和发表对于重大事件(如地震,城市内涝)的看法。
作为用户生成内容(User Generated Content,UGC)的一部分,社交媒体数据包含文本、图片、视频以及地理位置等数据。除内容形式多样外,社交媒体数据的数量庞大,且传播速度快、覆盖广。仅在2013年12月,新浪微博共有超过28亿条内容被分享,包括22亿条带图片内容,8170万条带短视频内容,以及2150万条带歌曲内容。仅在2013年10至12月,新浪微博有超过1.2亿次签到,即用户通过移动设备在微博内容中添加了自己的地理位置。
社交媒体越来越多地被看作是随人群移动的传感器,感知着发生在周边的事件以及远处的其他突发事件,并在网络中互相共享和沟通。一旦某地有突发事件发生,事发地的人们会第一时间通过文字、图片以及视频向互联网广播事件的状态。与此同时,处在事发地***的人们在社交网络上看到相关报道或讲述后,会纷纷作出及时的响应,最后与事件相关的信息就会很快充斥着整个社交网络。突发事件信息以社交媒体数据的形式在社交网络中广泛传播。
综上所述,社交媒体具有的自发性、及时性、广泛参与性、内容多样性正好弥补了传统突发事件应急信息的不足。面对海量的社交媒体数据,如何快速、及时、准确地从中挖掘出突发事件应急信息是需要研究的关键问题。
发明内容
针对现有技术存在的不足,本发明提出了一种基于社交媒体的突发事件应急信息挖掘方法。
为解决上述技术问题,本发明采用如下的技术方案:
基于社交媒体的突发事件应急信息挖掘方法,包括步骤:
一、基于社交媒体的突发事件分类方法,包括步骤:
S1采用开放平台API或网页爬虫采集社交媒体数据,社交媒体数据即文档集;
S2使用MongoDB集群存储文档集;
S3文档集预处理,包括文档去重、文档分词、文档去停用词和去掉词语稀少的文档;
S4利用LDA标注预处理后的文档集,获得已知样本,本步骤进一步包括:
4.1分别计算预处理后文档集中各文档主题,获得文档-主题概率矩阵和主题-词语概率矩阵;
4.2遍历文档-主题概率矩阵,将超过主题概率阈值λ的概率所对应的文档及主题作为已知样本,其中主题概率阈值λ为经验值,已知样本中文档由一系列词语构成;
S5已知样本各文档中所有词语构成词语特征集,各词语特征在文档中的词频即该词语特征在该文档中的权重;
S6构建短文本实时分类模型,本步骤进一步包括:
6.1采用词语特征集及其中各词语特征的权值训练SVM获得SVM分类器,采用格网搜索法枚举一系列SVM的模型参数;
6.2采用K-折交叉验证法逐一验证各模型参数下的SVM分类器,将预报误差最小的模型参数作为最优模型参数,最优模型参数对应的SVM分类器即短文本实时分类模型;
S7基于实时突发事件社交媒体数,采用短文本分类模型对实时突发事件进行分类,预测突发事件的主题。
步骤S1中,采用开放平台API采集社交媒体数据,具体为:
使用多个搜索中心点,以指定搜索半径进行缓冲区分析,使得缓冲区覆盖整个突发事件发生区域,从而获得突发事件发生区域的社交媒体数据。
步骤S1中,采用网页爬虫采集社交媒体数据,具体为:
采用定制爬虫,通过输入关键词、区域段、时间范围抓取社交媒体数据。
二、一种基于社交媒体的突发事件应急信息挖掘方法,包括步骤:
采用权利要求1所述方法对实时突发事件进行分类,根据分类后突发事件的社交媒体数据进行信息挖掘。
所述的根据分类后突发事件的社交媒体数据进行信息挖掘包括:
根据分类后突发事件的社交媒体数据获得参与突发事件讨论的社交媒体用户数在时间上的变化趋势。
所述的根据分类后突发事件的社交媒体数据进行信息挖掘包括:
根据分类后突发事件的社交媒体数据分析参与各主题突发事件的社交媒体用户数随时间的变化趋势。
所述的根据分类后突发事件的社交媒体数据进行信息挖掘包括:
根据分类后突发事件的社交媒体数据分析各主题突发事件社交媒体数据发布的空间位置信息。
所述的根据分类后突发事件的社交媒体数据进行信息挖掘包括:
根据分类后突发事件的社交媒体数据分析各主题突发事件社交媒体数据发布的空间位置信息,根据空间位置信息采用多层贪心聚类法对突发事件微博点进行聚类。
所述的根据分类后突发事件的社交媒体数据进行信息挖掘包括:
根据分类后突发事件的社交媒体数据分析各主题突发事件社交媒体数据发布的空间位置信息,根据空间位置信息采用多层贪心聚类法对突发事件微博点进行聚类,从而获得热点密集区域,对热点密集区域进行核密度估计检测获得热点区域。
和现有技术相比,本发明具有如下优点和有益效果:
(1)支持实时、快速获取与突发事件相关的社交媒体数据;
(2)可自动、快速地实现社交媒体短文本的分类,从而提取突发事件应急信息;
(3)从时间、空间角度,分析了基于社交媒体的应急信息与突发事件发展过程有着紧密关系。
附图说明
图1为以北京市城区为主的社交媒体数据采集区域;
图2为网络爬虫采集社交媒体数据的具体流程图;
图3为MongoDB集群存储社交媒体数据示意图;
图4为短文本实时分类模型框架示意图;
图5为参与暴雨讨论的微博用户数、转发微博数的统计曲线以及趋势曲线;
图6为参与各主题突发事件的社交媒体用户数随时间的变化趋势,其中,纵坐标为各主题突发事件的社交媒体用户数占社交媒体总用户数的比值;
图7为参与“救援信息”主题的原创与转发的社交媒体用户数随时间的变化趋势,其中,纵坐标表示参与“救援信息”主题的原创与转发的社交媒体用户数占社交媒体总用户数的比值;
图8为“交通状况”主题下含位置信息的微博点分布密度图;
图9为“暴雨”主题微博点的聚类结果;
图10为首都机场周围暴雨微博的热点图和真实积水点分布图,其中,图(a)为暴雨微博热点图,图(b)为搜狗地图提供的真实积水点分布图;
图11为本发明的具体流程示意图;
图12为本发明***框图;
图13为信息分类表与应急信息定位。
附图中案例为2012年7月21日北京暴雨突发应急事件。
具体实施方式
一、理论基础
1、社交媒体数据采集方法
现有技术中社交媒体数据采集方法主要有两种。
一种是通过开放平台API采集社交媒体数据。新浪微博开放的应用编程接口(Application Programming Interface,API)属于Web API,为用户提供了便捷地获取微博官方数据的通道。开发者通过发送HTTP请求,后台返回符合条件的微博数据。微博开放平台列出了25类接口,其中24类可用。每个接口返回的社交媒体数据均以JSON格式进行封装。开放平台API方式有一定的不足,不能实现“关键词+区域+时间”采集数据的方式。
另一种是使用网页爬虫抓取社交媒体数据。网页爬虫分为搜索引擎爬虫和定制爬虫。本发明采用的是定制爬虫。定制爬虫主要是为了满足某一特定需求,抓取规定范围内的网页。对于以“关键词+区域+时间”方式搜索微博,大体思路为:构造URL,爬取网页,下载网页,解析网页中微博信息;构造下一个URL,直至抓取完指定时间内的微博。
2、非监督学习法
Latent Dirichlet Allocation简称LDA,是一种基于语义的主题模型。对计算机而言,每篇文档是由一组词语构成的集合,无法获悉其主题。隐含主题模型通过词语之间在文档中出现的频率,能够找出文档集中每篇文档的各主题及其概率分布情况,其中主题是一组按概率分布的词语。LDA是一种非监督学习法,其优点体现在:(1)训练时,不需要人工标注训练集,只需要输入文档集以及指定主题的数量;特别地,当文档集较大时,LDA大大节省了人工标注成本和训练时间,效率高;(2)完成训练后,各主题可通过一组词语判别其含义,每篇文档所属主题由一组概率分布给出。
3、监督学习法
支持向量机(Support Vector Machine,SVM)是一个监督学习法。给定一个训练集,包含N条样本,训练集表示为其中, 为实数集,xk表示第k条样本特征的n维向量,yk表示第k条样本对应的输出值、样本真实值或样本标记。
二、技术难点
社交媒体数据属于短文本,短文本分类存在难点:文本短小,词语过于稀疏;口语化严重,难于分词;信息噪声大。为克服短文本分类存在的问题,本发明设计了短文本实时分类模型。短文本实时分类模型主要包括学习过程和预测过程两大类,其中,学习过程又分为基于LDA的短文本样本标注和基于SVM的分类模型的训练;预测过程主要用于实时文本流中每条文本的主题推测。
三、本发明实现过程
本发明的具体实施步骤如下:
步骤1,采集社交媒体数据,社交媒体数据即文档集。
主要可通过开放平台API或网页爬虫采集社交媒体数据。
当利用新浪微博开放的API(应用编程接口)采集社交媒体数据,见图1,本发明使用多个搜索中心点,以指定的搜索半径进行缓冲区分析,以覆盖整个突发事件发生区域,从而获得突发事件发生区域的社交媒体数据。
当采用网页爬虫采集社交媒体数据,可通过输入“关键词+区域段+时间”方式搜集微博数据,即社交媒体数据。采用网页爬虫采集社交媒体数据的具体流程参见图2。
步骤2,使用MongoDB集群存储文档集。
步骤1采集的社交媒体数据为JSON格式,使用MongoDB集群存储社交媒体数据,见图3,MongoDB集群可以建立空间索引,所以能很好地组织空间数据,方便时空查询。
步骤3,社交媒体数据预处理。
社交媒体数据即文档的集合,本步骤的预处理包括文档去重、文档分词、文档去停用词和去掉词语稀少的文档,文档去重即去掉重复的文档,文档去停用词即去掉对文本分类没有作用或贡献的词语。预处理后的文档即由一系列词语构成。
步骤4,利用LDA标注预处理后的文档集,获得已知样本。
本步骤进一步包括:
4.1根据预处理后的文档集,获得社交媒体数据的文档-主题概率矩阵和主题-词语概率矩阵。
分别计算预处理后文档集中各文档主题,从而获得文档-主题概率矩阵和主题-词语概率矩阵,文档-主题概率矩阵可用来表示各文档中主题的分布,主题-词语概率矩阵可用来表示各主题中词语的分布。
文档-主题概率即文档对应到不同主题的概率,文档d对应到第i个主题的概率即文档d中对应第i个主题的词语数和文档d中词语总数的比值。
主题-词语概率即主题对应到不同词语的概率,第i个主题对应到第j个词语的概率即第i个主题中第j个词语数和第i个主题中词语总数的比值。
社交媒体数据的文档-主题概率矩阵和主题-词语概率矩阵的计算为本领域内的常规技术,为便于理解,下面将对文档-主题概率矩阵的计算过程进行详细说明。
(1)对文档集中各文档,遍历其中词语,并随机赋予各词语一个主题;遍历所有文档,获得文档-主题概率矩阵。
(2)根据文档-主题概率矩阵,采用公式(1)更新文档中各词语对应的主题,并获得新的文档-主题概率矩阵:
式(1)中:
αt为文档-主题概率分布的先验参数,即超参数;
β为主题-词语概率分布的先验参数;
V表示词典大小,词典即预处理后的文档;
Ld表示文档d的长度;
Mtw表示训练语料主题t中词语w出现的次数,表示在Mtw中剔除当前采样词语w的影响;
Mt表示训练语料中主题t的出现次数,表示在Mt中剔除当前采样词语w的影响;
Mdt表示文档d中主题t的出现次数,表示在Mdt中剔除当前主题z的影响。
(3)重复步骤(2),直至文档-主题概率矩阵收敛。
根据文档-主题概率矩阵可获得文档对应到各主题的概率,概率越大的主题,表示文档最有可能在谈论该主题,即该主题可代表文档的真正主题。
4.2确定主题概率阈值λ,遍历文档-主题概率矩阵,提取概率超过λ的文档及对应的主题作为已知样本。主题概率阈值λ为经验值。
步骤5,特征选择,获得词语特征集。
步骤4获得了已知样本,已知样本包括文档及其对应的主题,其中文档是由一系列词语构成。已知样本中所有词语构成词语特征集。将词语特征的词频作为该词语特征的权重,即将词语特征j在文档d中的词频作为文档d中词语特征j的权重。权重用于给各词语特征赋予合理的重要程度。
步骤6,构建短文本实时分类模型。
本步骤进一步包括:
6.1采用词语特征集及其中各词语特征的权值训练SVM获得SVM分类器,采用格网搜索(Grid Search)法枚举一系列SVM的模型参数(C,γ);
6.2采用K-折交叉验证法逐一验证各模型参数(C,γ)下的SVM分类器,将交叉验证效果最好的模型参数(C,γ)作为最优模型参数(C,γ),最优模型参数(C,γ)对应的SVM分类器即短文本实时分类模型。交叉验证效果采用预报误差描述,即预报误差最小即交叉验证效果最好。
步骤7,对实时突发事件社交媒体数据进行预处理,包括去广告信息、过滤转发博文、去含URL博文,基于预处理后的实时突发事件社交媒体数据,采用短文本分类模型预测突发事件主题。
步骤8,根据分类后突发事件的社交媒体数据进行信息挖掘。
所述的信息挖掘包括:
(1)获得参与突发事件讨论的社交媒体用户数在时间上的变化趋势。例如,若突发事件为暴雨,则可通过excel统计参与暴雨讨论的用户数随时间的变化趋势,见图5,其中,A点对应2012年7月21日14时北京市气象台首次发布暴雨黄色预警和雷电黄色预警时刻,微博趋势线提前1小时达到了最高点;B点对应气象台又发布暴雨橙色预警的时刻,而微博趋势线达即将达到高点;参照20日同时刻的C点,B点趋势下降的原因为晚上22时微博总体参与人数开始下降,同时用户的转发行为增强。
(2)分析参与各主题突发事件的社交媒体用户数随时间的变化趋势。例如,分别统计参与“灾情信息”、“天气报道”、“损失影响”三个主题讨论的社交媒体用户数随时间的变化,见图6;统计参与“救援信息”主题的原创与转发的社交媒体用户数随时间的变化趋势,见图7。
(3)分析突发事件社交媒体数据发布的空间位置信息。
例如,分析“交通状况”主题含位置信息的微博点空间分布,利用ArcGIS空间分析工具,绘制“交通状况”主题微博点的空间分布密度,见图8。
(4)根据突发事件微博点的空间位置信息对突发事件微博点进行聚类,以揭示突发事件在空间上的分布规律。
可采用多层次贪心聚类法对微博点进行聚类:
(a)初始默认地图缩放层级为0,将所有微博点看成一个聚落。
(b)根据地图缩放层级递增顺序,计算下一层级层次的聚类阈值。
(c)依次取出上一层级的各聚落,根据步骤(2)的聚类阈值对该聚落重新聚类:依次取出聚落内的微博点a,计算其与各新聚落的距离;若距离小于聚类阈值,将a加入这个聚落;否则,形成一个新聚落。
(d)从最低层级至最高层级,重复步骤(b)~(c)步骤,形成各层级的聚落,计算聚落的凸包范围,并存储树结构中。
根据微博点的聚类结果可获得热点密集区域,图9为暴雨主题微博点聚类结果。
(5)对热点密集区域进行核密度估计检测获得热点区域,地图上表现为热点图,见图10。
本发明采用的核密度估计公式如下:
式(2)中,f(x)表示核密度;xi表示服从未知分布的微博点,n表示微博点数;带宽h对应热点图的半径,半径越大,微博点的影响范围越广;k(·)表示核函数,定义为空间中任一点到某一中心间欧氏距离的单调函数。
图11为本发明方法的具体流程示意图,图12为本发明的***框架,主要包括数据获取、数据存储、挖掘和结果可视化四部分,分为4个显式子模块和1个隐含子模块,分别是社交媒体数据获取子模块、社交媒体数据存储子模块、应急信息挖掘子模块、挖掘结果可视化子模块和地图子模块。
不同子模块实现不同功能,其中社交媒体数据获取子模块包括开放API采集数据功能、网页爬虫采集数据功能和数据入库功能;社交媒体数据存储子模块分为采集数据存储功能、短文本分类模型存储功能、主题类别更新功能;应急信息挖掘子模块包括应急信息分类、趋势分析、聚类分析、时间排序和热度排序等功能;挖掘结果可视化子模块分为情景再现、信息分类表、应急信息定位、趋势曲线图、聚类图、热点图和词云图等可视化形式,见图13;地图子模块提供地图底图切换、缩放、漫游等基本功能。
Claims (9)
1.基于社交媒体的突发事件分类方法,其特征是,包括步骤:
S1采用开放平台API或网页爬虫采集社交媒体数据,社交媒体数据即文档集;
S2使用MongoDB集群存储文档集;
S3文档集预处理,包括文档去重、文档分词、文档去停用词和去掉词语稀少的文档;
S4利用LDA标注预处理后的文档集,获得已知样本,本步骤进一步包括:
4.1分别计算预处理后文档集中各文档主题,获得文档-主题概率矩阵和主题-词语概率矩阵;
4.2遍历文档-主题概率矩阵,将超过主题概率阈值λ的概率所对应的文档及主题作为已知样本,其中主题概率阈值λ为经验值,已知样本中文档由一系列词语构成;
S5已知样本各文档中所有词语构成词语特征集,各词语特征在文档中的词频即该词语特征在该文档中的权重;
S6构建短文本实时分类模型,本步骤进一步包括:
6.1采用词语特征集及其中各词语特征的权值训练SVM获得SVM分类器,采用格网搜索法枚举一系列SVM的模型参数;
6.2采用K-折交叉验证法逐一验证各模型参数下的SVM分类器,将预报误差最小的模型参数作为最优模型参数,最优模型参数对应的SVM分类器即短文本实时分类模型;
S7基于实时突发事件社交媒体数,采用短文本分类模型对实时突发事件进行分类,预测突发事件的主题。
2.如权利要求1所述的基于社交媒体的突发事件分类方法,其特征是:
采用开放平台API采集社交媒体数据,具体为:
使用多个搜索中心点,以指定搜索半径进行缓冲区分析,使得缓冲区覆盖整个突发事件发生区域,从而获得突发事件发生区域的社交媒体数据。
3.如权利要求1所述的基于社交媒体的突发事件分类方法,其特征是:
采用网页爬虫采集社交媒体数据,具体为:
采用定制爬虫,通过输入关键词、区域段、时间范围抓取社交媒体数据。
4.一种基于社交媒体的突发事件应急信息挖掘方法,其特征是,包括步骤:
采用权利要求1所述方法对实时突发事件进行分类,根据分类后突发事件的社交媒体数据进行信息挖掘。
5.如权利要求4所述的基于社交媒体的突发事件应急信息挖掘方法,其特征是:
所述的根据分类后突发事件的社交媒体数据进行信息挖掘包括:
根据分类后突发事件的社交媒体数据获得参与突发事件讨论的社交媒体用户数在时间上的变化趋势。
6.如权利要求4所述的基于社交媒体的突发事件应急信息挖掘方法,其特征是:
所述的根据分类后突发事件的社交媒体数据进行信息挖掘包括:
根据分类后突发事件的社交媒体数据分析参与各主题突发事件的社交媒体用户数随时间的变化趋势。
7.如权利要求4所述的基于社交媒体的突发事件应急信息挖掘方法,其特征是:
所述的根据分类后突发事件的社交媒体数据进行信息挖掘包括:
根据分类后突发事件的社交媒体数据分析各主题突发事件社交媒体数据发布的空间位置信息。
8.如权利要求4所述的基于社交媒体的突发事件应急信息挖掘方法,其特征是:
所述的根据分类后突发事件的社交媒体数据进行信息挖掘包括:
根据分类后突发事件的社交媒体数据分析各主题突发事件社交媒体数据发布的空间位置信息,根据空间位置信息采用多层贪心聚类法对突发事件微博点进行聚类。
9.如权利要求4所述的基于社交媒体的突发事件应急信息挖掘方法,其特征是:
所述的根据分类后突发事件的社交媒体数据进行信息挖掘包括:
根据分类后突发事件的社交媒体数据分析各主题突发事件社交媒体数据发布的空间位置信息,根据空间位置信息采用多层贪心聚类法对突发事件微博点进行聚类,从而获得热点密集区域,对热点密集区域进行核密度估计检测获得热点区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610345293.6A CN106021508A (zh) | 2016-05-23 | 2016-05-23 | 基于社交媒体的突发事件应急信息挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610345293.6A CN106021508A (zh) | 2016-05-23 | 2016-05-23 | 基于社交媒体的突发事件应急信息挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106021508A true CN106021508A (zh) | 2016-10-12 |
Family
ID=57095827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610345293.6A Pending CN106021508A (zh) | 2016-05-23 | 2016-05-23 | 基于社交媒体的突发事件应急信息挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106021508A (zh) |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106933949A (zh) * | 2017-01-20 | 2017-07-07 | 浙江大学 | 一种控制社交网络中影响力爆发的规划方法 |
CN107229712A (zh) * | 2017-05-27 | 2017-10-03 | 中南大学 | 一种面向公共安全事件信息获取的时空聚类方法 |
CN107908636A (zh) * | 2017-09-26 | 2018-04-13 | 武汉大学 | 一种利用社交媒体挖掘人类活动时空模式的方法 |
US10136294B2 (en) | 2015-12-17 | 2018-11-20 | Rapidsos, Inc. | Devices and methods for efficient emergency calling |
CN108959424A (zh) * | 2018-06-11 | 2018-12-07 | 长春电力设计有限公司 | 一种用于电力***负荷监测的城市用电地图的操作方法 |
US10375558B2 (en) | 2017-04-24 | 2019-08-06 | Rapidsos, Inc. | Modular emergency communication flow management system |
US10419915B2 (en) | 2016-02-26 | 2019-09-17 | Rapidsos, Inc. | Systems and methods for emergency communications amongst groups of devices based on shared data |
US10425799B2 (en) | 2014-07-08 | 2019-09-24 | Rapidsos, Inc. | System and method for call management |
US10447865B2 (en) | 2016-04-26 | 2019-10-15 | Rapidsos, Inc. | Systems and methods for emergency communications |
CN110426735A (zh) * | 2019-07-02 | 2019-11-08 | 武汉大学 | 一种基于社交媒体的地震灾害影响范围的探测方法 |
CN110555568A (zh) * | 2019-09-12 | 2019-12-10 | 重庆交通大学 | 一种基于社交网络信息的道路交通运行状态实时感知方法 |
US10657799B2 (en) | 2015-11-02 | 2020-05-19 | Rapidsos, Inc. | Method and system for situational awareness for emergency response |
US10701542B2 (en) | 2017-12-05 | 2020-06-30 | Rapidsos, Inc. | Social media content for emergency management |
US10805786B2 (en) | 2018-06-11 | 2020-10-13 | Rapidsos, Inc. | Systems and user interfaces for emergency data integration |
US10820181B2 (en) | 2018-02-09 | 2020-10-27 | Rapidsos, Inc. | Emergency location analysis system |
US10861320B2 (en) | 2016-08-22 | 2020-12-08 | Rapidsos, Inc. | Predictive analytics for emergency detection and response management |
US10911926B2 (en) | 2019-03-29 | 2021-02-02 | Rapidsos, Inc. | Systems and methods for emergency data integration |
CN112396441A (zh) * | 2019-08-14 | 2021-02-23 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及可读存储介质 |
US10977927B2 (en) | 2018-10-24 | 2021-04-13 | Rapidsos, Inc. | Emergency communication flow management and notification system |
US11146680B2 (en) | 2019-03-29 | 2021-10-12 | Rapidsos, Inc. | Systems and methods for emergency data integration |
CN113821739A (zh) * | 2021-11-22 | 2021-12-21 | 南方科技大学 | 本地事件检测方法、装置、设备和存储介质 |
US11218584B2 (en) | 2019-02-22 | 2022-01-04 | Rapidsos, Inc. | Systems and methods for automated emergency response |
US11228891B2 (en) | 2019-07-03 | 2022-01-18 | Rapidsos, Inc. | Systems and methods for emergency medical communications |
US11330664B1 (en) | 2020-12-31 | 2022-05-10 | Rapidsos, Inc. | Apparatus and method for obtaining emergency data and providing a map view |
CN114637853A (zh) * | 2022-05-17 | 2022-06-17 | 天津卓朗科技发展有限公司 | 突发事件的分级方法及其模型训练方法、装置 |
US11425529B2 (en) | 2016-05-09 | 2022-08-23 | Rapidsos, Inc. | Systems and methods for emergency communications |
US11641575B2 (en) | 2018-04-16 | 2023-05-02 | Rapidsos, Inc. | Emergency data management and access system |
US11917514B2 (en) | 2018-08-14 | 2024-02-27 | Rapidsos, Inc. | Systems and methods for intelligently managing multimedia for emergency response |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102411611A (zh) * | 2011-10-15 | 2012-04-11 | 西安交通大学 | 一种面向即时交互文本的事件识别与跟踪方法 |
CN103176981A (zh) * | 2011-12-20 | 2013-06-26 | 中国科学院计算机网络信息中心 | 一种事件信息挖掘并预警的方法 |
CN103176983A (zh) * | 2011-12-20 | 2013-06-26 | 中国科学院计算机网络信息中心 | 一种基于互联网信息的事件预警方法 |
CN103744978A (zh) * | 2014-01-14 | 2014-04-23 | 清华大学 | 一种基于网格搜索技术用于支持向量机的参数寻优方法 |
CN105260437A (zh) * | 2015-09-30 | 2016-01-20 | 陈一飞 | 文本分类特征选择方法及其在生物医药文本分类中的应用 |
-
2016
- 2016-05-23 CN CN201610345293.6A patent/CN106021508A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102411611A (zh) * | 2011-10-15 | 2012-04-11 | 西安交通大学 | 一种面向即时交互文本的事件识别与跟踪方法 |
CN103176981A (zh) * | 2011-12-20 | 2013-06-26 | 中国科学院计算机网络信息中心 | 一种事件信息挖掘并预警的方法 |
CN103176983A (zh) * | 2011-12-20 | 2013-06-26 | 中国科学院计算机网络信息中心 | 一种基于互联网信息的事件预警方法 |
CN103744978A (zh) * | 2014-01-14 | 2014-04-23 | 清华大学 | 一种基于网格搜索技术用于支持向量机的参数寻优方法 |
CN105260437A (zh) * | 2015-09-30 | 2016-01-20 | 陈一飞 | 文本分类特征选择方法及其在生物医药文本分类中的应用 |
Non-Patent Citations (6)
Title |
---|
刘坤: "基于微博的网络舆情事件主动感知研究", 《中国优秀硕士论文全文数据库》 * |
刘小溪: "基于短文本分类的微博舆情信息检测***的设计与实现", 《中国优秀硕士论文全文数据库》 * |
朱建奇等: "基于社交媒体的应急信息***设计与实现", 《测绘与空间地理信息》 * |
王健峰等: "基于改进的网格搜索法的SVM参数优化", 《应用科技》 * |
王艳东等: "基于社交媒体的突发事件应急信息挖掘与分析", 《武汉大学学报》 * |
葛文镇: "面向微博的短文本多分类研究", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11153737B2 (en) | 2014-07-08 | 2021-10-19 | Rapidsos, Inc. | System and method for call management |
US11659375B2 (en) | 2014-07-08 | 2023-05-23 | Rapidsos, Inc. | System and method for call management |
US10425799B2 (en) | 2014-07-08 | 2019-09-24 | Rapidsos, Inc. | System and method for call management |
US11580845B2 (en) | 2015-11-02 | 2023-02-14 | Rapidsos, Inc. | Method and system for situational awareness for emergency response |
US10657799B2 (en) | 2015-11-02 | 2020-05-19 | Rapidsos, Inc. | Method and system for situational awareness for emergency response |
US11605287B2 (en) | 2015-11-02 | 2023-03-14 | Rapidsos, Inc. | Method and system for situational awareness for emergency response |
US11832157B2 (en) | 2015-12-17 | 2023-11-28 | Rapidsos, Inc. | Devices and methods for efficient emergency calling |
US11140538B2 (en) | 2015-12-17 | 2021-10-05 | Rapidsos, Inc. | Devices and methods for efficient emergency calling |
US10136294B2 (en) | 2015-12-17 | 2018-11-20 | Rapidsos, Inc. | Devices and methods for efficient emergency calling |
US10701541B2 (en) | 2015-12-17 | 2020-06-30 | Rapidsos, Inc. | Devices and methods for efficient emergency calling |
US11665523B2 (en) | 2016-02-26 | 2023-05-30 | Rapidsos, Inc. | Systems and methods for emergency communications amongst groups of devices based on shared data |
US10419915B2 (en) | 2016-02-26 | 2019-09-17 | Rapidsos, Inc. | Systems and methods for emergency communications amongst groups of devices based on shared data |
US11445349B2 (en) | 2016-02-26 | 2022-09-13 | Rapidsos, Inc. | Systems and methods for emergency communications amongst groups of devices based on shared data |
US10771951B2 (en) | 2016-02-26 | 2020-09-08 | Rapidsos, Inc. | Systems and methods for emergency communications amongst groups of devices based on shared data |
US10447865B2 (en) | 2016-04-26 | 2019-10-15 | Rapidsos, Inc. | Systems and methods for emergency communications |
US11425529B2 (en) | 2016-05-09 | 2022-08-23 | Rapidsos, Inc. | Systems and methods for emergency communications |
US10861320B2 (en) | 2016-08-22 | 2020-12-08 | Rapidsos, Inc. | Predictive analytics for emergency detection and response management |
US11790766B2 (en) | 2016-08-22 | 2023-10-17 | Rapidsos, Inc. | Predictive analytics for emergency detection and response management |
CN106933949B (zh) * | 2017-01-20 | 2020-09-11 | 浙江大学 | 一种控制社交网络中影响力爆发的规划方法 |
CN106933949A (zh) * | 2017-01-20 | 2017-07-07 | 浙江大学 | 一种控制社交网络中影响力爆发的规划方法 |
US11974207B2 (en) | 2017-04-24 | 2024-04-30 | Rapidsos, Inc. | Modular emergency communication flow management system |
US10375558B2 (en) | 2017-04-24 | 2019-08-06 | Rapidsos, Inc. | Modular emergency communication flow management system |
US11496874B2 (en) | 2017-04-24 | 2022-11-08 | Rapidsos, Inc. | Modular emergency communication flow management system |
CN107229712A (zh) * | 2017-05-27 | 2017-10-03 | 中南大学 | 一种面向公共安全事件信息获取的时空聚类方法 |
CN107908636A (zh) * | 2017-09-26 | 2018-04-13 | 武汉大学 | 一种利用社交媒体挖掘人类活动时空模式的方法 |
US11197145B2 (en) | 2017-12-05 | 2021-12-07 | Rapidsos, Inc. | Social media content for emergency management |
US10701542B2 (en) | 2017-12-05 | 2020-06-30 | Rapidsos, Inc. | Social media content for emergency management |
US10820181B2 (en) | 2018-02-09 | 2020-10-27 | Rapidsos, Inc. | Emergency location analysis system |
US11818639B2 (en) | 2018-02-09 | 2023-11-14 | Rapidsos, Inc. | Emergency location analysis system |
US11641575B2 (en) | 2018-04-16 | 2023-05-02 | Rapidsos, Inc. | Emergency data management and access system |
US10805786B2 (en) | 2018-06-11 | 2020-10-13 | Rapidsos, Inc. | Systems and user interfaces for emergency data integration |
CN108959424B (zh) * | 2018-06-11 | 2021-08-20 | 长春电力设计有限公司 | 一种用于电力***负荷监测的城市用电地图的操作方法 |
US11310647B2 (en) | 2018-06-11 | 2022-04-19 | Rapidsos, Inc. | Systems and user interfaces for emergency data integration |
CN108959424A (zh) * | 2018-06-11 | 2018-12-07 | 长春电力设计有限公司 | 一种用于电力***负荷监测的城市用电地图的操作方法 |
US11871325B2 (en) | 2018-06-11 | 2024-01-09 | Rapidsos, Inc. | Systems and user interfaces for emergency data integration |
US11917514B2 (en) | 2018-08-14 | 2024-02-27 | Rapidsos, Inc. | Systems and methods for intelligently managing multimedia for emergency response |
US10977927B2 (en) | 2018-10-24 | 2021-04-13 | Rapidsos, Inc. | Emergency communication flow management and notification system |
US11741819B2 (en) | 2018-10-24 | 2023-08-29 | Rapidsos, Inc. | Emergency communication flow management and notification system |
US11218584B2 (en) | 2019-02-22 | 2022-01-04 | Rapidsos, Inc. | Systems and methods for automated emergency response |
US11689653B2 (en) | 2019-02-22 | 2023-06-27 | Rapidsos, Inc. | Systems and methods for automated emergency response |
US11146680B2 (en) | 2019-03-29 | 2021-10-12 | Rapidsos, Inc. | Systems and methods for emergency data integration |
US11558728B2 (en) | 2019-03-29 | 2023-01-17 | Rapidsos, Inc. | Systems and methods for emergency data integration |
US10911926B2 (en) | 2019-03-29 | 2021-02-02 | Rapidsos, Inc. | Systems and methods for emergency data integration |
US11943694B2 (en) | 2019-03-29 | 2024-03-26 | Rapidsos, Inc. | Systems and methods for emergency data integration |
US11695871B2 (en) | 2019-03-29 | 2023-07-04 | Rapidsos, Inc. | Systems and methods for emergency data integration |
CN110426735A (zh) * | 2019-07-02 | 2019-11-08 | 武汉大学 | 一种基于社交媒体的地震灾害影响范围的探测方法 |
US11716605B2 (en) | 2019-07-03 | 2023-08-01 | Rapidsos, Inc. | Systems and methods for victim identification |
US11228891B2 (en) | 2019-07-03 | 2022-01-18 | Rapidsos, Inc. | Systems and methods for emergency medical communications |
CN112396441B (zh) * | 2019-08-14 | 2023-08-22 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及可读存储介质 |
CN112396441A (zh) * | 2019-08-14 | 2021-02-23 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及可读存储介质 |
CN110555568A (zh) * | 2019-09-12 | 2019-12-10 | 重庆交通大学 | 一种基于社交网络信息的道路交通运行状态实时感知方法 |
CN110555568B (zh) * | 2019-09-12 | 2022-12-02 | 重庆交通大学 | 一种基于社交网络信息的道路交通运行状态实时感知方法 |
US11528772B2 (en) | 2020-12-31 | 2022-12-13 | Rapidsos, Inc. | Apparatus and method for obtaining emergency data related to emergency sessions |
US11330664B1 (en) | 2020-12-31 | 2022-05-10 | Rapidsos, Inc. | Apparatus and method for obtaining emergency data and providing a map view |
US11956853B2 (en) | 2020-12-31 | 2024-04-09 | Rapidsos, Inc. | Apparatus and method for obtaining emergency data and providing a map view |
CN113821739A (zh) * | 2021-11-22 | 2021-12-21 | 南方科技大学 | 本地事件检测方法、装置、设备和存储介质 |
CN114637853A (zh) * | 2022-05-17 | 2022-06-17 | 天津卓朗科技发展有限公司 | 突发事件的分级方法及其模型训练方法、装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106021508A (zh) | 基于社交媒体的突发事件应急信息挖掘方法 | |
De Albuquerque et al. | A geographic approach for combining social media and authoritative data towards identifying useful information for disaster management | |
Zou et al. | Comprehensive flood risk assessment based on set pair analysis-variable fuzzy sets model and fuzzy AHP | |
CN108446293A (zh) | 一种基于城市多源异构数据构建城市画像的方法 | |
CN111459908A (zh) | 一种基于数据湖的多源异构生态环境大数据处理方法及*** | |
Ray et al. | A backcast land use change model to generate past land use maps: application and validation at the Muskegon River watershed of Michigan, USA | |
CN107229712A (zh) | 一种面向公共安全事件信息获取的时空聚类方法 | |
CN110533212A (zh) | 基于大数据的城市内涝舆情监测预警方法 | |
Xing et al. | Crowdsourced social media and mobile phone signaling data for disaster impact assessment: A case study of the 8.8 Jiuzhaigou earthquake | |
CN104346425A (zh) | 一种层次化的互联网舆情指标体系的方法及*** | |
Corcoran et al. | Characterising the metric and topological evolution of OpenStreetMap network representations | |
CN103793489A (zh) | 一种在线社交网络中社群话题的发现方法 | |
CN109508363A (zh) | 基于gis的水利大数据服务平台及其工作方法 | |
Tang et al. | Social media-based disaster research: Development, trends, and obstacles | |
CN103440328B (zh) | 一种基于鼠标行为的用户分类方法 | |
JP2023504961A (ja) | 台風事件情報収束方法 | |
Wu et al. | Tracking spatio-temporal variation of geo-tagged topics with social media in China: A case study of 2016 hefei rainstorm | |
Zhu et al. | A decision tree model for meteorological disasters grade evaluation of flood | |
Beshir et al. | Trend analysis, past dynamics and future prediction of land use and land cover change in upper Wabe-Shebele river basin | |
Li et al. | Retrospective research on the interactions between land-cover change and global warming using bibliometrics during 1991–2018 | |
Vega-Oliveros et al. | From spatio-temporal data to chronological networks: An application to wildfire analysis | |
Yang et al. | Analysis of spatial and temporal characteristics of major natural disasters in China from 2008 to 2021 based on mining news database | |
CN106056515A (zh) | 一种社区网格事件聚类特征的提取方法 | |
Wu et al. | Mining typhoon victim information based on multi-source data fusion using social media data in China: a case study of the 2019 Super Typhoon Lekima | |
Zhang et al. | The GPS trajectory data research based on the intelligent traffic big data analysis platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20161012 |
|
WD01 | Invention patent application deemed withdrawn after publication |