CN110866126A - 一种高校网络舆情风险评估方法 - Google Patents

一种高校网络舆情风险评估方法 Download PDF

Info

Publication number
CN110866126A
CN110866126A CN201911157105.7A CN201911157105A CN110866126A CN 110866126 A CN110866126 A CN 110866126A CN 201911157105 A CN201911157105 A CN 201911157105A CN 110866126 A CN110866126 A CN 110866126A
Authority
CN
China
Prior art keywords
public opinion
knowledge
college
data
risk assessment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911157105.7A
Other languages
English (en)
Inventor
刘垣
郭李华
苏建新
潘栋
卓超
王沁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian University of Technology
Original Assignee
Fujian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian University of Technology filed Critical Fujian University of Technology
Priority to CN201911157105.7A priority Critical patent/CN110866126A/zh
Publication of CN110866126A publication Critical patent/CN110866126A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种高校网络舆情风险评估方法,在专业的网站流量分析工具对高校网站进行实时监测基础之上,有针对性地基于主题网络在线爬虫技术,收集舆情多媒体信息和关键字外,还有高校实地调研的舆情数据,构建高校网络舆情风险评估知识图谱。本发明的知识图谱采用自底向上方案构建,每个知识单元的真实数据存放于数据层,再通过三元组存放于图数据库中;在数据层之上是模式层,通过本体库的途径进而实现对知识图谱的管理;从开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式。本发明不涉及科技行业媒体数据,也不对微博文本进行处理。本发明通过从高校网络、高校实地调研获取实体数据。

Description

一种高校网络舆情风险评估方法
技术领域
本发明涉及数据处理技术,尤其涉及一种高校网络舆情风险评估方法。
背景技术
几乎所有高校的师生都已成为互联网群体的一份子。网络承载着众多人的思想碰撞、情感交流、信息互换和压力宣泄,这样的复杂性容易导致高校网络舆情充满正反两面的不同冲击。正面网络舆论可以鼓舞师生奋发向上,扩大高校的影响力,提升高校形象,负面的标签化传播容易影响人们的态度、观点或行为,煽动人们负面情绪,给舆情处置和弥合撕裂造成难度,甚至产生舆情危机,威胁到社会的安定团结。
近年来,国内已经有许多学者开始研究网络舆情指标体系,并希望通过该体系的建立对舆情进行监测、评估或者预警。2016年宋余超等根据数据立方体和雪花型模式,从舆情主题、舆情传播和舆情受众3个维度构建监测指标体系;2017年王静茹等通过相关性分析和主成分分析相结合的方法对指标进行筛选并基于BP神经网络设定各级指标权重来建立危机监测指标体系;2018年覃玉冰等提出运用层次分析方法构建网络舆情评估指标体系。
发明专利申请201910277297 .9,公布了一种企业网络舆情潜在风险的评估方法及***,该方法包括基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值;基于正面网络舆情值和负面网络舆情值预测企业的网络声誉破产违约距离,并基于网络声誉破产违约距离得到企业的网络声誉破产概率,根据网络声誉破产概率得到企业网络声誉潜在风险值。
发明专利申请201711241476.4,公布了一种网络舆情风险评估方法及装置,该方法包括:根据网络资源库中的网络资源进行数据采集,得到网络舆情数据;提取所述网络舆情数据的要素信息,根据要素信息对所述网络舆情进行数据分析,得到分析结果;根据所述分析结果和关键词字典中的关键词,对所述网络舆情数据进行风险评估。它是根据网络资源库中的网络资源的属性调用对应的网络爬虫进行周期性数据采集,并对采集的数据进行去重和归一化处理,得到网络舆情数据。
发明专利申请201710169810.3,公布了一种知识图谱构建方法及装置,它是针对科技行业的媒体数据构建知识图谱。媒体数据存在大量的实体和关系,为了有效挖掘科技创新项目潜在价值、预警潜在投资风险,帮助一级市场金融投资行业的各项业务提升效率而构建知识图谱。知识图谱的构建方法是,基于科技行业媒体原始数据的舆情判断节点的价值,有效识别出最有价值的节点。没有采用人工干预的方式。
发明专利申请201710827984.4,公布了一种基于热点事件的舆情知识图谱构建方法,它是针对微博文本进行处理,构建文本簇,计算每个文本簇所属的话题类别,按类别识别每个簇中的热点事件,统计每个热点事件的多维属性:识别参与热点事件讨论的重要人物和机构,并获取重要人物和机构的多维属性;最后构建事件、人物、机构的多维属性体系及关系类型,以事件、人物、机构为实体,事件、人物、机构之间的关系为关联,构建舆情知识图谱。
在互联网舆论生态、媒体格局、传播方式都发生深刻变化的今天,以往的舆情风险评估指标已不合适,现有的网络舆情评估***还没有发现从构建原则、安全网络产品硬件设备和软件算法模型等多方面构建的,也没有发现针对高校的网络舆情风险评估***。
发明内容
本发明的目的在于提供一种高校网络舆情风险评估方法。
本发明采用的技术方案是:
一种高校网络舆情风险评估方法,其包括以下步骤:
步骤1,利用主题网络在线爬虫技术收集高校网站的目标舆情关键字信息,同时爬取媒体信息共同形成网络舆情信息;
步骤2,将网络舆情信息中的非文本信息转化或提取为文本信息;
步骤3,对收集的非结构化和半结构化的数据进行知识抽取得到知识图谱所需结构化数据信息,并存储到知识图谱的数据层;
步骤4,将结构化的数据与第三方数据库进行数据整合,并将经过知识抽取得到的数据进行实体对齐后,再运用质量评估以及本体抽取完成知识融合;
步骤5,分析知识融合后数据的逻辑关系形成知识图谱的本体模型;
步骤6,判断该本体模型符合实际逻辑是否符合实际逻辑;是则,用于构建知识图谱;否则,返回步骤4重新进行知识融合;
步骤7,利用可视化的工具对己有的挖掘结果进行优化生成数据综合立方体,并创建各种文档的多维视图以揭示各种空间映射关系,从而能够在确保可信度和有效性的前提下完成网络舆情监控分析报告;
步骤8,将网络舆情按态势由高至低排序后向决策者实时推送排序前列的舆情。
进一步地,步骤1中用Python Spider爬取媒体信息,且重点收集短视频。
进一步地,步骤1中收集高校网站的目标舆情关键字信息具体步骤为:
步骤1-1,利用主题网络在线爬虫技术收集指定目标主题关键字并表示为指定目标主题关键字的向量;
步骤1-2,依据内容与主题关键字的相关度计算出相应网页内容与目标主题关键字的相互关联程度,
步骤1-3,结合超链接分析网页的相关度评价,下载程序代码将根据相关度评价结果与设置的阈值的比较结果选择下载收集对应网页的超链接。
可见,在实际应用中采用这技术进行采集时并不需要程序采集全部的网页,因此,对比普通网络在线爬虫,该技术所需要保存的网页页面相对较少,能够节约很多相关的运行设备或网络存储资源,同时,可以有效满足使用者对查找指定关键字这一主题的相关需求。
进一步地,步骤2中将声音和视频转化为文本,并获取表情包的文本标签,用于构建舆情风险知识图谱。
进一步地,步骤3中知识抽取采用隐马尔可夫模型进行实体抽取,在实体识别的基础上确定无结构舆情文本中实体之间的关系类别并形成结构化的数据,以便存储和取用。实体抽取的质量决定了高校网络舆情风险知识图谱的深度与广度。
进一步地,步骤3中知识抽取包括实体抽取、关系抽取和事件抽取。
进一步地,步骤3中知识提取时针对数据量庞大的网络文本,在必要的时候进行降维处理,保留权值高的词条,并排除有倾向性的感情敏感字眼。
进一步地,步骤3的具体包括以下步骤:
步骤3-1,将文本信息进行规范化的预热处理,通过格式化将获取的HTML文档进行结构和语义上的重新处理;
步骤3-2,运用自然语言处理技术对已经形成的半结构数据进行特征提取确认文本实体之间的关系类别并形成结构化的数据。
进一步地,步骤3-2中关系类别包括同义关系、反义关系、主从关系。
进一步地,步骤7中利用CiteSpace文本可视化分析软件,或通过百分点DeepFinder***平台,绘制高校网络舆情风险评估知识图谱。
本发明采用以上技术方案,本发明充分利用现有软件自动获取一段时间的网络热点新闻和突发事件,并形成关键词予以反馈;通过从互联网与高校实地调研获取实体数据实现统一聚合,形成舆情风险评估知识图谱逻辑架构。利用现有软件自动获取一段时间的网络热点新闻和突发事件。本发明除了在专业的网站流量分析工具对高校网站进行实时监测基础之上,有针对性地基于主题网络在线爬虫技术,收集舆情多媒体信息和关键字外,还有高校实地调研的舆情数据,构建高校网络舆情风险评估知识图谱。本发明的知识图谱采用自底向上方案构建,每个知识单元的真实数据存放于数据层,再通过三元组存放于图数据库中;在数据层之上是模式层,通过本体库的途径进而实现对知识图谱的管理;从开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式。本发明不涉及科技行业媒体数据,也不对微博文本进行处理。本发明通过从高校网络、高校实地调研获取实体数据。
附图说明
以下结合附图和具体实施方式对本发明做进一步详细说明;
图1为本发明一种高校网络舆情风险评估方法的流程示意图。
具体实施方式
如图1所示,本发明公开了一种高校网络舆情风险评估方法,其包括以下步骤:
步骤1,利用主题网络在线爬虫技术收集高校网站的目标舆情关键字信息,同时爬取媒体信息共同形成网络舆情信息;
具体地,步骤1中收集高校网站的目标舆情关键字信息具体步骤为:
步骤1-1,利用主题网络在线爬虫技术收集指定目标主题关键字并表示为指定目标主题关键字的向量;
步骤1-2,依据内容与主题关键字的相关度计算出相应网页内容与目标主题关键字的相互关联程度;
步骤1-3,结合超链接分析网页的相关度评价,下载程序代码将根据相关度评价结果与设置的阈值的比较结果选择下载收集对应网页的超链接。
步骤2,将网络舆情信息中的非文本信息转化或提取为文本信息;具体地,将声音和视频转化为文本,并获取表情包的文本标签,用于构建舆情风险知识图谱;
步骤3,对收集的非结构化和半结构化的数据进行知识抽取得到知识图谱所需结构化数据信息,并存储到知识图谱的数据层。
进一步地,步骤3中知识抽取采用隐马尔可夫模型进行实体抽取,在实体识别的基础上确定无结构舆情文本中实体之间的关系类别并形成结构化的数据,以便存储和取用。
进一步地,步骤3中知识抽取包括实体抽取、关系抽取和事件抽取。实体抽取的质量决定了高校网络舆情风险知识图谱的深度与广度。
进一步地,步骤3中知识提取时针对数据量庞大的网络文本,在必要的时候进行降维处理,保留权值高的词条,并排除有倾向性的感情敏感字眼。
进一步地,步骤3的具体包括以下步骤:
步骤3-1,将文本信息进行规范化的预热处理,通过格式化将获取的HTML文档进行结构和语义上的重新处理;
步骤3-2,运用自然语言处理技术对已经形成的半结构数据进行特征提取确认文本实体之间的关系类别并形成结构化的数据。关系类别包括同义关系、反义关系、主从关系。
步骤4,将结构化的数据与第三方数据库进行数据整合,并将经过知识抽取得到的数据进行实体对齐后,再运用质量评估以及本体抽取完成知识融合;
步骤5,分析知识融合后数据的逻辑关系形成知识图谱的本体模型;
步骤6,判断该本体模型符合实际逻辑是否符合实际逻辑;是则,用于构建知识图谱;否则,返回步骤4重新进行知识融合;
步骤7,利用可视化的工具对己有的挖掘结果进行优化生成数据综合立方体,并创建各种文档的多维视图以揭示各种空间映射关系,从而能够在确保可信度和有效性的前提下完成网络舆情监控分析报告;具体地作为较优实施方式,步骤7中利用CiteSpace文本可视化分析软件,或通过百分点DeepFinder***平台,绘制高校网络舆情风险评估知识图谱;
步骤8,将网络舆情按态势由高至低排序后向决策者实时推送排序前列的舆情。
下面就本发明的具体原理做详细说明:
学校通过信息安全评估标准验证服务器、路由器、防火墙、个人电脑、手机等网络产品是直接面向高校各部门和个体用户的基础资源的信息安全质量,在一定程度上发现产品的潜在风险,防止有安全威胁的设备投入使用;同时通过校园网认证上网的网络产品可以长期、有效地对其安全质量进行监测、跟踪。能快速定位风险漏洞,及时发现风险热点话题,为学校监管部门的决策行动提供情报支持。
本发明利用专业的网站流量分析工具对高校网站进行实时监测,有针对性地收集网络舆情信息。实时监测高校在线社交网络平台的热点事件、热门话题等重点关注信息,提高舆情早发现的实时性和全面性。本发明具体而言包括如下部分:
1、网络舆情信息的提取收集:
利用主题网络在线爬虫技术,收集舆情关键字信息,利用Python Spider爬取媒体信息,重点收集短视频;
利用主题网络在线爬虫技术收集指定目标主题关键字,针对指定的目标主题关键字(或者是关键字列表)完成向量表示,并依据内容与主题关键字的相关度有效计算出相应网页内容与主题的相互关联程度,同时根据设置的阈值结合超链接分析来完成对网页的相关度评价,下载程序代码将根据这一评价结果,决定选择下载哪个队列里的超链接。在实际应用中采用这技术进行采集时并不需要程序采集全部的网页,因此,对比普通网络在线爬虫,该技术所需要保存的网页页面相对较少,能够节约很多相关的运行设备或网络存储资源,同时,可以有效满足使用者对查找指定关键字这一主题的相关需求;
当前高校学生热衷上传短视频传播热点社会事件。一个带摄像头的手机可以让普通人成为视频的发布者和议题的发起者,完成媒体记者出镜、采访、剪辑、发布等复杂的新闻采集任务。由于短视频比文字、图片更具真实感,增强了观众的信任感和参与感,已成为触发舆论关注的重要载体,成为移动互联网时代更为便捷的内容形式及舆情信息传播的新路径。
2、网络舆情风险评估知识图谱构建与分析:
知识图谱的每个知识单元的真实数据存放于数据层,再通过三元组,存放于图数据库中;在数据层之上是模式层,通过本体库的途径进而实现对知识图谱的管理。
本发明针对收集的文本、表情包、声音和视频进行分析挖掘。可将声音和视频转化为文本,并获取表情包的文本标签,构建舆情风险知识图谱,进行舆情信息挖掘。
本发明充分利用现有软件自动获取一段时间的网络热点新闻和突发事件,并形成关键词予以反馈。通过从互联网与高校实地调研获取实体数据,实现统一聚合,形成舆情风险评估知识图谱逻辑架构。
本发明采用自底向上方案构建高校网络舆情风险评估知识图谱,从一些开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式。
具体地,构建知识图谱包括如下几个方面.
2-1、知识抽取:从非结构化和半结构化的数据中抽取知识图谱所需结构化数据信息,并将这些数据信息存储到知识图谱的数据层之中;
文本信息首先进行规范化的预热处理,通过格式化将获取的HTML文档进行结构和语义上的重新处理。然后运用自然语言处理技术等方法对已经形成的半结构数据进行特征提取,发现其中的同义关系等。网络文本的数据量庞大,在必要的时候可以进行降维处理,只保留权值较高的词条。而对于还有倾向性明显的感情敏感字眼,应予以排除;
知识抽取包括实体抽取、关系抽取和事件抽取。我们采用隐马尔可夫模型进行实体抽取,在实体识别的基础上确定无结构舆情文本中实体之间的关系类别,并形成结构化的数据,以便存储和取用。实体抽取的质量决定了高校网络舆情风险知识图谱的深度与广度。
2-2、知识融合:通过第三方数据库和结构化的数据进行数据整合,并将经过知识抽取而得到的数据进行实体对齐,之后运用质量评估和本体抽取,完成知识融合工作;
2-3、知识图谱构建:通过知识融合处理得到的数据,分析其中的逻辑关系,形成知识图谱的本体模型,然后对其进行判定,将其中符合实际逻辑的情况用于构建知识图谱,反之则返回知识推理,重新进行知识融合;
2-4、分析阶段:利用CiteSpace文本可视化分析软件,或通过百分点DeepFinder***平台,绘制高校网络舆情风险评估知识图谱,利用可视化的工作对己有的挖掘结果进行优化,生成数据综合立方体,创建各种文档的多维视图,全面揭示各种空间映射关系,从而能够在确保可信度和有效性的前提下完成网络舆情监控分析报告。对互联网信息进行多维统计分析,计算高校各院系机构的情绪、热词等舆情指数,为舆情研判提供支持。通过分析舆情事件的言论观点、发展趋势、传播源头、传播路径、校内院系机构分布等,便于掌握事件的发展历程、关键节点和传播影响,做出针对性响应措施。
本发明的方法便于学校及时预警与便捷响应:高校网络舆情风险评估方法用词云图、地图、热力图、仪表盘、雷达图和动态曲线等方式展现舆情态势实时变化,帮助决策者快速把握舆情态势。进一步,本发明的方法可及时将关注的信息通过桌面提醒、QQ、微信、邮件或短信等方式通知用户,保障线上、线下预警方式的有效性。
本发明的方法实时推送高校各院系机构的热门事件、重点博主动态、最新敏感舆情,确保决策者及时掌握重点舆情;实时播报高校各院系机构的突发事件,通过弹窗预警,让决策者及时了解、快速决策,防止舆情事态蔓延扩大。此外,本发明的方法允许通过授权,进行快捷互动,以便于网络舆情的事实澄清或诉求回应。
本发明采用以上技术方案,充分利用现有软件自动获取一段时间的网络热点新闻和突发事件,并形成关键词予以反馈;通过从互联网与高校实地调研获取实体数据实现统一聚合,形成舆情风险评估知识图谱逻辑架构。利用现有软件自动获取一段时间的网络热点新闻和突发事件。本发明除了在专业的网站流量分析工具对高校网站进行实时监测基础之上,有针对性地基于主题网络在线爬虫技术,收集舆情多媒体信息和关键字外,还有高校实地调研的舆情数据,构建高校网络舆情风险评估知识图谱。本发明的知识图谱采用自底向上方案构建,每个知识单元的真实数据存放于数据层,再通过三元组存放于图数据库中;在数据层之上是模式层,通过本体库的途径进而实现对知识图谱的管理;从开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式。本发明不涉及科技行业媒体数据,也不对微博文本进行处理。本发明通过从高校网络、高校实地调研获取实体数据。

Claims (10)

1.一种高校网络舆情风险评估方法,其特征在于:其包括以下步骤:
步骤1,利用主题网络在线爬虫技术收集高校网站的目标舆情关键字信息,同时爬取媒体信息共同形成网络舆情信息;
步骤2,将网络舆情信息中的非文本信息转化或提取为文本信息;
步骤3,对收集的非结构化和半结构化的数据进行知识抽取得到知识图谱所需结构化数据信息,并存储到知识图谱的数据层;
步骤4,将结构化的数据与第三方数据库进行数据整合,并将经过知识抽取得到的数据进行实体对齐后,再运用质量评估以及本体抽取完成知识融合;
步骤5,分析知识融合后数据的逻辑关系形成知识图谱的本体模型,
步骤6,判断该本体模型符合实际逻辑是否符合实际逻辑;是则,用于构建知识图谱;否则,返回步骤4重新进行知识融合;
步骤7,利用可视化的工具对己有的挖掘结果进行优化生成数据综合立方体,并创建各种文档的多维视图以揭示各种空间映射关系,形成网络舆情监控分析报告;
步骤8,根据网络舆情监控分析报告向决策者实时推送排序前列的舆情。
2. 根据权利要求1所述的一种高校网络舆情风险评估方法,其特征在于:步骤1中用Python Spider爬取媒体信息,且重点收集短视频。
3.根据权利要求1所述的一种高校网络舆情风险评估方法,其特征在于:步骤1中收集高校网站的目标舆情关键字信息具体步骤为:
步骤1-1,利用主题网络在线爬虫技术收集指定目标主题关键字并表示为指定目标主题关键字的向量;
步骤1-2,依据内容与主题关键字的相关度计算出相应网页内容与目标主题关键字的相互关联程度,
步骤1-3,结合超链接分析网页的相关度评价,下载程序代码将根据相关度评价结果与设置的阈值的比较结果选择下载收集对应网页的超链接。
4.根据权利要求1所述的一种高校网络舆情风险评估方法,其特征在于:步骤2中将声音和视频转化为文本,并获取表情包的文本标签以用于构建舆情风险知识图谱。
5.根据权利要求1所述的一种高校网络舆情风险评估方法,其特征在于:步骤3的具体包括以下步骤:
步骤3-1,将文本信息进行规范化的预热处理,通过格式化将获取的HTML文档进行结构和语义上的重新处理;
步骤3-2,运用自然语言处理技术对已经形成的半结构数据进行特征提取确认文本实体之间的关系类别并形成结构化的数据。
6.根据权利要求5所述的一种高校网络舆情风险评估方法,其特征在于:步骤3-2中关系类别包括同义关系、反义关系、主从关系。
7.根据权利要求1所述的一种高校网络舆情风险评估方法,其特征在于:步骤3中知识抽取包括实体抽取、关系抽取和事件抽取。
8.根据权利要求1所述的一种高校网络舆情风险评估方法,其特征在于:步骤3中知识抽取采用隐马尔可夫模型进行实体抽取,在实体识别的基础上确定无结构舆情文本中实体之间的关系类别并形成结构化的数据以便存储和取用。
9.根据权利要求1所述的一种高校网络舆情风险评估方法,其特征在于:步骤3中知识提取时针对数据量庞大的网络文本,在必要的时候进行降维处理,保留权值高的词条并排除有倾向性的感情敏感字眼。
10.根据权利要求1所述的一种高校网络舆情风险评估方法,其特征在于:步骤7中利用CiteSpace文本可视化分析软件,或通过百分点DeepFinder***平台,绘制高校网络舆情风险评估知识图谱。
CN201911157105.7A 2019-11-22 2019-11-22 一种高校网络舆情风险评估方法 Pending CN110866126A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911157105.7A CN110866126A (zh) 2019-11-22 2019-11-22 一种高校网络舆情风险评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911157105.7A CN110866126A (zh) 2019-11-22 2019-11-22 一种高校网络舆情风险评估方法

Publications (1)

Publication Number Publication Date
CN110866126A true CN110866126A (zh) 2020-03-06

Family

ID=69655751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911157105.7A Pending CN110866126A (zh) 2019-11-22 2019-11-22 一种高校网络舆情风险评估方法

Country Status (1)

Country Link
CN (1) CN110866126A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428090A (zh) * 2020-03-10 2020-07-17 北京明略软件***有限公司 一种实现数据处理的方法、装置、计算机存储介质及终端
CN111581982A (zh) * 2020-05-06 2020-08-25 首都师范大学 一种基于本体的医疗纠纷案件舆情预警等级的预测方法
CN111581394A (zh) * 2020-04-30 2020-08-25 北京印刷学院 一种大规模知识地形图绘制方法
CN111881302A (zh) * 2020-07-23 2020-11-03 民生科技有限责任公司 基于知识图谱的银行舆情分析方法和***
CN111931027A (zh) * 2020-08-17 2020-11-13 深圳新闻网传媒股份有限公司 一种智能新闻舆情预警***
CN111984786A (zh) * 2020-08-17 2020-11-24 深圳新闻网传媒股份有限公司 一种基于新闻信息的智能吹哨预警方法及服务器
CN112131392A (zh) * 2020-08-01 2020-12-25 赛飞特工程技术集团有限公司 基于知识图谱的公共卫生疫情预警方法及***
CN112214663A (zh) * 2020-10-22 2021-01-12 上海明略人工智能(集团)有限公司 获取舆情声量的方法、***、装置、存储介质及移动终端
CN112287116A (zh) * 2020-10-29 2021-01-29 上海朋程勤学文化传播有限公司 一种基于知识图谱的院校数据分析方法
CN112668384A (zh) * 2020-08-07 2021-04-16 深圳市唯特视科技有限公司 一种知识图谱构建方法、***、电子设备及存储介质
CN112685621A (zh) * 2021-01-06 2021-04-20 深圳市网联安瑞网络科技有限公司 融合舆情风向跟踪及民情预测的网络舆情检测***与方法
CN112732781A (zh) * 2020-12-30 2021-04-30 深圳市网联安瑞网络科技有限公司 融合数据质量多维度评估的网情态势动态绘制***及方法
CN112883278A (zh) * 2021-03-23 2021-06-01 西安电子科技大学昆山创新研究院 基于智慧社区大数据知识图谱的不良舆论传播抑制方法
CN113220973A (zh) * 2021-05-31 2021-08-06 北京海纳数聚科技有限公司 一种基于知识推理技术的舆情验真方法
CN113570182A (zh) * 2021-05-06 2021-10-29 深圳怀新企业投资顾问股份有限公司 声誉风险管理能力评估方法、装置、设备和存储介质
CN113779195A (zh) * 2021-08-31 2021-12-10 西南电子技术研究所(中国电子科技集团公司第十研究所) 热点事件状态评估方法
CN114565486A (zh) * 2022-01-12 2022-05-31 黑龙江科技大学 一种课程学习***的构建方法
CN115422948A (zh) * 2022-11-04 2022-12-02 文灵科技(北京)有限公司 一种基于语义分析的事件层次网络识别***及方法
CN117633324A (zh) * 2023-11-03 2024-03-01 北京东方通网信科技有限公司 一种自定义的可视化爬虫配置方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509350A (zh) * 2011-09-30 2012-06-20 北京航空航天大学 一种基于立方体的体育运动赛事信息可视化方法
CN106709052A (zh) * 2017-01-06 2017-05-24 电子科技大学 一种基于关键词的主题网络爬虫设计方法
CN107783973A (zh) * 2016-08-24 2018-03-09 慧科讯业有限公司 基于行业知识图谱数据库对互联网媒体事件进行监测的方法、装置和***
CN109241429A (zh) * 2018-09-05 2019-01-18 食品安全与营养(贵州)信息科技有限公司 一种食品安全舆情监控方法及***
CN109977278A (zh) * 2019-02-21 2019-07-05 中国电子科技集团公司第二十八研究所 舆情数据的可视化展示***、方法、设备及存储介质
US20190278796A1 (en) * 2016-09-22 2019-09-12 Dogma Srl. Method and system for searching, publishing and managing the lite cycle of multimedia contents related to public events and the user experience

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509350A (zh) * 2011-09-30 2012-06-20 北京航空航天大学 一种基于立方体的体育运动赛事信息可视化方法
CN107783973A (zh) * 2016-08-24 2018-03-09 慧科讯业有限公司 基于行业知识图谱数据库对互联网媒体事件进行监测的方法、装置和***
US20190278796A1 (en) * 2016-09-22 2019-09-12 Dogma Srl. Method and system for searching, publishing and managing the lite cycle of multimedia contents related to public events and the user experience
CN106709052A (zh) * 2017-01-06 2017-05-24 电子科技大学 一种基于关键词的主题网络爬虫设计方法
CN109241429A (zh) * 2018-09-05 2019-01-18 食品安全与营养(贵州)信息科技有限公司 一种食品安全舆情监控方法及***
CN109977278A (zh) * 2019-02-21 2019-07-05 中国电子科技集团公司第二十八研究所 舆情数据的可视化展示***、方法、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖维泽: "基于知识图谱的多媒体网络舆情语义识别案例库构建", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428090A (zh) * 2020-03-10 2020-07-17 北京明略软件***有限公司 一种实现数据处理的方法、装置、计算机存储介质及终端
CN111581394A (zh) * 2020-04-30 2020-08-25 北京印刷学院 一种大规模知识地形图绘制方法
CN111581394B (zh) * 2020-04-30 2023-06-23 北京印刷学院 一种大规模知识地形图绘制方法
CN111581982B (zh) * 2020-05-06 2023-02-17 首都师范大学 一种基于本体的医疗纠纷案件舆情预警等级的预测方法
CN111581982A (zh) * 2020-05-06 2020-08-25 首都师范大学 一种基于本体的医疗纠纷案件舆情预警等级的预测方法
CN111881302A (zh) * 2020-07-23 2020-11-03 民生科技有限责任公司 基于知识图谱的银行舆情分析方法和***
CN111881302B (zh) * 2020-07-23 2023-11-28 民生科技有限责任公司 基于知识图谱的银行舆情分析方法和***
CN112131392A (zh) * 2020-08-01 2020-12-25 赛飞特工程技术集团有限公司 基于知识图谱的公共卫生疫情预警方法及***
CN112668384A (zh) * 2020-08-07 2021-04-16 深圳市唯特视科技有限公司 一种知识图谱构建方法、***、电子设备及存储介质
CN112668384B (zh) * 2020-08-07 2024-05-31 深圳市唯特视科技有限公司 一种知识图谱构建方法、***、电子设备及存储介质
CN111931027A (zh) * 2020-08-17 2020-11-13 深圳新闻网传媒股份有限公司 一种智能新闻舆情预警***
CN111984786A (zh) * 2020-08-17 2020-11-24 深圳新闻网传媒股份有限公司 一种基于新闻信息的智能吹哨预警方法及服务器
CN112214663A (zh) * 2020-10-22 2021-01-12 上海明略人工智能(集团)有限公司 获取舆情声量的方法、***、装置、存储介质及移动终端
CN112287116A (zh) * 2020-10-29 2021-01-29 上海朋程勤学文化传播有限公司 一种基于知识图谱的院校数据分析方法
CN112732781A (zh) * 2020-12-30 2021-04-30 深圳市网联安瑞网络科技有限公司 融合数据质量多维度评估的网情态势动态绘制***及方法
CN112685621A (zh) * 2021-01-06 2021-04-20 深圳市网联安瑞网络科技有限公司 融合舆情风向跟踪及民情预测的网络舆情检测***与方法
CN112883278A (zh) * 2021-03-23 2021-06-01 西安电子科技大学昆山创新研究院 基于智慧社区大数据知识图谱的不良舆论传播抑制方法
CN113570182A (zh) * 2021-05-06 2021-10-29 深圳怀新企业投资顾问股份有限公司 声誉风险管理能力评估方法、装置、设备和存储介质
CN113220973B (zh) * 2021-05-31 2023-10-24 北京海纳数聚科技有限公司 一种基于知识推理技术的舆情验真方法
CN113220973A (zh) * 2021-05-31 2021-08-06 北京海纳数聚科技有限公司 一种基于知识推理技术的舆情验真方法
CN113779195A (zh) * 2021-08-31 2021-12-10 西南电子技术研究所(中国电子科技集团公司第十研究所) 热点事件状态评估方法
CN113779195B (zh) * 2021-08-31 2023-12-22 西南电子技术研究所(中国电子科技集团公司第十研究所) 热点事件状态评估方法
CN114565486A (zh) * 2022-01-12 2022-05-31 黑龙江科技大学 一种课程学习***的构建方法
CN115422948A (zh) * 2022-11-04 2022-12-02 文灵科技(北京)有限公司 一种基于语义分析的事件层次网络识别***及方法
CN117633324A (zh) * 2023-11-03 2024-03-01 北京东方通网信科技有限公司 一种自定义的可视化爬虫配置方法

Similar Documents

Publication Publication Date Title
CN110866126A (zh) 一种高校网络舆情风险评估方法
Castillo Big crisis data: social media in disasters and time-critical situations
Goswami et al. A survey of event detection techniques in online social networks
Hu et al. Text analytics in social media
Xu et al. Building the multi-modal storytelling of urban emergency events based on crowdsensing of social media analytics
CN112749341B (zh) 重点舆情推荐方法、可读存储介质及数据处理装置
Priya et al. TAQE: tweet retrieval-based infrastructure damage assessment during disasters
Nan et al. Real-time monitoring of smart campus and construction of Weibo public opinion platform
Hsu et al. Integrating machine learning and open data into social Chatbot for filtering information rumor
Belcastro et al. Using social media for sub-event detection during disasters
CN107918644A (zh) 声誉管理框架内的新闻议题分析方法和实施***
Xu et al. Research on topic recognition of network sensitive information based on SW-LDA model
Alves et al. A spatial and temporal sentiment analysis approach applied to Twitter microtexts
Ouyang et al. Sentistory: multi-grained sentiment analysis and event summarization with crowdsourced social media data
Ramachandran et al. Event detection from Twitter–a survey
Horák et al. Technological approaches to detecting online disinformation and manipulation
Duong et al. Neurosymbolic AI for mining public opinions about wildfires
Wang et al. Topic discovery method based on topic model combined with hierarchical clustering
Yang et al. An automatic crisis information recognition model based on BP neural networks
KR102540944B1 (ko) 메타데이터를 활용한 인공지능 기반 문서관리 및 통합 검색 지원 디지털 콘텐츠 시스템
Xu et al. Generating risk maps for evolution analysis of societal risk events
Chen et al. A semantic graph-based approach for mining common topics from multiple asynchronous text streams
Guo Social network rumor recognition based on enhanced naive bayes
Cherichi et al. Big data analysis for event detection in microblogs
Cherichi et al. Using big data values to enhance social event detection pattern

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200306