CN108681584A - 一种处理舆情数据的方法和*** - Google Patents

一种处理舆情数据的方法和*** Download PDF

Info

Publication number
CN108681584A
CN108681584A CN201810451871.3A CN201810451871A CN108681584A CN 108681584 A CN108681584 A CN 108681584A CN 201810451871 A CN201810451871 A CN 201810451871A CN 108681584 A CN108681584 A CN 108681584A
Authority
CN
China
Prior art keywords
public sentiment
sentiment data
data
negative
further include
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810451871.3A
Other languages
English (en)
Inventor
尹杭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Hua Bi Mdt Infotech Ltd
Original Assignee
Suzhou Hua Bi Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Hua Bi Mdt Infotech Ltd filed Critical Suzhou Hua Bi Mdt Infotech Ltd
Priority to CN201810451871.3A priority Critical patent/CN108681584A/zh
Publication of CN108681584A publication Critical patent/CN108681584A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种处理舆情数据的方法和***,有助于及时处理负面内容的舆情数据。该方法包括:根据预设的关键词抓取指定网站的舆情数据;对所述舆情数据进行正负面分类以确定负面内容的舆情数据;确定并输出所述负面内容的舆情数据的发起人信息。

Description

一种处理舆情数据的方法和***
技术领域
本发明涉及计算机技术领域,特别地涉及一种处理舆情数据的方法和***。
背景技术
企业舆情***就是指从危机事件的征兆出现到危机开始造成可感 知的损失这段时间内,化解和应对危机所采取的必要、有效行动。其意义在于及早发现危机的苗头,及早对可能产生的现实危机的走向、 规模进行判断,及早通知各有关职能部门共同做好应对危机的准备。
随着新媒体时代的到来,舆论的力量不断地增强,尤其在社交网络的帮助下,社会舆论已经成为了一股无法被人忽视的力量。在这种大环境下,一个功能强大的,完善的***的需求性就表露无遗,一款 好的舆情***可以帮助用户在第一时间掌握舆情动态,不用被舆情牵着鼻子走,而是始终保有主动权。主要体现在能否从每天海量的网络言论中敏锐地发现潜在危机的苗头,以及准确判断这种发现与危机可 能爆发之间的时间差。这个时间差越大,相关职能部门越有充裕的时间来准备,为下一阶段危机的有效应对赢得宝贵的时间。
发明内容
有鉴于此,本发明提供一种处理舆情数据的方法和***,有助于及时处理负面内容的舆情数据。
为实现上述目的,根据本发明的一个方面,提供了一种处理舆情数据的方法。
本发明的处理舆情数据的方法包括:根据预设的关键词抓取指定网站的舆情数据;对所述舆情数据进行正负面分类以确定负面内容的舆情数据;确定并输出所述负面内容的舆情数据的发起人信息。
可选地,在根据预设的关键词抓取指定网站的舆情数据之前,还包括:保存预设的关键词以及指定网站的网址。
可选地,根据预设的关键词抓取指定网站的舆情数据之后,还包括:对所述舆情数据按预设方式统计然后输出。
可选地,对所述舆情数据进行正负面分类的步骤之前,还包括: 对所述舆情数据进行过滤。
可选地,对所述舆情数据进行过滤之后,在对所述舆情数据进行正负面分类之前,还包括:对所述舆情数据作去重处理。
根据本发明的另一方面,提供了一种处理舆情数据的***。
本发明的处理舆情数据的***包括:抓取模块,用于根据预设的关键词,抓取指定网站的舆情数据;分析模块,用于对所述舆情数据 进行正负面分类以确定负面内容的舆情数据;处理模块,用于确定并输出所述负面内容的舆情数据的发起人信息。
可选地,还包括监控模块,用于保存预设的关键词以及指定网站的网址。
可选地,还包括统计模块,用于对所述舆情数据按预设方式统计然后输出。
可选地,还包括过滤模块,用于对所述舆情数据进行过滤。
可选地,还包括去重模块,用于对所述舆情数据作去重处理。
根据本发明的技术方案,对抓取的舆情数据进行正负面分类以确定负面内容的舆情数据,确定并输出负面内容的舆情数据的发起人信息,在得到了负面内容的舆情数据的发起人信息之后,就可以尽快与其联系,从而将舆情方向纳入管理以避免扩散。发明人在实现本发明的过程中发现,网站的舆情一般具有如下特点:舆情往往自成一体,即有关某一具体话题发布的信息往往只局限于该网站以内,迁移到其他网站一般需要一定的时间;然而一旦出现迁移,舆情将很快扩散;舆情数据发起人对于舆情的导向具有关键性作用。因此,按照图1所 示的流程,能够尽快地确定舆情数据发起人以便舆情管理人员或其他相关人员与其联系并进行沟通,避免舆情扩散;同时有助于提升客户对企业的好感,维护企业形象。
附图说明
图1是根据本发明实施例的处理舆情数据的方法的基本步骤示意图;
图2是根据本发明实施例的处理舆情数据的***的基本模块的示意图;
图3是根据本发明实施例的处理舆情数据的***的优选结构及其中各模块功能的示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。 因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的处理舆情数据的方法的基本步骤示意图。如图1所示,本发明实施例中,处理舆情数据的方法主要包括如 下的步骤S11至步骤S13。
步骤S11:根据预设的关键词抓取指定网站的舆情数据。
步骤S12:对舆情数据进行正负面分类以确定负面内容的舆情数据。本步骤中可以采用现有的中文分词技术、自然语言处理技术、中文信息处理技术等来实现。
步骤S13:确定并输出负面内容的舆情数据的发起人信息。用户在发布信息之前通常都会登录,并且在注册时会留下注册信息,另外用户终端的相关参数例如IP地址等也会被记录。这些都构成了发起人信息,并且能够被监听到。
在步骤S11之前,可以保存预设的关键词以及指定网站的网址。 这里的指定网站可以是微博网站等。在步骤S12之前,可以先对舆情 数据进行过滤;或者进行过滤和去重处理。在得到舆情数据之后可以 对舆情数据按预设方式统计然后输出,从而形成舆情报告。
图2是根据本发明实施例的处理舆情数据的***的基本模块的示 意图。如图2所示,处理舆情数据的***20基本地包括抓取模块21、 分析模块22、以及处理模块23。抓取模块21用于根据预设的关键词, 抓取指定网站的舆情数据;分析模块22用于对舆情数据进行正负面分类以确定负面内容的舆情数据;处理模块23用于确定并输出负面内容 的舆情数据的发起人信息。
处理舆情数据的***20还可包括监控模块、统计模块、过滤模块、 去重模块(图中未示出),其中监控模块用于保存预设的关键词以及指定网站的网址;统计模块用于对舆情数据按预设方式统计然后输出; 过滤模块用于对舆情数据进行过滤;去重模块用于对舆情数据作去重 处理。
图3是根据本发明实施例的处理舆情数据的***的优选结构及其 中各模块功能的示意图。如图3所示,处理舆情数据的***优选地包括舆情监控模块、舆情抓取模块、舆情分析模块、舆情处理模块、舆情统计模块、舆情展示模块。其中舆情监控模块的主要功能包括网站 监控、关键词监控、预警设置、沟通模版设置;舆情抓取模块的主要 功能包括根据监控抓取舆情;舆情分析模块的主要功能包括舆情过滤、 舆情去重、正负分析、舆情预警;舆情处理模块的主要功能包括任务舆情、舆情领取、沟通模版、处理结果;舆情统计模块的主要功能包括舆情统计、报告生成;舆情展示模块的主要功能包括进行舆情展示。
根据本发明的技术方案,对抓取的舆情数据进行正负面分类以确定负面内容的舆情数据,确定并输出负面内容的舆情数据的发起人信息,在得到了负面内容的舆情数据的发起人信息之后,就可以尽快与 其联系,从而将舆情方向纳入管理以避免扩散。发明人在实现本发明的过程中发现,网站的舆情一般具有如下特点:舆情往往自成一体, 即有关某一具体话题发布的信息往往只局限于该网站以内,迁移到其他网站一般需要一定的时间;然而一旦出现迁移,舆情将很快扩散; 舆情数据发起人对于舆情的导向具有关键性作用。因此,按照图1所示的流程,能够尽快地确定舆情数据发起人以便舆情管理人员或其他相关人员与其联系并进行沟通,避免舆情扩散;同时有助于提升客户对企业的好感,维护企业形象。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和设备的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、 存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们 的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的 情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序 或者一组程序来实现。所述计算装置可以是公知的通用装置。因此, 本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序 代码的程序产品来实现。也就是说,这样的程序产品也构成本发明, 并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来开发出的任何存储介质。
还需要指出的是,在本发明的装置和方法中,显然,各部件或各 步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发 明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明 的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些 步骤可以并行或彼此独立地执行。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域 技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种 各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种处理舆情数据的方法,其特征在于,包括:根据预设的关键词抓取指定网站的舆情数据;对所述舆情数据进行正负面分类以确定负面内容的舆情数据;确定并输出所述负面内容的舆情数据的发起人信息。
2.根据权利要求1所述的方法,其特征在于,在根据预设的关键 词抓取指定网站的舆情数据之前,还包括:保存预设的关键词以及指 定网站的网址。
3.根据权利要求1所述的方法,其特征在于,根据预设的关键词 抓取指定网站的舆情数据之后,还包括:对所述舆情数据按预设方式 统计然后输出。
4.根据权利要求1至3中任一项所述的方法,其特征在于,对所 述舆情数据进行正负面分类的步骤之前,还包括:对所述舆情数据进 行过滤。
5.根据权利要求4所述的方法,其特征在于,对所述舆情数据进 行过滤之后,在对所述舆情数据进行正负面分类之前,还包括:对所 述舆情数据作去重处理。
6.一种处理舆情数据的***,其特征在于,包括:抓取模块,用于根据预设的关键词,抓取指定网站的舆情数据;分析模块,用于对所述舆情数据进行正负面分类以确定负面内容的舆情数据;处理模块,用于确定并输出所述负面内容的舆情数据的发起人信 息。
7.根据权利要求6所述的***,其特征在于,还包括监控模块, 用于保存预设的关键词以及指定网站的网址。
8.根据权利要求6所述的***,其特征在于,还包括统计模块, 用于对所述舆情数据按预设方式统计然后输出。
9.根据权利要求6,7或8所述的***,其特征在于,还包括过 滤模块,用于对所述舆情数据进行过滤。
10.根据权利要求9所述的***,其特征在于,还包括去重模块, 用于对所述舆情数据作去重处理。
CN201810451871.3A 2018-05-12 2018-05-12 一种处理舆情数据的方法和*** Withdrawn CN108681584A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810451871.3A CN108681584A (zh) 2018-05-12 2018-05-12 一种处理舆情数据的方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810451871.3A CN108681584A (zh) 2018-05-12 2018-05-12 一种处理舆情数据的方法和***

Publications (1)

Publication Number Publication Date
CN108681584A true CN108681584A (zh) 2018-10-19

Family

ID=63805591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810451871.3A Withdrawn CN108681584A (zh) 2018-05-12 2018-05-12 一种处理舆情数据的方法和***

Country Status (1)

Country Link
CN (1) CN108681584A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543186A (zh) * 2018-11-22 2019-03-29 北京奇安信科技有限公司 一种舆情信息处理方法、***、电子设备和介质
CN111538931A (zh) * 2020-03-27 2020-08-14 中国平安财产保险股份有限公司 基于大数据的舆情监控方法、装置、计算机设备及介质
CN111538931B (zh) * 2020-03-27 2024-08-02 中国平安财产保险股份有限公司 基于大数据的舆情监控方法、装置、计算机设备及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617212A (zh) * 2013-11-19 2014-03-05 北京京东尚科信息技术有限公司 一种处理舆情数据的方法和***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617212A (zh) * 2013-11-19 2014-03-05 北京京东尚科信息技术有限公司 一种处理舆情数据的方法和***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543186A (zh) * 2018-11-22 2019-03-29 北京奇安信科技有限公司 一种舆情信息处理方法、***、电子设备和介质
CN109543186B (zh) * 2018-11-22 2023-12-19 奇安信科技集团股份有限公司 一种舆情信息处理方法、***、电子设备和介质
CN111538931A (zh) * 2020-03-27 2020-08-14 中国平安财产保险股份有限公司 基于大数据的舆情监控方法、装置、计算机设备及介质
CN111538931B (zh) * 2020-03-27 2024-08-02 中国平安财产保险股份有限公司 基于大数据的舆情监控方法、装置、计算机设备及介质

Similar Documents

Publication Publication Date Title
US11036567B2 (en) Determining system behavior using event patterns in machine data
US10769159B2 (en) Systems and methods for data mining of historic electronic communication exchanges to identify relationships, patterns, and correlations to deal outcomes
CN105528280B (zh) ***日志与健康监控关系决定日志告警等级的方法及***
CN111209258A (zh) 税务端***日志实时分析方法、设备、介质及***
JP2022118108A (ja) ログ監査方法、装置、電子機器、媒体およびコンピュータプログラム
CN107229556A (zh) 基于elastic组件的日志分析***
US10742688B2 (en) Platform for automated regulatory compliance monitoring of messaging services
CN106055608A (zh) 自动采集和分析交换机日志的方法和装置
CN107748782A (zh) 查询语句处理方法及装置
CN106169959A (zh) 一种日志处理装置
US11897527B2 (en) Automated positive train control event data extraction and analysis engine and method therefor
CN103617212A (zh) 一种处理舆情数据的方法和***
US20240086293A1 (en) Automated system alert based on logs sentiment analysis
CN108681584A (zh) 一种处理舆情数据的方法和***
CN110796565A (zh) 监理日志的分析方法及分析***
CN106202509A (zh) 一种日志信息的处理方法
CN102055620B (zh) 监控用户体验的方法和***
CN106227644A (zh) 一种海量信息处理装置
CN106250405A (zh) 一种海量信息处理***
CN108710691A (zh) 一种日志管理的方法及装置
Girish et al. Extreme event detection and management using twitter data analysis
CN106227797A (zh) 一种海量日志信息的处理方法
CN116543878A (zh) 一种用于24小时在线问诊的大数据监控方法及***
CN114996080A (zh) 数据处理方法、装置、设备及存储介质
CN106790397B (zh) 一种数据的业务特征识别***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20181019

WW01 Invention patent application withdrawn after publication