CN113626717A - 一种舆情监测的方法、装置、电子设备和存储介质 - Google Patents

一种舆情监测的方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113626717A
CN113626717A CN202111090393.6A CN202111090393A CN113626717A CN 113626717 A CN113626717 A CN 113626717A CN 202111090393 A CN202111090393 A CN 202111090393A CN 113626717 A CN113626717 A CN 113626717A
Authority
CN
China
Prior art keywords
public opinion
real
information
opinion information
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111090393.6A
Other languages
English (en)
Inventor
杨志专
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Smart Healthcare Technology Co ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202111090393.6A priority Critical patent/CN113626717A/zh
Publication of CN113626717A publication Critical patent/CN113626717A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种舆情监测的方法、装置、电子设备和存储介质,通过读取分布式发布订阅消息***中的舆情信息并对舆情信息进行分类,能够对非目标信息进行筛选和过滤,如此,能够减少监测噪声,提高监测过程的准确性;此外,基于智能合约进行自动预警能够实现舆情的客观上报,避免了人工上报和逐层审批,从而避免了人工上报产生的误差,通过区块链的去中心化,得到一种公平可靠的机制,实现了舆情监测的自动化运行。

Description

一种舆情监测的方法、装置、电子设备和存储介质
技术领域
本申请涉及区块链技术领域,涉及但不限于一种舆情监测的方法、装置、电子设备和存储介质。
背景技术
在现有网络舆情监控过程中,多采用人工进行舆情信息的审批和负面舆情信息的上报,监控过程繁琐,且容易因为人工干预产生监测误差。因此,缺乏一种公平可靠的机制实现舆情监测的自动化运行。
发明内容
有鉴于此,本申请提供一种舆情监测的方法、装置、电子设备和存储介质。该方法能够实现舆情的客观上报,避免了人工上报和逐层审批,从而避免了人工上报产生的误差,通过区块链的去中心化,得到一种公平可靠的机制,实现了舆情监测的自动化运行。
第一方面,提供了一种舆情监测的方法,应用于区块链***中,所述区块链***包括一个或多个节点,所述方法包括:获取实时舆情信息;对所述实时舆情信息进行文本分析,得到所述实时舆情信息的第一特征,所述第一特征包括所述实时舆情信息的主题、目标实体、情感类型和置信度中的一种或多种信息;当所述第一特征满足预设的负面舆情事件上报条件时,将所述实时舆情信息推送到所述区块链***中,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,向所述区块链***上报所述实时舆情信息。
结合第一方面,在第一方面的一种可能的实现方式中,所述获取实时舆情信息,包括:当检测到分布式发布订阅消息***发送的消息通知时,从所述分布式发布订阅消息***中获取实时舆情信息。
结合第一方面和上述实现方式,在第一方面的一种可能的实现方式中,该方法还包括:确定舆情爆发预测模型,所述舆情爆发预测模型用于根据所述实时舆情信息预测是否爆发舆情;根据所述舆情爆发预测模型和所述第一特征,确定第二特征,所述第二特征包括所述实时舆情信息的词云、舆情爆发指数和媒体信用中的一种或多种信息;当所述第二特征满足预设的舆情爆发预警上报条件时,将所述实时舆情信息推送到所述区块链***中,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,进行舆情爆发预警。
结合第一方面和上述实现方式,在第一方面的一种可能的实现方式中,当所述第二特征包括所述媒体信用信息时,该方法还包括:确定媒体信用等级预测模型,所述媒体信用等级预测模型用于根据媒体发布的实时舆情信息预测所述媒体的可信度;根据所述舆情爆发预测模型和所述第一特征,确定所述媒体信用信息;所述第一特征还包括:所述实时舆情信息的发布时间、阅读量、转发量和点赞量中的一种或多种信息;当所述媒体信用信息满足预设的媒体信用上报条件时,将所述舆情信息推送到所述区块链***,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,进行媒体信用评价。
结合第一方面和上述实现方式,在第一方面的一种可能的实现方式中,确定舆情爆发预测模型,包括:获取N个实时舆情信息作为训练样本;N为大于或等于1的自然数;获取所述训练样本的第一特征;对所述第一特征进行归一化,得到输入向量;将所述输入向量输入卷积神经网络并进行学习训练,得到所述舆情爆发预测模型。
结合第一方面和上述实现方式,在第一方面的一种可能的实现方式中,确定媒体信用等级预测模型包括:获取M个实时舆情信息作为训练样本;M为大于或等于1的自然数;获取所述训练样本第一特征;对所述第一特征进行归一化,得到输入向量;将所述输入向量输入卷积神经网络并进行学习训练,得到所述媒体信用等级预测模型。
结合第一方面和上述实现方式,在第一方面的一种可能的实现方式中,提供了一种舆情监测的方法,该方法还包括:对所述媒体信用信息、情感类型、置信度、舆情爆发指数和词云进行存储,得到媒体信用评分表、情感分析表、置信度评分表、舆情爆发指数表和实时词云表。
第二方面,提供了一种舆情监测的装置,所述装置包括:第一获取单元,用于获取实时舆情信息;第一分析单元,用于对所述实时舆情信息进行文本分析,得到所述实时舆情信息的第一特征,所述第一特征包括所述实时舆情信息的主题、目标实体、情感类型和置信度中的一种或多种信息;第一发送单元,用于当所述第一特征满足预设的负面舆情事件上报条件时,将所述实时舆情信息推送到所述区块链***中,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;上报单元,用于当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,向所述区块链***中智能合约的签约节点上报所述实时舆情信息。
结合第二方面,在第二方面的某些实现方式中,所述装置还包括第一确定单元、第二分析单元、第二发送单元和预警单元,其中,所述第一确定单元,用于确定舆情爆发预测模型,所述舆情爆发预测模型用于根据所述实时舆情信息预测是否爆发舆情;所述第二分析单元,用于根据所述舆情爆发预测模型和所述第一特征,确定第二特征,所述第二特征包括所述实时舆情信息的词云、舆情爆发指数和媒体信用中的一种或多种信息;所述第二发送单元,当所述第二特征满足预设的舆情爆发预警上报条件时,用于将所述实时舆情信息推送到所述区块链***中,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;所述预警单元,当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,用于进行舆情爆发预警。
结合第二方面和上述实现方式,在第二方面的某些实现方式中,当所述第二特征包括所述媒体信用信息时,所述装置还包括第二确定单元、第三确定单元、第三发送单元和评价单元,其中,所述第二确定单元,用于确定媒体信用等级预测模型,所述媒体信用等级预测模型用于根据媒体发布的实时舆情信息预测所述媒体的可信度;所述第三确定单元,用于根据所述舆情爆发预测模型和所述第一特征,确定所述媒体信用信息,所述第一特征还包括:所述实时舆情信息的发布时间、阅读量、转发量和点赞量中的一种或多种信息;所述第三发送单元,当所述媒体信用信息满足预设的媒体信用上报条件时,用于将所述舆情信息推送到所述区块链***,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;所述评价单元,当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,用于进行媒体信用评价。
结合第二方面和上述实现方式,在第二方面的某些实现方式中,所述第一确定单元,包括第一获取子单元、第二获取子单元、第一处理子单元和第一训练子单元,其中,所述第一获取子单元,用于获取N个实时舆情信息作为训练样本;N为大于或等于1的自然数;所述第二获取子单元,用于获取所述训练样本的第一特征;所述第一处理子单元,用于对所述第一特征进行归一化,得到输入向量;所述第一训练子单元,用于将所述输入向量输入卷积神经网络并进行学习训练,得到所述舆情爆发预测模型。
结合第二方面和上述实现方式,在第二方面的某些实现方式中,所述第二确定单元,包括第三获取子单元、第四获取子单元、第二处理子单元和第二训练子单元,其中,所述第三获取子单元,用于获取M个实时舆情信息作为训练样本;M为大于或等于1的自然数;所述第四获取子单元,用于获取所述训练样本第一特征;所述第二处理子单元,用于对所述第一特征进行归一化,得到输入向量;所述第二训练子单元,用于将所述输入向量输入卷积神经网络并进行学习训练,得到所述媒体信用等级预测模型。
结合第二方面和上述实现方式,在第二方面的某些实现方式中,所述装置还包括存储单元,其中,所述存储单元,用于对所述媒体信用信息、情感类型、置信度、舆情爆发指数和词云进行存储,得到媒体信用评分表、情感分析表、置信度评分表、舆情爆发指数表和实时词云表。
结合第二方面和上述实现方式,在第二方面的某些实现方式中,所述装置还包括第二获取单元,其中,所述第二获取单元,用于当检测到分布式发布订阅消息***发送的消息通知时,从所述分布式发布订阅消息***中获取实时舆情信息。
第三方面,提供了一种电子设备,一个或多个处理器;存储器;安装有多个应用程序的模块;以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,当所述一个或者多个程序被所述处理器执行时,使得所述电子设备执行所述程序时实现上述方法中的步骤。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令配置为执行第一方面和第一方面任意一种可能的实现方式中提供的方法。
第五方面,提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行第一方面和第一方面任意一种可能的实现方式中提供的方法。
附图说明
在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相似的部件。具有不同字母后缀的相似附图标记可表示相似部件的不同示例。附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。
图1为本申请实施例提供的舆情监测***的组成结构示意图;
图2为本申请实施例提供的舆情监测***中舆情信息推送过程示意图;
图3为一种舆情监测的方法的实现流程示意图;
图4为医疗舆情信息区块链的组成结构示意图;
图5为本申请实施例提供的舆情监测的装置的组成结构示意图;
图6为本申请实施例提供的舆情监测的设备的一种硬件实体示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。在本申请实施例的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。下面结合附图和具体实施例对本申请的技术方案进一步详细阐述。
图1为本申请实施例提供的舆情监测***的组成结构示意图。如图1所示,在舆情监测***100中,可以包括多个子***。示例性的,如图1所示,该舆情监测***100可以包括数据收集***101、分布式发布订阅消息***102、机器学习***103和区块链104,应理解,本申请实施例对舆情监测***中各个子***的数量和形态不做限定。
图2为本申请实施例提供的舆情监测***中舆情信息推送过程示意图。舆情信息被推送到区块链中后,根据区块链中节点签订的智能合约,将符合智能合约的内容上报给区块链中的节点,实现舆情信息的监控。如图2所示,舆情信息在图1中的子***之间的推送过程为:
S201,数据收集***获取舆情信息;
S202,分布式发布订阅消息***接收并存储所述舆情信息;
S203,所述分布式发布订阅消息***生成新消息通知;
S204,所述分布式发布订阅消息***将所新消息通知发送给机器学习***;
S205,所述机器学习***接收所述新消息通知;
S206,所述机器学习***从所述分布式发布订阅消息***中读取所述舆情信息;
S207,所述机器学习***对所述舆情信息进行分析,得到分析结果;
S208,所述机器学习***将所分析结果发送给区块链;
S209,所述区块链接收所述分析结果,并对所述分析结果进行判断;
S210,当判断所述分析结果满足预先设定的智能合约的上报条件时,执行智能合约。
根据图2中舆情信息的推送过程,本申请实施例提供一种舆情监测的方法,图3为一种舆情监测的方法的实现流程示意图,如图3所示,所述方法应用于区块链***中,所述区块链***包括一个或多个节点,所述方法包括:
S301,获取实时舆情信息;
在一种可能的实现方式中,当检测到分布式发布订阅消息***发送的消息通知时,从所述分布式发布订阅消息***中获取实时舆情信息。
示例性的,所述舆情信息存储在图2所示的分布式发布订阅消息***中,所述分布式发布订阅消息***中的舆情信息通过数据收集***从互联网中获取。可选的,所述舆情信息可以为新闻信息。
可选的,所述分布式发布订阅消息***可以为Kafka消息***。Kafka有新消息的通知的功能,当Kafka中存储新消息时,将新消息通知发送给分布式发布订阅消息***的消费者,通知该消费者可以从***中读取新消息。
在一种可能的实现方式中,在读取所述分布式发布订阅消息***中的所述舆情信息后,可以对所述舆情信息进行分类;
在一种可能的实现方式中,当舆情信息为新闻信息时,对新闻信息进行是否为医疗类信息的分类。可选的,当确定医疗类信息为目标监测信息时,通过所述分类步骤可以对非目标信息进行筛选和过滤,如此,能够减少监测噪声,提高监测过程的准确性。
S302,对所述实时舆情信息进行文本分析,得到所述实时舆情信息的第一特征,所述第一特征包括所述实时舆情信息的主题、目标实体、情感类型和置信度中的一种或多种信息;
在一种可能的实现方式中,所述文本分析至少包括以下一种:摘要分析、命名实体识别、情感分析和置信度预测;所述摘要分析用于确定所述舆情信息的主题;所述命名实体识别用于确定所述舆情信息中的目标实体;所述情感分析用于确定所述舆情信息的情感类型;所述置信度预测用于确定所述舆情信息的可信程度。通过对所述实时舆情信息进行摘要分析、命名实体识别、情感分析和置信度预测,可以对应的得到实时舆情信息的主题、目标实体、情感类型和置信度。
应理解,所述舆情信息的主题用于表示舆情信息的核心内容。例如,关于新冠疫情的免疫方案的主题为新冠疫情的免疫。所述目标实体用于表示所述舆情信息中的关键字,例如,需要统计医疗舆情信息中的感染人数、死亡人数、治愈人数,所述“感染人数”、“死亡人数”、“治愈人数”即为医疗舆情信息中的关键字。可选的,为统计该关键字出现的次数,需要对该关键字实例化,得到三个目标实体,用于统计次数。应理解,所述情感分析用于确定所述舆情信息的情感类型,例如,正面积极的舆情事件,或者,负面消极的舆情事件。
S303,当所述第一特征满足预设的负面舆情事件上报条件时,将所述实时舆情信息推送到所述区块链***中,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;
在一种可能的实现方式中,负面舆情事件上报条件可以为同时满足以下条件:主题符合预先设定的热点词汇、情感类型为负面类型、置信度小于预先设定的阈值。
在一种可能的实现方式中,所述区块链***中具有用于存储待验证舆情事件的验证队列,不同验证队列用于存储满足不同舆情事件上报条件的舆情信息。区块链***中的每一节点可以查看上报的舆情信息,并对所述舆情信息进行签名验证。
示例性的,当所述主题为疫情;所述目标实体为:感染人数、死亡人数、治愈人数;所述情感类型为负面,所述置信度小于30%时,满足负面舆情事件上报条件,将所述舆情信息推送到区块链***中。可选的,所述负面舆情事件可以存储在第一验证队列中。
S304,当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,向所述区块链***中智能合约的签约节点上报所述实时舆情信息。
应理解,智能合约的特点包括以下两点:1)运行环境为中心化的网络,强调合约或函数执行的调用方式。2)智能合约出现异常时,所有的执行都将会被撤回,保证了合约执行的原子性。
在上述方案中,基于智能合约进行舆情监测够实现舆情的客观上报,避免了人工上报和逐层审批,从而避免了人工上报产生的误差,通过区块链的去中心化,得到一种公平可靠的机制,实现了舆情监测的自动化运行。
示例性的,图4为医疗舆情信息区块链的组成结构示意图,如图4所示,所述负面舆情事件智能合约的签约节点可以包括:媒体1、媒体2、媒体监管部门和其他政府部门,上述签约节点对舆情信息签名之后,可以查看上报的舆情信息的内容。
在一种可能的实现方式中,所述方法还包括:
确定舆情爆发预测模型,所述舆情爆发预测模型用于根据所述实时舆情信息预测是否爆发舆情;根据所述舆情爆发预测模型和所述第一特征,确定第二特征,所述第二特征包括所述实时舆情信息的词云、舆情爆发指数和媒体信用中的一种或多种信息;
在一种可能的实现方式中,确定舆情爆发预测模型,包括:获取N个实时舆情信息作为训练样本;N为大于或等于1的自然数;获取所述训练样本的第一特征;对所述第一特征进行归一化,得到输入向量;将所述输入向量输入卷积神经网络并进行学习训练,得到所述舆情爆发预测模型。
在一种可能的实现方式中,所述训练样本的第一特征可以为:所述实时舆情信息的置信度、目标实体和摘要。在对第一特征进行归一化之前,可以对第一特征进行数量化。示例性的,将不同目标实体使用不同数值进行区分,又如,通过关键词提取算法获取摘要的关键词列表,使用不同数值标记关键词列表中的不同关键词。
在一种可能的实现方式中,所述归一化可以包括以下方法中的一种:线性函数归一化和零均值标准化。
应理解,所述线性函数归一化使用公式(1)进行归一化:
Figure BDA0003266599530000101
其中,x表示待归一化的第一特征;可选的,可以为实时舆情信息的置信度、目标实体和摘要。Min表示时序的第一特征序列的最小值;Max表示时序的第一特征序列的最大值。
应理解,所述零均值标准化使用公式(2)进行归一化:
Figure BDA0003266599530000102
其中,x表示待归一化的第一特征;Mean表示时序的第一特征序列的均值;Standard deviation表示时序的第一特征序列的标准差。
在一种可能的实现方式中,所述卷积神经网络可以为包括:输入层、卷积层、池化层、全连接层和输出层。通过卷积神经网络可以输出是否爆发舆情信息的预测结果。示例性的,在输出结果为1时,预测会爆发舆情信息;在输出结果为0时,预测不会爆发舆情信息。
应理解,通过所述词云分析可以得到一定数量的关键词,并将所述关键词按照重要性进行排序。确定排序后,可以根据预先设定的阈值,确定选取数量。所述词云分析可以通过文本排序(TextRank)算法实现。
当所述第二特征满足预设的舆情爆发预警上报条件时,将所述实时舆情信息推送到所述区块链***中,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;
在一种可能的实现方式中,舆情爆发预警上报条件可以同时满足以下条件:检测舆情信息中的前10的词汇为同一主题词汇、舆情爆发指数大于阈值。
示例性的,当舆情信息中前10词汇为疫情、新冠和疫苗等,均为医疗主题词汇且舆情爆发指数大于50%时,满足舆情爆发预警上报条件,将所述舆情信息推送到区块链***中。
当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,进行舆情爆发预警。
在一种可能的实现方式中,所述舆情爆发预警会显示在舆情检测***的前端界面上。
在一种可能的实现方式中,当所述第二特征包括所述媒体信用信息时,所述方法还包括:
确定媒体信用等级预测模型,所述媒体信用等级预测模型用于根据媒体发布的实时舆情信息预测所述媒体的可信度;
在一种可能的实现方式中,确定媒体信用等级预测模型包括:获取M个实时舆情信息作为训练样本;M为大于或等于1的自然数;获取所述训练样本第一特征;对所述第一特征进行归一化,得到输入向量;将所述输入向量输入卷积神经网络并进行学习训练,得到所述媒体信用等级预测模型。
根据所述舆情爆发预测模型和所述第一特征,确定所述媒体信用信息;所述第一特征还包括:所述实时舆情信息的发布时间、阅读量、转发量和点赞量中的一种或多种信息;
示例性的,确定媒体信用等级预测模型使用的训练样本数量可以为10000条,确定媒体信用等级预测模型使用的归一化方法也可以包括以下方法中的一种:线性函数归一化和零均值标准化;所述卷积神经网络也可以为包括:输入层、卷积层、池化层、全连接层和输出层的神经网络。需要说明的是,需要对实时舆情信息的发布时间、阅读量、转发量和点赞量进行归一化,并将上述特征与置信度作为卷积神经网络的输入,训练输出量为L的媒体信用等级;所述L可以为大于或等于1的整数,表示媒体信用为第i等级,其中,i为大于等于1且小于等于L的数值。
当所述媒体信用信息满足预设的媒体信用上报条件时,将所述舆情信息推送到所述区块链***,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;
示例性的,所述媒体信用等级为低级,评分小于33%时,发布所述舆情信息的媒体可信度低,满足媒体信用上报条件,将所述舆情信息推送到所述区块链***中。
当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,进行媒体信用评价。
在上述方案中,基于智能合约进行自动预警能够实现舆情的客观上报,避免了人工上报和逐层审批,从而避免了人工上报产生的误差,通过区块链的去中心化,得到一种公平可靠的机制,实现了舆情监测的自动化运行。
在一种可能的实现方式中,所述方法还包括:对所述媒体信用信息、情感类型、置信度、舆情爆发指数和词云进行存储,得到媒体信用评分表、情感分析表、置信度评分表、舆情爆发指数表和实时词云表。
在一种可能的实现方式中,可以通过大容量,支持海量数据的数据库对所述媒体信用、情感类型、置信度、舆情爆发指数和词云进行存储,得到媒体信用评分表、情感分析表、置信度评分表、舆情爆发指数表和实时词云表。
其中,媒体信用评分表用于记录媒体名称、舆情数量和对应等级。情感分析表用于记录媒体名称、情感类型,例如,正面情感和负面情感和对应的分值。分值用于分析哪个负面的程度更重。置信度评分表用于记录置信度的得分,与置信度相关的预测,转发量和短时传播量。舆情爆发指数表用于记录通过舆情爆发预测模型,对舆情爆发的可能性进行指数判断,例如,时间、地点和爆发的时间空间以及爆发的可能性进行存储。时间的指数预测各个时间爆发的可能性,地域的指数预测爆发的地方。实时词云表用于记录词云计算的结果。
在一种可能的实现方式中,可以通过设定虚拟价格的方法抑制舆情传播。预先设定待发布舆情的信息币;当发布所述舆情时,扣除对应的信息币;当检测所述舆情为虚假信息时,扣除预先设定数量的信息币。在上述方案中,通过扣除信息币,抑制了虚假信息的传播。
在上述方案中,通过当所述主题、所述目标实体、所述情感类型和所述置信度满足负面舆情事件上报条件时,将所述舆情信息推送到区块链的第一待验证队列中,能够实现对负面舆情事件的实时监控和上报,从而一致虚假舆情信息的大范围传播。
结合上述介绍的实施例及相关附图,本申请实施例提供一种舆情监测的装置,应用于区块链***中,所述区块链***包括一个或多个节点,所述装置所包括的各单元都可以通过处理器来实现,当然也可通过具体的逻辑电路实现;在实施过程中,处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图5为本申请实施例提供的舆情监测的装置的组成结构示意图,如图5所示,该装置500包括第一获取单元501、第一分析单元502、第一发送单元503和上报单元504,其中,所述第一获取单元501,用于获取实时舆情信息;所述第一分析单元502,用于对所述实时舆情信息进行文本分析,得到所述实时舆情信息的第一特征,所述第一特征包括所述实时舆情信息的主题、目标实体、情感类型和置信度中的一种或多种信息;所述第一发送单元503,用于当所述第一特征满足预设的负面舆情事件上报条件时,将所述实时舆情信息推送到所述区块链***中,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;所述上报单元504,用于当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,向所述区块链***中智能合约的签约节点上报所述实时舆情信息。
在一种可能的实现方式中,所述装置500还包括第一确定单元、第二分析单元、第二发送单元和预警单元,其中,所述第一确定单元,用于确定舆情爆发预测模型,所述舆情爆发预测模型用于根据所述实时舆情信息预测是否爆发舆情;所述第二分析单元,用于根据所述舆情爆发预测模型和所述第一特征,确定第二特征,所述第二特征包括所述实时舆情信息的词云、舆情爆发指数和媒体信用中的一种或多种信息;所述第二发送单元,当所述第二特征满足预设的舆情爆发预警上报条件时,用于将所述实时舆情信息推送到所述区块链***中,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;所述预警单元,用于当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,进行舆情爆发预警。
在一种可能的实现方式中,当所述第二特征包括所述媒体信用信息时,所述装置500还包括第二确定单元、第三确定单元、第三发送单元和评价单元,其中,所述第二确定单元,用于确定媒体信用等级预测模型,所述媒体信用等级预测模型用于根据媒体发布的实时舆情信息预测所述媒体的可信度;所述第三确定单元,用于根据所述舆情爆发预测模型和所述第一特征,确定所述媒体信用信息,所述第一特征还包括:所述实时舆情信息的发布时间、阅读量、转发量和点赞量中的一种或多种信息;所述第三发送单元,用于当所述媒体信用信息满足预设的媒体信用上报条件时,将所述舆情信息推送到所述区块链***,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;所述评价单元,当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,用于进行媒体信用评价。
在一种可能的实现方式中,所述第一确定单元,包括第一获取子单元、第二获取子单元、第一处理子单元和第一训练子单元,其中,所述第一获取子单元,用于获取N个实时舆情信息作为训练样本;N为大于或等于1的自然数;所述第二获取子单元,用于获取所述训练样本的第一特征;所述第一处理子单元,用于对所述第一特征进行归一化,得到输入向量;所述第一训练子单元,用于将所述输入向量输入卷积神经网络并进行学习训练,得到所述舆情爆发预测模型。
在一种可能的实现方式中,所述第二确定单元,包括第三获取子单元、第四获取子单元、第二处理子单元和第二训练子单元,其中,所述第三获取子单元,用于获取M个实时舆情信息作为训练样本;M为大于或等于1的自然数;所述第四获取子单元,用于获取所述训练样本第一特征;所述第二处理子单元,用于对所述第一特征进行归一化,得到输入向量;所述第二训练子单元,用于将所述输入向量输入卷积神经网络并进行学习训练,得到所述媒体信用等级预测模型。
在一种可能的实现方式中,所述装置500还包括存储单元,其中,所述存储单元,用于对所述媒体信用信息、情感类型、置信度、舆情爆发指数和词云进行存储,得到媒体信用评分表、情感分析表、置信度评分表、舆情爆发指数表和实时词云表。
在一种可能的实现方式中,所述装置500还包括第二获取单元,其中,所述第二获取单元,用于当检测到分布式发布订阅消息***发送的消息通知时,从所述分布式发布订阅消息***中获取实时舆情信息。
这里需要指出的是,以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解,为节约篇幅,因此不再赘述。
这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解,为节约篇幅,因此不再赘述。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的舆情监测的方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台舆情监测的设备执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
对应地,本申请实施例提供一种舆情监测的设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例中提供的方法中的步骤。
对应地,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令配置为执行所述程序时实现上述实施例中提供的舆情监测的方法。
对应地,本实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的方法。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,图6为本申请实施例提供的舆情监测的设备的一种硬件实体示意图,如图6所示,该设备600的硬件实体包括:处理器601、通信接口602和存储器603,其中
处理器601通常控制设备600的总体操作。
通信接口602可以使设备600通过网络与其他终端或服务器通信。
存储器603配置为存储由处理器601可执行的指令和应用,还可以缓存待处理器601以及设备600中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(Random Access Memory,RAM)实现。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所描述的方法。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种舆情监测的方法,其特征在于,应用于区块链***中,所述区块链***包括一个或多个节点,所述方法包括:
获取实时舆情信息;
对所述实时舆情信息进行文本分析,得到所述实时舆情信息的第一特征,所述第一特征包括所述实时舆情信息的主题、目标实体、情感类型和置信度中的一种或多种信息;
当所述第一特征满足预设的负面舆情事件上报条件时,将所述实时舆情信息推送到所述区块链***中,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;
当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,向所述区块链***中智能合约的签约节点上报所述实时舆情信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定舆情爆发预测模型,所述舆情爆发预测模型用于根据所述实时舆情信息预测是否爆发舆情;
根据所述舆情爆发预测模型和所述第一特征,确定第二特征,所述第二特征包括所述实时舆情信息的词云、舆情爆发指数和媒体信用中的一种或多种信息;
当所述第二特征满足预设的舆情爆发预警上报条件时,将所述实时舆情信息推送到所述区块链***中,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;
当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,进行舆情爆发预警。
3.根据权利要求2所述的方法,其特征在于,当所述第二特征包括所述媒体信用信息时,所述方法还包括:
确定媒体信用等级预测模型,所述媒体信用等级预测模型用于根据媒体发布的实时舆情信息预测所述媒体的可信度;
根据所述舆情爆发预测模型和所述第一特征,确定所述媒体信用信息;所述第一特征还包括:所述实时舆情信息的发布时间、阅读量、转发量和点赞量中的一种或多种信息;
当所述媒体信用信息满足预设的媒体信用上报条件时,将所述舆情信息推送到所述区块链***,使得所述区块链***的所述一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;
当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,进行媒体信用评价。
4.根据权利要求2所述的方法,其特征在于,所述确定舆情爆发预测模型,包括:
获取N个实时舆情信息作为训练样本;N为大于或等于1的自然数;
获取所述训练样本的第一特征;
对所述第一特征进行归一化,得到输入向量;
将所述输入向量输入卷积神经网络并进行学习训练,得到所述舆情爆发预测模型。
5.根据权利要求3所述的方法,其特征在于,所述确定媒体信用等级预测模型包括:
获取M个实时舆情信息作为训练样本;M为大于或等于1的自然数;
获取所述训练样本第一特征;
对所述第一特征进行归一化,得到输入向量;
将所述输入向量输入卷积神经网络并进行学习训练,得到所述媒体信用等级预测模型。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
对媒体信用信息、情感类型、置信度、舆情爆发指数和词云进行存储,得到媒体信用评分表、情感分析表、置信度评分表、舆情爆发指数表和实时词云表。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述获取实时舆情信息,包括:
当检测到分布式发布订阅消息***发送的消息通知时,从所述分布式发布订阅消息***中获取实时舆情信息。
8.一种舆情监测的装置,其特征在于,所述装置包括:
第一获取单元,用于获取实时舆情信息;
第一分析单元,用于对所述实时舆情信息进行文本分析,得到所述实时舆情信息的第一特征,所述第一特征包括所述实时舆情信息的主题、目标实体、情感类型和置信度中的一种或多种信息;
第一发送单元,用于当所述第一特征满足预设的负面舆情事件上报条件时,将所述实时舆情信息推送到区块链***中,使得所述区块链***的一个或多个节点中的每一个节点对所述实时舆情信息进行签名验证;
上报单元,用于当检测到所述一个或多个节点中的每一个节点对所述实时舆情信息的签名之后,向所述区块链***中智能合约的签约节点上报所述实时舆情信息。
9.一种电子设备,其特征在于,包括:一个或多个处理器;存储器;安装有多个应用程序的模块;以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,当所述一个或者多个程序被所述处理器执行时,使得所述电子设备执行如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令配置为执行上述权利要求1至7任一项提供的方法。
CN202111090393.6A 2021-09-16 2021-09-16 一种舆情监测的方法、装置、电子设备和存储介质 Pending CN113626717A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111090393.6A CN113626717A (zh) 2021-09-16 2021-09-16 一种舆情监测的方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111090393.6A CN113626717A (zh) 2021-09-16 2021-09-16 一种舆情监测的方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113626717A true CN113626717A (zh) 2021-11-09

Family

ID=78390401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111090393.6A Pending CN113626717A (zh) 2021-09-16 2021-09-16 一种舆情监测的方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113626717A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114492439A (zh) * 2021-12-27 2022-05-13 四川新网银行股份有限公司 一种应用深度学习提升舆情预警准确率的***和方法
CN116527697A (zh) * 2023-06-30 2023-08-01 杭州城市大脑有限公司 应用于一网统管的区块链和ipfs舆情共享方法及***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012083856A1 (zh) * 2010-12-21 2012-06-28 北大方正集团有限公司 一种处理舆情话题的方法、装置和***
WO2020037942A1 (zh) * 2018-08-20 2020-02-27 平安科技(深圳)有限公司 风险预测处理方法、装置、计算机设备和介质
CN111259221A (zh) * 2020-01-20 2020-06-09 山东爱城市网信息技术有限公司 基于区块链的实现舆情处理的方法、设备、介质及***
CN111291394A (zh) * 2020-01-31 2020-06-16 腾讯科技(深圳)有限公司 一种虚假信息管理方法、装置和存储介质
CN112529696A (zh) * 2020-12-24 2021-03-19 潍坊信至科技发展有限公司 基于区块链和舆情的金融风控***
CN112860902A (zh) * 2021-04-02 2021-05-28 中国工商银行股份有限公司 舆情情感热度计算方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012083856A1 (zh) * 2010-12-21 2012-06-28 北大方正集团有限公司 一种处理舆情话题的方法、装置和***
WO2020037942A1 (zh) * 2018-08-20 2020-02-27 平安科技(深圳)有限公司 风险预测处理方法、装置、计算机设备和介质
CN111259221A (zh) * 2020-01-20 2020-06-09 山东爱城市网信息技术有限公司 基于区块链的实现舆情处理的方法、设备、介质及***
CN111291394A (zh) * 2020-01-31 2020-06-16 腾讯科技(深圳)有限公司 一种虚假信息管理方法、装置和存储介质
CN112529696A (zh) * 2020-12-24 2021-03-19 潍坊信至科技发展有限公司 基于区块链和舆情的金融风控***
CN112860902A (zh) * 2021-04-02 2021-05-28 中国工商银行股份有限公司 舆情情感热度计算方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘晓亮: ""涉军网络舆情监测指标体系构建"", 《情报探索》, 15 March 2017 (2017-03-15) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114492439A (zh) * 2021-12-27 2022-05-13 四川新网银行股份有限公司 一种应用深度学习提升舆情预警准确率的***和方法
CN116527697A (zh) * 2023-06-30 2023-08-01 杭州城市大脑有限公司 应用于一网统管的区块链和ipfs舆情共享方法及***
CN116527697B (zh) * 2023-06-30 2023-09-08 杭州城市大脑有限公司 应用于一网统管的区块链和ipfs舆情共享方法及***

Similar Documents

Publication Publication Date Title
CN108108902B (zh) 一种风险事件告警方法和装置
CN109271512B (zh) 舆情评论信息的情感分析方法、装置及存储介质
CN109241418B (zh) 基于随机森林的异常用户识别方法及装置、设备、介质
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及***
CN112348520A (zh) 基于XGBoost的风险评估方法、装置和电子设备
EP2461273A2 (en) Method and system for machine-learning based optimization and customization of document similarities calculation
CN113626717A (zh) 一种舆情监测的方法、装置、电子设备和存储介质
CN112560453B (zh) 语音信息校验方法、装置、电子设备及介质
CN112765003B (zh) 一种基于app行为日志的风险预测方法
CN113450147A (zh) 基于决策树的产品匹配方法、装置、设备及存储介质
CN111160959A (zh) 一种用户点击转化预估方法及装置
CN110941827A (zh) 应用程序异常行为检测方法及装置
CN110533094B (zh) 一种用于驾驶员的评价方法和***
CN112994960B (zh) 业务数据异常检测方法、装置及计算设备
US8918406B2 (en) Intelligent analysis queue construction
CN112632000A (zh) 日志文件聚类方法、装置、电子设备和可读存储介质
CN116127450A (zh) 一种模型评估方法及装置
CN115409104A (zh) 用于识别对象类型的方法、装置、设备、介质和程序产品
CN110704614B (zh) 对应用中的用户群类型进行预测的信息处理方法及装置
JPWO2019187107A1 (ja) 情報処理装置、制御方法、及びプログラム
CN114581219A (zh) 一种反电信网络诈骗预警方法及***
CN112801226A (zh) 数据筛选方法和装置、计算机可读存储介质、电子设备
CN112465149A (zh) 同城件识别方法、装置、电子设备以及存储介质
CN112468452A (zh) 流量检测方法及装置、电子设备、计算机可读存储介质
CN117612243B (zh) 一种基于多层注意力的重点人员行为预警方法及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220922

Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000

Applicant after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd.

Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000

Applicant before: Ping An International Smart City Technology Co.,Ltd.