发明内容
为了提高基于社会事件的风险预警的精准性,本申请提供一种基于社会事件的风险预警方法、装置、设备和存储介质。
第一方面,本申请提供一种基于社会事件的风险预警方法,采用如下的技术方案:
获取待预警地区内当前的社会事件文本信息;
对所述社会事件文本信息进行分词处理,得到多个关键词;
基于KNN文本分类模型对所述多个关键词进行分类,确定各个关键词所属的维度;
对每个所述关键词进行词法分析,得到词法分析结果,所述词法分析结果包括所述关键词的词性、类别和褒贬程度;
基于所述关键词的词法分析结果进行组词得到词组,对组成所述词组的至少两个所述关键词进行相关性分析,确定每个关键词在其维度对应的评估值;
基于属于同一维度的关键词对应的评估值相加,得到该维度的风险值,基于所述待预警地区各个维度的风险值,确定待预警地区的预警等级。
通过采用上述技术方案,电子设备以发生在对应地区的社会事件为统计单位,对社会事件文本信息进行分词处理,进而对得到关键词进行分类,确定关键词所属的维度,通过对关键词进行词法分析和相关性分析,确定关键词在其维度对应的评估值,进而电子设备根据同一维度的关键词的评估值,计算得到风险值,进而计算得到待预警地区的预警等级,从而使电子设备对非结构化数据进行深度分析,减少信息遗漏,以社会事件与各个维度的关系,更加精准地预警每个地区的风险度,更加全面地反映各个地区内的社会治理状况,便于社会治理人员根据预警信息有针对性地进行改善,提高社会治理效果。
进一步地,所述基于所述关键词的词法分析结果进行组词得到词组,对组成所述词组的至少两个所述关键词进行相关性分析,确定每个关键词在其维度对应的评估值,包括:
基于各个所述关键词的词性和类别,确定每个所述社会事件文本信息中,与所述动词和/或形容词相邻的名词,生成词组;
保存与社会治理维度相关的词组;
从大数据中获取同类型以及相似类型的多个词组,确定所述同类型的词组数量占所有的所述词组数量的比例,基于所述比例确定所述动词和/或形容词与所述名词的相关性;
基于所述相关性以及预设初始值确定每个关键词在其维度对应的评估值。
通过采用上述技术方案,社会事件的发生可能会与当前地区内至少一个维度相关,为了精细估算评估值,电子设备确定词组在各个维度的占比情况,进而确定词组中各个关键词的相关性,相关性反映出关键词在当前维度的重要程度,逐步将文本信息赋予数值,实现非结构化信息的转化。
进一步地,所述基于所述待预警地区各个维度的风险值,确定待预警地区的预警等级,包括:
基于所述待预警地区各个维度的风险值以及预设权重比,确定待预警地区的总风险值;
确定每个预警等级对应的风险值范围;
基于每个待预警地区的所述风险值与各个所述风险值范围对比,确定每个待预警地区对应的预警等级。
通过采用上述技术方案,电子设备确定每个预警等级对应的风险值范围,进而根据每个地区的风险值确定对应的预警等级。
进一步地,所述方法还包括:对所述评估值进行修正,包括
获取所述社会事件的过程处理信息以及结案信息中至少一种;
基于当前的社会事件文本信息,评估对应的社会事件的处理难度系数;
基于所述社会事件的处理难度系数,确定社会事件的预设处理期限;
执行以下至少一项:
若获取到所述社会事件的结案信息,则确定所述社会事件文本信息中每个关键词的评估值为零;
若获取到所述当前的社会事件的过程处理信息且未获取到结案信息,确定最后一个所述过程处理信息的获取时间与社会事件的存储时间的时间差值,判断所述时间差值与所述预设处理期限之间的比值是否大于预设比值,若是,则基于所述比值更新所述评估值;否则,不改变所述评估值;
若获取到所述当前的社会事件的同一所述过程处理信息的重复次数大于预设次数、且未获取到结案信息,基于同一所述过程处理信息的重复次数,以及大数据中同类型的社会事件的同一所述过程处理信息的重复次数,确定浮动附加值,基于所述浮动附加值更新所述评估值。
通过采用上述技术方案,电子设备根据社会事件的处理进度修正评估值,当社会事件刚发生,则评估值不变;当社会事件已处理完毕,则评估值为零;当社会事件在处理中,若处理时间接近预设处理期限,则在评估值的基础上增长,即警示工作人员加快处理当前社会事件,利于社会治理高效运行;若电子设备将过程处理信息的重复次数大于预设次数比较后,原因可能为当前社会事件的处理难度增大或工作人员处理效率较低,为了能监督社会事件的处理进度,并且衡量当前社会事件的处理进度是否正常,电子设备根据大数据以及当前过程处理信息的重复次数确定浮动附加值,根据浮动附加值更新评估值。因此电子设备根据社会事件的不同处理进度,计算得到更加精准的评估值。
进一步地,所述基于同一所述过程处理信息的重复次数,以及大数据中同类型的社会事件的同一所述过程处理信息的重复次数,确定浮动附加值,包括:
从大数据中获取与当前的社会事件文本信息同类型的多个参考社会事件的过程处理信息、以及参考社会事件总数量;
确定各个所述参考社会的同一所述过程处理信息的重复次数;
将所述多个参考社会事件进行分类,得到多个分组,其中,每个所述分组内参考社会事件的过程处理信息的重复次数相等;
确定每个所述分组内参考社会事件的数量占所述参考社会事件总数量的比重;
基于各个所述比重的降序生成关于分组的第一序列,确定各个所述分组在所述第一序列中的第一次序;
生成关于所述比重的升序序列;
将各个所述分组与所述升序序列中对应于所述第一次序上的比重一一对应;
将预设基础值与各个对应的所述比重相乘,得到每个分组对应的附加值;
将位于同一所述分组对应的附加值作为浮动附加值。
通过采用上述技术方案,电子设备从大数据中获取与当前社会事件同类型的参考社会事件的过程处理信息、以及参考社会事件总数量,根据参考社会事件中过程处理信息的重复次数作为参考样本,来分析得到浮动附加值。首先将参考社会事件根据过程处理信息的重复次数分组,进而得到每组样本社会事件的数量所占的比重,比重越大的分组,则对应分组的处理信息的重复次数越常见,则计算得到的附加值越小,比重越小的分组,则对应分组的处理信息的重复次数越异常,则计算得到的附加值越大。具体地,电子设备根据样本社会事件中,各个分组所占的比重来计算浮动附加值。
在另一种可能的实现方式中,在获取待预警地区内当前的社会事件文本信息后,所述方法还包括:
每隔预设时间,判断待预警地区的至少一个维度的社会事件数量与待预警地区内社会事件总量的比值是否达到预设比值;若是,则执行以下步骤:
对于所述至少一个维度中的任一维度,判断当前维度的预设权重比在上一个预设时间内是否经过调整,若否,则执行第一步骤;
所述第一步骤包括:
确定各个社会事件待结案的置信度;
确定各个所述社会事件待结案的置信度大于预设值的比率;
基于所述比率代入预设的反比公式,确定所述比率对应的调整值;
将所述当前维度对应的预设权重比与对应的所述调整值相减,确定新的预设权重比;
若当前维度在上一个预设时间内经过调整,维持当前维度对应的预设权重比,直至所述社会事件数量与待预警地区内社会事件总量的比值达到预设比值的次数达到预设限定次数,执行所述第一步骤;
当所述当前维度的社会事件数量与待预警地区内社会事件总量的比值小于预设比值,则使所述当前维度恢复至原预设权重比。
通过采用上述技术方案,电子设备在预设时间内即监测各个地区内每个维度的社会事件数量,当某一维度的社会事件数量过多,则可能因为某些原因,使在这一维度内频繁爆发同类型的社会事件,会导致当前维度的第一风险值很高,而在解决同类型的社会事件时,可协同处理,因此为了更加客观地估算当前维度的第一风险值,电子设备减小待调整维度对应的预设权重比,使重新计算的第一风险值减小,并且若上一预设时间内待调整维度已经过了调整,则不再继续调整预设权重比,若上一预设时间内待调整维度已调整且当前预设时间内无需调整,则在此维度上的治理状况已恢复常态,则恢复原有的权重比。因此实现智能调整各个维度对应的权重比,使地区对应的维度在遇到特殊情况时,对应的第一风险值在限制下有所增大。
在另一种可能的实现方式中,当任一所述维度内社会事件数量与待预警地区内社会事件总量的比值达到预设比值的次数达到预设限定次数,所述方法还包括:
随机抽取当前待预警地区中对应维度的多个社会事件文本信息作为分析样本;
基于各个分析样本的建立时间作为横坐标、各个所述分析样本中过程处理信息的重复次数为纵坐标,建立趋势曲线;
当所述趋势曲线呈上升趋势时,生成警示信息。
通过采用上述技术方案,当任一维度多次被确定为待调整维度时,为了监督工作人员的管理效率,电子设备根据当前地区中对应维度的多个社会事件文本信息作为分析样本,根据每个分析样本对应的记录数据库中,分析样本的建立时间以及过程处理信息的重复次数作为两个分析要素,建立用于分析的趋势曲线,当趋势曲线上升趋势,则工作人员针对当前维度的社会事件的处理效率较低,并不能快速处理,有社会事件堆积、滞后或消极处理的嫌疑,因此生成警示信息,在估算风险的过程中,反向激励工作人员。
第二方面,本申请提供一种基于社会事件的风险预警装置,采用如下的技术方案:
获取模块,用于获取待预警地区内当前的社会事件文本信息;
分词处理模块,用于对所述社会事件文本信息进行分词处理,得到多个关键词;
分类模块,用于基于KNN文本分类模型对所述多个关键词进行分类,确定各个关键词所属的维度;
词法分析模块,用于对每个所述关键词进行词法分析,得到词法分析结果,所述词法分析结果包括所述关键词的词性、类别和褒贬程度;
第一确定模块,用于基于所述关键词的词法分析结果进行组词得到词组,对组成所述词组的至少两个所述关键词进行相关性分析,确定每个关键词在其维度对应的评估值;
第二确定模块,用于基于属于同一维度的关键词对应的评估值相加,得到该维度的风险值,基于所述待预警地区各个维度的风险值,确定待预警地区的预警等级。
通过采用上述技术方案,以发生在对应地区的社会事件为统计单位,分词处理模块对社会事件文本信息进行分词处理,进而对得到关键词进行分类,分类模块确定关键词所属的维度,词法分析模块和第一确定模块通过对关键词进行词法分析和相关性分析,确定关键词在其维度对应的评估值,进而电子设备根据同一维度的关键词的评估值,计算得到风险值,进而第二确定模块计算得到待预警地区的预警等级,从而使电子设备对非结构数据进行深度分析,减少信息遗漏,以社会事件与各个维度的关系,更加精准地预警每个地区的风险度,更加全面地反映各个地区内的社会治理状况,便于社会治理人员根据预警信息有针对性地进行改善,提高社会治理效果。
第三方面,本申请提供一种电子设备,采用如下的技术方案:
一种电子设备,包括:
至少一个处理器;
存储器;
至少一个应用程序,其中所述至少一个应用程序被存储在所述存储器中并被配置为由所述至少一个处理器执行,所述至少一个应用程序配置用于:执行如第一方面中任一项所述的一种基于社会事件的风险预警方法。
通过采用上述技术方案,处理器执行存储器中存储的应用程序,电子设备以发生在对应地区的社会事件为统计单位,对社会事件文本信息进行分词处理,进而对得到关键词进行分类,确定关键词所属的维度,通过对关键词进行词法分析和相关性分析,确定关键词在其维度对应的评估值,进而电子设备根据同一维度的关键词的评估值,计算得到风险值,进而计算得到待预警地区的预警等级,从而使电子设备对非结构数据进行深度分析,减少信息遗漏,以社会事件与各个维度的关系,更加精准地预警每个地区的风险度,更加全面地反映各个地区内的社会治理状况,便于社会治理人员根据预警信息有针对性地进行改善,提高社会治理效果。
第四方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:
一种计算机可读存储介质,存储有能够被处理器加载并执行如第一方面中任一项所述的一种社会治理的风险预警方法的计算机程序。
通过采用上述技术方案,处理器加载并执行计算机可读存储介质中存储的计算机程序,电子设备以发生在对应地区的社会事件为统计单位,对社会事件文本信息进行分词处理,进而对得到关键词进行分类,确定关键词所属的维度,通过对关键词进行词法分析和相关性分析,确定关键词在其维度对应的评估值,进而电子设备根据同一维度的关键词的评估值,计算得到风险值,进而计算得到待预警地区的预警等级,从而使电子设备对非结构数据进行深度分析,减少信息遗漏,以社会事件与各个维度的关系,更加精准地预警每个地区的风险度,更加全面地反映各个地区内的社会治理状况,便于社会治理人员根据预警信息有针对性地进行改善,提高社会治理效果。
综上所述,本申请包括以下至少一种有益技术效果:
1. 电子设备以社会事件文本信息与各个维度的关系,对社会事件文本信息进行分词处理、词法分析和相关性分析,非结构化数据进行深度分析,减少信息遗漏,更加精准地预警每个地区的风险度,更加全面地反映各个地区内的社会治理状况,便于社会治理人员根据预警信息有针对性地进行改善,提高社会治理效果;
2.确定词组在各个维度的占比情况,进而确定词组中各个关键词的相关性,相关性反映出关键词在当前维度的重要程度,逐步将文本信息赋予数值,实现非结构化信息的转化;
3.电子设备根据社会事件的不同处理进度,更加精准计算得到评价值。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
本申请实施例公开一种基于社会事件的风险预警方法。参照图1,该方法由电子设备执行,包括(步骤S101~步骤S106):
步骤S101:获取待预警地区内当前的社会事件文本信息。
具体地,待预警地区实行网格化管理,由街道到区县各层级全量数据接入,社会事件文本信息可以为电子设备通过网格员上报、群众上报、热线电话、互联网舆情、市长信箱、官方机构等方式获得。
社会事件文本信息为一段对社会事件的概述信息,例如新闻稿件、开庭公告、判决文书等文本的标题或主题,作为社会事件文本信息。
步骤S102:对社会事件文本信息进行分词处理,得到多个关键词。
具体地,电子设备对社会事件文本信息进行分词处理,删除其中的连词、量词等对语意没有较大影响的词语,进而得到多个关键词。
步骤S103:基于KNN文本分类模型对多个关键词进行分类,确定各个关键词所属的维度。
具体地,为了实现全域社会治理业务数据全维精细管控,电子设备将待预警地区分为人、地、事、物、情和组织等六个维度。
其中,人,即监控网格人口。
地,即市域、区县、镇街、社区、村居、网格、楼、房、建筑等。
事,即社会治理事件。
物,即物资信息、城市部件。
情,即民情信息。
组织,即各类各级组织信息。
具体地,KNN文本分类模型由多个关键词的样本数据,以及每个样本数据对应的分类,训练而成,训练KNN文本分类模型的方法为现有技术。
步骤S104:对每个关键词进行词法分析,得到词法分析结果,词法分析结果包括关键词的词性、类别和褒贬程度。
具体地,关键词的词性包括代词、名词、形容词和动词等多种,褒贬程度由位于1~10中的数值表示。类别可以为关键词的领域,例如救护车可以为医疗类。
步骤S105:基于关键词的词法分析结果进行组词得到词组,对组成词组的至少两个关键词进行相关性分析,确定每个词组在其维度对应的评估值。
步骤S1051:基于各个关键词的词性和类别,确定每个社会事件文本信息中,与动词和/或形容词相邻的名词,生成词组。
步骤S1052:保存与社会治理维度相关的词组。
步骤S1053:从大数据中获取同类型以及相似类型的多个词组,确定同类型的词组数量占所有的词组数量的比例,基于比例确定动词和/或形容词与名词的相关性。
具体地,电子设备从大数据中获取在当前词组对应的领域的社会事件中,具有当前词组的数量,并计算确定当前词组在医疗领域所有词组中的比例,比例越大,则当前动词和/或形容词与名词的相关性越大,即当前词组所在的社会事件为常见事件,比例越小,则当前动词和/或形容词与名词的相关性越小,即当前词组所在的社会事件为非常见事件。
进一步地,电子设备可以将计算得到的比例确定为相关性。
步骤S1053:基于相关性以及预设初始值确定每个关键词在其维度对应的评估值。
具体地,预设初始值为预先设置的,电子设备将预设初始值与相关性相乘,得到一个中间值,再将中间值与词组中关键词的个数相除,计算得到每个关键词在其维度对应的中间值。
步骤S106:基于属于同一维度的关键词对应的评估值相加,得到该维度的风险值,基于待预警地区各个维度的风险值,确定待预警地区的预警等级。
具体地,社会事件在对应维度的关键词越多,则对应维度的风险值越高,当前也可以反映出当前社会事件与对应维度的相关性越高,因此提高社会治理过程中风险预测的准确性。
步骤S106在基于待预警地区各个维度的风险值,确定待预警地区的预警等级时,包括(步骤S1061~步骤S1063):
步骤S1061:基于待预警地区各个维度的风险值以及预设权重比,确定待预警地区的总风险值。
具体地,电子设备预设各个维度的预设权重比,具体权重比可以根据待预警地区的特点而定。电子设备将各个维度的风险值与其对应的预设权重比相乘,最后将各个积相加,即可计算得到待预警地区的总风险值。
步骤S1062:确定每个预警等级对应的风险值范围。
步骤S1063:基于每个待预警地区的风险值与各个风险值范围对比,确定每个待预警地区对应的预警等级。
具体地,电子设备实时更新待预警地区的预警等级,实现自动监控。
在另一种可能的实现方式中,若当前的社会事件为新发事件,因此关键词对应的评估值准确,然而,随着社会事件的不断处理,社会事件的风险会有所变动,为了提高预测风险的准确性,上述方法还包括:对评估值进行修正,具体包括(步骤S11~步骤S14):
步骤S11:获取社会事件的过程处理信息以及结案信息中至少一种。
具体地,过程处理信息可以为社会事件处理过程中发出的公告或文书,结案信息可以为社会事件处理完成后发出的公告或文书。进一步地,电子设备通过相关机构的***,获取过程处理信息和结案信息。例如,当负责解决当前社会事件的人员进行处理时,在***上新建过程处理信息,当当前社会事件得到解决时,负责人员在***上新建结案信息。
电子设备将每个当前的社会事件文本信息、过程处理信息和结案信息存储在一起,为了纵观社会事件的处理进度,电子设备建立处理时间轴,将当前的社会事件文本信息按照当前时刻进行储存。
步骤S12:基于当前的社会事件文本信息,评估对应的社会事件的处理难度系数。
具体地,当电子设备接收新的社会事件文本信息时,电子设备生成询问信息,向相关机构的处理人员确认当前社会事件的处理难度系数,工作人员根据经验给出处理难度系数。而当电子设备保存过相同的社会事件文本信息时,电子设备自动赋予其预设的处理难度系数。
步骤S13:基于社会事件的处理难度系数,确定社会事件的预设处理期限:
进一步地,每个处理难度系数即对应设置有预设处理期限。例如,处理难度系数最大为10,若处理难度系数为5,则预设处理期限为1个月;处理难度系数为7,预设处理期限为3个月。为了便于计算,电子设备可以设置关于预设处理期限和处理难度系数的函数。
步骤S14:执行以下至少一项:
A:若获取到社会事件的结案信息,则确定社会事件文本信息中每个关键词的评估值为零。
具体地,若当前社会事件已经结案,则电子设备即可确定当前社会事件已经不具备较大风险,对于预测社会治理风险的作用较小,因此可将社会事件文本信息中每个关键词的评估值确定为零。
B:若获取到当前的社会事件的过程处理信息且未获取到结案信息,确定最后一个过程处理信息的获取时间与社会事件的存储时间的时间差值,若时间差值与预设处理期限之间的比值大于预设比值,则基于比值更新评估值;否则,不改变评估值。
具体地,当前的社会事件在处理过程当中时,为了衡量当前社会事件的处理效率并重新确定其处理难度,电子设备可以计算最后一次处理社会事件与初次存储社会事件之间的时间差值,当时间差值越大,则当前社会事件的处理难度可能较预想中更加困难,从另一角度讲,也可能是工作人员处理效率更低。
因此为了提高评估值的精度,当时间差值与预设处理期限的比值大于预设比值时,将比值与原评估值相乘,计算得到较初步风险值更大的第一风险值,同时对工作人员具有督促作用。
当时间差值与预设处理期限的比值小于预设比值时,则当前社会事件的处理处于正常流程当中。
其中,预设比例可依具体情况设置,本申请不再赘述,但需注意的是,为了防止评估值过高,预设比例可以选取位于0.85~1.0之间的值,当比值到达预设限制时,则不再增长,预设限制可以选取位于2~3之间的值。
C:若获取到当前的社会事件的同一过程处理信息的重复次数大于预设次数、且未获取到结案信息,基于同一过程处理信息的重复次数,以及大数据中同类型的社会事件的同一过程处理信息的重复次数,确定浮动附加值,基于浮动附加值更新评估值。
具体地,在工作人员处理当前社会事件的过程中时,可能由于沟通障碍或现实因素,出现多次执行同一处理步骤的情况。电子设备根据这种情况,在评估值的基础上增加浮动附加值,提高当前社会事件的第一风险值。
为了判断当前社会事件出现重复处理的情况是否正常,并计算浮动附加值,步骤S14在执行基于同一过程处理信息的重复次数,以及大数据中同类型的社会事件的同一过程处理信息的重复次数,确定浮动附加值时,上述方法还包括(步骤Sa~步骤Si):
步骤Sa:从大数据中获取与当前的社会事件文本信息同类型的多个参考社会事件的过程处理信息、以及参考社会事件总数量。
步骤Sb:确定各个参考社会的同一过程处理信息的重复次数。
例如,当前的社会事件的过程处理信息a重复了5次,电子设备获取参考社会事件为m件,进而获取每个参考社会事件的过程处理信息a的重复次数。
步骤Sc:将多个参考社会事件进行分类,得到多个分组,其中,每个分组内参考社会事件的过程处理信息的重复次数相等。
例如, m件社会事件中包括重复了0、1、2次……过程处理信息的多种社会事件,因此电子设备分类得到n个分组。
步骤Sd:确定每个分组内参考社会事件的数量占参考社会事件总数量的比重。
例如,电子设备将分组1中的参考社会事件的数量与m相除,计算得到分组1所占的比重,依次类推,得到各个分组对应的比重(i=1~n)。
步骤Se:基于各个比重的降序生成关于分组的第一序列,确定各个分组在第一序列中的第一次序。
步骤Sf:生成关于比重的升序序列。
例如,电子设备分类得到10个分组,生成第一序列中的分组对应的比重依次减小,升序序列中的比重依次增大。
步骤Sg:将各个分组与升序序列中对应于第一次序上的比重一一对应。
例如,分组1的第一次序为3,则电子设备将分组1与升序序列中第3位的比重与其对应。
步骤Sh:将预设基础值与各个对应的比重相乘,得到每个分组对应的附加值。
步骤Si:将位于同一分组对应的附加值作为浮动附加值。
具体地,分组的第一次序越高,则代表其所占比例越高,则可以推测当前社会事件的过程处理信息重复次数为常见情况,因此电子设备可以赋予其较低的浮动附加值;若所占比例约低,则推测当前社会事件过程处理信息重复次数异常,则赋予其较高的浮动附加值。
为了计算得到浮动附加值,电子设备预设基础值,电子设备将预设基础值与对应的比重相乘,即可计算得到附加值,计算得到的附加值即作为浮动附加值。
在另一种可能的实现方式中,在获取待预警地区内当前的社会事件文本信息后,上述方法还包括(步骤S21~步骤S25):
步骤S21:每隔预设时间,判断待预警地区的至少一个维度的社会事件数量与待预警地区内社会事件总量的比值是否达到预设比值;若是,则执行步骤S22:否则,执行步骤S25。
具体地,电子设备在每次获取社会事件文本信息后,根据社会事件文本信息确定关键词所属维度,并将关键词所属的至少一个领域,确定为社会事件的维度。电子设备每隔预设时间后复盘待预警地区的社会治理情况。其中,预设时间依照实际情况设置,可以为1周。
当待预警地区的某一维度的社会事件数量与待预警地区内社会事件总量的比值达到预设比值时,则可以推测当前维度因为某些原因而爆发同类事件,这些同类事件在处理时具有趋同性,因此根据原有的预设权重比计算得到的第二风险值可能会出现过高的情况,影响判断,不利于预警。
预设比值根据维度的数量设置,例如,待预警地区内,有n个维度,则预设比值为1/n。
步骤S22:对于至少一个维度中的任一维度,判断当前维度的预设权重比在上一个预设时间内是否经过调整;若否,则执行第一步骤S23;若是,则执行步骤S24。
第一步骤S23包括(步骤S231~步骤S234):
步骤S231:确定各个社会事件待结案的置信度。
具体地,电子设备获取各个社会事件的处理时间,并将其与大数据中同类社会事件结案时间比较,计算其待结案的置信度。
步骤S232:确定各个社会事件待结案的置信度大于预设值的比率。
具体地,比率越大,则社会事件待结案的置信度大于预设值的数量越多,则当前维度内的社会事件结案的可能性越高,因此社会事件因持续而难以解决的可能性越小,对应的风险越小。
步骤S233:基于比率代入预设的反比公式,确定比率对应的调整值。
具体地,根据上述结论,比率越大,则对应的风险越小,因此电子设备预设反比公式,得到越小的调整值。
步骤S234:将当前维度对应的预设权重比与对应的调整值相减,确定新的预设权重比。
具体地,经过相减计算后,当前维度内待结案的社会事件越多,则预设权重比减小的值越小,防止因大幅调整而导致数据不稳定的现象发生,使实际的预测数据随着社会事件的结案而稳步下降。
步骤S24:维持当前维度对应的预设权重比,直至的社会事件数量与待预警地区内社会事件总量的比值达到预设比值的次数达到预设限定次数,执行第一步骤。
具体地,为了防止频繁减小预设权重值,降低总风险值的大幅浮动,当在上一个预设时间内,预设权重值已经被修改时,此时不再继续修改,若当前维度的社会事件仍然长时间内大部分未结案,则再执行减小预设权重值的步骤。
步骤S25:使当前维度恢复至原预设权重比。
具体地,当前维度内社会事件恢复正常,则可以推测当前维度的特殊事件已得到妥善解决,社会治理恢复常态,则电子设备将当前维度恢复至原预设权重比。
在另一种可能的实现方式中,为了针对当前维度的异常情况发出警报提示信息,在任一维度内社会事件数量与待预警地区内社会事件总量的比值达到预设比值的次数达到预设限定次数时,上述方法还包括(步骤S31~步骤S33):
步骤S31:随机抽取当前待预警地区中对应维度的多个社会事件文本信息作为分析样本。
步骤S32:基于各个分析样本的建立时间作为横坐标、各个分析样本中过程处理信息的重复次数为纵坐标,建立趋势曲线。
步骤S33:当趋势曲线呈上升趋势时,生成警示信息。
为了更好地执行上述方法,本申请实施例还提供一种基于社会事件的风险预警装置,参照图2,基于社会事件的风险预警装置200包括:
获取模块201,用于获取待预警地区内当前的社会事件文本信息;
分词处理模块202,用于对社会事件文本信息进行分词处理,得到多个关键词;
分类模块203,用于基于KNN文本分类模型对多个关键词进行分类,确定各个关键词所属的维度;
词法分析模块204,用于对每个关键词进行词法分析,得到词法分析结果,词法分析结果包括关键词的词性、类别和褒贬程度;
第一确定模块205,用于基于关键词的词法分析结果进行组词得到词组,对组成词组的至少两个关键词进行相关性分析,确定每个关键词在其维度对应的评估值;
第二确定模块206,用于基于属于同一维度的关键词对应的评估值相加,得到该维度的风险值,基于待预警地区各个维度的风险值,确定待预警地区的预警等级。
进一步地,第一确定模块205,具体用于:
基于各个关键词的词性和类别,确定每个社会事件文本信息中,与动词和/或形容词相邻的名词,生成词组;
保存与社会治理维度相关的词组;
从大数据中获取同类型以及相似类型的多个词组,确定同类型的词组数量占所有的词组数量的比例,基于比例确定动词和/或形容词与名词的相关性;
基于相关性以及预设初始值确定每个关键词在其维度对应的评估值。
进一步地,第二确定模块206在基于待预警地区各个维度的风险值,确定待预警地区的预警等级时,具体用于:
基于待预警地区各个维度的风险值以及预设权重比,确定待预警地区的总风险值;
确定每个预警等级对应的风险值范围;
基于每个待预警地区的风险值与各个风险值范围对比,确定每个待预警地区对应的预警等级。
进一步地,基于社会事件的风险预警装置200还包括用于对评估值进行修正的修正模块,具体用于:
获取社会事件的过程处理信息以及结案信息中至少一种;
基于当前的社会事件文本信息,评估对应的社会事件的处理难度系数;
基于社会事件的处理难度系数,确定社会事件的预设处理期限;
执行以下至少一项:
若获取到社会事件的结案信息,则确定社会事件文本信息中每个关键词的评估值为零;
若获取到当前的社会事件的过程处理信息且未获取到结案信息,确定最后一个过程处理信息的获取时间与社会事件的存储时间的时间差值,判断时间差值与预设处理期限之间的比值是否大于预设比值,若是,则基于比值更新评估值;否则,不改变评估值;
若获取到当前的社会事件的同一过程处理信息的重复次数大于预设次数、且未获取到结案信息,基于同一过程处理信息的重复次数,以及大数据中同类型的社会事件的同一过程处理信息的重复次数,确定浮动附加值,基于浮动附加值更新评估值。
进一步地,修正模块在基于同一过程处理信息的重复次数,以及大数据中同类型的社会事件的同一过程处理信息的重复次数,确定浮动附加值时,具体用于:
从大数据中获取与当前的社会事件文本信息同类型的多个参考社会事件的过程处理信息、以及参考社会事件总数量;
确定各个参考社会的同一过程处理信息的重复次数;
将多个参考社会事件进行分类,得到多个分组,其中,每个分组内参考社会事件的过程处理信息的重复次数相等;
确定每个分组内参考社会事件的数量占参考社会事件总数量的比重;
基于各个比重的降序生成关于分组的第一序列,确定各个分组在第一序列中的第一次序;
生成关于比重的升序序列;
将各个分组与升序序列中对应于第一次序上的比重一一对应;
将预设基础值与各个对应的比重相乘,得到每个分组对应的附加值;
将位于同一分组对应的附加值作为浮动附加值。
在另一种可能的实现方式中,基于社会事件的风险预警装置200还包括:
第二判断模块,用于每隔预设时间,判断待预警地区的至少一个维度的社会事件数量与待预警地区内社会事件总量的比值是否达到预设比值;
第三执行模块,用于在第二判断模块判断为是时,执行以下步骤:
对于至少一个维度中的任一维度,判断当前维度的预设权重比在上一个预设时间内是否经过调整,若否,则执行第一步骤;
第一步骤包括:
确定各个社会事件待结案的置信度;
确定各个社会事件待结案的置信度大于预设值的比率;
基于比率代入预设的反比公式,确定比率对应的调整值;
将当前维度对应的预设权重比与对应的调整值相减,确定新的预设权重比;
若当前维度在上一个预设时间内经过调整,维持当前维度对应的预设权重比,直至社会事件数量与待预警地区内社会事件总量的比值达到预设比值的次数达到预设限定次数,执行第一步骤;
第四执行模块,用于在第二判断模块判断为否时,使当前维度恢复至原预设权重比。
在另一种可能性中,任一维度内社会事件数量与待预警地区内社会事件总量的比值达到预设比值的次数达到预设限定次数,基于社会事件的风险预警装置200还包括:
分析样本抽取模块,用于随机抽取当前待预警地区中对应维度的多个社会事件文本信息作为分析样本;
建立模块,用于基于各个分析样本的建立时间作为横坐标、各个分析样本中过程处理信息的重复次数为纵坐标,建立趋势曲线;
生成模块,用于当趋势曲线呈上升趋势时,生成警示信息。
前述实施例中的方法中的各种变化方式和具体实例同样适用于本实施例的基于社会事件的风险预警装置,通过前述对基于社会事件的风险预警方法的详细描述,本领域技术人员可以清楚的知道本实施例中的基于社会事件的风险预警装置的实施方法,所以为了说明书的简洁,在此不再详述。
为了更好地实施以上方法,本申请实施例提供一种电子设备,参照图3,电子设备300包括:处理器301、存储器303和显示屏305。其中,存储器303、显示屏305均与处理器301相连,如通过总线302相连。可选地,电子设备300还可以包括收发器304。需要说明的是,实际应用中收发器304不限于一个,该电子设备300的结构并不构成对本申请实施例的限定。
处理器301可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器301也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线302可包括一通路,在上述组件之间传送信息。总线302可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线302可以分为地址总线、数据总线、控制总线等。
存储器303可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器303用于存储执行本申请方案的应用程序代码,并由处理器301来控制执行。处理器301用于执行存储器303中存储的应用程序代码,以实现前述方法实施例所示的内容。
图3示出的电子设备300仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
本申请实施例还提供一种计算机可读存储介质,存储有计算机程序,该程序被处理器执行时实现上述实施例提供的一种基于社会事件的风险预警方法,处理器加载并执行计算机可读存储介质中存储的计算机程序,以发生在对应地区的社会事件为统计单位,对社会事件文本信息进行分词处理,进而对得到关键词进行分类,确定关键词所属的维度,通过对关键词进行词法分析和相关性分析,确定关键词在其维度对应的评估值,进而电子设备根据同一维度的关键词的评估值,计算得到风险值,进而计算得到待预警地区的预警等级,从而使电子设备对非结构化数据进行深度分析,减少信息遗漏,以社会事件与各个维度的关系,更加精准地预警每个地区的风险度,更加全面地反映各个地区内的社会治理状况,便于社会治理人员根据预警信息有针对性地进行改善,提高社会治理效果。
本实施例中,计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。具体的,计算机可读存储介质可以是便携式计算机盘、硬盘、U盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、讲台随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、光盘、磁碟、机械编码设备以及上述任意组合。
本实施例中的计算机程序包含用于执行前述所有的方法的程序代码,程序代码可包括对应执行上述实施例提供的方法步骤对应的指令。计算机程序可从计算机可读存储介质下载到各个计算/处理设备,或者通过网络(例如因特网、局域网、广域网和/或无线网)下载到外部计算机或外部存储设备。计算机程序可完全地在用户计算机上执行、作为一个独立的软件包执行。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。
另外,需要理解的是,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。