一种舆情信息的识别方法、装置及设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种舆情信息的识别方法、装置及设备。
背景技术
随着互联网的普及,越来越多的人开始使用互联网,并通过互联网分享或表达自己的想法,互联网作为一种新的信息传播媒介已经融入到了人们的日常生活中,人们已经习惯了使用互联网来分享或表达自己的想法。由于互联网环境下相对来说更加开放、分享效率更高,因此,某个或某些观点很容易在互联网上传播,甚至会形成强大的舆论力量。
舆情对互联网企业来说越来越重要,业务提供商往往需要重点关注其开发的业务的各方面舆情,尤其是负面舆情。在新媒体背景下,***舆情量级庞大,而且用户反馈的业务的故障信息及用户诉求相对集中,为了尽快获取该业务的高危舆情,防止该业务处于风险之中,通常,可以通过关键词筛选出跟某业务相关的高危舆情,然后,通过人工的方式来判定上述业务中是否存在风险,由于对业务中存在的风险判断主要靠人工进行,而人工操作较慢,从而使得基于舆情信息的业务风险判断效率低下,且人力资源成本高。因此,需要提供一种基于舆情信息的业务风险判断效率更高、人力资源消耗更少的舆情信息处理方案。
发明内容
本说明书实施例的目的是提供一种舆情信息的识别方法、装置及设备,以提供一种基于舆情信息的业务风险判断效率更高、人力资源消耗更少的舆情信息处理方案。
为了实现上述技术方案,本说明书实施例是这样实现的:
本说明书实施例提供的一种舆情信息的识别方法,所述方法包括:
获取与目标业务相关的待分析的舆情信息;
根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述舆情信息中包含的所述目标业务存在的风险类型。
可选地,所述根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述舆情信息中包含的所述目标业务存在的风险类型,包括:
根据预定的历史舆情处理机制和处理样本信息,确定舆情信息对应的风险类型,并确定用户诉求对应的类型;
基于所述舆情信息对应的风险类别,以及所述用户诉求对应的类别,根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述待分析的舆情信息中包含的所述目标业务存在的风险类型和所述待分析的舆情信息对应的用户诉求。
可选地,所述方法还包括:
获取与所述目标业务相关的历史舆情样本信息,所述历史舆情样本信息中标注有所述目标业务存在的风险类型、所述目标业务出现的故障信息和所述历史舆情样本信息对应的用户诉求信息;
通过预定的机器学习算法和所述历史舆情样本信息,构建并训练所述舆情分析模型。
可选地,所述方法还包括:
对所述舆情信息对应的用户诉求进行聚类,得到所述舆情信息对应的用户诉求对应的类别;
将所述舆情信息对应的用户诉求的信息设置到得到的类别对应的群组中。
可选地,所述方法还包括:
从所述舆情信息中包含的所述目标业务出现的故障信息中,获取包括预定关键词的故障信息,所述预定关键词为预设的重点故障对应的关键词。
可选地,所述机器学习算法包括朴素贝叶斯算法、决策树算法、支持向量机算法、kNN算法、神经网络算法、深度学习算法和逻辑回归算法中的一种或多种。
可选地,所述舆情信息来自于以下中的至少一种:新闻消息、微博消息和论坛消息。
本说明书实施例提供的一种舆情信息的识别装置,所述装置包括:
信息获取模块,用于获取与目标业务相关的待分析的舆情信息;
舆情分析模块,用于根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述舆情信息中包含的所述目标业务存在的风险类型。
可选地,所述舆情分析模块,用于:
根据预定的历史舆情处理机制和处理样本信息,确定舆情信息对应的风险类型,并确定用户诉求对应的类型;
基于所述舆情信息对应的风险类别,以及所述用户诉求对应的类别,根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述待分析的舆情信息中包含的所述目标业务存在的风险类型和所述待分析的舆情信息对应的用户诉求。
可选地,所述装置还包括:
历史舆情获取模块,用于获取与所述目标业务相关的历史舆情样本信息,所述历史舆情样本信息中标注有所述目标业务存在的风险类型、所述目标业务出现的故障信息和所述历史舆情样本信息对应的用户诉求信息;
模型构建模块,用于通过预定的机器学习算法和所述历史舆情样本信息,构建并训练所述舆情分析模型。
可选地,所述装置还包括:
聚类模块,用于对所述舆情信息对应的用户诉求进行聚类,得到所述舆情信息对应的用户诉求对应的类别;
信息设置模块,用于将所述舆情信息对应的用户诉求的信息设置到得到的类别对应的群组中。
可选地,所述装置还包括:
故障信息获取模块,用于从所述舆情信息中包含的所述目标业务出现的故障信息中,获取包括预定关键词的故障信息,所述预定关键词为预设的重点故障对应的关键词。
可选地,所述机器学习算法包括朴素贝叶斯算法、决策树算法、支持向量机算法、kNN算法、神经网络算法、深度学习算法和逻辑回归算法中的一种或多种。
可选地,所述舆情信息来自于以下中的至少一种:新闻消息、微博消息和论坛消息。
本说明书实施例提供的一种舆情信息的识别设备,所述舆情信息的识别设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取与目标业务相关的待分析的舆情信息;
根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述舆情信息中包含的所述目标业务存在的风险类型。
由以上本说明书实施例提供的技术方案可见,本说明书实施例通过获取与目标业务相关的待分析的舆情信息,进而根据预定的舆情分析模型对待分析的舆情信息进行分析,得到该舆情信息中包含的目标业务存在的风险类型,这样,可以通过将目标业务的相关舆情信息通过舆情分析模型(或通过人工智能的方式),判定其是否存在风险,以及其风险类型,以便后续正对该风险类型进行相应的防控处理,从而不需要通过人工的方式对舆情信息进行分析来判定目标业务存在的风险和风险类型,提高了基于舆情信息的业务风险判断效率,且降低了人力资源成本,而且上述处理便于对舆情的批量处理,可以提升舆情管控效率。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一种舆情信息的识别方法实施例;
图2为本说明书一种舆情信息的识别界面示意图;
图3为本说明书另一种舆情信息的识别方法实施例;
图4为本说明书一种舆情信息的识别装置实施例;
图5为本说明书一种舆情信息的识别设备实施例。
具体实施方式
本说明书实施例提供一种舆情信息的识别方法、装置及设备。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
实施例一
如图1所示,本说明书实施例提供一种舆情信息的识别方法,该方法的执行主体可以为终端设备或服务器等,其中,该终端设备可以如手机或平板电脑等移动终端设备,还可以如个人计算机等设备。该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群,而且,该服务器可以是某网站(如网络购物网站或购物应用等)的后台服务器,或者可以是某业务(如金融业务或支付业务等)的服务器等。该方法可以用于将目标业务的相关舆情信息通过舆情分析模型的方式,判定其是否涉及安全问题,便于对舆情批量处理,提升舆情管控效率。为了提高舆情信息的识别和处理效率,本实施例的执行主体可以以服务器为例进行说明,对于执行主体为终端设备的情况,可以根据下述相关内容执行,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S102中,获取与目标业务相关的待分析的舆情信息。
其中,目标业务可以是任意业务,例如支付业务、理财业务或购物业务等。舆情信息可以是指在一定的社会空间内,围绕某中介性事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人,以及其它各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度的信息,舆情信息可以是较多群众关于社会中某种现象、问题所表达的信念、态度、意见和情绪等信息,舆情信息可以是专门对某些特定舆情状态及变化情况进行描述和反映的一种载体形式。
在实施中,随着互联网的普及,越来越多的人开始使用互联网,并通过互联网分享或表达自己的想法,互联网作为一种新的信息传播媒介已经融入到了人们的日常生活中,人们已经习惯了使用互联网来分享或表达自己的想法。由于互联网环境下相对来说更加开放、分享效率更高,因此,某个或某些观点很容易在互联网上传播,甚至会形成强大的舆论力量。
舆情对互联网企业来说越来越重要,业务提供商往往需要重点关注其开发的业务的各方面舆情,尤其是负面舆情。在新媒体背景下,***舆情量级庞大,而且用户反馈的业务的故障信息及用户诉求相对集中,为了尽快获取该业务的高危舆情,防止该业务处于风险之中,通常,可以通过关键词筛选出跟某业务相关的高危舆情,然后,通过人工的方式来判定上述业务中是否存在风险,由于对业务中存在的风险判断主要靠人工进行,而人工操作较慢,从而使得基于舆情信息的业务风险判断效率低下,且人力资源成本高。为此本说明书实施例提供一种基于舆情信息的业务风险判断效率更高、人力资源消耗更少的舆情信息处理方案。
在实际应用中,可以设置终端设备或服务器中可以安装的应用程序,该应用程序可以具备舆情信息获取功能,为了能够实现从不同数据源(如微博、博客、论坛或媒体网站)中获取舆情信息,可以在该应用程序中设置相应的程序接口,通过该程序接口可以分别与不同数据源进行连接。此外,该应用程序中还可以设置有多个不同的按键和信息输入框,例如,如图2所示,舆情信息获取按键、时间段输入框等。每当需要获取舆情信息时,用户可以点击该应用程序中的舆情信息获取按键,此时,该应用程序可以通过该程序接口,从不同数据源中获取与目标业务相关的舆情信息,或者,如图2所示,用户可以先在时间段输入框中设置舆情信息的时间段范围(如从0点整到当前时刻等),设置完成后,用户可以点击舆情信息获取按键,此时,该应用程序可以通过该程序接口,从不同数据源中查找产生时间位于设置的时间段内的舆情信息,并通过上述程序接口将查找到的舆情信息返回给该应用程序。
考虑到从不同数据源中获取的舆情信息可能较多,而其中的一个或多个舆情并不会对用户或用户的相关信息产生任何影响,或者,不会发展为热点舆情,因此,可以根据当前的实际情况,以及目标业务的相关信息,可以预先设置舆情信息筛选条件。当通过上述处理从不同数据源中获取到舆情信息后,可以使用舆情信息筛选条件对上述舆情信息进行进一步筛选,得到符合舆情信息筛选条件的与目标业务相关的待分析的舆情信息。
在步骤S104中,根据预定的舆情分析模型对待分析的舆情信息进行分析,得到该舆情信息中包含的目标业务存在的风险类型。
其中,舆情分析模型可以是用于对某些舆情信息进行分析,以确定该舆情信息中是否包含目标业务存在风险的相关信息,以及如果包含目标业务存在风险的相关信息,则获取风险类型的相关信息等模型。风险类型可以包括多种,具体如欺诈或业务漏洞等,风险类型可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,可以预先构建并训练舆情分析模型,可以通过多种方式构建舆情分析模型,例如通过分类算法构建舆情分析模型,或者,通过回归算法构建舆情分析模型等,其中的分类算法可以包括多种,例如朴素贝叶斯算法、决策树算法、支持向量机算法、kNN算法、神经网络算法或深度学习算法等,回归算法可以包括逻辑回归算法等。具体地,可以通过神经网络算法构建并训练舆情分析模型,首先,可以根据实际情况,为基于神经网络算法的舆情分析模型设置多个层,其中可以包括输入层和输出层,以及一个或多个中间层等,其中,输入层可以用于输入舆情信息,输出层可以用于输出目标业务存在的风险类型,中间层可以根据实际情况设置多个不同的参数,这样可以构建舆情分析模型。然后,可以通过多种方式获取用于训练舆情分析模型的样本数据,例如,可以通过购买或奖励等方式从多个不同的用户获取样本数据。可以使用获取的样本数据训练舆情分析模型,从而使得舆情分析模型中的多个不同参数得到确定的数值,进而得到训练完成的舆情分析模型。
通过上述方式得到舆情分析模型后,可以将上述步骤S102中获取的与目标业务相关的待分析的舆情信息作为输入数据输入到上述舆情分析模型中进行计算,得到计算结果,即通过舆情分析模型对待分析的舆情信息进行分析,得到该舆情信息中包含的目标业务存在的风险类型。
本说明书实施例提供一种舆情信息的识别方法,通过获取与目标业务相关的待分析的舆情信息,进而根据预定的舆情分析模型对待分析的舆情信息进行分析,得到该舆情信息中包含的目标业务存在的风险类型,这样,可以通过将目标业务的相关舆情信息通过舆情分析模型(或通过人工智能的方式),判定其是否存在风险,以及其风险类型,以便后续正对该风险类型进行相应的防控处理,从而不需要通过人工的方式对舆情信息进行分析来判定目标业务存在的风险和风险类型,提高了基于舆情信息的业务风险判断效率,且降低了人力资源成本,而且上述处理便于对舆情的批量处理,可以提升舆情管控效率。
实施例二
如图3所示,本说明书实施例提供一种舆情信息的识别方法,该方法的执行主体可以为终端设备或服务器等,其中,该终端设备可以如手机或平板电脑等移动终端设备,还可以如个人计算机等设备。该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群,而且,该服务器可以是某网站(如网络购物网站或购物应用等)的后台服务器,或者可以是某业务(如金融业务或支付业务等)的服务器等。该方法可以用于将目标业务的相关舆情信息通过舆情分析模型的方式,判定其是否涉及安全问题,便于对舆情批量处理,提升舆情管控效率。为了提高舆情信息的识别和处理效率,本实施例的执行主体可以以服务器为例进行说明,对于执行主体为终端设备的情况,可以根据下述相关内容执行,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S302中,获取与目标业务相关的历史舆情样本信息,历史舆情样本信息中标注有目标业务存在的风险类型、目标业务出现的故障信息和历史舆情样本信息对应的用户诉求信息。
其中,该历史舆情样本信息可以来自于以下中的至少一种:新闻消息、微博消息和论坛消息等。
在实施中,可以通过多种方式获取与目标业务相关的历史舆情样本信息,例如,可以通过购买的方式或奖励的方式从不同用户获取与目标业务相关的历史舆情样本信息,具体地,可以设置有目标业务的应用程序,该应用程序中可以设置有舆情信息的上传按键,该目标业务的服务商可以邀请具备一定能力的用户参加舆情分析模型的构建和分析等,如果用户同意目标业务的服务商的上述邀请,则可以向目标业务的服务商发送相应的反馈消息,目标业务的服务商可以记录该用户的标识。当该用户使用目标业务的过程中,可以记录用户提供的舆情信息(即历史舆情样本信息),同时,还可以接收用户主动上传的历史舆情样本信息,其中,该历史舆情样本信息可以来自于不同数据源,具体如微博、博客、论坛或媒体网站等。历史舆情样本信息可以是用户在一定时长(如一个月或15天等)内的与目标业务相关的历史舆情样本信息。
需要说明的是,为了使得后续得到的舆情分析模型更加准确,可以对历史舆情样本信息进行标注,可以将历史舆情样本信息中包含的目标业务存在的风险类型、目标业务出现的故障信息和历史舆情样本信息对应的用户诉求信息等标注出来,以对舆情分析模型的训练进行监督。
在步骤S304中,通过预定的机器学习算法和历史舆情样本信息,构建并训练舆情分析模型。
其中,机器学习算法可以包括多种,本说明书实施例中的机器学习算法可以为有监督的机器学习算法,例如,朴素贝叶斯算法、决策树算法、支持向量机算法、kNN算法、神经网络算法、深度学习算法或逻辑回归算法等。
在实施中,以机器学习算法为神经网络算法为例,可以通过神经网络算法构建并训练舆情分析模型,首先,可以根据实际情况,为基于神经网络算法的舆情分析模型设置多个层,其中可以包括输入层和输出层,以及一个或多个中间层等,其中,输入层可以用于输入舆情信息,输出层可以用于输出目标业务存在的风险类型,中间层可以根据实际情况设置多个不同的参数,这样可以构建舆情分析模型。然后,可以通过多种方式获取用于训练舆情分析模型的样本数据,例如,可以通过购买或奖励等方式从多个不同的用户获取样本数据。可以使用获取的样本数据训练舆情分析模型,从而使得舆情分析模型中的多个不同参数得到确定的数值,进而得到训练完成的舆情分析模型。
通过上述处理过程,构建并训练舆情分析模型后,可以通过训练的舆情分析模型对与目标业务相关的待分析的舆情信息进行实时分析处理,具体可以包括以下步骤S306~步骤S310的处理。
在步骤S306中,获取与目标业务相关的待分析的舆情信息。
其中,该舆情信息可以来自于以下中的至少一种:新闻消息、微博消息和论坛消息等。
在实施中,可以设置终端设备或服务器中可以安装的应用程序,该应用程序可以具备舆情信息获取功能,为了能够实现从不同数据源(如微博、博客、论坛或媒体网站)中获取舆情信息,可以在该应用程序中设置相应的程序接口,通过该程序接口可以分别与不同数据源进行连接。此外,该应用程序中还可以设置有多个不同的按键和信息输入框,例如舆情信息获取按键、时间段输入框等。每当需要获取舆情信息时,用户可以点击该应用程序中的舆情信息获取按键,此时,该应用程序可以通过该程序接口,从不同数据源中获取与目标业务相关的舆情信息,或者,用户可以先在时间段输入框中设置舆情信息的时间段范围(如从0点整到当前时刻等),设置完成后,用户可以点击舆情信息获取按键,此时,该应用程序可以通过该程序接口,从不同数据源中查找产生时间位于设置的时间段内的舆情信息,并通过上述程序接口将查找到的舆情信息返回给该应用程序。
考虑到从不同数据源中获取的舆情信息可能较多,而其中的一个或多个舆情并不会对用户或用户的相关信息产生任何影响,或者,不会发展为热点舆情,因此,可以根据当前的实际情况,以及目标业务的相关信息,可以预先设置舆情信息筛选条件。当通过上述处理从不同数据源中获取到舆情信息后,可以使用舆情信息筛选条件对上述舆情信息进行进一步筛选,得到符合舆情信息筛选条件的与目标业务相关的待分析的舆情信息。
在步骤S308中,根据预定的历史舆情处理机制和处理样本信息,确定舆情信息对应的风险类型,并确定用户诉求对应的类型。
其中,预定的历史舆情处理机制可以根据技术人员在处理舆情信息的过程积累的经验确定,还可以由技术人员根据实际情况等选择的处理机制,具体可以根据实际情况确定,本说明书实施例对此不做限定。处理样本信息可以是在处理舆情信息的过程中的舆情信息及其相关信息等。
在实施中,舆情信息对应的风险类型可以包括多种,例如欺诈类、赌博类等,在实际应用中,可以将风险类型划分为多个大类,每个大类中还可以包括多个小类等,为了使得得到的风险类型更准确,可以将风险类型划分的尽可能详细。另外,在实际应用中,可以基于技术人员在处理舆情信息的过程积累的经验和处理舆情信息的过程中的舆情信息(或上述历史舆情样本信息),为舆情信息对应的风险划分为多个不同的风险类型。同时,处理舆情信息的过程中的舆情信息中也会包含有用户诉求,还可以将用户诉求划分为多个不同的类型等。
在步骤S310中,基于上述舆情信息对应的风险类别,以及用户诉求对应的类别,根据预定的舆情分析模型对待分析的舆情信息进行分析,得到待分析的舆情信息中包含的目标业务存在的风险类型和待分析的舆情信息对应的用户诉求。
在实施中,通过上述方式得到舆情分析模型后,可以将上述步骤S306中获取的与目标业务相关的待分析的舆情信息作为输入数据输入到上述舆情分析模型中进行计算,并结合上述舆情信息对应的风险类别,以及用户诉求对应的类别,得到相应的计算结果,即基于上述舆情信息对应的风险类别,以及用户诉求对应的类别,通过舆情分析模型对待分析的舆情信息进行分析,得到舆情信息中包含的目标业务存在的风险类型,同时,还可以提炼舆情信息中包含的目标业务出现的故障信息,以及舆情信息对应的用户诉求的信息等。
通过上述方式得到目标业务存在的风险类型、舆情信息中包含的目标业务出现的故障信息和舆情信息对应的用户诉求后,还可以从全局的角度对目标业务的舆情信息进行管控,具体可以包括以下步骤S312~步骤S316的处理。
在步骤S312中,对舆情信息对应的用户诉求进行聚类,得到舆情信息对应的用户诉求对应的类别。
其中,类别可以包括多种,例如欺诈类或显示异常类等。
在实施中,可以预先设定聚类算法,例如K-Means算法、BIRCH算法或CURE算法等。当通过上述步骤S310的处理,得到舆情信息对应的用户诉求后,可以使用预先设定的聚类算法对舆情信息对应的用户诉求进行聚类计算,得到舆情信息对应的用户诉求对应的类别。例如可以使用K-Means算法对舆情信息对应的用户诉求进行聚类计算,得到舆情信息对应的用户诉求对应的类别等。
在步骤S314中,将舆情信息对应的用户诉求的信息设置到得到的类别对应的群组中。
在实施中,不同类别的信息可以存储在不同的存储区域中,并且可以分析用户诉求的信息所属的不同类别,以便对目标业务进行分析等。
另外,对于上述舆情信息中包含目标业务出现的故障信息的情况,还可以从舆情信息中包含的目标业务出现的故障信息中,获取包括预定关键词的故障信息,预定关键词为预设的重点故障对应的关键词。
其中,预定关键字可以是预先设定的任意关键字,例如重要故障对应的关键字等。
在实施中,可以从舆情信息中包含的目标业务出现的故障信息中,获取所有不同类型的故障信息,并可以从所有不同类型的故障信息中提取重要故障的故障信息等。
基于上述处理过程,即根据历史舆情样本信息的标注,再采用机器学习的方式,提炼历史舆情样本信息提及的主要风险类型、用户遇到的主要问题及用户核心诉求,可实现舆情文本的自动化解读,并可根据特定类目实现安全问题提前发现,目前的舆情管控,主要从文本情绪、文本是否涉及安全负面关键词来筛选安全负面的舆情信息进行人工运营,人工运营成本高,且主要在单点舆情管控,上述处理过程除进行单点舆情管控外,还能实现对舆情风险整体上的把控,此外,上述处理过程除单点舆情管控外,还可支持安全舆情整体管控,了解安全舆情整体情况,及当期重点风险聚类等。
本说明书实施例提供一种舆情信息的识别方法,通过获取与目标业务相关的待分析的舆情信息,进而根据预定的舆情分析模型对待分析的舆情信息进行分析,得到该舆情信息中包含的目标业务存在的风险类型,这样,可以通过将目标业务的相关舆情信息通过舆情分析模型(或通过人工智能的方式),判定其是否存在风险,以及其风险类型,以便后续正对该风险类型进行相应的防控处理,从而不需要通过人工的方式对舆情信息进行分析来判定目标业务存在的风险和风险类型,提高了基于舆情信息的业务风险判断效率,且降低了人力资源成本,而且上述处理便于对舆情批量处理,可以提升舆情管控效率。
实施例三
以上为本说明书实施例提供的舆情信息的识别方法,基于同样的思路,本说明书实施例还提供一种舆情信息的识别装置,如图4所示。
该舆情信息的识别装置包括:信息获取模块401和舆情分析模块402,其中:
信息获取模块401,用于获取与目标业务相关的待分析的舆情信息;
舆情分析模块402,用于根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述舆情信息中包含的所述目标业务存在的风险类型。
本说明书实施例中,所述舆情分析模块402,用于:
根据预定的历史舆情处理机制和处理样本信息,确定舆情信息对应的风险类型,并确定用户诉求对应的类型;
基于所述舆情信息对应的风险类别,以及所述用户诉求对应的类别,根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述待分析的舆情信息中包含的所述目标业务存在的风险类型和所述待分析的舆情信息对应的用户诉求。
本说明书实施例中,所述装置还包括:
历史舆情获取模块,用于获取与所述目标业务相关的历史舆情样本信息,所述历史舆情样本信息中标注有所述目标业务存在的风险类型、所述目标业务出现的故障信息和所述历史舆情样本信息对应的用户诉求信息;
模型构建模块,用于通过预定的机器学习算法和所述历史舆情样本信息,构建并训练所述舆情分析模型。
本说明书实施例中,所述装置还包括:
聚类模块,用于对所述舆情信息对应的用户诉求进行聚类,得到所述舆情信息对应的用户诉求对应的类别;
信息设置模块,用于将所述舆情信息对应的用户诉求的信息设置到得到的类别对应的群组中。
本说明书实施例中,所述装置还包括:
故障信息获取模块,用于从所述舆情信息中包含的所述目标业务出现的故障信息中,获取包括预定关键词的故障信息,所述预定关键词为预设的重点故障对应的关键词。
本说明书实施例中,所述机器学习算法包括朴素贝叶斯算法、决策树算法、支持向量机算法、kNN算法、神经网络算法、深度学习算法和逻辑回归算法中的一种或多种。
本说明书实施例中,所述舆情信息来自于以下中的至少一种:新闻消息、微博消息和论坛消息。
本说明书实施例提供一种舆情信息的识别装置,通过获取与目标业务相关的待分析的舆情信息,进而根据预定的舆情分析模型对待分析的舆情信息进行分析,得到该舆情信息中包含的目标业务存在的风险类型,这样,可以通过将目标业务的相关舆情信息通过舆情分析模型(或通过人工智能的方式),判定其是否存在风险,以及其风险类型,以便后续正对该风险类型进行相应的防控处理,从而不需要通过人工的方式对舆情信息进行分析来判定目标业务存在的风险和风险类型,提高了基于舆情信息的业务风险判断效率,且降低了人力资源成本,而且上述处理便于对舆情批量处理,可以提升舆情管控效率。
实施例四
以上为本说明书实施例提供的舆情信息的识别装置,基于同样的思路,本说明书实施例还提供一种舆情信息的识别设备,如图5所示。
所述舆情信息的识别设备可以为上述实施例提供的服务器。
舆情信息的识别设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器501和存储器502,存储器502中可以存储有一个或一个以上存储应用程序或数据。其中,存储器502可以是短暂存储或持久存储。存储在存储器502的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对舆情信息的识别设备中的一系列计算机可执行指令。更进一步地,处理器501可以设置为与存储器502通信,在舆情信息的识别设备上执行存储器502中的一系列计算机可执行指令。舆情信息的识别设备还可以包括一个或一个以上电源503,一个或一个以上有线或无线网络接口504,一个或一个以上输入输出接口505,一个或一个以上键盘506。
具体在本实施例中,舆情信息的识别设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对舆情信息的识别设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取与目标业务相关的待分析的舆情信息;
根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述舆情信息中包含的所述目标业务存在的风险类型。
本说明书实施例中,所述根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述舆情信息中包含的所述目标业务存在的风险类型,包括:
根据预定的历史舆情处理机制和处理样本信息,确定舆情信息对应的风险类型,并确定用户诉求对应的类型;
基于所述舆情信息对应的风险类别,以及所述用户诉求对应的类别,根据预定的舆情分析模型对所述待分析的舆情信息进行分析,得到所述待分析的舆情信息中包含的所述目标业务存在的风险类型和所述待分析的舆情信息对应的用户诉求。
本说明书实施例中,还包括:
获取与所述目标业务相关的历史舆情样本信息,所述历史舆情样本信息中标注有所述目标业务存在的风险类型、所述目标业务出现的故障信息和所述历史舆情样本信息对应的用户诉求信息;
通过预定的机器学习算法和所述历史舆情样本信息,构建并训练所述舆情分析模型。
本说明书实施例中,还包括:
对所述舆情信息对应的用户诉求进行聚类,得到所述舆情信息对应的用户诉求对应的类别;
将所述舆情信息对应的用户诉求的信息设置到得到的类别对应的群组中。
本说明书实施例中,还包括:
从所述舆情信息中包含的所述目标业务出现的故障信息中,获取包括预定关键词的故障信息,所述预定关键词为预设的重点故障对应的关键词。
本说明书实施例中,所述机器学习算法包括朴素贝叶斯算法、决策树算法、支持向量机算法、kNN算法、神经网络算法、深度学习算法和逻辑回归算法中的一种或多种。
本说明书实施例中,所述舆情信息来自于以下中的至少一种:新闻消息、微博消息和论坛消息。
本说明书实施例提供一种舆情信息的识别设备,通过获取与目标业务相关的待分析的舆情信息,进而根据预定的舆情分析模型对待分析的舆情信息进行分析,得到该舆情信息中包含的目标业务存在的风险类型,这样,可以通过将目标业务的相关舆情信息通过舆情分析模型(或通过人工智能的方式),判定其是否存在风险,以及其风险类型,以便后续正对该风险类型进行相应的防控处理,从而不需要通过人工的方式对舆情信息进行分析来判定目标业务存在的风险和风险类型,提高了基于舆情信息的业务风险判断效率,且降低了人力资源成本,而且上述处理便于对舆情批量处理,可以提升舆情管控效率。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、***、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。