CN104951434A - 品牌情绪的确定方法和装置 - Google Patents

品牌情绪的确定方法和装置 Download PDF

Info

Publication number
CN104951434A
CN104951434A CN201510406454.3A CN201510406454A CN104951434A CN 104951434 A CN104951434 A CN 104951434A CN 201510406454 A CN201510406454 A CN 201510406454A CN 104951434 A CN104951434 A CN 104951434A
Authority
CN
China
Prior art keywords
brand
mood
message
emotion
brand message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510406454.3A
Other languages
English (en)
Other versions
CN104951434B (zh
Inventor
齐中祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hi Tech (beijing) Ltd By Share Ltd
Original Assignee
Hi Tech (beijing) Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hi Tech (beijing) Ltd By Share Ltd filed Critical Hi Tech (beijing) Ltd By Share Ltd
Priority to CN201510406454.3A priority Critical patent/CN104951434B/zh
Publication of CN104951434A publication Critical patent/CN104951434A/zh
Application granted granted Critical
Publication of CN104951434B publication Critical patent/CN104951434B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种品牌情绪的确定方法和装置。其中,该方法包括:获取目标品牌的关键词;获取与关键词关联的品牌信息,品牌信息为用户发布的品牌信息;利用预先建立的分类模型确定品牌信息对应的品牌情绪,其中,品牌情绪为用户对于目标品牌的情绪,分类模型为根据预设的品牌情绪类型训练得到的训练集,预设的品牌情绪类型包括第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪;根据第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪中每一种情绪对应的品牌信息的条数和品牌信息所赋予的权重分别计算每一种情绪的量化值。本发明解决了无法得知消费者对于品牌的倾向性情绪的技术问题。

Description

品牌情绪的确定方法和装置
技术领域
本发明涉及品牌信息处理领域,具体而言,涉及一种品牌情绪的确定方法和装置。
背景技术
目前,消费者在购买产品或者服务时,产品或者服务的品牌是影响其购买的一项重要因素。因此,分析消费者对于品牌的情绪可以准确把握该品牌所处的状态。然而,目前还没有分析消费者对于品牌的情绪的方案,因此,无法得知消费者对于品牌的倾向性情绪。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种品牌情绪的确定方法和装置,以至少解决无法得知消费者对于品牌的倾向性情的技术问题。
根据本发明实施例的一个方面,提供了一种品牌情绪的确定方法,包括:获取目标品牌的关键词;获取与所述关键词关联的品牌信息,所述品牌信息为用户发布的品牌信息;利用预先建立的分类模型确定所述品牌信息对应的品牌情绪,其中,所述品牌情绪为所述用户对于所述目标品牌的情绪,所述分类模型为根据预设的品牌情绪类型训练得到的训练集,所述预设的品牌情绪类型包括第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪;根据所述第一情绪、所述第二情绪、所述第三情绪、所述第四情绪、所述第五情绪和所述第六情绪中每一种情绪对应的品牌信息的条数和所述品牌信息所赋予的权重分别计算每一种情绪的量化值,所述量化值用于表示与其相应的情绪表现的程度。
进一步地,在利用预先建立的分类模型确定所述品牌信息对应的品牌情绪之前,所述方法还包括:获取用于建立所述分类模型的品牌信息;提取所述用于建立所述分类模型的品牌信息中用于表达情感的关键词;按照所述预设的品牌情绪类型对所述用于表达情感的关键词进行训练,得到所述分类模型。
进一步地,在获取用于建立所述分类模型的品牌信息之后,以及提取所述用于建立所述分类模型的品牌信息中的用于表达情感的关键词之前,所述方法还包括:判断所述品牌信息是否为可识别的文本信息;如果判断出所述品牌信息不是可识别的文本信息,则将所述品牌信息转化为所述可识别的文本信息,对转化后的所述可识别的文本信息进行分词;如果判断出所述品牌信息是可识别的文本信息,则直接对所述品牌信息进行分词。
进一步地,如果判断出所述品牌信息不是可识别的文本信息,则将所述品牌信息转化为所述可识别的文本信息包括:如果所述品牌信息为音频信息,则利用语音识别将所述音频信息转化为所述可识别的文本信息;如果所述品牌信息为视频信息,则从所述视频信息中提取音频信息,利用语音识别将提取的音频信息转化为所述可识别的文本信息。
进一步地,在利用预先建立的分类模型确定所述品牌信息对应的品牌情绪之后,所述方法还包括:获取所述品牌信息发布时的位置信息;基于所述位置信息确定所述品牌信息所在的地区;根据所述品牌信息对应的品牌情绪确定各地区的品牌情绪。
进一步地,所述第一情绪为满意,所述第二情绪为失望,所述第三情绪为回避,所述第四情绪为愤怒,所述第五情绪为反感,所述第六情绪为知晓。
根据本发明实施例的另一方面,还提供了一种品牌情绪的确定装置,包括:第一获取单元,用于获取目标品牌的关键词;第二获取单元,用于获取与所述关键词关联的品牌信息,所述品牌信息为用户发布的品牌信息;第一确定单元,用于利用预先建立的分类模型确定所述品牌信息对应的品牌情绪,其中,所述品牌情绪为所述用户对于所述目标品牌的情绪,所述分类模型为根据预设的品牌情绪类型训练得到的训练集,所述预设的品牌情绪类型包括第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪;计算单元,用于根据所述第一情绪、所述第二情绪、所述第三情绪、所述第四情绪、所述第五情绪和所述第六情绪中每一种情绪对应的品牌信息的条数和所述品牌信息所赋予的权重分别计算每一种情绪的量化值,所述量化值用于表示与其相应的情绪表现的程度。
进一步地,所述装置还包括:第三获取单元,用于在利用预先建立的分类模型确定所述品牌信息对应的品牌情绪之前,获取用于建立所述分类模型的品牌信息;提取单元,用于提取所述用于建立所述分类模型的品牌信息中用于表达情感的关键词;训练单元,用于按照所述预设的品牌情绪类型对所述用于表达情感的关键词进行训练,得到所述分类模型。
进一步地,所述装置还包括:判断单元,用于在获取用于建立所述分类模型的品牌信息之后,以及提取所述用于建立所述分类模型的品牌信息中的用于表达情感的关键词之前,判断所述品牌信息是否为可识别的文本信息;分词单元,用于如果判断出所述品牌信息不是可识别的文本信息,则将所述品牌信息转化为所述可识别的文本信息,对转化后的所述可识别的文本信息进行分词;如果判断出所述品牌信息是可识别的文本信息,则直接对所述品牌信息进行分词。
进一步地,所述分词单元包括:第一转化模块,用于如果所述品牌信息为音频信息,则利用语音识别将所述音频信息转化为所述可识别的文本信息;第二转化模块,用于如果所述品牌信息为视频信息,则从所述视频信息中提取音频信息,利用语音识别将提取的音频信息转化为所述可识别的文本信息。
进一步地,所述装置还包括:第四获取单元,用于在利用预先建立的分类模型确定所述品牌信息对应的品牌情绪之后,获取所述品牌信息发布时的位置信息;第二确定单元,用于基于所述位置信息确定所述品牌信息所在的地区;第三确定单元,用于根据所述品牌信息对应的品牌情绪确定各地区的品牌情绪。
在本发明实施例中,通过获取目标品牌的关键词,获取与该关键词关联的品牌信息,利用预先建立的分类模型确定品牌信息对应的品牌情绪,根据第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪中每一种情绪对应的品牌信息的条数和品牌信息所赋予的权重分别计算每一种情绪的量化值,从而解决了无法得知消费者对于品牌的倾向性情绪的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的品牌情绪的确定方法的流程图;
图2是根据本发明实施例的品牌情绪的确定装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种品牌情绪的确定方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的品牌情绪的确定方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取目标品牌的关键词。
步骤S104,获取与关键词关联的品牌信息。品牌信息为用户发布的品牌信息。
步骤S106,利用预先建立的分类模型确定品牌信息对应的品牌情绪,其中,品牌情绪为用户对于目标品牌的情绪,分类模型为根据预设的品牌情绪类型训练得到的训练集,预设的品牌情绪类型包括第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪。
步骤S108,根据第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪中每一种情绪对应的品牌信息的条数和品牌信息所赋予的权重分别计算每一种情绪的量化值。量化值用于表示与其相应的情绪表现的程度。
以每种情绪的品牌信息的条数和品牌信息所赋予的权重为基础,来计算相应情绪对所有情绪的量化值。其中,量化值可以表示与其对应情绪的表现的程度,该值越大,其对应的情绪越强烈;品牌信息所赋予的权重则表示品牌信息对品牌情绪的量化值的影响力,如果品牌信息的权重越大,该品牌信息对其相应的品牌情绪的影响越大。
本发明实施例中,按照预先设定的品牌情绪类型(包括第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪)进行训练,得到训练模型,通过该训练模型可以识别用户发布的品牌信息中所包含的品牌情绪,也即是品牌信息对应的品牌情绪,从而确定用户的情绪是第一情绪,或者第二情绪,或者第三情绪,或者第四情绪,或者第五情绪,或者第六情绪。
通过获取目标品牌的关键词,获取与该关键词关联的品牌信息,利用预先建立的分类模型确定品牌信息对应的品牌情绪,根据第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪中每一种情绪对应的品牌信息的条数和赋予的权重分别计算每一种情绪的量化值,从而解决了无法得知消费者对于品牌的倾向性情的问题。进一步地,由于经过训练得到的分类模型可以识别出品牌信息中所包含的品牌情绪包括多种,识别出的品牌情绪更加多样化,从而准确地反映出用户对目标品牌的品牌情绪。对各类型的情绪数量进行统计计算,可以得到网络上对目标品牌的情绪的倾向性。
优选地,上述第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪可以依次为满意、失望、回避、愤怒、反感和知晓。上述六种情绪依次对应有经过量化得到的量化值:满意度、失望度、回避度、愤怒度、反感度和知晓度,依次用于表示上述六种情绪的表现程度。
优选地,可以根据每条信息的来源确定其权值,再使用计算模型来计算得到每种情绪的量化值。其中,不同来源的信息计算时,由于其权重不同,相应的权值不同,例如,来自网络媒体的信息的权重会比来自个人的信息的权重要高,不同来源的权值可以在训练过程中确定,从而可以在计算时由训练模型来确定每一条信息的权值。
例如,对于指定时间段内的,某个品牌相关的品牌信息,先用分类模型对其做情绪分析,确定每条信息对应的品牌情绪,然后按照如下公式计算得到各情绪的量化值:
Z=a0*b0+a1*b1+a2*b2+a2*b2+a3*b3……
其中,Z表示量化值,a0、a1、a2、a3等表示相应来源的品牌信息条数,b0、b1、b2、b3等表示不同来源的权值。
以“满意”的情绪为例,可以先按信息来源进行统计。比如:官方媒体100条,微博大V 200条,普通网民300条。再从分类模型里,读出每种来源的权重数据。比如:官方媒体0.8,微博大V 0.5,普通网民0.2。然后,对于上述的信息,进行加权汇总。“满意”情绪的量化值为:100*0.8+200*0.5+300*0.2=240。其他的情绪可以采用上述相同的方式,计算得到量化值。最终得到的是在指定时间段内,对该品牌的各种情绪量化值,比如:满意240,失望200,回避100,愤怒50,反感300,知晓400。
需要说明的是,本发明实施例中的情绪还可以包括第七情绪和/或第八情绪等。另外,再计算每一种情绪的量化值时,也可以认为所有品牌信息的权值都为1,那么每一种情绪的量化值可以是该情绪对应的品牌信息的条数。上述示例仅仅是为了描述本发明实施例的技术原理,并不对本发明有不当限定。
优选地,本发明实施例中,还可以结合地区、性别、认证身份等指标计算得到相应的量化值,这样,可以通过这些指标来对品牌情绪进行分析。
优选地,本发明实施例中的品牌信息可以是用户在网络上发布的博客、微博、朋友圈消息、应用社区消息(如QQ空间)、论坛上的帖子、评论等等。品牌信息可以通过网络爬虫、自动脚本、手工输入等方式获取。品牌信息的具体形式可以是文本信息,也可以是音频信息,还可以是视频信息等。
优选地,在利用预先建立的分类模型确定品牌信息对应的品牌情绪之前,方法还包括:获取用于建立分类模型的品牌信息;提取用于建立分类模型的品牌信息中用于表达情感的关键词;按照预设的品牌情绪类型对用于表达情感的关键词进行训练,得到分类模型。
用于建立分类模型的品牌信息可以通过网络爬虫、自动脚本、手工输入等方式获取,由于该品牌信息用于建立分类模型,因此,获取的该品牌信息的数据量相对较大,以便于训练出识别准确性较高的分类模型。
在获取到大量的品牌信息之后,从该品牌信息中提取用于表达情感的关键词,或者关键信息,例如“这牌子真好”,“这是什么牌子”,“好贵啊”等等,然后按照预设的网路情绪分类(包括满意、失望、回避、愤怒、反感和知晓)对关键词进行训练,得到上述分类模型。在得到分类模型之后,可以利用该分类模型对新输入的品牌信息进行情绪识别或者分类。
优选地,在获取用于建立分类模型的品牌信息之后,以及提取用于建立分类模型的品牌信息中的用于表达情感的关键词之前,方法还包括:判断品牌信息是否为可识别的文本信息;如果判断出品牌信息不是可识别的文本信息,则将品牌信息转化为可识别的文本信息,对转化后的可识别的文本信息进行分词;如果判断出品牌信息是可识别的文本信息,则直接对品牌信息进行分词。
本实施例中,由于获取到的品牌信息可以是多种形式的信息(包括文本信息、音频信息、视频信息),而通常关键词的提取是从可识别的文本信息中提取,因此,在获取到用于建立分类模型的品牌信息之后,以及提取用于建立分类模型的品牌信息中的用于表达情感的关键词之前,可以先判断获取到的品牌信息是否为可识别的文本信息,如果是,则可以直接对该品牌信息进行分词,以便于从中提取关键词;如果否,则将该品牌信息转化为可识别的文本信息,再进行分词,以便于从转化后的文本信息中提取关键词。
需要说明的是,本发明实施例中,在得到分类模型之后,对新输入的品牌信息进行分类或者识别时,也可以先判断该品牌信息是否为可识别的文本信息,以便于快速确定品牌信息对应的品牌情绪。
进一步地,如果判断出品牌信息不是可识别的文本信息,则将品牌信息转化为可识别的文本信息包括:如果品牌信息为音频信息,则利用语音识别将音频信息转化为可识别的文本信息;如果品牌信息为视频信息,则从视频信息中提取音频信息,利用语音识别将提取的音频信息转化为可识别的文本信息。
本实施例中,对于音频信息,可以识别语音识别技术,将语音信息转化为文本信息再从文本信息中提取关键词;对于视频信息,则可以先提取出该视频信息中的音频信息,再采用针对音频信息的转化方式进行处理。
需要说明的是,本发明实施例中,各种品牌信息可以是采用各种语言的信息,例如,中文、英文、日文等等,对于不同的语言,可以转化为相同的可识别的文本信息。
优选地,在利用预先建立的分类模型确定品牌信息对应的品牌情绪之后,方法还包括:获取品牌信息发布时的位置信息;基于位置信息确定品牌信息所在的地区;根据品牌信息对应的品牌情绪确定各地区的品牌情绪。
由于用户发布的品牌信息中通常都会携带有其所在的位置信息,获取该位置信息,并确定其所在的地区,该地区可以是以省、市等为单位划分的行政区域,然后根据确定出的品牌信息对应的品牌情绪来确定各地区的品牌情绪。优选地,如果在某个地区的品牌情绪包括上述品牌情绪(包括满意、失望、回避、愤怒、反感和知晓)中的多种,可以将所占比重最大的情绪作为该地区的品牌情绪。
例如,对于某一品牌,全国各地区的人们会存在不同的情绪,将每个地区的主导情绪作为该地区的情绪,从而可以确定出各地区对该品牌的倾向性情绪。
本发明实施例中,对于与关键词关联的品牌信息,可以利用品牌信息与目标品牌的关联度来确定,具体可以计算品牌信息与目标品牌的关键词的关联度,其关联度超过预设阈值,则确定该品牌信息为与关键词关联的品牌信息。
本发明实施例还提供了一种品牌情绪的确定装置,该装置可以用于执行本发明实施例的品牌情绪的确定方法。如图2所示,该品牌情绪的确定装置包括:第一获取单元10和第一确定单元20、第一确定单元30和计算单元40。
第一获取单元10用于获取目标品牌的关键词。
第二获取单元20用于获取与关键词关联的品牌信息。品牌信息为用户发布的品牌信息。
第一确定单元30用于利用预先建立的分类模型确定品牌信息对应的品牌情绪,其中,品牌情绪为用户对于目标品牌的情绪,分类模型为根据预设的品牌情绪类型训练得到的训练集,预设的品牌情绪类型包括第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪。
计算单元40用于根据第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪中每一种情绪对应的品牌信息的条数和品牌信息所赋予的权重分别计算每一种情绪的量化值。量化值用于表示与其相应的情绪表现的程度。
以每种情绪的品牌信息的条数和品牌信息所赋予的权重为基础,来计算相应的品牌情绪对所有情绪的量化值。其中,量化值可以表示与其对应的品牌情绪的表现的程度,该值越大,其对应的品牌情绪越强烈;品牌信息所赋予的权重则表示品牌信息对品牌情绪的量化值的影响力,如果品牌信息的权重越大,该品牌信息对其相应的品牌情绪的影响越大。
本发明实施例中,按照预先设定的品牌情绪类型(包括第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪)进行训练,得到训练模型,通过该训练模型可以识别用户发布的品牌信息中所包含的品牌情绪,也即是品牌信息对应的品牌情绪,从而确定用户的情绪是第一情绪,或者第二情绪,或者第三情绪,或者第四情绪,或者第五情绪。
通过获取目标品牌的关键词,获取与该关键词关联的品牌信息,利用预先建立的分类模型确定品牌信息对应的品牌情绪,根据第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪中每一种情绪对应的品牌信息的条数和赋予的权重分别计算每一种情绪的量化值,从而解决了无法得知消费者对于品牌的倾向性情绪。进一步地,由于经过训练得到的分类模型可以识别出品牌信息中所包含的品牌情绪包括多种,识别出的品牌情绪更加多样化,从而准确地反映出用户对目标品牌的品牌情绪的问题。对各类型的情绪数量进行统计计算,可以得到网络上对目标品牌的情绪的倾向性。
优选地,上述第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪可以依次为满意、失望、回避、愤怒、反感和知晓。
优选地,可以根据每条品牌信息的来源确定其权值,再使用计算模型来计算得到每种情绪的量化值。其中,不同来源的品牌信息计算时,由于其权重不同,相应的权值不同,例如,来自网络媒体的品牌信息的权重会比来自个人的品牌信息的权重要高,不同来源的权值可以在训练过程中确定,从而可以在计算时由训练模型来确定每一条品牌信息的权值。
例如,对于指定时间段内的,某个品牌相关的品牌信息,先用分类模型对其做情绪分析,确定每条信息对应的品牌情绪,然后按照如下公式计算得到各情绪的量化值:
Z=a0*b0+a1*b1+a2*b2+a2*b2+a3*b3……
其中,Z表示量化值,a0、a1、a2、a3等表示相应来源的品牌信息条数,b0、b1、b2、b3等表示不同来源的权值。
以“满意”的情绪为例,可以先按信息来源进行统计。比如:官方媒体100条,微博大V 200条,普通网民300条。再从分类模型里,读出每种来源的权重数据。比如:官方媒体0.8,微博大V 0.5,普通网民0.2。然后,对于上述的信息,进行加权汇总。“满意”情绪的量化值为:100*0.8+200*0.5+300*0.2=240。其他的情绪可以采用上述相同的方式,计算得到量化值。最终得到的是在指定时间段内,对该品牌的各种情绪量化值,比如:满意240,失望200,回避100,愤怒50,反感300,知晓400。
需要说明的是,本发明实施例中的情绪还可以包括第七情绪和/或第八情绪等。另外,再计算每一种情绪的量化值时,也可以认为所有品牌信息的权值都为1,那么每一种情绪的量化值可以是该情绪对应的品牌信息的条数。上述示例仅仅是为了描述本发明实施例的技术原理,并不对本发明有不当限定。
优选地,本发明实施例中,还可以结合地区、性别、认证身份等指标计算得到相应的量化值,这样,可以通过这些指标来对品牌情绪进行分析。
优选地,本发明实施例中的品牌信息可以是用户在网络上发布的博客、微博、朋友圈消息、应用社区消息(如QQ空间)、论坛上的帖子、评论等等。品牌信息可以通过网络爬虫、自动脚本、手工输入等方式获取。品牌信息的具体形式可以是文本信息,也可以是音频信息,还可以是视频信息等。
本发明实施例中,用户发布的品牌信息可以是针对用户当前时刻的情绪的,也可以是针对某个事件、某个事物的情绪。因此,本发明实施例的方案可以用于网络中对目标品牌或者事物的品牌情绪,具体可以获取与目标品牌或者事物相关的品牌信息,利用分类模型对获取到的品牌信息进行识别,确定出该品牌信息对应的品牌情绪,从而可以统计出网络用户对目标品牌或者事物的各种不同的情绪。
优选地,装置还包括:第三获取单元,用于在利用预先建立的分类模型确定品牌信息对应的品牌情绪之前,获取用于建立分类模型的品牌信息;提取单元,用于提取用于建立分类模型的品牌信息中用于表达情感的关键词;训练单元,用于按照预设的品牌情绪类型对用于表达情感的关键词进行训练,得到分类模型。
用于建立分类模型的品牌信息可以通过网络爬虫、自动脚本、手工输入等方式获取,由于该品牌信息用于建立分类模型,因此,获取的该品牌信息的数据量相对较大,以便于训练出识别准确性较高的分类模型。
在获取到大量的品牌信息之后,从该品牌信息中提取用于表达情感的关键词,或者关键信息,例如“这牌子真好”,“这是什么牌子”,“好贵啊”等等,然后按照预设的网路情绪分类(包括满意、失望、回避、愤怒、反感和知晓)对关键词进行训练,得到上述分类模型。在得到分类模型之后,可以利用该分类模型对新输入的品牌信息进行情绪识别或者分类。
优选地,装置还包括:判断单元,用于在获取用于建立分类模型的品牌信息之后,以及提取用于建立分类模型的品牌信息中的用于表达情感的关键词之前,判断品牌信息是否为可识别的文本信息;分词单元,用于如果判断出品牌信息不是可识别的文本信息,则将品牌信息转化为可识别的文本信息,对转化后的可识别的文本信息进行分词;如果判断出品牌信息是可识别的文本信息,则直接对品牌信息进行分词。
本实施例中,由于获取到的品牌信息可以是多种形式的信息(包括文本信息、音频信息、视频信息),而通常关键词的提取是从可识别的文本信息中提取,因此,在获取到用于建立分类模型的品牌信息之后,以及提取用于建立分类模型的品牌信息中的用于表达情感的关键词之前,可以先判断获取到的品牌信息是否为可识别的文本信息,如果是,则可以直接对该品牌信息进行分词,以便于从中提取关键词;如果否,则将该品牌信息转化为可识别的文本信息,再进行分词,以便于从转化后的文本信息中提取关键词。
需要说明的是,本发明实施例中,在得到分类模型之后,对新输入的品牌信息进行分类或者识别时,也可以先判断该品牌信息是否为可识别的文本信息,以便于快速确定品牌信息对应的品牌情绪。
优选地,分词单元包括:第一转化模块,用于如果品牌信息为音频信息,则利用语音识别将音频信息转化为可识别的文本信息;第二转化模块,用于如果品牌信息为视频信息,则从视频信息中提取音频信息,利用语音识别将提取的音频信息转化为可识别的文本信息。
本实施例中,对于音频信息,可以识别语音识别技术,将语音信息转化为文本信息再从文本信息中提取关键词;对于视频信息,则可以先提取出该视频信息中的音频信息,再采用针对音频信息的转化方式进行处理。
需要说明的是,本发明实施例中,各种品牌信息可以是采用各种语言的信息,例如,中文、英文、日文等等,对于不同的语言,可以转化为相同的可识别的文本信息。
优选地,装置还包括:第四获取单元,用于在利用预先建立的分类模型确定品牌信息对应的品牌情绪之后,获取品牌信息发布时的位置信息;第二确定单元,用于基于位置信息确定品牌信息所在的地区;第三确定单元,用于根据品牌信息对应的品牌情绪确定各地区的品牌情绪。
由于用户发布的品牌信息中通常都会携带有其所在的位置信息,获取该位置信息,并确定其所在的地区,该地区可以是以省、市等为单位划分的行政区域,然后根据确定出的品牌信息对应的品牌情绪来确定各地区的品牌情绪。优选地,如果在某个地区的品牌情绪包括上述品牌情绪(包括满意、失望、回避、愤怒、反感和知晓)中的多种,可以将所占比重最大的情绪作为该地区的品牌情绪。
例如,对于某一品牌,全国各地区的人们会存在不同的情绪,将每个地区的主导情绪作为该地区的情绪,从而可以确定出各地区对该品牌的倾向性情绪。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种品牌情绪的确定方法,其特征在于,包括:
获取目标品牌的关键词;
获取与所述关键词关联的品牌信息,所述品牌信息为用户发布的品牌信息;
利用预先建立的分类模型确定所述品牌信息对应的品牌情绪,其中,所述品牌情绪为所述用户对于所述目标品牌的情绪,所述分类模型为根据预设的品牌情绪类型训练得到的训练集,所述预设的品牌情绪类型包括第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪;
根据所述第一情绪、所述第二情绪、所述第三情绪、所述第四情绪、所述第五情绪和所述第六情绪中每一种情绪对应的品牌信息的条数和所述品牌信息所赋予的权重分别计算每一种情绪的量化值,所述量化值用于表示与其相应的情绪表现的程度。
2.根据权利要求1所述的方法,其特征在于,在利用预先建立的分类模型确定所述品牌信息对应的品牌情绪之前,所述方法还包括:
获取用于建立所述分类模型的品牌信息;
提取所述用于建立所述分类模型的品牌信息中用于表达情感的关键词;
按照所述预设的品牌情绪类型对所述用于表达情感的关键词进行训练,得到所述分类模型。
3.根据权利要求2所述的方法,其特征在于,在获取用于建立所述分类模型的品牌信息之后,以及提取所述用于建立所述分类模型的品牌信息中的用于表达情感的关键词之前,所述方法还包括:
判断所述品牌信息是否为可识别的文本信息;
如果判断出所述品牌信息不是可识别的文本信息,则将所述品牌信息转化为所述可识别的文本信息,对转化后的所述可识别的文本信息进行分词;
如果判断出所述品牌信息是可识别的文本信息,则直接对所述品牌信息进行分词。
4.根据权利要求3所述的方法,其特征在于,如果判断出所述品牌信息不是可识别的文本信息,则将所述品牌信息转化为所述可识别的文本信息包括:
如果所述品牌信息为音频信息,则利用语音识别将所述音频信息转化为所述可识别的文本信息;
如果所述品牌信息为视频信息,则从所述视频信息中提取音频信息,利用语音识别将提取的音频信息转化为所述可识别的文本信息。
5.根据权利要求1所述的方法,其特征在于,在利用预先建立的分类模型确定所述品牌信息对应的品牌情绪之后,所述方法还包括:
获取所述品牌信息发布时的位置信息;
基于所述位置信息确定所述品牌信息所在的地区;
根据所述品牌信息对应的品牌情绪确定各地区的品牌情绪。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述第一情绪为满意,所述第二情绪为失望,所述第三情绪为回避,所述第四情绪为愤怒,所述第五情绪为反感,所述第六情绪为知晓。
7.一种品牌情绪的确定装置,其特征在于,包括:
第一获取单元,用于获取目标品牌的关键词;
第二获取单元,用于获取与所述关键词关联的品牌信息,所述品牌信息为用户发布的品牌信息;
第一确定单元,用于利用预先建立的分类模型确定所述品牌信息对应的品牌情绪,其中,所述品牌情绪为所述用户对于所述目标品牌的情绪,所述分类模型为根据预设的品牌情绪类型训练得到的训练集,所述预设的品牌情绪类型包括第一情绪、第二情绪、第三情绪、第四情绪、第五情绪和第六情绪;
计算单元,用于根据所述第一情绪、所述第二情绪、所述第三情绪、所述第四情绪、所述第五情绪和所述第六情绪中每一种情绪对应的品牌信息的条数和所述品牌信息所赋予的权重分别计算每一种情绪的量化值,所述量化值用于表示与其相应的情绪表现的程度。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第三获取单元,用于在利用预先建立的分类模型确定所述品牌信息对应的品牌情绪之前,获取用于建立所述分类模型的品牌信息;
提取单元,用于提取所述用于建立所述分类模型的品牌信息中用于表达情感的关键词;
训练单元,用于按照所述预设的品牌情绪类型对所述用于表达情感的关键词进行训练,得到所述分类模型。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
判断单元,用于在获取用于建立所述分类模型的品牌信息之后,以及提取所述用于建立所述分类模型的品牌信息中的用于表达情感的关键词之前,判断所述品牌信息是否为可识别的文本信息;
分词单元,用于如果判断出所述品牌信息不是可识别的文本信息,则将所述品牌信息转化为所述可识别的文本信息,对转化后的所述可识别的文本信息进行分词;如果判断出所述品牌信息是可识别的文本信息,则直接对所述品牌信息进行分词。
10.根据权利要求9所述的装置,其特征在于,所述分词单元包括:
第一转化模块,用于如果所述品牌信息为音频信息,则利用语音识别将所述音频信息转化为所述可识别的文本信息;
第二转化模块,用于如果所述品牌信息为视频信息,则从所述视频信息中提取音频信息,利用语音识别将提取的音频信息转化为所述可识别的文本信息。
11.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第四获取单元,用于在利用预先建立的分类模型确定所述品牌信息对应的品牌情绪之后,获取所述品牌信息发布时的位置信息;
第二确定单元,用于基于所述位置信息确定所述品牌信息所在的地区;
第三确定单元,用于根据所述品牌信息对应的品牌情绪确定各地区的品牌情绪。
CN201510406454.3A 2015-07-10 2015-07-10 品牌情绪的确定方法和装置 Active CN104951434B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510406454.3A CN104951434B (zh) 2015-07-10 2015-07-10 品牌情绪的确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510406454.3A CN104951434B (zh) 2015-07-10 2015-07-10 品牌情绪的确定方法和装置

Publications (2)

Publication Number Publication Date
CN104951434A true CN104951434A (zh) 2015-09-30
CN104951434B CN104951434B (zh) 2018-10-23

Family

ID=54166097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510406454.3A Active CN104951434B (zh) 2015-07-10 2015-07-10 品牌情绪的确定方法和装置

Country Status (1)

Country Link
CN (1) CN104951434B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294779A (zh) * 2016-08-12 2017-01-04 杭州来二去广告有限公司 一种个人品牌标签生成方法及***
CN109118626A (zh) * 2018-08-08 2019-01-01 腾讯科技(深圳)有限公司 锁具的控制方法、装置、存储介质及电子装置
CN109359246A (zh) * 2018-12-07 2019-02-19 上海宏原信息科技有限公司 一种基于论坛用户言论的品牌亲密度计算方法
CN109697472A (zh) * 2018-12-28 2019-04-30 杭州翼兔网络科技有限公司 一种子情绪划归方法
CN110458615A (zh) * 2019-07-31 2019-11-15 沃民高新科技(北京)股份有限公司 通过互联网信息测评客户满意度的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763401A (zh) * 2009-12-30 2010-06-30 暨南大学 一种网络舆情的热点预测和分析方法
CN104750674A (zh) * 2015-02-17 2015-07-01 北京京东尚科信息技术有限公司 一种人机会话满意度预测方法及***
CN104765733A (zh) * 2014-01-02 2015-07-08 华为技术有限公司 一种社交网络事件分析的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763401A (zh) * 2009-12-30 2010-06-30 暨南大学 一种网络舆情的热点预测和分析方法
CN104765733A (zh) * 2014-01-02 2015-07-08 华为技术有限公司 一种社交网络事件分析的方法和装置
CN104750674A (zh) * 2015-02-17 2015-07-01 北京京东尚科信息技术有限公司 一种人机会话满意度预测方法及***

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
孙莹: "基于Web文本挖掘的企业口碑情感分类模型研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
崔志刚: "基于电商网站商品评论数据的用户情感分析", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
林政等: "基于情感关键句抽取的情感分类研究", 《计算机研究与发展》 *
王铁套: "突发事件网络舆情分析与威胁估计方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294779A (zh) * 2016-08-12 2017-01-04 杭州来二去广告有限公司 一种个人品牌标签生成方法及***
CN106294779B (zh) * 2016-08-12 2020-03-17 杭州一来二去广告有限公司 一种个人品牌标签生成方法及***
CN109118626A (zh) * 2018-08-08 2019-01-01 腾讯科技(深圳)有限公司 锁具的控制方法、装置、存储介质及电子装置
CN109359246A (zh) * 2018-12-07 2019-02-19 上海宏原信息科技有限公司 一种基于论坛用户言论的品牌亲密度计算方法
CN109697472A (zh) * 2018-12-28 2019-04-30 杭州翼兔网络科技有限公司 一种子情绪划归方法
CN109697472B (zh) * 2018-12-28 2021-05-04 泰州市津达电子科技有限公司 一种子情绪划归方法
CN110458615A (zh) * 2019-07-31 2019-11-15 沃民高新科技(北京)股份有限公司 通过互联网信息测评客户满意度的方法及装置

Also Published As

Publication number Publication date
CN104951434B (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
CN105095415A (zh) 网络情绪的确定方法和装置
CN106815192B (zh) 模型训练方法及装置和语句情感识别方法及装置
CN112346567B (zh) 基于ai的虚拟交互模型生成方法、装置及计算机设备
CN110168535B (zh) 一种信息处理方法及终端、计算机存储介质
CN104951807A (zh) 股市情绪的确定方法和装置
CN104951434A (zh) 品牌情绪的确定方法和装置
CN110472154B (zh) 一种资源推送方法、装置、电子设备及可读存储介质
CN105023165A (zh) 社交网络平台中投放任务的控制方法、装置及***
CN110598070B (zh) 应用类型识别方法及装置、服务器及存储介质
CN105893406A (zh) 群体用户画像方法及***
CN108021660B (zh) 一种基于迁移学习的话题自适应的微博情感分析方法
CN107193974B (zh) 基于人工智能的地域性信息确定方法和装置
CN108959329B (zh) 一种文本分类方法、装置、介质及设备
CN108319888B (zh) 视频类型的识别方法及装置、计算机终端
CN111309910A (zh) 文本信息挖掘方法及装置
CN105302911A (zh) 一种数据筛选引擎建立方法及数据筛选引擎
CN108845986A (zh) 一种情感分析方法、设备及***、计算机可读存储介质
CN108335165B (zh) 兴趣标签确定方法和装置
CN112116910A (zh) 语音指令的识别方法和装置、存储介质、电子装置
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
CN109685104B (zh) 一种识别模型的确定方法和装置
CN110704728A (zh) 信息推荐的方法、装置、电子设备及存储介质
CN105550361A (zh) 日志处理方法及装置和问答信息处理方法及装置
CN106294406A (zh) 一种用于处理应用访问数据的方法与设备
CN114639152A (zh) 基于人脸识别的多模态语音交互方法、装置、设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant