CN112445907A - 文本情感分类方法、装置、设备、及存储介质 - Google Patents
文本情感分类方法、装置、设备、及存储介质 Download PDFInfo
- Publication number
- CN112445907A CN112445907A CN201910823271.XA CN201910823271A CN112445907A CN 112445907 A CN112445907 A CN 112445907A CN 201910823271 A CN201910823271 A CN 201910823271A CN 112445907 A CN112445907 A CN 112445907A
- Authority
- CN
- China
- Prior art keywords
- text
- user
- emotion
- published
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 197
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012549 training Methods 0.000 claims abstract description 79
- 238000003062 neural network model Methods 0.000 claims abstract description 70
- 230000014509 gene expression Effects 0.000 claims abstract description 41
- 238000011156 evaluation Methods 0.000 claims description 68
- 230000011218 segmentation Effects 0.000 claims description 40
- 239000013598 vector Substances 0.000 claims description 27
- 230000009193 crawling Effects 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000002996 emotional effect Effects 0.000 description 23
- 230000006870 function Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种文本情感分类方法、装置、设备及计算机可读存储介质,通过获取用户发表文本;选取所述用户发表文本中的名词类关键词;获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象;获取训练后的神经网络模型,并通过所述训练后的神经网络模型对所述用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;根据所述初始情感属性获取所述目标对象对应的情感属性。提高了文本情感分类的准确性。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种文本情感分类方法、装置、设备及存储介质。
背景技术
随着电子商务和互联网的迅猛发展,网上浏览商品、下订单、支付以及发表个人对商品的使用感受和评价已然成为人们的日常习惯。这些评论文本反映了消费者对此产品在各个维度的褒贬喜恶,即用户对产品的评价属性,比如用户对某款手机的评价“还好吧,外观绚丽,电池耗电太快了,拍照功能中规中矩”,其中,评价属性“外观”的情感倾向为正向,“电池耗电”的情感倾向为负向,“拍照功能”的情感倾向为中性,正向、负向以及中性即为评价属性的情感。
现有技术通常采用情感词典加句法分析来解剖文本,判断文本正负面情感,或采用深度学习方法对文本情感进行分类。而词典和句法分析难以适应多样化表达的网络用语、需要持续收集新网络词汇及表达、且语法规则的制定容易顾此失彼;而深度学习方法难以识别一句包含多个被评价对象的评论具体针对的是哪一对象,尤其对褒一个对象贬另一个对象的判断容易出错,且传统的文本语料库无法适应社交网络的多样化网络用语,从而造成情感识别的准确性较低。
发明内容
本申请实施例提供一种文本情感分类方法、装置、设备及存储介质,可以实现获取情感属性的效率,以及提高文本情感分类的准确性。
第一方面,本申请实施例提供了一种文本情感分类方法,包括:
获取用户发表文本;
选取所述用户发表文本中的名词类关键词;
获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象;
获取训练后的神经网络模型,并通过所述训练后的神经网络模型对所述用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;
根据所述初始情感属性获取所述目标对象对应的情感属性。
在一些实施方式中,所述获取用户发表文本,包括:
通过预设网站爬取用户候选发表文本;
对所述用户候选发表文本进行合并去重,获得合并后的发表文本;
获取预设文本库,并根据所述预设文本库对合并后的发表文本进行过滤,获得用户发表文本。
在一些实施方式中,所述获取训练后的神经网络模型之前,还包括:
获取预设的语料库,其中,所述预设的语料库包括实时更新的网络用语;
通过分词模型对所述语料库中的文本进行分词,获得分词后的词语;
对所述分词后的词语进行训练,获得词向量;
对所述语料库中的文本进行情感标注;
将情感标注后的所述语料库中的文本与所述词向量进行结合,获得训练样本;
根据所述训练样本,对神经网络模型行训练,获得训练后的神经网络模型。
在一些实施方式中,所述选取所述用户发表文本中的名词类关键词,包括:
获取预设的名词类关键词库;
从所述预设的名词类关键词库中,匹配出所述用户发表文本中的名词类关键词。
在一些实施方式中,所述获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象,包括:
通过TFIDF算法获取所述名词类关键词的TFIDF分数,并将所述TFIDF分数设置为名词类关键词在所述用户发表文本中的贡献度;
将所述贡献度进行排序,获得贡献度最高的名词类关键词;
将贡献度最高的名词类关键词作为目标对象。
在一些实施方式中,所述根据所述初始情感属性与目标对象获得用户发表文本对应的评价主体的情感属性之后,还包括:
获取预设规则;
通过所述预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性。
在一些实施方式中,所述通过所述预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性,包括:
获取所述预设规则中的预设句式;
将所述用户发表文本与预设句式进行匹配;
若在所述用户发表文本中匹配到所述预设句式,则将所述预设句式包含的评价对象与目标对象进行对比;
若所述预设句式包含的评价对象与目标对象一致,且所述目标对象对应的情感属性为负向,则将所述目标对象对应的情感属性修正为正向。
第二方面,本申请实施例还提供了一种文本情感分类装置,包括:
第一获取单元,用于获取用户发表文本;
选取单元,用于选取所述用户发表文本中的名词类关键词;
第二获取单元,用于获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象;
第三获取单元,用于获取训练后的神经网络模型,并通过所述训练后的神经网络模型对所述用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;
第四获取单元,用于根据所述初始情感属性获取所述目标对象对应的情感属性。
在一些实施方式中,所述第一获取单元,包括:
爬取子单元,用于通过预设网站爬取用户候选发表文本;
合并子单元,用于对所述用户候选发表文本进行合并去重,获得合并后的发表文本;
第一获取子单元,用于获取预设文本库,并根据所述预设文本库对合并后的发表文本进行过滤,获得用户发表文本。
在一些实施方式中,所述文本情感分类装置,还包括:
第五获取单元,用于获取预设的语料库,其中,所述预设的语料库包括实时更新的网络用语;
分词单元,用于通过分词模型对所述语料库中的文本进行分词,获得分词后的词语;
第一训练单元,用于对所述分词后的词语进行训练,获得词向量;
情感标注单元,用于对所述语料库中的文本进行情感标注;
结合单元,用于将情感标注后的所述语料库中的文本与所述词向量进行结合,获得训练样本
第二训练单元,用于将情感标注后的词向量作为训练样本,对神经网络模型行训练,获得训练后的神经网络模型。
在一些实施方式中,所述选取单元,包括:
第二获取子单元,用于获取预设的名词类关键词库;
第一匹配子单元,用于从所述预设的名词类关键词库中,匹配出所述用户发表文本中的名词类关键词。
在一些实施方式中,所述第二获取单元,包括:
第三获取子单元,用于通过TFIDF算法获取所述名词类关键词的TFIDF分数,并将所述TFIDF分数设置为名词类关键词在所述用户发表文本中的贡献度;
排序子单元,用于将所述贡献度进行排序,获得贡献度最高的名词类关键词;将贡献度最高的名词类关键词作为目标对象。
在一些实施方式中,所述文本情感分类装置,还包括:
第六获取单元,用于获取预设规则;
修正单元,用于通过所述预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性。
在一些实施方式中,所述修正单元,包括:
第四获取子单元,用于获取所述预设规则中的预设句式;
第二匹配子单元,用于将所述用户发表文本与预设句式进行匹配;
对比子单元,用于若在所述用户发表文本中匹配到所述预设句式,则将所述预设句式包含的评价对象与目标对象进行对比;
修正子单元,用于若所述预设句式包含的评价对象与目标对象一致,且所述目标对象对应的情感属性为负向,则将所述目标对象对应的情感属性修正为正向。
第三方面,本申请实施例还提供了一种设备,所述设备包括处理器和存储器,所述存储器中存储有程序代码,所述处理器调用所述存储器中的程序代码时执行如上所述的文本情感分类方法。
第四方面,本申请实施例还提供了一种存储介质,所述存储介质存储有计算机程序,该程序被处理器加载以执行如上所述的文本情感分类方法。
本申请实施例通过获取用户发表文本;并选取用户发表文本中的名词类关键词;获取名词类关键词在用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象,即目标评价对象,从而获得用户发表文本中的目标评价对象,在用户发表文本包含多个评价对象时,通过确定目标评价对象,提高识别包含多个被评价对象文本的情感属性的准确性;获取训练后的神经网络模型,并通过训练后的神经网络模型对用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;由于训练后的神经网络模型为通过包含网络用语的训练样本训练得到,从而在用户发表文本包含网络用语时,准确地识别出对应的情感属性,然后结合初始情感属性与目标对象,获得所述目标对象的情感属性。由于结合了目标对象,并且通过包含网络用语的训练样本训练得到的神经网络模型进行识别,提高了识别包含多个被评价对象文本,以及包含包含网络用语文本的情感属性的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的文本情感分类方法的流程示意图;
图2是本申请实施例提供的文本情感分类方法的另一流程示意图;
图3是本申请实施例提供的文本情感分类装置的结构示意图;
图4是本申请实施例提供的设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,图1是本申请一实施例提供的文本情感分类方法的流程示意图。该文本情感分类方法的执行主体可以是本申请实施例提供的文本情感分类装置,或者集成了该文本情感分类装置的设备,比如终端或服务器等,该设备可以是智能手机、平板电脑、掌上电脑、或者笔记本电脑、固定电脑、以及服务器等等。该文本情感分类方法可以包括:
S101,获取用户发表文本。
具体地,在本实施例中,用户发表文本可以包括用户发表的个人对商品的使用感受和评价文本,或者用户发表的个人对某些文字的读后感等,在此不做限制。具体可通过数据爬取的方式获取用户发表文本,根据用户设置的用户发表文本爬取条件,选取需要爬取的用户发表文本并进行采集,即可获取候选的用户发表文本,由于是根据用户设置的用户发表文本爬取条件爬取的用户发表文本,因而提高获取候选的用户发表文本的准确性,然后对候选的用户发表文本进行合并去重以及过滤,即可获得用户发表文本。具体地,用户发表文本爬取条件可以包括用户标识,比如用户绑定的手机号码等,以及用户发表文本的发表时间等,当用户发表文本爬取条件包括用户标识时,则爬取与用户标识相关的发表文本。
具体地,步骤S101可包括:
在预设网站爬取用户候选发表文本;
对所述用户候选发表文本进行合并去重,获得合并后的发表文本;
获取预设文本库,并根据所述预设文本库对合并后的发表文本进行过滤,获得用户发表文本。
在预设网站爬取用户候选发表文本,其中,预设网站可以为单个的网站,也可以为多个网站的组合,具体可根据用户需求进行设置,在此不做限定。
首先启动服务器或设备中添加的数据采集器,其中数据采集器可以为安装在浏览器中的数据采集器,其中,数据采集器是用来批量采集网页,论坛等的内容,直接保存到数据或发布到网络的一种信息化工具,可以根据用户设定的规则自动采集原网页,获取格式网页中需要的内容,如SQL Server 2008性能数据采集器,可以让用户创建一个中心数据库来存储性能数据;包含三个内置数据收集组来收集和存储数据;为了帮助识别和排除SQLServer性能相关的问题,可以使用其内置的三个报表来查看收集存储的数据。然后根据接收到的用户发表文本爬取条件,选取需要爬取的用户发表文本并进行采集,即可获取候选的用户发表文本,提高获取候选的用户发表文本的准确性,然后对候选的用户发表文本进行合并去重,即将内容完全一致的候选的用户发表文本进行删除,从而避免后续重复分析用户发表文本的情感属性,然后获取预设文本库,并根据预设文本库对合并后的发表文本进行过滤,其中预设文本库可包括营销、活动推广、社交分享、资讯类词典,通过营销、活动推广、社交分享、资讯类的相关词语建立得到预设文本库,即具体可通过营销、活动推广、社交分享、资讯类词典,将合并后的发表文本中的营销、广告类等无关内容进行过滤,即可获得用户发表文本。
S102,选取所述用户发表文本中的名词类关键词。
在获得用户发表文本之后,可选取用户发表文本中的名词类关键词,具体实施过程中,用户对于商品或者对某些文字的读后感,商品或者书本一般为名词,比如评价手机的好坏,快递的快慢,书本的撰写质量等,可以看出,评价的对象包括手机、快递、书等,都为名词,因此,在选取关键词过程中,选取名词类的关键词即可。具体地,可通过预设的关键词库进行选取,首先获取预设的名词类关键词库;从预设的名词类关键词库中,匹配出用户发表文本中的名词类关键词即可。
进一步地,步骤S102可包括:
获取预设的名词类关键词库;
从所述预设的名词类关键词库中,匹配出所述用户发表文本中的名词类关键词。
获取预设的名词类关键词库,其中,名词类关键词库为根据预先设定需要识别的主体进行构建得到,比如调查快递行业舆情,那么需要识别的就是各快递公司的名字。将各快递公司的名字都列入一个词典,并将他们的词性都设定为某些在句子里比较突出的词性,比如规定“顺丰”“EMS”的词性为专有名词或者机构名词,从而构建得到预设的名词类关键词库。
或者根据历史评价主体进行构建得到的,具体地,获取历史评价主体,并对获取到的历史评价主体进行文本分析,具体可通过全切分算法对历史评价主体进行分词处理,获得历史评价主体的分词;通过神经网络语言模型对历史评价主体的分词进行量化处理,获得历史评价主体的分词的词向量;将历史评价主体的分词的词向量输入至预设数据库模型中,预设数据库模型可包括通用的欧式距离计算模型,获得历史评价主体的分词的词向量与预设数据库中的词向量的欧式距离;根据历史评价主体的分词的词向量与预设数据库中的词向量的欧式距离分析历史评价主体的语义,并根据历史评价主体的语义对历史评价主体进行词语分类,根据词语分类后的历史评价主体计算各类词语的出现频率,将出现频率大于预设值的词语设置为关键词,根据设置的关键词建立名词类关键词库。进一步地,可进一步在名词类关键词库中,添加更新的待评价主体。
然后将获取到的用户发表文本在名词类关键词库中进行匹配,当在名词类关键词库中匹配到与用户发表文本一致的内容时,确定用户发表文本中包含名词类关键词,从而实现关键词提取,得到名词类关键词。
S103,获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象。
获取名词类关键词在用户发表文本中的贡献度,具体可通过TFIDF算法计算名词类关键词的TFIDF分数,根据TFIDF分数获取名词类关键词的贡献度,将贡献度最高的名词类关键词作为目标对象。
具体地,步骤S103包括:
通过TFIDF算法获取所述名词类关键词的TFIDF分数,并将所述TFIDF分数设置为名词类关键词在所述用户发表文本中的贡献度;
将所述贡献度进行排序,获得贡献度最高的名词类关键词;
将贡献度最高的名词类关键词作为目标对象。
具体通过TFIDF算法获取名词类关键词的TFIDF分数,具体通过TFIDF算法计算各个名词类关键词在用户发表文本中的出现频率,即TFIDF分数,并将TFIDF分数设置为名词类关键词在用户发表文本中的贡献度,将贡献度进行排序,具体可为倒序排序或者正序排序等,在此不做限定,从而获得贡献度最高的名词类关键词;将贡献度最高的名词类关键词作为目标对象。
S104,获取训练后的神经网络模型,并通过所述训练后的神经网络模型对所述用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到。
获取训练后的神经网络模型,并通过训练后的神经网络模型对用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,训练后的神经网络模型为通过包含网络用语的训练样本训练得到。其中,训练后的神经网络模型为部署在文本情感分类装置中的模型。
因此在步骤S104之前,即具体的训练过程可包括:
获取预设的语料库,其中,所述预设的语料库包括实时更新的网络用语;
通过分词模型对所述语料库中的文本进行分词,获得分词后的词语;
对所述分词后的词语进行训练,获得词向量;
对所述语料库中的文本进行情感标注;
将情感标注后的所述语料库中的文本与所述词向量进行结合,获得训练样本;
根据所述训练样本,对神经网络模型行训练,获得训练后的神经网络模型。
获取预设的语料库,其中,预设的语料库包括实时更新的网络用语,还包括用户发表的历史文本,即通过实时更新的网络用语和用户发表的历史文本构建得到的语料库,通过分词模型对语料库中的文本进行分词,获得分词后的语料库,并对分词后的词语进行训练,即进行词向量的构建,从而获得词向量,其中,分词模型可以为基于网络语境构建的,具体可包括Word2vec模型,GloVe模型,FastText模型等,在此不做限定。
具体地,分词处理可包括:
将所述语料库中的文本切分出与预设词库匹配的词,得到初始词语;
通过所述分词模型获取所述初始词语与预设词库中各个词语之间的最优路径;
根据所述最优路径确定组成所述语料库中的文本的词语。
即首先通过分词模型将语料库中的文本切分出与预设词库匹配的所有可能的词,得到初始词语,再运用统计语言模型决定最优的切分结果,首先进行词条检索(一般用Trie存储),找到匹配的所有词条,以词网格(word lattices)形式表示,接着做路径搜索,基于统计语言模型(例如n-gram)找到最优路径,即查找词语之间的距离,即可计算得到最优的切分结果,从而获得分词结果,即获得组成语料库中的文本的词语。然后对分词后的词语进行训练,获得词向量,并对语料库中的文本进行情感标注;将情感标注后的语料库中的文本与词向量进行结合,获得训练样本,根据训练样本对神经网络模型进行训练,获得训练后的神经网络模型。
S105,根据所述初始情感属性获取所述目标对象对应的情感属性。
在本实施例中,通过将初始情感属性具体结合目标对象,从而获得用户发表文本所针对的对象做出的评价,比较假设目标对象为A快递,初始情感属性为正向,则可获得用户发表文本的情感属性为对A快递的正向评价。解决了传统情感分类易受句子中评论的其他对象干扰,因而无法判断针对某一特定对象的情感的问题。
具体地,在获得目标对象对应的情感属性之后,可进一步对情感属性进行修正,即S105之后,还包括:
获取预设规则;
通过所述预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性。
获取预设规则,其中,预设规则可以包括表情符合、预设句式等。然后通过预设规则对情感属性进行修正,从而获得修正后的情感属性。
具体地,步骤“通过所述预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性”可包括:
获取所述预设规则中的预设句式;
将所述用户发表文本与预设句式进行匹配;
若在所述用户发表文本中匹配到所述预设句式,则将所述预设句式包含的评价对象与目标对象进行对比;
若所述预设句式包含的评价对象与目标对象一致,且所述目标对象对应的情感属性为负向,则自动将所述目标对象对应的情感属性修正为正向。
进一步地,当出现多个评价对象时,有可能存在对A对象进行正向评价,而对其他对象为负向评价的情况,此时为了避免误判,可进一步通过预设句式进行修正情感属性。具体地,当预设规则为预设句式时,比如“现在快递服务都好差啊,除了A快递”,当出现除了的预设句式时,可判断为是对A快递的正向评价,或者出现快递A比快递B好时,也可判断为是对A快递的正向评价,而对B是负向评价,然后将用户发表文本与预设句式进行匹配,若在用户发表文本中匹配到预设句式,则将预设句式包含的评价对象与目标对象进行对比;若预设句式包含的评价对象与目标对象一致,且目标对象对应的情感属性为负向,则将目标对象对应的情感属性修正为正向,若预设句式包含的评价对象与目标对象一致,且目标对象对应的情感属性为正向,则不需要修改目标对象对应的情感属性。若预设句式包含的评价对象与目标对象不一致,此时也不需要对目标对象对应的情感属性进行修改。
进一步地,预设句式还可以为比较类的句式,比如A比B差,A和B比C差等句式。此时“通过所述预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性”可包括:
获取所述预设规则中的预设句式;
将所述用户发表文本与预设句式进行匹配;
若在所述用户发表文本中匹配到所述预设句式,则将所述预设句式包含的评价对象与目标对象进行对比;
若所述预设句式包含的评价对象与目标对象一致,且所述目标对象对应的情感属性为正向,则将所述目标对象对应的情感属性修正为负向。
当出现多个评价对象时,有可能存在对B对象进行正向评价,而对其他对象为负向评价的情况,具体地,当预设规则为预设句式时,比如“快递A服务比快递B服务差很多”,可判断为是对A快递的负向评价,对B对象进行正向评价,然后将用户发表文本与预设句式进行匹配,若在用户发表文本中匹配到预设句式,则将预设句式包含的评价对象与目标对象进行对比;若预设句式包含的评价对象与目标对象一致,且目标对象对应的情感属性为正向,则将目标对象对应的情感属性修正为负向,若预设句式包含的评价对象与目标对象一致,且目标对象对应的情感属性为负向,则不需要修改目标对象对应的情感属性。若预设句式包含的评价对象与目标对象不一致,此时也不需要对目标对象对应的情感属性进行修改。
进一步地,当预设规则为表情符号时,可通过表情符号对情感属性进行进一步修正。
具体地,步骤“通过所述预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性”可包括:
获取预设的表情符号以及所述表情符号对应的情感属性;
将所述用户发表文本与表情符号进行匹配;
若在所述用户发表文本中匹配到所述表情符号,则将所述表情符号对应的情感属性与所述目标对象的情感属性进行对比;
若所述表情符号对应的情感属性与所述目标对象的情感属性一致,则不需要进行修改;
若所述表情符号对应的情感属性与所述目标对象的情感属性不一致,则根据表情符号对应的情感属性对所述目标对象的情感属性进行修改。
本实施例通过获取用户发表文本;并选取用户发表文本中的名词类关键词;获取名词类关键词在用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象,即目标评价对象,从而获得用户发表文本中的目标评价对象,在用户发表文本包含多个评价对象时,通过确定目标评价对象,提高识别包含多个被评价对象文本的情感属性的准确性;获取训练后的神经网络模型,并通过训练后的神经网络模型对用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;由于训练后的神经网络模型为通过包含网络用语的训练样本训练得到,从而在用户发表文本包含网络用语时,准确地识别出对应的情感属性,然后结合初始情感属性与目标对象,获得所述目标对象的情感属性。由于结合了目标对象,并且通过包含网络用语的训练样本训练得到的神经网络模型进行识别,提高了识别包含多个被评价对象文本,以及包含包含网络用语文本的情感属性的准确性。
根据上述实施例所描述的文本情感分类方法,以下将作进一步详细说明。本实施例以用户发表文本为用户对商品的评论文本进行描述文本情感分类的方法。
请参阅图2,图2为本申请实施例提供的文本情感分类方法的又一流程图。
S201,获取用户发表文本。
具体地,在本实施例中,用户发表文本可以包括用户发表的个人对商品的使用感受和评价文本,或者用户发表的个人对某些文字的读后感等,在此不做限制。具体可通过数据爬取的方式获取用户发表文本,根据用户设置的用户发表文本爬取条件,选取需要爬取的用户发表文本并进行采集,即可获取候选的用户发表文本,由于是根据用户设置的用户发表文本爬取条件爬取的用户发表文本,因而提高获取候选的用户发表文本的准确性,然后对候选的用户发表文本进行合并去重以及过滤,即可获得用户发表文本。具体地,用户发表文本爬取条件可以包括用户标识,比如用户绑定的手机号码等,以及用户发表文本的发表时间等,当用户发表文本爬取条件包括用户标识时,则爬取与用户标识相关的发表文本。
S202,选取用户发表文本中的名词类关键词。
在获得用户发表文本之后,可选取用户发表文本中的名词类关键词,具体地,可通过预设的关键词库进行选取,首先获取预设的名词类关键词库,然后将获取到的用户发表文本在名词类关键词库中进行匹配,当在名词类关键词库中匹配到与用户发表文本一致的内容时,确定用户发表文本中包含名词类关键词,从而实现关键词提取,得到名词类关键词。
S203,获取名词类关键词在用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象。
获取名词类关键词在用户发表文本中的贡献度,具体可通过TFIDF算法计算名词类关键词的TFIDF分数,根据TFIDF分数获取名词类关键词的贡献度,将贡献度最高的名词类关键词作为目标对象。
S204,获取预设的语料库。
S205,通过分词模型对所述语料库中的文本进行分词,获得分词后的词语。
S206,对所述分词后的词语进行训练,获得词向量。
对所述语料库中的文本进行情感标注。
S207,将情感标注后的所述语料库中的文本与所述词向量进行结合,获得训练样本。
S208,根据所述训练样本,对神经网络模型行训练,获得训练后的神经网络模型。
获取预设的语料库,其中,预设的语料库包括实时更新的网络用语,还包括用户发表的历史文本,通过分词模型对语料库中的文本进行分词,获得分词后的语料库,并对分词后的词语进行训练,即进行词向量的构建,从而获得词向量,其中,分词模型可以为基于网络语境构建的,具体可包括Word2vec模型,GloVe模型,FastText模型等,在此不做限定。
通过分词模型将语料库中的文本切分出与预设词库匹配的所有可能的词,得到初始词语,再运用统计语言模型决定最优的切分结果,首先进行词条检索,找到匹配的所有词条,以词网格形式表示,接着做路径搜索,基于统计语言模型找到最优路径,即查找词语之间的距离,即可计算得到最优的切分结果,从而获得分词结果,即获得组成语料库中的文本的词语,对分词后的词语进行训练,获得词向量,并对语料库中的文本进行情感标注;将情感标注后的语料库中的文本与词向量进行结合,获得训练样本,根据训练样本对神经网络模型进行训练,获得训练后的神经网络模型。
S209,获取训练后的神经网络模型,并通过所述训练后的神经网络模型对所述用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性。
获取训练后的神经网络模型,并通过训练后的神经网络模型对用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,训练后的神经网络模型为通过包含网络用语的训练样本训练得到。其中,训练后的神经网络模型为部署在文本情感分类装置中的模型。
S210,根据初始情感属性获取所述目标对象对应的情感属性。
在本实施例中,通过将初始情感属性具体结合目标对象,从而获得用户发表文本所针对的对象做出的评价,比较假设目标对象为A快递,初始情感属性为正向,则可获得用户发表文本的情感属性为对A快递的正向评价。解决了传统情感分类易受句子中评论的其他对象干扰,因而无法判断针对某一特定对象的情感的问题。
S211,获取预设规则。
S212,通过预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性。
获取预设规则,其中,预设规则可以包括表情符合、预设句式等。然后通过预设规则对情感属性进行修正,从而获得修正后的情感属性。
本实施例通过获取用户发表文本;并选取用户发表文本中的名词类关键词;获取名词类关键词在用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象,即目标评价对象,从而获得用户发表文本中的目标评价对象,在用户发表文本包含多个评价对象时,通过确定目标评价对象,提高识别包含多个被评价对象文本的情感属性的准确性;获取训练后的神经网络模型,并通过训练后的神经网络模型对用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;由于训练后的神经网络模型为通过包含网络用语的训练样本训练得到,从而在用户发表文本包含网络用语时,准确地识别出对应的情感属性,然后结合初始情感属性与目标对象,获得所述目标对象的情感属性。由于结合了目标对象,并且通过包含网络用语的训练样本训练得到的神经网络模型进行识别,提高了识别包含多个被评价对象文本,以及包含包含网络用语文本的情感属性的准确性。
为便于更好的实施本申请实施例提供的文本情感分类方法,本申请实施例还提供一种基于上述文本情感分类装置。其中名词的含义与上述文本情感分类方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图3,图3为本申请实施例提供的文本情感分类装置的结构示意图,其中该物文本情感分类装置可以包括第一获取单元301、选取单元302、第二获取单元303、第三获取单元303以及第四获取单元305等。
具体地,文本情感分类装置包括:
第一获取单元301,用于获取用户发表文本;
选取单元302,用于选取所述用户发表文本中的名词类关键词;
第二获取单元303,用于获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象;
第三获取单元304,用于获取训练后的神经网络模型,并通过所述训练后的神经网络模型对所述用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;
第四获取单元305,用于根据所述初始情感属性获取所述目标对象对应的情感属性。
在一些实施方式中,所述第一获取单元301,包括:
爬取子单元,用于通过预设网站爬取用户候选发表文本;
合并子单元,用于对所述用户候选发表文本进行合并去重,获得合并后的发表文本;
第一获取子单元,用于获取预设文本库,并根据所述预设文本库对合并后的发表文本进行过滤,获得用户发表文本。
在一些实施方式中,所述文本情感分类装置,还包括:
第五获取单元,用于获取预设的语料库,其中,所述预设的语料库包括实时更新的网络用语;
分词单元,用于通过分词模型对所述语料库中的文本进行分词,获得分词后的词语;
第一训练单元,用于对所述分词后的词语进行训练,获得词向量;
情感标注单元,用于对所述语料库中的文本进行情感标注;
结合单元,用于将情感标注后的所述语料库中的文本与所述词向量进行结合,获得训练样本;
第二训练单元,用于根据所述训练样本,对神经网络模型行训练,获得训练后的神经网络模型。
在一些实施方式中,所述选取单元302,包括:
第二获取子单元,用于获取预设的名词类关键词库;
第一匹配子单元,用于从所述预设的名词类关键词库中,匹配出所述用户发表文本中的名词类关键词。
在一些实施方式中,所述第二获取单元303,包括:
第三获取子单元,用于通过TFIDF算法获取所述名词类关键词的TFIDF分数,并将所述TFIDF分数设置为名词类关键词在所述用户发表文本中的贡献度;
排序子单元,用于将所述贡献度进行排序,获得贡献度最高的名词类关键词;将贡献度最高的名词类关键词作为目标对象。
在一些实施方式中,所述文本情感分类装置,还包括:
第六获取单元,用于获取预设规则;
修正单元,用于通过所述预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性。
在一些实施方式中,所述修正单元,包括:
第四获取子单元,用于获取所述预设规则中的预设句式;
第二匹配子单元,用于将所述用户发表文本与预设句式进行匹配;
对比子单元,用于若在所述用户发表文本中匹配到所述预设句式,则将所述预设句式包含的评价对象与目标对象进行对比;
修正子单元,用于若所述预设句式包含的评价对象与目标对象一致,且所述目标对象对应的情感属性为负向,则将所述目标对象对应的情感属性修正为正向。
其中,以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
图4示出了本发明实施例提供的设备的具体结构框图,该设备可以用于实施上述实施例中提供的文本情感分类方法。该设备400可以为智能手机或平板电脑等。
如图4所示,设备400可以包括RF(Radio Frequency,射频)电路110、包括有一个或一个以上(图中仅示出一个)计算机可读存储介质的存储器120、输入单元130、显示单元140、传输模块170、包括有一个或者一个以上(图中仅示出一个)处理核心的处理器180以及电源190等部件。本领域技术人员可以理解,图4中示出的设备400结构并不构成对设备400的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。RF电路110可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。RF电路110可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信***(Global System for Mobile Communication,GSM)、增强型移动通信技术(Enhanced DataGSM Environment,EDGE),宽带码分多址技术(Wideband Code Division MultipleAccess,WCDMA),码分多址技术(Code Division Access,CDMA)、时分多址技术(TimeDivision Multiple Access,TDMA),无线保真技术(Wireless Fidelity,Wi-Fi)(如美国电气和电子工程师协会标准IEEE 802.11a,IEEE 802.11b,IEEE802.11g和/或IEEE802.11n)、网络电话(Voice over Internet Protocol,VoIP)、全球微波互联接入(Worldwide Interoperability for Microwave Access,Wi-Max)、其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。
存储器120可用于存储软件程序以及模块,如上述实施例中文本情感分类方法的程序指令/模块,处理器180通过运行存储在存储器120内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现物体体积计算的功能。存储器120可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器120可进一步包括相对于处理器180远程设置的存储器,这些远程存储器可以通过网络连接至设备400。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。具体地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及设备400的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图4中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输出功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
设备400通过传输模块170(例如Wi-Fi模块)可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了传输模块170,但是可以理解的是,其并不属于设备400的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是设备400的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行设备400的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;在一些实施例中,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
设备400还包括给各个部件供电的电源190(比如电池),在一些实施例中,电源可以通过电源管理***与处理器180逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
具体在本实施例中,设备400的显示单元140是触摸屏显示器,设备400还包括有存储器120,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器120中,且经配置以由一个或者一个以上处理器180执行一个或者一个以上程序包含用于进行以下操作的步骤:
获取用户发表文本;
选取所述用户发表文本中的名词类关键词;
获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象;
获取训练后的神经网络模型,并通过所述训练后的神经网络模型对所述用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;
根据所述初始情感属性获取所述目标对象对应的情感属性。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对文本情感分类方法的详细描述,此处不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,所述存储介质存储有计算机程序,该程序被处理器加载以执行本申请实施例所提供的任一种文本情感分类方法中的步骤。例如,该计算机程序可以执行如下步骤:
获取用户发表文本;
选取所述用户发表文本中的名词类关键词;
获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象;
获取训练后的神经网络模型,并通过所述训练后的神经网络模型对所述用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;
根据所述初始情感属性获取所述目标对象对应的情感属性。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种文本情感分类方法中的步骤,因此,可以实现本申请实施例所提供的任一种文本情感分类方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种文本情感分类方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种文本情感分类方法,其特征在于,包括:
获取用户发表文本;
选取所述用户发表文本中的名词类关键词;
获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象;
获取训练后的神经网络模型,并通过所述训练后的神经网络模型对所述用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;
根据所述初始情感属性获取所述目标对象对应的情感属性。
2.根据权利要求1所述的文本情感分类方法,其特征在于,所述获取用户发表文本,包括:
通过预设网站爬取用户候选发表文本;
对所述用户候选发表文本进行合并去重,获得合并后的发表文本;
获取预设文本库,并根据所述预设文本库对合并后的发表文本进行过滤,获得用户发表文本。
3.根据权利要求1所述的文本情感分类方法,其特征在于,所述获取训练后的神经网络模型,包括:
获取预设的语料库,其中,所述预设的语料库包括实时更新的网络用语;
通过分词模型对所述语料库中的文本进行分词,获得分词后的词语;
对所述分词后的词语进行训练,获得词向量;
对所述语料库中的文本进行情感标注;
将情感标注后的所述语料库中的文本与所述词向量进行结合,获得训练样本;
根据所述训练样本,对神经网络模型行训练,获得训练后的神经网络模型。
4.根据权利要求1所述的文本情感分类方法,其特征在于,所述选取所述用户发表文本中的名词类关键词,包括:
获取预设的名词类关键词库;
从所述预设的名词类关键词库中,匹配出所述用户发表文本中的名词类关键词。
5.根据权利要求1所述的文本情感分类方法,其特征在于,所述获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象,包括:
通过TFIDF算法获取所述名词类关键词的TFIDF分数,并将所述TFIDF分数设置为名词类关键词在所述用户发表文本中的贡献度;
将所述贡献度进行排序,获得贡献度最高的名词类关键词;
将贡献度最高的名词类关键词作为目标对象。
6.根据权利要求1-5任一项所述的文本情感分类方法,其特征在于,所述根据所述初始情感属性与目标对象获得用户发表文本对应的评价主体的情感属性之后,还包括:
获取预设规则;
通过所述预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性。
7.根据权利要求6所述的文本情感分类方法,其特征在于,所述通过所述预设规则对所述目标对象对应的情感属性进行修正,得到修正后的情感属性,包括:
获取所述预设规则中的预设句式;
将所述用户发表文本与预设句式进行匹配;
若在所述用户发表文本中匹配到所述预设句式,则将所述预设句式包含的评价对象与目标对象进行对比;
若所述预设句式包含的评价对象与目标对象一致,且所述目标对象对应的情感属性为负向,则将所述目标对象对应的情感属性修正为正向。
8.一种文本情感分类装置,其特征在于,包括:
第一获取单元,用于获取用户发表文本;
选取单元,用于选取所述用户发表文本中的名词类关键词;
第二获取单元,用于获取所述名词类关键词在所述用户发表文本中的贡献度,并将贡献度最高的名词类关键词作为目标对象;
第三获取单元,用于获取训练后的神经网络模型,并通过所述训练后的神经网络模型对所述用户发表文本进行情感类别识别,获得用户发表文本的初始情感属性,其中,所述训练后的神经网络模型为通过包含网络用语的训练样本训练得到;
第四获取单元,用于根据所述初始情感属性获取所述目标对象对应的情感属性。
9.一种设备,其特征在于,包括处理器和存储器,所述存储器中存储有程序代码,所述处理器调用所述存储器中的程序代码时执行如权利要求1至7任一项所述的文本情感分类方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,该程序被处理器加载以执行如权利要求1至7任一项所述的文本情感分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910823271.XA CN112445907A (zh) | 2019-09-02 | 2019-09-02 | 文本情感分类方法、装置、设备、及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910823271.XA CN112445907A (zh) | 2019-09-02 | 2019-09-02 | 文本情感分类方法、装置、设备、及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112445907A true CN112445907A (zh) | 2021-03-05 |
Family
ID=74734301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910823271.XA Pending CN112445907A (zh) | 2019-09-02 | 2019-09-02 | 文本情感分类方法、装置、设备、及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112445907A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101540683B1 (ko) * | 2014-10-20 | 2015-07-31 | 숭실대학교산학협력단 | 감정어의 극성을 분류하는 방법 및 서버 |
CN106897439A (zh) * | 2017-02-28 | 2017-06-27 | 百度在线网络技术(北京)有限公司 | 文本的情感识别方法、装置、服务器以及存储介质 |
CN108038725A (zh) * | 2017-12-04 | 2018-05-15 | 中国计量大学 | 一种基于机器学习的电商产品客户满意度分析方法 |
CN108647205A (zh) * | 2018-05-02 | 2018-10-12 | 深圳前海微众银行股份有限公司 | 细粒度情感分析模型构建方法、设备及可读存储介质 |
CN108664469A (zh) * | 2018-05-07 | 2018-10-16 | 首都师范大学 | 一种情感类别确定方法、装置及服务器 |
CN108804512A (zh) * | 2018-04-20 | 2018-11-13 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
CN109522412A (zh) * | 2018-11-14 | 2019-03-26 | 北京神州泰岳软件股份有限公司 | 文本情感分析方法、装置及介质 |
-
2019
- 2019-09-02 CN CN201910823271.XA patent/CN112445907A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101540683B1 (ko) * | 2014-10-20 | 2015-07-31 | 숭실대학교산학협력단 | 감정어의 극성을 분류하는 방법 및 서버 |
CN106897439A (zh) * | 2017-02-28 | 2017-06-27 | 百度在线网络技术(北京)有限公司 | 文本的情感识别方法、装置、服务器以及存储介质 |
CN108038725A (zh) * | 2017-12-04 | 2018-05-15 | 中国计量大学 | 一种基于机器学习的电商产品客户满意度分析方法 |
CN108804512A (zh) * | 2018-04-20 | 2018-11-13 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
CN108647205A (zh) * | 2018-05-02 | 2018-10-12 | 深圳前海微众银行股份有限公司 | 细粒度情感分析模型构建方法、设备及可读存储介质 |
CN108664469A (zh) * | 2018-05-07 | 2018-10-16 | 首都师范大学 | 一种情感类别确定方法、装置及服务器 |
CN109522412A (zh) * | 2018-11-14 | 2019-03-26 | 北京神州泰岳软件股份有限公司 | 文本情感分析方法、装置及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804512B (zh) | 文本分类模型的生成装置、方法及计算机可读存储介质 | |
US10878479B2 (en) | Recommendation through conversational AI | |
US11093854B2 (en) | Emoji recommendation method and device thereof | |
WO2020125445A1 (zh) | 分类模型训练方法、分类方法、设备及介质 | |
US20170344224A1 (en) | Suggesting emojis to users for insertion into text-based messages | |
CN107145571B (zh) | 一种搜索方法及装置 | |
CN107784092A (zh) | 一种推荐热词的方法、服务器及计算机可读介质 | |
CN106951494A (zh) | 一种信息推荐方法及装置 | |
CN106095845B (zh) | 文本分类方法和装置 | |
CN111177371B (zh) | 一种分类方法和相关装置 | |
WO2014031505A1 (en) | Word detection and domain dictionary recommendation | |
KR20110115542A (ko) | 향상된 개체 발췌에 기초하여 메시지 및 대화 간의 의미 유사성을 계산하는 방법 | |
CN111144120A (zh) | 一种训练语句的获取方法、装置、存储介质及电子设备 | |
CN108228808B (zh) | 确定热点事件的方法、装置和存储介质以及电子设备 | |
CN110069769B (zh) | 应用标签生成方法、装置及存储设备 | |
Tuarob et al. | A product feature inference model for mining implicit customer preferences within large scale social media networks | |
CN112989235A (zh) | 基于知识库的内链构建方法、装置、设备和存储介质 | |
CN113407738B (zh) | 一种相似文本检索方法、装置、电子设备和存储介质 | |
CN113822038B (zh) | 一种摘要生成方法和相关装置 | |
CN114116997A (zh) | 知识问答方法、装置、电子设备及存储介质 | |
CN112307198B (zh) | 一种单文本的摘要确定方法和相关装置 | |
CN112307200A (zh) | 情感属性获取方法、装置、设备、及存储介质 | |
CN112948573A (zh) | 文本标签的提取方法、装置、设备和计算机存储介质 | |
CN112749252A (zh) | 一种基于人工智能的文本匹配方法和相关装置 | |
CN113792230B (zh) | 服务链接方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |