CN116432107A

CN116432107A - 一种细粒度情感分类方法

Info

Publication number: CN116432107A
Application number: CN202310627129.4A
Authority: CN
Inventors: 马汉达; 杨智
Original assignee: Jiangsu University
Current assignee: Jiangsu University
Priority date: 2023-05-30
Filing date: 2023-05-30
Publication date: 2023-07-14

Abstract

本发明提供一种细粒度情感分类方法，其特征在于，所述方法包括：S1获取待分析的句子及其对应的方面词，并进行预处理；S2将所述S1获取的句子及其对应的方面词拼接输入到SKEP预训练模型进行处理，获得每个词向量与上下文信息整合后的语义信息；S3对所述S2获得的语义信息，采用多层神经网络进行特征提取，获取更深层次信息；S4将S3提取出的更深层次信息输入到输出层进行细粒度情感预测，得到情感分析方法的分析结果。本发明采用SKEP‑BiLSTM‑融合注意力的门限卷积神经网络模型，增强了方面词与评论语句的关联，引入BiLSTM与门限卷积神经网络，能对情感特征进行深度提取。

Description

一种细粒度情感分类方法

技术领域

本发明属于自然语言处理的文本情感分析领域，具体涉及一种细粒度情感分类方法。

背景技术

随着信息化时代的到来，互联网上充斥着各式各样的文本内容，其中蕴含着丰富的信息，尤其在新兴的服务行业里，从成千上万的评论信息中可以体现出商家是否拥有良好的口碑，并借此来评判其服务质量。如何从众多评论文本中抽取各个粒度的情感倾向，是值得研究的现实性问题。

细粒度情感分类是情感分类的一个重要的子任务，是对主观性文本的更深层次的分析。它不仅取决于上下文的信息，还与给定的方面信息相关，其任务是对文本中出现的多个评论对象进行深刻的分析，分离出多个对象的情感极性。细粒度情感分析可以识别一条评论中各个给定的方面词的情感倾向，并由此得出更加准确、全面的情感分析结论，避免信息丢失。

目前已有的情感分析方法可以分为基于情感词典、基于传统机器学习以及基于神经网络深度学习的情感分析方法。早期基于情感词典的情感分析方法主要依靠人工构建情感词典，对网络新词效果不好，使用需要扩充词典。基于机器学习方法：使用统计机器学习算法，抽取特征，输出情感结果，但不能充分利用上下文文本的语境信息。

因此，亟需一种能提升推文情感分类准确率的新的细粒度情感分类方法。

发明内容

为解决现有技术中存在的问题，本发明一种细粒度情感分类方法，步骤如下：

S1获取待分析的句子及其对应的方面词，并进行预处理；

S2将经过预处理后的句子及其对应的方面词拼接输入到SKEP预训练模型进行处理，获得每个词向量与上下文信息整合后的语义信息；

S3对所述S2获得的语义信息，采用多层神经网络进行特征提取，获取更深层次信息；

S4将S3提取出的更深层次信息输入到输出层进行细粒度情感预测，得到情感分类结果。

进一步的，所述预处理具体为：

对待分析的句子及其对应的方面词中包含的emoji表情进行转义处理，将其转换为文本描述，增强原始语句的情感特征；将等同于停用词一类的无用信息进行数据清洗；并对语句进行分词。

进一步的，所述S2具体为：

将经过预处理的句子及其对应的方面词拼接为“文本开始符号+待分析的句子+文本分隔及结束符号+方面词+文本分隔及结束符号”形式的输入文本序列；将文本序列输入进所述SKEP预训练模型中，得到词向量表示与上下文信息整合后的语义信息。

进一步的，所述S3具体为：

将所述SKEP预训练模型提取到的语义信息输入到多层神经网络中，多层神经网络接收到语义信息后，会在每个单词的位置输出一个前向向量和后向向量，然后将每个时间步骤对应的两个向量进行拼接，作为最终的输出向量；在这些上下文向量中应用Attention机制，获得整个文本序列的语义向量，再通过门限卷积神经网络获取更深层信息。

进一步的，所述多层神经网络由门限卷积神经网络和BiLSTM构成。

进一步的，所述S4具体为：

将所述S3得到的更深层信息输入一个输出层中，所述输出层包括一个全连接层和softmax，获得p个输出，其中p代表情感分析任务中包含的不同的情感极性数量；最终完成细粒度情感分类。

进一步的，采用Adam优化器对所述SKEP预训练模型进行优化，优化过程中使用交叉熵作为损失函数。

本发明的技术效果：

本发明采用SKEP-BiLSTM-融合注意力的门限卷积神经网络模型，增强了方面词与评论语句的关联，引入BiLSTM与门限卷积神经网络，能对情感特征进行深度提取。

附图说明

附图大体上通过举例而不是限制的方式示出各种实施例，并且与说明书以及权利要求书一起用于对所发明的实施例进行说明。在适当的时候，在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的，而并非旨在作为本装置或方法的穷尽或排他实施例。

图1示出了本发明的步骤示意图；

图2示出了本发明的流程示意图；

图3示出了本发明的架构示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

如图1所示，

对数据进行预处理；

S1获取待分析的句子及其对应的方面词；

S2将经过预处理后所述S1获取的句子及其对应的方面词拼接输入到SKEP预训练模型进行处理，获得每个词向量与上下文信息整合后的语义信息；

S4将所述S3提取出的更深层次信息输入全连接层进行细粒度情感预测，得到情感分类结果。

所述预处理具体为：

所述S2具体为：

将经过预处理后的句子及其对应的方面词拼接为“文本开始符号+待分析的句子+文本分隔及结束符号+方面词+文本分隔及结束符号”形式的输入文本序列；将文本序列输入进所述SKEP预训练模型中，得到词向量表示与上下文信息整合后的语义信息。

所述S3具体为：

所述多层神经网络由门限卷积神经网络和BiLSTM构成。

所述S4具体为：

将所述S3得到的更深层信息输入一个输出层中，包括一个全连接层和softmax，获得p个输出，其中p代表情感分析任务中包含的不同的情感极性数量；最终完成细粒度情感分类。

采用Adam优化器对所述SKEP预训练模型进行优化，优化过程中使用交叉熵作为损失函数。

以上所述，仅为本发明优选的具体实施方式，但本发明的保护范围不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种细粒度情感分类方法，其特征在于，所述方法包括：

S1获取待分析的句子及其对应的方面词，并进行预处理；

S4将所述S3提取出的更深层次信息输入到输出层进行细粒度情感预测，得到情感分类结果。

2.根据权利要求1所述的细粒度情感分类方法，其特征在于，所述预处理具体为：

对待分析的句子及其对应的方面词中包含的emoji表情进行转义处理，将其转换为文本描述，增强原始语句的情感特征；将等同于停用词一类的无用信息进行数据清洗，并对语句进行分词。

3.根据权利要求1所述的细粒度情感分类方法，其特征在于，所述S2具体为：

将经过与处理后的句子及其对应的方面词拼接为“文本开始符号+待分析的句子+文本分隔及结束符号+方面词+文本分隔及结束符号”形式的输入文本序列；将文本序列输入进所述SKEP预训练模型中，得到词向量表示与上下文信息整合后的语义信息。

4.根据权利要求1所述的细粒度情感分类方法，其特征在于，所述S3具体为：

5.根据权利要求4所述的细粒度情感分类方法，其特征在于，所述多层神经网络由门限卷积神经网络和BiLSTM构成。

6.根据权利要求1所述的细粒度情感分类方法，其特征在于，所述S4具体为：

将所述S3得到的更深层信息输入到输出层，获得p个输出，其中p代表情感分析任务中包含的不同的情感极性数量，最终完成细粒度情感分类。

7.根据权利要求1所述的细粒度情感分类方法，其特征在于，采用Adam优化器对所述SKEP预训练模型进行优化，优化过程中使用交叉熵作为损失函数。