CN113806541A - 情感分类的方法和情感分类模型的训练方法、装置 - Google Patents
情感分类的方法和情感分类模型的训练方法、装置 Download PDFInfo
- Publication number
- CN113806541A CN113806541A CN202111102932.3A CN202111102932A CN113806541A CN 113806541 A CN113806541 A CN 113806541A CN 202111102932 A CN202111102932 A CN 202111102932A CN 113806541 A CN113806541 A CN 113806541A
- Authority
- CN
- China
- Prior art keywords
- text
- feature
- emotion
- network
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 338
- 238000013145 classification model Methods 0.000 title claims abstract description 95
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000012549 training Methods 0.000 title claims abstract description 42
- 238000000605 extraction Methods 0.000 claims abstract description 83
- 230000004927 fusion Effects 0.000 claims description 53
- 230000002996 emotional effect Effects 0.000 claims description 36
- 238000010606 normalization Methods 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 230000015654 memory Effects 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims 1
- 238000003058 natural language processing Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 18
- 230000007246 mechanism Effects 0.000 description 14
- 239000011159 matrix material Substances 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本公开提供了一种采用情感分类模型进行情感分类的方法和情感分类模型的训练方法,涉及人工智能领域,具体涉及自然语言处理领域、深度学习领域和云计算领域,可以但不限于应用于智慧城市等场景中。采用情感分类模型进行情感分类的方法的具体实现方案为:将待处理文本输入情感分类模型的特征提取网络,得到待处理文本的第一文本特征;基于第一文本特征,采用情感分类模型的方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别;以及基于第一方面类别特征和第一文本特征,采用情感分类模型的情感分类网络确定待处理文本在多个预定方面类别的情感类别。
Description
技术领域
本公开涉及人工智能技术领域,具体涉及自然语言处理领域、深度学习领域和云计算领域,尤其涉及一种情感分类的方法和情感分类模型的训练方法、装置、设备和介质。
背景技术
随着计算机技术和网络技术的发展,深度学习技术在自然语言处理中得到了广泛应用。情感分析是自然语言处理中一项重要的任务,它是指通过计算机等辅助手段,判断人们在文本中对产品、对象、事件、服务、主题及其属性所持有的情感、看法等感受。
发明内容
基于此,本公开提供了一种提高情感分类精度和避免模型欠拟合的采用情感分类模型进行情感分类的方法和情感分类模型的训练方法、装置、设备和存储介质。
根据本公开的一个方面,提供了一种采用情感分类模型进行情感分类的方法,其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络;该方法包括:将待处理文本输入特征提取网络,得到待处理文本的第一文本特征;基于第一文本特征,采用方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别;以及基于第一方面类别特征和第一文本特征,采用情感分类网络确定待处理文本在多个预定方面类别的情感类别。
根据本公开的另一个方面,提供了一种情感分类模型的训练方法,其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络,该方法包括:将文本样本输入特征提取网络,得到文本样本的第二文本特征;文本样本包括文本的实际方面类别和实际方面类别的情感类别;基于第二文本特征,采用方面分类网络确定文本样本的第二方面类别特征和多个预定方面类别中文本样本的预测方面类别;基于第二方面类别特征和第二文本特征,采用情感分类网络确定文本样本在多个预定方面类别的预测情感类别;以及基于实际方面类别、预测方面类别、实际方面类别的情感类别和文本样本在实际方面类别的预测情感类别,对情感分类模型进行训练。
根据本公开的另一方面,提供了一种采用情感分类模型进行情感分类的装置,其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络;该装置包括:第一文本特征获得模块,用于将待处理文本输入特征提取网络,得到待处理文本的第一文本特征;第一方面类别预测模块,用于基于第一文本特征,采用方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别;以及第一情感类别预测模块,用于基于第一方面类别特征和第一文本特征,采用情感分类网络确定待处理文本在多个预定方面类别的情感类别。
根据本公开的另一方面,提供了一种情感分类模型的训练装置,其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络;该装置包括:第二文本特征获得模块,用于将文本样本输入特征提取网络,得到文本样本的第二文本特征;文本样本包括文本的实际方面类别和实际方面类别的情感类别;第二方面类别预测模块,用于基于第二文本特征,采用方面分类网络确定文本样本的第二方面类别特征和多个预定方面类别中文本样本的预测方面类别;第二情感类别预测模块,用于基于第二方面类别特征和第二文本特征,采用情感分类网络确定文本样本在多个预定方面类别的预测情感类别;以及模型训练模块,用于基于实际方面类别、预测方面类别、实际方面类别的情感类别和文本样本在实际方面类别的预测情感类别,对情感分类模型进行训练。
根据本公开的另一个方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提供的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法。
根据本公开的另一个方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提供的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法。
根据本公开的另一个方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开提供的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例的采用情感分类模型进行情感分类的方法和情感分类模型的训练方法、装置的应用场景示意图;
图2是根据本公开实施例的采用情感分类模型进行情感分类的方法的流程示意图;
图3是根据本公开实施例的得到待处理文本的第一文本特征的原理示意图;
图4是根据本公开实施例的确定第一方面类别特征和待处理文本的方面类别的原理示意图;
图5是根据本公开实施例的确定待处理文本在多个预定方面的情感类别的原理示意图;
图6是根据本公开另一实施例的确定待处理文本在多个预定方面的情感类别的原理示意图;
图7是根据本公开实施例的情感分类模型的训练方法的流程示意图;
图8是根据本公开实施例的采用情感分类模型进行情感分类的装置的结构框图;
图9是根据本公开实施例的情感分类模型的训练装置的结构框图;以及
图10是用来实施本公开实施例的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开提供了一种采用情感分类模型进行情感分类的方法,其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络。该方法包括文本特征提取阶段、方面类别预测阶段和情感类别预测阶段。在文本特征提取阶段中,将待处理文本输入特征提取网络,得到待处理文本的第一文本特征。在方面类别预测阶段中,基于第一文本特征,采用方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别。在情感类别预测阶段中,基于第一方面类别特征和第一文本特征,采用情感分类网络确定待处理文本在多个预定方面类别的情感类别。
以下将结合图1对本公开提供的方法和装置的应用场景进行描述。
图1是根据本公开实施例的采用情感分类模型进行情感分类的方法和情感分类模型的训练方法、装置的应用场景示意图。
如图1所示,该应用场景100可以包括终端设备110。
示例性地,该终端设备110可以为具有处理功能的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式电脑等。该终端设备110例如可以用于对文本120进行识别,以对文本进行分类,得到分类结果130。其中,分类结果130可以包括预定数量个方面(Aspect)中文本所涉及的方面,还可以包括该文本所涉及的各个方面的情感极性。其中,文本120可以为用户输入或上传的文本,也可以为终端设备110对语音数据转换所得到的文本,本公开对此不做限定。
例如,文本所涉及的方面可以包括环境方面、口味方面、服务方面等。情感极性可以包括好、一般、不好等预定极性。具体方面和情感极性可以根据实际需求预先设定,本公开对此不做限定。
在一实施例中,如图1所示,该应用场景100还可以包括服务器140。终端设备110可以通过网络与服务器140通信连接。服务器140可以是为终端设备110中应用程序的运行提供支持的各种后台管理服务器。
例如,该服务器140可以从数据库150中获取具有标签的文本,并根据获取的文本对情感分类模型160进行训练。其中,标签指示文本所涉及的方面及该方面的情感极性。在服务器140完成对情感分类模型160的训练后,例如可以响应于终端设备110发送的请求,向终端设备110发送训练好的情感分类模型160。如此,终端设备110可以根据接收到的情感分类模型160来对文本120进行处理。
在一实施例中,终端设备110还可以将文本120发送给服务器140,由服务器140采用情感分类模型对该文本120进行识别,实现对文本120的分类。
需要说明的是,本公开所提供的采用情感分类模型进行情感分类的方法一般可以由终端设备110执行,也可以由服务器140执行。相应地,本公开所提供的采用情感分类模型进行情感分类的装置一般可以设置在终端设备110中,也可以设置在服务器140中。本公开所提供的情感分类模型的训练方法一般可以由服务器140执行,或者由与服务器140通信连接的其他服务器执行。相应地,本公开所提供的情感分类模型的训练装置一般可以设置在服务器140中,或者设置在与服务器140通信连接的其他服务器中。
应该理解,图1中的终端设备、服务器和数据库的数目和类型仅仅是示意性的。根据实现需要,可以具有任意数目和类型的终端设备、服务器和数据库。
以下将结合图1,通过以下图2~图6对本公开提供的采用情感分类模型进行情感分类的方法进行详细描述。
图2是根据本公开实施例的采用情感分类模型进行情感分类的方法的流程示意图。
如图2所示,该实施例的采用情感分类模型进行情感分类的方法200可以包括操作S210~操作S230。其中,情感分类模型可以包括特征提取网络、方面分类网络和情感分类网络。
在操作S210,将待处理文本输入特征提取网络,得到待处理文本的第一文本特征。
根据本公开的实施例,可以对待处理文本进行分词处理,得到词序列。随后将待处理文本以词序列的形式输入特征提取网络。其中,特征提取网络可以为词嵌入网络,用于利用词嵌入矩阵,将词序列转换为向量序列。该向量序列可以组成特征矩阵,得到待处理文本的文本特征。
在一实施例中,特征提取网络还可以包括有循环神经网络,该循环神经网络例如可以为长短期记忆(Long-Short Term Memory)网络。在得到向量序列后,可以将该向量序列输入循环神经网络,将循环神经网络输出的特征数据作为第一文本特征。
在操作S220,基于第一文本特征,采用方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别。
根据本公开的实施例,方面分类网络可以用于执行方面类别检测(AspectCategory Detection)任务。该方面分类网络可以采用由多层感知器(Multi-LayerPerception,MLP)和基于激活函数的输出层组成的架构。
该实施例可以将第一文本特征输入方面分类网络,经由多层感知器的处理得到待处理文本的第一方面类别特征。该第一方面类别特征经由输出层处理后,可以输出概率向量,该概率向量包括多个概率值,分别表示待处理文本属于多个预定方面类别的概率。该实施例可以将概率向量中大于预定阈值的概率值对应的预定方面类别作为待处理文本的方面类别。
在操作S230,基于第一方面类别特征和第一文本特征,采用情感分类网络确定待处理文本在多个预定方面类别的情感类别。
根据本公开的实施例,情感分类网络的结构可以与前述方面分类网络的结构类似,区别在于,情感分类网络中多层感知器的网络参数与方面分类网络中多层感知器的网络参数存在区别,且情感分类网络中输出层的网络参数与方面分类网络中输出层的网络参数存在区别。
该实施例可以将第一方面类别特征和第一文本特征的内积作为情感分类网络的输入。经由情感分类网络处理后,输出待处理文本在多个预定方面类别中各类别的情感概率。例如,该情感分类网络的输出包括针对每个预定方面类别的二分类概率。根据该二分类概率与情感阈值之间的大小关系,可以确定每个预定方面类别的情感类别。
根据本公开的实施例,可以根据前述确定的待处理文本的方面类别,基于针对该待处理文本的方面类别的情感概率,确定针对该待处理文本的方面类别的情感类别。从而完成对待处理文本的方面分类任务和基于方面的情感分类任务。
本公开实施例的技术方案,通过将方面分类任务和基于方面的情感分类任务进行联合执行,可以避免相关技术中因针对每个方面类别分别进行情感预测,而存在一些方面类别的数据不足而情感分类模型欠拟合的问题。这是由于本公开实施例通过将实现方面分类任务的方面类别特征和文本特征相结合来完成情感分类,可以为情感分类提供方面信息,针对多个方面类别来进行情感预测,因此模型的精度不受数据量的影响,可以进一步提高情感分类精度。
图3是根据本公开实施例的得到待处理文本的第一文本特征的原理示意图。
根据本公开的实施例,在提取第一文本特征时,可以提取文本的语义特征,以此提高基于第一文本特征得到的方面类别和情感类别的准确性。
例如,该实施例中的特征提取网络可以包括文本转换子网络和语义提取子网络。其中,文本转换子网络可以为前文描述的词嵌入网络,语义提取子网络可以为双向长短期记忆(Bi-directional LSTM,Bi-LSTM)网络,或者基于注意力的模型(例如Transformer模型等)。
相应地,前述将待处理文本输入特征提取网络,得到待处理文本的第一文本特征的操作可以先将待处理文本输入文本转换子网络,得到文本向量特征。然后将文本向量特征输入语义提取子网络,得到文本语义特征。该文本向量特征和文本语义特征构成第一文本特征。
例如,如图3所示,在该实施例300中,若待处理文本的词序列301为{w1,w2,…,wn},将该词序列301输入文本转换子网络310,可以得到表示待处理文本的矩阵302,作为文本向量特征。该矩阵302中的每一行表示词序列301中的一个词。将该矩阵302输入语义提取子网络320,可以得到具有词序信息的矩阵303,作为文本语义特征。
根据本公开的实施例,还可以在特征提取网络中设置注意力层,该注意力层可以基于注意力机制对前述的文本向量特征和/或文本语义特征进行加权,以使得加权得到的特征更能表达待处理文本的方面类别。其中,注意力机制可以比拟为一种池化处理,通常可以包括三步:第一步是输入信息;第二步是计算注意力分布;第三步是根据注意力分布计算输入信息的加权平均。
例如,如图3所示,该实施例300中,特征提取网络除了文本转换子网络310和语义提取子网络320外,还包括第一方面注意力子网络330和第二方面注意力子网络340。
在得到文本向量特征后,可以将作为文本向量特征的矩阵302输入第一方面注意力子网络,得到第一方面特征304,以更为准确地表示待处理文本的方面特征。在得到语义特征后,可以将作为文本语义特征的矩阵303输入第二方面注意力子网络,得到第二方面特征305。该第二方面特征除了表征待处理文本的语义外,还可以更为准确地表示待处理文本的方面特征。
如此,可以将得到的第一方面特征和第二方面特征均作为第一文本特征的一部分。
图4是根据本公开实施例的确定第一方面类别特征和待处理文本的方面类别的原理示意图。
根据本公开的实施例,在第一文本特征包括文本向量特征和文本语义特征的情况下,可以先将该两部分特征融合。随后基于融合后的特征来确定待处理文本的第一方面类别特征和待处理文本的方面类别。
示例性地,前述方面类别特征提取子网络可以包括第一融合子网络、方面类别特征提取子网络和第一分类子网络。其中,第一融合子网络例如可以通过concat()函数来对输入的两部分特征进行融合。方面类别特征提取子网络可以为前文描述的MLP。第一分类子网络可以为前文提及的输出层,该输出层可以基于sigmoid等逻辑回归函数对输入输出层的数据映射至(0,1)的区间。
根据本公开的实施例,如图4所示,该实施例400中,在第一文本特征还包括词序列401经由文本转换子网络410和第一方面注意力子网络430的处理而得到的第一方面特征404,以及词序列401经由文本转换子网络410、语义提取子网络420和第二方面注意力子网络440依次处理而得到的第二方面特征405的情况下,可以将第一方面特征404和第二方面特征405输入方面分类网络包括的第一融合子网络450,得到融合方面特征406。例如,拼接第一方面特征和第二方面特征可以得到该融合方面特征。将融合方面特征输入方面分类网络包括的方面类别特征提取子网络460,可以由该方面类别特征提取子网络460输出第一方面类别特征。该第一方面类别特征输入方面分类网络包括的第一分类子网络470,由该第一分类子网络470输出待处理文本的方面类别。或者由第一分类子网络470输出待处理文本涉及多个预定方面类别中各个类别的概率所组成的概率向量。由该概率向量可以确定待处理文本的方面类别。
该实施例通过融合第一方面特征和第二方面特征,可以使得融合方面特征能够更为准确、完整地表达待处理文本的方面倾向。因此,基于该融合方面特征来完成方面类别预测任务,可以提高预测得到的方面类别的准确性。
图5是根据本公开实施例的确定待处理文本在多个预定方面的情感类别的原理示意图。
根据本公开的实施例,在提取第一文本特征时,还可以基于注意力机制对前述的文本向量特征和/或文本语义特征进行加权,以使得加权得到的特征更能表达待处理文本的情感极性。该注意力机制与前文使得特征更能表达待处理文本的方面类别的注意力机制类似,区别仅在于两个注意力机制的输入信息和计算得到的注意力分布不同,计算加权平均采用的权重不同。
根据本公开的实施例,还可以基于注意力机制对前述的第一方面特征和第二方面特征进行加权,以使得加权得到的特征能够表达情感极性与方面类别之间的关系。也可以对文本向量特征和第一方面特征的整体进行加权。
根据本公开的实施例,还可以采用注意力机制对前述的文本向量特征和第一方面特征的拼接特征进行处理,并采用注意力机制对前述的文本语义特征和所述第二方面特征进行处理。通过该方式,可以在表达情感极性与方面类别之间的关系的同时,保证对除方面特征外其他非方面特征信息的完整表达。从而可以保证采用注意力机制得到的特征能够更为完整的表达情感特征。
示例性地,如图5所示,该实施例500中,特征提取网络除了文本转换子网络510、语义提取子网络520、第一方面注意力子网络530和第二方面注意力子网络540外,还可以包括第一情感注意力子网络530’、第二情感注意力子网络540’和第二融合子网络580。在词序列501经由文本转换子网络510处理而得到文本向量特征,文本向量特征经由第一方面注意力子网络530处理而得到第一方面特征504后,可以将文本向量特征和第一方面特征504输入第一情感注意力子网络530’,经由该第一情感注意力子网络530’处理,得到第一情感特征。在文本向量特征经由语义提取子网络520处理而得到文本语义特征,且文本语义特征经由第二方面注意力子网络540处理而得到第二方面特征505后,可以将文本语义特征和第二方面特征505输入第二情感注意力子网络540’,经由该第二情感注意力子网络540’处理,得到第二情感特征。在得到第一情感特征和第二情感特征后,可以将该第一情感特征和第二情感特征输入第二融合子网络580,经由该第二融合子网络处理,得到融合情感特征。如此,第一文本特征还应包括该融合情感特征。
例如,第一情感注意力子网络530’可以先对文本向量特征和第一方面特征进行拼接。然后采用注意力机制对拼接后的特征进行处理,得到第一情感特征。类似地,第二情感注意力子网络540’采用注意力机制对拼接文本语义特征和所述第二方面特征得到的特征进行处理,得到第二情感特征。
例如,第二融合子网络用于通过concat()函数来对第一情感特征和第二情感特征进行融合,得到融合情感特征。
在得到融合情感特征后,该实施例可以将融合情感特征作为情感分类网络的一部分输入,将第一方面特征和第二方面特征经由第一融合子网络550和方面类别特征提取子网络560处理后得到的第一方面类别特征输入情感分类网络590,经由该情感分类网络590处理后,输出待处理文本针对多个预定方面的二分类概率。基于该二分类概率来确定每个预定方面类别的情感类别。
该实施例通过设置采用注意力机制对从待处理文本中提取的语义特征、方面特征进行处理,可以使得处理得到的情感特征能够更为准确地表达待处理文本在预定方面的情感倾向。因此,基于采用注意力机制处理后得到的特征来完成情感类别的预测任务,可以提高预测得到的各方面类别的情感类别的准确性。
图6是根据本公开另一实施例的确定待处理文本在多个预定方面的情感类别的原理示意图。
根据本公开的实施例,前述情感分类网络例如可以采用注意力交互模型(Attention-Over-Attention,AOA)来完成情感类别的预测任务。通过该模型,可以充分考虑待处理文本的语义到方面特征的关注度和方面特征到待处理文本的语义的关注度,从而可以提高情感分类结果的精度。
如图6所示,该实施例600中,情感分类网络可以包括关系提取子网络691、第一回归子网络692、第二回归子网络693和分类子网络694。
在得到融合情感特征601和第一方面类别特征602后,可以将该融合情感特征601和第一方面类别特征602输入关系提取子网络691,经由该关系提取子网络691处理后,得到关系特征。其中,关系提取子网络691例如可以用于对融合情感特征601和第一方面类别特征602进行点乘,将点乘得到的特征作为关系特征。该关系特征可以表示方面类别与情感类别之间的匹配关系。
在得到关系特征后,可以将关系特征分别输入第一回归子网络692和第二回归子网络693,由该第一回归子网络692和第二回归子网络693处理后,分别得到第一注意力特征和第二注意力特征。其中,第一回归子网络692例如可以采用softmax函数对表示关系特征的矩阵进行列方向的归一化,即针对表示关系特征的矩阵中的每一列做softmax归一化,得到表示方面类别到语义的注意力的关注,即给定一个方面类别,对待处理文本中每个词的注意力。第二回归子网络693例如可以采用softmax函数对表示关系特征的矩阵进行行方向的归一化,即针对表示关系特征的矩阵中的每一行做softmax归一化,得到表示语义到方面类别的注意力的关注,即给定一个待处理文本中的词,对方面类别中每个方面的注意力。该第二回归子网络例如还可以对针对每一行做softmax归一化得到的特征进行平均,以得到平均的方面级别关注。将表示平均的方面级别关注的量作为第二注意力特征。
在得到第一注意力特征和第二注意力特征后,可以基于该第一注意力特征和第二注意力特征,采用分类子网络694来确定待处理文本在多个预定方面的情感类别。
在一实施例中,可以综合考虑第一注意力特征、第二注意力特征和融合情感特征,来采用分类子网络完成情感分类任务。通过该方式,可以避免因归一化过程中一些情感特征的丢失而导致的分类结果不精准的问题。因此,通过该方式,可以提高情感分类任务的精度。在得到第一注意力特征和第二注意力特征后,可以将该两个注意力特征输入第一融合层6941,经由该第一融合层6941处理后得到融合后特征。该第一融合层6941例如可以通过计算两个注意力特征的点集,实现对两个注意力特征的融合。在得到融合后特征后,可以将融合后特征和融合情感特征输入第二融合层6942,经由该第二融合层6942处理后得到情感类别特征。该第二融合层6942与第一融合层6941的工作原理类似,在此不再赘述。在得到情感类别特征后,将情感类别特征输入归一化层6943,获得待处理文本在多个预定方面的情感类别。
例如,该归一化层6943可以采用softmax函数作为归一化函数,情感类别特征经由该归一化层6943处理后,可以得到针对多个预定方面的情感类别概率。基于该概率,可以得到待处理文本在多个预定方面的情感类别。
为了便于实现前文描述的采用情感分类模型进行情感分类的方法,本公开还提供了一种情感分类模型的训练方法。以下将结合图7对该情感分类模型的训练方法进行详细描述。
图7是根据本公开实施例的情感分类模型的训练方法的流程示意图。
如图7所示,该实施例的情感分类模型的训练方法700可以包括操作S710~操作S740。其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络。
在操作S710,将文本样本输入所述特征提取网络,得到文本样本的第二文本特征。其中,文本样本包括文本的实际方面类别和实际方面类别的情感类别。该操作S710与前文描述的操作S210类似,在此不再赘述。
在操作S720,基于第二文本特征,采用方面分类网络确定文本样本的第二方面类别特征和多个预定方面类别中文本样本的预测方面类别。该操作S720与前文描述的操作S220类似,在此不再赘述。
在操作S730,基于第二方面类别特征和第二文本特征,采用情感分类网络确定文本样本在多个预定方面类别的预测情感类别。该操作S730与前文描述的操作S230类似,在此不再赘述。
在操作S740,基于实际方面类别、预测方面类别、实际方面类别的情感类别和文本样本在实际方面类别的预测情感类别,对情感分类模型进行训练。
根据本公开的实施例,可以先根据实际方面类别与预测方面类别来确定第一预定损失函数的取值。并根据实际方面类别的情感类别和文本样本在实际方面类别的预测情感类别,确定第二预定损失函数的取值。最后将该第一预定损失函数的取值与第二预定损失函数的取值的加权和作为情感分类模型的损失。采用反向传播算法对该情感分类模型进行训练,以最小化情感分类模型的损失。
例如,第一预定损失函数和第二预定损失函数均可以采用交叉熵损失函数、铰链损失函数、平方铰链损失函数中的任一种损失函数,也可以采用相关技术中的其他可以用于二分类场景的损失函数,本公开对此不做限定。
通过本公开实施例设置的情感分类模型,可以使多个预定方面类别使用共享的情感预测层,从而可以在各方面类别之间传递情感知识。相较于相关技术,可以缓解数据缺失带来的过拟合的问题,并因此可以提高采用情感分类模型得到的情感分类结果的准确性。
基于前文描述的采用情感分类模型进行情感分类的方法,本公开还提供了一种采用情感分类模型进行情感分类的装置。以下将结合图8对该装置进行详细描述。
图8是根据本公开实施例的采用情感分类模型进行情感分类的装置的结构框图。
如图8所示,该实施例的采用情感分类模型进行情感分类的装置800可以包括第一文本特征获得模块810、第一方面类别预测模块820和第一情感类别预测模块830。其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络。
第一文本特征获得模块810用于将待处理文本输入特征提取网络,得到待处理文本的第一文本特征。在一实施例中,第一文本特征获得模块810可以用于执行前文描述的操作S210,在此不再赘述。
第一方面类别预测模块820用于基于第一文本特征,采用方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别。在一实施例中,第一方面类别预测模块820可以用于执行前文描述的操作S220,在此不再赘述。
第一情感类别预测模块830用于基于第一方面类别特征和第一文本特征,采用情感分类网络确定待处理文本在多个预定方面类别的情感类别。在一实施例中,第一情感类别预测模块830可以用于执行前文描述的操作S230,在此不再赘述。
根据本公开的实施例,特征提取网络包括文本转换子网络和语义提取子网络。上述第一文本特征获得模块810可以包括文本向量获得子模块和文本语义获得子模块。文本向量获得子模块用于将待处理文本输入文本转换子网络,得到文本向量特征。文本语义获得子模块用于将文本向量特征输入语义提取子网络,得到文本语义特征。其中,第一文本特征包括文本向量特征和文本语义特征。
根据本公开的实施例,特征提取网络还包括第一方面注意力子网络和第二方面注意力子网络。上述第一文本特征获得模块还可以包括第一方面特征获得子模块和第二方面特征获得子模块。第一方面特征获得子模块用于将文本向量特征输入第一方面注意力子网络,得到第一方面特征。第二方面特征获得子模块用于将文本语义特征输入第二方面注意力子网络,得到第二方面特征。其中,第一文本特征还包括第一方面特征和第二方面特征。
根据本公开的实施例,方面分类网络包括第一融合子网络、方面类别特征提取子网络和第一分类子网络。第一方面类别预测模块可以包括方面特征融合子模块、方面类别特征获得子模块和方面类别预测子模块。方面特征融合子模块用于将第一方面特征和第二方面特征输入第一融合子网络,得到融合方面特征。方面类别特征获得子模块用于将融合方面特征输入方面类别特征提取子网络,得到第一方面类别特征。方面类别预测子模块用于将第一方面类别特征输入第一分类子网络,获得多个预定方面类别中待处理文本的方面类别。
根据本公开的实施例,特征提取网络还包括第一情感注意力子网络、第二情感注意力子网络和第二融合子网络。第一文本特征获得模块还包括第一情感特征获得子模块、第二情感特征获得子模块和情感特征融合子模块。第一情感特征获得子模块用于将文本向量特征和第一方面特征输入第一情感注意力子网络,得到第一情感特征。第二情感特征获得子模块用于将文本语义特征和第二方面特征输入第二情感注意力子网络,得到第二情感特征。情感特征融合子模块用于将第一情感特征和第二情感特征输入第二融合子网络,得到融合情感特征。其中,第一文本特征还包括融合情感特征。
根据本公开的实施例,上述第一情感类别预测模块830用于将融合情感特征和第一方面类别特征输入情感分类网络,得到待处理文本在多个预定方面的情感类别。
根据本公开的实施例,情感分类网络包括关系提取子网络、第一回归子网络、第二回归子网络和分类子网络。第一情感类别预测模块830包括关系特征获得子模块、注意力特征获得子模块和情感类别预测子模块。关系特征获得子模块用于将融合情感特征和第一方面类别特征输入关系提取子网络,得到关系特征。注意力特征获得子模块用于将关系特征分别输入第一回归子网络和第二回归子网络,分别得到第一注意力特征和第二注意力特征。情感类别预测子模块用于基于第一注意力特征和第二注意力特征,采用分类子网络确定待处理文本在多个预定方面的情感类别。
根据本公开的实施例,分类子网络包括第一融合层、第二融合层和归一化层。上述情感类别预测子模块可以包括第一特征融合单元、第二特征融合单元和情感类别预测单元。第一特征融合单元用于将第一注意力特征和第二注意力特征输入第一融合层,得到融合后特征。第二特征融合单元用于将融合后特征和融合情感特征输入第二融合层,得到情感类别特征。情感类别预测单元用于将情感类别特征输入归一化层,获得待处理文本在多个预定方面的情感类别。
基于前文描述的情感分类模型的训练方法,本公开还提供了一种情感分类模型的训练装置。以下将结合图9对该装置进行详细描述。
图9是根据本公开实施例的情感分类模型的训练装置的结构框图。
如图9所示,该实施例的情感分类模型的训练装置900可以包括第二文本特征获得模块910、第二方面类别预测模块920、第二情感类别预测模块930和模型训练模块940。其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络。
第二文本特征获得模块910用于将文本样本输入特征提取网络,得到文本样本的第二文本特征。其中,文本样本包括文本的实际方面类别和实际方面类别的情感类别。在一实施例中,第二文本特征获得模块910可以用于执行前文描述的操作S710,在此不再赘述。
第二方面类别预测模块920用于基于第二文本特征,采用方面分类网络确定文本样本的第二方面类别特征和多个预定方面类别中文本样本的预测方面类别。在一实施例中,第二方面类别预测模块920可以用于执行前文描述的操作S720,在此不再赘述。
第二情感类别预测模块930用于基于第二方面类别特征和第二文本特征,采用情感分类网络确定文本样本在多个预定方面类别的预测情感类别。在一实施例中,第二情感类别预测模块930可以用于执行前文描述的操作S730,在此不再赘述。
模型训练模块940用于基于实际方面类别、预测方面类别、实际方面类别的情感类别和文本样本在实际方面类别的预测情感类别,对情感分类模型进行训练。在一实施例中,模型训练模块940可以用于执行前文描述的操作S740,在此不再赘述。
需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取、收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图10示出了可以用来实施本公开实施例的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图10所示,设备1000包括计算单元1001,其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序,来执行各种适当的动作和处理。在RAM 1003中,还可存储设备1000操作所需的各种程序和数据。计算单元1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
设备1000中的多个部件连接至I/O接口1005,包括:输入单元1006,例如键盘、鼠标等;输出单元1007,例如各种类型的显示器、扬声器等;存储单元1008,例如磁盘、光盘等;以及通信单元1009,例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理,例如采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法。例如,在一些实施例中,采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1008。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到RAM 1003并由计算单元1001执行时,可以执行上文描述的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元1001可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。其中,服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(″Virtual Private Server″,或简称″VPS″)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (21)
1.一种采用情感分类模型进行情感分类的方法,其中,所述情感分类模型包括特征提取网络、方面分类网络和情感分类网络;所述方法包括:
将待处理文本输入所述特征提取网络,得到所述待处理文本的第一文本特征;
基于所述第一文本特征,采用所述方面分类网络确定所述待处理文本的第一方面类别特征和多个预定方面类别中所述待处理文本的方面类别;以及
基于所述第一方面类别特征和所述第一文本特征,采用所述情感分类网络确定所述待处理文本在所述多个预定方面类别的情感类别。
2.根据权利要求1所述的方法,其中,所述特征提取网络包括文本转换子网络和语义提取子网络:所述将待处理文本输入所述特征提取网络,得到所述待处理文本的第一文本特征包括:
将所述待处理文本输入所述文本转换子网络,得到文本向量特征;以及
将所述文本向量特征输入所述语义提取子网络,得到文本语义特征,
其中,所述第一文本特征包括所述文本向量特征和所述文本语义特征。
3.根据权利要求2所述的方法,其中,所述特征提取网络还包括第一方面注意力子网络和第二方面注意力子网络;所述将待处理文本输入所述特征提取网络,得到所述待处理文本的第一文本特征还包括:
将所述文本向量特征输入所述第一方面注意力子网络,得到第一方面特征;以及
将所述文本语义特征输入所述第二方面注意力子网络,得到第二方面特征,
其中,所述第一文本特征还包括所述第一方面特征和所述第二方面特征。
4.根据权利要求3所述的方法,其中,所述方面分类网络包括第一融合子网络、方面类别特征提取子网络和第一分类子网络;基于所述第一文本特征,采用所述方面分类网络确定所述待处理文本的第一方面类别特征和多个预定方面类别中所述待处理文本的方面类别包括:
将所述第一方面特征和所述第二方面特征输入所述第一融合子网络,得到融合方面特征;
将所述融合方面特征输入所述方面类别特征提取子网络,得到所述第一方面类别特征;以及
将所述第一方面类别特征输入所述第一分类子网络,获得所述多个预定方面类别中所述待处理文本的方面类别。
5.根据权利要求3所述的方法,其中,所述特征提取网络还包括第一情感注意力子网络、第二情感注意力子网络和第二融合子网络;所述将待处理文本输入所述特征提取网络,得到所述待处理文本的第一文本特征还包括:
将所述文本向量特征和所述第一方面特征输入所述第一情感注意力子网络,得到第一情感特征;
将所述文本语义特征和所述第二方面特征输入所述第二情感注意力子网络,得到第二情感特征;以及
将所述第一情感特征和所述第二情感特征输入所述第二融合子网络,得到融合情感特征,
其中,所述第一文本特征还包括所述融合情感特征。
6.根据权利要求5所述的方法,其中,所述基于所述第一方面类别特征和所述第一文本特征,采用所述情感分类网络确定所述待处理文本在所述多个预定方面的情感类别包括:
将所述融合情感特征和所述第一方面类别特征输入所述情感分类网络,得到所述待处理文本在所述多个预定方面的情感类别。
7.根据权利要求6所述的方法,其中,所述情感分类网络包括关系提取子网络、第一回归子网络、第二回归子网络和分类子网络;所述基于所述第一方面类别特征和所述第一文本特征,采用所述情感分类网络确定所述待处理文本在所述多个预定方面的情感类别包括:
将所述融合情感特征和所述第一方面类别特征输入所述关系提取子网络,得到关系特征;
将所述关系特征分别输入所述第一回归子网络和所述第二回归子网络,分别得到第一注意力特征和第二注意力特征;以及
基于所述第一注意力特征和所述第二注意力特征,采用所述分类子网络确定所述待处理文本在所述多个预定方面的情感类别。
8.根据权利要求7所述的方法,其中,所述分类子网络包括第一融合层、第二融合层和归一化层;所述基于所述第一注意力特征和所述第二注意力特征,采用所述分类子网络得到所述待处理文本在所述多个预定方面的情感类别包括:
将所述第一注意力特征和第二注意力特征输入所述第一融合层,得到融合后特征;
将所述融合后特征和所述融合情感特征输入所述第二融合层,得到情感类别特征;以及
将所述情感类别特征输入所述归一化层,获得所述待处理文本在所述多个预定方面的情感类别。
9.一种情感分类模型的训练方法,其中,所述情感分类模型包括特征提取网络、方面分类网络和情感分类网络;所述方法包括:
将文本样本输入所述特征提取网络,得到所述文本样本的第二文本特征;所述文本样本包括文本的实际方面类别和所述实际方面类别的情感类别;
基于所述第二文本特征,采用所述方面分类网络确定所述文本样本的第二方面类别特征和多个预定方面类别中所述文本样本的预测方面类别;
基于所述第二方面类别特征和所述第二文本特征,采用所述情感分类网络确定所述文本样本在所述多个预定方面类别的预测情感类别;以及
基于所述实际方面类别、所述预测方面类别、所述实际方面类别的情感类别和所述文本样本在所述实际方面类别的预测情感类别,对所述情感分类模型进行训练。
10.一种采用情感分类模型进行情感分类的装置,其中,所述情感分类模型包括特征提取网络、方面分类网络和情感分类网络;所述装置包括:
第一文本特征获得模块,用于将待处理文本输入所述特征提取网络,得到所述待处理文本的第一文本特征;
第一方面类别预测模块,用于基于所述第一文本特征,采用所述方面分类网络确定所述待处理文本的第一方面类别特征和多个预定方面类别中所述待处理文本的方面类别;以及
第一情感类别预测模块,用于基于所述第一方面类别特征和所述第一文本特征,采用所述情感分类网络确定所述待处理文本在所述多个预定方面类别的情感类别。
11.根据权利要求10所述的装置,其中,所述特征提取网络包括文本转换子网络和语义提取子网络:所述第一文本特征获得模块包括:
文本向量获得子模块,用于将所述待处理文本输入所述文本转换子网络,得到文本向量特征;以及
文本语义获得子模块,用于将所述文本向量特征输入所述语义提取子网络,得到文本语义特征,
其中,所述第一文本特征包括所述文本向量特征和所述文本语义特征。
12.根据权利要求11所述的装置,其中,所述特征提取网络还包括第一方面注意力子网络和第二方面注意力子网络;所述第一文本特征获得模块还包括:
第一方面特征获得子模块,用于将所述文本向量特征输入所述第一方面注意力子网络,得到第一方面特征;以及
第二方面特征获得子模块,用于将所述文本语义特征输入所述第二方面注意力子网络,得到第二方面特征,
其中,所述第一文本特征还包括所述第一方面特征和所述第二方面特征。
13.根据权利要求12所述的装置,其中,所述方面分类网络包括第一融合子网络、方面类别特征提取子网络和第一分类子网络;所述第一方面类别预测模块包括:
方面特征融合子模块,用于将所述第一方面特征和所述第二方面特征输入所述第一融合子网络,得到融合方面特征;
方面类别特征获得子模块,用于将所述融合方面特征输入所述方面类别特征提取子网络,得到所述第一方面类别特征;以及
方面类别预测子模块,用于将所述第一方面类别特征输入所述第一分类子网络,获得所述多个预定方面类别中所述待处理文本的方面类别。
14.根据权利要求12所述的装置,其中,所述特征提取网络还包括第一情感注意力子网络、第二情感注意力子网络和第二融合子网络;所述第一文本特征获得模块还包括:
第一情感特征获得子模块,用于将所述文本向量特征和所述第一方面特征输入所述第一情感注意力子网络,得到第一情感特征;
第二情感特征获得子模块,用于将所述文本语义特征和所述第二方面特征输入所述第二情感注意力子网络,得到第二情感特征;以及
情感特征融合子模块,用于将所述第一情感特征和所述第二情感特征输入所述第二融合子网络,得到融合情感特征,
其中,所述第一文本特征还包括所述融合情感特征。
15.根据权利要求14所述的装置,其中,所述第一情感类别预测模块用于:
将所述融合情感特征和所述第一方面类别特征输入所述情感分类网络,得到所述待处理文本在所述多个预定方面的情感类别。
16.根据权利要求15所述的装置,其中,所述情感分类网络包括关系提取子网络、第一回归子网络、第二回归子网络和分类子网络;所述第一情感类别预测模块包括:
关系特征获得子模块,用于将所述融合情感特征和所述第一方面类别特征输入所述关系提取子网络,得到关系特征;
注意力特征获得子模块,用于将所述关系特征分别输入所述第一回归子网络和所述第二回归子网络,分别得到第一注意力特征和第二注意力特征;以及
情感类别预测子模块,用于基于所述第一注意力特征和所述第二注意力特征,采用所述分类子网络确定所述待处理文本在所述多个预定方面的情感类别。
17.根据权利要求16所述的装置,其中,所述分类子网络包括第一融合层、第二融合层和归一化层;所述情感类别预测子模块包括:
第一特征融合单元,用于将所述第一注意力特征和第二注意力特征输入所述第一融合层,得到融合后特征;
第二特征融合单元,用于将所述融合后特征和所述融合情感特征输入所述第二融合层,得到情感类别特征;以及
情感类别预测单元,用于将所述情感类别特征输入所述归一化层,获得所述待处理文本在所述多个预定方面的情感类别。
18.一种情感分类模型的训练装置,其中,所述情感分类模型包括特征提取网络、方面分类网络和情感分类网络;所述装置包括:
第二文本特征获得模块,用于将文本样本输入所述特征提取网络,得到所述文本样本的第二文本特征;所述文本样本包括文本的实际方面类别和所述实际方面类别的情感类别;
第二方面类别预测模块,用于基于所述第二文本特征,采用所述方面分类网络确定所述文本样本的第二方面类别特征和多个预定方面类别中所述文本样本的预测方面类别;
第二情感类别预测模块,用于基于所述第二方面类别特征和所述第二文本特征,采用所述情感分类网络确定所述文本样本在所述多个预定方面类别的预测情感类别;以及
模型训练模块,用于基于所述实际方面类别、所述预测方面类别、所述实际方面类别的情感类别和所述文本样本在所述实际方面类别的预测情感类别,对所述情感分类模型进行训练。
19.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1~9中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1~9中任一项所述的方法。
21.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1~9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111102932.3A CN113806541A (zh) | 2021-09-16 | 2021-09-16 | 情感分类的方法和情感分类模型的训练方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111102932.3A CN113806541A (zh) | 2021-09-16 | 2021-09-16 | 情感分类的方法和情感分类模型的训练方法、装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113806541A true CN113806541A (zh) | 2021-12-17 |
Family
ID=78896023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111102932.3A Pending CN113806541A (zh) | 2021-09-16 | 2021-09-16 | 情感分类的方法和情感分类模型的训练方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113806541A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114443849A (zh) * | 2022-02-09 | 2022-05-06 | 北京百度网讯科技有限公司 | 一种标注样本选取方法、装置、电子设备和存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110704622A (zh) * | 2019-09-27 | 2020-01-17 | 北京明略软件***有限公司 | 文本情感分类方法、装置及电子设备 |
CN111930940A (zh) * | 2020-07-30 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 一种文本情感分类方法、装置、电子设备及存储介质 |
-
2021
- 2021-09-16 CN CN202111102932.3A patent/CN113806541A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110704622A (zh) * | 2019-09-27 | 2020-01-17 | 北京明略软件***有限公司 | 文本情感分类方法、装置及电子设备 |
CN111930940A (zh) * | 2020-07-30 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 一种文本情感分类方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
YUNCONG LI ET AL.: ""A Joint Model for Aspect-Category Sentiment Analysis with Shared Sentiment Prediction Layer"", 《CCL 2020》, pages 388 - 400 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114443849A (zh) * | 2022-02-09 | 2022-05-06 | 北京百度网讯科技有限公司 | 一种标注样本选取方法、装置、电子设备和存储介质 |
CN114443849B (zh) * | 2022-02-09 | 2023-10-27 | 北京百度网讯科技有限公司 | 一种标注样本选取方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114549874B (zh) | 多目标图文匹配模型的训练方法、图文检索方法及装置 | |
CN113989593A (zh) | 图像处理方法、检索方法、训练方法、装置、设备及介质 | |
CN113190702B (zh) | 用于生成信息的方法和装置 | |
CN113407677B (zh) | 评估咨询对话质量的方法、装置、设备和存储介质 | |
CN113360700A (zh) | 图文检索模型的训练和图文检索方法、装置、设备和介质 | |
CN113053367A (zh) | 语音识别方法、语音识别的模型训练方法以及装置 | |
CN110826327A (zh) | 情感分析方法、装置、计算机可读介质及电子设备 | |
CN112926308A (zh) | 匹配正文的方法、装置、设备、存储介质以及程序产品 | |
CN115099239B (zh) | 一种资源识别方法、装置、设备以及存储介质 | |
CN113641805A (zh) | 结构化问答模型的获取方法、问答方法及对应装置 | |
CN114429633A (zh) | 文本识别方法、模型的训练方法、装置、电子设备及介质 | |
CN112560461A (zh) | 新闻线索的生成方法、装置、电子设备及存储介质 | |
CN113392920B (zh) | 生成作弊预测模型的方法、装置、设备、介质及程序产品 | |
CN113468857B (zh) | 风格转换模型的训练方法、装置、电子设备以及存储介质 | |
CN112906368B (zh) | 行业文本增量方法、相关装置及计算机程序产品 | |
CN114037059A (zh) | 预训练模型、模型的生成方法、数据处理方法及装置 | |
CN112948584A (zh) | 短文本分类方法、装置、设备以及存储介质 | |
CN113806541A (zh) | 情感分类的方法和情感分类模型的训练方法、装置 | |
CN114707638A (zh) | 模型训练、对象识别方法及装置、设备、介质和产品 | |
CN115116080A (zh) | 表格解析方法、装置、电子设备和存储介质 | |
CN113886543A (zh) | 生成意图识别模型的方法、装置、介质及程序产品 | |
CN114417974A (zh) | 模型训练方法、信息处理方法、装置、电子设备和介质 | |
CN113688938A (zh) | 确定对象情感的方法、训练情感分类模型的方法及装置 | |
CN113850072A (zh) | 文本情感分析方法、情感分析模型训练方法、装置、设备及介质 | |
CN111274383B (zh) | 一种应用于报价的分类对象方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |