CN109308318A - 跨领域文本情感分类模型的训练方法、装置、设备及介质 - Google Patents
跨领域文本情感分类模型的训练方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN109308318A CN109308318A CN201810922343.1A CN201810922343A CN109308318A CN 109308318 A CN109308318 A CN 109308318A CN 201810922343 A CN201810922343 A CN 201810922343A CN 109308318 A CN109308318 A CN 109308318A
- Authority
- CN
- China
- Prior art keywords
- domain
- sample set
- target
- cross
- emotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 85
- 238000012549 training Methods 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000008451 emotion Effects 0.000 claims abstract description 110
- 230000002996 emotional effect Effects 0.000 claims abstract description 40
- 230000006870 function Effects 0.000 claims description 76
- 238000004590 computer program Methods 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 5
- 238000003058 natural language processing Methods 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 26
- 230000000694 effects Effects 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000005520 cutting process Methods 0.000 description 4
- 230000009977 dual effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000012141 concentrate Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明适用自然语言处理技术领域,提供了一种跨领域文本情感分类模型的训练方法、装置、设备及介质,该方法包括:在根据源领域样本集和目标领域样本集对跨领域文本情感分类模型进行初次训练后,根据训练好的跨领域文本情感分类模型对目标领域样本集进行情感分类,得到目标领域样本集中每个目标样本对应的情感预测标签和每个目标样本属于每个情感类别的隶属度,根据隶属度,通过模糊值公式计算每个目标样本的情感模糊值,将情感模糊值低于模糊阈值的目标样本和该目标样本对应的情感预测标签添加到源领域样本集中,根据该源领域样本集和目标领域样本集对跨领域文本情感分类模型进行再次训练,从而提高跨领域文本情感分类模型的情感分类准确率。
Description
技术领域
本发明属于自然语言处理技术领域,尤其涉及一种跨领域文本情感分类模型的训练方法、装置、设备及介质。
背景技术
文本情感分析是领域敏感的,由于不同领域的评论有不同的词分布,例如,“干净”一词在酒店评论中很常见,然而在书籍评论中却很少使用,所以,仅使用带标签的书籍评论数据训练的情感分类器对无标签的酒店评论数据进行情感倾向预测,则无法在酒店评论中获得令人满意的结果。
领域自适应算法旨在利用相关领域(源域)大量带标签样本来改进目标域样本的预测效果。领域对抗神经网络(Domain Adversarial Neural Network,简称DANN)使用领域分类器和梯度反转层进行无监督跨领域情感分类,并取得了较好的结果。DANN思想来源于生成对抗神经网络,不同之处在于生成对抗网络是用来生成数据的,而领域分类器使用梯度反转层来实现对抗训练,其目标是使领域分类器无法识别领域之间的差异,从而获得领域不变的特征表示,当获得了领域不变的特征表示后,任何监督学习的方法都可以用来在源域带标签样本上训练分类器。
对于跨领域情感分类来说领域不变的特征和样本本身的特性都是重要的,然而,通过DANN、双转移深层神经网络(Bi-transferring Deep Neural Networks,简称BTDNNs)或者最大平均差异(Maximum Mean Discrepancy,简称MMD)等用来约束源域和目标域之间分布一致性的方法,更多地关注领域不变特征而忽略样本本身的特性,造成情感分类不准确的问题。
此外,Bruzzone和Habrard等提出了迭代领域自适应图像处理方法,每次迭代使用类别均匀的目标域样本及其预测标签来替换相同数量的源域样本,不断进行训练以提高目标域图像分类准确率,在跨领域情感分类任务上尚未发现这种迭代训练的做法。
发明内容
本发明的目的在于提供一种跨领域文本情感分类模型的训练方法、装置、设备及介质,旨在解决由于现有技术无法提供一种有效的跨领域文本情感分类模型的训练方法,导致跨领域文本情感分类模型的情感分类不准确的问题。
一方面,本发明提供了一种跨领域文本情感分类模型的训练方法,所述方法包括下述步骤:
根据预设的源领域样本集和预设的目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,所述目标领域样本集中的每个目标样本为无标签样本;
根据训练好的所述跨领域文本情感分类模型对所述目标领域样本集进行情感分类,得到所述每个目标样本对应的情感预测标签和所述每个目标样本属于预设的每个情感类别的隶属度;
根据所述隶属度,通过预设的模糊值公式计算所述每个目标样本的情感模糊值,得到对应的情感模糊值集;
将所述情感模糊值集中低于预设模糊阈值的情感模糊值对应的目标样本和所述目标样本对应的情感预测标签添加到所述源领域样本集中,以对所述源领域样本集进行扩充;
根据扩充后的所述源领域样本集和所述目标领域样本集对所述跨领域文本情感分类模型进行再次训练,以完成对所述跨领域文本情感分类模型的训练。
优选地,所述跨领域文本情感分类模型由自动编码器、领域分类器以及情感分类器组成。
优选地,根据预设的源领域样本集和预设的目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练的步骤,包括:
根据预设的模型代价损失函数、所述源领域样本集以及所述目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,所述模型代价损失函数lALL为lALL=lSC+αlAE+βlDC,其中,lSC为预设的所述情感分类器的代价损失函数,lAE为预设的所述自动编码器的代价损失函数,α为预设的所述自动编码器的损失权衡参数,lDC为预设的所述领域分类器的代价损失函数,β为预设的所述领域分类器的损失权衡参数。
进一步优选地,根据预设的模型代价损失函数、所述源领域样本集以及所述目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练的步骤,包括:
根据所述自动编码器的代价损失函数和所述源领域样本集对所述自动编码器进行训练,根据所述领域分类器的代价损失函数、所述源领域样本集以及所述目标领域样本集对所述领域分类器进行训练,根据所述情感分类器的代价损失函数和所述源领域样本集对所述情感分类器进行训练。
另一方面,本发明提供了一种跨领域文本情感分类模型的训练装置,所述装置包括:
模型初次训练单元,用于根据预设的源领域样本集和预设的目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,所述目标领域样本集中的每个目标样本为无标签样本;
情感分类单元,用于根据训练好的所述跨领域文本情感分类模型对所述目标领域样本集进行情感分类,得到所述每个目标样本对应的情感预测标签和所述每个目标样本属于预设的每个情感类别的隶属度;
模糊值计算单元,用于根据所述隶属度,通过预设的模糊值公式计算所述每个目标样本的情感模糊值,得到对应的情感模糊值集;
源样本集扩充单元,用于将所述情感模糊值集中低于预设模糊阈值的情感模糊值对应的目标样本和所述目标样本对应的情感预测标签添加到所述源领域样本集中,以对所述源领域样本集进行扩充;以及
模型再次训练单元,用于根据扩充后的所述源领域样本集和所述目标领域样本集对所述跨领域文本情感分类模型进行再次训练,以完成对所述跨领域文本情感分类模型的训练。
优选地,所述跨领域文本情感分类模型由自动编码器、领域分类器以及情感分类器组成。
优选地,所述模型初次训练单元包括:
模型训练子单元,用于根据预设的模型代价损失函数、所述源领域样本集以及所述目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,所述模型代价损失函数lALL为lALL=lSC+αlAE+βlDC,其中,lSC为预设的所述情感分类器的代价损失函数,lAE为预设的所述自动编码器的代价损失函数,α为预设的所述自动编码器的损失权衡参数,lDC为预设的所述领域分类器的代价损失函数,β为预设的所述领域分类器的损失权衡参数。
进一步优选地,所述模型训练子单元包括:
分类器训练单元,用于根据所述自动编码器的代价损失函数和所述源领域样本集对所述自动编码器进行训练,根据所述领域分类器的代价损失函数、所述源领域样本集以及所述目标领域样本集对所述领域分类器进行训练,根据所述情感分类器的代价损失函数和所述源领域样本集对所述情感分类器进行训练。
另一方面,本发明还提供了一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述跨领域文本情感分类模型的训练方法所述的步骤。
另一方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述跨领域文本情感分类模型的训练方法所述的步骤。
本发明在根据源领域样本集和目标领域样本集对跨领域文本情感分类模型进行初次训练后,根据训练好的跨领域文本情感分类模型对目标领域样本集进行情感分类,得到目标领域样本集中每个目标样本对应的情感预测标签和每个目标样本属于每个情感类别的隶属度,根据隶属度,通过模糊值公式计算每个目标样本的情感模糊值,将情感模糊值低于模糊阈值的目标样本和该目标样本对应的情感预测标签添加到源领域样本集中,根据该源领域样本集和目标领域样本集对跨领域文本情感分类模型进行再次训练,从而提高跨领域文本情感分类模型的情感分类准确率。
附图说明
图1是本发明实施例一提供的跨领域文本情感分类模型的训练方法的实现流程图;
图2是本发明实施例二提供的跨领域文本情感分类模型的训练装置的结构示意图;
图3是本发明实施例二提供的跨领域文本情感分类模型的训练装置的优选结构示意图;以及
图4是本发明实施例三提供的计算设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的跨领域文本情感分类模型的训练方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,根据预设的源领域样本集和预设的目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练。
本发明实施例适用于文本或自然语言处理平台、***或设备,例如,个人计算机、服务器等。根据预设的源领域样本集和预设的目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,其中,该源领域样本集包含带标签样本和无标签样本,该目标领域样本集中的每个目标样本为无标签样本。
在本发明实施例中,优选地,跨领域文本情感分类模型由自动编码器、领域分类器以及情感分类器组成,其中,自动编码器用于捕捉样本本身与情感相关特征,领域分类器用于捕捉领域不变的情感特征,从而提高情感分类器分类的准确率。
进一步优选地,自动编码器是由输入层、隐藏层以及输出层组成的无监督三层神经网络,自动编码器又被分为编码器Ge和解码器Gd两部分,编码器Ge通过编码函数将源领域样本集中带标签的第i个源样本的输入映射为隐藏层表示h1,解码器Gd通过解码函数Gd(h1)=f(wdh1+bd)从隐藏层表示h1重构原始输入从而提高从隐藏层表示中重构原始输入向量的重构效果,其中,we和be为编码器Ge的权重和偏置参数,wd和bd为解码器Gd的权重和偏置参数,f为非线性激活函数(例如,Sigmoid,Tanh或者Relu函数等)。
在根据预设的源领域样本集和预设的目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练时,优选地,根据预设的模型代价损失函数、源领域样本集以及目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,模型代价损失函数lALL为lALL=lSC+αlAE+βlDC,从而通过最小化模型代价损失函数lALL来优化跨领域文本情感分类模型的各模型参数,提高了对跨领域文本情感分类模型训练的训练效果,其中,lSC为预设的情感分类器的代价损失函数,lAE为预设的自动编码器的代价损失函数,α为预设的自动编码器的损失权衡参数,lDC为预设的领域分类器的代价损失函数,β为预设的领域分类器的损失权衡参数。
在根据预设的模型代价损失函数、源领域样本集以及目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练时,优选地,根据自动编码器的代价损失函数和源领域样本集对自动编码器进行训练,根据领域分类器的代价损失函数、源领域样本集以及目标领域样本集对领域分类器进行训练,根据情感分类器的代价损失函数和源领域样本集对情感分类器进行训练,从而提高了对跨领域文本情感分类模型训练的训练效果。
在根据自动编码器的代价损失函数和源领域样本集对自动编码器进行训练时,优选地,根据源领域样本集,通过最小化自动编码器的代价损失函数对自动编码器进行训练,自动编码器的代价损失函数lAE为从而提高对自动编码器训练的训练效果,其中,是源领域样本集中带标签的第i个源样本,we和be为自动编码器中编码器Ge的权重和偏置参数,wd和bd为自动编码器中解码器Gd的权重和偏置参数,为源领域样本集中带标签的源样本数量。
在对自动编码器进行训练时,进一步优选地,通过随机梯度下降法或者批梯度下降法对自动编码器中编码器和解码器的权重和偏置参数进行优化,从而进一步提高对自动编码器训练的训练效果。
在根据领域分类器的代价损失函数、源领域样本集以及目标领域样本集对领域分类器进行训练时,优选地,领域分类器的代价损失函数为交叉熵损失函数使用源领域样本集和目标领域样本集中所有的样本,通过最小化交叉熵损失函数lDC来对领域分类器进行训练,从而提高对领域分类器训练的训练效果,其中,di∈{0,1}是输入到领域分类器中的样本xi的实际领域标签,来自于源领域样本集的样本则该样本的领域标签为1,来自于目标领域样本集的样本则该样本的领域标签则为0,是样本xi来自于源领域样本集的预测概率值,是源领域样本集中带标签样本数量和无标签样本数量的总数量,Nt为目标领域样本集中目标样本数量。
在根据领域分类器的代价损失函数、源领域样本集以及目标领域样本集对领域分类器进行训练之前,优选地,通过边缘堆叠去噪自动编码器(Marginalized StackedDenoising Auto-encoder,简称mSDA)对待输入领域分类器的样本进行初始化,从而提高跨领域情感分类的准确率。
在本发明实施例中,优选地,领域分类器为逻辑回归分类模型,其包含特征提取层(即隐藏层)和领域分类层,从而使得领域分类器无法找到源领域样本集和目标领域样本集中样本间的差异。
进一步优选地,在领域分类器的特征提取层和领域分类层之间加入梯度反转层(Gradient Reversal Layer,简称GRL),GRL用于在领域分类器正向传播过程中保留原有输入,在反向传播的梯度下降时反转梯度,具体地,正向传播过程GRL为恒等函数Qβ(xgrl)=xgrl,反向传播过程GRL通过函数将后一层传递的梯度乘以-1后再传递到前一层,其中,xgrl为GRL的输入,Qβ为梯度反转层起到的作用,I为预设的单位矩阵,从而进一步提高对领域分类器训练的训练效果。
进一步优选地,根据公式h2=Gf(xi)=f(wxi+b)和通过GRL完成领域分类器的对抗训练,具体地,将样本xi输入领域分类器,得到隐藏层表示h2,再将h2传递给GRL,再将GRL层的输出作为Sigmoid层的输入,以完成领域分类器的对抗训练,从而通过优化wdc和bdc提高领域分类器辨别源样本和目标样本的能力,通过优化w和b降低领域分类器的准确性,进而提高对领域分类器训练的训练效果,其中,w和b为特征提取层Gf的权重和偏置参数,wdc和bdc为领域分类层Gdc的权重和偏置参数,样本xi为源领域样本集或者目标领域样本集中的样本。
在根据情感分类器的代价损失函数和源领域样本集对情感分类器进行训练时,优选地,将自动编码器的隐藏层表示h1和领域分类器的隐藏层表示h2被连接起来作为情感分类器的输入,通过最小化情感分类器的代价损失函数对情感分类器进行训练,其中, 是实际的one-hot情感类别标签,是情感分类器预测的情感类别概率值,维度和一样,v和t分别为情感分类器中的权重和偏置参数,从而提高对情感分类器训练的训练效果。
在步骤S102中,根据训练好的跨领域文本情感分类模型对目标领域样本集进行情感分类,得到目标领域样本集中每个目标样本对应的情感预测标签和每个目标样本属于预设的每个情感类别的隶属度。
在本发明实施例中,将目标领域样本集输入到初次训练好的跨领域文本情感分类模型中后,跨领域文本情感分类模型会对目标领域样本集中的每个目标样本进行情感模糊划分,分配给每个目标样本属于每个情感类别的隶属度,根据隶属度,给该隶属度对应的目标样本分配相应的情感预测标签。
在本发明实施例中,优选地,隶属度满足uij∈[0,1],从而提高隶属度的合理性,其中,uij为第i个目标样本xi属于情感类别中第j类的隶属度,C为情感类别数,N为目标领域样本集中目标样本数量。
在步骤S103中,根据隶属度,通过预设的模糊值公式计算每个目标样本的情感模糊值,得到对应的情感模糊值集。
在本发明实施例中,优选地,模糊值公式为从而提高情感模糊值计算的精确性,其中,uij为第i个目标样本xi属于情感类别中第j类的隶属度,C为情感类别数,μi=(μi1,μi2,...,μiC)T为第i个目标样本xi属于每个情感类别的隶属度的隶属度集。
在步骤S104中,将情感模糊值集中低于预设模糊阈值的情感模糊值对应的目标样本和该目标样本对应的情感预测标签添加到源领域样本集中,以对源领域样本集进行扩充。
在本发明实施例中,将情感模糊值集中的情感模糊值和预设模糊阈值进行比较,当情感模糊值低于预设模糊阈值时,将该情感模糊值对应的目标样本以及该目标样本对应的情感预测标签添加到源领域样本集中,以对源领域样本集进行扩充,从而增加了对更多目标样本的监督信息。
在步骤S105中,根据扩充后的源领域样本集和目标领域样本集对跨领域文本情感分类模型进行再次训练,以完成对跨领域文本情感分类模型的训练。
在本发明实施例中,将扩充后的源领域样本集和目标领域样本集输入到初次训练好的跨领域文本情感分类模型中,对经过初次训练的该跨领域文本情感分类模型进行再次训练,以完成对该跨领域文本情感分类模型的训练。
在根据扩充后的源领域样本集和目标领域样本集对跨领域文本情感分类模型进行再次训练时,优选地,根据模型代价损失函数、扩充后的源领域样本集以及目标领域样本集对初次训练后的跨领域文本情感分类模型进行再次训练,模型代价损失函数lALL为lALL=lSC+αlAE+βlDC,从而通过最小化模型代价损失函数lALL来再次优化跨领域文本情感分类模型的各模型参数,进一步提高了对跨领域文本情感分类模型训练的训练效果,其中,lSC为情感分类器的代价损失函数,lAE为自动编码器的代价损失函数,α为自动编码器的损失权衡参数,lDC为领域分类器的代价损失函数,β为领域分类器的损失权衡参数。
在根据模型代价损失函数、扩充后的源领域样本集以及目标领域样本集对初次训练后的跨领域文本情感分类模型进行再次训练时,优选地,根据自动编码器的代价损失函数和扩充后的源领域样本集对自动编码器进行再次训练,根据领域分类器的代价损失函数、扩充后的源领域样本集以及目标领域样本集对领域分类器进行再次训练,根据情感分类器的代价损失函数和扩充后的源领域样本集对情感分类器进行再次训练,从而进一步提高了对跨领域文本情感分类模型训练的训练效果。
对跨领域文本情感分类模型中的自动编码器、领域分类器以及情感分类器进行再次训练的具体实施方式可参考步骤S101中对自动编码器进行训练、对领域分类器进行训练、对情感分类器进行训练的描述,在此不再赘述。
在本发明实施例中,通过对跨领域文本情感分类模型进行多次训练,并在对跨领域文本情感分类模型进行训练过程中引入情感模糊值,以对源领域样本集进行相应的扩充,从而增加了对目标样本的监督信息,提高了跨领域文本情感分类模型的情感分类准确率。
实施例二:
图2示出了本发明实施例二提供的跨领域文本情感分类模型的训练装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
模型初次训练单元21,用于根据预设的源领域样本集和预设的目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练;
情感分类单元22,用于根据训练好的跨领域文本情感分类模型对目标领域样本集进行情感分类,得到目标领域样本集中每个目标样本对应的情感预测标签和每个目标样本属于预设的每个情感类别的隶属度;
模糊值计算单元23,用于根据隶属度,通过预设的模糊值公式计算每个目标样本的情感模糊值,得到对应的情感模糊值集;
源样本集扩充单元24,用于将情感模糊值集中低于预设模糊阈值的情感模糊值对应的目标样本和该目标样本对应的情感预测标签添加到源领域样本集中,以对源领域样本集进行扩充;以及
模型再次训练单元25,用于根据扩充后的源领域样本集和目标领域样本集对跨领域文本情感分类模型进行再次训练,以完成对跨领域文本情感分类模型的训练。
如图3所示,优选地,模型初次训练单元21包括:
模型训练子单元211,用于根据预设的模型代价损失函数、源领域样本集以及目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,模型代价损失函数lALL为lALL=lSC+αlAE+βlDC,其中,lSC为预设的情感分类器的代价损失函数,lAE为预设的自动编码器的代价损失函数,α为预设的自动编码器的损失权衡参数,lDC为预设的领域分类器的代价损失函数,β为预设的领域分类器的损失权衡参数。
模型训练子单元211包括:
分类器训练单元2111,用于根据自动编码器的代价损失函数和源领域样本集对自动编码器进行训练,根据领域分类器的代价损失函数、源领域样本集以及目标领域样本集对领域分类器进行训练,根据情感分类器的代价损失函数和源领域样本集对情感分类器进行训练。
在本发明实施例中,跨领域文本情感分类模型的训练装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。具体地,各单元的实施方式可参考前述实施例一的描述,在此不再赘述。
实施例三:
图4示出了本发明实施例三提供的计算设备的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
本发明实施例的计算设备4包括处理器40、存储器41以及存储在存储器41中并可在处理器40上运行的计算机程序42。该处理器40执行计算机程序42时实现上述跨领域文本情感分类模型的训练方法实施例中的步骤,例如图1所示的步骤S101至S105。或者,处理器40执行计算机程序42时实现上述各装置实施例中各单元的功能,例如图2所示单元21至25的功能。
在本发明实施例中,在根据源领域样本集和目标领域样本集对跨领域文本情感分类模型进行初次训练后,根据训练好的跨领域文本情感分类模型对目标领域样本集进行情感分类,得到目标领域样本集中每个目标样本对应的情感预测标签和每个目标样本属于每个情感类别的隶属度,根据隶属度,通过模糊值公式计算每个目标样本的情感模糊值,将情感模糊值低于模糊阈值的目标样本和该目标样本对应的情感预测标签添加到源领域样本集中,根据该源领域样本集和目标领域样本集对跨领域文本情感分类模型进行再次训练,从而提高跨领域文本情感分类模型的情感分类准确率。
本发明实施例的计算设备可以为个人计算机、服务器。该计算设备4中处理器40执行计算机程序42时实现跨领域文本情感分类模型的训练方法时实现的步骤可参考前述方法实施例的描述,在此不再赘述。
实施例四:
在本发明实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述跨领域文本情感分类模型的训练方法实施例中的步骤,例如,图1所示的步骤S101至S105。或者,该计算机程序被处理器执行时实现上述各装置实施例中各单元的功能,例如图2所示单元21至25的功能。
在本发明实施例中,在根据源领域样本集和目标领域样本集对跨领域文本情感分类模型进行初次训练后,根据训练好的跨领域文本情感分类模型对目标领域样本集进行情感分类,得到目标领域样本集中每个目标样本对应的情感预测标签和每个目标样本属于每个情感类别的隶属度,根据隶属度,通过模糊值公式计算每个目标样本的情感模糊值,将情感模糊值低于模糊阈值的目标样本和该目标样本对应的情感预测标签添加到源领域样本集中,根据该源领域样本集和目标领域样本集对跨领域文本情感分类模型进行再次训练,从而提高跨领域文本情感分类模型的情感分类准确率。
本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质,例如,ROM/RAM、磁盘、光盘、闪存等存储器。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种跨领域文本情感分类模型的训练方法,其特征在于,所述方法包括下述步骤:
根据预设的源领域样本集和预设的目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,所述目标领域样本集中的每个目标样本为无标签样本;
根据训练好的所述跨领域文本情感分类模型对所述目标领域样本集进行情感分类,得到所述每个目标样本对应的情感预测标签和所述每个目标样本属于预设的每个情感类别的隶属度;
根据所述隶属度,通过预设的模糊值公式计算所述每个目标样本的情感模糊值,得到对应的情感模糊值集;
将所述情感模糊值集中低于预设模糊阈值的情感模糊值对应的目标样本和所述目标样本对应的情感预测标签添加到所述源领域样本集中,以对所述源领域样本集进行扩充;
根据扩充后的所述源领域样本集和所述目标领域样本集对所述跨领域文本情感分类模型进行再次训练,以完成对所述跨领域文本情感分类模型的训练。
2.如权利要求1所述的方法,其特征在于,所述跨领域文本情感分类模型由自动编码器、领域分类器以及情感分类器组成。
3.如权利要求1和2所述的方法,其特征在于,根据预设的源领域样本集和预设的目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练的步骤,包括:
根据预设的模型代价损失函数、所述源领域样本集以及所述目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,所述模型代价损失函数lALL为lALL=lSC+αlAE+βlDC,其中,lSC为预设的所述情感分类器的代价损失函数,lAE为预设的所述自动编码器的代价损失函数,α为预设的所述自动编码器的损失权衡参数,lDC为预设的所述领域分类器的代价损失函数,β为预设的所述领域分类器的损失权衡参数。
4.如权利要求3所述的方法,其特征在于,根据预设的模型代价损失函数、所述源领域样本集以及所述目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练的步骤,包括:
根据所述自动编码器的代价损失函数和所述源领域样本集对所述自动编码器进行训练,根据所述领域分类器的代价损失函数、所述源领域样本集以及所述目标领域样本集对所述领域分类器进行训练,根据所述情感分类器的代价损失函数和所述源领域样本集对所述情感分类器进行训练。
5.一种跨领域文本情感分类模型的训练装置,其特征在于,所述装置包括:
模型初次训练单元,用于根据预设的源领域样本集和预设的目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,所述目标领域样本集中的每个目标样本为无标签样本;
情感分类单元,用于根据训练好的所述跨领域文本情感分类模型对所述目标领域样本集进行情感分类,得到所述每个目标样本对应的情感预测标签和所述每个目标样本属于预设的每个情感类别的隶属度;
模糊值计算单元,用于根据所述隶属度,通过预设的模糊值公式计算所述每个目标样本的情感模糊值,得到对应的情感模糊值集;
源样本集扩充单元,用于将所述情感模糊值集中低于预设模糊阈值的情感模糊值对应的目标样本和所述目标样本对应的情感预测标签添加到所述源领域样本集中,以对所述源领域样本集进行扩充;以及
模型再次训练单元,用于根据扩充后的所述源领域样本集和所述目标领域样本集对所述跨领域文本情感分类模型进行再次训练,以完成对所述跨领域文本情感分类模型的训练。
6.如权利要求5所述的装置,其特征在于,所述跨领域文本情感分类模型由自动编码器、领域分类器以及情感分类器组成。
7.如权利要求5和6所述的装置,其特征在于,所述模型初次训练单元包括:
模型训练子单元,用于根据预设的模型代价损失函数、所述源领域样本集以及所述目标领域样本集对预先构建的跨领域文本情感分类模型进行初次训练,所述模型代价损失函数lALL为lALL=lSC+αlAE+βlDC,其中,lSC为预设的所述情感分类器的代价损失函数,lAE为预设的所述自动编码器的代价损失函数,α为预设的所述自动编码器的损失权衡参数,lDC为预设的所述领域分类器的代价损失函数,β为预设的所述领域分类器的损失权衡参数。
8.如权利要求7所述的装置,其特征在于,所述模型训练子单元包括:
分类器训练单元,用于根据所述自动编码器的代价损失函数和所述源领域样本集对所述自动编码器进行训练,根据所述领域分类器的代价损失函数、所述源领域样本集以及所述目标领域样本集对所述领域分类器进行训练,根据所述情感分类器的代价损失函数和所述源领域样本集对所述情感分类器进行训练。
9.一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810922343.1A CN109308318B (zh) | 2018-08-14 | 2018-08-14 | 跨领域文本情感分类模型的训练方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810922343.1A CN109308318B (zh) | 2018-08-14 | 2018-08-14 | 跨领域文本情感分类模型的训练方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109308318A true CN109308318A (zh) | 2019-02-05 |
CN109308318B CN109308318B (zh) | 2021-06-04 |
Family
ID=65223882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810922343.1A Expired - Fee Related CN109308318B (zh) | 2018-08-14 | 2018-08-14 | 跨领域文本情感分类模型的训练方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109308318B (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084290A (zh) * | 2019-04-12 | 2019-08-02 | 北京字节跳动网络技术有限公司 | 训练分类器的方法、装置、电子设备和计算机可读存储介质 |
CN110188791A (zh) * | 2019-04-18 | 2019-08-30 | 南开大学 | 基于自动估计的视觉情感标签分布预测方法 |
CN110197183A (zh) * | 2019-04-17 | 2019-09-03 | 深圳大学 | 一种图像盲去噪的方法、装置和计算机设备 |
CN110399492A (zh) * | 2019-07-22 | 2019-11-01 | 阿里巴巴集团控股有限公司 | 针对用户问句的问题分类模型的训练方法和装置 |
CN111259674A (zh) * | 2020-01-13 | 2020-06-09 | 济南浪潮高新科技投资发展有限公司 | 基于gan网络的文字校对和情感分析方法、设备及介质 |
CN111738455A (zh) * | 2020-06-02 | 2020-10-02 | 山东大学 | 一种基于集成域自适应的故障诊断方法及*** |
CN111753092A (zh) * | 2020-06-30 | 2020-10-09 | 深圳创新奇智科技有限公司 | 一种数据处理方法、模型训练方法、装置及电子设备 |
CN111813940A (zh) * | 2020-07-14 | 2020-10-23 | 科大讯飞股份有限公司 | 一种文本的领域分类方法、装置、设备及存储介质 |
CN111831826A (zh) * | 2020-07-24 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 跨领域的文本分类模型的训练方法、分类方法以及装置 |
CN111881286A (zh) * | 2019-09-10 | 2020-11-03 | 马上消费金融股份有限公司 | 一种分类模糊性分析方法及装置 |
CN111881287A (zh) * | 2019-09-10 | 2020-11-03 | 马上消费金融股份有限公司 | 一种分类模糊性分析方法及装置 |
CN112015896A (zh) * | 2020-08-27 | 2020-12-01 | 腾讯科技(深圳)有限公司 | 基于人工智能的情感分类方法、以及装置 |
CN112084788A (zh) * | 2020-08-19 | 2020-12-15 | 北京影谱科技股份有限公司 | 一种影像字幕隐式情感倾向自动标注方法及*** |
CN112199505A (zh) * | 2020-10-30 | 2021-01-08 | 福州大学 | 一种基于特征表示学习的跨领域情感分类方法及*** |
CN112464931A (zh) * | 2020-11-06 | 2021-03-09 | 马上消费金融股份有限公司 | 文本检测方法、模型训练方法及相关设备 |
CN112784911A (zh) * | 2021-01-29 | 2021-05-11 | 北京百度网讯科技有限公司 | 训练样本的生成方法、装置、电子设备和存储介质 |
CN112989032A (zh) * | 2019-12-17 | 2021-06-18 | 医渡云(北京)技术有限公司 | 实体关系分类方法、装置、介质及电子设备 |
CN113723088A (zh) * | 2020-05-25 | 2021-11-30 | 阿里巴巴集团控股有限公司 | 自然语言处理方法、装置、文本处理方法、设备和介质 |
CN113779249A (zh) * | 2021-08-31 | 2021-12-10 | 华南师范大学 | 跨领域文本情感分类方法、装置、存储介质以及电子设备 |
CN114020879A (zh) * | 2022-01-04 | 2022-02-08 | 深圳佑驾创新科技有限公司 | 多源跨领域的文本情感分类网络的训练方法 |
CN114254146A (zh) * | 2020-09-21 | 2022-03-29 | 京东方科技集团股份有限公司 | 图像数据的分类方法、装置和*** |
CN114443849A (zh) * | 2022-02-09 | 2022-05-06 | 北京百度网讯科技有限公司 | 一种标注样本选取方法、装置、电子设备和存储介质 |
WO2022114347A1 (ko) * | 2020-11-27 | 2022-06-02 | 연세대학교 산학협력단 | 화자 정보와의 적대적 학습을 활용한 음성 신호 기반 스트레스 인식 장치 및 방법 |
CN114757183A (zh) * | 2022-04-11 | 2022-07-15 | 北京理工大学 | 一种基于对比对齐网络的跨领域情感分类方法 |
WO2022151553A1 (zh) * | 2021-01-12 | 2022-07-21 | 之江实验室 | 一种基于域-不变特征的元-知识微调方法及平台 |
US11423333B2 (en) | 2020-03-25 | 2022-08-23 | International Business Machines Corporation | Mechanisms for continuous improvement of automated machine learning |
GB2608344A (en) * | 2021-01-12 | 2022-12-28 | Zhejiang Lab | Domain-invariant feature-based meta-knowledge fine-tuning method and platform |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770580A (zh) * | 2009-01-04 | 2010-07-07 | 中国科学院计算技术研究所 | 一种跨领域的文本情感分类器的训练方法和分类方法 |
US20140222422A1 (en) * | 2013-02-04 | 2014-08-07 | Microsoft Corporation | Scaling statistical language understanding systems across domains and intents |
CN104239554A (zh) * | 2014-09-24 | 2014-12-24 | 南开大学 | 跨领域跨类别的新闻评论情绪预测方法 |
CN105224949A (zh) * | 2015-09-23 | 2016-01-06 | 电子科技大学 | 基于跨领域迁移学习的sar图像地物分类方法 |
-
2018
- 2018-08-14 CN CN201810922343.1A patent/CN109308318B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770580A (zh) * | 2009-01-04 | 2010-07-07 | 中国科学院计算技术研究所 | 一种跨领域的文本情感分类器的训练方法和分类方法 |
US20140222422A1 (en) * | 2013-02-04 | 2014-08-07 | Microsoft Corporation | Scaling statistical language understanding systems across domains and intents |
CN104239554A (zh) * | 2014-09-24 | 2014-12-24 | 南开大学 | 跨领域跨类别的新闻评论情绪预测方法 |
CN105224949A (zh) * | 2015-09-23 | 2016-01-06 | 电子科技大学 | 基于跨领域迁移学习的sar图像地物分类方法 |
Non-Patent Citations (2)
Title |
---|
CHUANJUN ZHAO等: ""Deep Transfer Learning for Social Media Cross-Domain Sentiment Classification"", 《CHINESE NATIONAL CONFERENCE ON SOCIAL MEDIA PROCESSING》 * |
赵传君等: ""基于集成深度迁移学习的多源跨领域情感分类"", 《山西大学学报(自然科学版)》 * |
Cited By (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084290A (zh) * | 2019-04-12 | 2019-08-02 | 北京字节跳动网络技术有限公司 | 训练分类器的方法、装置、电子设备和计算机可读存储介质 |
CN110084290B (zh) * | 2019-04-12 | 2021-03-05 | 北京字节跳动网络技术有限公司 | 训练分类器的方法、装置、电子设备和计算机可读存储介质 |
CN110197183A (zh) * | 2019-04-17 | 2019-09-03 | 深圳大学 | 一种图像盲去噪的方法、装置和计算机设备 |
CN110197183B (zh) * | 2019-04-17 | 2022-10-04 | 深圳大学 | 一种图像盲去噪的方法、装置、计算机设备和存储介质 |
CN110188791A (zh) * | 2019-04-18 | 2019-08-30 | 南开大学 | 基于自动估计的视觉情感标签分布预测方法 |
CN110188791B (zh) * | 2019-04-18 | 2023-07-07 | 南开大学 | 基于自动估计的视觉情感标签分布预测方法 |
CN110399492A (zh) * | 2019-07-22 | 2019-11-01 | 阿里巴巴集团控股有限公司 | 针对用户问句的问题分类模型的训练方法和装置 |
CN111881286B (zh) * | 2019-09-10 | 2021-08-24 | 马上消费金融股份有限公司 | 一种分类模糊性分析方法及装置 |
CN111881286A (zh) * | 2019-09-10 | 2020-11-03 | 马上消费金融股份有限公司 | 一种分类模糊性分析方法及装置 |
CN111881287A (zh) * | 2019-09-10 | 2020-11-03 | 马上消费金融股份有限公司 | 一种分类模糊性分析方法及装置 |
CN112989032A (zh) * | 2019-12-17 | 2021-06-18 | 医渡云(北京)技术有限公司 | 实体关系分类方法、装置、介质及电子设备 |
CN111259674A (zh) * | 2020-01-13 | 2020-06-09 | 济南浪潮高新科技投资发展有限公司 | 基于gan网络的文字校对和情感分析方法、设备及介质 |
CN111259674B (zh) * | 2020-01-13 | 2023-07-25 | 山东浪潮科学研究院有限公司 | 基于gan网络的文字校对和情感分析方法、设备及介质 |
US11423333B2 (en) | 2020-03-25 | 2022-08-23 | International Business Machines Corporation | Mechanisms for continuous improvement of automated machine learning |
CN113723088A (zh) * | 2020-05-25 | 2021-11-30 | 阿里巴巴集团控股有限公司 | 自然语言处理方法、装置、文本处理方法、设备和介质 |
CN111738455A (zh) * | 2020-06-02 | 2020-10-02 | 山东大学 | 一种基于集成域自适应的故障诊断方法及*** |
CN111738455B (zh) * | 2020-06-02 | 2021-05-11 | 山东大学 | 一种基于集成域自适应的故障诊断方法及*** |
CN111753092A (zh) * | 2020-06-30 | 2020-10-09 | 深圳创新奇智科技有限公司 | 一种数据处理方法、模型训练方法、装置及电子设备 |
CN111753092B (zh) * | 2020-06-30 | 2024-01-26 | 青岛创新奇智科技集团股份有限公司 | 一种数据处理方法、模型训练方法、装置及电子设备 |
CN111813940B (zh) * | 2020-07-14 | 2023-01-17 | 科大讯飞股份有限公司 | 一种文本的领域分类方法、装置、设备及存储介质 |
CN111813940A (zh) * | 2020-07-14 | 2020-10-23 | 科大讯飞股份有限公司 | 一种文本的领域分类方法、装置、设备及存储介质 |
CN111831826A (zh) * | 2020-07-24 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 跨领域的文本分类模型的训练方法、分类方法以及装置 |
CN111831826B (zh) * | 2020-07-24 | 2022-10-18 | 腾讯科技(深圳)有限公司 | 跨领域的文本分类模型的训练方法、分类方法以及装置 |
CN112084788B (zh) * | 2020-08-19 | 2024-05-14 | 北京影谱科技股份有限公司 | 一种影像字幕隐式情感倾向自动标注方法及*** |
CN112084788A (zh) * | 2020-08-19 | 2020-12-15 | 北京影谱科技股份有限公司 | 一种影像字幕隐式情感倾向自动标注方法及*** |
CN112015896A (zh) * | 2020-08-27 | 2020-12-01 | 腾讯科技(深圳)有限公司 | 基于人工智能的情感分类方法、以及装置 |
CN112015896B (zh) * | 2020-08-27 | 2024-02-06 | 腾讯科技(深圳)有限公司 | 基于人工智能的情感分类方法、以及装置 |
CN114254146A (zh) * | 2020-09-21 | 2022-03-29 | 京东方科技集团股份有限公司 | 图像数据的分类方法、装置和*** |
CN112199505B (zh) * | 2020-10-30 | 2022-06-03 | 福州大学 | 一种基于特征表示学习的跨领域情感分类方法及*** |
CN112199505A (zh) * | 2020-10-30 | 2021-01-08 | 福州大学 | 一种基于特征表示学习的跨领域情感分类方法及*** |
CN112464931A (zh) * | 2020-11-06 | 2021-03-09 | 马上消费金融股份有限公司 | 文本检测方法、模型训练方法及相关设备 |
WO2022114347A1 (ko) * | 2020-11-27 | 2022-06-02 | 연세대학교 산학협력단 | 화자 정보와의 적대적 학습을 활용한 음성 신호 기반 스트레스 인식 장치 및 방법 |
US11669741B2 (en) | 2021-01-12 | 2023-06-06 | Zhejiang Lab | Method and platform for meta-knowledge fine-tuning based on domain-invariant features |
GB2608344A (en) * | 2021-01-12 | 2022-12-28 | Zhejiang Lab | Domain-invariant feature-based meta-knowledge fine-tuning method and platform |
WO2022151553A1 (zh) * | 2021-01-12 | 2022-07-21 | 之江实验室 | 一种基于域-不变特征的元-知识微调方法及平台 |
CN112784911A (zh) * | 2021-01-29 | 2021-05-11 | 北京百度网讯科技有限公司 | 训练样本的生成方法、装置、电子设备和存储介质 |
CN112784911B (zh) * | 2021-01-29 | 2024-01-19 | 北京百度网讯科技有限公司 | 训练样本的生成方法、装置、电子设备和存储介质 |
CN113779249B (zh) * | 2021-08-31 | 2022-08-16 | 华南师范大学 | 跨领域文本情感分类方法、装置、存储介质以及电子设备 |
CN113779249A (zh) * | 2021-08-31 | 2021-12-10 | 华南师范大学 | 跨领域文本情感分类方法、装置、存储介质以及电子设备 |
CN114020879A (zh) * | 2022-01-04 | 2022-02-08 | 深圳佑驾创新科技有限公司 | 多源跨领域的文本情感分类网络的训练方法 |
CN114020879B (zh) * | 2022-01-04 | 2022-04-01 | 深圳佑驾创新科技有限公司 | 多源跨领域的文本情感分类网络的训练方法 |
CN114443849A (zh) * | 2022-02-09 | 2022-05-06 | 北京百度网讯科技有限公司 | 一种标注样本选取方法、装置、电子设备和存储介质 |
CN114443849B (zh) * | 2022-02-09 | 2023-10-27 | 北京百度网讯科技有限公司 | 一种标注样本选取方法、装置、电子设备和存储介质 |
US11907668B2 (en) | 2022-02-09 | 2024-02-20 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method for selecting annotated sample, apparatus, electronic device and storage medium |
CN114757183B (zh) * | 2022-04-11 | 2024-05-10 | 北京理工大学 | 一种基于对比对齐网络的跨领域情感分类方法 |
CN114757183A (zh) * | 2022-04-11 | 2022-07-15 | 北京理工大学 | 一种基于对比对齐网络的跨领域情感分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109308318B (zh) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109308318A (zh) | 跨领域文本情感分类模型的训练方法、装置、设备及介质 | |
CN109376242B (zh) | 基于循环神经网络变体和卷积神经网络的文本分类方法 | |
Xu et al. | Sequential video VLAD: Training the aggregation locally and temporally | |
CN108399158B (zh) | 基于依存树和注意力机制的属性情感分类方法 | |
CN110046656B (zh) | 基于深度学习的多模态场景识别方法 | |
Liu et al. | Implicit discourse relation classification via multi-task neural networks | |
CN111125358B (zh) | 一种基于超图的文本分类方法 | |
CN106569998A (zh) | 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法 | |
CN108363753A (zh) | 评论文本情感分类模型训练与情感分类方法、装置及设备 | |
CN108133188A (zh) | 一种基于运动历史图像与卷积神经网络的行为识别方法 | |
CN107908715A (zh) | 基于Adaboost和分类器加权融合的微博情感极性判别方法 | |
CN108734114A (zh) | 一种结合面部和声纹的宠物识别方法 | |
CN110175221B (zh) | 利用词向量结合机器学习的垃圾短信识别方法 | |
CN110188195B (zh) | 一种基于深度学习的文本意图识别方法、装置及设备 | |
CN111414770B (zh) | 一种基于协同训练的半监督蒙汉神经机器翻译方法 | |
Rhodes | Author attribution with cnns | |
CN109446423B (zh) | 一种新闻以及文本的情感判断***及方法 | |
CN111078833A (zh) | 一种基于神经网络的文本分类方法 | |
CN108108354A (zh) | 一种基于深度学习的微博用户性别预测方法 | |
CN113516152B (zh) | 一种基于复合图像语义的图像描述方法 | |
Salimans | A structured variational auto-encoder for learning deep hierarchies of sparse features | |
CN110427616A (zh) | 一种基于深度学习的文本情感分析方法 | |
WO2022218139A1 (zh) | 融合注意力机制的个性化搜索方法和搜索*** | |
CN112749274A (zh) | 基于注意力机制和干扰词删除的中文文本分类方法 | |
CN112070139A (zh) | 基于bert与改进lstm的文本分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210604 |