CN115510230A - 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法 - Google Patents

一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法 Download PDF

Info

Publication number
CN115510230A
CN115510230A CN202211145422.9A CN202211145422A CN115510230A CN 115510230 A CN115510230 A CN 115510230A CN 202211145422 A CN202211145422 A CN 202211145422A CN 115510230 A CN115510230 A CN 115510230A
Authority
CN
China
Prior art keywords
fusion
matrix
feature
vector
mongolian
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211145422.9A
Other languages
English (en)
Inventor
苏依拉
赵梦莹
仁庆道尔吉
吉亚图
乌尼尔
路敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia University of Technology
Original Assignee
Inner Mongolia University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia University of Technology filed Critical Inner Mongolia University of Technology
Priority to CN202211145422.9A priority Critical patent/CN115510230A/zh
Publication of CN115510230A publication Critical patent/CN115510230A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,对蒙古情感语料进行预处理,将预处理后的蒙古语情感语料进行多维特征表示,然后进行多维特征注意力融合得到融合特征矩阵F;从F中抽取出主题词库,经过CNN模型训练得到主题特征向量S;将F与S输入到TBGRU模型中获取文本语义信息R;将R与S的共同语义特征进行注意力融合;根据融合结果,使用比较增强学习机制获取文本情感分类信息。本发明能够实现对蒙古语文本的精确情感分析。

Description

一种基于多维特征融合与比较增强学习机制的蒙古语情感分 析方法
技术领域
本发明属于人工智能技术领域,涉及自然语言处理的情感分析,特别涉及一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法。
背景技术
情感分析作为自然语言处理领域和计算机语言学的一项基础任务,旨在判断出文本所表达的情感倾向。情感分析技术主要对篇章级、句子级和方面级三种粒度的文本进行分析,将整篇文章作为研究对象的分析方法比较粗糙,只能判断出文章所表达的整体情感倾向是积极或消极。以句子为单位的情感分析方法能识别出句子所表达的整体情感,但无法对句子中包含的目标词进行情感极性判断。方面级情感分析是一种细粒度级的情感分析,旨在分析句子中特定实体或属性的情感倾向。在以往的研究中,整个段落或者句子中包含的文本信息较多,但它的情感极性比较单一,只能得到正面或负面的情感倾向,这并不能准确地分析出评论者对于某个实体的情感态度。文本情感极性的判别不仅取决于句子中的文本信息,还与文本中特定方面的表达密切相关。由此可见,一个句子中不同方面词会对文本情感极性判断产生不同的影响。对于大多数文本内容来说,只给出一个笼统的情感倾向是没有意义的,都需要得到更细致的分析结果,这样有利于全面了解评论信息,从而做出更正确的选择。
随着深度学习在自然语言处理领域展现的独特优势,许多研究人员提出了基于循环神经网络(RNN)的方面情感分析模型,但单循环神经网络无法捕捉句中方面词与关键信息间的关联性,于是许多研究人员致力于引入注意力机制来解决。Wang等在长短期记忆网络(LSTM)的隐藏层结合注意力机制,拼接语义向量与方面向量提取情感特征。Tang等人将文本词向量构造为外部记忆进行注意力学习,通过多层注意力的迭代计算得到方面的情感特征。Zhang等人使用卷积和循环神经网络模型实现短文本的情感分类任务,利用卷积神经网络生成粗粒度级特征表示,用长短期记忆网络学习词语长距离依赖信息。这些研究虽然都将RNN和CNN进行各种优势组合,但是由于输入训练模型的文本特征简单,导致提取出来的文本语义信息不足,特别对隐式情感的情感分类准确率不高。
蒙古语是我国内蒙古自治区蒙古族的民族语言。作为蒙古族人民之间交流的主要用语,蒙古语对内蒙古自治区在政治、经济、文化和社会领域的发展都发挥着重要的作用。但是由于有关蒙古语的情感分析研究起步较晚以及蒙古语自身词法形态变化相比较英、汉等语言语法复杂且蒙古语语料库相对匮乏等原因。因此,基于蒙古语的情感分析研究是十分有必要的。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,将词向量与词性特征、位置特征、句法依存特征进行注意力多特征融合,抽取出主题词库,然后将融合特征输入到改进的TBGRU模型中获取语义信息,再与主题词库结合进行注意力特征融合语义特征信息,最后使用比较增强机制获取文本方面级情感分类信息。
为了实现上述目的,本发明采用的技术方案是:
一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,包括如下步骤:
步骤1,对蒙古情感语料进行预处理,将预处理后的蒙古语情感语料进行多维特征表示,然后进行多维特征注意力融合得到融合特征矩阵F;
步骤2,从所述融合特征矩阵F中抽取出主题词库,经过CNN模型训练得到主题特征向量;
步骤3,将所述融合特征矩阵F与所述主题特征向量输入到TBGRU模型中获取文本语义信息;
步骤4,将TBGRU模型的输出结果与所述主题特征向量的共同语义特征进行注意力融合;
步骤5,根据融合结果,使用比较增强学习机制获取文本情感分类信息。
与现有技术相比,本发明的有益效果是:
首先,本发明改善了以往文本特征提取不全面的问题,提出了多维特征表示法,能够更加充分的提取文本特征。其次,本发明对RNN与CNN模型进行了改进结合,对主题特征提取嵌入,能够更充分的提取文本语义信息,对隐式主题方面分类也更加精确。再次,本发明在分类时引入了比较增强学习机制,与以往的分类方法相比,通使用比较增强学习机制进行分类能够替代大量的复杂计算。
附图说明
图1是本发明整体流程示意图。
图2是多维特征融合框架图
图3是TBGRU模型图。
图4是比较增强学习机制模型结构图。
具体实施方式
下面结合附图和实施例详细说明本发明的实施方式。
本发明为一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,该方法主要分三部分。第一部分是多维特征表示,该部分首先是对词向量进行多维特征表示,再进行多维特征注意力融合,得到多维的融合特征矩阵。第二部分是模型训练,模型训练方法是先从融合特征矩阵中提取主题特征向量,然后将主题特征向量和融合特征矩阵输入到TBGRU模型中训练得到文本语义信息。第三部分是特征融合情感分类,在模型训练阶段已经在TBGRU模型中获取到了文本语义信息,使用注意力语义特征融合方法将主题特征向量、文本语义信息进行注意力融合,根据融合结果得到方面级情感分类的结果。
如图1所示,本发明的方法具体包括如下步骤:
步骤1,对蒙古情感语料进行预处理,将预处理后的蒙古语情感预料进行多维特征表示,然后进行多维特征注意力融合得到融合特征矩阵F。
本发明的预处理,是先对蒙古语情感语料进行数据清洗操作,然后进行分词操作。对于分词操作,按照每个蒙古语单词为最小单元分开。以“这款产品的音质较差,但电池寿命很好”为例,其对应的蒙古语表示为
Figure BDA0003855362140000041
Figure BDA0003855362140000042
分词后的结果为
Figure BDA0003855362140000043
然后对文本进行多维特征表示,该方法首先是对词向量进行多维特征表示,再进行多维特征注意力融合,得到多维特征融合词向量。具体步骤如下:
步骤1.1,多维特征表示。
文本语料中情感词的词性、词与词的位置关系以及句法依存关系是非常重要的,如示例
Figure BDA0003855362140000044
(这款产品的音质较差,但电池寿命很好)中,虽然前半句话中
Figure BDA0003855362140000045
(音质)的极性为负,但是后半句话中
Figure BDA0003855362140000046
(电池寿命)的极性为正。所以,如图2所示,将文本语料中情感词的词性、词与词的位置关系以及句法依存关系特征加入词向量中,可以从多维度层面挖掘出文本语义隐含的更深层次上的信息。
设句子中第t个单词的词向量为et,同时将第t个单词对应的词性特征向量、位置特征向量和句法依存特征向量分别设为st、tt、qt,将句子中的单词拼接在一起,每个特征向量矩阵表示的具体方法如下公式所示:
Figure BDA0003855362140000047
Figure BDA0003855362140000048
Figure BDA0003855362140000049
Figure BDA00038553621400000410
其中,a表示句子的长度,1≤t≤a,c、d、b和k分别表示词向量矩阵、词性特征向量矩阵、位置特征向量矩阵和句法依存特征向量矩阵的维度,Pc、Pd、Pb和Pk分别表示该句子的词、词性、位置和句法依存特征向量拼接矩阵,
Figure BDA0003855362140000051
表示向量拼接操作,进行多维特征表示之后输出的矩阵为y,y=Pc+Pd+Pb+Pk
步骤1.2,多维特征注意力融合。
在得到句子的多维特征表示后,如果只是简单的特征拼接,例如:
Pc+d=Pc+Pd,这会很难充分的考虑到每个特征之间的差异性,并且拼接后的矩阵增大了向量维度,给模型训练造成一定的压力。如图2所示,本发明使用注意力机制关注对象的特征信息,能够发现文本句子中贡献度较大的单词,更好地捕捉文本上下文的语义相关信息。多维特征注意力融合的计算方法如下所示:
M(yi)=tanh(Wyi+b)
Figure BDA0003855362140000052
Figure BDA0003855362140000053
其中,tanh表示激活函数,yi表示矩阵y中的第i个向量,M(yi)表示向量yi对应特征的权重,W表示权重矩阵,b表示偏置矩阵,βi表示M(yi)经过SoftMax的输出,fi表示第i个单词的融合特征向量。n表示矩阵y中向量的个数。将所有的特征通过注意力特征融合后得到融合特征矩阵F=[f1,f2,...,fi,...,fn]。
步骤2,从融合特征矩阵F中先抽取出主题词库,如
Figure BDA0003855362140000054
(音质)
Figure BDA0003855362140000055
Figure BDA0003855362140000056
(电池寿命)就属于主题词,经过CNN模型训练得到主题特征向量。
本发明在融合特征矩阵F的基础上,将主题词嵌入到模型中。具体地,在融合特征矩阵F中,选用SS-LDA,将一个句子中出现的多个方面主题均提取出来,组成主题词库s=[s1、s2、...、si、...、sm],其中,si表示第i个主题词,m表示主题词的个数。在示例
Figure BDA0003855362140000057
Figure BDA0003855362140000061
(这款产品的音质较差,但电池寿命很好)中有三个主题词
Figure BDA0003855362140000062
Figure BDA0003855362140000063
在主题词库嵌入过程中,主题词库s可能会是一个或多个词组成的,先对主题词库s进行卷积操作,将主题词库s输入到CNN模型中,通过卷积和池化操作提取主题特征u,公式如下所示:
u=frelu(s*Wu+bu)
其中,frelu表示激活函数,Wu是c*m的卷积核,bu是偏置值。
采用最大池化方法对主题特征u进行采样,得到主题特征向量S=[S1、S2、...、Si、...、SM],其中,Si表示采样后得到的第i个主题特征,M表示经过采样后得到的主题特征的个数。在示例
Figure BDA0003855362140000064
Figure BDA0003855362140000065
(这款产品的音质较差,但电池寿命很好)中最后留下的主题特征就是
Figure BDA0003855362140000066
Figure BDA0003855362140000067
步骤3,将融合特征矩阵F与主题特征向量S输入到TBGRU模型中获取文本语义信息。
TBGRU模型是在GRU模型基础上嵌入了主题特征向量,如图3所示,将融合特征矩阵F输入到TBGRU模型中,同时将主题特征向量嵌入到TBGRU模型中进行模型训练,在模型训练过程中添加注意力进行权值分配,得到文本语义信息表示。
TBGRU模型工作流程如下:
输入:多维融合特征矩阵F和主题特征向量S。
输出:文本语义信息表示R。
(1)将F输入到TBGRU模型中,使用双向GRU对传入的F进行编码,输入的每个单词隐藏状态hi由前向隐藏状态和后向隐藏状态连接表示,获取以hi为中心的整个句子的上下文信息。
(2)将S嵌入到TBGRU模型中,使用MLP计算hi的投影vi,计算vi和Si的点积生成每个主题特征向量对应于融合特征向量位置信息的嵌入权值βi,最终输出主题嵌入pi,计算方法如下公式所示。
vi=tanh(Wahi)
βi=softmax(viSi)
Figure BDA0003855362140000071
其中,Wa表示权重矩阵,
Figure BDA0003855362140000072
表示为标量和向量的乘积。
(3)将pi嵌入双向GRU公式中,将原始双向GRU公式更改为如下公式所示。
qi=σ(Wqfi+Uqhi-1+Vqpi-1)
zi=σ(Wzfi+Uzhi-1+Vzpi-1)
Figure BDA0003855362140000073
Figure BDA0003855362140000074
其中,σ(·)表示sigmoid函数,Wq、Wz、Wh、Uq、Uz、Uh、Vq、Vz、Vh都为权重矩阵,是通过模型学习的网络参数,区别在于维度不同。⊙表示向量间的乘积,qi表示重置门,zi表示更新门,hi表示前一个隐藏状态hi-1和当前候选状态
Figure BDA0003855362140000075
之间插值的隐藏状态,主题嵌入pi代表的是当前的主题嵌入状态,pi-1表示当前状态的前一个主题嵌入状态。
(4)引入注意力机制对词向量进行权值分配,计算方法如下公式所示。
ri=tanh(Wrhi+be)
αi=softmax(riVr)
Figure BDA0003855362140000076
其中,αi表示hi的注意力权重值,R表示权重分配后的文本语义表示。Wr,br是训练中需要学习的参数,Vr是权重矩阵,N是隐藏状态矩阵h中向量的个数,ri表示经过激活函数进行输出的向量。
步骤4,将TBGRU模型的输出结果与主题特征向量的共同语义特征进行注意力融合。
首先使用余弦相似度分别计算S和R之间的相似性,也即计算Si和权重分配后的第i个文本语义表示Ri之间的相似性,相似性高的特征给予更高的权重,相似性低的给予低的权重,即按照相似性从高到低将相应特征赋予从高到低的权重。使用SoftMax函数将得到的相似度权重进行标准化求和得到注意力权重γi。最后将γi和Ri加权运算得到第i个词的语义融合特征向量μi,计算方法如下公式所示:
f(Si,Ri)=cos(Si,Ri)
Figure BDA0003855362140000081
Figure BDA0003855362140000082
μ=[μ12,...,μM]
其中,f(Si,Ri)表示用余弦函数求Si和Ri间的相似度,μ表示语义融合特征矩阵。
步骤5,根据融合结果,使用比较增强学习机制获取文本情感分类信息。
比较增强学习机制通过与样本的比较,对各个μi评分,方法如下:
从标记的训练数据中采用随机方法选取数量相等的积极样本和消极样本,然后生成这些样本相应的句子向量,如图4所示。以隐层神经网络为相似函数得到分类的相似性得分。神经网络的输入是将语义融合特征向量μ和所有样本向量的拼接。输出层大小为1,隐藏层V为句子向量的长度。相似评分Score计算如下:
Score=W2(W1Concat(sample,μ)+s1)+s2
神经网络用两个线性变换和偏置表示,参数分别为W1、s1、W2、s2,其中Sample表示样本向量。在示例在实例
Figure BDA0003855362140000083
Figure BDA0003855362140000084
(这款产品的音质较差,但电池寿命很好)中,最终就会得到
Figure BDA0003855362140000085
的极性为负,
Figure BDA0003855362140000086
的极性为正。

Claims (8)

1.一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,包括如下步骤:
步骤1,对蒙古情感语料进行预处理,将预处理后的蒙古语情感语料进行多维特征表示,然后进行多维特征注意力融合得到融合特征矩阵F;
步骤2,从所述融合特征矩阵F中抽取出主题词库,经过CNN模型训练得到主题特征向量;
步骤3,将所述融合特征矩阵F与所述主题特征向量输入到TBGRU模型中获取文本语义信息;
步骤4,将TBGRU模型的输出结果与所述主题特征向量的共同语义特征进行注意力融合;
步骤5,根据融合结果,使用比较增强学习机制获取文本情感分类信息。
2.根据权利要求1所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述步骤1,预处理包括:
数据清洗和分词。
3.根据权利要求1所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述多维特征表示,是将语料中情感词的词性、词与词的位置关系以及句法依存关系特征加入词向量中,以从多维度层面挖掘出文本语义隐含的更深层次的信息;
设句子中第t个单词的词向量为et,同时将第t个单词对应的词性特征向量、位置特征向量和句法依存特征向量分别设为st、tt、qt,将句子中的单词拼接在一起,每个特征向量矩阵表示的具体方法如下公式所示:
Figure FDA0003855362130000011
Figure FDA0003855362130000012
Figure FDA0003855362130000013
Figure FDA0003855362130000021
其中,a表示句子的长度,1≤t≤a,c、d、b和k分别表示词向量矩阵、词性特征向量矩阵、位置特征向量矩阵和句法依存特征向量矩阵的维度,Pc、Pd、Pb和Pk分别表示该句子的词、词性、位置和句法依存特征向量拼接矩阵,
Figure FDA0003855362130000022
表示向量拼接操作,进行多维特征表示之后输出的矩阵为y,y=Pc+Pd+Pb+Pk
所述多维特征注意力融合,计算方法如下所示:
M(yi)=tanh(Wyi+b)
Figure FDA0003855362130000023
Figure FDA0003855362130000024
其中,tanh表示激活函数,yi表示矩阵y中的第i个向量,M(yi)表示向量yi对应特征的权重,W表示权重矩阵,b表示偏置矩阵,βi表示M(yi)经过SoftMax的输出,fi表示第i个单词的融合特征向量;n表示矩阵y中向量的个数;融合特征矩阵F表示为F=[f1,f2,...,fi,...,fn]。
4.根据权利要求3所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述步骤2,在融合特征矩阵F中,选用SS-LDA,将一个句子中出现的多个方面主题均提取出来,组成主题词库s=[s1、s2、...、si、...、sm],其中,si表示第i个主题词,m表示主题词的个数;将主题词库s输入到CNN模型中,通过卷积和池化操作提取主题特征u,公式如下所示:
u=frelu(s*Wu+bu)
其中,frelu表示激活函数,Wu是c*m的卷积核,bu是偏置值;
采用最大池化方法对主题特征u进行采样,得到主题特征向量S=[S1、S2、...、Si、...、SM],其中,Si表示采样后得到的第i个主题特征,M表示经过采样后得到的主题特征的个数。
5.根据权利要求4所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述步骤3,TBGRU模型是在GRU模型基础上嵌入了主题特征向量,将融合特征矩阵F输入到所述TBGRU模型中,同时将主题特征向量嵌入到TBGRU模型中进行模型训练,在模型训练过程中添加注意力进行权值分配,得到文本语义信息表示。
6.根据权利要求5所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述步骤3的流程如下:
(1)将融合特征矩阵F输入到TBGRU模型中,使用双向GRU对融合特征矩阵F进行编码,输入的每个单词隐藏状态hi由前向隐藏状态和后向隐藏状态连接表示,获取以hi为中心的整个句子的上下文信息;
(2)将主题特征向量S嵌入到TBGRU模型中,使用MLP计算hi的投影vi,计算vi和Si的点积生成主题特征向量对应于融合特征向量位置信息的嵌入权值βi,最终输出主题嵌入pi,计算方法如下公式所示:
vi=tanh(Wahi)
βi=softmax(viSi)
Figure FDA0003855362130000031
其中,Wa表示权重矩阵,
Figure FDA0003855362130000032
表示为标量和向量的乘积;
(3)将pi嵌入双向GRU公式中,将原始双向GRU公式更改为如下公式所示:
qi=σ(Wqfi+Uqhi-1+Vqpi-1)
zi=σ(Wzfi+Uzhi-1+Vzpi-1)
Figure FDA0003855362130000033
Figure FDA0003855362130000034
其中,σ(·)表示sigmoid函数,Wq、Wz、Wh、Uq、Uz、Uh、Vq、Vz、Vh均为权重矩阵,是通过模型学习的网络参数,区别在于维度不同;
⊙表示向量间的乘积,qi表示重置门,zi表示更新门,hi表示前一个隐藏状态hi-1和当前候选状态
Figure FDA0003855362130000041
之间插值的隐藏状态;其中pi代表的是当前的主题嵌入状态,pi-1表示当前状态的前一个主题嵌入状态;
(4)引入注意力机制对词向量进行权值分配,计算方法如下公式所示。
ri=tanh(Wrhi+br)
αi=softmax(riVr)
Figure FDA0003855362130000042
其中,αi表示hi的注意力权重值,R表示权重分配后的文本语义表示;Wr,br是训练中需要学习的参数,Vr是权重矩阵,N是隐藏状态矩阵h中向量的个数,ri表示经过激活函数进行输出的向量。
7.根据权利要求5所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述步骤4,首先使用余弦相似度计算Si和权重分配后的第i个文本语义表示Ri之间的相似性,按照相似性从高到低将相应特征赋予从高到低的权重,然后将得到的相似度权重进行标准化求和得到注意力权重γi,最后将γi和Ri加权运算得到第i个词的语义融合特征向量μi,计算方法如下公式所示:
f(Si,Ri)=cos(Si,Ri)
Figure FDA0003855362130000043
Figure FDA0003855362130000044
μ=[μ12,...,μM]
其中,f(Si,Ri)表示用余弦函数求Si和Ri间的相似度,μ表示语义融合特征矩阵。
8.根据权利要求7所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述步骤5,比较增强学习机制通过与样本的比较,对μi评分,方法如下:
从标记的训练数据中采用随机方法选取数量相等的积极样本和消极样本,然后生成这些样本相应的句子向量;以隐层神经网络为相似函数得到分类的相似性得分,神经网络的输入是μ和所有样本向量的拼接;输出层大小为1,隐藏层V为句子向量的长度,相似评分Score计算如下:
Score=W2(W1Concat(sample,μ)+g1)+g2
神经网络用两个线性变换和偏置表示,参数分别为W1、g1、W2、g2,其中,Sample表示样本总向量。
CN202211145422.9A 2022-09-20 2022-09-20 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法 Pending CN115510230A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211145422.9A CN115510230A (zh) 2022-09-20 2022-09-20 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211145422.9A CN115510230A (zh) 2022-09-20 2022-09-20 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法

Publications (1)

Publication Number Publication Date
CN115510230A true CN115510230A (zh) 2022-12-23

Family

ID=84503522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211145422.9A Pending CN115510230A (zh) 2022-09-20 2022-09-20 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法

Country Status (1)

Country Link
CN (1) CN115510230A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187339A (zh) * 2023-02-13 2023-05-30 首都师范大学 基于双塔模型进行特征语义融合的作文自动评分方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187339A (zh) * 2023-02-13 2023-05-30 首都师范大学 基于双塔模型进行特征语义融合的作文自动评分方法
CN116187339B (zh) * 2023-02-13 2024-03-01 首都师范大学 基于双塔模型进行特征语义融合的作文自动评分方法

Similar Documents

Publication Publication Date Title
CN110210037B (zh) 面向循证医学领域的类别检测方法
CN111382565B (zh) 基于多标签的情绪-原因对抽取方法及***
CN106599032B (zh) 一种结合稀疏编码和结构感知机的文本事件抽取方法
CN110647612A (zh) 一种基于双视觉注意力网络的视觉对话生成方法
CN112115238A (zh) 一种基于bert和知识库的问答方法和***
CN112541356B (zh) 一种生物医学命名实体识别的方法和***
CN111966812B (zh) 一种基于动态词向量的自动问答方法和存储介质
CN111666758B (zh) 中文分词方法、训练设备以及计算机可读存储介质
CN111414481A (zh) 基于拼音和bert嵌入的中文语义匹配方法
CN112883714B (zh) 基于依赖图卷积和迁移学习的absc任务句法约束方法
CN111428490B (zh) 一种利用语言模型的指代消解弱监督学习方法
CN112818698B (zh) 一种基于双通道模型的细粒度的用户评论情感分析方法
CN115204143B (zh) 一种基于prompt的文本相似度计算方法及***
CN114818717A (zh) 融合词汇和句法信息的中文命名实体识别方法及***
CN115357719A (zh) 基于改进bert模型的电力审计文本分类方法及装置
CN111145914B (zh) 一种确定肺癌临床病种库文本实体的方法及装置
CN114254645A (zh) 一种人工智能辅助写作***
CN114781375A (zh) 一种基于bert与注意力机制的军事装备关系抽取方法
CN114742069A (zh) 一种代码相似度检测方法及装置
CN115879546A (zh) 一种复合神经网络心理医学知识图谱构建方法及***
CN115759119A (zh) 一种金融文本情感分析方法、***、介质和设备
Yan et al. Implicit emotional tendency recognition based on disconnected recurrent neural networks
CN115510230A (zh) 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法
CN116757195B (zh) 一种基于提示学习的隐性情感识别方法
Göker et al. Neural text normalization for turkish social media

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination