CN112949318B - 基于文本和用户表示学习的文本立场检测方法 - Google Patents

基于文本和用户表示学习的文本立场检测方法 Download PDF

Info

Publication number
CN112949318B
CN112949318B CN202110233476.XA CN202110233476A CN112949318B CN 112949318 B CN112949318 B CN 112949318B CN 202110233476 A CN202110233476 A CN 202110233476A CN 112949318 B CN112949318 B CN 112949318B
Authority
CN
China
Prior art keywords
vector
text
user
matrix
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110233476.XA
Other languages
English (en)
Other versions
CN112949318A (zh
Inventor
彭愈翔
罗绪成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110233476.XA priority Critical patent/CN112949318B/zh
Publication of CN112949318A publication Critical patent/CN112949318A/zh
Application granted granted Critical
Publication of CN112949318B publication Critical patent/CN112949318B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于文本和用户表示学***台上获取文本数据集,生成用户社交关系图并获取对应的拉普拉斯矩阵,并确定每个文本的立场标签向量,采用预训练的BERT模型获取每个文本的文本向量,构建并训练立场检测模型,当需要对用户文本进行立场检测时,生成用户社交关系图并获取对应的拉普拉斯矩阵,将文本向量输入立场检测模型得到立场检测结果。本发明分别获取文本和用户两个模态特征并进行跨模态融合,从而实现准确的文本立场检测。

Description

基于文本和用户表示学习的文本立场检测方法
技术领域
本发明属于自然语言处理技术领域,更为具体地讲,涉及一种基于文本和用户表示学习的文本立场检测方法。
背景技术
立场检测是自然语言处理(Natural Language Processing,NLP)领域中的前沿研究分支之一,其目的是从文本信息中自动检测出人对个体、事物、事件所表现出来的看法或者态度,如“支持、反对或中立”。
目前,现有的立场检测方法主要采用的还是以CNN(Convolutional NeuralNetworks,卷积神经网络)、RNN(Recurrent Neural Network,循环神经网络)模型为主的经典模型。现有的立场检测方法大部分只使用了文本维度的信息进行立场检测,而没有将与立场高度相关的用户特征利用起来。用户本身的属性、用户之间的社交关系,都会影响到用户发表言论的立场。其次,CNN、RNN模型在NLP任务上都有其局限性,比如CNN只能看到局部领域,RNN由于其结构的原因,越往前的输入随着距离的增加,信息就衰减得越多。近年来随着预训练语言模型BERT的提出,NLP各个子任务的性能都得到了极大的提升。通过BERT模型能获得更好的文本维度的向量表示。最后,由于用户与文本的信息维度不同,可以视为不同的模态。不同模态拥有不同的语义,而简单的拼接,无法实现模态间语义的有效混合。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于文本和用户表示学习的文本立场检测方法,分别获取文本和用户两个模态特征并进行跨模态融合,从而实现准确的文本立场检测。
为了实现上述发明目的,本发明基于文本和用户表示学习的文本立场检测方法包括以下步骤:
S1:确定需要进行文本立场检测的社交媒体平台,从该社交媒体平台上收集需要进行文本立场检测的话题的文本数据集,文本数据集包括若干与该话题相关的文本,以及发布这些文本的用户之间的关注列表与被关注列表;
根据用户之间的关注列表与被关注列表,生成一个有向无环的用户社交关系图G=<V,E>,其中V表示所有用户ID集合,E表示用户之间有向边的集合,如果用户i关注了用户j,则存在一条从用户i到用户j的有向边,i,j∈V;然后构建用户社交关系图G=<V,E>的邻接矩阵A和度矩阵D;对邻接矩阵A与度矩阵D进行拉普拉斯矩阵变换得到拉普拉斯矩阵Lrw
将用户在文本中的立场规范为反对、中立、赞成三个取值,并以one-hot的形式编码得到3维立场向量,根据每个文本的立场确定其对应的立场向量作为立场标签向量;
S2:将文本数据集中的文本统一为预设长度W:如果文本长度大于W,则删除超出部分文本,如果文本长度小于W,则填充预设字符;将处理得到的各个文本分别输入预训练的BERT模型,将其输出的d维向量作为文本向量vt,其中t表示文本,t∈Φ,Φ表示文本数据集中文本集合,d的大小根据实际需要设置;
S3:构建立场检测模型,包括GCN网络、交互层、决策层、全连接层,其中:
GCN网络用于生成用户向量,具体方法为:将用户社交关系图的拉普拉斯矩阵作为GCN网络的邻接矩阵,GCN网络对用户初始向量矩阵进行处理,得到的输出矩阵作为用户向量矩阵,每行向量作为对应用户的用户向量;
交互层用于将文本向量和GCN网络得到的文本所属用户的用户向量进行语义融合得到交互向量;交互层包括隐藏层和attention层,其中隐藏层用于对文本向量和用户向量求外积得到d×d的交互矩阵;attention层用于对交互矩阵进行降维得到d维交互向量;
决策层用于对用户向量、文本向量以及交互向量进行加权求和,得到加权合成向量;决策层包括拼接层、MLP网络、softmax层和加权合成模块,其中拼接层用于将用户向量、文本向量和交互向量进行拼接,得到3×d的拼接矩阵;MLP网络用于获取拼接矩阵中每个行向量的隐含表示向量uj,j=1,2,3;softmax层用于根据3个隐含表示向量uj确定归一化的权重αj,其计算公式如下:
Figure BDA0002959626790000021
其中,uw为d维向量,用于将隐含表示向量uj降维为一个数值;
加权合成模块用于根据权重αj对用户向量、文本向量以及交互向量进行加权求和,得到加权合成向量s,加权求和公式如下:
s=∑αjhj
其中,h1,h2,h3分别表示用户向量、文本向量以及交互向量;
全连接层用于对加权合成向量s进行处理得到3维向量,其中每个元素表示文本属于反对、中立、赞成三种立场的概率;
S4:将步骤S1中的拉普拉斯矩阵Lrw作为立场检测模型中GCN网络的邻接矩阵,随机生成文本数据集中每个用户的d维初始向量并作为行向量构成用户初始向量矩阵U,将用户初始向量矩阵U和步骤S2得到的文本向量作为输入,文本向量所对应的立场标签向量作为期望输出,对立场检测模型进行训练;
S5:当需要对社交媒体平台用户所发布的文本进行立场检测时,首先获取社交媒体平台当前用户之间的关注列表与被关注列表,生成有向无环的用户社交关系图G′,构建邻接矩阵A′和度矩阵D′并采用步骤S1相同方法进行拉普拉斯矩阵变换得到拉普拉斯矩阵Lrw′;将所需进行立场检测的文本采用步骤S2中的相同方法得到d维的文本向量v′;
将拉普拉斯矩阵Lrw′作为立场检测模型中GCN网络的邻接矩阵,随机生成用户社交关系图G′中各个用户的d维初始向量并作为行向量构成用户初始向量矩阵U′,将用户初始向量矩阵U′和文本向量v′输入立场检测模型,得到立场检测结果。
本发明基于文本和用户表示学***台上获取文本数据集,生成用户社交关系图并获取对应的拉普拉斯矩阵,并确定每个文本的立场标签向量,采用预训练的BERT模型获取每个文本的文本向量,构建并训练立场检测模型,当需要对用户文本进行立场检测时,生成用户社交关系图并获取对应的拉普拉斯矩阵,将文本向量输入立场检测模型得到立场检测结果。
本发明具有以下有益效果:
1)在用户维度上充分利用不同用户相互之间的内在联系来建模用户,学习到的用户向量包含了用户之间的社交拓扑关系以及关系的紧密程度,具有更强的特征表达能力;
2)在立场检测模型中将文本向量和用户向量进行跨模态融合,实现用户与文本两个模态间语义的有效混合,以实现针对用户的文本立场检测,提高立场检测的效率和准确性。
附图说明
图1是本发明基于文本和用户表示学习的文本立场检测方法的具体实施方式流程图;
图2是本发明中立场检测模型的结构图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于文本和用户表示学习的文本立场检测方法的具体实施方式流程图。如图1所示,本发明基于文本和用户表示学习的文本立场检测方法的具体步骤包括:
S101:文本数据预处理:
确定需要进行文本立场检测的社交媒体平台,从该社交媒体平台上收集需要进行文本立场检测的话题的文本数据集,文本数据集包括若干与该话题相关的文本,以及发布这些文本的用户之间的关注列表与被关注列表。
在社交媒体平台上的关注行为,表达了用户之间的单向兴趣,而这种单向兴趣,往往是由于志趣相投、观点相近所产生的,直观上,关注列表越相近的两个人,其用户特征表示,也是相近的。更进一步来说,如果两个用户处于相互关注的关系,相比处于单方向关注关系的两个用户,其紧密程度要更高。最后,同一个用户在短期内发表的多段文本中蕴含对同一话题的立场大概率是相同的。
因此在本发明中,根据用户之间的关注列表与被关注列表,生成一个有向无环的用户社交关系图G=<V,E>,其中V表示所有用户ID集合,E表示用户之间有向边的集合,如果用户i关注了用户j,则存在一条从用户i到用户j的有向边,i,j∈V。然后构建用户社交关系图G=<V,E>的邻接矩阵A和度矩阵D。
邻接矩阵A用于存储用户之间的邻接关系,大小为|V|×|V|,|V|表示用户数量,其元素ai,j采用如下公式确定:
Figure BDA0002959626790000051
度矩阵D用于存储用户存在联系的用户数量,是大小为|V|×|V|的对角矩阵,对角上的元素即为相应用户存在联系的用户数量。
对邻接矩阵A与度矩阵D进行拉普拉斯矩阵变换得到拉普拉斯矩阵Lrw,拉普拉斯矩阵变换函数如下:
Lrw=D-1(D-A)
其中,上标-1表示求逆矩阵。
将用户在文本中的立场规范为反对、中立、赞成三个取值,并以one-hot的形式编码得到3维立场向量,根据每个文本的立场确定其对应的立场向量作为立场标签向量。
S102:利用预训练的BERT模型得到文本向量:
将文本数据集中的文本统一为预设长度W:如果文本长度大于W,则删除超出部分文本,如果文本长度小于W,则填充预设字符。将处理得到的各个文本分别输入预训练的BERT(Bidirectional Encoder Representation from Transformers)模型,将其输出的d维向量作为文本向量vt,其中t表示文本,t∈Φ,Φ表示文本数据集中文本集合。
BERT模型是Google在2018年提出的一种NLP(Natural Language Processing,自然语言处理)模型,成为最近几年NLP领域最具有突破性的一项技术。该模型采用了Transformer的Encoder结构,BERT-base模型包含12个Encoder block,BERT-large包含24个Encoder block。BERT模型的具体结构和工作过程可以参见文献“《Pre-training ofDeep Bidirectional Transformers for Language Understanding》”
S103:构建立场检测模型:
为了实现文本立场检测,本发明设计了一个立场检测模型。图2是本发明中立场检测模型的结构图。如图2所示,本发明中立场检测模型包括GCN(Graph ConvolutionalNetwork,图卷积神经网络)网络、交互层、决策层、全连接层,其中:
GCN网络用于生成用户向量,具体方法为:将用户社交关系图的拉普拉斯矩阵作为GCN网络的邻接矩阵,GCN网络对用户初始向量矩阵进行处理,得到的输出矩阵作为用户向量矩阵,每行向量作为对应用户的用户向量u。
交互层用于将文本向量和GCN网络得到的文本所属用户的用户向量进行语义融合得到交互向量。交互层包括隐藏层和attention(注意力)层,其中隐藏层用于对文本向量和用户向量求外积得到d×d的交互矩阵,该交互矩阵包含了文本向量与用户向量之间的交互关系。attention层用于对交互矩阵进行降维得到d维交互向量r。由于用户与文本的信息维度不同,可以视为不同的模态。不同模态拥有不同的语义,而简单的拼接,无法实现模态间语义的有效混合。因此本发明设置交互层,通过跨模态训练来学习联合表示,实现用户与文本的特征级融合。
决策层用于对用户向量、文本向量以及交互向量进行加权求和,得到加权合成向量。决策层包括拼接层、MLP(Multilayer Perceptron,多层感知机)网络、softmax层和加权合成模块,其中拼接层用于将用户向量、文本向量和交互向量进行拼接,得到3×d的拼接矩阵。该拼接矩阵可以看作是长度为3的序列,序列上每个单元隐层表示的维度为d。MLP网络用于获取拼接矩阵中每个行向量的隐含表示向量uj,j=1,2,3。softmax层用于根据3个隐含表示向量uj确定归一化的权重αj,其计算公式如下:
Figure BDA0002959626790000061
其中,uw为d维向量,由训练得到,用于将隐含表示向量uj降维为一个数值。
加权合成模块用于根据权重αj对用户向量、文本向量以及交互向量进行加权求和,得到加权合成向量s,加权求和公式如下:
s=∑αjhj
其中,h1,h2,h3分别表示用户向量、文本向量以及交互向量。
在决策层中使用了注意力机制,对文本特征、用户特征以及交互特征进行特征层面的加权评分,以此来表明不同特征的重要性差别,
全连接层用于对加权合成向量s进行处理得到3维向量,其中每个元素表示文本属于反对、中立、赞成三种立场的概率。
S104:训练立场检测模型:
将步骤S101中的拉普拉斯矩阵Lrw作为立场检测模型中GCN网络的邻接矩阵,随机生成文本数据集中每个用户的d维初始向量并作为行向量构成用户初始向量矩阵U,将用户初始向量矩阵U和步骤S102得到的文本向量作为输入,文本向量所对应的立场标签向量作为期望输出,对立场检测模型进行训练。
本实施例在进行立场检测模型训练时,损失函数采用softmax交叉熵函数,最终的损失由立场检测任务的损失和正则化项相加构成,联合训练如下目标函数:
J=L+λLreg
其中,L表示立场检测任务的交叉熵损失,Lreg表示L2-范数正则化项,用于防止神经网络的过拟合,λ是超参数,用于平衡正则化项在整个目标函数中所占权重。
训练过程中采用Adam算法优化损失函数,利用反向传播(BP)算法进行参数更新。同时为了防止过拟合,在最后的全连接层前加入了Droupout训练模型,最终学习到用户和文本的低维向量表示和立场的向量表示之间的非线性映射函数。对于社交媒体上的文本,可利用训练好的立场检测模型对其文本中的立场进行检测分类。
S105:文本立场检测:
当需要对社交媒体平台用户所发布的文本进行立场检测时,首先获取社交媒体平台当前用户之间的关注列表与被关注列表,生成有向无环的用户社交关系图G′,构建邻接矩阵A′和度矩阵D′并采用步骤S101中相同方法进行拉普拉斯矩阵变换得到拉普拉斯矩阵Lrw′;将所需进行立场检测的文本采用步骤S102中的相同方法得到d维的文本向量v′;
将拉普拉斯矩阵Lrw′作为立场检测模型中GCN网络的邻接矩阵,随机生成用户社交关系图G′中各个用户的d维初始向量并作为行向量构成用户初始向量矩阵U′,将用户初始向量矩阵U′和文本向量v′输入立场检测模型,得到立场检测结果。
本实施例在Semval2016 Task6A数据集上与经典的立场检测方法进行了立场检测准确率的对比实验,该数据集中有约4,000条推特,每条推特属于一个话题,共有5个话题,分别为Atheism(AT)、Climate Change is a real concern(CC)、Feminist Movement(FM)、Hillary Clinton(HC)、Legalization of Abortion(LA)。每个推特有对于其中一个话题的立场标签,共有三个立场标签,即赞成、反对和中立。所选择的对比方法包括基于TAN(注意力机制网络)的文本立场检测方法,基于LSTM(长短期记忆网络)的文本立场检测方法和基于CNN(卷积神经网络)的文本立场检测方法。表1是本实施例中本发明和3种对比方法对五个话题的立场检测准确率对比表。
Figure BDA0002959626790000081
表1
如表1所示,在五个话题中,本发明基于用户与文本表示学习的方法都接近甚至超过了以往方法的基线,尤其是在AT、CC与HC三个话题。证明了基于用户与文本表示学习的方法提高了立场检测的准确率。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (1)

1.一种基于文本和用户表示学习的文本立场检测方法,其特征在于,包括以下步骤:
S1:确定需要进行文本立场检测的社交媒体平台,从该社交媒体平台上收集需要进行文本立场检测的话题的文本数据集,文本数据集包括若干与该话题相关的文本,以及发布这些文本的用户之间的关注列表与被关注列表;
根据用户之间的关注列表与被关注列表,生成一个有向无环的用户社交关系图G=<V,E>,其中V表示所有用户ID集合,E表示用户之间有向边的集合,如果用户i关注了用户j,则存在一条从用户i到用户j的有向边,i,j∈V;然后根据构建用户社交关系图G=<V,E>的邻接矩阵A和度矩阵D;对邻接矩阵A与度矩阵D进行拉普拉斯矩阵变换得到拉普拉斯矩阵Lrw
将用户在文本中的立场规范为反对、中立、赞成三个取值,并以one-hot的形式编码得到3维立场向量,根据每个文本的立场确定其对应的立场向量作为立场标签向量;
S2:将文本数据集中的文本统一为预设长度W:如果文本长度大于W,则删除超出部分文本,如果文本长度小于W,则填充预设字符;将处理得到的各个文本分别输入预训练的BERT模型,将其输出的d维向量作为文本向量vt,其中t表示文本,t∈Φ,Φ表示文本数据集中文本集合,d的大小根据实际需要设置;
S3:构建立场检测模型,包括GCN网络、交互层、决策层、全连接层,其中:
GCN网络用于生成用户向量,具体方法为:将用户社交关系图的拉普拉斯矩阵作为GCN网络的邻接矩阵,GCN网络对用户初始向量矩阵进行处理,得到的输出矩阵作为用户向量矩阵,每行向量作为对应用户的用户向量;
交互层用于将文本向量和GCN网络得到的文本所属用户的用户向量进行语义融合得到交互向量;交互层包括隐藏层和attention层,其中隐藏层用于对文本向量和用户向量求外积得到d×d的交互矩阵;attention层用于对交互矩阵进行降维得到d维交互向量;
决策层用于对用户向量、文本向量以及交互向量进行加权求和,得到加权合成向量;决策层包括拼接层、MLP网络、softmax层和加权合成模块,其中拼接层用于将用户向量、文本向量和交互向量进行拼接,得到3×d的拼接矩阵;MLP网络用于获取拼接矩阵中每个行向量的隐含表示向量uj,j=1,2,3;softmax层用于根据3个隐含表示向量uj确定归一化的权重αj,其计算公式如下:
Figure FDA0002959626780000021
其中,uw为d维向量,用于将隐含表示uj降维为一个数值;
加权合成模块用于根据权重αj对用户向量、文本向量以及交互向量进行加权求和,得到加权合成向量s,加权求和公式如下:
s=∑αjhj
其中,h1,h2,h3分别表示用户向量、文本向量以及交互向量;
全连接层用于对加权合成向量s进行处理得到3维向量,其中每个元素表示文本属于反对、中立、赞成三种立场的概率;
S4:将步骤S1中的拉普拉斯矩阵Lrw作为立场检测模型中GCN网络的邻接矩阵,随机生成文本数据集中每个用户的d维初始向量并作为行向量构成用户初始向量矩阵U,将用户初始向量矩阵U和步骤S2得到的文本向量作为输入,文本向量所对应的立场标签向量作为期望输出,对立场检测模型进行训练;
S5:当需要对社交媒体平台用户所发布的文本进行立场检测时,首先获取社交媒体平台当前用户之间的关注列表与被关注列表,生成有向无环的用户社交关系图G′,构建邻接矩阵A′和度矩阵D′并采用步骤S1相同方法进行拉普拉斯矩阵变换得到拉普拉斯矩阵Lrw′;将所需进行立场检测的文本采用步骤S2中的相同方法得到d维的文本向量v′;
将拉普拉斯矩阵Lrw′作为立场检测模型中GCN网络的邻接矩阵,随机生成用户社交关系图G′中各个用户的d维初始向量并作为行向量构成用户初始向量矩阵U′,将用户初始向量矩阵U′和文本向量v′输入立场检测模型,得到立场检测结果。
CN202110233476.XA 2021-03-03 2021-03-03 基于文本和用户表示学习的文本立场检测方法 Active CN112949318B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110233476.XA CN112949318B (zh) 2021-03-03 2021-03-03 基于文本和用户表示学习的文本立场检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110233476.XA CN112949318B (zh) 2021-03-03 2021-03-03 基于文本和用户表示学习的文本立场检测方法

Publications (2)

Publication Number Publication Date
CN112949318A CN112949318A (zh) 2021-06-11
CN112949318B true CN112949318B (zh) 2022-03-25

Family

ID=76247341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110233476.XA Active CN112949318B (zh) 2021-03-03 2021-03-03 基于文本和用户表示学习的文本立场检测方法

Country Status (1)

Country Link
CN (1) CN112949318B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804608A (zh) * 2018-05-30 2018-11-13 武汉烽火普天信息技术有限公司 一种基于层次attention的微博谣言立场检测方法
CN109299262A (zh) * 2018-10-09 2019-02-01 中山大学 一种融合多粒度信息的文本蕴含关系识别方法
CN109543084A (zh) * 2018-11-09 2019-03-29 西安交通大学 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法
CN111523051A (zh) * 2020-04-24 2020-08-11 山东师范大学 基于图卷积矩阵分解的社交兴趣推荐方法及***
CN111581401A (zh) * 2020-05-06 2020-08-25 西安交通大学 一种基于深度相关性匹配的局部引文推荐***及方法
CN111966917A (zh) * 2020-07-10 2020-11-20 电子科技大学 一种基于预训练语言模型的事件检测与摘要方法
CA3081242A1 (en) * 2019-05-22 2020-11-22 Royal Bank Of Canada System and method for controllable machine text generation architecture
CN112001185A (zh) * 2020-08-26 2020-11-27 重庆理工大学 一种结合中文句法和图卷积神经网络的情感分类方法
CN112100388A (zh) * 2020-11-18 2020-12-18 南京华苏科技有限公司 一种长文本新闻舆情的情感极性的分析方法
WO2021000362A1 (zh) * 2019-07-04 2021-01-07 浙江大学 一种基于深度神经网络模型的地址信息特征抽取方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804608A (zh) * 2018-05-30 2018-11-13 武汉烽火普天信息技术有限公司 一种基于层次attention的微博谣言立场检测方法
CN109299262A (zh) * 2018-10-09 2019-02-01 中山大学 一种融合多粒度信息的文本蕴含关系识别方法
CN109543084A (zh) * 2018-11-09 2019-03-29 西安交通大学 一种建立面向网络社交媒体的隐蔽敏感文本的检测模型的方法
CA3081242A1 (en) * 2019-05-22 2020-11-22 Royal Bank Of Canada System and method for controllable machine text generation architecture
WO2021000362A1 (zh) * 2019-07-04 2021-01-07 浙江大学 一种基于深度神经网络模型的地址信息特征抽取方法
CN111523051A (zh) * 2020-04-24 2020-08-11 山东师范大学 基于图卷积矩阵分解的社交兴趣推荐方法及***
CN111581401A (zh) * 2020-05-06 2020-08-25 西安交通大学 一种基于深度相关性匹配的局部引文推荐***及方法
CN111966917A (zh) * 2020-07-10 2020-11-20 电子科技大学 一种基于预训练语言模型的事件检测与摘要方法
CN112001185A (zh) * 2020-08-26 2020-11-27 重庆理工大学 一种结合中文句法和图卷积神经网络的情感分类方法
CN112100388A (zh) * 2020-11-18 2020-12-18 南京华苏科技有限公司 一种长文本新闻舆情的情感极性的分析方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Chinese Grammatical Error Diagnosis with Graph Convolution Network and Multi-task Learning;Luo Yikang 等;《Proceedings of the 6th Workshop on Natural Language Processing Techniques for Educational Applications》;20201231;44-48 *
CNNTOP: a CNN-based Trajectory Owner Prediction Method;Luo Xucheng 等;《arXiv》;20200105;1-9 *
基于本证间隙增大的K邻域加权谱聚类算法;田文敏 等;《计算机科学与应用》;20200220;第10卷(第2期);289-302 *
基于网络社区的用户兴趣建模与推荐技术研究;李玉翔;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20140215(第02期);I138-957 *
浅谈网络舆情预测方法;徐红;《科技与创新》;20191205(第23期);60-61 *

Also Published As

Publication number Publication date
CN112949318A (zh) 2021-06-11

Similar Documents

Publication Publication Date Title
Zheng et al. Sentence representation method based on multi-layer semantic network
US11514305B1 (en) Intelligent control with hierarchical stacked neural networks
CN111061961B (zh) 一种融合多特征的矩阵分解兴趣点推荐方法及其实现***
CN109492157B (zh) 基于rnn、注意力机制的新闻推荐方法及主题表征方法
Kizielewicz et al. A new approach to identifying a multi-criteria decision model based on stochastic optimization techniques
Kirilenko et al. Inter-coder agreement in one-to-many classification: fuzzy kappa
CN109389151B (zh) 一种基于半监督嵌入表示模型的知识图谱处理方法和装置
Koukaras et al. Stock market prediction using microblogging sentiment analysis and machine learning
Zhang et al. Forecasting hotel accommodation demand based on LSTM model incorporating internet search index
Xie et al. Deep learning for natural language processing
CN112329474A (zh) 融合注意力的方面级用户评论文本情感分析方法及***
Zhou et al. Deepmove: Learning place representations through large scale movement data
Zhou et al. Stock prediction based on bidirectional gated recurrent unit with convolutional neural network and feature selection
Kulathunga et al. Effects of nonlinearity and network architecture on the performance of supervised neural networks
Zhang et al. Personal interest attention graph neural networks for session-based recommendation
CN116204729A (zh) 一种基于超图神经网络的跨领域群组智能推荐方法
Abudureheman et al. Performance evaluation of enterprises’ innovation capacity based on fuzzy system model and convolutional neural network
Syah et al. Forecasting daily electricity price by hybrid model of fractional wavelet transform, feature selection, support vector machine and optimization algorithm
Xu et al. Ship traffic flow prediction in wind farms water area based on spatiotemporal dependence
ter Burg et al. Comparing approaches for explaining DNN-based facial expression classifications
Wang et al. A complete reinforcement-learning-based framework for urban-safety perception
Medianovskyi et al. On explainable AI and abductive inference
CN112949318B (zh) 基于文本和用户表示学习的文本立场检测方法
CN116628345A (zh) 一种内容推荐方法、装置、电子设备和存储介质
Maldonado-Romo et al. Interoperability between real and virtual environments connected by a GAN for the path-planning problem

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant