CN110334219A

CN110334219A - 基于注意力机制融入文本语义特征的知识图谱表示学习方法

Info

Publication number: CN110334219A
Application number: CN201910629813.XA
Authority: CN
Inventors: 惠孛; 罗光春; 张栗粽; 卢国明; 李攀成
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2019-07-12
Filing date: 2019-07-12
Publication date: 2019-10-15
Anticipated expiration: 2039-07-12
Also published as: CN110334219B

Abstract

本发明涉及知识图谱，其公开了一种基于注意力机制融入文本语义特征的知识图谱表示学习方法，解决翻译模型未能利用实体和关系的描述文本而导致的语义特征不足以及多源信息嵌入方法未能同时为实体和关系融入语义特征，且文本提取效果差的问题。该方法可以概括为：首先获取并处理实体和关系的描述文本，得到其文本语义特征，然后利用实体和关系的语义特征构建实体的投影矩阵，将实体向量投影到关系空间中，接着利用翻译的思想在关系空间中建模并进行表示学习，以此建模多对多的复杂关系。本发明适用于知识图谱的表示学习。

Description

基于注意力机制融入文本语义特征的知识图谱表示学习方法

技术领域

本发明涉及知识图谱，具体涉及一种基于注意力机制融入文本语义特征的知识图谱表示学习方法。

背景技术

随着互联网技术的发展，数据呈现***式的增长。但由于互联网上的内容多源异构，组织结构松散，难以高效利用其中的信息，因此Google于2012年5月提出知识图谱(Knowledge Graph)的概念，旨在将海量非结构化或半结构的数据转化为规范统一且可靠有效的结构化知识，从而形成一个高度互联的语义网，为数据挖掘和智能化服务提供支持。

知识图谱可看作一个有向图结构的网络，其中图节点代表实体或者概念，图中的边代表实体与实体或实体与概念间的关系。一般以三元组的形式描述知识，即(主语，谓词，宾语)或(实体，关系，实体)。知识图谱表示学习(Knowledge Graph RepresentationLearning)目的是学习实体关系的向量化表示，将符号形式的知识转化为可计算的实值向量。

传统技术中有较多基于翻译的模型来进行知识图谱表示学习的方案：

Mikolov等人利用词嵌入工具word2vec发现词向量空间存在平移不变现象，如v(king)-v(queen)≈v(man)-v(woman)，这里v(king)表示利用word2vec得到的单词king的向量。受此现象的启发，Bordes等人提出TransE模型将知识图谱中的关系看作嵌入空间中头实体到尾实体的翻译(平移)操作：如果三元组(h,r,t)存在或成立，则在嵌入空间中，头实体向量加上关系向量应该与尾实体向量尽量靠近，即h+r≈t。其定义的评分函数为

TransE模型简单有效，在大规模知识图谱上也具有扩展性，但是也有严重的缺点。知识图谱中的关系按照其两端连接的实体数量可划分为1-1、1-N、N-1、N-N四种，而TransE的模型决定了它只对1-1的关系有效，对于其他关系类型存在很大问题，如N-1关系下， (h_i,r,t)∈T，意味着h₀＝h₁＝…＝h_m，这显然是不合理的。

针对TransE在复杂关系上的不足，TransH模型将头尾实体向量分别投影到关系平面后再进行平移操作，从而使得实体在不同关系下能具有不同的表示。TransH用w_r、d_r两个向量表示关系r，其中w_r为关系超平面的法向量，d_r为关系对应的平移操作，首先将头尾实体向量分别投影到关系平面后再进行平移操作，相应的评分函数为：

TransE和TransH都假设实体和关系处于相同的语义空间，而关系和实体却是不同对象，TransR对实体和关系在不同的空间中建模。对于一个三元组(h,r,t)，实体嵌入关系嵌入对于每一个关系r，设置一个投影矩阵用于将实体从实体空间投影到关系空间。类似的，其评分函数变为：

TransD提出一种动态变化矩阵的方法来解决关系的多种语义表示。它为每个实体或关系定义了两种表示，一种是(h,r,t)代表了自身的语义，另一种(h_p,r_p,t_p)代表了从实体向量投影到关系向量空间的方式，且第二种表示将用于构建映射矩阵：

有映射矩阵后就能得到投影后的实体关系向量和评分函数：

h_⊥＝M_rhh,t_⊥＝M_rtt (6)

可以看出，TransD与TransE、TransH等模型本质上都是仅建模了“翻译”这一种三元组内部的结构特征，而忽略了实体和关系的其他语义特征。

而传统技术中的一些多源信息嵌入方法通过对文本语料进行嵌入为实体和关系表示引入了更多的语义特征：

DKRL把实体所在的文本当作实体描述，提出融入实体描述信息的知识表示学习方法。每一个实体有两种表示：基于结构的表示e_s和基于描述的表示e_d，三元组评分由两部分组成：E＝E_S+E_D。结构的表示使用TransE模型：E_S＝‖h_s+r-t_s‖，为了使基于描述的表示的学习过程与E_S适配，E_D又分为E_DD＝‖h_d+r-t_d‖、E_DS＝‖h_d+r-t_s‖、E_SD＝‖h_s+r-t_d‖三部分。基于描述的表示通过处理实体描述的文本获得，作者设计了CBOW(Continuous Bag-of-Words，连续词袋)编码器和卷积神经网络编码器两种方式来提取实体描述的语义特征。可以看到，DKRL在结合实体描述信息时使用的是TransE模型，然而TransE无法建模多对多关系。此外，DKRL方法只为实体引入描述信息，没有考虑关系的语义特征。

TEKE也是一个利用文本增强实体关系语义的表示学习方法：给定知识图谱KG和表示为单词序列的文本语料，TEKE首先使用实体链接工具在对语料库中的单词进行标注，得到对应知识图谱中实体的标注序列D＝(x₁,x₂,…x_n)。为了将知识图谱KG与文本信息D联合，作者构建了由实体和单词组成的共现网络G＝(X,Y)，其中x_i表示网络的节点，对应于一个单词或一个实体，y_ij表示x_i和x_j间的共现频率。基于共现网络，选择共现频率超过给定阈值的标注词语集作为相应实体的语义上下文，并构建其向量表示。TEKE构建共现网络的文本处理方式较为传统，而且操作复杂，序列中单词之间的语义信息并没有得到充分利用。

综上所述，基于翻译的模型本质上都是仅建模了三元组内部的结构特征，而没有利用实体和关系的描述文本，因此忽略了知识图谱中实体关系的其他语义特征。在这种情况下，知识图谱的稀疏性导致实体关系向量没有得到充分的学习，往往只是粗略地满足翻译特性，质量不高，导致一些拥有相同关系但含义不同的实体很难区分，给后续知识融合和知识图谱补全等任务的准确率带来了负面影响。

DKRL、TEKE等多源信息嵌入方法通过对实体描述文本语料进行嵌入扩充了实体的语义，但这些方法有以下几个缺点：一是DKRL使用TransE方法进行结构嵌入，无法满足知识图谱中多对多的复杂关系；二是DKRL只对实体文本描述进行嵌入，为实体融入了语义特征，但没有考虑关系的语义特征；三是DKRL和TEKE在处理实体文本描述时，分别使用的是卷积神经网络和单词的共现网络，没有考虑序列中单词之间的相互影响。

发明内容

本发明所要解决的技术问题是：提出一种基于注意力机制融入文本语义特征的知识图谱表示学习方法，解决翻译模型未能利用实体和关系的描述文本而导致的语义特征不足以及多源信息嵌入方法未能同时为实体和关系融入语义特征，且文本提取效果差的问题。

本发明解决上述技术问题采用的技术方案是：

基于注意力机制融入文本语义特征的知识图谱表示学习方法，包括以下步骤：

步骤1、为知识图谱中的每个实体和关系均定义两种表示，包括本身的语义特征向量表示和文本的语义特征向量表示；

步骤2、针对知识图谱中的每个实体，从语料库中获取包含该实体的语句并进行预处理，然后采用自注意力机制提取句子的语义特征，获得实体的文本语义特征向量；

步骤3、针对知识图谱中的每个关系，对其名称描述进行分词，得到标签词集合，采用自注意力机制提取标签词集合的语义特征，获得关系的文本语义特征向量；

步骤4、基于实体和关系的文本语义特征向量构建映射矩阵，并基于翻译模型的思想构建三元组评分函数；

步骤5、根据三元组评分函数构建基于间隔的损失函数，以知识图谱三元组为训练集，采用梯度下降优化算法训练模型，最终得到实体和关系的向量表示。

作为进一步优化，步骤2具体包括：

步骤2.1、获取实体描述文本以及预处理：

对于知识图谱中每一个实体e，从语料库中获取至少一条包含该实体的语句作为该实体的描述文本，使用分词工具对每个句子进行分词，然后去除停用词得到预处理后的单词序列；

步骤2.2、文本特征提取模型搭建：

搭建由多层多单元的自注意力模块组成的网络模型，模型共由3个相同的层堆叠而成，即纵向上有3个相同的层，每层横向包含RH个自注意力单元对输入进行处理以从不同的方面学习单词序列的特征，其中每个自注意力单元都具有不同的参数矩阵；RH可进行自定义设置；

步骤2.3、获取每个单词的向量表示x作为模型的输入：

每个单词的向量表示由其词向量和位置向量的和组成，计算方式为

x＝l_word+l_pos (8)

词向量利用词嵌入工具word2vec进行初始化；每个单词计算位置编码由其在实体描述文本序列中的位置顺序pos决定，位置向量的第i个维度的值的计算方式为

步骤2.4、利用自注意力机制计算每个词与该序列中其他所有词的影响程度，以得到自身对其他词的注意力分配，即权重值：

单词之间的影响程度采用乘性注意力计算，然后与原词向量相乘得到注意力后的向量计算公式为

其中n为序列中单词的数量，是序列中所有单词的向量组成的矩阵，为参数矩阵，W₁的值在训练开始时采用正态分布进行初始化；

步骤2.5、经过3个注意力层的特征提取后，将序列的所有输出向量相加并经过一个ReLU激活函数作为实体语义特征，计算公式为：

步骤2.6、对RH个不同的注意力单元进行处理，将其映射为一个最终的实体语义特征向量，计算公式为：

e_p＝ReLU(W₂E+b) (13)

其中是一个映射矩阵，E是RH个不同的注意力单元的输出组成的矩阵，b是偏置向量，W₂和b的值在训练开始时采用正态分布进行初始化。

作为进一步优化，步骤3具体包括：

步骤3.1、对关系名称进行预处理：

对于知识图谱中每一个关系r，使用分词工具对其名称进行分词，得到标签词序列；

步骤3.2、文本特征提取模型搭建：

搭建由单层多单元的自注意力模块组成的网络模型，模型纵向上有1个自注意力层，该层横向包含RH个自注意力单元对输入进行处理以从不同的方面学习单词序列的特征，其中每个自注意力单元都具有不同的参数矩阵；RH可进行自定义设置；

步骤3.3、获取标签词序列中每个标签词的向量表示作为模型的输入；

步骤3.4、利用自注意力机制计算标签词之间的匹配程度，然后与原词向量相乘得到注意力后的向量；

步骤3.5、经过注意力层的特征提取后，将序列的所有输出向量相加并经过一个ReLU激活函数作为实体语义特征；

步骤3.6、对RH个不同的注意力单元进行处理，将其映射为一个实体语义特征向量r_p。

作为进一步优化，步骤4具体包括：

步骤4.1、对于一个三元组(h,r,t)，分别为头实体和尾实体设置一个投影矩阵M_rh和M_rt，用于将实体从实体空间投影到关系空间；投影矩阵由步骤2和步骤3中得到的实体和关系各自的语义特征向量构建而成，计算方式为

其中B^k×d为待学习的参数矩阵；

步骤4.2、将头实体、尾实体与各自的投影矩阵相乘以计算实体在关系空间的投影，即：h_⊥＝M_rhh、t_⊥＝M_rtt；

步骤4.3、在关系空间中，遵循翻译模型的思想，将关系看作头实体到尾实体的平移操作，构建三元组评分函数为：

作为进一步优化，步骤5具体包括：

步骤5.1、以知识图谱中的所有原始三元组T为训练集，定义基于间隔的合页损失函数以训练模型，目标是使得三元组评分函数对于正例三元组得到较低的分数，而对负例三元组得到较高的分数，所述损失函数为：

其中，T′_(h,r,t)＝{(h′,r,t)|h′∈E,h′≠h}∪{(h,r,t′)|t′∈E,t′≠t}是在三元组(h,r,t)的基础上构造的负例集，间隔值γ>0为超参数；

步骤5.2、对于任何实体，强制其向量的L2范数为1，即从而将实体嵌入向量规则化为单位球面；

步骤5.3、训练过程中，知识图谱的事实三元组被随机遍历多次，当访问每一个事实三元组时，为其构建负例三元组，负例实体的选取方式为：采用K-近邻的方法，首先利用余弦相似度算法计算待替换实体和其他实体的相似度，并从高到低排序，然后取top-k个实体作为待替换实体的负例候选集；

步骤5.4、使用小批量梯度下降算法来优化目标函数然后计算梯度并更新模型参数。

本发明的有益效果是：

(1)本发明同时为实体和关系融入了结构特征和文本语义特征：

本发明分别对实体描述和关系描述的文本语料进行嵌入，并将其用于构建实体构建到关系空间的投影矩阵，最后在关系空间中基于翻译思想进行表示学习，不仅同时考虑了实体和关系的语义特征，还巧妙地结合了结构嵌入和文本嵌入。

(2)本发明相比其他多源信息嵌入方法能提取更丰富的语义特征：

得益于注意力机制在自然语言处理上的优势，本发明采用的多层自注意力方法处理实体描述和关系描述，能高效地提取更加高质量的语义特征。

(3)K-近邻的负采样方法能使模型表现出更好的区分能力：

本发明的K-近邻的负采样方法，能够提高负例三元组的质量，从而加强模型的学习，使得最终的模型能更好的区分正确三元组和错误三元组。

附图说明

图1为本发明基于注意力机制融入文本语义特征的知识图谱表示学习方法的原理示意图；

图2为本发明基于注意力机制融入文本语义特征的知识图谱表示学习方法的流程图；

图3为基于注意力机制的文本特征提取示意图。

具体实施方式

本发明旨在提出一种基于注意力机制融入文本语义特征的知识图谱表示学习方法，解决翻译模型未能利用实体和关系的描述文本而导致的语义特征不足以及多源信息嵌入方法未能同时为实体和关系融入语义特征，且文本提取效果差的问题。

本发明的知识图谱表示学***移操作。

本发明的知识图谱表示学习方法如图2所示，其包括以下实现步骤：

步骤1、为知识图谱中每个实体e定义两种表示，一种是实体本身的语义特征，表示为e。另一种是实体的文本语义特征，表示为e_p。对知识图谱中每个关系r也定义所述两种表示。

步骤2、对于知识图谱中每一个实体e，从语料库中获取包含该实体的语句并进行预处理，然后采用自注意力机制提取句子的语义特征，得到实体的文本语义特征向量e_p。

步骤3、对于知识图谱中每一个关系r，对其名称描述进行分词，得到标签词集合，采用自注意力机制提取标签词集合的语义特征，得到关系的语义特征向量r_p。

步骤4、利用实体和关系的语义特征向量构建映射矩阵，并基于翻译的思想构建三元组评分函数，即能量方程。

步骤5、根据所述三元组评分函数构建基于间隔的损失函数，以知识图谱三元组为训练集，采用梯度下降优化算法训练模型，最终得到实体和关系的向量表示。

在具体实施时，所需的原始数据为知识图谱的三元组集合以及与知识图谱同种语言的语料文本集。下面对各个步骤的具体实现手段作进一步的描述：

步骤1中，首先获取知识图谱的所有实体和关系，利用tensorflow初始化实体和关系的两种向量，实体和关系向量的维度值分别为超参数d和k，可在{50,70,80,100}中选取。实体和关系本身的语义特征向量使用边界为的均匀分布记性初始化。实体和关系的文本语义特征e_p和r_p并非随机初始化，而是由步骤2和步骤3计算得到。

步骤2以实体的描述文本为输入，然后采用自注意力机制提取句子的语义特征，输出向量e_p。具体步骤包括：

步骤2.1、实体描述文本预处理：

对于知识图谱中每一个实体e，从语料库中获取至少一条包含该实体的语句作为该实体的描述文本，使用分词工具对每个句子进行分词，然后去除停用词得到预处理后的单词序列。

步骤2.2、文本特征提取模型搭建：

特征提取的基本处理单元是对序列应用自注意力机制，模型由多层多单元的自注意力模块组成，每一层有RH个自注意力单元，对输入进行处理以从不同的方面学习序列的特征。模型共由CH＝3个相同的层堆叠而成，即纵向上有3个相同的层，每层横向包含RH个自注意力单元，如图3所示。其中每个自注意力单元都具有不同的参数矩阵。在网络模型搭建中，RH可进行自定义设置，一般在{1,2,3,4}中选取即可。

步骤2.3、模型的输入是每个单词的向量表示x。每个单词的向量表示由其词向量和位置向量的和组成，计算方式为

x＝l_word+l_pos (8)

词向量利用词嵌入工具word2vec进行初始化。每个单词计算位置编码由其在实体描述文本序列中的位置顺序pos决定，位置向量的第i个维度的值的计算方式为

步骤2.4、利用自注意力机制计算每个词与该序列中其他所有词的影响程度，以得到自身对其他词的注意力分配(即权重值)，这个权重值决定每个词在所属位置表达多少。所述单词之间的影响程度采用乘性注意力计算，然后与原词向量相乘得到注意力后的向量计算公式为

其中n为序列中单词的数量。是序列中所有单词的向量组成的矩阵。为参数矩阵，W₁的值在训练开始时可以正态分布进行初始化。除以的目的是对权重值进行缩放，以防止其值过大。

步骤2.5、经过CH个注意力层的特征提取后，将序列的所有输出向量相加并经过一个ReLU激活函数作为实体语义特征，计算公式为

步骤2.6、为了综合不同的方面学习到的语义特征，在最后，对RH个不同的注意力单元进行处理，将其映射为一个最终的实体语义特征向量。计算方式为

e_p＝ReLU(W₂E+b) (13)

其中是一个映射矩阵，E是RH个不同的注意力单元的输出组成的矩阵，b是偏置向量。W₂和b的值在训练开始时可以正态分布进行初始化。

步骤3以关系的名称标签词为输入，采用自注意力机制提取标签词集合的语义特征，输出向量r_p。具体包括：

步骤3.1、关系名称的预处理：对于知识图谱中每一个关系r，使用分词工具对其名称进行分词，得到标签词序列。如关系名“/accident/traffic_accident/res-ponsible_party”经过处理后得到{accident,traffic,accident,responsible,party}的标签词集合。

步骤3.2、文本特征提取模型搭建：

与实体语义特征提取的模型类似，模型由单层多单元的自注意力模块组成，每一层有RH个自注意力单元，由于关系描述包含的单词少，且单词范围也较少，关系语义特征的提取模型中仅包含CH＝1个自注意力层，即纵向上有1个自注意力层，每层横向包含RH个自注意力单元。其中每个自注意力单元都具有不同的参数矩阵。在网络模型搭建中，RH可进行自定义设置，一般在{1,2,3,4}中选取。

步骤3.3、模型的输入是一个序列中每个标签词的向量表示，与步骤2.3的计算方式一致，首先利用词嵌入工具word2vec初始化每个单词的词向量，得到嵌入维度k在{50,70,80,100}中选取。利用公式(8)和公式(9)计算每个标签词的位置向量

步骤3.4、利用自注意力机制计算标签词之间的匹配程度，然后与原词向量相乘得到注意力后的向量，计算方式与与步骤2.4一致。

步骤3.5、经过CH个注意力层的特征提取后，将序列的所有输出向量相加并经过一个ReLU激活函数作为实体语义特征。计算方式与步骤2.5一致。

步骤3.6、为了综合不同的方面学习到的语义特征，在最后，对RH个不同的注意力单元进行处理，将其映射为一个最终的实体语义特征向量r_p。计算方式与步骤2.6一致

步骤4中利用实体和关系的语义特征向量构建映射矩阵，并基于翻译的思想构建三元组评分函数，即能量方程。具体包括：

步骤4.1、对于一个三元组(h,r,t)，分别为头实体和尾实体设置一个投影矩阵M_rh和M_rt，用于将实体从实体空间投影到关系空间。投影矩阵由步骤2和步骤3中得到的实体和关系各自的语义特征向量构建而成，计算方式为

其中B^k×d为待学习的参数矩阵。

步骤4.2、将头尾实体与各自的投影矩阵相乘以计算实体在关系空间的投影，即：h_⊥＝M_rhh、t_⊥＝M_rtt。

步骤4.3、在关系空间中，遵循翻译模型的思想，将关系看作头实体到尾实体的平移操作，构建三元组评分函数(即能量方程)为

步骤5中根据所述三元组评分函数构建基于间隔的损失函数，以知识图谱三元组为训练集，并采用梯度下降优化算法训练模型，最终得到实体和关系的向量表示。详细步骤为：

步骤5.1、以知识图谱中的所有原始三元组T为训练集，定义基于间隔的合页损失函数以训练模型。目标是使得三元组评分函数对于正例三元组得到较低的分数(能量)，而对负例三元组得到较高的分数。所述损失函数为

其中，T′_(h,r,t)＝{(h′,r,t)|h′∈E,h′≠h}∪{(h,r,t′)|t′∈E,t′≠t}是在三元组(h,r,t)的基础上构造的负例集。间隔值γ>0为超参数，可在{1,2,3,4}中选取。

步骤5.2、对于任何实体，强制其向量的L2范数为1，即从而将实体嵌入向量规则化为单位球面，通过人为增加实体嵌入规范的方式可以防止目标函数无效收敛。

步骤5.3、训练过程中，知识图谱的事实三元组(训练集)被随机遍历多次，当访问每一个事实三元组时，为其构建负例三元组。负例实体并非在实体集中选取，而是采用K-近邻的方法，首先利用余弦相似度算法计算待替换实体和其他实体的相似度，并从高到低排序，然后取top-k个实体作为待替换实体的负例候选集。

步骤5.4、使用小批量梯度下降(Mini-batch Gradient Descent)来优化目标函数学习率μ在{0.1,0.01,0.001}中选取，批量大小值B在{200,500,1400,4800}中选取。在小批量之后，计算梯度并更新模型参数。

基于本发明的上述方案，其与传统技术对比，至少具备以下优势：

TransE、TransH、TransR、TransD等翻译模型都是仅建模了三元组内部的结构特征，其缺点是忽略了知识图谱中实体关系的其他语义特征。而TEKE、DKRL等其他多源信息嵌入方法在TransE的基础上，对实体的文本描述进行嵌入，从而为实体引入了描述文本的语义特征，但仍然具有以下缺点：一是使用的TransE无法满足知识图谱中多对多的复杂关系，二是只为实体融入了语义特征。本发明分别对实体描述和关系描述的文本语料进行嵌入，并将其用于构建实体构建到关系空间的投影矩阵，最后在关系空间中基于翻译思想进行表示学习。不仅同时考虑了实体和关系的语义特征，还巧妙地结合了结构嵌入和文本嵌入。

TEKE基于单词和实体的共现网络处理实体描述文本，DKRL使用连续词袋模型或卷积神经网络处理实体描述文本，这些方式在自然语言处理上属于较为传统的方式，得益于注意力机制在自然语言处理上的优势，本发明采用的多层自注意力方法处理实体描述和关系描述，能高效地提取更加高质量的语义特征。

(3)K-近邻的负采样方法能使模型表现出更好的区分能力：

从整个实体集任意选取一个来替换，可能导致产生非常容易区分的负例三元组，如对于三元组(Beijing,capital of,China)，通过替换头实体产生(Water,capital of,China)或替换尾实体产生(Beijing,capital of,Airplane)，它们都是明显错误甚至不合逻辑的。Beijing和Water对应向量在同一空间中本来就相距较远，因此这类负例三元组对模型的学习贡献很小。相反，(Hong Kong,capital of,China)才是一个相近但是错误的三元组。本发明的K-近邻的负采样方法，能够提高负例三元组的质量，从而加强模型的学习，使得最终的模型能更好的区分正确三元组和错误三元组。

Claims

1.基于注意力机制融入文本语义特征的知识图谱表示学习方法，其特征在于，包括以下步骤：

2.如权利要求1所述的基于注意力机制融入文本语义特征的知识图谱表示学习方法，

其特征在于，步骤2具体包括：

步骤2.1、获取实体描述文本以及预处理：

步骤2.2、文本特征提取模型搭建：

步骤2.3、获取每个单词的向量表示x作为模型的输入：

x＝l_word+l_pos (8)

e_p＝ReLU(W₂E+b) (13)

3.如权利要求1所述的基于注意力机制融入文本语义特征的知识图谱表示学习方法，

其特征在于，步骤3具体包括：

步骤3.1、对关系名称进行预处理：

步骤3.2、文本特征提取模型搭建：

4.如权利要求1-3任意一项所述的基于注意力机制融入文本语义特征的知识图谱表示学习方法，其特征在于，步骤4具体包括：

步骤4.1、对于一个三元组(h，r，t)，分别为头实体和尾实体设置一个投影矩阵M_rh和M_rt，用于将实体从实体空间投影到关系空间；投影矩阵由步骤2和步骤3中得到的实体和关系各自的语义特征向量构建而成，计算方式为

其中B^k×d为待学习的参数矩阵；

5.如权利要求4所述的基于注意力机制融入文本语义特征的知识图谱表示学习方法，

其特征在于，步骤5具体包括：

其中，T′_(h，r，t)＝{(h′，r，t)|h′∈E，h′≠h}∪{(h，r，t′)|t′∈E，t′≠t}是在三元组(h，r，t)的基础上构造的负例集，间隔值γ＞0为超参数；